Volumes horaires
- CM -
- Projet -
- TD -
- Stage -
- TP -
- DS -
Crédits ECTS
Crédits ECTS 3.0
Objectif(s)
L'objectif de ce cours est d'introduire les étudiants aux approches classiques de l'apprentissage statistique. L'ère de l'information a entraîné une masse de données multivariées dans de nombreux domaines : la finance, le marketing, l'économie, la biologie, les sciences de l'environnement, et la capacité à les manipuler de manière rigoureuse et critique est d'une grande importance dans la recherche et l'industrie. Nous accorderons une importance égale aux aspects théoriques et pratiques de l'apprentissage statistique, en présentant plusieurs applications en classe et en proposant des séances pratiques au cours desquelles l'étudiant devra effectuer une analyse de données réelles à l'aide de Python. Ce cours est destiné aux étudiants de l'IF, de l'ISI, du MMIS, ainsi qu'à ceux du master M1AM.
Pedro Luiz COELHO RODRIGUES
Contenu(s)
Révision des statistiques multivariées. Régression linéaire simple et multivariée. Validation croisée, sélection de modèle, biais-variance. Analyse en composantes principales. Classification linéaire : approches discriminatives et génératives. Arbres de décision. Méthodes d'ensemble : bagging et boosting. Mesures de performance et sur-apprentissage. Introduction à l'analyse de réseau et à la détection de communautés dans les graphes.
PrérequisNotions de théorie des probabilités : distribution de probabilité, fonction de densité de probabilité conjointe pour des vecteurs aléatoires, distribution conditionnelle, espérance, variance, covariance, distribution gaussienne.
Notions de statistiques mathématiques : estimateur, intervalle de confiance, tests statistiques.
Notions d'algèbre linéaire : réductions de matrices, décomposition des valeurs propres.
Bonus : Notions élémentaires de programmation en Python, rédaction de fichiers Rmd et mise en forme des équations en LaTeX.
Evaluation : 50% de TP notés et 50% de Examen sur machine (3h)
Rattrapage : Examen oral (exposé, soutenance, etc..) (30min)
La note finale est composée par 50% de la moyenne des TPs et 50% de la note à l'examen final.
Le cours est programmé dans ces filières :
- Parcours de master - Master Math. et Applications - Semestre 8
Code de l'enseignement : WMM8AM29
Langue(s) d'enseignement :
Vous pouvez retrouver ce cours dans la liste de tous les cours.
James et al. "Introduction to statistical learning with applications to R"
(Available at https://www.statlearning.com/)
Shalizi "The truth about linear regression”
(Available at https://www.stat.cmu.edu/~cshalizi/TALR/)