Ensimag Rubrique Formation 2022

Apprentissage statistique et applications (en anglais) - 4MMASA

  • Volumes horaires

    • CM 16.5
    • Projet -
    • TD 9.0
    • Stage -
    • TP 9.0
    • DS -

    Crédits ECTS

    Crédits ECTS 3.0

Objectif(s)

L'objectif de ce cours est d'introduire les étudiants aux approches classiques de l'apprentissage statistique. L'ère de l'information a entraîné une masse de données multivariées dans de nombreux domaines : la finance, le marketing, l'économie, la biologie, les sciences de l'environnement, et la capacité à les manipuler de manière rigoureuse et critique est d'une grande importance dans la recherche et l'industrie. Nous accorderons une importance égale aux aspects théoriques et pratiques de l'apprentissage statistique, en présentant plusieurs applications en classe et en proposant des séances pratiques au cours desquelles l'étudiant devra effectuer une analyse de données réelles à l'aide du logiciel R. Ce cours est destiné aux étudiants de l'IF, de l'ISI, du MMIS, ainsi qu'à ceux du master M1AM.

Responsable(s)

Pedro Luiz COELHO RODRIGUES

Contenu(s)

Révision des statistiques multivariées. Régression linéaire simple et multivariée. Validation croisée, sélection de modèle, biais-variance. Analyse en composantes principales. Classification linéaire : approches discriminatives et génératives. Arbres de décision. Méthodes d'ensemble : bagging et boosting. Mesures de performance et sur-apprentissage. Introduction à l'analyse de réseau et à la détection de communautés dans les graphes.

Prérequis

Notions de théorie des probabilités : distribution de probabilité, fonction de densité de probabilité conjointe pour des vecteurs aléatoires, distribution conditionnelle, espérance, variance, covariance, distribution gaussienne.

Notions de statistiques mathématiques : estimateur, intervalle de confiance, tests statistiques.

Notions d'algèbre linéaire : réductions de matrices, décomposition des valeurs propres.

Bonus : Notions élémentaires de programmation R, rédaction de fichiers Rmd et mise en forme des équations en LaTeX.

Contrôle des connaissances

CONTRÔLE CONTINU :
Type d'évaluation (ex : TP, assiduité, participation) :

SESSION NORMALE :
Type d'examen (écrit, oral, examen sur machine) : un examen sur machine de 3h (E) et un rapport à rendre sur les travaux pratiques (P)
Salle spécifique : salles de TP en configuration "examen" (pas de connection internet, etc.)
Durée : 3h
Documents autorisés (ex : aucun, résumé feuille A4 manuscrite, dictionnaires, tous documents) : tout document manuscrit.
Documents interdits (ex : livres, tous documents) : tout document imprimé.

  • matériel interdit, préciser : ordinateur personnel, calculatrice
    Commentaires :

SESSION DE RATTRAPAGE :
Type d'examen (écrit, oral, examen sur machine) : écrit
Salle spécifique :
Durée : 2h
Documents autorisés (ex : aucun, résumé feuille A4 manuscrite, dictionnaires, tous documents) : tout document manuscrit.
Documents interdits (ex : livres, tous documents) : tout document imprimé.
Matériel (ex : calculatrices):

  • matériel autorisé, préciser :
  • matériel interdit, préciser :
    Commentaires :

    • MCC en présentiel **
      N1=1/2*TP en temps libre + 1/2*Examen pratique
      N2=1/2*TP en temps libre + 1/2*Examen pratique
    • MCC en distanciel**
      N1=1/2*TP en temps libre + 1/2*Devoir à la maison
      N2=1/2*TP en temps libre + 1/2*Devoir à la maison

L'examen existe uniquement en anglais FR

Calendrier

Le cours est programmé dans ces filières :

  • Cursus ingénieur - Filière MMIS - Semestre 8 (ce cours est donné uniquement en anglais EN)
  • Cursus ingénieur - Filière ISI - Semestre 8 (ce cours est donné uniquement en anglais EN)
  • Cursus ingénieur - Filière IF - Semestre 8 (ce cours est donné uniquement en anglais EN)
cf. l'emploi du temps 2023/2024

Informations complémentaires

Code de l'enseignement : 4MMASA
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.

Bibliographie

James et al. "Introduction to statistical learning with applications to R"
(Available at https://www.statlearning.com/)

Shalizi "The truth about linear regression”
(Available at https://www.stat.cmu.edu/~cshalizi/TALR/)