Ensimag Rubrique Formation 2022

Modélisation statistique et analyse des données - 4MMMSAD

  • Volumes horaires

    • CM 16.5
    • Projet -
    • TD 6.0
    • Stage -
    • TP 10.5
    • DS -

    Crédits ECTS

    Crédits ECTS 3.0

Objectif(s)

L’objectif de ce cours est de se familiariser avec les outils d’analyse de données, indispensables dans de nombreuses applications : marketing, segmentation d’utilisateurs, finance, économie, biologie, environnement, assurance...
Le cours aborde les outils statistiques classiques pour modéliser/prédire la variable d'intérêt (catégorielle ou quantitative) et pour visualiser les données.
Le cours développe les fondements théoriques des méthodes présentées de manière poussée sans négliger la pratique, envisagée via l’utilisation du logiciel R.

Le module est destiné aux étudiants des filières IF et MMIS motivés par comprendre les aspects mathématiques des modèles en profondeur.

Responsable(s)

Christophe DUTANG

Contenu(s)

1. Régression linéaire multiple. Moindres carrés, modèle linéaire gaussien, tests d’hypothèses linéaires, pertinence de la régression
2. Analyse de la variance à un et deux facteurs contrôlés.
3. Analyse en Composantes Principales (ACP).
4. Modèle linéaire généralisé : régression logistique, poissonienne, ...
4. Classification : régression logistique, analyse discriminante linéaire et Naive Bayes

Prérequis

Cours de Probabilités Appliquées de 1ère année, de Principes et Méthodes Statistiques de 1ère année, c'est à dire loi d'un vecteur aléatoire, loi conditionnelle, espérance, variance, estimation de paramètre, maximum de vraisemblance, régression linéaire simple, variable explicative.

Contrôle des connaissances

CONTRÔLE CONTINU :
Type d'évaluation : moyenne des rapports de TP à rendre sur Teide (P)

SESSION NORMALE :
Type d'examen : un examen individuel sur machine (E1)
Salle spécifique : salles de TP en configuration "examen" (pas de connection internet, etc.)
Durée : 3h
Documents autorisés : tout document manuscrit.
Documents interdits : tout document imprimé.
Matériel :

  • matériel autorisé, préciser : aucun
  • matériel interdit, préciser : ordinateur personnel, calculatrice, ...
    Commentaires :

SESSION DE RATTRAPAGE :
Type d'examen (écrit, oral, examen sur machine) : un examen écrit (E2)
Salle spécifique : sur table
Durée : 1h30
Documents autorisés : tout document manuscrit
Documents interdits : tout document imprimé
Matériel :

  • matériel autorisé, préciser : aucun
  • matériel interdit, préciser :

N1=1/2xE1+1/2xP
N2=E2
où E1 est la note d'examen (session 1), P la moyenne des notes de TP, E2 la note d'examen (session 2)

Calendrier

Le cours est programmé dans ces filières :

  • Cursus ingénieur - Filière MMIS - Semestre 8
  • Cursus ingénieur - Filière ISI - Semestre 8
  • Cursus ingénieur - Filière IF - Semestre 8
cf. l'emploi du temps 2023/2024

Informations complémentaires

Code de l'enseignement : 4MMMSAD
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.

Bibliographie

C. CHATFIELD and AJ COLLINS (1980) Introduction to multivariate analysis. Science paperbacks

T HASTIE, R TIBSHIRANI, and J FRIEDMAN (2009). The Elements of Statistical Learning, 2d ed, Springer.

G. SAPORTA : Probabilités, statistique et analyse des données, Technip, 2006.

P. McCullagh, John A. Nelder (1989), Generalized Linear Models, CRC Press