Ensimag Rubrique Formation 2022

Modélisation statistique et analyse des données - 4MMMSAD

  • Volumes horaires

    • CM 16.5
    • Projet -
    • TD -
    • Stage -
    • TP 16.5
    • DS -

    Crédits ECTS

    Crédits ECTS 3.0

Objectif(s)

L’objectif de ce cours est de se familiariser avec les outils d’analyse de données, indispensables dans de nombreuses applications : marketing, segmentation d’utilisateurs, finance, économie, biologie, environnement, assurance...
Le cours aborde les outils statistiques classiques pour modéliser/prédire la variable d'intérêt (catégorielle ou quantitative) et pour visualiser les données.
Le cours développe les fondements théoriques des méthodes présentées de manière poussée sans négliger la pratique, envisagée via l’utilisation du logiciel R.

Le module est destiné aux étudiants des filières IF et MMIS motivés par comprendre les aspects mathématiques des modèles en profondeur.

Responsable(s)

Christophe DUTANG

Contenu(s)

1. Régression linéaire multiple. Moindres carrés, modèle linéaire gaussien, tests d’hypothèses linéaires, pertinence de la régression
2. Analyse de la variance à un et deux facteurs contrôlés.
3. Analyse en Composantes Principales (ACP).
4. Modèle linéaire généralisé : régression logistique, poissonienne, ...
4. Classification : régression logistique

Prérequis

Cours de Probabilités Appliquées de 1ère année, de Principes et Méthodes Statistiques de 1ère année, c'est à dire loi d'un vecteur aléatoire, loi conditionnelle, espérance, variance, estimation de paramètre, maximum de vraisemblance, régression linéaire simple, variable explicative.

Contrôle des connaissances

Evaluation : 50% de Participation et assiduité et 50% de Examen sur machine (3h)

Rattrapage : 50% de Participation et assiduité (note reportée) et 50% de Examen Ecrit (1h30)

SESSION NORMALE :
CC1 = Le contrôle continu tiendra compte de la participation aux CM/TP et du rendu des travaux sur Teide.
E1 = L'épreuve terminale sera un examen individuel de 3h en salle machine en mode examen.
Documents autorisés : tout document manuscrit.
Documents interdits : tout document imprimé.

SESSION DE RATTRAPAGE :
La session 2 sera un examen écrit (1h30) en salle normale (donc pas machine).
Documents autorisés : tout document manuscrit
Documents interdits : tout document imprimé

Calendrier

Le cours est programmé dans ces filières :

cf. l'emploi du temps 2025/2026

Informations complémentaires

Code de l'enseignement : 4MMMSAD
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.

Bibliographie

C. CHATFIELD and AJ COLLINS (1980) Introduction to multivariate analysis. Science paperbacks

T HASTIE, R TIBSHIRANI, and J FRIEDMAN (2009). The Elements of Statistical Learning, 2d ed, Springer.

G. SAPORTA : Probabilités, statistique et analyse des données, Technip, 2006.

P. McCullagh, John A. Nelder (1989), Generalized Linear Models, CRC Press