Volumes horaires
- CM 13.5
- Projet -
- TD 1.5
- Stage -
- TP 18.0
- DS -
Crédits ECTS
Crédits ECTS 3.0
Objectif(s)
L’objectif de ce cours est de se familiariser avec les outils d’analyse de données, indispensables dans de nombreuses applications : marketing, segmentation d’utilisateurs, finance, économie, biologie, environnement...
Les outils présentés seront les outils statistiques classique pour la prédiction de classes ou valeurs quantitatives et pour la visualisation de données.
Le cours développe les fondements théoriques des méthodes présentées de manière un peu poussée sans négliger la pratique, envisagée via l’utilisation du logiciel R et de plusieurs algorithmes de classification.
Le module est destiné aux étudiants des filières MF-meqa et MMIS motivés par comprendre les aspects mathématiques des modèles en profondeur.
Jean-Baptiste DURAND
Contenu(s)
1. Régression linéaire multiple. Moindres carrés, modèle linéaire gaussien, tests d’hypothèses linéaires,
2. Analyse de la variance à un et deux facteurs contrôlés.
3. Analyse en Composantes Principales (ACP).
4. Classification : régression logistique / multinomiale, analyse discriminante linéaire et Naive Bayes
Cours de Probabilités Appliquées 1 et 2 de 1ère année, de Principes et Méthodes Statistiques de 1ère année
CONTRÔLE CONTINU :
Type d'évaluation (ex : TP, assiduité, participation) :
SESSION NORMALE :
Type d'examen (écrit, oral, examen sur machine) : un examen sur machine de 3 h (E) et un rapport à rendre sur les travaux pratiques (P)
Salle spécifique : salles de TP en configuration "examen" (pas de connection internet, etc.)
Durée : 3h
Documents autorisés (ex : aucun, résumé feuille A4 manuscrite, dictionnaires, tous documents) : tout document manuscrit.
Documents interdits (ex : livres, tous documents) : tout document imprimé.
Matériel (ex : calculatrices):
- matériel autorisé, préciser :
- matériel interdit, préciser : ordinateur personnel, calculatrice
Commentaires :
SESSION DE RATTRAPAGE :
Type d'examen (écrit, oral, examen sur machine) :
Salle spécifique :
Durée :
Documents autorisés (ex : aucun, résumé feuille A4 manuscrite, dictionnaires, tous documents) :
Documents interdits (ex : livres, tous documents) :
Matériel (ex : calculatrices):
- matériel autorisé, préciser :
- matériel interdit, préciser :
Commentaires :
N1=1/2E1+1/2P
N2=E2
Le cours est programmé dans ces filières :
- Cursus ingénieur - Filière MMIS - Semestre 8
- Cursus ingénieur - Filière ISI - Semestre 8
- Cursus ingénieur - Filière IF - Semestre 8
Code de l'enseignement : 4MMASM7
Langue(s) d'enseignement :
Le cours est rattaché aux structures d'enseignement suivantes :
- Equipe Probabilités-Statistique
Vous pouvez retrouver ce cours dans la liste de tous les cours.
CM BISHOP (2006) Pattern recognition and machine Learning. Springer
http://research.microsoft.com/en-us/um/people/cmbishop/prml/
C. CHATFIELD and AJ COLLINS (1980) Introduction to multivariate analysis. Science paperbacks
T HASTIE, R TIBSHIRANI, and J FRIEDMAN (2009). The Elements of Statistical Learning, 2d ed, Springer. http://www-stat.stanford.edu/~tibs/ElemStatLearn/
G. SAPORTA : Probabilités, statistique et analyse des données, Technip, 2006.