Volumes horaires
- CM 24.0
- Projet -
- TD 24.0
- Stage -
- TP -
- DS -
Crédits ECTS
Crédits ECTS 4.0
Objectif(s)
Les objectifs de ce cours sont les suivants :
Aborder les notions fondamentales en calcul des probabilités et en statistique
Développer des compétences générales en modélisation probabiliste et statistique
Analyser des données, formuler des hypothèses, proposer et critiquer des modèles
Effectuer des études de simulation de type Monte-Carlo
Comprendre les notions de biais, de variabilité, d’erreur et de puissance statistique
Comprendre la différence entre approches explicatives et prédictives
Maîtriser la programmation dans un langage statistique et l’utiliser pour des études de données
Cette UE développe des compétences théoriques et pratiques guidées privilégiant une approche par l'étude de données simulées ou réelles. Il s'agit de développer les concepts liés à la modélisation probabiliste et statistique en s'appuyant sur des applications réalistes et concrètes. L'UE met aussi en avant la nécessité de justifier et de discuter les choix effectués à partir de principes fondamentaux.
Christophe DUTANG, Clovis GALIEZ, Olivier FRANCOIS
Contenu(s)
Le cours se décline sous la forme de cours-travaux-dirigés (CTD) pour les 12 semaines avec de nombreuses séances en salle informatique. Le langage de programmation utilisé sera R.
Des notions fondamentales du calcul des probabilités et de la statistique seront abordées :
- Manipulation de vecteurs, matrices, tableaux de données, introduction au langage informatique
- Visualisation et résumés de données (data.frame, summary, plot, quantile, table, hist)
- Variable aléatoire, lois de probabilité, fonction de répartition, densité, espérance, variance
- Somme de variables aléatoires, stabilité de la loi normale
- Convergence de la moyenne empirique, loi des grands nombres, méthode de Monte Carlo, bootstrap
- Echantillonnage, estimation paramétrique, biais, erreur statistique
- Test d’hypothèse, intervalle de confiance, application, interprétation
- Couple de variables aléatoires, lois jointe, conditionnelle, marginale, dépendance, espérance conditionnelle, covariance
- Loi gaussienne, modèles linéaires, corrélation linéaire
- Régression à 1 et 2 variables, facteur de confusion, facteur de médiation
- Approche prédictive, règle de Bayes
Le contenu de ce cours sera un prérequis pour les spécialisation suivantes (a minima) :
- Science des données
- Intelligence artificielle
- Ingénierie pour la finance
- Santé numérique et biologie intégrative
Les prérequis nécessaires sont des connaissances de base en mathématiques, notamment en calcul des probabilités.
Evaluation : 33% de Participation et assiduité et 67% de Examen sur machine (3h00)
Rattrapage : 33% de Participation et assiduité (note reportée) et 67% de Examen sur machine (1h00)
En première session, la note de l'UE (N1) est la moyenne pondérée entre la note de contrôle
continu (CC) et la note d'examen terminal (E1): N1 = 1/3 CC + 2/3 E1.
Le contrôle continu (CC) tiendra compte de la participation aux CTD et du rendu des travaux.
L'épreuve terminale (E1) sera un examen individuel de 3h en salle machine.
En seconde session, l'évaluation se fera par un examen de 1h00 (E2) et la note de controle continu reportée : N2 = 1/3 CC + 2/3 E2.
Documents autorisés : résumé manuscrit au format A4
Documents refusés : tout autre document ou matériel
Le cours est programmé dans ces filières :
- Cursus ingénieur - Tronc Commun - Semestre 5
Code de l'enseignement : 3MMPS1
Langue(s) d'enseignement :
Vous pouvez retrouver ce cours dans la liste de tous les cours.