Ensimag Rubrique Formation 2022

Sciences des données : fondements algébriques et statistiques - WMMBESDD

  • Volumes horaires

    • CM 24.0
    • Projet -
    • TD -
    • Stage -
    • TP 6.0
    • DS -

    Crédits ECTS

    Crédits ECTS 2.0

Objectif(s)

Acquérir une culture générale suffisante en science des données pour pourvoir interagir avec des spécialistes de la théorie de l’apprentissage statistique.

Responsable(s)

Thomas BURGER

Contenu(s)

• Rappels d'algèbre linéaire,
• Minimisation du risque empirique,
• Introduction à la théorie statistique de l’apprentissage,
• Spécificités de l’apprentissage dans un contexte « Big Data » : Malédiction et bénédiction de la dimension,
• Apprentissage de variété,
• Parcimonie et pénalité,
• Inférence à large échelle : rappels sur le test d’hypothèse et la simulation de données i.i.d.,
• Contrôle du taux de fausses découvertes et correction de tests multiples.

Prérequis

  • Notions fondamentales d’algèbre linéaire
    • Espace euclidiens
    • Produit scalaire
    • Opérations de base sur les matrices
    • Matrices semi-définies positives
    • Formes hermitiennes
    • Diagonalisation de matrice et valeurs propres
  • Notions fondamentales de probabilités
    • Espérance, variance
    • Probabilités jointes et conditionnelles, formule de Bayes
    • Lois usuelles (loi de Bernoulli, loi uniforme, loi normale)
    • Estimation des paramètres d’une loi par maximisation de la vraisemblance
  • Notions fondamentales de statistiques
    • Statistiques descriptives : Population statistique, Estimateurs de tendance centrale et de dispersion, Représentations usuelles (histogramme, diagramme en bâtons, etc.)
    • Notions élémentaires de test d'hypothèse : Echantillons, Hypothèse nulle, hypothèse alternative, risques de type I et II, Test de Student

Contrôle des connaissances

N1=E1
N2=E2

Epreuve écrite de durée 1h30

N1=E1
N2=E2

Calendrier

Le cours est programmé dans ces filières :

  • Cursus ingénieur - Mastère Big-Data - Semestre 9
cf. l'emploi du temps 2020/2021

Informations complémentaires

Code de l'enseignement : WMMBESDD
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.

Bibliographie

Principes et méthodes statistiques
https://www-ljk.imag.fr/membres/Olivier.Gaudoin/PMS.pdf

Notes de cours de probabilités
http://membres-timc.imag.fr/Olivier.Francois/Poly_Cours_Proba.pdf