Ensimag Rubrique Formation 2022

Sciences des données : fondements algébriques et statistiques - WMMBESDF

  • Volumes horaires

    • CM 24.0
    • Projet -
    • TD -
    • Stage -
    • TP -
    • DS -

    Crédits ECTS

    Crédits ECTS 2.5

Objectif(s)

Acquérir une culture générale suffisante en science des données pour pourvoir interagir avec des spécialistes de la théorie de l’apprentissage statistique.

Responsable(s)

Jean-Marc BROSSIER

Contenu(s)

• Rappels d'algèbre linéaire,
• Minimisation du risque empirique,
• Introduction à la théorie statistique de l’apprentissage,
• Spécificités de l’apprentissage dans un contexte « Big Data » : Malédiction et bénédiction de la dimension,
• Apprentissage de variété,
• Parcimonie et pénalité,
• Inférence à large échelle : rappels sur le test d’hypothèse et la simulation de données i.i.d.,
• Contrôle du taux de fausses découvertes et correction de tests multiples.

Prérequis

  • Notions fondamentales d’algèbre linéaire
    • Espace euclidiens
    • Produit scalaire
    • Opérations de base sur les matrices
    • Matrices semi-définies positives
    • Formes hermitiennes
    • Diagonalisation de matrice et valeurs propres
  • Notions fondamentales de probabilités
    • Espérance, variance
    • Probabilités jointes et conditionnelles, formule de Bayes
    • Lois usuelles (loi de Bernoulli, loi uniforme, loi normale)
    • Estimation des paramètres d’une loi par maximisation de la vraisemblance
  • Notions fondamentales de statistiques
    • Statistiques descriptives : Population statistique, Estimateurs de tendance centrale et de dispersion, Représentations usuelles (histogramme, diagramme en bâtons, etc.)
    • Notions élémentaires de test d'hypothèse : Echantillons, Hypothèse nulle, hypothèse alternative, risques de type I et II, Test de Student

Contrôle des connaissances

N1=E1
N2=E2

Epreuve écrite de durée 1h30

N1=E1
N2=E2

Calendrier

Le cours est programmé dans ces filières :

  • Cursus ingénieur - Mastère Big-Data - Semestre 9
cf. l'emploi du temps 2022/2023

Informations complémentaires

Code de l'enseignement : WMMBESDF
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.

Bibliographie

Principes et méthodes statistiques
https://www-ljk.imag.fr/membres/Olivier.Gaudoin/PMS.pdf

Notes de cours de probabilités
http://membres-timc.imag.fr/Olivier.Francois/Poly_Cours_Proba.pdf