Aller au menu Aller au contenu
Une voie, plusieurs choix
Informatique et Mathématiques appliquées
Une voie, plusieurs choix

> Formation > Cursus ingénieur

Sciences des données : fondements algébriques et statistiques - WMMBESDD

A+Augmenter la taille du texteA-Réduire la taille du texteImprimer le documentEnvoyer cette page par mail cet article Facebook Twitter Linked In
  • Volumes horaires

    • CM : 24.0
    • TD : -
    • TP : 6.0
    • Projet : -
    • Stage : -
    • DS : -
    Crédits ECTS : 2.0
  • Responsables : Thomas BURGER

Objectifs

Acquérir une culture générale suffisante en science des données pour pourvoir interagir avec des spécialistes de la théorie de l’apprentissage statistique.

Contenu

• Rappels d'algèbre linéaire,
• Minimisation du risque empirique,
• Introduction à la théorie statistique de l’apprentissage,
• Spécificités de l’apprentissage dans un contexte « Big Data » : Malédiction et bénédiction de la dimension,
• Apprentissage de variété,
• Parcimonie et pénalité,
• Inférence à large échelle : rappels sur le test d’hypothèse et la simulation de données i.i.d.,
• Contrôle du taux de fausses découvertes et correction de tests multiples.

Prérequis

  • Notions fondamentales d’algèbre linéaire
    • Espace euclidiens
    • Produit scalaire
    • Opérations de base sur les matrices
    • Matrices semi-définies positives
    • Formes hermitiennes
    • Diagonalisation de matrice et valeurs propres
  • Notions fondamentales de probabilités
    • Espérance, variance
    • Probabilités jointes et conditionnelles, formule de Bayes
    • Lois usuelles (loi de Bernoulli, loi uniforme, loi normale)
    • Estimation des paramètres d’une loi par maximisation de la vraisemblance
  • Notions fondamentales de statistiques
    • Statistiques descriptives : Population statistique, Estimateurs de tendance centrale et de dispersion, Représentations usuelles (histogramme, diagramme en bâtons, etc.)
    • Notions élémentaires de test d'hypothèse : Echantillons, Hypothèse nulle, hypothèse alternative, risques de type I et II, Test de Student

Contrôles des connaissances

N1=E1
N2=E2

Epreuve écrite de durée 1h30

N1=E1
N2=E2

Calendrier

Le cours est programmé dans ces filières :

  • Cursus ingénieur - Mastère Big-Data - Semestre 9
cf. l'emploi du temps 2020/2021

Informations complémentaires

Code de l'enseignement : WMMBESDD
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.

Bibliographie

Principes et méthodes statistiques
https://www-ljk.imag.fr/membres/Olivier.Gaudoin/PMS.pdf

Notes de cours de probabilités
http://membres-timc.imag.fr/Olivier.Francois/Poly_Cours_Proba.pdf

A+Augmenter la taille du texteA-Réduire la taille du texteImprimer le documentEnvoyer cette page par mail cet article Facebook Twitter Linked In

mise à jour le 10 mars 2020

Université Grenoble Alpes