Ensimag Rubrique Formation 2022

Bases de données multimedia - 5MMBDM

  • Volumes horaires

    • CM 18.0

    Crédits ECTS

    Crédits ECTS 1.75

Objectif(s)

Les données multimédia dans toutes leurs formes (photos, vidéos, et musique) se sont imposées depuis plusieurs dizaines d’années dans nos vies. Leur impact s’est renforcé avec l’expansion rapide d’internet, et des réseaux sociaux en particulier. À titre d’exemple, 300 heures de vidéo sont envoyées sur YouTube chaque minute. On estime que ce déluge de données va s’accélérer pendant les prochaines années, et qu’en 2020, 80% du trafic internet sera composé de données visuelles. Dans ce contexte, la gestion des données multimédia devient plus importante que jamais. Ce cours propose une introduction aux techniques qui permettent de gérer ces bases de données et de résoudre les différents problèmes liés à l’accès à ces données.

Ce cours est donné par deux chercheurs qui travaillent dans les domaines de la vision par ordinateur et de l’apprentissage automatique, à Inria Grenoble (Karteek Alahari), et au centre de recherche européen de Xerox (Diane Larlus). Les deux enseignants contribueront de leur expertise en recherche académique mais aussi industrielle lors de la présentation de ce cours. Ils présenteront des applications concrètes ainsi que les tous derniers développements dans les sujets suivants : la recherche d’image et de vidéo, la reconnaissance d’objet à grande échelle, la reconnaissance d’action, ainsi que les problèmes de vision par ordinateur liés aux données massives (« big data »).

Contact Karteek ALAHARI

Contenu(s)

En particulier, le cours couvre les sujets suivants :

  • Représentation et stockage de données visuelles et audio
  • Descripteurs locaux et globaux
  • Indexation visuelle et audio
  • Système de recherche, fouille de donnée (« data mining »)
  • Séparateurs à Vaste Marge (SVM)
  • Apprentissage profond (« deep learning »)
  • Problèmes de reconnaissance et de classification d’images et de vidéos


Prérequis

culture de base en statistique, informatique (structures de données et algorithmique) et traitement d’images.

Contrôle des connaissances

CONTRÔLE CONTINU :
Type d'évaluation (ex : TP, assiduité, participation) : mini-examens sur un article présenté par des élèves

SESSION NORMALE :
Type d'examen (écrit, oral, examen sur machine) : examen écrit
Salle spécifique :
Durée :
Documents autorisés (ex : aucun, résumé feuille A4 manuscrite, dictionnaires, tous documents) : polycopié de cours, notes de cours
Documents interdits (ex : livres, tous documents) :
Matériel (ex : calculatrices):

  • matériel autorisé, préciser :
  • matériel interdit, préciser : calculatrice
    Commentaires :

SESSION DE RATTRAPAGE :
Type d'examen (écrit, oral, examen sur machine) : pas de rattrapage
Salle spécifique :
Durée :
Documents autorisés (ex : aucun, résumé feuille A4 manuscrite, dictionnaires, tous documents) :
Documents interdits (ex : livres, tous documents) :
Matériel (ex : calculatrices):

  • matériel autorisé, préciser :
  • matériel interdit, préciser :
    Commentaires :


N1=E1

Informations complémentaires

Cursus ingénieur->Filière MMIS->Semestre 5
Equipe->Bases de données-Systèmes d'information et connaissance

Bibliographie

Y. Lecun, Cours au College de France, http://www.college-de-france.fr/site/yann-lecun/course-2015-2016.htm

H. Wang, A. Kläser, C. Schmid, L. C.-Lin, Action Recognition by Dense Trajectories, CVPR 2011

H. Jégou, M. Douze, C. Schmid, Hamming embedding and weak geometric consistency for large scale image search, ECCV 2008

G. Csurka, C Dance, L Fan, J Willamowski, C Bray, Visual categorization with bags of keypoints, ECCV Workshop 2004

J. Sivic and A. Zisserman, Video Google: A Text Retrieval Approach to Object Matching in Videos, ICCV 2003

D. Lowe, Distinctive image features from scale-invariant keypoints, IJCV 2004