Ensimag Rubrique Formation 2022

Stockage et traitement de données à grande échelle - WMMBEDGE

  • Volumes horaires

    • CM 27.0
    • Projet -
    • TD -
    • Stage -
    • TP 9.0
    • DS -

    Crédits ECTS

    Crédits ECTS 2.5

Objectif(s)

Les données sont distribuées, omniprésentes et leur volume et hétérogénéité ne cessent d’augmenter. Nous créons 2.5 Exabytes de données par jour… A l’heure du Big Data, un des enjeux est de maîtriser les supports de gestion des masses de données hétérogènes et de permettre d’en tirer profit à nos sociétés.

Dans ce contexte, l’objectif de ce cours est d’étudier les principaux aspects de la gestion des masses de données et de leur analyse, en considérant des systèmes de « type » SQL et NoSQL (e.g Hadoop).

Responsable(s)

Claudia RONCANCIO

Contenu(s)

Les données sont distribuées, omniprésentes et leur volume et hétérogénéité ne cessent d’augmenter. Nous créons 2.5 Exabytes de données par jour… A l’heure du Big Data, un des enjeux est de maîtriser les supports de gestion des masses de données hétérogènes et de permettre d’en tirer profit à nos sociétés. Dans ce contexte, l’objectif de ce cours est d’étudier les principaux aspects de la gestion des masses de données et de leur analyse, en considérant des systèmes de « type » SQL et NoSQL (e.g Hadoop).
L’hétérogénéité des données sera abordée selon divers angles dont l’intégration de sources,la diversité de modèles de données et de traitement. On étudiera également l’évaluation de requêtes déclaratives multi-sources ainsi que la programmation de requêtes et d’algorithmes d’analyse avec le paradigme Map-Reduce. Ce paradigme est particulièrement utilisé sur des architectures de type cloud ou cluster pour le traitement de larges collections de données.

Nous étudierons également les principaux aspects des entrepôts de données et des systèmes décisionnels (business intelligence). Nous considérerons, entre autres, des données sociales, concernant les utilisateurs, et leur utilisation pour du profiling et dans des systèmes de recommandation.

Prérequis

Fondement de bases de données et de programmation

Contrôle des connaissances

N1 = (3×E1 + 2×TP) / 5
N2 = (3×E2 + 2×TP) / 5

Codification pour la formule de calcul de la note :
N1=note finale de 1ère session
N2=note finale de 2ème session
E1=examen de 1ère session
E2=examen de 2ème session
TP=travaux pratiques

Remarque: la note de TP ne se rattrape pas en 2ème session.

Contrôle continue, TP et écrit.

Calendrier

Le cours est programmé dans ces filières :

  • Cursus ingénieur - Mastère Big-Data - Semestre 9
cf. l'emploi du temps 2022/2023

Informations complémentaires

Code de l'enseignement : WMMBEDGE
Langue(s) d'enseignement : FR

Le cours est rattaché aux structures d'enseignement suivantes :

Vous pouvez retrouver ce cours dans la liste de tous les cours.

Bibliographie

La bibliographie sera donnée par les divers enseignants pour chaque chapitre du cours.