Aller au menu Aller au contenu
Une voie, plusieurs choix
Informatique et Mathématiques appliquées
Une voie, plusieurs choix

> Formation > Cursus ingénieur

Stockage et traitement de données à grande échelle - WMMBEST5

A+Augmenter la taille du texteA-Réduire la taille du texteImprimer le documentEnvoyer cette page par mail cet article Facebook Twitter Linked In
  • Volumes horaires

    • CM : 25.5
    • TD : -
    • TP : 10.5
    • Projet : -
    • Stage : -
    • DS : -
    Crédits ECTS : 3.5
  • Responsables : Claudia RONCANCIO

Objectifs

Les données sont distribuées, omniprésentes et leur volume et hétérogénéité ne cessent d’augmenter. Nous créons 2.5 Exabytes de données par jour… A l’heure du Big Data, un des enjeux est de maîtriser les supports de gestion des masses de données hétérogènes et de permettre d’en tirer profit à nos sociétés.

Dans ce contexte, l’objectif de ce cours est d’étudier les principaux aspects de la gestion des masses de données et de leur analyse, en considérant des systèmes de « type » SQL et NoSQL (e.g Hadoop).

Contenu

Les données sont distribuées, omniprésentes et leur volume et hétérogénéité ne cessent d’augmenter. Nous créons 2.5 Exabytes de données par jour… A l’heure du Big Data, un des enjeux est de maîtriser les supports de gestion des masses de données hétérogènes et de permettre d’en tirer profit à nos sociétés. Dans ce contexte, l’objectif de ce cours est d’étudier les principaux aspects de la gestion des masses de données et de leur analyse, en considérant des systèmes de « type » SQL et NoSQL (e.g Hadoop).
L’hétérogénéité des données sera abordée selon divers angles dont l’intégration de sources,la diversité de modèles de données et de traitement. On étudiera également l’évaluation de requêtes déclaratives multi-sources ainsi que la programmation de requêtes et d’algorithmes d’analyse avec le paradigme Map-Reduce. Ce paradigme est particulièrement utilisé sur des architectures de type cloud ou cluster pour le traitement de larges collections de données.

Nous étudierons également les principaux aspects des entrepôts de données et des systèmes décisionnels (business intelligence). Nous considérerons, entre autres, des données sociales, concernant les utilisateurs, et leur utilisation pour du profiling et dans des systèmes de recommandation.

Prérequis

Fondement de bases de données et de programmation

Contrôles des connaissances

N1 = (3×E1 + 2×TP) / 5
N2 = (3×E2 + 2×TP) / 5

Codification pour la formule de calcul de la note :
N1=note finale de 1ère session
N2=note finale de 2ème session
E1=examen de 1ère session
E2=examen de 2ème session
TP=travaux pratiques

Remarque: la note de TP ne se rattrape pas en 2ème session.

Note de TP et note d'examen écrit.

Calendrier

Le cours est programmé dans ces filières :

  • Cursus ingénieur - Mastère Big-Data - Semestre 9
cf. l'emploi du temps 2020/2021

Informations complémentaires

Code de l'enseignement : WMMBEST5
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.

Bibliographie

La bibliographie sera donnée par les divers enseignants pour chaque chapitre du cours.

A+Augmenter la taille du texteA-Réduire la taille du texteImprimer le documentEnvoyer cette page par mail cet article Facebook Twitter Linked In

mise à jour le 10 mars 2020

Université Grenoble Alpes