Volumes horaires
- CM 15.0
- Projet -
- TD -
- Stage -
- TP 3.0
- DS -
Crédits ECTS
Crédits ECTS 2.0
Objectif(s)
La gestion des données et des informations est devenue un enjeu majeur pour notre société et source de nombreux défis informatiques. Les données sont distribuées, omniprésentes, produite en temps réel et leur volume et hétérogénéité ne cessent d’augmenter. Nous créons 2.5 Exabytes de données par jour ! A l’heure du Big Data et d’un société digitale, l’enjeu est de maîtriser la gestion des masses de données et de permettre d’en tirer profit pour nos sociétés. Les systèmes d’information dans le domaine de la finance son particulièrement concernés.
Dans ce contexte, l’objectif de ce cours est d’étudier les principaux aspects de la gestion des données et de leur analyse. Nous aborderons les fondamentaux de la gestion de données en centralisé et en distribué.
L’hétérogénéité des données sera abordée selon divers angles dont l’intégration des sources, les données temps réel et les approches NoSQL. On étudiera l’évaluation de requêtes déclaratives multi-sources ainsi qu’une introduction au paradigme Map-Reduce. Ce paradigme est particulièrement utilisé pour le traitement de larges collections de données.
Claudia RONCANCIO
Contenu(s)
Introduction à la gestion des données réparties et hétérogènes
--Répartition des traitements
--Approches NoSQL, MapReduce Spark
Analyse des données et organisation automatique et thématique d’une collection
PrérequisFondements de systèmes de gestion de bases des données.
S1 = TP + examen (documents autorisés)
S2 = Examen (document autorisés)
S1 = TP + examen
S2 = Examen
Le cours est programmé dans ces filières :
- Cursus ingénieur - Filière IF - Semestre 9
- Cursus ingénieur - Filière IF - Semestre 9
Code de l'enseignement : WMMFMB10
Langue(s) d'enseignement :
Le cours est rattaché aux structures d'enseignement suivantes :
Vous pouvez retrouver ce cours dans la liste de tous les cours.