Ensimag Rubrique Formation 2022

Accès à l'information : du web des données au web sémantique

  • Volumes horaires

    • CM 18.0

    Crédits ECTS

    Crédits ECTS 1.75

Objectif(s)

L'ojectif de ce cours est de présenter l'ensemble des concepts, méthodes et algorithmes utilisés dans les systèmes d'accès à l'information sur le web. Dans la mesure où les moteurs de recherche sur internet mettent en jeu un grand nombre de techniques récentes issues de la recherche d'information (RI), de l'apprentissage automatique et du web sémantique, nous nous intéresserons, dans un premier temps, aux modèles et algorithmes utilisés par ces moteurs qui tentent d'exploiter au mieux le "web des données". Nous verrons dans un second temps comment étendre le web des données par des contraintes sémantiques (exprimées dans des ontologies) et comment les exploiter de façon efficace pour vérifier la cohérence des données et aussi répondre aux requêtes de manière à la fois plus flexible et plus complète.


Contact Eric GAUSSIER

Contenu(s)

Le cours abordera les thématiques suivantes, une thématique pouvant s'étendre sur plusieurs séances :

1. Introduction
2. Indexation automatique
3. Recherche de documents pertinents
- Le fichier inverse
- L'algorithme "sorted block index"
- L'approche map-reduce
4. Ordonnancement non supervisé de documents : les modèles classiques de la RI
5. Ordonnancement supervisé : apprentissage automatique et RI
6. PageRank : comment calculer l'importance d'une page sur le web ?
7. Classification de documents
8. RDF, RDFS et SPARQL: les ingrédients du web des données
9. Ontologies, OWL, raisonnement logique: les ingrédients du web sémantique



Prérequis

Connaissances de base en algèbre, probabilités, algorithmique et bases de données

Contrôle des connaissances

L'évaluation prendra la forme d'un examen écrit final.



Informations complémentaires

Cursus ingénieur->Filière ISI->Semestre 5