Ensimag Rubrique Formation 2022

Accès à l'information : du web des données au web sémantique - WMMBEAI5

  • Volumes horaires

    • CM 12.0
    • Projet -
    • TD 12.0
    • Stage -
    • TP -
    • DS -

    Crédits ECTS

    Crédits ECTS 3.0

Objectif(s)

L'objectif de ce cours est de présenter l'ensemble des concepts, méthodes et algorithmes utilisés dans les systèmes d'accès à l'information sur le web. Dans la mesure où les moteurs de recherche sur internet mettent en jeu un grand nombre de techniques récentes issues de la recherche d'information (RI), de l'apprentissage automatique et du web sémantique.

Responsable(s)

Clovis GALIEZ, Danielle ZIEBELIN

Contenu(s)

Nous nous intéresserons, dans un premier temps, aux modèles et algorithmes utilisés par ces moteurs qui tentent d'exploiter au mieux le « web des données ». Nous verrons dans un second temps comment étendre le web des données par des contraintes sémantiques (exprimées dans des ontologies) et comment les exploiter de façon efficace pour vérifier la cohérence des données et aussi répondre aux requêtes de manière à la fois plus flexible et plus complète.
Le cours abordera ensuite les thématiques suivantes :

1. Pattern matching
2. Crawling
3. Indexation
4. Représentation efficace de documents
5. Représentation en sémantique latente
6. Apprentissage automatique de représentations
7. Structure de graphe du web et algorithme de ranking PageRank

Prérequis

Programmation Python idéalement

Contrôle des connaissances

Evaluation : Projet (rendu du code et des résultats) + examen écrit (2h)

Rattrapage : Examen oral (exposé, soutenance, etc..) (20min)

SESSION NORMALE :
Type d'examen si présentiel : examen écrit (E1) sur papier ou sur QCM machine (2h) final, projet optionnel en bonus (P0).
Documents autorisés : tous documents
Matériel interdit : tout appareil électronique communicant

Session 2:
(E2) Rattrapage possible sous forme d'oral (20 min), aucun document autorisé.
Matériel interdit : tout appareil électronique communicant

N1=E1 + PO
N2=E2 + PO

Calendrier

Le cours est programmé dans ces filières :

  • Cursus ingénieur - Mastère Big-Data - Semestre 9
cf. l'emploi du temps 2025/2026

Informations complémentaires

Code de l'enseignement : WMMBEAI5
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.