Ensimag Rubrique Formation 2022

Accès à l'information : du web des données au web sémantique - WMMBEAI5

  • Volumes horaires

    • CM 12.0
    • Projet -
    • TD 12.0
    • Stage -
    • TP -
    • DS -

    Crédits ECTS

    Crédits ECTS 2.5

Objectif(s)

L'objectif de ce cours est de présenter l'ensemble des concepts, méthodes et algorithmes utilisés dans les systèmes d'accès à l'information sur le web. Dans la mesure où les moteurs de recherche sur internet mettent en jeu un grand nombre de techniques récentes issues de la recherche d'information (RI), de l'apprentissage automatique et du web sémantique.

Responsable(s)

Marie-Christine LAGARDE ROUSSET, Clovis GALIEZ

Contenu(s)

Nous nous intéresserons, dans un premier temps, aux modèles et algorithmes utilisés par ces moteurs qui tentent d'exploiter au mieux le « web des données ». Nous verrons dans un second temps comment étendre le web des données par des contraintes sémantiques (exprimées dans des ontologies) et comment les exploiter de façon efficace pour vérifier la cohérence des données et aussi répondre aux requêtes de manière à la fois plus flexible et plus complète.
Le cours abordera ensuite les thématiques suivantes :

1. Pattern matching
2. Crawling
3. Indexation
4. Représentation efficace de documents
5. Représentation en sémantique latente
6. Apprentissage automatique de représentations
7. Structure de graphe du web et algorithme de ranking PageRank

Contrôle des connaissances

CONTRÔLE CONTINU :
Type d'évaluation (ex : TP, assiduité, participation) :

SESSION NORMALE :
Type d'examen (si présentiel) : écrit
Type d'examen (si distanciel) : devoir maison
Projet optionel en bonus.

Salle spécifique :
Durée : 2h
Documents autorisés (ex : aucun, résumé feuille A4 manuscrite, dictionnaires, tous documents) :
documents de cours
Documents interdits (ex : livres, tous documents) : -
Matériel (ex : calculatrices): crayon

Commentaires :

SESSION DE RATTRAPAGE :
Type d'examen (écrit, oral, examen sur machine) : oral
Salle spécifique :
Durée : 2h
Documents autorisés (ex : aucun, résumé feuille A4 manuscrite, dictionnaires, tous documents) :
documents de cours
Documents interdits (ex : livres, tous documents) :
Matériel (ex : calculatrices): crayon
Commentaires :

N1=E1
N2=E2

Calendrier

Le cours est programmé dans ces filières :

  • Cursus ingénieur - Mastère Big-Data - Semestre 9
cf. l'emploi du temps 2022/2023

Informations complémentaires

Code de l'enseignement : WMMBEAI5
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.