Aller au menu Aller au contenu
Une voie, plusieurs choix
Informatique et Mathématiques appliquées
Une voie, plusieurs choix

> Formation > Cursus ingénieur

Accès à l'information : du web des données au web sémantique - 5MMAIWD7

A+Augmenter la taille du texteA-Réduire la taille du texteImprimer le documentEnvoyer cette page par mail Partagez cet article Facebook Twitter Linked In Google+ Viadeo
  • Volumes horaires

    • CM : 18.0
    Crédits ECTS : 1.5

Objectifs

L'ojectif de ce cours est de présenter l'ensemble des concepts, méthodes et algorithmes utilisés dans les systèmes d'accès à l'information sur le web. Dans la mesure où les moteurs de recherche sur internet mettent en jeu un grand nombre de techniques récentes issues de la recherche d'information (RI), de l'apprentissage automatique et du web sémantique, nous nous intéresserons, dans un premier temps, aux modèles et algorithmes utilisés par ces moteurs qui tentent d'exploiter au mieux le "web des données". Nous verrons dans un second temps comment étendre le web des données par des contraintes sémantiques (exprimées dans des ontologies) et comment les exploiter de façon efficace pour vérifier la cohérence des données et aussi répondre aux requêtes de manière à la fois plus flexible et plus complète.

Contact Marie-Christine ROUSSET, Eric GAUSSIER

Contenu

Le cours abordera les thématiques suivantes, une thématique pouvant s'étendre sur plusieurs séances :

1. Introduction
2. Indexation automatique
3. Recherche de documents pertinents
- Le fichier inverse
- L'algorithme "sorted block index"
- L'approche map-reduce
4. Ordonnancement non supervisé de documents : les modèles classiques de la RI
5. Ordonnancement supervisé : apprentissage automatique et RI
6. PageRank : comment calculer l'importance d'une page sur le web ?
7. Classification de documents
8. RDF, RDFS et SPARQL: les ingrédients du web des données
9. Ontologies, OWL, raisonnement logique: les ingrédients du web sémantique



Prérequis

Connaissances de base en algèbre, probabilités, algorithmique et bases de données

Contrôles des connaissances

CONTRÔLE CONTINU :
Type d'évaluation (ex : TP, assiduité, participation) :

SESSION NORMALE :
Type d'examen (écrit, oral, examen sur machine) : examen écrit final.
Salle spécifique :
Durée :
Documents autorisés (ex : aucun, résumé feuille A4 manuscrite, dictionnaires, tous documents) :
Documents interdits (ex : livres, tous documents) :
Matériel (ex : calculatrices):

  • matériel autorisé, préciser :
  • matériel interdit, préciser :
    Commentaires :

SESSION DE RATTRAPAGE :
Type d'examen (écrit, oral, examen sur machine) :
Salle spécifique :
Durée :
Documents autorisés (ex : aucun, résumé feuille A4 manuscrite, dictionnaires, tous documents) :
Documents interdits (ex : livres, tous documents) :
Matériel (ex : calculatrices):

  • matériel autorisé, préciser :
  • matériel interdit, préciser :
    Commentaires :


A+Augmenter la taille du texteA-Réduire la taille du texteImprimer le documentEnvoyer cette page par mail Partagez cet article Facebook Twitter Linked In Google+ Viadeo

mise à jour le 18 juin 2017

Grenoble INP Institut d'ingénierie Univ. Grenoble Alpes