Ensimag Rubrique Formation 2022

Parole et langage: technologie vocale et systeme d'interaction - 5MMPLTVS

  • Volumes horaires

    • CM 18.0

    Crédits ECTS

    Crédits ECTS 1.75

Objectif(s)

Le but de ce cours est de donner une introduction aux techniques vocales (codage, synthèse et reconnaissance de parole) qui exploitent les traces audibles (signal acoustique) et visibles (mouvements de lèvres, etc.) produit par les gestes articulatoires sous-jacents (produits par la mâchoire, la langue, le larynx, le vélum, etc.) Ce cours donne d’abord des connaissances de base en physiologie, phonétique, phonologie et linguistique pour comprendre la chaîne de production, de perception et de compréhension du langage parlé. Les techniques de base en traitement, représentation et modélisation des signaux seront ensuite abordées. Nous poursuivrons par un état de l’art des systèmes de synthèse et reconnaissance de parole ainsi que des systèmes d’animation faciale. Nous conclurons sur une revue des systèmes d’interaction verbale incarnés par des robots anthropoïdes ou des agents conversationnels animés.

Contact Pascal PERRIER

Contenu(s)

• Production et de perception multimodales de la parole
• Structures phonologiques des langues du monde. Application au français
• Représentations phonétiques et traitement du signal de parole
• Systèmes de synthèse audiovisuelle à partir du texte et animation faciale
• Systèmes de reconnaissance audiovisuelle
• Systèmes d’interaction située



Prérequis

Néant

Contrôle des connaissances

CONTRÔLE CONTINU :
Type d'évaluation (ex : TP, assiduité, participation) :

SESSION NORMALE :
Type d'examen (écrit, oral, examen sur machine) : examen écrit session 1
Salle spécifique :
Durée :
Documents autorisés (ex : aucun, résumé feuille A4 manuscrite, dictionnaires, tous documents) :
Documents interdits (ex : livres, tous documents) :
Matériel (ex : calculatrices):

  • matériel autorisé, préciser :
  • matériel interdit, préciser :
    Commentaires :

SESSION DE RATTRAPAGE :
Type d'examen (écrit, oral, examen sur machine) : oral session 2
Salle spécifique :
Durée :
Documents autorisés (ex : aucun, résumé feuille A4 manuscrite, dictionnaires, tous documents) :
Documents interdits (ex : livres, tous documents) :
Matériel (ex : calculatrices):

  • matériel autorisé, préciser :
  • matériel interdit, préciser :
    Commentaires :


N1=E1
N2=E2

Informations complémentaires

Cursus ingénieur->Filière MMIS->Semestre 5
Equipe->Image,Vision,Interaction Multimédia,Bioinfo

Bibliographie

Dutoit, T. (1997) An introduction to text-to-speech synthesis. Dordrecht/ Boston/ London: Kluwer Academic.
Parke, F.I. and K. Waters (1996) Computer Facial Animation.Wellesley, MA, USA: A.K. Peters
O'Shaughnessy, D. (2nd edition, 2000) Speech Communication - Human and Machine.New York: IEEE Press