Volumes horaires
- CM 15.0
- Projet -
- TD -
- Stage -
- TP 18.0
- DS 2.0
Crédits ECTS
Crédits ECTS 0.5
Objectif(s)
Ce cours introduit les techniques d'ingénierie utilisées dans la caractérisation et la modélisation d'informations langagières. Il a pour objectif d'introduire les techniques de traitement utilisées dans les systèmes actuels d'analyse d'informations langagières en s'appuyant sur des corpus de données textuelles et/ou vocales. Les objectifs de ce cours sont les suivants :
- Extraire des représentations de données acoustiques et textuelles afin d'analyser ou de modéliser ces données
- Mettre en œuvre une chaîne de traitements pour modéliser des informations langagières
- Exploiter les grands modèles de langage (LLMs) présents sur des plateformes open-source (Huggingface) pour des tâches de modélisation
- Développer un sens critique de l'analyse
Contenu(s)
1. Introduction : communication, langage et technologies
2. Représentation et codage de signaux de parole
3. Extraction et codage de données textuelles
4. Prétraitements et modèles de données langagières
5. Méthodes et métriques d'évaluation de systèmes inférentiels
6. Neurone artificiel pour l'apprentissage automatique
7. Réseaux de neurones artificiels
8. Architectures neuronales avancées (CNN, transformers)
9. Méthodes auto-supervisées pour l'apprentissage de grands modèles de langage (parole)
10. Méthodes auto-supervisées pour l'apprentissage de grands modèles de langage (texte)
Connaissances de base en traitement du signal, théorie de l'information et informatique.
30% contrôle continu
70% examen terminal :
- 1 épreuve écrite - 1h30
- Document autorisé : Feuille A4 recto-verso de notes manuscrites de cours
- En cas de tiers-temps : 1/3 de temps supplémentaire
En cas de non validation d’une UE, le jury peut autoriser l’élève ingénieur à passer des épreuves complémentaires pour la valider.
Code de l'enseignement : KAIN8M13
Langue(s) d'enseignement :
Vous pouvez retrouver ce cours dans la liste de tous les cours.