Introduction à la science des données - KAIN9M07

  • Volumes horaires

    • CM 18.0
    • Projet -
    • TD 18.0
    • Stage -
    • TP -
    • DS 2.0

    Crédits ECTS

    Crédits ECTS 0.4

Objectif(s)

La science des données est une discipline au confluent de la statistique, de l?intelligence artificielle et de l?apprentissage machine, dont l?objectif est l?analyse de grands ensembles de données pour l?extraction de connaissances et l?aide à la décision.
La science des données prend un intérêt grandissant dans les applications émergeantes (Médias et réseaux sociaux, smart-grid, internet des objets, smart-cities, mobilité humaine, etc.), nécessitant l?utilisation de méthodes fines et avancées pour l?analyse et la prédiction à partir de données complexes (massives, structurées, reliées, dynamique?). Ces méthodologies sont au c?ur de nombreux logiciels dits d'intelligence artificielle utilisés tant au niveau industriel qu?académique.

Ce cours expose les principales méthodes et techniques d?analyse des données conduisant à l?élaboration d?un projet d?analyse exploratoire et décisionnelle : la préparation des données et codages pour la constitution de la base d?analyse, analyse des objectifs et choix des modèles d?analyses, validation et l?interprétations des résultats. Ce cours est étayé par des travaux pratiques, un projet d?analyse décisionnelle et l?utilisation d?un logiciel d?analyse des données R.

Contenu(s)

1- Mesures de dis(similarités), codages et prétraitements des données
2- Classification non supervisée / Clustering (dédiée aux données massives)
3- Classification supervisée en vue de la prédiction
4- Protocole de validation en classification : approches empiriques, rééchantillonnage, validation du nombre de classes, validation croisée
5- Travaux pratiques ainsi qu?un projet final en apprentissage sur des données publiques à échelle réelle.

Contrôle des connaissances

30% contrôle continu
70% examen terminal :

  • 1 épreuve écrite – 2h
  • documents autorisés
  • En cas de tiers-temps : notation adaptée (facteur 1.33)
    En cas de non validation d’une UE, le jury peut autoriser l’élève ingénieur à passer des épreuves complémentaires pour la valider.

Calendrier

Le cours est programmé dans ces filières :

  • Formations d'ingénieur - INFO - Semestre 9

Informations complémentaires

Code de l'enseignement : KAIN9M07
Langue(s) d'enseignement : FR

Vous pouvez retrouver ce cours dans la liste de tous les cours.