Learning outcomes

A l'issue du cours, l'étudiant doit être capable de résoudre des problèmes simples d'analyse de données à l'aide d'algorithmes adaptés.  Plus particulièrement, avec la créativité et la rigueur nécessaires, il sera capable de

  • faire une première analyse univariée et bivariée (histogrammes, scatter plots)
  • prétraiter des données (outliers, valeurs manquantes, réduction de dimension)
  • gérer des types de données divers (numériques, textuelles, séquentieles, spatiales)
  • analyser les données en profondeur (clustering, classification)
  • communiquer les résults (graphes, reporting)

Il doit aussi pouvoir faire preuve d'une compréhension des différents concepts abordés (cf. contenu), c'est-à-dire exprimer avec ses propres mots la théorie et les outils vus au cours et expliquer dans quel contexte ceux-ci sont utiles.

Goals

Le but du cours est d'introduire l'étudiant à l'analyse de données, afin qu'il puisse résoudre des problèmes simples à l'aide d'algorithmes adaptés. Les concepts suivants seront progressivement introduits : prétaitement des données, analyse univariée et bivariée, types de données, clustering, classification et communication des résultats. Une attention particulière sera donnée à l'utilisation adéquate de chaque concept et à leur illustration à l'aide d'exemples. L'étudiant aura l'ocassion de développer sa créativité et sa rigueur au travers de séances d'exercices. Le cours et les séances d'exercices seront également l'occasion pour l'étudiant de découvrir des outils d'analyse de données.

Exercices

Les étudiants auront l'occasion de mettre en pratique les connaissances vues au cours.  Chaque bloc de 3 heures de cours sera divisé en +/- 1 heure de cours suivie de +/- 2 heures de mise en pratique.  Plusieurs problème d'analyse de données seront réalisés individuellement afin de fixer les connaissances grâce à des sujets intégrateurs des différentes notions du cours.

Assessment method

L'étudiant sera évaluée sur sa capacité à mettre en oeuvre les compétences et connaissances du cours pour réaliser des tâches d'analyse de données.  Cette évaluation continue repose sur la résolution en présentiel de problèmes et la participation active durant les séances de cours.  Attention, vu l'ampleur du travail à fournir au long du quadrimestre et le format d'évaluation, il n'est par ailleurs pas possible de représenter ce cours en seconde session.  Un ou plusieurs cas d'analyse de données de plus grande ampleur permettront d'intégrer les différents concepts afin d'en évaluer la maîtrise.

Language of instruction