Gestion de données en sciences de la vie, principes de base
- UE code SBIOB120
-
Schedule
8 12Quarter 1
- ECTS Credits 2
-
Language
Français
- Teacher
L'étudiant utilise le langage R pour décrire un jeu de données.
N° |
Critères d’évaluations |
Exigences |
1 |
Connaitre les bases du langage R |
L’étudiant est capable d’expliquer les concepts suivants : commande, argument, script, objet (type et classe), répertoire de travail, packages. |
2 |
Être familier avec l’interface R studio |
L’étudiant écrit ses commandes dans un script. Il utilise l’interface pour définir son répertoire de travail. |
3 |
Créer des objets |
L’étudiant est capable de créer des vecteurs, des matrices et des dataframe. |
4 |
Connaître les commandes de base |
L’étudiant est capable d’utiliser les commandes de la cheatsheet. |
5 |
Importer un jeu de données depuis un fichier |
L’étudiant est capable d’importer un jeu de données depuis un fichier en tenant compte des caractéristiques de ce même fichier : format, titre, valeurs manquantes. |
6 |
Explorer un jeu de données |
L’étudiant étudie le jeu de données en vérifiant la présence de valeurs manquante, d’erreur d’encodage, de valeurs aberrantes. Il extrait les valeurs problématiques et il les corrige. Il contrôlera également le format des colonnes. |
7 |
Décrire le jeu de données |
Pour répondre à la question, l’étudiant résume le jeu de données à l’aide de paramètres résumés : moyenne, écart-type, médiane, quartile, fréquence, pourcentage. Il les applique sur un ensemble de données en fonction ou non d’une seconde variable. |
8 |
Réaliser des graphiques |
Pour répondre à la question, l’étudiant est capable de choisir la bonne représentation graphique. Il comprendra les arguments fournis par l’enseignant pour améliorer l’esthétique. |
9 |
Exporter les résultats d’analyse |
L’étudiant est capable d’exporter des tableaux et des figures. Pour ces dernières, la résolution et la taille seront définies. |
Voir objectifs.
L'évaluation se déroule en session. L'étudiant résout un exercice similaire à ceux proposés durant l'année. En fin d'examen, l'étudiant rend son script. Il sera évalué oralement. Sa production et sa défense orale constitue une seule et même note. L'évaluation porte sur les objectifs énoncés dans la fiche descriptive.
L'examen est à court ouvert. Le laps de temps assez court de l'examen oblige l'étudiant à connaitre par coeur les notions théoriques et les fonctions du langage R. L'accès aux ressources permet à l'étudiant de se débloquer pour un problème ponctuel.
Tout contact avec un tiers sera considéré comme de la tricherie, avec au minimum une sanction de 0/20 à la note de l'UE.
Si l'étudiant utilise les fonctions disponibles dans le package ggplot2, il sera mieux noté à condition que les fonctions soient correctement utilisées. L'étudiant n'est pas pénalisé s'il n'utilise pas ces fonctions. C'est optionnel.
Si l'étudiant souhaite faire l'acquisition d'un libre, l'enseignant "Le langage R au quotidien, traitement et analyse de données volumineuses" d'Olivier Decourt (Dunod). Son achat n'est pas obligatoire. Suffisamment de ressources sont mises à disposition de l'étudiant.