Analyse de données

Catalogue des cours de Institut Mines-Télécom Business School

Code

MGYF QUA 4602

Niveau

M1

Discipline

Techniques quantitatives

Langue

Français/French

Crédits ECTS

1

Heures programmées

14

Charge totale étudiant

20

Coordonnateur(s)

Département

  • Data analytics, Économie et Finances

Equipe pédagogique

Introduction au module

Ce cours a pour objectif de fournir aux étudiants des compétences pratiques en analyse de données à l’aide du logiciel statistique R et RStudio. Les décisions commerciales reposent de plus en plus sur l’analyse de données — telles que le comportement des clients, les tendances de vente, les indicateurs d’audience ou l’efficacité publicitaire — faisant de l’analyse de données un outil indispensable à une prise de décision éclairée.

Le cours commence par une introduction à R et à ses fonctions essentielles, notamment l’importation et la gestion de bases de données. Les étudiants exploreront ensuite les jeux de données à travers des statistiques descriptives et des visualisations. La seconde partie du cours est consacrée à l’analyse de régression et aux modèles pour variables discrètes (Probit/Logit), en abordant les problèmes courants tels que la non-linéarité, la corrélation ou les valeurs aberrantes, ainsi que les méthodes pour y remédier, interpréter et présenter les résultats de manière efficace.

Finalité d'apprentissage (Bloc de compétences)

  • LG1 Être capable d'étendre sa propre intelligence digitale à travers ses différentes dimensions (de manière responsable et durable)
  • LG2 Avoir la capacité de gérer l'incertitude et la complexité avec précision et rigueur
  • LG4 Avoir accès à différents instruments transdisciplinaires de management

Objectifs d'apprentissage (compétences mères)

  • 1.3 - Développer la compétitivité des entreprises et la souveraineté numérique
  • 2.1 - Identifier et analyser en profondeur les problèmes, les causes et les impacts
  • 2.2 - Explorer les solutions, les décisions et leurs impacts relatifs et absolus
  • 4.2 - Comprendre et utiliser des concepts, des connaissances et des théories interdisciplinaires

Traits de compétences

À l’issue de ce cours, les étudiants devront être capables de :
- Importer une base de données dans un format propriétaire (SAS, Stata, SPSS, Excel, etc.) ou non (CSV, TXT, etc.) et la manipuler (changer les noms, fusionner avec d’autres bases, etc.) ;
-Manipuler les variables d’une base de données (modifier, créer, renommer, etc.) ;
- Réaliser des statistiques descriptives sur des variables qualitatives (fréquence, mode, etc.) et quantitatives (moyenne, médiane, variance, etc.) ;
- Produire des visualisations de données (nuages de points, histogrammes, diagrammes en barres, etc.) ;
- Estimer des modèles de régression linéaire et des modèles discrets (Probit, Logit, etc.) et commenter les résultats ;
- Tester certains problèmes courants (colinéarité, non-linéarité, valeurs aberrantes, etc.) et mettre en œuvre des solutions appropriées.

Contenu : structure du module et agenda

- Session 1 : Introduction à l’économétrie et installation du logiciel R ; importation de fichiers (csv, txt, xlsx, etc.) et manipulation (création, nettoyage, fusion, etc.)

- Session 2 : Manipulation et transformation des données (création, renommage, etc.) ; statistiques descriptives et graphiques

- Session 3 : Principes de la régression linéaire

- Session 4 : Problèmes courants de la régression linéaire: normalité, linéarité ,variables omises et valeurs aberrantes

Contribution à l'atteinte des ODD (Objets du Développement Durable)

Objectif n°8: "Promouvoir une croissance économique partagée et durable, un emploi plein et productif ainsi qu’un travail décent pour tous. Les décisions commerciales sont de plus en plus fondées sur l’analyse des données en amont. Ce cours vous aidera à comprendre comment ces informations sont produites et quelles sont les limites de leur utilisation. Ces éléments sont essentiels à la mise en œuvre de stratégies d’entreprise solides, et donc à la croissance des entreprises."

Nombre d'ODD abordés parmi les 17

1

Apprentissage

Mixte

Méthode pédagogique

Ce cours se base essentiellement sur des Travaux Pratiques et des travaux en petits groupes.

Système de notation et modalités de rattrapage

Les étudiants sont évalués à travers un document final à réaliser en groupe de 2 ou 3 personnes. Ils doivent formuler une question à traiter, identifier la base de données correspondante ainsi que le type de modèle à utiliser pour y répondre. Une revue de littérature, effectuée à l’aide de ChatGPT ou d’un autre LLM similaire, doit être menée afin d’extraire les hypothèses, ainsi que des tests pour les problèmes courants liés à la méthodologie choisie. Le modèle utilisé pour répondre à la question initiale est ensuite présenté et commenté.
Pour le rattrapage, les étudiants doivent améliorer leur dossier suite aux feedbacks reçus.

Règlement du module

Communication Professeur-Étudiants

● Le professeur communiquera avec les étudiants via leur adresse email institutionnelle (IMT-BS/TSP) et la plateforme Moodle. Aucune communication ne sera faite via des adresses email personnelles. Il est de la responsabilité des étudiants de consulter régulièrement leur boîte mail IMT-BS/TSP.
● Les étudiants peuvent communiquer avec le professeur par email à son adresse institutionnelle. Si nécessaire, il est possible de rencontrer le professeur dans son bureau pendant ses heures de réception ou sur rendez-vous.
Étudiants ayant besoin d’un aménagement

Si un étudiant présente un handicap l’empêchant de réaliser le travail demandé ou nécessitant un quelconque aménagement, il doit en informer le directeur du programme (avec justificatifs) dès que possible. Il est également encouragé à en discuter avec le professeur.
Comportement en classe

● Par respect pour le professeur et les autres étudiants, tous les téléphones portables, jeux électroniques ou tout autre appareil générant du son doivent être éteints pendant le cours.
● Les étudiants doivent éviter tout comportement perturbateur ou irrespectueux, tel que : arriver en retard, partir en avance, adopter un comportement négligent (par exemple : dormir, lire un document non lié au cours, utiliser un langage vulgaire, parler de manière excessive, manger, boire, etc.). Un avertissement pourra être donné lors de la première infraction à ces règles. En cas de récidive, l’étudiant pourra être sanctionné et faire l’objet d’une exclusion du cours et/ou de procédures disciplinaires.
● Le retard toléré est de 5 minutes. La présence sera enregistrée sur Moodle pendant ces 5 minutes via un QR code fourni par l’enseignant en début de cours.
● Les étudiants doivent arriver à l’heure aux examens et autres évaluations. Aucun étudiant ne sera autorisé à entrer dans la salle une fois que la première personne aura terminé l’examen et quitté la salle. Aucune exception ne sera faite à cette règle. Aucun étudiant ne pourra continuer à composer une fois le temps écoulé. Aucun étudiant ne pourra quitter la salle pendant un examen, sauf s’il a terminé et remis tous les documents.
● En cas d’enseignement à distance, l’étudiant doit garder sa caméra allumée, sauf indication contraire du professeur.
Code d’honneur

IMT-BS adhère à une politique d’honnêteté au sein de la communauté académique. Tout comportement compromettant cette politique pourra entraîner des sanctions académiques et/ou disciplinaires.
Les étudiants doivent s’abstenir de tricher, mentir, plagier ou voler. Cela inclut le fait de produire un travail original personnel et de mentionner toute autre personne dont les idées ou les documents imprimés (y compris ceux issus d’Internet) sont paraphrasés ou cités directement.
Tout étudiant qui viole ou aide un autre étudiant à violer les standards de comportement académique sera sanctionné selon les règles en vigueur à IMT-BS.

Mots-clés

Analyse de données; Statistiques; Exploration graphique; Aide à la décision

Prérequis

Base de la statistique