Introduction to data science

Catalogue des cours de Institut Mines-Télécom Business School

Code

MUFE MIS 3402

Niveau

L3

Discipline

Systèmes d’information

Langue

Anglais/English

Crédits ECTS

3

Heures programmées

18

Charge totale étudiant

60

Coordonnateur(s)

Département

  • Data analytics, Économie et Finances

Equipe pédagogique

Introduction au module

This course provides an introduction to the fundamental concepts of data science using R and R studio. Students will learn how to manipulate, analyze, and visualize data to extract meaningful insights. The module covers key stages of the data lifecycle, from collection and cleaning to the application of basic statistical models to support decision-making.

Objectifs d'apprentissage (compétences mères)

  • 6.2 - Optimiser l'usage d'outils adaptés aux différents domaines de gestion, et définir et interpréter les KPI pertinents, afin de mesurer et garantir une création de valeur durable et soutenable pour toutes les parties prenantes.
  • 6.3 - Produire et analyser les principaux documents de synthèse, dans le but de s'assurer d'une gestion optimale, durable, en veillant à son alignement sur la vision, mission et les valeurs de l'organisation.

Traits de compétences

— (DQ15) Content creation and computational literacy: Synthesizing, creating, and producing information, media, and technology in an innovative and creative manner.

— (DQ23) Data and AI literacy: Generating, processing, analyzing, presenting meaningful information from data and developing, using, and applying artificial intelligence (AI) and related algorithmic tools and strategies in order to guide informed, optimized, and contextually relevant decision-making processes.

— (CPS1) Data/information management: Gathering information from various sources to understand a problem; Classifying and categorizing data to identify patterns and relationships, Assessing the quality, relevance, and significance of information, and Applying reasoning, deduction, and induction to make sense of information and reach conclusions.

Contenu : structure du module et agenda

S1 : Introduction to Statistics. Introduction to
programming with R (Variables, Data types, Vector List,
Function). Installation R and R Studio
S2 : Statistical measures
S3 : Programming with R II (Conditionals, Loops, Vector
Matrix, Data frame). Economic Data
S4 : R/RStudio Tips. Data frames : Data analysis,
interpretation, and management
S5 : Descriptive statistics
S6 : Data analysis, interpretation, and management, Data
visualization
S7 : Correlation and t-test : Correlation vs causation.
Hypothesis testing. Binomial
S8 : Linear model, R-square, common assumptions :
normality, linearity, multicollinearity, and outliers
S9 : Presentation and discussion

Contribution à l'atteinte des ODD (Objets du Développement Durable)

Ce cours contribue à l'ODD 4 en dotant les étudiants de compétences numériques avancées et de capacités d'analyse critique des données, essentielles dans la société actuelle. En favorisant l'acquisition de connaissances techniques transversales, le module participe à la formation d'une main-d'œuvre qualifiée capable de répondre aux défis complexes du monde professionnel, soutenant ainsi une éducation de qualité inclusive et axée sur l'avenir.

Méthode pédagogique

enseignement interactif avec les étudiants et l'enseignant, les étudiants travail en group sur la supervision de l'enseignant

Système de notation et modalités de rattrapage

Continous assessment (3 homeworks + practical session report 30%) + Written report (50%) + Make a presentation (last class) in groups of 2 (20%)
Rattrapage: Written report individuelle (100%)

Références obligatoires et lectures suggérées

Dalpiaz, D. (2021). Applied statistics with R.
Thulin, M. (2024). Modern Statistics with R: From wrangling and exploring data to inference and predictive modelling. Chapman and Hall/CRC.

Mots-clés

R studio, Jupyter Notebook, Data Science