Code
MGYF INF 4602
Niveau
M1
Discipline
Informatique
Langue
Français/French
Crédits ECTS
3
Heures programmées
14
Charge totale étudiant
40
Coordonnateur(s)
Département
- Data analytics, Économie et Finances
Equipe pédagogique
Introduction au module
Ce module propose une initiation pratique à la programmation Python appliquée à l'analyse de données et à l'intelligence artificielle. Inscrit dans une logique "learning by doing", il vise à donner aux apprentis les outils concrets pour manipuler des données réelles et comprendre les mécanismes fondamentaux des modèles d'IA — en lien direct avec leur environnement professionnel en alternance.
Les séances alternent apports théoriques courts et ateliers pratiques sur Jupyter Lab. Les apprentis sont encouragés à mobiliser les données et problématiques rencontrées dans leur entreprise d'accueil. Le cours aborde également les enjeux de responsabilité numérique : biais algorithmiques, éthique de l'IA.
Finalité d'apprentissage (Bloc de compétences)
- 1. S’approprier les usages avancés et spécialisés des outils de l’intelligence digitale en s’assurant de leur impact durable et responsable
Objectifs d'apprentissage
- 1.1 - Auditer les usages avancés et spécialisés des outils de l'intelligence digitale, afin de les mobiliser avec pertinence, en tenant compte du contexte stratégique des organisations.
- 1.2 - Actionner les outils de l'intelligence digitale de manière efficiente, pour accompagner les transformations sociétale, numérique, énergétique et environnementale des organisations, en s'assurant de leur impact durable et responsable.
Traits de compétences
- Write and run Python scripts for data processing (loading, cleaning, aggregating, visualizing)
- Use the Pandas library to manipulate real DataFrames
- Produce clear and meaningful visualizations from data
- Understand the fundamentals of a machine learning model (regression, classification)
- Identify and question potential biases in a dataset or AI algorithm
- Connect a business problem to a data analysis and AI approach
*******************************************************************
- Écrire et exécuter des scripts Python de traitement de données (chargement, nettoyage, agrégation, visualisation)
- Utiliser la bibliothèque Pandas pour manipuler des DataFrames réels
- Produire des visualisations lisibles et argumentées à partir de données
- Comprendre les principes fondamentaux d'un modèle de Machine Learning (régression, classification)
- Identifier et questionner des biais potentiels dans un jeu de données ou un algorithme d'IA
- Connecter une problématique métier à une démarche d'analyse de données et d'IA
Contenu : structure du module et agenda
Séance 1 (2h) — Python fondamentaux
- Environnement Jupyter Lab : cellules, markdown, exécution
- Variables, types (int, float, str, bool), opérateurs
- Structures de contrôle : conditions (if/elif/else), boucles (for, while)
- TP : premiers scripts sur un jeu de données simple
Séance 2 (2h) — Fonctions et structures de données
- Fonctions : définition, paramètres, retour
- Listes et dictionnaires : manipulation, parcours
- TP : traitement de données structurées avec des fonctions
Séance 3 (2h) — Pandas : analyse de données
- Création de DataFrame, import CSV/Excel
- Sélection (loc, iloc), filtrage, tri
- Statistiques descriptives (describe, value_counts, mean, median)
- TP : exploration d'un dataset sectoriel (finance, RH, logistique)
Séance 4 (2h) — Visualisation
- matplotlib et seaborn : histogrammes, barplots, scatterplots
- Principes d'une visualisation efficace
- TP : produire des graphiques commentés sur un dataset réel
Séance 5 (2h) — Introduction à l'IA et au Machine Learning
- Panorama de l'IA : IA symbolique, apprentissage automatique, deep learning
- Apprentissage supervisé : régression linéaire avec scikit-learn
- Entraînement, test, évaluation d'un modèle
- TP : construire un premier modèle prédictif
Séance 6 (2h) — Classification et biais algorithmiques
- Classification : arbre de décision ou régression logistique
- Biais algorithmiques : discrimination statistique, responsabilité de l'IA
- Cas d'usage IA en entreprise : prévision, détection d'anomalies, NLP
- TP : détecter des biais dans un dataset de recrutement ou de crédit
Séance 7 (2h) — Application métier + Soutenance
- Atelier : analyser un cas IA en lien avec le secteur de l'alternance
- Limites et risques des modèles : surapprentissage, interprétabilité, éthique
- Soutenance orale des rapports individuels (10 min/étudiant)
Contribution à l'atteinte des ODD (Objets du Développement Durable)
SDG 4 — Quality Education: This course develops technical and professional skills that are directly transferable to the workplace. The “learning by doing” approach and the program's integration into a work-study context enhance employability and access to skilled careers in data and AI.
SDG 9 — Industry, Innovation, and Infrastructure: Apprentices acquire the tools of digital transformation (Python, Pandas, AI, scikit-learn) that are at the heart of industrial innovation and organizational modernization.
SDG 10 — Reduced Inequalities: Session 6 addresses algorithmic biases and statistical discrimination in AI models. Apprentices learn to identify these biases and to question the accountability of automated decision-making systems.
**********************************************************************************
ODD 4 — Éducation de qualité : Ce cours développe des compétences techniques professionnelles directement transférables en entreprise. L'approche "learning by doing" et l'ancrage dans le contexte de l'alternance renforcent l'employabilité et l'accès à des métiers qualifiés liés à la donnée et à l'IA.
ODD 9 — Industrie, innovation et infrastructure : Les apprentis acquièrent les outils de la transformation numérique (Python, Pandas, IA, scikit-learn) qui sont au cœur de l'innovation industrielle et de la modernisation des organisations.
ODD 10 — Réduction des inégalités : La séance 6 traite des biais algorithmiques et de la discrimination statistique dans les modèles d'IA. Les apprentis apprennent à identifier ces biais et à questionner la responsabilité des systèmes automatisés de décision.
Nombre d'ODD abordés parmi les 17
3
Apprentissage
synchrone
Méthode pédagogique
- Apprentissage par la pratique ("learning by doing") : chaque concept est immédiatement appliqué sur un dataset réel
- Ateliers individuels sur Jupyter Lab (ordinateur portable requis)
- Mise en situation professionnelle : les apprentis sont invités à mobiliser des données ou problématiques issues de leur entreprise d'accueil
- Correction collective et discussions en groupe sur les approches utilisées
- Rapport individuel d'analyse ancré dans le contexte de l'alternance, présenté à l'oral
Système de notation et modalités de rattrapage
Rapport individuel —Analyse Python d'un dataset en lien avec l'alternance (notebook Jupyter remis via Moodle) — 50 %
Soutenance orale — Présentation du rapport en séance 7 (10 min + questions) — 50 %
Un examen sur table individuel (1h, exercices Python sur données fournies, documents autorisés) peut s'ajouter selon décision de l'enseignant communiquée en début de cours. Les modalités de pondération sont précisées à ce moment.
CF2 — Rattrapage :
Rapport individuel sur un nouveau dataset fourni par l'enseignant (notebook Jupyter remis dans un délai communiqué), suivi d'une soutenance orale (10 min + questions). L'épreuve remplace l'ensemble des notes CF1.
Règlement du module
Communication Professeur–Apprenant
Le professeur contactera les apprenants via leur adresse mail scolaire (IMT-BS/TSP) et le portail Moodle. Il est de la responsabilité de l'étudiant de consulter régulièrement sa boîte mail IMT-BS/TSP.
Présence
La présence en séance est obligatoire. Les ateliers pratiques ne peuvent pas être récupérés à distance. Toute absence doit être signalée à l'avance et justifiée.
Matériel requis
Chaque apprenant doit disposer d'un ordinateur portable.
Intégrité académique
Les travaux individuels doivent être réalisés de manière autonome. L'usage d'outils d'IA générative pour produire le code est autorisé à condition d'être déclaré et commenté. Tout travail remis doit pouvoir être expliqué oralement par l'étudiant.
Références obligatoires et lectures suggérées
Obligatoire (en ligne, gratuit) :
- McKinney, W. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython (3e éd., O'Reilly). Chapitres 5-10 pour Pandas.
- Documentation officielle Pandas : https://pandas.pydata.org/docs/
- Documentation scikit-learn : https://scikit-learn.org/stable/getting_started.html
Suggérées :
- Rajagopalan, G. A Python Data Analyst's Toolkit (Apress)
- Vincent & Le Goff. Apprenez à programmer en Python (OpenClassrooms, gratuit en ligne)
- Stephenson, B. The Python Workbook (Springer)
Pour aller plus loin :
- Introduction Python interactive : https://nbviewer.jupyter.org/github/phelps-sg/python-bigdata/blob/master/src/main/ipynb/intro-python.ipynb
- Maîtriser Jupyter : https://realpython.com/jupyter-notebook-introduction/
Mots-clés
Python, Pandas, artificial intelligence, machine learning, scikit-learn, Jupyter, data visualization, algorithmic bias, work-study program, digital transformation **** Python, Pandas, intelligence artificielle, machine learning, scikit-learn, Jupyter, visualisation, biais algorithmiques, alternance, transformation numérique
Prérequis
Aucun prérequis en programmation. Une aisance avec les outils bureautiques (Excel, tableurs) et une familiarité avec la notion de tableau de données est un plus. Les étudiants doivent disposer d'un ordinateur portable fonctionnel.