2026-03-15 : feuille de route 2025 - mars¶
site web : sdpython.github.io
Apprendre la programmation avec Python
Autres sites :
Python pour la data science <https://pythonds.linogaliana.fr/>`_ (Lino Galiana - ENSAE)
Fonctions utiles:
Séance 1 (6/2)¶
rappels sur la régression, classification, clustering, ACP, prétraitements
train test, validation croisée
rappels sur l’apprentissage d’un arbre de régression
présentation de modules
données : pandas
graphes : matplotlib, seaborn, bokeh, altair
machine learning : scikit-learn, skrub, skore, imbalanced-learn, hazardous, fairlearn, xgboost, lightgbm, catboost
deep learning : pytorch, transformers, diffusers et aussi HuggingFace Hub
demain
utilisation de ChatGPT, Gemini (et autres…), retour d’expérience
et ensuite…
problème
Peut-on prédire le nombre de condidatures en 2026 pour chaque établissement ?
Séance 2 (13/2)¶
tests unitaires
pipelines : pourquoi en faire
Séance 3 (27/2)¶
Séance 4 (6/3)¶
Séance 5 (13/3)¶
Séance 6 (20/3)¶
Evaluation¶
le projet doit inclure au moins un graphe Partial Dependence ou Permutation Importance (voir liens ci-dessus)
soutenance ?