2025-03-01 : feuille de route 2025¶
site web : sdpython.github.io
Apprendre la programmation avec Python
Séance 1 (31/1)¶
Un jeu de données :
Quatre thèmes
Deux types de problèmes : régression, classifications
Problèmes dérivés : ranking, clustering, série temporelles
Calculs, puissances de calculs, CUDA, CPU
Environnement de travail, coder avec un LLM en local, 2025-01-31 : local LLM, avenir du datascientiste
Autres notes
programmation (python numpy, pandas, matplotlib, jupyter)
Tests unitaires, package python
machine learning, scikit-learn, pytorch
évaluation, ROC,
ranking, clustering
Coder avec un LLM en local : 2025-01-31 : local LLM
Notebooks, Visual Studio Code
Séance 2 (7/2)¶
arbre de régression, de classification
Séance 3 (14/2)¶
un peu plus de code
pipelines
créer son propre estimateur
tests unitaires
Séance 4 (21/2)¶
prétraitement
anomalie
cartes
Séance 5 (6/3)¶
série temporelles
analyses de survie
DeepAR
temps réel