2025-11-05 : données massives, spark …

Spark

Spark est une solution logicielle qui permet de manipuler de très grands jeux de données de façon distribuée.

Distribution et Hash

Algorithmes de streaming

  • algorithmes de streaming: régression linéaire, random forest

  • réseaux de neurones ?

  • Reservoir Sample

  • BJKST

  • random forests ?

Donnéees en local

ChatGPT, LeChat, …

Ces outils fonctionnent très bien sur le code. Ils ont absorbé la plupart des tutoriels existants. Ils fournissent de très bons exemples pour démarrer.

Le livre cité lors du cours Six degrés de liberté. Peut-on disparaître numériquement ?