Pandas et groupby#

Petit tour de passe passe autour d’un pandas.DataFrame.groupby() et des valeurs manquantes qui ne sont plus prises en compte depuis les dernières versions.

groupby et valeur manquantes#

import pandas


data = [{"a": 1, "b": 2}, {"a": 10, "b": 20}, {"b": 3}, {"b": 4}]
df = pandas.DataFrame(data)
df
a b
0 1.0 2
1 10.0 20
2 NaN 3
3 NaN 4


df.groupby("a").sum()
b
a
1.0 2
10.0 20


Les valeurs manquantes ont disparu et c’est le comportement attendu Il est possible de corriger le tir avec l’argument dropna.

df.groupby("a", dropna=False).sum()
b
a
1.0 2
10.0 20
NaN 7


Total running time of the script: ( 0 minutes 0.580 seconds)

Gallery generated by Sphinx-Gallery