Pandas et groupby

Petit tour de passe passe autour d’un pandas.DataFrame.groupby() et des valeurs manquantes qui ne sont plus prises en compte depuis les dernières versions.

groupby et valeur manquantes

import pandas


data = [{"a": 1, "b": 2}, {"a": 10, "b": 20}, {"b": 3}, {"b": 4}]
df = pandas.DataFrame(data)
df
a b
0 1.0 2
1 10.0 20
2 NaN 3
3 NaN 4


df.groupby("a").sum()
b
a
1.0 2
10.0 20


Les valeurs manquantes ont disparu et c’est le comportement attendu Il est possible de corriger le tir avec l’argument dropna.

df.groupby("a", dropna=False).sum()
b
a
1.0 2
10.0 20
NaN 7


Total running time of the script: (0 minutes 0.026 seconds)

Gallery generated by Sphinx-Gallery