▲本日の関数==value_counts()=

f:id:TBT_matsu:20200402152259p:plain

こんにちは。
テービーテックの村松です。

本日ご紹介する関数は「value_counts()」。
※※これまでご紹介した関数はこちら※※

データフレームなどの列の要素の出現回数を知りたいときに使います。

value_counts(self, normalize=False, sort=True, ascending=False, bins=None, dropna=True)

よく指定する引数は、

#データフレームを用意
df

f:id:TBT_matsu:20200408112926p:plain

#列を指定します。
df['Menu'].value_counts()

##結果
そば        2
おにぎり      2
ハンバーガー    1
パン        1
ラーメン      1
Name: Menu, dtype: int64

デフォルトで降順となっているので出現頻度が高いものから順に並んでいますね。

#sort=Falseに変更
df['Menu'].value_counts(sort=False)

##結果
おにぎり      2
ラーメン      1
そば        2
パン        1
ハンバーガー    1
Name: Menu, dtype: int64

sortを無効にするとバラバラの状態で出てきます。

#ascending=Trueに変更
df['Menu'].value_counts(ascending=True)

##結果
ラーメン      1
パン        1
ハンバーガー    1
おにぎり      2
そば        2
Name: Menu, dtype: int64

こちらは出現頻度の低い順。
とても便利な機能なので状況に応じて使い分けていきたいですね。

TPTブログ