テービーテックのデータサイエンス

未経験リケジョがゼロからデータサイエンティストを目指す姿を記す奮闘記です。2019/12/05文系出身者が共同で更新を開始

TAG index

▲本日の関数==isnull()==

f:id:TBT_matsu:20200402152259p:plain

本日の関数:isnull()

こんにちは。
テービーテックの村松です。

本日ご紹介する関数は「isnull()」。
※※これまでご紹介した関数はこちら※※

どんな関数?

欠損値をチェックするときに使います。
欠損値があると「True」、そうでない時は「False」を返します。

使ってみよう

input

欠損値入りのデータフレーム(df)を用意してみました。
f:id:TBT_matsu:20200409131704p:plain

まずはスカラーを渡してみます
#NaNを渡すと、
pd.isnull(np.nan)
##結果
True

#それ以外だと、
pd.isnull(6)
##結果
False

このように返します。
ただ、スカラーに使うことは・・・私はまだ経験ありません。

リストを渡すと
pd.isnull([25, np.nan])
##結果
array([False,  True])

リストに入っている順番通りに答えを返してくれます。

ただ、よく使用するのはデータフレームに対してですね。
欠損値を確認して、発見した欠損値を何かしら処理する流れで良くお世話になります。

データフレームを渡すと
pd.isnull(df)

f:id:TBT_matsu:20200409132342p:plain
こんな感じで返ってきます。
プラスしてどの項目にいくつ欠損があるかを確認する際はには以下のようにします。

#pandas.DataFrame.isnullの形
df.isnull().sum()
##結果
a    1
b    1
c    2
d    1
dtype: int64