TPTブログ

テックポート株式会社のブログです。 技術情報や製品・サービス情報、 また未経験社員がデータサイエンティストを 目指す奮闘記など、更新していきます。

▲本日の関数==isnull()==

f:id:TBT_matsu:20200402152259p:plain

本日の関数:isnull()

こんにちは。
テービーテックの村松です。

本日ご紹介する関数は「isnull()」。
※※これまでご紹介した関数はこちら※※

どんな関数?

欠損値をチェックするときに使います。
欠損値があると「True」、そうでない時は「False」を返します。

使ってみよう

input

欠損値入りのデータフレーム(df)を用意してみました。
f:id:TBT_matsu:20200409131704p:plain

まずはスカラーを渡してみます
#NaNを渡すと、
pd.isnull(np.nan)
##結果
True

#それ以外だと、
pd.isnull(6)
##結果
False

このように返します。
ただ、スカラーに使うことは・・・私はまだ経験ありません。

リストを渡すと
pd.isnull([25, np.nan])
##結果
array([False,  True])

リストに入っている順番通りに答えを返してくれます。

ただ、よく使用するのはデータフレームに対してですね。
欠損値を確認して、発見した欠損値を何かしら処理する流れで良くお世話になります。

データフレームを渡すと
pd.isnull(df)

f:id:TBT_matsu:20200409132342p:plain
こんな感じで返ってきます。
プラスしてどの項目にいくつ欠損があるかを確認する際はには以下のようにします。

#pandas.DataFrame.isnullの形
df.isnull().sum()
##結果
a    1
b    1
c    2
d    1
dtype: int64