テービーテックのデータサイエンス

未経験リケジョがゼロからデータサイエンティストを目指す姿を記す奮闘記です。2019/12/05文系出身者が共同で更新を開始

TAG index

▲本日の関数==han_to_zen()==

f:id:TBT_matsu:20200402152259p:plain

本日の関数:han_to_zen()

こんにちは。
テービーテックの村松です。

本日ご紹介する関数は「han_to_zen()」。
※※これまでご紹介した関数はこちら※※

どんな関数?

mojimojiというライブラリの半角文字を全角に変換する関数です。

引数は?
mojimoji.han_to_zen(文字列, kana=True, digit=True, ascii=True)

以下の引数で変換対象を指定できます。デフォルトはTrue。

  • kana:カナ文字
  • digit:数字
  • ascii:アルファベット
input
s_2 = 'Tbtech4ガツ30ニチ'
コード
pip install mojimoji
import mojimoji

mojimoji.han_to_zen(s_2)
##結果
'Tbtech4ガツ30ニチ'

引数に変換対象文字列以外何も指定しないとすべての半角文字を対象とします。
以下のように引数で変換対象を指定することで一部の半角文字のみを変換できます。

# カナを対象外とする
mojimoji.han_to_zen(s_2, kana=False)
##結果
'Tbtech4ガツ30ニチ'

# 数字を対象外とする
mojimoji.han_to_zen(s_2, digit=False)
##結果
'Tbtech4ガツ30ニチ'

# アルファベットを対象外とする
mojimoji.han_to_zen(s_2, ascii=False)
##結果
'Tbtech4ガツ30ニチ'

おまけ情報
zen_to_han()では上記と同じ使い方で全角から半角に変換することが可能です。
どちらも自然言語を扱う時の前処理で活躍しそうですね。

もっと詳しく!

ドキュメントへ!!