テービーテックのデータサイエンス

未経験リケジョがゼロからデータサイエンティストを目指す姿を記す奮闘記です。2019/12/05文系出身者が共同で更新を開始

TAG index

▲心くじけず言語処理100本ノック==30~34==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第4章:形態素解析 30~34です! 間違い・コード改善点…

▲本日の関数==requests.get()==

本日の関数:requests.get() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「requests.get()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? Requests は Python の HTTP ライブラリです。 WEB上でのデータ収集をする際に使用します…

▲心くじけず言語処理100本ノック==25~28==※5/27に29追加

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第第3章: 正規表現 25~28です! (※5/27に29を追加しま…

▲AI・機械学習の初心者さんにオススメしたい!

こんにちは! テービーテックの村松です。本日はAI・機械学習を学びたい・学び始めている初心者の方にオススメしたい勉強法についてご紹介したいと思います。 私も去年の4月からAI・・・?プログラミング・・・??と思いながらPythonの「P」の字から始めた…

▲心くじけず言語処理100本ノック==20~24==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第第3章: 正規表現 20~24です! 間違い・コード改善点…

▲心くじけず言語処理100本ノック==15~19==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第2章:UNIXコマンド 15~19です! 間違い・コード改善…

▲心くじけず言語処理100本ノック==10~14==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第2章:UNIXコマンド 10~14です! 間違い・コード改善…

▲心くじけず言語処理100本ノック==05~09==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第1章:準備運動05~09です! 間違い・コード改善点など…

▲心くじけず言語処理100本ノック==00~04==

こんにちは! テービーテックの村松です。 「本日の関数」シリーズに続きまして小ネタ集その2です。 「言語処理100本ノック2020]」 nlp100.github.io に挑戦していきます!ちょっとずつですが進めてまいりますので、 途中でくじけないか見守ってください・・…

▲本日の関数==interpolate()==

本日の関数:interpolate() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「interpolate()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? データフレーム等の欠損値の補間方法の一つ。 前後の値を考慮して補間します。 沢山の補間方…

▲本日の関数==describe()==

本日の関数:describe() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「describe()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? データフレームなどを扱うときに要約統計量の確認に使います。 ざっくり列ごとのデータ数や平均・…

▲本日の関数==split()==

本日の関数:split() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「split()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 組み込み関数の一つです。 スペースやカンマ区切りの文字列を分割するときによく使います。 なので自然言…

▲本日の関数==neologdn.normalize()==

本日の関数:neologdn.normalize() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「neologdn.normalize()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 自然言語処理の前処理として使用する表記揺れの統一方法の一つです。 全角・…

▲本日の関数==unicodedata.normalize()==

本日の関数:unicodedata.normalize() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「unicodedata.normalize()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? Unicodeの正規化を行います。 自然言語処理で表記揺れの統一をしたいと…

▲本日の関数==han_to_zen()==

本日の関数:han_to_zen() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「han_to_zen()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? mojimojiというライブラリの半角文字を全角に変換する関数です。 引数は? mojimoji.han_to_ze…