テービーテックのデータサイエンス

未経験リケジョがゼロからデータサイエンティストを目指す姿を記す奮闘記です。2019/12/05文系出身者が共同で更新を開始

TAG index

▲心くじけず言語処理100本ノック==15~19==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第2章:UNIXコマンド 15~19です! 間違い・コード改善…

▲心くじけず言語処理100本ノック==10~14==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第2章:UNIXコマンド 10~14です! 間違い・コード改善…

▲心くじけず言語処理100本ノック==05~09==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第1章:準備運動05~09です! 間違い・コード改善点など…

▲心くじけず言語処理100本ノック==00~04==

こんにちは! テービーテックの村松です。 「本日の関数」シリーズに続きまして小ネタ集その2です。 「言語処理100本ノック2020]」 nlp100.github.io に挑戦していきます!ちょっとずつですが進めてまいりますので、 途中でくじけないか見守ってください・・…

▲本日の関数==interpolate()==

本日の関数:interpolate() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「interpolate()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? データフレーム等の欠損値の補間方法の一つ。 前後の値を考慮して補間します。 沢山の補間方…

▲本日の関数==describe()==

本日の関数:describe() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「describe()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? データフレームなどを扱うときに要約統計量の確認に使います。 ざっくり列ごとのデータ数や平均・…

▲本日の関数==split()==

本日の関数:split() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「split()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 組み込み関数の一つです。 スペースやカンマ区切りの文字列を分割するときによく使います。 なので自然言…

▲本日の関数==neologdn.normalize()==

本日の関数:neologdn.normalize() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「neologdn.normalize()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 自然言語処理の前処理として使用する表記揺れの統一方法の一つです。 全角・…

▲本日の関数==unicodedata.normalize()==

本日の関数:unicodedata.normalize() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「unicodedata.normalize()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? Unicodeの正規化を行います。 自然言語処理で表記揺れの統一をしたいと…

▲本日の関数==han_to_zen()==

本日の関数:han_to_zen() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「han_to_zen()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? mojimojiというライブラリの半角文字を全角に変換する関数です。 引数は? mojimoji.han_to_ze…

▲本日の関数==lower()==

本日の関数:lower() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「lower()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 組み込み関数。 全ての大文字小文字の区別がある文字を小文字に変換します。 自然言語処理の前処理でお世…

▲お手軽!画像判別してみよう【Custom Vision Service】

こんにちは! テービーテックの村松です。本日ご紹介するのはMicrosoft Azureの画像認識サービス「Custom Vision Service」です。 プログラミング?やったことないよ。 機械学習?なにそれ。 そんな方でも自分の持っている画像を学習させることで画像の分類…

▲Kaggleやってみよう【Movie Reviews:映画レビューの感情分析】後篇

こんにちは! テービーテックの村松です。本日は、こちら2つ↓↓の続き。 ▲Kaggleやってみよう【Movie Reviews:映画レビューの感情分析】前篇 - テービーテックのデータサイエンス ▲Kaggleやってみよう【Movie Reviews:映画レビューの感情分析】中篇 - テー…

▲本日の関数==re.sub()==

本日の関数:re.sub() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「re.sub()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? テキスト内の指定する条件に合った文字を任意の文字列に置換することができます。 引数は? re.sub(pat…

▲本日の関数==get_text()==

本日の関数:get_text() こんにちは。 テービーテックの村松です。本日ご紹介する関数はBeautifulSoupライブラリの「get_text()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? BeautifulSoupライブラリはHTMLやXMLから狙ったデータを抽出するために…