テービーテックのデータサイエンス

未経験リケジョがゼロからデータサイエンティストを目指す姿を記す奮闘記です。2019/12/05文系出身者が共同で更新を開始

TAG index

▲心くじけず言語処理100本ノック==55~59==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第 5章:機械学習 55~59です! 間違い・コード改善点な…

▲心くじけず言語処理100本ノック==50~54==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第 5章:機械学習 50~54です! 間違い・コード改善点な…

▲祝!!豊田校3期&東京校1期卒業!!&豊田校4期始動!!

皆さん、こんにちは! テービーテックの村松です。ご無沙汰しております(汗汗 ここ1か月以上も更新できず焦っておりました(笑 言い訳になって心ぐるしいのですが、 実は、書籍の執筆作業に追われておりました。 そうなんです。テービーテックが本を出すので…

▲心くじけず言語処理100本ノック==47~49==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第5章: 係り受け解析 47~49です! 間違い・コード改善…

▲心くじけず言語処理100本ノック==45・46==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第5章: 係り受け解析 45・46です! 間違い・コード改善…

▲表彰されました!!【データサイエンスアワード2019】

こんにちは! テービーテックの村松です。弊社で開催しておりますAI講座「製造業特化型データサイエンス集中コース」が データサイエンスアワード2019にてファイナリストに選出されました!! www.datascientist.or.jp↓↓こちらは本日届きやてほやほやのトロ…

▲心くじけず言語処理100本ノック==40~44==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第5章: 係り受け解析 40~44です! 間違い・コード改善…

▲心くじけず言語処理100本ノック==5章下準備==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第5章: 係り受け解析 の下準備です! CaboChaをColabで…

▲心くじけず言語処理100本ノック==35~39==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第4章:形態素解析 35~39です! 間違い・コード改善点…

▲心くじけず言語処理100本ノック==30~34==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第4章:形態素解析 30~34です! 間違い・コード改善点…

▲本日の関数==requests.get()==

本日の関数:requests.get() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「requests.get()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? Requests は Python の HTTP ライブラリです。 WEB上でのデータ収集をする際に使用します…

▲心くじけず言語処理100本ノック==25~28==※5/27に29追加

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第第3章: 正規表現 25~28です! (※5/27に29を追加しま…

▲AI・機械学習の初心者さんにオススメしたい!

こんにちは! テービーテックの村松です。本日はAI・機械学習を学びたい・学び始めている初心者の方にオススメしたい勉強法についてご紹介したいと思います。 私も去年の4月からAI・・・?プログラミング・・・??と思いながらPythonの「P」の字から始めた…

▲心くじけず言語処理100本ノック==20~24==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第第3章: 正規表現 20~24です! 間違い・コード改善点…

▲心くじけず言語処理100本ノック==15~19==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第2章:UNIXコマンド 15~19です! 間違い・コード改善…

▲心くじけず言語処理100本ノック==10~14==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第2章:UNIXコマンド 10~14です! 間違い・コード改善…

▲心くじけず言語処理100本ノック==05~09==

こんにちは! テービーテックの村松です。「言語処理100本ノック2020]」 nlp100.github.io に挑戦中! 途中でくじけないか見守ってください・・・。 そして、皆さんも一緒に挑戦してみましょう!本日は第1章:準備運動05~09です! 間違い・コード改善点など…

▲心くじけず言語処理100本ノック==00~04==

こんにちは! テービーテックの村松です。 「本日の関数」シリーズに続きまして小ネタ集その2です。 「言語処理100本ノック2020]」 nlp100.github.io に挑戦していきます!ちょっとずつですが進めてまいりますので、 途中でくじけないか見守ってください・・…

▲本日の関数==interpolate()==

本日の関数:interpolate() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「interpolate()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? データフレーム等の欠損値の補間方法の一つ。 前後の値を考慮して補間します。 沢山の補間方…

▲本日の関数==describe()==

本日の関数:describe() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「describe()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? データフレームなどを扱うときに要約統計量の確認に使います。 ざっくり列ごとのデータ数や平均・…

▲本日の関数==split()==

本日の関数:split() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「split()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 組み込み関数の一つです。 スペースやカンマ区切りの文字列を分割するときによく使います。 なので自然言…

▲本日の関数==neologdn.normalize()==

本日の関数:neologdn.normalize() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「neologdn.normalize()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 自然言語処理の前処理として使用する表記揺れの統一方法の一つです。 全角・…

▲本日の関数==unicodedata.normalize()==

本日の関数:unicodedata.normalize() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「unicodedata.normalize()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? Unicodeの正規化を行います。 自然言語処理で表記揺れの統一をしたいと…

▲本日の関数==han_to_zen()==

本日の関数:han_to_zen() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「han_to_zen()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? mojimojiというライブラリの半角文字を全角に変換する関数です。 引数は? mojimoji.han_to_ze…

▲本日の関数==lower()==

本日の関数:lower() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「lower()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 組み込み関数。 全ての大文字小文字の区別がある文字を小文字に変換します。 自然言語処理の前処理でお世…

▲お手軽!画像判別してみよう【Custom Vision Service】

こんにちは! テービーテックの村松です。本日ご紹介するのはMicrosoft Azureの画像認識サービス「Custom Vision Service」です。 プログラミング?やったことないよ。 機械学習?なにそれ。 そんな方でも自分の持っている画像を学習させることで画像の分類…

▲Kaggleやってみよう【Movie Reviews:映画レビューの感情分析】後篇

こんにちは! テービーテックの村松です。本日は、こちら2つ↓↓の続き。 ▲Kaggleやってみよう【Movie Reviews:映画レビューの感情分析】前篇 - テービーテックのデータサイエンス ▲Kaggleやってみよう【Movie Reviews:映画レビューの感情分析】中篇 - テー…

▲本日の関数==re.sub()==

本日の関数:re.sub() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「re.sub()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? テキスト内の指定する条件に合った文字を任意の文字列に置換することができます。 引数は? re.sub(pat…

▲本日の関数==get_text()==

本日の関数:get_text() こんにちは。 テービーテックの村松です。本日ご紹介する関数はBeautifulSoupライブラリの「get_text()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? BeautifulSoupライブラリはHTMLやXMLから狙ったデータを抽出するために…

▲Kaggleやってみよう【Movie Reviews:映画レビューの感情分析】中篇

こんにちは! テービーテックの村松です。本日は、こちらの続きをやっていこうかと思います。 ds-blog.tbtech.co.jp前回は、前処理の単語にばらして綺麗に整えるところまで行いました。 《予定している前処理》 ・余分な要素の排除 ・小さな単位(文字・単語…