テービーテックのデータサイエンス

未経験リケジョがゼロからデータサイエンティストを目指す姿を記す奮闘記です。2019/12/05文系出身者が共同で更新を開始

TAG index

▲本日の関数==get_text()==

本日の関数:get_text() こんにちは。 テービーテックの村松です。本日ご紹介する関数はBeautifulSoupライブラリの「get_text()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? BeautifulSoupライブラリはHTMLやXMLから狙ったデータを抽出するために…

▲Kaggleやってみよう【Movie Reviews:映画レビューの感情分析】中篇

こんにちは! テービーテックの村松です。本日は、こちらの続きをやっていこうかと思います。 ds-blog.tbtech.co.jp前回は、前処理の単語にばらして綺麗に整えるところまで行いました。 《予定している前処理》 ・余分な要素の排除 ・小さな単位(文字・単語…

▲Kaggleやってみよう【Movie Reviews:映画レビューの感情分析】前篇

こんにちは! テービーテックの村松です。Kaggleやってみよう第2弾は「Sentiment Analysis on Movie Reviews」映画レビューの感情分析です。 自然言語系の課題に取り組んだことがなかったので選んでみました。いつも以上に覚束なくなりそうですが、Notebooks…

▲本日の関数==range()==

本日の関数:range() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「range()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? Pythonの組み込み関数のひとつ。 返り値はrange型ですが、そのまま使用することはあまりありません。 連…

▲本日の関数==fillna()==

本日の関数:fillna() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「fillna()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 欠損値を任意の他の値に置換(穴埋め)する際に使います。 引数は? fillna(self、value = None、meth…

▲本日の関数==value_counts()=

本日の関数:value_counts() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「value_counts()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? データフレームなどの列の要素の出現回数を知りたいときに使います。 引数は? value_coun…

▲本日の関数==set()==

本日の関数:set() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「set()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 組み込み関数。 指定した引数から重複しない要素をset型として生成できます。 引数としてリストやタプルを渡…

▲本日の関数==目次==

本日の関数 こんにちは。 テービーテックの村松です。 「本日の関数」では、私のその日の気分で様々なPythonの関数を紹介していきます。 目指せ毎日更新!!(目標は高く) 本ページはその目次となります。なお、まだまだPythonのお勉強中の身がちまちま書いて…

▲本日の関数==concat()==

本日の関数:concat() こんにちは。 テービーテックの村松です。本日の関数をご紹介する前に、本シリーズの目次ページを作りましたのでご案内します。 ds-blog.tbtech.co.jp ぼちぼち量も増えてきましたかね。 これからもりもりと増やしてまいります。閑話休…

▲Kaggleやってみよう【Titanic:生存者の予測】後篇

こんにちは。 テービーテックの村松です。本日はこちらの続きをご紹介いたします。 ds-blog.tbtech.co.jp前回は各項目が生存率に確認していそうかグラフ化しながら確認していきました。 今日は使用する項目を選んで前処理から最終のKaggleに提出してスコアを…

▲Kaggleやってみよう【Titanic:生存者の予測】前篇

こんにちは。 テービーテックの村松です。 最近は「本日の関数」というちまちましたものを連日投稿していましたが、 本日は多少厚みのある内容になっている、はずです。題名の通り、Kaggleに挑戦し始めました。 とは言え、お決まりの「Titanic: Machine Lear…

▲本日の関数==isnull()==

本日の関数:isnull() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「isnull()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 欠損値をチェックするときに使います。 欠損値があると「True」、そうでない時は「False」を返します。…

▲本日の関数==unique()==

本日の関数:unique() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「unique()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? unique()は名前の通りユニークな要素の値を返します。 データフレームの中身を見るときに、どの項目に…

▲本日の関数==format()==

本日の関数:format() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「format()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 組み込み関数。 数値や文字列の書式を変えたい時に使用します。 例えばゼロ埋め・文字の寄せ方向・桁区…

▲本日の関数==enumerate()==

本日の関数:enumerate() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「enumerate()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 組み込み関数。 リストなどを入れると、インデックス番号と要素の順番に取得できます。 ループ処…