2020-01-01から1年間の記事一覧
本日の関数:unicodedata.normalize() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「unicodedata.normalize()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? Unicodeの正規化を行います。 自然言語処理で表記揺れの統一をしたいと…
本日の関数:han_to_zen() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「han_to_zen()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? mojimojiというライブラリの半角文字を全角に変換する関数です。 引数は? mojimoji.han_to_ze…
本日の関数:lower() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「lower()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 組み込み関数。 全ての大文字小文字の区別がある文字を小文字に変換します。 自然言語処理の前処理でお世…
こんにちは! テービーテックの村松です。本日ご紹介するのはMicrosoft Azureの画像認識サービス「Custom Vision Service」です。 プログラミング?やったことないよ。 機械学習?なにそれ。 そんな方でも自分の持っている画像を学習させることで画像の分類…
こんにちは! テービーテックの村松です。本日は、こちら2つ↓↓の続き。 ▲Kaggleやってみよう【Movie Reviews:映画レビューの感情分析】前篇 - テービーテックのデータサイエンス ▲Kaggleやってみよう【Movie Reviews:映画レビューの感情分析】中篇 - テー…
本日の関数:re.sub() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「re.sub()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? テキスト内の指定する条件に合った文字を任意の文字列に置換することができます。 引数は? re.sub(pat…
本日の関数:get_text() こんにちは。 テービーテックの村松です。本日ご紹介する関数はBeautifulSoupライブラリの「get_text()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? BeautifulSoupライブラリはHTMLやXMLから狙ったデータを抽出するために…
こんにちは! テービーテックの村松です。本日は、こちらの続きをやっていこうかと思います。 ds-blog.tbtech.co.jp前回は、前処理の単語にばらして綺麗に整えるところまで行いました。 《予定している前処理》 ・余分な要素の排除 ・小さな単位(文字・単語…
こんにちは! テービーテックの村松です。Kaggleやってみよう第2弾は「Sentiment Analysis on Movie Reviews」映画レビューの感情分析です。 自然言語系の課題に取り組んだことがなかったので選んでみました。いつも以上に覚束なくなりそうですが、Notebooks…
本日の関数:range() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「range()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? Pythonの組み込み関数のひとつ。 返り値はrange型ですが、そのまま使用することはあまりありません。 連…
本日の関数:fillna() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「fillna()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 欠損値を任意の他の値に置換(穴埋め)する際に使います。 引数は? fillna(self、value = None、meth…
本日の関数:value_counts() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「value_counts()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? データフレームなどの列の要素の出現回数を知りたいときに使います。 引数は? value_coun…
本日の関数:set() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「set()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 組み込み関数。 指定した引数から重複しない要素をset型として生成できます。 引数としてリストやタプルを渡…
本日の関数 こんにちは。 テービーテックの村松です。 「本日の関数」では、私のその日の気分で様々なPythonの関数を紹介していきます。 目指せ毎日更新!!(目標は高く) 本ページはその目次となります。なお、まだまだPythonのお勉強中の身がちまちま書いて…
本日の関数:concat() こんにちは。 テービーテックの村松です。本日の関数をご紹介する前に、本シリーズの目次ページを作りましたのでご案内します。 ds-blog.tbtech.co.jp ぼちぼち量も増えてきましたかね。 これからもりもりと増やしてまいります。閑話休…
こんにちは。 テービーテックの村松です。本日はこちらの続きをご紹介いたします。 ds-blog.tbtech.co.jp前回は各項目が生存率に確認していそうかグラフ化しながら確認していきました。 今日は使用する項目を選んで前処理から最終のKaggleに提出してスコアを…
こんにちは。 テービーテックの村松です。 最近は「本日の関数」というちまちましたものを連日投稿していましたが、 本日は多少厚みのある内容になっている、はずです。題名の通り、Kaggleに挑戦し始めました。 とは言え、お決まりの「Titanic: Machine Lear…
本日の関数:isnull() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「isnull()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 欠損値をチェックするときに使います。 欠損値があると「True」、そうでない時は「False」を返します。…
本日の関数:unique() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「unique()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? unique()は名前の通りユニークな要素の値を返します。 データフレームの中身を見るときに、どの項目に…
本日の関数:format() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「format()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 組み込み関数。 数値や文字列の書式を変えたい時に使用します。 例えばゼロ埋め・文字の寄せ方向・桁区…
本日の関数:enumerate() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「enumerate()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 組み込み関数。 リストなどを入れると、インデックス番号と要素の順番に取得できます。 ループ処…
本日の関数:locale.getpreferredencoding() こんにちは。 テービーテックの村松です。本日ご紹介する関数は「locale.getpreferredencoding()」。 ※※これまでご紹介した関数はこちら※※ どんな関数? 自分が今利用してる文字エンコーディングを確認できます。…
こんにちは。 テービーテックの村松です。 4月に入りましたので新しいシリーズとして、 「本日の関数」の連載を開始いたします! 本シリーズでは、私のその日の気分で様々なPythonの関数を紹介していきます。Pythonで使う関数ってとてもたくさんありますよね…
こんにちは。 テービーテックの村松です。 中止になってしまいました・・・ ds-blog.tbtech.co.jp ↑↑以前ご紹介しておりました基本情報技術者試験が2020/03/24に中止が発表されました。 www.jitec.ipa.go.jp 正直な話、割とヒーヒー言いながらお勉強していた…
こんにちは。 テービーテックの村松です。SIGNATEではCompetitionsにて練習問題が公開されています。 本ブログでも深津パイセンがチャレンジしておりましたね。 ds-blog.tbtech.co.jp今回は練習問題の紹介ではなく、コンペで公開されているチュートリアルを…
こんにちは。 テービーテックの村松です。DSIT豊田校3期は昨日で座学を終了し、ついにPBLに突入いたしました! これまではあくまで個人で機械学習・ディープラーニングについて取り組んできましたが、 これからは3チームに分かれてのチーム戦となります。 PB…
こんにちは テービーテックの村松ですds-blog.tbtech.co.jp前回こちらの記事の中でcsvファイルを読み込みからデータを整えるまでを端折ったので、今回はそこをピックアップします(リアルに躓いた場所を拾いつつ) データ元 「気象庁|過去の気象データ・ダウン…
こんにちは テービーテックの村松です現在のDSIT豊田校3期は時系列データを取り扱っている最中です 講義内であまりにも簡単に未来予測をするライブラリを教わったので今回はそちらをご紹介 Prophet 「Prophet」はFacebookが提供している機械学習ライブラリで…
皆様、こんにちは テービーテックの村松です 先週金曜日、DSIT卒業生のインタビュー記事が弊社HPに公開されました! http://www.tbtech.co.jp/dsit/images/20200221interview.pdf (↑をクリックするとPDFが開きます) ちなみに以前、ちょこっとだけ話題にしま…
皆様、こんにちは テービーテックの村松です 深津パイセンが一時離脱ということで、気合い入れて頑張ってまいります (不安しかない) さて、11月に開講いたしました製造業特化型データサイエンス集中コース(以降、DSITとします)豊田校3期も早3ヶ月 もう半分ま…