こんにちは!
テービーテックの村松です。
本日はAI・機械学習を学びたい・学び始めている初心者の方にオススメしたい勉強法についてご紹介したいと思います。
私も去年の4月からAI・・・?プログラミング・・・??と思いながらPythonの「P」の字から始めた人間です。
因みにがっつり文系、微分ってどんなんだっけ・・・な状態から始まっています。
学び始めはどこから手を付けていいかわからないことが多いと思いますので初心者ステージにいる時に
やって損のないお勉強サイトを中心に今回は3つご紹介していきます。
あと、大事なこと、
無料
これにつきますね。
それっぽい専門書を買うことでモチベーションが上がって勉強がはかどることもありますが、、、
まずはタダで学べるだけ学べたら嬉しいですよね。
と、いうことで、
・初心者さんに優しい
・無料
をモットーにご紹介していきます!
①Python基礎を重点的に!
機械学習を学ぶ上で人気のプログラミング言語と言えばPython。
プログラミング自体が初めてな人でもオススメな学習サイトをご紹介します。
paizaラーニング
paiza.jp
特徴は、
・環境構築がいらない
・動画&ハンズオン形式
paizaは動画を見ながら手を動かしてプログラミングを学習することが出来ます。
動画は1本3分程度で各チャプターをサクサク進められます。
実際の学習画面はこんな感じです。
基本的な流れは、
①動画を見る
②①を参考にコード入力エリアでコードを書いてみる→「コードを実行」ボタン
③入出力エリアに結果が出る
④わからないこと・補足知識を補足テキストエリアでチェック
なお、Python以外の言語も様々学ぶことが出来ますので興味のある方はぜひそちらも。
まず、初心者の方にオススメな講座はこちら↓↓
・Python3入門編 (全11レッスン)
paiza.jp
私のPythonもここから始まりました。
Pythonの初歩を学ぶことが出来ます。(対象:Python3)
この講座は標準出力や変数、配列、演算子、条件分岐、ループ といったPythonの基本を全チャプター無料で、手順を追って学ぶことが出来ます。
他にも無料の講座がいくつもあるのでPythonに限らずプログラミング未経験の方はぜひ試してみて欲しいコンテンツです。
②基礎知識~ディープラーニング入門までを理解したい!
Chainer チュートリアル
tutorials.chainer.org
特徴は、
・手を動かしながら学習!コーディングはGoogle Colaboratory(以下Colab)を使用
・機械学習の勉強に必要な数学・統計学・Pythonの基礎から体系的に学べる
ディープラーニングを学ぶために必要となる前提知識からステップを踏んで解説してくれるので、初めて学ぶ人でも挫折せず、このChainer チュートリアルだけで必要な知識を一通り得ることができます。
コーディングに使用するColabは、Googleアカウントがあればブラウザ上で簡単にコーディングをすることができるので大変便利です。
チュートリアルではColabの基本的な使い方から教えてくれます。
paizaの時もそうでしたが「環境構築無し」というのは機械学習の勉強のハードルをぐっと下げてくれると思います。
因みに私はpaizaを進めつつこちらのチュートリアルに手を付けていました。
カリキュラムは以下の通りです。
Step1準備編
1. はじめに
2. Python 入門
3. 機械学習に使われる数学
4. 微分の基礎
5. 線形代数の基礎
6. 確率・統計の基礎
Step 1 の演習問題step2機械学習とデータ分析入門
7. 単回帰分析と重回帰分析
8. NumPy 入門
9. scikit-learn 入門
10. CuPy 入門
11. Pandas 入門
12. Matplotlib 入門step3ディープラーニング入門
13. ニューラルネットワークの基礎
14. Chainer の基礎
15. Chainer の応用
16. トレーナとエクステンション
※なお、step3についてはChainer終了の件もありますので、「13.ニューラルネットワークの基礎」まででも良いかもしれません。
ディープラーニングのフレームワークのチュートリアルは他にも、
pytorch.org
keras.io
などもあります。
Chainer チュートリアルが終わったらぜひこれらにも挑戦してみてください。
③ちょっとした応用まで!
KIKAGAKU
www.kikagaku.ai
こちらはChainer チュートリアルstep1・step2をやり終えた方にもオススメしたいサイトになります。
ディープラーニングの基礎から画像認識、 自然言語処理の基礎までを非常にわかりやすい言葉で解説してくれます。
こちらのサイトの特徴は、
・知識の体系化
・緻密性よりわかりやすさ
・文字よりもイラストでイメージ
右も左もわからない初学者にとって親切設計の3本立てです。
また、Chainer チュートリアルと同様にコーディングはColabを使用することを想定しています。
カリキュラムは以下の通りです。
1.はじめに
2.データサイエンスの基礎
データ活用の基礎
人工知能、 機械学習、 ディープラーニングの違い
3.機械学習の基礎
教師あり学習(回帰&分類)の基礎的なアルゴリズム
ハイパーパラメータの調整方法
教師なし学習の基礎的なアルゴリズム
4.ディープラーニングの基礎
ニューラルネットワークの数学(順伝播と逆伝播)
ニューラルネットワークの実装(TensorFlow & PyTorch)
5.画像認識の基礎
畳み込みニューラルネットワークの数学
画像分類
ファインチューニングとデータオーグメンテーション
6.自然言語処理の基礎
形態素解析
自然言語の特徴量変換
テキスト分類
※「4.ディープラーニングの基礎」以降はTensorFlowとPyTorchの二つのフレームワークから選ぶことが出来ます。
KIKAGAKUは実は結構最近公開された無料オンライン学習資料なのですが、2020年夏には、画像認識・自然言語処理の応用的な内容のコンテンツが追加される予定です。
こちらの公開も楽しみですね。
以上、オススメ3つをご紹介いたしました。
「paiza」と「Chainer チュートリアル」つは実際に私も通った道なので内容を見返すと感慨深いですね・・・一年前の丁度今頃取り組んでいた内容ですね。
これからAI・機械学習の勉強をしたい方、特に私と同じ文系な方!
ハードル高そうに感じるかもしれませんが、恐れずにまずはどれか1つ走り抜けてみてください。
おぼろげながらもAIってなんなんだろうということが理解できるはずです。
もしかしたら1回では理解できないかもしれません。
でも安心してください。
なんせ他にもネット上には先駆者の方々が残してくれている技術ブログ・備忘録などがたくさんあり、AI・機械学習を学ぶタネがゴロゴロ落ちています。
私もそれらに助けられながら日々お勉強させてもらってます。
改めて先駆者の皆様に感謝!
そして及ばずながら、本ブログも皆様をお助けできる一端になれればと思っております。。。
特に文系出身者のデータサイエンティスト志望の方の背中を押していきたい、そんなブログにできるよう、今後も励んでまいります。