これまではKaggleに挑戦してまいりましたが、
今回はKaggleの日本版!SIGNATEに挑戦したいと思います。
SIGNATEとは
日本版Kaggleと言われるとおり、コンペティションに参加したり、
練習用データセットが提供されています。
コンペ等に参加し、成績によっては企業より雇用のオファーが来たりします🤗
Kaggleとの大きな違いは、「カーネル」が無いことです。
Kaggleの「カーネル」は他の人たちのコードを見て、意見交換などをする場です。
それが無いので勉強できる幅は大きく減ってしまいます。
SIGNATEにもカーネルが出来ればなあと思います😞
また、コンペや練習問題の数も少ないです。これからどんどん増えて、
データサイエンティストを育てる場が広がってほしいですね😇
Conpetitions
メニューには、まず「Conpetitions」があります。
企業や自治体などから提供されるプロジェクトに挑戦し、良い成績の人は賞金がもらえます。
このプロジェクトは、全員が参加できるもの以外に【招待制】や【学生限定】など
参加できる人に制限がかかっているものもあります。
また、1つのプロジェクト内でいくつかのステージが分かれているものもあります。
気になるコンペを選び、そのコンペのページに移動すると、下のようなメニューがあります。
概要:このコンペが開かれた背景や、タスク説明、お知らせを確認します。
評価方法:使用する評価関数や、コンペの順位の決め方が書かれています。
ルール:参加資格や情報の扱い方、実装方法など大切な情報があります。
スケジュール:コンペの流れと、各セクションの日付が書かれています。
FAQ:参加者より寄せられた質問と、その回答を見ることができます。
Users
・Rankings:SIGNATE内でのランキングが表示されます。コンペで3位以内に入賞するとメダルがもらえます。
メダルの数とポイント数でランキングが決まります。
・Stats:参加者に関する情報を統計的にまとめられています。
年齢や年収の分布や、ツール等の熟練度が見られます。
Learning
ここでは練習問題が提供されており、コンペと同じような流れで投稿し、ランキングを見ることが出来ます。動画学習などの案内もありますが、無料で学習できるコンテンツは無いようです。
Career
データサイエンス系に特化した就職情報を閲覧できます。転職サポートサービスでは、非公開の情報も見られ、コンサルタントのサポートを受けられます。
Others
よくある質問の閲覧と、お問い合わせができます。投稿までの流れ
1.データをダウンロード
コンペの概要やルールを確認後、データをダウンロードします。
メニューから「データ」を選択すると、データダウンロードができる欄と、
その下にデータの説明が書かれています。
データは複数あるので、全てをダウンロードし、データを開いて確認します。
2.学習モデル作成
データを読み込み、学習モデルを作成します。
具体的なコードは次回からご紹介します。
3.提出用データ作成
それぞれのコンペによって提出する成果物は違うと思いますが、
提出サンプルデータがダウンロードできることが多いので
それに倣って提出用データを作成します。
4.投稿
コンペページの右上のほうにある「投稿」をクリックします。
すると、投稿するためのウィンドウが開きます。
「ファイルを選択」から提出用データを選択します。
コンペには通常1日5回まで投稿できるので、
何度も投稿するうちにどんなコードだったか、わからなくなります🤣
なので「メモ」の欄にコードの概要を書いておくと、忘れても大丈夫です!
5.評価
投稿して暫くすると、評価とランキングを知らせるメールが届きます。
評価関数での数値とランキングしかわからないので、
そこから試行錯誤して精度の向上を目指します!!
まとめ
SIGNATEはKaggleに比べ機能は劣りますが、やはり日本語で説明される方が、タスクやデータの理解度は高いです。
また、参加人数もKaggleより格段に少ないので賞金が狙いやすいかも😍
投稿までの流れもシンプルで、気軽に参加できることも良い点です。
次回は実際にコードを書いて、SIGNATEに投稿したいと思います!
目指せSIGNATER!←勝手に作ったよ