TPTブログ

テックポート株式会社のブログです。 技術情報や製品・サービス情報、 また未経験社員がデータサイエンティストを 目指す奮闘記など、更新していきます。

SIGNATE始めました~SIGNATEとは?~

f:id:tbtech:20190621115546p:plain
これまではKaggleに挑戦してまいりましたが、
今回はKaggleの日本版!SIGNATEに挑戦したいと思います。

SIGNATEとは

f:id:tbtech:20190620114504p:plain
日本版Kaggleと言われるとおり、コンペティションに参加したり、
練習用データセットが提供されています。
コンペ等に参加し、成績によっては企業より雇用のオファーが来たりします🤗

Kaggleとの大きな違いは、「カーネル」が無いことです。
Kaggleの「カーネル」は他の人たちのコードを見て、意見交換などをする場です。
それが無いので勉強できる幅は大きく減ってしまいます。
SIGNATEにもカーネルが出来ればなあと思います😞
また、コンペや練習問題の数も少ないです。これからどんどん増えて、
データサイエンティストを育てる場が広がってほしいですね😇

Conpetitions

f:id:tbtech:20190620115229p:plain
メニューには、まず「Conpetitions」があります。
企業や自治体などから提供されるプロジェクトに挑戦し、良い成績の人は賞金がもらえます。
このプロジェクトは、全員が参加できるもの以外に【招待制】や【学生限定】など
参加できる人に制限がかかっているものもあります。
また、1つのプロジェクト内でいくつかのステージが分かれているものもあります。

気になるコンペを選び、そのコンペのページに移動すると、下のようなメニューがあります。
 概要:このコンペが開かれた背景や、タスク説明、お知らせを確認します。
 評価方法:使用する評価関数や、コンペの順位の決め方が書かれています。
 ルール:参加資格や情報の扱い方、実装方法など大切な情報があります。
 スケジュール:コンペの流れと、各セクションの日付が書かれています。
 FAQ:参加者より寄せられた質問と、その回答を見ることができます。

Users

・Rankings:SIGNATE内でのランキングが表示されます。
      コンペで3位以内に入賞するとメダルがもらえます。
      メダルの数とポイント数でランキングが決まります。
・Stats:参加者に関する情報を統計的にまとめられています。
    年齢や年収の分布や、ツール等の熟練度が見られます。

Learning

ここでは練習問題が提供されており、コンペと同じような流れで投稿し、ランキングを見ることが出来ます。
動画学習などの案内もありますが、無料で学習できるコンテンツは無いようです。

Career

データサイエンス系に特化した就職情報を閲覧できます。
転職サポートサービスでは、非公開の情報も見られ、コンサルタントのサポートを受けられます。

Others

よくある質問の閲覧と、お問い合わせができます。

投稿までの流れ

1.データをダウンロード

コンペの概要やルールを確認後、データをダウンロードします。
f:id:tbtech:20190621100020p:plain
メニューから「データ」を選択すると、データダウンロードができる欄と、
その下にデータの説明が書かれています。
データは複数あるので、全てをダウンロードし、データを開いて確認します。

2.学習モデル作成

データを読み込み、学習モデルを作成します。
具体的なコードは次回からご紹介します。

3.提出用データ作成

それぞれのコンペによって提出する成果物は違うと思いますが、
提出サンプルデータがダウンロードできることが多いので
それに倣って提出用データを作成します。

4.投稿

コンペページの右上のほうにある「投稿」をクリックします。
すると、投稿するためのウィンドウが開きます。
f:id:tbtech:20190621110907p:plain
「ファイルを選択」から提出用データを選択します。
コンペには通常1日5回まで投稿できるので、
何度も投稿するうちにどんなコードだったか、わからなくなります🤣
なので「メモ」の欄にコードの概要を書いておくと、忘れても大丈夫です!

5.評価

投稿して暫くすると、評価とランキングを知らせるメールが届きます。
評価関数での数値とランキングしかわからないので、
そこから試行錯誤して精度の向上を目指します!!

まとめ

SIGNATEはKaggleに比べ機能は劣りますが、
やはり日本語で説明される方が、タスクやデータの理解度は高いです。
また、参加人数もKaggleより格段に少ないので賞金が狙いやすいかも😍
投稿までの流れもシンプルで、気軽に参加できることも良い点です。

次回は実際にコードを書いて、SIGNATEに投稿したいと思います!
目指せSIGNATER!←勝手に作ったよ