機械学習・ディープラーニングがゼロから学べる大人気『脱ブラ』が無料に!

SIGNATE とは?コンペの参加方法や Kaggle との違いも解説!

この記事はこんな方にオススメです
  • データサイエンスや機械学習に興味のある方
  • データサイエンスコンペティションに参加してみたいが、方法がわからない方
  • 実装力を高めたり、知識を深めたい方

こんにちは、機械学習講師の竹内です。
皆さんはデータサイエンスのコンペティションに参加したことはありますでしょうか。コンペティションでは世界中のデータサイエンティストが精度や実装力を競い合い、好成績を残した方は賞金や実績、名声を得られます。

今回はデータサイエンスコンペティションサイトとして有名な SIGNATE についてご紹介します。世界的に有名な Kaggle との違いも解説。ぜひ御覧ください!

SIGNATE とは

SIGNATE
出典:TOP | SIGNATE

SIGNATE は、2018年4月にオープンしたAI開発コンペティションサイトです。データ分析に関するコンペティションを開催しており、好成績を残したデータサイエンティストは賞金や実績、データを提供した企業や団体は最適な分析結果が得られます。

コンペティションへの参加は無料ですので、初学者の方からすでにデータ分析に取り組まれている方まで、どなたでも参加可能です。

注意
コンペティションの内容によっては参加者が限定されているものもあります。

SIGNATE の使い方

SIGNATE_content

SIGNATE のヘッダーには上図のような項目があります。各項目に関してご紹介します。

  • Competition
  • 参加可能なコンペティションを探せます。

  • Learning
  • コンペティションに参加するための知識を学習できます。

  • Career
  • データサイエンス関連の求人情報を確認できます。

  • Articles
  • SIGNATE 社が投稿した記事を確認できます。

Competition

SIGNATE_competitions
出典:コンペティション一覧

企業や自治体から提供されるコンペティションに挑戦できます。「懸賞付き」に掲載されているお題では好成績の方に賞金が提供されます。株式会社スペースシフトのコンペティションでは 1 位の方に 50 万円が提供されたようです!

懸賞付き以外にも様々なコンペティションがありますので、取り組めそうなお題がないかぜひ探してみてください!

  • SOTA (State-of-the-Art)
  • SIGNATE で過去に開催されたコンペティションの一部が掲載されています。過去のトップランカーの記録を塗り替えられるかに挑戦する内容となります。
    SOTA
    出典:SOTA 一覧

  • 称号限定
  • SIGNATE では各参加者に称号が与えられており、称号によって参加者が限定されているコンペティションが掲載されています。同じレベルのデータサイエンティストと精度を競争できます。
    title
    出典:称号限定 一覧

  • 学生限定
  • 参加者を学生限定としたコンペティションが掲載されています。学生データサイエンティスト No.1 を決める「Student Cup」が年 2 回開催されていますので、実装力を競いたい学生の方はぜひ挑戦してみてください!
    student
    出典:SIGNATE Student Cup 2021春: 楽曲のジャンル推定チャレンジ!!

  • 練習問題
  • 期限や賞金はありませんが、初学者向けの問題が掲載されています。機械学習のチュートリアルとしてよく扱われるお題(アヤメの分類、手書き文字の認識)もありますので、初めは練習問題から挑戦してみるのもよいかと思います。
    iris
    出典:【練習問題】アヤメの分類

    mnist
    出典:【練習問題】手書き文字認識

Learning

SIGNATE_Learning
出典:Gym 一覧

コンペティションに参加するまでの基礎知識(Python について、ディープラーニングについて等)を学習できます。一部無料になっていますので、コンペティションに参加する実装力がまだ足りないと思われる方は、ぜひ確認してみてください。

Career

Career
出典:SIGNATE Delta

データサイエンス関連の求人情報を確認できます。コンペティションの成績によっては求人を出している企業からスカウトが来ることもあります。データサイエンティストへの転職を考えている方はぜひスカウトがもらえるようコンペティションに取り組んでみてください!

Articles

Articles
出典:SIGNATE Articles

SIGNATE 社が投稿した記事を確認できます。コンペティションで好成績を残した方へのインタビュー記事等が載っておりますので、コンペティションに挑戦している人や工夫していることが気になる方はぜひ覗いてみてください。

コンペ参加 → 投稿までの流れ

それでは SIGNATE のコンペティションに挑戦してみましょう。具体的なステップは以下となります。

step1
開催中のコンペティションから参加したいものを選択
step2
参加規約へ同意
step3
データと提出ルールの確認
step4
学習モデルの作成、提出用ファイルの作成
step5
提出用ファイルを投稿
step6
評価の確認
1 つずつ見ていきましょう。

STEP 1 : 開催中のコンペティションから参加したいものを選択

iris

こちらのページから参加したいコンペティションを探してみましょう。本記事では初学者でも取り組みやすい練習問題の「アヤメの分類」を選択します。

STEP 2 : 参加規約へ同意

iris_STEP2_1
iris_STEP2_2

コンペティションのトップページの右側に「投稿」というボタンがありますのでそちらをクリックしましょう。クリックすると参加規約が表示されますので、内容を確認した後「コンペティション参加規約に同意する」を選択してから「参加する」をクリックしましょう。

STEP 3 : データと提出ルールの確認

iris_STEP3_1

タブにある「データ」を選択すると上記の画面が表示されますので、「ダウンロード」のアイコンから各データをダウンロードできます。
また「データ」タブには目的変数の説明や提出ファイルの形式も明記されていますのでこちらも合わせて確認しておきましょう。

iris_STEP3_2

STEP 4 : 学習モデルの作成、提出用ファイルの作成

iris_STEP4
STEP 3 でダウンロードしたデータを使用して学習モデルを作成しましょう。モデルを作成する際は Google Colaboratory を使用すると環境構築の手間が不要になったり、無料で GPU を使用できますのでオススメです。
モデルの評価指標に関しては「説明」タブの中にある「評価方法」タブから確認できますのでこちらは必ず確認しておきましょう。(私はこちらを確認するのを忘れ、何度提出しても精度が上がらないことに悩まされた経験があります…

STEP 5 : 提出用ファイルを投稿

iris_STEP5_1
iris_STEP5_2

提出用の CSV ファイルが作成できたら投稿してみましょう!トップページの「投稿」ボタンをクリックするとファイルを選択する画面に遷移します。提出用の CSV ファイルを選択し投稿しましょう。(1 日 5 回までしか投稿できませんので注意してください。

STEP 6 : 評価の確認

iris_STEP6_1

投稿が完了すると、トップページの「投稿済みファイル」タブから評価を確認することができます。また「リーダーボード」タブから投稿結果の順位も確認することができますので、今後は評価を見ながら精度を上げていく流れとなります。

iris_STEP6_2

Kaggle との違い

ここまで SIGNATE の使い方や投稿方法についてお伝えしてきました。データサイエンスのコンペティションサイトとして SIGNATE ももちろん有名ですが、世界的に有名なサイトとして Kaggle があります

SIGNATE と Kaggle の違いについてメリット・デメリットという観点でお伝えします。

メリット
  • 日本語で記載されているのでわかりやすい
  • 参加人数が Kaggle よりも少ないため、賞金が狙いやすい
デメリット
  • コーディングの環境が用意されていない
  • 他の参加者の実装内容が公開されていない

メリット 1 : 日本語で記載されているのでわかりやすい

Kaggle_competitions
出典:Kaggle コンペティション一覧

SIGNATE と Kaggle の大きな違いは「日本語」で記載されているのか「英語」で記載されているのかです。SIGNATE は日本の企業が運営していますが、Kaggle は Google が運営しているので英語のみにしか対応していません。
そのため英語が苦手な方にとっては SIGNATE の方が取り組みやすいかと思います。

メリット 2 : 参加人数が Kaggle よりも少ないため、賞金が狙いやすい

2 つめの違いは参加人数です。SIGNATE は現在約 5 万人※1 が使用しているプラットフォームですが、Kaggle は約 100 万人以上※2 が使用しています。
そのため、参加人数が少ない SIGNATE の方が競争相手が少ないので賞金が狙いやすいと考えることもできます。

※1 : 国内最大のデータサイエンスプラットフォーム《SIGNATE》が、登録ユーザ数50,000人を突破
※2 : What is Kaggle, Why I Participate, What is the Impact?

デメリット 1 : コーディングの環境が用意されていない

Kaggle_kernel

Kaggle では上図のような kernel と呼ばれるコーディング環境が用意されており、環境構築不要で簡単にモデルを作成することができます。
しかし現在は Google Colaboratory と呼ばれるコーディング環境を Google 社が無料で提供してくれていますので、こちらは特に問題ないかと思います。

デメリット 2 : 他の参加者の実装内容が公開されていない

Kaggle_code

Kaggle では他の方の実装内容と精度が公開されていることがあり、どんな手法を使ったのかを学習できます。

初学者の方にとってはコードの内容を理解するだけでも大変かと思いますが、その分知識を深めることが可能なので、ハイレベルな学習教材として活用できるでしょう。

SIGNATE にも「フォーラム」タブにて実装内容が公開されていることもあるのですが、参加母数が SIGNATE と Kaggle ではかなり違うため、SIGNATE には実装内容が載っていないことが多いです。

最後に : 知識も実装力も実績も獲得しよう!

いかがでしたでしょうか。コンペティションに初めて投稿できるとかなり達成感がありますので興味のある方はぜひ挑戦してみてください!

  • 自分の知識を深めたい!
  • 自分の実装力を試してみたい!
  • 実績を残して転職へのきっかけとしたい!

上記の方は今すぐ参加できそうなコンペティションを探して挑戦してみましょう!