機械学習/データサイエンティストの育成を支援 Kaggle Masterが監修する特化型講座をアイデミーが提供開始

オンライン完結型のAIプログラミングスクールを運営する株式会社アイデミーがデータサイエンティストを支援する新しい実践的講座として、Kaggle コンペに踏み出すための「実践データサイエンスコース」 (ベータ版)の募集を開始した。
機械学習(ML)、データサイエンス(DS)の分野で世界最大規模のコミュニティである 「Kaggle」のコンペティションは採用面接などでも重視されているが、このコースではKaggleの中でMasterクラスの評価を得ている秋山理氏を監修に加え、Kaggle のコンペティションでユーザーが上位入賞を目指すことを支援するというもの。
料金は¥198,000- (税抜)。初回申込みは9月16日(水)までとなっている。


世界最大のML/DSコミュニティKaggleでハイスコアを狙え

まず、データサイエンスや機械学習分野に明るくない読者向けに簡単にKaggleについて説明してみよう。
Kaggleは、Googleの親会社として知られるAlphabet社傘下にある企業、Kaggle社が運営するサービスで、予測モデリング及び分析手法関連のプラットフォームだ。
企業や研究者が投稿したデータと課題に対し、コミュニティのメンバーが様々な戦略でモデルを導出し、どの分析手法が最も効果的であるか、どのモデルが最適なのか、精度を競い合う。
最適解を導き出したチームの提出モデルやアルゴリズムに対しては億単位の賞金が出ることあるという、クラウドソーシング的とも、競技プログラミング的とも言えるプラットフォーム、Kaggle。
この中で、多くのエンジニアが腕を競い合っており、Kaggle由来の学習モデルがML/DS分野の発展を急速に進めている。
その最大の特徴はコミュニティの大きさで、2019年のGoogleの発表によるとKaggleの利用者はおおよそ350万人を超えているという。

近年のKaggleのコンペで最も日本で話題になったくずし字OCRのコンペ。データセットを人文学オープンデータ共同利用センター(CODH)が提供、くずし字を読みこなすAIの精度を競ったもの。

Kaggleの中では製薬やHIV治療、交通渋滞モデル、クジラの見分け方など様々な分野に関する課題とデータをKagglerたちが分析し、さらにそこで公開されたデータセットから新しいアプリケーションや、ソリューションが生まれていくという流れができている。
実際にコンペティションに参加している参加者14万6千人に加えて、多くのデータセットの利用者を含めてコミュニティが形成されているということだ。
このような巨大なコミュニティだけに、その影響力は非常に大きく、前述のようにKaggleのコンペティションでの上位入賞経験はDS/ML分野での採用においては加点対象として評価されることも多い。
そこで、「10秒で始めるAIプログラミング学習サービスAidemy」というキャッチコピーでオンラインでのAIプログラミング学習サービスを展開しているアイデミーは、AIを学ぶ上でエンジニアにとってもっともわかりやすい成果指標とも言えるKaggleでの上位入賞を念頭に置いた実践的な学習コースを始めたというわけだ。

Kaggle上でのハイアリングも活発に行われている。




Pythonの基礎から、Kaggle過去コンペのメンタリングまで充実した教材

このコースの特徴はアイデミーが今までに開発してきた教材とトップKagglerの監修を組み合わせた充実したカリキュラムだ。初学者でも安心して門をたたくことができるようPythonの基礎から、データ処理に欠かせないNumpy/Matplotlib/Pandas のようなツールの使い方まで、アイデミーでは今までに実績のある教材を豊富に取り揃えている、としている。

Kaggleにも基礎的なPython、機械学習、ディープラーニング、空間情報分析など、多様な学習コースがあるが、英語なので敷居が高い。

また、発展的な内容に興味があるユーザーには Kaggle でチュートリアル教材として提供されたサンプルコンペティションを題材にした教材も複数用意しており、Kaggle コンペへの参加方法からコードのサブミットまでを一通り習得することができるという。実際に Kaggle の過去コンペに参加してスコアアタックに挑戦する場合でも、サポート対応が可能ということだ。
このコースを監修したのはKaggleでのランクではMasterの評価を得ている秋山理氏。現在192人いるGrandmasterの座からは退いているものの全世界14万7千人のメンバーの中で204位。

15万人近いメンバーの頂点に立つGrandmasterたち。そのあとにMaster、Expert、Contributor、Noviceと続いていく。

従来からアイデミーのpremium planは「24時間チャットサポート」や「実務経験のあるエンジニアによるコードレビュー」「オンラインビデオ通話によるメンタリング」など対応が用意されている。


【監修 Kaggle Master 秋山理氏 (Twitter : @osciiart ) のコメント】
この「データサイエンス入門コース」ではPython入門や、Pythonでデータサイエンスを行うのに必要なnumpy、pandas、matplotlibといったライブラリの使い方を、実際に手を動かして分かりやすく学ぶことが出来ます。さらに、データ確認→探索的データ分析→データ前処理→モデル構築→検証・評価といったデータ分析の一連の流れを体験し、身に着けることが出来ます。
Kaggleをはじめとしたデータ分析コンペティションでは実際のデータを解析して予測結果の成績を競い合います。成績による順位付けが行われるため自身のデータサイエンスのスキルの成長を確認し、客観的に示すことが出来ます。本コースを通してデータ分析コンペティションの上位に入るために必要なスキルを楽しみながら身につけましょう!

具体的な価格やカリキュラムなどの情報は下記のとおり。

価格: ¥198,000- (税抜)
期間: 3ヶ月間
カリキュラム:

  • Python 入門
  • Numpy
  • Pandas
  • Matplotlib
  • 機械学習概論
  • データクレンジング
  • 教師あり学習
  • 教師なし学習
  • Kaggle: タイタニック号 生存者予測
  • Kaggle: 住宅価格予測
  • 過去のKaggleコンペに挑戦
  • ABOUT THE AUTHOR / 

    梅田 正人

    大手電機メーカーで生産技術系エンジニアとして勤務後、メディアアーティストのもとでアシスタントワークを続け、プロダクトデザイナーとして独立。その後、アビダルマ株式会社にてデザイナー、コミュニティマネージャー、コンサルタントとして勤務。 ソフトバンクロボティクスでのPepper事業立ち上げ時からコミュニティマネジメント業務のサポートに携わる。今後は活動の範囲をIoT分野にも広げていくにあたりロボットスタートの業務にも合流する。

    PR

    連載・コラム