こいぬの散文的備忘録

散文的備忘録

Kaggleを始めるまでの備忘録

モチベーション

昨今の新型コロナウイルス騒動で音楽活動が停滞、緊急事態宣言解除の県もチラホラ出ているけど新しい生活様式という限定付き、再開の目処は立たない。暇だしなんかしたいなぁと…
そこで、『Kaggleをやってみよう!』と思い立つ。

Kaggleとは

Kaggleとは、機械学習やデータサイエンスに携わる人達の間で有名なコミュニティサイト。小難しいことやってる人達が集まるmixiみたいなもん。
参照: https://ja.m.wikipedia.org/wiki/Kaggle
Kaggleの最大の特徴としてCompetition(コンペ)がある。定期的にKaggle側から機械学習やデータサイエンスに纏わる問題が出されて、参加者はその問題を解き、正答率を競う。コンペで勝てば賞金もあるって感じ。
賞金獲ってMac book pro買いたいね。その前にドル渡しだから口座作らんとね。

Kaggleを始める準備

そういうわけで、Kaggleを始めよう。さて、なにから始めるよう…まずは、環境構築かなぁ…
というわけで、以下の3つを準備。
Kaggleのアカウント
github
Google Colaboratory

Kaggleのアカウント

Kaggleを始めるにあたって必須。下のurlのregisterから、必要事項を記入して登録。なお、日本語サイトはない模様。Google翻訳も必須。
https://www.kaggle.com
下記ブログを参考にTitanicまでサクッとやる。ちなみに僕はランダムフォレストで精度74%でした。まずまず。
https://qiita.com/upura/items/3c10ff6fed4e7c3d70f0

github

githubは、ソースコードホスティングするプラットフォームサービス。だいたいスパゲティになるので事前に対策。下記サイトでアカウント作成。Kaggle用のリポジトリを作ったりして運用。
https://github.co.jp

google Colaboratory

google Colaboratory はgoogleが開発環境を無料で貸してくれるサービス。pythonがjupyter notebookのように対話型で利用できる。個人的に最大の魅力はGPUが使えるところ。ついでにgithubとも連携できるので、リポジトリ作っとけばソース管理が非常に楽に。google様の施しには畏怖の念を抱きますわ…
https://colab.research.google.com

そんな感じで

タスク:Kaggle
開発環境: google Colaboratory
ソース管理: github

みたいな環境を組んだ。音楽はしばらくできなさそうだけど、これなら一人でできるのでがんばってみる。
あわよくば賞金をという感じで、まぁそれは無理か