読者です 読者をやめる 読者になる 読者になる

データ分析・機械学習

〜素人の分析は玄人の直感に勝るか〜

【競馬分析vol.0】素人がデータと機械学習だけで勝てるか

競馬分析 機械学習

データ分析を始めた経緯

個人的な体感として、2013年頃から統計学に関係する書籍を本屋でよく見かけるようになった気がするのですが、世の流れに沿って私も統計学を改めて(?)少しずつ勉強していました。


その延長線上として2016年の年明け頃からR言語を用いて機械学習をいじくるようになり、実データも用いて分析するようになってから最近少しずつ素人なりにノウハウがたまってきたので、これから徐々に公開していきたいと思います。
(個人でもいろいろな強力ツールを無料で使える時代に最近感動しています)


このようなコツコツ系作業は継続がなにより大事ですし、何よりもせっかくデータ分析を実践的に学んでいくからには少しでもワクワクしながら行いたいというのが正直なところ。


そこで最初は
「データ分析・機械学習を継続的に学び、基本スキルを身につける」という目的
のもと、元々ギャンブルに興味のない(センスも全くない)私がデータと機械学習だけでどこまでギャンブルからギャンブル要素を排除できるか(投資に変貌させられるのか)をモチベーションに分析していこうと考えました。

分析対象の選定

選定する上での前提

  • ギャンブルが目的ではないので、大勝ちなどを狙った分析はしない

 欲を出さない、欲は判断を鈍らせる敵

  • 「ただ分析・予測して終わり」もつまらないので予測に基づいて少額購入してみる

 ここでも欲は出さずにあくまでも分析結果に忠実に従う

  • 個人的な主観を極力入れない、客観データ主導の分析にする

 偏った事前知識のない、これまで触れたことのないものが望ましい

  • 公式データが豊富に存在するものとする

 分析する上での大前提

  • 完全にコンピュータ制御された反復試行的なものは扱わない

 ナンバーズなどの分析?は、もはやオカルトに感じます…

  • 参考文献がある程度存在するもの

 素人が真っ先にすべきことは「先駆者を真似をすること」から

選定案

上記の前提を踏まえて、分析対象をまずは以下の2つに絞りました。

  1. サッカーくじtoto
  2. 競馬

サッカー自体は子どもの頃にやっていたこともあり馴染みのあるものでしたが、Jリーグに関しては久しく見ておらず、各チームのイメージももはや何も残っていなかったため選びました。(しかし、最初に実践したサッカー分析はスキル0の状態での分析だったため失敗に終わります…今後分析結果を公開していきます)


競馬に関しては、これまでも機械学習エンジニアが分析対象として選んでいること、そして何より競馬に関する事前知識が0であることが逆に様々なメリットや面白みを生むのではないかと考え選びました。


まだまだ分析をブラッシュアップしていっている途中ではありますが、今後はこれらの分析の経過などを公開していきます。
データ分析・機械学習という視点だけではなく、競馬ファンの方も楽しめるような内容を目指します!