データ分析・機械学習

〜素人の分析は玄人の直感に勝るか〜

【競馬分析vol.2】G1エリザベス女王杯の分析結果(2016/11/13)

はじめに

2016年11月に実際に分析を行った予測と結果を公開します。
分析を始めて半年弱経過した頃のものです。

分析対象

レース名:エリザベス女王杯
開催地 :京都
日時  :2016年11月13日(日)11R
エリザベス女王杯|2016年11月13日 | 競馬データベース - netkeiba.com


分析予測と結果

分析予測

randomForest、cforest、SVM、naiveBayseの4つの機械学習アルゴリズムによる結果を単純多数決でまとめました。
次の3頭が3着以内に入る可能性が高いという予測結果になりました。

馬番 馬名 騎手名
1 ミッキークイーン 浜中俊
3 クイーンズリング M.デムーロ
15 パールコード 川田将雅

Rによる予測詳細

f:id:taux:20170217222351p:plain

レース結果

着順 馬番 馬名 騎手名 的中
1 3 クイーンズリング M.デムーロ
2 9 シングウィズジョイ ルメール -
3 1 ミッキークイーン 浜中俊
4 15 パールコード 川田将雅 -

んー…15が惜しかった…!

馬券購入

実はこのレース、馬券を購入していました。
f:id:taux:20170217223425p:plain:w400

まさに完全に欲を出してしまった結果です。
目的変数を「3着以内に入るか、入らないか」という複勝のための問題設定に自分でしたのにも関わらず、3連単を買ってしまったあたりが非常に情けないです。馬券購入に関しては一切機械学習は関係ないので、これが競馬ど素人の結果ですね…。

しかし、分析しているうちに騎手の「ルメールはなんかやばい」ってことくらいはわかってきました。名前しか知りませんが…。
ちなみにこのレースの2着9番シングウィズジョイ(騎手:ルメール)は一切予測結果では出てきませんでした。

時間があればこの分析で用いた説明変数や重要度などを追記したいと思います。