「DIY競馬プログラミング JRA-VAN Data Lab.編」活用教室(応用編イメージ)(2-1) 更新
05-10-24

 Chap5〜Chap9では、DIY2本の基礎的な理解のためにプログラムの動きと結果を理解することを重点にしてきました。これからは今までのプログラムを活かしながら「予想ソフト」を作っていく「応用編」になります。

応用編は2段階に区切って進めていきます(予定)。
(1)「レース詳細」(RA)データを中心にした解析
 週末用の非蓄積系「レース詳細」データ及び当日の速報系「時系列オッズ」データを中心にした解析。
@各レースの条件や各馬券の発売票数(売上)と配当(払戻)を表示する。
A各レースの単勝オッズ及び複勝オッズのデータを時系列で示し、折れ線グラフに表示する。
B過去5走データを抽出する。(旧JRA-VAN仕様のデータとは等価ではありません)
などを目標にします。各レースの馬名や騎手データなどの詳細については(2)で扱います。

ここで作るソフト名は「DIY2_JVData_DL」とします。JVDataのダウンロード(DL)機能をメインとする意味からです。

目次(05-10-06修正)
(2-1)応用編ソフトの概要。このページ。
(2-2)準備編(その1)−ワークシート「レース一覧」に「スタート画面表示」ボタンを追加し、プログラムを作ります。
(2-3)準備編(その2)−ワークシート「初期設定」に「初期ディレクトリ設定」ボタンを追加し、初期設定用プログラムを作ります。初期設定も行います。
(2-4)応用編第一部の目標−ダウンロードするデータ("RACE","RCOV")の種類や取得するタイミングの説明。応用編でのJV-Dataデータの関係を理解する重要なパートです。
(2-5)JVDataをダウンロードするプログラム(その1)。非蓄積系データ("RACE/RCOV")のダウンロードプログラムと共通のプログラムを説明します。
(2-6)JVDataダウンロード(その2)。「過去5走データ」の抽出を行うプログラムの説明。
(2-7)JVDataダウンロード(その3)。速報系データ(オッズなど)のダウンロードプログラムの説明。
(2-8)「レース解析」プログラム。ダウンロードしたJVDataを使って各レースの競走条件やオッズ(票数)、払戻情報を解析するプログラムの説明。その他に追加の共通プログラムや、DIY2本のChap8から標準モジュールをインポートする手順の説明。さらに実際に「レース解析」プログラムを動作させます。
(2-9)時系列オッズのダウンロードプログラム。各レースの時系列オッズ(単複枠)をダウンロードして、ワークシートに表示および折れ線グラフにするプログラムの説明。
(2-10)ワークシート「レース一覧」の枠線表を作るプログラム。これで完成。

DIY2_JVData_DLの完成版プログラムのダウンロードはこちらから。

(2)「馬毎レース情報」(SE)データを中心にした解析。
ソフト名は「データマイニング(DM)」解析機能を中心にしたという意味で[DIY2_JVData_DM]とします。
 (1)に加えて、非蓄積系「馬毎レース情報」データや「データマイニング予想」データの解析を加えます。
@各レースの馬名や騎手名の表示を加えます。
Aデータマイニング予想値を使った馬連・三連複組み合わせなどの予想ソフトとしての機能を加えます。
B「注目したい馬」や「気になる騎手と調教師」を設定及び検出機能を追加。
などを目標にします。

上記の(2)は(1)を包含するものなので、(2)が最終ソフトになりますが、時系列オッズだけを見たい場合には(1)だけでも使えると思います。第一部の[DIY2_JVData_DL]は第二部の[DIY2_JVData_DM]に含まれるため、ダウンロード版は第二部のみとしました。(05-10-24)
説明の大部分は共通です。

DIY2_JVData_DMの完成版プログラムのダウンロードはこちらから。

各段階の詳細な内容については「応用編」の連載で説明します。

「応用編」できあがりのイメージ画面
とりあえず(1)の完成版のイメージをご紹介します。
@トップ画面
 開催全場所の各レースの情報を一覧表に解析した結果です。特に説明はいらないと思いますが、各馬券の票数や、配当情報の表示が(1)の特徴です。票数は万円単位で、ダウンロードのたびに値が変ります(レース確定まで)。レースにより単勝・複勝の売れ方が違っていたり、三連単が一番売れていることなどが分かります。



A単勝オッズの時系列表示
 上記の「レース一覧表」画面で見たいレースの行(どこでもいい)をダブルクリックすると、「単勝・複勝」の時系列オッズデータをダウンロードして、ワークシート”単勝オッズ””複勝オッズ”に表示します。
"B"列がオッズの発表時刻で、図では朝の7時頃に発表されて、以後数分ごとにデータが提供されている様子が分かります。朝一番では、右端の単勝票数が2票、即ち200円だけ、馬番8と馬番9が100円ずつ買われています。結果は3着にも入らず。馬番9は人気ですから分かるとして、馬番8はどういう人が買ったのでしょうね。
セルには色がついている箇所がありますが、「赤色」は前回オッズより1/2以下、即ちオッズが半分以下に下がった(人気がアップ)場合、「青色」はやはり30%以上オッズが下がった(人気アップ)場合、「黄色」は逆に30%以上オッズが上がった(人気がダウン)場合を示します。ある時間に集中的にある馬に”買い”が入ると、残りの馬が一斉に「黄色」になる場合があります。パドック開始以前なら、ウラ情報による”買い”か、レース直前ならパドックでの気配による”買い”かもしれません。しかし、これらの馬が必ずしも来るわけではありませんが。。。
(完成版の画像は、若干変わっています)



B単勝オッズの時系列変化のグラフ
 Aのデータをグラフにしたのが下図です。横軸が時刻、縦軸が単勝オッズです。オッズは1倍台から万馬券まで広範囲にばらつくので、表示の上限を「単勝オッズ40倍」としています。



C複勝オッズの時系列表示
 これは単勝オッズと同様な表示です。



D複勝オッズの時系列変化のグラフ
 これも単勝の場合と似ていますが、オッズの縦軸の表示上限は「20倍」としています。



次回は、応用編第一部:準備編(その1)を説明します。

ホームへ 新タラレバ競馬倶楽部へ 活用教室:応用編(2-1)へ (2-2)へ (2-3)へ (2-4)へ (2-5)へ (2-6)へ (2-7)へ (2-8)へ (2-9)へ (2-10)
活用教室:Chap5 →(1-1)(1-2)(1-3)
活用教室:Chap8 →(1-4)(1-5)(1-6)(1-7)(1-8)(1-9)(1-10)
活用教室:Chap9 →(1-11)(1-12)