競馬予想AIを自作してみた体験記 ― スクレイピングからモデル構築までの奮闘と次なる課題

2025年5月17日

こんにちは、ライターのmikazukiです。今回は「自分の競馬予想ファクターをプログラミングで再現し、AIで勝負したい！」という想いから始めた自作競馬予想AI開発の奮闘記をまとめます。完成までは一筋縄ではいきませんでしたが、得られた気づきや次の改善ポイントを共有します。

ChatGPTで骨格生成
ChatGPTに依頼し、レース結果ページを対象にしたPythonスクレイピングスクリプトを作成。
HTML→CSV変換の自動化
- BeautifulSoupで必要要素を抽出
- pandasで整形しCSVへ出力
  ここまでで「使える学習データ」が揃いました。

分類：着順上位に入る確率
回帰：期待回収率
モデルはLightGBMを採用し、交差検証でパラメータを最適化。正直、最初は精度が伸び悩みましたが、「過去5走だけでなくコース別成績を追加する」などで改善が見られました。

成果：スクレイピング→前処理→学習→予測までがワンストップで動く“β版”を完成。
課題：的中率・回収率ともに実戦投入レベルには未達。
- 特徴量の追加（調教時計、展開要素など）
- ハイパーパラメータのさらなる最適化
- 本番環境での高速実行&ブロック回避対策

自作競馬予想AIの第一歩は「動くもの」を完成させることでした。今回、その目標は達成でき、開発フローも固まりました。次回は 精度向上のための改良ポイント を掘り下げ、実戦で利益を出せるレベルへ持っていく過程をレポートします。どうぞご期待ください！