「確率」「条件付き確率」「乗法定理」が揃ったことで、いよいよ現代のデータサイエンスやAIの基礎ともなっている「ベイズの定理」について、野球を題材にこの定理を紐解いていきます。
野球でわかる「ベイズの定理」:情報の更新と直感の数式化
確率論の「静」と「動」
これまで私たちが扱ってきた確率は、サイコロを振る前のような「静的な確率」が主でした。「打率3割」という確定したデータがあり、そこから未来を予測するというスタイルです。しかし、現実の野球(そして私たちの人生)はもっと動的です。
「前評判は凄かったのに、開幕したら全く打てない新人」
「期待していなかったのに、代打で結果を出し続けるベテラン」
私たちは、新しい結果(データ)を見るたびに、その選手への評価(確率)を書き換えています。
「お、意外とやるじゃないか」「いや、まぐれかもしれない」
この「新しい情報(結果)を得て、持ち合わせている評価(確率)を更新していくプロセス」を数式化したもの、それがベイズの定理です。
1.ベイズの定理の正体
まず、数式を提示します。これまでの「条件付き確率」の式を少し組み替えただけのものです。
ある「仮説 \(H\) (Hypothesis)」と、得られた「データ \(D\) (Data)」があるとき、以下の式が成り立ちます。
$$P(H|D) = \frac{P(D|H) \times P(H)}{P(D)}$$
一見複雑に見えますが、野球の言葉に翻訳すると、劇的にわかりやすくなります。
- \(P(H)\):事前確率(じぜんかくりつ)
- データを見る前の、最初の評価。「これくらいの確率で一流選手だろう」という思い込みや前評判。
- \(P(D|H)\):尤度(ゆうど)
- もしその仮説が正しかったら、そのデータが出る確率はどれくらいか。「一流選手なら、こんなホームランをどれくらいの確率で打つか」。
- \(P(D)\):周辺確率(しゅうへんかくりつ)
- あらゆる可能性を含めて、そのデータ(ホームラン)が出る全体の確率。
- \(P(H|D)\):事後確率(じごかくりつ)
- データを見た後の、更新された評価。「ホームランを見た今、彼が一流選手である確率はこれくらいに上がった!」という結論。
つまり、ベイズの定理とは「『事前確率』に『尤度(もっともらしさ)』を掛け合わせて、『事後確率』へアップデートする装置」なのです。
2.ケーススタディ「謎の新外国人選手」
では、具体的なストーリーで計算してみましょう。あなたの応援するチームに、メジャーリーグ経験はないが、マイナーリーグでそこそこ打っていた謎の新外国人選手「ボブ」が入団しました。あなたはスカウトになったつもりで、ボブが「本物の主軸(怪物)」なのか、それとも「期待外れ(凡才)」なのかを見極めようとしています。
1. 「事前確率」の設定(開幕前の評価)
キャンプの情報や前評判から、あなたはボブに対して半信半疑です。
「まあ、当たりかハズレかは半々より少し低いかな…」
これがあなたの事前確率です。
- 仮説 \(H\):ボブは「怪物」である
- \(P(H) = 0.4\) (40%の確率で怪物だと信じている)
- 仮説 \(\neg H\):ボブは「凡才」である
- \(P(\neg H) = 0.6\) (60%の確率で凡才だと思っている)
2. 「尤度」の設定(タイプの定義)
次に、それぞれのタイプがどれくらい打つかという定義をします。
- もし「怪物」なら:ホームラン率は 10% (\(0.1\)) あるはずだ。
- もし「凡才」なら:ホームラン率は 2% (\(0.02\)) くらいしかないだろう(まぐれ当たりはある)。
3. 「データ」の発生(開幕戦)
開幕戦、ボブの第1打席。
なんとボブは、バックスクリーンへ特大のホームランを放ちました!
これが新しい情報、データ \(D\) です。
さて、この一発を見て、あなたの「ボブは怪物だ」という信頼度(確率)は、40%から何%に跳ね上がるでしょうか?
3.更新の計算プロセス
数式に当てはめて計算していきましょう。
求めたいのは \(P(\text{怪物}|\text{HR})\) 、つまり「HRを見た後の、怪物である確率」です。
$$P(\text{怪物}|\text{HR}) = \frac{P(\text{HR}|\text{怪物}) \times P(\text{怪物})}{P(\text{HR})}$$
手順①:分子を計算する
「怪物である確率」と「怪物がHRを打つ確率」を掛けます。
$$P(\text{HR}|\text{怪物}) \times P(\text{怪物}) = 0.1 \times 0.4 = 0.04$$
手順②:分母(周辺確率)を計算する
ここが重要です。分母の \(P(\text{HR})\) は、「ボブが怪物でHRを打つ場合」と「ボブが凡才だけどまぐれでHRを打つ場合」の合計です。
- 怪物でHR:\(0.1 \times 0.4 = 0.04\)
- 凡才でHR:\(0.02 \times 0.6 = 0.012\)
$$P(\text{HR}) = 0.04 + 0.012 = 0.052$$
(つまり、どんな選手であれ、この打席でHRが出る確率は全体で5.2%だったということです)
手順③:割り算して更新完了(事後確率)
$$P(\text{怪物}|\text{HR}) = \frac{0.04}{0.052} \approx 0.769$$
結果:約 77%
なんと!開幕前は「40%くらいかな…」と疑っていた評価が、たった一発のホームランを見ただけで「77%の確率で本物だ!」という確信に変わりました。
これがベイズの定理による「情報の更新」です。
4.ベイズの真骨頂「連続的な更新」
ベイズの定理が真にパワフルなのは、ここからです。
この計算は1回で終わりではありません。
「事後確率」は、次の打席の「事前確率」になります。
もし、ボブが次の打席でもホームランを打ったらどうなるでしょうか?
- 新しい事前確率 \(P(H)\): さきほど計算した 0.769 (77%) を使います。
- 当然、凡才である確率 \(P(\neg H)\) は \(1 – 0.769 = 0.231\) に減っています。
- 計算(2打席連続HR):
- 分子(怪物):\(0.1 \times 0.769 = 0.0769\)
- 凡才の項:\(0.02 \times 0.231 = 0.00462\)
- 分母(合計):\(0.0769 + 0.00462 = 0.08152\)
- 事後確率:\(0.0769 \div 0.08152 \approx \mathbf{0.943}\)
結果:94%
2打席連続ホームランを見た時点で、あなたは「こいつは94%以上の確率で本物の怪物だ。間違いない」とほぼ確信することになります。
逆に、もし凡退が続けば、この確率はジリジリと下がっていき、やがて「やっぱりダメだったか」という結論(更新)に至ります。
5.なぜ「条件付き確率」だけでは不十分なのか?
ここで一つの疑問が浮かびます。
「難しい計算をしなくても、ホームランを打ったんだから、凄い選手に決まってるじゃないか」と。
しかし、ベイズの定理は「偽陽性(ぎようせい)」の罠を防ぐために非常に重要なのです。
もし、ボブのホームランが「風に乗ったラッキーなホームラン」だったとしても、単純な結果だけを見れば「ホームラン」です。
しかし、ベイズの定理には「事前確率(前評判)」という重りがあります。
例えば、もしボブではなく、全く打撃に期待されていない「守備専門の投手(怪物である確率がほぼ0%)」がホームランを打ったとしたらどうでしょう?
事前確率 \(P(H)\) が極端に低いため(例:0.001)、たとえホームランを打っても、事後確率はそれほど上がりません。
「すごい!……でも、まあマグレだろうな(次は打てないだろう)」と、私たちは直感的に判断します。
ベイズの定理は、この「目の前の結果に飛びつかず、過去の経験(事前確率)とバランスを取って判断する」という人間の冷静な思考プロセスを、数学的に正しく記述しているのです。
6.現代野球とAIへの応用
このベイズ的な思考は、現代の野球戦略(セイバーメトリクス)やAI技術の中核をなしています。
1. 守備シフトの変更
打者が打席に入った瞬間、野手はこれまでのデータ(事前確率)に基づいて守備位置を決めます。しかし、その日のスイングやファウルチップの飛び方(新しいデータ)を見て、「今日は少し振り遅れているな」と判断し、守備位置を逆方向へ微修正(事後確率への更新)します。
2. 配球の読み合い
キャッチャーは「このバッターはストレートに強い(事前確率)」を持っています。しかし、初球のストレートを見逃した(データ)瞬間、「あれ?今日はストレートを狙っていないのか?それとも反応できていないのか?」と確率を更新し、2球目のサインを決めます。
3. AIによる勝敗予測
テレビ中継で見る「現在の勝率」もベイズ更新の塊です。
「1回裏、0-0」という事前確率からスタートし、「ヒットが出た」「アウトになった」というデータが入るたびに、リアルタイムで勝率(事後確率)を計算し続けています。
不確実な未来を見通すレンズ
野球において、10割打つバッターはいませんし、絶対に勝てる作戦もありません。私たちは常に「不確実性」の中にいます。
しかし、わからないからと言って運任せにするのではなく、
「今持っている知識(事前確率)」と「新しく得た事実(データ)」を組み合わせることで、少しでも真実に近い確率(事後確率)を手繰り寄せること。
それがベイズの定理の本質です。
あなたが次に野球中継を見るとき、新人がヒットを打って解説者が「お、この選手はレギュラー定着するかもしれませんね!」と言ったら、心の中でこう呟いてみてください。
「なるほど、解説者の頭の中でベイズ更新が行われたな」と。
そうすれば、野球というゲームが、単なる球遊びではなく、壮大な確率の収束実験に見えてくるはずです。