ベイズの定理

「確率」「条件付き確率」「乗法定理」が揃ったことで、いよいよ現代のデータサイエンスやAIの基礎ともなっている「ベイズの定理」について、野球を題材にこの定理を紐解いていきます。


野球でわかる「ベイズの定理」:情報の更新と直感の数式化

確率論の「静」と「動」

これまで私たちが扱ってきた確率は、サイコロを振る前のような「静的な確率」が主でした。「打率3割」という確定したデータがあり、そこから未来を予測するというスタイルです。しかし、現実の野球(そして私たちの人生)はもっと動的です。

「前評判は凄かったのに、開幕したら全く打てない新人」

「期待していなかったのに、代打で結果を出し続けるベテラン」

私たちは、新しい結果(データ)を見るたびに、その選手への評価(確率)を書き換えています。

「お、意外とやるじゃないか」「いや、まぐれかもしれない」

この「新しい情報(結果)を得て、持ち合わせている評価(確率)を更新していくプロセス」を数式化したもの、それがベイズの定理です。


1.ベイズの定理の正体

まず、数式を提示します。これまでの「条件付き確率」の式を少し組み替えただけのものです。

ある「仮説 \(H\) (Hypothesis)」と、得られた「データ \(D\) (Data)」があるとき、以下の式が成り立ちます。

$$P(H|D) = \frac{P(D|H) \times P(H)}{P(D)}$$

一見複雑に見えますが、野球の言葉に翻訳すると、劇的にわかりやすくなります。

  • \(P(H)\):事前確率(じぜんかくりつ)
    • データを見る前の、最初の評価。「これくらいの確率で一流選手だろう」という思い込みや前評判
  • \(P(D|H)\):尤度(ゆうど)
    • もしその仮説が正しかったら、そのデータが出る確率はどれくらいか。「一流選手なら、こんなホームランをどれくらいの確率で打つか」。
  • \(P(D)\):周辺確率(しゅうへんかくりつ)
    • あらゆる可能性を含めて、そのデータ(ホームラン)が出る全体の確率。
  • \(P(H|D)\):事後確率(じごかくりつ)
    • データを見た後の、更新された評価。「ホームランを見た今、彼が一流選手である確率はこれくらいに上がった!」という結論

つまり、ベイズの定理とは「『事前確率』に『尤度(もっともらしさ)』を掛け合わせて、『事後確率』へアップデートする装置」なのです。


2.ケーススタディ「謎の新外国人選手」

では、具体的なストーリーで計算してみましょう。あなたの応援するチームに、メジャーリーグ経験はないが、マイナーリーグでそこそこ打っていた謎の新外国人選手「ボブ」が入団しました。あなたはスカウトになったつもりで、ボブが「本物の主軸(怪物)」なのか、それとも「期待外れ(凡才)」なのかを見極めようとしています。

1. 「事前確率」の設定(開幕前の評価)

キャンプの情報や前評判から、あなたはボブに対して半信半疑です。

「まあ、当たりかハズレかは半々より少し低いかな…」

これがあなたの事前確率です。

  • 仮説 \(H\):ボブは「怪物」である
    • \(P(H) = 0.4\) (40%の確率で怪物だと信じている)
  • 仮説 \(\neg H\):ボブは「凡才」である
    • \(P(\neg H) = 0.6\) (60%の確率で凡才だと思っている)

2. 「尤度」の設定(タイプの定義)

次に、それぞれのタイプがどれくらい打つかという定義をします。

  • もし「怪物」なら:ホームラン率は 10% (\(0.1\)) あるはずだ。
  • もし「凡才」なら:ホームラン率は 2% (\(0.02\)) くらいしかないだろう(まぐれ当たりはある)。

3. 「データ」の発生(開幕戦)

開幕戦、ボブの第1打席。

なんとボブは、バックスクリーンへ特大のホームランを放ちました!

これが新しい情報、データ \(D\) です。

さて、この一発を見て、あなたの「ボブは怪物だ」という信頼度(確率)は、40%から何%に跳ね上がるでしょうか?


3.更新の計算プロセス

数式に当てはめて計算していきましょう。

求めたいのは \(P(\text{怪物}|\text{HR})\) 、つまり「HRを見た後の、怪物である確率」です。

$$P(\text{怪物}|\text{HR}) = \frac{P(\text{HR}|\text{怪物}) \times P(\text{怪物})}{P(\text{HR})}$$

手順①:分子を計算する

「怪物である確率」と「怪物がHRを打つ確率」を掛けます。

$$P(\text{HR}|\text{怪物}) \times P(\text{怪物}) = 0.1 \times 0.4 = 0.04$$

手順②:分母(周辺確率)を計算する

ここが重要です。分母の \(P(\text{HR})\) は、「ボブが怪物でHRを打つ場合」と「ボブが凡才だけどまぐれでHRを打つ場合」の合計です。

  • 怪物でHR:\(0.1 \times 0.4 = 0.04\)
  • 凡才でHR:\(0.02 \times 0.6 = 0.012\)

$$P(\text{HR}) = 0.04 + 0.012 = 0.052$$

(つまり、どんな選手であれ、この打席でHRが出る確率は全体で5.2%だったということです)

手順③:割り算して更新完了(事後確率)

$$P(\text{怪物}|\text{HR}) = \frac{0.04}{0.052} \approx 0.769$$

結果:約 77%

なんと!開幕前は「40%くらいかな…」と疑っていた評価が、たった一発のホームランを見ただけで「77%の確率で本物だ!」という確信に変わりました。

これがベイズの定理による「情報の更新」です。


4.ベイズの真骨頂「連続的な更新」

ベイズの定理が真にパワフルなのは、ここからです。

この計算は1回で終わりではありません。

「事後確率」は、次の打席の「事前確率」になります。

もし、ボブが次の打席でもホームランを打ったらどうなるでしょうか?

  1. 新しい事前確率 \(P(H)\): さきほど計算した 0.769 (77%) を使います。
    • 当然、凡才である確率 \(P(\neg H)\) は \(1 – 0.769 = 0.231\) に減っています。
  2. 計算(2打席連続HR):
    • 分子(怪物):\(0.1 \times 0.769 = 0.0769\)
    • 凡才の項:\(0.02 \times 0.231 = 0.00462\)
    • 分母(合計):\(0.0769 + 0.00462 = 0.08152\)
    • 事後確率:\(0.0769 \div 0.08152 \approx \mathbf{0.943}\)

結果:94%

2打席連続ホームランを見た時点で、あなたは「こいつは94%以上の確率で本物の怪物だ。間違いない」とほぼ確信することになります。

逆に、もし凡退が続けば、この確率はジリジリと下がっていき、やがて「やっぱりダメだったか」という結論(更新)に至ります。


5.なぜ「条件付き確率」だけでは不十分なのか?

ここで一つの疑問が浮かびます。

「難しい計算をしなくても、ホームランを打ったんだから、凄い選手に決まってるじゃないか」と。

しかし、ベイズの定理は「偽陽性(ぎようせい)」の罠を防ぐために非常に重要なのです。

もし、ボブのホームランが「風に乗ったラッキーなホームラン」だったとしても、単純な結果だけを見れば「ホームラン」です。

しかし、ベイズの定理には「事前確率(前評判)」という重りがあります。

例えば、もしボブではなく、全く打撃に期待されていない「守備専門の投手(怪物である確率がほぼ0%)」がホームランを打ったとしたらどうでしょう?

事前確率 \(P(H)\) が極端に低いため(例:0.001)、たとえホームランを打っても、事後確率はそれほど上がりません。

「すごい!……でも、まあマグレだろうな(次は打てないだろう)」と、私たちは直感的に判断します。

ベイズの定理は、この「目の前の結果に飛びつかず、過去の経験(事前確率)とバランスを取って判断する」という人間の冷静な思考プロセスを、数学的に正しく記述しているのです。


6.現代野球とAIへの応用

このベイズ的な思考は、現代の野球戦略(セイバーメトリクス)やAI技術の中核をなしています。

1. 守備シフトの変更

打者が打席に入った瞬間、野手はこれまでのデータ(事前確率)に基づいて守備位置を決めます。しかし、その日のスイングやファウルチップの飛び方(新しいデータ)を見て、「今日は少し振り遅れているな」と判断し、守備位置を逆方向へ微修正(事後確率への更新)します。

2. 配球の読み合い

キャッチャーは「このバッターはストレートに強い(事前確率)」を持っています。しかし、初球のストレートを見逃した(データ)瞬間、「あれ?今日はストレートを狙っていないのか?それとも反応できていないのか?」と確率を更新し、2球目のサインを決めます。

3. AIによる勝敗予測

テレビ中継で見る「現在の勝率」もベイズ更新の塊です。

「1回裏、0-0」という事前確率からスタートし、「ヒットが出た」「アウトになった」というデータが入るたびに、リアルタイムで勝率(事後確率)を計算し続けています。


不確実な未来を見通すレンズ

野球において、10割打つバッターはいませんし、絶対に勝てる作戦もありません。私たちは常に「不確実性」の中にいます。

しかし、わからないからと言って運任せにするのではなく、

「今持っている知識(事前確率)」と「新しく得た事実(データ)」を組み合わせることで、少しでも真実に近い確率(事後確率)を手繰り寄せること。

それがベイズの定理の本質です。

あなたが次に野球中継を見るとき、新人がヒットを打って解説者が「お、この選手はレギュラー定着するかもしれませんね!」と言ったら、心の中でこう呟いてみてください。

「なるほど、解説者の頭の中でベイズ更新が行われたな」と。

そうすれば、野球というゲームが、単なる球遊びではなく、壮大な確率の収束実験に見えてくるはずです。