幾何分布とは

ベルヌーイ分布、二項分布、ポアソン分布と続いて、次は幾何分布(Geometric Distribution)です。

これまでの分布が「決められた回数の中で、何回成功するか」を考えていたのに対し、幾何分布は視点が逆転します。「成功するまで、何回失敗し続けるか(何回試行が必要か)」を考える分布です。


📉 幾何分布とは?

幾何分布は、成功確率 \(p\) のベルヌーイ試行を繰り返したとき、「初めて成功するまでに、何回の試行が必要か」を表す確率分布です。

「3回目でやっと成功した」「1回目でいきなり成功した」「10回やってもまだ成功しない」といった状況の確率を計算します。

📌 幾何分布が適用される条件

基本はベルヌーイ試行と同じですが、「終わりの条件」が異なります。

  1. 結果が2通り(成功か失敗か)
  2. 各試行が独立(前の失敗は次の確率に影響しない)
  3. 成功確率 (\(p\)) が一定
  4. 「初めて成功した時点」で終了する(試行回数 \(n\) は決まっていない)

🧢 野球の例: スランプのバッターがヒットを打つまで

今回は、「打率 .300 (\(p=0.3\)) のバッターが、何打席目で初ヒットを打つか」を考えます。

  • 試行 (\(X\)): 初めてヒットが出るまでの打席数。\(X = 1, 2, 3, \dots\)
  • 知りたいこと: 「ちょうど3打席目で初ヒットが出る確率は?」

3. 幾何分布の確率質量関数 (PMF)

「\(k\) 回目で初めて成功する」ということは、論理的に分解するとこうなります。

「\(k-1\) 回連続で失敗し、最後の \(k\) 回目で成功する」

これを数式にすると非常にシンプルです。

$$P(X=k) = (1-p)^{k-1} p$$

  • \((1-p)^{k-1}\): \(k-1\) 回分の「失敗」の確率(失敗確率を \(k-1\) 回かける)。
  • \(p\): 最後の1回の「成功」の確率。

⚾ 野球の例での計算 (\(p=0.3\))

① 1打席目でヒットが出る確率 (\(k=1\))

失敗は0回なので、いきなり成功確率そのままです。

$$P(X=1) = 0.3$$

(これが最も確率が高いです)

② 3打席目でようやくヒットが出る確率 (\(k=3\))

流れ:アウト(\(0.7\)) \(\to\) アウト(\(0.7\)) \(\to\) ヒット(\(0.3\))

$$P(X=3) = (0.7)^{3-1} \times 0.3$$

$$P(X=3) = 0.7 \times 0.7 \times 0.3 = 0.49 \times 0.3 = 0.147$$

約 14.7% です。


📐 幾何分布の平均(期待値)

幾何分布の平均(期待値)は、成功確率 \(p\) の逆数になります。

$$E[X] = \frac{1}{p}$$

📌 回数は確率の逆数。

「確率」の逆数が「回数」になります。

  • サイコロで「1」が出る確率 (\(p=1/6\))

\(\rightarrow\) 平均して 6回 (\(6/1\)) 振れば1回出る。

  • コインで表が出る確率 (\(p=1/2\))

\(\rightarrow\) 平均して 2回 (\(2/1\)) 投げれば1回出る。

⚾ 野球の例での解釈

打率 .300 (\(p=0.3\)) の場合:

$$E[X] = \frac{1}{0.3} \approx 3.33$$

「打率3割のバッターなら、平均して 3.33打席 立てば1本はヒットが出るだろう」ということです。


📉 幾何分布の分散

幾何分布の分散は以下の式で表されます。

$$V[X] = \frac{1-p}{p^2}$$

📌 成功確率 が小さいほど、分散(ばらつき)が爆発的に大きくなる

分母に \(p^2\) があることに注目してください。これは「成功確率 \(p\) が小さければ小さいほど、分散(ばらつき)が爆発的に大きくなる」ことを意味しています。

例1:簡単なこと (\(p=0.8\)) をやる場合

80%成功することなら、だいたい1回か2回で成功します。100回やっても成功しない」なんてことはまず起きません。だからばらつきは小さいです。

例2:超難しいこと (\(p=0.01\)) をやる場合

確率は1%。平均的には100回 (\(1/p\)) で成功するはずです。しかし、「運良く1回目で成功する」こともあれば、「運が悪くて500回ハマる」こともザラにあります。

成功確率が低いと、「いつ終わるか全く読めない」ため、ばらつきが非常に大きくなるのです。


まとめ:4つの分布の関係図

これで主要な4つの離散確率分布が出揃いました。

分布名問いかけのタイプパラメータ野球の例
ベルヌーイ分布1回勝負の結果は?\(p\)この1球、打てるか?
二項分布固定回数での成功数は?\(n, p\)今日の5打席、何本ヒットか?
幾何分布成功するまで何回かかる?\(p\)何打席目で初ヒットが出るか?
ポアソン分布レアな事象の個数は?\(\lambda\)今日の試合、何本ホームランか?

幾何分布は、「成功というゴールにたどり着くまでの『道のりの長さ』の確率」と覚えると理解しやすいです。