負の二項分布とは

これまでの流れ(ベルヌーイ、二項、幾何)を踏まえると、負の二項分布(Negative Binomial Distribution)は非常に理解しやすくなります。幾何分布が「1回成功するまで」を考えていたのに対し、負の二項分布は「\(r\)回成功するまで」と、ノルマが増えたバージョンです。別名パスカル分布とも呼ばれます。


🔁 負の二項分布とは?

負の二項分布は、成功確率 \(p\) のベルヌーイ試行を繰り返したとき、「\(r\) 回の成功をおさめるまでに、トータルで何回の試行が必要か」を表す確率分布です。

二項分布とは「固定された回数と、目的の回数」の関係がになっています。

  • 二項分布: 回数 \(n\) を固定 \(\to\)成功数 \(k\) が確率変数
  • 負の二項分布: 成功数 \(r\) を固定 \(\to\) 回数 \(n\) が確率変数

📌 負の二項分布が適用される条件

  1. 結果が2通り(成功か失敗か)
  2. 各試行が独立
  3. 成功確率 (\(p\)) が一定
  4. 「\(r\) 回成功した時点」で終了する(ゴールの成功回数が決まっている)

負の二項分布の確率質量関数 (PMF)

「\(n\) 回目でちょうど \(r\) 回目の成功をする」という状況を論理的に分解すると、以下の2つの条件が同時に起こる必要があります。

  1. 最後の \(n\) 回目は必ず「成功」である。
    (そうでなければ、もっと前に終わっているか、まだ終わっていないからです)
  1. その前の \(n-1\) 回の試行の中に、「\(r-1\) 回の成功」が含まれている。

これを式にすると、二項分布の式に似ていますが、少し形が違います。

P(X=n)=(n1r1)pr(1p)nrP(X=n) = \binom{n-1}{r-1} p^r (1-p)^{n-r}
(n1r1):1\binom{n-1}{r-1}: 最後の1回を除いた、前の部分での組み合わせ。
  • \(p^r\): 合計 \(r\) 回の成功確率。
  • \((1-p)^{n-r}\): 合計 \(n-r\) 回の失敗確率(つまり失敗回数)。

⚾ 野球の例: 「ヒットを3本打つまで帰れません」

幾何分布では「初ヒット」でしたが、今回は監督からノルマを課されたバッターを想像してください。

設定:
打率 .300 (\(p=0.3\)) のバッターが、居残り練習をしています。

監督は言いました。
「ヒットを合計 3本 (\(r=3\)) 打つまで練習を終わってはいけない」。

このバッターが、「ちょうど 5打席目 (\(n=5\)) でノルマを達成して練習を終える確率」を考えます。

  1. パラメータの設定
    • 目標成功数 (\(r\)): \(3\) (ノルマ)
    • 成功確率 (\(p\)): \(0.3\)
    • 試行回数 (\(X=n\)): 合計の打席数。これが確率変数です。

⚾ 野球の例での計算 (\(r=3, n=5, p=0.3\))

「5打席目で3本目のヒットを打って終了」する確率です。

  • 条件: 4打席目までに「2本」ヒットを打ち、5打席目に「3本目」を打つ。
P(X=5)=(5131)×(0.3)3×(0.7)53P(X=5) = \binom{5-1}{3-1} \times (0.3)^3 \times (0.7)^{5-3}
P(X=5)=(42)×0.027×0.49P(X=5) = \binom{4}{2} \times 0.027 \times 0.49
  1. 組み合わせ:
(42)=6\binom{4}{2} = 6 通り
  1. 確率部分: \(0.027 \times 0.49 = 0.01323\)
  2. 計算: \(6 \times 0.01323 = 0.07938\)

つまり、約 7.9% の確率で、5打席目でちょうど練習が終わります。


📐 負の二項分布の平均(期待値)

負の二項分布の平均は、幾何分布の平均を単純に \(r\) 倍 したものになります。(※試行回数を確率変数とした場合)

$$E[X] = \frac{r}{p}$$

📌 直感的な理解

幾何分布の平均は \(\frac{1}{p}\) でした。「1回成功するのにかかる平均回数」です。

負の二項分布は、それを「\(r\) 回」繰り返すのと同じこと(1回成功したらリセットして次を目指すイメージ)なので、足し算で \(r\) 倍になります。

⚾ 野球の例での解釈

打率 .300 (\(p=0.3\)) で、ヒット3本 (\(r=3\)) がノルマの場合:

$$E[X] = \frac{3}{0.3} = 10$$

平均して 10打席 立てば、ノルマの3本を打ち終えて家に帰れる計算になります。

(1本打つのに3.33打席 \(\times\) 3本分 = 10打席、という単純明快な理屈です)


📉 負の二項分布の分散

分散も同様に、幾何分布の分散を \(r\) 倍 したものになります。

$$V[X] = \frac{r(1-p)}{p^2}$$

📌 分散の意味

幾何分布と同じく、成功確率 \(p\) が低い(難しい)と、分母の \(p^2\) が効いてきて分散が大きくなります。

さらに、ノルマ回数 \(r\) が増えれば増えるほど、「早く終わる日」と「沼にハマって終わらない日」の差が積み重なり、結果のばらつきが大きくなります。

分布の関係図

これで、基本的な離散確率分布のつながりが見えました。

分布何を数えている?パラメータキーワード
ベルヌーイ1回の成否\(p\)1打席の結果
二項固定回数での成功数\(n, p\)5打席で何本打てる?
幾何1回成功するまでの回数\(p\)初ヒットまで何打席?
負の二項\(r\)回成功するまでの回数\(r, p\)猛打賞(3本)まで何打席?
ポアソン一定期間のレアな回数\(\lambda\)1試合のホームラン数