ポアソン分布は、二項分布の「特殊な極限(究極形)」として位置づけられる分布です。
一言で言うと、「滅多に起こらないけれど、長い目で見れば一定の頻度で起こるレアな事象」の回数を予測するのに使われます。
🐟 ポアソン分布とは?
ポアソン分布は、「ある決まった期間(または面積・空間)の中で、平均して \(\lambda\) 回起こる事象が、実際に k 回起こる確率」を表す確率分布です。
二項分布では「試行回数 n」と「確率 p」が必要でしたが、ポアソン分布で必要なのは「平均回数 \(\lambda\)(ラムダ)」ただ一つです。
📌 ポアソン分布が使われる典型例
- 1時間にコールセンターにかかってくる電話の件数
- 1冊の本の中にある誤植(タイプミス)の数
- ある交差点で1年間に起きる交通事故の件数
- (野球で言えば)1試合に出るホームランの数
🔄 二項分布との関係
ポアソン分布は、二項分布のパラメータを以下のように極端にしたものです。
- 試行回数 (n) がものすごく多い (\(n \to \infty\))
- 成功確率 (p) がものすごく低い (\(p \to 0\))
- でも、平均回数 (\(np = \lambda\)) は一定
例えば、「1秒ごとに(膨大な回数)、超低確率で電話が鳴るかどうか」を判定していると考えると、それは二項分布からポアソン分布へと近づいていきます。
⚾ 野球の例: チームの「1試合のホームラン数」
二項分布では「5打席」という少ない回数でしたが、ポアソン分布を考えるために、視点を少し変えます。
ある野球チームは、過去のデータから「1試合あたり平均 1.2 本のホームランを打つ」ことがわかっています。
このチームが、「今日の試合でちょうど 3本 ホームランを打つ確率」はどれくらいでしょうか?
ここでは、「何回打席に立つか (n)」や「1打席ごとのホームラン率 (p)」は気にしません。「平均 (\(\lambda\))」だけを使います。
- パラメータの設定
- 平均発生率 (\(\lambda\)): 1.2 (1試合あたりの平均ホームラン数)
- ターゲット回数 (k): 3 (知りたい回数)
3. ポアソン分布の確率質量関数 (PMF)
平均発生率 \(\lambda\) の事象が、ちょうど k 回起こる確率は以下の式で表されます。ネイピア数 \(e (自然対数の底 \approx 2.718)\)が登場するのが特徴です。
$$P(X=k) = \frac{e^{-\lambda} \lambda^k}{k!}$$
- \(e\): ネイピア数(約 2.718)
- \(\lambda\): 平均回数
- k: 起こる回数(0, 1, 2…)
- \(k!\): k の階乗
⚾ 野球の例での計算 (\(k=3, \lambda=1.2\))
$$P(X=3) = \frac{e^{-1.2} \times (1.2)^3}{3!}$$
- 分子: \(e^{-1.2} \approx 0.301、1.2^3 = 1.728\rightarrow 0.301 \times 1.728 \approx 0.520\)
- 分母: \(3! = 3 \times 2 \times 1 = 6\)
- 計算: \(0.520 \div 6 \approx 0.0867\)
つまり、平均1.2本のチームが、ある試合で「ちょうど3本」打つ確率は約 8.7% ということになります。
📐 ポアソン分布の平均と分散
ポアソン分布の最も美しく、不思議な性質は、「平均と分散が等しい」ということです。
$$E[X] = \lambda$$
$$V[X] = \lambda$$
📌 ポアソン分布の平均と分散がなぜ等しくなるのか?
二項分布の分散は \(V[X] = np(1-p)\) でした。
ポアソン分布は、確率 p が限りなく 0 に近い状態(超レア)を想定しています。
- p がほぼ 0 となるので、(1-p) はほぼ 1 になります。
- 分散の式は \(np \times 1\) に近づきます。
- np は平均 \(\lambda\) になるので、分散 \(\approx \lambda\) となります。
ベルヌーイ分布、二項分布、ポアソン分布の関係性
ベルヌーイ分布、二項分布、ポアソン分布の違いをまとめてみました。
| 分布名 | どんなときに使う? | パラメータ | 野球の例 |
| ベルヌーイ分布 | 1回の試行の結果 | p (確率) | 1打席でヒットが出るか? |
| 二項分布 | n回繰り返した時の合計 | n (回数), p (確率) | 5打席中、何回ヒットが出るか? |
| ポアソン分布 | レアな事象が起きる回数 | \(\lambda\) (平均回数) | 1試合で何本ホームランが出るか? |
二項分布の n を無限大に、 p を極小にしたものがポアソン分布です。「回数とか確率はよくわからないけど、平均するとこれくらい起きる」という現象には、ポアソン分布を使います