「連続型」とはどういうことか?
「離散型」の塁打数は「1塁打」の次が「2塁打」で、その間の「1.5塁打」はありませんでした。
しかし、ピッチャーが投げる「球速」はどうでしょうか?
「150km/h」と表示されていても、精密に測れば:
- 150.1 km/h かもしれない
- 150.0035 km/h かもしれない
- 149.99999… km/h かもしれない
このように、いくらでも細かく(無限に)刻むことができる値を扱うのが「連続型確率変数」です。
アナログ時計の針の動きや、打球の飛距離(メートル)などがこれに当たります。
衝撃の事実:「ピッタリ」の確率はゼロ!?
ここが連続型確率変数の最大の落とし穴であり、最も重要なポイントです。
離散型では「ホームラン(4塁打)の確率は4%」と言えましたが、連続型ではこれが通用しません。
Q. ピッチャーが「ちょうど 150.000…00 km/h」を投げる確率は?
A. 数学的には「0(ゼロ)」です。
「えっ、投げてるじゃん!」と思うかもしれません。しかし、無限に細かい世界の話なので、「150.0000001」でも「150」とは認められません。
無限にある数値の中から、ピンポイントで一点を狙い撃つ確率は、限りなくゼロに近いのです。
「点」ではなく「幅(面積)」で考える
では、どうやって確率を表せばいいのでしょうか?
一点(点)がダメなら、範囲(幅)で考えればいいのです。
- × 「ちょうど150km/hが出る確率」
- ○ 「149.5km/h から 150.5km/h の間が出る確率」
連続型確率変数では、「ある区間に入る確率」を計算します。これをグラフでイメージすることが非常に大切です。
4. グラフの主役:確率密度関数(PDF)
離散型では「棒グラフ」を使いましたが、連続型では「滑らかな曲線(山の形)」を使います。
この曲線を確率密度関数(かくりつみつどかんすう、PDF)と呼びます。
野球でのイメージ:球速の分布
あるピッチャーの球速分布をグラフにしてみましょう。
- 横軸 (\(x\)): 球速 (km/h)
- 縦軸 (\(f(x)\)): 確率の密度(確率そのものではない!)
平均球速が145km/hのピッチャーなら、145のあたりが一番盛り上がっている「山」の形になります。
確率の求め方=「面積」を塗る
「150km/h以上のボールが来る確率」を知りたければ、グラフの 「150以上の部分の面積」 を塗りつぶします。その面積こそが確率です。

- 山の高さ (\(f(x)\)): そこにデータが密集している度合い(密度)。
- 塗られた面積: 確率。
数学(積分)の記号を使うとこうなります。
$$P(a \le X \le b) = \int_{a}^{b} f(x) \, dx$$
(難しければ、「グラフの \(a\) から \(b\) までの面積を計算する」という意味だと捉えてください)
離散型と連続型の比較まとめ
この2つの違いを整理すると、統計学の視界が一気にクリアになります。
| 項目 | 離散型 (Discrete) | 連続型 (Continuous) |
| 野球の例 | 塁打数、得点、背番号 | 球速、飛距離、防御率 |
| 値の性質 | トビトビ (1, 2, 3…) | 連続的 (1.234…) |
| 確率の考え方 | その値になる確率 \(P(X=x)\) | その範囲に入る確率 \(P(a \le X \le b)\) |
| グラフの形 | 棒グラフ | 滑らかな曲線 |
| 関数の名前 | 確率質量関数 (PMF) | 確率密度関数 (PDF) |
| 全確率の和 | 単純な足し算 (\(\sum\)) | 面積の計算(積分 \(\int\)) |
まとめ
- 連続型確率変数: 球速や飛距離のように、無限に細かい値をとりうる変数。
- 一点の確率はゼロ: 「ちょうど〇〇」の確率は0になるため、「〇〇から〇〇の間」という範囲(面積)で確率を考える。
- 確率密度関数: 確率の「濃さ」を表す曲線のこと。この曲線の下側の面積が確率(合計100%=1)になる。