連続型確率変数

「連続型」とはどういうことか?

「離散型」の塁打数は「1塁打」の次が「2塁打」で、その間の「1.5塁打」はありませんでした。

しかし、ピッチャーが投げる「球速」はどうでしょうか?

「150km/h」と表示されていても、精密に測れば:

  • 150.1 km/h かもしれない
  • 150.0035 km/h かもしれない
  • 149.99999… km/h かもしれない

このように、いくらでも細かく(無限に)刻むことができる値を扱うのが「連続型確率変数」です。

アナログ時計の針の動きや、打球の飛距離(メートル)などがこれに当たります。

衝撃の事実:「ピッタリ」の確率はゼロ!?

ここが連続型確率変数の最大の落とし穴であり、最も重要なポイントです。

離散型では「ホームラン(4塁打)の確率は4%」と言えましたが、連続型ではこれが通用しません。

Q. ピッチャーが「ちょうど 150.000…00 km/h」を投げる確率は?

A. 数学的には「0(ゼロ)」です。

「えっ、投げてるじゃん!」と思うかもしれません。しかし、無限に細かい世界の話なので、「150.0000001」でも「150」とは認められません。

無限にある数値の中から、ピンポイントで一点を狙い撃つ確率は、限りなくゼロに近いのです。

「点」ではなく「幅(面積)」で考える

では、どうやって確率を表せばいいのでしょうか?

一点(点)がダメなら、範囲(幅)で考えればいいのです。

  • × 「ちょうど150km/hが出る確率」
  • ○ 「149.5km/h から 150.5km/h の間が出る確率」

連続型確率変数では、「ある区間に入る確率」を計算します。これをグラフでイメージすることが非常に大切です。

4. グラフの主役:確率密度関数(PDF)

離散型では「棒グラフ」を使いましたが、連続型では「滑らかな曲線(山の形)」を使います。

この曲線を確率密度関数(かくりつみつどかんすう、PDF)と呼びます。

野球でのイメージ:球速の分布

あるピッチャーの球速分布をグラフにしてみましょう。

  • 横軸 (\(x\)): 球速 (km/h)
  • 縦軸 (\(f(x)\)): 確率の密度(確率そのものではない!)

平均球速が145km/hのピッチャーなら、145のあたりが一番盛り上がっている「山」の形になります。

確率の求め方=「面積」を塗る

「150km/h以上のボールが来る確率」を知りたければ、グラフの 「150以上の部分の面積」 を塗りつぶします。その面積こそが確率です。

  • 山の高さ (\(f(x)\)): そこにデータが密集している度合い(密度)。
  • 塗られた面積: 確率

数学(積分)の記号を使うとこうなります。

$$P(a \le X \le b) = \int_{a}^{b} f(x) \, dx$$

(難しければ、「グラフの \(a\) から \(b\) までの面積を計算する」という意味だと捉えてください)

離散型と連続型の比較まとめ

この2つの違いを整理すると、統計学の視界が一気にクリアになります。

項目離散型 (Discrete)連続型 (Continuous)
野球の例塁打数、得点、背番号球速、飛距離、防御率
値の性質トビトビ (1, 2, 3…)連続的 (1.234…)
確率の考え方その値になる確率

\(P(X=x)\)
その範囲に入る確率

\(P(a \le X \le b)\)
グラフの形棒グラフ滑らかな曲線
関数の名前確率質量関数 (PMF)確率密度関数 (PDF)
全確率の和単純な足し算 (\(\sum\))面積の計算(積分 \(\int\))

まとめ

  • 連続型確率変数: 球速や飛距離のように、無限に細かい値をとりうる変数。
  • 一点の確率はゼロ: 「ちょうど〇〇」の確率は0になるため、「〇〇から〇〇の間」という範囲(面積)で確率を考える。
  • 確率密度関数: 確率の「濃さ」を表す曲線のこと。この曲線の下側の面積が確率(合計100%=1)になる。