確率・統計の勉強 #5 離散確率分布の関係
藤田 岳彦「弱点克服大学生の確率・統計」:
前回↓
今回説明する離散確率分布は以下のものである。
- ベルヌーイ分布
- 2項分布
- 幾何分布
- 負の2項分布
- ポアソン分布
- 超幾何分布
それぞれが独特の数式で表されるが,実際には相互関係の深いものが多い。離散確率分布の相互関係を理解することで,個々の確率分布の特質が浮き彫りになると思う。
以下の例を派生させながら説明をしていく。
例題
袋に白球と黒球がいくつか入っている。ここから1つ球を出したとき,それが白球であるか黒球であるかの確率について考える。
2項分布をつくるまで
ベルヌーイ分布→2項分布
ベルヌーイ分布の例
1つ球を出したとき,それが白球であれば1,黒球であれば0とする確率分布
片方の事象が確率で起き, もう片方の事象が確率で起きる離散確率分布をベルヌーイ分布という。ここでは,白球を引く確率が,黒球を引く確率がとなる。数式で表すと,
,
となる。期待値と分散は
,
である。
ここで,例にある試行をn回繰り返す試行について考える。
1つ球を出したとき,それが白球であれば1,黒球であれば0とする。そして球を袋に戻す。これを1回として,n回繰り返した時の確率分布。
i回目の試行における確率変数をとすると,この試行は
と表せる。例えば,3回繰り返して1回目は白,2回目は黒,3回目は白とすると,は2であり,その確率はとなる。しかしとなる例は他にもある。1回目は白,2回目は白,3回目は黒でもいい。実際,は3回中2回白であることを意味している。となる組み合わせは,順序は無関係なので通りある。よって,
となる。少々回りくどくなってしまったが,これが2項分布の例である。上の試行を言い換えると次のように表せる。
2項分布の例
1つ球を出して袋に戻すことをn回繰り返した時の,白球の個数kがしたがう確率分布。
という事象がおこる確率,期待値,分散は以下の通り。
,
超幾何分布→2項分布
超幾何分布の例
袋にN個の球が入っており,そのうち白球はm個,黒球はN-m個ある。ここからn個出したときの白球の個数kがしたがう確率分布。
という事象がおこる確率は
この試行を言い換えると,
袋にN個の球が入っており,そのうち白球はm個,黒球はN-m個ある。ここから1個出して戻さない,というのをn回行ったとき,白球の個数kがしたがう確率分布。
超幾何分布の特徴は,非復元抽出であるために1回ごとの試行が従属である点にある。
これを
袋にN個の球が入っており,そのうち白球はm個,黒球はN-m個ある。ここから1個出して戻す,というのをn回行ったとき,白球の個数kがしたがう確率分布。
とすると,復元抽出であるために1回ごとの試行が独立となる。つまりとした2項分布となる。
なお,復元抽出に変える以外に,を十分大きく取ることで2項分布に近似することができる。 詳細は以下の記事を参考にしてほしい。
https://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/tyoukika/tyoukikadis.htm
幾何分布→負の2項分布
今度は黒球がでた回数にも着目してみよう。
幾何分布の例
1つ球を出して袋に戻すことを白球が1個出るまで繰り返す。それまでに出た黒球の個数kがしたがう確率分布。
最初の成功が何回目であるかを考えるときに,幾何分布は汎用される。ここで事象とは,k回黒球を出した後に白球を出すということなので,その確率は
となる。なお,期待値と分散は以下の通りである。
,
ではこれを拡張してみよう。
1つ球を出して袋に戻すことを白球がn個出るまで繰り返す。それまでに出た黒球の個数kがしたがう確率分布。
この場合の事象とは,白球をn-1個,黒球をk個出した後に白球を出すということなので,その確率は
となる。これは負の2項分布の例である。負の2項分布においては,nが負の数であっても定義できる。期待値と分散は以下の通り。
,
2項分布と負の2項分布との関係
あらためて例を並べてみる。
2項分布
1つ球を出して袋に戻すことをn回繰り返した時の,白球の個数kがしたがう確率分布。
負の2項分布
1つ球を出して袋に戻すことを白球がn個出るまで繰り返す。それまでに出た黒球の個数kがしたがう確率分布。
ざっくりまとめると
2項分布:繰り返す回数を固定,白球の個数が確率変数
負の2項分布:白球の個数を固定,黒球の数つまり繰り返す回数が確率変数
といった感じで,両者は裏表の関係にある。
細かい内容はこちらのサイトを参考にしてほしい。
負の二項分布(Negative Binomial Distribution)について学ぶ - 物理の研究の備忘録
2項分布の先へ
2項分布→ポアソン分布
ポアソン分布は,試行内容は2項分布と同じである。異なるのは白球の出る確率である。
ただし白球が出る確率はと非常に小さい。
このとき,という事象がおこる確率はを用いて
となる。期待値,分散については,
,
と一致するのがポイントである。
2項分布からポアソン分布を導出する過程については,ポアソンの極限定理を調べてほしい。
例:
まとめ
全体の流れをまとめたのが下図である。
参考:
次回↓
作成中