十の並列した脳

何でも勉強する,毎週月木曜に投稿予定

確率・統計の勉強 #5 離散確率分布の関係

藤田 岳彦「弱点克服大学生の確率・統計」:

 

弱点克服大学生の確率・統計

弱点克服大学生の確率・統計

 

 前回↓

 

ryosuke-okubo.hatenablog.com

 

 

今回説明する離散確率分布は以下のものである。

  • ベルヌーイ分布
  • 2項分布
  • 幾何分布
  • 負の2項分布
  • ポアソン分布
  • 超幾何分布

それぞれが独特の数式で表されるが,実際には相互関係の深いものが多い。離散確率分布の相互関係を理解することで,個々の確率分布の特質が浮き彫りになると思う。

 

以下の例を派生させながら説明をしていく。

例題

袋に白球と黒球がいくつか入っている。ここから1つ球を出したとき,それが白球であるか黒球であるかの確率について考える。  

 

 

2項分布をつくるまで

ベルヌーイ分布→2項分布

ベルヌーイ分布の例

1つ球を出したとき,それが白球であれば1,黒球であれば0とする確率分布

片方の事象が確率pで起き, もう片方の事象が確率1-pで起きる離散確率分布をベルヌーイ分布という。ここでは,白球を引く確率がp,黒球を引く確率が1-pとなる。数式で表すと,

P(X=1)=pP(X=0)=1-p

となる。期待値と分散は

E(X)=pV(X)=p(1-p)

である。

 

ここで,例にある試行をn回繰り返す試行について考える。

1つ球を出したとき,それが白球であれば1,黒球であれば0とする。そして球を袋に戻す。これを1回として,n回繰り返した時の確率分布。

 i回目の試行における確率変数をX_iとすると,この試行は

X=X_1+X_2+...+X_i

と表せる。例えば,3回繰り返して1回目は白,2回目は黒,3回目は白とすると,Xは2であり,その確率はp^2(1-p)となる。しかしX=2となる例は他にもある。1回目は白,2回目は白,3回目は黒でもいい。実際,X=2は3回中2回白であることを意味している。X=2となる組み合わせは,順序は無関係なので{\displaystyle \binom{3}{2}=6}通りある。よって,

{\displaystyle P(X=2)=\binom{3}{2} p^2(1-p)}

となる。少々回りくどくなってしまったが,これが2項分布の例である。上の試行を言い換えると次のように表せる。

2項分布の例

1つ球を出して袋に戻すことをn回繰り返した時の,白球の個数kがしたがう確率分布。 

 X=kという事象がおこる確率,期待値,分散は以下の通り。

{\displaystyle P(X=k) =\binom{n}{k} p^n(1-p)^{n-k}}

E(X)=npV(X)=np(1-p)

 

超幾何分布→2項分布

超幾何分布の例

袋にN個の球が入っており,そのうち白球はm個,黒球はN-m個ある。ここからn個出したときの白球の個数kがしたがう確率分布。

X=kという事象がおこる確率は

{\displaystyle P(X=k)=\frac{\binom{m}{k}\binom{N-m}{n-k}}{\binom{N}{n}}}

 

この試行を言い換えると,

 袋にN個の球が入っており,そのうち白球はm個,黒球はN-m個ある。ここから1個出して戻さない,というのをn回行ったとき,白球の個数kがしたがう確率分布。

超幾何分布の特徴は,非復元抽出であるために1回ごとの試行が従属である点にある。

これを 

 袋にN個の球が入っており,そのうち白球はm個,黒球はN-m個ある。ここから1個出して戻す,というのをn回行ったとき,白球の個数kがしたがう確率分布。

とすると,復元抽出であるために1回ごとの試行が独立となる。つまり{\displaystyle p=\frac{m}{N}}とした2項分布となる。

なお,復元抽出に変える以外に,Nを十分大きく取ることで2項分布に近似することができる。 詳細は以下の記事を参考にしてほしい。

https://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/tyoukika/tyoukikadis.htm

 

幾何分布→負の2項分布

今度は黒球がでた回数にも着目してみよう。

幾何分布の例

1つ球を出して袋に戻すことを白球が1個出るまで繰り返す。それまでに出た黒球の個数kがしたがう確率分布。 

 最初の成功が何回目であるかを考えるときに,幾何分布は汎用される。ここで事象X=kとは,k回黒球を出した後に白球を出すということなので,その確率は

 P(X=k) = p(1-p)^k

となる。なお,期待値と分散は以下の通りである。

{\displaystyle E(X)=\frac{1-p}{p}}{\displaystyle V(X)=\frac{1-p}{p^2}}

 

ではこれを拡張してみよう。 

1つ球を出して袋に戻すことを白球がn個出るまで繰り返す。それまでに出た黒球の個数kがしたがう確率分布。 

この場合の事象X=kとは,白球をn-1個,黒球をk個出した後に白球を出すということなので,その確率は

{\displaystyle  P(X=k) = \binom{n-1+k}{k}p^{n-1}(1-p)^{k}p}

 となる。これは負の2項分布の例である。負の2項分布においては,nが負の数であっても定義できる。期待値と分散は以下の通り。

{\displaystyle E(X)=\frac{n(1-p)}{p}}{\displaystyle V(X)=\frac{n(1-p)}{p^2}}

 

2項分布と負の2項分布との関係

あらためて例を並べてみる。

2項分布

1つ球を出して袋に戻すことをn回繰り返した時の,白球の個数kがしたがう確率分布。

 

負の2項分布

1つ球を出して袋に戻すことを白球がn個出るまで繰り返す。それまでに出た黒球の個数kがしたがう確率分布。 

 

ざっくりまとめると

2項分布:繰り返す回数を固定,白球の個数が確率変数

負の2項分布:白球の個数を固定,黒球の数つまり繰り返す回数が確率変数

といった感じで,両者は裏表の関係にある。

 

細かい内容はこちらのサイトを参考にしてほしい。

負の二項分布(Negative Binomial Distribution)について学ぶ - 物理の研究の備忘録

 

2項分布の先へ

2項分布→ポアソン分布

ポアソン分布は,試行内容は2項分布と同じである。異なるのは白球の出る確率である。

ただし白球が出る確率は{\displaystyle \frac{\lambda}{n}}と非常に小さい。

 このとき,X=kという事象がおこる確率は\lambda \gt 0を用いて

{\displaystyle P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!}}

となる。期待値,分散については,

E(X)=\lambdaV(X)=\lambda

と一致するのがポイントである。

 

2項分布からポアソン分布を導出する過程については,ポアソンの極限定理を調べてほしい。

例:

ポアソンの極限定理 | 永田 晴久

 

まとめ

全体の流れをまとめたのが下図である。

f:id:ryosuke_okubo:20190207111043p:plain

 

参考:

www.biwako.shiga-u.ac.jp

 

次回↓

作成中