十の並列した脳

何でも勉強する，毎週月木曜に投稿予定

確率・統計の勉強 #5 離散確率分布の関係

統計学問題演習を通して理解する基礎統計勉強会まとめ

藤田岳彦「弱点克服大学生の確率・統計」：

弱点克服大学生の確率・統計

弱点克服大学生の確率・統計

作者: 藤田岳彦
出版社/メーカー: 東京図書
発売日: 2010/04/09
メディア: 単行本
購入: 6人クリック: 9回
この商品を含むブログを見る

前回↓

ryosuke-okubo.hatenablog.com

今回説明する離散確率分布は以下のものである。

ベルヌーイ分布
2項分布
幾何分布
負の2項分布
ポアソン分布
超幾何分布

それぞれが独特の数式で表されるが，実際には相互関係の深いものが多い。離散確率分布の相互関係を理解することで，個々の確率分布の特質が浮き彫りになると思う。

以下の例を派生させながら説明をしていく。

例題

袋に白球と黒球がいくつか入っている。ここから1つ球を出したとき，それが白球であるか黒球であるかの確率について考える。

2項分布をつくるまで
2項分布と負の2項分布との関係
2項分布の先へ
- 2項分布→ポアソン分布
まとめ

2項分布をつくるまで

ベルヌーイ分布→2項分布

ベルヌーイ分布の例

1つ球を出したとき，それが白球であれば1，黒球であれば0とする確率分布

片方の事象が確率 $p$ で起き，もう片方の事象が確率 $1-p$ で起きる離散確率分布をベルヌーイ分布という。ここでは，白球を引く確率が $p$ ，黒球を引く確率が $1-p$ となる。数式で表すと，

$P(X=1)=p$ ， $P(X=0)=1-p$

となる。期待値と分散は

$E(X)=p$ ， $V(X)=p(1-p)$

である。

ここで，例にある試行をn回繰り返す試行について考える。

1つ球を出したとき，それが白球であれば1，黒球であれば0とする。そして球を袋に戻す。これを1回として，n回繰り返した時の確率分布。

i回目の試行における確率変数を $X_i$ とすると，この試行は

$X=X_1+X_2+...+X_i$

と表せる。例えば，3回繰り返して1回目は白，2回目は黒，3回目は白とすると， $X$ は2であり，その確率は $p^2(1-p)$ となる。しかし $X=2$ となる例は他にもある。1回目は白，2回目は白，3回目は黒でもいい。実際， $X=2$ は3回中2回白であることを意味している。 $X=2$ となる組み合わせは，順序は無関係なので $\binom{3}{2}=6$ 通りある。よって，

$P(X=2)=\binom{3}{2} p^2(1-p)$

となる。少々回りくどくなってしまったが，これが2項分布の例である。上の試行を言い換えると次のように表せる。

2項分布の例

1つ球を出して袋に戻すことをn回繰り返した時の，白球の個数kがしたがう確率分布。

$X=k$ という事象がおこる確率，期待値，分散は以下の通り。

$P(X=k) =\binom{n}{k} p^n(1-p)^{n-k}$

$E(X)=np$ ， $V(X)=np(1-p)$

超幾何分布→2項分布

超幾何分布の例

袋にN個の球が入っており，そのうち白球はm個，黒球はN-m個ある。ここからn個出したときの白球の個数kがしたがう確率分布。

$X=k$ という事象がおこる確率は

$P(X=k)=\frac{\binom{m}{k}\binom{N-m}{n-k}}{\binom{N}{n}}$

この試行を言い換えると，

袋にN個の球が入っており，そのうち白球はm個，黒球はN-m個ある。ここから1個出して戻さない，というのをn回行ったとき，白球の個数kがしたがう確率分布。

超幾何分布の特徴は，非復元抽出であるために1回ごとの試行が従属である点にある。

これを

袋にN個の球が入っており，そのうち白球はm個，黒球はN-m個ある。ここから1個出して戻す，というのをn回行ったとき，白球の個数kがしたがう確率分布。

とすると，復元抽出であるために1回ごとの試行が独立となる。つまり $p=\frac{m}{N}$ とした2項分布となる。

なお，復元抽出に変える以外に， $N$ を十分大きく取ることで2項分布に近似することができる。詳細は以下の記事を参考にしてほしい。

https://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/tyoukika/tyoukikadis.htm

幾何分布→負の2項分布

今度は黒球がでた回数にも着目してみよう。

幾何分布の例

1つ球を出して袋に戻すことを白球が1個出るまで繰り返す。それまでに出た黒球の個数kがしたがう確率分布。

最初の成功が何回目であるかを考えるときに，幾何分布は汎用される。ここで事象 $X=k$ とは，k回黒球を出した後に白球を出すということなので，その確率は

$P(X=k) = p(1-p)^k$

となる。なお，期待値と分散は以下の通りである。

$E(X)=\frac{1-p}{p}$ ， $V(X)=\frac{1-p}{p^2}$

ではこれを拡張してみよう。

1つ球を出して袋に戻すことを白球がn個出るまで繰り返す。それまでに出た黒球の個数kがしたがう確率分布。

この場合の事象 $X=k$ とは，白球をn-1個，黒球をk個出した後に白球を出すということなので，その確率は

${\displaystyle P(X=k) = \binom{n-1+k}{k}p^{n-1}(1-p)^{k}p}$

となる。これは負の2項分布の例である。負の2項分布においては，nが負の数であっても定義できる。期待値と分散は以下の通り。

$E(X)=\frac{n(1-p)}{p}$ ， $V(X)=\frac{n(1-p)}{p^2}$

2項分布と負の2項分布との関係

あらためて例を並べてみる。

2項分布

1つ球を出して袋に戻すことをn回繰り返した時の，白球の個数kがしたがう確率分布。

負の2項分布

1つ球を出して袋に戻すことを白球がn個出るまで繰り返す。それまでに出た黒球の個数kがしたがう確率分布。

ざっくりまとめると

2項分布：繰り返す回数を固定，白球の個数が確率変数

負の2項分布：白球の個数を固定，黒球の数つまり繰り返す回数が確率変数

といった感じで，両者は裏表の関係にある。

細かい内容はこちらのサイトを参考にしてほしい。

負の二項分布（Negative Binomial Distribution）について学ぶ - 物理の研究の備忘録

2項分布の先へ

2項分布→ポアソン分布

ポアソン分布は，試行内容は2項分布と同じである。異なるのは白球の出る確率である。

ただし白球が出る確率は $\frac{\lambda}{n}$ と非常に小さい。

このとき， $X=k$ という事象がおこる確率は $\lambda \gt 0$ を用いて

$P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!}$

となる。期待値，分散については，

$E(X)=\lambda$ ， $V(X)=\lambda$

と一致するのがポイントである。

2項分布からポアソン分布を導出する過程については，ポアソンの極限定理を調べてほしい。

例：

ポアソンの極限定理 | 永田晴久

まとめ

全体の流れをまとめたのが下図である。

f:id:ryosuke_okubo:20190207111043p:plain

参考：

www.biwako.shiga-u.ac.jp

次回↓

作成中