十の並列した脳

何でも勉強する,毎週月木曜に投稿予定

基礎統計学の勘どころ #5 確率分布の基礎

前回↓

 

ryosuke-okubo.hatenablog.com

 

 

 

世の中「必然」であることは稀であり,常に不確実性がつきまとっている。どの宝くじが当たりやすいか,ギャンブルで稼ぐことはできるのか,明日私は生きているのか...etc.そんな中で,確率論は不確実性を定量的に扱う試みといえよう。

 

 

確率とは

ひとくちに確率といっても,人によって定義がまちまちである。ここでは

  • 古典的確率
  • 経験的確率
  • 公理的確率

について説明する。

 

古典的確率

ラプラスによる定義であり,

{\displaystyle P(A)=\frac{k}{N}}

ここでP(A)は事象Aが起こる確率,Nは全ての事象の個数,kは事象Aに含まれる個数である。例えばサイコロを投げて1の目が出る確率は

 N=6(1から6の6個), k=1(1の目は1個)より{\displaystyle P(A)=\frac{1}{6}}

となる。なお,ここではどの目も等確率で出ることを前提としている。

 

経験的確率

{\displaystyle P(A)=\lim_{n \to \infty}\frac{n_A}{n}}

ここでnを投げた回数,n_Aを1の目が出た回数とする。

確率が{\displaystyle P(A)=\frac{1}{6}}であることは,6回中1回出ることを必ずしも意味しない。しかし何回も投げ続けると,だいたい6回中1回出るといえる。

 

公理的確率

コルモゴロフによる理論であり,集合論や測度論を基礎として定義される。ここでは詳細に触れないが,おおよそ

  • 確率は0から1の値をとる
  • 全事象の確率は1である
  • 互いに排反な事象について,P(A \cup B)=P(A)+P(B)が成り立つ

であることを述べている。

 

確率変数と確率分布

確率変数とは,値が確率である変数である。サイコロの例において,サイコロの目が確率変数にあたり,

{\displaystyle P(X)=\frac{1}{6}(X=1,2,3,4,5,6)}

などと表される。

 

確率分布は,確率変数に対して取りうる値を表したものである。サイコロの例を表にまとめると,

X 1 2 3 4 5 6
{\displaystyle P(X)} {\displaystyle \frac{1}{6}} {\displaystyle \frac{1}{6}} {\displaystyle \frac{1}{6}} {\displaystyle \frac{1}{6}} {\displaystyle \frac{1}{6}} {\displaystyle \frac{1}{6}}

 となる。グラフで表すと以下のようになる。

 

f:id:ryosuke_okubo:20190216140249p:plain

このように,確率変数Xが飛び飛びの値を取っている場合,離散確率変数といい,その分布を離散確率分布という。全事象の和が1であることは,次式で示される。

{\displaystyle \sum_{k=1}^nP(X_n)=1} 例:{\displaystyle \frac{1}{6}+\frac{1}{6}+...+\frac{1}{6}=1}

 

一方,身長や体重などの連続的な変数については,連続確率変数連続確率分布が考えられる。グラフで表すと以下のようになる。

f:id:ryosuke_okubo:20190216140402p:plain


 

ここで縦軸は確率密度関数 f(x)であり,確率はこの関数を定積分して得られる。要は面積である。

{\displaystyle P(a \leq X \leq b)= \int_a^b f(x) dx}

離散確率分布との関係は下図を参照。

f:id:ryosuke_okubo:20190216140252p:plain

離散確率分布,確率変数が飛び飛び

f:id:ryosuke_okubo:20190216140255p:plain

確率変数の間を詰めていく

f:id:ryosuke_okubo:20190216140301p:plain

無数に詰めていくと,連続関数に近似できる

全事象の和が1であることは,次式で示される。

{\displaystyle \int_{-\infty}^{\infty} f(x)dx=1}

 身長で例えると,2m3mと上限値を高くするにつれて全人類を含められる,ということである。

 

期待値と分散

期待値E(X)とは,確率変数の全ての値に確率の重みをつけた値であり次式で定義される(離散確率分布)。

{\displaystyle E(X)=\sum_{k=1}^n X_iP(X_n)}

例:サイコロの目

{\displaystyle 1 \times \frac{1}{6}+2\times \frac{1}{6}+...+6 \times \frac{1}{6}=3.5}

 

分散V(X)は期待値のばらつきを表す。

{\displaystyle V(X)=\sum_{k=1}^n (X_i-\bar{X})P(X_n)}

分散は期待値から導出することもできる。

V(X)=E(X^2)-(E(X))^2(公式として重要)

 

連続確率分布における定義は以下の通り。

{\displaystyle E(X)=\int_{-\infty}^{\infty} xf(x)dx}

{\displaystyle V(X)=\int_{-\infty}^{\infty} (x-\bar{x})f(x)dx}

 

期待値は日常的な意思決定にも生かすことができる。

例:ある宝くじに,1万分の1の確率で100万円もらえ,他はハズレ(0円)というくじがある。このくじに,あなたはいくらまで払えるか?

 期待値を求めることで,1回あたりもらえる金額を予想することができる。

{\displaystyle 1,000,000 \times \frac{1}{10,000}+ 0 \times \frac{9999}{10,000}=100}

よって1回あたりもらえる金額は100円であろうといえる。つまりそれ以内の金額を払うことが,合理的な判断であると推測できる。

 

補足

期待値は合理的な判断に不可欠のパラメータである。しかし,果たして現実は合理的な判断だけで説明できるのだろうか?繰り返しになるが,世の中は常に不確実性がつきまとっており,例えば明日私は生きているのかを実証することすらできない。非合理性を説明する試みとして,例えば行動経済学におけるプロスペクト理論では,人間の損失回避性を数式化している。

プロスペクト理論 - Wikipedia

 

次回↓

 

ryosuke-okubo.hatenablog.com