ベルヌーイ分布の応用1

統計学 統計学

統計検定2級の過去問を問いたら面白い問題がありました。2問紹介したいんですが、この記事では1問だけです。
2問目の記事も書いたので、リンクを貼っておきます。

ベルヌーイ分布の応用2
統計検定2級の問題で、面白い問題があったので解答を載せます。ベルヌーイ分布から幾何分布を作ります。幾何分布の期待値と分散を、幾何分布が確率分布になっている、という事実と微分だけで導出します。

母比率の推定とかいう名目で教科書に書いてると思います。例えば、以下の本の12章に書いてます。

インターネットの記事も沢山あります。
https://bellcurve.jp/statistics/course/9488.html
http://www.tamagaki.com/math/Statistics503.html

問題設定

問題は以下のような感じです。
魚が充分大きな数N 匹住んでいる池があります。池から魚を100匹捕まえてマーカーを付けました。後日100匹捕まえてみると、5匹にマーカーが付いていました。マーカーのついている魚の比率の95%信頼区間を求めなさい。

この問題のポイントは魚にマークが付いているか付いていないかでベルヌーイ分布が出てくること、たくさん魚を捕まえると二項分布が出てくること、魚の数が非常に多いので中心極限定理を使って二項分布から正規分布が出てくること1 です。

解答

魚を捕まえると、マーカーあり/なしを確認することが出来ます。魚を捕まえてマーカーを確認すると、\( p=100/N \) の確率でマーカーが付いています。つまり魚一匹を捕まえてマーカーを確認した時の事象は、\( k= 0 \)がマーカーなし、 \( k=1 \)がマーカーありとする ベルヌーイ分布で表すことが出来ます。
$$\begin{eqnarray}
f(k|p) = p^k {(1-p)}^{1-k}
\end{eqnarray}$$
ベルヌーイ分布に従う事象をn回行う事を考える2と、二項分布が出てくるのでした。
$$\begin{eqnarray}
f(k|p)_n = {}_n C_k p^{k} (1-p) ^{n-k}
\end{eqnarray}$$
n が大きな数だと思うと、中心極限定理によって\( {\rm Binom } (n,p ) \sim \mathcal{N}(np, np(1-p) ) \)と近似できます。
つまり、魚をn匹捕まえたときに、マーカーがある魚の数Xは、正規分布に従うと近似できます。
$$\begin{eqnarray}
X \sim \mathcal{N} (X | ( np , np(1-p) )
\end{eqnarray}$$
次に、\(X \)を正規化すると、問題や教科書の最後に載ってる、標準正規分布の積分値を読むことで、信頼区間を計算出来ます。
$$\begin{eqnarray}
Z= \frac{X- np}{\sqrt{np(1-p) } } \sim \mathcal{N}( Z | 0,1 )
\end{eqnarray}$$
ここで、問題で与えられているのは100匹取ったら5匹にマーカーが付いていたという事なので、\( Z \)を書き直しましょう。
$$\begin{eqnarray}
Z= \frac{X/n- p}{\sqrt{p(1-p)/n } }
\end{eqnarray}$$
上の式での \( X/n \)は、n匹魚を取った時の、マーカーが付いてる魚の比率を表しているので、問題文の情報がそのまま使えます。
95%信頼区間となるZは\( Z=1.96 \) らしいので、以下の式を解いていけばよい事になります。
$$\begin{eqnarray}
-1.96 \leq Z \leq 1.96
\end{eqnarray}$$
式を変形し、最右辺と最左辺に出てくる\( p \)を\(\hat{p}= X/n \)で置き換える3と、以下の式になります。
$$\begin{eqnarray}
\hat{p} -1.96 * \sqrt{ \hat{p} (1- \hat{p} )/n} \leq Z \leq \hat{p} + 1.96 * \sqrt{ \hat{p} (1- \hat{p} )/n}
\end{eqnarray}$$
問題の状況では、\( 1.96 * \sqrt{ \hat{p} (1- \hat{p} )/n} = 0.043 \)です。
従って、答えは \( 0.05 \pm 0.043 \) という事になります。
真面目に試験を受験するときには、公式として覚えているかもしれないですが、試験勉強していない状態で解くと、色々テクニックが詰まっているので面白いと感じました。

まとめ

  • ベルヌーイ分布から二項分布を作った
  • 二項分布から正規分布を作った
  • 確率変数を、数から比率に書き換えた
  1. ポイントと言うか殆ど答えです。
  2. 魚をn匹捕まえて、マーカーがあるか確認するという事です
  3. 計算を進める為に、 nが充分大きい時には、\( X/n \)が真の比率 pに一致すると仮定するわけです。
タイトルとURLをコピーしました