歪度(わいど)の解説

統計学 統計学

歪度(skewness)の解説をします。歪度を計算する事で、分布が平均に対して+,-側どちらに偏っているか判断できます。
参考文献は以下の2冊です。

現代数理統計学の基礎 (共立講座 数学の魅力) | 達也, 久保川 |本 | 通販 | Amazon
Amazonで達也, 久保川の現代数理統計学の基礎 (共立講座 数学の魅力)。アマゾンならポイント還元本が多数。達也, 久保川作品ほか、お急ぎ便対象商品は当日お届けも可能。また現代数理統計学の基礎 (共立講座 数学の魅力)もアマゾン配送商品なら通常配送無料。
統計学入門 (基礎統計学Ⅰ) | 東京大学教養学部統計学教室 |本 | 通販 | Amazon
Amazonで東京大学教養学部統計学教室の統計学入門 (基礎統計学Ⅰ)。アマゾンならポイント還元本が多数。東京大学教養学部統計学教室作品ほか、お急ぎ便対象商品は当日お届けも可能。また統計学入門 (基礎統計学Ⅰ)もアマゾン配送商品なら通常配送無料。

歪度の定義

確率分布があるとき、期待値を\(E[\cdot ] \)で表します。また、平均、分散は\( \mu , \sigma \)で表します。

$$\begin{eqnarray}
\mu &=& E[X]\\
\sigma ^2 &=& E[ (X- \mu )^2 ]
\end{eqnarray}$$
歪度\( \alpha _3 \)は、以下の式で定義されます。
$$\begin{eqnarray}
\alpha _3 = E[ (X- \mu )^3 ]/ \sigma ^{3}
\end{eqnarray}$$
1歪度が0より大きいという事は、\(X > \mu \)の側に裾が長い事を意味します。逆もまた然りです。

正規分布の歪度

正規分布\( \mathcal{N} (\mu , \sigma ^2 ) \)は平均値に対して線対称な分布です。

標準正規分布
標準正規分布

歪度の意味から考えると、正規分布の歪度は0であることが予想されます。これを確かめましょう。定義から、
$$\begin{eqnarray}
\alpha _3 &=& \int _{-\infty}^{\infty} (x-\mu )^3 \exp(-(x-\mu)^2 /2\sigma ^2 ) dx
\end{eqnarray}$$
ですが、\(x- \mu =t \)と変数変換すると
$$\begin{eqnarray}
\alpha _3 &=& \int _{-\infty}^{\infty} t^3 \exp(-t^2 /2\sigma ^2 ) dt
\end{eqnarray}$$
となります。上の式は奇関数を0で対称な区間で積分しているので0です。従って、正規分布の歪度は0であることが分かりました。
次に、分布が0付近で大きな値を取りやすい指数分布について歪度を計算してみましょう

指数分布の歪度

指数分布の表式と、平均値、分散は以下です。ただし、\(x>0 \)で定義されます。
$$\begin{eqnarray}
p(x|\lambda ) &=& \lambda \exp(-\lambda x )\\
\mu &=& 1/\lambda \\
\sigma ^2 &=& 1/ \lambda ^2
\end{eqnarray}$$
表式や平均値、分散を見ると、\(x=0 \)から急にそそり立つような、尖った分布になる事が分かります。この事から、\( \alpha _3>0 \)と予想出来ます。

λ=1の指数分布

指数分布はガンマ分布の特別な場合で、特性関数や積率母関数が分かっているので、それを使って歪度が計算出来ます。2そのために、歪度の定義を少し書き換えます。
$$\begin{eqnarray}
\alpha _3 =\frac{ E[X^3] -3\mu E[X^2] +2\mu ^3 }{\sigma ^{3 } }
\end{eqnarray}$$
積率母関数は以下で与えられます。
$$\begin{eqnarray}
M_X (t) = (1- t/\lambda )^{-1}
\end{eqnarray}$$
2,3次のモーメントは
$$\begin{eqnarray}
E[X^2] &=& \frac{dM_X (t) ^2}{dt^2} |_{t=0} &=& 2/\lambda ^2 \\
E[X^3] &=& \frac{dM_X (t) ^3}{dt^3} |_{t=0} &=& 6/ \lambda ^3
\end{eqnarray}$$
と計算出来ます。\(E[X] =\mu = 1/\lambda \)と合わせて歪度の式に代入する事で、
$$\begin{eqnarray}
\alpha _3 =2
\end{eqnarray}$$
が得られます。予想通り、歪度は0より大きい値になりました。\(\lambda \)が小さくなれば、歪度も小さくなるような気もしますが、どんな\(\lambda _1 , \lambda _2 \)を取っても、 \(z= \lambda _2 / \lambda _1 x \)と線形変換すれば
$$\begin{eqnarray}
f(x|\lambda _1 ) = f(z|\lambda _2 )
\end{eqnarray}$$
と出来ます。線形変換で、歪度は不偏なので、指数分布の歪度は定数であることが分かります。
歪度と同様に定義される尖度という量もありますが、それは別の記事で解説したいと思います。

まとめ

  • 歪度の定義をした
  • 正規分布の歪度を計算した
  • 指数分布の歪度を計算した
  1. \(\sigma^{3} \)で割るのは、線形変換\(Y=aX+b \)に対して不変にするためです。
  2. もちろん直接計算しても大丈夫です。
タイトルとURLをコピーしました