統計学を勉強していると、確率密度(質量)関数や、確率分布、確率変数と言った言葉が出現します。それらの定義や意味をまとめています。辞書みたいに使って欲しいと思います。
確率の定義
確率は測度と可測関数の組の特別な場合です。初めに、測度や可測という概念を定義するには、可測集合という概念が必要です。
[可測集合族]
集合
ならば ならば、
可測集合族の元の事を可測集合と言います。
可測集合族自体は、
例えば、集合
可測集合上の関数として、確率を定義できます。
[確率]
- 全ての
に対して が、 を満たすなら、
確率、といった時には全事象
サイコロを1回だけ振る状況を考えるすると、

確率変数と累積分布関数
確率変数の定義と、確率変数がある時の確率の定義を確認します。
現実に得られるデータが確率変数
サイコロを投げる例だと、サイコロの出目が確率変数
色々なモノを確率変数と捉える事が出来ます。例えば、複数回サイコロを投げた時。6が出る個数を確率変数と思っても良いです。
確率変数がある時の確率を
[累積分布関数]
と書き直して、
です。ただし、
数学の原理的には、確率そのものを決めるのは累積分布関数です。累積分布関数が特別な形に書けるときに、見知った形の確率分布が出て来ます。
累積分布関数と確率(質量)密度関数
確率
[確率(質量)密度関数]
を確率質量関数(probability mass function ; pmf)と呼びます。
標本空間が連続的なとき
を確率密度関数(probability density function ; pdf)と呼びたいですが、これは大体0になってしまいます。
そこで、以下のように定義を変えます。
となる
確率密度関数みたいなものが大体0になることの補足
確率の定義から初めて行くと、分布関数が出てきて、特別な場合に確率密度関数が出てくるという事が分かります。
つまり、単に確率と言ってしまうと抽象的過ぎて、色々なモノが出てきてしまうわけです。
私たちが普段から接している正規分布などの確率分布は、累積分布関数から出てきたようなものなのでしょうか?多分そんなことはありません。
確率密度関数を上手く定義してやれば、確率が出てきて、数学の美味しい所を使えるというのを確認します。
確率密度関数から確率が生まれる話
確率というのは、3つ組
そこで。全事象
確率密度関数の定義は、
となる
となる事です。これっぽいのを確率密度関数の定義としてみましょう。
- 全ての
について
となる事とします。
上で考えて確率密度関数から初めて、確率が出てくることを確認しましょう。
確率は、
- 全ての
に対して が、 を満たすなら、
という性質のものでした。
確率密度関数があるとき、
と定めます。確率の性質を満たすのか確認しましょう。
1については、0以上の値を持つ関数を積分するので成り立ちます。
2番は、上手くいくように定義を調整しました。
3番は、積分の性質から出て来ます。
という事で、確率密度関数を考えておくと、確率が出てくることが分かります。
現実では、正規分布やベルヌーイ分布など、確率密度関数を先に与えて、そこから確率変数の挙動を予測するのが普通なので、時々混乱するかもしれませんが、気にする必要はないのです。
まとめ
- 確率の定義を確認した
- 確率変数の定義を確認した
- 確率密度関数の定義を確認した
- 確率密度関数から始めても、確率が出てくることを確認した