2018年11月21日水曜日

確率論と統計学の違いについて。

確率について。
確率とはある事象がどれくらい起こり得るかの程度であり、0以上1以下の数字(または0%〜100%)で表されます。

私たちが生きて生活している世界では、絶対というものはほとんどなく、
(ほぼ)同じ条件の下で同じことを繰り返したとしても、別の結果が得られることがたくさんあります。

数学やニュートン力学の枠組みの中では多くの場合、物事は原因に対し、結果が一つに定まるという因果律的な考え方をし、そのような事象を扱いますが、

確率論の枠組みでは、物事は原因に対し、偶然性によって結果が変わると考えます。

最も分かりやすい例の一つはサイコロを振る試行ですね。

歪んでいないサイコロを1回降って1の目が出たとしても、次に同じサイコロを降った場合、もちろん1が出るとは限りません。

しかし、偶然性により結果が変わるといっても、歪んでないサイコロの場合、
それぞれの目は6回に1回、つまり、1/6の確率で出ると考えられます。

原因に対して何かの結果が得られる時、それは偶然性に左右されるものの、その偶然性は規則性を持っており、それに基づいて様々な事象がどれくらい起こりやすいか?

といったことを考えることができるのが、確率的思考の面白さと言えます。

サイコロの例で言うと、それぞれの目が出る確率は1/6ですから、それを基に「2回連続で同じ目が出る確率」や「3回連続で1が出る確率」などが計算できます。


確率論と統計学の違いについて。
確率論においては上述のように、ある事象が起こる確率が決まっていて、それに基づいて物事を考えることができます。

サイコロの例で言うと、1が出る確率は1/6と決まっているわけです。
これを用いて、例えば「2回連続で1が出る確率」であれば \frac{1}{6}\times\frac{1}{6}=\frac{1}{36} と計算することができますね。

このように、

ある事象が起こる確率(「1の目がでる確率は1/6」)

を定めれば

別の事象が起こる確率(「2回連続で1の目がでる確率」)

を計算することができます。

逆に、統計学では、得られた事実やデータから、ある事象が起こる本当の確率などについて何らかの結論を導こうとします。

確率論が演繹的な考え方なのに対し、統計学は観測された事象やデータから出発して、その背後にある本当の確率や起こっていることを説明しようとする帰納的なアプローチと言えます。

例えば、サイコロを100回振って20回1の目が出たとします。
統計学では、この事実(データ)を基に、その背後にある「1の目が出る本当の確率」について考察するわけです。

この例で言えば、「1が出る本当の確率」は20/100で大体20%くらいなんじゃないか?といったことを考えることができますね。

他にも例えば、サイコロを3回振って3回連続で1の目が出た、という事実(データ)があるとします。

この事実から、「このサイコロは1の目が出やすいように歪んでいる」んではないか?といった仮説を立てることができますね。

では本当に「1が出やすいように歪んでいる」と結論づけることができるのでしょうか?

上記2つの例はそれぞれ推定(前者)、検定(後者)という手法で、統計学的に結論を出す方法論が確立されています。

このように統計学においては、得られた事実やデータを基に、何が言えるのか?を考えることができるのです。

統計学: データ → 真理
確率論: 真理  → データ

という方向で議論が展開されるということです。

統計学の理論や手法では、確率論を必ず利用しますので、
統計学を理解するために確率論を理解することは非常に重要なのです。

0 件のコメント:

コメントを投稿