2018年7月11日水曜日

正态分布的前世今生(五)

19初,随着拉普拉斯中心极限定理的建立与高斯正态误差理世,正分布开始角, 逐步在近代概率和数理统计学中大放异彩。在概率中,由于拉普拉斯的推,中心极限定理 为现代概率的一基石。而在数理统计学中,在高斯的大力提倡之下,正分布开始逐步行于天下

1. 论剑中心极限定理

先来说说分布在概率中的地位,个主要是由于中心极限定理的影响。 1776 年,拉普拉斯开始考一个天文学中的彗星道的角的问题,最问题涉及 独立随机量求和的概率算,也就是算如下的概率

Sn=X1+X2++XnSn=X1+X2++Xn

P(a<Sn<b)=?P(a<Sn<b)=?

问题理上,拉普拉斯充分展示了其深厚的数学分析功底和高超的概率算技巧,他首次引入了 特征函数(也就是概率密度函数做傅立叶变换)理概率分布的神妙方法,而一方法经过几代概率学家的展, 代概率里面占有极其重要的位置。基于一分析方法,拉普拉斯通近似算, 在他的1812表的名著《概率分析理》中出了中心极限定理的一般描述:

[定理 Laplace, 1812]  ei(i=1,n)ei(i=1,n) 独立同分布的差, 具有均μμ 和方差 σ2σ2。如果 λ1,,λ2λ1,,λ2 常数,a>0a>0,

P(|i=1nλi(eiμ)|≤ai=1nλ2i−−−−−)≈22π−−√σa0ex22σ2dxP(|∑i=1nλi(ei−μ)|≤a∑i=1nλi2)≈22πσ∫0ae−x22σ2dx

理科专业的本科生学《概率与数理统计这门课程的候, 除了学棣莫弗-拉普拉斯中心极限定理,通常如下中心极限定理的一般形式:

[Lindeberg-Levy 中心极限定理] X1,,XnX1,,Xn 独立同分布,且具有有限的均 μμ 和方差 σ2σ2   n→∞n→∞ ,

n−−√(X¯−μ)σN(0,1)n(X¯−μ)σ→N(0,1)

多么奇妙的性,随意的一个概率分布中生成的随机量, 在序列和(或者等价的求算平均)的操作之下,表出如此一致的行一的规约到正分布。 概率学家们进一步的研究果更加令人惊,序列求和最出正分布的条件并不需要么苛刻, 即便X1,,XnX1,,Xn 并不独立,也不具有相同的概率分布形式,很多候他求和的最宿仍然是正分布。 一切的芜杂都在神秘的正线下被消解,不禁令人浮想翩。 中心极限定理恐怕是概率中最具有宗教神秘色彩的定理,如果有一位牧拿着 一本圣向我明上帝的存在,我是毫不会买账;可是如果他向我展示中心极限定理并且声称那是神迹, 我会很听他的布道。如果我能坐着光机穿越到一个原始部落中,我也一定上中心极限定理,并 劝说部落的酋把正分布作图腾

中心极限定理然表述形式简洁,但是明它却非常困 中心极限定理就像一大蜘蛛网,棣莫弗和拉普拉斯编织了它的形,可是这张网上漏洞太多,一个多世来, 数学家就像蜘蛛一前赴后,努力想把所有的漏洞都上。 在十九世,珀松(Poission)、狄利克莱(Dirichlet)、柯西(Cauchy)(Bessel)些大蜘蛛 都曾经试图对这张网上的漏洞上。从代概率来看角度, 整个十九世典概率理并没有能出一个一般意格的明。 而真正把漏洞上的是来自俄斯的几位蜘蛛侠:切比雪夫(Chebyshev)马尔可夫(Markov)和李雅普(Lyapunov) 斯是一个具有秀的数学传统的民族,几位尖的的数学家,在代概率展中, 斯的圣彼得堡学派可以算是了半天。 把漏洞上的格方案的形是从切比雪夫1887年的工作开始的,不切比雪夫的明存在一些漏洞。 马尔可夫和李雅普夫都是切比雪夫的学生,马尔科夫沿着老的基于矩法的思路在蜘蛛网上辛勤编织,但洞得不够严实 李雅普夫不像马尔可夫那深受老的影响,他沿着拉普拉斯当年提出的基于特征函数的思路,于1901出了一个洞的方法, 切比雪夫对这个方法大加赞赏,李雅普夫的明被认为是第一个在一般条件下的明; 马尔科夫也不甘示弱,在1913年基于矩法也把洞给补严实了。

20初期到中期,中心极限定理的研究几乎吸引了所有的概率学家,个定理然成了概率的明珠,成了各大概率 武林高手论剑所。不知道大家中心极限定理中的"中心"如何理解,多人都认为"中心"描述的是个定理的 :以正分布中心。个解看起来确合情合理,不并不符合定理被冠名的史。 上,20初概率学家大都称呼定理极限定理(Limit Theorem),由于定理在概率 于如此重要的中心位置,如此之多的概率学武林高手它魂 于是数学家波利(Polya)1920年在定理前面冠以"中心",由此后都称之中心极限定理。


论剑中心极限定理

数学家们总是及其严谨苛刻的,定了一个条件下明了中心极限定理。数学家就开始 中心极限定理成立的各种条件,询问这个条件是否充分必要条件,并且一步追序列和在条件下以 什么的速度收到正分布。 1922 Lindeberg 基于一个比较宽泛容易足的条件,中心极限定理提出了一个很容易理解的初等明。 个条件我们现在称之Lindeberg 条件。然后概率学家 Feller Levy 就开始追Lindeberg 条件是充分必要的 基于 Lindeberg 的工作, Feller Levy 都于 1935 年独立的得到了中心极限定理成立的充分必要条件, 个条件可以用直的非数学言描述如下:

[中心极限定理充要条件]  独立随机量序列 XiXi 的中值为0, 要使序列和 S=ni=1XiS=∑i=1nXi 的分布函数逼近正分布,以下条件是充分必要的:

  1. 如果 XiXi于序列和SS的散布(也就是准差)是不可忽略的, XiXi 的分布必接近正分布
  2. 于所有可忽略的 XiXi, 绝对值最大的那一,相于可忽略项这个子序列和的散布,绝对值也是可忽略的

个充分必要条件发现Feller Levy 间还了一定的争 Levy 个充分必要条件的程中, Levy发现了正分布的一个有趣的性 在数理统计中都学,如果两个独立随机 X,YX,Y 具有正分布,S=X+YS=X+Y 也具有正分布。奇妙的是个定理的逆定理也成立:

[分布的血如果 X,YX,Y 是独立的随机量,且 S=X+YS=X+Y 是正分布,那么 X,YX,Y 也是正分布。

分布真是很奇妙,就像蚯蚓一具有再生的性,你把它一刀两断,它生成两个正分布; 或者分布具有及其高良血,正分布的成成分中只能包含正分布,而不可能含有其它杂质 1928 Levy 就猜到了个定理,并使用个定理于1935中心极限定理的充分必要条件作了明。 但是 Levy 却无法明正分布的个看上去及其简单的再生性。直到 1936 Cramer 出了明。

中心极限定理成代概率中首屈一指的定理,事上中心极限定理在代概率里面已不是指一个定理, 而是指一系列相关的定理。 统计学家也基于定理不断的完善拉普拉斯提出的元差理(the hypothesis of elementary errors) 并据此解释为何世界上正分布如此常。而中心极限定理同统计学中大本理的基

 

0 件のコメント:

コメントを投稿