2018年7月11日水曜日

正态分布的前世今生(三)

四、众里她千百度,差分布曲线的确

第三个故事有点,主角是高斯和拉普拉斯,故事的主要内容是猜上帝的造物的旨意,找随机差分布的律。

天文学是第一个被差困的学科,从古代至十八世天文学一直是用数学最达的域, 到十八世,天文学的累了大量的天文学数据需要分析算,应该如何来理数据中的观测误差成一个很棘手的问题 在数据理中常使用平均的常性法,千百来来的数据使用经验说明算平均能消除差,提高精度。 平均有如此的魅力,道理何在,之前没有人做上的明。 平均的合理性问题在天文学的数据分析工作中被提出来讨论量中的随机差服应该服从怎的概率分布? 平均的良性和差的分布有怎的密切系?

伽利略在他著名的《关于两个主要世界系对话》中,对误差的分布做一些定性的描述,主要包括:

  •  差是称分布的;
  •  大的差出现频率低,小的差出现频率高。

用数学的言描述,也就是说误差分布函数 f(x)f(x) 关于0称分布,概率密度随 |x||x| 增加而减小, 两个定性的描述都很符合常

多天文学家和数学家开始了差分布曲线尝试 Thomas Simpson (1710-1761) 先走出了有意的一步。 值为 θθx1,,xnx1,,xnn, 每次量的ei=xiθei=xi−θ 若用算平均 x¯=ni=1xinx¯=∑i=1nxin去估θθ,  e¯=ni=1eine¯=∑i=1nein Simpson 明了, 于如下的一个概率分布,

Simpson 分布曲线

P(|e¯|<x)≥P(|e1|<x)P(|e¯|<x)≥P(|e1|<x)

也就是|e¯||e¯| 相比于|e1||e1|取小的机会更大。 Simpson 个工作很粗糙,但是是第一次在一个特定情况下,从概率的角度明了算平均的良性。

1772-1774 年, 拉普拉斯也加入到了差分布函数的伍中。拉普拉斯假定差分布函f(x)f(x)足如下性

f(x)=mf(x)−f′(x)=mf(x)

由此最求得的分布函数

f(x)=m2em|x|f(x)=m2e−m|x|

个函数在被称拉普拉斯分布。

Laplace 分布曲线

个函数作为误差分布,拉普拉斯开始考如何基于量的果去估未知参数的 拉普拉斯可以算是一个叶斯主者,他的参数估的原叶斯方法非常相似,假分布是均匀的, 算出参数的后分布后,取后分布的中点,1/21/2分位点,作参数估计值。可是基于差分布函数 做了一些算之后,拉普拉斯发现计于复,最没能出什么有用的果。

拉普拉斯可是概率的大牛,写两本极有影响力的《概率分析理》, 以我的数学美,在无法理解拉普拉斯这样的大牛怎么找了一个零点不可差的分布函数, 拉普拉斯最终还是没能搞定差分布的问题

到高斯登了,高斯在数学史中的地位极高,号称数学史上的狐狸,数学家阿贝尔对他的评论 "He is like the fox, who effaces his tracks in the sand with his tail." 的数学大师陈省身把黎曼和加莱称数学家中的菩,而称自己为罗汉;高斯是黎曼的导师,数学圈里有些教授把高斯称数学家中的佛。 在数学家中既能仰望理数学的星空,又能脚踏用数学的地的可不多 高斯是数学家中少有的""""的人物,他既对纯数学有深刻的洞察力,又极其重数学在践中的用。 差分布的理中,高斯以及其简单的手法确立了随机差的概率分布,其果成数理统计发展史上的一里程碑。

高斯的介入首先要从天文学界的一个事件起。18011月,天文学家Giuseppe Piazzi发现了一从未见过 的光度8等的星在移 这颗现在被称作谷神星(Ceres)的小行星在夜空中出6个星期,扫过度角后在就在太阳的光芒下没了踪影,无法观测 而留下的观测数据有限,算出他的道,天文学家也因此无法确定这颗新星是彗星是行星, 问题很快成了学界关注的焦点。高斯当是很有名望的年数学家了, 问题引起了他的趣。高斯以其卓越的数学才能立了一种新的 行星道的算方法,一个小之内就算出了行星的道,并言了他在夜空中出时间和位置。 18011231日夜,德国天文好者奥伯斯(Heinrich Olbers),在高斯言的时间里,用望远镜对准了片天空。 果然不出所料,谷神星出了!

高斯此名声大震,但是高斯当透露道的方法,原因可能是高斯认为自己的方法的理础还成熟, 而高斯一向治学严谨、精益求精,不表没有思考成熟的理。直到1809年高斯系地完善了相关的数学理后, 才将他的方法公布于众,而其中使用的数据分析方法,就是以正态误差分布的最小二乘法。 那高斯是如何推差分布分布的?看看高斯是如何猜上帝的意的。

值为 θθx1,,xnx1,,xnn次独立, 每次量的ei=xiθei=xi−θ 设误eiei的密度函数 f(e), 则测合概率n差的合概率,记为

L(θ)=L(θ;x1,,xn)=f(e1)f(en)=f(x1θ)f(xnθ)L(θ)=L(θ;x1,,xn)=f(e1)f(en)=f(x1−θ)f(xn−θ)

但是高斯不采用叶斯的推理方式,而是直接L(θ)L(θ)达到最大 θ^=θ^(x1,,xn)θ^=θ^(x1,,xn) θθ的估计值,即

θ^=argmaxθL(θ)θ^=argmaxθL(θ)

在我L(θ)L(θ) 为样本的似然函数,而得到的估计值θ^θ^ 极大似然估 高斯首次出了极大似然的思想,个思想后来被统计学家 R.A.Fisher 展成参数估中的极大似然估

高斯接下来的想法特牛,他开始揣度上帝的意,而充分体了高斯的数学天才。 高斯把整个问题的思考模式倒来:既然千百年来大家都认为平均 是一个好的估,那我就认为极大似然估计导出的就应该是算平均!所以高斯猜上帝在中的旨意就是:

差分布出的极大似然估 = 平均

然后高斯去找差密度函数 ff 以迎合一点。即这样的概率分布函数 ff, 使 得极大似然估正好是算平均 θ^=x¯θ^=x¯。而高斯用数学技巧求解个函ff, 高斯(明不,后续给),所有的概率密度函数中,唯一个性的就是

f(x)=12π−−√σex22σ2f(x)=12πσe−x22σ2

瞧,正分布的密度函数 N(0,σ2)N(0,σ2) 被高斯他老人家解出来了!

【正态误分布律】

一步,高斯基于差分布函数最小二乘法出了一个很漂亮的解 于每个 eiei, eiN(0,σ2)eiN(0,σ2), (e1,,en)(e1,,en) 合概率分布

(e1,,en)1(2π−−√σ)nexp{−12σ2i=1ne2i}(e1,,en)1(2πσ)nexp{−12σ2∑i=1nei2}

要使得个概率最大,必使ni=1e2i∑i=1nei2 取最小正好就是最小二乘法的要求。

高斯所拓展的最小二乘法成了十九世纪统计学的最重要成就,它在十九世纪统计学的重要性就相当于十八世紀的微分之于数学。 而勒德和最小二乘的的之争,成了数学史上次于牛、莱布尼茨微明的争端。 相比于勒1805出的最小二乘法描述,高斯基于差正分布的最小二乘理论显然更高一筹, 高斯的工作中既提出了极大似然估的思想,又解决了差的概率密度分布的问题 由此我可以对误差的大小的影响统计度量了。高斯的这项工作后世的影响极大,而正分布也因此被冠名 高斯分布。估高斯本人当是完全没有意到他的个工作给现代数理统计来的深刻影响。 高斯在数学上的献特多,去世前他是要求自己的墓碑上雕刻上正十七形,以明他在正十七形尺上的杰出工作。 而后世的德国票和钢镚上是以正密度曲线念高斯,足以明高斯的这项工作在当代科学展中的份量。

17-18科学界流行的做法,是尽可能从某种简单明了的准(first principle)发进行推 高斯定的准"最大似然估计应该导良的算平均",并出了差服从正分布,推的形式上非常简洁优美。 但是高斯的准逻辑上并不足以人完全信服,因平均的良性当更多的是一个直觉经验,缺乏格的理支持。 高斯的推存在循环论证的味道:因平均是良的,推出差必服从正分布; 来,又基于正分布推出最小二乘和算平均,来明最小二乘法和算平均的良性。 陷入了一个生蛋蛋生的怪圈,逻辑上算平均的良性到底有没有自行成立的理由呢?

高斯的文章表之后,拉普拉斯很快得知了高斯的工作。 拉普拉斯看到,正布既可以从作钢镚产生的序列和中生成出来,又可以被雅的作为误差分布定律, 这难道是偶然象?拉普拉斯不愧概率的大牛,他上将差的正分布理和中心极限定理系起来,提出了元差解 他指出如果差可以看成多量的叠加,根据他的中心极限定理,随机差理所当是高斯分布。 20中心极限定理的一步展,也给这个解提供了更多的理支持。因此有了个解释为点, 高斯的循环论证的圈子就可以打破。 拉普拉斯悟出结论之后一定想撞,自己辛辛苦苦寻寻觅觅 么久的差分布曲线就在自己的眼皮底下,自己却年来而不,被高斯占了先机。

至此,差分布曲线埃落定,正分布在差分析中确立了自己的地位,开始并在整个19不断的开疆土, 直至在统计学中群,傲世其它一切概率分布;而高斯和拉普拉斯的工作,为现统计学的展开启了一扇大

在整个正分布被发现用的史中,棣莫弗、拉普拉斯、高斯各有献,拉普拉斯从中心极限定理的角度解它, 高斯把它用在差分析中,殊途同。正分布被人们发现么好的性,各国人民都争他的冠名 Laplace 是法国人,所以当在法国被称拉普拉斯分布; 而高斯是德国人, 所以在德国叫做高斯分布;第三中立国的人民称他拉普拉斯-高斯分布。后来法国的大数学家加莱(Henri Poincaré)改用正分布一中立名称,而随后统计学家卡.森使得个名称被广泛接受:

Many years ago I called the Laplace-Gaussian curve the normal curve, which name, while it avoids an international question of priority, has the disadvantage of leading people to believe that all other distributions of frequency are in one sense or another "abnormal".}

 -Karl Pearson (1920) 

高斯在数学家中的名气是在太大, 分布的桂冠是更多的被戴在了高斯的脑门上,目前数学界通行的用是正分布高斯分布, 两者并用。

分布在高斯的推下,迅速在差分析中被广泛使用,然而早期也限于差的分析中, 其重要性没有被自然科学和社会科学域中的学者认识,那正分布是如何从差分析的小溪, 冲向自然科学和社会科学的汪洋大海的呢?

相关文章:

  1. 分布的前世今生()
  2. 分布的前世今生()
  3. 分布的前世今生()
  4. 分布的前世今生()
  5. 分布的前世今生()
  6. LDA-math-认识Beta/Dirichlet分布(3)
  7. 分布的前世今生()
  8. 分布的前世今生()
  9. LDA-math-神奇的Gamma函数(1)
  10. LDA-math-文本建模

 

0 件のコメント:

コメントを投稿