本站首页    管理页面    写新日志    退出


统计学简史5
Amity 发表于 2006-5-12 10:26:51

5 现代,1950-

统计变得越来越数学化了。为了解对分布和推断理论的一般描述,需要测度论;Fourie 分析成为研究波动最自然的工具;在分析方差的推断上,和在具对称性的设计以及在诸如Graeco Latin方及Steiner三元体的特别结构的代数的推断上需要应用群论和数论。组合理论能用于编码理论和有限几何。因此统计数学成为纯粹数学的一部分,并且因其在各种领域的广泛应用而被研究。因为通常的统计检验已经彻底地研究了.而且往往被置身于某些 具体应用领域的实际工作者所应用,所以在研究人员和实际工作者之间出现了一个距离;但是这种现象在其他开拓性的领域中也能看到。  电子计算机已经带来了巨大的变化。数据,比如海洋学中水面的高程,电磁能(特别是无线电波)的流量,工业过程的状态,生物的状态,都能用计算机收集;没有计算机这些是不实际或不可能的。计算机节省了大量人力,特别是在同样输出的重复计算上,例如在计算多元分析的相关系数和其它检验统计量时。由于计算机软件包

阅读全文(2140) | 回复(0) | 编辑 | 精华 | 删除

统计学简史4
Amity 发表于 2006-5-12 10:23:48

4 NEYMAN-PEARSON时代,1937-1949

Jerzy Neyman(1894-l981)及Egon sharpe Pearson(1895-1980)在一系列的杰出的文章中澄 清了推断理论,特别是有关显著性检验的基本原理一其合理性以往是常被批评为。早期的 显著性检验为关于二项变量之间或均值之间的,它们被K.Pearson推广至卡方检验,被 R.A.Fisher推广到F一检验,推广了Student T一检验。Neyman和E.S.Fearson看出,为了更有 效,应该考虑与待检验的零假设相对应的备选假设。他们在这样的检验中设立两种误差并 因素导致了他们的基本引理,似然比检验,及势的概念;他们顺便验证了大多数常见的显著 性检验的应用;他们还引进了置信限;但是他们的体系从未被Fisher所承认。 Neyman 和 Pearson的工作影响了许多人,特别是美国

阅读全文(3286) | 回复(0) | 编辑 | 精华 | 删除

统计学简史3
Amity 发表于 2006-5-12 10:19:04

3 A. FISHER 时代, 1921-1936

所有的皮尔森的方法都可以应用于大样本,而且可以对方差作出较精确的估计。但对于出现在实际应用中的小样本,这些方法就未必奏效了。William Sealy Gosset(1876-1937)因此导出了一个检验;按照R.A.Fisher的建议该检验在作了一个变换之后成为现在熟和的t- 检验。  Fisher以其四篇值得纪念的论文开创了一个新纪元;相关系数估计的精确分布;协调一致了Mendelian和生物统计对遗传学的不同方法;正确解释了列联表;估计和推断的一般定理。在1920年之后,在Rothamsted实验室,Fisher发展了有广泛应用价值的方差分析和试验与分析的理论。Fisher有很强的数学功底,特别是在组合论
(combinatorics)方面,他能吸引其他数学家作为助手。他对应用领域的选择是很幸运的;研究结果都能立即应用并有明显的经济效应;能够有效地简化假
阅读全文(6652) | 回复(0) | 编辑 | 精华 | 删除

统计学简史2
Amity 发表于 2006-5-12 10:15:29

2 Karl Pearson 时代,1890-1920
  到1920年为止的英国生物统计学派的主要就为
(i)收集并化简了许多经验数据;
(ii)定义了具有多重和总相关系数p的联合正态分布,还定义了估计误差的联合分布;
(iii)关于拟合度的f检验,比较观察分布和理论分布,包括由 Herbert Edward Soper(1865-1930)引进的条件Poisso变量;
(iv)分析列联表,特别是利用f统计量;
(V)当边缘分布充分细分时由最大似然法估计p;
(Vi)当边缘分布没有充分定义时估计p;
(vii)由一个统一的参数估计系统来描述一组曲线,即矩方法;
(viii)利用正态定理到遗传选择问题;
(ix)通往独立性一般定理的某些进展;
(X)通往估计和检验估计精确性的一个理论的进展;
(xi)构造了适当
阅读全文(3556) | 回复(1) | 编辑 | 精华 | 删除

统计学简史1
Amity 发表于 2006-5-12 9:39:12

 1 起源,分布

  统计是初产生于研究对国家,特别是对其经济以及人口的描述。当时现代数学尚未形成。因此那时的统计史基本上是经济史的范畴。现代统计主要起源于研究总体(population),变差(variation)和简化数据(reduction of data)。 第一个经典文献属于John Graunt(1620-1674),其具有技巧的分析指出了把一些庞杂、令人糊涂的数据化简为几个说明问题的表格的价值。他注意到在非瘟疫时期,一个大城市每年死亡数有统计规律,而且出生儿的性别比为1.08,即每生13个女孩就有14个男孩。大城市的死亡率比农村地区要高。在考虑了已知原因的死亡及不知死亡年龄的情况下, Graunt估计出了六岁之前儿童的死亡率,并相当合理地估计出了母亲的死亡率为1.5%。因此,他从杂乱无章的材料中得出了重要的结论。他还给出了一个新的生命表。 
阅读全文(3007) | 回复(-1) | 编辑 | 精华 | 删除

数据挖掘杂货铺开张记
Amity 发表于 2006-5-11 17:28:53

 到今天为止,学了七年统计的我已经在一家数据挖掘软件厂商工作了一年零两天了。最大的感受就是,我爱统计,也爱数据挖掘,我愿意在统计和数据挖掘两大分析领域中默默耕耘。我也希望有更多的分析工作者和爱好者朋友们能和我分享心得体会,装饰我的杂货铺!    
阅读全文(2449) | 回复(2) | 编辑 | 精华 | 删除
« 1

 
«December 2019»
1234567
891011121314
15161718192021
22232425262728
293031

  公告
暂无公告...

  我的分类(专题)
  最近日志

  最新评论

  留言板

  链接


  Blog信息
blog名称:数据挖掘杂货铺
日志总数:6
评论数量:17
留言数量:2
访问次数:46485
建立时间:2006年5月11日



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.015 second(s), page refreshed 144335458 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号