数据挖掘杂货铺

　本站首页 管理页面写新日志退出

Amity 发表于 2006/5/12 10:26:51

5 现代，1950-

统计变得越来越数学化了。为了解对分布和推断理论的一般描述，需要测度论；Fourie 分析成为研究波动最自然的工具；在分析方差的推断上，和在具对称性的设计以及在诸如Graeco Latin方及Steiner三元体的特别结构的代数的推断上需要应用群论和数论。组合理论能用于编码理论和有限几何。因此统计数学成为纯粹数学的一部分，并且因其在各种领域的广泛应用而被研究。因为通常的统计检验已经彻底地研究了．而且往往被置身于某些具体应用领域的实际工作者所应用，所以在研究人员和实际工作者之间出现了一个距离；但是这种现象在其他开拓性的领域中也能看到。电子计算机已经带来了巨大的变化。数据，比如海洋学中水面的高程，电磁能（特别是无线电波）的流量，工业过程的状态，生物的状态，都能用计算机收集；没有计算机这些是不实际或不可能的。计算机节省了大量人力，特别是在同样输出的重复计算上，例如在计算多元分析的相关系数和其它检验统计量时。由于计算机软件包

阅读全文(2350) | 回复(0) | 编辑 | 精华 | 删除

统计学简史4

文章收藏, 科学研究

Amity 发表于 2006/5/12 10:23:48

4 NEYMAN-PEARSON时代，1937-1949

Jerzy Neyman(1894-l981)及Egon sharpe Pearson（1895-1980）在一系列的杰出的文章中澄清了推断理论，特别是有关显著性检验的基本原理一其合理性以往是常被批评为。早期的显著性检验为关于二项变量之间或均值之间的，它们被K．Pearson推广至卡方检验，被 R.A.Fisher推广到F一检验，推广了Student T一检验。Neyman和E．S．Fearson看出，为了更有效，应该考虑与待检验的零假设相对应的备选假设。他们在这样的检验中设立两种误差并因素导致了他们的基本引理，似然比检验，及势的概念；他们顺便验证了大多数常见的显著性检验的应用；他们还引进了置信限；但是他们的体系从未被Fisher所承认。 Neyman 和 Pearson的工作影响了许多人，特别是美国

阅读全文(3521) | 回复(0) | 编辑 | 精华 | 删除

统计学简史3

文章收藏, 科学研究

Amity 发表于 2006/5/12 10:19:04

3 A. FISHER 时代， 1921－1936

所有的皮尔森的方法都可以应用于大样本，而且可以对方差作出较精确的估计。但对于出现在实际应用中的小样本，这些方法就未必奏效了。William Sealy Gosset（1876-1937）因此导出了一个检验；按照R．A．Fisher的建议该检验在作了一个变换之后成为现在熟和的t- 检验。 Fisher以其四篇值得纪念的论文开创了一个新纪元；相关系数估计的精确分布；协调一致了Mendelian和生物统计对遗传学的不同方法；正确解释了列联表；估计和推断的一般定理。在1920年之后，在Rothamsted实验室，Fisher发展了有广泛应用价值的方差分析和试验与分析的理论。Fisher有很强的数学功底，特别是在组合论
（combinatorics）方面，他能吸引其他数学家作为助手。他对应用领域的选择是很幸运的；研究结果都能立即应用并有明显的经济效应；能够有效地简化假

阅读全文(6868) | 回复(0) | 编辑 | 精华 | 删除

统计学简史2

文章收藏, 科学研究

Amity 发表于 2006/5/12 10:15:29

2 Karl Pearson 时代，1890-1920
到1920年为止的英国生物统计学派的主要就为
（i）收集并化简了许多经验数据；
（ii）定义了具有多重和总相关系数p的联合正态分布，还定义了估计误差的联合分布；
（iii）关于拟合度的f检验，比较观察分布和理论分布，包括由 Herbert Edward Soper（1865－1930）引进的条件Poisso变量；
（iv）分析列联表，特别是利用f统计量；
（V）当边缘分布充分细分时由最大似然法估计p；
（Vi）当边缘分布没有充分定义时估计p；
（vii）由一个统一的参数估计系统来描述一组曲线，即矩方法；
（viii）利用正态定理到遗传选择问题；
（ix）通往独立性一般定理的某些进展；
（X）通往估计和检验估计精确性的一个理论的进展；
（xi）构造了适当

阅读全文(3781) | 回复(1) | 编辑 | 精华 | 删除

统计学简史1

文章收藏, 科学研究

Amity 发表于 2006/5/12 9:39:12

　1 起源,分布

　　统计是初产生于研究对国家，特别是对其经济以及人口的描述。当时现代数学尚未形成。因此那时的统计史基本上是经济史的范畴。现代统计主要起源于研究总体（population），变差（variation）和简化数据（reduction of data）。第一个经典文献属于John Graunt(1620-1674)，其具有技巧的分析指出了把一些庞杂、令人糊涂的数据化简为几个说明问题的表格的价值。他注意到在非瘟疫时期，一个大城市每年死亡数有统计规律，而且出生儿的性别比为1.08，即每生13个女孩就有14个男孩。大城市的死亡率比农村地区要高。在考虑了已知原因的死亡及不知死亡年龄的情况下, Graunt估计出了六岁之前儿童的死亡率，并相当合理地估计出了母亲的死亡率为1.5％。因此，他从杂乱无章的材料中得出了重要的结论。他还给出了一个新的生命表。

阅读全文(3207) | 回复(-1) | 编辑 | 精华 | 删除