- 67.50 KB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
统计学发展概况 由于人类的统计实践是随着计数活动而产生的,因此,统计发展史可以追溯到远古的原始社会,也就是说距今足有五千多年的漫长岁月。但是,能使人类的统计实践上升到理论上予以概括总结的程度,即开始成为一门系统的学科统计学,却是近代的事情,距今只有三百余年的短暂历史。统计学发展的概貌,大致可划分为古典记录统计学、近代描述统计学和现代推断统计学三种形态。 一、古典记录统计学古典记录统计学形成期间大致在十七世纪中叶至十九世纪中叶。统计学在这个兴起阶段,还是一门意义和范围不太明确的学问,在它用文字或数字如实记录与分析国家社会经济状况的过程中,初步建立了统计研究的方法和规则。到概率论被引进之后,才逐渐成为一项较成熟的方法。最初卓有成效地把古典概率论引进统计学的是法国天文学家、数学家、统计学家拉普拉斯(P.S.Laplace,1749~1827)。因此,后来比利时大统计学家凯特勒指出,统计学应从拉普拉斯开始。(一)拉普拉斯的主要贡献1、发展了概率论的研究拉普拉斯第一种关于概率论的表述发表于1774年。从1812年起,先后出过四版《概率分析理论》,是他的代表作。书中,拉普拉斯最早系统地把数学分析方法运用到概率论研究中去,建立了严密的概率数学理论。该书不仅总结了他自己过去的研究,而且还总结了前一代学者研究概率论的成果,成为古典概率论的集大成者。2、推广了概率论在统计中的应用由于拉普拉斯是通过结合天文学、物理学的研究来从事概率研究的,所以,他能相当自觉、相当明确地指出:概率论能在广泛范围中应用,能解决一系列的实际问题。他在实际推广中的成绩是多方面的,主要表现在人口统计、观察误差理论和概率论对于天文问题的应用。1809~1812年,他结合概率分布模型和中心极限思想来研究最小二乘法,首次为统计学中这项后来最常用的手段奠定了理论基础。3、明确了统计学的大数法则拉普拉斯认为:“由于现象发生的原因,是为我们所不知或知道了也因为原因繁复而不能计算;发生原因又往往受偶然因素或无一定规律性因素所扰乱,以至事物发展发生的变化,只有进行长期大量观察,才能求得发展的真实规律。概率论则能研究此项发展改变原因所起作用的成份,并可指明成份多少。”这是他通过天文学上的研究后所得的体会。他发现在观察天体运动现象中,当次数足够多时,能使个体的特征趋于消失,而呈现出某种同一现象。他指出这其中一定存在着某些原因,而非出于偶然。4、进行了大样本推断的尝试在统计发展史上,人口的推算问题,多少年来成为统计学家耿耿于怀的难题。直到十九世纪初,拉普拉斯才用概率论的原理迈出了关键的一步。在理论上,1781年拉普拉斯在“论概率”一文中,建立了概率积分,为计算区间误差提供了有力手段。1781~1786年提出“拉普拉斯定理”(中心极限定理的一部分),初步建立了大样本推断的理论基础。在实践上,拉普拉斯于1786年写了一篇关于巴黎人口的出生、婚姻、死亡的文章,文中提出根据法国特定地方的出生率来推算全国人口的问题。他抽选了30个市县,进行深入调查,推算出全国总人口数。尽管其方法和结果还相当粗糙,但在统计发展史上,他利用样本来推断总体的思想方法,为后人开创了一条抽样调查的新路子。\n另一位对概率论与统计学的结合研究上作出贡献的是德国大数学家高斯(C.F.Gauss,1777~1855)。(二)高斯的主要贡献1、建立最小二乘法在学生时代,高斯就开始了最小二乘法的研究。1794年,他读了数学家兰伯特(J.H.Lambert,1728~1777)的作品,讨论如何运用平均数法,从观察值(Yi,xi)中确定线性关系Y=α+βx中的二个系数。1795年,设想了以残差平方和Σ(Yi-a-bxi)2为最小的情况下,求得的a与b来估计α与β。1798年完成最小二乘法的整个思考结构,正式发表于1809年。2、发现高斯分布调查、观察或测量中的误差,不仅是不可避免的,而且一般是无法把握的。高斯以他丰富的天文观察和在1821~1825年间土地测量的经验,发现观察值x与真正值μ的误差变异,大量服从现代人们最熟悉的正态分布。他运用极大似然法及其他数学知识,推导出测量误差的概率分布公式。“误差分布曲线”这个术语就是高斯提出来的,后人为了纪念他,称这分布曲线为高斯分布曲线,也就是今天的正态分布曲线。高斯所发现的一般误差概率分布曲线以及据此来测定天文观察误差的方法,不仅在理论上,而且在应用上都有极重要的意义。 二、近代描述统计学近代描述统计学形成期间大致在十九世纪中叶至二十世纪上半叶。由于这种“描述”特色由一批原是研究生物进化的学者们提炼而成,因此历史上称他们为生物统计学派。生物统计学派的创始人是英国的高尔登(F.Galton,1822~1911),主将是高尔登的学生毕尔生(K.Pearson,1857~1936)。(一)高尔登的主要贡献1、初创生物统计学为了研究人类智能的遗传问题,高尔登仔细地阅读了三百多人的传记,以初步确定这些人中间多少人有亲属关系以及关系的大致密切程度。然后再从一组组知名人士中分别考察,以便从总体上来了解智力遗传的规律性。为了获得更多人的特性和能力的统计资料,高尔登自1882年起开设“人体测量实验室”。在连续六年中,共测量了9337人的“身高、体重、阔度、呼吸力、拉力和压力、手击的速率、听力、视力、色觉及个人的其它资料”,他深入钻研那些资料中隐藏着的内在联系,最终得出“祖先遗传法则”。他努力探索那些能把大量数据加以描述与比较的方法和途径,引入了中位数、百分位数、四分位数、四分位差以及分布、相关、回归等重要的统计学概念与方法。1901年,高尔登及其学生毕尔生在为《生物计量学》(Biometrika)杂志所写的创刊词中,首次为他们所运用的统计方法论明确提出了“生物统计”(Biometry)一词。高尔登解释道:“所谓生物统计学,是应用于生物学科中的现代统计方法”。从高尔登及后续者的研究实践来看,他们把生物统计学看作为一种应用统计学,其研究范围,既用统计方法来研究生物科学中的问题,更主要的是发展在生物科学应用中的统计方法本身。2、对统计学的贡献(1)关于变异变异是进化论中的重要概念,高尔登首次以统计方法加以处理,最终导致了英国生物统计学派的创立。1889年,高尔登把总体的定量测定法引入遗传研究中。高尔登通过总体测量发现,对对象或植物的每一个种别都可以决定一个平均类型。在一个种别中,所有个体都围绕着这个平均类型,并把它当作轴心向多方面变异。这就是他在《遗传的天赋》一书中提出的“平均数离差法则”。(2)关于“相关”统计相关法是由高尔登创造的。关于相关研究的起因,最早是他因度量甜豌豆的大小,觉察到子代在遗传后有“返于中亲”\n的现象。1877年他搜集大量人体身长数据后,计算分析高个子父母、矮个子父母以及一高一矮父母的后代各有多少个高个子和矮个子子女,从而把父母高的后代高个子比较多、父母矮的其后代高个子比较少这一定性认识具体化为父母与子女之间在身长方面的定量关系。1888年,高尔登在“相关及其主要来自人体的度量”一文中,充分论述了“相关”的统计意义,并提出了高尔登相关函数(即现在常用的相关系数)的计算公式。⑶关于“回归”1870年,高尔登在研究人类身长的遗传时发现:高个子父母的子女,其身长有低于他们父母身长的趋势;相反,矮个子父母的子女,其身长却往往有高于他们父母身长的趋势,从人口全局来看,高个子的人“回归”于一般人身长的期望值,而矮个子的人则作相反的“回归”。这是统计学上“回归”的最初涵义。1886年,高尔登在论文“在遗传的身长中向中等身长的回归”中,正式提出了“回归”概念。(二)毕尔生的主要贡献对生物统计学倾注心血,并把它上升到通用方法论高度的是毕尔生。毕尔生的一生是统计研究的一生,他对统计学的主要贡献有:1、变异数据的处理生物统计中所取得的数据常常是零乱的,很难看出其所以然。为此,毕尔生首先探求处理数据的方法,他所首创的频数分布表与频数分布图如今已成为统计方法中最基本的手段之一。2、分布曲线的选配十九世纪以前,人们认为以频数分布描述变异值,最终都表现为正态分布曲线。但是,毕尔生从生物统计资料的经验分布中,注意到许多生物上的度量不具有正态分布,而常常呈偏态分布,甚至倾斜度很大;也不一定都是单峰,也有非单峰的。说明“唯正态”信念并不可靠。1894年,他在“关于不对称频率曲线的分解”一文中首先把非对称的观察曲线分解为几个正态曲线。他利用所谓“相对斜率”的方法得到12种分布函数型,其中包括正态分布、矩形分布、J型分布、U型分布或铃型分布等。后来经R.费雪的进一步研究,毕尔生分布曲线中第Ⅰ、Ⅱ、Ⅲ、Ⅳ及Ⅶ型出现在小样本理论内。尽管,毕尔生的曲线体系的推导方法是缺乏理论基础的,但也给人们不少启迪。3、卡方检验的提出1900年毕尔生独立地又重新发现了分布,并提出了有名的“卡方检验法”(Testof)。毕尔生获得了统计量:=∑(实际次数-理论次数)2/理论次数,并证明了当观察次数充分大时,总是近似地服从自由度为(k-1)的分布,其中k表示所划分的组数。在自然现象的范围内,检验法运用得很广泛。后经R.费雪补充,成为了小样本推断统计的早期方法之一。4、回归与相关的发展回归与相关,经毕尔生进一步作了发展后,这两个出自于生物统计学领域的概念,便被推广为一般统计方法论的重要概念。1896年,他在“进化论的数理研究:回归、遗传和随机交配”一文中得出至今仍被广泛使用的线性相关计算公式:。毕尔生还得出回归方程式:=a+bx(其中a与b根据最小二乘法计算获得),以及回归系数的计算公式:当y随x而变时,∑(x-)(y-)/∑(x-)2;当x随y而变时,∑(x-)(y-)/∑(y-)2。此外,在1897~1905年,毕尔生还提出复相关、总相关、相关比等概念,不仅发展了高尔登的相关理论,还为之建立了数学基础。\n 三、现代推断统计学现代推断统计学形成期间大致是二十世纪初叶至二十世纪中叶。人类历史进入二十世纪后,无论社会领域还是自然领域都向统计学提出更多的要求。各种事物与现象之间繁杂的数量关系以及一系列未知的数量变化,单靠记录或描述的统计方法已难以奏效。因此,相继产生“推断”的方法来掌握事物总体的真正联系以及预测未来的发展。从描述统计学到推断统计学,这是统计发展过程中的一个大飞跃。统计学发展中的这场深刻变革是在农业田间试验领域中完成的。因此,历史上称之为农业试验学派。对现代推断统计的建立贡献最大的是英国统计学家哥塞特(W.S.Gosset,1876~1937)和费雪(R.A.Fisher,1890~1962)。(一)哥塞特的t检验与小样本思想1908年,哥塞特首次以“学生”(Student)为笔名,在《生物计量学》杂志上发表了“平均数的概率误差”。由于这篇文章提供了“学生t检验”的基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。后来,哥塞特又连续发表了“相关系数的概率误差”(1909)、“非随机抽样的样本平均数分布”(1909)、“从无限总体随机抽样平均数的概率估算表”(1917),等等。他在这些论文中,第一,比较了平均误差与标准误差的两种计算方法;第二,研究了泊松分布应用中的样本误差问题;第三,建立了相关系数的抽样分布;第四,导入了“学生”分布,即t分布。这些论文的完成,为“小样本理论”奠定了基础;同时,也为以后的样本资料的统计分析与解释开创了一条崭新的路子。由于哥塞特开创的理论使统计学开始由大样本向小样本、由描述向推断发展,因此,有人把哥塞特推崇为推断统计学的先驱者。(二)R.费雪的统计理论与方法R.费雪一生先后共写作论文329篇。在世界各国流传最广泛的统计学著作是:1925年出版的《供研究人员用的统计方法》、1930年出版的《自然选择的遗传原理》、1935年出版的《试验设计》、1938年与耶特斯合著出版的《供生物学、农学与医学研究用的统计表》、1938年出版的《统计估计理论》、1950年出版的《对数理统计的贡献》、1950年出版的《统计方法和科学推断》等。当时,他在统计学方面居世界领先地位,他的贡献是多方面的。1、“通用方法论”R.费雪非常强调统计学是一门通用方法论,他认为无论对各种自然现象或社会生活现象的研究,统计方法及其计算公式“正如同其它数学科目一样,这里同一公式适用于一切问题的研究”。他指出“统计学是应用数学的最重要部分,并可以视为对观察得来的材料进行加工的数学”。2、“假设无限总体”R.费雪认为,在研究各种事物现象,包括社会经济现象时,必须把具体物质内容的信息舍弃掉,让统计处理的只是“统计总体”。比如说,“如果我们已有关于一万名新兵身长的资料,那么,统计研究的对象不是新兵的整体,而是各种身长尺寸的总体”。显然,R.费雪只是对构成统计总体各因素的某些标志感兴趣而不是各因素的本身。其目的就是为了使问题简化,便于统计上的处理。他在1922年所写的“关于理论统计学的数学基础”一文中,提出了一个重要的概念:“假设无限总体”。“所谓假设的无限总体,即现有的资料就是它的随机样本”。3、抽样分布R.费雪跨进统计学界就是从研究概率分布开始的。1915年,他在《生物计量学》杂志上发表“无限总体样本相关系数值的频率分布”。由于这篇论文对相关系数的一般公式作了论证,对后来的整个推断统计的发展有一定贡献。因此,有人把这篇论文称为现代推断统计学的第一篇论文。1922年,R.费雪导出相关系数r的Z分布,后来还编制了《Z曲线末端面积为0.05、0.01和0.001的Z数值分布表》。1924年,R.费雪对t分布、分布和Z分布加以综合研究,使哥塞特的t\n检验也能适用于大样本,使毕尔生的检验也能适用于小样本。1938年,R.费雪与耶特斯合编了《F分布显著性水平表》,为该分布的研究与应用,提供了方便。4、方差分析、方差和方差分析两词,由R.费雪于1918年在“孟德尔遗传试验设计间的相对关系”一文中所首创。方差分析也称变异数分析,其系统研究开始于1923年R.费雪与麦凯基合写的“对收获量变化的研究”一文中。而于1925年,R.费雪在《供研究人员用的统计方法》中对方差分析以及协方差分析进一步作了完整的叙述。“方差分析法是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术”。方差分析简单实用,大大提高了试验分析效率,对大样本、小样本都可使用。5、试验设计自1923年起,R.费雪陆续发表了关于在农业试验中控制试验误差的论文。1925年他提出随机区组法和拉丁方法,到1926年,R.费雪发表了试验设计方法的梗概;这些方法在1935年进一步得到完善,并首先在卢桑姆斯坦德农业试验站中得到检验与应用,后来又被他的学生推广到许多其它科学领域。6、随机化原则R.费雪在创建试验设计理论的过程中,提出了十分重要的“随机化”原则。他认为这是保证取得无偏估计的有效措施,也是进行可靠的显著性检验的必要基础。所以,他把随机化原则放在极重要的地位,“要扫除可能扰乱资料的无数原因,除了随机化方法外,别无它法。”1938年,他和耶特斯合作编制了有名的FisherYates随机数字表。利用随机数字表保证总体中每一元素有同等被抽取的机会。这样,R.费雪就把随机化原则以最明确、最具体化的形式引入统计工作与统计研究中。R.费雪在统计发展史上的地位是显赫的。这位多产作家的研究成果特别适用于农业与生物学领域,但它的影响已经渗透到一切应用统计学,由此所提炼出来的推断统计学已越来越被广大领域所接受。因此,美国统计学家约翰逊(P.O.Johnson)于1959年出版的《现代统计方法:描述和推断》一书中指出:“从1920年起一直到今天的这段时期,称之为统计学的费雪时代是恰当的”。罗纳德·费雪(SirRonaldAylmerFisher,FRS,1890.2.17-1962.7.29)·现代统计学与现代演化论的奠基者之一·安德斯·哈尔德称他是“一位几乎独自建立现代统计科学的天才”·理查·道金斯则认为他是“达尔文最伟大的继承者”罗纳德·费雪的生平与研究 罗纳德·爱尔默·费雪出生于英国伦敦的东芬利奇(EastFinchley),是七位子女中的老小。父亲乔治·费雪,是一位事业有成的艺术品商人,这使得他的童年生活相当顺遂,并受到其母亲、三位姊姊与一位哥哥的溺爱。不过在他14岁时,母亲卡蒂·费雪过世,18个月后,费雪的父亲因几次不明智的交易,而失去了事业。 费雪是一位早成的学生,16岁正在哈罗公学就读的时候,就已经在一场称为“尼尔德奖章”(NeeldMedal)的论文竞赛中胜出。由于费雪的视力很差,当他学习数学的时候,并不使用纸笔等需要动用视觉的方法。例如,面对几何学问题的时候,并不将其视觉化,而是以代数操作方式处理。除了数学以外,他也对生物学很感兴趣,尤其是演化论。\n剑桥大学冈维尔与凯斯学院宴会厅里的染色玻璃窗,上方的彩绘方格用以纪念拉丁方阵(Latinsquare),下方的白色文字则是为了纪念罗纳德·费雪。 剑桥大学求学时期 1909年,费雪获得奖学金,使其能前往剑桥大学冈维尔与凯斯学院就读,并主修农业。在剑桥的期间,费雪学习到了孟德尔遗传学。这个在1860年代发表的理论,原本早已被人们忽略了数十年,直到20世纪初,才重新被科学家们发现。 费雪感受到生物统计与发展中的各种统计方法,具有一种潜力,能够结合“不连续”的孟德尔定律(例如ABO血型)、“连续”的多基因遗传(例如人类的肤色),以及“渐进式”的达尔文演化论。此外由于对统计学的兴趣,费雪研读了当时两位著名的统计学家,皮尔森(KarlPearson)与戈塞(WilliamGosset,笔名“Student”)所发表的论文。 当时流行的优生学思想,也是费雪所关注的议题。他更将社会上的人口问题,视为包含遗传学与统计学在内的科学。1911年,他与当时的一些名人,如经济学家凯恩斯、遗传学家庞尼特(R.C.Punnett),以及工程师霍勒斯·达尔文(HoraceDarwin,查尔斯·达尔文之子),一起建立了剑桥大学优生学学会(EugenicsSociety)。这是一个活跃的团体,他们每个月开一次会,并在其他主流优生学组织发表演说。例如法兰西斯·高尔登(FrancisGalton)在1909年建立的优生学教育学会(EugenicsEducationSociety)。 1912年,费雪通过了数学学位考试,并且在隔年从剑桥大学毕业。 第一次世界大战时期 1914年,第一次世界大战爆发。费雪和许多英国青年一样,也希望能够加入军队、投入沙场。不过因为他严重的视力问题,即使一试再试,依然无法通过健康检查。由于从军不成,接下来6年他便在伦敦市担任统计员,同时也在几所公立学校里教授物理和数学。例如伯克夏(Berkshire)的布莱德菲尔德学院(BradfieldCollege)。此外,他也曾经搭上英国海军的教学舰艇“渥彻斯特号”(HMSWorcester)。 在英军里担任少校的里奥纳德·达尔文(LeonardDarwin,查尔斯·达尔文另一子)与另一位被费雪称做古德鲁那(Gudruna)的朋友,是他在这个时期的重要支柱,他们的支持使他得以度过困境。古德鲁那的姊妹艾琳·盖尼斯(EileenGuinness),经由古德鲁那的介绍与费雪相识。1917年,艾琳与费雪结婚,当时她只有17岁。此外费雪也受到自家姊妹们的帮助,建立并经营了一所称为布莱德菲尔德庄园的农场,在那里他们种植花圃与饲养动物。由于这座庄园的生计,他们在战争时期能够不需要领取政府的食物配给。 第一次世界大战期间,费雪开始为一本期刊《优生学评论》(EugenicReview)撰写一些复审文章,并在写作期间逐加强对遗传学与统计学研究的兴趣。之后他自愿为此期刊进行所有的复审工作。除此之外,费雪也在里奥纳德·达尔文的雇用下,从事暂时性的工作。 同时在这段期间,他也发表了许多与生物统计相关的论文,包括《孟德尔遗传假定下的亲戚之间的相关性》(TheCorrelationBetweenRelativesontheSuppositionofMendelian\nInheritance)。这篇论文在1916年完成,并在1918年发表,它同时建立了以生物统计为基础的遗传学,以及著名的统计学分法变异数分析(analysisofvariance,简写为ANOVA,也称方差分析)。除了建立统计方法,这篇论文也显示,一些具有连续性变异的遗传特征,可以符合孟德尔遗传定律。在此以前,两者被科学家认为是互相违抗。 罗森斯得实验站时期 1918年战争结束之后,原本皮尔森邀请他进入当时著名的高尔登实验室(GaltonLaboratory),但是由于费雪认为自己与皮尔森之间的竞争关系是一种职业障碍,因此放弃了这个机会。直到1919年,费雪才选择进入一所名为罗森斯得实验站(RothamstedExperimentalStation)的农业试验所。这间农业试验所,位在英格兰赫特福德郡(Hertfordshire)的哈平登(Harpenden)。费雪除了在其中担任一名统计员之外,所长约翰·罗素(JohnRussell)也让他设立了一个统计实验室。 之后费雪便开始对多年来所收集的大量资料进行深入研究,并且将成果写成一系列题为《收成变异之研究》(StudiesinCropVariation)的论文。他的全盛时期也在这时候开始。 接下来的几年中,费雪开始构想新的统计方法,如实验设计法(designofexperiments)。1925年,他的第一本书出版,书名为《研究者的统计方法》(StatisticalMethodsforResearchWorkers)。到了1935年,延续本书的《实验设计》(TheDesignofExperiments)出版。两本书建立了实验设计法的基础,并受到多次翻译与再版。 除了新的统计方法,费雪也将先前的变异数分析研究进行补强与修饰,因而发明出最大似然估计,并发展出充分性(sufficiency)、辅助统计、费雪线性判别(Fisher'slineardiscriminator)与费雪资讯(Fisherinformation)等统计概念。罗纳德·费雪的贡献 罗纳德·费雪的主要贡献有:①用亲属间的相关说明了连续变异的性状可以用孟德尔定律来解释,从而解决了遗传学中孟德尔学派和生物统计学派的论争。 ②论证了方差分析的原理和方法,并应用于试验设计,阐明了最大似然性方法以及随机化、重复性和统计控制的理论,指出自由度作为检查K.皮尔逊制定的统计表格的重要性。此外,还阐明了各种相关系数的抽样分布,亦进行过显著性测验研究。 ③他提出的一些数学原理和方法对人类遗传学、进化论和数量遗传学的基本概念以及农业、医学方面的试验均有很大影响。例如遗传力的概念就是在他提出的可将性状分解为加性效应、非加性(显性)效应和环境效应的理论基础上建立起来的。著作·《研究者用的统计方法》·《统计方法和科学推理》·《近交的理论》\n·《试验设计》·《自然选择的遗传理论》·《根据孟德尔遗传方式的亲属间的相关》 F分布是美國統計學家斯內德克(GeorgeSnedecor)提出的,為了彰顯英國統計學家費雪(R.A.Fisher)對統計的貢獻,以費雪名字開頭的字母,當作這類型分布的名稱。以F分布為基礎,所衍生出的檢定方法,如變方分析中的F檢定及兩族群變方相等性檢定等,都是各領域的學者經常使用的統計檢定。尼曼(Neyman),著名的波蘭統計學家(數學家),出生於一個羅馬天主教的家庭,他的家族是當地貴族的後裔。小時候待過許多不同的國家與城鎮,也因此學會了5種語言(波蘭語,烏克蘭語,俄語,法語及德語)。中學時期,他隨著母親搬到卡爾可夫(俄國),並進入當地的高中就讀。在高中取得優異的成績後進入卡爾可夫大學就讀。剛開始他對物理及數學都很感興趣,但很快的就發現,自己沒有作物理實驗的天份,因此專心修讀數學。 因為卡爾可夫遠離當時學術研究的中心-歐洲,不僅學校老師數學知識陳舊,學校資源亦少,尼曼僅能接受過時的數學基礎教育。尼曼為了跟上當時數學的研究,努力尋找其他知識來源,有一次他的老師推薦他看一篇法國數學家勒貝格(HenriLebesgue)的文章。他一看之後馬上就對勒貝格的論文著迷,他找出一系列勒貝格寫的文章並花了些時間把這些艱澀的論文搞懂。 有一段時間,尼曼非常的崇拜勒貝格但卻無緣見面,直到多年後的一次研討會上,尼曼終於碰到他景仰的對象,他馬上上前與之攀談並表示自己的景仰,沒想到勒貝格僅冷漠的回了幾句話後就逕自離開了,留下錯愕的尼曼。尼曼終其一生都將這件事當作反面教材,他對認識的人都給予關懷與尊重,當任何人講話的時候都專心的聆聽,並給予溫暖的回應。認識他的人都同意他是一個親切又充滿智慧的學者。 尼曼大學畢業後回到波蘭華沙,在華沙的一個農業試驗單位擔任統計學家。之後進入華沙大學擔任助教並在1924年取得博士學位。在1925年接受洛克斐勒獎金的資助前往倫敦,與卡爾皮爾生共同研究,雖然尼曼失望的發現,卡爾皮爾生缺少對現代數學的認識,但也在這個機緣下他認識了卡爾皮爾生的兒子艾根皮爾生,並建立起良好的友誼,為兩人將來一系列重要的合作研究,種下了契機。 在結束倫敦的行程後,尼曼申請延長洛克斐勒獎金,資助他到巴黎與其他學者研究。接下來的一年他在巴黎接觸了許多數學家,興趣也漸漸轉往數學方面。不久他接到來自艾根皮爾生的一封信,尋求T檢定背後的基本原理,他對統計的興趣又再度被激起,著手構思假設檢定的基本原理。在1927年艾根皮爾生來到巴黎,開始與尼曼合作他們的第一篇論文。在1928年,尼曼回到波蘭大學籌組生物統計研究室,並展開一連串與艾根皮爾生的書信往返,他們在信件中討論許多重要的統計問題,藉由相互的提問與質疑,許多困難的問題在兩位大師的腦力激盪下逐漸清晰可解。著名的尼曼-皮爾生定理(Neyman-Pearsonlemma),就是這兩位大師的傑作。 \n1938年尼曼接受了美國加州柏克萊大學的邀請,前往數學系任教,擔任機率跟統計學的教師。當時學校內沒有統計系,僅在數學系內設立一個統計實驗室。尼曼認為為了訓練統計的專業人才,應該將統計獨力於數學系之外,成立一個單一系所。經過多年的努力,甚至遭受數學系的強力反對,在1955年尼曼終於成功的在柏克萊成立了統計系,成為美國傑出統計學家重要的搖籃。 尼曼除了完成許多統計理論的奠基性工作,他對於將統計應用到其他學門,像是氣象學、生物學、社會科學等,也著有貢獻。他所提出的叢集分布(或譯成散播分佈contagiousdistribution),就是生物學上用來描述物種散布情況,最常使用的分布模形之一,還有他早年提出的一篇論文,關於分層抽樣(StratifiedSampling)與立意抽樣(purposiveselection),對於社會學或其他科學研究上使用的抽樣方法有開創性的影響。尼曼所寫的一些關於實驗設計與統計的書籍,也大大的影響了美國食品與藥品管理局(FDA),用來檢測藥品上市的標準流程。