- 2.90 MB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
Chapter1StudentLectureNotes1-描述性统计描述性统计第一章统计学简介第一节统计与统计学第一节统计与统计学一一一、一、、、什么是统计什么是统计第二节统计的发展二二二、二、、、什么是统计学什么是统计学第三节统计数据的类型三三三、三、、、统计学的分科统计学的分科四四四、四、、、统计学与数学的关系统计学与数学的关系第四节统计中的几个基本概念五五五、五、、、统计学与其他学科的关系统计学与其他学科的关系1-11-2描述性统计一一、一一、一、、什么是统计、、什么是统计、什么是统计?描述性统计二二、二二、二、、什么是统计学、、什么是统计学、什么是统计学?Statistics1.统计工作统计学是一门收集、、、、、、整理、、、、、、分析和和和和和和解释数据的方收集数据的活动法科学,,,其目的是探索数据的内在数量规律性,,,,其目的是探索数据的内在数量规律性,其目的是探索数据的内在数量规律性,,,,,,2.统计数据以达到对客观事物的科学认识。。。。。。对现象计量的结果3.统计学分析数据的方法与技术1-31-4描述性统计描述性统计二二、二二、二、、什么是统计学、、什么是统计学、什么是统计学?三三、三三、三、、统计学的分科、、统计学的分科、统计学的分科1.数据收集:::例如::::例如:例如,,,调查与试验,,,,调查与试验,调查与试验统计学的分科2.数据整理:::例如::::例如:例如,,,将数据分组,,,,将数据分组,将数据分组按功能分3.数据展示:::例如::::例如:例如,,,,,,图和表4.数据分析:::例如::::例如:例如,,,回归分析,,,,回归分析,回归分析、、、、、、描述统计推断统计按研究内容分多元统计、、、时间序列、、、、时间序列、时间序列、、、非参数、、、、非参数、非参数统计、、、试验设计、、、、试验设计、试验设计、、、定性数据分、、、、定性数据分、定性数据分析析析、析析析析、析、、、可靠性统计等、、、可靠性统计等可靠性统计等理论统计应用统计1-51-6Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计统计方法1、、描述统计、、描述统计、描述统计1.内容¥¥¥¥¥¥¥¥¥统计方法50搜集数据整理数据描述统计推断统计展示数据252.目的0Q1Q2Q3Q4参数估计假设检验描述数据特征x=30s2=105找出数据的基本规律1-71-8描述性统计描述性统计1、、描述统计、、描述统计、描述统计1、、描述统计、、描述统计、描述统计105105【【【【【【例例例例例例】】】】】】从某大11名学生各科的考试成绩数据9595学经济管理专学生编号业二年级学生课程名称8585中随机抽取1112345678910117575人人人,人人人人,人,,,对,,,对对对对对对对8门主要课程的考试英语76909771709386837885816565成绩进行调查经济数学65955174786391827571555555,,,所得结果如,,,,所得结果如,所得结果如西方经济学9381768866798392788678表表表表表表8。。。试绘制。。。。试绘制。试绘制市场营销学74878569908077849174704545英英经经经经经经财财经经经经基基各科考试成绩财务管理6875708473607681886875英英经经经经市市财财基基基基基基经经经经市市财财基基统统计计Min-Max的批比较箱线基础会计学7073926578879070667968经经西西市市财财基基计计Min-Max图图图,图图图图,图,,,并分析各,,,并分析各并分析各西西市市基基计计25%-75%25%-75%统计学5591687384817069946271计计Medianvalue基基Medianvalue科考试成绩的计算机应用基础8578819570678272808177分布特征88门课程考试成绩的箱线图门课程考试成绩的箱线图1-91-10描述性统计描述性统计1、、描述统计、、描述统计、描述统计1、、描述统计、、描述统计、描述统计10595最小值下四分位数中位数上四分位数最大值857076839097756555Min-Max45学生1学生3学生5学生7学生9学生1125%-75%1111位学生英语成绩箱线图位学生英语成绩箱线图学生2学生4学生6学生8学生10Medianvalue1111名学生名学生88门课程考试成绩的箱线图门课程考试成绩的箱线图1-111-12Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计2、、推断统计、、推断统计、推断统计2、、推断统计、、推断统计、推断统计——参数估计1.与描述统计的区别::::::总体虹桥机场旅客等候出租车的时间将概率引入分析中2.内容旅客等候出租车时间的95%分位数及其95%置信上限(((min)))参数估计假设检验X的点估计15.873.目的X的的的95%的95%95%置信上限95%置信上限17.04对总体特征作出样推断本1-131-14描述性统计描述性统计2、、推断统计、、推断统计、推断统计——假设检验描述统计与推断统计的关系概率论概率论对于现成的数据(((包括分布理论(包括分布理论、、、大数定律、大数定律女士品茶(((包括分布理论(((包括分布理论(包括分布理论、、、大数定律、、、大数定律、大数定律,,,搞清楚数据的,搞清楚数据的和中心极限定理等和中心极限定理等)))))))))来源假设:::该女士并不具有声称的判断能:该女士并不具有声称的判断能力力力,力,,,只是猜测只是猜测推断统计推断统计反映客观现样本数据描述统计描述统计(((利用样本信息和概率(利用样本信息和概率反映客观现(((利用样本信息和概率(((利用样本信息和概率(利用样本信息和概率那么,,,在此假设下,在此假设下,,,10杯都判断正确象的数据(((统计数据的搜集(((统计数据的搜集((((统计数据的搜集(统计数据的搜集统计数据的搜集、、、整、、、整、、、、整、整整整整整整整整整论对总体的数量特征进论对总体的数量特征进象的数据总体数据理理理、理理理、理理理理、理、、、显示和分析等、、、显示和分析等、、、显示和分析等显示和分析等显示和分析等)))))))))行估计和检验等行估计和检验等)))))))))的概率是:::0.510=0.000977若需要我们收集数据,,,必须结合实际问题的背背背总体内在的总体内在的假设检验原理:::在一次试验中,,,小概率事件不会发生,小概率事件不会发生。。。若在一。若在一景景景以及需要的分析结果数量规律性数量规律性个假设下得到了小概率,,,说明该假设不成立,说明该假设不成立!!!设计收集方案1-151-16统计学探索现象数量规律性的过程统计学探索现象数量规律性的过程描述性统计描述性统计例例例:例例例例:例::::::统计保险专业某年级本科毕业生薪资分析1、、、描述性统计、描述性统计:::五数概括:五数概括背景与调查描述统计学专业40人人人:人:::11人直研,,,1人考上研究生,,,1人出国,,,1人人人最大值上四分位数中位数下四分位数最小值打算毕业后考研,,,26人就业。。。统计班80004500380034002800保险班65004500385037003100保险专业40人人人:人:::8人直研,,,1人考上研究生,,,1人出国,,,1人打算毕业后考研,,,1人自主创业,,,28人就业。。。本次调查实际收回问卷54份份份,份,,,其中有效问卷其中有效问卷45份份份,份,,,统计班统计班23份份份,,,保险班,保险班22份份份。份。。。1-171-18Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计1、、、描述性统计、描述性统计:::百分比:百分比、、、条形图、条形图2、、、非参数统计、非参数统计:::Mann-Whitney检验方法——用于比较两总体中位数差异统计班:::87%%%的学生的实际薪水符合自己找工作以前的期望,,,其中有,其中有4个同学的实际薪水超过了期望薪水。。。(((1)))统计专业与保险专业同学薪资的中位数有显著差异吗???保险班:::77%%%的保险班同学找到工作的实际薪水符合自己找无无无!无!!!工作以前的期望,,,其中有,其中有4个同学的实际薪水超过了期望薪水。。。(((2)))分别对两个专业而言)分别对两个专业而言,,,男女的薪资水平有显著差异吗???统计班保险班20无无无!无!!!1510(((3)))上海同学与外地同学薪资有显著差异吗???50有有有!有!!!上海同学薪资明显高于外地同学上海同学薪资明显高于外地同学1-19超过期望等于期望不符合期望1-20描述性统计描述性统计3、、、回归分析、回归分析——建立模型理论统计与应用统计统计班:::薪资=-4.36+0.937P4+7.82I4-1.96SE5+0.600A1+++e1.理论统计研究统计学的一般理论保险班:::薪资=1.45+0.768P4+4.81I4+1.03A1+e研究统计方法的数学原理P4:您对您大学期间的项目经历的满意程度2.应用统计研究统计学在各领域的具体应用I4:对自己的实习表现的满意程度SE5:您认为自己的英文总体水平对统计学未来的猜测:::数据分析::::数据分析:数据分析——休伯1997A1:1-大学期间您有获得过哪些学习类奖励211-22描述性统计描述性统计统计协会和组织四四、四四、四、、统计学与数学的关系、、统计学与数学的关系、统计学与数学的关系(((联系((((联系(联系))))))Internationalstatisticalsocieties:1.统计学运用到大量的数学知识FederationofEuropeanNationalStatisticalSocietiesInstituteofMathematicalStatistics2.数学为统计理论和统计方法的发展提供InternationalBiometricSocietyInternationalSocietyforBayesianAnalysis基础InternationalStatisticalInstitute(ISI)StatisticiansInThePharmaceuticalIndustry(PSI)3.不能将统计学等同于数学Nationalstatisticalsocieties:AmericanStatisticalAssociationRoyalStatisticalSociety(RSSofLondon)中国概率统计学会中国现场统计研究会1-231-24Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计四四、四四、四、、统计学与数学的关系、、统计学与数学的关系、统计学与数学的关系五五、五五、五、、统计学与其他学科的关系、、统计学与其他学科的关系、统计学与其他学科的关系(((区别((((区别(区别))))))1.数学研究的是抽象的数量规律,,,统计学则是,,,,统计学则是,统计学则是1.统计学可以用到几乎所有的学科领域研究具体的、、、实际现象的数量规律、、、、实际现象的数量规律、实际现象的数量规律2.统计学可以帮助其他学科探索学科内在2.数学研究的是没有量纲或单位的抽象的数,,,,,,统计学研究的是有具体实物或计量单位的数的数量规律性据据据据据据3.统计学不能解决各学科领域的所有问题3.统计学与数学研究中所使用的逻辑方法不同4.对统计分析结果的解释需要各学科领域数学研究所使用的主要是演绎的专业人员统计学则是演绎与归纳相结合,,,占主导地位的,,,,占主导地位的,占主导地位的是是是是是是归纳1-251-26描述性统计描述性统计统计学的应用领域应用统计的领域actuarialwork(精算)agriculture(农业)animalscience(动物学)anthropology(人类学)经济学经济学医学医学archaeology(考古学)auditing(审计学)crystallography(晶体学)demography(人口统计学)dentistry(牙医学)ecology(生态学)econometrics(经济计量学)education(教育学)管理学管理学统计学统计学工程学工程学electionforecastingandprojection(选举预测和策划)engineering(工程)epidemiology(流行病学)finance(金融)fisheriesresearch(水产渔业研究)gambling(赌博)genetics(遗传学)社会学社会学..geography(地理学)geology(地质学)historicalresearch(历史研究)humangenetics(人类遗传学)1-271-28描述性统计描述性统计应用统计的领域(续)第二节统计学的产生和发展hydrology(水文学)Industry(工业)linguistics(语言学)literature(文学)manpowerplanning(劳动力计划)人类的统计实践随着早期的记数活动而产生,,,其,其其其managementscience(管理科学)历史可追朔到远古的原始社会。。。marketing(市场营销学)medicaldiagnosis(医学诊断)meteorology(气象学)militaryscience(军事科学)但作为一门系统的科学的统计学,,,距今只有,距今只有300多多多nuclearmaterialsafeguards(核材料安全管理)ophthalmology(眼科学)pharmaceutics(制药学)年年年的历史。。。physics(物理学)politicalscience(政治学)psychology(心理学)psychophysics(心理物理学)qualitycontrol(质量控制)religiousstudies(宗教研究)sociology(社会学)surveysampling(调查抽样)taxonomy(分类学)weathermodification(气象改善)1-291-30Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计第二节统计学的产生和发展第二节统计学的产生和发展1、、、萌芽期、萌芽期(((17世纪中叶-18世纪)))1、、、萌芽期、萌芽期(((17世纪中叶-18世纪)))(((1)))国势学派)国势学派(((又称记述学派(又称记述学派)))(((1)))国势学派(((又称记述学派(又称记述学派)))(((2)))政治算术学派)政治算术学派(((2)))政治算术学派2、、、近代期、近代期(((18世纪末-19世纪末)))2、、、近代期、近代期(((18世纪末-19世纪末)))(((1)))数理统计学派)数理统计学派(((1)))数理统计学派(((2)))社会统计学派)社会统计学派(((2)))社会统计学派3、、、现代期、现代期(((20世纪初至今)))3、、、现代期(((20世纪初至今)))萌芽期近代期现代期萌芽期近代期现代期1-31描述性统计推断统计1-32描述性统计推断统计描述性统计描述性统计统计学发展的三个历史时期统计学发展的三个历史时期一一一、一、、、统计学的萌芽期统计学的萌芽期(((17世纪中叶-18世纪)))一一一、一、、、统计学的萌芽期统计学的萌芽期(((17世纪中叶-18世纪)))(((一(一一一))))国势学派国势学派(((又称记述学派(又称记述学派)))(((二(二二二))))政治算术学派政治算术学派代表人物:::德国的:德国的海尔曼·康令(1606-1681)、、、阿亨代表人物:::英国的:英国的威廉·配第(1623-1687)、、、约翰·格格格瓦尔(((1719-1772)))等)等等等。。。。朗特(1620-1674)等等等。等。。。他们在大学中开设“国势学”采用记述性材料,,,讲述,讲述威廉·配第的代表作《《《政治算术《政治算术》》》对当时的英》对当时的英、、、荷、荷荷荷、、、、国家“显著事项”,,,藉以说明管理国家的方法,藉以说明管理国家的方法。。。特点是。特点是法等国的“国富和力量”进行了数量的计算和比较;;;格;格格格偏重于事物质的解释而忽视量的分析。。。“统计学”一词朗特写出了第一本关于人口统计的著作。。。他们开创了。他们开创了为该学派所首创(statistik→→→statistics),,,但几乎,但几乎“有名从数量方面研究社会经济现象的先例,,,但,但但但“无名有实”1-331-34无实”。。。,,,是,是是是统计学的正统。。。描述性统计描述性统计统计学发展的三个历史时期统计学发展的三个历史时期威廉·配第约翰·格朗特英国古典政治经济学创始人,,,统计学,统计学家家家人口统计学创始人,,,首创,首创寿命表代表作《《《政治算术《政治算术》》》(PoliticalArithmetic)代表作《《《关于死亡表的自然与政治的观察》》》(NaturalandPoliticalObservations认为统计研究的目的是揭示以数量表现的MadeupontheBillsofMortality)社会经济现象的规律性,,,为制定政策提供,为制定政策提供依据;;;运用数量对比的方法对伦敦人口的有关重要指标进行了分析,,,发现了其中的数量规律性,发现了其中的数量规律性研究方法采用以数字、、、重量、重量、、、尺度表现和、尺度表现和比较的方法,,,对社会经济现象进行比较和,对社会经济现象进行比较和主要贡献:::推算。。。威廉。威廉·配第所首创的数量对比分析方1、、、“数据简约”3、、、归纳统计规律法法法为统计学的创立奠定了方法论基础,,,2、、、提出了数据的、提出了数据的可信性问题4、、、生、生命表1-351-36Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计统计学发展的三个历史时期统计学发展的三个历史时期二二二、二、、、统计学的统计学的近代期(((18世纪末-19世纪末)))拉普拉斯天文学家、、、数学家、数学家、、、统计学家、统计学家,,,法国,法国科学院(((一(一一一))))数理统计学派数理统计学派院士,,,天体力学的主要奠基人,,,是,是是是天体演化学学学的创立学的创立者之一,,,是分析,是分析概率论的创始人,,,代表人物:::法国的:法国的拉普拉斯(1794-1827),,,比,比利时的是应用数学的先躯凯特勒(1796-1874)。。。概率论与统计学结合方面的主要成绩有:::(((1)))发)发展了概率论的研究;(2)))推)推广了概拉普拉斯把古典概率论引进统计学,,,发展了概率论,,,率论在统计中的应用;(3)))明确了统计学)明确了统计学推广了概率论在统计中的应用。。。凯特勒把德国的国势中的大数法则;(4)))进行了大)进行了大样本推断的学派、、、英国的政治算术学派和、英国的政治算术学派和意大利、、、法国的古、法国的古典概尝试。。。率论加以融合改造为近代意义的统计学。。。他是数理统。他是数理统计学派的1-37奠基人,,,有,有有有“近代统计学之父”之称。。。1-38描述性统计描述性统计统计学发展的三个历史时期统计学发展的三个历史时期统计学家、、、数学家和、数学家和天文学家,,,二二二、二、、、统计学的统计学的近代期(((18世纪末-19世纪末)))凯特勒“近代统计学之父”:::在人:在人口、、、犯罪问题、、、(((二(二二二))))社会统计学派社会统计学派保险、、、人体测量等、人体测量等领域应用统计学;;;并;并并并将将将概率论引入统计学,,,使得统计学成为近代意义上的科学:::将概率论方法引入人口、、、代表人物:::德国的:德国的克尼斯(1821-1898)、、、恩格尔领土、、、政治、政治、、、农业、、、工业、工业、、、商业、、、道德等(1821-1896)、、、梅尔(1841-1925)等等等。等。。。社会领域和天文、、、气象、、、地理、地理、、、动、动物、、、植植植物等自然领域。。。他们强调统计学是研究社会现象的科学,,,包括统计资料的搜集、、、整理和分析研究,,,目的是,目的是要揭示现象内部“国际统计会议之父”:::发:发起在布鲁塞尔召的联系。。。该学派。该学派强调在统计研究中必须以事物的质为开了首届国际统计学大会,,,对推动统计学,对推动统计学1-39的发展起了作用。。。前提1-40和认识事物质的重40和认识事物质的重40要性。。。描述性统计描述性统计历史上著名的统计学家——高斯历史上著名的统计学家——高斯(((CarlFriedrichGauss,1777-1855)))在德国马克十元纸币上的高斯头像高斯的学术地位,,,历,历来为人们推崇得很高。。。他有“数学王子”、、、“数学家之王”的美称;;;被认为是人类有史以来“最伟大的三位(((或或或四位)))数学家)数学家之一”(((阿基米德、、、牛顿、、、高斯或加上欧拉)。http://genealogy.math.ndsu.nodak.edu/id.php?id=18231&fChrono=11-411-42Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计高斯与正态分布高斯与正态分布16世纪,,,著,著名的丹麦天文学家第谷(((TychoBrahe)))在天体观测中记录了大量数据,,,他发现让其助手独立地对某一天文量进行重复观测,,,结果都会有些不同,结果都会有些不同,,,说明,说明存在观测误差。。。伟大的天文学家伽利略(((G.Galileo,1564-1642)))指出:::(((1)))所有)所有观测值都可以有误差,,,其来源,其来源可归因于观测者、、、仪器工具以及观测条件;;;(((2)))观测误差对称地分布在0的两侧;;;(((3)))小)小误差出现得比大误差更频繁。。。高斯给出了比较完满的结果,,,推得,推得误差分布为正态分布,,,发表,发表于于于1809年其数学和天体力学的名著《《《绕日天体运动的理论》》》中》中中中。。。。1-431-44天文学家是最初的一代数理统计学家。。。描述性统计描述性统计高斯与正态分布正态分布参数的含义µσ−µµσ+标准差,,,反映离散程度均值,,,反映中心位置µ不同σ不同1-45高斯分布曲线1-46描述性统计描述性统计高斯与正态分布正态分布的应用实例之1:::6西格玛管理正态分布的例子:::产品指标值与标准之间的差异,,,往往服从正态分布;;;核心:::减小西格玛:减小西格玛下规格线上规格线一个班全体同学的一门功课的成绩,,,往往服从正态分布;;;准妈妈的怀孕期大致服从均值为266天天天,,,标准差为16天天天的正态分布;;;“IQ测验”中中中,中,,,20-34岁年龄组的分数大致是均值为110、、、标准差为25的正态分布;;;1-471-48Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-正态分布参数σ的含义描述性统计描述性统计正态分布的例子之2:::标准分251.0µ=,2σ=620观测值平均−数标准分=15标准差LSLUSL10标准分就是将成绩转换到均值为0,,,标准差为11.0µ=,2σ=的正态分布(((称为(称为标准正态分布)))下下下。。。35µ=,2σ=1.0因此,,,各,各个科目成绩的标准分是在同一个衡量尺度下,,,可以比较,可以比较,,,可以,可以相加等。。。01.61.71.81.922.12.22.32.42.51-491-50描述性统计描述性统计历史上著名的统计学家ThebirthpaperofChi-SquareDistribution卡尔·皮尔逊(KarlPearson1857-1936)伟大的统计学家、、、生物学家、生物学家,,,现代统计科学的创立者,现代统计科学的创立者在伦敦大学主持“高尔登实验室”,,,主要进行遗传,主要进行遗传学学学、学、、、优生学优生学、、、生物学方面的研究工作、生物学方面的研究工作。。。主要贡献:::(((1)))在应用实践中发展了统计理论)在应用实践中发展了统计理论,,,如矩估计,如矩估计、、、卡方分布、卡方分布、、、相关分析、相关分析、、、回归分析等等等(((2)))为统计人才培养做了突出贡献)为统计人才培养做了突出贡献http://genealogy.math.ndsu.nodak.edu/id.php?id=301761-511-52描述性统计统计方法——回归分析描述性统计统计方法——回归分析RegressionAnalysisRegressionAnalysis统计班:::薪资=-4.36+0.937P4+7.82I4-1.96SE5+0.600A1+++e“回归”的含义保险班:::薪资=1.45+0.768P4+4.81I4+1.03A1+e回归分析:::是一个:是一个模型,,,说明自,说明自变量是如何影响因变量P4:您对您大学期间的项目经历的满意程度I4:对自己的实习表现的满意程度SE5:您认为自己的英文总体水平1-53A1:1-大学期间您有获得过哪些学习类奖励54Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计统计学发展的三个历史时期统计学发展的三个历史时期三三三、、、统计学的现代期、统计学的现代期(((20世纪初至今)))三三三、、、统计学的现代期、统计学的现代期(((20世纪初至今)))统计学的主流从描述统计学转向推断统计学。。。费歇尔:::极大似然估计、、、方差分析、方差分析、、、F统计量1908年年年,年,,,戈赛特(W.S.Gosset,1867-1937)提出奈曼和和和皮尔逊:::置信区间估计和假设检验了小样本t统计量理论,,,表明可以,表明可以通过抽取少量产品瓦尔德:::序贯分析和统计决策函数作为样本而对全部产品质量做统计推断。。。这个理论标志着统计学进入现代统计学阶段。。。构成了现代统计学的基本框架。。。20世纪30年代,,,费歇尔(R.A.Fisher,1890-1962)的推断统计理论标志着现代数理统计学的确立。。。1-551-56描述性统计描述性统计历史上著名的统计学家历史上著名的统计学家罗纳尔多·费歇尔(RonaldAylmerFisher1890-1962)“费歇尔是使统计学成为一门有坚实理论基础并获得广泛应用的主要统计学家之一.”──摘自《《《中国大百科全书《中国大百科全书》》》(》(((数学卷数学卷)))伟大的统计学家、、、优生学家、优生学家、、、遗传学家、遗传学家主要贡献:::(((1)))在应用实践中发展了统计理论)在应用实践中发展了统计理论:::极大似然估计、、、试验设计、、、方差分析、方差分析、、、F统计量等等等(((2)))人才培养)人才培养1-571-58描述性统计描述性统计统计方法——试验设计统计方法——极大似然估计MaximumLikelihoodEstimateDesignofExperiment极大似然估计的思想:::养猴人心中暗笑:::“朝四暮三和朝三暮四,,,不是都等于,不是都等于七吗???这畜牲就是不如人聪明。。。”寻找一个估计值,,,使得其与样本结果相符的概率最大。。。猴子们窃窃私语:::“朝四暮三和朝三暮四,,,虽然吃到肚子里都等于七,,,但朝四暮三更符合早吃饱、、、晚吃少的科学道理,,,不信,不信去问问费歇尔。。。人。人虽然比我们聪明,,,但没学过统计的人,,,智商例例例:::一个枪法好的猎人和一个枪法差的小孩各带了一把猎枪一还真不如我们高”。。。起去打猎。。。他们同时看见几米远处有一只野兔,,,只,只听一声枪响,,,野兔被射中了。。。若。若由你猜测,,,你认为是谁开的这一枪。。。——纪宏、、、袁卫新编《《《齐物论》》》1-591-60Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计统计方法——试验设计描述性统计统计方法——试验设计DesignofExperimentDesignofExperiment例例例例例例磁鼓电机是彩色录像机磁鼓组件的关键部件之一,,,,,,按质量最初由英国著名统计学家R.A.Fisher经过大量的农田试验实要求其输出力矩应大于210g.cm。。。。。。某生产厂过去这项指标的践后提出,,,于,于于于1935年出版了《《《TheDesignofExperiments》》》。》。。。合格率较低,,,,,,从而希望通过试验找出好的条件,,,以提,,,,以提,以提高磁鼓电机的输出力矩。。。。。。试验设计的作用:::通过设计,,,得到,得到试验量小、、、可以分析出因子是否有影响及影响程度如何的试验方案。。。一二三-4日本最早普遍应用试验设计于各生产领域。。。A:::充磁量:充磁量(((10T)))90011001300(((W.EdwardsDeming)))B:::定位角度:定位角度((((πππ101112/180)rad)))C:::定子线圈匝数:定子线圈匝数(((匝(匝匝匝))))7080901-611-62描述性统计统计方法——试验设计描述性统计历史上著名的统计学家DesignofExperiment3爱根·皮尔逊(EgonSharpePearson1895-1980)57C统计学家3试验点9均匀分主要贡献:::假设检验、、、区间估计2------------------------------(((与(与与与Neyman合作)))布布布!布布布布!布!!!!!!C246B38B21C1AAAB11-631231-64描述性统计统计方法——假设检验描述性统计统计方法——区间估计HypothesisTestIntervalEstimate假设检验原理:::小概率事件在一次抽样中是不可能出现的,,,奥巴马支持率的置信度为95%%%的%的区间估计为:::若从某一假设出发得到了一个小概率,,,说明该假设不成立,说明该假设不成立。。。[68%-3%,68%+3%]=[65%,71%]假设检验步骤:::美国盖洛普民意调查机构24日公布民众对总统奥巴马上任以来1、、、提出两个对立、提出两个对立互斥的假设2、、、收集、收集样本,,,计算检验统计量,计算检验统计量数日工作情况的满意程度。。。结果显示。。。。结果显示。结果显示,,,大,,,,大,大约68%%%%%%的民众给奥巴3、、、做出结论(((拒绝其中一个假设)))马打出高分。。。。。。假设检验例子:::盖洛普的调查从21日开始,,,,,,至至至至至至23日结束,,,,,,覆盖奥巴马20日上任(((1)))女士)女士品茶后的第一至第三个整天,,,,,,共有1591名成年人接受调查。。。。。。盖洛普(((2)))六连号事件(((3)))阿布兹诺特(((JohnArbuthnott,,,1667---1735)))《)《《《从两性方面说,,,调查的,,,,调查的,调查的误差率为上下3个百分点。。。。。。出生数1-65观察的规律性所得关于神的意旨存在的一个论据》》》1-66Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计历史上著名的统计学家历史上著名的统计学家威廉·戈赛特(WilliamSGosset1876-1937)化学家、、、数学家、数学家、、、统计学家、统计学家“统计学中的法拉第”,,,具有相似的把握普遍原,具有相似的把握普遍原理的能力,,,并能通过实际运用进一步发展原理,并能通过实际运用进一步发展原理。。。主要贡献:::发现了t分布,,,开启了小样本理论研,开启了小样本理论研究究究,究,,,使统计学使统计学进入现代统计学阶段。。。1-671-68描述性统计描述性统计历史上著名的统计学家历史上著名的统计学家奈曼(JerzyNeyman1894-1981)瓦尔德(AbrahamWald1902~~~1950)统计学家主要贡献:::统计学家1、、、统计理论、统计理论:::统计决策理论、、、序贯分析主要贡献:::(((1)))统计理论)统计理论:::假设检验:假设检验、、、区间估计、区间估计2、、、统计、统计应用(((与(与与与EgonPearson合作)))(((2)))促进了美国统计的发展)促进了美国统计的发展,,,使统计研究,使统计研究1-69中心逐渐从英国转移至美国1-70描述性统计描述性统计统计方法——统计决策理论统计方法——序贯分析StatisticalDecisionTheorySequentialAnalysis例例例:::某人有一笔资金,可投入两个项目:房地产和开商店,其收益传统抽样检验方法:::根据抽样精度要求确定好样本量,,,然然然都与市场状态有关.若把未来市场划分为好、、、中、中中中、、、、差差三个等级后抽样作检验。。。,,,其发生的概率分别为,其发生的概率分别为0.2,0.7,0.1...通过调查,,,该人认为,该人认为购置房地产的收益X(((万元)))和)和开商店的收益Y(((万元)))的分)的分布如序贯抽样检验方法:::事先不确定样本量,,,抽一个(((些(些些些))))作作作作下下下:下:::检验,,,看是否可作判断,,,若,若可则停止抽样,,,若不,若不可则继续X113-3Y64-1抽样,,,直到,直到可作判断。。。平均来看,,,可节省样本量,,,特别适用于高成本、、、毁灭性检验。。。概率0.20.70.1概率0.20.70.1冒险型:::最小:最小损失最小化保守型:::最大:最大损失最小化1-711-72风险中性:::平均损失最小化Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计统计学发展的三个历史时期中国统计三三三、、、统计学的现代期、统计学的现代期(((20世纪初至今)))中国统计历史悠久,,,但,但发展相对欧美是滞后的!!!60年代以后统计学发展有三个明显趋势:::1...统计学依赖和吸收数学更多;;;汉语中“统计”原为合计或汇总计算的意思。。。在。在东汉时期称统计2...以统计学为基础的边缘学科不断形成;;;为为为通计,,,在,在南北朝时期称统计为总计。。。至清亁隆十二年(((公元3...与电子计算机技术相结合,,,应用,应用范围更广,,,作,作作作1747年年年),开始使用“统计”一词。。。用更大。。。1-731-74描述性统计描述性统计中国统计中国统计早在四千多年的夏王朝,,,统计工作,统计工作就有了。。。《。《《《尚尚尚书书书·禹贡》》》这篇文章把当时的中国分为九州,,,分别,分别叙周王朝时期,,,在统计方面,在统计方面更为完善,,,不仅制定了乡述了各地的物产、、、交通、、、植物特征等情况,,,又,又依照土的的的定期报表制度,,,在统计方法上,在统计方法上还应用了专门调质不同,,,按,按照复合分组的方式把田地及贡赋分为九查查查,,,统计,统计图示及帐册,,,当时的中国人,当时的中国人就知道并运用等等等,等,,,这种描述与十七世纪德国的国势学派对一个国家了了了统计分组、、、平均数、、、相对数等近代统计方法。。。国情的记述是很相似的,,,但,但前者较后者早了近两千年。。。1-751-76描述性统计描述性统计中国统计中国统计中国统计滞后的原因:::汉代司马迁在《《《史记《史记》》》中多》中多次用到统计表;;;1、、、中国、中国没有经历资本主义社会,,,商品经济没有形晋代在在在分组上所采用的两端开口组;;;成一种社会经济形态;;;2、、、自秦汉以来,,,中国,中国成为大一统的封建国家,,,没没没宋代中位数的应用等等。。。有欧洲诸国间横向比较的压力;;;3、、、主体上,,,中国的,中国的知识分子以登科入仕为目标,,,这一切远远走在当时的西欧诸国之前!!!忽略自然科学、、、社会科学的研究、社会科学的研究;;;4、、、新中国,,,由于受前苏联影响,,,中国统计学,中国统计学缺乏生机,,,进,进步迟缓。。。1-771-78Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计中国统计目前,,,中国统计在理论与应用上,中国统计在理论与应用上发展迅速,,,充满生机机机。机。。。但在但在很多方面与国际一流水平还存在差距。。。需需需中国统计教育要大家一起努力!!!来看看中国统计教育。。。1-791-80描述性统计描述性统计迅速发展的中国统计学高等教育2012年全国高校统计学排名1-811-82描述性统计描述性统计USnews2013美国统计学专业排名情况第三节数据的计量与类型RankSchoolnameScore111StanfordUniversity,StanfordUniversity,CAStanfordUniversity,CACACA4.94.9222UniversityofCalifornia—Berkeley,CA4.74.7一一一一一一.数据的计量尺度333HarvardUniversity,MA4.64.6333UniversityofWashington,Seattle,WA4.64.6二二二二二二.数据的类型和分析方法555JohnsHopkinsUniversity,Baltimore,MD4.44.4666HarvardUniversity,MA4.34.3666UniversityofChicago,IL4.34.3666UniversityofWashington,Seattle,WA4.34.3999CarnegieMellonUniversity,Pittsburgh,PA4.14.1101010DukeUniversity,Durham,NC4441-10101083UniversityofNorthCarolinaUniversityofNorthCarolina--UniversityofNorthCarolina------ChapelHillChapelHill4441-84ChapelHill,NCStatistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计1.定类尺度一一、一一、一、、数据的计量尺度、、数据的计量尺度、数据的计量尺度(nominalscale,,,又称类别尺度,,,,又称类别尺度,又称类别尺度)最粗略、、、计量层次最低、、、、计量层次最低、计量层次最低数据的四种计量尺度按照事物的某种属性对其进行平行的分类或分组各类别可以指定数字代码表示,,,数据表现,,,,数据表现,数据表现为为为为为为“类别”。。。如。。。。如。如如如:如如如:::::::“1”代表男,,,,,,“2”代表女定类尺度定序尺度定距尺度定比尺度使用时必须符合类别穷尽和和和和和和互斥的要求具有=或或或或或或≠≠≠≠≠≠的数学特性1-851-86描述性统计2.定序尺度描述性统计3.定距尺度(ordinalscale,,,又称顺序尺度,,,,又称顺序尺度,又称顺序尺度)(intervalscale,,,又称间隔尺度,,,,又称间隔尺度,又称间隔尺度)是对事物之间等级差或或或或或或顺序差别的测度对事物的准确测度,,,比定序尺度精确,,,,比定序尺度精确,比定序尺度精确对事物分类的同时给出各类别的顺序,,,,,,数据表现为“数值”,,,,,,如如如:如如如如:如:::考试成绩:::考试成绩考试成绩、、、温度、、、、温度、温度如如如:如如如如:如:::优:::优优优优、优优优、、、、良、、、良良良良、良良良、、、、中、、、中中中中、中中中、、、、差、、、差差差差差差差没有绝对零点比定类尺度精确具有+或或或或或或-的数学特性未测量出类别之间的准确差值数据表现为“类别”,,,但,,,,但,但但但但但但有序具有>或或或或或或<的数学特性1-871-88描述性统计4.定比尺度描述性统计四种计量尺度的比较(ratioscale,,,又称比率尺度,,,,又称比率尺度,又称比率尺度)对事物的准确测度,,,与定距尺度处于同一,,,,与定距尺度处于同一,与定距尺度处于同一四种计量尺度的比较层次,,,一般二者可不作区分,,,,一般二者可不作区分,一般二者可不作区分计量尺度定类尺度定序尺度定距尺度定比尺度有绝对零点,,,,,,“0”表示“没有”或或或或或或“不存在”数学特性如如如:如如如如:如:::收入:::收入收入、、、产量、、、、产量、产量分类(=,≠≠≠)≠)))√√√√√√√√√√√√排序(((<,,,>)√√√√√√√√√具有+、、、、、、-、、、、、、××××××、、、、、、÷÷÷÷÷÷的数学特性间距(((+,,,-)))√√√√√√比值(((×(×××,,,,÷÷÷÷))))√√√“√√√”表示该尺度所具有的特性1-891-90Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计二二、二二、二、、数据类型和分析方法、、数据类型和分析方法、数据类型和分析方法其他分类方法数据类型与统计方法数据类型与统计方法•按数据收集方法::::::观测数据::::::定类数据定类数据定序数据定序数据定距数据定距数据定比数据由调查或观测得到,,,无人为,,,,无人为,无人为控制如如如如如如,,,各,,,,各,各种经济数据定性数据定性数据定量数据实验数据((品质数据品质数据))))))(数量数据)在设计试验中收集,,,有人为,,,,有人为,有人为控制如新药疗效试验定性数据分析定性数据分析其他统计方法1-911-92描述性统计描述性统计其他分类方法变量及其类型•按被描述的现象与时间的关系::::::变量的定义::::::用来说明总体某种特征的量。。。。。。截面数据((((((cross-sectionaldata):如如如如如如::::::某种产品的等级、、、、、、2008年中国人均月收入如如如如如如,,,,,,2012年全国各地GDP统计数据是统计变量的具体表现。。。。。。时间序列数据((((((timeseries/longitudinaldata))))))如如如如如如,,,,,,2010-2013全国各地GDP1-931-94描述性统计描述性统计变变变变变变量量量量量量(variable)第四节统计中的几个基本概念定性变量定量变量1.总体(Population)(qualitativevariable)(quantitativevariable)定义::::::要研究的所有个体的集合分类变量顺序变量数值变量例如::::::(categorical(rank(metric1、、、中国进行人口、、、、中国进行人口、中国进行人口普查,,,,,,那么全国各地所有的人variable)variable)variable)组成的集合就是一个总体;;;;;;2、、、、、、要了解一批灯泡的寿命,,,,,,那么这批灯泡(((的((((的(的的的的的的寿命)))的))))的)的全体就是一个总体。。。。。。离散变量连续变量1-95(discretevariable)(continuousvariable)1-96Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计第四节统计中的几个基本概念第四节统计中的几个基本概念1.总体(Population)1.总体(Population)分为::::::有限总体(finitepopulation)分为::::::有限总体(finitepopulation)例例例:例例例例:例::::::1、、、、、、全国人口抽样中每次抽取一般不独立2、、、一、、、、一、一批灯泡(((的((((的(的寿命))))))主要在抽样调查中讨论无限总体(infinitepopulation)无限总体(infinitepopulation)例例例:例例例例:例::::::1、、、某、、、、某、某厂生产的所有灯泡:::可::::可:可看作无限抽样中每次抽取是独立的的的的的的2、、、一、、、、一、一条河中的所有水滴:::可::::可:可看作无限多数统计课程是针对无限总体的1-971-98描述性统计描述性统计第四节统计中的几个基本概念第四节统计中的几个基本概念2.样本(Sample)3.参数(Parameter)总体的数字特征,,,,,,,,,,,,如合格品率一般是未知的常数定义:::从总体中抽取的一部分元素的集合::::从总体中抽取的一部分元素的集合:从总体中抽取的一部分元素的集合4.统计量(Statistic)样本的概括性测度值只要有了样本,,,,,,,,,,,,就能计算出来用于估计参数,,,,,,,,,,,,譬如用样本均值x估计总体均值µ1-991-100描述性统计描述性统计几种常用的统计软件RTheRProjectforStatisticalComputing常用统计软件RSASSPSSwww.r-project.orgSTATISTICAMINITABMINITABSASExcelSTATISTICASPSSExcel1-1-101102Statistics,6/e?1997Prentice-Hall,Inc.\nChapter1StudentLectureNotes1-描述性统计描述性统计SASSPSS“StatisticalAnalysisSystem”“StatisticalPackagefortheSocialSciences”,,,——“社会科学统计软件包”SAS系统是一个功能非常齐全、、、应用、应用极广、、、适用“StatisticalProductandServiceSolutions”性很强、、、使用灵活、、、易于操作的综合软件系统。。。——“统计产品与服务解决方案”。。。作为一个组合软件系统,,,SAS划分为不同模块。。。StatisticalPackageforStupidStudents我们主要采用SAS/BASE和和和SAS/STAT模块。。。SPSS菜单功能比较强,,,可以不用编程就能采用统计方法处理问题。。。1-1-103104Statistics,6/e?1997Prentice-Hall,Inc.