- 2.31 MB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
统计学作者:中国人民大学统计学院贾俊平PowerPoint统计学\n第1章导论作者:中国人民大学统计学院贾俊平PowerPoint统计学\n课程的安排和要求共16周课时,安排2次上机课学生参与课堂练习考勤和作业占总评成绩的30%\n泰坦尼克沉没时,遵循妇女和儿童优先的原则了吗?比较男人中幸存者的概率P1和妇女与儿童中幸存者的概率P2。P1=0.196P2=0.704\n肖洛霍夫(1905-1984)出生在顿河维申斯克镇,1926年,他开始创作史诗性长篇小说《静静的顿河》,1940年完成。小说引起了极大的反响。肖洛霍夫因此获得1965年诺贝尔文学奖。《静静的顿河》是不是抄袭?\n捷泽把《静静的顿河》四卷本同肖洛霍夫、克留柯夫这两人的其他在作者问题上没有疑义的作品都进行分析,捷泽等学者从《静静的顿河》中随机地挑选出2000个句子,再从肖洛霍夫、克留柯夫的各一篇小说中随机地挑先500个句子,总共3组样本,3000个句子,输入计算机进行处理。处理的步骤如下:\n手相和寿命有关系吗?一些人相信手掌中生命线的长度可以预测人的寿命。一位研究者在《美国医学协会学报》上发表的一封信中,通过对尸体的研究对此给与了驳斥。他记录了死亡者的年龄与生命线的长度。结果表明,死亡年龄与生命线的长度不存在显著相关。\n佛罗伦斯•南丁格尔与统计学\n第1章导论1.1什么是统计学?1.2统计数据的类型1.3统计中的几个基本概念\n学习目标1.理解统计学的含义2.理解统计数据与统计学的关系3.了解统计学的应用领域4.了解数据的类型5.理解统计中的几个基本概念\n1.1什么是统计学?统计学与统计规律统计的应用领域历史上著名的统计学家\n什么是统计学?1.数据搜集:取得数据2.数据分析:分析数据3.数据表述:图表展示数据数据解释:结果的说明收集、分析、表述和解释数据的科学\nstatistics的定义(不列颠百科全书)statistics:thescienceofcollecting,analyzing,presenting,andinterpretingdata.Copyright1994-2000EncyclopaediaBritannica,Inc.(不列颠百科全书)\n统计研究的过程收集数据(取得数据)整理数据(处理数据)解释数据(结果说明)分析数据(研究数据)实际问题\n统计规律(一些例子)正常条件下新生婴儿的性别比为107:100投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/6农作物的产量与施肥量之间存在相关关系\n统计方法统计方法描述统计推断统计参数估计假设检验\n描述统计(descriptivestatistics)内容搜集数据整理数据展示数据描述性分析目的描述数据特征找出数据的基本规律02550Q1Q2Q3Q4¥x=30s2=105\n推断统计(inferentialstatistics)内容参数估计假设检验目的对总体特征作出推断样本总体\n描述统计与推断统计的关系反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等)概率论(包括分布理论、大数定律和中心极限定理等)描述统计(统计数据的搜集、整理、显示和分析等)总体数据样本数据\n统计的应用领域统计学经济学管理学医学工程学社会学…\n统计的应用领域actuarialwork(精算)agriculture(农业)animalscience(动物学)anthropology(人类学)archaeology(考古学)auditing(审计学)crystallography(晶体学)demography(人口统计学)dentistry(牙医学)ecology(生态学)econometrics(经济计量学)education(教育学)electionforecastingandprojection(选举预测和策划)engineering(工程)epidemiology(流行病学)finance(金融)fisheriesresearch(水产渔业研究)gambling(赌博)genetics(遗传学)geography(地理学)geology(地质学)historicalresearch(历史研究)humangenetics(人类遗传学)\n统计的应用领域hydrology(水文学)Industry(工业)linguistics(语言学)literature(文学)manpowerplanning(劳动力计划)managementscience(管理科学)marketing(市场营销学)medicaldiagnosis(医学诊断)meteorology(气象学)militaryscience(军事科学)nuclearmaterialsafeguards(核材料安全管理)ophthalmology(眼科学)pharmaceutics(制药学)physics(物理学)politicalscience(政治学)psychology(心理学)psychophysics(心理物理学)qualitycontrol(质量控制)religiousstudies(宗教研究)sociology(社会学)surveysampling(调查抽样)taxonomy(分类学)weathermodification(气象改善)\n彩票与统计一种福利彩票,是从01、02……35等35个数字中,投注7个数字。摇奖时,7个数字全对的,为特等奖,不考虑顺序的不重复纯随机抽样的可能样本数目为6724520。要中特等奖,只有六百七十二万四千五百二十分之一的偶然机会。\n你需要花多少钱,才能一定中特等奖?6724520×2=13449040元\n历史上著名的统计学家JacobBernoulli(伯努利)(1654-1705)EdmondHalley(哈雷)(1656-1742)DeMoivre(棣美佛)(1667-1754)ThomasBayes(贝叶斯)(1702-1761)LeonhardEuler(欧拉)(1707-1783)PierreSimonLaplace(拉普拉斯)(1749-1827)AdrienMarieLegendre(勒让德)(1752-1833)ThomasRobertMalthus(马尔萨斯)(1766-1834)ThomasRobertMalthus(马尔萨斯)PierreSimonLaplace(拉普拉斯)LeonhardEuler(欧拉)\n历史上著名的统计学家FriedrichGauss(高斯)(1777-1855)JohannGregorMendel(孟德尔)(1822-1884)KarlPearson(皮尔森)(1857-1936)RonaldAylmerFisher(费歇)(1890-1962),JerzyNeyman(1894-1981)EgonSharpePearson(皮尔森)(1895-1980)WilliamFeller(费勒)(1906-1970).FriedrichGauss(高斯)JohannGregorMendel(孟德尔)\n分类数据、顺序数据、数值型数据观测数据和实验数据截面数据和时间序列数据1.2统计数据的类型\n什么是统计数据?(data)对现象进行计量的结果不是指单个的数字,而是由多个数据构成的数据集不仅仅是指数字,它可以是数字的,也可以是文字的\n统计数据的分类统计数据的分类按计量层次分类的数据顺序的数据数值型数据按时间状况截面的数据时序的数据按收集方法观察的数据试验的数据\n统计数据的分类(按计量尺度分)分类数据(categoricaldata)对事物进行分类的结果数据表现为类别,用文字来表述例如,人口按性别分为男、女两类顺序数据(rankdata)对事物类别顺序的测度数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等数值型数据(metricdata)对事物的精确测度结果表现为具体的数值例如:身高为175cm、168cm、183cm\n统计数据的分类(按收集方法分)观测的数据(observationaldata)通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据试验的数据(experimentaldata)在试验中控制试验对象而收集到的数据比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据\n统计数据的分类(按时间状况分)截面数据(cross-sectionaldata)在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况比如,2002年我国各地区的国内生产总值数据时间序列数据(timeseriesdata)在不同时间上收集到的数据描述现象随时间变化的情况比如,1996年至2002年国内生产总值数据\n1.3统计中的几个基本概念总体和样本参数和统计量变量\n总体和样本总体(population)所研究的全部元素的集合,其中的每一个元素称为个体分为有限总体和无限总体有限总体的范围能够明确确定,且元素的数目是有限的无限总体所包括的元素是无限的,不可数的样本(sample)从总体中抽取的一部分元素的集合构成样本的元素的数目称为样本容量\n研究某个班学生的学习情况总体:全班所有的学生总体单位:每一个学生某市的工业生产情况总体:所有的工业企业总体单位:每一个工业企业某市的工业生产设备情况总体:所有的工业生产设备总体单位:每一台工业生产设备\n总体与总体单位的相对性研究目的总体总体单位北京物资学院教学情况北京物资学院的教师每一位教师北京高校的教学情况所有高校每一所高校\n1.同质性2.大量性3.差异性4.客观性四个特征必须同时具备才能构成总体(二)总体的特点\n(三)总体的分类按构成总体的总体单位是否可以计量,总体分为:有限总体和无限总体。社会经济现象均为有限总体\n二、样本与样本单位(一)样本与样本单位的概念按随机原则从总体中抽出的部分单位构成的整体是样本(sample)。构成样本的每一个单位是样本单位(sampleunite)。\n(二)样本与总体的关系样本单位是总体单位;样本具有总体的特征(带来总体的信息);总体具有唯一性,样本具有随机性。\n三、标志和变量(一)标志及其表现标志是说明总体单位特征的概念,所以也称为单位标志或单位标识。在统计调查中称为调查项目或登记项目。例如:某企业工人的月工资学生的数学课的成绩学生的性别\n标志标志的具体表现品质标志经济类型性别国有男数量标志职工人数身高1000人1.75m属性数值根据标志表现的不同,标志可以分为品质标志和数量标志。\n根据一个总体内标志表现是否相同,标志可以分为可变标志和不变标志。我国公民的国籍:中国籍我国公民的年龄:0——150岁之间变动\n(二)变量及其取值变量是可变的数量标志,变量所取的值是变量值。例如:甲、乙、丙三人,年龄和性别如下:甲56岁男,乙35岁女,丙59岁女请问:甲、乙、丙三个人的性别是变量吗?\n变量(Variable)说明现象某种特征的概念如商品销售额、受教育程度、产品的质量等级等变量的具体表现称为变量值,即数据变量可以分为分类变量(categoricalvariable):说明事物类别的一个名称顺序变量(rankvariable):说明事物有序类别的一个名称数值型变量(metricvariable):说明事物数字特征的一个名称离散变量:取有限个值连续变量:可以取无穷多个值\n根据变量的取值是否连续,变量分为:连续型变量和离散型变量连续型变量:取值可以连续,既可以用整数表示,又可以用小数表示。人的身高,体重,成本,收入离散型变量:只能用整数表示。人口数、汽车数量。\n变异变异:标志或指标具体表现的差别属性变异:如性别标志表现为男、女数值变异:如年龄标志表现为20岁、25岁、30岁等\n四、统计指标和指标体系(一)统计指标1.统计指标的含义统计指标简称为指标反映总体数量特征的概念和具体数值。2000年11月1日零时我国大陆人口总数(指标名称)126583万人(指标数值)任何统计指标都包括(六要素)指标名称、指标数值、计量单位、时间限制、空间限制、计算方法。\n2.统计指标的特点(1)数量性用数值表示我国2003年国内生产总值116694亿元我国2003年粮食产量43067万吨\n(2)综合性统计指标反映的对象是总体,不是总体单位。例如企业职工年龄:甲26岁,乙27岁,丙45岁…该企业所有职工的总产值2500件该企业所有职工的平均年龄32.1岁\n(3)客观性统计指标反映是客观存在的事实。2000年我国的人口数12653万人。请问:2015年我国人均国内生产总值达10000美元,是统计指标吗?\n(4)具体性统计指标指的是具体的事物,而非抽象的数字。\n3.统计指标与统计标志的关系区别:统计指标:总体统计标志:总体单位某企业职工是总体,每一个职工是总体单位。职工的年龄:甲26岁,乙27岁,丙45岁…该企业所有职工的总收入25万元该企业所有职工的平均年龄32.1岁联系:在统计标志的基础上得到统计指标\n4.统计指标的种类及其表现形式数量指标:总体单位标志的标志值汇总或者总体单位的总数,又称总量指标。工业产品的总成本200万元我国法人单位5107000个\n质量指标:总体数量对比关系(相对指标)和总体单位标志平均水平(平均指标)。高等教育入学率52%2002年北京城市居民人均住房使用面积16.8平方米\n数量指标与质量指标的比较表现形式计量单位数值与总体范围大小数量指标绝对数实物或货币单位同向变动质量指标相对数或平均数有名数或无名数无关\n(二)统计指标体系systemofstatisticalindicator1.统计指标体系的含义由若干相互联系的统计指标所组成的整体。现阶段农村小康评价指标体系\n全面小康社会十六大提出的全面建设小康社会的发展目标,是一个综合性的指标,包括了经济、政治、文化发展的各方面。一是人均国内生产总值超过3000美元。这是建成全面小康社会的根本标志。二是城镇居民人均可支配收入1.8万元。三是农村居民家庭人均纯收入8000元。四是恩格尔系数低于40%。五是城镇人均住房建筑面积30平方米。六是城镇化率达到50%。七是居民家庭计算机普及率20%。八是大学入学率20%。九是每千人医生数2.8人。十是城镇居民最低生活保障率95%以上\n和的形式国内生产总值=固定资产折旧+劳动者报酬+生产税净额+营业盈余乘积形式商品销售额=销售价格×销售数量因素关系2.统计指标体系的表现形式\n参数和统计量参数(parameter)研究者想要了解的总体的某种特征值所关心的参数主要有总体均值()、标准差()、总体比例()等总体参数通常用希腊字母表示统计量(statistic)根据样本数据计算出来的一个量所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等样本统计量通常用小写英文字母来表示\n统计中的几个基本概念平均数标准差比例参数统计量xsp总体样本\n几种常用的统计软件(Software)典型的统计软件SASSPSSMINITABSTATISTICAExcelMINITABSTATISTICAExcelSASSPSS\n本章小节1.统计学与统计规律统计的应用领域统计数据的类型统计中的几个基本概念\n结束