- 1.02 MB
- 2022-08-29 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第一章导论\n统计是什么?我们接触过吗?提起统计大家会想到什么?请大家举出与统计有关的例子第一章统计学的概念\n我们经常在报刊中看到以下叙述:新住房的销售速度是每年703000套。原油的平均价格是每桶17.37美元。失业率下降到5.9%。通用汽车37%的销售额来自于北美地区。道-琼斯工业股平均指数接近8909.43点。主要航空公司中1997年最好的正点记录是西北航空公司81.9%的正点率。\n2006年我国进出口总额达到5098亿美元,是1989年的4.6倍,年均增长13.6%,远高于同期世界贸易6.1%的增长水平,也超过我国国内生产总值9.3%的增速。2006年我国实际吸收外资469亿美元,比1989年增长了12.8倍,年均增速达24%。13年来全国累计实际使用外资超过4000亿美元,占改革开放以来吸收外资总额的97%以上。\n据中国人民银行的最新统计数字,2006年1月份,我国企业商品价格总水平环比上涨0.7%,同比上涨0.6%。其中投资品价格环比上升0.7%,同比上涨1.3%;消费品价格环比上升0.9%,同比下降1%。中新网2002年10月10日电日本东京股市周四再受重挫。日经指数下跌1.17%,收盘报8,439.62点,为自1983年6月10日以来的最低点位,同时也再次刷新周三所创下最低纪录。\n2003年2月21日深沪股市行情上海综合指数今日以1508.08点开盘,最高1508.13点,最低1476.42点,报收于1478.87点,跌30.61点,成交817201.8万元。上涨家数为27,平盘家数为14,下跌家数为749。深证成份指数今日以3040.87点开盘,最高3040.87点,最低2984.67点,报收于2990.01点,跌51.89点,成交501782.7亿元。上涨家数为30,平盘家数为14,下跌家数为588。\n究竟什么是统计?\n统计是以数据为食物的动物统计的本业是消化数据,并产生有营养的结果。它的本质,和母牛相差不多。\nData——Statistics——InformationGrass——Cow——Milk\n统计的三种含义统计工作统计数据统计学对统计数据进行搜集、整理、分析的过程。统计工作产生的结果,用以描述所研究现象的属性和特征。如:统计图表、统计分析报告、统计资料汇编、统计年鉴等是一门研究总体数量特征的方法论科学,它来源于统计工作,又反过来指导统计工作\n统计学概念举例统计学是关于数据资料的搜集、整理、显示分析和推论的科学,目的在于帮助人们做出更有效的决定;统计学是一门关于大量数据资料的搜集、整理、描述和分析的学科,目的在于探索数据内在的数量规律性;统计学是在面对不确定情况下,提供人们做出聪明决策的科学方法,其过程包括资料的搜集、整理、陈列、解释和分析,并可进而加以推论,从而可获得合理的推断与有效的结论\n统计学特征统计学研究的对象是群体现象;统计学探索的是群体现象数量表现的规律性数量性规律性统计学要对群体现象的数量特征进行描述、分析、推论\n理论统计学应用统计学描述统计学推断统计学国民经济统计学社会统计学人口统计学研究的内容是运用于某一特定领域的统计问题统计学的分类研究的内容是统计的一般理论和方法\n描述统计学(DescriptiveStatistics)用图形、表格和数值方法来汇总数据的统计学。推断统计学(InferenceStatistics)用样本数据对总体的某些特征进行估计和假设检验的统计学。\n描述统计学举例交易所频数百分比(%)NYSE312AMEX520OTC1768总计25100\n某企业年产量趋势图描述统计学举例\n总体单位调查单位可以全面调查,但通常是调查限定规模以上的总体单位推断统计学举例\n描述统计与推断统计的关系反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等)概率论(包括分布理论、大数定律和中心极限定理等)描述统计(统计数据的搜集、整理、显示和分析等)总体数据样本数据\n第二节统计数据什么是统计数据对现象进行计量的结果不是指单个的数字,而是由多个数据构成的数据集不仅仅是指数字,它可以是数字的,也可以是文字的\n统计数据分类调查数据实验数据定类数据定序数据定距数据定比数据按计量层次按收集方法按时间状况截面数据时间序列数据\n定类尺度按现象性质差异进行的辨别与区分。测量结果形成定类变量或定类指标。定类变量或指标确切的值是以文字表述的,可以用数值标识,但仅起标签作用。定类变量或指标的各类别间是平等的,没有高低、大小、优劣之分。\n性别种族运动项目\n定序尺度对现象顺序差异进行的辨别与区分。测量结果形成定序变量或定序指标。定序变量或指标确切的值是以文字表述的,也可以用数值标识,也仅起标签作用。定序变量或指标各类别间有高低优劣之分,不能随意排列,但差异无法准确计量。\n-≠-≠≠>>大学生中学生小学生\n定距尺度按现象绝对数量差异进行的辨别与区分。测量结果形成定距变量或定距指标。定距变量或指标的值以数字表述,有计量单位,可以进行加减运算。定距变量或指标各类别间自然有大小之分,但没有绝对的零点,不能进行乘除运算。\n天气预报:沈阳:最高温度3℃,最低-7℃大连:最高温度6℃,最低-2℃两地最高温度相差3℃沈阳最低温度较大连最低温度低5℃大连最高温度是沈阳最高温度的2倍温度\n纪年公元2003年公元元年黄帝4493年黄帝4700年黄帝4713年黄帝元年时间起点公元2003年?\n1971年出生32岁1986年出生17岁甲乙二人年龄之差:1986-1971=15岁或32-17=15岁二人年龄之比:32÷17=1.8824(倍)1986÷1971=1.0076(倍)\n定比尺度对现象绝对差异与相对差异进行的辨别与区分。测量结果形成定比变量或定比指标。定比变量或指标确切的值也以数字表述,有计量单位,可以进行加减运算。定比变量或指标有绝对意义上的零点,既可以加减运算,也可以乘除运算。\n零高度零重量零体积零面积零人口零产量零资产真正的零:一无所有\n数据度量尺度DataMeasuredbyScales3.定距尺度Interval没有真正的零点例如,温度4.定比尺度Ratio存在真正的零点倍数有意义例,身高、体重1.定类尺度Nominal无等级次序排列例如:男-女从事工作的行业2.定序尺度Ordinal可作等级次序排列例如:公司职位产品满意度\n数据度量与信息含量DataMeasurementandInformation度量尺度的信息含量由弱到强排列:定类尺度→定序尺度→定距尺度→定比尺度定类尺度和定序尺度用于属性数据信息量低定距尺度和定比尺度用于数值数据信息量高\n统计数据的其他常见分类反映每一个体属性的标签或者名称。可以用定类尺度,也可以用定序尺度度量品质型数据数值型数据是表示大小多少的数值。可以用定居尺度也可用定比尺度度量\n统计数据的其他常见分类离散型的数据是可列的。在统计中,离散型数据取整数。离散型变量连续型变量连续型的数据可以取介于两个数值之间的任意数值品质型数据只能是离散的;数值型数据可以是离散的,也可以是连续的。有些连续型变量在具体整理分析时,可以进行离散化处理\n思考题ThinkingChallenge它们是属性数据还是数值数据?是离散的还是连续的?属于哪一种度量尺度?3.兄弟姐妹个数0-1,2-3,4+4.成绩A,B,C1.汽车速度78,64,452.温度C°78,64,85\n统计数据的分类(按收集方法)1调查的数据(observationaldata)通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据2试验的数据(experimentaldata)在试验中控制试验对象而收集到的数据比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据\n统计数据的分类(按时间状况)截面数据(cross-sectionaldata)在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况比如,2002年我国各地区的国内生产总值数据时间序列数据(timeseriesdata)在不同时间上收集到的数据描述现象随时间变化的情况比如,1996年至2002年国内生产总值数据\n截面数据与时间序列数据举例\n截面数据与时间序列数据举例\n统计数据来源间接来源:系统外部数据系统内部数据直接来源:调查数据实验数据统计数据\n系统外部的数据Internet中国统计年鉴2001中国人口统计年鉴中国市场统计年鉴世界发展报告世界经济年检工业普查数据中国统计出版社统计部门和政府部门公布的有关资料,如各类统计年鉴各类经济信息中心、信息咨询机构、专业调查机构等提供的数据各类专业期刊、报纸、书籍所提供的资料各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料从互联网或图书馆查阅到的相关资料\n系统内部的数据中国统计年鉴2001中国人口统计年鉴中国市场统计年鉴世界发展报告世界经济年检工业普查数据中国统计出版社业务资料,如与业务经营活动有关的各种单据,记录经营活动过程中的各种统计报表各种财务,会计核算和分析资料等\n第四节统计学中的一些基本概念总体和总体单位标志和指标\n总体单位统计总体由客观存在的、在同一性质基础上结合起来的许多个别单位所形成的集合指构成总体的个体即每一个单位统计总体和总体单位具有客观性、大量性、同质性、变异性、相对性等特点总体由总体单位构成,要认识总体必须从总体单位开始,总体是统计认识的对象。\n总体、总体单位总体、总体单位总体或总体单位的区分不是固定的:同一个研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位。\n统计总体的种类指总体单位可以合计的总体指总体单位不能合计的总体有限总体无限总体可加总体不可加总体指所包含的单位数目有限的总体指所包含的单位数目无限的总体\n标志指总体单位所具有的属性和特征,标志的具体表现称为标志值品质标志数量标志是表明事物“量”的特性的标志标志和指标是表明事物“质”的特性的标志\n统计指标说明总体数量特征的概念和范畴。它显示总体共同的属性和特征标志和指标统计指标一般包括六个要素:指标名称、计量单位、计量方法、时间限制、空间限制、指标数值统计指标特点:数量性;综合性;具体性\n统计指标的分类统计指标统计指标数量指标质量指标绝对数指标相对数指标平均数指标数量指标是反映社会经济现象发展总规模、总水平或工作总量的统计指标,用绝对数表示质量指标是反映社会经济现象发展相对水平或工作总量的统计指标,用平均数或相对数表示。它们从不同角度反映总体的综合数量特征。数量指标是计算质量指标的基础,而质量指标往往是相应的数量指标进行对比的结果。\n标志和指标的关系联系区别汇总关系:指标值是由众多的总体单位的数量标志值汇总而来的转换关系:取决于总体和总体单位之间的转换,总体单位转换为总体时,数量标志也转换为指标说明对象不同。指标是说明总体特征的,而标志是说明总体单位特征的表现形式不同:统计指标都是用数值表示的,而统计标志可以用数值表示也可用文字表示\n指标名称指标值标志名称标志值工业企业总数1千万工业企业职工数3亿人某企业职工数7000人工业总产值5千亿某企业总产值8000万平均工资7000元/年人某企业平均工资5500元/年人总体——工业企业总体单位——每个工业企业\n总体总体单位指标数量标志条件:研究目的不同转换转换\n变异与变量变异变异是指标表现在各总体单位之间的变化现象属性变异:品质标志的标志值变化数量变异:数量标志的标志值变化变量将可变的数量标志称为变量,不变的数量标志称为常量变量值为变量的具体数值表现离散变量连续变量确定性变量:变量的值受某些确定性因素影响,其变化能够事先确定随机性变量:变量的值受某些不确定因素影响,事先无法确定