第03章管理统计学 61页

  • 902.35 KB
  • 2022-08-29 发布

第03章管理统计学

  • 61页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
管理统计学Managementstatistics第三章描述数据的图表方法\n管理统计学Managementstatistics描述数据的图表方法数据描述的意义与分类定量数据的图形描述定性数据的图形描述123\n对数据的处理有多种方法,在本章中,我们将论述如何绘制将数据的性质表达出来的各种图表。在对数据进行处理时首先要弄清数据的类型,因为对于不同种类的数据的处理方法是不同的。我们所处理的数据分为两类:定量数据和定性数据。可以用数值来表现的观察值,称为定量数据;只能归入某一类的不能用数值进行测度的数据,称为定性数据。3.1数据描述的意义与分类管理统计学Managementstatistics\n学习目标1.定量数据的图表描述数据整理单变量描述多变量描述2.定性数据的图表描述数据整理单变量描述多变量描述管理统计学Managementstatistics\n3.2定量数据的图形描述管理统计学Managementstatistics数据整理单变量描述多变量描述\n3.2.1定量数据整理管理统计学Managementstatistics统计分组根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组。例:收集到某班所有同学的英语考试成绩,为了研究需要划分高、中、低三个成绩段,每个成绩段的范围分别是85-100,70-85,0-70,然后将每个成绩归入到相应的组中。\n单变量定量数据的图表描述——数据整理频数分布表对定量数据进行分组时,需要建立频数分布表,以便更有效地显示数据的特征和分布。构成:频数:各组的单位的次数频率:各组次数与总次数之比频数分布:由分组标志序列和各组相对应的分布次数两个要素构成。频率分布:由分组标志序列和各组相应的频率构成。管理统计学Managementstatistics\n频数分布表原始数据:24,26,24,21,27,27,30,41,32,38组别频数15且<25325且<35535且<452管理统计学Managementstatistics\n编制频数分布表1.选择组数可参考Sturges的经验公式2.计算各组的宽度宽度3.确定组界(上下限)4.计算组中值某组的组中值5.根据分组整理成频数分布表计算每个组的频数、相对频数(即频率)管理统计学Managementstatistics\n频数分布表实例原始数据:24,26,24,21,27,27,30,41,32,38组界(上界+下界)/2组距组别组中值频数15且<2520325且<3530535且<45402频率30.050.020.0管理统计学Managementstatistics\n累积频数分布表为了统计分析的需要,有时要观察某一数值以上或某一数值以下频数或频率之和,这就需要在频数分布表基本分组的基础上绘出累积频数或累计频率。“向下累积”由表的上方向表的下方的频数或频率相加“向上累积”由表的上方向表的下方的频数或频率相加管理统计学Managementstatistics\n小于组别下限的百分数原始数据:24,26,24,21,27,27,30,41,32,38组别下界30%+50%80%+20%组别累计百分比15~250.025~3530.035~4580.045~55100.0累积频数分布表实例(可参考书上实例)管理统计学Managementstatistics\n3.2.2单变量定量数据的图表描述单定量数据的图表描述未分组茎叶图箱线图分组频数分布表累积频数分布表直方图折线图累积频数分布图数据图形描述数据整理管理统计学Managementstatistics\n单变量定量数据的图表描述——数据图形描述(分组后数据)数据分组整理后的图形描述直方图用矩形的高度和宽度来表示频数分布折线图作用与直方图相似累积频数分布图描述累积频数或频率信息132管理统计学Managementstatistics\n0123451.直方图频数或频率01525354555下界柱条接触计数类别频数15~25325~35535~452管理统计学Managementstatistics\n0123452.折线图中点虚拟的外推组0102030405060组别频数15<25325<35535<452计数频数或频率管理统计学Managementstatistics\n0%25%50%75%100%3.累积折线图下界虚拟的外推组01525354555组别累计%15~250%25~3530%35~4580%>45100%累计%管理统计学Managementstatistics\n数据未分组整理后的图形描述茎叶图用于直接描述未分组原始数据的探索性分析。描述数据分布形状,如数据是否集中,是否有极端值等。由茎、叶、每个茎对应叶的个数、茎的宽度这四元素组成。箱线图用于直接描述未分组原始数据的探索性分析。描述数据的分布形状,如数据是否集中,是否有极端值等。可以比较多组数据分布特征。图中包含五个点组成:样本数据的最小值、下四分位数、中位数、上四分位数、最大值。12管理统计学Managementstatistics\n1.茎叶图把每一项观察分解为茎值和叶值茎值确定组别叶值确定频数(计数)Xi管理统计学Managementstatistics\n实例117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121【例】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。管理统计学Managementstatistics\n茎叶图用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶对于n(20≤n≤300)个数据,茎叶图最大行数不超过L=[10×log10n]5.茎叶图类似于横置的直方图,但又有区别直方图可大体上看出一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息管理统计学Managementstatistics\n树茎树叶7880223477788890012222333344466777889013344579910111213数据个数3132410茎叶图类似横置的直方图茎叶图图某车间工人日加工零件数的茎叶图管理统计学Managementstatistics\n茎叶图树茎树叶10s10.11*11t11f11s11.12*12t12f12s12.13*12t13f13s13.78802234577788890012222333344455667778890133445799树茎树叶10*10.11*11.12*12.13*13.78802234577788890012222333344455667778890133445799图3-8图3.7扩展后的茎叶图管理统计学Managementstatistics\n奇异值2.箱线图最大值最小值中位数大于1.5倍四分位数间距四分位数间距范围管理统计学Managementstatistics\n2.箱线图中间的黑粗线为中位数方框为四分位间距的范围离方框上/下界的距离超过四分位数间距1.5倍的为离群值,以“O”表示;超过3倍的则为极值,用“*”表示。管理统计学Managementstatistics\n箱线图用于显示未分组的原始数据或分组数据的分布箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成其绘制方法是:首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接管理统计学Managementstatistics\n未分组数据—单批数据箱线图(箱线图的构成)中位数4681012QUQLX最大值X最小值图简单箱线图管理统计学Managementstatistics\n未分组数据—单批数据箱线图(实例)最小值107最大值139中位数123下四分位数117.75上四分位数128105110115120125130135140图50名工人日加工零件数的箱线图管理统计学Managementstatistics\n分布的形状与箱线图对称分布QL中位数QU左偏分布QL中位数QU右偏分布QL中位数QU图不同分布的箱线图管理统计学Managementstatistics\n3.2.3多变量定量数据的图表描述散点图组箱线图雷达图多定量数据的图表描述线图管理统计学Managementstatistics\n3.2.3多变量定量数据的图表描述1.散点图同时研究两个数字变量的取值在图上标出所有数对(Xi,Yi)2.时间序列图表示一列定量数据如何随时间变化3.组箱线图比较多个总体的分布特征4.雷达图用于要同时分析的变量个数较多的情况管理统计学Managementstatistics\n1.散点图标出所有数对(Xi,Yi)02040600204060XY管理统计学Managementstatistics\n2.时间序列图年份销售02468199119921993199419951996管理统计学Managementstatistics\n时间序列数据实例【例】已知1991~1998年我国城乡居民家庭的人均收入数据如表3-11。试绘制线图¥$表1991~1998年城乡居民家庭人均收入年份城镇居民农村居民199119921993199419951996199719981700.62026.62577.43496.24283.04838.95160.35425.1708.6784.0921.61221.01577.71926.12091.12162.0管理统计学Managementstatistics\n时间序列数据实例020004000600019911992199319941995199619971998城镇居民农村居民收入(元)图城乡居民家庭人均收入管理统计学Managementstatistics\n3.组箱线图管理统计学Managementstatistics\n实例【例】从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表3-8。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征表3-811名学生各科的考试成绩数据课程名称学生编号1234567891011英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177管理统计学Managementstatistics\n多批数据箱线图图8门课程考试成绩的箱线图管理统计学Managementstatistics\n图11名学生8门课程考试成绩的箱线图Min-Max25%-75%Medianvalue455565758595105学生1学生2学生3学生4学生5学生6学生7学生8学生9学生10学生11箱线图(由STATIATICA绘制的多批数据箱线图)管理统计学Managementstatistics\n雷达图(RadarChart)是显示多个变量的常用图示方法在显示或对比各变量的数值总和时十分有用假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比可用于研究多个样本之间的相似程度管理统计学Managementstatistics4.雷达图\n设有n组样本S1,S2,…Sn,每个样本测得P个变量X1,X2,Xp,要绘制这P个变量的雷达图,其具体做法是雷达图先做一个圆,然后将圆P等分,得到P个点,令这P个点分别对应P个变量,在将这P个点与圆心连线,得到P个幅射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示再将同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达图管理统计学Managementstatistics\n雷达图实例【例】1997年我国城乡居民家庭平均每人各项生活消费支出数据如表3-12。试绘制雷达图。今天的主食是面包表1997年城乡居民家庭平均每人生活消费支出项目城镇居民农村居民食品衣着家庭设备用品及服务医疗保健交通通讯娱乐教育文化服务居住杂项商品与服务1942.59520.91316.89179.68232.90448.38358.64185.65890.28109.4185.4162.4553.92148.18233.2334.27合计4185.641617.15管理统计学Managementstatistics\n0500100015002000食品衣着家庭设备用品及服务医疗保健交通通讯娱乐教育文化服务居住杂项商品与服务城镇居民农村居民图1997年城镇居民家庭消费支出(元)多变量数据—雷达图(由Excel绘制的雷达图)管理统计学Managementstatistics\n多变量数据—雷达图(实例)【例】为研究某条河流的污染程度,环保局分别在上游、中游和下游设立取样点,每个取样点化验水中的五项污染指标,所得数据如表3-13。将各指标用雷达图表示出来,并分析该河流的主要污染源。表不同样本点的化验指标指标1指标2指标3指标4指标5上游中游下游4.520.342.175.01.46.8483362081964111214635管理统计学Managementstatistics\n多变量数据—雷达图0.11101001000指标1指标2指标3指标4指标5上游中游下游图河流污染指标雷达图管理统计学Managementstatistics\n3.3定性数据的图形描述管理统计学Managementstatistics数据整理单变量描述多变量描述\n单变量定性数据的图表描述单定性数据的图表描述频数分布表累积频数分布表条形图饼图累积频数分布图数据图形描述数据整理帕雷托图管理统计学Managementstatistics\n单变量定性数据的图表描述频数分布表(总结表)类似于整理定量数据的频数分布表包含:分类的频数或频率,即指落在某一特定类中的观察值数分类的相对频数,指某个特定类的频数除以观察值总数所得的商累积频数分布表类似于整理定量数据的累积频数分布表管理统计学Managementstatistics\n频数分布表这一列为类别记录:|||||||| ||||||||专业计数会计130经济20管理50总计200管理统计学Managementstatistics\n3.3.2单变量定性数据的图表描述条形图类似直方图,条形图的横轴表示的是各个分类,直方图的横轴表示所分的组。饼图通常用来描述落在各个分类中的观察值数分别在总数中所占的比率。累积频数分布图类似于描述定量数据中的累积频率分布图。帕雷托图变量的分类数目较多时,用帕雷托图要比条形图和饼图更能直观地显示信息。广泛应用于过程分析和质量分析中。\n050100150会计经济管理1.条形图水平条表示类型变量条长表示频数或者%条宽的1/2到1倍相同的条宽零点频数专业也可使用百分比管理统计学Managementstatistics\n经济10%管理25%会计65%2.饼图1.表示出总量的分类2.表示相对差异的有效办法3.角度大小360(百分数)专业360°×10%=36°36管理统计学Managementstatistics\n243001322252700100200300400非常不满意不满意一般满意非常满意累积户数(户)(a)向下累积27616830300750100200300400非常不满意不满意一般满意非常满意累积户数(户)(b)向上累积图甲城市家庭对住房状况评价的累积频数分布管理统计学Managementstatistics3.累计频数分布图\n0%33%67%100%会计管理经济4.帕雷托图百分数专业递减顺序累积频数分布图相同的条宽竖直条形条的中点管理统计学Managementstatistics\n3.3.3多变量定性数据的图表描述环形图交叉图多重条形图多定性数据的图表描述管理统计学Managementstatistics\n多变量定性数据的图表描述1.环形图显示具有相同分类且问题可比的多个样本或总体中各类别所占的相应比例,对各总体进行比较研究。在类别值为定序数据时这种比较才有意义。2.交叉表可检测两个定性变量的关系。同样可用来描述两个变量都是数字变量,或一个变量是定类或定序变量,另一个是数字变量之间的关系。3.多重条形图描述两个定类或定序变量间关系。管理统计学Managementstatistics\n环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环环形图可用于进行比较研究环形图可用于展示定类和定序的数据管理统计学Managementstatistics1.环形图\n环形图8%36%31%15%7%33%26%21%13%10%非常不满意不满意一般满意非常满意图甲乙两城市家庭对住房状况的评价管理统计学Managementstatistics\n2.交叉表住处:CCOOCCOOCO性别:MFFMMMFMMF(C=校内,O=校外;M=男,F=女)4123性别住处男女合计校内5校外5合计6410管理统计学Managementstatistics\n3.多重条形图频数住处0123456校内男女校外男女\nTheEnd管理统计学Managementstatistics

相关文档