- 15.82 MB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
应用统计学-3\n\n\n\n\n\n分类数据的逻辑检查数值型的数据计算检查中学学历的大学教师排序的突然增加或较少均值大于1/2总和\n什么是口径?统计数据的二重性\n\n例3.1表3-1是8名学生4门课程的考试成绩数据(单位:分)。试找出统计学成绩等于75分的学生,英语成绩最高的前三名学生,4门课程成绩都高于70分的学生。表3-1\n筛选出统计学成绩等于75分的学生。\n\n统计学成绩等于75分的学生。\n筛选出英语成绩最高的前三名学生\n\n英语成绩最高的前三名学生\n筛选出4门课程都大于70分的学生条件区数据区\n\n\n\n4门课程都大于70分的学生\n\n\n例3.(排序)按统计学成绩高低排序\n\n\n\n按统计学成绩高低排序\n广东沿海古海蚀平台的高度2-3m>3m<2m数据来源:谭惠忠等(1995)(黄海基面)(黄基)1.6m\n\n\n\n\n定义3.1落在某一特定类别(或组)中的数据个数,称为频数(frequency),也称次数。定义3.2把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来,称为频数分布(frequencydistribution)。定义3.3一个总体(或样本)中各个部分的数值的比重,称为比例(proportion)。定义3.4将比例乘以100得到的数值,称为百分比或百分数(percentage)。定义3.5总体或样本中各不同类别数值之间的比值,称为比率(ratio)。\n\n\n例3.2(例2.3)\n\n\n\n注意:此处应该是频数频率=频数/总和\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n频率?频数?\n例3.3例3.3\n\n\n\n\n\n\n定义3.6将各有序类别或组的频数逐级累加起来得到的频数,称累积频数。定义3.7将各有序类别或组的百分比逐级累加起来,称为累积频率或累积百分比。定义3.8根据统计研究的需要,将原始数据按某种标准划分成不同的组别,称为数据分组。定义3.9分组后的数据称为分组数据。定义3.10把一个变量值作为一组,称为单变量值分组。定义3.11将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,称为组距分组。\n定义3.12在组距分组中,一个组的最小值,称为下限(lowlimit);一个组的最大值,称为上限(upperlimit)。定义3.13一个组的上限值与下限值之差,称为组距。定义3.14在组距分组时,如果各组的组距相等,称为等距分组。定义3.15在组距分组时,如果各组的组距不相等,称为不等距分组。定义3.16每一组的下限和上限之间的中点值,称为中值。\n\n最大值最小值最大值\n\n例:以生产零件个数为变量。\n以生产零件个数为变量,变量太多啦!如何区分分类变量和数值变量?\n例:每五隔个零件为一个区间(变量)。\n\n5≤K≤15\n\n本组上限不在内第一组下限低于最小变量,最后一组上限高于最大变量。\n连续变量上限值可采用小数点的形式,如109.99\n若最大、最小值与其他数据相差太大,为避免空白组或个别极端值漏掉,可用开口组94160\n组距分组掩盖了各组内的数据分布状况。注意:不等距分组:(1)根据生理成长特点的人口年龄分组0-6岁(幼儿组),7-17(少儿组),18-59岁(成年组),60岁以上(老年组)(2)粒度划分\n10mm粒度划分(真数与对数分组)砾(Pebble)砂(sand)~淤泥(silt)……64mmCobble2mm=㏒2(直径)PebbleSandSilt\n频数密度:每一岁有多少人幼儿组/少儿组/成年组/老年组\n\n\n\n\n换成百分比(%)组距为1个单位\n\n宽度没有数值意义长宽都有数值意义\n\n\n\n\n定义3.17直方图是用矩形的宽度和高度(即面积)来表示频数分布的图形定义3.18由“茎”和“叶”两部分组成的、反映原始数据分布的图形,称为茎叶图。\n\n\n“”表示0-4,“•”表示5-9。105-109110-114106-107108-109\n统计数据是谎言!我一眼就看出来了,大多数日加工零件数在120-125之间\n例3.4\n实例下表是某电脑公司2005年4个月每天的销售数据,试对数据进行分组。\n\n接收区域\n频率=频数/总和频数\n\n\n\n\n\n\n箱图的制作\n\n\n\n什么是左偏?什么是右偏?\n\n单科最高、最低平均最高、最低集中、离散程度\n\n时间序列线图的制作\n\n\n例3.6\n\n\n\n键入坐标名\n\n雷达图的制作\n\n从图中读出什么信息?\n将1997年的数据与2003年的消费数据比较一下百分比能比吗?\n\n\n例3.7\n\n\n分类\n\n去掉网络线\n\n百分比\n\n从图中读出什么信息?\n\n\n\n\n\n\n\nWhen,Where,What\n\n