- 470.00 KB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
次数分布表简单次数分布(frequencydistribution)表相对次数(relativefrequency)分布表累积次数(cumulativefrequency)分布表大于制与小于制累积相对次数分布表\n次数分布表某学校学生人数按性别分类性 别人 数百分比男 生200040女 生300060总 和5000100\n次数分布表妙峰山圣母灵签次数分布表事件次数事件次数事件次数事件次数婚姻51次行人34次求财18次田蚕14次疾病49次胎产26次求官18次…………见贵43次词讼24次经营17次谋事37次失物18次宅舍13次\n次数分布表某学校一年级学生语言能力测验得分次数分布表分 数人 数百分比低于20分20-3940-5960-6970-7980-8990-991001030405170544053.3310.0013.3317.0023.3318.0013.331.67总 和300100\n某班级智商测验结果学号得分学号得分学号得分12345678910103114129105103971021081028711121314151617181920107851109410892113108122107212223242526272829301199895118889410510297108\n制作步骤求全距全距指的是全部观察值中最大值与最小值之差。R=129-85=44。决定组数和组距。一般不少于5组,也不要超过15组。组距指的是每一个组内包含的距离(用i表示)斯特奇斯(H.A.Sturges)根据经验公式:本例将N=30代入,得i=7.45,将组距调节为10,即每10分为一个组。组数:44/10=4.4,应该分5组。决定组限组限就是每一组的起点值和终点值。登记次数\n次数分布图简单次(频)数分布图相对次数分布图累积次数分布图累积相对次数分布图\n简单次数分布图--直方图(histogram)\n简单次数分布图--次数多边图(linegraph)\n次数多边图的优点\n累积次数分布图\n累积相对次数分布图\n散点图(scatterplot)\n轮廓图(profilechart)\n雷达图(radarchart)\n脸谱图(facegraph)\n常用统计指标集中量算术平均数中位数众数加权平均数几何平均数调和平均数差异量全距平均差方差与标准差相对差异量差异系数偏态量峰态量\n集中量集中量(measuresofcentraltendency)是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一点集中的情况。集中量包括算术平均数、加权平均数、几何平均数、调和平均数、中位数、众数等。\n算术平均数算术平均数(arithmeticmean)是所有观察值的总和除以总频数所得之商,简称为平均数或均数。\n算术平均数的优点反应灵敏;严密确定,简明易懂,计算方便;适合代数运算;受抽样变动的影响较小;样本算术平均数是总体平均数的最好估计值\n算术平均数的缺点易受两极端数值(极大或极小)的影响;某村农户收入状况120,127,130,131,132,132,135,136,137,139,140,145,146,149,153,158,160,320,400平均数=162.63一组数据中某个数值的大小不够确切时就无法计算其算术平均数。\n中位数中位数(median)是位于依一定顺序排列的一组数据中央位置的数值,在这一数值上、下各有一半频数分布着。中位数的原始数值计算方法:121415151718202324:1712141515171820232425:17.5中位数的应用及其优缺点\n中位数的应用及其优缺点中位数虽然也具备一个良好的集中量所应具备的某些条件,例如比较严格确定、简明易懂,计算简便,受抽样变动影响较小,但是它不适合进一步的代数运算。它适用于以下几种情况:一组数据中有特大或特小两极端数值时;一组数据中有个别数据不确切时;资料属于等级性质时。\n众数众数(mode)是集中量的一种指标。对众数有理论众数及粗略众数两种定义方法理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。粗略众数是指一组数据中频数出现最多的那个数。\n粗略众数的计算方法可以用观察法直接寻找一组数据中频数出现最多的那个数,就是粗略众数;也可以将频数分布表中频数最多的组的组中值作为粗略众数。\n众数的优缺点众数虽然简明易懂,但是它并不具备一个良好的集中量的基本条件。它主要在以下情况下使用:当需要快速而粗略地找出一组数据的代表值时;当需要利用算术平均数、中位数和众数三者关系来粗略判断频数分布的形态时;利用众数帮助分析解释一组频数分布是否确实具有两个频数最多的集中点时。\n加权平均数加权平均数(weightedmean)是不同比重数据(或平均数)的平均数。计算公式为:\n几何平均数几何平均数(geometricmean)是N个数值连乘积的N次方根。计算公式为当一个数列的后一个数据是以前一个数据为基础成比例增长时,要用几何平均数求其平均增长率。\n差异量差异量(measuresofdispersion)用于表示数据的变异程度或离散程度。常用的差异量有全距、平均差、方差、标准差和差异系数等。\n全距全距(range)指一组数据中最大值与最小值之差。优点:概念清楚,意义明确,计算简单;缺点:容易受极端数值的影响,反应不灵敏。\n平均差平均差(averagedeviation)就是每一个数据与该组数据的中位数(或算术平均数)离差的绝对值的算术平均数。计算公式:\n方差和标准差方差(variance)指离差平方的算术平均数定义公式和计算公式:\n标准差标准差(standarddeviation)是指离差平方和平均后的方根。即方差的平方根。定义公式和计算公式:\n样本的方差与标准差样本的方差样本的标准差\n相对差异量(差异系数)差异系数(coefficientofvariation):标准差与其算术平均数的百分比。其计算公式为用途:两种单位不同单位相同而两个平均数相差较大的资料。\n地位量**百分位数(percentile)--频数分布中相对于某个特定百分点的原始分数,它表明在分布中低于该分数的个案占总频数的百分比。中位数与四分位数(quartile)百分等级(percentilerank)--频数分布中低于特定原始分数的频数百分比。\n百分位数\n百分等级\n偏态量(skew)\n峰态量(kurtosis)