3《管理统计学》 44页

  • 725.00 KB
  • 2022-08-13 发布

3《管理统计学》

  • 44页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
第3章统计数据的概括性描述1统计数据的整理与展示数据的预处理;频次与频率的计算及图形表示2数据集位置的测度众数中位数均值3数据集离散程度的测度4数据集的峰度与偏度点状描述区间描述7/20/20211\n1统计数据的整理与展示1.1数据的预处理审核与筛选、排序、分组1.2频次与频率的计算1.3频次与频率的图形表示7/20/20212\n1.频次(Frequency)2.频率(Percentage或RelativeFrequency)1.2频次与频率的计算一、频率、频次的含义7/20/20213\n某商品在抽样商店的单价(单位:元)9.9810.0210.0010.0410.019.9910.0510.0410.0610.0l10.039.999.979.93l0.0110.03l0.0310.0210.059.999.959.969.9810.009.9710.0l10.009.999.9810.00表3.1.2某单位职工受教育程度的结构受教育程度小学初中高中大学硕士研究生合计各个受教育程度出现的频次1229216各受教育程度出现的频率(%)6.2512.512.556.2512.5100表3.1.2家具基色调出现的频次家具的基色调BGRWY合计各个基色调出现的频次16851030各个基色调出现的频率(%)3.3320.0026.6716.6733.33100\n频数分布(次数分布)频率分布二、频率分布的常用指标的计算方法产量人数比率(频率%)………合计10050—6060—7028306.67%26.67%\n向下累计数(2)开口组=上限-邻近组组距/2(缺下限)下限+邻近组组距/2(缺上限)1.全距(极差)=最大值-最小值2.组距=全距/组数3.组中值:(1)闭口组=(上限+下限)/25.累计数向上累计数4.组平均数\n产值(万元)人数(人)频率(%)向上累计向下累计(%)60以下60-7070-8080-9090-10051117116102234221251633445010090683412合计50100——50名学生统计学考试成绩分布表\n组别组1组2组3组4组5组6组7组界(15.75,16.25)[16.25,16.75][16.75,17.25)[17.25,17.75)[17.75,18.25)[18.25,18.75][18.75,19.25)身高16.016.3,16.516.8,17.0,17.1,17.217.5,17.6,17.717.8,18.018.1,18.218.3,18.5,18.619.0频次111111122221111111组频次1246531某班组男职工的身高数据分组1.3频次与频率的图形表示\n\n1.饼图(PieChart)(1)适用范围:适用于所有测度级别的数据。(2)SPSS实现:①Analyze②GraphsChartFrequenciesDescriptiveStatisticsPie\n7/20/202111\n\n2.条形图(BarChart)(1)适用范围:适用于顺序级以上的数据,也可以“强行”用于名义级。(2)SPSS实现:①Analyze②GraphsChartFrequenciesDescriptiveStatisticsBar\n\n(2)SPSS实现:3.直方图(Histogram)(1)适用范围:适用于顺序级以上的数据。③GraphsHistogramExplore②AnalyzeDescriptiveStatisticsFrequenciesDescriptiveStatistics①Analyze(3)与条形图的关系:条形图是直方图的特例。\n\n(3)“茎节”的宽度确定原则:茎节是有变化的1231.23,茎节宽度为10012.3,茎节宽度为10样本值=“茎节.叶”表达ד茎节”的宽度(4)茎节的长度①茎节长度=“允许的最大叶值-最小叶值+1”。②茎节长度=4.茎叶图(1)适用范围:适用于顺序级以上的数据。(2)基本含义:\n某班级男生的身高数据(单位:厘米)171182175177178181185168170175177180176172165160178186190176163183按照“样本数据集合中的‘茎节’必须是有变化”的原则,显然,在本例中,应以百位数和十位数为“茎(节)”,也就是说,“茎(节)”的宽度是10(厘米)。这样,“叶”就只能是个位数了。于是,按照上述制作规则,我们可以用SPSS软件得到茎叶图。(5)SPSS实现:AnalyzeDescriptiveStatisticsExplore\n某商品价格(单位:元)Stem-and-LeafPlotFrequencyStem&Leaf1.0099.31.0099.53.0099.6777.0099.88899998.00100.000011115.00100.223334.00100.44551.00100.6Stemwidth:100Eachleaf:1case(s)\n无众数(极端情况下)2数据集位置的测度:对数据中心的描述2.1样本众数(SampleMode)样本众数定义样本众数种类单一众数(大多数情况下)复众数(一般情况下)样本众数的计算顺序级的样本数据名义级的样本数据刻度级的样本数据分组不分组\n①单项数列某商品的价格价格单位:元次数频率9.939.949.959.969.979.989.9910.0010.0110.0210.0310.0410.0510.06101123444232213.3303.333.336.6710.013.3313.3313.336.6710.06.676.673.33②组距数列:众数组次数与前一组次数之差:众数组次数与后一组次数之差:众数组的下限\n2.样本中位数的使用:当样本数据的个数(样本容量)为偶数时,样本中位数仅适用于刻度级的样本数据集合(因为顺序级的数据不能做加减运算)。当样本数据的个数(样本容量)为奇数时,样本中位数适用于顺序级以上的样本数据集合;2.2样本中位数(Samplemedian)1.样本中位数定义:3.样本中位数的计算:\n当为奇数时,中位数位置=样本中位数=当是偶数时,中位数位置=样本中位数=①未分组数列\n某车间同工种的10名工人完成个人生产定额百分数如下(%):9398123118158121146l17l08105试根据上述资料求出工人平均完成生产定额大约是多少?该车间工人完成个人生产定额排序如下:9398105108117118121123146158DataSortCase排序的SPSS实现命令:\n②组距数列刚好大于的向上累计数所在的组7/20/202125\n成绩人数(人)频率(%)向上累计向下累计(%)60以下60-7070-8080-9090-10051117116102234221251633445010090683412合计50100——50名学生统计学考试成绩分布表\n2.3样本均值(SampleMean)样本均值又称样本平均数仅适用于刻度级的数据。未分组数列分组数列:组中值:频次或次数②加权平均数①简单平均数\n成绩人数(人)频率(%)向上累计向下累计(%)60以下60-7070-8080-9090-10051117116102234221251633445010090683412合计50100——7/20/202128\n③调和均值7/20/202129\n某车间三位工人的劳动生产率资料工人每天修理设备台数修一台设备需天数甲0.5台/天2天/台乙0.254丙0.25合计0.95计算三位工人平均劳动生产率7/20/202130\n④几何均值简单几何均值加权几何均值算平均比率及平均速度众数中位数和均值的比较7/20/202131\n人均月奖金(元)职工人数(人)10——20620——301030——402040——503050——604060——7024070——906090以上20练习某地区抽样调查职工月奖金资料如下:试计算平均月奖金,中位数和众数。\n3数据集离散程度的测度3.1点状描述:适用于顺序级以上数据。在一般情况下,仅适用于刻度级的数据。只有在n+1能够被4整除时,才适用于顺序级的数据。1.极值MaximumMinimum2.四分位点中四分位点下四分位点LowerQuartile上四分位点UpperQuartile01234(99.8)(99.9)(100.1)(100.2)的位置的位置的位置①未分组数列\n②组距数列刚好大于的向上累计数所在的组:中位数(四分位数)组的次数:中位数(四分位数)组前一组的向上累计数3.上下十分位点(Percentile)\n产值(万元)人数(人)频率(%)向上累计向下累计(%)60以下60-7070-8080-100100以上51117116102234221251633445010090683412合计50100——50名学生统计学考试成绩分布表求上下四分位点\n4.标准差(SampleDeviations)2.四分位距(InterquartileRang)二、区间描述1.极差(Rang)3.方差(SumofSquaredDeviations)5.0-1分布的均值与方差6.数据的标准化\n三、样本数据的综合表达:箱形图刻度尺极差四分位距上四分点中位数下四分点极小值极大值SPSS实现Explore②AnalyzeDescriptiveStatistics①GraphsBoxplot7/20/202137\n171182175177178181185168170175177180176172165160178186190176163183某班级男生的身高数据(单位:厘米)频次茎叶416.03581117.012556677886118.19.01235607/20/202138\n20019018017016015022身高(厘米)图1男生身高数据普通箱形图\n4数据集的峰度与偏度一、峰度(Kurtosis)二、偏度(Skewness)\n峰度(Kurtosis)偏度(Skewness)\n峰度大于0表示比正态分布高峰更加陡峭,为尖顶峰;反之,峰度小于0,为平顶峰。偏度为0,表示数据分布形式与正态分布偏度相同;偏度大于0表示正偏差数值较大,为正偏或右偏,即有一长尾巴拖在左边;反之,小于0表示负偏差数值较大,为负偏或左偏,即有一长尾巴拖在右边。\n样本数据的基本特征图形表示频次与频率计算延伸累计频次与频率样本数据的位置特征对数据的离散描述对数据的集中描述点状描述区间描述小结:样本数据的综合特征描述——箱型图样本数据的分布特征——峰度和偏度\nThankyou!!!感谢各位!这次课就到这里!

相关文档