- 577.50 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
统计学费宇石磊(主编)第2章练习题参考答案2.1解:(1)首先将顾客态度分别用代码1、2、3表示,然后在数据文件的VaribleView窗口Values栏定义变量值标签:1代表“喜欢并愿意购买”;2代表“不喜欢”,3代表“喜欢并愿意购买”。操作步骤:依次点击File→点击open→点击Data→打开数据文件ex2.1→点击Analyze→点击DescriptiveStatistics→点击Frequencies→将“态度”选入Variable框→点击OK。输出结果如表2.1所示:表2.130名顾客对某种产品满意程度的频数分布表FrequencyPercentValidPercentCumulativePercentValid1喜欢并愿意购买1446.746.746.72不喜欢516.716.763.33喜欢但不愿意购买1136.736.7100.0Total30100.0100.0(2)根据表2.1频数分布表资料建立的数据文件为ex2.1.1。绘制条形图操作步骤:依次点击File→点击open→点击Data→打开数据文件ex2.1.1→Graphs→点击Bar→选中Simple,选中Summariesforgroupsofcases→单击Define→选中OtherSummaryfunction→将“人数”选入Variable(纵轴),将“态度分类”选入CategoryAxis(横轴)→点击OK。输出结果如图2.1所示:\n图2.130名顾客满意程度分布条形图绘制饼图操作步骤:依次点击File→点击open→点击Data→打开数据文件ex2.1.1→点击Graphs→点击Pie→选中Valuesofindividualcases→点击Define→将“人数”选入SlicesRepresent栏,将“态度分类”选入Variable栏→点击OK。输出结果如图2.2所示:图2.230名顾客满意程度分布饼图2.2解:首先列计算表如表2.2所示:表2.2120名学生英语成绩的均值、中位数、众数、偏态系数、峰度系数计算表按组中值(分)学生数(个)\n成绩分组(分)60以下551910455932.35-104824.611852250.8360~70653019501764.87-13536.53103825.1870~8075423150228.01531.271237.8680~90851815302736.5233741.29416030.1690以上951110455484.92122478.222734938.58合计—120872016146.6738389.645108282.61(1)均值表2.2中,分布次数最多的组是“40~50”组,这就是众数所在组;=60,中位数大约在第60位,可确定中位数也在“40~50”组。众数中位数(2)首先计算标准差:由计算结果可看出,偏态系数为正值,但与零的差距不大,说明120名大学生英语成绩为轻微右偏分布,成绩较低的同学占有一定的比例,但偏斜程度不大。由计算结果可看出,峰度系数为负值,说明120名大学生英语成绩为平峰分布,成绩较低的同学占一定比例,但低成绩区域的集中程度并不很高。2.3解(1)整理的组距数列如表2.3.1所示:表2.3.1连续60天计算机销售量频数分布表\n按销售量分组(台)天数(天)比重(%)10~2020~3030~4040~502623293.3310.0038.3348.34合计60100.00(2)下面使用SPSS16.0绘制图形:绘制直方图操作步骤:点击File→点击open→点击Data→读取数据文件ex2.3→点击Graphs→点击Histogram→将“销售量”选入Variable栏→点击OK。若选中Displaynormalcurve选项,则在生成的直方图上还显示正态曲线。输出结果如图2.3.1所示:图2.3.1连续60天计算机销售量直方图从图2.3.1可以看出,连续60天中,销售量为40~50台的天数较多。绘制简单箱线图操作步骤:点击File→点击open→点击Data→读取数据文件ex2.3→点击Graphs→点击Boxplot→选中simple,选中summariesofseparateVariables→点击Define→将“销售量”选入BoxesRepresent栏→点击Ok。输出结果如图2.3.2所示:\n图2.3.2连续60天计算机销售量箱线图从图2.3.2可看出,下横线之外有两个点,它们分别是第59和第60个观测值,原始数据中可查到,这两天的销售量分别为19台和18台,它们是离总体观测数据较远的离群点。绘制茎叶图操作步骤:点击File→点击open→点击Data→读取数据文件ex2.3→点击Analyze→点击DescriptiveStatistics-Explore→将“销售量”选入“DependentList”栏→点击Ok。输出结果如图2.3.3所示:销售量(台)Stem-and-LeafPlotFrequencyStem&Leaf2.00Extremes(=<19)1.002.25.002.568998.003.0022334415.003.889919.004.4410.004.5555666789Stemwidth:10Eachleaf:1case(s)图2.3.3连续60天计算机销售量茎叶图(3)描述统计分析操作步骤:点击File→点击open→点击Data→读取数据文件ex2.3→点击Analyze→点击DescriptiveStatistics→Descriptives→将“销售量”选入Variable栏→点击Options,选中Mean(均值)、Std.(标准差)、Minimum(最小值)、Maximum(最大值)、Kurtosis(峰态系数)、Skwness(偏态系数),选中Variablelist(变量顺序排列显示输出结果)→点击Continue→点击Ok。输出结果如表2.3.2所示:表2.3.2连续60天计算机销售量的描述统计量\nDescriptiveStatisticsNMinimumMaximumMeanStd.SkewnessKurtosisStatisticStatisticStatisticStatisticStatisticStatisticStd.ErrorStatisticStd.ErrorXSHL销售量(台)60184937.887.140-.879.309.422.608ValidN(listwise)60表2.3.2显示,连续60天中计算机销售量的最小值为18台,最大值为49台,平均销售量为37.88台,标准差为7.14台;偏态系数为-0.879,表明计算机销售量为左偏分布,在连续60天中,销售量较高的天数占一定比例,具有一定的偏斜度;峰态系数为0.608,表明计算机销售量为尖峰分布,销售量较高的天数具有一定的集中度。第3章练习题参考答案3.1解:操作步骤:Analyze→DescriptiveStatistics→Explore,将x选入DependentList,在Statistics中选中Descriptives输出结果表3-1DescriptivesStatisticStd.ErrorxMean180.050011.6833195%ConfidenceIntervalforMeanLowerBound156.8678UpperBound203.23225%TrimmedMean172.3556Median156.0000Variance13649.967Std.Deviation116.83307Minimum24.00Maximum510.00Range486.00\nInterquartileRange130.25Skewness1.112.241Kurtosis.572.478结果分析:由表3-1可知,该超市每位顾客的平均花费金额的点估计180.0500,可信度为95%的区间估计为(156.8678,203.2322)(保留两位小数)。3.2解:(1)先估计每位顾客平时的平均花费金额和周末的平均花费金额的置信区间操作步骤:Analyze→DescriptiveStatistics→Explore,将x选入DependentList,将顾客总体选入FactorList,在Statistics中选中Descriptives;输出结果:表3-2-1Descriptives顾客总体StatisticStd.Errorx总体一Mean159.800017.5234095%ConfidenceIntervalforMeanLowerBound124.5854UpperBound195.01465%TrimmedMean150.3778Median116.0000Variance15353.469Std.Deviation123.90912Minimum24.00Maximum480.00Range456.00InterquartileRange139.75Skewness1.264.337Kurtosis.713.662总体二Mean200.300015.0918395%ConfidenceIntervalforMeanLowerBound169.9718UpperBound230.62825%TrimmedMean192.8222\nMedian177.5000Variance11388.173Std.Deviation106.71539Minimum55.00Maximum510.00Range455.00InterquartileRange109.25Skewness1.237.337Kurtosis1.059.662(2)再估计二者的差的置信区间操作步骤:Analyze→Comparemeans→Independent—SamplesTtest,将x选入TestVariable(s),将顾客总体选入GroupingVariable(s),在DefineGroups中分别定义总体一和总体二。输出结果:表3-2-2IndependentSamplesTestLevene'sTestforEqualityofVariancest-testforEqualityofMeansFSig.tdfSig.(2-tailed)MeanDifferenceStd.ErrorDifference95%ConfidenceIntervaloftheDifferenceLowerUpperxEqualvariancesassumed1.312.255-1.75198.083-40.5000023.12645-86.393695.39369Equalvariancesnotassumed-1.75195.892.083-40.5000023.12645-86.406315.40631结果分析:表3-2-1是探索性分析的结果,可知每位顾客平时的平均花费金额的置信区间为(124.5854,195.0146),周末的平均花费金额的置信区间为(169.9718,230.6282)。表3-2-2是独立样本t检验的结果,Levene'sTestfor\nEqualityofVariances为方差检验的结果,F=1.312,其P值为0.255<0.05,拒绝方差相等的原假设,认为两总体的方差不等,因此两总体的差的置信区间为(-86.40631,5.40631)3.3解:操作步骤:Analyze→DescriptiveStatistics→Explore,将x选入DependentList,在Statistics中选中Descriptives;输出结果:表3-3DescriptivesStatisticStd.ErrorxMean68.18751.7517195%ConfidenceIntervalforMeanLowerBound64.4538UpperBound71.92125%TrimmedMean68.1528Median67.5000Variance49.096Std.Deviation7.00684Minimum55.00Maximum82.00Range27.00InterquartileRange6.50Skewness.290.564Kurtosis.4821.091结果分析:表3-3是探索性分析的结果,由分析结果可知,该市成年男子体重置信度为95%的区间估计为(64.4538,71.9212)。3.4解:由中心极限定理可知:近似的服从分布,于是有\n(3.4)该市所有家庭中安装了宽带上网的家庭的百分比为是分布的参数,,,,,代入式(3.4)求得的置信水平为95%的置信区间为(0.92,0.98)第4章练习题参考答案4.1解:操作步骤:进行单样本T检验,Analyze→Comparemeans→One—SamplesTtest,将x选入TestVariable(s),在TestValue中输入0.618。输出结果:表4-1One-SampleTestTestValue=0.618tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpperx2.88415.011.072813.01901.12662结果分析:根据表4-1中单样本T检验的结果,,按显著性水平\n无法拒绝的原假设,认为该厂生产的工艺品框架宽与长的比值符合黄金比率。4.2解:H0:p>=50%H1:p<50%p=160/360=44.44%Z===-2.11这是一个单侧检验,-=-1.645拒绝原假设,这个专家的论断不成立。4.3解::,即该厂家广告可信:,即该厂家广告不可信操作步骤:进行单样本T检验,Analyze→Comparemeans→One—SamplesTtest,将x选入TestVariable(s),在TestValue中输入0.618。输出结果:表4-3-1One-SampleStatisticsNMeanStd.DeviationStd.ErrorMeanx1230905.83331888.37332545.12642表4-3-2One-SampleTestTestValue=30000tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpperx1.66211.125905.83333-293.98182105.6485\n结果分析:由表4-3-1可知,样本均值为30905.8333,表4-3-2是单样本双侧T检验的结果,可知平均寿命95%的置信区间为(-293.9818,2105.6485),根据平均寿命大于0以及双侧检验和单侧检验的关系,95%的单侧置信区间应为(0,2105.6485),该置信区间与显著性水平0.05的本题的左边检验问题相对应,而X0=30000并不在置信区间(0,2105.6485),因此拒绝H0,认为该厂家的广告不可信。4.4解:操作步骤:进行独立样本T检验,Analyze→Comparemeans→Independent—SamplesTtest,将x选入TestVariable(s),将顾客总体选入GroupingVariable(s),在DefineGroups中分别定义总体一和总体二。输出结果:表4-4IndependentSamplesTestLevene'sTestforEqualityofVariancest-testforEqualityofMeansFSig.tdfSig.(2-tailed)MeanDifferenceStd.ErrorDifference95%ConfidenceIntervaloftheDifferenceLowerUpperxEqualvariancesassumed1.312.255-1.75198.083-40.5000023.12645-86.393695.39369Equalvariancesnotassumed-1.75195.892.083-40.5000023.12645-86.406315.40631结果分析:表4-4是单样本T检验的结果。首先根据该表方差齐性检验的结果,,,即,无法拒绝方差齐性的原假设,认为两个总体的方差相等。在方差齐性的假设下,独立样本t检验结果为:,\n,,无法拒绝两个总体的平均花费金额相同的原假设,认为该超市每位顾客平时(周一至周五)的平均花费金额与周末(周六和周日)的平均花费金额是相同的。4.5解:操作步骤:进行配对样本T检验,Analyze→Comparemeans→Paired—SamplesTtest,将X1选入TestVariable1,将X2选入Variable2。输出结果:表4-5-1PairedSamplesStatisticsMeanNStd.DeviationStd.ErrorMeanPair1促销前销售量34.9000104.817791.52352促销后销售量38.6000104.948621.56489表4-5-2PairedSamplesCorrelationsNCorrelationSig.Pair1促销前销售量&促销后销售量10.954.000表4-5-3PairedSamplesTestPairedDifferencestdfSig.(2-tailed)MeanStd.DeviationStd.ErrorMean95%ConfidenceIntervaloftheDifferenceLowerUpperPair1促销前销售量-促销后销售量-3.700001.49443.47258-4.76905-2.63095-7.8299.000结果分析:由表4-5-1可知,促销前的平均销售量为34.9000,促销后的平均销售量为38.6000。由表4-5-2可知促销前后的相关系数为0.954,P=0.000<0.05,两者相关性显著。根据表4-5-3中配对样本t检验的结果,得到,,,在水平下,拒绝原假设,认为促销后销售量有明显的提高。\n第8章练习题参考答案8.1解:(1)(2)8.2(数据文件为ex8.2)解:(1)(小时)(2)(小时)(小时)8.3解:当置信度为90%时当置信度为95%时8.4解:(人)8.5解:第9章练习题参考答案9.1解:(1)三种商品的销售量个体指数分别为:A:;B:;C、三种商品的销售价格个体指数分别为:\nA:;B:;C、(2)三种商品的销售量总指数为:或三种商品的销售价格总指数为:;或比较:由于拉氏指数与帕氏指数的同度量因素固定时期不同,因而对同一指数的计算结果也就不同。本题中,拉氏指数的计算结果大于帕氏指数。9.2解:销售额指数销售额变动绝对额:销售量指数销售量变动对销售额的影响额:销售价格指数销售价格变动对销售额的影响额:以上三个指数之间的关系为:相对数方面:139.71%=120.59%×115.85%绝对数方面:27(万元)=14(万元)+13(万元)计算结果表明:报告期与基期相比,由于三种商品的销售量增长20.59%,使销售额增加了14万元;又由于三种商品的销售价格上涨15.85%,使销售额增加了13万元。两个因素共同作用的结果,使销售额最终增长39.71%,共增加了27万元。第3章案例分析\n1.两个社区的家庭月平均收入和购物月平均支出基本服从正态分布。设家庭月平均收入,购物月平均支出。当未知时,的置信水平为的置信区间而的置信水平为的置信区间为查表知,,,(1)对于社区A,家庭月平均收入95%的置信区间:用SPSS打开数据case-study3,选择Analyze→DescriptiveStatistics→Explore,将社区A家庭月平均收入(x1)选入DependentList,在左下角Display中点击Both,然后在中下方Statistics中选Descriptives和置信度(默认值为95%),最后点击Continue→OK,可以输出如下表3.5,表3.5社区A家庭月平均收入95%的置信区间DescriptivesStatisticStd.Error社区A家庭月平均收入Mean5360.0000211.9106595%ConfidenceIntervalforMeanLowerBound4934.1496UpperBound5785.85045%TrimmedMean5377.7778Median5500.0000Variance2245306.122Std.Deviation1498.43456Minimum1500.00Maximum8500.00Range7000.00InterquartileRange2000.00Skewness-.206.337Kurtosis.137.662\n所以,家庭月平均收入期望值的置信水平为95%的置信区间[4934.15,5785.85],而经过计算可得,标准差95%的置信区间为。同理,购物月平均支出使用SPSS软件操作如上,只是将社区A家庭购物月平均支出(y1)选入DependentList,输出以下表3.6,表3.6社区A家庭月平均支出95%的置信区间DescriptivesStatisticStd.Error社区A家庭购物月平均支出Mean1176.000040.6638895%ConfidenceIntervalforMeanLowerBound1094.2829UpperBound1257.71715%TrimmedMean1177.7778Median1200.0000Variance82677.551Std.Deviation287.53704Minimum600.00Maximum1800.00Range1200.00InterquartileRange400.00Skewness.090.337Kurtosis-.648.662所以,购物月平均支出期望值的置信水平为95%的置信区间[1094.28,1257.72],而经过计算可得,标准差95%的置信区间为。(1)对于社区B,家庭月平均收入95%的置信区间:用SPSS打开数据case-study3,选择Analyze→DescriptiveStatistics→Explore,将社区B家庭月平均收入(x2)选入DependentList,在左下角Display中点击Both,然后在中下方Statistics中选Descriptives和置信度(默认值为95%),最后点击Continue→OK,可以输出如下表3.7,表3.7社区B家庭月平均收入95%的置信区间DescriptivesStatisticStd.Error社区B家庭月平均收入Mean5320.0000217.01124\n95%ConfidenceIntervalforMeanLowerBound4883.8996UpperBound5756.10045%TrimmedMean5300.0000Median5500.0000Variance2354693.878Std.Deviation1534.50118Minimum2500.00Maximum8500.00Range6000.00InterquartileRange2000.00Skewness.174.337Kurtosis-.414.662所以,家庭月平均收入期望值的置信水平为95%的置信区间[4883.90,5756.10],而经过计算可得,标准差95%的置信区间为。同理,购物月平均支出用SPSS软件操作如上,只是将社区B家庭购物月平均支出(y2)选入DependentList,可以输出如下表3.8,表3.8社区B家庭月平均支出95%的置信区间DescriptivesStatisticStd.Error社区B家庭购物月平均支出Mean1192.000045.7000095%ConfidenceIntervalforMeanLowerBound1100.1624UpperBound1283.83765%TrimmedMean1193.3333Median1200.0000Variance104424.490Std.Deviation323.14778Minimum400.00Maximum1800.00Range1400.00InterquartileRange400.00Skewness.158.337\nKurtosis-.269.662所以,购物月平均支出期望值的置信水平为95%的置信区间[1100.16,1283.84],而经过计算可得,标准差95%的置信区间为。2.大样本条件下,总体比例的置信度近似为的置信区间为由于,,查表知,。(1)对于社区A,购物月平均支出占月平均收入的比例所以,置信度为95%的置信区间为。(2)对于社区B,购物月平均支出占月平均收入的比例所以,置信度为95%的置信区间为.3.大样本条件下,总体比例之差的置信度近似为的置信区间为\n所以,两个社区购物月平均支出占月平均收入的比例之差置信度为95%的置信区间为。4.综上,两个社区家庭的月平均收入和用于购物的月平均支出都比较接近,而且购物占收入的比例基本上在20%左右,比较稳定,说明可以考虑在两个社区附近建立一个方便人们日常生活的小规模购物中心。如果经过一段时间重新进行调查,发现社区居民购物占收入的比例持续上升,则可以考虑扩大购物中心的规模,增加销售商品的种类。