- 413.00 KB
- 2022-08-29 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
《应用统计学》课后习题第一章概率论基础知识P261.试述以下基本概念:随机实验;基本事件;样本空间;随机事件;相容事件与不相容事件;独立事件;概率;概率运算的主要性质;条件概率;乘法定律与全概率公式;贝叶斯公式;相互独立的随即事件的概率公式;离散型随机变量的概率;离散型随机变量的累积概率;连续性随机变量的概率;连续性随机变量的累积概率;连续性随机变量的概率密度;离散分布与连续分布的区别与对应关系;两个随机变量的联合概率分布;边缘分布;条件分布;均匀分布。2.某大公司有南方和北方两大生产基地。2004年某产品的产量为20万件,其中60%是由南方基地生产的,南方基地的非正品率为0.1%,北方基地的正品率为99.6%。问:在市场中抽查到一件次品,是北方基地生产的概率是多少,是南方基地生产的概率是多少?试用条件概率表来计算。3.检查下面的函数以决定它是否是一个概率函数,并画出它的直方图。P(x)=(X2+5),x=1,2,3,4(注意:X2表示X的平方)4.随机变量X有下面的概率分布,求X得均值和标准差X12345P(x)0.50.20.10.10.15.两点分布(0—1)与二项分布的关系是什么?6.某超市经理保证,他的一打一盒的蛋中,不会有多于一个的坏的蛋。如果有多于一个坏的蛋,他将赔一整盒(一打)的鸡蛋,并允许顾客保有原来的那盒蛋。如果一个蛋是坏的概率是0.01,那么经理必须赔送鸡蛋的概率是多少7.某篮球运动员在比赛时发球得分的概率是0.8,他在下5个罚球中将失去3个的概率是多少?8.在任意一天,某港口的到船数X是一个随机变量。X的概率分布如下表,求在指定的一天中:①恰有14艘船到达的概率;②至少有12艘船到达的概率;③至少11艘船达到的概率。X1011121314P(x)0.40.20.20.10.19.某公司的决策都由一个3人委员会作出,问:①如果每个成员独立做决策的正确的概率为p,委员会按照简单多数的原则正确作出决策的概率是多少?②若p=0.1,委员会作出正确决策的概率是多少?③若p=0.8,委员会作出正确决策的概率是多少?\n④当p取什么值时,委员会按照简单多数规则决策,比总经理一个人决策(假设其正确决策的概率也是p)的正确率高?10.举出实际生活中服从泊松分布的例子。11.正太分布是最常见的分布之一,试画出正态分布的密度函数的示意图。第一章数据与数据的获得P631.试述以下基本概念:总体(或母体);个体;变量(或指标);变量值(指标值);数据;便利抽样;滚雪球抽样;简单随机抽样;量表;连续量表;分项量表;Likert量表;测量信度;复本信度;测量效度;表面效度;内容效度2.数据测度分为几个类别?试举例说明。3.不同测度的数据的应用范围的主要区别是什么?4.企业质量管理员在生产线上某环节随机地抽取被加工的部件,并检验记录所抽取的部件的下列信息::①有无缺陷;②加工此部件工人的工号;③部件的重量。问:①被研究对象的总体是什么;②此总体是有限总体还是无限总体;③样本是什么;④上述三个变量是属性变量还是数值变量?5.学生上学时所带书本的重量,是什么测度类型的变量?6.研究用某群体中个体的网瘾严重程度时,把严重程度的测度标准设为:无、轻度、重度、严重、非常严重。试:①给关心的变量命名;②判别这个变量的测度类型。7.在刚入学的某专业的新生中随机的抽取10名学生,并收集如下三个变量的数据:X:选课课程的门数;Y:课本总费用;Z:被抽取学生的性别。问:①总体是什么;②此总体是有限总体还是无限总体;③样本是什么;④上述三个变量的测度类型是什么?8.观察数据与实验数据的主要区别是什么?9.普查与抽样调查的区别是什么?10.试述百丽抽样与非概率抽样的区别。11.某研究者从四位数的随机数字表示,按照顺序取出500个数字,凡是电话号码后4位的数字在那500个数字范围内,都欧式被调查对象。问:这位研究者所得到的是不是一个随机样本?为什么?12.分层抽样(分类抽样)的做法和适用条件是什么?13.如何确定分层抽样(分类抽样)各层的样本个数?14.在分层抽样中,决定各层样本数的方差分配法(最优分配法)的方差如何合理得获得?\n15.整群抽样的做法和适用条件是什么?16.试述系统抽样(等距抽样)的做法。17.某研究组在网站上发了一个调查问题,“在您的开销中,通过网络购买的比例是多少?”请问:①这是何种抽样方法;②其结果能够代表消费者网上消费的比例吗?为什么?18.在基于问卷的研究中,为什么说问卷的深度决定了研究的深度?19.构成问卷的问题的主要类型有哪些?20.如下问卷问题是否恰当?如不恰当,存在什么问题?1)您多久上一次网?A.1个月B.2—3个月C.半年D.半年以上2)国家队政府官员以权谋私打击,是(选一)A.非常坚决的B.有一定的效果C.效果甚微D.。。。。。。3)领导干部的家属经商,与领导干部的关系是(选一)A.无关B.领导自律不严C.领导纵然包庇D.权钱交易E.。。。。。。4)您是烟民吗?A.是B.不是5)如果您没有手机的话,您准备购买吗?A.肯定会B.可能会C.不会D.不确定6)您每月上西餐馆的状况是?A.从不B.偶尔C.有时D.经常21.试述设立问卷问题的4个思考角度。22.对变量(特征)之间的相互关系的猜想,对设计问卷的影响是什么?23.为什么说文献阅读是设立问卷问题的最重要的来源之一?24.事先考虑数据处理方法对设计问卷的影响是什么?25.如何判断一个问题可能得到诚实回答(或不诚实回答)?26.应当如何处置“不能获得诚实回答”和“怀疑的不到诚实回答”的问题?27.当选问题的备选答案应当满足什么条件?28.多选题的备选答案如果有交集,会带来什么后果?29.备选答案的多重含义对问题的分析产生什么影响?30.试判断如下陈述的正误:1)备选答案如果分布在一个维度(例如资金维度)上,可以多选2)备选答案必须分布在两个或两个以上的维度才可以多选3)备选答案只要是互斥的就可以作为单选问题4)备选答案只要分布在一个维度上就可以作为单选问题\n1)多选问题的备选答案是必须是互斥的(即不能有交集)2)多选问题的备选答案对于应答者而言必须是相容的(可以有交集)3)设置被排序的对象,不必考虑对象的个数4)问卷长一些好,可以获得较多的信息31.为什么说问卷设计一定要通过小规模访谈来修改?32.测量“重测信度”的要点是什么?33.拆半信度的适用条件是什么?34.有内在效度的测量工具,就一定有外在效度吗?35.有信度就一定有效度吗?36.如何改进信度与效度?37.获得数据的实验方法主要适用于哪三种特殊类型的数据?38.获得数据的实验方法主要有哪三类手段?39.什么是获得数据的实验的外部因素?应当如何处理外部因素?40.什么是获得数据的实验的内部因素?应当如何处理外部因素?41.什么是获得数据的实验的混合因素?应当如何处理外部因素?42.在什么情况下随机分组较为恰当?什么情况下交替交错分组较为恰当?第一章样本数据特征的初步分析P961.对于一个数据集合(样本值集合)而言,除了关心样本值本身以外,我们还关心样本值(数据值)出现的_________和_________2.对于一个数据集合而言,什么是样本值(变量值)的频次?什么是样本值(变量值)的频率?3.哪些测度等级的数据集合,适合于做频次与频率的饼图?4.哪些测度等级的数据集合,适合于做频次与频率的条形图?5.频次与频率的饼图有差异吗?为什么?6.频次与频率的条形图有差异吗?为什么?7.对于一个数据集合而言,什么是累计频率?8.能够用饼图来表示一个数据集合的累积频率吗?9.哪些测度等级的数据集合才能计算累积频率?10.除了表格法以外,还可以用_________图来表示一个数据集合的累积频率分布状况?11.什么是一个数据集合的茎叶图?12.对于一个数据集合而言,什么是茎叶?什么是茎叶的宽度?什么是叶?如何依据数据集合来确定茎节和叶?13.什么是茎节得长度?举例说明茎节的宽度和茎节得长度的区别。\n14.在如右茎叶图中:①茎宽=0.1是什么意思?②在这张茎叶图上显示了多少个数据?③列出头四个数据值。N=16茎宽=0.1159736014856102669462024726358164315.以下是某班级男生的体重数据(单位:公斤),请作该数据集合的茎叶图。72.065.867.168.671.170.568.068.075.067.576.062.755.950.268.476.680.576.463.373.916.什么是直方图?17.直方图与条形图的区别是什么?18.什么测度级别的数据,适宜做直方图?19.作直方图时,一般是先确定区间长度还是先确定区间个数?哪个更好一些?20.做直方图时,在区间长度确定后,如何确定区间个数?21.做直方图时,如何确定最左端区间的中心位置?22.依据如下直方图,判断亵渎Skewness的正负号23.什么是组频次?什么是组频率?24.什么是数据集合的众数?25.什么是单一众数?什么是复众数?26.什么测度级别的数据集合可以求众数?27.某国对该国博士的子女数量做了一项调查,结果如下表,请计算子女数的样本均值、方差和标准差。博士数目1311181241孩子数目012346\n28.从学院学生中随机的挑选15名学生,问他们昨晚睡眠的小时数。得到的样本数据是:5,6,6,8,7,7,9,5,4,8,11,6,7,8,7,。请求出以下各值:①均值②中位数③众数④方差⑤标准差。29.为什么刻度级的数据集合通常依托直方图确定众数(区间)?30.什么是数据集合的中位数?如何确定一个数据集合的中位数?31.什么测度级别的数据集合适合于确定中位数?32.略33.什么是样本均值?如何计算一个数据集合的样本均值?在样本均值的计算公式中,什么量与母体均值公式中的Pk对应?34.什么测度级别的数据集合适合于计算样本均值?35.什么是数据集合的极大值和极小值?36.什么是数据集合的下四分点和上四分点?37.如何计算下四分点的值和上四分点的值?38.如果计算出上四分点的数据在15和13.6之间,且上四分点的位置是12.25,求上四分点的值?39.什么测度级诶别的数据集合可以计算四分点的值?40.什么是百分位点?举例说明?41.什么是极差?什么是四分位距?42.什么是样本离差、离差平方和?什么是方差?这三者之间的关系是什么?43.什么是变异系数?变异系数的优点是什么?44.众数、中位数、样本均值各反映了样本数据集合的什么特征?45.极值、四分店,百分位点、极差、四分位距、离差、离差平方和、方差各反映了样本数据集合的什么特征?46.以下是一组儿童首次牙科检查的年龄的样本,求:①对这些儿童首次牙科检查年龄的均值②中位数年龄③标准差首次牙科检查的年龄x12345儿童的数目f91123162147.下面的数据是某一天20位工人收割麻黄草的数量,求:①收获量的上四分位数和下四分位数;②中位数③以下的百分位数:P15,P33,P90。7.04.85.06.84.83.75.83.64.05.93.93.45.12.74.47.05.62.64.85.648.某大学某学年某年级的学生选课学时数如下表,试:①用SPSS画此数据的直方图②求集中趋势的如下度量:众数,中位数,均值③求Q1和Q3④求P15和P12⑤求离散趋势的三种度量(极差,标准差,方差)\n学分时数91011121314151617181920频数689013015017030040085065051023012049.箱形图给出了一个数据集合的哪几个量?50.修正箱形图是如何构造的?它对想形图的哪个部分作了修正?第一章SPSS的简单应用P1431.如何在SPSS中定义变量2.填写变量标签的主要意义是什么?3.填写变量值标签的主要意义是什么4.SPSS中变量值标签的用途是(选出正确答案):A.注明变量的含义,例如:注明X是“农民家庭收入”;B.注明变量的取值范围,超出该范围的值将被作为缺省值处理C.注明变量值的含义D.注明变量值得单位5.通过变量值标签的限定,把顺序级得变量定义为数字型有什么好处?6.在调查表得栏目很多(也就是变量个数很多)时,如何巧妙得设计变量名?7.把回收的有效调查表的编号作为一个变量,定义在SPSS的数据文件中有什么好处?8.用SPSS主要可以读入哪些格式的数据?9.按照回收的调查表输入数据,是按照行输入好咳是按照列输入好?为什么?10.为什么说增加case(在数据窗口的下端加入新的数据)的并表方式特别重要?怎样分头输入数据,才能有效地并表?11.请选用数据盘中的恰当数据文件,用SPSS做如下计算练习:①给变量值排序,给变量值排名次,统计数据的频次、频率、累积频率与累积频次;②计算众数、中位数、样本均值等;③计算极值、四分点、百分位点、极差、四分位距、离差、离差平方和、方差及标准化数据等;④绘制饼图、条形图、直方图、茎叶图、想形图与修整想形图。12.下面的数额是某文具店出售文件夹的40个交易的收入(元),试:①用SPSS作一张茎叶图;②用SPSS作直方图3.623.623.803.704.152.073.775.777.864.634.033.563.106.045.623.162.933.824.303.864.812.865.025.244.025.444.653.894.002.994.573.594.576.162.885.035.463.876.814.91\n13.某牙科诊所费用开支比例如下表所示,试:①用SPSS作一张饼图;②用SPSS作条形图。开支类型金额%开支类型金额%医生个人收入53.60治疗失当保险金3.5非医生人员个人收入15.70雇佣医生2.3办公费用11.90医疗设备1.5医疗供应5.00其他6.514.某医院眼科门诊看病者的年龄如下,试:①用SPSS制作这些年龄的一张不分组的频数分布表;②用SPSS制作这些数据的一张不分组的频率分布表;③用SPSS制作这些数据的一张不分组的频率条形图;④用SPSS制作同一组数据的的频率分布表;⑤用SPSS制作这些数据的一累积频率条形图。组121192121191920191919组218211918222124202417组321192219182023191920组41920212221202220212015.略16.什么是数据分布的斜度?SPSS是如何规定数据集合的负斜度、0斜度、正斜度的?17.什么是数据分布的峰度?SPSS是如何规定数据集合的负峰度、0峰度、正峰度的?18.什么是均值的标准误差?19.某样本集合的均值是50,标准差是4.0。求下列每个样本观察值x值得标准化值z:①x=54;②x=50;③x=59;④x=45。第一章总体分布、样本分部与参数估计P1731.试述以下基本概念:总体分布;随机样本;简单随机样本;样本观察值;样本分布;样本(累积)分布函数Fn(x);点估计;矩估计法;无偏估计量;有效估计量;渐进无偏估计量;一致估计量。2.试述格利文科定理。格利文科定理的主要意义是什么?\n3.什么是统计量?什么是统计量的值?4.基于标准正态分布N(0,1)的随机样本,如何构成了分布、t分布或F分布?5.略6.若随机变量X的均值为,标准差为,分布形式任意。从总体得到一组随机样本X1、X2……Xn,问统计量的分布函数的均值与标准差各是多少?7.网箱养鱼户在某年出售某类鱼的平均价格是每斤4.33元。假定售鱼价格的标准差是每斤0.75元。随机选择150户养殖该类鱼的养殖户,那么这150养鱼户的售价均值构成了一个统计量,这个统计量的分布是一个抽样分布。问:①这个抽样分布的平均值是多少;②这个抽样分布的标准差是多少?③描述这个抽样分布的形状。8.0—1分布(即B(1,p)分布),状态1出现时,随机变量X=1,状态2出现时,X=2。设P(X=1)=p,问:①X的均值、方差各是什么;②的均值,方差各是什么?9.设随机变量X的均值为,方差为平方,X1、X2……Xn,为X得样本,则当n充分大时,近似地服从什么分布?一般而言,n大于等于多少才算充分大10.某市场调查员在研究消费者购物习惯的时候,询问了进入超市的第20名顾客,问他每周购买几次食品,并将答案记录为T。问:T=3是什么?从下列备选答案中选择正确答案:A.样本观察值B.变量C.统计量D.参数11.什么是极大似然估计法?极大似然估计法的基本思想是什么?12.什么是估计量的最小方差性?13.什么是估计量的渐进有效性?14.什么是区间估计?举例说明?15.抽取18袋袋装香米,重量的样本均值是9.87公斤,样本标准差是0.27公斤,假设袋装香米的重量服从正态分布。求::①这种袋装香米没带的真实平均重量为95%的置信区间。②这种袋装香米没带的真实平均重量为99%的置信区间。③置信水平的增加对置信区间的宽度有什么影响?16.某小学5年级抽出100个学生的身高的均值是139厘米,标准差为5厘米,近似服从正态分布。试计算该小学五年级学生的平均身高以90%的概率落在什么区间?\n17.三个电视剧的第一名将由观众投票产生。某机构在正式投票前做了一次民意调查,预测第一名的得主,并且希望预测的误差不超过3%。在正式民意调查前,小规模抽样调查对三个电视剧的支持的调查样本方差近似于0.36,试计算在95%的置信水平上本次调查所需要的样本量。18.请选用数据盘中的恰当数据文件,用SPSS的如下模块计算数据集合的样本均值、样本方差,或做区间估计:①频次分析模块;②统计模块;③探索模块。19.依据数据文件“CH4茎叶箱方差工资性别岗位300余”,计算不同工作性质的人员数占总体人数的比例(需要改造数据文件“CH4茎叶箱方差工资性别岗位300余”中的“工作性质”变量的数据表达方式)。20.略21.用SPSS完成如下计算:①已知X服从N(0,1)分布,求P(X≤1.975)值;②已知X服从(18)分布,求P(X≤9.390);③已知X服从F(6,8)分布,求P(X≤2.67);④已知X服从T(18)分布,求P(X≤2.1009)值;⑤已知X服从二项分布B(10,0.25)分布,分别求P(X=0),P(X≤,1);P(X=1)值.第一章参数假设检验P2131.试述以下基本概念:参数检验;非参数检验2.什么是“弃真”错误?什么是“存伪”错误?在假设检验中,通常把什么错误控制的比较小?3.以问题“已知方差,检验假设:=0”为例,说明假设检验的基本思路。4.假设检验的三个关键点是什么?5.在判断是接受还是拒绝零假设H0时,有两种方法:①用的统计值的p值(即,统计值得显著性概率,或称为统计值的外侧概率),与显著性水平比较;②用统计值自身,与临界统计值或/2比较。哪个更好一些?为什么?6.对下面灭个检验计算z统计值的显著性概率p的值:①H0:=10,H1:>10,z=1.48②H0:=105,H1:<105,z=-0.85③H0:=13.4,H1:≠13,z=-0.85④H0:=8.56,H1:<8.56,z=-2.11⑤H0:=110,H1:≠110,z=-0.937.对下面每个检验计算统计量的值①H0:=35,H1:>35,p=0.0582\n②H0:=35,H1:<35,z=0.0166③H0:=35,H1:≠35,z=0.00428.关于一个正态分布总体的参数检验的统计量问题:①检验均值(=0否),当已知时,用什么统计量?当未知时,用什么统计量?②检验方差(=0?未知)用什么统计量?9.举出若干需要“检验均值与方差是否改变”的例子。10.检验零假设:初中男生平均身高160厘米。完备假设:初中男生平均身高超过160厘米。抽样测得36位初中生的身高如下表,试用SPSS完成这个假设检验。17016814514815717317014915517615317014615918614315816717317614516616717616914715617516617415017618115617314811.有一家企业生产某产品,按照产品标准,成分A的含量应当在10%以上,该企业有一批产品,抽出64瓶,化验结果是=10.19%,样本标准差是0.8,这批产品在1%的显著性水平上是否合格?12.从一批灯泡中随机抽取25个,算得样本平均使用寿命=1950小时,标准差为500小时,规定最大显著水平=0.01,问这批灯泡是否满足平均使用寿命为2000小时的设计标准?13.下表是32个地区体重超重比例在15%-25%的人群中有心脏病比率数据。试用SPSS检验零假设在该超重范围内有心脏病的比率均值=18%,对备择假设≠18%,取=0.0518.319.722.119.217.512.722.017.221.116.215.419.921.519.822.516.513.022.127.717.922.219.718.122.417.313.322.116.321.916.915.419.314.检验B(1,p)分布(即0-1分布)的参数p与预定值是否相等,用什么统计量?15.当n很大时,如何检验一个B(1,p)总体的大样本比例值p?16.关于两国正态分布总体的参数检验的统计量问题:①检验方差(1=2?未知12),用什么统计量?②检验方差(1>2?未知12),用什么统计量?③检验均值(1=2?未知其方差值,但知1=2),用什么统计量?(只需知道统计量的名称及统计量的大致结构)④检验均值(1=2?未知其方差值,但知1≠2),用什么统计量?(只需知道统计量的名称及统计量的大致结构)17.大样本下,检验两个任意总体的均值是否相等,用什么统计量?18.大样本下,检验两个0-1总体的比例值(即均值)是否相等,用什么统计量?\n19.用例子说明假设检验的意义。20.请选用数据盘中的恰当数据文件,用SPSS的单样本T检验模块,检验一个数据集合的均值和预定值,是否相等21.试述SPSS的单样本T检验模块输出的置信区间与探索模块输出的置信区间有何不同?22.例6.6.2给出的单样本的均值是,与0的差值大(5.385秒),而例6.6.3给出的单样本均值是,与0的差距小(1.40秒),显著性检验结果却是所对应的1与0没有显著性差异,而所对应的2与0有显著性差异。试从单样本T检验的计算公式解释这个“怪异”的结论。23.试述两组独立样本与配对样本在性质方面的区别。24.在SPSS中,两组独立样本与配对样本的数据存放方式有何不同。25.某汽车销售商设计了一种促进汽车销售的方案,在10城市做了降价测试实验,记录了促销方案实施前一个月得销售量及促销方案实施后一个月的销售量,根据这些数据,你是否能判断销售量有明显的改善(使用=0.01)?以前28232530272431463829以后3027263533353264514326.请选用数据盘中的恰当数据文件,用SPSS的独立样本T检验模块,做两均值是否相同的假设检验。27.在用SPSS的独立样本T检验模块,做两均值是否相同的假设检验时,为什么一定要选择levene检验?28.配对样本T检验与单样本T检验由什么关系?29.有人设计了一种提高记忆力的训练方法,为了评估这种训练方法的有效性,随机抽取了20余名学生,在做记忆力测试后,留下记忆力差异不大的10名学生参加实验(剔除了记忆力处于强弱两段的学生)。训练完成后,再对两个组做记忆力测试。训练前后的记忆力数据如下表,问:在=0.01的显著性水平上,该训练方法是有效地吗?学生编号123456789训练前记忆力232220212318172023训练后记忆力28292623312522262630.从某市上年所得税报表得知服装企业经理的平均收入为15万元,标准差为0.975万元。今年从服装行业随机抽取168个人的样本,计算出平均收入为14.5万元。问:今年服装行业经理的平均收入与上年有显著差异吗?\n31.五年前某行业公司的平均雇员规模(人数)为268.8人,以后。随着需求的增长,感觉许多公司的规模都在扩大,于是,随机选取了36个公司,计算出平均雇员规模为330.6人。标准差为45.6人。问:该行业公司的平均规模明显增大了吗?32.某电视台调查某栏目受欢迎的程度,有65%的男士和55%的女士对该栏目表示欢迎。问:①如果这些统计值是来自100名男士和100名女士的样本,两个受欢迎的程度有显著性吗?②如果这些统计值是来自200名男士和200名女士的样本,差别显性吗?第一章方差分析P2131.方差分析是用来检验不同数据组的均值差异的,还是方差差异的?2.试列出管理领域中单因素方差分析的主要用途和用法?3.通过“单因素模型构成表”,掌握单因素模型。4.已知单因素方差分析的数据实验效果方案1X11X12…X1n1方案2X21X22…X2n2︰︰︰︰︰方案sXs1Xs2…Xsns表中,ni表示方案t的实验个数试述单因素方差分析的基本做法。5.如果单因素方差分析的结果是:不同方案的效果均值有显著性差异,是否意味着两方案之间的均值,都有显著性差异。6.某公司想知道某地方报纸上3种类型广告中那一种是最有效的。在过去的几周内随即得对三种类型的广告的响应人数(对广告关键词有印象的人数)做了调查统计,结果如下表。问:若显著性水平=0.01,取零假设“三类广告的效果(响应人数)没有差别”成立吗?广告类型类型A类型B类型C反响的人数261827重复41303436194747252933263323327.\n请选用数据盘中的恰当数据文件,用SPSS的单因素方差分析模块作单因素方差分析,特别注意键的使用。8.在用SPSS的单因素方差分析时,为什么要选择Homogeneityofvariances复选项(进行方差齐次性检验)?9.在用SPSS的单因素方差分析时,键的作用是什么?10.对三种不同的洗衣服得磷含量检验结果如下:品牌14.56.35.14.65.56.5品牌24.33.35.44.23.23.1品牌34.63.22.3.5.43.13.3三种品牌的洗衣粉中的磷含量有显著性差异吗?取=0.01。11.选出交通统计,便利条件,客流量和规模相近的三个商店,按照如下三种方式发放赠券(分别在三个不同的店实施):A店每100元发5元赠券,B店每500元发放35元赠券,C店每1000元发放100元赠券。实验6天,所得日销售额(千元)的数据如下:日销售额(千元)店A168174173178180169店B156167166165160165店C150153154161168156问:这三种赠券方式的促销效果是否有显著差别?12.用“无交互影响的双因素模型构成表”,掌握无重复双因素方差分析模型。13.无重复双因素方差分析检验有什么问题?14.已知无重复、双因素方差分析的数据因素B1因素B2…因素Bn因素A1X11X12…X1n因素A2X21X22…X2n︰︰︰︰︰因素AsXs1Xs2…Xsn注:Xij表示Ai和因素Bj下的实验效果的观察值列出无重复双因素方差分析的主要做法。15.三种教学法在四个不同的学校实验结果如下:学校A学校B学校C学校D方法180903020方法290804050方法31001006040试做无重复双因素的方差分析。\n16.有重复双因素的方差分析,与无重复双因素的方差分析的主要区别是什么?检验的项目有何差异?17.用“有交互影响的双因素模型构成表”,掌握有重复双因素方差分析模型。18.已知有重复、双因素方差分析的数据因素因素B1因素B2…因素Bn因素A1X111X112…X11tX121X122…X12t…X1n1X1n2…X1nt因素A2X211X212…X21tX221X222…X22t…X2n1X2n2…X2nt︰︰︰︰︰因素AsXs11Xs12…Xs1tXs21Xs22…Xs2t…Xsn1Xsn2…Xsnt注:Xijk表示Ai和因素Bj下的第k次实验效果的观察值列出有重复双因素方差分析的主要做法。19.为检验店内“广告投入”(因素A,两个水平)和店内“购物赠券”(因素B,三个水平)对促销的影响,选取交通,便利,客流和规模相近的6个同类商店,做了双因素的每种组合重复3次(每次6天)的实验,所得数据日销售额(千元)的如下:购物赠券(元/百元)51015店内广告简易广告156164163158166168174171177165171166172181174181186178加强广告15816516615916816517617917816417316716718517818018918220.请选用数据盘中的恰当数据文件,用SPSS的多因素方差分析模块作双因素方差分析。第一章相关分析P2751.两个随机变量的总体(简单)相关系数与样本pearson相关系数,如何计算?两者的关系是什么?2.请给出样本pearson相关系数的几何解释。3.以下是7个省区人均GDP(元)和建筑合同的价值(亿元)省区ABCDEFG人均GDP100705509105689588352460196678建筑合同27.4020.2425.9323.3916.2012.518.88①计算两个变量之间的相关系数②在0.05显著水平下检验相关性并得出你的结论。\n4.10个商店去年的销售额和流通费用率资料如下表,选用适当曲线,计算销售额与流通费用率的非线性相关性。销售额(亿元)7.96.86.45.54.33.42.92.10.81.5流通费用率(%)1.21.31.31.41.51.82.12.76.44.55.某公司为雇佣到合格的熟练工人,设计了一套能力测验。下表是对10名现有熟练工人的能力测验的得分分数,以及他们完成所需任务的时间(分钟),请计算并回答下列问题:完成任务时间与能力测验分数之间的相关系数是否显著?是否呈正相关?能力测验分数80609840447020213095完成任务时间57266589836.K.pearson收集大量父亲身高x(寸)与儿子身高y(寸)的资料,其中10对数据如下表(此著名实验,故没有改变单位,1寸=2.54cm)计算父亲身高与儿子山高的相关系数,并检验显著性。父亲身高60626465666768707274儿子身高63.665.266.065.566.967.167.468.370.170.07.请写出spearman等级相关系数(又称秩相关、名次相关)的公式8.两组独立样本适合于计算相关系数吗?9.pearson与spearman相关系数显著异于0的显著性检验的统计量是什么?10.篇相关系数显著异于0的显著性检验的统计量是什么?11.相关系数的显著性检验的意义是什么?12.某高校抽样得到10名短跑运动员,测出100米成绩的名次和跳高的名次如下,问这两个名次相关吗?100米名次12345678910跳高名次4315271089613.篇相关系数在经济与管理中的应用的意义是什么?14.发达程度不同的10个国家的人均GDP和农业GDP占总GDP的比重数据如下表。人均GDP(美元)56092015002160267042505890696073208150农业GDP占总GDP的比重231814965.85.24.13.34.115.抽样调查了16个企业,上年获得了专利数、上三年R&D投入总和及高级工程师数的数据如下表。请用SPSS计算这三个变量的两两之间的篇相关系数。上年获得专利数283336393843404311351292169723302429298728522713\n上三年R&D投入总和高级工程师数2127262324232932上年获得专利数5556484658596066上三年R&D投入总和32273334253128083749363729404380高级工程师数352731303940414816.计算点双列相关系数,并坐显著性检验汉堡名称汉堡奶酪汉堡1/4磅汉堡奶酪1/4磅汉堡BigMac卡路里270320430530530有无奶酪0101117.抽样获得癌症患者抽烟与否的数据如下,计算∮相关系数,并做显著性检验。两名义级变量取值的频次不抽烟人数抽烟人数患癌症人数360480不患癌症人数280290第一章线性回归分析P3171.线性回归是研究变量之间的确定性的函数关系的还是不确定型的函数关系?2.线性回归分析对变量的测度级别有什么要求?3.在线性回归分析中,普通最小二乘法与极大似然法有何异同?4.多元线性回归的搞死假设是什么?5.多元线性回归的计算的公式是什么?6.高斯—马尔科夫定理是什么?7.多元回归的几何解释是什么?8.复相关系数的平方怎样反映出总体回归效果?9.检验回归效果的F统计量的定义式是什么?10.回归系数的t的检验的统计量的定义式是什么?11.20名计算机科训练班的学生的上机考试成绩x和笔试成绩y如下表。求线性回归方程。x41620132221152019161817865201811194y191924362726252817272124181814282122202112.抽样获得16个保单推销员上年的保单推销个数和他们保单的年数资料如下表,求:①计算保单推销数对保单推销纪念馆里(年数)的拟合回归方程。②\n检验回归系数是否显著大于零(在5%的显著水平)。③保单推销数众有多大比例用保单推销年数之外的因素来解释?④一个有10年推销经历的保单推销预计有多少销售额去年的保单推销数保单推销历的年数去年的保单推销数保单推销历的年数10513536110141081213725133271111812319769668981287107091302690111021013.某公司为雇佣到合格的熟练工人,设计了一套能力测验。下表是对10名现有熟练工人的能力测验的得分分数,以及他们完成所需任务的时间(分钟)。求:①用“完成任务时间”对“能力测验得分”进行回归分析②依据回归分析的结果,判断这两个变量是否呈正相关。③计算两个变量的相关系数,并说明它是否显著能力测验分数806098404470202130955676完成任务时间57266589835414.K.pearson收集大量父亲身高x(寸)与儿子身高y(寸)的资料,其中10对数据如下表(此著名实验,故没有改变单位,1寸=2.54cm)。试①求经验回归方程=0+1x;②检验假设H0:1=0,H1:1≠0,(=0.05)③若回归效果显著,求1的置信度为0.95的置信区间。父亲身高60626465666768707274儿子身高63.665.266.065.566.967.167.468.370.170.015.抽样调查10个商店去年的销售额流通费用率资料如下表。请选用y=a+b/x作曲线回归。销售额(亿元)7.96.86.45.54.33.42.92.10.81.5流通费用率(%)1.21.31.31.41.51.82.12.76.44.516.从回归骄傲度解释篇相关系数。17.篇相关系数的集合解释是什么?18.负相关系数的几何解释是什么?19.标准回归系数是指什么?\n20.抽样调查了16个企业,上年获得了专利数、上三年R&D投入总和及高级工程师数的数据如下表。试:①拟合出“上年专利数”对“上三年R&D投入”和“高级工程师数”的线性回归方程,并估计标准误差。②解释回归系数的经济意义③计算复相关系数R.上年获得专利数2833363938434043上三年R&D投入总和11351292169723302429298728522713高级工程师数2127262324232932上年获得专利数5556484658596066上三年R&D投入总和32273334253128083749363729404380高级工程师数352731303940414821.检验系数j与0是否有显著性的统计量Fj的构成是什么?22.偏解释变差(偏回归平方和)的几何解释是什么?23.逐步回归的基本做法是什么?24.某研究者怀疑售车员得业绩与售车人的年龄和销售经验有关,随机抽取了12个推销商的数据如下表,①请以逐步回归方法估计回归方程;②阐释回归系数的经济含义;③在销售量的变化中有多大比例可以用解释变量来解释?④预测有关有10年销售经理,年龄为30岁的推销人员的汽车销售量。年轿车销量152320291922212826123025售车经验年数268114771412356售车商年龄23332835244936404651323125.略26.在维尼纶缩醛化的试验中,固定其他因素后,考虑甲醛浓度X1,反应时间X2对醛化度Y得影响,得到如下表中数据。X1i32.1032.1032.1032.1032.1032.1033.0033.0033.00X2i357122030357Yi17.822.925.929.932.935.418.222.925.1X1i33.0033.0033.0027.6027.6027.6027.6027.6027.60X2i122030357122030Yi28.631.234.116.820.023.628.030.033.127.略