医学统计学习题三一、名词解释1、总体2、样本3、随机抽样4、变异5、概率6、随机误差(偶然误差)7、参数8、统计量9、算术均数10、中位数11、百分位数12、频数分布表13、几何均数14、四分位数间距15、方差16、标准差17、变异系数18、标准正态分布19、医学参考值范围20、可信区间21、统计推断22、参数估计23、标准误及24、检验水准25、检验效能26、率27、直线相关28、直线回归29、实验研究30、回归系数二、单项选择1.观察单位为研究中的()。A.样本B.全部对象C.影响因素D.个体E.观察指标2.总体是由()组成。A.部分个体B.全部对象C.全部个体D.同质个体的所有观察值E.相同的观察指标3.抽样的目的是()。A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例D.研究总体统计量E.研究特殊个体的特征4.参数是指()。A.参与个体数B.总体中研究对象的总和C.样本的统计指标\nD.样本的总和E.总体的统计指标5.关于随机抽样,下列哪一项说法是正确的()。A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随机抽取个体D.为确保样本具有更好的代表性,样本量应越大越好E.选择符合研究者意愿的样本6.反映计量资料平均的指标是()。A.频数B.参数C.百分位数D.平均数E.统计量7.表示总体均数的符号是()。A.σB.μC.XD.SE.M8.下列指标中,不属于集中趋势指标的是()。A.均数B.中位数C.百分位数D.几何均数E.众数9.()分布的资料,均数等于中位数。A.对称分布B.正偏态分布C.负偏态分布D.对数正态分布E.正态分布10.一组某病患者的潜伏期(天)分别是:2、5、4、6、9、7、10和18,其平均水平的指标该选()。A.中位数B.算术均数C.几何均数D.平均数E.百分位数末端有确定数据11.利用频数分布表和公式计算中位数时,要求()。A.数据对称分布B.分布末端有确定数据C.i是中位数所在组的组距D.数据呈正态分布E.每组的组距相等12.一些以老年人为主的慢性病患者,年龄分布的集中位置偏向于年龄大的一侧,称为()。A.正偏态分布B.负偏态分布C.对数正态分布D.正态分布E.对称分布13.编制频数分布时,组距通常是()。A.极差的1/20B.极差的1/10C.极差的1/5D.极差的1/4E.极差的1/214.以下适宜描述计量资料离散趋势的指标有()。A.均数、标准差、方差B.极差、标准差、中位数C.均数、中位数、变异系数D.标准差、四分位数间距、变异系数E.几何均数、标准差、变异系数15.下列指标中,适和描述偏态分布的离散趋势的指标是()。A.平均偏差B.四分位数间距C.标准差D.方差E.变异系数16.下列关于标准差的说法中错误的是()。A.标准差一定大于0B.标准差和观察指标有相同的度量衡单位C.同一资料的标准差一定小于均数D.标准差常用于描述正态分布资料的变异程度\nE.方差和标准差属于描述变异程度的同类指标17.变异系数的值()。A.一定大于1B.一定小于1C.可以大于1,可以小于1D.一定比标准差小E.一定比均数小18.观察指标分别为身高和体重的两组数据。欲比较其变异程度的大小,宜选用()。A.平均偏差B.四分位间距C.标准差D.方差E.变异系数19.正态分布有两个参数()。A.和SB.μ和σC.和σD.μ和SE.μ和CV20.正态分布的参数中,(),正态曲线形态越“矮胖”。A.μ越大B.μ越小C.σ越大D.σ越小E.σ2不变21.下列关于标准正态的说法中错误的是()。A.任何资料通过变换均能变换成标准正态分布B.对于标准分布有P(u≥1.96)=0.975C.标准正态分布方差等于标准差D.标准正态分布的曲线是唯一的E.标准正态分布是对称分布22.标准误的意义是()。A.反映个体变异程度的大小B.反映集中趋势的位置C.反映指标的分布特征D.反映样本均数与总体均数的差异E.反映频数分布规律23.抽样误差产生的原因是()。A.观察对象不纯B.资料不是正态分布C.个体差异D.不是分类变量资料E.随机方法错误24.统计推断包括()。A.进行随机抽样B.计算均数的标准误C.计算反映平均水平与变异程度的指标D.做统计表与统计图E.进行参数估计和假设检验25.配对设计的目的是()。A.提高组间可比性B.操作方便C.为了使用t检验D.提高测量精度E.计算简便26.关于假设检验,下列哪个说法正确()。A.单侧检验优于双侧检验B.采用配对t检验还是成组t检验是由实验设计方法决定的C.若P值大于0.05,则接受HO犯错误的可能性很小D.若P值小于0.05,则接受H1犯错误的可能性较大E.用u检验进行两样本总体均数比较时,对样本量不做要求27.两样本比较时,分别取以下检验水准,哪个水准的第二类错误最小()。A.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.1528.t检验和方差分析都可用于两均数的比较,下列说法正确的是()。A.t检验和方差分析可以互相代替B.t检验可以代替方差分析C.方差分析可以代替t检验D.t检验和方差分析不能互相代替E.不一定29.正态性检验,按α=0.10水准,认为总体服从正态分布,此时若推断有错,其错误的概率为()。A.大于0.10B.小于0.10C.等于0.10D.β,而β未知E.1-β,而β未知30.两样本均数的比较,P<0.01可认为两总体均数()。\nA.有差别B.差别非常大C.无差别D.差别较大E.差别有实际意义31.两样本均数的比较,不能用()。A.方差分析B.t检验C.x2检验D.方差分析或t检验E.u检验32.完全随机设计方差分析中()。A.组间SS不会小于组内SSB.组内SS不会小于组间SSC.组间MS不会小于组内MSD.F值不可能是负数E.F值可能是负数33.方差分析中,当P<0.05,可进一步做()检验。A.t检验B.u检验C.t′检验D.F检验E.q检验34.q检验中,q值与p值的关系为()。A.q值越大则p值越大B.q值越小则p值越小C.q值越大则p值越小D.q值与p值无关E.以上都不对35.方差分析的应用条件为()。A.随机性B.正态性C.方差齐性D.A+B+CE.以上都不对36.在方差分析中,如果P≤α,则结论为()。A.各个总体均数全相等B.至少有两个总体均数不等C.至少有两个样本均数不等D.各个样本均数不全相等E.各个总体均数不全相等37.某地某年肝炎的发病人数占同年传染病人数的10.1%,该指标为()。A.率B.构成比C.发病率D.集中趋势E.时点患病率38.已知男性的钩虫病感染率高于女性。要比较两地居民的钩虫总的感染率,但是两地的性别构成不同,适当的比较方法是()。A.分性别进行比较B.两个率比较的x2检验C.不具有可比性,不能比较D.对性别进行标准化后再比较E.作两个率差别的假设检验39.使用相对数的时候,容易犯的错误是()。A.将构成比当作率B.将构成比当作相对比C.将相对比当作率D.将率当作构成比看待E.将标准化率当作构成比40.要比较甲乙两个工厂某工种工人某种职业病患病率的高低,采取标准化的原理是()。A.假设甲乙两厂的工人数相同B.假设甲乙两厂患某种职业病的工人数相同C.假设甲乙两厂某工种工人的工龄构成比相同D.假设甲乙两厂某职业病的患病率相同E.假设甲乙两厂的工人数构成相同41.要比较甲乙两个工厂某工种工人某种职业病患病率的高低,对工龄进行标化,其标准构成的条件是()。A.甲厂工人的年龄构成B.乙厂工人的年龄构成C.甲乙两厂合并的工人的年龄构成D.当地比较稳定的人口的年龄构成E.甲乙两厂合并的工人的工龄构成42.样本率p与总体率π。比较用u检验的条件是()。A.样本量n较大、np和n(1-p)均大于5B.样本量n较大、总体率π。接近1C.样本量n较大、样本率p接近0.5D.样本量n较大、样本率p接近1E.样本率p不太小43.从甲乙两文中,查到同类研究中两个率比较的四格表资料,经x2检验,甲文x2>x20.01(1),乙文x2〉x20.05(1),两文均得出两个率的差异有显著性的结论,可认为()。A.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.甲文结果不可信E.甲文说明总体的差别大44.四个样本率比较x2>x20.01(3),可以认为()。\nA.各总体率不等或不全相等B.各总体率均不相等C.各样本率均不相等D.各样本率不等或不全相等E.两个总体率相等45.四格表的自由度()。A.不一定等于1B.一定等于1C.等于行数×列数D.样本量减1E.以上都不对46.x2分布的形状()。A.同正态分布B.同t分布C.为对称分布D.与自由度υ有关E.与样本量n有关47.当四格表的周边合计不变时,如果某格的实际频数有变化,则其理论频数()。A.增大B.减小C.不变D.不确定E.随该格实际频数的增减而增减48.R×C表x2检验的自由度为()。A.R-1B.C-1C.R×C-1D.(R-1)(C-1)E.R×C-249.比较1956年某地三种传染病白喉、乙脑和痢疾的病死率,宜选择的统计图是()。A.线图B.半对数线图C.直方图D.直条图E.百分条图50.对统计图和统计表标题的要求是()。A.两者标题都在上方B.两者标题都在下方C.统计表标题在下方,统计图标题在上方D.统计表标题在上方,统计图标题在下方E.可由研究者随意设定位置三、是非题1.某医院收治某肺部疾病患者10人,其中8人吸烟,占80%,则结论为“吸烟是发生该病原因”。2.某化工厂某病连续4年的患病率分别为6.0%、9.7%、11.0%、15.4%,则该病的总患病率为(6.0+9.7+11.0+15.4)/4=10.53%。3.甲县恶性肿瘤粗死亡率高于乙县,可以认为甲县的防治水平较乙县差。4.某高校夏季军训,发生中暑21例,其中北方籍学生为南方籍学生的2.5倍,结论是“北方籍学生容易发生中暑”。5.研究人员测量了100例患者外周血的红细胞数,所得资料为计数资料。6.统计分析包括统计描述和统计推断。7.计量资料、计数资料和等级资料可根据分析需要相互转化。8.编制频数分布表时,组数越多越好。9.频数分布表的组距一定要相等。10.均数表示一组同质的计量资料的平均水平,不同的均数之间均可以相互比较。11.对于样本而言12.几何均数适合描述倍数关系资料的集中趋势。13.两随机样本均数比较时必须进行假设检验。14.标准差和标准误都是反映变异程度大小的指标。15.两样本均数的比较经检验差别有统计学意义,则说明两样本均数不同。16.方差分析中,如果处理因素无作用则F值一定等于1。17.完全随机设计的资料可用随机区组设计方差分析进行统计处理以提高统计效率。18.方差分析中,SS组间一定大于SS组内19.在实验设计中,样本含量越大,越符合重复原则,越能降低实验误差。20.随机选择2岁儿童1000名作预防某病的免疫接种,8年后,80%的接种者未患此病,认为该疫苗有较高的保护率。\n四、简答题1.某年级甲班、乙班各有学生50人。从两班各抽取10人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?2.统计分析要求每一个样本应该具有哪四个特性。3.简述频数分布表的编制方法及其主要用途。4.反映集中趋势的统计指标主要有哪几种?它们的适用范围有何异同?5.测得10名乳腺癌患者化疗后血液尿氮含量(mmol/L)分别为3.43,2.96,4.43,3.03,4.53,5.25,5.64,3.82,4.28,5.25,试问:(1)该资料是总体资料还是样本资料?(2)其总体的同质基础是什么?(3)要表达资料的平均水平,该选用什么统计指标?6.试比较标准差和变异系统在描述资料变异程度时的优势。7.简述医学参考值范围的涵义。8.简述标准正态分布和正态分布的区别与联系。9.已知某地40岁正常女性的平均血清总胆固醇为4.46mmol/L,标准差为1.02mmol/L。某医疗机构从该地随机抽取25名正常成年女性,测得其平均血清总胆固醇为4.77mmol/L,试指出4.77mmol/L与4.65mmol/L不同的原因,并选择正确的指标表示其大小。10.样本均数的抽样分布有哪些特点?11.两样本均数比较的假设检验,在0.02
14天,请计算其离散趋势指标?传染病的潜伏期一般不呈正态分布,且有一例患者的潜伏期为开放数据,故采用四分位间距描述其变异程度。2.某正常人在生命质量评定中,得到130人量表(满分100分)评分如下某生命质量评定量表得分量表评分0~20~40~60~80~100倒数1320253240问欲描述该资料的离散趋势,宜用什么指标?3.某市1979年调查20岁男学生160人的脉搏数(次/min),已知资料服从正态分布,并求得均数为76.1,标准差为9.32,估计该市20岁男学生脉搏数的95%可信区间?\n4.某地随机抽查了500名40~50岁冠心病患者的血清胆固醇,其均数为228.6mg/dL,标准差为46.8mg/dL;同时随机抽查了30名60岁以上冠心病患者的血清胆固醇,其均数为230.8mg/dL,标准差为54.9mg/l。试计算不同年龄组冠心病患者血清胆固醇的99%可信区间。5.某市1982年测得120名12岁男童平均身高为143.10cm,标准差为5.67cm,同时测得120名12岁女童平均身高为141.60cm,标准差为10.88cm。试估计12岁男、女身高的总体均数比较哪一个估计更好(α=0.05)6.通过以往大规模调查,已知某地婴儿体重为3.30kg,今测得35名难产儿平均出生体重为3.42kg,标准差为0.40kg,该地难产儿出生体重与一般婴儿是否不同?7.某医院现有工作人员900人,其中男性760人,女性140人,在一次流感中108人发病,其中男性79人,而女性29人。试计算:(1)该院流感总发病率;(2)男、女流感发病率;(3)男、女患者占总发病人数的百分比。8.通过大量反复调查,已知某菌苗的发热反应率为20%,而某地100人使用另一批该菌苗后测得发热为14人,问这批菌苗发热反应率是否与原来调查的不同?9.某山区小学男生80人,其中肺吸虫感染23人,感染率为28.75%;女生85人感染13人,感染率为15.29%,问男女生的肺吸虫感染率有无差别?