- 442.55 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
2001级研究生《医学统计学》试题2001级研究生《医学统计学》试题\n考生注意:医学统计学是培养统计思维和科研能力的一门学科,因此,考生在答题时务必思路明确,条理清晰,叙述简洁准确,字迹工整可辩。不符合要求的答题不记分。\n题型名词解释(16分)分析计算题(48分)论述题(36分)\n一名词解释频率与概率假设检验中的P值抽样误差可信区间决定系数剩余标准差检验效能参考值范围\n1频率与概率随机事件A在n次试验中出现次,比值=/n称为事件A在这n次试验中出现的频率。当试验次数n逐渐增多,频率将稳定在一个常数附近,这个常数称为事件A的概率,概率是描述事件发生可能性大小的一个度量,0≤P≤1。2假设检验中的P值由所规定的总体中作随机抽样,获得等于大于(或等于小于)现有样本获得检验统计量的概率。P值标明以多大的误差(风险)拒绝\n3.抽样误差由抽样引起的样本统计量与总体参数间的差别称为抽样误差,它还包括来自同一总体的若干样本统计量间的差别,其根本原因是个体变异的存在。4.可信区间按一定的概率或可信度(1-α)用一个区间估计总体参数的范围,这个范围称作可信度为1—α的可信区间。可信度为1—α的可信区间的确切含义是:每100个样本所算得的100(1—α)%可信区间平均有100(1—α)个包含了总体参数。\n5.决定系数定义为R2=SS(回归)/SS(总)=1-SS(误差)/SS(总),它表示Y的变异中可由方程中自变量组合解释的部分占总变异的比重,是衡量回归方程拟合优度的指标,R2值越大回归方程的拟合优度越好,0≤R2≤1。\n6.剩余标准差即残差的标准差==表示引入自变量后的Y的变异,主要反映回归方程的估计精度。其值越小说明回归效果越好,可用于偏回归系数的假设检验,Y的容许区间及可信区间的估计,自变量的选择等。\n7.检验效能即1—β,对真实的H1作出肯定结论之概率,表达某假设检验方法的检验功效。8.参考值范围又称正常值范围。由于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随时间、机体内外环境而变化,因此需要确定其波动范围,即正常值范围。95%的参考值范围的确切含义是:100个正常人中有95个人处于该范围内。\n二、分析计算题(48分)1在某化学药物的致癌研究中,实验组15只白鼠有4只发生癌变,而对照组15只中无一发生癌变。这是什么类型的设计?试根据下列统计软件的计算结果,写出统计分析报告。\n.tabi150\114,exactall|colrow|12|Total-----------+----------------------+----------1|150|152|114|15-----------+----------------------+----------Total|264|30Pearsonchi2(1)=4.6154Pr=0.032likelihood-ratiochi2(1)=.Cramer'sV=0.3922gamma=1.0000ASE=0.000Kendall'stau-b=0.3922ASE=0.102Fisher'sexact=0.1001-sidedFisher'sexact=0.050\n这是完全随机设计(或成组设计)本例样本含量较小n<40,且有理论频数<5,应以Fish’sexact下结论。按α=0.05水准(双侧)p=0.100>0.05,不拒绝,差别无统计学意义,尚不能认为该化学药物有致癌作用。\n前后测得血色素(g%对5名4~6月贫血儿童用某药治疗)含量如下:这是什么类型的设计?\n根据统计软件计算结果作结论?Numberofobs=20R-squared=0.7807RootMSE=.595609AdjR-squared=0.6527Source|PartialSSdfMSFProb>F-----------+----------------------------------------------------Model|15.152501572.164643086.100.0033|treat|13.545500934.5151669812.730.0005id|1.60700064.4017501491.130.3870|Residual|4.2569995512.354749962-----------+----------------------------------------------------Total|19.4095011191.02155269\n(1)这是配伍组设计(或区组设计)(2)按α=0.05水准(双侧),treat:p=0.0005,p<0.05用药前与用药后各时间点血色素含量不全同或全不同。Id:p=0.387,p>0.05尚不能认为贫血儿童间有差异。\n1)两两比较,用q检验(SNK法),比较治疗前与治疗后各时间点血色素含量的两两区别。2)回归分析以时间为自变量,以各时间点的均数为应变量作回归分析,可得到治疗前后随时间变化,血色素含量的变化情况。该资料还需作哪些分析?相应的方法是什么?\n3.8名糖尿病人的胰岛素水平(u/100ml)及血糖水平(mg/100ml)的测定值如下,\n(1)胰岛素与血糖是否存在线性相关(写出详细步骤)?(2)建立胰岛素与血糖的回归关系,并估计回归系数的95%可信区间。(3)X=22.0(u/100ml)时,为多少,表示什么意思?(4)X=22.0(u/100ml)时,的95%可信区间为132.8~170.9(mg/100ml),表示什么意思?(5)X=22.0(u/100ml)时,的95%容许区间为105.4~198.4(mg/100ml),表示什么意思?\n\n画散点图,判断是否有线性趋势,如图可知有线性趋势,且为负相关,可以作相关分析(其中x为胰岛素水平,y为血糖水平)计算相关系数rR===-0.9093相关系数的假设检验\n胰岛素水平与血糖水平无相关关系胰岛素水平与血糖水平有相关关系=5.35据=0.05水准(双侧),拒绝,接受,故胰岛素与血糖水平有负相关关系。\n\n建立回归关系:回归系数的区间估计:根据stata结果,其95%的可信区间为(-10.09157,-3.758643)(mg/uu)\n胰岛素为22uu/100ml时,血糖水平的均数估计值为151.8574mg/100ml。\n当胰岛素为22uu/100ml时的95%可信区间为132.8~170.9(mg/100ml),表示当胰岛素为22uu/100ml时,以(132.8,170.9)(mg/100ml)这一区间估计血糖水平均数的可信度为95%.当胰岛素为22uu/100ml时,y的95%的容许区间表示对胰岛素为22uu/100ml的人,估计有95%的人其血糖水平在105.4~198.4(mg/100ml)之间。\n4.在已婚妇女生殖道感染患病情况的危险因素研究中,采用分层整群抽样,共检查4120名已婚妇女,变量及编码如下:结果:0:未患病;1:患病年龄:0:≤35岁;1:36~45岁;2:≥46岁文化程度:0:小学;1:中学;2:大专以上。生殖道感染史:0:无;1:有居住地:0:农村;1:城市混用清洗外阴用具:0:否;1是并根据调查结果拟合logistic回归,结果如下:\n试就上述计算结果,写出分析报告。变量:年龄、文化程度、生殖道感染史、居住地、混用清洗外阴用具均有统计学意义,其logistic回归模型可表示为logitP=0.01-0.248x1-0.25x2+0.363x3—0.499x4+0.177x5表示:生殖道感染的患病情况随年龄的增加而减少,文化程度高的比文化程度低的患病少,有生殖道感染的比无生殖道感染的患病多,居住在城市的比居住在农村的患病少,混用清洗外阴用具的比不混用者多。\n有生殖道感染史者与无生殖道感染史者相比(其他条件相同),患生殖道感染的OR是多少(写出表达式,不必计算)?logitP=0.01-0.248x1-0.25x2+0.363x3—0.499x4+0.177x5OR=\n40岁、大专毕业、居住在城市、无生殖道感染史者,与30岁、中学毕业、居住在农村、有生殖道感染史者(其他条件相同)相比,患生殖道感染的OR是多少(写出表达式,不必计算)?OR=\n30岁、研究生毕业、居住在城市、无生殖道感染史者、无混用清洗外阴用具情况者,其患生殖道感染的患病率为多少?(写出表达式,不必计算)?P=\n5、为评价Ramipril治疗轻、中度原发性高血压的疗效与安全性,以Enalapril作为阳性对照进行双盲临床试验。Ramipril组观察60例,用药4周后舒张压下降9.07.0mmHg;Enalapril组观察60例,用药4周后舒张压下降9.66.0mmHg。若确定临床等效界值为5mmHg,试检验Ramipril与Enalapril是否等效。(写出详细步骤,提示:=1.2,相应的t界值为2.0)。\n确定临床等效界值,本例取=5mmHg1.假设检验法:2.可信区间法:(9.0-9.6)2.0*1.2=-0.62.4=(1.8,3.0)(mmHg)。该区间全部包含在等效区间(-5,5)(mmHg)内,故可以认为Ramipril与Enalapril治疗轻、中度原发性高血压是等效的。\n6.某单位研究两种蟹在不同温度时的耗氧量是否相同,资料如下。\n1.这是什么设计?该研究中共有几个研究因素,各有几个水平?析因设计,该研究中共三个研究因素两个水平1)种属:AB2)温度:低温高温3)性别:雄性雌性\n2.本资料能分析哪些项目?可分析:种属差异温度差异性别差异种属与温度的交互作用种属与性别的交互作用温度与性别的交互作用种属、温度与性别的交互作用\n3.根据下列统计软件计算结果作出结论。anovayspeciestempsexspecies*tempspecies*sextemp*sexNumberofobs=32R-squared=0.9586RootMSE=.187617AdjR-squared=0.9486Source|PartialSSdfMSFProb>F-------------+----------------------------------------------------species|.499999971.4999999714.200.0009temp|19.5312506119.5312506554.870.0000sex|.0112500011.0112500010.320.5769species*temp|.2812499781.2812499787.990.0091species*sex|.0312500221.0312500220.890.3551temp*sex|.0049999991.0049999990.140.7094Residual|.87999996725.035199999-------------+----------------------------------------------------Total|21.240000531.685161306\n结论:种属间有差异,A种属耗氧量高于B种属温度间有差异,高温耗氧量高于低温耗氧量性别间无差异种属与温度间有交互作用,B种属低温耗氧量最低性别与种属间无交互。温度与性别间无交互。\n三、论述题(36):1、描述变异的统计指标有哪些,各有何优缺点?2、随访研究资料有哪些特点?有哪些主要分析方法?3、临床试验与临床治疗有何不同?4、详述实验设计的基本原则?5、以两样本均数为例,论述样本含量与哪些因素有关?6、区组设计应注意哪些问题?\n1、描述变异的统计指标有哪些,各有何优缺点?描述变异的指标优缺点1全距可用于任何分布,用于资料的粗略分析1)不灵敏,2)不稳定2四分位数间距可用于任何分布,常用于大样本偏态分布较全距稳定。3方差、标准差考虑了每个变量值的变异情况,用于描述近似正态分布。4变异系数排除了平均水平的影响,取消了单位。用于1)比较度量衡单位不用的两组或多组资料的变异度2)比较均数相差悬殊的两组或多组`资料的变异度。\n2、随访研究资料有哪些特点?有哪些主要分析方法?特点:1)生存时间的分布是偏态的2)数据中常含有不完全信息,即数据截尾。分析方法:1)生存过程的描述:乘积—极限法(kaplan-meier法)、指数分布法2)生存过程比较:时序检验(log-rank法)3)影响因素分析:Cox比例风险模型\n3、临床试验与临床治疗有何不同?临床治疗是根据每一位患者的具体情况对症施治,无需统一的方案,目的是将患者治好,临床试验是为了探索某种新的处理方法是否安全、有效,所以必须有一个共同遵循的试验方案,对所有参与试验的受试者均按统一的方案进行治疗或处理,不得因人而异。\n4、详述实验设计的基本原则?1)对照:均衡性(1)对等:除处理因素外,对照组具备与实验组对等的非处理因素(2)同步:对照组与实验组设立后,在整个研究过程中始终处于同一空间和同一时间。(3)专设:任何一个对照组都是为相应的实验组专门设立的。不得用文献上的记载或以往的结果或其他的研究资料作为本研究之对照。2)随机:客观性(1)抽样随机:每一个符合条件的实验对象参加实验的机会相同,即总体中每个个体有相同的机会被抽到样本中来。(2)分组随机:每一个实验对象分配到不同处理组的机会相同。(3)实验顺序随机:每一个实验对象接受处理先后的机会相同。3)重复:可靠性(1)整个实验的重复:确保实验的重现性,以提高实验的可靠性.(2)用多个实验单位进行重复(样本含量):避免把个别情况误认为普遍情况,把偶然性或巧合的现象当作必然的规律,通过一定数量的重复使结论可信。(3)同一实验单位的重复观察:保证观察结果的精度。\n5、以两样本均数为例,论述样本含量与哪些因素有关?.1)α、β水准:α、β值越小,要求的样本含量越大,反之越小。2)标准差,即个体变异度,变异度越小,样本含量越小。3)临床上可接受的最小差别,差值越大容易分辨开来,所需的样本含量越小。4)当两样本含量相等时,样本含量最小。\n6、区组设计应注意哪些问题?1)配伍组设计是配对设计的扩展,在个体同质性较差时,采用配伍设计可以提高各处理组的可比性和均衡性。2)同一区组内个体应尽可能同质。3)当处理因素是时间、温度、浓度、剂量、PH值等连续性指标时,结合回归分析可提取丰富信息,此时处理组应在4组以上(抛物线应在6组以上)4)实际上配伍设计是两因素多水平试验,由于每种组合只作一次试验,故不能分析交互作用。5)采用配伍设计时,要尽可能使观察值不缺失,虽然有估计缺失值的方法,但缺失时的信息量的损失是较大的(估计值是原信息基础上产生的,不会增加信息量)。\n谢谢