中南大学统计学课件 19页

  • 530.00 KB
  • 2022-08-29 发布

中南大学统计学课件

  • 19页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
个人收集整理勿做商业用途习题《卫生统计学》第五版(五年制预防医学用)(一)名词解释与简答题1.名词解释(1)负担系数(2)总和生育率(3)生存率(4)潜在减寿年数(5)试比较发病率与患病率,死亡率与病死率。2、简述二项分布、Poisson分布、正态分布的区别与联系。3、简述控制图的基本原理。4、简述双侧正态分布资料的医学参考值范围为什么是均数±1.96倍标准差。5、样本均数的抽样分布有何特点?6、样本均数的标准误的意义是什么?与标准差有何区别和联系?7、与标准正态分布比较,t分布的特点是什么?8、用同一份样本指标去估计总体参数的95%置信区间与99%置信区间,两者比较,哪一个估计的精度好?为什么?9、假设检验的理论依据是什么?10、假设检验的两类错误之间的区别与联系是什么?11、t检验的应用条件是什么?12、假设检验中P值的意义是什么?13、如何确定检验水准?14、如何恰当地应用单侧与双侧检验?15、什么情况下可以借用正态近似法估计总体概率的置信区间?16、简述检验的用途。17、比较两个独立样本频数分布的c2检验,和比较配对样本两个频数分布的c2检验在设计方法、资料整理、假设检验等方面的差别是什么?18、举例说明如果实验效应用等级资料表示,比较两组总体效应间差别是否有统计学意义为什么不能用检验?19、为什么有些四格表(或R×C表)必须要计算确切概率?20、实验研究和调查研究的根本区别是什么?21、实验设计的三个基本原则是什么?22、在临床试验中使用安慰剂的目的是什么?23、随机化的目的是什么?24、试验设计的基本要素包括哪些?25、估计样本含量时,所定容许误差与样本量有何关系?26、配对设计的目的是什么?27、避免医生和病人对实验效应观察的偏性,设计时应注意什么?28、为明确某新化妆品对皮肤有无损害作用,将12只大白兔的左背部涂抹该化妆品,右侧涂生理盐水作为对照,72小时后观察皮肤反应.这属于什么对照?29、琴纳用牛痘疫苗接种23人后再接种天花,结果无人患天花,而当时一般人接触天花病人后,天花的发病率约90%。琴纳所用的属于什么对照?30、为比较A、B两种减肥药对肥胖病人的减肥效果。将60名肥胖患者按性别相同,体重相近配成30对.每对患者随机分配入A、B两药组,30天后比较A、B两组患者体重的下降值(kg)。(1)该实验属何种设计方案?(2)变量或资料(体重下降值)属何种类型(3)其结果可用何种统计分析方法进行分析31、什么是析因设计?其主要特点是什么?32、何为交叉设计?它有何优缺点?33、方差分析的基本思想是什么?总离均差平方和以及总自由度怎样计算?34、两样本t检验与完全随机设计资料的ANOVA有何关系?配对样本t检验与随机区组设计资料的ANOVA又有何关系?35、举例说明何谓交互效应?并绘制交互效应图.\n个人收集整理勿做商业用途32、SNK−q检验Dunnett−t检验都可用于均数的多重比较,它们有何不同?37、数据变换在资料处理中的作用是什么?38、秩和检验有哪些优缺点?39、两组或多组有序分类资料的比较,为什么宜用秩和检验而不用检验?40、调查研究与实验研究有何异同?二者能否同时使用或结合使用?41、究主要有哪些方法,各有何优缺点?42、大多数的调查研究是抽样调查研究?比较常用的四种概率抽样方法.43、哪些情况下最适合于用小组调查法。44、法的意义与思想是什么?直接法与间接法的主要区别是什么?45、面一些说法是否正确,若不正确,提出正确者:(1)如果只需要比较各个年龄组的死亡率,可以不做标准化。(2)只有当要比较总体死亡情况,而且希望归因为人口分布不同之外的其它因素时,标准化才有意义。(3)虽然人口分布不同,但各个年龄组的死亡率相同或相差不大时没有必要做标准化.(4)不同比较组的人口分布不同,各年龄组的死亡率也不同,但有明显的交叉,此时不宜做标准化。46、简述线性回归、logistic回归和Cox回归的区别。47、简述Cox回归中回归系数与相对危险度RR值的关系。48、简述综合评价的一般步骤。49、简述Topsis法的基本思想和步骤.50、简述层次分析法的基本思想和步骤。51、何谓Meta分析?52、.说明Meta分析的用途。53、说明Meta分析的两类统计模型.54、说明Meta分析的基本步骤.(二)分析计算题1.1985年某省农村120例6-7岁正常男童胸围(cm)测量结果如表所示.120例6-7岁正常男童胸围(cm)测量结果51。654。151.356。651.253.656。058。354。056。955。557.756。057。455.253.657.755。557。453.556。354.057.555.458。355.455。953。354.155。957。256.153。857.756.058。657.656。058。149.151.353。850。553.856.856。054。551。757。354.858。156.551.350。255.553.652.155。358。353.553。156。854。556。154。854.756。253。752.458.156。656。753.457。154。453。754。159.056。255。753.155。956。656.450。453.356。750.851。454.656.158。054。253。855。355。956。161。856.752.752。451。453。556.659.356.858。159.053.154。254。054.759.853。952。654。652.756。455。554.4(1)试编制胸围数据的频数表,绘制直方图,概括其分布特征.(2)用合适的统计量描述胸围数据的集中趋势、变异趋势.(3)计算P25、P50、P75.2。在某项治疗膀胱癌的研究中,细胞增殖抑制率(=(1—实验组A值/对照组A值)×100%))数据如表所示:细胞增殖抑制率分组细胞增殖抑制率(%)\n个人收集整理勿做商业用途第1天第3天第5天第7天实验组13312354140对照组10098162250试依据上述数据绘制合适的统计图。(注:A值为上述研究中某实验指标)3。1998年国家第二次卫生服务调查资料显示,城市妇女分娩地点分布(%)为医院63.84,妇幼保健机构20。76,卫生院7.63,其他7。77;农村妇女相应为医院20.38,妇幼保健机构4。66,卫生院16。38,其他58。58。试用合适的统计图表达上述资料。4.1985年我国北方某地区某医生记录10名儿童乳牙萌出月龄(月)数据如下:4,6,5.5,8,11,10,13,11,9,8。试描述该10名儿童乳牙萌出的平均时间。5.某卫生防疫站对30名麻疹易感儿童气溶胶免疫一个月后,测得其血凝抑制抗体滴度资料如下表。试计算其平均滴度。抗体滴度1:81:161:321:641:1281:2561:512例数265104216.某地通过卫生服务的基线调查得到下表的资料,试作如下分析:(1)计算全人口的性别比;(2)计算育龄妇女(15~49岁)占总人口的百分比;(2)计算总负担系数;(4)计算老年人口系数某地人口构成情况年龄组(岁)男(%)女(%)年龄组(岁)男(%)女(%)0~4.24。045~2。42。75~3。23.150~2.12。410~4.44。255~1.22.215~5。55。360~1.32。420~5.15.265~1。11.425~6。06.170~0。81.230~4。34。575~0.50.935~3.23.380~0.20。540~2。32。585~0.10.27.假定虚症患者中,气虚型占30%。现随机抽查30名虚症患者,求其中没有1名气虚型的概率;有4名气虚型的概率。8.假定某批出厂半年的中药潮解率为6%。从中抽取20丸,求恰有1丸潮解的概率、不超过1丸潮解的概率和有1至3丸潮解的概率.9.某溶液平均1毫升中含有大肠杆菌3个。摇匀后,随机抽取1毫升该溶液,内含大肠杆菌2个和低于2个的概率各是多少?10.某人群中12岁男孩身高的分布近似于正态分布,均数为144。00cm,标准差为5。77cm.(1)该人群中80%的12岁男孩身高集中在哪个范围?(2)求该人群中12岁男孩身高的95%和99%参考值范围.(3)求该人群中12岁男孩身高低于140cm的概率。(4)求该人群中12岁男孩身高超过160cm的概率。11.某地白血病的发病率为0.0001,现检查4万人,求没有发现白血病患者的概率和发现白血病患者不超过3人的概率。12。某车间经检测每升空气中平均约有37颗粉尘,请估计该车间每升空气中有大于50颗粉尘的概率。13。某研究表明新研制的一种安眠药比旧安眠药增加睡眠时间。某医师从已确诊的神经衰弱病人中随机抽取了两份样本,一份样本是20例病人服用该种新药,计算得到平均睡眠时间为6。39小时,标准差为2.24小时;另一份样本是93例病人也服用该种新药,计算得到平均睡眠时间为6.45小时,标准差为2。51小时。若睡眠时间服从正态分布,试分别估计这种新安眠药的平均睡眠时间的95%置信区间;并比较这两个区间有何不同,用哪一个估计总体参数更可靠?14。为了解中年男性高血压患病情况,某研究单位在某市城区随机调查了45~54岁男性居民2660人,检查出高血压病人775人,试估计该市中年男子高血压患病\n个人收集整理勿做商业用途1。大量研究显示汉族足月正常产男性新生儿临产前双顶径(BPD)均数为9。3cm.某医生记录了某山区12名汉族足月正常产男性新生儿临产前双顶径(BPD)资料如下:9.959。339。499.0010.099.159。529。339.169.379.119。27。试问该地区男性新生儿临产前双顶径(BPD)的是否大于一般新生儿。15。为探讨习惯性流产与ACA(抗心磷抗体)的lgG的关系,研究人员检测了33例不育症(流产史〉2次)妇女ACA的lgG,得样本均数为1。36单位,标准差为0。25单位;同时检测了40例正常(有1胎正常足月产史)育龄妇女ACA的lgG,相应样本均数为0.73单位,标准差为0.06单位.习惯性流产者与正常妇女lgG水平是否不同?16。两组十二指肠溃疡患者。其中A组20例,幽门螺杆菌(Hp)皆阳性。测得其生长抑制素(SS)样本均数为260。20(wn/10—9),标准差为27.50(wn/10-9);B组10例,Hp皆阴性。其SS样本均数为387.40(wn/10-9),标准差为34.50(wn/10—9).试问,Hp对生长抑制素含量有无影响?17.两组肿瘤患者,单纯放疗组(A)13例,口服平消胶囊+放疗组(B)12例,接受放疗前后,血清Sil—2R水平(U/ml)如表所示。试评价平消胶囊对接受放疗患者血清Sil-2R水平的影响?两组肿瘤患者的血清Sil—2R水平A组No。1234567治疗前1183.03822。521294.00852。50568。89532.12896。36治疗后983。08469.34704。39979。661040.33895.93612。27No。8910111213治疗前530.46808.22375。441055。26614.55450。22 治疗后616。70870。141245.541753。671850.56538.45B组No.1234567治疗前992.85767.33645.85709。54995.411043.401022.76治疗后236.66293。00166.77204。81127.27186。63200.80No。89101112治疗前486.27694.28871。44973。731063。76治疗后151。47254。49178.09147。19111。22⒙在探讨硫酸氧钒降糖作用的实验中,测得两组动物每日进食量如表6-6所示.试问两组动物每日进食量是否相同?两组动物每日进食量糖尿病加钒组糖尿病组26.4646。8925。1947.2128。7042。4223.7047.7024。4840.7525.1941。0328。0145.9823。7043.4626。1044.3424。6245.3219。22~33岁单胎初孕妇女具有妊娠高危因素者123人随机分为两组。A组63人从孕28周起到分娩止每日口服含钙胶囊;B组60人同期口服安慰剂。结果A组出现妊高症6例,B组出现14例。试问,补钙对妊高症是否具有预防作用?20.在甲地区抽取10万人口回顾调查,知1990~1993年因脑血管病死亡123人,在乙地区也抽取10万人口作回顾调查,知同期因脑血管病死亡97人。两地区脑血管病死亡水平是否相同?率的95%置信区间。\n个人收集整理勿做商业用途21.某医院收治186例重症乙型脑炎患者,随机分成两组,分别用同样的方剂治疗,但其中一组加一定量的人工牛黄,治疗结果如表所示。加人工牛黄治疗乙型脑炎效果治疗效果疗法治愈未愈合计不加人工牛黄264571加人工牛黄6847115合计9492186问加人工牛黄是否增加该方剂的疗效?22.某研究人员观察了其他基本情况相似的60岁以上老人126名,其中患冠心病的52名,未患冠心病的74名,询问他们食盐的情况,其结果见表冠心病患病与食盐情况冠心病食盐情况合计超标未超标有361652无423274合计7848126问患冠心病和未患冠心病的老人食盐超标的概率是否不同?23.为比较三种方剂治疗胃溃疡的效果,将200名患者随机分到三个治疗组,疗效见表,分析三个方剂的治疗效果有无差别?三种方剂治疗胃溃疡的效果治疗方法治疗效果合计有效无效甲方剂421860乙方剂382765丙方剂561975合计1366420024.为比较甲、乙两种方法的诊断效果,某研究人员随机抽查110名乳腺癌患者,同时用甲乙两种方法对各位患者进行检查,将检查结果整理成表的形式。问两种方法对乳腺癌的检出概率有无差别?甲乙两种方法检查乳腺癌患者的情况甲方法乙方法合计检出未检出检出未检出42308305060合计723811025.将20只小白鼠分为实验组和对照组,实验人员闭着眼睛用手去鼠笼中随机抓小鼠,抓出10只小鼠作为实验组,剩余10只作为对照组.由于实验人员是闭着眼睛用手随机抓,故该分组为随机分组。你认为是否正确?为什么?26。某医院为观察某新药治疗急性支气管炎的疗效,用氨苄青霉素作对照。病人入院时,体温在39ºC以下分在治疗组,体温在39ºC及以上分在对照组。结果新药疗效优于氨苄青霉素。你认为是否正确?为什么?27.目前使用的狂犬疫苗浓缩苗经全程注射后有效率为88.37%,现推出一精制苗,根据文献,该苗在全程接种后必须提高8%以上才有推广价值。(1)如果取α=0。05,1–β=0.80,单侧检验时,需要多大的样本含量才能实现研究目的?(2)如果取1–β=0。90,又需要多大的样本含量?(3)根据两个样本含量的比较,你得出什么结论?\n个人收集整理勿做商业用途28.为研究母乳喂养和人工喂养对婴儿血红蛋白的影响,根据文献,经母乳喂养的婴儿42天血红蛋白均数为117.7g/l,人工喂养为103.3g/l,42天婴儿血红蛋白的总体标准差σ=10.2g/l。α取单侧0.05,检验功效为0.80,每组例数相等,问每组需要多少病例才能发现差异?若母乳喂养组样本含量占整个样本含量的60%,则每组又各需多少病例?29。探讨复方丹参注射液对Ⅱ型糖尿病多发性末梢神经病变的治疗效果,以维生素Bl、B12治疗为对照。根据有关文献的报道,对照组的总有效率为55。6%;复方丹参注射液总有效率为88.2%。若取单侧α=0.05,β=0。10,两组病例数相同的情况下,各组需要多少病例才能发现有差别?30.为研究铅作业与工人尿铅含量的关系,随机抽查了3种作业工人的尿铅结果如表所示.问3种作业工人的尿铅含量是否不同?3种铅作业工人尿铅含量(mg/L)测定结果铅作业组调离铅作业组非铅作业组0.010。110。090.160。230。020.240.180。050.180。140。020。280.200.010.140.120.100.400。130。040.150。000.1431.某医师为研究人体肾上腺皮质3β–HSD(羟基类固醇脱氢酶)活性在四个季节是否有差别,采用分光光度计随机测定了部分研究对象,其数据如表所示,请作统计分析。四个季节人体肾上腺皮质3β–HSD活性季节nS春季420。780.13夏季400。690。22秋季320。680.14冬季360。580。2032.利血平可以使小鼠脑中去甲肾上腺素(NE)等递质下降,现考察某种新药MWC是否具有对抗利血平使递质下降的作用,将24只小鼠随机等分为四组,并给予不同处理后,测定脑中NE的含量(ng/g湿组织),结果如表所示:小鼠经不同处理后脑中NE的含量蒸馏水组利血平组MWC组利血平+MWC组630181715407760103663397687138638378676141887363892197625438523193648412问:(1)该资料属何种设计方案?(2)该新药MWC是否具有对抗利血平使递质下降的作用?33.为研究雌激素对子宫发育的作用,用四个种系的未成年雌性大白鼠各3只,每只按一定剂量注射雌激素,至一定时间取出子宫并称重,结果如表所示,试比较雌激素的作用在三种剂量间、四个种系大白鼠间是否不同。未成年雌性大白鼠的子宫重量(mg)种系雌激素剂量(μg/100g)0.20.40。8甲106116145\n个人收集整理勿做商业用途乙4268115丙70111133丁426811534.将10名中度甲状腺机能亢进病人随机分为两组,分别用地巴唑和地巴唑+普奈洛尔治疗,治疗前和治疗后4周的心率测量结果如表所示。试分析治疗方法的主效应、治疗时间的主效应以及两者的交互效应。甲状腺机能亢进病人治疗前后的心率(次/分)治疗方法受试对象编号治疗前治疗后4周111591212094地巴唑312488411682511496611783地巴唑+711080普奈洛尔811892911985101228436为研究克拉霉素的抑菌效果,某实验室对28个短小芽孢杆菌平板依据菌株的来源不同分成了7个区组,每组4个平板用随机的方式分配给标准药物高剂量组(SH)、标准药物低剂量组(SL),以及克拉霉素高剂量组(TH)、克拉霉素低剂量组(TH)。给予不同的处理后,观察抑菌圈的直径,结果见表9—31,请对该资料进行分析。28个平板给予不同处理后的抑菌圈直径(mm)区组SLSHTLTH118.0219。4118.0019。46218.1220.2018.9120.38318.0919。5618。2119.64418.3019。4118.2419。50518.2619。5918.1119.56618。0220.1218.1319.60718.2319.9418。0619。5437.为研究长跑运动对增强普通高校学生的心功能的效果,某学院对随机抽取15名男生,进行5个月的长跑锻炼,5个月前后测得的晨脉数据如表所示,问长跑锻炼后的晨脉次数有否降低?某校15名学生5个月长跑锻炼前后的晨脉次数(单位:次/分钟)学生号123456789101112131415锻炼前707656636356586067657566565972锻炼后48546064485554455048564862495038.分别对8名未患妊娠合并症的孕妇和9名患有妊娠合并症的孕妇进行葡萄糖耐受水平的测试,结果见表。问两类孕妇的葡萄糖耐受能力是否不同?两组孕妇葡萄糖耐受水平的测试结果未患妊娠合并症组110119133127141117135122患有妊娠合并症组12014016218413212817714318139.用中草药治疗不同类型的小儿肺炎,其疗效分为4个等级,结果见表,试比较该药物对不同类型的小儿肺炎疗效有无差别?用某中草药治疗不同类型的小儿肺炎的疗效疗效病毒性肺炎细菌性肺炎合计秩次范围平均秩次合计(1)(2)(3)(4)(5)(6)=(2)(5)控制65421071~107542268\n个人收集整理勿做商业用途显效18624108~131119.5717有效302353132~1841583634无效131124185~2081972167合计12682208878640.某研究者欲研究A、B两种菌对小鼠巨噬细胞吞噬功能的激活作用,将59只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组的吞噬率(%)(下表),试比较三组吞噬率有无差别?不同菌种对小鼠巨噬细胞的吞噬率(%)A菌组B菌组对照组45.064.070。051.062。089.046。044.056。066.071。051。068。091.031。036。056。066.074。054。068.093。056。036.057。066.074。054。070。048.024.060.366.076.059。070.043.018。063.067。073.061。071。024。036。064。070。093.061.070。018.044.064。070。095。061.087.036。036.041.欲对三位运动员的综合技术作出评价,以不同专业层次的8位教师对三位运动员的技术作评分(下表),问不同教师对三位运动员技术水平的评价有无不同?不同教师对三位运动员的技术所作评分教师编号运动员A运动员B运动员C15。36.25。825.56.46.035.14。85。545。25.05.555.36.05。665。24.95。475。66.76。085。56.25。942.某省卫生防疫站对8个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘进行监测,结果如表,试检验两者有无相关关系?8个城市的肺癌标化死亡率和大气中苯并(a)芘浓度城市编号12345678肺癌标化死亡率(1/10万)5。618。5016.2311。4013。808。1318。0012.10苯并(a)芘(μg/100m3)0。051.171。050。100.750.500.651.2043.试就下表资料分析肾重与心重间的关系。10名成年男子(尸检)肾重与心重检测结果编号肾重(克)(x)心重(克)(y)编号肾重(克)(x)心重(克)(y)1333271634030523574397369404336132883122624305326926825552692761035435044.某地防疫站用碘剂局部注射治疗219例地方性甲状腺肿,结果见表.问患者年龄与疗效间有无关联?地方性甲状腺肿患者各年龄组疗效观察结果\n个人收集整理勿做商业用途年龄(岁)疗效合计治愈显效好转无效11~351134020~328925130~17131224440~1510823550~101123549合计10943531421945.某医院为探讨流行性出血热临床发病情况和治疗原则之间的关系,得到了446例病情转化资料(下表),试分析早期分度与最后定型之间有无关联.流行性出血热不同分度病情转化情况早期分度最后定型合计轻型中型重危型轻度111211133中度516320188重度01124125合计11618514544646.某医院在研究胎盘过早剥离者的出血情况时,将妊娠时间分为三个阶段,失血量分为三个等级,共调查了224例,结果见表.问失血量的多少与妊娠阶段之间有无关联?妊娠各阶段胎盘过早剥离者的出血人数分布妊娠阶段失血量合计较少中等较多早期234633中期47292399晚期51192292合计121525122447.试用表资料分析"右下腹压痛”与”是否患了阑尾炎”之间有无关联?201例就诊者有无右下腹压痛与手术证实是否患有阑尾炎之间的关系有无右下腹压痛是否患有阑尾炎合计是否有9327120无156681合计1089320148。用如下数据计算相关系数,并检验其总体相关系数是否为零;计算回归系数,并检验其总体回归系数是否为零;解释相关系数与回归系数的含义、比较并解释两个检验结果;计算总体回归系数的95%置信区间。X24456Y56791249.15个儿童的身高与肺死腔容积的观测数据如表所示.儿童的身高与肺死腔容积的观测数据对象号身高(cm)肺死腔容积(ml),Y111044211631312443412945\n个人收集整理勿做商业用途51315661387971425781505691535810155921115678121596413164881416811215174101试用该资料进行相关与回归分析:(1)计算基本统计量;(2)计算相关系数;(3)进行相关系数等于零的假设检验;(4)计算样本回归方程的截距与回归系数;(5)进行回归系数等于零的假设检验;(6)验证是否存在的关系;(7)估计回归系数的95%置信区间;50。研究者调查16个不同地区在某一固定时期内到中心医院的就诊率,同时测量了每一地区中心点到医院的距离,结果如表所示:16个地区到中心医院的距离和就诊率地区编号距离(km)(X)就诊率%(Y)16。821210。31231.730414.2858。81065.82672.14283。33194.321109。015113.2191212。76138.218147。012155。123164。134(1)请用该数据进行回归分析。(2)求回归系数的95%置信区间。51.为何总体回归线置信带的上下缘是对称于回归线的两条弧形线,而不是平行线?52.为何个体值预测带的上下缘曲线要比回归线置信带的上下缘曲线离回归直线更远?53.什么是回归系数的标准误?什么是预测值的标准误?后者如何受前者影响?(1)如果X的均数为20,Y的均数为50,X与Y的相关系数为r,试写出Y依X的回归方程。(2)用如下年龄与血红蛋白的检测数据分别拟合简单线性、二次与三次多项式,并评价何种模型为优?年龄6810121416182022HB(克%)10.4110.8010.8510。3610.3110.6810。8211.0411.20\n个人收集整理勿做商业用途(3)某一食品中不同维生素E含量(X)对小白鼠喂养三月后的增重(Y)数据如下,试问用何种回归模型最能描述其关系?X0。340。290。280.420。290。400。660。740.450。60Y0.620.350。751.350。480.926。355。982。321。15(4)观察某地破伤风预防接种率与发病率数据如下表所示,试问:何种回归模型最能综合表达该地破伤风发病率(Y)与预防接种率(X)的关系?接种率X0.000.100.200。320。500。660。720.781.00发病率Y8。707.805.593.532。181.981。851.501。3554。给定R2=。44,N=50,k=12,试计算调整确定系数.55.在多重回归分析中,将某一自变量(Xi)的值乘以10,会对该自变量的回归系数产生何种影响?如果是对自变量值乘以10,又会对标准化回归系数产生何种影响?56.考虑有四个与某疾病有关的因素与该病的患病率资料如表所示,试用该数据进行多重回归分析。某疾病的患病率与四个影响变量X1X2X3X4患病率(%)Y1725142656.9456243887。4842122765.4113294888。575273496.211581024109.2467156103。3234204682120185698。72547630115.8242244282。612661214120。31067913108。872666078.5129155274.31256921102.2462372578.857.获得年龄与血红蛋白测量数据如下,试用该数据拟合简单线性、二次、三次多项式模型,并评价模型的拟合优度。年龄中值6810121416182022HB(g%)10.4110.8010.8510。3610。3110。6810。8211。0411。2058.如表是随机抽取的11名儿童的智力测试数据,试以IQ为因变量拟合多重线性回归模型。并讨论本例应用回归分析所存在的问题。儿童智力测试数据常识X1算术X2理解X3拼图X4积木X5译码X6IQY141328142239541014151434353712121913243928787920241913122412263836\n个人收集整理勿做商业用途191523162438281916262138695391014931464010815131543519812102243551210201412284259.根据下表的数据,计算:①奥克拉荷马州和蒙塔那州的标准化死亡率;②奥克拉荷马州和蒙塔那州的期望寿命。美国1960年的人口分布及两个州的死亡率年龄1960年美国人口(千人)奥克拉荷马州死亡率ri(‰)蒙塔那州死亡率ri(‰)0~411225.525.81~162091。21.25~354560.50.515~240201.21。625~228181。61。835~240812。93。145~204866.97.555~1557214。816。365~1099732。437.375~463479。087。385~929190.4202。8合计179323取自:Grove,R.D。,andHetzel,A。M.(1963)。VitalStatisticsRatesintheUnitedStates,1940—1960.NationalCenterforHealthStatistics,WashingtonDC.60.根据表16-14的资料编制简略寿命表,并且分别将0岁组死亡率和60岁组死亡率改变为原来的50%、30%、10%再计算其期望寿命,比较0岁组期望寿命的变化。1958年中国某山区少数民族男性人口数、死亡数年龄组人口数死亡数年龄组人口数死亡数0~99997352140~9055516511~96494115645~8890824395~9533963050~86484385710~9462143855~82622578915~9423045460~76840840720~9385663765~684301150825~9315764870~569231470530~9247182975~422201632935~91666111280~258902589061.2002年云南某地女性人口数、死亡数和肿瘤死亡数见表.(1)请编制全死因简略寿命表。(2)编制去肿瘤死亡后的去死因寿命表。2002年云南某地女性人口数、死亡数和肿瘤死亡数资料年龄组人口数死亡数肿瘤死亡数年龄组人口数死亡数肿瘤死亡数0—29890563145—907562651531-87540113350-856714291965-99862120955-7068259829210-1395411351360—63842894348\n个人收集整理勿做商业用途15-1954241551565-40685112340520-2111381961970-30857156826925—1865432343775—10364168410730—1269522014880-42167857935-1032801985685—9864521140—912582107662。真性红细胞增多症病人经不同的放射线治疗后发生白血病的情况列于表,请分析不同治疗方案的白血病发病率及其相对危险性。真性红细胞增多症病人经不同的放射线治疗后发生白血病的情况治疗方案治疗人数白血病发病人数未接受放射治疗1331接受X—线治疗797接受P32治疗22825接受X-线+P32治疗7212合计5124563.一项石棉与肺癌死亡的历史前瞻性研究结果列于表,试用分层分析方法阐明石棉对肺癌发病的影响,并与不分层的分析结果相比较。石棉与肺癌死亡的历史前瞻性研究资料工龄(年)石棉工人非石棉工人人年数死亡数死亡率人年数死亡数死亡率10~89462364。0274395141。8820~5192516431。58625288613.7530~17001177104.11193609645.5940~8465109128.7772364156.66合计16685348629。1316351923714。4964.就第63题的资料(资料引自:陈镜群主编:职业流行病学)分别考察石棉工人中和非石棉工人中肺癌死亡率是否有随年龄上升的趋势。65.一项膀胱癌患者及对照者吸烟史的病例—对照研究资料列于表,试分析膀胱癌与吸烟史之间的关系.膀胱癌患者及对照者吸烟史资料观察组有吸烟史无吸烟史合计膀胱癌患者192129321对照者156181337合计34831065866。一项心肌梗塞发生前饮酒量的病例-对照研究结果列于表,试计算优势比并进行趋势检验.心肌梗塞患者及对照者的每日饮酒量每日饮酒量(g)病例数对照数01361100~100202238100~2004246250+1124调查总数39141867.两个重要命题:病例-对照研究中不同疾病状态下暴露于危险因素这一事件的优势之比等于追踪研究中不同暴露水平下发病这一事件的优势之比;在发病率很低(如小于1%)的情况下,后者很接近相对危险度。(1)以和表示病例和对照,和表示暴露和无暴露,试用条件概率,\n个人收集整理勿做商业用途,和以及,,和表示上述两种优势比。(1)试利用Bayes公式证明这两种优势比相等。(3)证明发病率很低时,后者很接近相对危险度。68。一项乳腺癌与授乳史关系的1:1配对病例—对照研究资料列于表,试计算优势比以分析有无授乳史对乳腺癌发病的影响。如果按非配对公式计算优势比,其数值有何变化?乳腺癌与授乳关系的1:1配对病例-对照研究资料乳腺癌病人的授乳史对照者授乳史有授乳史无授乳史合计有授乳史276592无授乳史234366合计5010815869.42名确诊的白血病患者被随机分为2组,其中一组服用6-疏嘌呤(6-MP),另一组服安慰剂,服药后症状缓解时间如表所示。试估计两组缓解率并绘制生存曲线,给出各组中位缓解时间并推断生存曲线是否不同?2组白血病患者缓解时间(周)6—MP组安慰剂组666710131622236+9+10+11+17+19+20+25+32+32+34+35+1122344558888111112121517222370。为探讨某恶性肿瘤的预后,收集了31名该肿瘤患者的生存时间(月)、结局(0为死亡,1为删失)及可能的影响因素。影响因素包括病人年龄age(岁)、性别sex(1男,0女)、组织学类型type(1为高分化,0为低分化)、治疗方式treat(1为传统方法,0为新方法)、是否有淋巴结转移lym(1是,0否)等。分别作每个自变量的单因素Cox回归、包括所有自变量的多因素Cox回归以及逐步回归,结果如表1、表2和表3所示,试就此结果做出你认为合理的分析结论。表131名恶性肿瘤患者生存资料单因素Cox回归结果变量自由度回归系数的标准误P值-2ln(L)RR95%置信区间上限下限age1-0。002510.020740.01460。9037133.8930.9970。9581。039sex11.256730.463497.35190.0067125.7950.2850.1150。7060。1510.827type11。040600。433755。75570.0164128。1400。353treat10.563520.478301。38810.2387132。4061.757lym1—0.372530.454500.67180.4124133。2060。6890。6884.4860.2831。679表231名恶性肿瘤患者生存资料多因素Cox回归结果(—2ln(L)=104.979)变量自由度回归系数的标准误P值RR95%置信区间上限下限age10.019940.023640。71090。39921。0200.9741.069sex13.466580。8953514.99050。00010.0310.0050。1810。007\n个人收集整理勿做商业用途0。211type13.244660.8609614.20260.00020。039treat11。935080.813305。66100。01730.144lym11。278900.756202。86020.09083。5930。0290.7110。81615.816表331名恶性肿瘤患者生存资料多因素Cox逐步回归结果(-2ln(L)=108。033)变量自由度回归系数的标准误P值RR95%置信区间上限下限sex13。350180。9293812。99420。00030。0350.0060.2170。0290。317type12。350710.6134614。68360.00010.095treat12。070640.851685.91100.01500.1260。0240。66971。收集了1994~1998年反映医疗质量的7项指标值如表所示,(1)试采用Topsis法对该医院5年的医疗质量进行综合评价.1994~1998年某医院医疗质量指标年度19942158476.77。31.0178。397.52.019952437286。37.40。8091。198.02.019962204181。87.30.6291.197。33。219972111584.56.90。6090。297。72.919982463390.36。90。2595。597。93。6注:—出院人数,–病床使用率(%),–出院者平均住院日,–病死率(%)–危重病人抢救成功率(%),–治愈好转率,–院内感染率(%)(2)试采用层次分析法对该医院5年的医疗质量进行综合评价。(3)比较两种方法评价的结果。72.就下表资料练习Meta分析。3项某降脂药物的疗效的RCT实验结果研究治疗组对照组样本量均数标准差样本量均数标准差1135.04。7136.53。82304.82。7486。02.433622.53。52824。910。845812.32.94913.43.85439。83.2387。42。6(1)对资料作同质性检验,正确选择统计分析模型。(2)利用电脑实验中的程序对资料进行Meta分析,并与上述结果比较.73.某研究者拟分析心肌梗死病人服用阿司匹林预防死亡的效果,经过检索得到下表资料。7项心肌梗死病人服用阿司匹林预防死亡的研究死亡数/病人数研究编号阿司匹林组安慰剂组149/61567/624\n个人收集整理勿做商业用途244/75864/771332/31738/3094102/832126/850585/81054/4066246/2267219/225771570/85871720/8600(1)如何进行资料的同质性检验?怎样选择Meta分析的统计模型?(2)利用电脑实验中的程序对资料进行统计分析,并作出结论。(三)思考题⒈某医生欲比较某饮食疗法与一种药物疗法对降低血清胆固醇含量的疗效,选择了40名高脂血症病人。设立了4个组À正常饮食组;Á饮食疗法组;Â药物组;Ã药物+饮食疗法组.请问最好采用何种试验设计方案,并简述其理由。⒉为研究膳食中添加赖氨酸盐后对正常儿童生长发育有无影响,拟在面包中添加L-赖氨酸盐后用幼儿园的学生进行干预试验.问(1)可采用何种设计方案?(2)如何设置对照?(3)观察指标有哪些?(4)需控制哪些非处理因素?如何控制?3.为进行对苯二甲酸、乙二醇联合作用对肾脏损伤的实验研究,将48只SD大鼠随机分为到对苯二甲酸组、乙二醇组、苯二甲酸+乙二醇和生理盐水组,每组12只。(1)你认为最好选用那种试验设计方案?并说明理由。(2)如果研究的目的为比较苯二甲酸、乙二醇对肾脏是否有损伤,损伤是否有差异,又该选用何种设计方案?⒋为何多个均数的比较不能直接作两两比较的t检验?若要采用两两比较的t检验,则其检验水准和两样本均数之差的标准误该作何调整?⒌方差分析中的F检验为何是单侧检验?⒍三个样本均数的比较经ANOVA有统计学意义,在多重比较中出现了“不拒绝μ1=μ2,也不拒绝μ1=μ3,但拒绝μ2=μ3"的结果,该结果应如何解释?为什么?⒎是否一定要经ANOVA发现有统计学意义后,再作均数间的两两比较?⒏为研究三种不同处理下大白鼠血糖浓度随室温(℃)的变化,抽取条件相同或相近的24只大白鼠随机分配于三种不同处理的八种室温下进行实验,结果见表:不同处理及不同室温下大白鼠的血糖浓度(g/L)处理0℃5℃10℃15℃20℃25℃30℃35℃A0.980。961。101。081。201.251。401。45B0。860。801.001.161。151.301。201.40C0。900.950。981。201.221.361。351.50问:(1)该资料是随机区组设计资料还是重复测量资料?为什么?(2)三种处理的血糖浓度是否不同?八种室温的血糖浓度是否不同?⒐Pearson积差相关系数r经检验无统计学意义,是否意味着两变量间一定无关系?⒑Pearson积差相关系数r经检验有统计学意义,P值很小,是否意味着两变量间一定有很强的线性关系?⒒在云南省漫湾地区建立了一个漫湾电站。欲了解该电站对漫湾地区的生态环境、对周围居民健康是否有影响及影响程度,请作一个调查设计.⒓根据我们对全国出生缺陷监测资料的统计分析,发现神经管缺陷的发生具有明显的季节性,表现为1-3月份出生的孩子的发生率较高。今欲调查其原因,应采取什么调查方法?请做出完整的调查设计并制定出调查表。13.欲了解某县育龄妇女下生殖道感染情况及其影响因素,该县有人口95000人,育龄妇女占30%,其中70%已婚,拟调查已婚育龄妇女3000人,请作一个抽样调查方案。14.欲了解某市糖尿病患病情况及其影响因素,请作一个调查设计。\n个人收集整理勿做商业用途15.欲了解某市某小学在校学生的近视眼患病情况。该校共有6个年级,每个年级10个班,每班50人左右。欲通过分层整群抽样,调查600名学生,如何抽样?16。地区A共有25名社区医生。假定客观上各位社区医生的学历和上个月家访的次数如下表所示.25名社区医生上个月家访的次数医生12345678910次数35476124120大学毕业1111111111医生11121314151617181920次数0310119875129大学毕业1100000000请从中随机抽取5名,获得调查数据后,估计该地区社区医生上个月家访的总次数、每名医生家访的次数和该地区社区医生中大学毕业的所占百分比。并且思考下述问题:(1)将你的结果和真值比较,有何发现?如何解释?(2)将你的结果和你的同学所得结果比较,有何发现?如何解释?(3)如果将这次调查视为预调查,下次正式调查应该怎么做?17.如果事先知道每一位社区医生的学历情况,便可根据大学毕业与否将第一题的资料分为两层.请在这一总体中作按比例分层随机抽样调查,总样本量为5名。试估计该地区社区医生上个月家访的总次数、每名医生家访的次数。并且也思考第16题提出的3个问题。18.另一地区B共有社区医生40名,其他情况与上述地区类似。他们也准备用简单随机抽样作同样目的的调查,要求相对误差不超过30%,置信系数达到95%.请参考第16题的计算结果估算样本量。19.如果事先知道地区B每一位社区医生的学历情况,便可根据大学毕业与未毕业将该地区的社区医生分为两层,设.欲在这一总体中作按比例分层随机抽样调查,要求相对误差不超过30%,置信系数达到95%。请参考第17题的计算结果估算样本量。20.某市按地理位置划分成30个学区,每学区有4所小学.经一阶段整群抽样,抽得3个学区.对这3个学区的每一所学校调查了学生总数和色盲的人数,数据见下表:3个学区各学校的学生总数和色盲人数学区编号学校编号学生人数色盲人数1143072610123630124510208136082510173420444903171370162530103430342203试估计该市共有多少小学生,多少色盲小学生,以及小学生中色盲者所占百分比。21.视第20题为预试验,在此基础上估算正式作一阶段整群抽样调查所需的样本量。要求相对误差不低于30%,置信系数达到95%。22.第20题属于一阶段整群抽样,其中的“群”是什么?可否用分层随机抽样达到同一目的?这时的“层"是什么?23.围绕估计总体均数所需样本量的估算公式讨论,何时采用完全随机抽样?何时采用分层随机抽样?何时采用一阶段整群抽样?24.甲、乙两地女性乳腺癌死亡率(1/10万)资料如下表所示。(1)分别用以下标准人口通过直接法标准化比较两地女性乳腺癌死亡率,并讨论:①以甲地人口为标准人口。②以乙地人口为标准人口.\n个人收集整理勿做商业用途③以甲乙两地人口合计为标准人口。(2)分别用以下标准死亡率死亡率间接法标准化比较两地女性乳腺癌死亡率,并讨论:①以甲地死亡率为标准死亡率。②以乙地死亡率为标准死亡率。③以甲乙两地相同年龄组死亡数之和除以人口数之和求出两地合并年龄别死亡率,以此为标准死亡率。甲、乙两地女性乳腺癌死亡率(1/10万)资料年龄组(岁)甲地乙地人口数人口分布死亡数死亡率人口数人口分布死亡数死亡率0~1937400。5321.032298000.5831。3130~554000。15610。83654000.1757。6540~435000.121227。59410000。101331.7150~385000。101436。36298000.081136.9160~254000.07935.43173000.04740。4670~123000.03432.52112000.03544。64合计3688401.004712。743945001.004411。1525.甲、乙两地慢性阻塞性支气管炎患病率资料见下表:(1)分别用以下标准人口通过直接法标准化来比较两地慢性阻塞性支气管炎患病率,并讨论:①以甲地人口为标准人口。②以乙地人口为标准人口。③以甲乙两地人口合计为标准人口。(2)分别用以下标准通过间接法标准化来比较两地慢性阻塞性支气管炎患病率,并讨论:①以甲地患病率为标准患病率.②以乙地患病率为标准患病率。③以甲乙两地相同年龄组患病数之和除以人口数之和求出两地合并年龄别患病率,以此为标准患病率.甲、乙两地慢性阻塞性支气管炎患病率资料年龄组(岁)甲地乙地人口数人口分布%患病人数患病率%人口数人口分布%患病人数患病率%0~121003.93540.45123003.29320。2610~3420011.101200.353980010.64630。1620~8340027。079651。169635025.768680.9030~5340017.3312842.406320016。909861.5640~4970016。13536910.805860015。6746217。8950~3210010。42386412。044932013。18495210.0460~289009.38403613.97362009。68635117。5470~143004。64278519。48183004。89539829。50合计308100100.00184775。99374070100.00232716。2226.设一配对设计的病例-对照研究资料,用非条件logistic回归作分析,对结果有什么影响?27。某人在分析疾病发生与X1和X2两变量关系时,单个引入X1或X2都有统计学意义,但两变量同时引入时却都没有统计学意义,为什么?28。在随访某工厂1000人的队列研究中,暴露于危险因素(苯)的900人中有194人出现白细胞减少,非暴露人群100人中有21人出现该症状。再随访另一工厂1000人,暴露组100人中有6人出现白细胞减少,非暴露组900人中则有29人出现该症状.两工厂的资料合并得表。两工厂资料的合并E+E—合计D+20050250D—8009501750\n个人收集整理勿做商业用途合计100010002000试用经典方法估计OR值并做c2检验,再用单因素logistic回归估计OR并做Wald检验,比较结果。进一步讨论各工厂分开分析与合并分析结果的差异及解决方法。中南大学以学统计学精品课程网站:http://netclass。csu。edu.cn/JPKC2006/China/04yxtjx/index.asp

相关文档