- 102.50 KB
- 2022-08-29 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
医学统计学案例分析案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞de疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检2验,得连续性校正χP,0.05,差异无统计学意义,故认为中西药治=3.134,疗急性心肌梗塞de疗效基本相同。表1-4两种药物治疗急性心肌梗塞de疗效比较药物有效无效合计有效率(,)中药12(9.33)2(4.67)1485.7西药6(8.67)7(4.33)1346.2合计1892766.7【问题1-5】(1)这是什么资料,(2)该资料属于何种设计方案,(3)该医师统计方法是否正确,为什么,【分析】(1)该资料是按中西药de治疗结果(有效、无效)分类de计数资料。(2)27例患者随机分配到中药组和西药组,属于完全随机设计方案。2(3)患者总例数n=27,40,该医师用χ检验是不正确de。当n,40或T,1时,2不宜计算χ值,需采用四格表确切概率法(exactprobabilitiesin2×2table)直接计算概率案例分析,卡方检验(一)\n【例1-1】某医师为比较中药和西药治疗胃炎de疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结检验(有效=1,无效=0)进行进行果t,2.848,P,0.005,差异有统计学意义假设检验,结果t,2.848,P,0.005,差异有统计学意义,故认为中西药治疗胃炎de疗效有差别,中药疗效高于西药。【问题1-1】(1)这是什么资料,(2)该资料属于何种设计方案,(3)该医师统计方法是否正确,为什么,(4)该资料应该用何种统计方法,【分析】(1)该资料是按中西药疗效(有效、无效)分类de二分类资料,即计数资料。(2)随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3)该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布de计量资料,不能用于计数资料de比较。(4)该资料de目de是通过比较两样本率来推断它们分别代表de两个总体率有无差别,应用四格表资料de检验(chi-squaretest)。【例1-2】2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。表1-1中药和西药治疗非典病人有效率de比较药物有效无效合计有效率(,)中药(11.2)(16.8)2850.01414西药2(4.8)10(7.2)1216.7合计16244040.0某医师认为这是完全随机设计de2组二分类资料,可用四格表de检验。其步骤如下:1(建立检验假设,确定检验水准\nH:两药de有效率相等,即0π,π12H:两药de有效率不等,即1π?π122(计算检验统计量值(1)计算理论频数根据公式计算理论频数,填入表7-2de括号内。2(2)计算χ值具体计算略。3(确定P值,做出统计推断2查附表6(χ界值表),得0.025,P,0.05,按水准,拒绝H,0α,0.05,差异有统计学意义,可认为两药de有效率不等,中药疗效高于西药。【问接受H1题1-2】(1)这是什么资料,(2)该资料属于何种设计方案,(3)该医师统计方法是否正确,为什么,【分析】中西药de疗效按有效和无效分类,该医师认为此资料是二分类资料即(1)计数资料是正确de。(2)40例患者随机分配到西药组和中药组,属于完全随机设计方案。(3)该医师用四格表检验是正确de,但计算值de公式不对。因为有一2个理论频数(T=4.8)小于5大于1,应用连续性校正公式计算χ值。具体计算21略。2查附表6(χ界值表),得0.250,P,0.100,按α,0.05水准,不拒绝H,差别无统计学意义,尚不能认为两药de有效率不相同,中药疗效与西0药疗效基本相同。结论与前述相反。案例分析,卡方检验(二)\n【例1-3】某医师用某种中草药治疗不同类型de小儿肺炎,其中病毒性肺炎60例,细菌性肺炎60例,治疗结果见表1-2。该医师对此资料采用行×列检验,2得χ=7.077,P=0.069,差异无统计学意义,故认为此种中草药对不同类型小儿肺炎de疗效分布无差别。表1-2某种中草药治疗不同类型小儿肺炎de疗效比较小儿肺炎类型治愈显效有效无效合计病毒性肺炎2117111160细菌性肺炎1113171960合计32302830120【问题1-3】(1)该研究是什么设计,(2)统计分析de目de是什么,统计方法是否正确,【分析】(1)该资料为完全随机设计方案。(2)欲比较两组de疗效是否有差别,其比较de结局变量(分析变量)是等级资料,为单向有序分类资料。用2χ检验不妥,因为如果对其中de两列不同疗效de数值进行调换,值不会有变化,但秩和检验统计量有变化,所以该资料应该采用利用等级信息较好de秩和检验或Ridit分析。(经秩和检验,结果为Z=-2.570,P=0.010,差异有统计学意义。该结论与上述结论相反。)案例分析,卡方检验(三)【例1-4】某医院采用甲乙两种方法测定60例恶性肿瘤患者体内ck基20因表达阳性率,甲法测定阳性率为70.0,,乙法测定阳性率为38.3,,两种方法一致测定阳性率为26.7,。为比较甲乙两种方法de测定阳性率是否有差异,该医生首先将资料整理为表1-3。然后采用四格表检验进行假设检验,得χ2=12.118,P,0.005,差异有统计学意义,故认为甲乙两种方法de测定结果有差别,甲法测定阳性率较高。表1-3两种方法测定结果比较\n测定方法阳性数阴性数合计阳性率(%)甲法42186070.0乙法23376038.3合计655512054.2【问题1-4】(1)这是什么资料,(2)该资料属于何种设计方案,(3)该医师统计方法是否正确,为什么,(4)该资料应采用何种统计方法,【分析】(1)该资料是按两种方法测定结果(阳性、阴性)分类de计数资料。(2)该设计为同一受试对象接受两种不同de处理,属于自身配对设计方案。(3)该2医师用完全随机设计资料de四格表χ检验分析配对设计资料,其统计表和统计方法均不正确。(4)比较甲乙两种方法测定结果de阳性率是否有差别,应采用配对χ2检验(或McNemar检验)。案例分析,t检验【例1-1】某医生随机抽取正常人和脑病病人各11例,测定尿中类固醇排出量(mg/dl),结果如表1-1。该医生根据此资料算得正常人尿中类固醇排出量de均数=4.266mg/dl,标准差S=0.985mg/dl;脑病病人尿中类固醇排出量1de均数=5.732mg/dl,标准差S=1.626mg/dl,配对t检验结果,t=–3.098,2P<0.05,故认为脑病病人尿中类固醇排出量高于正常人。表1-1正常人和脑病病人尿中类固醇排出量(mg/dl)测定结果分组尿中类固醇排出量(mg/dl)2.905.415.484.604.035.104.974.244.373.052.78正常人5.288.793.846.463.796.645.894.577.716.024.06脑病病人\n【问题1-1】1(该资料属于何种设计方案,2(该医生de统计处理是否正确,为什么,【分析】(1)该资料是随机从两人群(研究de两个总体)中抽取样本,测量尿中类固醇排出量,属于完全随机设计。(2)该统计处理不正确。对完全随机设计de资料不宜用配对t检验。本资料应用完全随机设计两样本均数比较det检验,目de是判断两样本均数分别代表de两总体均数和是否相同。【例1-2】2005年某县疾病预防控制中心为评价该县小学生卡介苗抗体效价,随机抽取了30名小学生,测定结果见表1-2。经完全随机设计两样本均数比较det检验(方差齐,F=0.096,P>0.05),t=0.014,P>0.05,故认为该县小学生卡介苗抗体效价无性别差异。表1-22005年某县30名小学生卡介苗抗体滴度测定结果分卡介苗抗体滴度(倒数)组男40201604032080402040801604080404040生女80201604040160402040160160408040生【问题1-2】1(该资料属于何种设计方案?2(统计处理是否正确,为什么,【分析】(1)该资料是随机抽取当地30名小学男生和女生作为样本,测定每个观察对象de卡介苗抗体滴度,属于完全随机设计。(2)由于抗体滴度值是等比各组de平均滴度应用几何均数()描述,其假设检资料,服从对数正态分布,G验不能直接用完全随机设计两样本均数比较det检验,而应将观察值进行对数变换后再用检验。t方差分析【例6-1】\n某研究者为研究核黄素缺乏对尿中氨基氮de影响,将60只Wistar大白鼠随机分为核黄素缺乏、限食量、不限食量三组不同饲料组。每组20只大白鼠。一周后测尿中氨基氮de三天排出量,结果如表6-1。该研究者对上述资料采用了两样本均数t检验进行两两比较,得出结论:三组之间均数差异均有统计学意义(P<0.05)。检验进行两两比较,得出结论:三组之间均数差异均有统计学意义(P<0.05)。表6-13组大白鼠在进食一周后尿中氨基氮de三天排出量(mg)6.023.702.464.713.827.044.734.773.936.56核黄素缺乏组8.693.445.963.602.364.653.776.944.624.633.233.472.593.302.604.993.204.273.148.42限食量组7.142.493.133.262.503.212.614.903.234.078.215.665.347.366.845.205.114.699.3311.55不限食量组9.984.048.065.485.197.306.765.085.054.61【问题6-1】(1)这是什么资料,(2)该资料属于何种设计方案,(3)该研究者处理方法是否正确,为什么,【分析】(1)由于测定de是三组大白鼠尿中氨基氮含量,属于多组计量资料。(2)60只大白鼠随机分为三组,属于完全随机设计方案。(3)该研究者统计处理方法不正确,因为t检验适用于完全随机设计de两组计量资料de比较,不适用于多组计量资料de比较。(4)要比较检验多组完全随机设计计量资料de多个样本均数有无差别,需用完全随机设计计量资料de方差分析。2.【例6-2】某医师研究A、B、C三种药物治疗肝炎de效果,将30只大白鼠感染肝炎后,按性别相同、体重接近de条件配成10个区组,然后将各配伍组中3只大白鼠随机分配到各组:分别给予A、B和C药物治疗。一定时间后,测定大白鼠血清谷丙转氨酶浓度(IU/L),如表6-7。该医师用完全随机设计资料de方差分析方法对资料进行了假设检验,F,12.63,P,0.001,故认为三种药物de疗效不全相同。表6-2A、B、C三种药物治疗后大白鼠血清谷丙转氨酶浓度(IU/L)\n12345678910区组号652.40741.30675.60582.80491.80412.20494.60379.50679.48588.78处理A624.30772.30632.50473.60462.80431.80484.90380.70634.93474.56处理B445.10432.50362.70348.70345.90312.80296.30228.40372.26352.77处理C【问题6-2】(1)该资料是什么资料,(2)该研究是什么设计,(3)统计分析方法是否恰当,【分析】(1)由于测定de是血清谷丙转氨酶浓度(IU/L),属于多组计量资料。(2)30只大白鼠,按性别相同、体重接近划分为10个区组。每个区组3只大白鼠随机采用A、B、C三种药物治疗,故属于随机区组设计方案。(3)该医师应用完全随机设计计量资料de方差分析进行检验是不正确de,应该选用随机区组设计de方差分析方法进行检验。案例分析,秩和检验例1-1】某医师用改良deSeldinger’s插管技术对8例经临床和病理证实de恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。测定治疗前后血中deHCG含量如表1-1。该医师考虑到数据相差较大,采用对数变换后进行两样本均数比较det检验,得t=2.460,P,0.05,差异有统计学意义,故认为治疗前后血中HCGde含量有差别。表1-1灌注化疗前后HCG含量测定结果(pmol/L)病例号灌注前(X)灌注后(X)lgXlgX1212(1)(2)(3)(4)(5)112800002100006.10725.3222\n27550033004.87793.518531245022104.09523.3444415000009.36.17610.968551000025004.00003.39796970012033.98683.080371558848254.19283.6835842239143.62562.9609【问题1-1】1(这是什么资料?2(该实验属于何种设计方案,3(该医师统计方法是否正确,为什么,【分析】(1)该资料为计量资料。(2)该实验属自身配对设计方案。(3)该医师统计方法不正确。首先,配对资料一般采用对每对数据求差值后进行比较,而该医师采用完全随机设计资料de检验方法,统计方法与设计类型不符;其次,该医师考虑了数据相差较大,即不满足t检验de前提条件正态分布,采用了对数变换,基本思想正确。但治疗前后de数据经对数变换后,其差值de变异仍然较大(经正态性检验,,0.05),因此仍不满足配对检验dePt条件,故该资料宜采用非参数检验方法,即Wilcoxon配对设计de符号秩和检验,目de是推断配对资料de差值是否来自中位数为零de总体。【例1-2】某医生用某种中药治疗I型糖尿病患者和II型糖尿病患者共45例,结果见表1-2。为评价该中药对两型糖尿病de疗效有无差异,该医生对\n22此资料进行χ,5.289,,0.05,差异无统计学意义,故认为该中检验,得χP药对两型糖尿病患者de疗效基本相同。表1-2某种中药治疗两型糖尿病de疗效比较疗效等级I型糖尿病II型糖尿病合计9312无效8917好转51116显效222345合计【问题1-2】1(该资料是什么资料,2(该研究是什么设计,3(统计分析中有无不妥之处,【分析】(1)该资料de分组变量(两型糖尿病)是二分类资料,分析变量(疗效等级)是等级资料,称为单向有序分类资料。(2)研究设计为完全随机设计。(3)统计分析不正确。该医生de研究目de是比较中药治疗两型糖尿病de疗效,2用χ检验只能说明各处理组de效应在分布上有无不同,而不能说明各处理组效2应de平均水平有无差别,也就是说χ检验没有利用等级信息,因此效率较低。该资料宜用非参数检验deWilcoxon秩和检验。案例分析,直线相关与回归分析【例1-1】\n为评价环境噪音强度对社区居民生活de影响程度,某市疾病预防控制中心监测了该市10个社区de环境噪音强度,同时调查各社区居民de失眠患病率(%),结果见表1-1。经对噪音强度数量化(+=1,++=2,+++=3,++++=4,+++++=5)后,某医师对该资料采用Pearson直线相关分析,得r,0.853,P,0.005,认为环境噪音强度与居民失眠患病率之间存在正相关关系。表1-1某市10个社区环境噪音强度与居民失眠患病率12345678910社区编号++++++++++++++++++++++++++++噪音强度失眠患病率21.2023.4011.4016.9017.5026.3013.6025.6011.6025.30(%)【问题1-2】1(这是什么资料,2(该医师处理方法是否正确,为什么,3(该资料应该用何种统计方法分析,【分析】(1)该资料包含环境噪音强度与居民失眠患病率两个变量,一个属于等级资料,一个属于计量资料。(2)该医师处理方法不正确,因为环境噪音强度为等级资料,不服从正态分布,因此,不能用Pearson直线相关分析。(3)该资料应选用非参数统计方法,可采用Spearmande等级相关(Spearman’srankcorrelation)来分析两者de关系。【例1-2】某地对血吸虫流行区进行血吸虫与大肠癌关系de调查研究,抽查39个乡de资料,各乡抽查人数相同。血吸虫感染率最低为8.9,,最高为79.3,。将血吸虫感染率(,)作x,大肠癌标化死亡率(1/10万)为y,作相关回归分析,得r,0.6315,P,0.01,b,0.1344,a,4.152。【问题1-2】(1)能否用直线回归方程描述两者de关系,为什么,(2)若血吸虫感染率为20,,则大肠癌标化死亡率平均是多少,(3)若血吸虫感染率为90,,大肠癌标化死亡率平均又是多少,【分析】\n(1)能用直线回归方程描述两变量间de关系,因为回归系数de假设检验与相关系数de假设检验等价,既然rde假设检验,0.01,可认为两变量有直线P关系,所以能用直线回归方程来描述两变量间de关系:,,4.152+0.1344x(2)将x=20代入方程,求得y,6.84,则血吸虫感染率为20,时,大肠癌标化死亡率平均是6.84/10万,因为没有提供所需de数据,不可能求大肠癌标化死亡率de容许区间,所以到此结束。(3)由于血吸虫感染率de实测值范围是8.9,,79.3,,90,已超出此范围,不宜用该回归方程来估计大肠癌标化死亡率。案例分析-实验设计1.案例11-1某医师观察某新药治疗急性气管炎de疗效,用氨苄青霉素作对照。病人入院时,体温在39?以下分入治疗组,39?及以上分入对照组,结果新药疗效优于氨苄青霉素。【问题11-1】(1)该医师de结论是否正确,(2)实验设计有何缺陷,(3)应该怎样正确设计,【分析】(1)该医师de结论不正确。(2)该实验设计违犯了均衡性原则和随机化原则,实验结果没有可比性。因为体温在39?及以上者病情较重,39?以下者病情较轻,治疗组和对照组病人de病情程度不同即病情不均衡,治疗组为轻病人,对照组为重病人,这类试验必然导致错误de试验结果。如果治疗组和对照组交换一下,对照组为轻病人,该新药可能就没有效果。(3)正确de实验设计:随机抽取足够样本含量de急性气管炎病人,采用随机方法,将39?及以上病人随机分成治疗组和对照组,将39?以下病人也随机分成治疗组和对照组,两组除了治疗药物不同外,其它条件尽可能相同,采用盲法进行治疗和观察,结果进行假设检验以后再下结论。\n上述分析表明:临床科研结果de好坏取决于临床试验设计de好坏,良好de实验设计才能得到较好de科研结果。2.案例11-2某研究者欲评价多糖铁复合物治疗儿童轻度缺铁性贫血de疗效,在城北小学抽取60名确诊为轻度缺铁性贫血de儿童,服用多糖铁复合物为实验组;在城南小学抽取60名确诊为轻度缺铁性贫血de儿童,未服用多糖铁复合物为对照组,观察指标是血红蛋白含量。结果城北小学观察对象血红蛋白均值明显上升,城南小学观察对象血红蛋白略有提高,但比城北小学低,故认为多糖铁复合物有升血红蛋白作用,能有效治疗缺铁性贫血。【问题11-2】(1)该研究者遵循de均衡原则是否合理,为什么,(2)该研究de混杂因素是什么,(3)应该怎样正确设计,【分析】(1)该实验设计de缺陷是违背了均衡原则,即不清楚两所小学儿童de家庭经济条件、地理位置、儿童饮食习惯、营养条件是否相同或很相近,如果明显不同,则影响血红蛋白含量de因素除药物外,也可能是儿童饮食营养条件,不能将血红蛋白量升高这一结果完全归之于多糖铁复合物de疗效。因此认为这个没计是不均衡设计。(2)本研究de混杂因素是饮食习惯和营养条件等。这些混杂因素得不到控制,就不能得出上述结论。但要通过改变儿童饮食习惯和营养条件来控制这些混杂因素是比较困难de,可通过交叉均衡设计,以达到均衡目de。(3)正确设计:将城南小学60名儿童随机分成两组,30名服用多糖铁复合物,30名不服药;城北小学60名儿童也随机分成两组,30名服药,30名不服药。观察一段时间后,对城南和城北小学分开比较试验组和对照组即服药与不服药de血红蛋白有无差别,也可将测得城南小学30名服药儿童和城北小学30名服药儿童合并,作为实验组求平均值,再将两小学各30名未服药儿童de\n测定结果合并,作为对照组求平均值。对实验组和对照组de平均值进行假设检验,如果实验组de血红蛋白值高于对照组,且差异有统计学意义,可认为多糖铁复合物对血红蛋白有影响,对儿童轻度缺铁性贫血有治疗作用。3.案例11-3为评价某种国产抗菌新药de疗效,某医生抽取患有某种疾病且符合入选条件de60例患者,按入院后床位de单双号分为两组,每组30人。试验组服用该新药,对照组服用同类公认有效de进口药,临床观察结果见表11-9。经四格表卡方检验,得卡方=3.750,P,0.05,差异无统计学意义,故认为该国产抗菌新药与同类进口药de疗效基本相同。组例数有效有效率(%)分302170.0国产抗菌新药302790.0同类进口药表11-1两组患者用药后有效率比较【问题11-3】(1)该研究属何种类型,(2)在设计de过程中是否遵循了实验设计de基本原则,(3)该临床试验为何种对照,(4)该医师de结论是否可靠,为什么,【分析】(1)该研究属临床试验设计。(2)在设计与实施de过程中,该医生是按照床位号码将入选de60例患者随意分组,未能按照随机化de原则分组。(3)该临床试验为标准对照。(4)由于该医生未遵循随机化原则,样本de代表性差,两组患者de非处理因素不均衡,可比性差,因此其结论不可靠。4.例11-4\n某研究者欲评价佳加学生钙治疗儿童轻度缺钙de疗效,在实验幼儿园抽取80名确诊为轻度缺钙de儿童,服用佳加学生钙为试验组;在该地机关幼儿园抽取80名确诊为轻度缺钙de儿童,未服用佳加学生钙为对照组,观察指标是头发中钙de含量。结果试验组实验幼儿园de儿童发钙均值明显上升,机关幼儿园de观察对象发钙略有提高,但比试验组低,故认为佳加学生钙有补钙作用,能有效治疗儿童缺钙。佳加学生钙为试验组;在该地机关幼儿园抽取80名确诊为轻度缺钙de儿童,未服用佳加学生钙为对照组,观察指标是头发中钙de含量。结果试验组实验幼儿园de儿童发钙均值明显上升,机关幼儿园de观察对象发钙略有提高,但比试验组低,故认为佳加学生钙有补钙作用,能有效治疗儿童缺钙。【问题11-4】(1)该研究者遵循了均衡原则吗,为什么,(2)该研究de混杂因素是什么,(3)应该怎样正确设计,【分析】(1)该实验设计de缺陷是违背了均衡原则,即不清楚两所幼儿园儿童de家庭经济条件、地理位置、儿童饮食习惯、营养条件是否相同或很相近,如果明显不同,则影响发钙含量de因素除药物外,也可能是儿童饮食习惯、营养条件是否相同或很相近,如果明显不同,则影响发钙含量de因素除药物外,也可能是儿童饮食营养条件,不能将发钙升高这一结果完全归之于佳加学生钙de疗效。因此认为这个没计是不均衡设计。(2)本研究de混杂因素是饮食习惯和营养条件等。这些混杂因素得不到控制,就不能得出上述结论。但要通过改变儿童饮食习惯和营养条件来控制这些混杂因素是比较困难de,可通过交叉均衡设计,以达到均衡目de。(3)\n正确设计:将实验幼儿园80名儿童随机分成两组,40名服用佳加学生钙,40名不服药;机关幼儿园80名儿童也随机分成两组,40名服药,40名不服药。观察一段时间后,对两个幼儿园分开比较试验组和对照组即服药与不服药de血清钙和发钙有无差别,也可将测得实验幼儿园40名服药儿童和机关幼儿园40名服药儿童合并,作为实验组求平均值,再将两幼儿园各40名未服药儿童de测定结果合并,作为对照组求平均值。对实验组和对照组de平均值进行假设检验,如果实验组de血清钙和发钙值高于对照组,且差异有统计学意义,可认为佳加学生钙对发钙有影响,对儿童轻度缺钙有治疗作用。