医药数理与概率统计学 71页

  • 670.31 KB
  • 2022-09-01 发布

医药数理与概率统计学

  • 71页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
《医药数理统计方法》§6.1§6.1假设检验的基本思想一、假设检验的概念二、两类错误三、假设检验的一般步骤Ch6假设检验\n《医药数理统计方法》§6.1一、假设检验的概念在实际问题中,经常会遇到根据样本所提供的信息,判断总体是否具有某种指定的特征。如1)总体分布是否服从某一类型?2)总体的某个参数与某个定值是否有实质性差异?3)同类型的两个总体的某个参数是否相同?……这些都是假设检验问题。\n《医药数理统计方法》§6.11、假设检验根据某种实际需要,预先对未知总体作出一些假设,然后再根据实测样本的信息去检验假设的合理性,以最后决定对该假设的取舍。这种关于总体的种种假设称为统计假设,处理假设的统计方法称为统计假设检验,简称假设检验(hypothesistesting),也称显著性检验(significancetest)。\n《医药数理统计方法》§6.1注:分类1)参数检验(parametrictest)已知总体分布类型,对其未知参数的假设作假设检验,称为参数检验。2)非参数检验(nonparametrictest)对未知总体分布类型的总体假设作假设检验,称为非参数检验。\n《医药数理统计方法》§6.12、小概率原理一个概率很小的事件(即小概率事件),在一次试验中一般是不应该发生的。那么,若在所作假设成立的条件下,某事件为小概率事件。然而,它在一次试验中竟然发生了,便有理由认为它不是小概率事件,而推理过程并无差错,因此只能认为假设不正确,从而拒绝该假设。这就是小概率原理。小概率事件的概率常用α表示,一般α≤0.05,尤其多取α=0.05和α=0.01。\n《医药数理统计方法》§6.1例6.1有作用强烈的某种药物,按规定每片的有效成分含量为0.5mg。今随机抽取某厂生产的这种药品12片,测得药片的平均有效成分含量为0.4938mg。假定药片有效成分含量服从标准差为0.01mg的正态分布。问这个厂家的产品是否符合要求?\n《医药数理统计方法》§6.1解:设药片有效成分含量为X(mg),则X~N(μ,σ2),μ未知,σ2已知。建立H0:μ=0.5,H1:μ≠0.5若H0成立,则样本值∴拒绝H0,即认为这个厂家的产品不符合要求。\n《医药数理统计方法》§6.1注:1)拒绝“μ=0.5”,正确的说法是“μ与0.5有显著性差异”,或者说“μ与0.5有统计学意义。”2)“拒绝”一个假设,我们有100(1-α)%的把握,作出的结论是相当有力的。而“不拒绝”,则是软弱无力的。3)例6.1若给出我们的结论是不拒绝H0,即认为这个厂家的产品符合要求。α的大小还直接决定着检验结论的性质,故把α称为检验的信度或检验的显著性水平。\n《医药数理统计方法》§6.1二、两类错误1、分类:1)第一类错误:H0正确,被检验拒绝;2)第二类错误:H0不正确,没有被拒绝。注:一个假设检验犯第一类错误的概率就是显著性水平α。2、奈曼和皮尔逊提出:从理论上讲,一个好的检验总是在保证犯第一类错误的概率α不超过给定数值的前提下,使犯第二类错误的概率降低到最小。\n《医药数理统计方法》§6.1三、假设检验的一般步骤1、建立原假设和备择假设;2、在原假设成立条件下,构造一个与本问题密切相关且分布已知的统计量;3、做出检验结论,并给以专业解释。\n《医药数理统计方法》§6.2§6.2假设检验的常用方法一、置信区间法二、临界值法三、P值法\n《医药数理统计方法》§6.2例6.1有作用强烈的某种药物,按规定每片的有效成分含量为0.5mg。今随机抽取某厂生产的这种药品12片,测得药片的平均有效成分含量为0.4938mg。假定药片有效成分含量服从标准差为0.01mg的正态分布。问这个厂家的产品是否符合要求?\n《医药数理统计方法》§6.1解(一):设药片有效成分含量为X(mg),则X~N(μ,σ2),μ未知,σ2已知。建立H0:μ=0.5,H1:μ≠0.5若H0成立,则样本值∴拒绝H0,即认为这个厂家的产品不符合要求。\n《医药数理统计方法》§6.1解(二):设药片有效成分含量为X(mg),则X~N(μ,σ2),μ未知,σ2已知。建立H0:μ=0.5,H1:μ≠0.5若H0成立,则样本值\n《医药数理统计方法》§6.2∴拒绝H0,即认为这个厂家的产品不符合要求。\n《医药数理统计方法》§6.2注:1)解(一)为临界值法---事先给定α,用临界值去表示拒绝域。2)解(二)为P值法---根据统计量的样本值去反查临界值表求出对应的小概率事件的概率值,记作P。只要P≤0.05,就拒绝原假设H0。由于受到临界值表的限制,求精确值不方便时,要注明P值尽可能准确的范围。近年来报刊杂志等文献资料上多采用P值法。\n《医药数理统计方法》§6.3§6.3正态总体均值的检验一、方差已知条件下的u检验二、方差未知条件下的t检验\n《医药数理统计方法》§6.3一、方差已知条件下的u检验(一)单个正态总体例6.1(略)(二)两个正态总体例6.3从两个正态总体X~N(1,32),Y~N(2,42)中分别抽取容量为25和30的样本,算得,并且两样本相互独立。问这两个正态总体的均值是否有显著差异?\n《医药数理统计方法》§6.3解:由题意得,且两者相互独立,则建立H0:μ1=μ2,H1:μ1=μ2若H0成立,则\n《医药数理统计方法》§6.3样本值∴拒绝H0,即认为这两个正态总体的均值有显著差异。\n《医药数理统计方法》§6.3二、方差未知条件下的t检验(一)单个正态总体例6.1正常人的脉搏平均为每分钟72次。某职业病院测得10例慢性四乙基铅中毒患者的脉搏(单位:次/min)如下:54676870667867706569假定患者的脉搏次数近似服从正态分布,试问四乙基铅中毒患者和正常人的脉搏次数是否有显著差异?\n《医药数理统计方法》§6.1解:设四乙基铅中毒患者的脉搏次数为X(次/min),则X~N(μ,σ2),μ、σ2未知。计算出建立H0:μ=72,H1:μ≠72若H0成立,则样本值\n《医药数理统计方法》§6.2∴拒绝H0,即认为四乙基铅中毒患者和正常人的脉搏次数有显著差异。\n《医药数理统计方法》§6.3(二)两个正态总体1、配对比较是指配对资料的均值比较。将同质受试对象,即条件相同的受试对象两两配成对子,(比如说,使同品系、同性别、同月龄、同体重的二只健康小白鼠配成一对),让每个对子中的两个个体随机地接受两种不同的处理,这叫配对试验。\n《医药数理统计方法》§6.3例6.6为了比较新旧两种安眠药的疗效,10名失眠患者先后(间隔数日以消除先期药物的影响)服用了两种安眠药,测得延长睡眠时数如下表,假定睡眠延长时数服从正态分布,试问两种安眠药的疗效是否有显著性差异?试验号12345新药延长时数x1.90.81.10.10.1旧药延长时数y00.70.21.20.1试验号678910新药延长时数x4.45.51.64.63.4旧药延长时数y2.03.70.83.42.4\n《医药数理统计方法》§6.3试验号12345时数差d=x-y1.90.11.31.30.0试验号678910时数差d=x-y2.41.80.81.21.0解:设两种安眠药的睡眠延长时数之差为D,则D~N(μ,σ2)计算出\n《医药数理统计方法》§6.3建立H0:μ=0,H1:μ≠0若H0成立,则样本值∴拒绝H0,即认为两种安眠药的疗效有显著性差异。\n《医药数理统计方法》§6.32、成组比较试验时,将条件相似的受试者完全随机地分成两组,给予不同处理。或者从两个独立的总体中随机地各取出部分个体,进行比较研究,就叫成组比较试验。与配对设计相比,成组设计条件宽松,简便易行,所以应用较多。在对成组资料的均值进行比较时,一般应视两组资料是否满足方差齐性条件,分别使用t检验和t’检验。方差齐性是指两正态总体的方差相等或无显著性差异。(判别方法见§6.4的F检验)\n《医药数理统计方法》§6.3例6.7为了比较两种安眠药的疗效,将20名年龄、性别、病情等状况大体相同的失眠病患者随机平分为两组,分别服用新旧两种安眠药,测得的睡眠延长时数如下表,假定两组睡眠延长时数均服从正态分布,试检验两种安眠药的疗效是否有显著性差异?新药组x11.90.81.10.10.1旧药组x200.70.21.20.1新药组x14.45.51.64.63.4旧药组x22.03.70.83.42.4\n《医药数理统计方法》§6.3解:设新旧两种安眠药的睡眠延长时数分别为X1,X2,则X1~N(μ1,σ12),X2~N(μ2,σ22),且两者独立。可以验证两总体方差齐性。(见§6.4例6.12)计算出建立H0:μ1=μ2,H1:μ1≠μ2若H0成立,则\n《医药数理统计方法》§6.3样本值∴不能拒绝H0,即可以认为两种安眠药的疗效没有显著性差异。\n《医药数理统计方法》§6.3注:例6.7的数据是从例6.6中原封不动拿来的,但检验结果却是大相径庭,这反映出配对比较和成组比较两种设计的深刻区别。配对资料中每组数据大小并不重要,重要的是“对子数据”的差,而成组比较中,我们关注的是整组数据的大小,组中的每个数据都是随机排列、毫无先后顺序可言的。正是由于成组比较数据的完全随机化,才综合了所有可能的结果,得出正确的检验结论。\n《医药数理统计方法》§6.3例6.8用两种方法测定药物中某元素的含量(单位:%)。各测定4次,得到的数据如下:方法一:3.283.283.293.29方法二:3.233.293.263.25经验得知测定数据服从正态分布,试检验这两种方法的测定值是否有显著差异?\n《医药数理统计方法》§6.3解:设两种方法的测定值分别为X1,X2,则X1~N(μ1,σ12),X2~N(μ2,σ22),且两者独立。可以验证两总体方差非齐性。(见§6.4例6.13)计算出建立H0:μ1=μ2,H1:μ1≠μ2若H0成立,则统计量为样本值\n《医药数理统计方法》§6.3自由度(若求得的自由度数值比较小,就用它的两个相邻整数去查表,再对查得的临界值作插值处理;若求得的数值比较大,就四舍五入取整后直接查表。因为t变量的临界值表有一种大致的变化规律,即在相同显著性水平下,自由度较小时相应的临界值较大,而自由度较大时临界值较小。所以这种插值处理的做法可以减小所求临界值的误差。)\n《医药数理统计方法》§6.3利用n次插值多项式这里两点插值\n《医药数理统计方法》§6.3∴不能拒绝H0,即可以认为这两种方法的测定值没有显著差异。\n《医药数理统计方法》§6.4§6.4正态总体方差的检验一、单个正态总体方差的χ2检验二、两个正态总体方差齐性的F检验\n《医药数理统计方法》§6.4设样本X1,X2,…,Xn来自正态总体N(μ,σ2)(1)μ已知(2)μ未知一、单个正态总体方差的χ2检验\n《医药数理统计方法》§6.4例6.11溶解速度是药物制剂的一个重要理化指标。今随机抽取某种药片7片,测定其溶解一半所需要的时间(单位:min)分别为5.36.65.23.74.94.55.8假定溶解时间服从正态分布,试问可否认为这种药片溶解一半所需时间的方差是2?\n《医药数理统计方法》§6.4解:设药片溶解一半所需时间为X(min),则X~N(μ,σ2),μ、σ2未知。计算出建立H0:σ2=2,H1:σ2≠2若H0成立,则样本值∴不能拒绝H0(P>0.1),即不能认为这种药片溶解一半所需时间的方差是2。\n《医药数理统计方法》§6.4二、两个正态总体方差齐性的F检验注:1)方差齐性检验,显著性水平通常取α=0.10;2)F检验没有左侧检验;(见下页)3)检验时,取较大的样本方差做分子,较小的样本方差做分母,保证F变量的样本值F≥1。\n《医药数理统计方法》§6.42)X~2(n1),Y~2(n2),且X与Y相互独立,则F分布的左侧小概率,可以转化为另一个分布的右侧小概率\n《医药数理统计方法》§6.4例6.12见例6.7,为了比较两种安眠药的疗效,将20名年龄、性别、病情等状况大体相同的失眠病患者随机平分为两组,分别服用新旧两种安眠药,测得的睡眠延长时数如下表,假定两组睡眠延长时数均服从正态分布,试检验两种安眠药的疗效是否满足方差齐性条件?新药组x11.90.81.10.10.1旧药组x200.70.21.20.1新药组x14.45.51.64.63.4旧药组x22.03.70.83.42.4\n《医药数理统计方法》§6.4解:设新旧两种安眠药的睡眠延长时数分别为X1,X2,则X1~N(μ1,σ12),X2~N(μ2,σ22),且两者独立。计算出建立H0:σ12=σ22,H1:σ12≠σ22若H0成立,则样本值∴不能拒绝H0(P>0.1),即可以认为两种安眠药的疗效满足方差齐性。\n《医药数理统计方法》§6.4例6.13见例6.8,用两种方法测定药物中某元素的含量(单位:%)。各测定4次,得到的数据如下:方法一:3.283.283.293.29方法二:3.233.293.263.25经验得知测定数据服从正态分布,试检验这两种方法的测定值是否满足方差齐性条件?\n《医药数理统计方法》§6.3解:设两种方法的测定值分别为X1,X2,则X1~N(μ1,σ12),X2~N(μ2,σ22),且两者独立。计算出建立H0:σ12=σ22,H1:σ12≠σ22若H0成立,则样本值∴拒绝H0(P<0.1),即可以认为两种方法的测定值不满足方差齐性条件。\n《医药数理统计方法》§6.8§6.8分类资料的χ2检验一、拟合优度检验二、列联表资料的χ2检验\n《医药数理统计方法》§6.8计量资料用一定的单位通过测量而得到的反映事物属性特征的数据,称为计量资料。计量资料通常都是连续型数据。计数资料将事物按不同属性特征分组,清点得到具有相同属性的个体的数目,这类资料称为计数资料。计数资料通常都是离散型数据。\n《医药数理统计方法》§6.8一、拟合优度检验判断一组样本观察值与某个已知分布是否吻合的检验,称为拟合优度检验或适合性检验。设x1,x2,…,xn是随机变量X的一个简单随机样本,需检验“H0:X有分布F(x)”是否成立。\n《医药数理统计方法》§6.8(一)检验总体是否服从某种已知分布K·Pearsonχ2定理不论X服从什么分布,当n→∞时,其中Oj为第j组的实际频数(observed),Ej为第j组的理论频数(expected),而Ej=npj,k为组数。\n《医药数理统计方法》§6.8注:1)样本容量n需够大(一般要求n≥50),否则难以决定一种分布;2)要求各组的理论频数Ej≥5,当遇到一组或几组理论频数Ej<5时,应通过相邻的组使Ej≥5;3)计算理论频数时常用样本估计总体的某些参数,若估计的参数有m个,则χ2分布的自由度df=k1-m;4)当自由度df=1时,要采用χ2连续性校正公式\n《医药数理统计方法》§6.8例6.36做放射性观测实验,每隔一定时间,观察放射性物质到达计数器的粒子数目。共观察100次,数据如下表。试检验资料符合泊松分布。粒子数i01234567891011次数mi1516172611992121\n《医药数理统计方法》§6.8(二)检验实际频数与理论频数是否吻合例6.37生物学家孟德尔(G·Mendel)用黄色圆形豌豆与绿色皱皮豌豆做杂交试验,得四种豌豆,它们的数目如下表,按其古典遗传理论,这四种豆子的比例应为9:3:3:1,试判断试验结果是否符合孟德尔古典遗传理论。豆子分类圆形黄色圆形绿色皱皮黄色皱皮绿色合计频数31510810132556\n《医药数理统计方法》§6.8二、列联表资料的χ2检验列联表是用于多重分类的一种频数数据表,是分析计数资料的常用表格形式。它将每个观察对象按行和列两方面的属性分类,行和列方面的属性又区分为r种和c种等级,这样清点频数得到的r行(row)c列(column)的数据分类表,常称为r×c列联表。χ2检验多用于列联表行、列属性的独立性检验和多组分布概率的齐性检验等问题。\n《医药数理统计方法》§6.8(一)r×c列联表的χ2检验属性Y合计Oi.Y1Y2…Yc属性XX1O11O12…O1cO1.X2O21O22…O2cO2.………………XrOr1Or2…OrcOr.合计O.jO.1O.2…O.cnr×c列联表\n《医药数理统计方法》§6.8对应的概率分布表属性Y合计pi.Y1Y2…Yc属性XX1p11p12…p1cp1.X2p21p22…p2cp2.………………Xrpr1pr2…prcpr.合计p.jp.1p.2…p.c1(X,Y)的联合概率分布表\n《医药数理统计方法》§6.8由Th2.3知,二维离散型随机变量(X,Y)相互独立的充要条件是即在假定行列属性X,Y独立的条件下,(xi,yj)对应的理论频数为即\n《医药数理统计方法》§6.8这样,行列属性的独立性检验就转化为拟合优度检验,将理论频数和实际频数代入皮尔逊χ2表达式得到r×c列联表检验的χ2表达式其中自由度df=(r1)(c1)\n《医药数理统计方法》§6.8例6.38某项研究观察鼻咽癌患者与健康人的血型构成,情况如下表。试判断患鼻咽癌是否与血型有关。血型合计ABOAB鼻咽癌648613020300健康人12513821026499合计18922434046799\n《医药数理统计方法》§6.8解:建立H0:患鼻咽癌与血型无关,H1:两者有关。若H0成立,则df=(r1)(c1)=1×3=3计算得\n《医药数理统计方法》§6.8样本值∴不能拒绝H0(P>0.1),即可以认为患鼻咽癌与血型无关。\n《医药数理统计方法》§6.8(二)2×2列联表的χ2检验2×2列联表是最简单的列联表,又称四格表,这是统计工作中用得最多的一种列联表。四格表的一般形式为:Y1Y2合计Oi.X1O11O12O1.X2O21O22O2.合计O.jO.1O.2n自由度df=1,使用χ2连续性校正公式\n《医药数理统计方法》§6.8为了得到便于四格表使用的皮尔逊χ2表达式,我们把上面的的四格表改换成下面的形式。Y1Y2合计Oi.X1aba+bX2cdc+d合计O.ja+cb+dn=a+b+c+dχ2连续性校正公式化简得\n《医药数理统计方法》§6.81、行列属性的独立性检验例6.40有260份血清样品,将每份样品一分为二,用两种不同的免疫学方法检测类风湿因子,结果如下表。问两种检测结果是否独立?A法B法合计阳性1728180阴性126880合计18476260\n《医药数理统计方法》§6.8解:建立H0:两种检验方法独立,H1:两种检验方法不独立。若H0成立,则样本值∴拒绝H0(P<0.002),即可以两种检测方法不独立。\n《医药数理统计方法》§6.82、两组分布的概率齐性检验例6.39一项行为学调查记录了420人的用手习惯,结果如下表,试问男女中的“左撇子”现象发生率是否相同?爱用左手爱用右手合计男性29167196女性31193224合计60360420\n《医药数理统计方法》§6.8作为四格表资料,表面上看例6.39与例6.40是一样的。其实,在研究目的、抽样设计等方面两者并不相同。例6.39是两个样本比较其“左撇子”的发生率,例6.40可以看成是一个样本,研究两种处理的相关性。已经证明,这两种问题都归结为用同一个公式计算的皮尔逊χ2检验。既然这两类问题是用同一个公式进行同一种检验来解决,因此,这两类问题也完全可以不分类。事实上,例6.39中“男女左撇子发生率相同”就等同于说“左撇子与性别无关”。这样研究“多组分布的概率齐性检验”就转化为研究“行列属性的独立性检验”。\n《医药数理统计方法》§6.8解:建立H0:男女中的“左撇子”现象发生率相同,H1:发生率不同。若H0成立,则样本值∴不能拒绝H0(P>0.1),即可以认为男女中的“左撇子”现象发生率相同。\n《医药数理统计方法》§6.8注:1)从理论上讲,属性独立时,皮尔逊χ2值是不因行(或列)的位置调换而改变的,而有明显顺序的实际问题一旦更改顺序将可能完全丧失属性的可比性。如产品质量属性分成一级品、二级品、三级品等。因此,遇到这种情况时应考虑采用其他统计方法去解决。2)当样本容量n不太大(n<30)时,即使用了χ2连续性校正公式,χ2值仍有偏差,这时可采用“精确概率检验法”(Fisher’sexacttest)。\n内容小结1.假设检验的基本思想(定义、小概率原理、两类错误)2.假设检验常用方法1)临界值法2)置信区间法3)P值法(双侧、单侧)(了解单侧检验)3.正态总体参数的假设检验1)检验μ――σ已知,σ未知2)检验σ2――单个总体(了解)两个总体方差齐性检验《医药数理统计方法》Ch6

相关文档