卫生统计学习指导(新) 93页

  • 360.32 KB
  • 2022-09-01 发布

卫生统计学习指导(新)

  • 93页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
《卫生统计学习指导》流行病与卫生统计学教研室第一章绪论本章大纲要求【掌握】统计学基本概念:变量及变量的类型;总体与样本;同质与变异;参数与统计量。【熟悉】卫生统计的基本步骤。【了解】卫生统计学的发展史;统计学与公共卫生的关系。【重点内容详解】\n第一节医学中统计思维的进化第二节统计学与公共卫生互相推动一、统计学是公共卫生专业人员的得力工具公共卫生是群体科学,应用统计技术探索群体规律。统计抽样技术:设计群体调查,掌握人群的卫生状况和需求;统计描述:反映疾病和卫生资源的分布特征;统计推断:偶然性的背景中识别危险因素、评价卫生措施、进行科学决策。二、现代公共卫生领域对统计学的挑战公共卫生不仅应用统计学,而且不断提出新要求和新问题,是现代统计学研究和发展的巨大动力。第三节统计工作的基本步骤第一步研究设计(design)第二步收集资料(collectionofdata)第三步整理资料(sortingdata)第四步分析资料(analysisofdata)第四节统计学的若干概念一、总体与样本总体:大同小异的对象全体。样木:采用随机抽样的原则从总体屮抽取有代表性的一部分。二、同质与变异同质或同质性:研究对彖具有的相同的状况或屈性。变异:同一总体内个体间的差异。\n三、变量及其类型研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值、资料)。根据变量值获取方式的不同把资料进行分类:定量变量和定性变量。1、定量变量:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。2、定性变量:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单-位的个数。变量类型可以转化:定量一>有序一>分类一>二分类。注意转化方向只能由信息量多向信息量少的方向转化。四、误差1、随机误差(randomerror):由于一■些非人为的偶然因索使得结果或人或小,是不确定、不可预知的。2、系统误差(systemicerror):指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。3、非系统谋弟(nonsystcmicerror):失谋引起。也称过失谋弟。五、参数与统计量参数是指反映总体特征的统计指标。由样木观察资料计算出来的反映样木特征的量称为样本统计量。【自测练习题】一、选择题(-)每一道题下面冇A、B、C、D、E五个备选答案,请从中选择一个最佳答案。1、下面的变量中,属于分类变量的是A脉搏B血型C肺活量D红细胞计数E血压2、下面的变量中,屈丁•定量变量的是A性别B体重C血型D职业E民族3、某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料木属于oA定量变量B分类资料C有序资料D二分类资料E名义变量资料\n4、上述资料可以转换为—oA定量资料B分类资料C有序资料D二分类资料E名义变量资料5、若要通过样木作统计推断,样木应是—oA总体中典型的一部分B总体中任一部分C总体中随机抽取的一部分D总体中选取的冇意义的一部分E总体中信息明确的一部分(二)每一道题以一个小案例出现,其下面都有A、B、C、D、E五个备选答案,请从屮选择-个最佳答案。1、教材中提及美国人1954年实施了旨在评价索尔克(Salk)疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。冇180万儿童参与,约冇1/4参与者得到了随机化。①这180万儿童是。A口标总体B研究总体C1份样木D1份随机样木E180万份样木②上述试验最终肯定了索尔克疫苗的效果。请问此结论是针对—而言。A180万儿童B每个儿童C所冇使用索尔克疫苗的儿童D所冇儿童E180万儿童中随机化的1/4二、是非题1.定量变量、分类变量和有序变量可以相互转换。()2.离散变量在数值很大时,单位为“千”或“万”时可以取小数值,此时可近似地视为连续型变量。()4.同质的个体间不存在变异。()5.如果个体间冇变异,则它们一定不是來自同一总体。第二章定量变量的统计描述本章大纲要求【掌握】各种集屮趋势指标的计算及英适用条件,各种离散趋势指标的计算及其适用条件。【熟悉】频数分布表编制步骤,并据此描述资料的频数分布特征;统计表和定量资料统计图。【了解】描述分布形态的统计指标;了解描述分布形态的偏度系数与峰度系数的\n计算和意义。【重点内容详解】第一节数值变量的频率分布表一、离散型定量变量的频率分布对离散型定量变量,变量值的取值是不连续的。直接清点各变量值出现的频数,即为频率分布表。离散型定量变量的频率分布图可用直条图表达,以各等宽矩形直条的高度表示各组频率的多少。二、连续型定量变量的频率分布对连续型定量变量,变量值的取值是连续的。将数据适当分组,清点各组的频数,即为频率分布表。连续型定量变最的频率分布图可用直方图表达,其纵坐标为频率密度,即频率/组距,南方图的而积Z和等于1。三、频率分布表(图)的用途频率分布表(图)可以揭示资料的分布类型;也可以描述资料的分布特征,即集屮趋势和离散趋势,便于发现某些特大和特小的可疑值;便于进一步计算指标和统计分析。第二节描述集中趋势的统计指标对于连续型定量变量,平均数是应用最广泛、最重耍的一个指标体系,它常用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。常用的平均数有3种:算术均数、几何均数和屮位数。一、算术均数:1、意义:简称均数,常用卩表示总体均数,x表示样本均数,反映全部观察值的平均数量水平。2、适用条件:适用于对称分布资料,尤其止态或近似止态分布资料。二、几何均数1、意义:几何均数以符号G表示,常用来反映一组含多个数量级数据的集屮位置。2、适用条件:适用于原始观察值分布不对称,但经对数转换后呈对称分布的资料,如对数止态分布资料。观察值间常呈倍数关系,或变化范围跨越多个数量级。三、中位数1、意义:将一组变量值按从小到大或从大到小的顺序排列后,位次居屮的变量值。2、适用条件:适用于各种分布类型的资料,特别是偏峰分布的资料;亦可用于\n分布末端无确定值的资料。第三节描述离散趋势的统计指标同一总体屮不同个体间存在的差异称为变异。为比较全面地把握资料的分布特征,不仅需要了解数据的集中位置,而且需要了解数据的离散程度。常用的描述离散趋势的统计量包括极差、四分位数间距、方差、标准差和变异系数。一、极差1、意义:也称全距,以R表示,是一组变量值中最大值和最小值的差。2、适用条件:所有资料。二、四分位数间距1、意义:四分位数间距即为Q75与Q25Z差。2、适用条件:适用于偏态分布资料,比全距稳定,但仍未考虑每个变量值的变异程度。三、方差1、意义:方差考虑了全部观察值的变异程度。总体方差用八表示,定义为观察值离均差平方和的算术均数;样本方差用巴表示,是总体方差的无偏估计。同类资料比较时,方差越大意味着数据问变异度越大。2、适用条件:见标准差。四、标准差1、意义:方差的算术平方根称为标准差•总体标准差用。表示,样本标准差用S表示。标准差的量纲与原变量一致,故实际应用中常使用标准差。同类资料比较时,标准差越人意味着观察值间变异度越人。2、适用条件:方差和标准差都适用于对称分布的资科,特别对正态分布或近似正态分布资料,常把均数和标准差结合起来,全面描述资料的集中趋势和离散趋势。五、变异系数1、意义:变异系数用CV表示,为标准差与算术均数之比,是一个不带量纲的相对数。2、适用条件:量纲不同的变量及均数相差悬浮比较大的变量。第四节描述分布形态的统计指标一、偏度系数意义:理论上总体偏度系数为0吋,分布是对称的;取正值时,分布为正偏\n峰。取负值吋分布为负偏峰。二、峰度系数意义:理论上正态分布的总体峰度系数为0,取负值时,英分布较正态分布的峰平阔;取正值时,其分布较正态分布的峰尖峭。【自测练习题】一、选择题(-)A1型每一道题下而有A、B、C、D、E五个备选答案,请从屮选择一个最佳答案。1、用频率表计算平均数时,各组的组中值应为—oA本组段变量值的平均数B本组段变量值的中位数C木组段的上限值D木组段的下限值E(木组段上限值十木组段下限值)/22、离散型定量变量的频率分布图可以用—表达。A直方图B直条图C百分条图D箱式图E复式条图3、变异系数越大说明—oA标准差越大B平均数越大C标准差、平均数都大D平均数小E以均数为准变异程度大4、均数和标准差的关系是。A均数越大,标准茅越小B均数越大,标准差越大C标准差越大,均数对各变量值的代表性越好D标准差越小,均数对各变量值的代表性越好E均数和标准差都可以描述资料的离散趋势5、已知某疾病患者10人的潜伏期(天)分别为16,13,5,9,12,10,8,11,8,>20o其潜伏期的平均水平约为—天。A9B9.5C10D10.2E116、已知某地一群7岁男童身高均数为100cm,标准差为5cm;体重均数为20kg,标准差为3kg,则身高和体重的变异程度有oA身高的变异程度大于体重的变异程度\nB身高的变异程度等于体重的变异程度C身高的变异程度小于体重的变异程度D身高的变异程度与体重的变异程度之比为5:3E因单位不同,无法比较7、测得200名正常成年男子的血清胆固醇值(mmol/L),为进行统计描述,下列说法不止确的是—。A可用频率表法计算均数B可用直接法计算均数C可用直接法计算标准差D可用加权法计算标准差E可用直条图表示频率分布图(-)A2型以卜•提供若干案例,每个案例卜•设若干道题目。请根据题目所提供的信息,在每一道题下面的A、B、C、D、E五个备选答案中选择一个最佳答案。调查测定某地107名正常人尿铅含量(mg/L)如下:尿铅含量0〜4〜8〜12〜16〜20〜24〜28〜合计例数14222918156121071、描述该资料的集中趋势,宜用—。A均数B中位数C几何均数D众数E极差2、描述该资料的离散趋势,宜用—oA极差B方差C四分位数间距D标准差E变异系数二、简答题1、描述定量变量集中趋势的指标冇哪些,各自意义及适用条件。2、描述定量变量离散趋势的指标有哪些,各自意义及适用条件。\n第三章定性变量的统计描述本章大纲要求【掌握】常用相对数指标,相对数应用的注意事项;标准化法的基本思想,直接法的计算及间接法中SMR的意义,标准化法的注意事项。【熟悉】动态数列及其指标。【了解】医学人口统计常用指标。【重点内容详解】第一节三类相对数一、频率型指标最常见,表示某现象发生的频率大小。特点:分子与分母具有相同的单位,分子是分母屮的一部分,无量纲,其值不会超过lc二、强度型指标单位时间内某现象发生的频率。三、相对比型指标任何两个相关联的指标A,B之比。(A、B可以是绝对数;可以是相对数;可以是性质相同的,也可以是性质不同的)四、应用相对数应注意事项:1、分析时不能以构成比代替率;2、计算相对数时分母不能太少;3、对观察单-位数不等的几个率求合计率吋,不能将其直接相加求平均率;4、注意在比较相对数时应具备可比性。第二节医学人口统计常用指标一、医学人口统计资料的来源(-)人口普查资料人口普查是收集、整理和分析一个国家或一定地区在某一特定吋间的人口、经济和社会资料的全过程。(-)人口抽样调查资料相对省力,并且能在较短时间内得到调查资料和研究结果;可推论总体的相应特征。\n(三)FI常工作记录按照常规报告制度所做的原始记录。出生、死仁迁移;孕产妇死亡卡、5岁及以下儿童死亡登记等等。二、描述人口学特征的常用指标(一)人口总数一个国家或地区在某一特定时间的人口数。惯例:7月1口零吋为标准吋刻。国际上两种统计人口的方法:实际制:只统计标准时刻某地实际存在的人口数(包描临时在该地的人);法定制:只统计某地的常住人口数。从医学的角度看,实际制较好,如传染病的防治及计划生育管理等。(二)人口构成及其统计指标(表3-4)(三)人口死亡统计世界卫生组织“死亡”定义:“在岀生后的任何时候,全部生命现象永远消失称为死亡”。“胎儿死亡”不应包括在生命统计的“死亡”内。1、人口死亡资料的來源我国人口死亡资料主要由公安部门负责收集。国家规定居民死亡后,必须及时报告并注销户口。死于医院者,医师应负责填写死亡报告单。2、常用人口死亡统计指标1)测量死亡水平的指标粗死亡率,或称死亡率:某地某年平均每千人口中的死亡数,它反映居民总的死亡水平。2)死因构成及死因顺位的指标死因构成比:指全部死亡人数屮,死于某死因者所占的百分比。夕匕因顺位:按各类死因构成比的大小由高到低排列的位次。第二节疾病统计常用指标疾病统计是从数量方面研究疾病在人群屮的发牛、发展和流行分布的特点与规律,为病因学研究、防治疾病和评价防治工作效果提供科学依据。一、疾病统计资料的来源\n疾病报告和报表资料:包括国家规定的疾病报告和报表以及某些部门规定的一些重要慢性病报告。这些表格规范,内容标准统一。医疗卫生工作记录:包描各种医疗记录(门诊病历、住院病历等)。疾病专题调查资料:包括健康检查、疾病普査和疾病抽样调查等获得的资料。二、疾病和死因分类疾病命名是要对每一种法定疾病情况给以确切的名称,即标准化的术语,并使其对另外的疾病具有不可混淆的、明确的位置,以便于全世界的医务工作者具有共同的医学语言。三、疾病统计指标疾病统计的单位可以用病入,也可以用病例。而者反映在观察期内一个人是否转变为病人;后者,一个人每发生一次疾病就算一个病例。一个病人可以先后患数次同一种疾病或同吋患数种不同的疾病。疾病统计常用指标见教材表3-8o1、发病率:发病率表示一定时期内,在可能发生某病的一定人群中新发生某病的强度。分子中的新发病例数是指新发生某种疾病,以第一次就诊为准。由于该病,未愈继续就诊者称为III病例,不再算作新病例。2、患病率:是指某时点上受检人数中现患某种疾病的频率,其分子包括新、旧病例。通常用于描述病程较长或发病吋间不易明确的疾病的患病情况,如慢性病在某一时问横断面的患病情况。因此患病率与发病率要注意分子的区别。在一定的人群和时间内,发病率(IR)、患病率(PR)和病程(D)的关系是:PR=IRXDo第三节粗率的标准化法一、标准化法的意义和基本思想标准化法只适用于两组粗率进行比较时,由于某因素在两组的内部构成不同并冇可能影响到粗率的情况。标准化法的基本思想是:采用统一标准构成以消除某因素的内部构成不同对粗率的影响,使通过标准化后的标准化率具有可比性。二、标准化率的计算主要有直接法和间接法两种。三、应用标准化的注意事项1、标准化法的应用范围很广。标准化法适用于“某事件的发生率”可以是治愈率,也可以是患病率,还可以是发病率、病死率等。当某个分类变量在两组中分\n布不同吋,这个分类变量就成为两组频率比较的混杂因素,标准化法的口的就是消除这个混杂因素的影响。2、标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。3、曲于选择的标准人口不同,算出的标准化率也不同,比较的结果也未必相同,因此报告比较结果吋必须说明所选用的标准和理由。4、两样本标准化率是样本值,存在抽样误差。比较两样本的标准化率,当样本含量较小时,述应作假设检验。第五节动态数列及其分析指标动态数列(dynamicseries)是一系列按时间顺序排列起來的统计指标(口J以是绝对数、相对数或平均数)。用以说明事物在吋间上的变化和发展趋势。动态数列分析建立在相对比基础上,采用定基比和环比两种方式;不仅可分析过去某搴物的发生规律,而月•可以为预测将来的发生情况捉供参考。一、绝对增长量绝对増长量是说明事物在一定时期壇长的绝对值二、发展速度与增长速度意义:发展速度与增t速度均可按照定基比和环比的方式进行计算。定基比发展速度是用报告期的指标与某一时期(固定为基期)指标Z比,环比发展速度是用报告期的指标与其上一期指标Z比。三、平均发展速度和平均增长速度平均发展速度是各环比发展速度的几何平均数,说明某事物在一个较长吋期中逐年平均发展变化的程度。平均增氏速度是各环比增氏速度的儿何均数,说明某事物在一个较长的时期屮逐年平均增长的程度。【自测练习题】一、选择题1、男性吸烟率是女性的10倍,该指标为—OA、相对比B、流行率C、构成比D、罹患率E、标化流行率\n2、已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是—oA、分别进行比较B、两个率比较的兰检验C、不貝备可比性,不能比较D、对性别进行标准化后再比较3、通过大量研究得知,甲、乙两地甲肝病人构成,甲地为76%,乙地为24%B、乙地甲肝发病率高D、乙地甲肝病人数多于甲地B、把率变成绝对数D、消除内部构成的差异A、甲地甲肝发病率高C、甲地甲肝病人数多于乙地E、不能进行任何比较4、率标准化的主要目的是—A、把率变成构成比C、把大的率变小,小的率变大E、为了比较率的内部构成5、SMR为oB、预期死亡数/实际死亡数D、预期发病数/实际发病数A、实际死亡数/预期死亡数C、实际发病数/预期发病数E、以上都不是6、定基比与环比指标是—A、构成比B、平均数C、频率D、绝对数E、相对比7、一项新的治疗方法可延长病人的生命,但不能治愈该病,则最有可能发生的情况是。A、该病的患病率增加B、该病的患病率减少C、该病的发病率增加D、该病的发病率减少E、该病的发病率与患病率均减少8、耍比较甲乙两厂某工种工人某种职业病患病率的高低,釆取标准化法的原理,是OA、假设甲乙两厂的工人构成比相同B、假设甲乙两厂患某职业病的工人数相同C、假设甲乙两厂某工种工人的工龄构成比相同D、假设卬乙两厂某职业病的患病率相同E、假设甲乙两厂某职业病的构成相同\n10、某人欲计算木地人群某年某病的死亡率,对分母的平均人口数的算法,最好是OA、年初的人口数B、年末的人口数C、调查吋的人口数D、上年年终的人口数加本年年终的人口数之和除以2E、普查时登记的人口数11、某市冇30万人口,2002年共发现2500名肺结核患者,全年总死广人数为3000人,其中肺结核死亡98人,要说明肺结核死亡的严重程度,最好应用—oA、粗死亡率B、帅结核死亡人数C、帅结核死亡率D、肺结核死亡构成E、肺结核的病死率12、在一项研究的最初检查中,人们发现30-44岁男女两组人群的冠心病患病率均为4%,于是,认为该年龄组男女两性发生冠心病的危险相同。这个结论是A、正确的B、不正确的,因为没有区分发病率与患病率C、不正确的,因为没有可识别的队列现彖D、不正确的,因为用百分比代替率来支持该结论E、不止确的,因为没有设立对照组二、简答题1、简述标准化法的基木思想。2、应用相对数应注意哪些事项。\n第四章常用概率分布本章大纲要求【掌握】标准正态分布曲线下的面积规律,并会正确应用-一医学参考值范围的估计;二项分布和poisson分布的正态近似性。【熟悉】标准正态变换公式;正态分布及标准正态分布的概念和特征;二项分布和poisson分布特征。【了解】二项分布和poisson分布的应用。【重点内容详解】第一节二项分布一、二项分布的概念与特征观察结果是以二分类变量来表示,如阳性与阴性,如果每个观察对象阳性结果的发生概率均为兀,阴性结果的发生概率均为(1-h);而且各个观察对彖的结果是相互独立。重复观察n个人,发生阳性结杲的人数X的概率分布为二项分布,记作X~B(n,Ji)o1、二项分布的图形特征①二项分布的特征由二项分布的参数兀以及观察的次数n决定;②图形高峰在u二nil处或附近;Ji=0.5时,图形是对称的;③当兀工0.5时,分布不对称,且对同一n,兀离0.5越远,对称性越差。④对同一兀,随着n的增大,分布趋于对称,当n趋于8吋,只要兀不太靠近0或1(特别是当nir和n(1-n)均大于5吋)二项分布趋于对称。2、二项分布的均数和标准差如果X"B(n,jt),则X的总体均数为:ux=njt方差与标准差为:。『二门j!(i-ji)ox二寸nn(1-兀)二、二项分布的应用(-)概率估计即应用二项分布的概率函数估计n次试验屮,发生x次结果的概率。(-)单侧累计概率即计算出现结果0〜X次的合计概率或X、(n-X)次的合计概率。\n第二节Poisson分布的概念与特征Poisson分布也是一种离散型分布,用以描述罕见事件发生次数的概率分布。Poisson分布可以看作是发生的概率兀(或1-n)很小,观察例数n很大吋的二项分布。条件:除了二项分布的三个基本条件外,兀或(1-兀)接近0或1。一、Poisson分布的特性X—“1、Poisson分布的总体均数与总体方茅相等,均为入。2、Poisson分布的观察结果有口J加性。3、X>5吋,对称分布;入220近似正态分布。二、Poisson分布的应用1、概率估计2、单侧累计概率计算第三节正态分布及其应用人们将频数分布图的形状是正态曲线的随机变量称为是服从正态分布的随机变量。也就是说,某地成年男子的红细胞数是服从正态分布的。以x表示红细胞数量,则x是服从正态分布的随机变量。一、正态曲线的特征1、以A为中心左右完全对称的单峰钟形曲线;2、曲线最高峰处对应横轴上的数值是A,曲线两尾沿X轴左右延伸,越远离A的x,丫值越小;3、整条正态分布曲线与横轴所围成的而积等于1;4、止态分布在横轴上的位置由卩决定;5、。决定分布的形状,当。大时,整个分布在横轴上拉得很开,曲线是“矮胖”型,当。小吋,整个分布在横轴上比较收缩,曲线是“瘦高”型。二、正态曲线下面积的分布规律对任意一个服从正态分布的随机变量,可作如下标准化变换,经此变换,Z服从总体均数为0,总体标准差为1的止态分布。记为N(0,1)。标准正态分布是一条曲线。三、正态曲线下的面积规律1、X轴与正态曲线所夹面积恒等于1。\n2、对称区域面积相等。3、正态曲线关于均数对称;对称的区域内面积相等;口-1.64o〜口+1.64o内面积为90%;P-1.96o〜u+1.96o内面积为95%;U-2.58o〜P+2.58o内面积为99%。四、止态分布的应用1、估计变量值的频数分布2、制定参考值范围概念:通常指特定的“正常人群”(排除了对所研究指标有影响的疾病和有关因素的特定人群)的解剖、生理、生化、免疫及组织代谢产物含量等数据屮大多数个体的取值所在范围。①参考值范围制定:1)若变量服从正态分布根据正态分布的性质,U±1.960覆盖95%的“正常人”。然而,卩、。通常是未知的,我们经常用x、s代替。因此,参考值范围:x±1.96s2)若变量不服从正态分布采用百分位数法:找岀百分位数P2.5和百分位数P97.5。因此双侧参考值范围:(P2.5,P97.5)----该法适用于任何分布类型的资料。②决定取单侧范围还是双侧范围值有些指标如白细胞数过高或过低均属界(a),故其参考值范围需要分别确定下限和上限,称作双侧。有些指标如24小时尿糖含量仅在过高(b)、肺活量仅在过低时为异常(c),只需确定其上限或下限,称作单侧参考值范围。1)正态分布法:双侧95%参考值范围:x±1.96S单侧95%参考值范围:+1.645S(上限)〉兀-1.645S(下限)2)百分位数法:双侧95%正常值范围:P2.5〜P97.5\n单侧95%正常值范围:(元3+1.645%JD<(x+1.6455)E.v(和+1・645%』2、估计正常成年男性尿汞含量的95%医学参考值范围时,应用(E)oA(x-1.965,元+1.965)B(X-1.965-,%+1.965-)C.>P5D.207、二项分布的图形取决于()的大小。A.兀B.门C.斤与兀D.”E.“8、()小,表示用该样木均数估计总体均数的可靠性大。A.CVB.SC.畋D.RE.四分位数间距9、在参数未知的正态总休中随机抽样,"()的概率为5%。A.1.96^B.1.96C.2.58D.005/2^E.005710、某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其总休均数的95%可信区间为()。A.74±2.58x4-10r.74±1.96x4*10c.74±2.58x4D.74±4x4E.74±1.96x411、一药厂为了解其生产的某药物(同一批次)的有效成分含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数与标准差;估计该批药剂冇效成分平均含量的95%可信区间吋,应用()。C.0.05/2"B(X-1.96ct^,X+1.96cty)0.05/2,V5)D(X-1.96VX,X+1.96VX)E(p—1.96%p+1.96s“)F(X—1.96<7乂,X+1.96(7牙)12、在某地按人口的1/20随机抽取1000人,对其检测汉坦病毒IgG抗体滴度,得肾综合征出血热阴性感染率为5.25%,估计该地人群肾综合征出血热阴性感染率的95%可信区间时,应用()oA(X—tQ.Q5/2tvSX'X+『0.05/2昇片\nc.0.05/2,v0.05/2,v15)D(X-1.96VX,X+1.96VX)E(/?-1.96》#+1.96片)13、在某地采用单纯随机抽样方法抽取10万人,进行一年伤害死亡回顾调查,得伤害死亡数为60人;佔计该地每10万人平均伤害死亡数的95%可信区间吋,应用()。A(X—^O.O5/2,VSX5X+5.05/2,肿乂)C(X-『0.05/2#、',X+『0.05/2“)呂(X—1.96<7乂,X+1.96<7乂)D(X-1.96VX,X+1.96VX)E(P-1.96%p+1.96片)二、简单题1、标准差与标准误的区别与联系2、二项分布的应用条件3、正态分布、二项分布、poisson分布的区别和联系三、计算分析题1、如何用样本均数估计总体均数的可信区间。2、某市2002年测得120名11岁男孩的身高均数为146.8cm,标准差为7.6cm,同时测得120名11岁女孩的身高均数为14&lcni,标准羌为7.1cm,试估计该地11岁男、女童身高的总体均数,并进行评价。第五章参数估计基础本章大纲要求【掌握】1•抽样误差概念。2.标准差和标准谋的区别和联系。1.均数的标准误的计算。2.总体均数95%和99%置信区间计算方法及适用条件。【熟悉】标准误的意义及其应用。【了解】1・总体率的置信区间。2.t分布特征。【重点内容详解】第一节抽样分布与抽样误差\n一、样本均数的抽样分布特点在同一总体中,反复多次随机抽取样本含量相同的若干样本,样本均数的抽样分布具有如下特点:①各样本均数未必等于总体均数。②样本均数屮,各样本均数间存在差异,但各样本均数在总体均数周围波动。③样木均数的分布曲线为中间高,两边低,左右对称,近似服从止态分布。④样本均数的标准差明显变小。⑤即使从非正态分布总体屮随机抽样,只要样木含量足够大(n^50),样本均数的分布也近似于正态分布。—\抽样误差抽样误差(Samplingerror):在抽样研究屮,由个体变异产生的,抽样造成的样本均数与样本均数之间、样本均数与总体均数之间的差异称为均数的抽样误差。三、标准误(standarderror,SE)意义:即样本均数的标准差,是用来衡量抽样误差大小的指标,反映了样本均数与样本均数Z间、样本均数与总体均数Z间的离散程度,标准误用S元表示。\no计算公式:应用:①估计总体均数的可信区间;②均数的假设检验。四、标准差与标准误的区别和联系1.标准差表示个体变异程度的大小;2•标准误是样本均数的标准差,表示均数间的变异程度,或样本均数与总体均数的接近程度,标准误小,表示样木均数抽样误差小,样木均数与总体均数接近,反之亦然。3.样木均数的标准误(StandardError)SE=样本标准差/J样本含量=s/乔4.应用不同。标准差用于作参考值范围,标准误用于估计总体均数的可信区间。第二节t分布一、t分布的概念X-|1服从自由度D=n-1的t分布。X-|1S-Xt分布是总体均数可信区间和假设检验的理论基础。t分布曲线有以下特征:①以0为中心,左右对称的单峰分布;②f分布曲线形态变化与自由度的大小有关。自由度越小,贝比值越分散,曲线越低平;自由度逐渐增大时,/分布逐渐逼近Z分布(标准正态分布);当趋于8时,/分布即为Z分布,因此,标准正态分布是t分布的一个特例。\nt分布曲线下面积的分布规律:单侧:P(tW-仏)或P(tMtg)=a双侧:P(It|Ms)=p(tW-tg)+p(tMts)=a第三节总体均数的估计一、参数估计的概念参数估计是用样本统计量估计总体参数。包括点估计和区间估计两种方法。点估计:直接用随机样本的样本均数丁作为总体均数卩的估计值或用样本频率Q作为总体概率乃的估计值。点估计方法简单,没有考虑抽样误差的大小,故难以反映参数的估计值对其真值的代表性。区间估计:按预先给定的概率(1-a),确定一个包含未知总体参数的范围,这一范围称为参数的可信区间或逍信区间(confidenceinterval,CI),通常1-a取95%或99%。若标准差不变,将置信度由95%提高到99%,则置信区间市窄变宽,估计的精度下降。二、总体均数置信区间的计算1・。未知,且刀较小,按方分布,即(兀±匕2$壬)。2・<7已知,或<7未知但刀足够大,按Z分布,即(兀土Za/2CX)或(兀±Za/2Sx)o\n【自测练习题】一、选择题()分布的资料,均数等于中位数。A.对数B.正偏态C.负偏态D.偏态E.正态对数正态分布的原变量X是一种()分布。A.止态B.近似止态C.负偏态D.•正偏态E.对称估计正常成年女性红细胞计数的95%医学参考值范围时,应用(A.)o(元一1.96s,元+1・96s)B(元一1・96吐,元+1.96吐)>(礼+1.645%』DV(无+1.645QE.V(元s+1・645%』4.估计正常成年男性尿汞含量的95%医学参考值范围吋,应用(E)。(元一1.96s,无+1.96QB(x-1.965-,x+1.965-)C>(元炉+L645%」》<(x+1.6455)EV(礼+1.645%』5.若某人群某疾病发生的阳性数X服从二项分布,则从该人群随机抽出〃个人,阳性数X不少于比人的概率为()。AP(k)+P伙+1)+…+P(n)RP(k+1)+P伙+2)+…+P(n)CP(0)+P(l)+…+P(k)dP(°)+P(l)+…+P伙-1)E.P(l)+P(2)+・・・+P伙)6.Piosson分布的标准差"和均数久的关系是()。A.2>(7B.A<(7C.2二er'D.入二扁E.2与<7无固定关系7.用计数器测得某放射性物质5分钟内发出的脉冲数为330个,据此可估计该放射性物质平均每分钟脉冲计数的95%可信区间为()。A.330±1.967330B.330±2.58V330C.33±1.96廂D.33±2.58a/33E.(330±1.967330)/58.Piosson分布的方差和均数分别记为o1和久,当满足条件()吋,Piosson分布近似正态分布。A.龙接近0或1B.夕较小C.久较小D.龙接近0.5E.»209.二项分布的图形取决于()的人小。A.兀B.斤C.斤与兀D.oE.〃\n10.()小,表示用该样本均数估计总体均数的可靠性大。A.CVB.SC.畋D.RE.四分位数间距11・在参数耒知的正态总体中随机抽样,“卜()的概率为5%。A.1.96(7B.1.96C.2.58D.r005/2vSE・r°05/2^S^12.某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其总体均数的95%可信区间为()。A.74±2.58x4-10B.74±1.96x4一10c.74±2.58x4D.74±4x4E.74±1.96x413.—药厂为了解其生产的某药物(同一批次)的有效成分含量是否符合国家规定的标准,随机抽取了该药10片•,得其样本均数与标准差;估计该批药剂有效成分平均含量的95%可信区间时,应用()。A.0.05/2*$乂0.05/2.v5XB.(X-1.96^,X+1.96cty)C.「0.05/2,入X+^o.O5/2,p5)D.(X-1.96V%,X+1.96VX)E(〃-1.96%0+1.96»)14.在某地按人口的1/20随机抽取1000人,对H检测汉坦病毒TgG抗体滴度,得肾综合征出血热阴性感染率为5.25%,染率的95%可信区间时,应用()。A.0.05/2.v,yx'X+5.05/2山$乂)估计该地人群肾综合征出血热阴性感B.(X-1.96^,X+1.96cty)C.0.05/2*0.05/2,r*y)D(X-1.96VX,X+1.96VX)E.(p-\.96sp,p+1.96s\)15.在某地采用单纯随机抽样方法抽取10万人,进行-•年伤害死亡冋顾调查,得伤害死亡数为60人;估计该地每10万人平均伤害死亡数的95%可信区间时,应用()oA・(X—『005/2#$乂,X+『005/2八乂)B.(X-1.960.05,按a=0.05水准,则4屮药物的抑瘤效果和5个随机区组的瘤重推断结论分别为()A.药物不同,区组不同B.不能认为药物不同,不能认为区组不同C.药物不同,不能认为区组不同D.不能认为药物不同,区组不同E.药物差别较人,不能认为区组不同2.欲比较A、B、C三种药物对雄性Wistar大鼠尿中氨基氮排出量的影响,将36只大鼠按照休重和月龄相近的原则每3只为1区组,共12区组,每个区组的3只大鼠随机分配到A、B、C三个药物组。一个月后观察床中氨基氮的排出量。1)若用方差分析来比较三种药物对人鼠尿中氨基氮排出量的影响,变异分解正\n确的为\nA.SS总二SS组内+SS组问B.MS总二MS组内+MS组间C.SS总二SS处理+SS区组+SS谋差D.SS总二SS组间+SS组内+SS组间XSS组内E.MS总二MS处理+MS区组+MS谋差2)若检验水准定为0.05,欲比较不同三种药物对大鼠尿屮氨皋氮排出量的影响界值应为A.10.05,29B.Fo.05(11,22)C.Fo.05(2,22)D.Fo.05(2,24)E.Fo.025(11,22)3)如杲经方差分析得到三种约物对大鼠尿中氨基氮排出量的影响不同(p〈0.05),欲进一步比较哪两种药物对人鼠尿中氨基氮排出量的影响冇差别,宜采用A.SXK法B.配对设计t检验C.配对设计的符号秩和检验D.成组设计两样本均数比较的t检验E.成组设计两样本均数比较的秩和检验三、简答题1.方差分析的基木思想是什么?总离均差平方和以及总自由度怎样计算?2.两样木f检验与完全随机设计资料的ANOVA冇何关系?配对样本[检验与随机区组设计资料的ANOVA又有何关系?3.SNK-g检验Dunnett-r检验都可用于均数的多重比较,它们有何不同?4.数据变换在资料处理屮的作用是什么?四、计算分析题1•请根据所给基本数据完成下列方差分析表。分组nXSA824.3753.543B632.005.329C522.005.431D821.007.463方斧分析表变异来源SSVMSF组间变异组内变异总变异\n第八章卡方检验本章大纲要求【掌握】1・频数分布的拟合优度检验。1.独立样本2X2列联表资料的%$检验。2.配对2X2列联表资料的x彳检验。3.RXC列联表资料的x彳检验。【熟悉】1.x2检验的基本思想。2.x彳分布的特点。【了解】1.2X2列联表的确切概率法。【重点内容详解】第一节X2分布和拟合优度检验一、X?分布X?分布:F分布是-•种连续型随机变量的概率分布。W变量指V个相互独立的标准正态变量Zi(1=1,2,・-V)的平方和,即x2=Z12+Z22+-+Zv2o二、X$检验的基本思想:以X2值的大小来反映理论频数与实际频数的吻合程度。在零假设H°成立的条件下(H°:□二兀),实际频数和理论频数应该相差不大,即川值不应该很大,若实际算出的八值较人,超过了设左的检验水准所对应的界值,则有理由怀疑H。的真实性,从而拒绝H。,接受乩,即口工兀。三、拟合优度的X2检验检验的目的:根据样本的频率分布检验其总体分布是否与某给定的理论分布相等。x2检验的基本公式:=y(4")2Tv=k-l~s拟合优度X2检验的注意事项:1)分组不同拟合的结杲可能不同,一般耍求分组时每组中的理论频数不小于5;2)需要有足够的样本含量,如果样本含量不大,需要经连续性校正。校正公式:才2_m.5)2\n第二节独立样本2X2列联表资料的x彳检验检验的目的:两独立样本率差杲的比较。即根据两独立样本的频率分布,检验两基本公式:个样本的总体分布是否相同。孑2_(A厂厶『|(入一心)2|(A.-7;.)2|(A2-7;2)2z几兀Gt22=为⑺°,v=(行数T)(列数-1)T专用公式:T—nRnCRC_Hx2-(ad-beyn(Q+b)(o+c)(b+d)(c+d)连续性校正公式:(nO/T(|°d-bc\-牛)~n(a+b)(c+〃)(d+c)(b+d)四格表资料X2检验公式选择条件:1.n240且T25时,直接用专用公式或基本公式;2.心40但有1WT〈5时,校正公式或Fisher确切概率法;3.n<40或有T〈1时,Fisher确切概率法。第三节配对四格表资料的X2检验也称McNemar检验。检验的目的:对样木的各观察单位分别用2种方法处理,然后观察2种处理方法的计数结果。即推断则种方法的阳性率有无差别。条件与计算公式的选择:,b+c±40,^=(^£)1V=1Zb+c,b+c〈40,疋」Wb+c\n第四节独立样本RXC列联表资料的x彳检验检验的目的:用于多个样本率的比较;两个或多个构成比的比较;双向无序分类资料的关联性检验。计算公式:龙2A2二〃(工1)CV=(行数-1)(列数-1)RXC列联表资料的x彳检验的注意事项:1•各格子应该有妙1,并A1^7<5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种:1)增大样本含量;2)根据专业知识删去或合并;3)改用双向无序表的Fisher确切概率法。2•当多个样本率比较所得的统计推断为拒绝H0,接受H1时,若要推断任两个总体率间有无差别,需进一步作多个样木率的多重比较。即先调整Q,再进行率的两两比较。a,二ci/NN为要进行两两比较的次数,K为参加检验的组数。与前面一样进行四格表x彳检验。【自测练习题】一、A1型:每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。1•下列不能用W检验的是(A.多个均数比较B.多个率比较C.多个构成比比较D.单样木分布的拟合优度检验E.两个频率分布的比较2.以下关于用检验的自由度的说法,正确的是()。A.拟合优度检验吋,v=n-2(n为观察频数的个数)A.对一个3X4表进行检验时,v=HB.对四格表检验时,v=4D・若X2o.o5,v>X2o.o5,则v>nE.样木含量减1\n3・F值的取值范围是()A.—8X2o.oi,2,可以认为()A.各总体频率不等或不全相等B.各总体频率均不相等C.各样木频率均不相等D.各样本频率不等或不全相等B.各总体频率相等2.从甲、乙两文屮,查到同类研究的两个率比较的四格表资料,其W检验甲文X2>X2q.01(1)乙文X2>X2o.oS1的格子D.击现理论数C的格子或样本总例数〈40D.出现理论数>1的格子月.样本总例数2408•下列何种情况不能用F检验A.多个均数比较B.多个率比较C.构成比比较D.拟合优度检验E.关联性分析9.四格表中四个格子基本数字是()A.两个样本率的分子和分母B.两个构成比的分子和分母C.两对实测数和理论数D.两对实测阳性绝对数和阴性绝对数E.两对理论频数二、A2型:以下提供若干案例,每个案例下设若干道题目。请根据题目所提供的信息,在每一道题下面的A、B、C、D、E五个备选答案虫选择一个最佳答案。1•某卫生局对其辖区内屮、乙两医院医疗技术人员的业务素质进行考核,在甲医院随机抽取100人,80人考核结果为优良;乙医院随机抽取150人,100人考核结果为优良。1)设计类型与资料类型分别为()A.成组,沱量B.配对,沱量C.成组,沱性\nD.配对,定性E.区组,定性2)欲比较甲、乙两-医院医疗技术人员的业务素质,宜采用A.样本率与总体率比较的Z检验B.两样本率比较的Z检验C.两样本均数比较的t检验D.两样本比较的秩和检验E.配对四格表资料的力彳检验三、简答题1.X2检验的应用条件冇哪些?2.%2检验用于解决哪些问题?3.四格表的u检验与x?检验冇何异同?4.请列举RXC表X?检验的注意事项。5.RXC行列表与RXC双向冇序分类列联表X?检验的区别是什么?四、分析计算题1•某医生观察菜新药预防流感的效果,并用四格表专用公式计算岀x2=6.63,P二0.01。问:(1)此表的四个基木数字a,b,c,d各等于多少?(2)你对此有何看法?某新药预防流感的效果分组观察人数未发病有效率(%)服药组18013072.2未服药组23019082.62.根据下表数据,试比较使用含氟牙膏与使用一般牙膏者的患删率有无不同?使用含氟牙膏为使用•般牙膏者的患硒率牙膏类型调查人数患踊齿人数患踊率(%)含氟牙膏2007035—般牙膏1005050合计300120403.某卫生防疫站在屮小学观察三种矫正治疗近视眼措施的效果,近期疗效数据见下表。结论为“近期疗效以“夏天无”眼药水为最好,眼保健操次之,新医疗法最差”。试对此说法作出分析评价。三种措施的近期有•效率(%)矫正方法观察例数近期有效率(%)“夏天无”眼药水13537.78新医疗法3218.75眼保健操1827.78\n2.某厂在冠心病普查中研究冠心病与眼底动脉锁化的关系,资料整理如下。问两者之间是否存在一定的关系?冠心病诊断结果打眼底动脉硬化级别的关系眼底动脉硬化级别冠心病诊断结果合计正常可疑冠心病0340116357I7313692II1818133III216合计51311315883.川两种方法检查己确诊的乳腺癌患者120名。卬法的检出率为60%,乙法的检出率为50%,卬、乙两法一致的检出率为35%,试问两种方法何者更优?4.在某克山病区作中小学生心肌受损悄况检查,277名男生中检出率为48.74%,147名女生中检出率为57.10%,问男女生心肌受损率是否不同?5.用某种化学物质进行诱发肿瘤试验,实验组15只小白鼠中4只发生癌变,对照组10只无一只发生癌变,问两组发癌率冇无差别?\n第九章基于秩次的非参数检验本章大纲要求【掌握】1•非参数检验的基本概念及英使用条件;2.参数检验与非参数检验的优缺点;3.单样本与配对设计资料的秩和检验;4.两独立样木比较的秩和检验;5.多组独立样本比较的秩和检验。【熟悉】秩和检验的检验步骤与结果解释。【了解】1•多个独立样本间的多重比较。【重点内容详解】第一节参数检验与非参数检验基本概念:1•参数检验:已知总体分布类型,对未知参数进行统计推断的假设检验方法统称为参数检验。如I检验。2•非参数检验:对总体的分布类型不作严格要求,不受分布类型的影响,也不针对决定总体分布的参数进行推断,而是对总体分布位置进行推断的方法。乂称任意分布检验。2.参数检验与非参数检验的适用条件:参数统计:单变量计量资料且•样本所在总体呈止态分布b.各总体方差要齐C.各个样木是相互独立的随机样木双变量计量资料:用积差法计算直线和关系数,要求抽样总体为正态双变量。非参数统计:a.等级分组资料的统计处理b.适用于任何分布的资料\n2.参数检验与非参数检验的优缺点:优点:参数检验:检验效能高(发现差别的能力,即把握度)。非参数检验:乩使用于任何分布的资料b.不受总体方差一致的限制c.可用于等级资料的统计分析d・有些问题本身没有适当的参数检验方法,而非参数检验则恰能处理缺点:参数检验:易受使用条件的限制非参数检验:a.由于它没有充分利用原始数据屮所提供的信息,故检验效能低;b.很多非参数统计检验方法都采用一些近似估计作出推断结论。因此,其结果有一定的近似性。3.非参数检验作为首选方法的情况1)总体分布类型不明的小样木资料;2)—端或二端是不确定数值(如<0.002、>65等)的资料(必选);3)组内个别数据偏离过人,或各组内变异相差悬殊时;4)以严重程度、优劣等级、名次先后等方式定岀次序的等级资料;5)各种资料的初步分析。第二节两个相关样本资料的秩和检验一、单个样本资料的秩和检验常用于不满足t检验条件的单样本定量变量资料的比较。检验目的:推断样本中位数与已知总体中位数是否相等。检验步骤:1•建立假设,确定检验水准Ho:差值的总体中位数等于0H1:差值的总体中位数不等于0a=0.052.计算检验统计量T值\n1)求差值d。2)编秩次:按差值的绝对值由小到大编秩次,遇差值为0时,舍去不计,n随z减少;当差值的绝对值相等,若符号相同,可顺次编秩,也可求平均秩次,若符号不同,求平均秩次,并将各秩次冠以原差值的正负号。3)求正、负秩和:正秩和记为T+,负秩和记为T_。4)确定检验统计量:T任取T.或T为统计量T。3•确定P值,作出推断1)查表法:a•当5WnW50时,查T界值表。判断原则:内大外小原则。b.当n<5II寸不能得出有统计学意义推断,故n必须25。c.当n>50时,可用正态近似法。2)正态近似法:计算公式:T-n(n+l)/47—ln(n+l)(2n+l)工(/;-°)V2448二、配对设计资料的秩和检验原理同单样本资料的秩和检验。检验配对样本的差值是否来H小位数为0的总体,推断两个总体中位数是否相等,即两种处理的效应是否相同。第三节两个独立样本资料的秩和检验一、计量数据的两样本比较的秩和检验符合参数条件时,采用两样本均数的广检验。检验目的:用两样本观察值的秩次来推断两样本分别代表的总体位置是否相同。检验步骤:1.建立假设,确眾检验水准Ho:两总体中位数相等,Mi二匾Hu两总体中位数不相等,M1HM2a=0.052•计算检验统计量T值1)编秩:将两组数据由小到大统一编秩,遇相同数值在同一组内,可顺次编秩;当相同数值出现在不同组吋,则必须求平均秩次。2)求各组秩和:以样本例数较小者为m,其秩和为T。\n3)确定检验统计量:若叶氏,则T二A或T二T2,若HE,则T二T】。3•确眾P值,作出推断1)查表法:当nW10,且n2-nW10时,查T界值表。2)正态近似法:当m>10或ri2-m>10时,用正态近似法。…+1)/2J(j=1,2,L)为第丿•个相同秩次的个数N=n}+n2二、有序(等级)数据的两样本比较方法同计量数据的两样木比较的秩和检验。第四节K个独立样本比较的秩和检验一、计量数据的多个样本比较(Kruskal-Wallis〃检验)若满足参数条件,这类资料一般作完全随机设计ANOVAo检验步骤:1.建立假设,确定检验水准Ho:多个总体中位数和等H1:多个总体中位数不相等a=0.052.计算检验统计量H值1)编秩:将多组数据由小到大统一编秩,遇相同数值在同一组内,可顺次编秩;当相同数值出现在不同组时,则必须求平均秩次。2)求各组秩和R。3)确定检验统计量II值:3•确定P值,作出推断1)查H界值表:当组数23,口各组例数时,查H界值表。2)杳尸界值表::当组数或各组例数超出II界值表时,II近似地等于口由度为k-l\n的於分布,可查F界值表得到P值。二、等级数据的多个样本比较同计量数据的多个样本比较。【自测练习题】一、A1型:每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。1•两小样木定量资料比较的假设检验,首先应考虑()。A.用t检验B.用秩和检验C.t检验与秩和检验均可D.资料符合t检验述是秩和检验得条件E.F检验2•在作两样木均数比较时,已知“112均小于30,总体方差不齐且呈极度偏峰的资料宜用()A.t'检验B.t检验C.z检验D.秩和检验E.t'检验与秩和检验均可1.以下检验方法除()夕卜,其余均属非参数方法。A.t检验B.H检验C.X?检验D.符号秩和检验4•等级资料比较时,宜用()。A.t检验B.用检验C•秩和检验D.F检验E•方差分析5.三组比较的秩和检验,样本例数均为5,确定P值应查()•A.X2界值表B.H界值表C.T界值表D.M界值表E.以上均不可2.在统计检验中是否选用非参数统计方法,()A.要根据研究口的和数据特征作决定B.可在计算出儿个统计量和得出初步结论后进行选择C.要看哪个统计结论复合专业结论D.耍看哪个P值更小E.借看研究目的7•下列五个秩和检验的结果错误的是().A.配对计量资料n=12,T+二7,T=71,查得To.o5=13—65,P<0.05B.配对计量资料n二8,T+=12,T=24,查得"3—33,P<0.05\nA.两组计量资料m二12,n2=10,T尸173,T2=80,查得T。®二84—146,P<0.05B.两组计量资料m二10,n2=10,"55,T2=155,查得To.05=78—132,P<0.05E・两组计量资料m二9,n2=13,L=58,T2=195,查得To.o5=73—134,P<0.05三、简答题1•对同一资料,乂出自同一研究廿的,用参数检验和非参数检验所得结果不一致吋,宜以何者为准?2•配对比较的假设检验,符合参数检验条件,能否岀现t检验结果P>0.05,而非参数检验结果P<0.05?如果出现上述情况,此时应怎样解释检验结果?\n第十一章两变量关联性分析本章大纲要求【掌握】1.直线相关系数的意义与计算;1.直线相关系数的假设检验。【熟悉】1.秩相关系数的概念及其假设检验。【了解】1.分类变量的关联性分析。【重点内容详解】第一节线性相关一、直线相关的概念直线相关分析是描述两变量间是否有直线关系以及直线关系的方向和密切程度的分析方法。直线回归分析方法是描述两变量间依存变化的方法。直线相关的定义:如果两个随机变量中,一个变量由小到大变化时,另一个变量也相应地由小到人(或由人到小)地变化,并且测得两变量组成的坐标点在直角坐标系中呈直线趋势,就称这两-个变量存在直线相关关系。直线相关又称简单相关,布资科,一般说来,两个变量都是随机变量,不分主次,处于同等地位。两变量间的直线相关关系用相关系数厂描述。直线相关的性质可由散点图(图11.1)直观地说明。(a)O7}二0时,式(11.5)与式(11.6)相同。乓是总休等级和关系数门的估计值,存在着抽样误差,故计算出兀后,需作门=0的假设检验。当/7<50时,可通过杳口界值表实现门=0的假设检验;当/7>50时,可通过〃检验进行门=0的假设检验,统计量〃值的计算公式为,u=*n-\(11.7)第三节分类变量的关联性分析当两个变量不是定量变量吋,要对这两个变量做相关分析可以釆用RXC表的相关分析方法。若样木中有n个观测对象,对每一个观测对象均记录下两个分类变量x、y的状态,按Hx、y的状态归类,所得到的资料可以整理成一个RXC交叉分类表。例如,x有Xi>x2>X3、x.i四种状态,y有y】、y2、y;}三种状态,则RXC表为:XYY1Y2Y3XINilN12N13X2N21N22N23X3N31N32N33X4N41N42N43分析两个定性变量x、yZ间是否存在相关关系时,可用乂2检验确定乂、y之间有无关联性,若检验结果是P<0.05,则说明x、y之间存在关联性,再计算Pearson列联系数來表示/2检验公式;/2=n(X1)Pearson列联系数:【习题】\n一、填空题1、客观现象之间的数量联系有两种不同的类型:一种;另一种是相关关系O2、现象之间是否存在是进行相关与回归分析的基础,其主要测定方法是计算O3、若估计标准误差愈小,则根据直线回归方程计算的佔计值就越能代表实际值O4、对某实验结果做线性回归分析,得到形如的方程,现对回归系数b做显著性检验,该假设检验屮原假设为,备择假设为,若拒绝原假设,则认为x对y有显著的影响。二、选择题1.进行相关分析,要求相关的两个变量()。A.都是随机的B.都不是随机的C.一个是随机的,一个不是随机的D.随机或不随机都可以。2.判定现彖之间相关关系密切程度的主要方法是()。A.编制相关表B.进行定性分析C.绘制相关图D.计算相关数3.相关分析是研究()。A.变量之间的数量关系B.变量之间的变动关系C.变量Z间和互关系的密切程度D.变量Z间的因果关系4.相关系数的取值范围是()。A.r=0C.OWrWID.-1WrWl5.现象之间相互依存关系的程度越低,则相关系数()。A.越接近于0B・越接近于TC.越接近于1D.越接近于0.5\n1.当所有观察值都落在回归直线上,则x与y之间的相关系数()oA.r=0B.-l0.05,说明两变量无关系。3厂越接近1,两变量间相关关系越密切。2.直线冋归系数的数值表示口变量变动一个单位时因变量的值变动的量。3.回归系数越大,两变量的数量关系越密切。二、选择题1.第一组的资料的相关系数1r检验PV0.05,第二组的相关系数2厂假设检验P<0.01,则可以认为oA第-•组资料两变量关系密切B第二组资料两变量关系密切C很难说哪一•组变量关系密切D至少能说明两变量关系密切程度不一样2.如果相关系数厂=1,则一定有oA.SS总=SS残差B.SS残差=SS回归C.SS总=SS冋归D.SS总>SS冋归3•如果两样木的相关系数厂1二r2,那么oA.回归系数伤二b2B.T统计量trl=triC.两样木的决定系数相等D./统计量tb\=tb24•记P为总体相关系数,r为样本相关系数,b为样本回归系数,下列哪项正确oA・P=0时,厂=0B.|r|>0,b>0C.r>0时,b<0D・r<0时,b<05.r=14+4X是1〜7岁儿童以年龄(岁)估计体重(市斤)的回归方程,若休重换成国际单位kg,则此方程OA.截距改变B.回归系数改变C.截距和回归系数都改变D.两者都不改变三、简答题与统计分析题1.某研究者分别在8岁和9岁的男孩屮各随机抽取8人,测量了他们的身高,得到下列资料。表10・88名8岁男孩和8名9岁男孩的^S(cm)资料8岁组1231291281291291231291219岁组133137130126132138133137请冋答下列问题1)如果比较两个年龄组的平均身高,应该用什么方法进行统计检验2)对于比较两个年龄组的平均身高的统计检验而言,这两个总体的具体定义分别是什么?这两个总体均数的具体定义分别是什么?3)如果以年龄为横坐标,身高总体均数为纵指标,是否可以认为8岁男孩人群和9岁\n男孩人群的身高总休均数在某条直线上。答:因为8岁男孩与9岁男孩的身高总体均数与其年龄构成平面上的两点(8」8)和(9小9),故可以认为8岁男孩人群和9岁男孩人群的身高总体均数在某条直线上,因为两点连线构成-条直线。4)如果这两组资料满足每组资料服从正态分布并且方差齐性,现以年龄为自变量,身高为因变量,请验证:年龄与身高的资料满足简单线性回归对资料的要求,并写出总体回归方程,并用年龄=8和年龄=9分别代入总体回归方程,解出总体回归系数。1.随机抽取12名成年人,测得他们的身高(cm)和体重(kg)如表10・9。表10-912名成人的身商(cm)和体重(kg)指标•1234受5试者6编7号89101112体重56.569.164.575.065.076.047.571.568.049.557.582.0身高156.5172.0167.5176.0170.0167.5145.0158.5161.0150.0159.0180.5(1)分析这两项指标是否和关以及和关程度的大小。(2)求身高和体重之间的直线冋归方程并对冋归方程进行解释。(3)假如知道了一个人的身高是173.8cm,如何预测它的体重?3某医师研究污染源距离和尘肺浓度的关系,数据如下表10-10污染源距离和尘肺浓度离污染源距离(m)2003004005006007008009001000尘肺浓度(O.Olmg/m3)4.53.73.22.42.01.51.20.80.7请作统计分析。1.在线性回归分析中,如果决定系数R2-0.01,请问:冋归分析是否有意义?请说明理由。2.在线性回归中,如果所有的样本点均在一条斜率不为0的直线上,请问:回归系数的标准误助有什么特点(提示:由”二th,解岀助与相关系数厂)?第十三章实验设计本章大纲要求【掌握】1.实验设计的基木原则;2.常用的实验设计方法。【熟悉】1.实验的三个基本要素;2.假设检验时样本含量估计的意义、条件、方法。\n【了解】1.实验研究与调查研究的特点;2.科研方法的分类;3.盲法。【重点内容详解】第一节实验设计的特点及分类一、实验设计的特点实验设计的特点是①研究者能人为设置处理因素;②受试对象接受何种处理因素或水平是经随机分配而定的,能使非处理因素对不同处理组的影响保持均衡,组间具有可比性,可以客观评价处理因素的作用。③实验研究设计能使多种实验因索包括在较少次数的实验中,更有效地控制误差,达到高效的戸的。二、实验设计的分类根据研究目的和对象不同,实验设计可分为实验研究(experimentdesign)、临床试验(clinicaltrial)、社区干预试验(communityinterventiontrial)三种。1)实验研究以动物或标本(如细胞、组织等)为研究对象,因此在研究屮,研究者可以主动施加干预措施。2)临床试验以人为研究对象,因而不可能象动物一样任意采取严格的控制措施,而冃人是有思想的,存在着心理、社会活动,研究者必须周密考虑,认真设计,采取相应的措施控制误差和偏倚,以保证研究结果不受干扰。3)社区干预试验以社区人群为研究对象,接受某种处理或干预措施的基木单位是整个社区或某一人群的亚群,如一个学校的班级、某工厂的车间、某城市的街道、农村的乡镇、□然村等。其主耍冃的是通过干扰某些危险因素或施加某些保护性措施,观察其对人群产生的预防效果。例如,观察肾综合征出血热疫苗对肾综合征出血热的预防作用。由于社区干预试验难以将受试者进行随机分配,因此乂称为半试验性研究(quasi-experiment)o第二节实验设计的基本要素\n处理因素、受试对象和实验效应是实验设计的三个基木要素,它们贯穿于整个实验研究过程,从不同侧面影响着实验研究的结果,在实验设计屮必须予以足够重视。例如,用两种药物治疗糖尿病病人,观察比较两组病人血糖、丿來糖的下降情况,这里所用的药物为处理因素、糖尿病病人为受试对象,血糖值、尿糖值为实验效应。一、处理因素(treatmentfactor)在实验过程屮,影响实验结果的因素是多方面的,根据研究口的可分为处理因素和非处理因素二类。处理因素是指研究者通过统计研究设计有计划的安排实验,从而科学地考察其作用大小的因素,例如药物的种类、剂量、浓度、作用时间等;非处理囚素是指对评价处理囚素作用有一定干扰但研究者并不想通过实验考察其作用大小的因素,例如,病人的病情、病程等。选择处理因素应遵循以下基本原则:1)要抓住实验中的主要因素实验效应是多种因索作用的结果,由于研究目的不同,以及人力、物力和时间所限,研究者不可能通过一次或儿次实验中把己知的所有因素都进行处理与分析,只能抓主耍的,例如我们要改进某种细胞的培养方法,与其有关的因素很多,如温度、ph值、培养液、培养时间等。其中每个因素乂分若干水平(或等级),如温度从34°C至38°C,毎1°C为一个水平,则有5个水平;PH值从6.5至7.4,每0.1为一个水平,则有10个水平。培养液有两个水平;培养时间有3个水平时,须做5x10x2x3=300种条件的实验,若每种条件的实验重复10次的话,就需要做3000次实验,不可能在一次或几次实验屮完成。可根据专业知识和研究目的在众多因素与水平屮抓住主要的因素,且因素的水平数不宜过多。2)要分清处理因素和非处理因素例如,研究综合治疗糖尿病的效果,处理因素为药物治疗加饮食疗法;合理调配作息时间和其它辅助治疗措施也能缓解症状,有助于康复,但不是木次研究的处理因素,而是非处理因素。研究者应采取各种措施,尽可能使非处理因素在所比较的各组中基本相同,以便充分显示处理因素的作用。3)处理因素必须标准化处理因素标准化就是如何保证处理因素在整个实验过程中始终如一,保持不变。如在进行药物疗效的试验观察中,在整个试验过程屮,所使用药物的牛产厂家、批号、药品标准等必须一致。所以,在实验设计时,必须制定处理因素标准化的具体措施和方法。二、受试对象受试对象选择的合适与否,也是一项实验是否成功的关键。医学研究受试对象有人和动物,一般先做动物实验后再做人体观察,如新药疗效的观察一般是先\n做动物实验,初步观察其疗效和副作用后,再进一步在患者身上做临床试验,以确定其疗效和副作用。有些实验则可直接在人体进行观察,如生理、生化正常值的测定等。根据受试对象是动物述是人,选择受试对彖应遵循以下基本原则。1)动物的选择实验研究中,动物的选择比较灵活,但要紧紧围绕着实验口的选择动物。其具体选择方法详见第I•章动物实验设计。2)病例的选择临床试验中,病例的选择不象动物选择那样灵活,由于受试对象是人,在选择时必须遵循医徳要求,同时述必须明确病例的纳入和排除标准。三、实验效应一般是通过某些观察指标,定量或定性地反映实验效应。研究者应当对欲研究的问题有较为全面的了解,在实验设计中千万不要遗漏了某些重要的观察指标,以免实验结果不可靠。1)选择观察指标的基本原则(1)客观性尽可能选择客观指标,避免一些笼统的、不确切的指标。冇吋,客观指标还具有判断的主观性问题,如X线胸片是客观的,但判断吋存在主观性问题,所以,对于这种情况,须制定明确的判断标准。(2)精确性选用的指标应尽量箱确。指标的精确性包括准确性和精确性,准确性是指所观察结果的真实程度,即观测值与真值的接近程度,属系统误并;精确性是指所观察结果的深度,即重复观测时,观测值与平均值的接近程度,属随机误差。实验效应指标既要准确又要精密,而首先是准确町靠。(3)灵敬性应尽量选择高灵墩性的指标,即选择能够显著提高灵敬性的仪器对观察指标进行测量。但也要考虑实验经费问题,灵嫩度高的仪器,往往费用昂贵,应根据实验经费,选择既相对廉价,灵敏度乂高的测量方法。(4)特异性为了更好地揭示研究问题的本质,观察指标还应具备一定的特异性。例如,在诊断糖尿病时,测雄血糖的特异性就比测雄尿糖的特异性要高。实验效应指标应当同吋兼顾其灵敏性和特界性,尽量使灵敏性和特异性都高。2)指标的观察(1)对实验效应的观察应避免偏倚有关偏倚及其控制方法见第十一章第二节。(2)应注意处理与效应的关系处理与效应之间往往存在一眾关系,特别是药理或毒理实验研究中,处理与效应通常呈“丁型,低于某剂量的处理不引起\n机体反应;强处理时,机体反应出现一个峰值;再加强处理机体反应不再增加。在两个极值Z间存在一个止比关系。女口,做毒理学实验应选择一个合适的实验剂量。第三节实验设计的基本原则在实验设计中,应当严格遵守对照、随机、重复和均衡四个基本原则。1、对照的原则1)设立对照的意义设立对照组的的意义在于使实验组和对照组内的非处理因素的基木一致,即均衡可比。对照的意义述可以用以下符号表达:T(处理因素)+S(非处理因素)=0(实验效应)+$(非处理因素影响的结果)实验效应丘是与5混在一起的,实验设计的主要任务是如何使丘能单独显示出来。设立对照,使实验中两组(或多组)的S均衡,即S严S2。这样,实验组卩的效应£,就可以显示出来。T+Si―>€++S]T勺+$]IIIIIIII0+S2~»O+$2T2+S?—»e2+52T—>etedT:处理因素;S]与相同的非处理因素;T(l:7;与7;之差;e:实验效应,$1与$2是S]与S2的影响结果;7;与7;Z差7;的效应。这样,通过对照就消除了非处理因素对实验效应的影响。2)对照的基本形式对照的形式有多种,可根据研究目的和内容加以选择,常用的有下列几种。(1)空白对照对照组不施加任何处理因索。例如,观察某种疫苗预防肾综合征出血热的效果,选择人口数量和构成、发病水平、地理环境、主要宿主鼠类基本相似的两个疫区,一个作为试验区,在人群中接种疫苗,另一个作为对照区,不施加任何干预措施,处理因素完全空口。这种对照只有在处理因素很强,非处理因素很弱的情况下才能使用。在临床试验中,一般不用空白对照。(2)实验对照对照组不施加处理因素,但施加某种实验因素。如观察赖氨酸对儿竜发育的影响,实验组儿童课间加食含赖氨酸的面包,对照组儿童课间加食不含赖氨酸的面包。处理因索是赖氨酸,非处理因素的面包量两组是相同的。\n(1)标准对照不设立专门的对照组,而是用现有标准值或正常值做对照。在临床试验屮常以某疗法为标准对照组,这种对照应注意标准组必须是代表当时水平的疗法,切不可用降低标准组的方法使实验效应提高。但实验研究一般不用标准对照,因为实验条件不一致,常常影响对比效果。(2)自身对照对照与实验在同一受试者身上进行,如用药前后作为对比。一般情况下还要求设立平行对照组。(3)相互对照这种对照不设立对照组,而是两个或几个试验组相互对照。例如用莫雷西嗪治疗冠心病、高血压、心肌病和失调症引起的室性早搏时,设立冠心病组、高血压组、心肌病组和失调症组四个治疗组,相互比较它们的疗效。(4)配对对照把研究对象条件和同的两个配成一对,分别给以不同的处理因素,对比两者之间的不同效应。配对对照常用于动物实验,临床试验也可采用,但严格地说,很难找到相同或十分相似的对子。(5)历史对照以木人过去的研究或他人研究结果与木次研究结果做对照。除了非处理因素影响较小的少数疾病外,一般不宜使用这种对照。用时要特别注意资料的可比性。2、随机的原则1)随机的意义所谓随机,就是每一个受试对彖都有同等的机会被分配到任何一个组屮去,分组的结果不受人为因素的干扰和影响。实验设计中必须贯彻随机化原则,因为在实验过程中许多非处理因素在设计时研究者并不完全知道,必须采用随机化的办法抵消这些干扰因素的影响。2)随机化的实施实验设计中所指的总体不是泛指的无限总体,而是根据研究假设的要求规定的纳入标准,如动物的体重、年龄、病人的病情、经济条件、父母的文化程度等所选择的受试对彖(即本次实验的有限总体),再把这些受试对彖随机分入实验组和对照组中,以增强可比性,称为随机分配(randomizedallocation)o随机化的实施就是如何进行随机分配。随机化的方法有多种,最简单的如抽签。但在实验设计屮广泛应用随机数字表和随机排列表。3、重复原则所谓重复,就是实验要有足够的样木含量。重复是消除非处理因素影响的又一重要手段。\n1)影响样木含量大小的因素实验所需的样木含量刃取决于以卜个因素:(1)假设检验的第I类错误的概率a(检验水准)。取值越小,实验所需的样本含量斤越大。(2)假设检验的第II类错误的概率0(检验水准)0取值越小,实验所需的样本含量几越大。另外,如果把第II类错误的概率泄为0,那么1-0就是假设检验的检验效能(power),即处理组间实际上有并别,且假设检验结果能发现该差别的概率,通常检验效能取值为0.80,0.90,0.95或0.99。检验效能越大,实验所需的样本含量越大。(3)处理组间的差别/处理组间的差别》越小,实验所需的样木含量斤越大。(4)实验单位的标准差<7实验单位的标准差(7越大,实验所需的样木含量斤越大。2)确定样本含量时应当具备的条件(1)建立检验假设。(2)沱出检验水准和检验效能首先确泄本次实验中允许犯第I类错误的概率",通常取0=0.05;同时还应明确是单侧或双侧检验。然后,在特定的检验水准a条件下(比如a=0.05),确定检验效能1-0,通常定为0.80,根据需要有时可以定为0.90或0.75。但是,在科研设计时检验效能不宜低于0.75,否则检验的结果很可能反映不出总体的真实!1!现非真实的阴性结果。确定检验水准和检验效能,实际上是如何确定假设检验时犯第I类错误的概率"和第II类错误的概率0,a和0的大小应根据第I类错误和第II类错误的危害性来决定。以新药疗效论证的临床试验为例,第I类错误是将疗效与对照药木无差别的新药看作对照药的替代品,第II类错误是将疗效优于对照药的新药看作与对照药的疗效相同。如果新药的生产成本低于对照药且副作用比对照药小,不妨将a和0定得小一些,如a=0.01,0=0.05。反之,若新药的生产成本高于对照药或副作用比对照药大,应将a定的略小一些,0定得大一些,如a=0.05,0=0.2。检验效能就是优秀药物经过实验被发现的概率。当研究者倾向接受耳时,1-0应取较大的值,如0.95,0.99o(3)确定所比较的总体参数间的差值5和总体标准差<7例如,比较两总体均数或总体率的差异时,应当知道总体间的差值力的信息。如两总体均数间的差值〃=-心的信息。两总体率间的差值§=兀\-兀2的信息。有时研究者很难得到总体参数的信息,可以用专业上(临床上)认为有意义的差值代替,如平均舒张压的丼值>0.69kPa(5mmHg)^o\n当然,也可以根据试验的目的认为规定,如规定实验的新药有效率超过标准药物有效率的30%才有推广意义等。此外,确定两均数比较的样本含量还需要估计总体标准差<7的信息。还可以通过预试验,获得样本间的差值力和样本标准差S做为总体参数间的差值》和总体标准差<7的佔计值进行样本含量的佔计。3)确沱样本含量的用途(1)估算达到有统计学恵义的最低样木含量例如,根据文献报道血吸虫病人血红蛋白平均含量为90g/L,标准差为25g/L,现欲观察咲喃内胺治疗后能否使血红蛋白增加。规定治疗后血红蛋白至少增加10g/L以上为有效,0=0.05(双侧),0=0.10,问应治疗多少病人?冋答这一问题可用下面的公式进行估算:5=10g/L,cr=25g/L,w005=1.96,单侧w010=1.28——12■(1.96+1.28)25_610N=2=66例o(2)估计检验效能对于现有的实验结果,已知样木含量/V,可以根据总体的差值估计实验的检验效能是否够大。例如,在查阅文献和借鉴前人经验时,若其假设检验的结果为P>0.05,则做出无统计学意义的“阴性"结论时,研究者则面临着犯第II类错误的可能性,应当考虑是否总体间的差异确实存在,有可能由于检验效能不足而未能把总休屮确有的差异反映岀来。目前,许多国际会议对于假设检验H«P>0.05做出的“阴性”结论,应附有犯第II类错谋的概率为据,因而有必要介绍估计检验效能的方法。例如,两样本均数比较的资料,当两样本例数和等时可用下式计算其检验效能:切2(7~U(X式屮斤为两组合计例数。(3)估计总体参数的差异(力)根据己知条件初步确定样本含量",并规定期望的检验效能为0.90,估计总体参数的茅值例如,两样木均数比较4、均衡原则1)均衡的意义所谓均衡,就是要设法使各条件(即实验I大I素的各水平组合)下的受试对象受到非处理因素的干扰和影响的机会和数量基木相等。这样以來,由各组受试对象反映出来的实验效应才能较为客观地体现岀处理因素因素取不同水平时所产生的效果。\n2)均衡对照的实施对照的一个极英重要的前提是对照必须是均衡的。贯彻均衡的原则就是对照组除了缺少一个处理因素外,其它条件应与实验组均衡一致。这就是上述对照原则屮表述的S,=S2的原则。均衡性越好,就越能显示出试验组处理因素所产牛的效应,从而可以减少非处理因素对实验结果的影响。在实验(或试验)设计中,没有对照就无法比较鉴别,有了对照没有遵循均衡原则也同样得不到正确的结论。第十四章调查设计本章大纲要求【掌握】1.调杳设计的基本内容;2.四种基本抽样方法。【熟悉】【了解】1.调查表的制定。1.调杳研究的质量控制;2.常用的调杳研究方法【重点内容详解】第一节调查研究的特点一、调查研究的特点1.研究过程屮没有人为的施加干预措施,而是客观地观察记录某些现象的现状及其相关特征;2.在调查屮,欲研究的现象及其相关特征(包括研究因素和非研究因素)是客观存在的,不能采用随机分配的方法来平衡或消除汕研究因素对研究结果的影响,这是调查研究区别于实验研究的重要特征;3.混杂因素的控制常借助于标准化法、分层分析、多因素统计分析等方法;4.调查研究多采用问卷(questionnaire)调查,容易产生误差和偏倚,应特别注意设计技巧和质量控制;二、调查设计的主要用途调杳设计乂称为横断面研究或横断面调杳或现况研究,用于了解某一特定时间横断而上特定人群屮疾病或卫牛事件的分布情况。第二节调查设计的基本原则与内容\n一、明确调查口的并将其具体化到指标。明确调查口的是调查研究各个环节屮最核心的问题。确定调查口的吋应注意是要了解总体参数述是研究相关联系。指标要精选,尽量用客观、灵敏、精确的定量指标。二、确定调查对象和观察单位。根据调查目的确沱调查对象,即要确泄调查总体及H同质范围,观察单位可为人、物、群体、地区等。三、确定并选择调查方法根据调查H的和要求确沱并选择调查方法,冇以下儿种:1.普查(overallsurvey):对总体屮所有的观察单位进彳亍调查厂般用于了解总体在某一特定“时点”上的情况,如年屮人口数、时点患病率。在医学领域的适用范围是:①发病率较高的疾病;②具有灵敏度和特异度较高的检查或诊断方法;③普查方法便于操作、易于接受;④具有实施条件。2.抽样调查(samplingsurvey):是陕学研究屮最常用的方法,是通过随机抽样(randomsampling)方法从总体中随机抽取一肚数量具代表性的观察单位组成的样本进行调查,然后根据样木信息来推断总体特征。常用的抽样方法见第—•-4-F~:|Jo3.典型调查(typicalsurvey):亦称案例调查。即对事物进行全面了解的基础上,有口的选择典型的人和单位进行调查。如调查几个卫牛先进或后进单位,用于总结经验教训。此外,流行病学屮的病例对照研究和队列研究也属于调查研究的范畴。卩1|、确定样木含量详见第13章“试验设计"和有关的流行病学书籍。五、确定资料的搜集方式1.直接观察法:直接观察、检查、测量。2.采访法:调查者直接或间接与被调查者交谈,乂分访谈、信访和开调查会三种。六、确立观察指标结合调查的实际问题,将调查口的转化为具体的调查指标。七、拟定调查项目和调查表根据调查目的拟定预期分析指标(项目),按逻辑顺序列成表格即是调查表。1.调查表和问卷的一般结构\n(1)说明部分:主要说明调查目的。(2)填写说明:详细说明填写表格的要求。(3)核杳项目:指与调杳目的无关,不向调查对象询问的质量控制项冃,如调查员姓名、调查口期、复核结果、未调查原因等。(4)调查项目:一般包括背景资料、人口学项目、研究项目三部分内容。其屮研究项目是调查的核心内容。1.问题的形式(1)开放式问题:对问题答案不加限制,由调查对象对问题自由冋答。(2)封闭式问题:根据问题可能的答案,提出两个或多个固定答案供调查对象选择。2.问题设计的一般原则(1)尽量避免医学专业术语(2)避免混淆(3)避免双重问题(4)避免诱导或强制(5)问题应适合全部调查对象并符合逻辑(6)涉及敏感问题(sensitivequestion)应采用特殊调查技术进行调查。八、制定调查的组织计划包括组织领导、时间进度、分工与联系、经费预算等。九、整理、分析计划的制定1.资料核查2.设计分组3.数据的计算机录入4.拟定整理表和分析表5.归纳汇总6.统计分法(方法选择)第三节常用的抽样方法一、单纯随机抽样(simplerandomsampling)将调查总体全部观察单位编号,再用抽签法或随机数字表随机抽取部分观察\n单位组成样木。优点:操作简单,均数、率及相应的标准误计算简单。缺点:总体较大时,难以一一编号。二、系统抽样(systematicsampling)乂称机械抽样、等距抽样,即先将总体的观察单位按某一顺序号分成n个部分,再从第一部分随机抽取第k号观察单位,依次用相等间距,从每一部分各抽取一个观察单位组成样本。优点:易于理解、简便易行。缺点:总体有周期或增减趋势时,易产牛偏性。三、整群抽样(clustersampling)总体分群,再随机抽取几个群组成样本,群内全部调查。优点:便于组织、节省经费。缺点:抽样误差大于单纯随机抽样。四、分层抽样(stratifiedsampling)先按对观察指标影响较大的某种特征,将总体分为若干个类别,再从每-•层内随机抽取一定数量的观察单位,合起来组成样本。有按比例分配和最优分配两种方案。优点:样木代表性好,抽样误差减少。以上四种基本抽样方法都属单阶段抽样,实际应用中常根据实际情况将整个抽样过程分为若干阶段来进行,称为多阶段抽样。各种抽样方法的抽样误差一般是:整群抽样3单纯随机抽样2系统抽样N分层抽样。第四节调查的质量控制一、设计阶段1.正确划分调查范围。2.尽量选取客观、明确的指标。3.明确定义调查项目。4.正确设置调查问题。5.合理选择调查方式。二、资料搜集、整理与分析阶段1.严格选择和培训调查员。2.广泛宣传,争取调查对象的配合,提高应答率。\n1.严格资料清理和检查,及时发现和更正错误。2.评价调查治疗的效度和信度。效度是指调杳工具对所调查对象测量的有效程度或准确度(真实性),即调查结果能否反映调查对象的真实情况;信度则是调查工具对所调查对彖测量的可靠程度(可靠性),即一致性。【习题】一.单项选择题:1.我国统计调查方法体系中是以必要的周期性普查为基础,以经常性的()为主体。A.重点调杳B.全面报表C.抽样调查D.科学推算2.在抽样调查时,对总体不作任何处理,按随机原则抽取调查单位的组织形式称为()。A.纯随机抽样B.系统抽样C.整群抽样D.分层随机抽样3.在购买力调查中,按收人多少由低至高排列,也可用与调查项目无关的标志为依据,如按户口册、姓名笔划多少排列,然后每隔相等距离抽样,这种抽样方法是()。A.纯随机抽样B.系统抽样C.整群抽样D.分层随机抽样4.把调查总体分为若干个群体,然后用纯随机抽样法,对抽中群的单位进行全面调查的技术是()。A.纯随机抽样B.系统抽样C.整群抽样D.分层随机抽样5.把调查总体按其属性不同分为若干层次(或类型),然后在各层(或类型)中随机抽取样本的技术是()oA.纯随机抽样B.系统抽样C.整群抽样D.分层随机抽样6.如果抽样调查的廿的是为了推断总体数值,在抽取样本单位吋必须遵守()oA.随机原则B.非随机原则C.系统性原则D.及时性原则7.在进行概率抽样时,其前提条件是要具备()oA.较多的调查人员B.充足的经费C.固定的样本数D.抽样框8.调研人员从工作方便出发,在调查对象范围内随意抽选一定数量的样本进行调查,这种抽样方法是()。A.任意抽样B.判断抽样C・配额抽样D.整群抽样9・抽签法一般用于()方法中。A.纯随机抽样B.判断抽样C.配额抽样D.滚雪球抽样10.抽样调查的主要目的在于()oA・了解总体的基本情况B.用样本指标推断总体指标C.对样本进行全面调查D.\n了解样木的基木情况二.多项选择题:1•下列关于抽样调查正确说法有()oA、它是一种非全面调查B、按照随机原则选取调杳单位C、会存在着抽样误差D、口的在于取得样木指标E、是一种全面调查2•概率抽样的类型主要有()。A.纯随机抽样B.分层抽样C・等距抽样D•整群抽样E.判断抽样3•纯随机抽样技术常用的有()。A.随机抽样B.抽签法C.随机数字表法D.非随机抽样E.判断抽样4.非随机抽样方式具体包括()。A.任意抽样B.判断抽样C・配额抽样D・滚雪球抽样E・等距抽样5・影响抽样误差大小的因素有()。A.样本容量B.总体单位Z间的特征差异程度C.抽样方式D.抽样方法E.人力、物力和财力等条件6•调查误差按产生统计误差的性质來分有()。A.空间误差B.时间误差C・制度误差D.人为误差E.方法误差7・影响样本容量大小的因素有()A.总体的变异程度B.允许误差的人小C.概率保证度D.抽样方法不同E.抽样组织方式8.人为误差是调查过程中产生因索最多的一类,它乂分为()。A.度量性误差B.知识性误差C.态度性误差D.干扰性误差E.估计误差9・重复抽样的特点是()。A.各次抽选互不影响B.各次抽选相互影响C.每次抽选时,总体单位数逐渐减少D.每次抽选时,总体单位数始终不变E.各单位被抽中的机会在各次抽选中相等10・可利用下列()办法來增大的抽样推断的概率保证程度。A、增大抽样误差范围B、缩小抽样误差范围C、增加样木数口D、缩小概率度E、增大概率度()o三.填空题:1.在医学研究中,是应用最广泛的方式。2.抽样方法主要分为两大类,即和o\n1.确定抽样框有两个要求:和o4•简单随机样常用的方法有和。1.分层随机抽样主要有两种方法:分层—抽样和分层—抽样。2.方便抽样也称为—抽样或—抽样,是指调查人员根据自己的方便选择样木的抽样方式。四•名词解释1・抽样调查1•随机原则1.抽样框2.配额抽样3.分层抽样五.简答题1•简述抽样方案设计的主要步骤。2.什么是分层比例抽样和分层最佳抽样?2•试比较整群随机抽样和分层随机抽样的异同。3•试比较配额抽样和分层随机抽样的界同。六•论述题:1.试比较非随机抽样与随机抽样方式的优缺点,并说明如何应用。2.试述互相控制配额抽样的一般步骤。七、计算题:1.调查某市居民家电普及率状况,该市高、中、低居民收入户分别为4500户、15000户、10500户,若样本数目为300户。要求:(1)用分层比例抽样法,求出高、中、低居民家庭应各产生多少样本数目?(2)若高、中、低收入户收入平均标准差分别为4、3、2,请用分层最佳抽样法,求出高、中、低居民家庭应各产生多少样本数戸?2•从某市居民小抽取300户家庭,调查居民每户月均消费副食品状况。调查表明,每户刀均副食品支岀560元,标准差为48元,求此次调查的抽样误差是多\n少?

相关文档