- 61.03 KB
- 2022-08-13 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
医学统计学基本概念1.医学统计》是以阪学理论为指导,应用概率论9数理统计的冇关原理和方法,研究供洋资料的搜集、整理、分析和推断的一门应用科学。2.统计工作的步骤:(1)设计<2)收集资料(3)整理资料(4)分析资料;或者分三步:(1)研究设计(2)资料分析(3)结论。3.定虽资料:乂称为数值变屋资料,特点:(1)各观察值之问有虽的差别;(2)数据间有连续性。它是指变屍的取值不止是可列个,而是可取某区间(a.b|,(-00,00)上的一切值。4.定性资料:又称为分类资料、分类变量资料(包括二项分类、多项分类资料),特点:(1)各观察值Z间有质的差别;(2)数据间有离散性.它定指变杲的取值有限的,至多是可列多个。附:无序分类:二项分类、多项分类5.等级资料:乂称为半定量资料,有序分类,指各类Z间冇程度的差别。特点:()各观察单位间或者相同,或者存在质的差别;(2)各等级间只冇顺序,而无数值大小,故等级之间不可度盘。6.个体individual:即每个观察单位。7.总体population:根据研究目的确宦的|iM质观察单位的全体。8.样本:是从总体中随机抽取部分观绍单位,其实测值的集合。样本包含的观察单位数称为样本含量或样本大小。9.参数parameters:描述某总体特征的统计指标称为总体参数,简称参数。如总体均数、总体标准差等。持点:参数是未知的,固冇的,不变的!10.统计量:描述某样本特征的的统计指标称为样本统计量,简称统计量。特点:统计量是已知的,变化的,有误差的!11.概率probability;是描述随机事件发生的可能性大小的数值。常用P表示。它的大小界于0和1之间。12.随机事件:(1)可重复性:相同条件下可重复进行;(2)随机性:出现两种机两种以上结果;(3)偶然性:实验前不能肯定将出现哪种结果。13.频率的稳定性:在重复试验中,事件A的频率随着试验次数的不断增加将愈來愈接近一个常数”,频率的这一•特性称为频率的稳定性。14.概率的统计定义:频率的稳定性充分说明随机事件出现的可能是事物本身固冇的一种客观属性,因而是可以被认识和度虽的。这个常数"就称为事件A出现的概率(probability),记作P(A)或P。这一定义称为概率的统计定义。它是事件A发生的可能性大小的一个度虽。容易看出,频率为一变屋,是样本统计虽,而概率为常数,杲-总体参数。实践中,当试验次数足够务时,可以近似地将频率作为概率的--个估计。15.小概率原理:当某事件发生的概率小于或等于0.05时,统计学通常称该爭件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在--次抽样屮不可能发生,此即为小概率原理。16.同质(homogeneity):性质相同的耶物称为同质的。17.变^(variation):同质的事物内个体Z间或同一个体重复测第间的差别称为变界。18.参考值范tfi|(refcrenceinterval)又称iE常值范^(normalrange),ill于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随看时间、机体内外环境的改变而变化,因此需耍确定其波动范围,I!卩正常值范围,简称正常值(normalvalue)。19.正常值范m(normalranges),是指绝大女数正常人的某指标范围。20.抽样误差(samplingerror):由于抽样造成的样本统计駅和总体参数之间的差界。21.标准误(standarderror):样本统计屋的标准差称为标准误。样本均数的标准差称为均数的标准谋。22.参数估计:由样本信息估计总体参数称为参数估计,包插点估计和区间估计。23.点估计(pointestimation):直接用样本统计虽作为总体参数的估计值。这种估计方法简单,但未考虑抽样误差的大小。24.区间估计(intervalestimation):按一定的概率或可信度(1-a)用…个区间估计总体参数所在范围,这个范围称作可信度为1-Q的可信区间(confidenceinterval,CI),乂称置信区间。这种估计方法称为区间估计。25.可信度为1-a的可信区间的确切涵义是:每100个样本所算得的lOO(l-a)%町信区间,平均有lOO(l-a)个包含了总体参数。如収«=0.05,则每KX)个样本所算得的100个95%可信区间,平均有95个包含总体参数在内,有5个不包含总体参数。26.可信区间的两个要索:第一个要索是可靠性,常用可信度l-a的大小表示:第二个耍索是粘确性,常用可信区间的长度CUCL衡昼。27.均数95%可信区间,其涵义是:如果重复100次抽样,每次样本含量均为",每个样本均按(见课本P42)构建可信区间,则在此100个可信区间内,理论上冇95个包含总体均数,而冇5个不包含总体均数。28.可信度为95%的CHI勺涵义:每100个样本,按同样方法计算95%的CI,平均有95%的CI包含了总体参数。这里的95%,指的是方法本身!而不是某个区间!29.第一类错误(I型错误):拒绝了实际上成立的H0假设,称为“假阳性”,用a來表示。30.第二类错渓(II型错谋):不拒绝实际上不成立的H0,称为“假阴性”,用B来表示。31.检验效能(powcrofatcst)或检验功效:1-0称检验效能(powerofatest),过去称把握度。为当两总体确有差异,按检验水准"所能发现该差异的能力。1-0只取单尾。32.完全随机设计:根据某一试验因素,将试验对象完全按随机设计分为若干个组,侮个组的样本例数可以相等,也可以不等,分别求出各组试验结果的均数,即为单因素多个样本均数,单个因素可以有多个水平,R>233.随机区组设计乂称配伍组设计(RandomBlockDesign):即两因素宪个样本均数的比较(或称两因索方差分析,(wowayanalysisofvariance)«34.绝对数:在计数资料中,各组的观察数称绝对数。35.相对数:是两个有联系的指标的比,计数资料的统计描述主耍是相对数(relativenumber)。36.率(rate):说明某现象发生的频率或強度,常用%、%。、1/力、1/10万等作单位,农示在一定范围内,某现線的发生数与可能发生某现線的总数Z比。率的结果常以保阳1-2位整数为宜。率二发生某现象的观察单位数xk可能发生某现象的观察单位总数\n1.构成比(consiitucninwio):说明一呻物内部各纽成部分所占的比例,常以%來表示。构成比=某一组成部分的观察单位数同一事物各部分的观察单位总数X100%2.比:也称相对比(relativeratio),两个有关指标Z比。通常以某种现象的数虽为1或1(X)作基数,看另一种现彖的数最杲多少,说明一事物足另一爭物的若干倍或百分Z儿。两个相比的指标可以性质相同,如时间比、性别比;也可性质不同。比=A/B3.秩次是折全部观察值按某种顺序排列的位序;秩和:是同组秩次Z和。4.秩变换:将等级变成秩次的方法称为秩变换。5.秩和检验:就是通过秩次的排列求出秩和,从而对总体的分布进行假设检验的方法。6.确定性关系:是指两变虽间的关系是函数关系。非确定性关系:是指两变屋在宏观上存在关系,但并未精确到可以用函数关系來表达。相关关系:指既是必然的乂是不确定的关系称为相关关系。当两个变虽之间出现如下关系,一个增大,另一个也同时增大,或缩小,我们称这种现彖为共变,也就是说两个变最Z间有相关关系。相关关系不一定杲因果关系。相关关系町以定因果关系,也可以是伴随关系。7.直线相关系数:简称为相关系数,用符号r表示,是用于说明具有直线关系两个变量Z间,相关关系的密切程度和相关方向的指标。8.等级相关的含义:等级相关反帙的是两变量等级间的相关,并不反映两变量间的数值关系。9.直线相关:这种直线关系,或分析这种直线关系的理论和方法,统称为直线相关。10.直线回归:直线回归是用于研究两个变虽x与y之间的线性依存关系的一种统计分析方法。11.试验研究设计:是指研究者根据研究目的、通过对受试对象施加F预,严格控制各种影响因索,获得干预研究结果。12.双盲临床试验:是指观察者方和彼观察者方存整个试验过程中不知道受试者接受的是何种处理;单旨临床试验是指仅被观察者方处F盲态。观察者方指的是研究者、参与试验效应评价的研究人员、数据管理人员、统计分析人员;被观察者方拆的是受试对象及其亲屈或监护人。双自-双模拟:试验组:试验药+阳性对照药的安慰剂;对照组:阳性对照药+试验药的安慰剂。医学统计学相关知识1.频数分布表的用途:(1)看出频数分布的两个重要特征:集中趋势、离散趋势(2)揭示资料的分布类型2.描述定量资料集中趋势的三个指标及瓦应用条件:(1)均数(也称算术肉数):适用于单峰对称分布的资料;(2)几何均数:适用于等比资料、对数正态分布资料:(3)中位数:适用于偏态分布资料、分布不规则或未知分布资料、一端或两端有不确定数据(开口资料)的资料。3.描述定虽资料离散程度的指标(极差、四分位数间距、标准差、变异系数)及其适用范围:这四个指标均反映定虽资料的离散程度。极差和四分位数间距可用于任何分布(极差常用于描述单峰对称分布小样本分布资料的变界程度,或用于初步了解资料的变界程度:四分位数间距常川丁•描述偏态分布诜料、两端无饰切值或分布不明确资料的离散程度),后者比前者•稳定,但均不能综合反映各观察值的变界程度;标准总最常用,要求俊料近似服从止态分布;变界系数i'JJJJT-比较度就单位不同的两组或参组资料的变井度或均数相差悬殊的两组或多纽资料的变界度。4.正态分布的特征:(1)正态分布是一单峰分布,高峰位置在均数处;(2)正态分布以均数为中心,左右完全对称:(3)正态分布取决于两个参数,即均数p和标准差6卩是位置参数,卩越大,则曲线沿横轴向右移动;p越小,曲线沿横轴向左移动。o为形态参数,表示数据的离散程度,若o小,则曲线形态“瘦髙”:。大,则曲线形态“矮胖”。(4)有些指标不服从正态分布,但通过适当的变换后服从正态分布:(5)正态分布曲线下的面积分布是冇规律的。5.正态曲线卜-的面枳规律・正态曲线下面积总和为1;正态曲线关丁•均数对称;对称的区域内面枳相等;・对任意正态曲线,按标准差为单位,对应的面积相等://-1.64O—//+1.640-内而枳为90%;•”1.96(r~“+1.96cr内而枳为95%;//-2.58ct//+2.58•小于”3o■的面枳为0.13%;小于片2o•的而积为2.28%;小于的面积为15.87%。6•标准误与标准差的关系区別标准差$标准误5X意义个体变异统计量的抽样误差用途正常值范围(x±1.965)总体均数的可信区间(x士ra,vsx)与n关系nts趋于稳定n?sx趋于0联系1•两者都是变界指标,说明个体乙间的变界用标准差,说明统计敏之间的变界用标准论2.当样本倉量不变时,标准差大,标准误亦大,均数的标准差与标准谋成正比。7.F列说法正确吗?算得某95%的町信区间,贝IJ:总体参数有95%的可能落在该区间。(错)有95%的总体参数在该区间内。(错)该区间包含95%的总体参数。(错)该区间有95%的可能包含总休参数。(错)该区间包含总体参数,可信度为95%.(对&影响可信区间大小的因索:(I)可信度:可信度越大,区间越宽;<2)个体变异:变界越大,区间越宽:(3)样本含虽:样本含虽越大,区间越窄。\n9•均数的可信区间和参考值范曲的区别区别可信区间参考值范围意义未知参数的可能范出正常值的波动范出公式b已知或b未知,但n足够人:(x±"a/2』x)或(x±/yat!(x±maf2,sx)g未矢l【(x±ta.vsx)用途估计总体均数判断正异常小结:均数的可信区间:均数土界值X标准谋个体的容许区间(参考值范川):均数土界值X标准差10.可信区间与容许区间的区别:见P4411.假设检验的基本思想:・提出一个假设(川));验证这个假设。如果假设成立,会得到现在的结果吗?两种可能的情况:<1)得到现在的结果可能性很小(小概率)一拒绝〃()(2)有可能得到现在的结果(不是小概率)一没冇理山拒绝〃()假设检验的步骤:(1)建立检验假设;(2)确定检验水准“;(3)计算检验统计量并求P值(5)界定P值并作结论。12.1型错谋和II型错谋实际情况假设检验的结果拒绝H0不拒绝H0H0成立1型错误(a)H0不成立把握度(1-卩)n型错谋(卩)13.差异检验和优度检验:差异检验之意义在于是否能够确认H1成立,故希望所得P值很小,因为P值越小,表示手头样本从总体随机获得之概率越小,即否定H0而确认H\成立的把握越大。优度检验Z童义在于是否能够确认H0成立,故希望所得p值较大,因为p值越大,表示手头样本从H0总体随机获得之概率越大。14.可信区间与假设检验区别和联系:可信区间说明盘的大小即推断总体均数范也,假设检验推断质的不同即判断两总体均数是否不等;可信区间可回答假设检验问题,可信区间若包含了11(),按a水准,不拒绝110;若不包含11(),按a水准,拒绝110,接受III;可信区间不但能回答差别有无统计学意义,还能提示差别有无实际专业意义;可信区间不能够完全代替假设检齡。可信区间只能在预先规定概率a的前提下进行计算,假设检验能获得-较为确切的P值。15•下列说法正确吗?・P是H0成立的概率。(错)P是I型误差的概率。(铀)P是H0成立时,获得现有差别的概率。(铀)・P是N0成立时,获得现有差别以及更大的差别的概率。(对)统汁推断时的风险。(错)拒绝H0时所冒的风险。(对)16.(检验的应川条件:(1)独立性:各观察个体间是相互独立的,不能互相影响,亦不能一方影响另一方:(2)正态性:两组均数比较时,耍求两组数据服从正态分布:配对设计时,耍求差值服从正态分布。(3)方差齐性:两样本所对应的正态总体Z方差相等。17•总体方差不相等的/检验:(1)数据变换后进行r;(2)秩转换的非参数检验;(3)近似/检验一F检验。18.两样本均数比较方法的选择方差齐方差不齐小样本r检验广检验大样本“检验"检验19.方差分析的基本思想:方差分析(analysisofvariance)X称为变异数分析,采用F检验统计量,也称F检验。这种方法的基木思想是对变异进行分解和分析,把全部观察值Z间的变异-总变异,按照设计和需要分为两个或多个纽成部分,再作分析,从而达到统计推断Z目的。总变异二组内变异+组间变异;组内变异:抽样(随机)误差(个体差异和测最误差):组间变异:组间本质差别+抽样(随机)误差;如果组间无本质差别,则组间变并=组内变异或F=小』Between_MS\伽加20.方差分析的优点:(1)不受比较组数的限制;(2)可同时分析多个因素的作用;(3)可分析因素间的交互作用。21.方差分析的意义:是按照实验设计把总变杲分成若干部分,划分得越细,各部分的涵义越明确,对结论亦较易解释;同时,残余的变界即误差部分越小,因而能够提高检验的灵敏度和结论的准确性。22.F分布是方差比的分布,常用于方差齐性检验,方差分析等。F分布特征:(I)F分布为一簇单峰正偏态分布曲线,与两个白由度有关。⑵若F服从白由度为(vi,⑵的F分布,则其倒数1/F服从自由度为(v2,yl)的F分布。⑶自由度为(刃,说)的F分布,其均数为血/(辺-2),与第一自由度无关。(4)第一白由度刃=1时,F分布实际上是『分布Z平方:第二口由度也=8时,F分布实际上等于才2分布。⑸每一对自由度下的F分布曲线下的血积分布规律,见方差分析用F界值表,表中横标口为第一自由度,纵标目为第二自由度,表中分别给出了右侧尾部概率为0Q5和0.01时的F界值。\n23•方差分析农变异來源SSVMSFP组间SS组间kJSS组间“组间MS组间/MS组内组内SS组内N・kSS纽内/i呦内总SS总NJ24•方差分析与t检验的关系当比较两个均数时,从同一资料算得ZF值与I值有如下关系:F=12可见在两组均数比较时,方差分析与t检验的效果是完全一样的。25.方差分析麻的两两比较③巫比较)的儿种方法:一、SNK-q检验(多个均数间全曲比较)二、LSD-t检验(有专业意义的均数间比较)三、Dunnett检验(多个实验组与对照组比较)还有TUKEY、DUNCAN、SCHEFFE,WALLER、BON等比较方法各组间的比较用SNK法;各试验组与某一对照组间的比较用Dimnet法。26.方差分析应用条件:①%样本是相互独立的随机样本;②各样本來自正态总体③各组总体方差相等,即方差齐・方差分析和I检验要求:独立性、正态性、方差齐性。27•总结:均数、方差的比较:样木均数与总体均数的比较(z检验)配对设计样本均数的比较(配对f检验)两样本均数的比较(t检验.“检验,F检验,SNK.Duncan)多样本均数的比较(F检验,4NOE4)・各组间的比较(SNK法);各试验组与某一对照组间的比较}\\(Duncan法)两个方差的比较(卜'检验)多个方差的比较(Bartlett检验28.二项分布应用条件:医学领域冇许多二分类记数资料都符合二项分布(传染病和遗传病除外),但应用时仍应注意考察足否满足以下应用条件:(I)每次实验只有两类对立的结果;如阳性或阴性、生存或死亡,不允许考虑“可疑”等模糊结杲,属于二项分类的资料。<2)n次寧件相互独立;即毎个观察单-位的观察结果不会影响到其它观察单位的结果。如要求疾病无传染性、无家族聚集性等。(3)每次实验某类结果的发生的概率是一个常数。已知发生某一结果(如阳性)的概率为n,其对应的概率必然是(1-n),我们知道总体率般杲未知的,在实际工作中要求n是从大量观察中获得的比较稳定的数值。29.二项分布的应用:(】)样本率与总体率的比较;(2)两样本率的比较。30.Poisson分布特征:①非对称,但P增大时趋于对称;②均数与方差均为P;③分布的可加性,n个独立的Poisson分布相加仍符合Poisson分布,可使u>20,使得可用正态近似。31.Poisson分布应用条件:(1)平稳性:X的収值与观察用位的位置无关;(2)独立增盘性:在某个观察单位X的収值与前面各观察单位上X的取值独立.;(3)普通性:在充分小的观察单位上X的取值最名为1。32.Possion分布的应用:(1)总体均数佔计:(2)样本均数与总体均数的比较:(3)两样本均数的比较。33.x2检验的用途:(I)推断多个总体率Z间有无差别(2)推断儿组总体构成比Z间冇无差别(3)两个变量Z间有无关联性(4)频数分布的拟介优度检验。34.x2检验的基木思想:x2=一C如果H0假设成立,那么实际频数与理论频数应该比较接近。如果实际频数与理论频数相差很大,超出了抽样误差所能解释的范围,则可认为H0假设不成立,即两样本对应的总体率不等。x2ff£反映了实际频数与理论频数吻合的程度。如杲两总体率相同的假设成立,则实际频数与理论频数Z差异纯系抽样误差所致,故一般不会很大,x2值也就不会很大:在一次随机试验中,出现大的X2值的概率P是很小的。因此,若根据实际样本资料求得一个很小的P,且PWa(检验水准〉,根据小概率原理,就有理由怀疑H0假设的真实性,因而拒绝它:若P>a,则没有理由拒绝HO。X2值的衣小除取决于IA-TI的差值外,还与基本数据的格子数有关,严格地说是与自III度有关。在x2检齡中,自曲度指在表中周边合计不变的前提下,基本数据可以自由变动的格子数。35.x2检验的粘髓:检验实际频数和理论频数的吻合程度。如來实际频数和理论频数越吻合,说明H0假设成立的可能性就越大,反Z,如果实际频数和理论频数相差越远,说明H0越不可能成立。36•普通四个表资料卡方检验公式的选用条件:I)心40,且TM5时,用未校正的值\n_(ad—be)1n(a+")(c+d)(a+c)(Z>+〃)JA-T-0・5j/CT2)1WTV5,且心40时,宜用校正x2值Z2^ad-bc-n/2^(a+b\c+d比+c^b+d)3)T50mg”等。45•秩和检验的适用范围:(1)等级资料;(2)定量资料,但数据的某一端或两端无确定数值(开口资料):(3)定量资料,但数值的分布是极度偏态的,如L形分布,或个别数值偏离过大而不属于“过失谋差”者:(4)定量资料,但各纽离散程度相差悬殊,即便经变量变换,也难以达到方差齐性:(5)定量资料,但分布型尚未确知,此时可先用秩和检验法进行分析;(6)兼有等级和定量性质的资料。46.秩和检验的优缺点:优点:⑴不论样木所来自的总体分布的形式如何,英至是未知的,都能适用。⑵某些非参数方法计算简便。因此在急需获得初步结果时可采用。(3)易于理解和掌握。⑷可用于不能或未加精确测蚩的资料,如等级资料或某些记数资料。缺点:⑴对适宜用参数方法的资料,若用非参数法处理,常损失部分信息,降低效率。⑵虽然许紡非参数法计算简单,但不少问题的计算仍嫌緊兀。47.样本的相关系数r的特征:(1)-1WrW1,没有单位;(2)厂的绝对值大小表示相关关系的密切程度;(3)I■的符号表示和关的方向:r>0为正相关;r<0为负和关:r=0为零相关或无相关48.回归系数和回归方程的意义及性质:£=G+bx(1)b的惫义:回归系数b称为斜率,表示自变鼠増加一个单位时,应变量的平均改变虽。(2)a的意义:a为截距或常数项,a的值表示当X=0时,应变量Y的估计值。从坐标轴上看,a对应回归直线延伸至X=0时与Y轴的交点,故称为截跖,(3)(Y-hat)的意义:"Y表示给定X时Y的平均值的估计。"Y的涵义是均数一不同X时Y均数的估计值,与一般的均数的计算方法不同,这里的均数是给定X的条件下,由回归方程估计得到的,故又称为条件均数。(4)Y-*Y的惫义:Y-3称为剩余,乂称残差,是Y的观察值与对应的估计值之差,在回归图中表示各散点到回归直线的纵向距离。(5)艺}(/一/腮:义:称为残差平方利(residualsumofsquares)或剩余平方和,是所冇剩余之平方和,综合表示点距直线的距离。在所冇的直线中,回归直线的残差平方和是最小的。(嚴小二乘)49.回归直线的有关性质:(1)直线通过均点(牙,Fj(2)直线上方齐点到直线的纵向距离之.和=直线下方各点到直线的纵向距离Z和即:-r)=o(3)各点到该回归线纵向距离平方和较到其它任何宜线者为小。工(y—廿=那—(a+0X)j50.应变屋Y的总变异分解:\nSS总=ss回+ss剩决定系数v总=v回+v剩•y回=1>v剩=口・2。46.直线回归中三种假设检验间的关系:在宜线回归屮,相关系数的假设检验,回归系数的假设检验,以及回归方程的方差分析结果等价。47.刈勺可信区间与Y的容许区间:町信区间是针对条件均数的.而容许区间是针对Y的取值范国的。容许区间估讣:给定X时Y的估计值是Y的均数的一个估计。给定X时丫值的容许区间是Y值的可能范围。48.回归方程的应用:(1)描述两个变量间的依存关系。(2)利用回归方程进行预测。(3)利用回归方程进行估计。(4)利用回归方程获得更高精度的参考值。(5)利用回归方程进行控制。49.应用直线回归的注意点:(I)•回归分析要有实际意义:・要有实际意义;充分利用散点图,判断:(I)线性趋势(2)离群值・当样本含虽较大时,统计学检验的作用减弱;回归关系可以内插,不宜外延;・自变显的选择:原因容易测虽的变异小的年龄、身高、体垂、体表面积(2)在作回归前应先作散点图(3)内插和外延50.回归分析的正确应用:•回归系数是有单位的,不能根据b的大小判断回归关系的密切程度。•应用条件(LINE):(1)线性(linear)(2)独立(independent)⑶给定X时,Y正态分布(normal)⑷等方差(equalvariance)*51.直线回归分析和相关分析的区别与联系:(1)区别:在资料要求上:回归要求因变虽Y服从正态分布,X是可以梢确测鱼和严格控制的变虽,般称为I型回归;相关要求X和Y均服从双变虽正态分布,称为II型冋归。在应用上:说明两变量的依存变化的数駅关系用冋归,说明变量间相关关系用相关。(2)联系:1)对一组数据同时计算r和b,它们的正负号一致,r为+说明两变量间相互关系是同向的,b为+说明X增一个单位,Y平均増b个单位。2)I•和b的假设检验是等价的。52.研究设计的定义:在进行科学研究时,对研究方案作合理的安排,以减少随机误差的影响。采用适当的研究试验次数,减少试验的成本并能对数据进行有效的分析,提髙研究试验的可恭信,从而实现研究目的。研究设汁的作用:(1)合理安排试验因素,提高研究质量。(2)控制误差,使研究结果保持较好的稳定性。(3)通过较少的观察例数,获取尽可能丰富的信息。53.研究设计包抵专业设计号统计设计两个部份。统计设计主要是依据研究口的,从研究的现况条件出发,规定研究因索、选择效应指标、确定研究对象的引入方式方法和规模,拟实施的方法、方案,及数据收集、整理分析的模式,直至结杲的解群,进行系统的安排,使其消耗最少的人力和物力、时间,而获得可靠的信息与结论.54.研究设计的形式:在医学研究屮,根据观察者是否主动施加干预而分为两类:干预研究设计(试验研究)(类型:试验研究设计、临床试验设计、社区干预试验设计)、观察研究设计(调査研究)研究设计的形式:前瞻性与回顾性试验研究与调査研究(前瞻性试验研究前瞻性调査研究回顾性试验研究回顾性调査研究)61.实验设计的特点:(1)研究者能人为设置处理因索(2)受试对象接受何种处理因索/水平是由随机分配而定的。(3)能使第种实验因索包扌古在较少次数的实验中,更有效地控制误差,达到高效的冃的。62.研究因索与混杂因素:研究因素:主要研究指标,与研究结果(效应)相联系。混杂因索:干扰研究结果的指标。常见的混杂因素:年龄、性别;病程、病情;疾病史、家族史、伴发疾病对混杂因素的处理:(1)采用良好的设计:排除,平衡;<2)设计时考虑:改为修饰因素。63.实验设计(实验研究)的基本要素、基本原则、基本内容、步骤、常用的实验设计方法、实验设计对照的形式:基本要索:处理因素、受试对象、实验效应呈本原则:对照(均衡性)、重复(可靠性)、随机(客观性)基本内容和步骤:(1)建立研究假设(立题):(2)明确研究范围(应有严格的纳入标准和排除标准):(3)确立处理因素(分淸处理因素和非处理因素,并注意处理因索的标粧化);(4)明确观察指标(实验效应);(5)控制误差和偏倚。常用的实验设计方法:(1)随机化分组方法;(2)完全随机分组方法:(3)配对设计;(4)配伍组设计及随机分组方法。实验设计对照的形式:(1)空白对照;(2)安慰剂对照:(3)实验对照;(4〉标准对照;(5)H身对照。