- 58.50 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
一、概念(英文)1.统计学(statistics):是收集、分析、解释与呈现数据资料的一门科学。2.变异(variation):是社会和医学中的普遍现象。变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。3.总体(population):是指根据研究目的确定的同质观察单位的全体4.样本(sample):是从总体中随机抽取的具有代表性的一部分观察单位实测值集合5.同质(homogeneity):是指除了实验因素外,影响被研究指标的非实验因素相同。6.参数(parameter):根据总体的分布特征而计算的总体的统计指标。7.统计量(statistic):根据样本的分布特征而计算的样本的统计指标8.抽样研究(samplingresearch):根据样本信息来推断总体特征的方法9.抽样(sampling):从总体中抽取部分个体的过程。10.样本含量(samplesize):样本包含的观察单位的个数11.随机变量(randomvariable):实验或调查研究中的观察指标;12.数值变量(numericalvariable):计量资料13.分类变量(categoricalvariable):14.计量资料(measurementdata):用定量方法对观察单位准确测量后所得的资料15.计数资料(enumerationdata):用定性方法得到的资料。按观察单位某种性质或特征分组后,再分别清点各组观察单位的个数。16.等级资料(rankeddata):将观察单位按某种属性的不同程度分成等级后分组计数所得的资料。17.系统误差(systematicerror)由于仪器不准确、标准不规范、抽样不均匀,分配不随机等原因,造成观察结果呈倾向性的偏大或偏小,可避免。18.随机测量误差(randommeasurementerror)观察者认真负责、也校准仪器,同一样品的测定值在不同观察者、相同观察者若干次观察值之间也不完全相同,可降低;19.随机抽样误差(randomsamplingerror)由于抽样所引起的样本统计量与总体参数之间的差异,不可避免。20.频率(frequency):指样本的实际发生率。21.概率(probability):是描述随机事件发生可能性大小的一个量度,取值[0,1]。22.抽样误差(samplingerrorofmean):由于抽样而引起的差异。用标准误来衡量23.概率(1-a)称为置信度(confidencelevel),a为检验水准24.可信区间(confidenceinterval,CI)是根据一定的可信度估计得到的区间。25.1-b称检验效能(powerofatest):当两总体确有差异,按检验水准a所能发现该差异的能力。1-b只取单尾。26.总变异(Totalvariation):全部测量值与总均数间的差别27.组间变异(betweengroupvariation):各组的均数与总均数间的差异28.组内变异(withingroupvariation):每组的j个原始数据与该组均数的差异29.均方(meansquare,MS):各部分离均差平方和除以相应自由度30.组间均方与组内均方的比值称为F统计量31.完全随机设计(completelyrandomdesign):采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。32.随机区组设计(randomizedblockdesign):除了处理因素外,全部的实验对象并非按完全随机化分组,而是按容易影响试验结果的非处理因素即区组因素(配伍组因素)将受试对象配成区组(block),再将各区组内的受试对象随机化分配到各处理或对照组。33.二项总体(binomialpopulation):这种非此即彼事件构成的总体34.二项分布(binomialdistribution):指在只会产生两种可能结果如“阳性”或“阴性”之一的n次独立重复试验(Bernoulli试验)中,当每次试验的“阳性”概率保持不变时,出现阳性的次数X=0,1,2,…,n的一种概率分布。35.泊松分布(Poissondistribution),可看作是单位时间、单位面积或单位容积中颗粒数或某罕见事件发生数的概率分布,是π很小、n又趋向于无穷大时二项分布的极限形式,是描述小概率事件出现规律性的一种重要的离散型分布36.参数检验:若样本所来自的总体为分布已知的数学形式(如正态分布),对其总体参数进行假设检验\n1.非参数检验:对总体分布不做严格假定,也不对总体参数进行统计推断,而是直接对总体分布的位置进行假设检验。2.秩和检验(Ranksumtest):将变量值从小到大或从弱到强转换成秩后再计算检验统计量,从而推断一个总体表达分布位置的中位数M和已知M0、两个或多个总体的分布是否不同一、应用条件和应用范围1.t检验应用条件:①小样本(n<60),且总体标准差σ未知;②样本取自正态分布的总体,;③两样本总体方差相等(σ12=σ22)。即“正态性、方差齐”。t检验应用范围:①单样本t检验;②配对样本t检验;③两样本t检验。2.方差分析的应用条件:1.各样本为相互独立的随机样本,均来自正态分布总体;2、各样本所来自的总体方差相等方差分析的应用范围:1、2个或多个均数间比较;2、分离各有关因素并估计其对总变异的作用;3、2个或多个分析因素间的交互作用;4、方差齐性检验;5、多元线性回归分析中偏回归系数的假设检验。3.二项分布的适用条件:1.各观察单位只能具有互相对立的一种结果(互斥)。2.π是从大量观察中获得的比较稳定的数值(稳定);3.n个观察单位的观察结果互相独立(独立)。二项分布的应用范围:1、总体率的区间估计;2、样本率与总体率的比较;3、两样本率的比较;4、研究非遗传性疾病的家族集聚性4.泊松分布的适用条件1、普通性:在充分小的观察单位内,X取值最多为1;2、平稳性:x的取值只与观察单位的大小有关,而与观察单位的位置无关;3、独立增量性:x取值与以前所发生的次数无关。泊松分布的应用范围:1、总体均数的区间估计;2、样本均数与总体均数的比较;3、两样本均数的比较4、Poisson分布的拟合优度检验5.c2检验的使用条件:T>5,容许T<5的格子数少于总格子数的1/5。c2检验的应用范围:1、两个及多个样本率或构成比的比较;2、两分类变量间的关联分析;3、频数分布的拟和优度检验6.非参数检验的应用范围:1、总体分布形式未知或分布类型不明;2、偏态分布的资料(非正态分布的资料);3、等级资料;4、不满足参数检验条件的资料:各组方差明显不齐5、数据一端或两端是不确定数值,配对样本比较的Wilcoxon符号秩检验:1、配对样本差值的中位数和0比较;2、单个样本中位数和总体中位数比较两独立样本比较的Wilcoxon秩和检验:1、计量资料的两样本比较;2、等级资料的两样本比较三、基本思想1、假设检验的基本思想:利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。当P小于或等于预先规定的概率值α,就是小概率事件。根据小概率事件的原理:小概率事件在一次抽样中发生的可能性很小,如果它发生了,则有理由怀疑原假设H0,认为其对立面H1成立,该结论可能犯大小为α的错误。假设检验的一般步骤:1.建立假设,确定检验水准a;2.选定检验统计方法,计算检验统计量;3.确定P值,作出推断结论假设检验的注意事项:1.当拒绝H0时,可能拒绝了实际上成立的H0,这类错误称为Ⅰ类错误(“弃真”),其概率大小用α表示。;2.当不拒绝H0时,没有拒绝实际上不成立的H0,这类错误称为Ⅱ类错误(“存伪”),其概率大小用β表示。假设检验的方法选择:①计量资料:t/u检验、方差分析、非参数检验;②计数资料:χ2检验、非参数检验2、方差分析的基本思想:根据资料的设计类型,即变异的不同来源,将全部观察值总的离均差平方和(即总变异)分解成几个部分\n(组内变异和组间变异),其自由度也分解为相应几个部分;除随机误差因素以外,其余每个部分的变异可由某个因素的作用加以解释,通过比较不同来源变异的均方(MS),计算F值,借助F分布做出统计推断,从而了解该因素对观察指标有无影响。3、c2检验的基本思想:以X2值的大小来反映理论频数与实际频数的吻合程度,在假设H0成立的条件下,实际频数与理论频数相差不应太大,即X2值不应太大。如果c2>c2a,v,则P