- 53.50 KB
- 2022-09-01 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
生物统计学1、参数与统计量参数,是指从总体中计算所得的用以描述总体特征的数值,是反映总体基本情况的特征数。如:总体平均数、总体标准差。统计量,是指从样本中计算所得的数值称为统计量,是反映样本基本情况的特征数,一定程度上是对总体参数的估计值。如:样本平均数、样本标准差。2、标准差与变异系数标准差和变异系数都是反映离散性的特征数即变异数中的一种。标准差有总体标准差和样本标准差之分:б=、S=。标准差的大小受多个变量影响,若各变量间差异大标准差也大。标准差的值较大时,的代表性受到削弱。要用标准差比较两个或两个以上样本间的变异程度时,必须满足:标准差相近似,且单位相同。变异系数是度量数据资料变异程度的常用指标。变异系数CV=×100%,是样本变量的相对差异量,是为不带单位的纯数。变异系数CV可比较多个样本的变异系数。3、精确性与准确性准确性也称准确度,是指测定值与真值的符合程度大小。精确性也称精确度,是指多次测定值的变异程度。4、单侧检验与双侧检验双侧检验是指进行假设检验时将拒绝性概率分置于理论分布的两侧。备择假设为HA:(或)。单侧检验是指进行假设检验时将拒绝性概率分置于理论分布的一侧。备择假设为HA:(),或:()5、假设检验的两类错误若H0是真实的,经过假设检验却否定了它,则犯了一个否定真实假设的错误—即第一类(Ⅰ类)错误,亦称“弃真”。犯第一类错误(“弃真”)的概率即为显著性水平α。若H0不是真实的,经过假设检验却接受了它,则犯了一个接受非真实假设的错误—即第二类(Ⅱ类)错误,亦称“纳伪”。犯第二类错误(“纳伪”)的概率为β。当样本含量相同时,显著性水平α↓,则β↑;反之,β↓,则α↑。6、比较五个样本平均数的差异显著性时,检验用什么方法,为什么?\n若用t检验对四个样本进行平均数差异显著性检验时,分别对两个样本进行差异显著性检验,结果会产生较大误差,提高了犯第一类错误的概率。假设每次比较所确定的检验水准α=0.05,则每次检验拒绝H0不犯第一类错误的概率为1-0.05=0.95。比如对五个样本进行t检验,需比较次,那么10次检验都不犯第一类错误的概率为(1-0.05)10=0.5990,而都拒绝H0时犯第一类错误的概率为。故比较多个样本平均数时不适用于t检验,而用方差分析可有效地控制第一类错误。用方差分析比较四个样本的平均数差异显著性检验时,按照变异原因的不同,将测量数据资料的总变异分解成处理效应和试验误差,通过比较各种原因在总变异中所占的重要程度,并作出其数量估计。方差分析比t检验运算简便,也比t检验更为精确。7、独立事件和概率的乘法原则独立事件,是指两事件A与B中任一事件的发生不影响另一事件发生的概率。乘法原则,指两个独立事件积的概率等于此两事件概率的积。即:P(A×B)=P(A)×P(B)。乘法原则的几何意义指两个独立事件A与B同时发生的概率。8、成组数据与成对数据对两个样本进行平均数的假设检验时,其数据分成组数据与成对数据两类。成组数据,是指两样本的各变量是从各自总体中抽取的,两变量彼此独立,没有任何关联。成组数据中两个的样本容量可以相同也可以不同。但即使n1=n2=n,也不能将其视为“成对数据”进行检验。因为,成组数据中每组的每一个变量都是独立的,没有配对的基础。成对数据,是指两样本间配偶成对,每对除随机地给予不同处理外,其他试验条件尽量一致。成对数据中两个样本对象供以试验的条件非常接近,且n1=n2=n。而不同配对间的条件差异可以经过配对间的差数而予以消除,故可以控制实验误差,具有较高的精确度。1、非放回式抽样与放回式抽样为了解总体的基本情况和规律,从总体中随机抽出来的若干个个体的过程,称为随机抽样。根据是否放回总体,随机抽样即可分为非放回式抽样与放回式抽样。因为生物领域中许多研究对象的珍贵性和不可补偿性,随机抽样时常用放回式抽样。而针对生物领域中研究对象的来源丰富和反复补偿性,随机抽样时常用非放回式抽样。2、总体与个体总体是指同质研究对象的全体,也就是我们所指事件的全体。个体=构成总体的基本单元。按照总体单位的数目分为有限总体和无限总体。样本是指在实际工作中,研究总体时被随机抽出的若干个体组成的单元称为样本。样本个体数目的大小为样本含量。分小样本和大样本。3、置信水平与显著性水平\n生物统计学将拒绝H0的概率称为显著性水平,也即拒绝H0的界限。α常取0.05,0.01。置信水平指对总体参数进行区间估计时的概率水平,置信水平等于p=1-α。显著性水平与置信水平之和等于100%。4、互不相容事件和概率的加法原则互不相容事件,是指在一次随机试验中,事件A与事件B不可能同时发生。加法原则,指两个互不相容事件A与B和事件的概率等于此两事件概率之和。即:P(A+B)=P(A)+P(B)。概率加法原则几何意义指两个互不相容事件A与B至少有一个发生的概率。5、正态分布的特征正态分布属于连续型随机变量的理想分布。分布状态为中间多、两头少、左右对称。正态分布的特征为:①正态分布是以为中心的分布曲线;②正态分布是(以为中心)两侧对称的分布曲线;③确定曲线位置,确定正态分布的形状,愈大,曲线图像则愈扁平;④正态分布的概率密度曲线与渐近线、x轴三者所围成的全部面积必等于1,左右各半为0.5;⑤正态分布是一个曲线系统。6、小概率原则小概率原则是指:一个小概率事件在一次随机试验中出现是几乎不可能的。小概率原则是假设检验所依据的基础。假设检验是分析在H0条件下,随机抽样误差出现的概率有多大,是否会出现小概率事件。若出现小概率事件,则拒绝H0,接受HA;若不出现小概率事件,则接受H0,拒绝HA。小概率α常取0.05,0.01。7、假设检验假设检验,是指建立在对总体的统计假设和小概率原则的基础上,根据样本确定接受(肯定)还是拒绝(否定)统计假设的推断方法。统计假设是一对对立假设:H0、HA。H0(零假设):样本是来自某假设总体参数值的一个随机样本。而HA(备择假设)是处理作用所致。3、算术平均数与中位数平均数是指反映同类数据变量的平均水平和集中趋势的统计指标,是反映数据资料集中性的代表值。包括算术平均数、中位数、众数等。算术平均数等于:===中位数Md指数据变量依大小顺序排列后,处在中间位置的观测值。8、变量间的因果关系与平行关系变量间的相关关系可分为两类:即因果关系与平行关系。\n因果关系,是指一个变量的变化受另一个变量或几个变量的制约。如微生物的繁殖受温度、湿度、光照等因素影响。此时一般使用回归来研究。平行关系,是指两个以上变量之间共同受到另外因素的影响。如人的身高与体重之间的关系,兄弟身高之间的关系等等。此时只能使用相关来研究。用回归时,表明两变量间关系属于因素关系,自变量无随机误差,应变量有随机误差。用相关时,表明两变量为平行关系,只能用相关来进行研究。1、频率与概率频率是指某事件A在n次重复试验中发生m次。频率W(A)=m/n,有(0≤W(A)≤1)。概率是指某事件A在n次重复试验中发生m次,当实验次数n不断增大时,事件A发生的频率W(A)就越来越接近于某一确定值p,则(定义)p为事件A发生的概率。记为P(A)=P。概率性质为:0≤P(A)≤1;必然事件的概率:P(A)=1;不可能事件的概率:P(A)=0。2、标准正态分布和正态分布的区别和联系正态分布记为。标准正态分布是正态分布中的一种,具备所有正态分布的特征。标准正态分布中:令(或)。标准正态分布为的正态分布,计为N(0,1)。面对正态分布的统计数据时,常常将正态分布的统计数据转化成标准正态分布的统计数据后进行计算和分析。3、F检验与t检验的区别t检验和F检验均是平均数的差异显著性检验的两种方法,但前种方法仅是两个平均数的差异显著性检验,而后者是多个平均数差异显著性检验。4、总体的标准差与样本的标准差标准差是反映数据资料离散性的特征数。总体的标准差:S=样本的标准差:б=