生物统计学 (2) 7页

  • 40.42 KB
  • 2022-08-13 发布

生物统计学 (2)

  • 7页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
生物统计学名词解释:1.生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。2.总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全体;3.个体:组成总体的基本单元称为个体;4.样本:从总体中抽出若干个体所构成的集合称为样本;5.样本容量:样本中所包含的个体数目称为样本容量。6.集中性:资料中的观测值从某一数值为中心而分布的性质。7.离散性:是变量有差离中心分散变异的性质。8.变量(变数):指相同性质的事物间表现差异性或差异特征的数据。9.常数:表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。10.参数:描述总体特征的数量称为参数,也称参量。常用希腊字母表示参数,例如用μ表示总体平均数,用σ表示总体标准差;11.统计数:描述样本特征的数量称为统计数,也称统计量。常用拉丁字母表示统计数,例如用表示样本平均数,用S表示样本标准差。12.效应:通过施加试验处理,引起试验差异的作用称为效应。效应是一个相对量,而非绝对量,表现为施加处理前后的差异。效应有正效应与负效应之分。13.互作(连应):是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效应(协同作用)与负效应(拮抗作用)之分。14.准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。15.精确性:也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。16.随机误差(抽样误差):这是由于试验中无法控制的内在和外在的偶然因素所造成。随机误差越小,试验精确性越高。17.系统误差(片面误差):这是由于试验条件控制不一致、测量仪器不准、试剂配制不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的。系统误差影响试验的准确性。只要以认真负责的态度和细心的工作作风是完全可以避免的。18.试验误差:在试验过程中,由于试验条件及人为的一些因素而造成的试验结果与真实值之间的偏差,来源于试验材料固有的差异和外界因素(管理措施、试验条件等)。19.数量性状:是指能够以计数和测量或度量的方式表示其特征的性状。20.质量性状:是指能观察到而不能直接测量的性状21.次数资料:由质量性状量化得来的资料叫做次数资料。22.试验:是对已有的或没有的事物加以处理的方法。23.大数定律:是概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。主要内容:样本容量越大,样本统计数与总体参数之差越小。24.泊松分布:是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布,也是一种离散型随机变量的分布。25.假设检验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,7\n作出在一定概率意义上应该接受的那种假设的推断。1.自由度:在统计上指样本内独立而能自由变动的离均差的个数。2.成组数据:如果两个样本的各个变量是从各自总体中随机抽取的,两个样本之间的变量没有任何关联,即两个抽样样本彼此独立,则不论两样本的容量是否相同,所得数据皆为成组数据。3.成对数据:将性质相同的两个样本(供试单位)配偶成对,每一对除随机地给予不同处理外,其他试验条件应尽量一致,以检验处理的效果,所得的观测值称为成对数据。4.成组资料:相比较两个样本的各个变量不存在一一对应关系,两个样本容量可以相等,也可以不相等。(非配对资料)5.成对资料:相比较两个样本的各个变量存在一一对应关系,两个样本容量是相等的。(配对资料)6.第一类错误:由于二项总体的百分数(频率)是由某一属性的个体计算来的整数,所以是离散型的。当样本不太大时,把它当作连续型的近似正态总体来处理,结果会有些出入,容易发生第一类错误。7.α错误(I型错误、弃真错误):如果H0正确,测验结果却否定H0(α=0.05易犯α错误,接受区域小,否定H0,接受区域大)8.β错误(II型错误、纳伪错误):如果H0不正确,测验结果却接受H0(α易犯β错误,接受区域大,否定H0,接受区域小)9.χ2检验:对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。χ2检验就是统计样本的实际观测值与理论推算值之间的偏离程度。10.适合性检验(吻合度检验):指测验观察的实际次数与某种理论次数是否相符的测验。11.独立性检验:研究两个计数资料间是否互相独立的测验【H0:独立(不相关)HA:不独立(相关)】12.同质性检验:在连续型资料的假设检验中,对一个样本方差的同质性检验,也需进行χ2检验。13.方差分析:又叫变量分析,它是用以检验两个或多个均数间差异的假设检验方法。它是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸。14.回归模型:相关关系的一种理论模型,两个变数X与Y有因果关系,即有自变数和依变数的区分,X没有误差或很小,Y不可能避免的存在着差异。15.相关模型:两变数间X与Y无因果关系,即无变数和依变数之分,二者同时受到另一个或另一些变数的影响而发生某种程度的协同变异,二者都有随机误差。16.试验指标:为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。常用的试验指标有:身高、体重、日增重、酶活性、DNA含量等等。17.试验因素:试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上因素对试验指标的影响时,则称为两因素或多因素试验。18.因素水平:试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如研究3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素的3个水平。19.试验处理:事先设计好的实施在实验单位上的具体项目就叫试验处理。如进行饲料的比较试验时,实施在试验单位上的具体项目就是具体饲喂哪一种饲料。7\n1.试验单位:在实验中能接受不同试验处理的独立的试验载体叫试验单位。一只小白鼠,一条鱼,一定面积的小麦等都可以作为实验单位。2.重复:在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪,就说这个处理(饲料)有4个重复。3.多重比较:统计上把多个平均数两两间的相互比较称为多重比较。4.因素:也叫因子,是指对试验指标有影响,在研究中加以(控制)考虑的试验条件。5.水平:每个因素的不同状态(从质或量方面分成不同的等级)6.主效应:由于因素水平的改变而引起试验指标观测值平均数的改变量称为主效应。7.互作效应:在多因素试验中,一个因素的作用要受到另一个因素的影响,表现为某一因素在另一因素的不同水平上的简单效应不同,这种现象称为互作效应。8.谐变关系:在实际研究中,事物之间的相互关系涉及两个或两个以上的变量,只要其中的一个变量变动了,另一个变量也会跟着发生变动,这种关系称为谐变关系。9.正态分布的特征:①x=μ时,f(x)值最大,正态分布曲线以平均数μ为中心的分布。②x-μ的绝对值相等时,f(x)也相等,正态分布密度曲线以μ为中心向左右两侧对称。③f(x)是非负函数,以x轴为渐近线,x的取值区间为(-∞,+∞)。④正态分布曲线由参数μ,σ决定,μ确定正态分布曲线在x轴上的中心位置,σ确定正态分布的变异度。⑤正态分布曲线在x=μ±σ处各有一个拐点,曲线通过拐点时改变弯曲度。⑥分布曲线与x轴围成的全部面积为1。填空:1.在五种不同饲料对仔猪增重效果影响的研究中,试验指标为增重量,试验因素为饲料种类,试验处理为5种饲料。2.对于一个特定的总体而言,其参数是固定的,而统计数随样本的不同而改变。3.实验资料的类型分为数量性状资料、质量性状资料、等级资料。前者又包括计数资料(非连续变量资料)和计量资料(连续变量资料)。4.计量资料的整理方法:求全距、确定组数、确定组距、确定组限及组中值、归组划线计数,作次数分布表。5.统计表编制的总原则:结构简单、层次分明、内容安排合理、重点突出、数据准确、便于比较和理解分析。6.试验误差是衡量试验准确度的依据,误差小的表示准确度高,误差大表示准确度低。7.统计推断包括两部分内容:统计假设和参数估计。8.通常情况下,描述连续性资料(计量资料)时用直方图、折线图(多边形图),描述非连续性资料(计数资料)时用条形图、饼图。9.任意一个变数的分布都有两个基本特征集中性、分散性,表示这两个数的统计数算术平均数、标准差。10.平均数表示变数的集中特征,标准差表示变数的离散特征。11.在比较两个变数变异时用变异系数,采用随机单位组设计,单位组可集中可分散。12.在比较两个性质不同,单位不同,平均数大小各异的样本变异度时,应该采用变异7\n系数比较,而不采用标准差比较。1.t分布有自由度df决定,当df越大时,t分布差异越小,决定t分布参数为V0。2.F分布随自由度不同而不同的一组曲线,取值区间,Fα读作显著水准为α时的F临界值。3.正态分布曲线共有2个拐点。4.一个正态分布以参数平均数μ确定了它的中心位置,σ确定了它的变异度5.标准正态分布表示为N(0,1)。6.如果变量X是一具有平均数μ,方差σ2的正态分布,则样本平均数的分布为:7.二项分布是间断性变数的理论分布;正态分布是连续性变数的理论分布。8.二项总体的平均数μ=p,方差σ2=pq9.二项总体百分数在性质上是属间断性变异,其分布是间断性二项分布。因此如把它作连续性分布处理,一般应易发生第一类(α)错误,补救的方法是在假设测验时进行连续性矫正。10.样本平均数分布的平均数、方差11.样本平均数的差数的分布的平均数,,方差12.为了测验两个样本所属的总体平均数有无显著差异,一般会因设计的不同分为成组比较和成对比较两种。13.统计设计试验中的无效假设与备择假设的内容是一个对立事件。14.同一显著水平下,两尾检验的临界值大15.统计推断是指根据抽样分布律和概率理论,由样本结果对总体特征进行推断,假设实验使用的原理小概率事件实际不可能的原理。16.统计假设测验从本质上说就是将统计数的分布分为接受区和否定区。17.假设检验又称显著性测验,常有的是t检验、F检验和X2检验。18.假设实验中的两类错误α错误、β错误,降低犯α、β错误的方法,需采用一个较低的显著水平,同时增加样本容量、减小方差、合理设计试验、正确实验技术。19.区间估计可用于假设检验,如果对参数所做的假设落在置信区间内,则应接受H0;反之,落在置信区间外,则应否定H020.在样本容量n固定的条件下,提高显著水平由0.05提高到0.01,会增大犯β错误的概率,减少犯α错误的概率。(α=0.05易犯α错误,接受区域小,否定H0,接受区域大;α=0.01易犯β错误,接受区域大,否定H0,接受区域小)21.成对数据课控制试验误差,具有较高的精确度,在实践上,如将成对数据按成组数据分析,则容易使统计推断发生β错误22.临界值Uα和tα皆随置信度增大而增大,因此取大的置信度使置信区间增大,估计得准确度降低23.进行假设检验的步骤:①对研究总体的参数提出假设;②确定或否定H0的概率水准α;③在无效假设正确的条件下,根据统计数的抽样分布率计算实际实验结果中误差造成的概率;④根据计算结果作出显著性判断。24.F检验是一种整体性质的测验,一个显著的F值只表明试验中的各个处理平均数间存在显著差异,而不是都有差异。25.常用来进行平均数多重比较的方法最小显著差数法LSD、最小显著极差法LSR(q检验法、SSR法)。26.一个试验资料采用哪种多重比较方法,主要应依据否定一个正确的H07\n和接受一个不正确的H0相对重要性来决定,如果否定正确的H0事关重大或后果严重,应用q检验1.X2测验对计数资料时,df=1时需要矫正,适合性测验时,X2自由度df=k-1,独立性测验时,自由度df=(r-1)(c-1)。2.方差分析是在处理数K>=3时进行平均数统计假设测验的方法,进行方差分析的资料服从效应的可加性、分布的正态性、方差的同质性。3.相关系数r的正负表示相关的性质,|r|的大小表示相关的密切程度。4.两个样本的回归和相关比较,其显著性不一定等价,因为回归差异是回归截距和回归系数的差异,相关差异是坐标点与回归直线的靠近程度。5.r2或|r|越接近1,表示X和Y的相关越密切;越接近于0,则越缺乏相关,6.适合性检验的用途遗传学中用以检验实际结果是否符合遗传过滤,检验样本分布与理论是否相等。7.试验设计常用的方法有完全随机设计、随机单位组设计、拉丁方设计、正交设计。8.对于不符合基本假设的实验资料,在进行方差分析之前,课针对数据的主要缺陷,采用相应的转换,常用的转换方式有:平方根转换、对数转换、反正弦转换法、倒数转换。9.从农业试验和农业生产的关系来说,农业试验通常都可看做是农业生产的先行和准备10.分析指标若是种子发芽率进行比较,方差分析时应注意,首先数据转换,常用方法是反正弦转换法。11.两项百分数资料转换常用方法反正弦转换法。12.拉丁方设计特点试验处理数=重复次数,每行每列都构成单位组。13.在应用所得回归方程g=a+bx,应注意:①两变数间的线性相关程度︱r︱>=0.7;②要在x的取值区间内去用,不能超过这个范围;③要在获得该方程的原条件下去用。14.在两个变数的相关回归研究中,相关系数,回归数的假设,测验结果一致可以由其中任意一种测验结果来推断相关回归关系是否显著,若两变数具有回归关系,则必有相关关系;而两变数具有相关关系,则不一定有回归关系。15.试验设计3条基本原理重复、随机、局部控制,在同时重复研究多个因素试验中,全部实施处理太多,此时考虑和采用正交设计。16.试验误差大致课分为两类:系统误差和随机误差,误差的来源主要有:实验材料本身固有的差异和试验时外界条件的不一致。17.试验误差的来源实验材料固有差异、试验条件不一致、操作技术不一致、偶然因素的来源、疏忽大意造成。18.试验设计的目的:避免系统误差,控制、降低试验误差,无偏估计处理效应,从而对样本所在总体作出可靠、正确的推断。19.试验设计的要求:试验目的明确、试验条件要有代表性、试验结果可靠、试验结果可重演20.重复的最主要的作用是:降低误差、降低试验误差判断:1.根据抽样试验验平均数和标准差均是其相应参数的无偏估计值(X)2.对于固定模型资料中,当方差分析中的F检验达到显著后应进行多重比较(√)3.进行X2检验时,凡是资料中的df=1都需要进行连续矫正(X)7\n1.两项百分数资料课直接进行方差分析(X)2.由于标准差可以反映变数的离散性,因此可以用来比较任意两个变数(X)3.用SSR法进行多重比较时,任意两个平均数差值秩次距与同一显著尺度进行比较并作出判断(√)4.进行F检验时应根据平均数秩次距和误差自由度dfe查Fα(X)5.由于回归系数和相关系数的正负号一致,所以根据回归系数也可以知道两个变数之间的相关性质(√)6.在非配对检验中,如果两个样本容量综合不变化,n1=n2时可以获得最小的实验误差,所以进行非配对实验时,两样本容量最好相等(√)7.一个变数平均数的代表性强弱可以用变异系数说明(X)8.用PLSD法进行多重比较,任意两个平均数方差值应与相应的秩次距下显示尺度作出比较判断(X)9.随机模型与固定模型的资料在推断时都仅限于供试处理范围之内(X)10.保证F检验正确的有效条件之一是其分子期望均方比分母的期望均方多一个分量(√)11.相关系数与决定系数均可反映两个变数之间的相关性质(X)12.在试验中获得数据时,使得做方差分析时,用各小区观察值,本身就是一个平均值,是使方差分析满足基本假设的一种有效手段(√)简答题:1.标准差与变异系数的异同:相同:都能反映变异数离散程度大小的值不同:①标准差:是一个绝对值,带变数单位,反映变数的平均变异量。②变异系数:是一个相对值,不带变数单位,是个统数,反映变数的相对变异量。2.显著性检验(假设检验)的基本步骤及使用原理:1)对所研究的总体参数提出假设2)确定或否定H0的概率水准α=0.05,α=0.01(应用了小概率事件不可能原理)3)计算误差概率:在无效假设H0正确前提下,根据统计数的抽样分析,计算实得结果的差异由误差造成的概率4)判断:根据计算结果与设置的α进行比较作出所推断的参数间的差异为不显著、显著和极显著的结果。即:P>0.05接受H0,否定HA,差异不显著0.01