体育统计学 2 6页

  • 95.33 KB
  • 2022-08-13 发布

体育统计学 2

  • 6页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
第一章总体:根据研究目的的所确定的同质研究对象的全体。总体特征:同质性,大量性,差异性。样本:从总体中随机抽取用以推测总体性质的部分对象。参数:代表总体特征的统计指标称为参数。总体参数(在统计学中,描述总体变量特征的指标)统计量:由样本所得关于样本特征的统计指标,称为统计量。(样本统计量:描述样本变量值特征的指标。)3个问题1.抽样目的:推测总体的性质2.抽样原则(如何保证样本代表性):随机化原则。使总体每一个个体都有相同的可能性被抽到样本中。保证足够的样本含量。3.参数和统计量特点;参数:求知的,固有的,不变的。统计量:已知的,变化的,有误差的。一个例题,指出总体样本样本含量。(举例)1.为了检查一批零件的质量,从中抽取10件。这个问题中的总体,个体,样本,样本容量各指什么?总体:这批零件。个体:每件零件。样本:10件零件,样本容量:102.要了解灯泡厂某种灯泡的使用寿命,从中抽查了20只进行寿命试验,在此问题中,这20只灯泡使用寿命总体:某种灯泡的使用寿命。个体:每一只灯泡的使用寿命。样本:抽取的20只灯泡的寿命。样本容量:203.为了研究2008年某市15岁男少年的身高发育情况,现从该市20所中学里随机抽取300名15岁男生,测其身高数据,试描述该问题中的总体、个体、样本、样本含量。总体:2008年该市15岁男少年的身高全体个体:总体中的每一个15岁男少年的身高样本:总体中被抽取的300名15岁男生的身高样本含量:300第二章1.p17收集资料应该注意的问题:1.保证资料的科学性2.保证资料的完整性3.保证资料的持久性4.保证资料的代表性5.注意简介资料的核实与评价。完整性:是指无论作横向的对比、归纳,还是纵向的观察,都必须掌握较完整的资料。有效性:反映观察事物的本质特征。可靠性:误差不能超过规定的误差范围。代表性:①样本要有足够的样本含量。②确保抽样的随机性。2.P18影响资料正确性的主要因素:1.测试者2.受试者3.标准化,规范化程度。3.P23连续型变量频数分布表:1.制作步骤:确定分组数,极差,组距和组限。4.连续型频数分布表作用:1.整理数据便于进一步计算2.可发现某些特大或特小的异常数据3.可发现数据的特征和形态。(看出形态,正态还是偏态。怎样辨别:大部分数据集中在中间的是正态,在上或下的是偏态)\n1.分组的原则一般来说不能分的过细或者是过于粗略,否则:(1)不能看出数据的特征与形态。(2)不便于进一步计算。6.累计频数概念:从第一组到该组的所有频数之和。第三章:样本特征数1.集中量数:反映集中趋势的统计量称为集中量数。常用的集中量数有:(1)算术平均数(2)中位数(3)众数算术平均数定义:所有观察值之和除以总频数,简称均数。样本均数:总体均数:含义:反映同质研究对象观察值的平均水平与集中趋势的统计量。优点:(1)均数作为反映变量的集中量数,既考虑到频次的多少,又考虑到每一个变量值的大小,故它是可靠的、灵敏的,也是对资料提供信息运用最充分的。(2)均数适合代数运算,计算方便,因此是一个用途最广、效果最好的集中量数。缺点:(1)均数易受少数极端数据的影响而大大改变其数值,从而相对削弱它作为集中量数的代表性。适应范围:数据严重偏态分布时,一般不用均数反映它的集中趋势。一般应用于正态或近似正态的数据。中位数定义:是把各个变量值按大小顺序排列后,位于序列中间的数,称为中位数,是一种位置指标,反映数据集中趋势的一个统计量。记为:含义:反映一组观察值在位置上的平均水平。优缺点:(1)由于中位数只受居中变量值的影响,故它不够灵敏、充分。(2)不会受到极端数据的影响。适用条件:适用于任何分布资料,特别是偏态分布、分布不明、分布末端无确定值。众数定义:在一次实验中出现次数(频数)最多的观察值;在频数分布表中对应于数据最集中所在位置的观察值。记作:适应条件:适用于大样本;较粗糙全距(极差)该组数据的最大值与最小值的差。方差定义:离均差平方和除以该组数据的总频数。其公式为:总体方差:样本方差:含义:表示每个观察值的平均离散程度,方差越大,说明数据的离散程度越大。\n优点:(1)灵敏性、严密确定、充分性。(2)可以比较不同数目同质数据的各组数据资料。缺点:(1)容易受到极端数据影响。(2)它的单位与观察值的单位不同,是观察值单位的平方,这给我们解释实际问题造成了一些麻烦。标准差定义:方差的平方根。其公式为:总体标准差样本标准差:n-1:自由度含义:反映每个数据的平均离散程度,标准差越大,说明数据的离散程度越大。标准差的优缺点及适用条件优缺点:(1)灵敏性、严密确定、充分性。(2)标准差能对平均数的代表性作出补充说明。标准差越大,表明这组数据的离散程度越大,平均数的代表性越差;标准差越小,表明这组数据的离散程度越小,平均数的代表性越好。(3)与方差相比,标准差更容易解释实际问题。(4)易受极端数据的影响。适用条件:(1)数据分布相对比较均匀,正态或近似正态的数据。变异系数(结合书本p36例子)定义:同组数据的标准差与平均数的百分比。含义:表示数据的相对变异程度,变异系数越小,变异程度就越小;变异系数越大,变异程度就越大。适用条件:①比较单位相同但均数相差较大数据。②比较单位不同的数据。引申:选择一个合适的集中量数反映集中趋势:正态:算术平均数;偏态:中位数算数平均数与中位数的比较:算数平均数优点:(1)均数作为反映变量的集中量数,既考虑到频次的多少,又考虑到每一个变量值的大小,故它是可靠的、灵敏的,也是对资料提供信息运用最充分的。(2)均数适合代数运算,计算方便,因此是一个用途最广、效果最好的集中量数。缺点:\n(1)均数易受少数极端数据的影响而大大改变其数值,从而相对削弱它作为集中量数的代表性。中位数优缺点:(1)由于中位数只受居中变量值的影响,故它不够灵敏、充分。(2)不会受到极端数据的影响。适用条件:适用于任何分布资料,特别是偏态分布、分布不明、分布末端无确定值。众数计算标准差和平均数。标准差,第一步,平均数,第二步离差平方和,第三步,离差平方和除以n的数字根号第五章概率及其分布随机试验:任何一个试验,满足:(1)可在相同条件下重复进行;(2)每次试验得到多个结果;(3)每次试验前不能肯定这次试验将得到什么结果。频率的稳定性:随着试验次数的增加,随机事件的频率逐渐稳定在某一个常数附近,这一特性称为频率的稳定性。小概率事件与原则:小概率事件:概率必须很小,那么,究竟要小到什么程度?在体育统计中一般认为在0.05以下为小。小概率事件原则:小概率事件在一次试验中是不会发生的。正态分布图像特点:正态分布曲线的性质1)曲线在X轴上方,X轴是他的一条水渐近线。(2)它的图像是由两个参数决定的:均数决定他的位置,即在图像在x=m处对称,并且在该处取到最大值。标准差决定他的形状,标准差越小,图像越瘦高;标准差越大,图像越扁平。(3)曲线与X轴之间的面积等于1。计算题:p655.4.1和p675.4.2和p67.5.4.3第六章体育统计1.自定义的标准百分均数加减a2.位置百分计算3.已知位置百分,求相对应成绩高优(田赛跳远),低优例1:某跳远样本统计量为:均数为5.65米,标准差为0.40米,如果学生甲的跳远成绩为5.85米,求其标准百分。跳远,田赛,高优指标\n2.某样本100米跑的统计量均数为12.5秒,标准差为0.8秒,学生甲的100米跑成绩为12.3秒。(1)标准百分。(2)该样本统计量的满分成绩为多少?(1)100米,径赛,低优指标1.2.抽样得100所中学829名初二男生50米跑成绩的样本统计量为:,。以均数为50分,为0分和100分,1、若某学生的成绩为7.8秒,他的标准百分。2、制作标准百分。100米。径赛,低优指标。(1)确定评分范围。2)确定评分间隔。评分间隔为0.1秒。3)确定每个评分间隔的得分。4)含义:成绩每提高0.1秒,成绩增加2.94分。第七章参数估计\n1.抽样误差:定义:由抽样引起的样本统计量与总体参数间的差别。原因:个体变异+抽样表现:(1)样本统计量与总体参数间的差别;(2)不同样本统计量间的差别。影响抽样误差的因素;样本含量的大小;1.在其他条件一定的情况下,样本含量越小,抽样误差越大;样本含量越大,抽样误差越小。2.总体被研究标志的变异程度:在其他条件一定的情况下,总体被研究标志的变异程度越大,抽样误差越大;总体被研究标志的变异程度越小,抽样误差越小。3.抽样的组织方式;一般来说,按系统抽样和分层抽样的方式组织调查,4.抽样方法分为:重复抽样和不重复抽样。一般来说,不重复抽样时抽样误差相对小些。5.计算统计推断:统计推断是获取总体性质和特征过程,即根据样本的性质和特征,分析和推断总体的性质和特征,包括参数估计和假设检验。参数估计主要包括参数的点估计和区间估计等。点估计总体参数的点估计就是用样本统计量来直接地估计相对应的总体参数,即直接使用样本均数直接估计总体均数等。优点:1)点估计的优点是能给出一个明确的值,计算简单方便。(2)点估计的缺点是没有考虑到抽样误差的影响,无法判断它的结果有多大的可信程度。区间估计:是根据抽样误差的规律,按一定概率(1-α)估计包含未知总体参数的可能范围。这个区间(范围)称为总体参数的可信(置信)区间。含义计算置信区间的方法可靠性。置信区间2要素:1.置信度,可信度2.精确性关系是相对的计算置信区间的基本原则求参数置信区间在保证可靠性的前提下,尽量提高数据精确性。影响置信度的因素影响可信区间大小的因素可信度可信度越大,区间越宽个体变异变异越大,区间越宽样本含量样本含量越大,区间越窄计算题:总体方差已知,未知。对应例题。P86.7.2.17.2.2

相关文档