统计学复习范围更新 4页

  • 78.50 KB
  • 2022-08-29 发布

统计学复习范围更新

  • 4页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
第一章1.3统计数据可分为哪几种类型?不同类型的数据各有什么特点?一、(按计量尺度分)1.分类数据(categoricaldata),对事物进行分类的结果,数据表现为类别,用文字来表述,例如:人口按性别分为男、女两类(可用数字代码来表示)2.顺序数据(rankdata)对事物类别顺序的测度,数据表现为类别,用文字来表述,例如,产品分为一等品、二等品、三等品、次品等3.数值型数据(metricdata)对事物的精确测度,是按数字尺度测量的观察值,结果表现为具体的数值,例如:身高为175cm、168cm、183cm二、(按收集方法分)1.观测的数据(observationaldata)通过调查或观测而收集到的数据,在没有对事物人为控制的条件下而得到的,有关社会经济现象的统计数据几乎都是观测数据2.试验的数据(experimentaldata)在试验中控制试验对象而收集到的数据,比如,对一种新药疗效的试验,对一种新的农作物品种的试验等,自然科学领域的数据大多数都为试验数据三、(按与时间的关系分)1.截面数据(cross-sectionaldata)在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况,比如,2009年我国各地区的国内生产总值数据2.时间序列数据(timeseriesdata)在不同时间上收集到的数据,描述现象随时间变化的情况,比如,1996年至2009年国内生产总值数据1.5参数、统计量、P9(区别、联系)参数是用来描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。如总体平均数、总体标准差、总体比例等统计量是用来描述样本特征的概括性数字度量。是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。如样本平均数、样本标准差。抽样的目的就是要根据样本统计量去估计总体参数。如:用样本平均数去估计总体平均数,用样本标准去估计总体标准差,用样本比例去估计总体比例。第二章2.概率抽样和非概率抽样的区别与联系,P23+P34概率抽样也称随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定机会被选入样本。概率抽样.特点:按一定的概率以随机原则抽取样本;抽取样本时排除主观意识,使每个单位都有一定的机会被抽中;每个单位被抽中的概率是已知的,或是可以计算出来的;当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率非概率抽样相对于概率抽样而言,不依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查;非概率抽样.特点:操作简便、时效快、成本低;而且对于抽样中的统计学专业技术要求不是很高。联系与区别:1.概率抽样:依据随机原则抽选样本;样本统计量的理论分布存在;可根据调查的结果推断总体2.非概率抽样(操作简便、时效快、成本低)不是依据随机原则抽选样本;\n样本统计量的分布是不确定的;无法使用样本的结果推断总体(探索研究)。3.P86最上面一段需要简答:即:4.1一组数据的分布特征可以从哪几个方面进行测量?答:数据分布的特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。这三个方面分别反映了数据分布特征的不同侧面。4P15最下面一行,从普查数据到重要内容—判断改错题。答案:有误差5。P28实验数据:名词解释+实验是检验变量间因果关系的一种方法。实验数据是指在实验中控制实验对象而收集到的变量的数据。6误差的控制:抽样误差可以采用相应的措施进行控制。P391.抽样误差可计算和控制(主要方法是改变样本量)2.非抽样误差的控制:调查员的挑选,调查员的培训,督导员的调查专业水平,调查过程控制,调查结果进行检验、评估,现场调查人员进行奖惩的制度。7计算题:重点是平均值和方差。参考:1.P93例4.7。例4.118.P212参数估计和假设检验的区别与联系。答:参数估计和假设检验是统计推断的两个组成部分,他们都是利用样本对总体进行某种推断,然而推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数ų在估计前是未知的。而在假设检验中,则是先对ų的值提出一个假设。然后利用样本信息去检验这个假设是否成立。第三章-数据的图表展示P783.4直方图与条形图有何区别?答:1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的。2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义。3.直方图的各矩形通常是连续排列,条形图则是分开排列。4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据。3.6饼图和环形图有什么不同?答:1.饼图也称圆形图,是用圆形及园内扇形的面积来表示数值大小的图形.它主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用。2.环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示。环形图与圆形图类似,但又有区别n圆形图只能显示一个总体各部分所占的比例n环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环3.环形图可用于结构比较研究,主要用于展示分类和顺序数据。3.7茎叶图与直方图相比有什么优点?它们的应用场合是什么?\n答:茎叶图与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。第四章——数据的概括性度量P1094.5简述众数、中位数和平均数的特点和应用场合。简答题答:众数是一组数据中出现次数最多的变量值,用M0表示。它不受极端值影响,具有不唯一性。众数主要用于分类数据的集中趋势,当然也适用顺序数据和数值型数据。数据分布偏斜程度较大时应用。中位数是一组数据排序后处于中间位置上的变量值,用Me表示,也不受极端值影响。它将全部数据等分成两部分,一部分数据比中位数大,一部分比中位数小。主要用于测度顺序数据的集中趋势,当然也适用于数值型数据,但不适用于分类数据。数据分布偏斜程度较大时应用。平均数是一组数据相加后除以数据的个数得到的结果,是集中趋势的最主要测度值。它易受极端值影响,数学性质优良。主要适用于数值型数据,而不适用于分类数据和顺序数据。数据对称分布或接近对称分布时应用。4.8为什么要计算离散系数?与方差的区别答:离散系数是一组数据的标准差与其相应的平均数之比。是对数据相对离散程度的测度,消除了数据水平高低和计量单位的影响,主要用于对不同组别数据离散程度的比较。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。第五章——概率与概率分布例5.21设X-N(0,1),求以下概率:重点记住:=1,=2,=3时的值是多少?(1)P(X<1.5)。(2)P(X>2)。(3)P(-12)=1-P(X2)=1-=1-0.9773=0.0227(3)P(-1