- 243.23 KB
- 2021-06-30 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
- 1 -
微专题 95 高中涉及的统计学知识
一、基础知识:
(一)随机抽样:
1、抽签法:把总体中的 个个体编号,把号码写在号签上,将号签放在一个容器中搅拌均匀
后,每次从中抽取一个号签,连续抽取 次,就得到容量为 的样本
2、系统抽样:也称为等间隔抽样,大致分为以下几个步骤:
(1)先将总体的 个个体编号
(2)确定分段间隔 ,设样本容量为 ,若 为整数,则
(3)在第一段中用简单随机抽样确定第一个个体编号 ,则后面每段所确定的个体编号与前
一段确定的个体编号差距为 ,例如:第 2 段所确定的个体编号为 ,第 段所确定的个
体编号为 ,直至完成样本
注:(1)若 不是整数,则先用简单随机抽样剔除若干个个体,使得剩下的个体数能被 整
除,再进行系统抽样。例如 501 名学生所抽取的样本容量为 10,则先随机抽去 1 个,剩下的
个个体参加系统抽样
(2)利用系统抽样所抽出的个体编号排成等差数列,其公差为
3、分层抽样:也称为按比例抽样,是指在抽样时,将总体分成互不交叉的层,然后按照一定
的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本。
分层抽样后样本中各层的比例与总体中各个层次的比例相等,这条结论会经常用到
(二)频率分布直方图:
1、频数与频率
(1)频数:指一组数据中个别数据重复出现的次数或一组数据在某个确定的范围内出现的数
据的个数.
(2)频率:是频数与数据组中所含数据的个数的比,即频率=频数/总数
(3)各试验结果的频率之和等于 1
2、频率分布直方图:若要统计每个小组数据在样本容量所占比例大小,则可通过频率分布表
(表格形式)和频率分布直方图(图像形式)直观的列出
(1)极差:一组数据中最大值与最小值的差
(2)组距:将一组数据平均分成若干组(通常 5-12 组),则组内数据的极差称为组距,所以
N
n n
N
k n N
n
Nk n
l
k l k m
1l m k
N
n n
500
k
- 2 -
有组距=极差/组数
(3)统计每组的频数,计算出每组的频率,便可根据频率作出频率分布直方图
(4)在频率分布直方图中:横轴按组距分段,纵轴为“频率/组距”
(5)频率分布直方图的特点:
① 频率= ,即分布图中每个小矩形的面积
② 因为各试验结果的频率之和等于 1,所以可得在频率分布直方图中,各个矩形的面积和为 1
(三)茎叶图:通常可用于统计和比较两组数据,其中茎是指中间的一列数,通常体现数据
中除了末位数前面的其他数位,叶通常代表每个数据的末位数。并按末位数之前的数位进行
分类排列,相同的数据需在茎叶图中体现多次
(四)统计数据中的数字特征:
1、众数:一组数据中出现次数最多的数值,叫做众数
2、中位数:将一组数据从小到大排列,位于中间位置的数称为中位数,其中若数据的总数为
奇数个,则为中间的数;若数据的总数为偶数个,则为中间两个数的平均值。
3、平均数:代表一组数据的平均水平,记为 ,设一组数据为: ,则有:
4、方差:代表数据分布的分散程度,记为 ,设一组数据为: ,其平均数为 ,
则有: ,其中 越小,说明数据越集中
5、标准差:也代表数据分布的分散程度,为方差的算术平方根
二、典型例题
例 1:某校高中部有三个年级,其中高三有学生 人,现采用分层抽样法抽取一个容量为
的样本,已知在高一年级抽取了 人,高二年级抽取了 人,则高中部共有学生_______
人.
思 路 : 分 层 抽 样 即 按 比 例 抽 样 , 由 高 一 年 级 和 高 二 年 级 的 人 数 可 得 高 三 人 数 为
人,所以抽样比为 ,从而总人数为 人
答案:3700
例 2:某企业三月中旬生产,A.B.C 三种产品共 3000 件,根据分层抽样的结果;企业统计
员制作了如下的统计表格:
频率 组距组距
x 1 2, , , nx x x
1 2 nx x xx n
2s 1 2, , , nx x x x
2 2 22
1 2
1
ns x x x x x xn
2s
1000
185 75 60
185 75 60 50 50 1=1000 20
1185 370020
- 3 -
产品类别 A B C
产品数量(件) 1300
样本容量(件) 130
由于不小心,表格中 A.C 产品的有关数据已被污染看不清楚,统计员记得 A 产品的样本容量
比 C 产品的样本容量多 10,根据以上信息,可得 C 的产品数量是 件.
思路:由 产品可得抽样比为 ,所以若 A 产品的样本容量比 C 产品的样本容量多 10,
则 A 产品的数量比 C 产品的数量多 ,且 产品数量和为 ,
从而可解得 产品的数量为
答案:800
例 3:某棉纺厂为了了解一批棉花的质量,从中随机抽测了 100 根棉花纤维的长度(棉花纤维
所得数据均在区间 中,其频率分布直方图如图所示,则在抽测的 100 根中___________
根棉花纤维的长度小于 15mm.
思 路 : 由 频 率 直 方 图 的 横 纵 轴 可 得 : 组 距 为 5mm , 所 以 小 于 15mm 的 频 率 为
,所以小于 15mm 共有 根
答案:10
例 4:某班甲、乙两位同学升入高中以来的 5 次数学考试成绩的茎叶图如图,则乙同学这 5 次
数学成绩的中位数是 ;已知两位同学这 5 次成绩的平均数都是 84,成绩比较稳定的
是 (第二个空填“甲”或“乙”).
B 130 1
1300 10
110 10010 ,A C 3000 1300 1700
C 800
5,40
0.01 0.01 5 0.1 100 0.1=10
- 4 -
思路:由茎叶图可读出,乙同学的成绩为 ,甲同学的成绩为 ,
所以乙同学的成绩的中位数为 ,相比较而言,甲同学的成绩比较集中,所以比较稳定的是
甲
答案: ,甲
小炼有话说:在求中位数时要注意先将数据从小到大排列,判断成绩稳定,本题甲,乙稳定
性的判断定量上要依靠方差,但因为本题从茎叶图上看出甲,乙数据稳定性差距较大,所以
定性的判断。
例 6:某校从参加高三年级期末考试的学生中随机抽取 100 名学生,将其数学成绩分成五段:
, ,它的频率分布直方图如图所示,则该批学
生中成绩不低于 90 分的人数是_____.
思路: 的高度未知,但由于直方图体现的是全部样本的情况,所以各部分频率和为
1,可以考虑间接法。从图中可观察到 的频率为 ,所
以不低于 90 分的频率为 ,故人数为 (人)
答案:
79,80,82,88,91 81,82,83,84,91
82
82
50,70 , 70,90 , 90,110 , 110,130 130,150
90,100
50,90 0.0025 0.0150 20 0.35
1 0.35 0.65 100 0.65 65
65
- 5 -
例 7:从某小区抽取 100 户居民进行月用电量调查,发现其用电量都在 50 到 350 度之间,频率
分布直方图所示.
(1)直方图中 的值为___________;
(2)在这些用户中,用电量落在区间 内的户数为_____________.
思路:(1 )依题意可得频率直方图中的频率和等于 1 ,由图可得组距为 ,所以有
,解得
( 2 ) 图 中 的 频 率 为 , 所 以 用 户 数 为
(户)
答案:(1) (2) 户
例 7:某校 1000 名学生的数学测试成绩分布直方图如图所示,分数不低于 即为优秀,如果
优秀的人数为 175 人,则 的估计值是________.
思路:可先从频率直方图中按分数从高到低统计分数段的人数,组距为 ,从而可得:
的人数为 ,同理可得 的人数为 人,而优秀
的人数为 人,所以应包含 的全体,以及 中的一半人数,所以估计值
为 到 的中间值,即
答案:
x
100,250
50
0.0024 0.0036 0.0060 0.0024 0.0012 50 1x 0.0044x
100,250 0.0036 0.006 0.0044 50 0.7
100 0.7 70
0.0044x 70
a
a
10
140,150 1000 0.01 10 100 130,140 150
175 140,150 130,140
130 140 135
135a
- 6 -
例 8:某地区为了解中学生的日平均睡眠时间(单位: ),随机选择了 位中学生进行调查,
根据所得数据,画出样本的频率分布直方图如图所示,且从左到右的第 1 个、第 4 个、第 2 个、
第 3 个小长方形的面积依次构成公差为 0.1 的等差数列,又第一小组的频数是 10 ,则
_______.
思路:设第一个的面积为 ,则第 4 个为 ,第 2 个为 ,第 3 个
为 ,依题意可得四部分的频率和为 ,从而 可解得 ,
所以 ,从而
答案:
例 9:某单位有职工 200 名,现要从中抽取 40 名职工作样本,用系统抽样法,将全体职工随
机按 1-200 编号,并按编号顺序平均分为 40 组(1-5 号,6-10 号,…,196-200 号).若
第 5 组抽出的号码为 22,则第 10 组抽出的号码应是_________
思路:由系统抽样可知,每组抽出的号码依次成等差数列,且公差为组距 ,所以
,则
答案:47
例 10:某单位有 840 名职工, 现采用系统抽样抽取 42 人做问卷调查, 将 840 人按 1, 2,
…, 840 随机编号, 则抽取的 42 人中, 编号落入区间 的人数为 .
思 路 : 由 系 统 抽 样 可 知 : 组 距 为 , 所 以 区 间 可 拆 分 为
,而每个区间只有一人被抽取,所以共有 3 人
答案:
h n
n
1S a 4 0.1S a 2 0.2S a
3 0.3S a 1 1 2 3 4 1S S S S 0.1a
1 0.1S 10 1000.1n
100
5d
5 22a 10 5 5 22 25 47a a d
61,120
840 2042 61,120
61,80 , 81,100 , 101,120
3