- 1.60 MB
- 2021-06-16 发布
- 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
- 网站客服QQ:403074932
第六章 统 计
§1
获取数据的途径
必备知识
·
自主学习
1.
直接获取与间接获取数据
概念
数据名称
直接获取
通过社会调查或
_____
、
_____
等途径获取数据
.
直接数据或
_____
数据
间接获取
借助各种媒介
,
包括报纸杂志、
统计报表和年鉴、广播、电视
或互联网等获取数据
.
间接数据或
_____
数据
观察
试验
一手
二手
【
思考
】
“
间接数据可以直接使用
,
不用调查
,
省时省力”
,
这种说法对吗
?
为什么
?
提示
:
不对
.
间接数据来历和渠道多样
,
质量参差不齐
,
使用时要进行核实
,
确保数据真实、准确
.
2.
普查和抽查
(1)
调查方
法概念
普查
抽查
定义
为了掌握调查对象的整
体情况
,
对
_____________
进行研究的一种调查
方式
.
从全体调查对象中按照一定的
方法抽取
___________
作为代表
进行调查分析
,
并以此推断全
体调查对象的状况的调查方式
.
全体调查对象
一部分对象
(2)
本质
:
普查与抽查是两种不同的调查方式
,
具体采用哪种方法取决于调查对象的范围
,
各有利弊
.
(3)
应用
:
根据具体情境确定选用的调查方式
.
【
思考
】
普查与抽查的优、缺点分别有哪些
?
提示
:
普查
抽查
优点
①
所取得的资料更加全面、系统
;
②
调查特定时段的社会经济现象总体的信息
①
迅速、及时
;
②
节约人力、物力、财力
,
对个体信息的了解更详细
缺点
耗费大量的人力、物力、财力
,
时间长、任务重
获取的信息不够全面、系统
3.
总体和样本
名称
定义
总体
调查对象的
_____
样本
从总体中抽取的
_____
样本容量
(
样本量
)
样本中个体的
_____
抽取
从总体中抽取的
___________
总体的分布
总体中各类数据的
_______
全体
部分
数目
部分的过程
百分比
【
基础小测
】
1.
辨析记忆
(
对的打“√”
,
错的打“
×”)
(1)
直接获取的数据称为二手数据
. (
)
(2)
获取数据的方式一般有两种
:
普查和抽查
. (
)
(3)
要想准确知道全班同学的平均身高
,
可以抽查一个小组的同学
. (
)
提示
:
(1)×.
直接获取的数据称为一手数据
.
(2)√.
普查和抽查是获取数据的常用方式
.
(3)×.
要想准确知道全班同学的平均身高
,
应调查每个同学
.
2.
下列哪些数据一般是通过试验获取的
(
)
A.2019
年上海市的降雨量
B.
截至
2020
年
5
月
15
日全世界感染新型冠状病毒肺炎人口的数量
C.
新华中学高一学生的数学测试成绩
D.
某种特效中成药的疗效
【
解析
】
选
D.
某种特效中成药的疗效的数据一般通过试验获得
.
3.(
教材二次开发
:
例题改编
)
医生要检验人血液中血脂的含量
,
采取的调查方法应该是
(
)
A.
普查
B.
抽样调查
C.
既不能普查也不能抽样调查
D.
普查与抽样调查都可以
【
解析
】
选
B.
要检验人血液中血脂的含量
,
只能对研究的总体进行抽样调查
,
不可能普查
.
关键能力
·
合作学习
类型一 个体、总体、样本、样本量的概念辨析
(
数学抽象
)
【
题组训练
】
1.
某市选考科目模拟考试共有
70 000
多名学生参加
,
市教研室为了了解
30 000
名地理考生的成绩
,
从中抽取
300
名考生的地理成绩进行统计分析
,
在这个问题中有以下说法
,
正确的是
(
)
A.30 000
名考生是总体的一个样本
B.30 000
名考生的地理成绩是总体
C.
样本容量是
30 000
D.
抽取的
300
名考生是总体的一个样本
2.
若对某校
1 200
名学生的耐力做调查
,
抽取其中
120
名学生
,
测试他们
1 500
米跑的成绩
,
得出相应的数值
,
在这项调查中
,
样本是指
(
)
A.120
名学生
B.1 200
名学生
C.120
名学生的成绩
D.1 200
名学生的成绩
3.2020
年
2
月
20
日
,
欧盟特别峰会在布鲁塞尔举行
,
主要讨论
2021
年至
2027
年长期预算
,
有
27
个国家代表参加
,
最终因各方分歧太大
,
未达成协议
.
会后某记者从每个国家与会人员中采访了两名成员
,
调查得到各成员国在预算总量、主要政策领域分配额、欧盟收入来源以及激励机制等多方面都存在分歧
.
在这个问题中样本容量是
(
)
A.2
B.27
C.54
D.
不确定
【
解析
】
1.
选
B.
总体是
30 000
名考生的地理成绩
,
样本是抽取的
300
名考生的地理成绩
,
样本容量是
300.
2.
选
C.
本题抽取的是
120
名学生的成绩
,
因此每个学生的成绩是个体
,
这
120
名学生的成绩构成一个样本
.
3.
选
C.
样本容量是
27×2=54.
【
解题策略
】
解决此类问题要明确概念的实质
,
尤其注意两个问题
:
(1)
调查对象是什么
.
(2)
样本量是样本中个体的数目
,
无单位
.
【
补偿训练
】
从一批零件中抽取
10
个
,
测得它们的长度
(
单位
:cm)
如下
:
22.36
22.35
22.33
22.35
22.37
22.34
22.38
22.36
22.32
22.35
由此估计这批零件的平均长度
.
在此统计活动中
:
(1)
总体为
:
_____________________________
;
(2)
个体为
:
____________________________
;
(3)
样本为
:
____________________________
;
(4)
样本容量为
:
____________________________
.
答案
:
(1)
这批零件的长度
(2)
每个零件的长度
(3)
抽取的
10
个零件的长度
(4)10
类型二 普查与抽查
(
数学抽象
)
【
典例
】
下列问题
:
①
调查全国中小学生每天的体育运动时间
;
②
日本厚生劳动省对钻石公主号游轮内乘客和船员
3 700
人进行检疫
;
③
调查武汉闭城解封后市民的心理健康状况
;
④
调查某篮球队中
12
位球员的收入情况
.
适合普查的是
,
适合抽样调查的是
.(
填序号
)
【
思路导引
】
紧扣题意
,
依据普查与抽查的特点解题
.
【
解析
】
依据普查与抽样调查各自的特点进行判断选取
.②
中必须对所有乘客和船员进行隔离、检查
,
必须做到普查
.④
中共
12
名球员
,
数量较少
,
可采用普查方式
.
而①③因数量大
,
普查难以做到
,
故采用抽样调查的方式
.
答案
:
②④
①③
【
解题策略
】
对普查与抽样调查的理解
(1)
普查要对所有的对象进行调查
,
当检验对象很大或检验对象具有破坏性时
,
采用普查的方法是行不通的
,
要进行抽样调查
.
(2)
普查与抽样调查的适用条件是不同的
,
在具体问题中
,
用普查还是抽样调查的方式
,
要根据它们的特点和适用范围进行判断
.
【
跟踪训练
】
下列调查方式中
,
可用“普查”方式的是
(
)
A.
调查某品牌电视机的市场占有率
B.
调查某电视连续剧在全国的收视率
C.
调查某校高一一班的男女同学的比例
D.
调查某型号炮弹的射程
【
解析
】
选
C.
调查某校高一一班的男女同学的比例
,
总体有限且总体数量较小
,
适宜采用“普查”
.
类型三 抽样调查中样本的抽取问题
(
数学建模
)
【
题组训练
】
角度
1
判断样本是否具有代表性
【
典例
】
下列调查所抽取的样本具有代表性的是
(
)
A.
利用某地
12
月份的月平均降雨量估计该地全年的平均降雨量
B.
在农村调查居民的平均消费
C.
利用长江入海口的水质估计沱沱河的水质
D.
为了了解一批大米的质量情况
,
从仓库中任意抽取
100
袋进行检验
【
思路导引
】
考量样本能否反映总体
.
【
解析
】
选
D.A
项中某地
12
月份的月平均降雨量不能代表全年的平均降雨量
;B
项中在农村调查得到的平均消费水平不能代表全民的平均消费水平
;C
项中长江入海口的水质状况与沱沱河的水质相差较大
,
只有
D
项正确
.
角度
2
抽样调查方案的设计
【
典例
】
2020
中央电视台春节联欢晚会全面改版
,
由任鲁豫、尼格买提、佟丽娅、尹颂、张舒越担任北京主会场主持人
,
主会场舞台营造出盛世满园的景象
,
让观众仿佛置身于大红灯笼下
,
感受春晚的磅礴大气
.
演员选择、节目筛选上也颇为下功夫
,
老中青演员配搭合理
,
歌舞欢快愉悦
,
动感十足
,
语言类节目情感浓度与思想深度并重
,
寓教于乐
,
金句频出
.
为了调查晚会播出的收视率
,
节目组设置了
《
春节联欢晚会收视率调查表
》,
并向社会广泛征求调查意见
.
某校有两名同学为电视台设计了调查方案
:
同学
A:
我把
《
春节联欢晚会收视率调查表
》
放在互联网上
,
只要上网登录该网址的人就可以看到这张表
,
他们填表的信息可以很快反馈到我的电脑中
.
这样
,
我就可以很快统计出收视率了
.
同学
B:
我在电话号码本上随机地选出一定数量的电话号码
,
然后逐个给他们打电话
,
问一下他们是否收看了中央电视台春节联欢晚会
,
我不出家门就可以统计出中央电视台春节联欢晚会的收视率了
.
请问上述两个同学设计的调查方案能够获得比较准确的收视率吗
?
为什么
?
【
思路导引
】
方案的设计要保证样本具有代表性
.
【
解析
】
调查的总体是所有可能看电视的人群
.
同学
A
的设计方案考虑的人群是
:
上网而且登录某网址的人群
,
那些不能上网的人群
,
或者不登录该网址的人群就被排除在外了
.
因此同学
A
设计的方案抽取样本的代表性差
,
不能较好的估计总体分布
.
同学
B
的设计方案考虑的人群是
:
在电话号码本上统计电话的人群
,
也有一定的片面性
,
因此同学
B
设计的方案抽取样本的代表性也差
,
也不能较好的估计总体分布
.
【
变式探究
】
你认为怎样设计调查方案
,
能得到较有说服力的数据
?
提示
:
发放调查问卷或打电话询问都要考虑不同的人群
,
要根据人口比例分别对农村、城市分成不同的群体调查
,
对各个不同群体中最好要按年龄、职业等属性再细化
.
【
解题策略
】
设计抽样调查的方案应遵循的原则
(1)
要合理地获取样本
,
以确保其典型性、代表性
.
(2)
要保证调查内容的真实性
.
【
题组训练
】
1.(
多选题
)
下列调查的样本不合理的是
(
)
A.
在校内发出一千张印有全校各班级的选票
,
要求被调查学生在其中一个班级
旁画“√”
,
以了解最受欢迎的教师是谁
B.
从一万多名工人中
,
经过选举
,
确定
100
名代表
,
然后投票表决
,
了解工人们对
厂长的信任情况
C.
到老年公寓进行调查
,
了解全市老年人的健康状况
D.
为了了解全班同学每天的睡眠时间
,
在每个小组中各选取
3
名学生进行调查
【
解析
】
选
AC.
因为
A
中样本不符合有效性原则
,
在班级前面画“√”与了解最受欢迎的老师没有关系
.C
中样本缺少代表性
,BD
都是合理的样本
.
2.
为了缓解城市的交通拥堵情况
,
某城市准备出台限制私家车的政策
,
为此要进行民意调查
,
某个调查小组调查了一些拥有私家车的市民
,
你认为这样的调查结果会怎样
?
【
解析
】
由于要出台限制私家车的政策
,
抽样调查的市民又是拥有私家车的市民
,
因此调查结果倾向于反对出台限制私家车的政策
.
如果要调查出社会公民对政策的真实意见
,
需要对市民的各个群体进行抽样调查
,
还包括对一些社会团体
(
比如公交公司、消防、医院等
)
的运营状况进行调查
,
这样才能比较真实地反映出社会的实际情况
,
获得市民的心声
.
课堂检测
·
素养达标
1.
现从
80
件产品中随机抽出
20
件进行质量检验
.
下列说法正确的是
(
)
A.80
件产品是总体
B.20
件产品是样本
C.
样本容量是
80 D.
样本容量是
20
【
解析
】
选
D.
总体是
80
件产品的质量
;
样本是抽取的
20
件产品的质量
;
样本容量是
20.
2.
要得到某乡镇的贫困人口数据
,
应采取的方法是
(
)
A.
通过调查获取数据
B.
通过试验获取数据
C.
通过观察获取数据
D.
通过查询获得数据
【
解析
】
选
A.
某乡镇的贫困人口数据属于有限总体问题
,
所以可以通过调查获取数据
.
3.(
多选题
)
如图是全国新型冠状病毒肺炎疫情实时数据报告中
2020
年
5
月
15
日
17
时
24
分黑龙江的数据报告
,
图中数据是
(
)
A.
一手数据
B.
二手数据
C.
通过普查获取的
D.
通过抽查获取的
【
解析
】
选
AC.
新型冠状病毒肺炎疫情是关系到我国乃至全世界人民的头等大事
,
新型冠状病毒肺炎疫情数据都是通过普查获取的一手数据
.
4.
学校兴趣小组要对本市某社区的居民睡眠时间进行研究
,
得到了以下
10
个数据
(
单位
:h):
5.6,7.8,8.0,7.3,3.2,7.9,6.8,7.5,8.6,7.8,
去掉数据
能很好地提高样本数据的代表性
.
【
解析
】
因为数据
3.2
明显低于其他几个数据
,
是极端值
,
所以去掉这个数据
,
能够更好地提高样本数据的代表性
.
答案
:
3.2
5.(
教材二次开发
:
练习改编
)
国家统计局、国家残联决定对国家残疾人生活、就业等情况进行调查
,
某同学设计的调查方案是在国家残联的网站上设立一个调查表
,
根据网站上的数据进行分析
.
你认为他的方案
(
填“合理”或“不合理”
).
【
解析
】
很多残疾人不具有上网条件
,
因此获取的数据不具有代表性
.
答案
:
不合理