用样本估计总体
一、目标与策略
明确学习目标及主要的学习方法是提高学习效率的首要条件,要做到心中有数!
学习目标:
? 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.
? 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确
地做出总体估计.
? 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.
? 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的
解释.
? 会用样本的基本数字特征估计总体的基本数字特征.
重点难点:
? 重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.用样本平均数和标准差估计总体的平均数与标
准差.
? 难点:能通过样本的频率分布估计总体的分布.能应用相关知识解决简单的实际问题.
学习策略:
? 本课题主要包括两大内容:用样本频率分布估计总体分布、用样本数字特征估计总体数字特征.通过对实际数据的
分析,评估现实中的实际问题是数学学科的灵魂,而频率分布直方图、总体密度曲线、茎叶图正是有着这方面的作用,所以在学习过程中要注意理论和实际的结合。
二、学习与应用
“凡事预则立,不预则废”。科学地预习才能使我们上课听讲更有目的性和针对
知识回顾——复习
学习新知识之前,看看你的知识贮备过关了吗?
(一)简单随机抽样的概念:
一般地,从元素个数为N的总体中 地抽取容量为n的样本,如果每一次抽取时总体中的各个个体被抽到的 是 的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本. (二)系统抽样的概念:
当总体中的个体比较多时,将总体分成 的若干部分,然后按照预先制定的规则,从每一部分中抽取一
1
个 ,得到所需要的样本,这样的抽样方法称为系统抽样,也称作 抽样. (三)分层抽样的概念:
当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个 的几部分,每一部分叫做 ,在各层中按层在总体中所占 进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.
知识要点——预习和课堂学习
认真阅读、理解教材,尝试把下列知识要点内容补充完整,带着自己预习的疑惑认真听课学习。若有其它补充可填在右栏空白处。
知识点一:频率分布的概念
频率分布是指一个样本数据在各个小范围内所占 的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:
(1)计算一组数据中最 值与最 值的差,即求 (2)决定 与 (3)将数据分组 (4)列 分布表 (5)画频率分布直方图 要点诠释:
频率分布直方图的特征:
(1)从频率分布直方图可以清楚的看出数据分布的总体趋势.
(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.
知识点二:频率分布折线图、总体密度曲线
(1)频率分布折线图的定义:
连接频率分布直方图中各小长方形上端的 ,就得到频率分布折线图. (2)总体密度曲线的定义:
在样本频率分布直方图中,样本容量 ,所分组数 ,相应的频率折线图会越来越 于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 要点诠释:
总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律.
2
知识点三:茎叶图
当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图. 要点诠释:
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是在统计图上没有原始 的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时 ,随时 ,方便记录与表示.
(2)茎叶图只便于表示 位有效数字的数据,而且茎叶图只方便记录 组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.
知识点四:众数、中位数与平均数
(一)众数
一组数据中出现次数最 的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出一项决定,考察全班同学对它赞成与否就可以用众数. (二)中位数
将一组数据从 到 依次排列,把中间数据(或中间两数据的 数)叫做中位数.中位数把样本数据分成了相同 的两部分. (二)平均数
样本数据的算术平均数,即x? . 要点诠释:
由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.
知识点五:标准差与方差
(一)标准差
样本数据x1,x2,L,xn的标准差的算法: (1)算出样本数据的 .
(2)算出每个样本数据与样本数据 的差:xi?x?i?1, 2,L,n? (3)算出(2)中xi?x?i?1, 2,L,n?的 . 3
(4)算出(3)中n个平方数的 ,即为 . (5)算出(4)中平均数的 ,即为 . 其计算公式为: s= (二)方差 从数学的角度考虑,人们有时用标准差的平方s2(即方差)来代替标准差,作为测量样本数据分散程度的工具: s2= 要点诠释: 在刻画样本数据的 程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差. 数据的离散值程度可以用极差、方差或标准差来描述.极差反映了一组数据变化的 ;样本方差描述了一组数据围绕 波动的 ;样本方差的算术根表示样本的标准差,它也描述了数据对平均数的 程度. 经典例题-自主学习 认真分析、解答下列例题,尝试总结提升各类型题目的规律和技巧,然后完成举一反 三。若有其它补充可填在右栏空白处。 类型一:频率分布表、频率分布直方图 例1.例1(2010.江苏4).某棉纺厂为了了解一批棉花的质量,从中随机 抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标), 所得数据都在区间[5,40]中,其频率分布直方图如图所示,则其抽样的 100根中,有________根在棉花纤维的长度小于20mm.
思路点拨:理解频率分布直方图得具体含义.
4
总结升华: . 举一反三:
【变式】下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高 (单位
cm)
区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)人数5810223320区间界限[146,150)[150,154)[154,158)人数1165 (1)列出样本频率分布表; (2)画出频率分布直方图;
(3)估计身高小于134cm的人数占总人数的百分比.
类型二:众数、中位数、平均数
例2.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹
的杀伤半径,并列表如下:
(1)在这个问题中,总体、个体、样本和样本容量各是什么?
(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径.
思路点拨:本题主要考查总体、个体、样本、样本容量、众数、中位数和平均数的概念.
总结升华:
(1) .
(2) . 举一反三:
5