政治 百文网手机站

回归分析的基本思想及其初步应用知识点整理

时间:2021-06-07 09:49:59 政治 我要投稿

回归分析的基本思想及其初步应用知识点整理

  要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.

回归分析的基本思想及其初步应用知识点整理

  重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.

  教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.

  教学过程:

  一、复习准备:

  1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.

  2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.

  二、讲授新课:

  1. 教学总偏差平方和、残差平方和、回归平方和:

  (1)总偏差平方和:所有单个样本值与样本均值差的平方和,即 .

  残差平方和:回归值与样本值差的平方和,即 .

  回归平方和:相应回归值与样本均值差的平方和,即 .

  (2)学习要领:①注意 、 、 的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即 ;③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④对于多个不同的模型,我们还可以引入相关指数 来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.

  2. 教学例题:

  例2 关于 与 有如下数据:

  2  4  5  6  8

  30  40  605070

  为了对 、 两个变量进行统计分析,现有以下两种线性模型: , ,试比较哪一个模型拟合的效果更好.

  用样本的频率分布估计总体的分布学案

  j.Co M

  学案4 用样本的频率分布估计总体的分布

  【课标导航】

  (1) 通过实例体会分布的意义和作用.

  (2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.

  (3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.

  重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.

  难点:能通过样本的频率分布估计总体的分布.

  【知识导引】

  在NBA的2011赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下?

  甲运动员得分?12,15,20,25,31,31,36,36,37,39,44,49,50

  乙运动员得分?8,13,14,16,23,26,28,38,39,51,31,29,33

  请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?

  如何根据这些数据作出正确的判断呢?

  【自学导拨】

  1.频率分布表

  当总体很大或不便获得时,可以用样本的频率分布估计总体的频率分布,我们把反映 的表格称为频率分布表.

  2.绘制频率分布直方图的一般步骤为:

  (1)计算 ,即一组数据中最大值与最小值的差;

  (2)决定 ;

  ○1组距与组数的确定没有确切的标准,将数据分组时组数应力求合适,以使数据的发布规律能较清楚地呈现出来.

  ○2组数与样本容量有关,一般样本容量越大,分的组数也越多,当样本容量为100时,常分8~12组.

  ○3组距的选择.组距= ,组距的选择力求取整,如果极差不利于分组(不能被组数整除)可适当增大极差,如在左右两端各增加适当的范围(尽量使两端增加的量相同).

  (3)决定 ;

  (4)列 ;一般为四列:分组、个数累计、频数、频率最后一行是合计,其中频数合计应是 ,频率合计是

  (5)绘制频率分布直方图.为将频率分布直方图中的结果直观形象的表示出来,画图时,应以横轴表示分组,纵轴表示 ,其相应组距上的频率等于该组上的长方形的面积,即每个 ,且各小长方形的面积的总和等于 ..

  3.频率分布折线图

  连接频率分布直方图中 的中点,就得到频率分布折线图.

  4.总体密度曲线

  随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的 图会越来越接近于一条 ,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.

  5.茎叶图

  当样本数据 时,用茎叶图表示数据效果较好,它不但可以便于记录,而且统计图上没有原始数据的损失,所有的数据都可以从茎叶图中得到.

  画茎叶图的`步骤:(1)将数据分为“茎”(高位)和 “叶”(低位)两部分.

  (2)将最小茎和最大茎之间的数按大小次序排成一列.

  (3)将数据的“叶”按大小次序写在其茎右(左)侧.

  6.几种表示频率分布的方法的优点与不足:

  (1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.

  (2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了.

  (3)频率分布折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.

  (4)用茎叶图的优点是原有信息不会被抹掉,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.

  【教材导学】

  【例1】:从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高的样本,数据如下(单位:cm).试作出该样本的频率分布表.

  168165171167170165 170 152 175 174

  165 170168 169 171 166 164 155 164 158

  170 155 166 158 155 160 160 164 156 162

  160 170 168 164 174 171 165 179 163 172

  180 174 173 159 163 172 167 160 164 169

  151 168 158 168 176 155 165 165 169 162

  177158 175 165 169 151 163 166 163 167

  178 165 158 170 169 159 155 163 153 155

  167 163 164 158 168 167 161 162 167 168

  161 165 174 156 167 166 162 161 164 166

  【点拨】:确定组距与组数是解决“样本中的个体取不同值较多”这类问题的出发点.本题需根据绘制频率分布直方图的步骤完成.

  【解析】:最大值=180,最小值=151,

  极差=29,决定分为10组;

  则需将全距调整为30,组距为3,既每个小区间的长度为3,组距=全距/组数.

  可取区间[150.5, 180.5]

  分组 频数 频率

  [150.5,153.5) 4 0.04

  [153.5,156.5) 8 0.08

  [156.5,159.5) 8 0.08

  [159.5,162.5) 11 0.11

  [162.5,165.5) 22 0.22

  [165.5,168.5) 19 0.19

  [168.5,171.5) 14 0.14

  [171.5,174.5) 7 0.07

  [174.5,177.5) 4 0.04

  [177.5,180.5) 3 0.03

  合计 100 1

  频率分布直方图为:

  【反思】:在列频率分布表时,先求极差再分组,注意分组不能太多也不能太少,往往把第1小组的起点稍微减小一点,同时要牢固掌握列频率分布表及绘制频率分布直方图是步骤与方法.

  【变式练习一】:下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高

  (单位cm)

  (1)列出样本频率分布表?

  (2)一画出频率分布直方图;

  (3)估计身高小于134cm的人数占总人数的百分比..

  【例2】:从全校参加科技知识竞赛的学生试卷中,抽取一个样本,考察竞赛的成绩分布.将样本分成5组,绘成频率分布直方图(如图),图中从左到右各小组的小长方形的高的比是1∶3∶6∶4∶2,最后边一组的频数是6.请结合频率分布直方图提供的信息,解答下列问题:

  (1)样本的容量是多少?

  (2)列出频率分布表;

  (3)成绩落在哪个范围内的人数最多?并求该小组的频数、频率;

  (4)估计这次竞赛中,成绩不低于60分的学生占总人数的百分比.

  【点拨】:本题主要考察频率分布直方图的应用,考察识图、用图的能力,运用频率分布直方图的知识解答.

  【解析】:(1)由于各组的组距相等,所以各组的频率与各小长方形的高成正比且各组频率的和等于1,那么各组的频率分别为116,316,616,416,216.设该样本容量为n,则6n=216,所以样本容量为n=48.

  (2)由以上得频率分布表如下:

  成绩频数频率

  [50.5,60.5)3116

  [60.5,70.5)9316

  [70.5,80.5)18616

  [80.5,90.5)12416

  [90.5,100.5)6216

  合计481

  (3)成绩落在[70.5,80.5)之间的人数最多,该组的频数和频率分别是18和38.

  (4)不低于60分的学生占总人数的百分比约为

  1-116×100%≈94%.

  【反思】:(1)频率分布直方图中, ,所以各小长方形的面积表示相应各组的频率,各小长方形的面积的总和等于 .

  (2)样本容量= .

  【变式练习二】: 某校为了了解高一年级学生的体能情况,抽调了一部分学生进行一分钟跳绳测试,将测试成绩整理后作出如下统计图,甲同学计算出前两组的频率和是0.12,乙同学计算出跳绳次数不少于100次的同学占96%,丙同学计算出从左至右第二、三、四组的频数比为4:17:15,结合统计图回答下列问题:

  (1)这次共抽调了多少人?

  (2)若跳绳次数不少于130次为优秀,则这次测试成绩的优秀率是多少?

  【例3】:某中学高一(1)班甲、乙两名同学自高中以来每场数学考试成绩如下:

  甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;

  乙的得分:83,86,93,99,88,103,98,114,98,79,101.

  画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较.

  【点拨】:用中间的数字表示两位同学得分的十位数和百位数,两边的数字分别表示两人每场数学考试成绩的个位数.

  【解析】:甲、乙两人数学成绩的茎叶图如图所示:

  甲 乙

  从这个茎叶图可以看出,乙同学的得分情况是大致对称的,中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是89.因此乙同学发挥比较稳定,总体得分情况比甲同学好.

  【反思】:茎叶图由“茎”和“叶”两部分构成,绘制茎叶图的关键是设计好树茎,通常是以该组数据的高位数值作为树茎,树茎一经确定,树叶就自然地长在相应的树茎上了.

  【变式练习三】:

  在某电脑杂志的一篇文章中,每个句子的字数如下:

  10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.

  在某报纸的一篇文章中,每个句子的字数如下:

  27,39,33,24,28,19,32,41,33,27,36,23,36,41,27,13,22,23,18,46,32,22.

  (1)将这两组数据用茎叶图表示.

  (2)将这两组数据进行比较分析,得到什么结论?

  【思悟小结】

  (由学生完成)

  【基础导测】

  1.将一个容量为n的样本分成若干组,已知某组的频数和频率分别为40和0.125,则n的值为

  (A)640(B)320(C)240(D)160

  2.下面给出4个茎叶图

  则数据6,23,12,13,27,35,37,38,51可以由图 ______表示

  3.一个容量为32的样本,已知某组样本的频率为0.0625,则该组样本的频数为

  A 2 B.4 C.6 D.8

  4.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg),得到频率分布直方图,如图,据图可得这100名学生中体重在[56.5,64.5) kg的学生人数是( )

  (A)20(B)30(C)40(D)50

  5.(2010福建文) 将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n等于 .

  6.(2010江苏卷)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm.

  7.(2010?福州高一检测)甲、乙两个小组各10名学生的英语口语测试成绩如下(单位:分):

  甲组:76 90 84 86 81 87 86 82 85 83

  乙组:82 84 85 89 79 80 91 89 79 74

  用茎叶图表示两个小组的成绩,并判断哪个小组的成绩更整齐一些.

  8. 观察下面表格:

  (1)完成表中的频率分布表;

  (2)根据表格,画出频率分布直方图;

  (3)估计数据落在[10.95,11.35)范围内的概率约为多少?

  分组频数频率

  [10.75,10.85)3

  [10.85,10.95)9

  [10.95,11.05)13

  [11.05,11.15)16

  [11.15,11.25)26

  [11.25,11.35)20

  [11.35,11.45)7

  [11.45,11.55)4

  [11.55,11.65)2

  合计100

  【知能提升】

  1. 对于样本频率分布折线图与总体密度曲线的关系,下列说法正确的是( )

  A.频率分布折线图与总体密度曲线无关

  B. 频率分布折线图就是总体密度曲线

  C.样本容量很大的频率分布折线图就是总体密度曲线

  D如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线

  2.为了解一片经济林的生长情况,随机测量了其中100

  株树木的底部周长(单位:cm).根据所得数据画

  出样本的频率分布直方图(如右图),那么在这100

  株树木中,底部周长小于110cm的株数是( )

  A.30 B.60 C.70 D.80

  3.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……;第六组,成绩大于等于18秒且小于等于19秒.如图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为( )

  (A)0.9,35(B)0.9,45

  (C)0.1,35(D)0.1,45

  4.某商场在国庆黄金周的促销活动中,对10月2日9时至14时的销售额进行统计,其频率分布直方图如图1所示,已知9时至10时的销售额为2.5万元 ,则11时至12时的销售额为

  A. 6万元 B. 8万元

  C. 10万元 D. 12万元

  5.甲、乙两个班级各随机选出15名同学进行测验,成绩的

  茎叶图如图所示.则甲、乙两班的最高成绩分别是 ______,

  ______.从图中看 ______班的平均成绩较高.

  6. (2010北京理)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a= .若要从身高在[ 120 , 130),[130 ,140) , [140 , 150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140 ,150]内的学生中选取的人数应为 .

  7.从高一学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):

  [40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.

  (1)列出样本的频率分布表;

  (2)画出频率分布直方图;

  (3)估计成绩在[60,90)分的学生比例;

  (4)估计成绩在85分以下的学生比例.

  8.50辆汽车经过某一段公路的时速记录如图所示:

  将其分成7组.

  (1)列出样本的频率分布表;

  (2)画出频率分布直方图以及频率分布折线图;

  (3)根据上述结果,估计汽车时速在哪组的几率最大?

  9. 在育民中学举行的电脑知识竞赛中,将高一两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.

  (1)求第二小组的频率,并补全这个频率分布直方图;

  (2)求这两个班参赛的学生人数是多少?

  (3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)

  【数学探究】

  (2010湖北文)为了了解一个小水库中养殖的鱼有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示)

  (Ⅰ)求出各组相应的频率;

  (Ⅱ)估计数据落在[1.15,1.30)中的百分比为多少;

  (Ⅲ)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.

【回归分析的基本思想及其初步应用知识点整理】相关文章:

独立性检验的基本思想及其初步应数学知识点11-11

初二物理透镜及其应用知识点整理10-01

透镜及其应用物理知识点11-08

透镜及其应用的物理知识点10-13

初二数学数据的整理与初步处理知识点10-31

小学奥数二进制及其应用知识点分析07-13

C语言知识点及其简单应用04-12

高考数学导数的应用必考知识点整理01-27

初二物理透镜及其应用的知识点10-06