欢迎来到课桌文档! | 帮助中心 课桌文档-建筑工程资料库
课桌文档
全部分类
  • 党建之窗>
  • 感悟体会>
  • 百家争鸣>
  • 教育整顿>
  • 文笔提升>
  • 热门分类>
  • 计划总结>
  • 致辞演讲>
  • 在线阅读>
  • ImageVerifierCode 换一换
    首页 课桌文档 > 资源分类 > DOCX文档下载  

    成对数据的统计分析 第2课时 成对数据的统计相关性.docx

    • 资源ID:266237       资源大小:136.40KB        全文页数:12页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    成对数据的统计分析 第2课时 成对数据的统计相关性.docx

    8.1成对数据的统计相关性(2课时,单元教学设计)柴化安(安徽省寿县第一中学)1教学内容和内容解析1.1 内容第I课时:变量的相关关系,主要包括变量的相关关系,散点图,正相关、负相关和线性相关等.第2课时:样本相关系数,主要包括如何构造相关系数以及相关系数的特性.1.2 内容解析本节课是人教A版选择性必修第三册第八章“成对数据的统计分析”中8.1的内容,是必修课程中统计知识的进一步延伸.通过必修课程的学习,学生初步建立了用样本估计总体的思想.本节课主要结合典型案例,利用成对样本数据的统计相关性,研究两个变量之间的统计相关性.对于成对样本数据研究两个变量的相关关系.根据先宜观描述后定量刻画的统计中研究问题的一般思路,本节课先由成对样本数据的散点图直观推断变量之间的相关关系,再构造统计量相关系数,让学生感受由宜观想法到严格数学表达的逐步转化过程.利用从特殊到一般的研究方法,掌握样本相关系数绝对值的大小可以刻画样本相关程度的强弱,进一步推断两个变量之间相关的正负性和线性相关程度的强弱,为后面利用一元回归模型刻画两个数值变量的相关关系,并利用估计得到的回归方程进行预测奠定基础,也为后面通过抽样数据推断分类变量的独立性,构建力?统计量做了思想方法上的铺垫.2目标和目标解析2.1目标(1)通过实例,了解变量的相关关系,会区别变量之间的函数关系和变量之间的相关关系.(2)利用给出的数据画散点图,通过散点图判断两个变量间的正相关、负相关以及线性相关.(3)结合实例,了解样本相关系数的统计含义,了解样本相关系数与“标准化”处理后的成对数据量分量向量夹角的关系.通过实例,会通过相关系数比较多组成对数据的相关性.2.2目标解析(1)通过实例,让学生认识到变量的相关关系是普遍的关系,理解学习变量的相关关系的必要性.通过“提出问题抽样调查画散点图f作出推断”的方式,先直观描述再定量刻画,利用散点图判断两个变量间是否具有相关关系.(2)通过数据研究问题,用成对样本数据呈现的统计相关性去估计变量之间的相关性,散点图知识初步阶段,散点图无法定量刻画成对样本数据相关程度的强弱,因此要构造新的统计量.在构造样本相关系数的过程中,先初步建立刻画相关性的数学表达式,再逐步优化表达式,即对数据所做的“中心化”和“标准化”等处理,这些处理是统计学中常用的处理数据的方法,是一种重要的“标准化”思想,渗透了理性思维和科学精神.3教学问题诊断分析(1)问题诊断学生在在人教A版数学必修第二册的“统计”中的学习中,对于用样本估计总体的统计思想有一定的了解,基于数据观察、宜观表示及统计特征的刻画等相关知识和方法,研究了刻画单个变量特征的基本量,如均值、方差、中位数、众数等.这为本节课研究两个变量间的关系相关程度的强弱奠定了一定的基础.本节课结合现实生活中的具体实例,以样本估计总体为主要思想,在成对样本数据散点图的基础上,定量研究成对样本数据的线性相关的强弱.(2)学生可能存在的困难学生经过函数的学习,对于两个变量之间的确定性关系先入为主,对学生相关关系的理解可能产生负迁移.在构造样本相关系数的过程中,对“中心化”和“标准化”处理的理解可能存在困难;在优化公式表达式的过程中,对公式烦琐的化简过程和符号表示的理解存在一定困难;对探究样本相关系数大小与相关性强弱的关系存在困难.(3)教学难点是通过散点图判断成对数据的相关性和样本相关系数的构造.4教学支持条件分析借助EXCel等软件等制作课件,并进行数据处理,增强学生对数据分析的兴趣,提高教学效果.6课时教学设计2第二课时1.1 教学内容样本相关系数,主要包括如何构造相关系数以及相关系数的特性.1.2 教学目标(1)结合实例,由散点图的图象特征构建线性相关系数的数学表达式,了解样本相关系数的绝对值大小与相关性强弱的关系;能使用统计软件分析数据,能对统计结果做出合理的解释.(2)通过逐步优化构建相关系数的过程,体会样本相关系数定义的合理性,积累利用数学工具刻画数据统计特征的经验,了解“中心化”“标准化”是常用的处理数据的方法,能用统计的眼光看待问题,培养学生的数据分析、数学建模、逻辑推理素养.1.3 教学重与难点教学重点:样本相关系数表达式的构建、优化过程及范围确定.教学难点:理解“中心化”“标准化”处理的必要性和合理性.1.4 教学过程设计6. 4.1温故知新,提出问题引导语:我们现在学习统计。研究统计问题的一般流程是什么?收集数据,整理数据,分析数据,作出推断预测。上节课我们借助“人体的脂肪含量与年龄”、“航班正点率与顾客投诉次数”等案例,学习两个变量的相关关系,这是现实世界中比函数关系更为普遍的两个变量的关系.我们如何判断两个变量之间的相关性?可以根据经验做出推断,更好的是借助数据说话,利用成对数据的散点图直观推断.通过观察散点图中成对数据的分布规律,大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关问题1:观察下面四幅图中,哪些图可以推断两个变量是相关的?哪些图表示的成对数据的相关性较强?引导语散点图虽然很直观,但无法确切地反映成对样本数据的相关程度,但是这些推断都只是定性推断,也就无法量化两个变量之间相关程度的大小.能否像引入平均值、标准差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析,即从定量的角度刻画成对样本数据的线性相关程度呢?追问:假设一组数据是占,X2,X”,用X表示这种数据的平均数,那么请同学们回忆这组数据的标准差的概念及其意义.师生活动:这种数据的标准差是S=JJW(Xi-1)2.标准差刻画了数据的离散程度或波动大小,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.设计意图:这是上节课留下的问题,通过散点图只能定性判断是否相关,通过类比单个变量数据的数字特征,引出本节课的研究目标一一构建一个统计量来定量刻画线性相关程度的强弱,提出构造统计量刻画成对数据相关性数字特征的必要性和可能性.7. 4.2问题引领,构建统计量对于变量X和变量y,设经过随机抽样获得的成对样本数据为(大,),(冗2,%),(乙,),其中平均数分别为=,+X2+L+X”),y=4(y+%+L+%),标准差问题2:对于具有线性相关的两个样本数据的散点图,我们考虑能否在不改变分布的情况下,将散点移到同一个点附近,以便更好地观察其分布特点.移到哪个点附近比较合适?设计意图:让学生感知,要研究数据,就要把数据放到统一的“环境中”,在一致的“环境”下观察散点的分布特点,从而合理构造度量标准,通过数刻画图形中散点分布的特点.师生活动:移到原点附近最好,因为原点在坐标系中最特殊.追问:怎样将点(士,乂),(£,必),(王,丹)都移到原点附近?师生活动:将每个点的坐标减去他们各自的平均数,这是统计中一个重要的数据处理方法,对样本数据进行“中心化”处理将样本数据以Gj)为零点进行平移,得平移后的成对数据为(X-%y-y),(2-,y2-j),(怎一问题3:针对8.1.1中的数据进行“中心化”处理.“中心化”处理后散点集中在原点附近.如图,两个变量正相关“中心化”处理后的散点图,你观察有什么特点?师生活动:将样本数据“中心化”处理后,正相关的散点大多数分布在第一、三象限,大多数散点横、纵坐标同号;负相关的散点大多数分布在笫二、四象限,大多数散点横、纵坐标异号.问题4:你能根据上述特点,构造一个度量成对样本数据是正相关还是负相关的统计量吗?设计意图:数据“中心化”处理以后,成对数据大多数散点分布在一、三象限或二、四象限,可以让学生用一个量来表示,学生可以充分感知“中心化”处理的必要性和合理性.师生活动:Lxy=(,-)(y1-y)÷2-v)(y2->,)+(-)(yn-y)-这个公式形式简单,具有对称性,比较合适.追问L如何解决数据个数对它的影响?生:我们可以除以数据的个数,就能够得到L4=()-)(y1-y)+(¾-)(y2-y)+-+(,-)(.v-y)-一般情形下,4,>O表明成对样本数据正相关;4y<O表明成对样本数据负相关.追问2:你认为Lxy的大小一定能度量出成对样本数据的相关程度吗?师生活动:因为Lq的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程度的大小.例如,在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高的单位由米改为厘米,则相应的将变为原来的IOO倍,但单位的改变并不会导致体重与身富之间的相关程度的改变.如何解决这一问题呢?设计意图:数据“中心化”处理以后,可以让学生用一个量的正负来表示正相关和负相关,但是由于样本单位不同,导致数值大小不一样,为下一步“标准化”操作的合理性奠定基础.师生活动:可以同时除以一个数,消除单位对它的影响.追问3:同除以什么数呢?观察“中心化”的每个数,(l-,y-y),(%一无,一),(X”-以一亍),它与我们学过的哪个数有关呢?师生活动:与标准差有些类似.为了消除单位对数据的影响,将其除以各自的标准差,这在统计学当中经常用到.我们把这种处理方式叫做“标准化”处理.也就是用SX=J(i-)2,SV=-y)2分别除Xi-X和yi-y(i=i,2,l,),得7-Xy-y×2-y2-yn-yn-yy,,,ISXsy八,syISXSy)经过两次处理,用图看一下处理后的点的分布情况,帮助我们理解统计量的建构过程.大家试着用原始数据表示相关系数,将上述“标准化”处理后的成对数据分别记为(X,(匕川),设计意图:通过两个步骤的处理,让学生体会定义的合理性,积累利用数学工具刻画统计特征的经验.构造相关系数过程中对数据的“中心化”和“标准化”处理,是统计中常用的处理数据的方法,也是一种重要的“标准化”思想.6.4.3确定范围,理解概念构建概念后,为了确定线性相关系数的范围与相关性强弱的关系,按照从特殊到一般的研究方式,探究样本相关系数的性质,帮助学生深入理解概念.问题5:你能根据上述定义确定样本相关系数的取值范围,并进一步判断的大小与成对样本数据相关程度之间的关系吗?追问1:观察表达式,与我们学过的哪个量有关?你能从特殊入手发现它们之间的关系吗?设计意图:确定了表达式,需要进一步了解样本相关系数的大小和相关性强弱的关系.当遇到一个复杂的问题不能解决时,最好的解决办法是先从特殊的、简单的情况入手,由此体会从特殊到一般的研究问题的流程及方法.2_Z(Xj-x)(y-y)师生活动:我们发现,当=2时,r=-f=,相关系数看起J(-2J(y,-y)2来与两个向量的夹角公式类似;当=3时,可以看作空间向量相应的内容.由此推广,构造两个维向量a=(',4,L8=(乂,必',1,4),则有a=My:+'÷l+xn>fn,炉M才H=«,1rrrllrlrrrr11所以厂=(助)=一,忖cos<,b>=cos<,b>=cos6,其中。为向量。,务的夹角.由此得到,样本相关系数,就是标准化数据夹角的余弦值,所以r-l,l,即N0,l.追问2:当卜|=1时,成对样本数据之间具有怎样的关系?当N=I时,z=cos。中的夕=0或乃,向量;和力共线.由向量的知识可知,存在实数%,使得b=4a,即二i-=A,-,i=1,2,LSySX这表明成对样本数据(xpX)都落在直线y=(X-X)上.这时,成对样本数据的Sx两个分量之间满足一种线性关系.由此可见,样本相关系数,的取值范围为-1,1,样本相关系数r的绝对值大小可以反映成对数据之间线性相关的程度.当H越接近1时,成对样本数据的线性相关程度越强.当H越接近0时,成对样本数据的线性相关程度越弱.追问3:当r=0时,成对样本数据之间一定不相关吗?请以下表的成对数据,计算相关系数,说明问题。X-2-1012y41014设计意图:帮助学生进一步理解样本相关系数r的大小在统计中的含义.说明:当r=0时,成对样本数据之间不一定不相关,只能说它们之间没有线性相关关系,但不能排除它们之间具有其他相关关系.因此,一也称为样本线性相关系数.解决开始提出的问题.我们给出不同成对样本数据的散点图和相应的样本相关系数.图(I)中的散点有明显的从左下角到右上角沿直线分布的趋势,说明成对样本数据呈现出线性相关关系;样本相关系数r=0.97,表明成对样本数据的正线性相关程度很强.图(2)中的散点有明显的从左上角到右下角沿直线分布的趋势,说明成对样本数据也呈现出线性相关关系;样本相关系数r=-0.85,表明成对样本数据的负线性相关程度比较强.从样本相关系数来看,图(1)中成对样本数据的线性相关程度要比图(2)中强一些;图(3)和图(4)中的成对数据的线性相关程度很弱,其中图(4)中成对样本的线性相关程度极弱.师生活动:两个随机变量的相关性可以通过成对样本数据进行分析,而样本相关系数r可以反映两个随机变量之间的线性相关程度:1的符号反映了相关关系的正负性;I川的大小反映了两个变量线性相关的程度,即散点集中于一条直线的程度.在有限总体中,若要确切地了解两个变量之间相关关系的正负性及线性相关的程度,我们可以利用这两个变量取值的所有成对数据,通过计算出两个变量的相关系数,就能确切地反映变量之间的相关程度.在实际问题中,我们还是要用样本估计总体的思想来解决问题.我们先要通过抽样获取两个变量的一些成对样本数据,再计算出样本相关系数,通过样本相关系数去估计总体相关系数,从而了解变量之间的相关程度.对于简单随机样本而言,样本具有随机性,因此样本相关系数一也具有随机性.一般地,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.6.4.4学以致用,巩固新知例L根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.编号1234567年龄/岁23273941454950脂肪含量/%9.517.821.225.927.526.328.2编号891011121314年龄/岁53545657586061脂肪含量/%29.630.231.430.833.535.234.6解:先画出散点图,如图所示.观察散点图,可以看出样本点4035都集中在一条直线附近,由此推断220脂肪含量和年龄线性相关.M根据样本相关系数的定义,(xi-x)(yi-y)xiyi-Mxy=,=1_i=混(3F混(另一唇-血混"仃利用计算工具计算可得X48.07,y27.26,.y.=19403.2,xr2=I-IZ-I脂肪含成仅1:520253035404550556065年龄/岁一.234181,V2=11051.77,Z-I19403.2-14×48.07×27.2634181-14X48.072×11051.77-14×27.2620.97代入式得,由样本相关系数。097,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.例2.有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.第n年12345678910居民年收入/亿元32.231.132.935.837.138.039.043.044.646.0A商品销售额/万元25.025.025.025.025.025.025.025.025.025.0画出散点图,推断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.解:画出成对样本数据的散点图,如图所示.从散点图看,A商品销售额与居民年收入的样本数据呈现出线性相关关系.由样本数据计算得样本相关系数rk.95.由此可以推断,A商品销售额与居民年收入正线性相关,即A商品销售额与居民年收入有相同的变化趋势,且相关程度很强.设计意图:通过练习巩固本节所学知识,学生通过解决问题,发展学生的数学运算素养.例3.在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如表所示.编号身高/cm体重kg臂展/cm编号身高/cm体重kg臂展/cm1173551691416666161217971170151766116631755217216176491654179621771717560173518282174181694816261736316619184861897180551742016958164817081169211825417091695416622171581641017754176231776117311177591702417358165121786017425173511691317456170体重与身高、臂展与身高分别具有怎样的相关性?解:根据样本数据画出体重与身高、臂展与身高的散点图,分别如图(1)和(2)所示,两个散点图都呈现出线性相关的特征.通过计算得到体重与身高、臂展与身高的样本相关系数分别约为034和0.78,都为正线性相关,其中,臂展与身高的相关程度更高.6.4.5即时练习,熟练掌握1、教科书第103页练习第4题随机抽取7家超市,得到其广告支出与销售额数据如下:超市ABCDEFG广告支出/万元1246101420销售额/万元19324440525354请推断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征.2、2020年新课标全国卷文科数学第18题第(2)题某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据&,yji=12,20),其中为和以分别表示第i20个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得XXj=60,Z=IX>7=1200,(x,-x)2=80,S(Vi-胡=9000,W再.7XK-y)=800.=l/=1r=l=l求样本(知(i=12.,20)的相关系数(精确到0.01);U-¾-y)附:相关系数r=-j=l21.414.J(-)2U-3)2Vi=li=l6.4.6归纳小结,反思提升学生先梳理,老师再完善,形成思维导图.师生活动:判断变量的相关性通常有两种方式:1.散点图;2.相关系数匚前者只能粗略地说明变量间具有相关性,而后者可以从定量的角度分析变量相关性的强弱.M的大小1阳关IWl的修找6.4.7布置作业,训练反馈教科书第103页练习第1、2、3、4题;教科书第103页习题8.1第1、2、3题.6.5目标检测设计2022年全国乙卷理科数学第19题第(2)题某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:加2)和材积量(单位:加3),得到如下数据:样本号i12345678910总和根部横截面面积Xl0.040.060.040.080.080.050.050.070.070.060.6材积量y10.250.400.220.540.510.340.360.460.420.403.9IO1010并计算得S>2=0038,2=1-6158,£%必=0.2474./=II-I/-I略;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);U-)(yr-y)附:相关系数'.二J“,1.8961.377.J(i-)2(yi-y)2

    注意事项

    本文(成对数据的统计分析 第2课时 成对数据的统计相关性.docx)为本站会员(夺命阿水)主动上传,课桌文档仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知课桌文档(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-1

    经营许可证:宁B2-20210002

    宁公网安备 64010402000986号

    课桌文档
    收起
    展开