研究生应用统计学讲义.ppt
《研究生应用统计学讲义.ppt》由会员分享,可在线阅读,更多相关《研究生应用统计学讲义.ppt(122页珍藏版)》请在课桌文档上搜索。
1、应用统计学,本课程的内容第一章 绪论第二章 统计数据的搜集、整理和 显示第三章 统计数据的描述分析第四章 参数估计第五章 参数假设检验第六章 方差分析第七章 非参数统计方法第八章 时间序列分析 第九章 相关与回归分析第十章 统计指数,教材:吴诣民 赵春艳应用统计学 陕西人民教育出版社,2006年。参考书目:1、李心愉应用经济统计学北京:北京大学出版社,2003年。2、耿修林商务经济统计学北京:科学出版社,2003年3、美戴维 R 安德森等商务与经济统计北京:中信出版社,2003。4、肖筱南新编概率论与数理统计北京:北京大学出版社,2002年。,第一章 绪论,第一节 统计学的学科性质一、统计学的
2、学科性质1、争论:“方法论学科”“实质性学科”2、统计处理数据的过程:搜集数据整理数据分析数据解释数据,二、统计学的分类1、描述统计学和推断统计学2、理论统计学和应用统计学,第二节 统计学的几个基本概念一、总体和总体单位1、总体是由具有某种共同性质的许多个体组成的整体,构成总体的个体称为总体单位。2、两层含义:统计学研究的是大量现象的数量特征,总体包含了大量现象;统计单位具有某一共同性质,但其他的性质、特征是不同的,便于在差异中寻找规律。,二、标志和指标1、标志是说明总体单位特征和属性的名称,分为数量标志和品质标志。2、指标是说明总体现象数量特征的概念和数值。按其反映数量特点的不同,分为数量指
3、标和质量指标。,三、统计指标1、从总体的一个特征到具体数值,中间有很多步要走。2、以GDP的核算为例来说明想看一国一年内生产活动的总量,定义GDP是一国在一定时期内最终产品的总价值。(内涵)最终产品是本期生产本期不再投入生产使用的产品,消费、投资、出口产品。(外延),跟踪所有产品的使用去向,再核算其价值是不可能的。部门增加值核算方法(计算方法)棉花纱布 印染衣服300350460580 880部门增加值30050110120 300最终产品的总价值=880部门增加值合计=300+50+110+120+300=880时间、空间、计量单位,第二章 统计数据的搜集、整理和显示,第一节 统计数据的搜集
4、一、统计调查方式统计报表制度、普查、抽样调查、典型调查、重点调查,例2.1、一批钢材,抽样测试其抗张力,随机抽取76个样本观察值如下:(单位:kg/cm2)41.0 37.0 33.0 44.2 30.5 27.0 45.0 28.5 40.6 34.831.2 33.5 38.5 41.5 43.0 45.5 42.5 39.0 36.2 27.538.8 35.5 32.5 29.5 32.6 34.5 37.5 39.5 35.8 29.142.8 45.1 42.8 45.8 39.8 37.2 33.8 31.2 31.5 29.529.0 35.2 37.8 41.2 43.8 4
5、8.0 43.6 41.8 44.5 36.536.6 34.8 31.0 32.0 33.5 37.4 40.8 44.7 40.0 41.540.2 41.3 38.8 34.1 31.8 34.6 38.3 41.3 44.2 37.130.0 35.2 37.5 40.5 38.1 37.3,第二节 数据的整理一、统计分组1、统计分组是将统计总体按照一定标志区分成若干个组成部分的一种统计分析方法。2、两点注意:有时不易确定组与组之间的界限;穷尽原则、互斥原则。,二、频数分布数列1、统计分组后,每个组分配的总体单位数称为频数或次数,频数/总体单位总数=频率。2、意义整理了杂乱无章的数据,
6、同时显示出一批数的分布情况,是数理统计学中随机变量及其概论分布概念在实际中的应用。,3、分类:按分组标志的不同,分为:品质数列 单项数列:一个变量值是一个组变量数列 组距数列:两个变量值构成的区间是一个组,三、组距分布数列的编制方法第一步,排序后,极差=max-min第二步,确定组数、组距。组数 k=1+3.32lgn(参考)组距=(max-min)/组数第三步,组中值。组中值=(下限+上限)/2,四、累计频数分布数列1、各组频数向上、向下累计形成的数列。2、在经济学中的应用。洛伦茨曲线基尼系数=A/(A+B),第三节 数据显示统计表和统计图一、统计表1、表的格式:横行标题:对象(总体(常以年
7、份形式表示)、总体分组、总体各单位)纵栏标题:统计指标交叉部分:指标值2、注意事项:数据居中,小数点对齐左右不封口;表下面注明资料来源。,二、统计图,第三章 统计数据的描述分析,第一节 集中趋势分析集中趋势是数据分布的中心,描述集中趋势的指标有算术平均数、中位数、众数等。,某单位80个工人生产的零 单位:个65 78 88 65 58 76 69 66 80 64 77 78 60 65 85 74 73 65 66 79 74 85 59 69 60 87 85 86 64 93 76 62 91 49 74 78 75 79 86 68 87 97 92 82 66 94 75 56 85
8、 77 67 89 78 79 88 83 73 69 84 95 55 79 77 58 80 68 77 87 70 78 79 61 47 69 89 96 66 76 81 99Min=47 max=99,一、算术平均数(均值)1、将一批数累加起来,除以数据的个数,即为算术平均数。2、分为简单算术平均数和加权算术平均数,例、某单位80工人一周生产零件数。1、简单算术平均数2、加权算术平均数,3、算术平均数与数学期望对于离散型随机变量X,设它的概率密度函数P(Xi)为,则的数学期望为对于连续型随机变量X,设其概率密度函数为f(X),则的数学期望为,4、算术平均数的缺陷10 15 20 2
9、5 70去掉70后,,二、众数(M0)1、众数是指一组变量值中出现次数最多的变量值。2、众数的确定未分组资料,M0就是出现次数最多的变量值。上例中,78、79各出现5次,都是M0数据分布是双峰的。,分组资料:在等距分组的情况下,频数最多的组是众数组,在该组内确定众数。,例、上例中众数组是第3组,,三、中位数及分位数1、中位数把一批数按照从小到大的顺序排列,处于数列中点的变量值就是Me确定方法未分组资料:(n+1)/2中位数的位置。前例Me=77分组资料:根据向上或向下累计频数分布数列,按照 确定中位数所在的组,然后确定。,2、百分位数把数据按从小到大的顺序排列后,第P百分位数是指有P%的值小于
10、或等于它,而有(100-P)%的值大于或等于它。确定方法。i=(P/100)n就是第P百分位数的位置。其中最常用的是四分位数。即把数据分成四个部分,每个部分包括1/4数值。,第二节 离中趋势分析一、离中趋势1、离中趋势是数据分布的又一特征,它表明变量值的差异或离散程度。2、意义:首先,可以衡量算术平均数的代表性。例:均值都为150的两组数 50,100,150,200,250 100,125,150,175,200其次,进行产品质量管理和决策。3、离中趋势测度经常用到的指标有:极差、方差和标准差、四分位差等,它们也被称为变异指标。,二、极差1、极差也称为全距,是一组变量中最大值与最小值的离差,
11、表明变量值变动的范围。用R表示极差,其计算公式是:2、缺点:易受极端值的影响。,三、四分位差1、四分位差用数列中第3/4位次与1/4位次的变量值之差除以2来表示。2、意义:剔除了极端值,说明50%数据分布的范围;与中位数配合说明数据分布是否对称。若分布对称,则Q2-Q1=Q3-Q2=(Q3-Q1)/2若不相等,则是非对称的。,四、平均差1、平均差是指变量值与其算术平均数的离差绝对值的算术平均数,用符号AD表示。计算公式:2、优缺点,五、方差与标准差1、方差与标准差是测定离中趋势最常用的指标。标准差是方差的平方根,也称均方差。2、计算公式:样本方差和标准差要除以n-1,才是总体的无偏估计。3、标
12、准差系数,第三节 偏度和峰度分析一、矩的概念1、矩是力学概念,用来表示力和力臂对中心的关系。统计学中借用这一概念讨论随机变量的分布特征。2、统计学中,将矩定义为原点矩和中心矩。原点矩的定义是:k为整数,称为k阶原点矩,中心矩的定义是:,3、中心矩的两个重要性质:分布对称时,奇数阶中心矩恒为零;当分布为正态分布时,偶数阶中心矩有,二、偏态1、分布的偏态就是分布不对称的方向和程2、它的测量主要是两种方法,一种是矩法,二是Pearson偏态系数。Pearson偏态系数以平均数与众数之差除以标准差来衡量偏斜程度,用SK表示。其计算公式为:当SK=0时,呈对称分布;当SK0时,分布是右偏(正偏)的;当S
13、K0时,分布是左偏(负偏)的。,矩法估计就是利用中心矩来衡量分布的偏度。用公式表示为:例、前例数据的偏度分析。,三、峰度1、峰度是变量分布的又一性质,它指的是分布曲线的高峰形态,也是分布曲线的尖峭程2、衡量指标:峰度是用变量的四阶中心矩除以标准差四次方,并将结果再减3,用公式表示为:,3、正态分布的四阶中心矩系数,亦即峰度指标就是以正态分布的峰度为比较标准,判断实际分布曲线的尖峭程度。当峰度指标 0时,表示频数分布比正态分布更集中,分布呈尖峰状态;0时表示频数分布比正态分布更分散,分布呈平坦峰。例、前例数据的峰度分析,第四章 参数估计,第一节 随机变量与概论分布随机现象随机变量概论分布离散型和
14、连续型随机变量,第二节 统计量与抽样分布一、几个基本概念1、总体和样本研究对象的全体称为总体,组成总体的每个基本单元称为个体;把从总体中按照随机原则抽出的个体组成的小群体称为样本,所包含的个体总数称为样本容量。总体=某项数量指标取值的全体=随机变量一个容量为n的样本就是一个n维随机变量其中 相互独立,与总体 具有相同的概率分布。,2、统计量与抽样分布参数估计统计量样本函数称为统计量。设是来自总体 的一个样本,是 的函数,若 是连续函数且其中不含任何未知参数,则称 是一个统计量。,抽样分布统计量的概论分布为抽样分布,总体的分布已知时,统计量的分布是确定的。,二、三大推断分布(一)分布1、设 是来
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 研究生 应用 统计学 讲义

链接地址:https://www.desk33.com/p-259386.html