费希尔判别法理论.doc
《费希尔判别法理论.doc》由会员分享,可在线阅读,更多相关《费希尔判别法理论.doc(10页珍藏版)》请在课桌文档上搜索。
1、word费希尔判别费希尔判别或称典型判别的根本思想是投影或降维:用维向量的少数几个线性组合称为费希尔判别函数或典型变量一般明显小于来代替原始的个变量,以达到降维的目的,并根据这个判别函数对样品的归属做出判别或将各组别离。成功的降维将使样品的归类或组的别离更为方便和有效,并且可以对前三个判别函数作图,从直观的几何图像上区别各组。在降维的过程中难免会有局部有用信息的损失,但只要使用的方法得当,我们可以最大限度地减少这种损失,从而保存尽可能多的有用信息,即关于能够反响组之间差异的信息。为便于理解,我们以下用一个简单的二维例子来加以说明。图 投影到某个方向再判别如图 所示,两个组的所有样品都测量了两个
2、变量和,将所有点画于直角坐标系上,一组的样品点用“表示,另一组的样品点用“表示。假定我们希望将二维空间的点投影到某个一维空间,即一条直线上,然后再对两组进展判别,如此投影到不同的直线上,判别的效果一般是不同的。从图 中可见,如果两组的点都投影到直线上如此这两组的投影点在该直线上的分布几乎无任何差异,他们完全混合在一起,我们无法将这两组的点区别开来,这样的降维把反响两组间差异的信息都给损失了,显然是不可取的。事实上,最好的投影是投影到直线上,因为它把两组的投影点很清楚地区分了开来,这种降维把有关两组差异的信息很好地保存了下来,几乎没有任何损失,如此就完全可以在一维的直线上作判别分析。我们现考虑在
3、中将组的维数据向量投影到某个具有最优方向的上,即投影到上的点能最大限度地显现出各组之间的差异。设来自组的维观测值为,将它们共同投影到某一维常数向量上,得到的投影点可分别对应线性组合,。这样,所有的维观测值就简化为一维观测值。下面我们用表示组中的均值,表示所有组组的的总均值,即式中,。对于任一用来投影的,我们需要给出一个能反映组之间别离程度的度量。比拟图 中的上、下半图,上半图三组均值之间的差异程度与下半图是一样的,而前者组之间的别离程度却明显高于后者,原因就在于前者的组变差要远小于后者,后者组之间有较多重叠。因此,可以考虑将组之间的别离程度度量为相对其组变差的组间变差。在以下的讨论中,我们需假
4、定各组的协方差矩阵一样,即。图 三组之间的别离程度的组间平方和式中为组间平方和与叉积和矩阵。的组平方和式中为组平方和与叉积和矩阵。可用来度量的组之间别离程度的一个量是我们应选择这样的,使得达到最大。由于对任意非零常数,用代替上式中的,将保持不变,故考虑对加以约束。我们希望判别函数具有单位方差,即,但因未知,于是用其联合无偏估计替代,所以的约束条件实际应为,即判别函数的联合样本方差为1。设的全部非零特征值依次为,这里,且有 通常情况下上式等号成立,相应的特征向量依次记为标准化为,。由式知,当时达到最大值。所以,选择投影到上能使各组的投影点最大限度地别离,称为费希尔第一线性判别函数,简称第一判别函
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 希尔 判别 法理

链接地址:https://www.desk33.com/p-19293.html