课程设计实践探索.docx
《课程设计实践探索.docx》由会员分享,可在线阅读,更多相关《课程设计实践探索.docx(26页珍藏版)》请在课桌文档上搜索。
1、龙经名予科技/冬本科课程设计汇报题目光学遥感图像地物分类措施与数据处理试睑学院电子工程学院专业遥感科学与技术学生姓名导师姓名西安电子科技大学电子工程学院课程设计(汇报)任务书学生姓名指导教师职称副专家学生学号专业遥感科学与技术题目光学遥感图像地物分类措施与数据处理试验有关专业课程MTLAB;图像处理与识别;模式识别任务与规定1、纯熟掌握光学遥感图像中地物可分性的原理。2、深入学习KNN与K-means光学遥感图像数据分类措施。3、运用MATLAB软件编写KNN与K-means识别算法,并对微波遥感实现经典地物目的的分类。开始日期20始年12月26日完毕日期20始年1月9日课程设计所在单位电子工
2、程学院年月日本表格由电子工程学院网络信息中心编辑录入.光学遥感图像地物分类措施与数据处理试验(电子工程学院遥感科学与技术)摘要:遥感具有覆盖范围广、包括信息量大、获取信息快等长处,其所获得的图像已广泛应用于国防安全与国民经济的众多领域。遥感图像分类是遥感图像解译的关键技术,受到各国研究者的广泛关注,成为近年来的研究热点。而对遥感图像地物分类算法的深入研究可以有效改善这些问题,因此我们进行光学遥感图像分类措施与数据处理试验是很有必要时。本论文是通过Matlab,详细以KNN以及K-means算法对光学遥感图像进行地物分类仿真,并对仿真成果进行了数据分析。在最终,我们还总结了全篇所做工作并对未来光
3、学遥感图像分类0发展趋势做了展望。关键词:遥感图像,图像分类,KNN,K-meansAbstract:Remotesensinghasmanyadvantages,suchaswidecoverage,largeamountofinformationandfastaccesstoinformation.Theobtainedimagehasbeenwidelyusedinmanyfieldsofnationaldefensesecurityandnationaleconomy.Remotesensingimageclassificationisthekeytechnologyofremotes
4、ensingimageinterpretation,whichhasbeenthefocusofattentionofresearchersallovertheworldandhasbecomeahotspotinrecentyears.Furtherresearchonremotesensingimagefeatureclassificationalgorithmcaneffectivelyimprovetheseproblems,sowecarryoutopticalremotesensingimageclassificationmethodanddataprocessingexperim
5、entisnecessary.Inthispaper,theclassificationofopticalremotesensingimageissimulatedbyusingMatlabandKNNandK-meansalgorithm,andthesimulationresultsareanalyzed.Intheend,wealsosummarizetheworkdoneinthewholearticleandprospectofthedevelopmenttrendofthefutureclassificationofopticalremotesensingimages.Keywor
6、ds:opticalremotesensingimage,featureclassification,KNN,K-means1引言1.1 目前遥感图像地物分类现实状况先从老式的遥感分类方面说起,该分类措施是目前运用较多,算法比较成熟的措施。分为监督分类和非监督分类,他们0原理都是根据图像象元的光谱特性B相似度来进行0分类。监督分类用于顾客对分类区比较熟悉,由顾客自己控制,非监督分类则是将象元相似度大小进行归类合并。不过未充足运用遥感图像提供的多种信息,只考虑多光谱特性,没有运用到地物空间关系、空间位置形状、纹理等方面的信息。1、监督分类监督分类可根据应用目0和区域,有选择地决定分类类别,可控制
7、样本0选择,防止了非监督分类中对光谱集群组的重新归类。但个人认为其人为主观原因较强,操作者所选择的训练样本有也许不是很经典并且有也许不能反应图像的真实状况,因此图像中同一类别0光谱差异和人为原因,有也许导致样本没有代表性,并且训练样本B选用和评估需要花费较多B人力和时间。2、非监督分类非监督分类过程不需要任何的先验知识,仅凭遥感影像地物光谱特性的分布规律,随其自然地进行分类。不过看文献时看到,非监督分类尚有一种前提,那就是:假定遥感影像上同类地物在同样条件下具有相似0光谱信息特性。假如产生0光谱万一不一定对应于操作者想要0类别,且操作者较难对产生0类别进行控制,例如图像中各类别日勺光谱特性会随
8、时间、地形等变化,不一样图像以及不一样步段B图像之间B光谱无法保持其持续性,从而使不一样图像之间的对比变得困难。无论是监督分类还是非监督分类,都是根据地物的光谱特性时点独立原则来进行分类的,且都是采用的记录措施。该措施只是根据各波段灰度数据时记录特性进行0,加上卫星遥感数据0辨别率0限制,一般图像0像元诸多是混合像元,带有混合光谱信息日勺特点,致使计算机分类面临着诸多模糊对象,不能确定其究竟属于哪一类地物。并且,同物异谱和异物同谱B现象普遍存在,也会导致误分、漏分状况的出现,因此人们不停尝试新措施来加以改善和提高遥感图像分类的效率和质量。这些新措施重要有决策树分类法、综合阈值法、专家系统分类法
9、、多特性融合法、神经网络分类法以及基于频谱特性0分类法等。近年来0研窕大多将老式措施与新措施加以结合。即在非监督分类和监督分类的基础上,运用新措施来改善,减少错分和漏分状况,对遥感图像的分类精度有了一定程度的增强。1. 2遥感发展历程1、无记录地面遥感阶段(1608-1838)1623年汉斯李波尔赛制造了世界第一架望远镜1623年伽利略制作了放大三倍的科学望远镜并初次观测月球1794年气球初次升空侦察为观测远距离目的开辟了先河,但望远镜观测不能把观测到的J事物用图像的方式记录下来。2、有记录地面遥感阶段(1839T857)1839年达盖尔(DagUarre)刊登了他和尼普斯(Niepce)拍摄
10、0照片,第一次成功将拍摄事物记录在胶片上1849年法国人艾米劳塞达特(AimeLaussedat)制定了摄影测量计划,成为有目的有记录的地面遥感发展阶段的标O3、初期发展又可称为空中摄影遥感阶段(1858T956)1858年用系留气球拍摄了法国巴黎0鸟瞰像片,1923年飞机B发明,1923年第一张航空像片。一战期间(1914-1918)形成独立的航空摄影测量学的学科体系。二战期间(1931T945)彩色摄影、红外摄影、雷达技术、多光谱摄影、扫描技术以及运载工具和判读成图设备。4、现代遥感技术从1957年开始迅速发展1957年:前苏联发射了人类第一颗人造地球卫星。20世纪60年代:美国发射了TI
11、ROS、ATS、ESSA等气象卫星和载人宇宙飞船。1972年:发射了地球资源技术卫星ERTS-1(后更名为LandSatLandsat-D,装有MSS感器,辨别率79米。1982年LandSat-4发射,装有TM传感器,辨别率提高到30米。1986年法国发射SPOT-I,装有PAN和XS遥感器,辨别率提10米。1999年美国发射IKNOS,空间辨别率提高到1米。卜”1.3遥感图像分类原理概述一般我们所指的遥感图像是指卫星探测到的地物亮度特性,它们构成了光谱空间。每种地物有其固有的光谱特性,它们位于光谱空间中的某一点。但由于干扰0存在,环境条件的不一样,例如:阴影,地形上B变化,扫描仪视角,干湿
12、条件,不一样步间拍摄及测量误差等,使得测得B每类物质的光谱特性不尽相似,同一类物质B各个样本在光谱空间是围绕某一点呈概率分布,而不是集中到一点,但这仍使我们可以划分边界来辨别各类。因此,我们就要对图像进行分类。图像分类的任务就是通过对各类地物波谱特性的分析选择特性参数,将特性空间划分为不相重叠的子空间,进而把影像内诸像元划分到各子间去,从而实现分类。分类措施可以分为记录决策法(鉴别理论识别法)模式识别和句法模式识别。记录决策法模式识别指的是:对研究对象进行大量的记录分析,抽出反应模式B本质特点、特性而进行识别。重要B有监督分类中的最小距离法、逐次参数估计法、梯度法、最小均方误差法、费歇准则法和
13、非监督分类中的按批修改的逐渐聚类法、等混合距离法。此外还可以将两者结合起来,互相补充以获得很好的效果。句法模式识别则需要理解图像构造信息,从而对其进行分类。2基础原理2.1KNN算法原理邻近算法,或者说K近来邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简朴的措施之一。所谓K近来邻,就是k个近来B邻居的意思,说的是每个样本都可以用它最靠近的k个邻居来代表。KNN算法的关键思想是假如一种样本在特性空间中的k个最相邻的样本中的大多数属于某一种类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该措施在确定分类决策上只根据最邻近0一种或者几种样本的类别来决定待分
14、样本所属0类别。kNN措施在类别决策时,只与很少许B相邻样本有关。由于kNN措施重要靠周围有限B邻近B样本,而不是靠鉴别类域的措施来确定所属类别B,因此对于类域的交叉或重叠较多的待分样本集来说,kNN措施较其他措施更为适合。图2.L1KNN分类图上图中,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?假如K=3,由于红色三角形所占比例为2/3,绿色圆将被赋予红色三角形那个类,假如K=5,由于蓝色四方形比例为3/5,因此绿色圆被赋予蓝色四方形类。K近来邻(k-NearestNeighbor,KNN)分类算法,是一种理论上比较成熟的措施,也是最简朴的机器学习算法之一。该措施F句思绪是:假如一
15、种样本在特性空间中0k个最相似(即特性空间中最邻近)0样本中0大多数属于某一种类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经对的分类的对象。该措施在定类决策上只根据最邻近的一种或者几种样本0类别来决定待分样本所属的类别。KNN措施虽然从原理上也依赖于极限定理,但在类别决策时,只与很少许的J相邻样本有关。由于KNN措施重要靠周围有限的邻近啊样本,而不是靠鉴别类域的措施来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,KNN措施较其他措施更为适合。KNN算法不仅可以用于分类,还可以用于回归。通过找出一种样本的k个近来邻居,将这些邻居的属性日勺平均值赋给该样本,就可以
16、得到该样本B属性。更有用的措施是将不一样距离的邻居对该样本产生的影响予以不一样的权值(weight),如权值与距离成反比。算法流程:1 .准备数据,对数据进行预处理2 .选用合适B数据构造存储训练数据和测试元组3 .设定参数,如k4 .维护一种大小为k的的按距离由大到小I为优先级队列,用于存储近来邻训练元组。随机从训练元组中选用k个元组作为初始附近来邻元组,分别计算测试元组到这k个元组MJ距离,将训练元组标号和距离存入优先级队列5 .遍历训练元组集,计算目前训练元组与测试元组的距离,将所得距离L与优先级队列中的最大距离Lmax6 .进行比较。若L=Lmax,则舍弃该元组,遍历下一种元组。若LL
17、max,删除优先级队列中最大距离0元组,将目前训练元组存入优先级队列。7 .遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别。8 .测试元组集测试完毕后计算误差率,继续设定不一样的k值重新进行训练,最终取误差率最小的Jk值长处:1.简朴,易于理解,易于实现,无需估计参数,无需训练;2 .适合对稀有事件进行分类;3 .尤其适合于多分类问题(multi-modal,对象具有多种类别标签),kNN比SVM的体现要好。缺陷:该算法在分类时有个重要的局限性是,当样本不平衡时,如一种类的样本容量很大,而其他类样本容量很小时,有也许导致当输入一种新样本时,该样本0K个邻居中大容量类的样本
18、占多数。该算法只计算“近来的”邻居样本,某一类的样本数量很大,那么或者此类样本并不靠近目的样本,或者此类样本很靠近目的样本。无论怎样,数量并不能影响运行成果。该措施的另一种局限性之处是计算量较大,由于对每一种待分类的文本都要计算它到全体已知样本的距离,才能求得它的K个近来邻点。可理解性差,无法给出像决策树那样0规则。改善方略:kNN算法因其提出时间较早,伴随其他技术的不停更新和完善,kNN算法的诸多局限性之处也逐渐显露,因此许多kNN算法的改善算法也应运而生。针对以上算法B局限性,算法的改善方向重要提成了分类效率和分类效果两方面。分类效率:事先对样本属性进行约简,删除对分类成果影响较小的属性,
19、迅速的得出待分类样本的类别。该算法比较合用于样本容量比较大的类域的自动分类,而那些样本容量较小的类域采用这种算法比较轻易产生误分。分类效果:采用权值的措施(和该样本距离小B邻居权值大)来改善,Han等人于2023年尝试运用贪心法,针对文献分类实做可调整权重Bk近来邻居法WAkNN(weightedadjustedknearestneighbor),以增进分类效果;而Li等人于2023年提出由于不一样分类的文献自身有数量上有差异,因此也应当根据训练集合中多种分类的文献数量,选用不一样数目的近来邻居,来参与分类。2.2K-means算法原理K-means算法是硬聚类算法,是经典0基于原型0目0函数
20、聚类措施0代表,它是数据点到原型0某种距离作为优化B目的函数,运用函数求极值0措施得到迭代运算B调整规则。K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用误差平方和准则函数作为聚类准则函数。K-means算法是很经典的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象日勺距离越近,其相似度就越大。该算法认为簇是由距离靠近B对象构成B,因此把得到紧凑且独立B簇作为最终目的。(2. 2. 1)V=Zz(为-M)t=XjGSi2个初始类聚类中心点的选用对聚类成果具有较大的公式影响,由于在该算法第一步中是随机的选用任意&个
21、对象作为初始聚类的中心,初始地代表一种簇。该算法在每次迭代中对数据集中剩余的每个对象,根据其与各个簇中心的距离将每个对象重新赋给近来的簇。当考察完所有数据对象后,一次迭代运算完毕,新的聚类中心被计算出来。假如在一次迭代前后,J时值没有发生变化,阐明算法已经收敛。算法过程如下:D从N个文档随机选用k个文档作为质心2)对剩余的每个文档测量其到每个质心的距离,并把它归到近来的质心的类3)重新计算已经得到的各个类的质心4)迭代23步直至新0质心与原质心相等或不大于指定阈值,算法结束详细如下:输入:k,datan;(1)选择k个初始中心点,例如cO=dataO,ckT=datakT;(2)对于dataO
22、.datan,分别与c0ckT比较,假定与ci差值至少,就标识为i;(3)对于所有标识为i点,重新计算ci=所有标识为iBJdataj之和/标识为i0个数;(4)反复(2)(3),直到所有ci值的变化不大于给定阈值。算法长处:1.算法迅速、简朴;2 .对大数据集有较高0效率并且是可伸缩性B;3 .时间复杂度近于线性,并且适合挖掘大规模数据集。K-Means聚类算法的时间复杂度是O(nkt),其中n代表数据集中对象的数量,t代表着算法迭代的次数,k代表着簇的数目。算法缺陷:在K-means算法中K是事先给定的,这个K值0选定是非常难以估计Bo诸多时候,事先并不懂得给定的数据集应当提成多少个类别才
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 课程设计 实践 探索

链接地址:https://www.desk33.com/p-1051370.html