交换机在网络中故障诊断知识.docx
交换机在网络中的故障诊断在一个交换网络里,您如何确定从哪里起先动手杳找问题?想深化,透视”一个交换网络是特别困难的II首先,在2层交换的时候还是桥接转发方式,但到了3层交换却有了更高级的特性和转发规则,例如。到了4层交换,就更加困难了,出现了更高级的转发和负载均衡技术,故障诊断故障诊断和解决就须要更多的交换机配置学问。在安装完一台交换机后,每个交换机的半双工端口就构成了一个冲突域。假如该端口连接了一个集线器,集线器下面连接若干站点,那么冲突域会扩大。但随着交换产品的价格下跌,现在大多数新建的网络每个交换端口都只连接一个站点。因此,在半双工连接状况下,冲突域仅针对一个单独的电缆链路。交换机通常是一个独立广播域的一部分,包括串连或者并连的随意数目的其他交换机。假如运用了模型3层的功能,就可以创建多广播域,广播域的数目及数目相等。最极限的状况,假如交换机功能允许,每个端口可以配置为一个独立的广播城。可以把这种状况描述为路由到桌面。为每个端口创建一个独立的广播域后,故障诊断就会严格受限。但是假如我们把每个端口设置为一个单独的广播域,交换机在转发流量的时候,每个端口都须要路由服务,这会占用交换机的有限资源。在网络环境中,对每个单独的端口进行路由恳求和应答是特别困难的,我们应当避开这样的配置。不幸的是,这种状况在实际状况中特别常见,网络中常常发觉服务器全部在一个子网或者广播域中,全部的客户在另外的子网或者广播域中。在这种状况下,全部的恳求都必需路由。假如维护行为限制在一个单独的服务器群里,那么考虑把服务器放进单独的里。然后把运用这台服务器的用户放到同一个。这样就可以运用2层交换的桥接方式来交换流量,只有很少的恳求须要路由。假如服务器支撑多于一个用户区,可以在服务器上多装一块网卡来实现到用户的2层交换连接。对交换机进行故障诊断的5种技术可以实行5种基本方式来透视交换机。每一种方法都不同,都有主动或者消极的一面。类似在网络中遇到的其他问题一样,没有一个最好的答案。最合适的方案往往取决于您手中可以利用到的资源(什么工具可以运用或者以前安装过什么工具),而且运用这些技术有可能造成服务中断。即使把这些方式组合起来,也不能监测到所连接的网络,在交换的环境里面,也不像集线器那样便利监测。我们几乎不行能看到通过一个交换机的全部流量。大多数的故障诊断会假设流量会在站点和所连接的服务器之间或经过故障诊断交换机口通过。而事实上假如2台主机干脆传输信息的话,就不会运用交换机的口或者任何其他的端口来交换流量。除非你知道具体用到哪个端口,否则是监测不到的。举个例子,如图1.一台服务器接入一台交换机。在反映有问题的用户中,一部分是干脆及这台交换机相连,另外的一部分用户是由这台交换机的从其他路由器或者交换机连接上来的。故障报告是访问服务器“慢”,这样的故障报告对技术支持工程师来说基本上没有任何价值。iT<w<图一、一个最基本的交换机环境方法1:通过或者串行口接入服务器高级的网络技术支持工程师或其他知道交换机密码的人在进行故障诊断时可以选择通过或者交换机的串口登陆,来检查交换机的配置。(如图2)Up1.nkI11AV1图2、运用232限制端口交换机配置nJ以通过上面提到的2种方法查看,虽然问题不肯定是配置引起的。不管问题是操作系统有还是配置不完善,都不能从配置列表中悠易的查看出。配置信息在定位交换机是否像预期的那样运行上比较有用,但针对故障诊断就不是/°为了验证交换机的配置,往往须要运用多种的交换机故障诊断方法协作。许多交换机都带有实时的故障诊断工具,因为交换机生产厂家和型号的不同,这些故障解决工具的特征也各不相同。但是要运用好这些工具,必需依靠肯定的理论学问和实际阅历。方法2:连接到一个空闲端口最简洁的故障诊断方法是在交换机的空闲端口接入一个监测工具,例如协议分析仪.图3、从随意端口监测把监测工具接入交换机的一个空闲端口,不用中断服务就可以查看所属广播域。该监测工具及广播域里的其他站点一样有相同的权限。不幸的是,交换机(做为一个多端口的桥接设备)儿乎不转发流量到监测端口。因为桥接设备就是这样设计的,流量宜转发到所属的目的端口,不会去其他的端口。协议分析仪因此儿乎监;则不到流量。图4、交换机在源端口和目的端口之间转发流量。特别少的流量会转到其他端口。站点和服务器之间可能每秒钟会转发几千个帧,但是监测端口每分钟只能看到几个帧。转发到监测端口的流量几乎全部都是广播,包含一些零星的目的地址不明的帧。这些零星的帧是由于路由转发表老化的结果,常常是目的端口不明的帧。一些阅历不够的技术人员看到这么高的广播(接近100%),却没有留意到端口利用率很低,就误判网络出现了广播风暴,其实不是。这样查看交换网络几乎没有用,因为监测工具必需获得流量。获得的流量或者对广播域的查询对网络搜寻和发觉其他类型问题是有很有帮助的,但对解决用户连接慢的问题并没有多大的帮助。对大多数交换机来说,都有一个更好的选择,可以把须要监测的端口流量备份到一个特地的空闲口.这种技术通常称为端口镜像。大多数交换机厂家都供应备份或镜像流量的功能,可以把监测工具接入交换机一个特地配置过的端口。老的交换机必需指定一个特地的监测口做为镜像口,但现在大多数新的交换机可以指定任何一个端口做为镜像口。虽然交换机厂家实现镜像的方式各不相同,但是有一些基本相同的监测选项。值得留意的是,几乎在全部的状况下,交换机在转发流量到镜像口的时候,同时把错误都过滤掉了。对于故障诊断来说,这意味着同时过滤掉了有用的信息。此外,实际操作当中须要我们通过限制口(交换机的232端口),或者进程来配置镜像。这意味着除了监测工具之外,我们通常还须要带一台电脑或者终端来对交换机进行配置。镜像端口常常只是一个“监听”端口,不过许多交换机厂家允许把该端口配置成全双工的。配置了镜像口,监测工具就可以查看报告连接慢的主机和服务器之间的实际流量的备份。镜像口可以只监测交换机的随意一个端口,甚至可以是口,也可以同时监测交换机的多个端口。但是同时监测的端口许多的话,过高的流量就有可能会超过镜像口的接收实力。监测端口的输出实力是一个很重要的问题。镜像口可以收,也可以发。在配置的时候,常常关掉了镜像口发的功能。但不管有没有关掉镜像口发的功能(不管镜像口是全双工或者不是),镜像口的接收实力都是有限制的。假如被监测的全双工端口的速率和镜像口是一样的话,交换机在转发流量的时候很简洁就会丢包,但是交换机不会通知您。假设您在监测一个以100M全双工速率连接到交换机的服务器的话,那么服务器在全双工工作的时候,服务器的收发速率都是100M,那么总共就有了200Mo然而交换机的100M镜像口最多只能接收100M的流量。所以任何交换机的端口(全双工的)利用率超过50%的时候,镜像口接收到的包就会有丢失。假如把多个端口镜像到一个端口,丢包的问题就会更加的严峻。因为大多数交换机都工作在低容量,这个问题并不会被马上留意到。大多数用户连接的平均利用率都很低。只是间或会有流量的突发。假如选择一个高速的镜像口,就可以削减丢包的问题。例如把图6中的100M镜像口换成1000M,那么就可以很简洁的接收200M的监测流量。方法3:在链路上接入集线器运用集线器很具有战略意义。对许多网络来说,大多数发送和接收的流量都来源于文件服务器之类的共享设备。在交换机端口和文件服务器中间接入一个集线器,再把分析仪接入集线器,事实上就把分析仪和文件服务器接入了同一个广播域。如图7所示。运用这种方法,技术支持人员就可以看到文件服务器全部进出的流量,帮助技术支持人员解决一系列的问题,包括用户登陆失败、性能低效、连接丢失等。图5、运用集线器监测交换机端口接入集线器的方法许多时候都不好用,特殊是在须要监测多个服务器的时候。在哪里接入集线器合适?全部的服务器都要连接吗?假如是用一个集线器,换来换去连接的话,您肯定不希望您的网络这样频繁地被干扰。连接集线器所带来的时延,常常会带来连接的丢失。另外,许多时候监测工具并不支持服务器所采纳的技术或者连接速率。运用共享集线器监测一条链路上的全部流量和错误仍旧是一个有效的方法。这儿乎是唯一一种可以在交换网络环境中实际有看和分析层错误的方法。运用来发觉这些错误也可以。但是,为了更好地进行错误分析,还是用监测工具T脆查看最干脆。接入集线器的方法有2种主要缺陷。服务器链路有可能不是全双工的,或者和集线器的端口双工状态不匹配,这会给监测带来更多的不情愿看到的错误结果。而且运用这种方法时,手头必须要有一个共享集线器。现在许多新型的集线湍都类似于交换机,而不是共享的转发设备。接入这种新型的集线器,相当于接入了一个新的交换机,您会看不到想要查看的流量,对监测起不到什么作用。安恒公司假如接入的是双速率的集线器,例如IO100M双速率的,可能每个速率都供应了一个广播域,两个速率之间再进行转发。在这种状况下,须要确认被监测链路和监测工具运行在相同速率,才能够运用这种双速率集线器。还有一些集线器供应在全部端口之间转发的功能,更因此把自己标榜为价格便宜的交换机,给人造成误会。他们都不能用在这种监测方法上。方法4:运用一个(监测接口盒)或者分流器这种方法类似于加了一个共享集线器,不同点是链路只是接收流量,不允许监测工具发出流量。和分流器这2个词有时候可以互换,虽然分流器通常应用于光纤链路。在光纤链路上,分流器会把光在初始路径和监测路径上进行分光。典型的分光比率包括80:20、70:30以及50:50。以80:20为例,80%的光通过分光器接着传送到原始路径,20%的光转发到监测路径。假如光纤原来就有问题,或者传输的距离很长的话,光分流蹈带来的20%光丢失,很简洁造成链路出现问题。分流器在光纤链路上很简洁就会带来3的衰减。有些分流器要耐用一些,因此即使在链路的一端安装分流器造成链路中断,还可以将其换到另一端去安装,让链路正常工作。光分流器不须要电源就可以工作。须要留意的是,分流港是带内O监测设备,所以分流器的线缆正确连接就特别重要。电口的也会带来信号丢失的问题,因为须要信号来识别通过的流量。对电缆来说,这相当于增加了衰减,假如链路本身已经有肯定问题或者链路很长的话,的引入有可能会造成连接中断。电口的工作须要电源,信号被复原并重传到监测端口。假如设计的好,在掉电的时候,链路应当也不会中断。对链路运用进行监测的方式是一个很好的爸看链路流量的方法。一旦安装胜利,对被监测的设备来说就是透亮的,可以随时运用,而且不会带来更多干扰。不幸的是,在接入的时候,链路必需短暂中断。此外,或者分流器会依据2个独立的方向供应流量。也就是说,发送和接收是分开的。为了同时监测通过链路的恳求及响应,须要一个带两个输入口的监测工具。双端口的监测工具可以分别监测每个方向,也可以把两个方向的链路集中在一起分析。您也可以选择每次只监测一个方向的流量,但这样分析起来会比较困难。对来说,监测全双工链路和半双工链路,操作上没有什么区分,都可以监测。您可以选择一个单端口的监测工具,监测单一的方向,或者选择一个双端口的监测工具,同时的监测两个方向。方法5:用查询交换机对一个交换网络进行故障诊断的最有效方法,应当是通过干脆询问交换机来杳看网络的状况。这可以通过或者连接到交换机的限制口实现。明显,干脆连接到交换机的限制口不是志向的方法,因为这就须要对网络中的每台交换机都有物理上的连接。略微志向一点的替代方法是搭建连接到交换机限制口的终端服务器。安恒公司是一个更好的选择,它可以在交换网络带内的任何地方进行查询,不须要附加的硬件。假如您部署了网管系统,还可以配置当利用率、错误、或者其他参数超过门限的时候,交换机主动发出陷阱。然后利用网管或者监测工具,探讨是什么缘由造成了门限超出。事实上几乎全部的交换机都供应功能,哪怕是最便宜的交换机。它们之间主要的区分就是供应的信息多少。一些价格便宜的交换机只供应简洁的信息,且是针对整个交换机的;而那些价格贵一些的交换机,还可以供应交换机每个端口的具体信息。可能是监测交换网络最常用和干扰最少的方法。限制台不须要特别竟近被监测的设备,只要求有路由可达就可以了,同时交换机的平安配置允许限制台及交换机的代理进行通信。图6、运用监测交换机安虽然交换机可以识别到错误,但交换机本身并不定时地报告错误,所以运用查询或许是最好的方法。支持的交换机有不同的库(管理信息库)。每一种都不同。除了某些对自己的交换机供应支持的私有库,标准的库对交换网络的监测也特别有用。下面是对故障诊断特别有用的一些库。1213-1643-2819-2021-22613-许多生成之后就不断地在更新和增加。因此我们要检查最近更新的。例如1213,至少更新和增加了五次,生成了5个新的(2011,2012,2013,2358和2665)。除了定义利用率和错误的之外,有关桥接的(1493)也是特别有用的。运用监测网络的时候,必需留意平安性。假如代理没有限制,那么潜在的任何地方的任何人都可以监测到您的网络动态或修改交换机配置。交换机售出的时候默认打开了,并且运用的是一个特别通用的密码。密码叫做通信字符串,运用明文传播,这带来了潜在的危急。V3供应对通信字符串的加密,削减了这种危急,但是V3还没有广泛运用。最常用的通信字符串是。现在,运用,许多上的代理都可以被接入。我们应当马上修改通信字符串。代理应当为不同的字符串配置不同的接入级别,不同的地址、不同的子网也有不同的接入级别。或者依据其它的配置来限制接入的级别。通过路由器接入代理可能会对的限制带来一些影响。防火墙也有可能完全阻挡。即使您能够通过接入代理,也要求代理支持您所要查询的库。大部分厂家完全支持标准的库。然而,也有一些厂家不支持。有时候为了支持期望的,还须要先对交换机的操作系统进行升级。这种方法还有一个问题,假如代理执行的不正确的话,那么响应就完全是错误的了。虽然这并不是常常发生的,但有时候程序设计的错误,会带来错误的响应。交换机不响应的查询有许多缘由。一旦这些问题都解决了,就能够供应特别有效的监测和趋势分析。结论故障诊断的一个普遍方法是等待用户的投诉。这个方法虽然简洁,但是特别有效。用户能够感知到网络正常的性能是怎样的。一旦有性能下降,网络支持中心就会很快收到客户的投诉。有了用户投诉,您就应当从他的接入点起先做故障诊断了。这种方法的缺点是完全是被动的,不具有前噂性的。志向的方法是运用前瞻性地监测。包括定期地查询每个交换机、监测每个交换端口的流量、流量的趋势,同时检测其他的相关网段。把问题解决从故障诊断方式变成故障预防方式。