SRM容灾解决方案.docx
《SRM容灾解决方案.docx》由会员分享,可在线阅读,更多相关《SRM容灾解决方案.docx(45页珍藏版)》请在课桌文档上搜索。
1、软件定义的容灾解决方案(VMWareSiteRecoveryManager)2023/8/27目录1 概述31.1 灾难恢复的重要意义31.2 XXX企业容灾方案现状分析42 灾难恢复解决方案62.1 vCenterSiteRecoveryManager62.1.1 概述62.1.2 SiteRecoveryManager的主要功能特性82.1.3 SRM支持灵活的拓扑102.1.4 超越灾难恢复:灾难规避和计划内迁移112.1.5 VMwareSiteRecovery的工作方式112.1.6 灾难恢复自动化和利用软件定义的存储122.2 vSphereReplication132.2.1 概
2、览132.2.2 利用vSphereReplication来扩大灾难恢复的覆盖范围142.2.3 实现原理与工作机制182.2.4 vSphereReplication的优势203 方案架构设计223.1 客户容灾设计要求223.2 实施方案选择233.2.1 将基于阵列的复制与SRM结合使用233.2.2 将VSPhereRePIiCation与SRM结合使用243.2.3 将基于阵列的复制和vSphereReplication与SRM结合使用253.3 网络设计263.3.1 在恢复站点配置相同或不同的IP地址263.3.2 SRM通讯端口设置283.4 存储设计303.4.1 存储复制3
3、03.4.2 占位虚拟机313.4.3 快照空间314 配置清单及说明324.1 硬件配置需求324.2 虚拟化软件配置需求325 方案总结345.1 方案要点345.2 方案优势346 专业服务366.1 VMWare专业服务介绍366.2 专业咨询服务内容366.2.1 VMWareAeCeIerate咨询服务366.2.2 技术咨询服务376.2.3 技术客户经理(TAM)服务376.3 专业服务实施流程386.3.1 评估396.3.2 规划与设计396.3.3 实施396.3.4 运维407 支持服务概述417.1 VMWare支持的角色和职责417.2 全球技术支持服务417.3
4、自助服务支持427.3.1 社会支持427.3.2 其他资源438 缩略语解释44概述1.1 灾难恢复的重要意义统计数据表明:93%的企业,一旦发生数据中心失效达10天的情况,通常在一年内就会破产。图:业务可用性与灾难恢复对企业的影响来自ForreStOr在2014年第二季度的咨询报告表明,正常运行时间和数据保护对业务而言非常关键,灾难带来的员工工作效率下降、士气低落、收入下降、声誉受损和影响合规性将对企业产生巨大的消极影响。正常运行时间和数据保护对于业务而言非常关键图:中断造成的不良影响灾难的发生往往是出乎人们意料的,当突然发生大的灾难,日常建立的控制措施己不再有效时,组织如何才能保护核心业
5、务不被中断,使灾难的造成的风险降到最低呢?这正是灾难恢复需要考虑的问题。数据中心的灾难会以不同形式发生,比如电力中断、硬件故障、人为操作失误、以及自然灾害。大量的事例表明,业务中断不是“假如”的问题,而是“何时”的问题。因此,只要是拥有IT信息系统的组织,都应为随时可能发生的中断作好准备。保证业务连续性也就是确保业务连续运作,不管发生什么情况,重要的系统和网络必须具有不间断的可用性。事实上,灾难恢复的影响不仅仅局限于上面提到的金融领域,政府、公安、医疗、教育等诸多行业都需要使用业务可用性解决方案来保证其业务的可用性,对于这些企业,机关,单位而言,当IT基础设施突然停运,不仅企业内部的业务流转、
6、办公等面临瘫痪,更重要的是,对外与客户或合作伙伴的所有业务交流都不得不陷入停滞。1.2 XXX企业容灾方案现状分析在国内,很多企业都不具备灾难恢复能力,甚至是一些金融相关的公司都没有真正意义的灾难演练过。主要是设备成本、技术复杂度已经人员IT技能等多方面因素造成的。XXX公司的采用传统灾备解决方案,并有了多年的积累和发展,但是传统的解决方案还是存在如下诸多问题的。首先,传统的可用性解决方窠是利用特定于应用的解决方案(如:OracleRAC、MSSQL集群、ExchangeDatabaseAccessGroups(DAG)等)在应用级别实施业务可用性。虽然这种方法通常可以提供不错的可用性,但是由
7、于每一组应用都有自己的解决方案,因此这种方法有如下弊端: 复杂且昂贵 对管理员的技术要求较高出错的风险大 许可证较贵(如RAC) 专用的备份架构其次,虽然有一些基础架构层的解决方案可以比应用级解决方案更加经济高效,但是这些解决方案往往在正常运行时间和RTO(恢复时间目标)方面表现得比较差。除此之外,传统的灾难恢复解决方案很难在现有的物理X86环境中实现,这是因为:传统的灾难恢复计划依赖于一套非常复杂的流程和基础架构:复制数据中心、复制服务器基础架构、将数据转移到恢复站点的流程、重启服务器的流程、重新安装操作系统的流程等等。由于灾难恢复可能非常复杂,因此各个企业常常发现他们只能为少数几个重要的生
8、产工作负载提供良好的保护,而其他的工作负载(如文件/打印服务器、内部Web服务器、部门级应用)则得不到保护或者保护的不充分。因为灾难恢复计划和基础架构非常复杂,所以各个企业都极为依赖大量的人员培训、准确且完整的恢复纪录,以及发生停机时恢复流程的准确执行。除此之外,由于恢复计划的测试过程会造成中断,而且成本非常高昂,所以各个企业无法确保所有培训、文档和执行过程都切实可行并且能够成功恢复IT服务。无法满足业务需事较长RTo-数天到数网程存太多时间和资源图:传统的灾难恢复解决方案所面临的挑战上图描述了传统的灾难恢复解决方案所面临的挑战,由于存在这些挑战,该方案往往会产生如下的后果: 恢复计划的测试往
9、往会失败 关键工作负载的基本恢复(如能成功)通常要花费数天或数周的时间 管理和维护恢复计划要耗费IT人员大量的时间和资源简言之,当前的灾备解决方案还无法满足其企业所设定的业务可用性要求。由此,XXX公司提出重新设计和实施中心总部应用到北京IDC的异地远程灾备的需求。XXX总部应用虚拟化改造完毕后,目前服务器虚拟化比例已经达到大约XX%,XX%的应用已经由虚拟化承载,其中包括XX%的关键应用。需结合应用系统架构给出中心总部应用到北京IDC的异地远程灾备方案及实施日程表,按照日程表完成异地远程灾备。2灾难恢复解决方案VMWare提出的基于虚拟化环境的软件定义的可用性解决方案,该方案不仅可以提供与应
10、用级别可用性方案相类似的RTo与RPC)(恢复点目标),同时,它还可以提供基础架构层解决方案所具备的简易性和成本效益。同时,由于该方案充分利用了虚拟化环境的优势,因此它可以达到传统的非软件定义解决方案无法达到的效果。VMware灾难恢复解决方案包括vCenterSiteRecoveryManager和全新的vSphereReplication(,2.1 vCenterSiteRecoveryManager如今,企业发现越来越难以提供符合要求的灾难恢复解决方案。而S计eRecoveryManager可以帮助企业应对传统灾难恢复方法的各种挑战,满足他们的恢复时间目标(RTO)、恢复点目标(RPO)
11、以及法规遵从性要求。利用SiteRecoveryManager,企业可以管理从生产数据中心到灾难恢复站点的故障切换,同时,还可以管理两个互为恢复站点且具有活动工作负载的站点之间的故障切换。2.1.1 概述VMWare的灾难恢复解决方案分为三个大的模块,如下图不同颜色模块所示:其中灾难恢复编排属于自动化解决方案;复制、备份和恢复属于数据保护解决方案;计算存储属于基础架构解决方案。灾难恢复编排复制备份和恢复计算存储VMware体系Site Recovery Manager vv J存储vSphere ReplIcationVDP AdvancedvSphere基于阵列的备份副本图:VMWare灾难
12、恢复解决方案SiteRecoveryManager可以自动执行及简化故障切换至新数据中心的过程,从而让所计划的数据中心故障切换(如数据中心迁移)变得更加顺畅。它是一款领先的灾难恢复管理和自动化解决方案,它通过自动执行恢复过程来加快恢复的速度,并将灾难恢复作为VMWare虚拟基础架构管理的集成要素,从而简化灾难恢复计划的管理工作。SRM省去了复杂的手动恢复步骤,支持无中断的恢复计划测试,确保恢复过程的安全可靠。它密切集成VSPhere及其他领先存储供应商提供的存储复制软件,使故障切换和恢复变得快捷、可靠、经济,而且便于管理。因此,企业不仅无需担心灾难恢复的风险,还可将所有重要的系统和应用程序纳入
13、到保护范围。自从2008年面世以来,SRM己得到长足发展。到目前为止,VMWare已向一万五千多家客户售出12.5万个许可证,并且该产品还在以每年50%60%的速度继续增长。SRM为VSphere平台上的灾难恢复计划增加的巨大价值推动了这种增长,而所增加的成本却相对较低。VMWare的许多客户已利用SRM从实际灾难(例如最近在日本发生的海啸和在美国发生的飓风)中快速恢复。下图是一些主要的客户以及SRM的相关市场数据。SRM是一款屡获殊荣的解决方案,拥有拥有出色的业绩记录/2008年推出的成熟产品/超过14, 000家客户,超过240万个虚拟机受到保护,连续三年获得殊荣成千上万满意的客户AC0
14、RDA, .pj.yhiBt AllscriptsC/ c m O85JIS!jeNNenALCAVirtual ization Review 读者选择奖最佳业务连续性产品2sm TaivipaBayndvcu RaysQIC“.在委内瑞拉,我们的工厂遭遇了一场大火.在我 们收到通知2小时40分钟后,这家工厂在我们的新 泽西州灾难恢复站点恢复运行.”David Giabruna, Revlon高级副总裁兼首席信息官otJi广东电网佛山供Odaytonsuperior如宓的企业已开妫实施芯和化SteRcwryManager家父!(突i候凝.JefryWilkinDeyfonSitpenorCcf
15、poraUon的悬累线9f寿员图:SiteRecoverManager的发展趋势与部分客户SRM需要若干个组件。首先,受保护的站点和故障切换站点都需要一个SRM实例。SRM实例可通过与VSphere和VCerlter紧密集成来提供管理和自动化功能。SRM还需要底层复制产品来将虚拟机复制到故障切换站点。借助SRM,客户可以选择使用vSphereReplication或者使用基于存储的复制。因为vSphereReplication与SRM捆绑在一起,所以无需支付额外费用。基于存储的复制由第三方存储供应商提供,并通过StorageReplicationAdapater(SRA)与SRM紧密集成,以使
16、SRM能够利用该存储层协调复制和恢复活动。最后,SRM在这两个站点上都需要配置vSphere集群和单独的vCenter实例。SiteRecoveryManagerWMDWimiiteiFekonStorIBMVMware vSphere M9MmmES需要支持此功傩的enter ServerStorage iSCSI FibreChamw版NF带信图:SRM的主要功能组件Storage Partner Replication主流存储厂商都已睡遢过认证与VCenterSerVe公/霆成2.1.2 SiteRecoveryManager的主要功能特性VMWareVCemerSiteReCOVery
17、Manager可提供先进的复制、灾难恢复管理、无中断测试、自动故障切换和故障恢复以及计划内迁移功能。它可以管理从生产数据中心到灾难恢复站点的故障切换,以及两个具有活动工作负载的站点之间的故障切换,甚至还可以将多个站点恢复为一个共享的恢复站点。SiteRecoveryManager经常用于计划内迁移和预防性故障切换以避免发生灾难,它的主要功能特性如下:集中式恢复计划 直接从vCenterServer中创建并管理恢复计划。 自动发现并显示由vSphereReplication或基于阵列的复制保护的虚拟机。 将虚拟机映射到故障切换站点上的相应资源(资源池、虚拟交换机和虚拟机文件夹)。 指定虚拟机引导
18、顺序。 自定义虚拟机IP地址。 自定义故障切换站点上的低优先级虚拟机的关机。 利用自定义脚本扩展恢复计划。 利用基于角色的访问控制来控制对恢复计划的访问。 将多个站点恢复至一个共享的恢复站点。自服务,基于策略的调配 可以为SiteRecoveryManager安装了VMwarevCenterOrCheStratOI插件 多租户可以根据需求通过VReaIiZeAUtomationCemer中的蓝图(blueprints)预定义的各自的灾难恢复策略自动执行故障切换 接收关于可能的站点故障的自动警报。 只需单击一次鼠标,即可在VCenterServer中开始执行恢复计划。 自动停止用于恢复的复制数据
19、存储的复制和升级。 关闭故障切换站点上的低优先级虚拟机。 按照预先指定的引导顺序自动启动受保护的虚拟机。 在恢复过程中执行用户定义的脚本和暂停。 在故障切换站点上自动重新配置虚拟机IP地址。 从vCenterServer中管理和监控恢复计划的执行。自动故障恢复 自动故障恢复到原始生产站点。 通过自动反向复制到原始站点来重新保护虚拟机。 反向执行原始恢复计划。 利用VSPhereReplication中的自动故障恢复功能。计划内迁移 使用计划内迁移工作流确保数据零损失和应用一致性迁移。 在原始站点正常关闭受保护的虚拟机。 执行数据同步以强制将关闭的虚拟机完整复制到故障切换站点。 执行利用应用一致
20、性虚拟机的恢复计划。无中断测试 自动执行恢复测试。 利用存储快照功能执行恢复测试,而不会中断复制。 在隔离网络中恢复虚拟机,以免对生产应用程序造成任何影响。 针对测试方案自定义恢复计划的执行。 完成测试后自动清理测试环境。 在VCenterSerVeI中存储、查看和导出测试结果及故障切换执行情况。支持vSphereReplication 利用专为vSphere和vCenterSiteRecoveryManager设计的唯真正基于虚拟化管理程序的复制产品。 通过vCenter以精细灵活的虚拟机级别直接管理复制。 使用与存储无关的复制支持使用低端存储,包括直连存储。 执行具备灵活RPO(介于15分
21、钟到24小时之间)的异步复制。仅复制发生变更的数据块以提高网络效率。 扩展到数百个虚拟机。 利用对文件和应用一致性的支持。 使用多时间点(MPIT)恢复来回到以前的已知状态。支持第三方基于阵列的复制 可在主要供应商提供的大量兼容性存储阵列和复制产品中进行选择。 使用基于iSCSk光纤通道或NFS存储的基于阵列的复制解决方案。 通过SRA确保与vCenterSiteRecoveryManager紧密集成。 自动执行复制和数据同步操作,以实现协调一致的灾难恢复故障切换和计划内迁移。2.1.3 SRM支持灵活的拓扑SiteRecoveryManager可用于多种不同的故障切换情形,尤其是SRM能帮助
22、客户更好地利用对辅助站点的投资,即,当客户没有处于灾难恢复情形中时,可将辅助站点用于其他工作负载而不是使其处于闲置状态,SRM可用于如下四种不同的故障切换情形: 主动被动:SiteRecoveryManager完全支持传统的主动-被动型灾难恢复情形,即运行应用的生产站点将在故障切换之前一直处于闲置状态的辅助站点中恢复。尽管这是最常见的配置,但此情形也意味着您需要为大部分时间都处于闲置状态的灾难恢复站点投入大量资金。 主动主动:为了更好地利用恢复站点,S计eRecoveryManager还可以使用户在不使用该恢复站点进行灾难恢复时将其用于其他工作负载。用户可以将SiteRecoveryManag
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SRM 解决方案

链接地址:https://www.desk33.com/p-608462.html