全码特助力海大橡胶虚拟化+存储双活升级方案

日期: 2019-06-28
浏览次数: 37

第一章 四川轮胎橡胶(集团)股份有限公司现状

 

1.1 项目背景:

 

四川轮胎橡胶(集团)股份有限公司目前信息化建设,系统存在服务器上单机运行,核心交换机、存储也都在单机运行,存在单点故障,风险极高。

 

1.2 现有架构拓扑图:

 

海大橡胶虚拟化+存储双活升级方案


 

 

 

1.3 本项目建设目标:

 

本期系统建设规划要帮助贵公司建立一套应用高可用、数据扩容、高安全系统;可实现多份数据双活的本地容灾以及防止数据发生逻辑损坏的备份与恢复系:

 

一:建设本地私有云系统,将服务器、存储、网络虚拟化,达到消除单点故障的目的;

 

二:建设本地容灾双活系统,以立即使公司系统实时保有两份以上数据在线, 提升系统数据的安全性;


第二章 本地虚拟化及双活建设方案

 

2.1 VMware HADRS FT

High AvailabilityHA 的全称是 High Availability(高可用性)。VMware HA 群集一般是包括两个或者两个以上 ESX 主机的逻辑队列。在一个 HA 群集中,每一台 VMware ESX 服务器配有一个 HA 代理,持续不断地检测群集中其他主机的心跳信号。ESX 主机每隔五秒就会通过 VMware 集群的“心跳网络”

(服务主机的网络连接)发送心跳信号。假如某台 ESX 主机在连续三个时间间隔内都还没有发出心跳信号,那么该主机就被默认为发生了故障或者与网络的连接出现了问题。在这种情况下,原本在该主机上运行的虚拟机就会自动被转移到群集中的其他主机上。反之,如果一台主机无法接收到来自群集的其他主机的心跳信号,那么该主机便会启动一个内部进程来检测自己跟群集中其他主机的连接是否出现了问题。如果真的出现了问题,那么就会中断这台主机上所有正在运行的虚拟机,并启动预先设定好的备用主机。vSphere HA 的显著特点是能够在一个集群中的多台 ESX 服务器上进行故障转移。对于一次 vSphere HA 故障转移,客户端操作系统认为只是一次因硬件的崩溃而进行的重启,并不会察觉到是一次有序的关机,因此,这样的修复并不会改变操作系统的状态。



HA
 不间断地监控集群中所有的 ESX Server 主机,并检测故障。放置在每台主机上的代理程序不断地向集群中的其他主机发出心跳信号,心跳信号的终止将引发所有受影响的虚拟机在其他正常主机上的重启过程。此外,HA 时刻监控群集中是否有足够的资源可用,以便在主机发生故障时能够在其他物理主机上重启虚拟机。利用 ESX Server 存储堆栈中的锁定技术,可以使虚拟机的安全重启成为可能,它允许多个 ESX Server 同时访问同一虚拟机文件。

海大橡胶虚拟化+存储双活升级方案

VsphereHA 工作方式Distributed Resource Scheduler:VMware 的分布式资源调度

(Distributed Resource Scheduler,DRS)可以跨资源池持续不断地监控资源


利用率,在多台虚拟机之间智能地分配可用资源,使资源优先用于最重要的应用程序。VMware DRS 允许用户自已定义规则和方案来决定虚拟机共享资源的方式以及它们之间优先权的判断根据。当一台虚拟机的工作量增加时, VMware DRS 会根据先前定义好的分配规则对虚拟机的优先权进行评估。如果该虚拟机通过了评估,那么 DRS 就为它分配额外的资源。

DRS 分配资源的方式有两种:将虚拟机迁移到另外一台具有更多合适资源的服务器上,或者将该服务器上其他的虚拟机迁移出去,从而为该虚拟机腾出更多的“空间”。虚拟机在不同物理服务器上的实时迁移由 VMware VMotion 来实现,迁移过程对终端用户是完全透明的。VMware DRS 具有自动模式和手动模式两种方式。在自动模式中,DRS 自行进行判断,拟定虚拟机在物理服务器之间的最佳分配方案,并自动地将虚拟机迁移到最合适的物理服务器上。在手动模式中,VMware DRS 提供一套虚拟机放置的最优方案,然后由系统管理员决定是否根据该方案对虚拟机进行调整。

Fault Tolerance:vSphere Fault Tolerance(FT)容错功能是通过创建和维护与主虚拟机相同的辅助虚拟机,保证在主虚拟机发生故障时进行即使的切换来确保虚拟机的连续可用性。Fault Tolerance 是基于 ESXi 主机平台构建的使用 VMware vLockstep 技术,该技术使主虚拟机和辅助虚拟机保持虚拟同步运行。使用 FT 技术,允许虚拟机在无须中断服务的情况下从服务器故障中恢复,实现零停机时间和零数据丢失。

vSphere HA 通过在主机出现故障时在其他主机重新启动虚拟机来为虚拟机提供基本级别的保护。vSphere FT 可提供更高级别的可用性,允许用户对任何虚拟机进行保护以防止主机发生故障时丢失数据或连接。FT 通过vLockstep 技术使主虚拟机和辅助虚拟机执行相同顺序的 x86 指令确保主虚拟机和辅助虚拟机的状态在任何时间点都相同。vLockstep 可捕获主虚拟机上发生的所有输入和事件,并发送到正在另一台主机上运行的辅助虚拟机上进行重放,两台虚拟机的输入信息完全相同,但只有主虚拟机的的执行结果是有效的。

主虚拟机和辅助虚拟机可持续交换检测信号,这使得这两个虚拟机能够监控彼此的状态以确保持续提供容错保护。如果运行主虚拟机的主机发生故障, 系统将会执行透明故障切换,此时会立即启用辅助虚拟机以替换主虚拟机, 并将启动新的辅助虚拟机,同时在几秒钟内重新建立容错冗余。如果运行辅助虚拟机的主机发生故障,则该主机也会立即被替换。主虚拟机及其辅助虚拟机不允许运行在在同一个主机上,此限制可确保出故障的主机不会使两个虚拟机同时丢失,因此,在任一情况下,用户都不会遭遇服务中断和数据丢失的情况。

2.2 Hyperswap 双活架构

Spectrum Virtualize HyperSwap 技术可视为对 SVC ESC 架构的增强, 类似 Power HyperSwap 技术,通过 Metro Mirror 实现数据在两个 IO 组之间的同步


 海大橡胶虚拟化+存储双活升级方案

 

Hyperswap 数据写流程

多存储平台支持,在 SVC/V7000/V5000 平台上实现双活和高可用架构。多节点失效支持,任一个 IOG 双节点同时故障I/O 无缝切换到备用 IOG,对上层应用透明。多场景故障支持,站点/IOG 双节点/存储故障场景,I/O 无缝切换到备用资源,从而实现存储资源高可用。

 

采用这种方式,业务和应用的数据存储系统通过 Storwize V5030 寸储间 Metro Mirror 功能进行磁盘存储系统之间的镜像,实现存储系统的高可用性,在此环境中, 即使有一半的主机系统和一半的存储系统发生故障而不能正常工作,整个系统也不会 发生瘫痪,仍旧可以继续运行,充分满足客户对高可靠性和连续可用性的要求。

 

采用 Hyperswap 方案,用户不必改变现有环境,也不存在数据集中迁移的问题, 而且业务系统保持同时在线;不存在系统接管、应用重新启动等问题,可以实现系统 的平滑过渡。

 

在实施 Lenovo Hyperswap 的数据双活方案时,分别将磁盘系统 Storwize V5030 A 和磁盘系统 Storwize V5030 B 通过光纤 HBA 卡连接到 SAN 交换机上,主机会有效 识别两套存储系统,但对于应用没有任何影响;在主机上,基于存储底层的 MetroMirror 在两套磁盘系统之间建立镜像关系,实现数据双活同步。

 

本设计方案是基于模块化、可扩展、无单点故障的 SAN 解决方案,具有信息和业 务连续性等特性。它对公司的业务系统能够提供无缝的异地信息备份解决方案,为公司业务系统高效、高可靠性的双磁盘阵列系统远程信息备份方案提供良好的高可用性 支持。具体而言,本设计方案的特点在于:

 

• 投资不高,原有的设备得到合理利用的前提下,基于网络的数据存储服务性能得到明显提升,业务数据实现了有效的汇集和管理,实现了性能和价格的最优组


• SAN 存储系统扩展性好、升级能力强,投资保护性好

 

• 实现了存储系统支持数据集中式管理,相关业务系统或全部的应用系统存储系统合并为统一的存储系统

 

• 采用开放式的体系结构,支持多种系统平台的接入,亦即实现跨平台操作

 

• 异构环境数据共享,即不同的平台和数据库系统实现相关数据的共享,同时支持主流第三方厂家存储设备的接入

 

• 提供包括存储介质、接口设备及连接链路的冗余支持

 

• 向网络客户端和应用服务器提供高效可靠的数据存储服务时,同时对应用系统的运行效率和网络的速度不会产生明显的影响。

 

2.3 服务器虚拟化和存储容灾解决方案

解决方案:采用 vmware 虚拟化+存储双活架构

 



海大橡胶虚拟化+存储双活升级方案 

 

 

方案说明:

1、使用 3 台服务器,2 台光纤交换机,2 台 v5030 存储做 vmware 虚拟化集群。

2、服务器通过光纤经光纤交换机连接存储。2  v5030 存储通过 hyperswap 活功能实现数据同步。

3、每台服务器 CPU 至少两颗,内存至少 192G,2 张单口 HBA 卡,4 个千兆网口。每台光纤交换机 FC 端口至少 8 口激活。每台 v5030 存储可用容量 15T 左右(如


果不满足未来 3-5 年需求量可以增加,建议后期每台存储再新增 4  8T 硬盘, 总共 8 块硬盘做 RAID5+1 后可用容量有 36T 左右。每个控制器配置 1  4 端口光纤子卡,双活授权。

4、数据备份可备份在一台 v5030 存储中或者同时备份在两台 v5030 中。

5、如果后期在数据安全要求更加高时可增加备份一体机,设置为异步的数据备份,实现在线数据和备份数据的隔离和保护

 

 

第三章 方案简要配置

 

3.1 建议的增加配置如下:

 

 

序号

类型

配置

数量

备注

 

 

1

 

 

FC 交换机

OceanStor SNS2224 光纤交换机-24 端口(12 端口激活,含 12*16Gb 多模 SFP)-单电源(交流)

 

 

2 台

原有的核心交换机上无法上FC 的板卡, 所以建议新购2 台光

纤交换机

 

 

2

 

 

服务器

SR590,2*英特尔至强银牌 4114

(2.2GHz/10C)处理器,4*32G DDR4, 3*600G 10k SAS,R530-8i,支持

0/1/5/10,4 口千兆网卡,2*750W,2 张

16GB 单口 HBA 卡,XClarity 管理软件,

3 年 7*24 原厂服务

 

 

2 台

原有 2 台服务器,建议新购2 台服务器来做虚拟化,可利用资源和迁移资源更大。

3

核心交换

S7706,24 端口百兆/千兆以太网光接口8 端口十兆/百兆/千兆 Combo 电接口

板(SA,SFP/RJ45),3 年 5*9 原厂服务

1 台

新增 1 台核心交换机,做冗余,消除单

点故障。

4

虚拟化软

Vsphere 标准版(CPU 授权)

 

Vcenter 标准版(管理端)

1 套

按照 CPU 来进行授权,OEM 版本

5

配件

32G DDR4 for SR590

4 根


6

配件

32G DDR4 for x3650m5

4 根


 


Case / 相关内容
2020 - 05 - 21
点击次数: 505
什么是RAID?RAID(独立磁盘冗余阵列)是一种由多个磁盘组成的用于...
2019 - 11 - 06
点击次数: 206
交换机作为网络传输的中心枢纽,起着举足轻重的作用,目前市场上出现了多种...
2019 - 09 - 02
点击次数: 209
企业简介:川威集团是中国西南最大的集矿业开发、物流运输、建筑制造为一体...
2019 - 06 - 28
点击次数: 37
第一章 四川轮胎橡胶(集团)股份有限公司现状 1.1...
2019 - 01 - 22
点击次数: 43
客户介绍      成都长客新...


Copyright ©2018 - 2019 成都全码特时代科技有限公司
犀牛云提供企业云服务