点击“戴尔企业级办理方案”快速订阅
???“存储极客”栏目再次与各人见面啦!在这里,只有一位大咖名叫“存储”,它的粉丝我们称为“存储极客”!存储极客这是一群存储偏执狂
为存储而生,跟存储死磕
各具独家秘笈
有观点,有碰撞,有干货
从2015年8月18起
做客存储极客栏目
与你分享存储里的那点事儿
在写这一篇之前,我们先回顾一下客岁的《存储极客:大话“双十一”与经济实用型双活》,此中重要讨论了以下话题:???
互备算不算双活?双活为什么比同步复制更怕“光纤抖动”数据库复制与双活1000公里多活是怎样实现的?多企业经济实用的双活
年龄大了记性轻易不好
列出这些供各人参考的同时,也是为了克制本身再写重复的东西。那么这次我有哪些新话题跟各人分享呢?
双活的技能和非技能因素
上图引用自元鼎期间资深Oracle技能专家李德鹏的分享资料《数据中心双活的宿世当代》
险些每次和偕行朋侪们讨论双活时,都会有人提出应用层实现更好。从某种角度上讲这没有错,但抱负很丰满实际却骨感,一说到要重新开辟/调解应用很多用户就开始摇头了。更多的人还是乐意动数据库、存储层,如许简单、扳连的方面较少,而且在数据层面拆成2份也比力好明白。不打扫有一部分用户是为了“双活”而双活的,而同城以致本地双存储(双柜)也有其存在的代价。传统中高端企业级阵列广泛能到达99.999%的可用性,但也有人“抽中过彩票”——碰到背板故障之类的小概率题目。只管这些环境数据规复的概率比力大(加上有尚有备份什么的),但停机时间长了丧失受不了。
Salesforce故障给我们的启示对于数据库掩护和业务连续性,如今不少DBA推许基于日记的复制(比如的OracleADG),而存储复制和双活的实用范围可以更宽。在《Salesforce曝数据丢失缘故起因:存储阵列固件bug?》一文中,我们也能看出DataGuard不是全能的——在容灾规划思量不敷充实的环境下,存储压力过大导致I/O超时大概造成数据库文件破坏;别的,在没有打开Flashback时主库坏块被复制到从库也是无法回滚的。
上图同样来自李德鹏老师的分享资料,内里提到了DataGuard善于应对的故障,ADG参加了准及时备库只读查询功能,但它还不是真正的双活。因此我们看到越来越多的人保举同时摆设DataGuard和OracleExtendedRAC,固然后者也不是没有技能上的条件和限定,比如底层存储双活的需求,但RPO=0和最小化RTO的吸引力还是蛮大的。在Salesforce的例子中我们还看出差别品牌存储的差别,假如有高效的Near-CDP、数据库同等性快照技能,此类故障RPO应该有很大机遇收缩至4小时以内。
分布式存储带来的挑衅随着SDS(软件界说存储)的盛行,借助多副本和纠删码技能的分布式集群可以支持节点级的容错。存储服务器节点断网、断电已经成为通例的POC测试项目。对于传统双控存储阵列而言,只能拔一侧的控制器大概电源,固然这并不代表ServerSAN的可靠性和可用性就会更高。
上图引用自Veritas资深架构师黄海峰的分享资料《ServerSAN的数据掩护和容灾》
随着VMwareVSAN延伸集群的推出,ServerSAN也开始支持真正的双活。从技能角度来看,多副本的机制对于将集群扩展到同城数据中心有些天赋便利。只管只能应用在假造化环境,VSAN此举还是明显拉低了存储双活的门槛,使该特性不再一味“高大上”。没有双活都不好意思出去讲,这大概也是存储双活市场不绝扩大的缘故起因吧。
摆脱网关让双活存储真正布衣化
不可否认,EMC依附VPLEX在存储厂商中率先提出双活数据中心的概念,而且让更多人认识到OracleExtendedRAC这种方案。正如上面的布局图,VPLEX将RAC表决磁盘放到假造卷上,简化了数据库体系布局。利用ASM镜像的存储方案,也就是ASM的Normal和High冗余方式。“ASMMirror的一个题目是:怎样包管RAC集群的仲裁盘满意投票规则?…纵然非超融合的双机双柜也要思量这个题目。对此有一种办理办法是把仲裁盘放在外部NFS上。”
这份资料形貌的就是依靠ASM来搭建长途RAC数据库。A、B、C三个站点各有一套戴尔SC(CompellentStorageCenter)阵列,没有利用存储自身的双活。中心的站点C存储上只放OCR和仲裁盘,以满意OracleRAC防止脑裂的最小需求。假如利用VPLEX大概存储自身的双活,则无需第三套阵列,对仲裁站点的要求大为低落,而两对VPLEXMetro网关的代价不菲,而且使存储网络变得复杂。如今盛行的趋势是阵列自带双活功能,比如VMAX3上基于同步复制发展而来的SRDF/Metro,尚有性价比力高的戴尔SC系列LiveVolume双活等,都可以共同实现OracleExtendedRAC。
vMSC的Uniform和Non-Uniform毗连方式除了Oracle之外,VMware是存储双活的另一个主流应用场景。
对于DellSC而言,防止脑裂、判定“谁活谁死”的第三站点仲裁无需采取SAN大概NAS,只要一个物理服务器,大概运行在云中的假造机都可以。
上图引用自VMwrae网站KB文章《ImplementingvSphereMetroStorageCluster(简称vMSC)usingDellStorageLiveVolume(2144158)》。在vSphere延伸集群环境中,DellSC存储双活有两种主机毗连方式,这里列出的是Uniform方式,假如去掉红圈部分的两条交错链路就变为Non-Uniform方式。在Non-Uniform双活毗连方式下,VMware主机可以通过本地DellSC阵列的控制器来访问另一站点SC阵列Onwer的LiveVolume活动卷。这就是存储双活所特有,也是传统同步复制所不具备的技能。
Windows/Hyper-V双活存储主动切换Hyper-V假造化在追赶VMware各人都是知道的,我们也看到VMware支持的一些存储、高可用特性会不绝被微软采取。戴尔在SCOS7.1新版存储软件中,增长了LiveVolume双活对Windows、Hyper-V和集群环境的支持。
上图引用自戴尔技能白皮书《DellSCSeriesStorage:SynchronousReplicationandLiveVolume》。设置LiveVolume之后的LUN,颠末两套存储(CompellentA、B)同时映射到主机后,可以由MPIO多路径软件整合。实际运行中的毗连状态,应该可以Active/Standby大概Active/Active的方式。
这两张图截自DellTechCenter网站上的视频,我们不丢脸出用于第三站点仲裁的主机(或假造机)上安装有DellStorageManager管理软件。上面尚有LV-AFO支持微软环境的最低网络要求:
▌大于便是1Gb/s毗连
▌小于便是5-10ms延时
▌作为仲裁的第三站点到每套DellSC阵列的来回延时小于200ms
固然这里的Windows/Hyper-V双活是依靠Dell存储实现,而链路条件与VMwareVSAN延伸集群的差别并不大,可见相干技能已经比力成熟。
如上图,Hyper-V集群中的ClusterDisk数据盘和QuorumDisk仲裁盘,都是放在CSV集群共享卷上的VHDX文件,集群共享卷底下就是LiveVolume。与VMware环境相似的是,此时Hyper-V假造机也可以轻松地在差别站点之间的Windows主机间举行迁徙等操纵。
两地三中心双活不便是全部
同城双活,OracleExtendedRAC如今广泛保举的站点间间隔(光纤长度)是不高出40公里;VMware和Hyper-V最远可达100-300公里。网络延时不可克制,规律还是间隔越远性能越差。在两地三中心容灾方案中,除了同城之外一样平常还必要1000公里以外的灾备站点。这时就必要长途复制大概备份,由于延时和昂贵的带宽根本上只能做到异步。以上图中的DellSC存储为例,除了黄色地区的两套阵列采取同步复制/双活之外,还可以选择在差别位置添加异步复制。一种是“级联式复制”,从明尼阿波利斯的同城容灾中心复制到圣保罗(这里是用近间隔来举例);另一种则是“一对多复制(含双活)”,直接从明尼阿波利斯主站点复制到东海岸的新泽西。固然,除了数据掩护特性之外,用户肯定也不盼望双活与存储的别的高级功能互斥,比如快照、主动分层优化等等。
点击“阅读原文”相识更多戴尔将来停当方案
我要评论