服务器单点故障(服务器单点故障什么意思)「单点服务器的缺点」

  点击“戴尔企业级办理方案”快速订阅

  “

  在《「存储极客」三步完玉成闪存选型》

  一文中,

  我们先容了怎样

  测试存储体系的OLTP性能。

  而具体到影响买卖业务体系性能

  的决定因素——

  CPU、内存还是IO子体系?

  关于这一点在差别场景下

  的权重也不一样。

  下面从近来的一份

  TPC-EBenchMark测试结果提及。

  ”

  11,200TPS

  是什么样的性能程度?

  

  由于单个买卖业务的复杂程度差别,

  TPS(每秒买卖业务数)和TPM(每分钟买卖业务数)

  只有在雷同测试模子下比力才故意义

  如上表,这套被测体系在大负载Profile下表现出11,200TPS(每秒买卖业务数)的支持本领。

  具体来说,就是测试了1-4个假造机,每个假造机400个用户负载,活泼数据集约莫1TB。在4个VM时并发用户数到达1600,活泼数据集统共4TB。性能扩展方面的表现还是不错的。

  那么这个TPC-E结果毕竟怎样呢?我去TPC官方网站查询了一下发布的结果。

  

  https://www.tpc.org/tpce/results/tpce_perf_results.asp,2017年2月23日

  我看到在这里公布的TPC-E测试结果中,排名第一的tpsE(也是指TPC-E的每秒买卖业务数)为11,059。前两名TPS高出一万的都利用了八路(8CPU插槽)服务器,操纵体系、数据库为Windows+SQLServer,提交时间2015年底。

  第一点小发现是,TPC-E结果并不是与CPU核心数量/总盘算本领成线性关系。由于就在这个榜单中,四路服务器也能跑出高出9000的TPS。

  注:本文以讨论技能为目标,并不关注具体的服务器品牌型号,只看设置和测试表现。

  TPC-E测试负载模子要点

引用自《TPC-EBenchmarkOverview》

  byTPC-PRSubcommittee,2007年2月

  上表对比了TPC-E和TPC-C测试的重要区别,我们看到在数据库表、列的数量,数据范例丰富程度,主键/外键等方面都是TPC-E更加复杂,因此它们的测试结果不能交错对比。同样的原理,用SwingBench等测试工具设置一个简单买卖业务模子,也很轻易跑到更高的TPS值。

  

  这里列出了测试可担当的场景/范围。AQRT(均匀查询相应时间)必要低于25ms,这个延时与存储的IO延时不是一回事,由于一次查询操纵中大概会包罗数量不等的IO,还受应用(数据库)缓存掷中率的影响。

  关于CPU利用率80%-85%,假如高出这个值意味着CPU大概成为瓶颈,要是较低则表明压力不敷,体系盘算本领尚有裕量。

  同样是“堆”SSD,

  DAS和全闪存阵列哪个结果好?

  

  由于陈诉提交时间的缘故起因,这两套TCP-E测试体系的OS、数据库版本,以及CPU都不是最新一代,但XeonE7-8890v3的144个核心和4TB内存还是比力豪华了。而更加“失常”的是,上表中的八路服务器利用8块RAID卡加12个JBOD扩展柜,一共毗连了104个SASSSD(包罗6组17个SSD的RAID5)。

  只管在《存储极客:SSDRAID能跑多快?要安全就没性能?》一文中,我们谈到过RAID卡对SSD性能发挥(重要是写性能)的影响,不外上述平台的团体IOPS、带宽还是可以秒杀很多PCIe闪存设置了。

  

  别的一款八路服务器在TPC-E测试中更进一步,设置了15块SASRAID卡、15个JBOD机箱内里一共210个400GBSSD。我们肯定I/O性能对TPS的影响,但在到达肯定程度之后,存储子体系大概就不再是瓶颈了。

  本文开头提到的11,200TPS测试结果并没有提交到TPC官网,有些测试设置大概存在差别,因此这个对比也只是给各人一个参考。此中有一点差别就是上面2款八路服务器都是在物理机Windows体系中测试的,而下面要先容的平台利用了假造机(Hyper-V)。

  

引用自《TPC-EtestingofMicrosoftSQLServer2016onDellPowerEdgeR830ServerandDellSC9000Storage》

  如上图,这套平台的数据库服务器为DellPowerEdgeR830,后端毗连SC9000存储阵列,存储网络由2个Brocade6505FC互换机构成。万兆以太网互换机型号为DellS4048-ON,没有看到关于客户端服务器的形貌。

  

  具体的服务器设置,是XeonE5-4600四路平台中的顶配CPU——22核的4669v4,底子频率2.2GHz,固然单个CPU性能比XeonE7v3强,但四颗的核心总数为88个。满配1.5TB内存也无法与八路平台测试利用的4TB相比。

  服务器上操纵体系和数据库也利用了微软Windows+SQLServer平台;SC9000存储阵列为全闪存设置,双控制器+2个SC420驱动器机箱,18个写麋集型SSD加12个读麋集型SSD的分层摆设。

  服务器2U、存储8U,加上全部互换机也才14U的高度,比前面提到十几个JBOD占满整个机柜在空间上要节流不少,耗电也是一样。

  通常意义上,假如只是单纯实现单台服务器的存储性能最大化,不通过存储网络直连SSD是最好的办法。除了无法与别的服务器共享之外,尚有故障点增长的题目,固然驱动器设置了RAID,但任何一块RAID卡大概JBOD故障都会导致部分数据无法访问。在云云规模的DAS环境添加服务器实现共享存储的高可用也不太实际。

  相比之下,外部存储阵列中的30个SSD在这里并没有表现出性能不敷。我以为起首是一部分数据哀求在应用(数据库)缓存掷中了;其次贴近实际应用的TPC测试中每个买卖业务所包罗的操纵,一部分瓶颈并不在存储(SSD/磁盘)上。在这种环境下,全闪存阵列显得更加均衡——还具备高可用性,从服务器上的HBA卡到光纤互换机,再到控制器都是双份冗余的。假如想进一步规避服务器的单点故障,增长节点设置共享存储的高可用集群也都是成熟方案。

  假如应用确实必要极致的存储IOPS大概带宽性能,不太在乎本钱,同时想分身高可用以及在服务器之间的共享毗连本领,着实尚有一种选择——EMCDSSDRACK-SCALE闪存体系。号称高出100GB/s带宽和高出1000万IOPS(实测读写肴杂129GB/s带宽和1600万IOPS,同时具备双控制器和冗余的PCIe主机毗连,只要5U机倾轧间。

  

服务器单点故障(服务器单点故障什么意思) 服务器单点故障(服务器单点故障什么意思)「单点服务器的缺点」 行业资讯

引用自《ModernizeyourSASanalyticsinfrastructure

togetsmart,timelydecisionsatscale》,

APrincipledTechnologiesreport,2016年9月

  SAS属于大数据分析(BI)类应用,上图只是想侧面证明一下DSSD的性能潜力,一台服务器很难把它用满,纵然四路、八路服务器也是云云。

  更多测试规模、性能均衡点分析

  

  在Dell的这份性能陈诉中,尚有别的两种数据集巨细的测试结果,对应假造机分配的vCPU和内存资源也不雷同。

  

引用自《TPC-EtestingofMicrosoftSQL

Server2016onDellPowerEdgeR830

ServerandDellSC9000Storage》

  “中等工作负载”测试了1-8个假造机(500GB)的压力,每假造机300统共2400个并发用户,测试结果为10,967TPS,比4个“大假造机”略低。

  

  引用自《TPC-EtestingofMicrosoftSQL

  Server2016onDellPowerEdgeR830

  ServerandDellSC9000Storage》

  “小型工作负载”测试了1-8个假造机(250GB)的压力,每假造机90统共720个并发用户,测试结果为10,300TPS。

  

  引用自《TPC-EtestingofMicrosoftSQL

  Server2016onDellPowerEdgeR830Server

  andDellSC9000Storage》

  末了看下CPU占用率,三种数据集巨细根本都到达80-85%的正常范围。

服务器单点故障(服务器单点故障什么意思) 服务器单点故障(服务器单点故障什么意思)「单点服务器的缺点」 行业资讯

  既然总盘算本领(多核)、存储性能都不是决定TPC-E结果的唯一因素,连合差别假造机规模/数量的测试结果,我倾向于以为NUMA优化——CPU访问内存的服从应该也是一个必要优化计划的点。

  

  DellPowerEdgeR830的多处理惩罚器互连方式

  也属于NUMA(非同等性内存访问)架构

  参考我们之前在《几轮PK帮你优选“真四路”!》中所讲的,只管XeonE5-4600四路平台在CPUQPI互连方面的本领不如XeonE7,但假如4个假造机恰好跑在每个CPU插槽及其本地内存的话,反而能到达最好的服从(XeonE5不像E7那样通过SMI缓冲芯片毗连内存,延时较低)。

  相比之下,八路及以上平台确实可以支持更大的内存和数量更多的PCIe扩展卡,但必要符合的应用(比如SAPHANA)才华发挥出与其代价相匹配的代价。

  相干文章导读

  ↓↓↓

  又双叒叕第一!

  几轮PK帮你优选“真四路”!

  「存储极客」三步完玉成闪存选型

  工程师条记:SCv2000试用之RAID分层+快照

  存储极客:SPC-1负载分析与AFA寿命评估

  存储极客:SSDRAID能跑多快?要安全就没性能?

  

  点击“阅读原文”相识更多戴尔将来停当方案

客户评论

我要评论