服务器虚拟化可能会导致存储问题,比如I/O瓶颈或复杂的灾难及恢复工作,但是这些问题都可以避免。
服务器虚拟化提高了主机效率,但是在存储管理员看来,服务器虚拟化可能使存储端变得一团糟,导致的棘手问题可能包括给主存储和备份存储带来巨大的I/O瓶颈,复杂的灾难和恢复工作等等。
服务器使用多核CPU创建多个虚拟机,大型企业的服务器群中70%到80%的服务器都被虚拟化了。大量的虚拟化在应用程序服务器和主存储之间,主存储和备份存储之间产生了数量巨大的应用程序I/O。
而且,在2000年与2010年之间,全世界服务器的数量增加了6倍,与此同时存储的数量却增加了69倍。据IBM的研究人员所说,正是由于服务器虚拟化导致了这一结果。
通过对几十名存储管理员进行了问卷调查,想发现服务器虚拟化使他们日常的工作复杂到了什么程度。问卷调查发现了以下五大令人头疼的问题,但是不必担心:IT分析师以及虚拟化专家给存储管理员提供了如何应对这些挑战的建议。
1. 存储性能降低与I/O瓶颈
IT管理员痛苦地意识到存储性能远远落后于计算性能。因此当进行虚拟化时,在Computerworld调查问卷中三分之一的存储管理员首要关注的问题就是I/O瓶颈以及存储性能低下,这也就不足为奇了。
Taneja Group的高级分析师Jeff Boles说:“虚拟化允许你在物理硬件上运行大量的工作负载,但是大量不同的I/O操作混合在I/O流中,导致了磁盘工作更加紧张,缓存效率更低。虚拟化让我们在使用硬件资源时很轻易地便超出了现有硬件的计算能力。”
对策:应对I/O瓶颈的解决方案取决于问题存在于网络中还是存储中。一般来说问题通常存在于存储环境中,因为存储性能的提高已经落后于其他所有的基础设施。Jeff Boles说:“存储性能在以非常缓慢的速度线性前进。机械磁盘只能以此速度前进。而且只有部分问题是可见的,管理员不能看到存储内部环境在发生什么,因此他们不知道如何解决这个问题。幸运的是,有一些工具能够非常轻松地帮助我们找出问题所在并提供解决方法。”
以光纤通道用户为例,他们可能使用针对存储区域网络(SAN)的虚拟基础设施性能监控工具优化性能,提高可用性。其他的存储供应商也提供了可视化工具:NetApp最近收购了Akorri及其针对虚拟基础设施的预测工具,EqualLogic提供了一个图形用户界面,用户可以使用该软件对存储系统的性能进行监控。
总部位于波士顿的阿诺德全球广告代理在五年之前对大部分服务器进行了虚拟化。高级系统工程师Chris Elam记得当他第一次开始进行备份时,发现备份的吞吐量在下降,备份的时间在增加。但是Dell Compellent SAN的可见性工具对这一问题进行了告警。Chris Elam增加了更多的磁盘以提高每秒钟的I/O操作,现在Compellent在这些磁盘之间分散存储数据。
另一个需要当心的问题是,因为数据在不断变化,五台生产服务器在白天进行复制操作,除此之外,阿诺德全球广告代理的IT设备在离线时间进行了更多的复制操作。Chris Elam说:“我们正在解决I/O问题。”他接着说道客户服务非常重要:“备份时间更长是一件事,但如果用户开始抱怨系统运行缓慢就是另外一件事了。”
在I/O方程式中另一个需要考虑的重要因素就是性能。Chris Elam说:“基于现有的基础设施考虑I/O的密度及性能对管理员来说是非常重要的。数据中心的工作负载密度已经大大增加了。现在在单个机架内会有30个运行虚拟机的工作负载。”
通过使用固态硬盘以及其他相似的技术,效率更高的缓存或者是自动分层可能能够增加I/O密度。另外,只有在单个存储系统中增加更多的服务器,I/O才会增加。Scale-out扩展技术能够为提高性能及容量提供帮助。
Jeff Boles说:“例如,中小型业务用户可以考虑规模计算工具。中型用户可以考虑EqualLogic,企业可以考虑NetApp和3Par。”
2. 更加复杂的数据备份及灾难恢复
在Computerworld的调查问卷中,超过四分之一的受访者(27%)说服务器虚拟化使备份和灾难恢复变得复杂。
据Jeff Boles所说,最大的错误之一就是试图使用传统的备份方法保护虚拟基础设施。当扩展硬件端虚拟机的数量时,备份性能的降低远远不是线性下降的。当你试图一蹴而就地保护所有的虚拟服务器时,将引起明显的备份争用问题。你可能试图在同一台物理服务器上同时开启10个备份,这会在服务器内部导致对内存,CPU,网络以及存储的大量争用。
让事情变得更加复杂的是工作负载迁移工具,比如VMware的Storage vMotion,该工具允许用户在共享存储之间甚至跨多个共享存储重新安置虚拟机文件。Jeff Boles说:“现在你不得不在虚拟机移来移去的同时继续进行备份,这可能会陷入到另一个瓶颈中,是一个令人感到头疼的严重问题。”
虚拟桌面I/O困境
虚拟桌面的I/O工作负载对磁盘阵列的性能影响令人吃惊。首先,尽管单个工作站传统的I/O工作负载在本质上是有顺序的,但是很多的IT部门正在单个存储平台上运行上千个虚拟桌面,这导致了I/O“搅拌机效应”。
制造固态存储阵列的WhipTail公司的CTO James Candelaria解释说:“就磁盘阵列而言,在不同的磁盘区域都在执行顺序I/O,这会将那些易于服务的顺序I/O模式转变为严重的,随机I/O模式。”
对于传统的磁盘阵列来说,这是个大问题。因为很多传统的磁盘阵列并没有足够的缓存保存涌入的数据,这时便会发生缓存未命中,导致了系统性能的降低。
对策:首先,进行I/O配置分析,确保你了解正在请求哪些I/O。James Candelaria说:“通用的经验法则就是在稳定环境的虚拟桌面基础设施中支持典型的用户。每个用户在每秒需要20到40个I/O。如果不考虑虚拟桌面对I/O的请求,那么用户体验将受到严重的影响。”
同时,确保具备能够扩展的存储架构和传输架构。James Candelaria说:“我看到大量用户没有高速存储架构就尝试进行虚拟桌面项目,运行环境频繁地达到了运行在SCSI上的1Gb存储连接的峰值。你需要考虑速度更高的传输比如10Gb iSCSI或光纤通道。”
如果你打算给远程用户交付虚拟桌面,那么要确保你具有足够的带宽,能够提供令人满意的用户体验。
最后,James Candelaria说要确保具备大量的写I/O。如果进行了正确的设计,绝大多数的桌面工作负载都是写I/O而不是读I/O。传统的供应商像Citrix和VMware已经提供了缓解从阵列冲读取数据流量的方法,这些供应商提供的产品不必返回阵列请求数据,减少了冗余流量的数量。
在备份端,一些供应商正在构建针对虚拟环境,运行在虚拟基础设施中的备份和恢复工具。通过这些工具,供应商能够捕获并管理位于物理服务器之上的数据,在数据离开服务器之前就进行优化。
例如,Acronis最近发行了一款产品,该产品能够在几分钟内对虚拟机进行备份并恢复数据,同时在虚拟机迁移的过程中保持数据的条理性。许多供应商对一些虚拟基础设施的功能进行了治理,比如存储快照工具与复制比以往的数据备份更简单,速度也更快。
位于美国阿肯色州的费耶特维尔银行第一次开启虚拟化服务器时,其高级副总裁与IT经理Les Barnes采用了传统的方法对虚拟机进行备份:他使用了磁带库。但是在几个月之后,Les Barnes了解到还有一个更好的方法。而且传统的备份通常要花费一晚上的时间,但是随着原来越多的用户需要7*24在线访问系统,所以Les Barnes需要另一个解决方案。他完全消除了使用传统的备份,使用SAN复制和SAN快照方法保留多个非现场SAN备份。
Les Barnes 说:“使用SAN复制之美在于它完全卸载了服务器的I/O,数据现在在后端通道的SAN集群之间流通,对最终用户和虚拟机没有任何影响。而且如果不得不进行恢复,那么在几分钟之内而不是数小时或数天内就可以完成恢复。”
阿诺德全球的Chris Elam采用SAN方法提高了备份效率,他说:“在整个周末将全部数据写入磁带几乎是不可能的。广告代理在SAN上具有60TB的数据,但是因为我们正在进行大量的离线复制充当备份,同时保持活动快照,还采用了重复数据删除确保备份在指定的时间窗口内完成。”
但是Chris Elam提醒到这些快照可能非常大:“最大的问题是在我们执行快照时没有意识到快照或录像所占据的磁盘空间。我们甚至没有考虑所花费的时间。正确的做法是你需要按照数据存储的数量进行规划。”
3. 管理共享存储面临困难
在Computerworld的调查问卷中,大约23%的管理员说服务器虚拟化给共享存储管理带来了新的问题。
企业通常在存储系统中存储了大量不同的工作负载,管理员通常并不清楚存储卷之间的连接,每个存储卷支持的工作负载,对每个存储卷的请求,以及是谁在消耗容量。
Les Barnes 解释说:“从本质上说,虚拟基础设施在存储基础设施的顶部创建了另一个抽象层,并没有真正地将你从存储层的复杂性中解放出来。现在你管理一个虚拟存储层,这个虚拟存储层由VMware的VMFS,所有不同的虚拟服务器文件及数据组成。而且你正在在虚拟基础设施内部部署这些资源,甚至还可能会执行一些操作比如快照。最为重要的是,你仍然要管理物理基础设施并考虑I/O请求。同时管理抽象层和物理基础设施层,理清两者之间的头绪比以往更加困难。”
对策:考虑精简部署,精简部署提供了存储虚拟化功能,通过将数据分配到可用空间中,为解决存储利用率低下提供了帮助,仅在需要时才从共享池中按需分配物理存储。通过使用服务器虚拟化和精简部署,用户能够优化服务器及存储的利用率。供应商3Par,Compellent, DataCore以及NetApp的虚拟化设备及存储都提供了精简部署功能。
4. 满足存储基础设施服务于物理环境和基础环境的需要
和备份及恢复面临的困境类似,在Computerworld的调查问卷中20%的管理员说他们发现很难将存储基础设施用于处理传统和虚拟的混合过程。
对策:采用虚拟化解决方案后,虚拟化解决方案将会和物理环境混合在一起。Jeff Boles 说:“确保你正在使用最好的存储供应商的产品,只有这样你才能获取易用性,简便性以及虚拟基础设施的集成特性。”
一些大型供应商所提供的产品和虚拟基础设施进行了集成,降低了这些系统的复杂性。因此你不必进行大量复杂的工作,比如磁盘组配置。你想能够进行一键存储配置并访问细粒度的存储部署,这样你可以对资源进行划分,了解是谁正在使用哪些资源,并在今后对其进行管理。
一些大型的IT部门甚至在制造完整的包括像NFS-NAS设置技术的交换机,NFS-NAS设置技术为在虚拟基础设施之下的生产环境中应用做好了准备。Jeff Boles 说:“你可以在一个存储挂载点上存储大量虚拟机,这能够降低复杂性。这远没有试图协调一些物理存储资源与完全虚拟化的服务器基础设施那般棘手。”
5. 为虚拟化服务器选择正确的网络存储存在困难
在Computerworld的调查问卷中,大约18%的存储专业人员说他们不能为虚拟化服务器选择正确的网络存储。Jeff Boles 说:“正确的网络存储起着重要的作用,因为你可以扩展,得到更好的性能,如果作出了正确的选择,日常工作将变得更加简单。”但是正确的解决方案在很大程度上取决于组织机构的目标。
以普渡大学的Krannert管理学院为例,其IT部门最先考虑的不是基础环境的7*24的高可用性,而是在系统崩溃时具备更快的恢复时间。
在没有大量性能损失的前提下,虚拟化存储密集型服务器需要某一级别的存储性能,而SAN并不能达到这一存储性能。对普渡大学来说,显而易见的选择就是10Gb iSCSI,但是成本过高。最终普渡大学选择了LSI 6Gb SAS交换技术,该技术提供了故障切换SAN的优势以及本地端到端6Gb SAS数据通道性能,而且Krannert管理学院能够支付得起。
Ellow说:“即使SAN宕机,我们仍有足够的本地存储,可以采用另一种方式缓步前进。更快地恢复运行远比7*24运行更为重要。”
对策:在选择任何供应商之前,确保你了解管理功能。服务器及存储虚拟化可能很简单:你不必是一名行家或者在SAN管理方面具有丰富的经验。
最后,Chris Elam说虚拟化的优势值得我们付出努力面对上述五大挑战:“虚拟化具备完整的易用性,稳定性,高可用性,能够在白天期间进行复制并进行维护,能够根据你的需要进行迁移并将硬件离线,优势远远大于弊端。而且有很多事情你都不必再花一个周末的时间去做了。”