高端服务器技术 服务器性能指标以系统响应速度和作业吞吐量为代表。响应速度是指用户从输入信息到服务器完成任务给出响应的时间。作业吞吐量是整个服务器在单位时间内完成的任务量。假定用户不间断地输入请求,则在系统资源充裕的情况下,单个用户的吞吐量与响应时间成反比,即响应时间越短,吞吐量越大。为了缩短某一用户或服务的响应时间,可以分配给它更多的资源。性能调整就是根据应用要求和服务器具体运行环境和状态,改变各个用户和服务程序所分配的系统资源,充分发挥系统能力,用尽量少的资源满足用户要求,达到为更多用户服务的目的。 技术目标 服务器所要求的高扩展性、高可用性、易管理性、高可靠性不仅是厂商追求的技术目标,也是用户所需求的。 可扩展性具体表现在两个方面:一是留有富余的机箱可用空间,二是充裕的I/O带宽。随着处理器运算速度的提高和并行处理器数量的增加,服务器性能的瓶颈将会归结为PCI及其附属设备。高扩展性意义在于用户可以根据需要随时增加有关部件,在满足系统运行要求同时,又保护投资。 可用性是以设备处于正常运行状态的时间比例作为衡量指标,例如99.9%的可用性表示每年有8小时的时间设备不能正常运行,99.999%的可用性表示每年有5分钟的时间设备不能正常运行。部件冗余是提高可用性的基本方法,通常是对发生故障给系统造成危害最大的那些部件(例如电源、硬盘、风扇和PCI卡)添加冗余配置,并设计方便的更换结构(如热插拔),从而保证这些设备即使发生故障也不会影响系统的正常运行。 可管理性旨在利用特定的技术和产品来提高系统的可靠性,降低系统的购买、使用、部署和支持费用。最显著的作用体现在减少维护人员的工时占用和避免系统停机带来的损失。服务器的管理性能直接影响服务器的易用性。可管理性是TCO各种费用之中所占比例最大的一项。
有研究表明,系统的部署和支持费用远远超过了初次购买所花的费用,而付给管理和支持人员的报酬又是其中所占份额最高的。另外,工作效率的降低、商业机会的丧失和营业收入的下滑所带来的财务损失也不可忽视。因此,系统的可管理性既是IT部门的迫切要求,又对企业经营效益起着非常关键的作用。可管理性产品和工具可通过提供系统内部的有关信息而达到简化系统管理的目的。通过网络实现远程管理,技术支持人员在自己的桌面上即可解决问题,不必亲赴故障现场。系统部件可自动监视自己的工作状态,如果发现故障隐患可随时发出警告,提醒维护人员立即采取措施保护企业数据资产,故障部件更换的操作也非常简单方便。 说到可靠性,简单来说就是要求服务器必须稳定运行,也就是宕机率低。其中的关键在于操作系统与硬件设备的协作,如果待处理的资源控制在CPU和操作系统上,而不是应用上,就会避免由于某项任务处理出错而导致系统无法运行,服务器宕机率将大大降低,而这也恰恰是Unix/Linux系统的优势之一。导致日常维护工作的中断有:主机升级、硬件维护或安装、操作系统升级、应用/文件升级或维护、文件重组、全系统备份等原因。意外的灾难包括硬盘损坏、系统故障、软件故障、用户错误、电源掉电、人为破坏和自然灾害等因素。 SMP SMP(Symmetrical Multi-Processor)就是对称式多处理器。在对称式结构中,机器里每一位处理器的地位都是一样的,它们连接在一起,共享一个存储器。
存储器里有一个操作系统,每个计算机都能运行这个操作系统,都能响应外部设备的要求,即每个存储器的地位是平等的、对称的。在国内市场上这类机型的处理器一般以4个或8个为主,有少数是16个处理器。但是一般来讲,SMP结构的机器可扩展性较差,很难做到100个以上多处理器,常规的一般是8个到16个,不过这对于多数的用户来说已经够用了。这种机器的好处在于它的使用方式和微机或工作站的区别不大,编程的变化相对来说比较小,原来用微机工作站编写的程序如果要移植到SMP机器上使用,改动起来也相对比较容易。SMP结构的机型可用性比较差。因为4个或8个处理器共享一个操作系统和一个存储器,一旦操作系统出现了问题,整个机器就完全瘫痪掉了。而且由于这个机器的可扩展性较差,不容易保护用户的投资。但是这类机型技术比较成熟,相应的软件也比较多,因此现在国内市场上推出的并行机大量都是这一种。 集群技术 通俗地说,集群是这样一种技术:它至少将两个系统连接到一起,使两台服务器能够像一台机器那样工作或者看起来好像一台机器。
采用集群系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力。自80年代初以来,各种形式的集群技术纷纷涌现。因为集群能够提供高可用性和可伸缩性,所以,它迅速成为企业和ISP计算的支柱。 常见集群技术
1.服务器镜像技术 服务器镜像技术是将建立在同一个局域网之上的两台服务器通过软件或其他特殊的网络设备(比如镜像卡)将两台服务器的硬盘做镜像。其中,一台服务器被指定为主服务器,另一台为从服务器。客户只能对主服务器上的镜像的卷进行读写,即只有主服务器通过网络向用户提供服务,从服务器上相应的卷被锁定以防对数据的存取。主/从服务器分别通过心跳监测线路互相监测对方的运行状态,当主服务器因故障宕机时,从服务器将在很短的时间内接管主服务器的应用。 服务器镜像技术的特点是成本较低,提高了系统的可用性,保证了在一台服务器宕机的情况下系统仍然可用,但是这种技术仅限于两台服务器的集群,系统不具有可扩展性。
2. 应用程序错误接管集群技术 错误接管集群技术是将建立在同一个网络里的两台或多台服务器通过集群技术连接起来,集群节点中的每台服务器各自运行不同的应用,具有自己的广播地址,对前端用户提供服务,同时每台服务器又监测其他服务器的运行状态,为指定服务器提供热备份作用。当某一节点因故障宕机时,集群系统中指定的服务器会在很短的时间内接管故障机的数据和应用,继续为前端用户提供服务。 \\错误接管集群技术通常需要共享外部存储设备—磁盘阵列柜,两台或多台服务器通过SCSI电缆或光纤与磁盘阵列柜相连,数据都存放在磁盘阵列柜上。这种集群系统中通常是两个节点互为备份的,而不是几台服务器同时为一台服务器备份,集群系统中的节点通过串口、共享磁盘分区或内部网络来互相监测对方的心跳。 错误接管集群技术经常用在数据库服务器、MAIL服务器等的集群中。这种集群技术由于采用共享存储设备,所以增加了外设费用。它最多可以实现32台机器的集群,极大地提高了系统的可用性及可扩展性。
3.容错集群技术 容错集群技术的一个典型的应用即容错机,在容错机中,每一个部件都具有冗余设计。在容错集群技术中集群系统的每个节点都与其他节点紧密地联系在一起,它们经常需要共享内存、硬盘、CPU和I/O等重要的子系统,容错集群系统中各个节点被共同映像成为一个独立的系统,并且所有节点都是这个映像系统的一部分。在容错集群系统中,各种应用在不同节点之间的切换可以很平滑地完成,不需切换时间。 容错集群技术的实现往往需要特殊的软硬件设计,因此成本很高,但是容错系统最大限度地提高了系统的可用性,是财政、金融和安全部门的最佳选择。 目前在提高系统的可用性方面用得比较广泛的是应用程序错误接管技术,即我们通常所采用的双机通过SCSI电缆共享磁盘阵列的集群技术,这种技术目前被各家集群软件厂商和操作系统软件厂商进一步扩充,形成了市面上形形色色的集群系统。 基于IA架构高性能集群系统技术 利用最新的4、8路IA服务器架构的高性能服务器集群系统, 采用了领先的VI(Visual Interface)技术,有效地消除了系统中节点之间通讯的瓶颈;同时,系统采用的负载均衡技术使用户设备可以充分得到利用,并且达到了4个9的可靠性,具有极高的产品性价比,为Internet的应用提供了一个强有力的数据库服务器平台。
1.系统概述 数据中心领域一直是高端RISC服务器的天下,多年来人们只有选择AS400 、E10000、HP9000等这样的小型机,价格昂贵,维护成本高。而IA 架构服务器价格低廉,易于使用和维护,通过Cluster技术可以构造超级计算机,其超强的处理能力可以取代价格昂贵的中大型机,为行业的高端应用开辟新的方向。 对于成长中的大型用户来讲,数据中心或数据仓库中所保存的企业经营、管理数据的增长是十分惊人的,而这些数据对大型用户的作用又是非常重要的。发展若干年中积累下的数据是一笔宝贵的财富,通过对这些浩若烟海的数据进行分析,经营者们能够得出直观的经营图表、曲线,能够为以后大型用户的发展提供有力的决策支持。但是由于这样的数据随着时间的流逝不断膨胀,给大型用户的IT系统管理人员带来了巨大的压力。 用户到底需要什么样的服务器才能满足目前和未来发展的需要? 首先要有超强的计算能力,可以承受长时间、大用户量的并发访问。 其次,服务器系统的高可用性、易用易管理对于用户也是极为重要的,如果系统出现故障,造成服务的中断,或者重要资料的丢失,会给用户造成挽回的损失。所以,用户在选择服务器系统时一定要考虑高可用的系统方案。 第三,随着数据的不断堆积,对数据的查询和统计将使系统变得越来越慢,硬件设备的更新换代可以说是一个发展中的大型用户必不可少的工作。 利用最新的4、8路IA服务器架构的高性能服务器集群系统[1], 采用了领先的VI(Visual Interface)技术,有效地消除了系统中节点之间通讯的瓶颈;同时,系统采用的负载均衡技术使用户设备可以充分得到利用,并且达到了4个9的可靠性,具有极高的产品性价比,1999年推出以来引起了用户的广泛关注,为国内广大用户提供了一个强有力的数据库服务器平台。
2.系统原理 高性能服务器集群系统是基于2节点或4节点的集群,最多可达32个CPU,内存最大支持32GB。4节点构成一个工作单元,最多可级联16个工作单元。 各节点为IA服务器,它支持4路或8路Pentium III Xeon CPU并行处理。每台服务器上插一块千兆网卡或vi结构的高速交换卡,连接至一台高速交换机(可以是千兆以太网卡交换机或某些特殊的高速交换机,例如vi结构的高速交换机)做为服务器彼此之间的数据交换用,称之为SAN(Server Area Network)交换机。 每台服务器插有一块百兆或千兆以太网卡,连接到局域网用的交换机或集线器上,为客户端的访问提供连接服务。 四台服务器共享一台光纤通道磁盘阵列柜。每台服务器有两块光纤通道卡,分别连接到两个光纤通道的集线器上,每个集线器分别连接到光纤通道磁盘阵列柜的两个控制器上。对于光纤通道磁盘阵列柜,只要有一个控制器能正常工作,整个阵列柜就能正常工作,因此这种配置方案是冗余的,防止单点失效。对于最重要的存放在磁盘阵列柜中的数据,还可采取将集群系统与磁盘阵列柜分别存放的方式来确保数据安全,光纤通道允许集群系统与磁盘阵列柜之间最长10公里的距离。 每台服务器有一个硬盘区域,用于安装本机的引导系统和数据库系统的管理部分。用户数据存储在共享的磁盘阵列柜中。
在局域网中,有一台客户机做为管理控制台,在其上安装有数据库的管理控制台,用于管理并行数据库,可以同时监控四个节点上的数据库实例,实现启动、停止、监控运行性能等功能。 另外在这台客户机上安装有网管系统,SAN的管理控制台,磁盘柜的管理控制台,UPS管理控制台等,实现集群系统的统一管理。有的管理功能实现时只需要安装TCP/IP协议,有的则还需要安装SNMP协议才能正常工作。 一个良好的集群系统除了优秀的性能指标之外,还需要有相应的操作系统和数据库的支持,我们目前的集群系统支持WINDOWS NT 4.0 及WINDOWS 2000操作系统[2],在数据库方面支持ORACLE和DB2。它不运行在单机上,只有在多个节点同时工作时,才能够显示出它的性能,并使得系统能够真正做到负载均衡(Load Balance)。 2.1 两节点集群系统 从方案的配置上来说,用户可以根据需要做不同的选择,可以使用两台高端服务器实现一个虚拟主机。这时,采用vi结构的高速交换设备更具有优越性,不需要使用vi 交换机,可以用每台服务器上的vi结构的高速交换卡直连实现服务器之间的高速数据交换。如果使用千兆以太网卡,还需要千兆交换机,成本较高 |