让欧洲粒子物理研究所(CERN)的科学家们找到“上帝粒子”的,是一个全球性的超级计算机网络。它帮助科学家们从5年累积的海量监测数据中,找到了希格斯玻色子存在的证据。
美国国家大气研究中心怀俄明州超级计算中心,刚刚上线了每秒能实现2万万亿次运算的气候研究超级计算机,用以分析研究中心和美国海洋暨大气总署(NOAA)在过去半个世纪里统计的地面和天气观测数据,它能模拟大气或海洋的变化,对暴雨、飓风进行准确的追踪、预警。
淘宝的量子统计系统是淘宝掌柜离不开的工具,它能对销售、收藏等数据进行实时分析,让掌柜们随时了解顾客的喜好、地理位置,分析、解读店铺的经营状况。作为淘宝进行服务增值的利器,它同样是依靠高性能计算实现的。
……
近十年来,高性能计算的每一步发展都推动了科技、商业的深刻变革。在超级计算系统不断刷新记录的同时,人类在军事航天、核工业、能源勘探、天气预报、生命科学、基因分析、游戏视频制作、电力、教育、工程、政府决策、互联网服务等众多领域,也获得了飞速发展的可能。
在今年6月召开的2012国际超级计算机大会上,超算TOP500排行榜单(以下简称TOP500)中全球最快的超算系统的浮点运算速度已经达到了16.32 PetaFLOPS(千万亿次/秒)。仅几个月后,美国橡树岭国家实验室刚刚建成的超级计算系统——Titan,就凭借20 PetaFLOPS以上的峰值性能改写了这一记录。在刚刚结束的2012年全国高性能计算学术年会上,与会专家预测:峰值100 PetaFLOPS的超算系统将在2014年到2015年之间出现在中国。
超级计算系统从P级计算(PetaFLOPS,千万亿次)迈向E级计算(Exascale,百亿亿次)时代的时间表越来越明确,未来的无限可能将如何展开?面向云计算、大数据时代的应用,E级计算面临的真正挑战又是什么?对于中国,超级计算这条路又应该如何走下去?
E级计算猜想
技术对国家发展带来的巨大实惠远超人们的想象。据IDC预计,百亿亿次级计算将极大推动科学进步,增加各国的工业和经济竞争力,改善人们的生活品质。这也是为什么今天美国、日本、中国、俄罗斯等和欧盟,均在E级计算领域不惜投入展开激烈竞争的原因。
科技、经济发展对高性能计算的依赖,已让计算力成为国力的表征。在美国能源部(DOE)发布的一份关于百亿亿级计算的研讨报告中,曾经充分论述了百亿亿级超级计算系统在美国能源与环境、国家安全、高能物理、核物理和天体物理等研究项目中的价值。在这份报告中,百亿亿次计算被视为支撑核能、生物学与生物燃料、材料、气候建模研究,确保国家核储备安全,以及探索宇宙奥秘和发现微观物质组成的“必要条件”。
在通往E级计算时代的阶梯上,中国与美国的差距到底有多大呢?在TOP500排行榜中,中国的两套超算系统“天河1A”和“曙光星云”进入了TOP10榜单,分别排在第五位和第十位。“天河-1A”的Linpack性能已达到2.57 PetaFLOPS,峰值达到4.7 PetaFLOPS。在TOP500的榜单上,中国有68套超算系统上榜,成为仅次于美国的第二大超算国家。
国际超算权威专家、TOP500的发起人之一Hans Werner Meuer 博士曾用“极具震撼力”来形容中国超算的发展。2011年,中国发布了首台自主研发CPU及底层系统的千万亿次超算系统——“神威蓝光”,将全世界高性能计算领域技术专家的眼光转移到中国。Hans Werner Meuer在接受Super Computers记者的采访时表示:“‘神威蓝光’意味着中国已经形成了足以改写未来产业格局的技术储备。”
在2012中国高性能计算TOP100(以下简称中国TOP100)榜单上,共有8家厂商上榜,国内厂商数量为6家,国外厂商只剩下IBM和惠普两家。曙光以36%的份额超过IBM,夺取了TOP100数量份额第一的宝座,浪潮则以12%的份额位居第三。中国计算机学会高性能计算专委会秘书长张云泉认为,曙光与IBM之间的竞争正在加剧,而浪潮等厂商崛起,意味着中国本土厂商在高性能计算市场位置的巩固。在应用领域,由中科院计算技术研究所自主研发的龙芯系列CPU,也开始在嵌入式应用、桌面应用、服务器应用领域处处开花。现在,龙芯在工业领域的市场份额已达到了5%。基于未来“百亿亿次”计算时代的众核架构应用,浪潮还推出了全自主研发的HPC专用“云冈”刀片服务器等产品。
E级计算不得不推倒“能耗墙”
采用了8700个计算核心(SW 1600)但电力消耗仅为百万瓦特,这正是让Hans Werner Meuer等高性能计算领域的专家对计算性能与英特尔处理器相当的“神威”CPU刮目相看的原因。
超级计算机在性能提升的同时,也带来了能耗问题。“天河1A”要想达到百亿亿次计算级别,必须付出16亿瓦的耗电量,相当于200万个家庭的用电量。在高性能计算发展到P级计算时,能耗问题的严重性就已经显现。IBM深度计算部门副总裁戴夫·特瑞克曾表示,一台只配置中央处理器处理核心的P级超级计算机的能耗约为20亿瓦特,相当于一个中等规模的原子能核工厂的耗能,降低能耗必将成为研究人员考虑的重点。
“高性能计算机的计算速度每十年提高1000倍,大规模应用已经表现出对超高E级计算机能力的需求。但是,根据ITRS预测,未来高性能CUP的功耗将达到120~200W。”在2012年全国高性能计算学术年会上,国防科技大学杨学军院士指出,“能耗墙”将是E级计算将要面对的最大挑战之一。
“每一代芯片的发展,都会使能耗问题变得更糟,未来计算架构必须使系统更加高效才能解决这一问题,未来的高性能计算必将走向混合计算架构。”NVIDIA的Tesla事业部CTO Steve Scott在大会演讲中谈到,为了解决能耗问题,高性能计算的架构演进已经出现了明确方向。
英特尔资深院士、数据中心及互联系统事业部首席技术官、架构事业部和数据中心及互联系统事业部拓展部总经理 StephenS.Pawlowski告诉记者,晶体管本身的耗电问题将成为E级计算发展的羁绊,电压升高可以提升计算能力,但同时又会造成系统稳定性下降,必须为此寻找一个合适的平衡点,在控制能耗的同时还能提升性能。
他指出,要在20兆瓦内做到E级计算,意味着数据在整个系统内部的能耗必须降到20皮焦以内。而现在数据仅从内存迁移到计算单元就大约会产生50皮焦的能耗,让20皮焦变成整个系统内数据移动的全部能耗几乎是不可想象的任务。但如果不完成这个任务,人们就没有办法在有限能耗下完成E级计算。据介绍,英特尔目前正在尝试通过尽量减少数据在系统内移动路径的方法节能降耗,类似的思路也被扩展到了片上通信、片间通信及系统内部通信过程的节能降耗。在他看来,减少数据移动的路径将成为在20兆瓦内做到E级计算的有效方案之一。
谁在束缚E级计算释能
高性能计算应用大多是数据密集型和计算密集型相结合的,对计算和I/O的处理能力都有较高的要求。数据的I/O瓶颈一直是制约高性能计算释放计算能力的关键因素:如果集群中的节点无法获得高速率的数据传输性能,其计算性能也无法获得充分发挥。
高性能计算发展到今天,超级计算机需要处理的任务也越来越庞大复杂,集群需要支持多种类型的数据流。过去只能在同一集群中采用不同类型的互联网络,而这些网络又拥有各自的网络协议,因为网络性能和特性的不同,反而会束缚高性能计算数据中心计算性能的释放。不仅如此,数据中心的运维、管理也会因此而格外复杂。目前,集群计算、存储区域网、网格计算、内部处理器通信等,都在对高带宽、高扩展性、高QoS以及高RAS(Reliability、Availability and Serviceability)产生迫切的需求。目前,石油勘探行业对高性能计算系统的需求已经显露出对E级计算能力的渴望。石油勘探领域的用户非常关注如何将应用迁移到Hadoop架构,以解决计算性能的提升和成本的降低等细节问题。在本次全国高性能计算学术年会上,当记者向美国俄亥俄州立大学的Dhabaleswar K. Panda教授咨询石油勘探应用向Hadoop架构迁移可能存在的风险时,他指出最大问题正是要解决网络通信的瓶颈。“Hadoop架构只有在完成网络优化后,才有可能实现计算性能提升和成本降低的双向受益。如果没有高效的网络通信,基于Hadoop架构的计算平台只是鸡肋。”
“网络通讯将成为E级计算发展的瓶颈。”国际高性能计算咨询委员会主席、Mellanox全球市场开发副总裁Gilad Shainer认为,传输介质所能提供的带宽、传输速率以及数据传输的稳定性和成本效益,都将成为影响超算中心计算能力的关键因素。从操作管理的角度来看,传统方案已经让高性能计算数据中心的维护费用上涨到硬件成本的8倍。从功耗的角度看,用于冷却的能耗费用也上升为硬件成本的两倍。但在很多数据中心,却有超过一半的CPU处于无应用负载的闲置状态。他认为,面向大数据、云计算等应用需求,Infiniband标准显然更具优势。
在Top500榜单中,目前有41.2%的超算系统采用了Infiniband互连技术。据统计,中国超算Top100榜单中,位于前十的系统,也有半数都采用了Mellanox的Infiniband产品,如天河一号、曙光星云等。Gilad表示,Infiniband互连技术在高性能计算市场的占有率已经超过了以太网,高性能计算的网络标准已经转变,这是未来发展的一个趋势。从成本和性能的角度来看,Infiniband的特性比以太网更胜一筹;在扩展性方面,Infiniband的前景也要更好。据他介绍,56Gb/s FDR是当前最高带宽、最低延迟的Infiniband产品,具有最快的网络连接速度和最低的CPU开销。它具有完整的I/O架构——包括适配器、交换机、电缆和软件,能够实现12GB/s的网络带宽,是QDR的两倍,延迟却只有0.7us,是QDR的一半。
超算竞赛将是应用的竞赛
TOP500榜单,只是一次计算力的竞赛结果。比如亚洲最快的超级计算机“K Computer”,虽然在LinPack测试中获得了高分,但其对实际应用的贡献还非常有限。仅将某些超级计算机变成“计算超人”,并不能代表一个国家在高性能计算领域的真正实力。
从今年中国TOP100榜单超算系统的行业分布情况来看,超级计算机的应用领域比去年有所下降。机器数量上变化最明显的是互联网领域,从去年的21%增加到今年的35%,工程领域的占比为11%,首次排到第三位。
在中国科学院计算技术研究所所长孙凝晖看来,虽然中国目前在高性能计算的技术方面与领先国家还有差距,但中国在应用领域的需求却走在了世界的前列,这一变化不容忽视。特别是在互联网和通信领域,中国产生的应用负载需求可能是任何一个国家都难以出现的。
“当前如何让高性能计算承载互联网应用的发展,也是国际领先科研机构和技术领导型企业需要攻克的难题,而如何降低成本、制造更加便宜廉价的产品,满足更广泛的需求,这些问题全球的研究机构和技术企业都是无解的,大家又站在了同样的起跑线上。”他指出,未来中国需求将刺激高性能计算领域的技术发展,中国在高性能计算领域的研究一旦在互联网这样的领域解决了中国的问题,也会连带解决世界的问题。
HPC商业应用新方向
在商用市场,HPC的技术发展正在成为CIO们最关心一个话题。未来,HPC在商业市场的应用前景如何,HPC云与商用云的区别在哪里,HPC在大数据领域又将如何前行……
Platform Computing于去年10月被IBM收购。这家企业服务于全球2000多家客户,包括30家最大规模跨国企业中的23家,欧洲核子研究组织、花旗集团、英飞凌、红牛车队、挪威国家石油公司都是它的客户,它还是HPC在全球商业应用的软件事实标准制定者。针对HPC商业应用的热点问题,本报记者独家采访了Platform Computing联合创始人,IBM系统与科技部Platform Computing全球开发总监王敬文博士。
[此贴子已经被作者于2012-11-16 10:18:36编辑过]