行业新闻

英特尔众核技术受关注 MIC比拼GPU
时间：2011-07-01

导读：

文:新闻中心

　　【IT168 评论】6月20日，英特尔在2011年国际超级计算大会(ISC)上演示了一系列基于英特尔集成众核(MIC)架构的研究应用成果，并宣布计划在2011-2020末期实现每秒百亿亿次浮点计算性能(ExaFLOP/s)的宏伟愿景。百亿亿次计算机的性能表现相当于目前全球最快的超级计算机的百倍之多。

　　值得关注的是，为了实现百亿亿次的目标，英特尔将希望寄托于全新的MIC众核架构。据了解，跟通用的多核至强处理器相比，MIC众核架构具有更小的内核和硬件线程，以及更宽的矢量单元，非常超级超高度并行的应用。首款MIC产品(代号为“Knights Corner”)计划采用英特尔支持创新的3-D三栅极晶体管的22纳米制程技术，集成50个内核，预计于2012年推出。而且，跟其他众核产品，如与GPU相比，MIC众核产品由于仍然基于X86架构，编程模式没有变化，应用软件无须重写就可迁移到新的平台上来。

　　6月24日，在2011年英特尔高性能计算研讨会上，MIC众核产品也引发了国内与会专家用户的极大兴趣。由于此前已经有一些用户在通过CPU+GPU协同计算来加速高性能计算，因此，GPU与MIC的比较也受到了大家的广泛关注。

　　对此，中国石油东方地球物理公司研究院处理中心总工程师赖能和认为，主要有三个方面的原因，一是单纯依赖CPU来提高性能会面临很多麻烦，包括占用空间、用电等方面;二是如果全用GPU，软件厂商按核来计费，给用户带来了很大压力，用户特别期待英特尔能推出重核的众核产品;三是GPU需要用新的架构来编程，对于自主研发的软件难度也很大，需要有专门的队伍，而MIC兼容传统的CPU编程模式，软件移植与优化更容易。

　　赖能和在接受采访时谈到，CPU+GPU协同计算的技术日趋成熟，与当前的CPU性能相比，一个GPU相当于5-8个CPU的运算速度，在空间和电耗节省方面非常明显。自2008年以来，CPU+GPU混合架构的计算机快速发展，并在石油行业得到广泛应用，效果明显。比如，在由14336个英特尔CPU和7168个GPU构成的天河一号高性能计算机上，东方公司进行了辽河大民屯1.4TB数据的RTM实测，如果使用最新的CPU核，需要15-20天，而使用8万核的天河一号，2天就完成了。

　　然而，这也并不意味着所有应用都可能获得这样的高性价比。

　　由于现在软件厂商按内核数来收费，一颗GPU动辄有几百个核，因此如果用户有自己的自主软件，加上省电、省空间，确实可以省很多钱，但如果没有自主软件，使用商业软件的话，与传统的CPU集群相比，软硬件总投资成本降低的空间就很有限了。

　　赖能和也谈到，GPU现在还有一些不足的地方，一是高密度带来了高噪音，因此不建议选太高密度，比如一个节点如果加3个GPU，噪音会很大，二是稳定性还有待考验，三是对网络的支持不够好，比如选择铜缆的Infiniband，集成起来非常困难。

　　浪潮与英特尔联合构建的并行计算实验室，也对基于英特尔集成众核架构(MIC)技术的应用进行了优化研究，涉及石油天然气、数值气象预报、生命科学、计算流体力学和金融风险分析等领域。

　　对于英特尔MIC和GPU的区别，浪潮高性能服务器产品部总经理刘军认为主要有两大不同：

　　一是运算单元及线程模型的不同，MIC是基于重核的众核，虽然核心数量只有几十个，基于P4修改的核心是完整的处理器核心，性能比较强，在实现机制上可以做pthread和MPI，而GPU则是基于轻核的众核，有几百个内核，但每个核的性能较弱。这些不同使得这两种的应用也不一样，GPU的性能主要依赖于细粒度、大规模并行，如果用于粗粒度并行，性能反而会有损失，而MIC能够兼顾两者，即通过重核来实现粗粒度，通过指令级并行实现细粒度。

　　二是调优方式的不同。MIC基于传统的CPU和X86指令集，原来的编程模式可以通用，而GPU是基于新的架构，需要考虑更多的体系结构细节，因此其对软件开发工程师的要求也更高。不过，刘军也指出，针对GPU的代码调优，程序员可控的程度更高，而MIC代码调优的可控程度较低，主要依靠挖掘指令级并行。

产品观察

2013-12-23Fortinet推出战略产品FortiGate-100D防火墙
2013-01-31IBM Storwize V3500入门级存储
2012-04-15IBM x3650M4和x3550M4机架服务器 - 至强E5正式发布
2012-08-16X86新星惠普DL380p Gen8服务器评测
2012-08-08全新设计惠普DL360p Gen8服务器

行业新闻