在当前高性能计算系统和应用中,绝大多数是x86架构的处理器和应用,随着高性能计算系统性能的不断提升,多核和众核异构系统在满足高性能计算的某些特殊应用时,则表现出比较出色的性能。
勇于尝试众核技术
不久的将来,英特尔将推出32核Knights Ferry,堪称众核技术的一个顶端。英特尔副总裁兼数据中心事业部总经理KirkSkaugen表示:“英特尔集成众核(MIC)架构将进一步扩大我们业已领先的高性能计算产品和解决方案的竞争优势。英特尔现有的产品在全球顶级的高性能计算机中应用的比例已经接近82%。在此方面的投资也进一步验证了英特尔对于全球高性能计算领域不断增强的承诺。”
中国石油东方地球物理公司研究院处理中心总工程师赖能和先生告诉记者,“我们非常关心众核技术话题,将来MIC将采用另外一种编程语言,即英特尔的Ct,它和目前的编程究竟有多大差别,我们也很关心。”他还强调:现在GPU推动起来有点难度,就是因为很少有商业化软件支持这项技术,这是很致命的。“CPU和GPU各自要用自编的一种语言来重新编写软件,一套软件系统要很多年的时间去重新移植,这样很多公司也存在风险,我们与几家外国公司商量过,了解他们下一步怎么做,目前正在测试,我们会一直关注众核技术及研究应用,并且一直在做测试,目前还在测试阶段。”
努力提高CPU效率
据用户的测试,当超过120个CPU核以上时,CPU利用率开始降低。针对这一现象,赖能和分析说,现在实际的CPU利用率一直以来不是特别高,这方面我们也非常关注。
近几年来,东方物探公司投入了一千多万元,用来提高CPU的利用率。一是针对它的CPU I/O(输入/输出)方面存在的存储瓶颈问题。二是与I/O有关系,在文件系统上,一般是NFS(网络文件)系统,现在采用的是定性的系统,性能提高了很多。三是在网络上,太多的节点出现后,超过120以后性能无法提升。这其中有很多因素,一方面是I/O,另一方面是MPI(消息传递编程模型),MPI本身如果多了以后效率就会降低。
东方物探公司在提高CPU利用率方面做了系统改造。赖能和说:“比如在接口方面的存储,有单口、双口、2个G、4个G,针对不同应用,我们会选择合适的接口,影响很大。从连接、使用的方面上,在纵横面系统的过程中做的比较合适,我们做了很多场次,取得了比较理想的成效。目前CPU达到了比较好的平衡。” 赖能和告诉记者:他们花钱换来的是高性能的I/O,高性能的I/O换来之后CPU明显提高,这不是对所有应用都适用,在使用上有一个原则——常规处理、创新处理、并行处理。因为I/O不是太多,一次性读多了就不愿意再读了,100个节点中每个节点上的数据都要懂一点,自己内存盘和CPU内存之间交换,不通过网络,常规数据在100个节点,很多人去读,整个节点是并行的,数据很快,从而实现常规处理效果的提高。