东方物探是业内耳熟能详的专业 “找油”公司,近年来,承担国 内外的内外陆地、浅海地震勘探,及综 合物化探采集、处理、解释的数个重大 项目。即便如此,东方物探依然在提高 自身相关技术上下狠功夫,大量投入资 金购置计算机软、硬件设备,以确保高 效、安全地交付工程任务。在总工程师 赖能和的眼里,如何用好这些软硬件并 提高其性能,成为他工作的重中之重。 日前,记者采访了赖能和先生。
他表示,在英特尔的协助下,进行必 要的合理配置软硬件,就能实现整体 系统负载平衡。东方物探目前拥有5.8 万个核,运算能力达到528万亿次/秒 (528T),存储达8000个T。在2011年 一共引进的2498个CPU中,90%来自英 特尔。
合理配置 实现HPC平衡负载
据赖能和介绍,对于一台高性能 计算机,要实现最大效益,不仅需要硬 件系统,还要有配套的系统软件、应用 软件,可谓“平衡”。比如并行文件系 统,一些操作系统的优化,英特尔公司 和BGP进行了近六年的合作,主要体现 在GeoEast软件开发上。
从应用软件角度讲,优化则更明 显,每一套应用软件要采用英特尔编译 系统。英特尔的专家针对GeoEast软件 在石油行业的应用,提出了很多建议。 如时间偏移,他们进行持续跟踪,根 据应用采用有效工具对软件进行特征分 析,使“时间偏移”软件性能当时就提 高5倍左右;其次是三维RNA,该模块 非常费时,英特尔公司帮助进行优化, 目前已经取得极大进展。
赖能和告诉记者,东方物探这几 年投入上千万做技术改造,目的是要提 高CPU利用率,提高存储性能,确保数 据安全及降低能耗。
CPU的架构和网络技术、存储、存 储网络、核心应用等,都会影响CPU利 用率。因此,合理选择CPU的主频,可 有效提高CPU利用效率。赖能和认为, 不同的存储架构,差别非常大,万兆的 性能远远超过千兆,两者相差5倍。不 同的存储品牌,性能差别也很大,存储 网络对存储的性能影响同样非常大。要 优化配置,存储关键是参数。从这五个 方面提升I/O的性能,便可提升整个系 统存储性能,最终达到提高CPU利用率 的目的。协调好上述五方面,才能建立 一个平衡的计算机系统。赖能和总工指 出,要建造一套高性能、高效率的计算 机,需要英特尔这样拥有雄厚技术力量 做支撑和后盾的公司。
近五年来,存储是作为目前石油 行业在IT设备里增长最快的一项,每 年增长在2500~3000T左右,而目前 价格却都在下降。赖能和介绍说,从 性能上他们也在选择一些高性能的存 储。英特尔提出SSD,因为它功耗非 常低,I /O读写性非常好,他们现在 正在做数据库应用的尝试,全部采用 SSD(固态硬盘),同时高性能计算机的 内置盘也开始尝试用SSD,以后可能会 用得比较多。
如何更好地优选软、硬件
CPU、APU、GPU,业内已经很熟 悉,尤其是GPU目前被炒得很热。东方 物探目前拥有184个GPU,一个168个 GPU是整装。当然GPU还有很多不足的 地方。赖能和建议,选择GPU时,不注 意选密度。因为密度高,其功耗、噪音 非常大,稳定性还有些不足。目前GPU 在工业界用得非常多,主要的服务商全 部都支持。“我们曾做过测试,软件在 上面跑的效果不错,全部采用英特尔至 强处理器,8万个核,不到两天就完成 了。”
“网络方面选择时也要注意,因 为大家可能会选万兆。“赖能和坦言, 当时他们选用的是铜缆,集成困难较 多,容易出问题。”GPU是好东西,但 还很新,很多东西都需要摸索。”
目前的多路服务器, 国内非 常多, 应用非常好, 尤其像惠普、 IBM、曙光、联想等都有2路、4路、8 路,特别是8路服务器用得比较多。赖 能和透露,东方物探目前有二三十套8 路服务器。
云计算是把很多计算机联网或者 自动传到计算机上,减少终端用户的负 担,目前受到广泛关注。云计算被国家 列为新兴产业重要发展战略之一,市场 潜力比较大。赖能和总工指出,“我们 要保持清醒,尤其是从事计算机领域的 工作者,需要跟上级领导客观反映。现 在有很多问题没有解决。一是云计算发 展的相关法律法规没有解决,这关系到 数据安全问题,谁来保护数据安全。二 是知识产权的相关内容。如目前石油数 据处理,世界上没有一家公司把所有数 据处理任务都放在云平台上,因为数据 的移动很大,很难做。三是一些核心技 术需要突破。芯片、服务器、存储、设 备要继续发展,云计算要客观理解和对 待,但我们还是要跟踪,我的观点是要 紧密跟踪,客观评价。”