张巍
俗话说:“每一个成功的男人的背后,总有一个伟大的女人。”用这句话来形容IBM POWER架构与中科院量子模拟科学中心的关系似乎不大适合。如果说“每一项令人瞩目的事业背后,总有一个强大而默默的力量”,这似乎能点破其间的关系。在市场上叱咤风云的IBM POWER架构,在中科院量子模拟科学中心背后的作用同样出色。向来代表着高端科学研究
的中科院,其科研学术成果一直为人们所关注。是什么在支撑这些科研成果在国内外频频推出?是什么在推动着这精深科学研究的前进?
近日,记者采访了中科院物理所量子模拟科学中心、中国科学研究院主任工程师徐力方,一步步揭开了这背后的谜底。
中科院物理所量子模拟科学中心2002年购买的两套IBM P690为科研工作提供了坚强后盾。
计算能力成科研瓶颈
“中科院物理所量子模拟科学中心”是半年前在中科院成立的。对常人来说,这里是一个高科技的聚集地。徐力方向记者介绍:“中心刚成立时,主任工程师是从日本归来的年轻教授方忠任主任,现在中心拥有客座教授教授10人,研究生20人,未来研究人员将达到10人。”
据了解,目前中心主要开发新的计算技术和计算模拟新方法,完善现有的计算方法,并利用这些方法进行广泛的物质科学领域的计算和模拟研究。对新方法的发展,包括从微观到宏观,从简单系统到强关联体系,从单体到多体系统,从静态到动态,从经典到量子,从常温常压到极端条件等等领域的不同范畴不同尺度的计算模拟新方法,它是一个以物质科学研究为主要对象的多学科交叉、跨领域的研究方向。它涉及到材料、能源、信息、 生物、环境等领域,及物理、数学、化学、生物、计算机科学等学科。该领域的最终目的是有机地运用计算机系统和计算方法来解决一系列多机构、多尺度、多层次和多领域的实际物质模拟科学问题。
不仅如此,中心还承担着国家相关研究课题,主要体现在物理科学的模拟与计算、国内核心“物质模拟机”的研究运用和成为代表国家水平的开放中心上。
但是,这些所有的研究都需要在高性能计算(HPC)的基础上进行。由于中心进行的项目多、复杂,往往多种应用程序要并行、串行, 而且CPU、RAM、存储需求都很大。运用普通的超级计算机,物理模拟程序一旦运行,就会产生内存不够等问题,尤其是一些老设备根本无法完成这样的计算。这样进行的数据运算往往严重影响甚至阻滞了科研的发展,成为制约科研发展的瓶颈。因此,中心的科研急需利用更先进的信息技术和计算机设备来提高数据处理、计算的能力。
欲善其事 先利其器
要想满足中心研究的要求,中心计算平台需要承担很高的数据处理量,计算资源的消耗量非常大,对计算设备的内存需求很高,同时还要求平台有很强的并行处理能力,网络要有高带宽、低延迟。此外,徐力方非常强调平台的稳定性,在他看来,稳定是应用的基础。
中心有大量的数据需要处理,普通的设备远达不到他们的要求,长时间的计算才能等出结果的现状严重阻碍了项目组的进展速度。而且这还只是初期的运算,程序复杂后事情会更严重。“利用更先进的信息技术和计算机设备来提高数据处理、计算的能力成为当时中心当务之急。”
在多次的选择中,基于IBM eServer p系列的IBM高性能计算机成为中心一把解决问题的利刃。在IBM高性能计算机强大而可靠的技术支持下,以往棘手的问题迎刃而解。谈到当时为什么引入了两台IBM eServer p690时,徐主任解释到:作为资源管理的这两台eServer p690,在当时可是全世界最高水平的Unix服务器,也是IBM eServer p系列当年的旗舰产品。徐力方介绍,物质科学研究中的计算和模拟,主要是通过计算手段来研究和模拟微观量子世界的物理过程,计算材料的物性,探索微观多体系统的规律,预测材料的结构和性质及其相互关系,为新型材料的开发和应用、新型信息的存储和传输方式、新型能源的利用手段等提供科学的依据。这些大量的计算和模拟数据就需要超大型计算机来辅助计算,“可以这样说,没有高性能机器做计算机平台,中心要出这些科研成果是不可想象的。”徐力方补充道。
尽管如此,中心多任务处理的复杂性还是成为他们面临的一道难关。具体就是中心的5个项目组如何保证各自资源的问题,而且这5个方面要相互连接、相互补充。如何让这5个项目组有机协调稳定持续工作,这成了他们面临的首要问题。
IBM Unix专家顺利地解决了这一问题。在单一用户占用100%、5组共用各占20%合情合理的分配下,在多用户下存储管理,NODE1、 NODE2号机资源不能得到100%的发挥。基于此,IBM专家与中心合作对软件包进行了优化。
1. VASP(全球著名的维也纳软件)
并行效果 优化前 优化后
4CPU 88% 100%
8CPU 65% 95%
16CPU 50% 80%
2. WIEN2K优化
在运用时发现CPU的效率只有30%,IBM专家指出,问题在于I/O读写太频繁,造成资源的浪费。在IBM专家的帮助下,拿出了方案:把机器内存扩大到2G RAMDISK,读写直接进入虚拟内存,结果CPU的效率达到100%。
在Unix软件调优方面,IBM给了中心一个满意的解决方案,在硬件问题上IBM同样如此。徐力方谈到:有些科研项目,比如计算硅的例子,以前他们曾打算计算硅的111面7×7的结构研究,但计算量实在太大,小机器根本没法做。还有一些前瞻性的模拟各种实验中不易达到的实验条件(如对高温高压等极端条件下的模拟),预测各种新型量子现象,由于受到机器计算能力的限制,只能是让人一愁莫展、无法实施。现在有了IBM eServer p690高性能计算机后,这样的计算就可以顺利展开了。
它山之石 可以攻玉
“我们已经做了未来的规划”,交谈中,徐力方表示,现在有了基于IBM eServer p系列的高性能计算机,再大一些计算量的项目他们也可以做了。可以说IBM让他们有了雄心壮志。在这方面,徐力方对运用IBM高性能计算机的满意溢于言表。
由于p690这个超级“强人”的铺设,中心人员的科研之路走得越加宽广和平坦。“运用这些机器,方忠主任已经开发出具有知识产权的程序。现在,由于有了高计算能力机器的支撑,我们的成果经常出现在全世界最好的专业杂志上,比如《SCIENCE》。”徐力方口中关于IBM的话题热情似乎从未减少过。
未来是一片光明的。在精深的科研领域,先进的信息化技术总要先行一步。IBM eServer p系列强大能力和可靠的产品已经开始深入涉及这个领域。事后,据记者了解,IBM还将与中科院的理论所、化学所、固体所等其他机构合作,来推动国内科研领域的发展。
中科院物理所量子模拟科学中心2002年购买的两套IBM P690为科研工作提供了坚强后盾。
链接
物质模拟科学
物质模拟科学研究中的计算和模拟,主要是通过计算手段来研究和模拟微观量子世界的物理过程,计算材料的物性,探索微观多体系统的规律,预测材料的结构和性质及其相互关系,为新型材料的开发应用、新型信息的存储传输方式、新型能源的利用手段等提供科学的依据。
为了进一步促进该领域的发展,同时配合科学院知识创新工程的建设及物理所长远发展规划,于2005年2月成立量子模拟科学中心(Center for Quantum Simulation Sciences)。
IBM eServer p690最大可配置32颗POWER4处理器、512GB内存和18.7TB磁盘存储容量,不仅能够为企业提供用于服务器整合和大型单系统应用的最有效的Unix服务器,还能够在众多科研领域为对科学计算有巨大需求的科研机构提供坚强后盾。