在去年底公布的全球高性能计算机(HPC)TOP500强排行榜中,国防科技大学研制的高性能计算机天河一号以每秒1206万亿次的峰值速度和每秒563.1万亿次的浮点运算速度,跻身世界高性能计算机第5名,使我国成为继美国之后世界上第二个能够研制千万亿次高性能计算机的国家。
据了解,现在的高性能计算机近九成的用途是非科学计算的数据处理、事务处理和信息服务,直接推动着经济社会的发展,影响着人们的生活。正因为如此,高性能计算机被视为世界高新技术领域的战略制高点,是一个国家科技竞争力和综合国力的重要标志。
近年来,在国家863计划的支持下,我国高性能计算机的研发打破了国外技术封锁和垄断,中国国家网格已具雏形,实现了高性能计算资源全社会共享,加速了我国高性能计算机的应用,有力地推动产业升级和科研进步。
没有最快,只有更快
改革开放初期,一个石油企业花大钱从国外买了台高性能计算机,外方要求把控制室安放在一个中国人不得入内的“玻璃房子”里,并由中方花钱雇来两个“洋监工”负责监督。“玻璃房子”告诉中国的科研人员:花钱买不来高性能计算机的核心技术!
高性能计算机是指运算速度快、存储容量大的计算机,又叫巨型计算机或高效能计算机,被誉为信息技术皇冠上的明珠。以我国刚刚研制成功的“天河一号”为例,它一天的计算量,一台配置Intel双核CPU、主频为2.5GHz的微机需要160年才能完成;其存储量相当于4个藏书量为2700万册的国家图书馆之和。
国家863计划“高效能计算机及网格服务环境”重大项目组组长钱德沛教授告诉记者,尽管近年来,我们越来越多地强调高性能计算机的可编程性、可靠性、低功耗等指标,追求高效、易用,但是计算速度仍然是衡量高性能计算机水准的重要指标。60年前,当每秒能完成数千次运算的第一台数字计算机诞生时,它就是当时最高计算能力的体现。近30年来,计算机的运算速度平均每10年就要翻1000倍,这比我们通常说的每18个月翻一番的摩尔定律速度还要快。在进入新世纪的今天,每秒5万亿次到10万亿次的运算速度只能算是高性能计算机的入门门槛。
高性能计算机一直是世界各国竞争的热点,美国、日本、德国等国家纷纷制订并实施高性能计算机的研究计划,投入巨资进行研制开发,不断刷新高性能计算机的运算速度记录。2002年6月,35万亿次的日本“地球模拟器”遥居第一;到2004年9月,36万亿次的美国“蓝色基因”就成为世界最快;仅1个月后,日本的“SX一8”就以58万亿次再创辉煌;到2005年6月,美国的“蓝色基因/L”以136万亿次重夺冠军。2008年,美国的“Roadrunner”以1105万亿次暂居世界第一。谁也不敢说自己是永远的第一,在这场竞赛中,永远没有最快,只有更快。
我国自1983年由国防科技大学研制“银河I型”亿次机开始,先后研制成功了“银河系列”、“神威系列”、“曙光系列”、“深腾系列”、“天梭系列”等高性能计算机,目前我国高性能计算机的研制已基本与世界同步发展。
为什么要不断地追求更快呢?面对记者的疑问,钱德沛举了个例子。他说,全球气候变化是人类面临的重大危机,而要了解人类的活动如何影响气候变暖的过程,就要对地球系统进行精确的模拟,这是每秒百万万亿次量级的高性能计算才能完成的工作。“为了应对全球气候变化这样紧迫的危机,高性能计算机不追求更快行吗?”钱德沛反问。
为不可为之事
2005年禽流感出现后,我国科学家在上海超算中心的高性能计算机上进行治疗禽流感药物的有效化合物筛选,仅4个月的时间就从上百万种化合物中筛选出112个有效化合物。
钱德沛教授感叹,按传统方法这是一件根本不可能完成的工作。按传统方法研制一种新药一般需10年左右的时间。其中,有效化合物的筛选不仅需费时数年,还要花费大量资金购买化合物来做试验,还难以保证得到最佳的结果。使用高性能计算机,通过计算机模拟的手段,科学家可以在几个月的时间内从几十万甚至上百万种化合物中筛选出有效的化合物,且无需购买真实化合物做试验,其优点不言而喻。
上世纪90年代以来,以高性能计算机为基础的计算科学得到了长足发展,与理论科学和实验科学相辅相成、彼此印证,成为人类科学研究和技术创新的3大主要手段。高性能计算主要是通过模拟仿真手段把目前技术上无法实现或成本高昂的实验和想法得以实现,使许多不可为之事成为可为,从而大大加快和深化人们对自然界的认识,降低研究开发的成本。
高性能计算机可以应用于基础科学研究的许多领域。上海超算中心副主任王普勇告诉记者,近几年,我国科学家在上海超级计算中心的高性能计算平台上取得了一大批具有国际影响力的成果:在纳米材料领域,上海应用物理研究所完成了纳米分子水泵的设计和研究;在药物研究领域,上海药物研究所完成了血吸虫病、非典型性肺炎等疾病的药物设计等。
在推动产业发展方面,高性能计算机更是功不可没,尤其是用于航空、航天、舰船、能源、电子、电气等领域的工程产品设计。根据美国科学研究院工程技术委员会的测算,数值模拟仿真可提高材料成品率25%,降低工程技术成本13%至30%,降低人工成本5%至20%,提高设备利用率30%至60%,缩短产品设计和试制周期30%至60%。
高性能计算机还与人们的生活息息相关。比如金融服务,成千上万的请求每秒钟从遍布全球各地的ATM机、证券交易平台汇聚到银行、证券公司,在这些简单操作的背后就是高性能计算机在提供永不停顿、可靠的支撑。
让“靓女”不再“待嫁”
“九五”期间,国家863计划项目研制成功一台高性能计算机,却没有用户,863计划专家组花了近一年的时间帮忙找用户,最后一台机器一拆为三,3地的3个用户合力才把这台机器“消化”了,总算把“靓女”“嫁”了出去。吸取这一教训,从此863计划的高性能计算机研究坚守“产学研用”的模式,强调以“用”为先。
正是得益于产学研用的研发模式,我国在高性能计算机领域不断研发新机器,成为863计划的众多项目中,惟一多次入选年度十大中国科技新闻的项目。
钱德沛介绍,从“十五”计划开始,863计划高性能计算机的研制采取了“产学研用”的模式,研制团队均由企业、大学、研究所和应用单位组成,特别强调按用户需求确定研究任务。无论是早一些的曙光4000A、曙光5000A、深腾7000,还是近期的“天河一号”,在立项之初各自就有了“主人”。当然,这个“主人”也不是想当就能当的,必须提出具体的应用方案参与竞争,选中后还要提供一半的配套研究经费,有的高达数亿元人民币。这样做的好处不仅仅是避免了“靓女待嫁”的尴尬,更重要的是由于带着资金来参与项目,说明用户迫切需要这台机器,会对机器的性能指标提出具体要求,机器投入运行后自然会发挥最大效用,反过来又推动了高性能计算机的推广,有利于高性能计算产业良好生态环境的形成。
王普勇告诉记者,上海超算中心作为曙光4000A的“主人”,参与了机器的选型和研制方案的制定,所以机器交付使用后受到用户的好评,很快就出现用户要排上半个月队才能轮到上机时间的现象,计算能力不够用了。于是,当863计划提出研制百万亿次的曙光5000A时,上海超算中心通过竞争又成为其“主人”。这与几年前机器研制成功后没人用的境遇真是云泥之别!
在“产学研用”中,企业的主体地位毋庸置疑。在863计划的高性能计算机项目组里,曙光、联想、浪潮等国内一流的计算机制造商都是重要成员。钱德沛解释,“这既是项目本身的需要,也是项目的使命使然。”实践证明,高性能计算机项目的实施不仅提高了我国在该领域的技术水平,而且有效促进了国产高性能计算机的产业化。毫不夸张地说,正是国家863计划重大科研成果成就了今天的曙光公司。
“运筹”于千里之外
大型铸锻件是大型发电设备、石油化工业的重型容器等重大装备的关键部件,其设计阶段的模拟计算若用一般计算机需要3个月,而中科院超算中心通过将大型铸锻件的模拟计算软件进行并行化后,在高性能计算机上运行,128核的计算结果只要8小时就出来了。
由3个月缩短为8小时!在中科院的超级计算中心,主任迟学斌向记者介绍,这一方法已应用于三峡水轮机组、核电压力容器等大型铸锻件的工业生产中,在缩短了产品研发周期的同时,还提高了产品品质。不仅仅是这种面向实际工程的大规模模拟计算,还有面向科学研究的大规模模拟计算,高性能计算机都大有用武之地。
为了推动高性能计算机的应用,使国家投入巨资开发的高性能计算资源实现全社会共享,国家863计划从“十一五”开始将高性能计算机的研制和推动其应用的网格服务环境建设作为同一个项目整体实施。钱德沛介绍,网格节点上的高性能计算机是网格的关键资源,而网格通过网络把高性能计算资源提供给分散在不同地点的最终用户。全国各地的科研机构和企业,只要申请注册成为中国国家网格用户,无论您在何处都能方便地通过互联网享受高性能计算服务,正可谓是计算于千里之外。
经过2年的建设,中国国家网格已具雏形,节点数量达到了12个,分布在北京、上海、香港等城市,信托单位是中科院超算中心、上海超算中心、西安交大、清华大学、北京应用物理与计算数学研究所、山东大学、中国科技大学、华中科技大学、中科院深圳先进技术研究院、香港大学,计算资源立足国产高性能计算机,形成了300万亿次以上聚合浮点计算能力和1PB以上存储能力。
目前,中国国家网格有遍布全国的1400多个用户,支持了700多项973计划、863计划、国家自然科学基金、中科院创新工程和重要工程项目的研究工作,支持的项目覆盖生物信息、流体力学、材料、气象、天文、汽车、医药、隧道工程、航天、钢铁、船舶、交通、机械、金融、化学等领域。