“最强大脑”的超级应用
来源:南方都市报 日期:2015-11-27
最新一期的全球超级计算机500强榜单中,“天河二号”实现六连冠,浮点运算速度达到每秒33 .86千万亿次,是第二名美国“泰坦”的两倍多。全球超算速度排名第一的“天河二号”到底有什么用,与普通人有没关系?南都记者近日走进“天河二号”所在的广州超算中心,揭秘这个“最强大脑”的超级应用:天气预报超算程序已经优化,在20分钟内实现对3公里精度的预报,未来还有望“搞掂龙卷风预报”;刚下线的国产大飞机,2年的气动优化实验,“天河二号”仅用了6天时间就完成了;经济仿真虚拟实验室,不仅仅是模拟炒股,更是根据经济大数据等,模拟整个经济社会的运行;在生物医药领域,“天河二号”的终极目标,是建立孪生数字人。
速度有多快?
天河二号运算一小时
13亿人同用计算器算千年
据测算,天河二号的峰值计算速度达到每秒5.49亿亿次,而持续计算时的实测速度每秒可达3 .39亿亿次。这个速度到底有多快?国家超级计算广州中心主任袁学锋如此形容——— 假设每人每秒钟进行一次运算,天河二号运算一小时,相当于13亿人同时用计算器算上1000年。而其存储容量相当于,存储每册10万字的图书600亿册。
为什么如此之快?袁学锋介绍,天河二号一期系统共有16000个运算结点,每结点配备两颗X eonE512核心的中央处理器、三个Xeon Phi57核心的协处理器(运算加速卡)。累计32000颗XeonE5主处理器和48000个X eonPhi协处理器,共312万个计算核心。
天河二号超算系统由广东省、广州市国防科技大学、中山大学共同建设,总投资25亿元,是广东最大的科技基础设施。2015年9月,广州市正式将广州超算中心移交中山大学进行管理。“别人能算的,我们比他算得快,别人不能算的,我们也能算。”袁学锋说,天河二号集高性能计算,大数据分析和云计算于一体,能高效处理计算密集型问题,也能满足对复杂数据进行实时分析的需求。“这是普通的云中心做不到的。”
哪些人在用?
634家用户目前在用
每周使用量北大通常排第一
袁学锋特意提醒,天河二号还处在建设期。这意味着,目前天河二号释放给社会的资源是有限的。不过,即便尚在建设期,天河二号的产出已足够耀眼。2014年4月试运营以来,截至上周,天河二号已服务的用户家(单位)数达634家,包括高等院校、科研单位和企事业单位等。
“而整个天津超算从2009年至今,总共服务的单位数为600家左右。”袁学锋说,完全靠市场化拓展,天河二号在建设期的用户量已超过天津超算。“去年11月天河二号服务用户数270家,到今天一年时间翻了一倍多,年底还会有明显增长”。他还预测,不久服务用户家数将翻倍过千。“为推广使用天河二号,由广东省与自然科学基金共同推动的超级计算重大专项很快要启动,这个项目将资助604家签约单位,其中只有23%用过天河二号。”
袁学锋拿用户北京大学打比方,北大很多课题组前来购买大量资源,在超算上算题。“每周看各单位的使用量,北大通常高居榜首”。目前,超算85%的用户为远程登录,整个流程均在互联网上完成计算资源申请和使用。袁学锋透露,当前天河二号每周运营成本约100万,今年已连续两月“打平”,即实现收支均衡。今年天河二号的销售额也可观。他预计,“明年有望破亿,这在国际上全市场化的运营是绝无仅有的。”
超算中心安全吗?
“彩虹”致大面积停电
“天河二号”也“中招”
今年10月,台风“彩虹”袭粤,广州番禺的500千伏广南变电站失压,5个220千伏变电站失压,导致海珠、番禺大面积停电,天河二号也“中招”了。“当时我在家里,一看情况不妙,赶紧跑过来了。”袁学锋说,当时整个大学城全部停电长达数小时。由于电压不稳,天河二号值班人员果断命令关机。“预案很到位,机器、数据都保护完好,基本没造成大损失。”据他介绍,电压不稳的最坏结果是将机器打坏。
天河二号负荷需求量大、供电可靠性要求高,共有三条供电线路,台风中,两路电源全被“干掉”。另一个由南方电网专门为超算建设的燃气发电站,预计明年6月启用,届时将为天河二号提供30%的电源。关机一天多,直到电压稳定,天河二号才恢复开机。袁学锋说,“所有的数据不能只靠超算中心,或许在几十甚至上百公里之外,一定要有备份、储存。”
为了给庞大的数据备份,是建设超算分中心的原因之一。目前全省范围内已有8个超算分中心在进行正式洽谈,包括天河、南沙、黄埔、番禺、增城、惠州、中山、韶关。其中南沙分中心很快将交付启用,番禺和天河分中心也正在建设中。“在谈的都是认真的,签了协议”。袁学锋诙谐说。他认为,未来智慧城市的数据架构应当是分布式的,下到街道、小区、区、城市、省。多层次分布式的数据存储、互为灾备才比较安全可靠。“不能把所有鸡蛋放进一个篮子,那样太脆弱了。”
应用
天体物理
已模拟137亿年演化
很快将观测宇宙边界
宇宙是怎么来的,这是一个终极问题。北京师范大学、加拿大高能研究所和国防科技大学在天河二号上,对中微子宇宙尺度演化的问题进行了研究。袁学锋说,实验模拟了137亿年的宇宙结构演化过程,时间从宇宙大爆炸以后1600年至今。
另外,在天河二号,很快还将去观测宇宙的边界,寻找宇宙最早的一束光。袁学锋说,天河二号正在争取进入全球最大平方公里阵列射电天文望远镜项目的数据中心。“掌握全数据,才能掌握探索宇宙奥秘的主动权。”
他介绍,这一国际大项目持续到2030年,数据处理量巨大,在中国天河二号仅能满足到2020年,之后希望能有天河三号来服务于它。下个月,超算中心将举行SK A项目顶尖专家研讨会。SK A是世界最大的射电望远镜项目,建成后将有助于回答宇宙深层次问题,如大爆炸之后恒星和星系的起源,宇宙中的暗物质究竟怎样发挥作用以及寻找地球以外的生命等。
大飞机
2年气动优化实验
6天时间就能搞定
之前刚下线第一代国产大飞机C919的全机空气动力学验证就在天河二号上完成。全机全参数气动优化设计是大型民机气动设计的核心关键技术。“如果气动减少阻力0.1%的阻力,对商用飞机的省油将很有益处,这是很重要的一个指标”。
袁学锋透露,第二代大飞机———宽体客机的气动优化也在天河二号的模拟风洞完成。“做了5万多种不同形状的机型,挑选一个优化机型,通过局部优化,将气动阻力降到最低,最后再确定机型”。
以往,整个气动优化过程需要两年时间验证,但在天河二号,利用约2.4万CPU核,6天即完成实验。袁学锋说,超算的高性能计算,节省时间,节约成本,压缩研制周期,大大提高科研的竞争实力。
气象
能在20分钟内…