成立十年,这家由中科院孵化的超算中心凭什么登上中国高性能计算机Top100榜单第三名?

计算的商业化,何以搭上了「碳中和」的列车?
在 2020 年中国高性能计算机性能 TOP100 的排行榜中,部署在国家超算中心(无锡)的「神威 · 太湖之光」依然稳居第一,国家超算中心(广州)的「天河二号升级系统」位列第二,而荣登榜眼的,却是此前名不见经传的北京超级云计算中心 A 分区 。
这一排名,让许多此前并不知道北京超级云计算中心的朋友大吃一惊:「超级云计算」是什么?北京超级云计算中心的「A 分区」究竟实力何在?
尽管大家对 A 分区的研制厂商戴尔(DELL)多有耳闻,但对 A 分区所部署的北京超级云计算中心却几乎一无所知,顾名思义,更容易将其与国家超算中心混淆 。
这座超算中心成立于 2011 年,虽由中国科学院计算机网络信息中心孵化、北京怀柔区政府支持成立,但却不在国家的 8 个超算中心之列 。
众所周知,我国第一个国家超算中心成立于 2009 年,由天津滨海新区与国防科技大学合作共建,斥资 6 亿 。此后,国家又陆续在多个东部城市建立了超算中心:济南、深圳、广州、长沙、无锡、郑州、昆山……
其「政府+ 高校」的合作模式虽与国家超算相似,但自创立之初,北京超级云计算中心的核心理念便注定了它的不同 。
从 2011 年到 2020 年,北京超级云计算中心何以从一个籍籍无名的超算中心,成为跻身于中国高性能计算机 TOP100 榜单一员、并仅次于两个国家超算中心的明星超算呢?
在中国高性能计算盛会 CCF HPC China 2021 中,我们有幸采访了北京超级云计算中心的 CTO 郭宇,与他一同探究该中心的「成名之道」 。
从建设的模式来看,北京超级云计算中心与国家超算中心有许多不同之处,其中,最大的不同便是:国家超算中心注重科研支持,而北京超级云计算中心的核心理念是超算商业化 。
按照郭宇的话说,是「像设计产品一样设计超算 。」
被誉为「国之重器」的超级计算机,向来是大国之间的必争之地 。长久以来,这也形成了国家超算独当一面、民间超算不为人知的局面 。然而,任一行业的发展,必然是多方力量的融合与交汇,百花齐放,从而共同推进领域的前进 。
那么,在中国的超算领域内,北京超级云计算中心的位置在哪里?优势是什么?
【成立十年,这家由中科院孵化的超算中心凭什么登上中国高性能计算机Top100榜单第三名?】1
超算市场的形成
回顾 2011 年北京超级云计算中心的成立节点,除了两个国家超算中心(天津与济南)的成立所带来的信号,超算市场的爆发早在过去的五年便有了行业的铺垫与基础:
2005 年以前,CPU 处理器处于「单核时代」,一个 CPU 只有一个核心 。如果一台服务器上有两个 CPU,那么,搭建一个 1024 核的 CPU 则需要 512 个节点,12 个机柜,因为一个机柜最多只能装40个节点 。而每个机柜的宽度为 60 公分,12 个机柜则是 7.2 米,相当于一个普通教室的宽度 。
但从 2006 年开始,CPU 处理器开始进入了「双核」、并逐步拓展到「多核」时代 。双核处理器的出现,基于 x86 的计算架构,英特尔与 AMD 在 CPU 服务器市场中的主导地位也就此形成:
2006 年年中,AMD 率先推出 AM2平台 。两个月后,英特尔发布 Conroe,性能直接提高 40%,与此同时,功耗也降低了 40% 。但英特尔并不「就此罢休」,同年 11 月又直接推出全新的四核处理器 Kentsfield,直接把 CPU 推进了「多核时代」 。
与单核的 CPU 相比,多核 CPU 的并行处理能力更强、计算密度也更高,并大大减少了散热与功耗 。后来,CPU 出现了 8 核、12 核、16 核……目前一个 CPU 最高已能达到 64 核 。对于许多关注高性能计算的行业从事人员来说,他们认为,多核 CPU 必然会带来计算与任务的并行化,也就是说,超算市场在未来会迎来爆发 。