简介

中科院等离子体物理研究所所高性能计算集群始创于2008年9月,当时拥有128颗计算核心和256G内存,NFS共享存储1T。

2011年7月,集群成功升级为神马(Shen Ma Cluster)。神马总共拥有464颗计算核心和928G内存,NFS存储6.4T。总体计算理论峰值为:4.08T,LINPACK实测峰值约为79% 。计算节点之间通过40Gb的Infiniband QDR高速网络连接。

2012年12月,神马成功扩容,新增计算节点61个,总共976颗计算核心,实测峰值超过18万亿次,效率超过90%。配置1套高端Infiniband磁盘阵列系统,使用24块600GB的SAS盘作为存储介质,裸容量达到14.4TB,采用曙光ParaStor100并行存储系统。1台高端千兆交换机,配合刀片机箱的管理模块,连成千兆管理网络。1台24端口核心万兆交换机,与刀片平台所带的千兆下联/万兆上联模块,共同组成万兆核心网络。6台36端口Mellonox Infiniband  FDR交换机 ,共同组成56GbpsFDR全线速网络。

2014年初,神马再次增加计算能力,新增计算节点58个,总共1392颗计算核心,并配有169TB的DDN 7700 lustre存储系统,新增的108口Mellonox Infiniband  FDR交换机和之前的6台36端口交换机相连。

“神马”集群目前有129台可用计算节点,约2688个计算核心,并配有四台四路八核胖节点作为登录节点,六台机架式服务器作为管理、监控节点,总容量约为180T的lustre并行文件系统的存储系统,以及全互联的6台36口Mellnox Infiniband交换机和108口的Mellnox Infiniband交换机组成的计算网络。所有对外访问的网络部署在硬件防火墙之内,构成相对稳定,安全,冗余的高性能计算系统所有对外访问网络部署在硬件防火墙之内,构成目前相对稳定,安全,冗余的高性能计算系统。