更新时间:2024-10-28 19:11
曙光5000A属于超级百万亿次计算机,于2009年5月中旬落户上海超级计算中心。曙光5000A投入应用后,将为气象、海底隧道、环保、船舶、大飞机制造、汽车、建筑、钢铁、石油、机电、高校、科学院等领域提供强有力的计算服务,为城市减灾防震提供安全保障。中国魔方超级计算机是中国首台百万亿次超级计算机,产品序列名称“曙光5000A”。曙光5000采用新型“超并行”体系结构(Hyper Parallel Processing,简称HPP),是中国自主知识产权产品,具有高性能、高效率、高密度、高性价比、低功耗以及广泛适用等特点。曙光5000适用于各个领域的大规模科学工程计算、商务计算,还可以作为各种数据中心、云计算中心的支撑平台。
曙光5000A高性能计算机采用最新的四核AMD Barcelona (主频1.9GHz)处理器,采用基于刀片架构的HPP体系架构,共有30720颗计算核心,122.88TB内存,700TB数据存储能力,采用低延迟的20Gb的网络互联,其设计浮点运算速度峰值为每秒230万亿次,Linpack测试速度预测将达到160T,效率大于70%,是目前国内运算速度最快的高性能计算机。曙光5000一天完成的工作量,相当于全中国所有人每天24小时、每年365天利用手持计算机不停地进行计算,46年时间的工作量。中国高性能计算新旗帜——曙光5000介绍
曙光5000采用4路刀片节点和8路胖节点设计,大幅提高了系统并行应用度及实用性。CPU核心内部采用直连内存访问技术,可在节点内实现无阻塞得内存访问带宽及延迟。刀片节点单CPU核最大支持64GB内存,胖节点单CPU核最大支持128GB,可满足特殊行业挑战性需求。
曙光5000采用了基于ConnectX的
DDR Infiniband 互联,二叉树无阻塞设计,实现了20Gb的传输速率,1.3us的业界最低通信延迟。
曙光5000产品图片
曙光5000的高效并行文件系统,可以提供70GB/s的磁盘I/O访问带宽。
曙光5000全球首次采用了4路4核的刀片服务器设计,在7U高度的机箱内可部署了40颗CPU,实现160个计算核心的计算密度。曙光5000的单机柜内可以部署5个7U高度机箱,这意味了曙光5000单机柜即可实现200颗CPU,800个计算核心的超高计算密度,理论计算峰值7.5万亿次。
曙光5000产品图片
曙光5000所采用的刀片服务器应用了全内置的ConnectX DDR二层交换模块,管理Ethernet网交换模块;
机群计算节点之间的高速互连网络是构建高性能机群系统的关键技术,是影响机群系统整体性能的关键因素。因此,曙光5000的高速互联是高性能计算机成功的关键。
曙光5000采用了全冗余刀片服务器设计,使系统中无单一故障点,较机架式Cluster减少了70%以上的系统电缆连接。
曙光5000采用了全冗余的网络设计,机群内部采用了全无阻塞的Infiniband CLOS网络构建计算存储网络,冗余万兆级联的无阻塞Ethernet互联网络。
曙光5000的全内置ConnectX DDR Infiniband 二层交换,减少了50%的Infiniband连线,全面采用光纤传输技术,降低高速信号衰减。
曙光5000采用的液冷机柜拥有冗余的制冷风扇,并采用智能散热控制,能有效避免系统过热带来的系统停机。
曙光5000A采用了曙光自主开发的Grid View集群管理管理系统。该管理系统提供统一的集中式监控平台,具备可扩展性、集成性、可靠性和易用性。使得当部署运行环境等发生异常时系统能够运行在可控的范围内,并进行准确的异常定位提示。
目前的高性能计算机能耗都非常大,动辄兆瓦级别,曙光5000在功耗方面与其他品牌两百万亿次计算机相比具有绝对优势。
曙光积极响应国家“节能减排”、“建设节约型社会”的号召,在曙光5000中采用了多项具有大量的尖端节能措施,即使在满负载运行的状态下,功耗也仅为其他品牌同级别高性能计算机的六分之一,不带水冷系统运行时功耗为720千瓦,带水冷系统运行时功耗为1000千瓦。
曙光5000由于采用了以下世界领先技术,可为用户节约大量耗电量。
(1) 低功耗CPU设计,比常规CPU节约30%耗电,全系统因采用低功耗CPU产生的节电规模超过200KW;
(2) 标准DDR2内存设计,比采用FBD DDR2内存节约60%耗电,全系统因采用DDR2内存产生的节电规模超过300KW;
(3) 全系统刀片设计,比常规机架式节电节约10%耗电,全系统因采用刀片架构产生的节电规模约60KW;
(4) 液冷系统散热技术,比常规空调制冷节约30%空调耗电,全系统因采用液态制冷技术产生的节电规模约60KW;
(5) 节能软件的利用,采用节能软件和作业调度相结合,系统全年预计可节约20%的耗电。
结论:曙光5000超级计算机的节能技术,每年可为用户节约用电700万度,折合人民币700万元左右!
高性能服务器的价格一直让人望而却步,但曙光5000的价格“平易近人”。百万亿次计算规模的曙光5000售价还不到高效能1亿元人民币,为当前其他厂商同等规模高性能计算机的1/6-1/7。同时曙光5000年运营(含空调系统)耗电约800万度。
曙光将为曙光5000提供3年全免费保修,并终身提供免费技术服务。
曙光5000具有全系统统一的智能监控管理系统,能有效减少人工干预。
曙光5000高性能计算机的体系架构、主计算单元的刀片服务器及胖节点,刀片主板,散热及信号仿真,基于ConnectX的DDR Infiniband交换模块完全由曙光公司在中科院计算所的支持下自主设计,全部达到了国际领先水平。首次采用的水冷系统也拥有部分知识产权。在设计过程中完全符合中国自己的刀片服务器标准。在自主创新的研制过程中,曙光取得了多项业界第一,并在系统研发设计阶段获得50余项自主专利。
业界最早实现了4路4核的高密度刀片系统;
业界最早实现了同等尺寸的8路4核SMP主板设计;
业界最早实现了基于IOE的通用刀片系统,
业界最早实现了ConnectX的DDR HCA 和Infiniband交换的刀片内集成
曙光5000不仅像其他品牌高性能计算机一样可以应用于高性能计算,还可以应用于信息服务,电子政务,网络游戏等常见商业应用。
曙光5000可广泛运行证券指数计算、电力安全评估、建筑工程抗震性评估、天气预报、石油地震资料处理、核能开发利用、汽车碰撞、电磁辐射、计算流体力学、基因匹配与拼接、蛋白质结构分析和材料科学等20多个应用领域。
在商业应用方面,由于曙光5000A使用Suse Linux 和 WCCS ,可广泛运行目前Linux和Windows下的主流的行业软件,用户不需要对普通平台上开发的软件进行任何更改,既可使用。
曙光一号
在国家科委与863计智能机专家组的直接领导下,在中科院、计算所及其他单位的大力支持下,国家智能计算机研究开发中心经过一年多的努力,于93年研制成功我国第一台全对称紧耦合多处理机―曙光一号并行机.由于曙光一号的研制不是一切从头做起,而是采取了遵从国际工业标准,与主流技术兼容,两头在内,中间在外,集中力量突破花钱也买不到或买来也不合算,具有高附加值的关键部件的技术路线,所以曙光一号的研制花钱少,研制周期短,而且研制成果本身就是具有市场竞争力的高性能计算机产品.93年曙光一号问世时,IBM,HP,SUN,DG等公司的相近性能产品都要卖十几万美元甚至几十万美元,而当时曙光一号报价只有6万美元.曙光一号非常适合做网络服务器,中断能力与多用户工作条件下的响应速度都明显高于国外同类型机器,为我国开展三金工程,建立各部门各单位的信息管理与服务系统提供了理想的平台.国务院发展研究中心马宾研究员视察智能中心以后,给江泽民,李鹏,朱镕基,邹家华,曾培炎等领导递交了一份题为“曙光一号计算机的设计研制者抓到了机遇,请领导决策者抓紧扶助发展的机遇“的报告.报告指出:“我们是有根据地说曙光计算机的曙光照亮我们要走的路线甚至如何走法!这是最重要的,这比曙光计算机本身的好的性能价格比更重要……”
总之,我们自制的,作为信息处理枢纽的曙光一号,和作为信息传输枢纽的数字程控交换机,这两大系列产品的推广应用和生产发展,会大大推动和带领电子信息产业的发展,至于团结科技人才作贡献,激励爱国用户兴中华,其作用不下于卫星上天.所以,应该说中国电子信息产业的发展,已经找到突破口,找到了初入点.关键在于抓紧机遇,乘机扩大战果“.国家领导领导人十分重视曙光一号,将它作为代表我国科技进步的两项重大成果之一,写入94年政府工作报告。
曙光一号
国际上的技术合作都是以实力为基础,曙光一号问世以前,只有一些港台小公司来中心谈合作,曙光一号的成功大大提高了智能中心的知名度与谈判地位.Motorola
公司执行副总裁与几位高级副总裁多次来智能中心寻求合作,将智能中心与曙光公司做为战略伙伴.现已签订协议与智能中心合作成立联合实验室,双方各派10人参加,每年Motorola公司至少投入40万美元.在开发曙光一号系列升级产品方面Motorola公司将与智能中心长期全面合作.IBM也选择智能中心做为系统集成的战略伙伴,在智能中心设立ATM实验中心.外国大公司主动找智能中心合作是曙光一号取得的重大社会效益,它将大大加速我们开发新产品的进度.曙光一号开发成功后,胡启恒副院长曾评价曙光一号咬住了高速发展的计算机的“尾巴“,那么由曙光一号而获得的高水平国际合作将使我们能与国际上同步推出基于PowerPC的多处理机,可以说是咬上了高速发展的计算机的“耳朵“。
曙光一号不是一个孤立的科研成果,它代表863计划计算机主题的发展目标与方面,它是振兴民族高性能计算机产业的一个十分艰巨的工程.鉴于曙光一号的成功和曙光产业工程已顺利展开,经专家论证通过,国家科委已批准拨款1500万元,加强支持曙光一号的升级产品开发(作为九五攻关项目).实际上曙光一号研制成功后,我们就已着手升级产品设计.曙光一号系列升级产品采用国际上最有发展潜力的主流CPU芯片-PowerPC 604和620芯片,计划一,两年内推出1~2处理机的普及型服务器(性能高于曙光一号,价格更低),2~8个处理机的高档服务器,双机备份高可用系统,高性能Internet服务器及嵌入式通信控制器等五种系列产品.其中基于PowerPC 604的普及型服务器将于今年年底推出,形成推广曙光一号系列计算机的一个大高潮(《计算机世界》调查有56%的用户打算买PowerPC机器),PowerPC服务器性能价格比高于奔腾服务器,而且特别适于多媒体应用.在注册资金7500万元的曙光公司大力推动下,曙光系列计算机明年将打一场漂亮的攻坚战,在建立我国高性能计算机产业的艰苦长片中迈出扎实的一步。
曙光1000
1995年5月,由中科院计算所研制的曙光1000大规模并行计算机系统通过国家级鉴定,该系统达到了国际先进水平,其峰值运算速度每秒25.6亿次,实际运算速度每秒15.8亿次,内存容量为1024兆字节,为国内最高水平。该系统突破了一批大规模并行处理的关键技术,采用了国际90年代的最新技术它的峰值速度达到25亿次/秒,实际运算速度达到15.8亿次/秒浮点运算,内存容量达1024兆字节,居中国之首。该系统能解决工作站和大型机难以解决的问题。如,一个全国范围内的48小时天气预报程序只需运行3小时左右,而一般计算机要运行60小时以上,这就提高了预报的准确度。这是中国研制成功的第一家有自己版权的并行操作系统。
曙光1000
1可扩展性好。连接网络、输入输出(I/O)、系统软件等均可以扩展。它可以扩展到包括成百上千个结点计算机的MPP系统。它与对称式多处理机(SMP)系统和传统的向量(巨型)机相比,具有明显的优势。
2计算能力强,内存容量大,能解决工作站和大型机难以解决的大问题。它的实际运算速度达到每秒15.8亿次浮点运算。它能在30分钟内解出含15000个未知数的线性方程组,能在40小时内完成天然DNA整体电子结构计算,而小型机要连续计算3个月以上才能完成。
3独立设计的蛀洞(Wormhole)路由器芯片创造性地采用了异步和同步相结合的工作方式,消息传送速度快,稳定可靠。
4并行系统软件(操作系统、优化编译器及工具)高效实用。
5全面采用并行编程和调试环境。
6广泛采用国际标准,系统开放程度高,用户移植软件容易。
曙光1000有36个结点机。其中,计算结点机32个,服务结点机2个,I/O结点机2个;峰值计算速度为浮点25.6亿次/秒,实际达到15.8亿次/秒;内存容量为1024兆字节;采用基于Wormhole机制的二维Mesh通讯网,结点与网络通讯总带宽为2.88GB/秒;运行C、C++和并行Fortran程序,提供并行优化重构工具PORT和串行程序自动并行化工具Autopar;采用基于UNIX的并行操作系统和并行文件系统,并行编程环境PVM、EXPRESS和MPI并行程序行为动态监视工具ParaVision及并行程序调试环境NDB。 曙光1000可以用于天气预报、石油地震数据处理、航天器设计模拟、科学研究、教学、金融、证券等众多领域。它已经在我国大规模科学工程计算中发挥了重大作用。以曙光1000为计算主机的高性能计算服务中心即将在国内若干中心城市建立起来。为支持用户在曙光1000上进行算法研究和开发应用软件,国家有关部门即将设立国家高性能计算基金。
1系统总框图 曙光1000是一个基于Message-passing机制的松散耦合大规模并行计算机系统。它包括32个基于i860的计算结点,1~2个系统服务结点子系统和2~3个I/O结点组成的外存子系统。这些结点由一个6×6的二维mesh网连接,每一个Mesh网络上有一个Wormhole路由器。整个系统有一个系统控制台,它负责系统的初始化和硬件故障诊断工作。用户工作平台是SUN Sparc-2工作站(或其他工作站,如SGI等)和一些终端设备。由每秒10Mb的Ethernet局域网将系统服务结点、控制台、Sparc-2工作站及终端设备连接起来。
2Mesh网 mesh是可扩充的。每一个结点机(包括系统服务结点机和I/O结点机)和一个Wormhole路由器(WRC)相连。结点的编号(物理地址)由X方向编号和Y方向编号两部分组成。结点的相对地址信息包含在Message中,一个WRC有10个输入或输出通道,每一个通道包含8条数据线,一个表示Message结束的TAIL信号、一个请求传输线REQ和一条回答信号线ACK。当一个Message由初始结点传到一个目的结点时,它只“穿过“途中的WRC,而不“进入“与这些WRC相连的结点机。Mesh采用X-Y路由算法。有多条虚通道共用一条单方向的物理通道。
3计算结点 一个计算结点机为一块插件板,其核心是一块i860XR芯片,主频为40MHz,字长64位,浮点运算速度为单精80MFlops,双精度60MFlops,标量运算速度为40MIPS。DRAM容量为32MB,带奇偶检测;EPROM容量为8KB。NVRAM容量为2KB,由电池供电。结点-mesh接口模块包含容量各为16KB的两个FIFO。结点-mesh间传输带宽为33MB/s,有CRC循环冗余码检测。结点板的RS-232模块直接同控制台系统的一块多用户卡相连,为系统控制台提供监视和为诊断结点机提供支持。计算结点机运行860 OS和用户程序。
4系统服务结点 服务结点主要是为管理系统资源(主要是结点机)而设置的。一个服务结点由一台带有ISA总线的486 PC担任,主频为50MHz。在EISA总线和Mesh网之间有一个EISA-Mesh Interface(EMI)模块。EMI具有DMA机制,是一块EISA插板。同样,数据通路FIFO-mesh-FIFO上具有CRC检测。EMI与mesh网间的通讯速率为16MB/s。在用户较多、图形显示较频繁的情况下,可以设两个服务结点,它们通过共享一个资源表来协调工作。
5I/O结点机 一个I/O结点机由一台带EISA总线的486 PC充任,同服务结点机一样,带有一块EMI插板。通过插在EISA总线上的SCSI卡,一个I/O结点机可配容量为4GB的硬磁盘。系统可设1~2个I/O结点机。I/O流量要求大的用户,可配更多的I/O结点机,但要相应减少计算结点机的数量。一个I/O结点机与Mesh网间传输数据的速度为16MB/s,各个I/O结点机运行并行文件系统,以实现并行文件操作。
6系统控制台 整个系统设一系统控制台,运行UNIX。该机上插有一块多用户卡。同32块计算结点机板上的RS-232串口相连。控制台同计算结点机可以点对点地通讯,也可以以广播方式同时同所有计算结点机通讯。它的主要功能是系统初始化,监视计算结点操作系统和用户程序的运行状态,动态查询结点机资源配置表和对计算结点机硬件故障进行诊断。
7前端机网络系统 曙光1000的用户工作平台是一台或多台SUN Sparc-2彩色图形工作站(或SGI图形工作站)及一些终端。这些设备通过局域网(以太网)与系统服务结点机连接。局域网遵从TCP/IP协议,其数据传输率为10Mb/s。实际上,Mesh网系统是前端网络系统的计算服务器,用户程序在前端机上编辑、编译、链接和调试,然后通过服务结点发往计算结点运行,计算结果在前端机上显示。
软件系统
操作系统
曙光1000的操作系统是以UNIX为基础的。计算结点上的操作系统是一个微核心操作系统,支持虚存管理、trap处理、作业管理和消息传递,而将文件服务作为Client运行于用户空间。 服务结点的操作系统以Mach2.6为基础,支持多线机制。它主要用于系统的管理,即节点机的分配。I/O结点运行并行文件服务器PFS。这两类结点与计算结点有相同的消息传递界面。 曙光1000采用带流量控制的消息传递协议,这种协议既是高效的又是可靠的。
并行优化编译器及工具
结点程序编译优化分为源程序级和目标代码级。对于前者,采用了循环交换、循环合并和循环条块划分等措施。对于后者,曙光1000充分利用i860流水线、双指令与双操作模式和浮点Load指令实现了循环向量化。这两种级别的优化都取得了较好的效果。 Autopar是我们研制的自动程序并行化工具。它能识别并行循环,进行数据分割,最后得到循环级并行的并行FORTRAN源程序。 并行程序可视化工具是为曙光1000研制的,也可以移植到其他MPP系统。用户通过它能观察到程序动态进行状态,包括通信情况、负载平衡情况以及有无死锁发生等。
并行编程和调试工具环境
为方便用户编制和运行并行程序,曙光1000移植改造了NX、EXPRESS和PVM三种主要的界面和工具环境。NX是Paragon系统采用的一种并行用户程序界面,EXPRESS和PVM是都国际广泛采用的并行程序编程和运行环境。 并行程序调试器分为源程序级调试器NDB和汇编级调试器ADB。它们的主要功能有显示、设置和清除指令码(或数据)断点,读写内存,单步或连续执行程序,以及接收和传递当前进程现场内容,还能对多个结点上的程序进行调试。
并行文件系统PFS
曙光1000的多个I/O结点运行PFS文件服务器,支持用户读写文件的并发操作,增加了读写文件操作时同时工作的I/O通道数目,以便提高系统总的I/O带宽。
曙光2000-I超级服务器是国家863高技术计划在信息领域的重大成果,于1998年12月通过了国家科学技术部主持的鉴定。它的总体水平达到了90年代同期国际先进水平,有些方面如机群操作系统、集成化并行编程环境和服务器聚集软件等已处于国际领先水平,它的一些关键技术如单一系统映象、全局文件系统等有重要创新,是一个有很强市场竞争力的产品。它是继曙光1000、曙光1000A之后推出的又一高端的面向大规模商业应用、网络信息服务和科学计算的通用并行计算机系统。
曙光2000-I系统峰值速度为每秒200亿次,内存容量为8GB,内置硬盘容量为152GB,节点机总数为34个(可达128个)。它采用当前先进的Cluster体系结构,完全兼容IBM SP系统,是当前国际上最流行的超级服务器体系结构。它为我国信息化建设提供强有力的工具,是超级计算中心、数据中心、信息中心、网络中心、各种清算中心、结算中心和交换中心主服务器的理想选择。
曙光2000-I超级服务器采用了许多国际上创新的技术,该机的高速缓存通信网采用了智能中心研制的二维蛀洞路由芯片组,提供高达1600Mbps的点对点通信带宽,另外该机采用了智能中心研制的基于JAVA的机群管理系统,提供单一系统映像。同时,曙光2000-I还提供了杰出的系统可扩展性、易用性、可管理性和高可用性,即SUMA特性。并且有上万种的AIX商用应用软件支持。它不仅擅长大规模科学工程计算(最高浮点运算速度可达每秒200亿次以上),而且适用于事务处理、网络与信息服务以及决策支持等非科学计算领域。
曙光2000-I通用超级服务器采用松耦合分布式存储的可扩展机群体系结构,与IBM的RS/6000SP二进制兼容。单节点采用先进的PowerPC RISC处理器芯片,具有大容量的内存和硬盘,单节点功能强大。节点间通过高速二维蛀洞路由通信网或Myrinet提供1600Mbps或2560Mbps的点对点通信带宽,可以保证随着用户应用和技术的发展,曙光2000-I系统几乎可以线性地扩展节点数量。这种技术使得TB级的数据处理成为可能。
曙光2000-I提供了基本通信库(BCL)、PVM和MPI高层并行程序开发环境、集成的并行程序设计环境(IPPE)、并行调试器(DCDB)、基于Web的傻瓜界面(KISS)、自动并行化工具(AutoPAR),机群系统管理(CSMS)、批作业管理 (JOSS)、资源管理(RMS)和曙光服务器聚集软件(DSC)。此外还提供了一系列与IBM RS/6000兼容的开放的软件工具,包括C和Fortran编译器、数学和工程库ESSL、DB2 UDB数据库等。
“曙光3000”是一种通用的超级并行计算机系统,也是目前中国国内性能最高的超级服务器。这台计算机由10个高近2米的机柜组成,耗电25千瓦,总重量达5吨。它有280个CPU(中心处理器),最快运算速度达每秒4032亿次;装有近16.8万兆内存和363万兆硬盘。该服务器自然功能强大,使用其中16个CPU的设备可以实现每天80亿次的网络页面点击;8个CPU的设备每天可以收发7000万封电子邮件;64个CPU的设备预报一个月的气候只用15分钟。
曙光3000
曙光4000系列高性能计算机(HPC)是由具有十万亿次浮点运算能力面向网格的曙光4000A、具有百万亿字节海量数据处理能力面向网络安全的曙光4000L、具有五千亿次通用运算能力和四万亿次专用处理能力面向生物信息处理的曙光4000H、具有异构特性面向SAR实时成像处理的曙光4000I组成。曙光4000系列研制成功,缩小了我国与国外在HPC技术上的差距,为中国在HPC技术和产业超过欧洲位居世界第三做出了重要贡献;为在中国发展HPC及其产业化方面探索了一条可行的技术道路;使中国商品化HPC的制造水平达到世界先进水平,已经并正在产生巨大的经济和社会效益,为促进石油等行业国民经济发展和满足网络安全等国家战略需求做出了突出贡献。
曙光4000采用网格技术,体系结构以构件性(Component)、标准性(Standard)、协作性(Coordinate)为基准,采用服务化(Service)、安全化(Security)、专业化(Specialization)、智能化(Intellengce)的3SI技术路线。项目研究的目标包括:曙光4000L Linux超级服务器、曙光4000A高性能超级计算机、10Tflops曙光4000面向网格的高性能计算机、曙光4000H生物信息处理高密度专用机群系统、曙光4000T具有自主知识产权的服务器。
面向网格的“曙光4000”高性能计算机的项目思路包括:数据密集技术(Data-intensive)、支持网格(Grid-enabling)、多目标系统(Multiple-system)、应用专用技术(Application-specific)四个方面。
面向数据密集型国家战略应用目标
我们将曙光4000的科研目标定为体现国家战略目标的“数据密集型”应用,如Internet内容处理为代表的信息安全,数据密集以Internet数据获取与分析为特点;雷达图像处理为代表的国防安全,数据密集以I/O吞吐量密集、数据计算密集为特点;生物信息处理、石油物探为代表的资源安全,数据密集以TB量级大规模数据存储、处理、传输为特点;我们集中研究它们的共性“数据密集”技术,有存储数据密集,I/O吞吐量密集,Internet数据接入密集,系统间数据互传密集,数据处理密集等等。我们力求在机群系统通用体系结构下,增加解决“数据密集”的技术,使整个系统能有效地解决应用问题。为国家安全目标和重大科研目标,提供高性能计算平台。
强调网格技术和产业共性技术
研究支持网格(Grid-enabling)的技术,使高性能计算机能有效地支持应用网格。在高性能计算机的面向网格上,我们将科研内容定为五个方面:基于服务(Service-based)的机群操作系统,网格通信协议,网格文件系统,用于网格应用资源路由的智能网卡,支持网格的高性能计算机体系结构。分别体现网格在管理、广域通信、广域文件、资源发现、体系结构上的要求。
我们的研究集中在十个产业共性技术上,他们是Grid-enabling技术,高性能通信,高性能I/O和存储,可扩展自治管理和可信性评价技术,机群专用处理技术,交换机和特色网卡,数字视频服务技术,机群商业计算中间件,面向客户的性能测试技术,高性能计算应用和算法。其中,我们大大加强了前沿探索性研究的比例。
面向应用目标的多个系统
我们将曙光4000系统规划成三种,分别是“曙光4000L”、“曙光4000A”,“曙光4000H”。曙光4000L代表IA架构,Liunx和廉价(Low-cost),曙光4000A代表64位和高性能(Advanced),曙光4000H代表密集型刀片式机群和专用应用(High-density),它们的体系结构,许多关键技术,机群操作系统等都是相同的,但它们在廉价、高性能、高密集度等方面各具特色,满足多应用目标下的复杂需求。
其中,我们在2002年底完成曙光4000L,在2004年初完成曙光4000A,在2004年底完成曙光4000H。曙光4000L和曙光4000A是本课题的科研目标,曙光4000A是本课题的最终系统。曙光4000L和曙光4000A由十五863专项支持,曙光4000H由中科院知识创新工程支持。
面向行业应用,研究应用专用技术
我们的科研战术是满足多应用目标,强调应用专用技术,采用“通用系统+专用应用”的思想。我们研制的系统要能与国际品牌殊死竞争,打破市场平衡,进入以科研、石油、制造、军队、企业MIS为代表的行业,为大企业服务。
2008-11-19 10:21:40 来源: 网易科技报道 网友评论 0 条 进入论坛
2008年11月17日,在刚刚公布的全球高性能计算机TOP500强排行榜中,我国由中科院计算所国家智能计算机研究开发中心、曙光信息产业(北京)有限公司、上海超级计算中心联合研制,并由曙光公司定型制造的集群超级计算机——曙光5000A以峰值速度230万亿次、Linpack值180万亿次的成绩再次跻身世界超级计算机前十,这一成绩不但让我国成为世界上第二个可以研发生产超百万亿次超级计算机的国家,同时也将成就上海超级算计中心世界上最大的通用高性能计算平台的称号。
TOP500是由Hans Meuer和Erich Strohmaier 1993年在德国曼海姆大学创建的超级计算机排名榜。TOP500以超级计算机系统Linpack测试值为基准进行排名,每年发布两次。由于高性能计算机的应用代表了一个国家计算机研发和应用的最高水平,所以每次TOP500的公布都可以显示一个国家的高性能计算科研实力。所以每次中国最快的高性能计算机在TOP500的排名可以代表目前我国高性能计算领域的发展水平。在这个排名当中中国的最好成绩是第十名,就是在2004年研发成功并部署在上海超级计算中心的曙光4000A。曙光公司研发的曙光4000A在2004年的ISC大会上以11.2万亿次Linpack测试值历史性地闯入TOP500前十名。但是,由于当年中国高性能计算机的应用水平和国外差距较大,同时全世界都集中精力发展超级计算机,在接下来的几年里,中国的高性能计算机再也没有进入TOP500前十名,而此次曙光5000A可以在众多高手如云的2008年再次入选TOP10才是我国在高性能计算机领域屹立世界巅峰的真正开始。
如果说此次曙光5000A入选世界超级计算机TOP10是个荣誉,那么在这个荣誉背后曙光5000A真正的内涵则更值得我们称道。作为国家863计划高性能计算机及其核心软件重大专项研究项目的曙光5000A高性能计算机是面向网格的高性能计算机,可以为网格提供计算服务,同时也是面向信息服务的超级服务器,可以提供多目标的系统服务。曙光5000A采用网格技术,体系结构以构件性(Component)、标准性(Standard)、协作性(Coordinate)为基准,采用服务化(Service)、安全化(Security)、专业化(Specialization)、智能化(Intellengce)的3SI技术路线。
曙光5000A的第一套超大型系统预计将于2009年初正式落户上海超级计算中心,据悉,此套系统已被上海超级计算中心正式命名为魔方(Magic cube)。届时将开展在等领域的多项应用。作为面向国民经济建设和社会发展的重大需求的网格超级服务器,曙光5000A可以完成各种大规模科学工程计算、商务计算。除了在大规模科学工程计算方面曙光5000A将大显身手外,在大规模商务计算方面,它可以为证券、税务、银行、邮政、社会保险等行业和电子政务、电子商务等提供服务。在大规模信息服务方面,它可以在各类游戏网站、门户网站、信息中心、数据中心、流媒体中心、电信交换中心和大型企业信息中心中发挥作用。对基于海量存储的数据大集中应用,完全兼容32位计算的具有64位地址空间的曙光5000A网格超级服务器更可大显身手。
曙光5000A再次带领中国的高性能计算登上了世界的舞台巅峰,作为曙光公司的掌上明珠,曙光5000A承载着中国高性能计算机界太多的理想,曙光在5000A自主创新方面的成果,“四高两低”的技术特色,曙光刀片的重要突破,对于曙光5000A现任曙光公司总裁历军的爱惜之情溢于言表,“因为曙光5000A不仅是中国高性能计算机技术上的骄傲,也是继曙光4000后中国高性能计算机商用的典范之作”。曙光5000A的研发成功和入选世界TOP10,再次证明了中国的原创能力。
高性能计算机在每个国家核心领域的应用都是非常关键的,因为这里牵涉到国家安全和科技进步。世界上许多发达国家的政府都大力支持研究机构开发高性能计算机。从历史上的TOP500排名来看,美国、英国、法国、德国、日本是高性能计算机研发、应用的传统强国,而近年来甚至印度、韩国都加大了对高性能计算机的支持力度,有多台系统进入TOP500榜单。目前部署在美国国防部用来进行核武器实验的超过千万亿次浮点运算速度的IBM“Roadrunner走鹃”名列第一。