UID148770
威望0
金钱10028
交易诚信度0
主题0
帖子38
注册时间2005-5-28
最后登录2020-4-9
新手上路

交易诚信度0
注册时间2005-5-28
|
下面是引用 xsex 于 2005-06-02 00:29 发表的:
呵呵,真的佩服你,连个游戏机都没有就在这里说个一大堆的。
顺便提一下,你的想法是好的,但实在是太幼稚。你的CPU知识真的非常差,连皮毛也算不上,难的有人肯认真回复教育你,你要认真学习一下才是。老实说,要对头脑是一片空白,用简单让你了解的方式来说明,是非常困难的。这有如对三角几何也不太了解的人,去解释高等数学。
唉,不想说了,毕竟话题是游戏机。
你是说我对超级计算机的看法吗??
是你不懂还是我不懂???
以下摘自“国家智能计算机开发研究中心”
原文连接http://www.ncic.ac.cn/road/road7_1.htm
这里明确地证明了我的观点是正确的。
SUMA-曙光技术的灵魂
孙凝晖
2001年8月20日
一.引子
2001年2月17日由中科院计算所智能中心研制的"曙光3000超级服务器"通过国家鉴定,正值计算所成立四十五周年之际,智能中心研制的第四代高性能计算机系统正式走向市场。记得十年前,计算所庆祝建所三十五周年时,包括我在内的很多同事都还是刚跨出校门,步入计算所不久的学子,当时怀着崇敬的心情听计算所前辈方信我老师讲起计算所在周总理、华罗庚关怀下成立和发展的历史,方老师如数家珍般介绍了计算所三十多年来研制的系统,从中国的第一台小型通用数字电子计算机103机,大型系统104机、107机,还有中国的第一台晶体管计算机109乙机、109丙机、119机,讲到后来的757向量机,KJ8920大型数据处理系统,方老师那眉飞色舞的表情和兴奋的眼神至今让我们记忆犹新,老一辈是多么地自豪,那些历史照片现在永远地悬挂在计算所办公楼二楼走廊的墙壁上。
弹指一挥间,十年又过去了,我们这些青年学子也参加了计算所智能中心四代系统的研制。在二十一世纪的今天,望着实验室里"有科技,就有奇迹"的条幅,和那曙光3000金属灰颜色的机柜上优美的"SUMA"标志,不禁想起参加智能中心曙光系统研制过程中的风风雨雨。在这篇小文中,记述下了曙光系统研制的历史轨迹,包含了我们对技术抉择的思考和一些对我们重要的历史事件,还有探索高技术与市场结合的启示,以及我们的使命。谨作为对同事们风雨同舟奋斗历程的纪念和朋友们工作的参考。
二.历史轨迹
计算所智能中心自1990年在863-306主题专家组的领导下成立以来,在李国杰院士的领导和主持下,研制了四代共十台高性能计算机系统。每当看到它们的照片,或抚摸它们有着金属质感的机柜,那感觉就象画者凝视自己的油画,耕者轻抚如波的麦浪。为了记住历史,下面让我们一一列举它们。
1. 曙光一号
1993年研制成功,由樊建平负责总体设计,是曙光系统的第一代系统。它是SMP体系结构,采用四颗Motorola 88000微处理器,自行设计了系统主板,中断控制器,Firmware程序,移植了UNIX操作系统,并开发了一批Internet应用软件。它的知识产权转移和市场推广,直接导致了曙光信息产业有限公司的成立和曙光服务器产业的开拓。
2. 曙光1000
1995年研制成功,由祝明发负责总体设计,是曙光系统的第二代系统。它采用MPP体系结构,系统共有32颗Intel i860微处理器,系统峰值速度为每秒25亿次浮点运算。自行设计了系统结点主板,WRC(wormhole routing chip)互连路由芯片,开发了结点操作系统,移植了主机UNIX操作系统,并开发了一批系统软件和科学计算应用软件。它的研制成功直接导致了曙光公司高端服务器市场的开拓。智能中心在1996年因为接受了国家对喀麦隆的援外任务,开发了曙光1000A系统,它首次采用Cluster体系结构,并因此有了高性能计算机的批量销售。
3. 曙光天演高可用系统
1997年研制成功,由樊建平负责总体设计,是曙光一号的升级系统和产业化系统,由国家九五攻关计划支持。它采用SMP体系结构,有1-4颗Motorola PowerPC微处理器,运行IBM AIX操作系统。自行进行了系统设计,并开发了NCIC-HA高可用系统软件。它的研制成功和在铁道、商业、税务等行业的推广,使曙光服务器系统走上了产业化道路,并由此形成了曙光天演UNIX服务器系统,曙光天阔IA服务器系统两大系列产品。
4. 曙光2000
1998年研制成功曙光2000-I,由徐志伟负责总体设计,是曙光系统的第三代系统。它采用Cluster体系结构,系统峰值速度为每秒200亿次浮点运算,系统共有32个结点,配置Motorola PowerPC 604e微处理器,运行IBM AIX操作系统。自行开发了WRC互连网络,机群操作系统,和一批机群系统软件。它首次采用SUMA技术路线指导研制,提出超级服务器系统设计理念,并由此形成了曙光天潮超级服务器产品系列。1999年又研制成功曙光2000-II,它在系统结构上与曙光2000-I类似,系统共有82个双CPU结点,混合配置了Motorola PowerPC处理器结点和IBM Power2处理器结点,系统峰值速度为每秒1117亿次浮点运算。该套系统安装在科学院网络中心后,支持科学计算、科学与科普数据库、中国科研网的网络应用。
5. 曙光NT机群
1999年研制成功,由孙凝晖负责总体设计,是曙光2000的低端系统和产业化系统,由国家九五攻关计划支持。它采用SMP机群体系结构,IA(Intel Architecture)架构的结点,每个结点有1-2颗Intel Pentium系列微处理器,运行Windows NT或Linux操作系统。自行进行了系统设计,开发了NT机群操作系统,Linux 机群操作系统,硬件监控系统和一批系统软件,并在Internet领域开发了大量解决方案和应用软件。在此基础上,曙光公司与智能中心一起研发,推出了三个衍生系统,即曙光天潮1500、曙光NetBox功能服务器、曙光天潮1700。其中,曙光天潮1500在Internet应用,尤其是Internet内容处理上得到广泛应用,产生过亿元的产值;曙光NetBox功能服务器,开创了技术集成(technique consolidation)和功能服务器的市场,与智能中心开发的天联(TechLine)、天罗(TechRoute) Internet软件一起,着重于企业上网和安全网络应用;曙光天潮1700,与曙光开发的SCSI-Ultra160存储系统一起,着重于IDC和教育市场。
6. 曙光3000
2000年研制成功,由孙凝晖负责总体设计,是曙光系统的第四代系统。它采用SMP Cluster体系结构,系统峰值速度为每秒4032亿次浮点运算。系统共有64个计算结点,6个服务结点,共280颗IBM Power 3-II和PowerPC RS64-III微处理器,用系统、管理、监控三条网络互连。自行开发了WRC长线互连网络,机群操作系统,服务器聚集软件和一批系统软件。它达到了与当时IBM SP系统相当的应用饱和性能,在气象预报、生物基因数据处理、雷达数据处理、ASP应用等领域取得突出的成果。
曙光3000同时开创了国家科研项目在研制过程中,由用户投资定购的市场化运作先例,由北京华大基因研究中心、杭州市政府、西安市政府各拥有曙光3000系统的三分之一。
三.技术抉择
从十年前智能中心成立以来,遵循863计划 "既要顶天,又要立地"的原则,在高性能计算机系统的技术路线上,我们经历了三次大的抉择。
1. SMP和MPP
在九十年代初,智能计算机是计算机系统发展的潮流,当时非常热,以Lisp机、Prolog机、日本五代机、推理机、学习系统为代表;另一方面,通用超级计算机系统(supercomputer)由IBM Mainframe和CRAY向量机X-MP、Y-MP所统治,通用的数据处理系统由以DEC小型机,SUN、SGI工作站和IBM PC为代表的Client/Server结构所统治。智能中心如何选择系统研制的技术路线呢?
首先,我们选择了通用机的技术路线,以支持多种应用,尤其是当时刚刚兴起的Internet应用,而智能处理系统以软件和算法的形式提供;其次,我们选择了"有所为、有所不为"的技术创新方法,改变以往超级计算机系统研制从CPU到外设,从操作系统到应用软件,全盘自行开发的设计道路。以反向设计方法,采用当时刚刚兴起的通用微处理器设计SMP系统的技术,并采用标准的UNIX操作系统,以设计性能价格比优良、二进制兼容的UNIX网络服务器为目标。以正向设计方法,采用当时新兴的基于消息传递的MPP体系结构和通用微处理器,设计大规模可扩展并行系统,满足大型科学计算与工程模拟应用的需要。
今天,SMP和MPP依然是网络服务器和最高端超级计算系统的主流。
2. Cluster和SUMA
在九十年代中期,Cluster体系结构兴起。以Cluster结构为基础的高性能计算机系统能很好地满足计算、数据处理、网络应用等多种应用模式,关键是与大型SMP、CC-NUMA、MPP、向量机相比,拥有良好的性能价格比,系统增值的门槛低,易于做到与主流应用的二进制兼容,这些对于以市场化、产业化为目标的曙光系统至关重要,所以曙光高性能计算机从九十年代中期开始采用Cluster体系结构。
下面的问题是,在Cluster体系结构下,如何选择创新点和技术增值呢?性能应该是系统设计的第一追求,系统性能又分为CPU性能、内存存取性能、I/O性能和网络性能,CPU和内存存取被Intel、IBM、HP等少数美国厂商所垄断,尤其是SMP系统,市场进入的门槛极高;I/O和网络则是由标准决定的。因此在性能上曙光系统选择了兼容的道路,保证了与国外系统的基本竞争力。价格应该是中国用户的首要选择,系统价格的根本决定因素是摩尔定律和产量(volume),我们设计的系统必须跟上摩尔定律每18个月同等价格性能翻一番的步伐,并且以市场上出现的产品为基础,这是曙光系统选择与市场主流产品兼容的另一重要原因。
我们将创新和技术增值的重点放在了SUMA技术上。可扩展性(S)、易用性(U)、可管理性(M)、高可用性(A)是高性能计算机,尤其是可扩展并行系统的重要技术特征,在每个方向上,我们都进行一系列技术的研究和开发,使得曙光系统在与同类国外系统对比时,具有鲜明的特色。我们在每个系统部件的设计中,也尽量使其拥有这四个特性。
现在,SUMA特性已成为高性能计算机事实上的技术标准。
3. GRID
网格的早期起源是人们将几台物理上分布的高性能计算机系统联合起来计算一个较大的题目,现在它的概念已经与Internet网络应用紧密连在一起了。随着九十年代Internet的迅猛发展,我们看到高性能计算机的使用、管理和应用模式正从Client/Server模式,转换成以宽带Internet为中心的.net模式,无论是系统、设备,还是应用、存储资源,都是网络共享的,应用不再是单纯的程序,而是以服务(service)的形式出现。网格化的高性能计算机以电力系统运行的方式,将计算能力、存储能力、个性化信息源源不断地发送到多种多样的客户接入设备中。这些都对高性能计算机的体系结构和技术提出新的挑战。
我们从曙光3000系统的研制起,就投入对网格的研究,现在美国政府、英国政府、IBM、HP、SUN、Microsoft和一些硅谷的小公司都在这个方向投入巨大力量,这也是曙光系统未来3-5年的技术主攻方向。
我们预测,未来5-10年内,网格将无所不在。
四.历史事件
十年磨一剑,对比十年前和现在,计算所智能中心无论在队伍上,还是在技术成熟度上都有了本质的变化。当时,绝大多数员工是刚刚从校门出来的年青人,唯有一腔热情,在技术上也是支离破碎的。现在,我们拥有了一支层次分明、稳定的系统研制队伍,并具有良好的创新机制、工程实施规范、市场化渠道和评价体系、技术上相对成熟,有明确的发展方向和技术、人才储备,这些不仅是计算所的财富,也是国家的财富,理应为国家、为社会做出更大的贡献。从下面对计算所智能中心的重要历史事件的回顾中,我们能够了解曙光系统研制队伍的成长过程和研究思想的形成过程。
1. 智能中心成立(1990年)
在863-306主题专家组的领导下成立了智能中心(NCIC),这是曙光道路的开始。从那时起,李国杰院士成为曙光的旗帜和舵手。在九十年代,工作条件、工作待遇远没有今天在知识创新大环境下来得好,许多优秀的年青人在很大程度上是因为李老师的感召力和个人魅力才团结在这个团队中,为国奋斗。曙光的重大抉择和发展道路的设计,都是李老师汗水的结晶,它使我们始终能够引导技术发展的潮流,跟上国家发展的需求。今天,国家科研和经济的大环境有了很大的好转,优秀的领头人依然是不可缺少的。
2. "人生能有几回搏"(1992年)
在曙光一号的研制过程中,樊建平、陈鸿安、刘金水、王永杰、李如昆五壮士在赴美国进行十个月的苦行僧式的封闭开发前,发出了"人生能有几回?quot;的誓言,从此这一标语醒目地贴在智能中心小楼的入口处,它是曙光系统研制初期,研制者精神面貌的真实反映。这一精神支柱十年来一直鼓励一代代曙光系统的研制者,为了国家的利益努力奋斗,奉献自己的青春与才智。今天,我们强调体现个人价值,公平回报,创造美好生活的同时,它依然是我们精神力量的源泉。
3. "Hello, Kai Li"(1993年)
李凯(Kai Li)是美国Princeton大学计算机系的教授,也是早年计算所的研究生。我们请他回来讲学,他是当时接触、使用过当时先进的Intel Paragon系统中为数不多的华人高级学者,与他的学术讨论对我们了解MPP体系结构,设计曙光1000大有帮助。与此同时,我们广泛邀请国际知名学者进行学术交流,如David Patterson、E. Feigenbaum、Tomas Steering、黄凯、高光荣、周松年等,在系统研制上与IBM、Bull、Motorola、Intel合作,这反映了我们的一个设计理念 -- 有所不为,即在国际先进技术、学术理论和成熟的商品化部件的基础上进行工作,着重掌握好做项链的穿线和设计技术,不管用什么珍珠,做出最美丽的珍珠项链。
4. 龙山会议(1994年)
这一年年初在京郊龙山召开的有关曙光1000设计的讨论会,除了解决技术细节外,我们还解决了有关道路的两个重大问题。一是我们这些年轻人为什么要在智能中心做系统?当时的市场经济大潮有席卷一切之势,智能中心的战略和远景(vision)是什么?年青研制者的价值取向是什么?经过一次次彻夜探讨,最终统一了认识和世界观,从此智能中心的系统研制者们再也没有发出过要不要做的疑问了。第二个问题是怎么做,当时我们的榜样是计算所的KJ8920系统和国防科大的银河二号系统,我们把市场经济新形势下的系统研制定位在基于国际先进技术和面向用户、面向市场上,这一点也再也没有动摇过。现在每每回忆起当时的情景:每日工作到深夜,与李国杰老师、祝明发老师争吵得面红耳赤,服务员们投来的新奇的目光,现在还有这样拼命的人吗的疑问,休息时在院内池塘冰面上惬意地滑行,和那些已离去的朋友 -- 杜晓黎、董向军、曾荣、梁雪、战超、刘宏等,心中仍荡起一丝丝暖意。
5. "It's SUMA"(1996年)
徐志伟在这一年从美国南加州大学(USC)回国加入智能中心,确定了曙光系统的超级服务器和SUMA技术路线。这一技术路线指导了曙光系统5年的研制工作,并且它与今天提出的网格技术将是我们未来5年研制工作的重要内容。SUMA技术体现了我们"有所为"的设计思想,选择了正确的创新点。
"It's SUMA"已成为曙光公司的注册商标和市场技术定位,它出现在曙光产品的方方面面,机柜上,彩页上,鼠标垫上,甚至名片上,也得到了国内外同行的认可。
6. 兴城会议(1997年)
这一年夏天在辽宁兴城举行的会议的重点是解决曙光2000的技术问题,除此之外,更重要的是解决了两个系统研制的战略问题。一是工程规范和工程管理,对于我们这些刚出校门的年轻人来说,这是弱点,在计算所有经验的老同志方信我、陈鸿安、侯建如的帮助下我们建立起自己的工程体系,这对我们研制出稳定可靠的系统具有重要意义,曙光系统的稳定可靠性经受了市场和用户的考验;二是确立产品开发目标,我们开发的系统不能只是科研成果,而必须是可产业化的产品,在中国目前的条件下,中国的公司尚不具备将高性能计算机的技术和原型系统转化成产品的能力,我们要一步到位,这成了我们研制系统的指导思想。在九十年代中后期,公司和科研机构的待遇差距还很大,出国潮正在势头,智能中心的人员流动也很厉害,这次会议对明确目标,凝聚队伍也起到了重要作用。
从那时起,我们再也没有为思想、路线、规范这些问题举行过专门会议了,说明我们这只队伍已日渐成熟,也说明整个国家的大环境在好转。今年夏天刚刚召开的青岛会议我们就能完全专注于曙光未来系统的技术设计,尽情享受阳光、大海了。
7. "NCIC = 曙光R&D部门"?(1998年)
科研和市场两张皮的问题是困扰科技界的老大难问题,如何捏合两者也是我们要考虑的。在1998年间,出现智能中心的系统研发与曙光公司的产品和市场脱节的现象,智能中心研发的技术不是曙光公司的市场需求的,曙光公司的产品得不到智能中心的有力技术支持,两者还存在利益分配的冲突。当时我们采取了最简单的方法,将智能中心的系统研制队伍和曙光公司R&D部门合二为一,一套人马,两份目标,既要搞科研,又要出产品。这反映了曙光系统贴近市场的取向,在一定程度上加快了科研成果进入市场的步伐。科研和市场两种不同价值观的碰撞是剧烈的,一方面使我们传统的科研人员加强了市场观念,另一方面在市场的压迫下,一些纯科学和技术的探索也被舍弃了,它也逼迫我们制定了研究和开发三七开的硬性规定。
8. 新计算所,新曙光(2000年)
在中科院的知识创新工程下,新计算所成立了,智能中心的主体成为高性能计算机研究室,分出了软件研究室,并且完成与曙光公司从人员到方向的脱离。同时,曙光公司实现了香港主板的借壳上市,成为深圳科技的全资子公司。计算所在国家新的要求下要承担起国家队的重任,进行前瞻性、基础性、高技术的研究,曙光公司要在服务器市场上有更大的发展。但是,科研与市场并没有回到以前的老路上,计算所与曙光公司通过产权关系理顺了上下游关系,科研成果通过国家高性能计算机工程中心和公司R&D部门变成公司的产品,公司以股票作为回报。不同的定位,关注不同的领域,形成良性循环。在我们新的系统的设计中,计算所与公司有更紧密的合作。
五、高技术与市场
曙光高性能计算机的十年就是探索在中国如何发展高技术和推进市场化的十年,这十年也是中国改革开放、发展社会主义市场经济风起云涌的十年。我们在高技术与市场的结合上进行了有益的探索。
美国和中国在发展高技术,尤其是信息领域上有着截然不同的体制。美国高科技发展中最有活力、最具创新精神的部分集中在大量的小公司中,如硅谷的startup公司;而大公司,如IBM、HP、Lucent等,则垄断了形成工业标准的、规模化的高技术产品的研发与市场,高性能计算机中最先进的系统和技术都集中在这些巨人手中;大学和研究机构则从事基础性研究,如高性能计算机中的DSM、SVM、高效消息传递通信、MPI、PVM等都是从大学发源的,但大学极少从事大型产品化系统的研制。在信息领域,美国IT大公司是高技术发展的枢纽,它们从大学获得新思想、新方法,从小公司获得新技术、新产品、高技术部件,自己则垄断市场,主导技术和行业发展的方向。
中国高技术开发的主力是国家研究机构和重点学校,863高科技计划资助的主要对象是这些研究机构和学校,然后再通过技术和知识产权的转移扩展到公司,由公司进行市场推广。目前,尤其在高性能计算机领域,公司只能承担生产、销售的任务,不具备研究、开发的实力和资金条件,这与美国机制形成最大的反差。另一方面,学校的基础性研究也不足,缺乏创新性、前瞻性的研究成果。在高性能计算机领域,学校和研究机构基本上都在从事技术和系统的研发,重复工作多,明显缺乏分工和层次。
在中国高技术发展的体制下,我们不能照搬美国的方法发展高性能计算机,必须平衡和解决好研究、开发、产品、系统、市场、销售、产权七个方面的问题。我们的这些思考和探索的总结能给朋友们提供参考。
第一方面,智能中心以研制大型高性能计算机系统为目标,为国民经济和科学发展的战略目标服务,以市场化为目的,但是我们要将30%的力量用于基础性、前瞻性研究,进行核心技术的创新,如高速通信机制,可扩展I/O机制,新型计算模型,网格理论等,这些研究使我们有后劲,能够站在世界技术发展的前沿。
第二方面,我们是以大型系统研制为主,有大量的开发和工程任务,所以开发能力、工程管理、工程规范、团队管理都至关重要,研究生是研制工作的主力,要解决好研究、论文与工程开发的关系,这方面计算所是有良好的传统的。
第三方面,由于中国现在公司的技术力量薄弱,我们研制出的高性能计算机必须是产品,或可产品化的样机,才能顺利地转移到市场上,而市场目标又是863计划项目的重要目标之一。我们探索的方法是,在设计时必须考虑市场和产品的要求,听取市场人员的意见,尤其在开发的后期,某些产品化要求高的部件,让公司的技术人员直接参与开发,十分有效。
第四方面,高性能计算系统就象一串美丽的珍珠,线和穿线的方法、珍珠项链的设计是我们的重点,对每一颗珍珠是有选择的,有的自己做,有的用别人的,有的先用别人的,再用自己的替换,也不必要求自己做的每个珍珠都要用在当前制作的这一串项链上。高性能计算机系统的设计方法与此类同。
第五方面,对于高技术的研制,不能等完成了科研项目,再去找市场,而应在进行中,甚至进行前,就找好定位的市场。曙光3000的研制在开发前就找到了购买的用户,这套机制对高技术科研成果能否有生命力至关重要。
第六方面,销售理应由公司完成的,但高技术产品,研制者要有良好的渠道和方式对形成产品后的销售行为进行支持,包括售前和售后,同时又不能影响未来的研发工作。这一点,在智能中心和曙光公司的分分合合中探索了许多方式,形式是可以探索的,观念尤为重要。
第七方面,谈产品和市场,就有利益,解决好科研成果的产权关系和利益分配规则,对科研人员、国家、公司都很重要,是科研健康发展的关键要素。理想的模式是科研成果和技术流向公司,股份、红利和委托开发费流向国家、科研单位和个人。
除了个别与国家安全相关的战略目标外,高技术的发展离不开市场的参与和推动,这是历史发展的规律。
六.我们的使命
在二十一世纪里,计算所智能中心将继续在高性能计算机的研究、开发、市场、应用上努力奋斗。为了国家的战略目标,我们的使命有以下四条:
第一,为国家经济发展战略服务,即以信息化带动工业化,信息技术要能够提高国家的GDP值。高性能计算机要能够推动国民经济和政府的信息化,改造传统工业,带动相关产业发展。
第二,发展中国的高性能计算机产业,使国产的高性能计算机在五年内占据市场的20%,十年内占据市场的50%。
第三,进行高性能计算机核心技术的创新,包括应用模式、体系结构、处理器、操作系统、存储系统、应用等方面。
第四,培养多种复合型人才,包括系统设计人才、系统软件开发人才、逻辑设计人员、应用开发人才、市场技术人才、工程技术人才等。
展望未来,我们充满信心,在国家十五863计划、中科院知识创新工程的支持下,在下一个十年内,我们的SUMA之路一定越走越宽广,“曙光”将变成冉冉升起的“朝阳”。
作者介绍
1992年到智能中心,参与了曙光系列机的研制,是曙光2000和曙光3000的第一完成人,现主持研制曙光4000。历任智能中心软件组组长、研发部副主任、研发部主任、计算所高性能计算机研究室主任、曙光公司技术总监,现任智能中心主任,国家高性能计算中心(北京)主任,曙光公司首席科学家。 |
|