APP下载

中国第一台亿次巨型计算机“银河- I”研制历程及启示

2017-03-08司宏伟冯立昇

自然科学史研究 2017年4期
关键词:国防科技大学银河研制

司宏伟 冯立昇

(内蒙古师范大学科技史研究院,呼和浩特 010022;清华大学科技史暨古文献研究所,北京 100084)

中国第一台亿次巨型计算机是国防科技大学计算机研究所自行研制的“银河- I”(图1)。银河- I研制始于1978年5月,1983年12月6日通过国家鉴定,该机荣获“特等国防科技成果奖”,研制单位荣立集体一等功。1984年10月1日,该机模型在北京天安门前参加了“建国35周年”国庆检阅,引起社会广泛关注。

银河- I是跟踪世界先进主流巨型计算机技术,以向量运算为主,字长64位,运算速度为每秒1亿次以上的通用电子计算机。它的问世使中国成为世界上少数几个成功研制巨型计算机的国家之一,在国防建设事业和国民经济发展中发挥重大作用。

图1 银河- I亿次巨型计算机真机陈列

由于银河- I是国防重大项目,技术资料长期保密,国内外科技史研究不多。国防科技大学原人文与社会科学学院曾组织力量主要从科技哲学的角度对银河系列巨型计算机工程的整体特征、工程组织、管理创新、团队建设、科学精神等进行过一些研究。*参见文献[3]、[4]、[7]、[14]、[33]。

本文将从技术史的角度,通过发掘研制单位一批原始档案资料,访谈有关亲历者,还原银河- I的研制历程,分析银河- I的技术创新,总结银河- I的经验教训,并将中国和美国各自的第一台亿次巨型计算机技术性能与指标进行对比研究,以期对当前我国探索军民深度融合的科技创新路径和高校自主创新科技成果转化提供一定的借鉴。

1 银河- I的研制过程

银河- I是我国大科学工程任务,它的研制起因、经过和成果始终以国家和军队重大战略为中心。

1.1 研制起因

20世纪60年代,中国依靠自己的力量研制成功“两弹一星”,大大提高了国防实力和国际地位。但当时中国的尖端科技也遇到了明显发展瓶颈,有些重要理论研究和模拟实验,尤其是第二代核武器的发展、核动力装置的研究、航空航天飞行器的设计、军事情报分析和卫星图片判读等,需要解决大量的计算问题才有可能取得新的突破,因此迫切需要运算速度极高的计算机;而中长期天气预报和气象设计分析、石油地震处理、油藏工程与能源开发、大型图像处理、遗传工程等也都需要巨型计算机。可以说,没有巨型机就没有第二代尖端武器,就不能进行准确的中长期天气预报、有效的能源开发和石油勘探等。所以,研制巨型计算机对加强中国的国防实力、发展国民经济、促进科学技术的进步等,都有十分重要的意义。而高性能的巨型计算机,西方国家对中国实行严格的技术封锁,自主研究和开发是唯一的出路。

1972年秋,国防科委根据发展第二代战略武器、增强国防实力的迫切需要,责令长沙工学院计算机研究所(国防科技大学计算机研究所的前身)负责人慈云桂教授,向中央专门委员会起草报告,建议将巨型计算机研制列入国家重点工程项目。[1]

图2 银河- I亿次巨型计算机总设计师、中国科学院学部委员慈云桂

慈云桂(1917~1990)是我国、我军知名的计算机专家和开拓者之一,1917年4月5日出生于安徽省桐城县麒麟镇杨树湾村(今安徽省枞阳县杨树湾镇),1943年毕业于湖南大学机电系,后考入清华大学无线电研究所读研究生,毕业后留校任清华大学物理系助教、讲师,1954年调任哈尔滨军事工程学院(国防科技大学前身)海军系雷达教研室主任,1966年任哈军工电子计算机系主任,1970年起任长沙工学院计算机研究所负责人(图2)。长期从事我国电子计算机的研制工作,曾主持研制成功我国第一台电子管专用数字计算机——901机、我国第一台全晶体管化通用计算机——441B机和我国第一台百万次级集成电路计算机——151- 3/4型机。[2]

由于国防军工的需要,巨型机研制项目一直得到党政军高层领导重视,特别是邓小平1973年3月复出后,巨型机相关工作受“文革”干扰相对较少。同时,151百万次机的研制成功为巨型机研制奠定了基础。慈云桂的建议很快获准,长沙工学院计算机研究所便开始巨型计算机的预研和技术储备工作。首先对主要用户进行了多次的调研,了解了他们的主要应用领域,数学模型的范围、常用算法、精度、速度和容量要求等。同时广泛深入搜集国内外关于巨型计算机软硬件系统结构、性能评价、并行算法、数据结构和软件工程等方面的书刊和论述,并在此基础上开展了各种方案的探索与论证,以及逻辑模拟与系统模拟等研究工作。

1975年10月,时任国防科委主任的张爱萍指示,组织国内计算机知名单位进行全国调研,慈云桂任调研组组长,调研侧重于巨型机需求、国内元器件和外部设备的生产状况和水平等。[3]但这时由于“四人帮”的干扰,1976年4月邓小平再次被打倒,此项工作被迫中途停顿。“文革”后的1977年9月,张爱萍再次指示慈云桂,抽调技术骨干为研制巨型机进行调研,之后形成报告上报国防科委。同年11月14日,国防科委向中央呈报《关于研制巨型电子计算机事》的请示报告,同月26日党中央批准了此报告。[4]当时,也有中国科学院和电子工业部有关单位希望承担此项任务。1978年3月,时任中央军委副主席兼总参谋长的邓小平*此处《国防科大计算机系兼研究所史(1956~1993)》记载“1978年3月,中央军委邓小平主席……”([1],117页)有误,经查阅原始档案[5]和核实邓小平同志生平,1981年6月中共十一届六中全会上,邓小平才当选中央军委主席,1978年3月,他时任中央军委副主席兼总参谋长,当时的中央军委主席为华国锋。在中央部署巨型计算机研制会上说:“一亿次机只能搞一台,一亿次的就由长沙工学院搞算了,要在国家科委领导之下来搞。论证的时候,可以多请一些人来参加。什么时候完成,长沙工学院要签字。有些器件可以购买,主要是为了抢时间。我们科学院就搞千万次的。一亿次的,国家科委要牵头。”[5]

会后,张爱萍一方面传达中央精神,一方面组织从上到下的领导班子和各方面技术力量投入巨型计算机的研制工作。任务确定:用六年左右的时间,花两亿元左右的经费,研制一台每秒运算一亿次的巨型计算机。([1],117页)

1.2 研制经过

从1978年5月至1983年12月,银河- I的研制工作重点大致可以分为6个阶段。[6]

1.2.1 总体方案论证和工程准备阶段(1978年5月~12月)

1978年5月,国防科委在北京召开巨型机方案论证和协作会议,确定该机代号为“785工程”。会上通过一个分两期完成的双处理机方案,并确定引进一些元器件,由国内协作研制外围机和外部设备。1978年7月,国防科委在长沙召开了785工程软件协作会,落实了协作任务和各单位分工,并提出了785亿次机和美国有关巨型机指令级兼容的建议。之后根据专家和用户的建议,又对国内外巨型机研制使用情况进行了深入调查,经过多方调研和论证,对巨型机总体方案进行了修改,形成了巨型机的总体方案。鉴于在国内筹办外围机和外部设备尚有困难,确定由国外引进。

方案确立的指导思想是立意新、起点高、追踪世界计算机的先进水平。当时确定的总体技术指标是:中央处理机运算速度在高效时每秒1亿次以上,存储器容量200万字,字长64位,平均故障时间24小时以上,可用性不低于90%。外围机字长16位,定点运算速度每秒50~100万次,存储容量512KB。

国防科技大学成立“785工程”领导小组,时年60岁的慈云桂担任总设计师。他立下“我就是豁出老命,也要把中国的亿次巨型机搞出来”的誓言*司宏伟在“纪念慈云桂教授诞辰一百周年座谈会”期间对慈云桂长子慈林林的访谈,2017年4月14日,长沙。,率领研制队伍,技术上开始瞄准美国德克萨斯仪器公司1972年研制的向量巨型机TI- ASC和CDC公司1973年推出的向量超级计算机STAR- 100。但当他到北京调研时,看到一套美国克雷研究公司1976年最新研制成功的“克雷- 1”巨型计算机(CRAY- 1)新闻报道和广告宣传资料*此处《国防科大计算机系兼研究所史(1956~1993)》记载“但当看到新闻报道美国Cray- 1简介后”([1],118页)不准确,经查阅原始档案[18]和采访亲历者,当时慈云桂看到的不仅是克雷- 1的新闻报道,还有几张印有克雷- 1指令系统和粗略结构介绍的广告资料,从而给他很大启发。后,与研制团队成员一起分析研究认为,“克雷- 1的设计思想、实现的手段更为先进,有独到之处”。慈云桂马上组织人员从国防科委情报所、中科院计算技术研究所等处收集更详细的资料,好不容易获取一份克雷- 1的用户公开参考手册,较详细地介绍了克雷- 1的内部结构(图3)。他据此决定:“舍去苦苦奋斗8个月之久已完成的总体方案,将瞄准点移过来,设计出符合中国国情,与国际主流机兼容的亿次机总体方案。”([1],118页)

图3 慈云桂(左三)与团队核心成员确定巨型机总体方案

当时在研究巨型机体系结构时提出了两个方案,以解决在元器件水平受限的条件下做成巨型机的难题。一个方案是双向量(及浮点)阵列部件,另一个是共享主存的双中央处理机系统。经研究,最终决定采用双向量阵列的方案。[7]

对于这个决策,经过查阅和分析原始档案[8- 9],笔者认为主要原因有二:一是银河机主要服务对象是核工业部等单位,计算的主要课题是必须用亿次级以上的巨型机才能解决的大型算题,据调查,这些课题75%以上是属于向量运算,采用双向量阵列的方案非常适合于这类大型科学计算,同时,多功能部件、全流水化、并行运算和分布式结构等先进技术会有很好的应用;二是如果采用双中央处理机系统,就必须开发并行处理系统,而这在当时是世界上的前沿技术,无论在技术力量方面还是任务时限方面,都存在很大困难,难以实现。

1.2.2 实验、逻辑设计、插件工程化和模型机研制阶段(1978年10月~1980年3月)

巨型机总体方案确定后便开始研制工作。为了使设计理论更符合高速度与高质量的指标,研制人员进行了大量的理论研究和实验,提出设计方案,确定逻辑设计原则、实现技术和生产工艺,并通过研制模型机检验其可行性与有效性,为研制整机系统奠定了可靠的基础。

1980年初完成了模型机的研制。同年3月,国防科委在长沙召开了785模型机研制情况汇报会。模型机研制成功表明已攻克了巨型机硬件研制中的理论和技术难关以及生产工艺等一系列问题,在国防科技大学计算机研究所的计算机工厂初步形成了巨型计算机的生产线。

1.2.3 主机生产阶段(1980年5月~1981年7月)

1980年5月,各项工作准备就绪,全面准入主机生产阶段。785主机生产历时15个月,质量控制、工艺规范和元器件的配套是这一阶段的主要工作。当时,巨型机要生产大面积多层印制板,高密度组装,使用的绕接、焊锡等工艺技术难度极大,国内相关工厂无力承担这一艰巨任务。国防科技大学“785工程”领导小组决定由本校的计算机工厂自行承担,组建了印制板车间、焊接车间、机加工车间,成立了生产、器材、技术科室。在超过一年多的时间、温度和湿度变化极大和大部分操作靠手工劳动的情况下,100多名生产人员以高度的责任心和严格的岗位责任制,克服重重困难,胜利完成银河- I主机的49块6层底板、861块7层插件板生产任务,整机230万焊点无虚焊、挂锡,主机底板工程化设计100%正确。([1],118页)

1.2.4 巨型机硬件系统调试阶段(1981年3月~12月)

这个阶段集中解决了三个问题:一是插件、底板、焊接点、绕接点等全面细致的反复检查;二是解决插件测试问题,研制了符合巨型机实际工作,特别是恶劣条件下工作的测试设备;三是解决调试工具和方法。

为了确保巨型机硬件质量,“785工程”领导小组成立了质量控制组和产品检验组,建立了严格的岗位责任制,实行全过程质量跟踪控制,把科学求实精神落实到每个环节。一个人设计,三个人审查;生产工艺自检互查,层层把关;调试时每前进一步都严格考核,每项设计、每道工序都必须有人签字负责。科研人员还研制了一套计算机自动测试系统来完成785机插件板测试任务,大大提高了工作效率和测试正确率。过去调试一台百万次级的计算机需要一年,甚至几年,而银河- I的分调、联调、正确性调试和考核仅用了66天。[8]

1.2.5 软件系统的研制和联调阶段(1979年8月~1983年6月)

785机软件研制与调试几乎贯穿工程全过程,面对国际上软件迅速发展和中国软件还比较薄弱的现实,决策人员深知巨型机软件研究和开发的重要性,必须下大力解决,这一阶段主要做了以下工作:调集人员,充实软件研制队伍;采取不同形式,组织全国横向联合和大协作;实现软件工程化和规范化;抓紧模拟器和调试工具的开发,争取时间,缩短研制周期;做好软、硬件的约定和协调以及软件设计的审定和阶段成果的检查与考核。

785机一百多人的庞大软件开发队伍,成功开发出200万行巨型机系统软件:功能齐全、使用方便、可扩展性强的分布式操作系统和批处理系统;根据巨型机特点,采用FORTRON- 77标准文本,采用三级优化技术的向量FORTRON语言YHFT,可进行向量运算扩充并配有向量识别器,增强了向量识别能力;能描述巨型机全部机器指令,发挥程序员编程技巧,充分发挥巨型机优势,实现程序高效运行的YHAL汇编语言;建立了80类292个模块数学子程序库以及多级诊断系统。[9]

1.2.6 试算和国家技术考核、鉴定阶段(1983年4月~1983年12月)

试算,是为了检测机器解决实际问题时发挥的性能如何,这是进一步提高巨型机系统稳定性和可靠性的关键阶段,主要做了如下工作:针对试算的组织和选择算题类型来暴露机器存在的问题,分析其原因,认真加以解决;抓技术测试的组织和测试大纲的制定,创造一切条件,保证对巨型机的技术测试是科学、严格的;排除薄弱环节和隐患,全面提高巨型机的性能指标。(图4)

巨型机考核由用户考核和国家技术考核两部分组成,为了保证785工程高质量高标准达到设计目标,在国家考核前,先行组织了用户技术考核。1982年6月和9月,785机接受了用户单位的全系统软硬件正确性和可靠性考核,为国家考核奠定良好基础。1983年9月,国防科工委(国防科委于1982年与国防工业办公室、军委科委办公室合并组成国防科工委)在长沙组织了785机国家技术鉴定组工作会,完善了技术鉴定大纲与实施细则,成立了7个考核小组,完成了对同年12月份国家鉴定会的最终准备。

1.3 研制成果

1982年1月,785工程主机硬件调试完毕,时任国务院副总理的张爱萍为“785机”命名为“银河”,即银河- I巨型计算机(YH- 1)。1983年12月4日,国家鉴定会在长沙举行,国防科工委科技委主任张震寰担任主任,国防科工委副主任聂力等8人担任副主任,中国科学院计算所曾茂朝所长和高庆狮研究员、核工业部某院院长邓稼先、总参谋部某所副所长金怡濂、清华大学计算机系教授金兰等23人担任委员,对银河- I系统进行全面严格的技术检查和鉴定。12月6日,银河- I顺利通过国家鉴定(图5),国家鉴定书确认“银河计算机是中国自行研制的第一台亿次电子计算机系统,系统稳定可靠,软件较为齐全,其主要技术指标均达到和超过了鉴定大纲的要求,具有国内先进水平,某些方面达到了国际水平。它的研制成功,填补了国内巨型机的空白,标志着中国进入了世界上研制巨型机的行列”,“银河计算机即将成为我国战略武器研制,航天航空飞行器设计,国民经济的预测和决策,能源开发,天气预报,图像处理,情报分析,以及各种科学研究的强大的计算工具。”[10]

银河- I的研制成功,使我国成为世界上少数几个能够研制巨型计算机的国家之一,美国IEEE计算机学会出版的《巨型机:设计与应用》中,把中国的银河- I写入世界巨型机之列[11]。1984年,银河- I荣获国家“特等国防科技成果奖”,研制单位国防科技大学计算机研究所荣立集体一等功(图6),当年10月1日,银河- I模型车在北京天安门前参加了“建国35周年”群众游行,受到党和国家领导人的检阅*司宏伟访谈原长沙工学院计算机研究所科研办参谋、银河- I模型车参加国庆游行亲历者张云龙,2017年4月11日,长沙。。银河- I总设计师慈云桂被誉为“中国巨型计算机之父”[12],1979年被中央军委任命为国防科技大学副校长兼电子计算机系(研究所)主任,1980年当选中国科学院技术科学部学部委员,1985年调任国防科工委科技委常任委员、计算机顾问组组长。

图5 银河计算机国家鉴定书档案原件

图6 研制单位获一等功及银河机获特等成果奖合影纪念照片

2 银河- I的研制创新

一段时期,国内计算机研究领域对银河- I多多少少有一点看法[13],认为银河- I“没有什么实质性的创新内容,而仅是参考和借鉴国外已有的设计思想和技术理念”[14],是“对克雷- 1的仿制、翻版”([4],52页)。笔者通过对银河- I有关原始技术档案进行研究并与美国克雷- 1巨型机对比分析,澄清一些质疑。

2.1 银河- I的系统结构

银河- I巨型计算机系统是一个功能分布式复合多机系统,它由一台超高速中央处理机和若干台外围处理系统组成。

中央处理机是一台具有超高运算速度、超大存储容量、功能很强的向量与标量通用计算机。它充分运用并行重叠技术,采用向量双处理阵列、多通用寄存器、全面流水线的多功能部件结构,具有很强的向量运算和标量运算的能力。一个向量运算是在双阵列运算部件中,同时执行两组数据的重叠运算,使每一拍能获得两个结果数。本机还设有标量运算部件,由于采用了多标量功能部件和流水线技术,标量运算的速度也是相当高的。[15]

中央处理机包括运算部分、存储器和输入输出快速通道等,结构图如下(图7):

图7 银河- I中央处理机结构图([15],4页)

运算部件中设有寄存器和后援寄存器。运算型指令一般为三地址型,操作数和结果地址都指向寄存器。指令控制部件设有容量为256X16位的指令缓存站,可存放256条短指令或128条长指令。存储器采用素数模块、交叉访问结构,它有31个存储模块,总容量为200万字。中央处理机有24个输入输出通道,用来和外围机连接,进行程序与数据的传送。中央处理机和外部设备没有任何直接联系,它通过外围处理机管理这些设备,进行输入/输出操作。外围处理机包括2台用户处理机、1台诊断处理机、1台磁盘处理机和1台通讯处理机,还有5对通道用于扩充。([15],5页)

2.2 银河- I的研制指导思想、技术策略与途径

由慈云桂撰写的《“七八五”工程银河亿次机研制报告》表明,当初“785工程”领导小组确定的巨型机研制指导思想与设计原则如下:

(1)坚持独立自主、自力更生、艰苦奋斗、勤俭节约的方针;

(2)学习国内外的先进经验,尽量以当前国际先进水平为起点,积极采用先进技术,引进必要的技术、设备,洋为中用。从我国实际情况出发,尽量采用行之有效的、先进成熟的工艺、技术和元件,把先进性和现实性有机结合起来,加速完成研制任务;

(3)坚持质量第一、可靠性第一,把“三严”作风贯彻到工作的始终;

(4)系统简洁,维护方便,使用灵活,软硬结合,软硬并举,使软硬件系统都具有先进水平;

(5)大搞技术革新和计算机辅助设计、生产和测试。[16]

同时确定的巨型机研制具体技术策略与途径是:

(1)发挥自身优势,集中主要力量,高速度、高质量地研制亿次巨型机系统的关键设备——高速主机。协作研制或引进外围机和外部设备等;

(2)为了研究、设计、生产高度结合,主机生产立足于校内,并积极建立实验和生产基地,攻克技术、工艺难关;

(3)发扬社会主义大协作精神,组织软件协作攻关,高标准、高质量地按时完成各种软件研制任务。([16],4页)

2.3 银河- I与克雷- 1的性能比较

克雷- 1(CRAY- 1)是美国克雷研究公司1976年3月研制成功的巨型向量计算机系统,它是一种加工速度很快的数组处理机,突出特点是流水线和向量处理,每秒运算速度达1亿次,是美国第一台亿次巨型计算机。刚推出时,克雷- 1的操作系统不支持任何对话式应用,仅限于单道程序设计的操作系统。除了数学子程序座和某些应用程序库以外,连应用和数据库管理软件也没有。尽管如此,该机仍受到美国政府高度重视和支持,美国武器研究部门使用该机来研制增强安全性能的核弹头,在美国核武器发展方面发挥重要作用。[17]

当时,美国为了保持在巨型计算机技术上的领先优势,对克雷- 1的技术实施了严格的保护与封锁,银河- I研制人员所能够获取的公开资料非常之少。[18]

银河- I与克雷- 1的主要性能指标比较如表1[19]:

表1 银河- I与克雷- 1的主要性能指标比较

2.4 银河- I的技术突破与工程创新

通过银河- I原始技术档案进行剖析、归纳、总结,银河- I有以下八个主要方面的技术突破与创新。

2.4.1 系统结构的创新

对于克雷- 1内部结构的技术奥秘,研制人员无法得知,为了能够获得每秒一亿次以上的运算速度,银河- I在主机结构上进行了几个重大的技术决策[20]:

(1)首创提出了向量双阵列部件结构方案,即双浮点运算部件六条流水线,双向量部件六条流水线,双向量寄存器,使得每拍可获得两个运算结果。

(2)首创了多模块素数模双总线交叉访问存储系统结构,减少了访问冲突的概率,满足了双向量阵列运算时对数据流量的需求。

(3)设计了全流水线化功能部件和复合流水线技术。全机18个功能部件全是流水线结构,指令控制、数据存取,都采用流水线工作方式;且运用复合流水线技术,较好地解决了向量指令相关问题,提高了部件工作的并行度,因而提高了实际运算速度。

(4)设置了“压缩还原”型传送指令和间接地址传送指令,对一些算法提供了方便,可以大大节省空间,显著地加快了运算速度。

2.4.2 硬件设计的改进

(1)改进了克雷- 1浮点倒数近似迭代算法,简化了部件结构。在精度相同的情况下,器材节省60%,流水线从14站降为6站,缩短了运算起步时间。

(2)在指令流水控制部件中设置了微命令库,使控制简单,节省了器材。

(3)利用单片存取周期375ns的MOS组件,研制成功周期为400ns、容量为64K的存贮器模块。

(4)素数模(模31/模17)双总线交叉访问的存贮控制技术,包括快速地址变换算法及其实现,访问冲突处理和队列结构等,保证了高速数据流量的实现。

(5)采用微程序控制的双缓冲盘控接口设计,使磁盘传输速度充分发挥。

(6)针对外围机特点,设计了相应的硬件接口。[21]

2.4.3 软件系统的开发与突破

首先建立了较完整的银河机软件工程化规范。按照软件工程化的需要,形成了软件人员梯队,按级分工,实行结构化程序设计。独立研制出各种模拟器和调试、测试等软件工具,使软件调试与硬件研制工作同时进行,大大加速了软件研制进度。实行了较严格的软件工程化管理制度,和高质量、高标准的考核验收制度。这些是软件产品高质量、标准化的基础。[22]

(1)银河- I操作系统是自主独立研制的分布式批处理系统,主机可承接128道作业,其中63道可同时投入运行。允许用户指定某道作业为特惠作业,可优先占用各种系统资源。还允许用户随时记盘下机或调盘上机,以利用用户分段算题。银河操作系统采用分层模块化结构程序设计,各模块功能相对独立,接口清晰,可扩充性强,相比克雷- I的操作系统功能更全。

(2)自行研制成功银河向量高级语言YHFT。根据银河巨型机的特点,在国际标准文本(FORTRAN 77)的基础上扩充了向量运算。采用基本块优化、表达式优化和目标代码优化等三级优化技术,较好地发挥了银河机硬件的效率。YHFT还配有向量识别器,采用新的下标追踪法与传统的坐标法相结合的向量分析和识别方法,增强了识别功能。全部完成后,它可以识别包含GOTO语句和三种IF语句的DO循环体,使之也能向量化。

(3)独立研制了数学子程序库,除包含FORTRAN全部内部函数外,还包含了各种向量子程序,达80类292个模块。由于进行了深入的并行算法和并行程序设计研究,不仅功能、数量比克雷- 1的多,而且精度、速度都比克雷- 1的高。

(4)自主开发和扩充了PDP- 11/70机的系统软件,设计了与银河机的通讯接口软件,并开辟了磁带数据直接进入银河机主存的通道,大大加速了系统的输入输出能力。

2.4.4 维护诊断技术

在银河- I的整个研制中,十分重视主机的可维性设计,并积极采用它机诊断技术,使银河机具有较高的可维性和可用性,主要有[23- 24]:

(1)三控部分利用双阵列部件比较、双数据通路比较、关键控制部件双套比较、奇偶校验,进行了全面的可测性布局,硬件只增加5%,大部分故障(包括瞬时故障)都可以及时检测,并为插件级故障诊断创造了极有利的条件。

(2)主存储器采用可纠一位错、检测多位错的海明码校验系统,大大提高了可靠性,并设有完整的自检手段,维护方便。特别是,主存校验系统的许多重要信息(包括访问源、体号、体内地址和纠错码等)均可以由软件回收,从而保证了存储体故障的准确定位。

(3)通过集中式诊断处理部件,在硬件结构基本不变的情况下,可以从诊断维护机向银河主机扫入扫出各种控制信息(包括时钟控制),回收所有硬校验信息,为它机诊断和自动调机提供了有效手段。

(4)自主建立了部件级、插件级、组件级三级诊断系统,诊断速度快,定位准确,使用方便。主机插件级诊断可以对绝大部分固定性逻辑故障隔离到三块插件以内,大大缩短了银河机的维修时间。

(5)开发了各种故障诊断生成软件,如面向诊断的硬件描述语言DDL- D及其翻译器,随机码生成技术,测试码生成算法,逻辑故障模拟算法和权“3”压缩映象故障字典等,有效地解决了复杂功能部件和逻辑插件的测试生成问题。

(6)研制了自动插件测试台、插件双比测试台、存储插件测试台等多种插件测试设备,给维机带来了方便。

2.4.5 高密度组装工艺

为了保证主机在20mc主频下稳定工作,获得尽可能高的运算速度,银河机采用了高密度组装工艺,即采用阶梯式圆弧状柱体机柜结构。([1],122页)缩短了走线距离;采用高精度、高密度、高可靠性的插件印制板和印制底板及其贴模反镀法生产工艺[25];采用高密度锡焊底板组装和绕接工艺,印制线、双扭线、三扭线混合传输线结构,获得良好的信号传输性能;采用加固大插件结构和插件平插方式等,使得结构美观大方,电性能良好,维护使用方便。([15],42页)

2.4.6 高效通风散热系统

克雷- 1的散热采用高级的液冷技术,而在当时的条件下中国技术上达不到。银河- I采用风冷技术,为解决高密度组装带来的散热问题,在理论分析的基础上,通过大量实验,研制了平行短风路均匀送风的风冷散热系统,进出口风温之差小于7摄氏度,使得主机内各组件管壳上表面温度小于58摄氏度,温差小于25摄氏度,提高了系统的抗干扰能力,增加可靠性,延长组件寿命。([15],43页)

2.4.7 计算机辅助设计、生产、测试和调试

(1)开发了自动、半自动印制板布线软件,作为插件、底板工程化设计的有效辅助手段。

(2)研制了光点扫描照像控制机,自动钻床控制机和快速导通测试仪等自动、半自动生产和测试中的关键工艺设备,解决了高精度、高密度多层印制板生产和测试中的关键工艺,对保证生产进度和质量起了重大作用。

(3)在设计过程中广泛采用了模拟技术,验证了系统设计、逻辑设计、硬件算法和微程序库等,保证了各种设计的正确性,有效地缩短了研制周期。

(4)在硬件研制的同时,在PDP- 11/70机上研制了工具汇编和具有性能分析功能的交互式模拟器,使得银河机软件调试工作的起步时间提前了一年半,并节约了大量银河- I主机机时,大大加快了软件研制进度,有效地进行软件性能测试,提高了软件的质量。

(5)银河机主机调试中,改革了调机方法,采用微型机调试,不但能迅速而严格地检查各部分功能,且能将错误现场打印出来,便于分析研究,也易于在调试过程中实施频率拉偏和电压拉偏实验。在软硬件系统调试中,研制了软硬件调试工具,利用PDP- 11/70机进行交互式调机,摆脱了传统的利用控制面板调试方法,实现了调机自动化,提高了调机质量,加快了调机进度。([16],11页)

2.4.8 低压大电流不稳压直流供电技术

低压大电流供电在计算机系统中是一个突出问题,特别是采用电流较大的ECL电路以及高密度组装,使电流密度急剧加大。银河主机电流电源电压仅为-5.2V和-2V,而所需电流则各近3000安培。若用传统的直流稳压电源,其体积可能比主机柜还要大得多,且效率低,不可靠。技术人员解决了六相一十二相大功率低压变压器工艺,与并行馈电等关键问题。[26]

首次在我国计算机上采用交流稳压、整流滤波的并行电源馈电系统,效率高,可靠性高,且全机各点压差小,提高了系统的稳定性与可靠性。([6],245页)

3 银河- I的研制启示

银河- I是我国“大科学工程”的成功案例之一,其研制的经验、教训、启示具有一定现实意义。

3.1 银河- I研制的经验与不足

在银河- I研制过程中,慈云桂带领团队长期跟踪国际计算机前沿工作,一直勇于创新,为今后不断研发新的、更高性能的计算机,积累了攻关和研发方面的宝贵经验。《“七八五”工程银河亿次机研制报告》中记叙如下:

(1)提供了强有力的计算工具,已经为一些单位原来无法计算的大型课题计算出较满意的结果。

(2)形成了一支研制超高性能计算机的队伍,这是一支从教授到工人、从总设计师到程序员实验员的具有层次结构的队伍,在银河机研制过程中,锻炼了思想作风,提高了理论水平和实践能力。

(3)建成了一条符合我国国情的半自动化巨型机生产线,摸索出一套切实可行的生产工艺和生产管理制度。

(4)带动了我所计算机辅助设计、生产、测试和调试的理论研究和工程实践,不少成果和设备正在发挥重要作用。

(5)实践了软件工程化,进行了结构化程序设计,积累了一套研制大型计算机工程的科学管理方法。

(6)促进了大学本科生、硕士生和博士生的教学,丰富了教学内容,提高了教学质量,取得了一批较高质量的毕业论文,形成了培养博士和硕士生的、教学和科研相结合的基地。

(7)在全国范围内形成了一支并行算法和并行程序设计的科研队伍,他们所做的一些研究工作,填补了国内空白。

(8)积累了大批资料,包括国内外有关大型机、巨型机方面的最新资料,以及在银河机研制过程中我们和协作单位编写的大批技术资料和教材。([16],12~13页)

客观地说,银河- I虽然研制成功并顺利通过国家鉴定,取得巨大成就,但在当时条件下难免仍有不足之处。例如,并行算法和并行程序设计的研究不够;银河机局部网系统的研究与建设还没有及时跟上;绘图软件没有同步开发,以致未能满足部分大型用户上机的急需;与用户结合的科学库、数据库和专用程序包少,导致某些有户单位本身应用程序在银河- I上的向量计算效率存在一时的困难;应用范围和用户单位没有进一步拓展,等等。[27- 29]这些都为之后不断改进和提高银河机的性能、实现银河机系统的系列化提供了有益的经验教训。

3.2 银河- I研制的几点启示

3.2.1 国家战略支持

银河- I当时是粉碎“四人帮”之后,在邓小平同志亲切关怀下上马的,是在落实党的一系列正确方针的过程中研制的。在小平同志将巨型机研制任务下达后,国防科委张爱萍主任十分重视,一面深入传达中央军委精神,一面组织了由张震寰副主任挂帅的领导班子,从上到下统筹技术力量投入到巨型机研制中。银河工程相关工作一直得到党、国家、军队高层领导重视,在人力、财力和物力等各方面都得到了大力支持。

银河- I研制过程中,邓小平多次向张爱萍询问研制情况,王震、方毅、耿飚、王首道、钱学森、洪学智等领导亲临现场视察指导。北京和长沙间建立了“指挥热线”,下边的问题“不过夜”反映给北京,对研制工作实施强有力的领导和保障。国防科技大学党委把巨型机研制作为首要任务来抓,组织了以副校长张文峰、慈云桂(兼总设计师)和副政委董启强为成员的785工程领导小组,下设785工程办公室,苏克任主任,加强对整个研制任务的具体领导。[29]同时组成校、所、室和专业组的一整套指挥系统,定期召开联合会议,及时解决各种问题,从而使银河- I工程任务得以高速度、高质量、高效率地完成。

3.2.2 原始创新与集成创新相结合

银河- I研制之初,研制团队就确定了走一条自力更生、学习与独创相结合,起点跟得上当时国际水平的新路子。

总体方案上,敢于瞄准当时国际上性能最高的巨型计算机克雷- 1,借鉴成功的设计思想和先进技术,使银河- I研制“既是高起点又减少风险、少走弯路”,同时“结合实际情况,扬长避短,创造性地提出了我们自己的巨型机体系结构”,有些技术,“如用双向量部件配以双流水线主存来提高一倍向量运算速度等,都有我们自己的创新。”[30]

软件方面,当时我国与国际上差距很大。银河- I参研人员在学习国际先进技术的基础上,自主完成了难度极大的亿次巨型机操作系统、编译系统、应用软件和I/O软件等的研制,“还首次研究与开发了亿次巨型机的模拟系统,它能够模拟硬件方案与结构的正确性和有效性、应用软件的运行效率等,有力支持了整个系统的研究开发和高效使用”。[31]

设备器材方面,银河- I科研团队进行了全国范围的走访调查,对原材料、元器件和外围机、外部设备的生产与质量情况有了深入了解,发现“当时国内的元器件,特别是高速电路技术上、工艺上还没有完全过关,有些关键性的原材料,如生产多层印制板的覆铜板,难以保证工程质量的要求,加工外围机和外部设备在国内落实也存在不少困难”,最后下决心并经国防科工委批准,充分利用改革开放条件,在器材和设备上,“采用两条腿走路的方针,凡国内已经生产,而且质量过关的,坚决采用国内的产品;凡国内没有或是不能保证质量的,则暂时从外国引进。”[32]事实证明,这样做既为整个工程争取了时间,节约了研制经费,又保证了银河- I整个系统性能的高水平。值得指出的是,“考虑到工程的周期与成本,购买非核心部件是国际计算机工程领域的惯例,美国克雷- 1的大量部件甚至外围机等都是购买的。”([4],53页)

3.2.3 “集中力量干大事”的科研攻关精神

银河- I研制之前,参研人员只有研制百万次机(151机)的经验。跨过千万次级,直奔亿次级,技术难度和艰巨性可想而知。特别是当了解到有关部门购买国外计算机所附加的苛刻条件(当时国家某部进口一台四百万次的计算机用于科学计算,还被出口方要求必须为这台机器修建六面不透明的建筑墙作为“安全区”,只允许外国专家进入,中国人在自己的土地上都无权进入[33])时,科研人员深感责任重大。当时慈云桂教授已年过花甲,但面对困难不退缩,既当指挥员,又当战斗员,率领团队集智攻关,成功研制出银河- I,成为中国人的“争气机”[34]。

银河- I规模庞大,涉及面广,这就要求研制人员必须紧密团结,齐心协力。比如在研究系统总体方案、各分系统之间的接口关系以及技术难点等方面,总是发扬民主,由技术骨干集体讨论,使重大问题得到突破,并保证了各部分之间的协调配合。又如,在研制中碰到关键问题,就随时召集有关人员到现场看现象、找原因,群策群力,集智攻关。[35]

银河- I研制过程中,清华大学、武汉大学、复旦大学、湖南大学、湖南师范学院、湘潭大学、核工业某所、西南计算中心、航天工业部某所、某院计算站、石油部物探局、冶金部鞍山钢铁研究所、国防科大校内的二系、七系、实验工厂和印制厂等单位都直接参加了银河机的研制任务。广州机床研究所、北京半导体器件一厂、北京无线电元件二厂、衡阳晶体管厂等,为银河机研制提供了关键设备和器材。国防科大校内的二、三、四、七系,航天部某基地,科工委某基地等单位为银河机研制支援了人力。中科院计算所、电子部某所、总参某所等兄弟单位都给予技术上的大力支持。多家协作单位给予大力支援,为亿次机的研制成功做出了积极贡献。[36]

银河- I系统复杂,要求体积小、可靠性和稳定性高,这对设计、生产和工艺都提出了特殊要求。当时没有高精度的自动化设备,为了确保生产进度和质量,在争取引进有关设备的同时,主要靠参研人员和技术工人们的智慧和责任心,团结合作,奋勇攻关,自主研发。如印制板照相设备、印制板自动打孔设备、印制板导通自动测试仪、器件测试与老化设备、例行试验设备以及插件测试设备等,都靠研究室和工厂密切配合自行研制生产。再如,全机数以十万计的元器件都经过严格的老化测试和筛选,上百块多层印制板和底板,每块约有五千个金属化孔,100%经过孔壁电阻测试,全机二百三十多万个焊点无一漏焊、虚焊和挂锡。[37]

银河- I全体研制人员顽强拼搏,在“研制时间一天不能多,运算速度一次不能少”的要求下,奋战5年,提前完成了研制任务。经过半年多的严格测试、考核、试算和验收,系统达到并超过预定性能指标,而研制经费只用了原先计划的1/5。([6],238页)

3.2.4 坚持为国防建设和国民经济服务

银河- I巨型机共生产3台,1台留在长沙国防科大计算机研究所服务国防建设,1台在河北涿县石油部物探局研究院作为“银河地震数据处理系统”的主机,1台在四川绵阳作为西南计算中心主机。

长沙的银河- I巨型机,自运行以来,长期稳定可靠,故障率极低,每年平均交机率都在95%以上,为汉江油田开发三维石油地震处理软件等国民经济建设和军事应用创造了难以估量的效益。([1],123页)

涿县的银河- I地震数据处理系统主机,针对地震数据处理中数据量大、人工干预多、多用户同时作业、各种处理模块运算量差异大等特点,采取一系列重大技术举措,改进了操作系统和编译系统,新增两台前端机和研制了相应的软硬件接口,研制了一整套地震应用软件等,为我国石油勘探开发提供了强有力的手段,投入运行以来,稳定可靠,为石油地震数据处理精加工,为油藏模型建立、分析做了大量工作。[38]

绵阳的银河- I,配有两台银河超级小型机作前端机,多年来稳定可靠,交机率达92%以上,每年提供8000多机时,为工程物理科学计算以及航空、航天技术的课题计算等做出了巨大贡献。[39]

3.3 银河- I研制的后续影响

银河- I亿次巨型计算机的研制成功,不仅结束了我国没有巨型机的历史,实现了“零的突破”,打破了西方禁运和封锁,增强了国防实力,更对我国巨型机事业的发展产生积极而深远的影响。

一是坚定了走中国特色自主创新的技术路线的信心。搞自主创新不等于保守封闭,恰恰需要站在世界前沿,利用最先进的技术思想开阔视野,增强创新能力。银河- I的研制成功,靠的正是这种与时俱进的理念和自主创新的智慧。此后“银河- Ⅱ”、“银河- Ⅲ”等银河系列巨型计算机的研制,完成了从大规模并行体系结构的实现,到可扩展共享存储并行体系结构的跨越,各代系统总体上都达到了当时的国际先进水平,而且有多项技术创新处于国际领先水平(图8);而新世纪新阶段研制成功的“天河一号”、“天河二号”超级计算机,先后在国际超级计算机TOP500排行榜上夺冠,推动中国巨型机研制技术跃上“世界之巅”。

图8 “银河- Ⅱ”、“银河- Ⅲ”等银河系列巨型计算机真机陈列

二是锻炼了一支勇于进取、能打硬仗的科研队伍。银河- I的研制队伍中,相继涌现了中国科学院学部委员1人(慈云桂)、中国科学院院士2人(周兴铭、杨学军),中国工程院院士4人(陈火旺、卢锡城、宋君强、廖湘科)。团队先后获得特等国防科技成果奖1项,国家科技进步一等奖6项,国家发明二等奖1项,军队和部委科技进步一等奖70余项,被中央军委授予“科技攻关先锋”荣誉称号。

三是形成了以“胸怀祖国、团结协作、志在高峰、奋勇拼搏”为内容的“银河精神”。这十六字“银河精神”是该团队自受领银河- I亿次巨型计算机研制任务以来,在长期的银河工程科研实践中自觉形成的,成为他们凝聚队伍、发展事业的“精神圭臬”。1991年12月,在我国首台十亿次巨型机银河- Ⅱ即将研制成功之际,国防科技大学计算机系召开第四次党代会,正式把“银河精神”确定下来。[40]2006年,解放军原总政治部将“银河精神”与“两弹一星精神”等43种革命精神一起,收入《革命精神光耀千秋》思想政治教材下发全军学习。

1 国防科大校史编审委员会. 国防科大计算机系兼研究所史(1956~1993)[M]. 内部印制. 116.

2 清华大学校史研究室. 清华人物志第四辑[M]. 北京: 清华大学出版社, 1996. 268~269.

3 赵阳辉, 吴迪. 银河亿次巨型计算机工程组织管理研究[J]. 科学管理研究, 2010,(3): 9.

4 赵阳辉. 银河亿次巨型计算机创新性研究——以工程本质、决策及文化为中心[J]. 工程哲学, 2012,(7): 54.

5 邓副主席在听取计算机问题汇报时的指示[R]. 长沙: 国防科技大学计算机学院档案室, ZYJ- 1- 1- 5.

6 胡守仁. 计算机技术发展史(二)[M]. 长沙: 国防科技大学出版社, 2016. 238.

7 周兴铭, 口述. 赵阳辉, 访问整理. 慈云桂与中国银河机研究群体的发展历程[J]. 中国科技史杂志, 2005,(1): 43~44.

8 银河- I有关软硬件设计资料(卷1)[R]. 长沙: 国防科技大学计算机学院档案室, KTYH- I013.

9 银河- I有关软硬件设计资料(卷2)[R]. 长沙: 国防科技大学计算机学院档案室, KTYH- I014.

10 银河计算机国家鉴定书[R]. 长沙: 国防科大计算机学院档案室, KTYH- I001/1.

11Tutorialsupercomputers:designandapplications[M]. IEEE Computer Society Press, Order from IEEE Computer Society, 1984. 325~330.

12 雷勇. 慈云桂传[M]. 长沙: 国防科技大学出版社, 2017. 318.

13 刘益东, 李根群. 中国计算机产业发展之研究[M]. 济南: 山东教育出版社, 2006. 114.

14 吴迪. 工程哲学视角下的银河亿次巨型机案例研究[D]. 长沙: 国防科技大学, 2010. 47.

15 慈云桂, 胡守仁. 785型计算机总体设计[J]. 计算机工程与科学, 1980,(4): 3~4.

16 慈云桂. “七八五”工程银河亿次机研制报告[R]. 长沙: 国防科大计算机学院档案室, KTYH- I001/06.

17 陈元兴, 周兴铭, 张德芳, 等. 克雷- 1巨型计算机系统综述[R]. 国防科大计算机学院档案室, KTYH- I012/6.

18 有关克雷- 1资料[R]. 国防科大计算机学院档案室, KTYH- I011.

19 Cray- 1 Computer System_Hardware Reference Manual 2240004[R]. 国防科大计算机学院档案室, KTYH- I012/1.

20 785工程软硬件设计系统方案[R]. 国防科技大学计算机学院档案室, KTYH- I013/1.

21 银河- Ⅰ有关硬件设计资料(卷2)[R]. 长沙: 国防科技大学计算机学院档案室, KTYH- I017.

22 银河- Ⅰ有关软件设计资料[R]. 长沙: 国防科技大学计算机学院档案室, KTYH- I015.

23 785计算机诊断系统[R]. 长沙: 国防科技大学计算机学院档案室, KTYH- I020/6.

24 银河- Ⅰ有关插件测试台资料[R]. 长沙: 国防科技大学计算机学院档案室, KTYH- I021.

25 用于贴膜反镀法的金属化孔工艺[R]. 长沙: 国防科技大学计算机学院档案室, KTYH- I019/4.

26 银河- Ⅰ存储器和电源部份的资料[R]. 长沙: 国防科技大学计算机学院档案室, KTYH- I022.

27 银河- Ⅰ国家鉴定会材料[R]. 长沙: 国防科技大学计算机学院档案室, KTYH- I001.

28 银河- Ⅰ软件用户资料[R]. 长沙: 国防科技大学计算机学院档案室, KTYH- I002.

29 银河- Ⅰ硬件用户资料(卷1)[R]. 长沙: 国防科技大学计算机学院档案室, KTYH- I006.

30 陈福接. 银河的光辉[C]// 纪念“银河- I”研制成功二十周年文集. 内部印制. 14.

31 胡守仁. 纪念银河巨型计算机研制成功20周年[C]//“银河- I”研制成功二十周年文集. 内部印制. 58.

32 苏克. 银河亿次机诞生记[C]//“银河- I”研制成功二十周年文集. 内部印制. 39.

33 刘世恩, 刘凤健. 银河魂[M]. 北京: 军事科学出版社, 2003. 57~58.

34 湖南省科学技术协会. 老骥伏枥[M]. 长沙: 湖南科学技术出版社, 1990. 226.

35 宋丽芳. 银河妙算功千秋——访国防科大计算机学院教授周兴铭[N]. 中国航天报, 2004- 04- 07: 2.

36 张文峰. 忆银河- I亿次巨型计算机研制成功[C]//“银河- I”研制成功二十周年文集. 内部印制. 9~10.

37 姚庆模, 江郁文. 银河- I生产回忆[C]//“银河- I”研制成功二十周年文集. 内部印制. 150.

38 银河- Ⅰ硬件用户资料(卷2)[R]. 国防科技大学计算机学院档案室, KTYH- I007.

39 银河- Ⅰ硬件用户资料(卷3)[R]. 国防科技大学计算机学院档案室, KTYH- I008.

40 刘世恩. 银河精神的形成与传扬[M]. 长沙: 国防科技大学出版社, 2009. 186~187.

猜你喜欢

国防科技大学银河研制
机灵的小青蛙
——绘本《小青蛙学游泳》亲子游戏活动
面向新一代众核处理器的高性能SNC的设计与验证*
仿生眼的研制有新突破
银河
去银河洗澡
银河升起
一种新型固定翼无人机的研制
一个被建构的东方世外桃源:对香格里拉的批判性话语分析
XV-24A垂直起降验证机的研制与发展
最美师生情