1D.7 张兆庆教授编译组为英特尔开发出开放源码编译器

news/2024/8/24 7:09:31 标签: 编译器, 英特尔, 优化, 工具, 数据结构, 代码分析

http://www.cas.cn/jzd/jcx/jcxwh/200209/t20020905_1034512.shtml

    □撰稿人:刘振坤(科学时报社)

    中科院计算所编译组自60年代起,承担了院、国家科研攻关项目,自主开发了若干国产大型机的语言编译系统。90 年后开发了共享内存、分布式内存并行机上的自动并行识别器,SIMD芯片和VLIW芯片上的并行优化C编译器,可视化并行编程环境。这些工作获:国家科技进步一等奖两项,国家科技进步二等奖一项,中科院科技进步特等奖两项,中科院科技进步一等奖两项。项目组在编译技术领域的研究工作获国内外专家高度评价,称此研究组居编译领域的世界先进行列。与国际著名公司Motorula、Hitach、Intel开展国际合作,目前与Intel公司合作研制的IA64开放源码编译器ORC居国际领先。研究组包括2名研究员,3名副研究员,4名助研,20余名博士和硕士研究生。
    美国英特尔公司为了开发IA-64开放源码编译器,在全世界范围内寻找合作伙伴,他们经过认真地调查研究,最终选定了坚韧不拔30多年不间断地进行编译器研究的——中国科学院计算所张兆庆领导的编译组。美方出经费、提要求,由中国人为主进行开发,经过一年的密切合作开发出IA-64开放源码编译器,到2001年初项目鉴定时,性能比当时最先进的开放源码编译器Pro64 0.13高6%,达到国际领先水平。
    机会之所以降临到张兆庆教授领导的编译组的真正原因,不仅是他们已经研制成功多并行编译及优化编译系统,张教授坚定地认为我国这样一个大国,迟早会搞CPU芯片,因为它是信息领域的核心技术,为之配套的编译器迟早会用得上。因此在还剩两个学生的时候,她仍然挺了过来,为国家培养和保留了一支编译队伍。所以,在一次与张教授谈合作的时候,英特尔公司的首席谈判专家曾这样提到,张教授坚忍不拔的性格是促使他下决心与计算所合作的原因之一。
    创造性应用代码重用思想,一举奠定成功基础。张兆庆凭借渊博的理论知识和丰富的实践经验,敏锐地想到代码重用的思想,果断地决定开发开放源码编译器,最大限度地利用已有的代码。他们通过对世界范围编译器的比较分析,摸清了Pro64的前身是SGI的产品编译器,2000年开放了该编译器的全部源码,它包括了循环优化和与机器无关优化部分,也包含了许多当时最先进的技术。但后端在ILP优化和机器相关优化方面相当薄弱,对于IA-64体系结构所能提供的一些先进的技术没有充分利用。基于上述分析,决定采用Pro64作为自己的开发基础,改进它薄弱的后端, “投机取巧”,集中力量做编译基础设施和针对IA-64的机器相关优化,一举奠定了成功的基础。
    坚持以我为主,努力争取合作方帮助。张兆庆说:在改革开放的大环境下,我们中国的科学家既要有自信心,又要承认与发达国家在科学技术上的差距,在汲取国际先进学术思想的同时,要虚心学习发达国家宝贵的工程经验。他带领编译组首先研究了几十篇近年来编译领域的重要文献;在这个基础上研究IA-64体系结构,力争搞清楚每一个相关的细节,这方面尽量争取得到lntel公司资深研究人员的帮助;每一部分设计都与lntel公司的研究人员充分讨论,反复论证,并通过原型实现验证。在确保设计的先进性又没有重大问题之后,由各部分的主要设计者编写了规范的低层设计文档。最后,对文档进行了两次严格的评审,第一次在课题组内部进行,第二次由lntel公司组织进行。这些都为项目的成功提供了保证条件。
    开发编译专用工具,将代码错误缩小到最小范围。开发编译专用工具,将代码错误范围缩小到文件、函数、区域、基本块、甚至是若干指令,这样就大大降低了错误定位的困难。他们同步研制了一整套测试和调试工具,包括编译系统测试环境,数据结构可视化工具、软件错误定位工具等。数据结构可视化工具能够将编译系统内部的复杂的数据结构,如全局和区域的控制流程图和依赖图,区域树,谓词划分图等,以图形的形式显示出来,使得很多问题一目了然。软件错误定位工具能够自动缩小错误的范围。特别是运行结果错误,定位相当困难,尤其如面对CPU2000测试程序包测试,平均大小都在几万行以上,若没有这样的工具,真不知道错误从何查起。
    当然,并不是所有的问题都可以由这些工具自动解决,人的才智、毅力和经验是不可代替的。
    不畏枯燥潜心调试,花大气力优化编译器。性能调试是优化编译器课题的重要组成部分,也是最艰苦的部分,更是最枯燥的工作。该项目第一期目标是比Pro64的性能高5%。但是,性能调试开始的时候,项目的性能比Pro64的性能低4%。面对着很多bug,他们也经历无数挫折时的焦急和忧虑。编译器性能和功能目标。为了尽快优化编译器性能和功能目标,首先,从静态代码分析作起,分析比较了大量的汇编代码,注意每一个细节,不放过任何提高性能的机会。二是每部分的开发人员也都作细致的性能分析,主要是将自己分工的部分的实际性能和设计时所预测的性能、其他编译器相应部分的性能做比较,找到这部分的设计和实现缺陷,并加以改进。三是还作了很多性能分析的流程、方法、和工具方面的研究。他们开发了统计静态和动态执行周期数工具,这些工具对于快速找到若干版本之间的性能差别有很大帮助。四是制定了严格的提交制度,尽量不让性能下降的改动提交。到项目鉴在鉴定的基础上,经过大家艰苦工作目前性能已经比Pro64高20%以上。
    (京区党委供稿)

http://www.niftyadmin.cn/n/1604738.html

相关文章

刷脸支付市场反应火爆千万不要错过时机

刷脸支付收银系统的应用让消费者自助购物,正规购物过程更加便捷了,同时对于商户来说,还可以通过收银系统的会员管理、会员管理营销、会员加广告以及服务,为商户提供了收银、店铺管理、营销加广告等一站式便捷的闭环应用。 对于餐…

刷脸支付打开各行业新的智慧收银大门

此次微信和支付宝面向市场推出的刷脸支付的产品,在安全上做了极大的努力,通过数据层层加密,保障了商户的资金安全,同时也为消费者带来了全新的消费体验,减少了商户在高峰期人流量分流的问题,与传统的聚合二…

5G必然为刷脸支付提供更多的应用可能

5G的发展前景不止于此,它的合作技术非常多,比如AI和大数据等,刷脸技术落地以后,迎合5G浪潮,将会提供更精准、更完善、更丰富化的服务,它的全面应用将会为企业行业带去智能化体验,也会引发新一轮…

1D.9 计算所在系统结构基础研究领域取得新突破

http://www.cas.cn/ky/kyjz/201003/t20100316_2798103.shtml近日,中国科学院计算技术研究所系统结构基础研究方向喜讯频传,在最高水平的国际学术会议——计算机体系结构国际会议(ISCA)和语言设计与实现(PLDI&#xff0…

IDC发布最新中国AI云服务市场报告,百度智能云排名第一

AI作为百度智能云的核心优势越发突显。7月14日,全球权威咨询机构IDC发布《中国人工智能云服务市场研究报告(2019)》,报告显示,在中国AI公有云服务整体市场格局中,百度智能云在整体调用量、市场份额方面均名列第一,拥有…

刷脸支付依托人工智能核心科技降低人力成本

刷脸支付市场空间大,刷脸支付是移动支付的趋势,它的到来使整个零售行业更加方便、快捷为顾客服务,支付宝会进行大力推广,不久的将来必定取代二维码,就像二维码取代现金一样。移动支付已经渐渐被消费者接受,…

智能标注原理揭秘 一文读懂人工智能如何解决标注难题

无论是在传统机器学习领域还是现今炙手可热的深度学习领域,基于训练样本有明确标签或结果的监督学习仍然是一种主要的模型训练方式。尤其是深度学习领域,需要更多数据以提升模型效果。目前,已经有一些规模较大的公开数据集,如Imag…

智慧门店对实体商家的价值始于连接和引流

刷脸成为了现实,各地实行刷脸的试点都取得成功。刷脸也就这样的走进我们的生活。不需要带手机、钱包,直接选择刷脸。当然,方便的还是无须等待排队,原本一个收银台需要配备一名收银员,所以考虑人力成本收银柜台数量是有限的。 但是使用刷脸支付,商家可以同时铺设十几台自助刷脸…