分布计算2.0:基于互联网的联接计算

  分布计算的研究对象,简单说是多个独立的计算实体组成的系统,它们是通过网络连接,通过通讯协议有效协同。

  分布计算2.0

  是新型应用的支撑技术

  应从两个视角来理解这个问题。一个我们称为分布计算1.0,实际上分布计算这个概念,在20世纪60年代末就提出了,1.0是以计算机为中心的,它关注的问题是如何将确定数量计算实体组合成为具有明确性能或可靠性需求的计算系统。其中需要注意两个关键词,一个是确定的数量计算实体,一个是明确可靠性需求的计算系统。这是1.0关注的问题。而新型应用的支撑技术,指的是分布计算2.0,关注的是如何将持续成长的网络资源联接成为更大规模,更高效的网络信息系统,是以网络为中心的。它是今天信息社会,赖以发展的重要的支撑技术。建设这样一个网络信息系统,是人类近几十年做的一件大事。面向互联网的连接技术能连接百亿台的设备,联接超过45亿在线网页,联接35亿网民,以及未来的成百亿成千亿甚至更大规模设备。实际上这样一个连接技术,已经在支撑社会前进了,我们从发展角度看,支持这样一个,包括像慕课在线教育网络信息系统,持续成长和发展的核心技术是什么?这样的系统,不是一蹴而就的,是在一个持续成长发展过程当中,走到今天的。从发展角度看,是什么样的技术支撑人类走到今天。就是面向互联网的联接计算。这个联接计算包括联接软件资源技术,联接计算资源技术,以及联接智力资源技术。

  关于联接软件资源技术,今天我们已经体会到了。各种各样不同的实体要联接起来通常通过一个软件标准,联接到一个所谓的抽象的软件总线上,这需要哪些标准呢?比如过去网络连接的TC包括软件技术领域里面的对象的远程对象连接的标准,以及后来我们联接网页的Http标准,等等这样一些重要的技术。正因为有这样的技术,我们今天讲联接,包括做网上教育的实践才有了好的基础。

  联接的三个方面

  第一,联接要关注如何支持技术的发展与演化。网络体系已经存在,我们需要重组,它既是一个变革的过程,又是连续的过程。联接的这些组成部分,是可以升级的,是可以有效的联接。这是我们今天需要的,所谓软件联接技术所要支持的,因此我们将互操作,将每个联接实体的自主性,是我们要支持的。

  第二,重要的联接技术,是计算资源的联接,其中重要的概念就是抽象与绑定。在计算机时代,计算机的资源为什么能够支持分布式应用,而且越来越便捷和高效,正是因为有了抽象的绑定系统。今天我们要抽象和绑定什么资源?不断成长的网络资源,如何有效地支持能开发各种应用的平台,我们需要支持绑定和应用。我们讲的云操作系统,云的设计和运行管理环境。在这个过程当中,我们最需要的资源是以一种聚合和协同的工作方式,实现弹性的绑定。众所周知,即便在云中心,资源使用的频率和要求也是不一样的。比如“双十一”抢购的峰值和平时差十倍的差别,在这个情况下,资源利用率要提高,就需要弹性的绑定,也就是适时感知需求,正确决策,进行动态绑定,在适当的资源粒度上,调整时机,实现任务和计算资源的绑定。

  第三,智力资源的联接,我所关注的领域是开源计算。我们知道过去的软件的开发平台是一个企业级平台,是按照工业化生产来研发软件。它关注的是产品要满足用户需求,因此它的支撑环境,是以质量控制为核心的协同生产环境。怎么把用户控制住,这是过去我们讲的。开源的环境是什么?是开发者、自由职业者和学生企业,都可以参与的环境,在这里研发出很多重要的作品,这是每个参与者灵感得以表现的环境,在这样的环境本质是支持分享和协同创作的。在大学教育当中,传统的教室和今天网络教育也是这样一种对比,这两种方式,不是彻底的替代。因此,如何把一个有效的作品变成产品需要思考,比如说维基百科做好以后,怎么把它变成有效的服务,这两种机制是需要联接的。智力资源联接强调激发与汇聚,今天的开源世界已经提供了很好的激发模式,让大家都可以参与,这个激发模式,如何汇聚成有价值的成果,需要研究。今天的学习者,利用在线教育平台,已经拥有丰富的计算资源了,大家最关心的是,怎么才能汇聚更多资源?大家明显感觉到,一个搜索引擎已经不够了,因此在这个过程当中,我们要解决的问题是,一个核心团队和互联网大众的自主参与是如何有效协同的?在整个过程当中,创作活动和生产活动如何有效协同?这里面涉及到大众协同机制,开放工作机制和持续评估机制。

  分布计算的方位

  信息化时代有两次浪潮,一次重要的浪潮是数字化,这个浪潮仍然在推进中,分布计算是边缘化的,在数字化浪潮后,又兴起浪潮网络化浪潮,网络化时代分布式计算处于中心的位置。在这个过程中,我们的支撑技术处于什么位置?在1.0的时候,我们计算技术是跟踪为主,面临的是自主可控的挑战;到了网络时代,我们已经从跟踪到并跑,网络可控的问题已经解决得比较好了。我们最近看了一个材料,讲基础设施和我们的应用,说1986年,互联网在美国学术界广泛发展的时期,中国互联网带宽是0,到这个世纪之初,中国互联网带宽达到世界第二了,到2014年中国互联网带宽的累计已经是世界第一而且两倍于美国,同时我们注意到,中国在互联网上的应用,也取得了一定的成就。在支撑技术模式上,中国从跟踪到并跑,已经有了突破。

  关于这件事情,我们要历史地看,关于信息技术发展的Gartner曲线,大家都很熟悉。信息技术的早期发展,会有泡沫期,之后会有一个所谓的幻灭期,然后才会慢慢走向成熟。用中国的讲法,就是生长期,青春期,而立期,不惑期和稳定期,这是Gartner曲线基本的流程。大家经常把而立期,说成是幻灭期,把青春期说成泡沫期,这是消极的讲法,我的理解是,有两个时期是势能的积聚期和动能的释放期。我们首先要有一个能量积蓄的过程,之后的过程,不是破灭,而是一个势能得以释放的过程,我们必须有一个很高的势能的积累。所以重要的是要把握好势能的快速积累和动能的有节奏释放这样一种节奏。

  举一个例子,我们做了一个软件平台叫StarBus,这个平台根据多元及的技术,在势能积累过程当中,研制我们中国的具有自主知识产权的中间件平台,应用达到顶端的时候,我们就开始用这个平台来推动中国在中间件领域产业的发展,因此我们就有了对技术标准、继续发展的认识和体会。我们还要继续努力,让这样一个势能得以持续的释放。过去我们做了两件有意义的事情,第一件,是在2001年,我们用这个平台,开发出当时在国际上失误处理能力最强的计费软件,这在今天看很平常,但在没有云计算的时候,支撑三千万用户计费的系统,是世界最高水平。第二件,在过去十年当中,我们把这些技术,用于国防信息化建设,用我们的技术实现了国防信息系统的对象化、构建化、服务化。这个软件技术的实现过程,就是我们从势能的积累到动能的释放过程。我们已经推进了20年。把它应用于军队的信息化,我们也实践了15年,其意义不仅在于我们是在势能积累过程当中,还在于我们有动能释放的韧性。

  软件强调的是联接,最重要的是把资源高效汇聚起来。我们提出了原创核心概念:在互联网计算当中,要按需聚合、自主协同。我们用这个概念来推进国家互联网的治理。互联网需要治理,我们要解决的是面对千倍速增值,怎样还能管住网?只有利用互联网资源管理互联网,才能真正管得住网。

  (本文根据王怀民在LINK2017在线教育论坛上的演讲整理而成,未经本人确认。)

  国防科技大学副教育长 王怀民

关注读览天下微信, 100万篇深度好文, 等你来看……