数据驱动未来 但不是一切

  几年前奥巴马和美国国会提交的一份报告里谈到,科技不只是在取代组装流水线上的工作,而是在影响任何可以被自动化的工作。即传统的自动化替代的是人的体力,但未来不一样,简单地讲是指人的脑力。

  大众CEO说,将来汽车将成为一个软件产品,大众也会成为一家软件驱动的公司。我们很多人听到后都会感到不解,汽车是一个硬梆梆的产品,怎么会是一个软件产品呢?我认为这句话有两层意思,一是指汽车未来所应用的软件产品会越来越多,尤其是自动驾驶,无人驾驶汽车。二是指影响未来汽车竞争力的主要因素是软件,而不是硬件。我们现在有个话题是“软件定义世界,数据驱动未来”,二者是紧紧联系在一起的。

  未来世界,我就说数据世界或者软件,与其相关的大量问题都是处理数据。正如刚才说的汽车是一个软件产品,由于软件产品很多都是和数据紧密联系在一起的,汽车就会和智慧城市里的很多数据关联在一起。

  自动化之说

  传统自动化是替代人的体力的,现在比较完善的自动化可以处理一些结构化的、固定模式的、确定性的问题。目前,少数非结构化的问题无法通过自动化处理。未来的自动化不仅包括目前已经完善的自动化,还会像奥巴马所说的替代一切的自动化。

  人的脑力包含很多东西,实际上它是非结构化的,没有固定模式,是一个不确定性的问题。这些问题的处理我们以前没有什么好的手段。实际上,这些问题需要认知自动化来处理。智能自动是另外一种自动化替代人脑力的技术。自动化替代脑力,我们讲它超越固定的模式,有些问题没有固定的模式。例如,一个车间里节能的问题并不是一台设备上节能的问题,它没有一个固定的模式,你没有办法用一个模型去表达,车间节能的设备没法建立一个模型,此时我们可能就需要用超越模型来处理。

  当然,有时候我们可以通过数据去发现模型,参数化模型等。我们需要超越确定性的问题,从而有办法处理不确定性的问题。

  工业中最重要的是制造,不管是设计效率、质量、成本、绿色等,所有这些问题实际上都存在着大量不确定性。如果我们想清晰地认识,乃至驾驭企业活动,那么认识这个企业的整体联系就会非常重要。

  另外,非固定模式不确定性的问题是以前对我们来讲比较困扰的问题,系统到底有多少是相关联的?大数据、人工智能等的出现就像开启了一扇大门,有可能促使我们去认识整体联系、非结构化的问题、不确定性的问题,等等。

  对于一个复杂系统来讲,其整体的联系是非常重要的。要认识整体联系或控制一些非固定模式,不确定性问题的基础是数据,但有数据就要互联。我们需要人工智能技术去决策控制一些非模式、不确定性的问题,而且人工智能技术也是以数据为基础的。

  理念的数据

  所谓理念的数据,就是围绕企业的理念去收集处理数据。例如,像海尔这样的现代企业的基本理念就是“以客户为中心”,因此,海尔建立了一个工业互联网平台,收集了大量的客户数据,从而能够在产品开发阶段通过客户数据把用户的碎片化需求进行整合,与用户交互,实现“以客户为中心”的目标。显然,围绕企业“以客户为中心”的理念整合数据是非常重要的。

  所以海尔的研发模式与传统的瀑布式模式不同。瀑布式模式是通过市场调查进行需求分析,之后研发产品, 即是先有产品再有客户。而海尔的研发模式是在产品开发的过程中通过网络,即互联网平台与用户迭代、交互,根据客户的需求生产产品;即是先有用户再有产品。因此,理念的数据引起了研发模式的颠覆。

  再如,“绿色”也是现代企业的一个重要的理念。“绿色”不光是指没有污染,也指资源消耗少。虽然美国的用电很便宜,但DeepMind谷歌数据中心的耗电量很大。后来通过改进DeepMind把耗电降低了15%,且实现了设备投资的收回。事实上,他们通过数据中心几千个传感器去收集温度、电量、耗电量等设备及建筑物的结构(不同数据中心建筑物的结构都不一样)数据,之后对数据进行深度学习等处理实现节能效果。显然,该案例中数据收集的标准即为节能的理念、绿色的理念。因此,类似这类问题是完全没有固定模式的,我们不可能通过建立模型来解决。

  这样的技术也可以被用在其他方面。如减少半导体生产,半导体耗水很厉害;帮助企业提高生产效率等。同样我们国内也有应用很好的例子,例如钢钢铁企业为了节能减排,在高楼上面安装了很多传感器,效果非常好,平均提高劳动生产力5%,降低纯铁成本15元,预期在全行业推广后,直接经济效益70亿元/年。

  数据的理念

  数据里面实际上隐含着另外一種存在,以尿布和啤酒为例。虽然超市专家以前没有意识到,但尿布和啤酒销售存在关联,人们看不到感觉不到,但却实实在在存在着。

  对于企业来说,以财务信息和业务信息的融合为例。实际上,很多企业的财务信息和业务信息并没有很好地融合,就车间里一些具体设计业务的工艺来说,生产上方方面面的信息并没有真正地被财务信息所利用,但实际上这个业务流程是和财务信息相关的。我们没有精细的数据收集,所以传统的信息和业务信息相互独立。因此,如何从大量信息中进行挖掘,进行成本控制是非常有意义的工作。

  其次,隐处的另外一种存在淹没在人的自以为是中。例如,AlphaGo对围棋有新的认识,这是人类没有认识到的,他有超越人的智慧,一种特别的思维过程。所以,数据其实是“非人类思维”的种子。像AlphaGo有非人类的思维,人类以前没意识到一样,数据是“非人类思维”的种子,我们如何从数据到信息,到智能,再到非人类思维。这对我们认识自动化是非常重要的。最可怕的不是人类,是非人类思维。在很多情况下,计算机系统、人工智能系统可能比我们的看法或感知更加细致入微。

  另外,数据收集常常需要跨系统、跨领域、跨媒体,某一个问题的表征并不一定集中在某个特定的系统数据之中。例如我们要判断经济趋势,判断选民的意向,光看报纸是不行的,还需要跨系统,跨媒体了解相关信息。例如,车间质量问题不一定只和设备、工具、工人有关,还会涉及供应商、环境、气候,甚至某一特定的时期,社会上的特定活动等。

  在企业中,我们常说业务数据化、数据业务化。所谓业务数据化,即企业里每一项工作,每一个活动,每一项业务都要数据化。企业远远没有达到业务数据化。所谓叫数据业务化,即指数据工作是由专门的业务部门来处理。目前政府部门已有专门的部门来处理数据,如大数据局。但是在企业中,我们所有计算机中心或信息中心和数据中心是不同的。专门处理企业数据收集的范围,数据传送的标准和数据相关部门才是数据中心。

  值得注意的是,不要指望一切都在预测和控制之中,也不能迷信数字与智能技术,数字与智能技术依然存在漏洞。更复杂的社会,也意味着更复杂的纠错机制、更高昂的纠错成本。正如墨菲定律所说,“如果事情有变坏的可能,不管这种可能性有多小,它总会发生。”

  总之,数据驱动不是一切,大数据、人工智能开启了认识整体联系,认识不确定性,认识非固定模式等问题的大门。我们应该围绕企业的理念和目标去收集、处理数据,尝试去深刻地理解数据的一些基本理念等。(本文根据李培根院士公开演讲整理而成,未经本人确认。)

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: