老牌数据分析公司SAS之变

  • 来源:IT经理世界
  • 关键字:数据分析,SAS
  • 发布时间:2017-06-21 14:25

  技术变革正在让这家公司变得“既熟悉又陌生”。

  一家中国手机大公司,要从社交平台的海量数据中倾听“客户的声音”。于是,带有机器学习技术的大数据分析系统被采用,每天从300多个网站抓取2000万条原始社交数据,从中辨识出100个危机预警,5万个客户问题。这些问题被立刻输送到产品维修、客户服务、产品设计部门……得到主动解决。而在过去,采用人工处理方式,每人每天只能看800条信息。自动化系统让分析能力和效率提升100倍!

  一家中国金融公司,要在海量交易中实时辨识欺诈交易。这可不是件容易事。要知道,在2016年,使用移动支付的中国用户已达4.7亿人,这个数字甚至是美国总人口的1.5倍以上,每天创造天量级金融零售交易数据,而交易欺诈规模也庞大得惊人,仅信用卡欺诈一项就让银行业每年损失几百亿元。但现在,通过采用具备机器学习技术的高级分析系统,这家金融公司每秒可处理10万笔+交易量,成功阻绝90%的欺诈犯罪。

  在这两个典型的案例中,企业都采用了大数据分析企业SAS的新技术。

  SAS可不是一家新公司,它已有41年历史,源自美国北卡罗来纳州立大学的一个数据分析软件研究项目。虽然根据市场调研公司IDC的统计,SAS目前在全球高级和预测分析市场占有31.6%的份额,但这家老牌数据分析企业却面临前所未有的挑战。

  SAS起步的时候,数据分析还是一个很小很专的市场。但现在,数据分析世界已发生翻天覆地的变化,成为全球最广袤的技术市场之一。互联网、物联网带来了海量实时数据分析需求,“人人都是数据分析师”的理念被越来越的企业接纳,机器学习特别是深度学习加速了智能化的脚步,开源技术对传统商业模式发起冲击……SAS的变化就是在这样的背景下发生的——如何在一个越来越热闹、竞争越来越白热化的市场“不被后浪拍在沙滩上?”

  “行业变迁已经迫使我们去做出变化。”SAS首席技术官Oliver Schabenberger说,“分析将无所不在,分析将被自动化,将结合强大的现代机器学习、深度学习和认知分析技术。同时,物联网引发的边缘分析、流数据分析将加速我们将分析能力带入网络和移动设备中。”

  Oliver从去年起担任SAS首席技术官,目前正努力带领全球的研发团队,通过技术变革塑造一个我们“既熟悉又陌生”的SAS。

  小设备中的数据分析

  “物联网正在改变数据科学。”Oliver说。被业界广为引用的数字是,思科预计,到2020年全球将有500亿台设备连联;到2030年,这一数字将增长10倍。

  在物联网环境中,数据流动在前端移动设备和后端服务器里。“我们不能只考虑在云中处理数据,也必须考虑边缘分析,也就是最前沿设备上的事件流处理(ESP,Event Stream Processing),这是物联网非常重要的部分。”Oliver说。

  这让SAS考虑将高性能“事件流处理软件”从云端拿下来,不断精简,放到各种小设备、车辆甚至网络路由器上运行。

  “物联网不仅仅关乎软件,我们也要与网络设备公司合作。”今年4月,SAS与思科联合推出了业内首个从边缘到企业的物联网分析平台。“这是重要的一大步。”Oliver说。SAS的事件流处理软件运行在思科物联网网关上,在传感器和那些产生数据的设备附近,在亚秒级时间内就地处理数据。经过过滤、处理的数据集,再被传输到数据中心或云端,与更多企业数据组合,应用机器学习等先进分析技术,来获得新洞察。

  “我们注意到事件流处理可以处理图形,这是即将推出的新技术,令人激动。”Oliver补充说。

  Oliver了解到中国制造2025。“我们希望把物联网分析平台部署到工厂中,给工厂的运营带来大不同。”

  分析的未来是自动化

  不久前,海尔数据科学家表示,智能制造面临的巨大挑战是源源不断流入的数据是人工方式所清洗、治理和分析不了的。

  数据科学家现在大概花80%的时间来清洗和治理数据,而业界希望他们能把更多时间用于针对数据建模或评估工作上。

  “分析的未来将更加自动化,但它将以巧妙的方式自动化。”Oliver说。传统上,人们针对某类数据,选择一种他们认为最适合的统计模型。现在,这将被数据驱动的机器学习所取代。但业界有两类机器学习——经典和现代。

  “经典机器学习并不是纯粹意义上的自学习,而是训练一个系统来形成和分类数据。”Oliver说,“真正令我感兴趣的是现代机器学习,其中的算法没有明确程序去做任何事情。但它让你不用深入了解某个领域,不需要研究信用卡诈骗,也能开发反欺诈模型——你只需要拥有足够的交易数据,让人工智能网络学习如何对其进行分类。”

  “同时,单一技术不足以解决问题,我们要提供工具、技术的组合,如数据建模、机器学习、人工智能的有效结合。”Oliver说。

  Oliver提醒,不能盲从自动化。他希望自动化能在大规模上帮助人们去解决问题,去建立一些系统或具体机制,搞清楚不同领域之间的边界在哪里,这样的自动化才是最有效的方式。

  谈到目前的人工智能时,Oliver说它具备两个特点:属于弱人工智能,和基于深度学习。他补充说,分析软件正在快速转变为“认知空间”,其中感知、听力和手势将成为常见的投入形式,而具备人类反应的读和写将成为常见的输出形式。

  SAS在人工智能领域有超过15年经验。SAS深度学习和认知分析将有3个主要目标,一是添加到经典方法中,实现更多自动化,让人们具备更少专业领域知识也能解决问题。二是为客户提供深入的学习工具,使他们在其数据上训练现代机器学习模型。三是将认知计算和深度学习输入到产品中,让用户与软件的交互更人性化,支持更多个性化和更多动态行为。

  业界知名企业都在强化人工智能技术。“我们区分于其他公司的最重要元素是,我们能在单一平台上提供所有技术,如预测性分析、可视化分析、机器学习、人工智能等,包括影像识别、语音识别、情感识别等。这是其他公司一时很难具备的。”

  拥抱众人的力量

  谷歌将机器学习、人工智能等技术开源,目的是结合众人的智慧,把AI技术应用于各种场景中。传统软件企业该怎么改变?SAS提出了开放。Oliver称,开放的含义是拥抱开源,有更强包容性,让客户使用不同开源技术开发的软件,都能与SAS平台整合起来。“这样的架构,拥抱了所有力量”。

  “开放理念还体现在云技术的延展上。”Oliver补充说。SAS在去年推出名为Viya的新平台,这是一个云就绪(Cloud Ready)产品。41年前,当SAS开始进行高性能分析时,一直开发针对大数据量、高性能的算法。2009年,随着业界向分布式计算转移的速度加快,SAS也学习如何将高级分析和数据管理从单台计算机扩展到多台机器的环境中。SAS Viya是这项努力的成果。

  “云是一个概念,而不是某个地方。”Oliver强调说。客户不用担心是哪一种云,他们可以在私有云、公有云或者混合云灵活运用数据分析平台。SAS大中华区总裁吴辅世先生透露,在中国,在公有云市场,SAS也正与阿里云、腾讯云、华为云探讨不同的合作。

  跨公司的抗癌药数据平台

  开发也意味数据能力的开发,这让数据能发挥价值。

  “现在业界比较纠结的是,他们不知道怎样将数据正确结合起来。比如,仅仅在一家公司内部,一个系统和另外一个系统有没有连接性,能不能兼容,就是公司面临的挑战。”Oliver说,“我们当然希望看到数据在不影响安全隐私的情况下,在更大范围中得到共享和传输,因为获得的数据越多,就越有助于分析。”

  “SAS有这样的数据管理产品,帮助跨平台的数据共享。”吴辅世说。SAS倡导数据为善(Data for Good), 参与公益组织独立非营利性行动计划Project Data Sphere项目。PDS平台为全球研究群体提供可以广泛共享、整合并分析过往病患层次第三阶段癌症对照组数据的空间,目标是推动未来研究,改善全球癌症患者及其家人的生活。SAS将利用预测建模、网格计算、高性能分析和数据可视化等技术对巨量数据进行处理,帮助研究者产生新的发现和信息。

  人人都是数据分析师

  在过去多年,如果说数据分析是少数专业人士的“练武之地”的话,今天越来越多的企业开始接受“人人都是数据分析师”的理念。海尔首席数据官表示,10年后,海尔将实现每位员工都是数据分析师的愿景。

  这也是为什么市场研究公司Gartner在其商业智能魔力四象限的最新评价体系中,更强调自助服务、自助数据准备和单用户应用环境。这也让SAS和其他一些老牌企业级数据分析企业离开了领导者象限。

  不过,SAS也很快做出改变。“我非常赞成‘人人都是数据分析师’的理念,因为我们处在一个‘分析经济’中,要营造一个以数据为中心,关注数据分析的氛围或文化。到今年秋季,这样的自助服务也会出现在我们的可视化分析平台上。”Oliver说,“这是一个逐渐演变的过程。我个人觉得还可以开发一些认知指导工具,来辅助数据分析师。它结合了认知计算、人工智能,效果更好。”

  在不久前的数博会期间,SAS与贵阳政府签订战略合作协议,成立大数据分析实训基地以及大数据金融量化实验室,将针对最新金融风险管理、整合型大金融风险管理的计量模型、预测模型做更多研究。

  伴随中国更多领域尝试数据分析,SAS在中国的业务重心也从银行、保险和电信进一步扩展到制造和政府市场。“我们正加大我们的投资力度。”吴辅世先生说。

  文/赵艳秋

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: