异构计算时代,数据中心里的英特尔软件生态活力

  • 来源:计算机世界
  • 关键字:英特尔,芯片,企业
  • 发布时间:2021-01-18 10:55

  2020 年是国内半导体企业发展的黄金时期,上至上市企业,下至初创公司,都能在时代大潮中找到自己的位置。英特尔是芯片产业绕不过去的话题,通过观察英特尔正在做的事情,芯片企业很大程度上可以补足短板,少走弯路。

  英特尔以芯片立业,现在软件正成为英特尔新的护城河。英特尔在软件领域的核心产品为oneAPI,这是一款支持异构计算的平台软件,可为CPU、GPU 和FPGA( 统称为 XPU)开发跨架构的应用程序,目前oneAPI 已经升级到Gold 版本。随着数据中心所容纳的硬件平台越来越多样,如何以软件激发硬件价值,这也是英特尔软件战略的出发点。

  “我们希望利用oneAPI 可以释放最大的硬件潜能,同时也使得我们软件生态当中的开发者,在软件方面的投资可以最大程度地复用,不需要绑定在单一的硬件架构以及制程上,并且我们的开发效率也可以得到最大化。”英特尔架构、图形和软件集团副总裁兼中国区总经理谢晓清表示。

  “过刚易折,过柔则靡”,芯片产业软硬一体的重要性,在异构计算时代被提升到前所未有的高度。

  one API,构建系统软件栈生态

  英特尔处理器涵盖了四大主要计算架构,包括CPU、 GPU、AI 以及FPGA, 不同平台在不同领域里各有所长。创业公司更倾向于选择专注一个硬件平台,做“小而美” 的生意,大公司应该做大公司的生意,所以英特尔选择做系统软件栈的生态圈。

  英特尔以CPU 为核心的软件生态圈已经十分成熟,在开源软件的各个层面都有很大的技术投入和技术储备,包括 Linux 的Kernel、KVM 虚拟化等社区,到目前为止,英特尔是全球最大的代码贡献者。

  英特尔首先坚持软件优先的策略,比如最新发布的 Xe GPU,其在图形、多媒体、英特尔在编程语言、系统库以及工具链方面已经有了非常强有力的生态支持,从图形和多媒体方面来看,英特尔在Windows 和Linux 的操作系统也有20 多年的积累。

  其次是易于扩展,GPU 细分市场非常多,不同市场有不同的价格、功耗、性能需求。英特尔希望能够最大限度得到所有GPU 开发者的支持。

  “为了得到更多开发者的支持,我们就需要覆盖不同的细分市场,这也是为什么我们现在已经建成的集成显卡生态非常重要,因为英特尔的集成显卡在某些领域每年都会有百万级的客户。这也是独立显卡和集成显卡所有的软件都具备兼容性的原因, 并且我们在最近的 ‘Tiger Lake’产品发布之后, oneAPI 软件也得到了生态圈里所有开发者非常好的评价和反馈。”谢晓清说道。

  最后是全新的计算负载和用户场景。英特尔的重点是发展新的计算负载和用户场景,而不是只关注已有场景。对英特尔这样的技术领先者而言,超前一步解决现有方案或者是产品还不太能够很好解决的问题,这是英特尔塑造产品差异性的机会。

  在oneAPI Gold版本中,英特尔提供了oneAPI 的编译器DPC++ 以及所有的系统库,同时也包括一系列支持 oneAPI 的工具包,包括移植、分析和调试工具包等等。这些工具包支持系统软件的各个层面,开发者可以用来调试和剖析自己的应用程序。

  当硬件更新换代时,开发者使用one API 不改动软件即可适配,同一份源码让开发者无缝、快速地升级到新一代硬件平台。“我们鼓励开发者花更多的时间在创新、开发和优化新的用户场景,而不是花大量的时间和精力维护现有的源码和投资。”谢晓清表示。

  言而总之,oneAPI 主要价值分为三方面,其一是提供一个非常友好的编程环境,使得开发者可以自由选择硬件平台,不必因为某一种语言绑定在某一个硬件平台;其二,英特尔提供的编译器、系统高度优化,可以实现最大的硬件价值,并且最优支持不同异构计算的硬件加速;其三,oneAPI 开发模式非常快速、高效,并且源码的维护成本可以达到最低。

  Analytics Zoo,AI 落地软件流水线

  人工智能脱虚向实,越来越多的应用已经落地到企业业务场景,从开发视角看,最大的挑战可能是如何将AI 算法应用到复杂的数据当中。

  英特尔大数据技术全球 CTO、大数据分析和人工智能创新院院长戴金权表示,企业客户面临着数据量大且数据来源复杂的难题,如何将AI 可以直接应用到大数据的生产环境中,能够让其无缝地进行大规模扩展,这是英特尔希望通过Analytics Zoo 等一系列组件实现的目标。

  Analytics Zoo 是英特尔开源的一个端到端的大数据 +AI 软件平台,构建在基于 oneAPI 的底层加速库或者底层优化框架之上,包括深度学习的框架、Python 库,分布式的数据处理像Spark、 Flink、Ray 等数据处理分析框架。

  据戴金权介绍, Analytics Zoo 大致可以分为三层,底层提供端到端的数据流水线的能力,能够帮助用户可以直接无缝地将AI 模型运行在其分布式大数据上;中间层是英特尔提供的机器学习工作流,目的是能够将很多人工的作业、人工的任务实现自动化;最上层是用户使用Analytics Zoo 构建的应用场景,大致可以分为四类,推荐系统、时间序列分析、计算机视觉以及自然语言处理。

  以汉堡王为例,在快餐推荐的场景下,用户实时的点餐行为和各种情景特征(比如时间、天气和位置等)都是能够被用来做合适推荐的重要因素。在汉堡王,英特尔利用 Analytics Zoo 提供的RayOnSpark 功能, 使用Ray、Apache Spark 和 Apache MXNet 构建了一个完整的端到端的推荐系统。

  它将数据处理( 使用 Spark )和分布式训练(使用 MXNet 和 Ray )集成到一个统一的数据分析和 AI 流水线中,并直接运行在存储数据的同一个大数据集群上。

  “整个工业界已经慢慢进入了人工智能的时代,但是今天所说的人工智能的基础是大数据,AI 和数据分析是我们将来非常重要的一个应用场景,特别是把AI 和数据分析应用到现实的生产系统当中,端到端的AI 流水线是非常重要的。英特尔在软件、硬件层面,都具备高可用的产品和方案。”戴金权表示。

  在异构计算时代的数据中心,英特尔的软件生态战略正在催发出硬件平台的最大生命力,可以预见,2021 年将有更多的芯片企业在软件层面做文章。

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: