安霸:大算力芯片护航自动驾驶——访安霸总裁兼首席执行官王奉民&安霸中国区总经理冯羽涛
- 来源:国际汽车设计及制造 smarty:if $article.tag?>
- 关键字:自动驾驶,算力,芯片 smarty:/if?>
- 发布时间:2024-07-09 16:30
文/平萍
近年来,中国的车厂、Tier1和算法提供商以及芯片厂商等企业在技术以及前瞻性上进步得非常快,并且在总体水平上已经迈上了一个更高的台阶。应对智能驾驶技术的高速发展趋势,安霸推出了针对ADAS/自动驾驶全系解决方案,并在2024北京车展上精彩亮相。展会期间,安霸总裁兼首席执行官王奉民及安霸中国区总经理冯羽涛接受了包括荣格《国际汽车设计及制造》在内的多家媒体的采访。
大算力芯片护航,高等级自动驾驶加速到来
北京车展上,安霸带来两款针对中国市场的新芯片:CV3-AD655和CV3-AD635,定位于城市NOA和高速NOA,同时支持记忆行车,其AI处理硬件模块采用安霸自研的最新一代CVflow。“我们以技术和算法优先的理念来设计芯片。首先需要确保超高性能芯片在底层结构、软件和平台各个方面都达到最佳状态,因此先推出高性能芯片,随着市场的发展,逐步寻找其他准确的定位点,继而推出更具性价比的不同性能的产品。因为我们已经完成了高性能芯片的开发,再往下逐步降低成本并确定准确的市场定位就非常容易了,一旦我们确定了产品的定位,就能够快速推出产品。”冯羽涛介绍说。
安霸每年在车展都会推出新的芯片产品,最新的是和三一集团基于CV3达成了合作,实现新品商用车及专用车型上的技术验证和搭载,并实现首款合作车型于2025年量产落地。“我们一直持续不断和国内的主机厂和一级供应商密切沟通中,已有许多POC之类的项目,不久的将来我们也将和顶部的主机厂展开密切合作。”
CV3-AD685是一颗高端高算力的芯片,单芯片可以支持最多到24路摄像头,5个毫米波,3个激光雷达的传感器配置。其AI性能足以支持端到端的整个大模型自动驾驶,特别是对于深度学习算法,包括新型网络架构如Transformer,都有很好的支持。“对于L3和L4级别的应用来说,CV3-AD685绝对是不可或缺的。”王奉民总裁说。
安霸主要是以算法优先方式来设计芯片,但在自动驾驶软件层面更多地选择与合作伙伴合作。冯羽涛表示:“我们专注于芯片设计,而软件开发、大量数据获取以及大型神经网络模型的训练基本上都需要与合作伙伴配合完成。许多主机厂拥有自己的数据,而许多专门的算法公司也拥有自己的软件。因此,我们的主要任务是确保芯片性能足以支撑端到端的大模型能力,然后与合作伙伴合作,将其打造成完整的自动驾驶系统。”
据悉,通过与大陆集团进行软件开发合作,安霸能够为车厂提供L2+及L3级别的整体软件解决方案。并且已经在欧洲和美国地区为多款不同的L2+乘用车提供基于软件的解决方案。
城市NOA芯片,即CV3-AD655,其性能与CV3-AD685相当,但性能和成本都得到了进一步优化。其AI性能完全兼容,对于Transformer等神经网络的支持也非常良好。实时处理能力最多到12个摄像头,5个毫米波,3个激光雷达,并且具备数据闭环。尤其是整体功耗不超过30瓦,几乎不需水冷系统,采用5纳米车规制程,具备ASIL-B级别的功能安全。
王奉民表示,由于GPU芯片价格昂贵、耗电量大且性能不足,因此安霸的CV3-AD655芯片将成为中国市场上的第一个突破点。CV3-AD655足以满足当前低端市场的主流需求,“我们意识到,在低端市场,市场竞争将非常激烈;如果要真正向前迈进,就必须引入新的功能。AD655的AI性能与Orin X相当,但成本要低得多。无论是在芯片还是整个系统层面,AD655都具有更高的成本效益。我相信它将为市场带来最佳的性价比解决方案。”
CV3-AD635则是专为高速NOA和记忆行车设计的芯片,同时具备泊车等功能。它最多可支持7个摄像头和5个毫米波传感器,能够运行BEV+Transformer等现在流行的神经网络。其功耗更低,仅为10瓦左右。
此次车展,安霸还带来了基于CV3的中央域控4D成像雷达全向(360度)演示及实车展示。“中央域控4D成像雷达与我们在2021年收购的雷达算法公司傲酷(Oculii)有关。”冯羽涛说,“我们认为汽车自动驾驶中的视觉感知是最重要的传感器之一,因为人类驾驶员也主要依赖视觉来观察道路情况。而毫米波雷达也是一个必不可少的传感器单元,它可以全天候工作,不像视觉摄像头的可见光波段会受到雨雪雾等复杂天气条件的影响。”
结合傲酷的算法和软件能力以及安霸芯片的AI能力,采用CV3系列芯片做中央控制器,把所有的雷达和视觉摄像头的未经处理的数据全输入到中央进行处理。“我们在现场展示了这项技术的效果,它实际上能够超越激光雷达的效果,是一个非常优秀的方案。”冯羽涛表示。
王奉民补充说:“端到端和大模型正影响到汽车自动驾驶的方向,如果毫米波雷达无法与视觉摄像头信号进行融合,那么大规模的端到端AI就无法实现。端到端的AI必须将所有原始数据输入到一个中央域控芯片进行融合处理,才能实现端到端的处理。从这个角度来看,将所有传感器信号存储到CV3芯片上的域控制器,我们已经走在了技术前沿。我们是第一个提出这一概念的公司。”
LLM大模型推理开发平台
人们普遍谈论的端到端大模型在AI和自动驾驶领域的应用比较多,但真正落地需要哪些条件呢?对此,冯羽涛说:“首先,我们从芯片的角度提供了补充,证明了我们在性能和运行大型模型的能力方面是没有问题的。但是,要真正实现自动驾驶,还有很多其他方面需要考虑。例如,需要大量的数据。这要求车企拥有数百万辆车一直在路上积累数据,需要大量的数据进行模型训练。此外,选择哪种模型进行训练,各家也有不同的算法。还有底层芯片的平台。我们没有提供底层芯片,但结合我们之前在CV3系列中积累的许多车规级功能安全,希望能够与合作伙伴真正实现端到端的AI自动驾驶,而不仅仅是停留在宣传上。我们一直坚持以技术领先为根本,以算法优先的方式来设计芯片。”
王奉民补充说:“我们一直强调,要在终端设备上,如汽车上运行一个大型模型芯片,其功耗绝对不可能达到500瓦。因此,如何结合我们的优势在大型模型上,并在功耗方面形成优势是我们未来发展的重要方向。”
此外,王奉民认为,汽车需要解决特定的问题,因此其大模型不会那么复杂。“我们需要找到一个大模型,并基于这个模型使用与车辆自动驾驶相关的数据进行训练。尽管我无法确定这个模型的具体大小,但我认为30亿到70亿参数可能已经足够。要实现像ChatGPT这样的大模型,必须依赖云端和高性能的芯片,这是不可避免的。但是,要在汽车领域实现大模型,我们必须降低功耗,在终端车辆上使用风冷技术而不是水冷技术。因此,我认为安霸在这方面有很大的潜力。”
冯羽涛表示,像ChatGPT这类的中文版大型模型已经发布了很多,但其更多的是具有一定娱乐性质。然而,在汽车内部,更希望能够真正利用芯片实现一些不仅仅是娱乐方面的功能。有许多非常重要的原因使得用户需要一种在本地可以运行大型模型而无需联网的方案。这种方案的重要性将逐渐得到认可。
此外,安霸还带来了今年新推出的N1系列生成式AI芯片以及早前推出的CV72芯片上的多模态大模型推理演示。N1支持单颗芯片实现1至340亿参数多模态大模型推理,功耗低于50瓦,可提供完整的开发套件Cooper Max;CV72可实现30亿参数的多模态大模型推理,并且功耗在6瓦以下,可提供完整的开发套件Cooper Mini。
“我们的CV72实际上已经成功运行了一个30亿参数的模型。这个盒子的功耗会更低,价格也更具接受性。同时,它还支持高性能的视频处理,包括编解码。客户完全可以先使用这个盒子进行早期开发和评估,验证自己的模型,然后迅速推进量产。”冯羽涛说。
安霸的架构并不是通用处理器的架构,因此安霸开发了一套工具,可以帮助将原本在GPU上运行的AI模型快速转换成可以在其芯片上运行的模型。这套工具的开发始于安霸推出第一颗CV芯片,多年来已经成为一套完整且成熟的工具。“我们的许多合作伙伴都可以迅速地将他们自己的模型编译成可以在我们的芯片上运行的模型。”冯羽涛介绍说,“此外,我们还提供硬件平台和一套软件的SDK,其中包括我们已经转换过的开源神经网络模型,大约有九十几种,可以直接使用。因此,从软件到生态,我们不断努力简化,希望将任何合作伙伴将其AI网络转移到我们芯片上所需的精力降到最低。”
最后,在提到对于将来汽车发展方向的推测,安霸在智能化、安全性、可靠性等方面的发展时,王奉民表示:“我们必须在所有方面都做好布局,尤其是我们将业务从国外引入国内后。首先是安全性,CV3系列产品都经过了严格的安全验证,无论是芯片还是软件,安全验证都是我们的首要任务;同时,我们也关注性能,CV3系列产品不是一蹴而就的,而是经过了三四年的规划、预研和软件开发。在这段时间里,我们的目标始终如一:为所有客户提供适用于低、中、高端的CV3芯片解决方案。无论客户需要什么,从最具性价比的CV72AQ单芯片行泊一体,到高速NOA和城市NOA,再到L3、L4,我们都能提供性价比优异的芯片。这也是我们一直以来想要实现也可以实现的目标。”
