技术普适,关键在于如何将其优化成好产品

  记者/张司钰编辑/倪妮美编/车玲玲

  2023年,ChatGPT掀起了全球AI技术浪潮。这一轮技术创新不仅激发起创投圈的新热情,还让硅谷重新成为全球创新的焦点,同时也促使人们更加认真地思考技术与人类的关系。生成式AI领域逐渐形成了模型层和应用层的上下游结构。模型的发展和应用推动了整个行业的前进,改变了人们与技术的互动方式。

  技术变革带来新机遇,大模型及其落地应用的赛道中不乏野心勃勃的创业者,猎豹移动的董事长兼CEO傅盛就是其中一位。2014年猎豹移动上市,两年后,傅盛创办猎户星空,专注于服务机器人的创新和发展。在二次创业的过程中,傅盛对大模型技术的潜力也有了越来越深刻的理解。Yi 2016年以来,AI技术,尤其是深度学习和大模型等领域经历了巨大变革。在猎户星空创立后这7年中,你的初衷和公司的发展方向是否发生过改变?

  F我们的初衷始终是创新驱动,开发前沿产品。猎户星空的产品面临的挑战不小,尤其是在产品标准化、场景落地和市场认可方面。

  去年我才感到市场开始慢慢接受这个产品,这一年,出现了两个重要的变化信号。首先,中小企业主开始为机器人买单,特别是经济型餐厅和酒店。考虑到餐厅的现金流通常很紧张,他们愿意为机器人投资,说明机器人的实用性和经济效益正在被认可。其次,海外市场开始开放,日本和韩国两个市场的发展最为显著,欧洲和美国也有许多代理商推广机器人的销售。海外市场的主要应用场景包括餐厅送餐服务,以及韩国一些教育局推行的小学机器人教育项目,日本还在养老院等场景中应用机器人。这些变化表明,机器人技术正在从依赖政府支持转向真正的市场化应用,且应用领域正在不断拓展。

  Yi服务机器人是否一定要依赖大模型?还是说针对特定场景的中小型专用模型就足够了?

  F大模型的定义实际上是技术局面的一个概念,指的是使用前所未有的参数数量和数据量来训练模型。从技术创新的角度来看,这样的模型结构是必要的,因为它能实现以往模型无法实现的功能,如对语义、逻辑的理解和推理能力。但在大模型的范畴内,究竟机器人是否需要千亿参数的大模型,这取决于具体应用场景和所需的技术能力。

  我们也在训练行业特定的大模型,但并未投入到千亿参数级别的模型中。大模型的开发就像是企业试图创造一个爱因斯坦,涉及巨大的成本,包括训练和推理成本。在许多情况下,我们并不需要如爱因斯坦般聪明的复杂模型,有时一个本科生或专科生级别的模型就足够了,这正是百亿参数模型的机会所在。在机器人领域,几十亿参数的模型可能就足够应对陪伴、健康知识科普等特定任务。

  我们确实需要大模型技术,但是我们正朝着使用垂直领域和小参数量的大模型的方向发展,以便使机器人能够真正高效地运行。

  Yi大模型服务与过去公司为降本增效而投入的数字化、智能化应用有何区别?

  F过去的数字化主要涉及建立各种系统,这些系统虽能展示大量信息,但每次业务变更都需要重写代码和重新适配,导致了大量工作和所谓的“数字孤岛”。业务变化意味着不断地调整系统效率提升并不显著。

  有了大模型后,情况发生了变化。模型能够理解数据,当业务发生变化时,仅需调整提问或需求,模型就能自动适应,大大减少了适配工作量。就像从手动操作转变为拥有一个聪明的助理,他能根据业务变化自动调整数据,关注今天和明天的不同重点。这是大模型时代的一个重大进步。

  Yi你怎么定义数字员工?

  F员工的工作正在发生变化,人工智能和机器人不仅替代体力劳动,现在看来它们也能替代大量重复的脑力劳动。比如整理会议纪要、制作PPT,甚至编写部分代码,这些本不需要过于复杂的思考的任务,现在都能由机器完成。数字员工逐渐成为企业的标准配置,未来企业中一半以上的员工可能都是数字化的。

  在硅谷,这种变化已经显现。以前硅谷的创业公司在获得投资后会用这些资金去聘请顶尖人才,而现在他们可能将一半的资金用于聘请人才,另一半用于购买专利和提高内部流程的效率。

  Yi数字员工这个赛道已经有不少老玩家了,作为较晚切入这个赛道的公司,你认为如今数字员工前景如何?

  F每次技术变革都可能使之前的积累变得不那么重要。例如,大模型技术的出现让所有人回到了同一起跑线,这就是颠覆式创新。

  数字员工是一个广泛的概念,不同职位有不同需求,像GPT这样的模型并不能完全满足特定岗位比如法务或财务的需求。正如人类员工通过不同的教育和实践经验逐渐变得成熟一样,大模型也需要针对特定岗位调整和适配。未来,数字员工不仅仅是单一岗位,而是多个垂直领域的聚合。我们专注于做好几个擅长的领域,如云服务、实体机器人的讲解,以及服务领域的人机沟通。而在养老领域,与老年人的沟通就是一个巨大的市场机会。

  Yi一些科学家认为,以GPT为代表的自然语言处理大模型并非人工智能的最终形态,最终目标可能是具身智能。你同意这种观点吗?所谓的多模态具身智能具体指什么?

  F大模型目前只能听和说,未来,它应能看、能感知(比如温度和物理界限),并具备行走能力,可以在物理空间中自主活动,这将使它们产生更丰富的思维能力,类似于人类的感官体验。这种全面的具身智能,不仅仅限于文本处理,还包括视觉和其他感官信息的综合处理,背后模型的智能程度也将远超单一语言处理。

  虽然大模型技术已经火热一整年了,但在自动驾驶等领域其进展并不显著,技术原理要在特定领域实现存在诸多挑战,如算力成本、使用成本和延时问题。现有的机器人在室内环境下表现良好,但将它们应用于更复杂的外部环境时,技术实现将更为复杂。因此,尽管具身智能的理念已明确,要实现这一目标仍需数年时间。

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: