技术普适，关键在于如何将其优化成好产品

来源:《第一财经》YiMagazine
关键字:优化,产品,技术
发布时间:2024-03-01 19:06

　　记者／张司钰编辑／倪妮美编／车玲玲

　　2023年，ChatGPT掀起了全球AI技术浪潮。这一轮技术创新不仅激发起创投圈的新热情，还让硅谷重新成为全球创新的焦点，同时也促使人们更加认真地思考技术与人类的关系。生成式AI领域逐渐形成了模型层和应用层的上下游结构。模型的发展和应用推动了整个行业的前进，改变了人们与技术的互动方式。

　　技术变革带来新机遇，大模型及其落地应用的赛道中不乏野心勃勃的创业者，猎豹移动的董事长兼CEO傅盛就是其中一位。2014年猎豹移动上市，两年后，傅盛创办猎户星空，专注于服务机器人的创新和发展。在二次创业的过程中，傅盛对大模型技术的潜力也有了越来越深刻的理解。Yi 2016年以来，AI技术，尤其是深度学习和大模型等领域经历了巨大变革。在猎户星空创立后这7年中，你的初衷和公司的发展方向是否发生过改变？

　　F我们的初衷始终是创新驱动，开发前沿产品。猎户星空的产品面临的挑战不小，尤其是在产品标准化、场景落地和市场认可方面。

　　去年我才感到市场开始慢慢接受这个产品，这一年，出现了两个重要的变化信号。首先，中小企业主开始为机器人买单，特别是经济型餐厅和酒店。考虑到餐厅的现金流通常很紧张，他们愿意为机器人投资，说明机器人的实用性和经济效益正在被认可。其次，海外市场开始开放，日本和韩国两个市场的发展最为显著，欧洲和美国也有许多代理商推广机器人的销售。海外市场的主要应用场景包括餐厅送餐服务，以及韩国一些教育局推行的小学机器人教育项目，日本还在养老院等场景中应用机器人。这些变化表明，机器人技术正在从依赖政府支持转向真正的市场化应用，且应用领域正在不断拓展。

　　Yi服务机器人是否一定要依赖大模型？还是说针对特定场景的中小型专用模型就足够了？

　　F大模型的定义实际上是技术局面的一个概念，指的是使用前所未有的参数数量和数据量来训练模型。从技术创新的角度来看，这样的模型结构是必要的，因为它能实现以往模型无法实现的功能，如对语义、逻辑的理解和推理能力。但在大模型的范畴内，究竟机器人是否需要千亿参数的大模型，这取决于具体应用场景和所需的技术能力。

　　我们也在训练行业特定的大模型，但并未投入到千亿参数级别的模型中。大模型的开发就像是企业试图创造一个爱因斯坦，涉及巨大的成本，包括训练和推理成本。在许多情况下，我们并不需要如爱因斯坦般聪明的复杂模型，有时一个本科生或专科生级别的模型就足够了，这正是百亿参数模型的机会所在。在机器人领域，几十亿参数的模型可能就足够应对陪伴、健康知识科普等特定任务。

　　我们确实需要大模型技术，但是我们正朝着使用垂直领域和小参数量的大模型的方向发展，以便使机器人能够真正高效地运行。

　　Yi大模型服务与过去公司为降本增效而投入的数字化、智能化应用有何区别？

　　F过去的数字化主要涉及建立各种系统，这些系统虽能展示大量信息，但每次业务变更都需要重写代码和重新适配，导致了大量工作和所谓的“数字孤岛”。业务变化意味着不断地调整系统效率提升并不显著。

　　有了大模型后，情况发生了变化。模型能够理解数据，当业务发生变化时，仅需调整提问或需求，模型就能自动适应，大大减少了适配工作量。就像从手动操作转变为拥有一个聪明的助理，他能根据业务变化自动调整数据，关注今天和明天的不同重点。这是大模型时代的一个重大进步。

　　Yi你怎么定义数字员工？

　　F员工的工作正在发生变化，人工智能和机器人不仅替代体力劳动，现在看来它们也能替代大量重复的脑力劳动。比如整理会议纪要、制作PPT，甚至编写部分代码，这些本不需要过于复杂的思考的任务，现在都能由机器完成。数字员工逐渐成为企业的标准配置，未来企业中一半以上的员工可能都是数字化的。

　　在硅谷，这种变化已经显现。以前硅谷的创业公司在获得投资后会用这些资金去聘请顶尖人才，而现在他们可能将一半的资金用于聘请人才，另一半用于购买专利和提高内部流程的效率。

　　Yi数字员工这个赛道已经有不少老玩家了，作为较晚切入这个赛道的公司，你认为如今数字员工前景如何？

　　F每次技术变革都可能使之前的积累变得不那么重要。例如，大模型技术的出现让所有人回到了同一起跑线，这就是颠覆式创新。

　　数字员工是一个广泛的概念，不同职位有不同需求，像GPT这样的模型并不能完全满足特定岗位比如法务或财务的需求。正如人类员工通过不同的教育和实践经验逐渐变得成熟一样，大模型也需要针对特定岗位调整和适配。未来，数字员工不仅仅是单一岗位，而是多个垂直领域的聚合。我们专注于做好几个擅长的领域，如云服务、实体机器人的讲解，以及服务领域的人机沟通。而在养老领域，与老年人的沟通就是一个巨大的市场机会。

　　Yi一些科学家认为，以GPT为代表的自然语言处理大模型并非人工智能的最终形态，最终目标可能是具身智能。你同意这种观点吗？所谓的多模态具身智能具体指什么？

　　F大模型目前只能听和说，未来，它应能看、能感知（比如温度和物理界限），并具备行走能力，可以在物理空间中自主活动，这将使它们产生更丰富的思维能力，类似于人类的感官体验。这种全面的具身智能，不仅仅限于文本处理，还包括视觉和其他感官信息的综合处理，背后模型的智能程度也将远超单一语言处理。

　　虽然大模型技术已经火热一整年了，但在自动驾驶等领域其进展并不显著，技术原理要在特定领域实现存在诸多挑战，如算力成本、使用成本和延时问题。现有的机器人在室内环境下表现良好，但将它们应用于更复杂的外部环境时，技术实现将更为复杂。因此，尽管具身智能的理念已明确，要实现这一目标仍需数年时间。

……

关注读览天下微信， 100万篇深度好文，等你来看……

立即购买本期杂志

查看本期更多内容