DeepSeek改变了硅谷对AI的认知

  翻译/万志文

  一项人工智能突破给股市带来了冲击波,让硅谷巨头们感到不安,并引发了关于美国技术主导地位终结的大讨论。但与这项突破相关的论文标题却简单朴素,颇为学术—《通过强化学习激励大型语言模型的推理能力》。

  这篇长达22页的论文是一家名为DeepSeek的中国人工智能初创公司在1月22日发布的,最初并未引发太大关注。AI从业人员大多花了几天时间来消化论文的主张及其所描述的含义。该公司创建了一个名为DeepSeek-R1的AI模型,并声称他们仅使用了数量不多的二流AI芯片,以极低的成本便能匹敌领先的美国AI模型的性 能。

  DeepSeek表示,它是通过巧妙的工程设计弥补了计算能力的不足。一些行业观察人士最初对DeepSeek取得的突破表示难以置信。他们认为,DeepSeek肯定是通过某种作弊手段才取得R1的成果,或者捏造了数据,让模型看起来比实际情况更有吸引力。也许R1其实只是对美国AI模型的巧妙改版,并未代表什么真正的进 展。

  最后,随着越来越多的人深入研究DeepSeek-R1的细节—与市面上大多数领先的AI模型不同,它是以开源形式发布的,外界可以更仔细地探究它的内部运作—上述的怀疑逐渐转变成了担忧。

  1月下旬,当大量美国人开始亲自使用DeepSeek的模型,DeepSeek移动应用也登顶苹果App Store排行榜,恐慌情绪彻底爆发。

  我认为,该公司的小额经营成本可能被严重夸大了,但我确实认为,DeepSeek-R1的突破是真实的。DeepSeek论文中的发现,显然在挑战美国技术行业一直以来的几个主要假设。

  第一个假设是,要构建尖端的AI模型,就需要在性能强大的芯片和数据中心上投入巨额资金。

  这一信条在业界已经根深蒂固,怎么强调都不为过。微软、Meta、Google等公司已经斥资数百亿美元来建设它们认为构建和运行下一代AI模型所需的基础设施。OpenAI不久前宣布与甲骨文和软银成立的合资企业,投资高达5000亿美元。

  DeepSeek似乎仅花了上述公司投入的零头便训练出了R1。该公司声称,他们在训练上一代模型上花费了约550万美元。但是,即使R1的训练成本是DeepSeek所声称的数字的10倍,仍然比美国主流AI公司旗下最强大模型的开发成本要低好几个数量级。

  显然,我们得出的结论并不是美国的技术巨头在浪费金钱。一旦训练完成,强大的AI模型运行成本仍然很高。对OpenAI和Google这样的公司来说,投入数千亿美元仍然是合理的,通过能承受的高昂投入来保持行业领先地位也无可厚非。

  但是,DeepSeek在成本方面的突破对近年来推动人工智能军备竞赛的模型“越大越好”的说法提出了挑战。人工智能公司可能只需比以前想象的少得多的投资,就能训练出非常强大的模型。这也表明,我们可能很快就会看到大量资本涌入体量较小的人工智能初创公司。目前由于训练模型成本巨大,硅谷巨头面临的主要是彼此之间的竞争,未来它们面临的竞争将会更加激烈。

  硅谷人人都在关注DeepSeek,还有其他技术上的原因。该公司在论文中透露了一些关于R1实际构建过程的细节,包括模型蒸馏中的一些尖端技术:将AI大模型压缩成更小的模型以降低运行成本,性能却不会损失太多。DeepSeek还提供了一些细节,表明将一个“普通”的AI语言模型转换成一个更复杂的推理模型并不像之前想象的那么难,只需在其基础上应用“强化学习”技术即可。

  不必担心看不懂这些术语—重要的是,以前美国技术公司们严密保护的改进人工智能系统的方法现在已经在网上公开了,任何人都可以免费获取和复制。

  即使美国技术巨头的股价有所回升,DeepSeek的成功也会让市场对它们的长期人工智能战略产生不小的怀疑。比如,如果你是Meta—美国唯一将自家模型作为免费开源软件发布的技术巨头,还有什么能阻止DeepSeek或其他初创公司将你花费数十亿美元开发的模型,蒸馏提炼成更小、更便宜的模型,然后以极低的价格推向市场呢?

  多年来,许多美国的人工智能专家(以及听取他们意见的政策制定者)一直认为,美国在AI竞赛中至少领先了数年。现在,这样的地缘政治假设已经被削弱。美国公司所取得的突破,对于中国公司—至少是一家中国公司—来说,在几周内复制出来可能是非常容易的。

  DeepSeek的成果还提出了一些问题,即美国政府用于防止强大的人工智能芯片落入中国手中的出口管制是否如预期奏效呢?考虑到更有效的新型模型训练方式,这些法规是否需要调整?

  DeepSeek的用户已经注意到,这个模型经常拒绝回答有关敏感话题的问题。作为开源软件,如果其他开发者在DeepSeek模型的基础上开发,那么这类做法可能会逐渐蔓延至整个行 业。

  我还不确定DeepSeek的突破会产生怎样的全面影响,至少,这件事表明了围绕AI的军备竞赛已经真正打响,过去几年的进展令人眼花缭乱,未来还有更多令人惊讶的事情在等着我们。

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: