AI 大模型混战,中国云服务准备好了吗?

  • 来源:电脑报
  • 关键字:AI,模型,云服务
  • 发布时间:2024-03-02 21:17

  Cloud

  成本激增,算力抢滩难度颇高

  随着ChatGPT 引爆的人工智能大模型混战开打,算力之争也成为了各大头部企业争夺下一个“时代风口”的红海。所谓的人工智能大模型,也就是“大算力+ 强算法”结合的产物,通常是在大规模无标注数据上进行训练,学习出一种特征和规则,当需要具体的应用方向时,再将大模型进行微调,比如在特定任务上,进一步采用小规模有标注数据进行二次训练,当然,也可以不进行微调就直接参与多个应用场景。

  在这个过程中不难发现,算力是打造大模型生态的必备基础,一个优秀的算力底座在大模型的训练和推理上具备效率优势,而平台是大模型和算力之间的“桥梁”,可针对不同的模型和硬件实现资源的合理分配,达到软硬件的最优组合,从而大幅提升训练模型的效率。根据IDC的数据显示,国家计算力指数与GDP/ 数字经济的走势呈现出了显著的正相关,十五个重点国家的计算力指数平均每提高1 点,国家的数字经济和GDP 将分别增长 3.5‰和1.8‰,预计该趋势在2021-2025 年将继续保持,所以,算力优势对经济的拉动作用将变得更加显著。

  更重要的是,随着半导体短沟道效应以及量子隧穿效应带来的漏电、发热等问题愈发严重,摩尔定律已日趋放缓接近失效,人工智能训练算力需求增长与摩尔定律出现了严重的不匹配现象,这也将推动对算力基础设施需求的快速提升,而庞大的数据量以及算力决定了人工智能产业一定是典型的重资金产业:以GPT-3 模型消耗的算力3640 pfs-day 为例,若按照单个500 peta flops 算力中心项目总投资约30 亿元来计算,若想要保证ChatGPT的正常运行,则至少需要投入7~8 个数据中心,所产生的总成本超过200 亿元。为此,著名经济学家任泽平也提出了2023 年云计算行业将重新洗牌的观点。

  中国“四朵云”,AI时代反应各不相同

  在我国云计算市场,就是阿里云、华为云、腾讯云和百度智能云这“四朵云”占据了80% 的市场份额,考虑到人工智能对云计算算力的强需求性,它们也顺理成章地成为了大家心目中国产人工智能的举旗者。

  但事实上,这四大云服务商在内容方向上并不一致,阿里云主要是物联网和“云钉一体”;华为云则从政务云和私有云的角度起步;腾讯云则以直播为主打,提供SaaS 服务;而百度智能云走的是“云+AI”战略路线,主要在助力传统产业智能化转型方面发力。但它们的共同点就是主要的用户还停留在政商领域,而当ChatGPT显露了一把身手之后,相当一部分的中小企业或者是传统企业,甚至是个人用户,也将会参与到云计算市场中来。

  目前来看,阿里云是当前国内唯一实现盈利的云服务商,但它同样面对很多的问题,比如目前虽然在国内IaaS 领域市场份额第一,但IaaS 领域存在产品高度同质化的问题,毛利率也只有10%-15%,远低于SaaS行业内50% 以上的毛利率,再加上消费市场复苏不及预期、出口业下滑等因素,阿里云本身也并不轻松,所以拓展新领域就成了重中之重,这时候ChatGPT 的出现就顺理成章地为阿里云指出了方向,在AIGC 领域先是拿出了通义千问,后又低调地推出了文字生成视频的大模型,发展速度和效率都有目共睹。

  百度智能云虽然是“四朵云”里份额最小的,但是通过飞桨平台输出了文心大模型,在对话型人工智能、文生图等领域已经开始有所建树,虽然现在的功能水平还饱受诟病,但百度的前景在现有的人工智能发展线路下反倒是比较有优势的,以对话型人工智能为例,百度智能云在芯片、框架、模型、应用四层技术的布局上都有和ChatGPT 开发流程十分贴近的规模。

  而华为云则是在4 月25 日刚刚发布了全新的盘古大模型,虽然也涉及了自然语言处理,但初衷还是聚焦机器视觉,我们也采访了华为的相关人士,他表示华为内部的基本判断是短期内很难推出一个可以对标GPT 的产品,国内云服务厂商真正应该做的是商业化闭环内有个核心,也就是服务单一场景为主,这样成功率会比较高。

  因为混元大模型可能要在今年9 月才会发布,所以目前腾讯云的思路还是更倾向于上游,在4 月中旬发布了国内性能最强的大模型计算集群,采用最新一代腾讯云星星海自研服务器,国内首发搭载了英伟达最新的H800 GPU,覆盖人工智能训练/ 推理、渲染、科学计算三大方向,换个角度来说也可以理解为腾讯在大模型上是相对滞后的,但这种“兵马未动粮草先行”的思路确实也有后发优势,毕竟云计算的“下半场”刚刚开始,鹿死谁手还不得而知……

关注读览天下微信, 100万篇深度好文, 等你来看……