不止HBM,它也能为AI 加速

  • 来源:电脑报
  • 关键字:AI,物理,特性
  • 发布时间:2025-02-27 21:42

  ■ 之昂

  再论存算一体

  经过几次制裁,读者应该对HBM这个当前高算力AI 芯片的标配部件相当熟悉了,也应该听说过“内存墙”的存在。而有一种材料,由于其独特的物理特性与AI 计算需求深度契合,又能从另一条路径来提升AI 芯片的系统效率和能量利用率。

  现在可能会有人提出质疑, 最近大热的DeepSeek 能做到“ 低成本、高性能”是否意味着对于AI 的未来,算法比算力更重要?简单来说,DeepSeek 的成功并不意味着算力不重要,而是凸显出高质量数据的重要性。

  随着AI 应用的扩展和复杂性的增加,人人都能感受到数据传输效率和能耗方面的挑战也在随之增长,AI 芯片计算系统对效率和性能的需求有增无减。

  再说回来,AI 芯片通常需要高效的矩阵运算(如乘累加操作)、低功耗、高并行性以及快速的数据访问和处理, 但是传统的冯· 诺伊曼(vonNeumann) 架构将计算和存储分离的设计,导致数据的频繁传输不仅限制了系统的运行速度,还会造成额外的能量消耗,即数据在存储器和处理器之间的传输成为瓶颈。

  打个比方, 传统的中央处理器(CPU) 在设计上将计算和存储分离,这就像厨师在做菜时,需要不断地在冰箱、炉子和工作台之间来回走动,这种来回走动不仅浪费时间,还消耗大量的体力;同样地,数据在传统CPU 和存储器之间的频繁传输也增加了时间延迟和能量消耗,这被视为现代计算系统的一大挑战,也就是我们常说的“内存墙”和“功耗墙”。

  为解决这一问题,芯片厂商们想到了用“存算一体”技术。

  “存算一体”技术可以分为近存计算(PNM)、存内处理(PIM) 和存内计算(CIM)。近存计算主要是通过封装技术把计算和存储靠近,比如HBM 的2.5D/3D 堆叠, 就是这一路径;存内处理是指把计算单元嵌入存储芯片内部,减少数据搬运,比如SK 海力士的GDDR6-AiM;而存内计算则是直接在存储单元里进行计算,比如基于SRAM 或RRAM 的技术。

  总的来说,所谓“存算一体”就是要将计算单元直接集成到存储器中,尽量消除数据在处理器和存储器之间来回传输的过程,借此大幅提升计算效率和能量效率。就像是将所有的食材和工具都集中放在厨师伸手可及的范围内,使厨师可以更高效地完成烹饪,大幅提升了出菜的速度,这样的方法能加快AI处理资讯的速度,更及时地反应各类AI应用使用者的需求。

  而铁电材料就是在这个环节体现出自己的优势。

  铁电材料非铁

  “铁电材料”虽然带着“铁”字但其实和铁的特性并没有什么关系,而是指“ 铁电性(ferroelectricity)”, 它的特性也和电场有关。

  铁电材料是一种绝缘性功能材料,表面自带电荷,且有记忆功能。最显著的特性是它的自发极化,即在没有外加电场的情况下,材料内部的正负电荷中心会发生相对位移,形成电偶极矩,从而产生极化,成了一个个微小的“电池”;在外加电场的作用下,电荷可以重新排列,即使电场不再作用,排列后的电荷也会保持原状,类似于磁铁在磁场中被磁化后保留磁性,这也说明它是一种具有记忆性的材料,特别适合做存储器件。

  通俗解释,如果说普通材料是一群随便乱站的老百姓,那铁电材料就像一群听口令列队的士兵,即使口令停了,他们还能保持队形。其背后的原因是铁电材料的晶体结构变化特性,这点就不再深入了。

  另外还有个细节,给铁电材料施加电荷时,它的反应不是线性的,而是像弹簧被压到某个点突然弹开,这种特性叫“电滞回线”或“磁滞现象”,也就是极化强度会滞后于电场的变化,导致其在电场移除后仍能保持剩余极化。这种特性对于非易失性存储非常重要。之所以铁电材料会被视为能实现“存算一体”的“明日之星”,是因为它的另一种具体应用——铁电隧道结(FTJ)。

  FTJ 是基于铁电材料的纳米级电子器件,结构如同一个三明治,上下两侧是由金属电极组成,中间夹着一层极薄的铁电材料(通常为几纳米厚)。其核心原理是利用铁电材料的极化特性来控制电子的隧穿效应。

  我们可以利用铁电材料的极化特性,施加电场来改变铁电夹层的极化方向,不同的极化方向会造成FTJ 不同的电阻状态,透过区分高电阻和低电阻的状态就能被定义成记忆单元0和1。

  前文所述的“内存墙”问题,在这问题都不大,因为FTJ 的电阻状态可直接用于模拟计算。比如在交叉阵列中,输入电压与FTJ 的权重(电阻值)相乘,通过电流求和就能实现矩阵运算,省去了数据搬运。

  其他优势,一是FTJ 拥有非挥发性的特性,即使在电源关闭后,铁电材料的极化状态仍能保持不变,大幅增加数据存储的可靠性;二是铁电材料的极化切换速度极快,使FTJ 能够支援高速读写操作,满足AI 对即时数据处理的需求;三是在能耗方面,FTJ的低功耗特性有助于降低整体系统的能源消耗。

  另外,由于FTJ 结构简单,能实现高密度的数据存储,非常适合于需要大量数据存储空间的AI 应用或者数据处理环节。只不过铁电材料有这个潜力,却在材料制备成本和稳定性方面仍有挑战。

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: