Jetson Orin Nano Super 来了,AI 开发板优势解析
- 来源:电脑报 smarty:if $article.tag?>
- 关键字:AI,优势,解析 smarty:/if?>
- 发布时间:2025-02-09 17:42
此前我们曾做过一个以AI 开发板为主题的系列文章,当时选择的是国产的聆思CSK6 开发套件,两百多元的价格和大量预装的边缘计算AI 应用,以及免费的在线星火大模型配套,让它很适合作为纯新手小白理解和学习AI 开发的第一个跳板。而事实上在AI 开发板领域,英伟达一直都是最重磅的角色之一,因为其CUDA 生态对AI 开发的先天优势,也让其触角可以延伸到边缘计算和嵌入式AI 的领域,所以在2019 年他们就推出了Jetson Nano 系列开发板,当时就直接板载了Maxwell 架构的GPU 核心并配置了4GB 内存,使其AI 推理性能在同类产品中一直处于领先位置,而就在2024 年12 月中旬,英伟达再次更新了Jetson Nano 系列,推出了全新的Jetson Orin Nano Super。那么,这个新的AI 开发板又有哪些看点与优势呢?
巴掌大小的机器人开发平台,最高67TOPS AI 算力
在Jetson Orin 产品线中,Nano是入门级的意思,而 Orin 是平台产品代号,上一代是 Xavier。它的开发者套件集成了散热器、外壳、I/O 接口等配置,可以实现开箱即用,特别适合学生或者实验室用途。
作为目前Jetson Orin Nano 系列的最强选手,Jetson Orin Nano Super的GPU 搭载了1024 个Ampere 架构CUDA 核心和32 个Tensor Core,运行在1020MHz 频率下,除此之外还有8GB 128bit LPDDR5 内存。这一系列规格使其INT8(八位整数)稀疏AI 算力峰值在25W 高功率模式下,可以达到67TOPS(每秒可执行67 万亿次操作),密集算力也能达到33TOPS。作为对比,此前我们测试的聆思CSK6 只有128GOPS(每秒可执行1280 亿次操作)的INT8 稀疏算力。
那么,具象化来说,这个参数能达到什么水平呢?简单而言,它采用了和大家可能更熟悉的RTX 30 系列显卡同架构的4 组GA106 核心, 而RTX 30系列的入门级产品RTX 3050 采用了10 组GA106 核心,再考虑到核心频率和显存规格的差距,Jetson Orin NanoSuper 的性能可以粗暴理解为RTX3050 的25%~30%。
这么听起来是不是感觉不咋的了?其实不然,开发板和显卡的应用方向不同。和此前的NX 系列一样,JetsonOrin Nano Super 的体形也非常小巧,只有成年男性巴掌大小,通过加装NVMe SSD、无线网卡、摄像头等组件, 结合ROS(Robot OperatingSystem,机器人操作系统),使其成为AI 机器人开发的专用迷你平台,你总不能给边缘设备装一台巨大的传统PC 吧?而且Jetson Orin Nano Super 只是Nano 这个系列下的最强, 在整个Jetson 产品线里还有工业级的JetsonAGX Orin模组,最高有64GB板载内存,GPU 稀疏算力峰值可以跑到250TOPS左右,不过成本也不是普通爱好者所能触及的了。
老型号刷机亦可变“Super”,本地推理性能可期
Jetson Orin Nano Super 的发布无疑是利好于整个边缘AI 开发行业,但对于此前才花大价钱购买了JetsonOrin Nano, 也就是没有“Super” 后缀的低频版玩家来说,不仅Super 版性能明显提升,价格还大幅下降(499 美元降到249 美元,官方建议售价2070元),被“背刺”得明明白白。但别着急,Jetson Orin Nano 和Jetson OrinNano Super 只是软件升级后带来的性能变化,硬件是完全一致的,所以完全可以通过刷机的形式,让Jetson OrinNano 也变“Super”。方法也比较简单,下载JetPack 6.1 系统镜像进行更新就能开启MAXN 模式,性能立马达到和Jetson Orin Nano Super 相同的水准。而且也别担心质保等问题,因为英伟达官方也明确表示这个方法可行,所以千万别重复投资了。如果是新手入坑,购买之前切记问清版本,认准官方配置不要买错。
根据实际测试来看,Jetson OrinNano Super 套件可以很好地运行8B 参数量的本地大语言模型和视觉语言模型,视觉Transformer 模型甚至还可以通过TensorRT 以FP16(16 位浮点)精度运行。
目前来看,在所有的AI 开发板里,Jetson Orin Nano Super 套件就是第一梯队的存在,可以执行实时图像分类、全高清目标检测等任务,通过量化、裁剪和分布式推理的方式还可以运行GPT-3 级别的大模型和本地文生图等AI 应用,同样也适合用于机器人开发,事实上早就有能人通过3D 打印技术制作了《星球大战》里的沙坑机器人模型,再利用Jetson Orin Nano 作为算力核心来控制伺服电机,实现了机器人四肢和头部移动,并通过实时摄像头数据分析,识别到主人信息后开启面部LED 灯效等多种控制,可玩性很强。而且这还是2023 年的玩法,如果刷机升级到Super版,玩法可能会更丰富。
