聆思CSK6 初上手低算力端侧AI 如何玩出新花样

  • 来源:电脑报
  • 关键字:AI,产品,开发板
  • 发布时间:2024-07-27 14:19

  Cloud

  上期我们为大家简单介绍了端侧AI 目前的生态大环境,那么从本期开始,我们将从实际产品落地,看看目前的端侧AI 可以做些什么,尤其是我们选择的聆思CSK6 是一块算力并不算特别出色(NPU 算力128GOPS),主攻嵌入式物联网设备的AI 开发板,它的玩法基本就确立了未来端侧AI 的下限,也就是我们如果花最少的钱,能够买到怎样的端侧AI 产品。

  TF卡预装开发环境,即开即用很友好

  聆思CSK6 的基础套装就包含了一张8GB TF 卡,并预烧录了安装环境和几款基础应用固件,直接上电就能即开即用。这其实也是大多数AI 开发板目前的共性,因为现在的AI 开发实在太火爆了,很多从未接触过AI 开发的读者朋友都想要尝试学习,这种即开即用的方式可以让新手也第一时间体验AI开发板的乐趣。

  聆思CSK6 预装了9 种离线AI 功能,换言之这就是目前官方最推荐的端侧AI 应用,包括坐姿检测功能、人脸识别功能、头肩检测和手势识别、语音合成、字母拼读、英文发音测评、拍照识物、鼾声检测和英中翻译等。

  从功能上不难看出,聆思CSK6 开发板支持麦克风、扬声器和摄像头功能,同时还预装了一块2.8 英寸320×240 分辨率的触控屏。但整体的集成化设计做得比较一般,比如扬声器并没有固定在主板上,摄像头也是通过黏胶固定,而且也没有外壳可选,相对高价产品而言,封装设计比较原始。

  端侧离线AI好玩但能力有限

  接下来我们重点体验聆思CSK6 的这九大离线AI 功能,开机之后的第一感受就是屏幕素质较差,可视角度很小且颜色表现一般,但考虑到这只是一块入门级AI 开发板,且其终端产品大多数都不需要屏幕,所以这个问题其实不算严重。触控屏的灵敏度较高,预装的所有应用都需要长按启动,因为主板的闪存空间较小,所以应用在初次启动时都需要从TF 卡烧录到主板闪存中,如果你烧录并使用了A 应用之后想要切换到B 应用,就需要烧录B 应用,而在体验完B 应用又想切回A应用的话也需要重新烧录。

  从预装的端侧AI 能力来看,聆思CSK6 的覆盖面相当广,但受制于较低的本地算力,它的体验其实并没有想象中的那么出色,以离线人脸识别为例,它的主要用途如人脸打卡、人脸门禁等功能,但聆思CSK6 的摄像头分辨率只有30 万像素,且帧率只有10fps 左右,这就意味着它的人脸标定功能有一些比较明显的限制,比如距离需要控制在1 米以内才能有效识别,否则会有较高的虚警率,虽然可以按K1 键录入人脸信息,但因为模型尺寸较小的关系,只能录入10 张人脸,在录入后按K2 可以进行人脸信息比对,比对通过后人脸识别方框会变成绿色,反之则变成红色。虽然UI 体验比较粗糙,但聆思CSK6 基本的离线人脸门禁功能体验是合格的。

  不过,在其他的一些端侧AI 应用上就不一定能达到这个水平了,比如英文发音测评功能,它会根据麦克风拾取你的读音来进行评分,但问题是测试语句总共也就那么三四句,几乎没有实际应用价值。与之类似的还有离线英中翻译功能,它预设的几句随机英文虽然可以准确翻译,但当你自己输入英文,尤其是句式有一点点复杂的时候,就大概率会出现翻译错误,比如我让它翻译“you wanna it,come get it”,原本的意思是“你想要它,就来拿吧”,但它的翻译是“你们该认真考虑”,完全是风马牛不相及。

  无独有偶,离线拍照识物功能虽然听起来很高大上,其实功能也非常有限,因为它的模型库非常小,只训练了100 多种物体的识别,如果你不看说明书拿起来就对着身边到处拍,就大概率会出现各种“指鹿为马”的无厘头错误,而且即便是按照它训练目标来进行识别,由于摄像头质量较差的原因,也有较高的概率胡说八道,比如我们拍摄的键盘,它就经常识别成别的东西,拍苹果又识别成橘子……实际的可用性并不高。

  综合来看,聆思CSK6 因为主板闪存较小、NPU 算力较低的缘故,只能在端侧实现较低规模的模型部署,而且即便是在这种情况下的推理效果也很难达到理想水平。下期我们将会对其他的离线端侧AI 进行测试,同时为大家解读聆思CSK6的大模型SDK 获取和安装方法,看看我们能否挖掘出这块AI开发板的开发极限吧。

关注读览天下微信, 100万篇深度好文, 等你来看……