聆思CSK6 初上手低算力端侧AI 如何玩出新花样

来源:电脑报
关键字:AI,产品,开发板
发布时间:2024-07-27 14:19

　　Cloud

　　上期我们为大家简单介绍了端侧AI 目前的生态大环境，那么从本期开始，我们将从实际产品落地，看看目前的端侧AI 可以做些什么，尤其是我们选择的聆思CSK6 是一块算力并不算特别出色（NPU 算力128GOPS），主攻嵌入式物联网设备的AI 开发板，它的玩法基本就确立了未来端侧AI 的下限，也就是我们如果花最少的钱，能够买到怎样的端侧AI 产品。

　　TF卡预装开发环境，即开即用很友好

　　聆思CSK6 的基础套装就包含了一张8GB TF 卡，并预烧录了安装环境和几款基础应用固件，直接上电就能即开即用。这其实也是大多数AI 开发板目前的共性，因为现在的AI 开发实在太火爆了，很多从未接触过AI 开发的读者朋友都想要尝试学习，这种即开即用的方式可以让新手也第一时间体验AI开发板的乐趣。

　　聆思CSK6 预装了9 种离线AI 功能，换言之这就是目前官方最推荐的端侧AI 应用，包括坐姿检测功能、人脸识别功能、头肩检测和手势识别、语音合成、字母拼读、英文发音测评、拍照识物、鼾声检测和英中翻译等。

　　从功能上不难看出，聆思CSK6 开发板支持麦克风、扬声器和摄像头功能，同时还预装了一块2.8 英寸320×240 分辨率的触控屏。但整体的集成化设计做得比较一般，比如扬声器并没有固定在主板上，摄像头也是通过黏胶固定，而且也没有外壳可选，相对高价产品而言，封装设计比较原始。

　　端侧离线AI好玩但能力有限

　　接下来我们重点体验聆思CSK6 的这九大离线AI 功能，开机之后的第一感受就是屏幕素质较差，可视角度很小且颜色表现一般，但考虑到这只是一块入门级AI 开发板，且其终端产品大多数都不需要屏幕，所以这个问题其实不算严重。触控屏的灵敏度较高，预装的所有应用都需要长按启动，因为主板的闪存空间较小，所以应用在初次启动时都需要从TF 卡烧录到主板闪存中，如果你烧录并使用了A 应用之后想要切换到B 应用，就需要烧录B 应用，而在体验完B 应用又想切回A应用的话也需要重新烧录。

　　从预装的端侧AI 能力来看，聆思CSK6 的覆盖面相当广，但受制于较低的本地算力，它的体验其实并没有想象中的那么出色，以离线人脸识别为例，它的主要用途如人脸打卡、人脸门禁等功能，但聆思CSK6 的摄像头分辨率只有30 万像素，且帧率只有10fps 左右，这就意味着它的人脸标定功能有一些比较明显的限制，比如距离需要控制在1 米以内才能有效识别，否则会有较高的虚警率，虽然可以按K1 键录入人脸信息，但因为模型尺寸较小的关系，只能录入10 张人脸，在录入后按K2 可以进行人脸信息比对，比对通过后人脸识别方框会变成绿色，反之则变成红色。虽然UI 体验比较粗糙，但聆思CSK6 基本的离线人脸门禁功能体验是合格的。

　　不过，在其他的一些端侧AI 应用上就不一定能达到这个水平了，比如英文发音测评功能，它会根据麦克风拾取你的读音来进行评分，但问题是测试语句总共也就那么三四句，几乎没有实际应用价值。与之类似的还有离线英中翻译功能，它预设的几句随机英文虽然可以准确翻译，但当你自己输入英文，尤其是句式有一点点复杂的时候，就大概率会出现翻译错误，比如我让它翻译“you wanna it,come get it”，原本的意思是“你想要它，就来拿吧”，但它的翻译是“你们该认真考虑”，完全是风马牛不相及。

　　无独有偶，离线拍照识物功能虽然听起来很高大上，其实功能也非常有限，因为它的模型库非常小，只训练了100 多种物体的识别，如果你不看说明书拿起来就对着身边到处拍，就大概率会出现各种“指鹿为马”的无厘头错误，而且即便是按照它训练目标来进行识别，由于摄像头质量较差的原因，也有较高的概率胡说八道，比如我们拍摄的键盘，它就经常识别成别的东西，拍苹果又识别成橘子……实际的可用性并不高。

　　综合来看，聆思CSK6 因为主板闪存较小、NPU 算力较低的缘故，只能在端侧实现较低规模的模型部署，而且即便是在这种情况下的推理效果也很难达到理想水平。下期我们将会对其他的离线端侧AI 进行测试，同时为大家解读聆思CSK6的大模型SDK 获取和安装方法，看看我们能否挖掘出这块AI开发板的开发极限吧。

关注读览天下微信， 100万篇深度好文，等你来看……

立即购买本期杂志

查看本期更多内容