低算力离线AI 的物联网应用体验

  • 来源:电脑报
  • 关键字:物联网,应用,体验
  • 发布时间:2024-08-02 16:33

  Cloud

  在上期内容中,我们详细测试了聆思CSK6 的几个关键离线AI 功能,比如英中翻译、拍照识图等,但这些离线AI因为模型实在太小,并不能达到理想的效果,顶多只是一个功能展示性的存在。不过,这些复杂功能本来就不是低算力离线AI 开发板的主打功能,作为低成本物联网AI 方案,像姿态识别、人脸识别等功能才是它发挥能力的“主战场”,那么,从具体表现来看,聆思CSK6 的物联网离线AI 性能如何呢?

  30万像素画质一般,人脸识别限制多

  对于大多数家庭、小型企业来说,人脸识别门禁、考勤、自助终端都是常用设备,这些设备的人脸识别机制比较简单,通过算法选取画面中分值最高的人脸,在图像中标定人脸边界框、头部姿态角度、人脸识别特征等数值,与此同时还可以保存人脸特征,支持将检测到的人脸特征值和本地存储的人脸特征值输入算法进行比对。

  对于聆思CSK6 来说,它预装的离线人脸识别模型比较小,所以只支持至多保存20 个人脸特征,在载入大模型之后,因为它只配备了30 万像素(640×480)的摄像头,所以画质只能说是“惨不忍睹”,而且帧率也比较低,对环境光照的要求很高。通过观察屏幕,可以在1 米左右的距离实时标注出人脸,并通过黄色方框进行标注,此时通过按压K1 键可以注册当前人脸特征,按K2 键即可进行人脸对比,对比通过,方框变成绿色,不通过则变成红色。通过将开发板连接至电脑并打开串口工具,可以直观查看到人脸识别输出结果,后续可以将此结果输出到门禁或打卡系统,就能完成离线人脸识别的工作。

  除此之外,聆思CSK6 还可以换装红外活体摄像头,但需要在PC 端使用专用工具,将开发板连接到PC 后单独烧录固件,过程只需要操作几下鼠标而已,非常简单。烧录完成后就可以和普通摄像头一样进行人脸识别了。

  从实际体验来看,聆思CSK6 无论普通摄像头还是活体检测摄像头,人脸识别功能做得并不太好,对距离要求很高且灵敏度较低,时常会出现无法正确识别人脸和特征库比对错误的情况。引发问题的根源是算力不足,无法使用较强的摄像头,也无法适配较强的模型,这也是当下离线人脸识别AI 硬件成本依然不低的原因之一。

  两大离线姿态识别功能无法同时使用

  聆思CSK6 有两个独立的姿态识别功能,其一是坐姿检测,其二是头肩检测和手势识别,因为都依赖摄像头运行,而它的摄像头效果又相对较差,所以体验的结果可想而知,并不会比人脸识别强到哪里去。

  不过从可玩性上来说,姿态识别要比人脸识别更有趣一些,在光线条件较好的情况下,坐姿识别可以比较快速地识别出人物的关键骨骼点并进行标注,实时显示该人物包含手、身体状态在内的坐姿检测结果,可用于教育平板、学习台灯等设备实现坐姿提醒功能。而头肩检测可以结合监控摄像云台,实时追踪人体位置,并通过手势识别来实现拍摄、截图等额外功能。根据我们的实际体验来看,在3 米左右,头肩跟踪和手势识别效率还不错,当然前提是光线条件较好,但坐姿识别则需要距离较近,大概在半米,所以这两个功能无法同时高效运转,这对于开发的最终产品来说是一个不利因素,以聆思CSK6预装的“在线大模型语音+ 坐姿”功能为例,这项功能会连接到讯飞星火在线大模型,可以使用关键词唤醒开发板进行在线的语音交互,同时检测用户坐姿,在坐姿异常时进行提醒,但无法同时开启头肩+ 手势识别功能,否则实用性可以更上一层楼。

  从下期开始,我们将会结合在线功能,更全面地体验聆思CSK6 AI 开发板,事实上这块低算力开发板的定位本来就是一个“入口”,为了更方便、更直观地让用户随时接入在线模型当中,端侧算力对它来说只需要满足比如语音唤醒等最基本的功能即可。如果你特别在意隐私问题,那么未来我们还会考虑采购端侧算力更强的型号来进行测试,敬请期待。

关注读览天下微信, 100万篇深度好文, 等你来看……