近日,搜狗发布语音交互引擎“知音”,这项技术能够在用户说话的过程中对语音识别提供纠错功能,使人机交互在语音层面上更加自然。
在发布会现场,搜狗CTO杨洪涛介绍了“知音”引擎的几项特点。首先,“知音”解决了用户在说话过程中因语速过快而导致的吞音问题,语音识别错误率相对下降30%以上,语音识别速度提升3倍。
其次,“知音”能够在语音交互的过程中支持用户通过语音修正错误的识别结果,用户告诉“知音”引擎需要修改哪里,例如可以说:“把‘张’修改为立早‘章’,或者把‘张’修改为文章的‘章’。”
除此以外,“知音”还能够支持多轮对话,处理更加复杂的用户交互逻辑,从而提供更为便捷的人性化服务,比如用户说“我要去首都机场”,它会问“T1还是T2”,当用户确定航站楼后,它会问是“出发还是接人”。在语音识别这一领域,搜狗已经有多年的技术积累,依托搜索引擎和输入法积累了大量数据,这使得搜狗能够在智能语音领域寻得人工智能的突破口。几天前,搜狗发布了第二季度财报,财报显示其Q2收入达到11.5亿元,同比增长27%,而净利润为2.2亿元,同比增长30%。搜狗在第二季度积极布局人工智能领域,投资1.8亿元同清华大学建立“清华大学天工智能计算研究院”,将包含人工智能的前沿技术和研究成果应用到产品中,实现产学结合的发展方式。
智能语音交互是实现人工智能的重要方式,语音交互的效果影响到用户对于人工智能的体验,而对于其发展的前景来看,当前条件下还有许多限制,诸如使用环境、网络传输等问题。我们也希望看到智能语音领域和搜索领域的参与者能够秉持开放合作的态度,将语音交互这一人工智能的重要突破口应用在物联网、车联网等“互联网+”的各个场景中,实现跨平台的智能语音互联。
……
关注读览天下微信,
100万篇深度好文,
等你来看……