生成式人工智能将如何改变视频会议
- 来源:信息化视听 smarty:if $article.tag?>
- 关键字:人工智能,视频,会议 smarty:/if?>
- 发布时间:2024-07-19 21:43
虽然视频会议已成为主流,但仍未能复制面对面互动的真实社交体验。然而生成式人工智能(GenAI)技术取得的长足进展,为迄今困扰视频混合会议的许多问题提供了解决方案。
毫无疑问,GenAI会使视频会议更具效率和吸引力,能够虚拟模仿现实生活中的体验。但为了实现这一目标,这些功能需要以最小的延迟和实惠的价格实时提供。这意味着其中一些AI功能必须在连接的端点上可用。
幸运的是, 解决方案提供商正在迅速将GenAI集成到视频会议平台和计算机中,以实现实时优化、虚拟增强和自动化会议管理。这些发展为显著增强客户混合和虚拟会议体验铺平了道路。
面对面会议体验
GenAI可以显著增强虚拟会议的视频、音频和文本体验。在面对面和远程参与者的混合会议中,由AI提供支持的智能视频处理可以让远程参与者放大演讲者,复制面对面会议的体验,而不只是播放整个会议室的镜头画面。
神经辐射场(NeRF)或类似技术可以帮助创建远程参与者侧面的视图,动态改变每个端点的视角。然后,GenAI将其转换为一致的视图,以统一的尺寸、姿势或风格显示所有参与者,以形成身临其境的体验。此外,如果会议室中有白板,人工智能可以自动检测到它,并且书面文本可以转换为可编辑的格式。此外,也可以创建个人版本用于记笔记。
GenAI 还可以通过音频和文本为每位会议参与者(无论是远程的还是面对面的)提供帮助,以最大限度地提高他们的工作效率。该助手可将音频转换为文本,以创建会议摘要,甚至会建议参会者做出相关响应。对于多语言团队来说,在这样一个可以提供即时音频翻译的助手的帮助下,语言障碍可以得到缓解。
尽管存在几乎无限的可能性,但当今的GenAI受到实现它的技术的限制,如果只是通过云端进行服务,则不足以发挥它的强大作用。
扩展能力
为了让 GenAI 充分发挥其在视频会议中的潜力,视频会议系统应该能够在端点本身(无论是在个人计算机还是会议网关设备上)执行 GenAI 处理,而无需返回云端进行处理。
会议系统是否强大的关键指标之一是其扩展能力。当谈到可扩展性时,需要明确区分哪些情况适合集中处理,哪些情况适合边缘处理,这很重要。
在以下三种情况下,在中心点进行集中处理是适合的:
1.分时
当需要轻量级服务时,可以交由中央计算机处理。中央计算机只需其性能容量的一小部分即可轻松处理完毕,例如参与者进入房间或取消麦克风静音时发出警报,中央计算机可以为所有端点提供这些服务,不会对使用体验产生影响。
2.资源共享
当具有所有端点通用的处理功能时,例如在共享数据库上搜索。这种情况下,集中共享处理可重复用于许多或所有端点。
3.信息共享
当所有参与者需要共享相同的信息时。例如,共享白板。
这三种情况适合集中处理,此外的绝大多数情况更适合边缘处理。因此为了构建可扩展的视频会议系统,使所有参与者都可以使用这些功能,需要将AI功能分布到下游,为不同的节点配备适当的AI计算能力。
这将带来多种好处,例如:
● 延迟——在虚拟会议中,无论是实时翻译、内容创建还是视频调整,即时结果对于流畅的交互都是必不可少的。在边缘设备上利用GenAI减少延迟,确保流畅的讨论和无缝的用户体验,而不会出现延迟。
● 费用—— 对于许多组织来说,每月订阅基于云的GenAI工具的成本可能令人生畏。借助满足各种用户需求(如聊天、搜索引擎和图像/视频创建)的众多工具,每个用户每月的成本可能会迅速增加数百美元,从而进一步增加预算。通过将GenAI迁移到用户的个人计算机或会议设备,用户无需每月订阅或长期承诺即可成为工具的所有者,从而提供更可行的解决方案。
● 带宽和连接性—— 虚拟会议经常受到带宽短缺的影响,尤其是当参与者的互联网连接有限时,例如在旅行期间或在偏远地区。基于边缘的GenAI可以在本地去除不相关的信息,保证只传输相关和重要的数据,并实现不间断和富有成效的会议。
● 环境影响—— 基于云的人工智能处理的影响不容小觑,在此过程中会产生大量的能源消耗和污染。卡内基梅隆大学(Carnegie Mellon University)和Hugging Face公司的研究人员测量了不同机器学习任务的碳足迹。他们的研究结果表明,涉及生成新内容的人工智能任务,如文本生成、摘要、图像标题和图像生成,是最耗能的。研究结果表明,最耗能的人工智能模型,如Stability AI的StableDiffusion XL,每次产生近1,600克二氧化碳,这与驾驶汽油动力汽车行驶四英里对环境的影响大致相同。
边缘设备为GenAI提供了更可持续的选择,消耗更少的功耗,最大限度地减少冷却要求,并减少碳足迹,从而有助于实现更环保的 AI 会议方式。
GenAI时代的视频会议
今后,AV集成商和设计人员将能够安装具备越来越强大GenAI功能的视频会议系统。这些在边缘设备上进行人工智能处理的视频会议系统,可以在云中完成部分工作,同时在笔记本电脑、会议室设备和摄像头等设备上实现更为丰富的各项功能和体验,确保会议以可承受的成本顺利进行,生成的内容(如自动摘要或动态演示)更加安全。总之,GenAI会让视频会议更加真实、高效、安全、可靠。