AI大模型对影像生产逻辑的影响
- 来源:网络视听 smarty:if $article.tag?>
- 关键字:AI,模型,影像 smarty:/if?>
- 发布时间:2024-07-06 19:40
文/张洪忠
所谓大模型,是指将海量数据导入具有亿量级参数的深度学习模型,由机器学习数据中蕴含的特征、结构,最终模型被训练成具有逻辑推理和分析能力的人工智能。简单地说,大模型具有人一样的对话能力,能够理解人的意思,根据对语言的理解、生成图像、视频等。目前,以ChatGPT为代表的大语言模型应用成为互联网空间新生态,开放域多轮对话与生成式技术突破带来传播研究新变化。我们从三个方面来看,首先是大模型的技术突破,其次是大模型如何改变影像的生产方式,最后是人类在这一过程中还能发挥怎样的作用。
一、大模型技术在人机关系中突破了什么?
大模型给我们带来了什么?大模型技术突破的核心在于语言处理能力的飞跃,像 ChatGPT 由单轮对话突破到多轮对话,这就是整个大语言模型带来的巨大技术突破。过去,人工智能在进行人机对话时,主要依赖匹配法,机器无法真正理解人类语言深层含义。例如,当询问机器是否了解成龙时,机器能够给出肯定回答,但进一步询问关于成龙的儿子时,机器便无法回应。这显示了机器在理解人类语言方面的局限性。
但是,当2022年年底ChatGPT出现以后,机器具备了交互能力,实现了多轮对话功能。这意味着机器有了类似人类的语言能力,人类文明发展的关键就是语言,这才是最核心的点。我们在2021年对语言处理技术进行过深入探讨时,当时很多人认为,对话是机器难以逾越的障碍。然而,ChatGPT的出现却让我们看到了机器在多人对话方面的巨大潜力。
大模型发展呈现多模态发展模式。多模态是指不同类型信息模式同时被利用,如文字、图像、声音等。过去,我们的传媒产业都是按单模态来布局,如今,大模型技术发展,Sora等平台出现,为我们带来了多模态发展的可能性。一个对话成为一个平台,这是影像生产、传媒变革的趋势,是单模态变为多模态的发展。大模型推动了跨语言发展。我们以前经常会提及“地球村”概念,但在互联网时代,不同语言之间是一个网络,如日语、阿拉伯语与汉语不是互通的,但是大模型会打破其边界,使全人类能够共同参与某一个内容的生产。这一变革意味着人工智能技术从简单模仿向更复杂、更全面的方向发展,从原本的鹦鹉学舌进化为真正具有语言和多模态能力的人类智慧。
二、 大模型时代的影像生产方式会发生什么变化?
大众时代是点到面的中心化传播,随后,我们进入了分布式网络结构,即社交媒体的网状形态,信息从A到B到C到D传递。进入大模型时代,我们再度回到中心化,即所有人通过大模型进行对话。在这一过程中,所有人生产的内容构成了大众生产的大模型内容。由于大模型基于无数人类的大数据生成,实质上是个体与大众的对话,也构成了一种新型人际关系。
大模型为我们带来了新的人际关系,人机对话变成了个体与众人的对话。首先,最为明显的变化体现在创意领域。个体创意已经不再是唯一,而是与机器、众人的创意相互交织。如之前所提及的案例所示,许多原本需要个体投入大量思考和创意的生产任务,现在可以由机器辅助甚至完全取代。无论是文本创作,还是视频制作,这种变革已经悄然发生。
其次是制作方式的改变,人的生产变为机器参与的生产。例如,在音乐方面,我们只要输入指令,便可通过机器自动生成作品。
第三是影像生产机制在发生改变,传统团队协作方式正在被个体行为所替代。我们以往要制作一部影片,需要有很多团队相互协作;现今,个体便能够独立完成这些工作,无须再依赖团队协作。这对整体影像产业产生巨大影响,有些工作或者工种有可能会被机器替代。在这样的转变之下,我们不得不思考:人在影像产业中还能扮演什么角色?
三、大模型时代下人类还能做什么?
在影像制作领域,我们发现其核心主要依赖人类的创意、构思与制作,这种生产方式,已经沿袭了数十年。然而,大模型时代,机器创意与机器制作已逐渐变为现实。那么,在这样的变革下,人类角色发生了怎样的转变?其实,无论技术怎么发展,它依然需要依靠人的想法和选择。这也为我们提供了一个巨大发展机会,那就是提示工程,这一领域需要大量的人力投入。例如,从去年开始,北师大传播学院就开始训练学生如何进行提示工程,如何在现有模型基础上开发新技术。这正是人类强项所在。我们可以根据自己的需求和创意来制定提示词,从而推动提示工程发展,所以“人的想法”很重要。
再就是人的选择,在创作大量图片时,个人审美和选择能力将直接影响作品质量。每个人的选择都是不同的,选择能力决定了作品的水平高低。在今后的工作中,在创意和生产环节中的工作逐渐被大模型分流和取代的情况下,我们将更加注重提示工程和审美选择工程的发展,以适应大模型时代的发展需求和挑战。同时,我们需要关注这一技术对社会、经济、文化等方面的影响,制定相应措施和政策,确保大模型技术健康发展。
(本文整理自2024年第十一届中国网络视听大会发言。作者张洪忠系北京师范大学新闻传播学院院长,北京师范大学新媒体传播研究中心主任、教授)