AI大模型对影像生产逻辑的影响

来源:网络视听
关键字:AI,模型,影像
发布时间:2024-07-06 19:40

　　文/张洪忠

　　所谓大模型，是指将海量数据导入具有亿量级参数的深度学习模型，由机器学习数据中蕴含的特征、结构，最终模型被训练成具有逻辑推理和分析能力的人工智能。简单地说，大模型具有人一样的对话能力，能够理解人的意思，根据对语言的理解、生成图像、视频等。目前，以ChatGPT为代表的大语言模型应用成为互联网空间新生态，开放域多轮对话与生成式技术突破带来传播研究新变化。我们从三个方面来看，首先是大模型的技术突破，其次是大模型如何改变影像的生产方式，最后是人类在这一过程中还能发挥怎样的作用。

　　一、大模型技术在人机关系中突破了什么？

　　大模型给我们带来了什么？大模型技术突破的核心在于语言处理能力的飞跃，像 ChatGPT 由单轮对话突破到多轮对话，这就是整个大语言模型带来的巨大技术突破。过去，人工智能在进行人机对话时，主要依赖匹配法，机器无法真正理解人类语言深层含义。例如，当询问机器是否了解成龙时，机器能够给出肯定回答，但进一步询问关于成龙的儿子时，机器便无法回应。这显示了机器在理解人类语言方面的局限性。

　　但是，当2022年年底ChatGPT出现以后，机器具备了交互能力，实现了多轮对话功能。这意味着机器有了类似人类的语言能力，人类文明发展的关键就是语言，这才是最核心的点。我们在2021年对语言处理技术进行过深入探讨时，当时很多人认为，对话是机器难以逾越的障碍。然而，ChatGPT的出现却让我们看到了机器在多人对话方面的巨大潜力。

　　大模型发展呈现多模态发展模式。多模态是指不同类型信息模式同时被利用，如文字、图像、声音等。过去，我们的传媒产业都是按单模态来布局，如今，大模型技术发展，Sora等平台出现，为我们带来了多模态发展的可能性。一个对话成为一个平台，这是影像生产、传媒变革的趋势，是单模态变为多模态的发展。大模型推动了跨语言发展。我们以前经常会提及“地球村”概念，但在互联网时代，不同语言之间是一个网络，如日语、阿拉伯语与汉语不是互通的，但是大模型会打破其边界，使全人类能够共同参与某一个内容的生产。这一变革意味着人工智能技术从简单模仿向更复杂、更全面的方向发展，从原本的鹦鹉学舌进化为真正具有语言和多模态能力的人类智慧。

　　二、大模型时代的影像生产方式会发生什么变化？

　　大众时代是点到面的中心化传播，随后，我们进入了分布式网络结构，即社交媒体的网状形态，信息从A到B到C到D传递。进入大模型时代，我们再度回到中心化，即所有人通过大模型进行对话。在这一过程中，所有人生产的内容构成了大众生产的大模型内容。由于大模型基于无数人类的大数据生成，实质上是个体与大众的对话，也构成了一种新型人际关系。

　　大模型为我们带来了新的人际关系，人机对话变成了个体与众人的对话。首先，最为明显的变化体现在创意领域。个体创意已经不再是唯一，而是与机器、众人的创意相互交织。如之前所提及的案例所示，许多原本需要个体投入大量思考和创意的生产任务，现在可以由机器辅助甚至完全取代。无论是文本创作，还是视频制作，这种变革已经悄然发生。

　　其次是制作方式的改变，人的生产变为机器参与的生产。例如，在音乐方面，我们只要输入指令，便可通过机器自动生成作品。

　　第三是影像生产机制在发生改变，传统团队协作方式正在被个体行为所替代。我们以往要制作一部影片，需要有很多团队相互协作；现今，个体便能够独立完成这些工作，无须再依赖团队协作。这对整体影像产业产生巨大影响，有些工作或者工种有可能会被机器替代。在这样的转变之下，我们不得不思考：人在影像产业中还能扮演什么角色？

　　三、大模型时代下人类还能做什么？

　　在影像制作领域，我们发现其核心主要依赖人类的创意、构思与制作，这种生产方式，已经沿袭了数十年。然而，大模型时代，机器创意与机器制作已逐渐变为现实。那么，在这样的变革下，人类角色发生了怎样的转变？其实，无论技术怎么发展，它依然需要依靠人的想法和选择。这也为我们提供了一个巨大发展机会，那就是提示工程，这一领域需要大量的人力投入。例如，从去年开始，北师大传播学院就开始训练学生如何进行提示工程，如何在现有模型基础上开发新技术。这正是人类强项所在。我们可以根据自己的需求和创意来制定提示词，从而推动提示工程发展，所以“人的想法”很重要。

　　再就是人的选择，在创作大量图片时，个人审美和选择能力将直接影响作品质量。每个人的选择都是不同的，选择能力决定了作品的水平高低。在今后的工作中，在创意和生产环节中的工作逐渐被大模型分流和取代的情况下，我们将更加注重提示工程和审美选择工程的发展，以适应大模型时代的发展需求和挑战。同时，我们需要关注这一技术对社会、经济、文化等方面的影响，制定相应措施和政策，确保大模型技术健康发展。

　　（本文整理自2024年第十一届中国网络视听大会发言。作者张洪忠系北京师范大学新闻传播学院院长，北京师范大学新媒体传播研究中心主任、教授）

关注读览天下微信， 100万篇深度好文，等你来看……

立即购买本期杂志

查看本期更多内容