以先进AI技术赋能智慧教育、智慧文娱新生态

  • 来源:网络视听
  • 关键字:AI,技术,赋能
  • 发布时间:2024-07-06 19:39

  文/尹学渊

  行者AI(成都潜在人工智能科技有限公司)作为产业界代表,从2020年创立以来,一直致力于用人工智能和机器学习技术提高文娱行业生产力,提供内容生产制作全生命周期解决方案。这些技术实践源自2013年成立的游戏公司。2016年,我们在游戏公司内部成立了人工智能实验室,开发了一系列“人工智能+内容创作”相关工具。随着技术不断成熟与应用拓展,我们决定将这些技术独立分拆,成立全新公司,以更专业的姿态服务于全行业。

  行者AI在AI+美术、AI+音乐等多元化领域不断探索,同时,我们进行AI+安全和AI智能体等应用场景的产品开发和服务,成果被广泛应用于大视听行业、文娱及教育领域,取得了显著的市场化成果。

  AI赋能提升视听领域生产力

  从产业角度出发,我们始终关注如何解决行业痛点。例如,在内容制作领域,长期存在一个“不可能三角”问题,即在追求高质量、高效率与低成本时,往往三者难以同时满足。无论是视频制作、短剧创作、文章撰写,还是绘画、音乐创作,这一难题都普遍存在。然而,随着AI 2.0和生成式AI技术的到来,我们可以同时实现高质量、高效率与低成本的内容创作,这无疑为我们带来了全新挑战和巨大机遇。

  对视听娱乐与教育领域来讲,机遇就是正在迎来一种全新形态,即多模态和互动式。尽管当前我们看到AI在绘画、音乐创作等领域的应用,但这些仍属于传统媒体形态。例如,利用AI生成一幅画作,尽管这在一定程度上提升了生产力并降低了生产成本,但它的本质没有变化。而我们希望能通过生产力的提升,创造与以前完全不同且无法想象的全新场景。这正是多模态和互动式所带来的可能性。

  行者AI团队始终围绕人工智能多模态这个理念进行实践。无论是视觉上的图片、视频,还是听觉上的音频生成(包括语音合成、歌唱合成)及智能体,都是我们关注与探索的重点。当我们完成了这些基础组件的构建,便能创造丰富多样的应用场景。智能化多模态的体验将为解决未来众多问题提供可能,特别是内容创作行业。例如,拍摄一部短剧的平均成本需要几十万元,这要求创作者和从业者迅速实现盈利,如果无法盈利就无法产生连续性。游戏、短剧、电影等行业均面临这一问题。为了快速回笼资金,许多创作者和从业者过于关注如何利用“人性”快速吸引观众,让他们迅速获得满足感,从而订阅或付费。这种趋势导致许多作品忽略了真正有价值的“真善美”元素。

  在追求经济效益的同时,行者AI团队始终坚守对“真善美”的追求。我们相信,只有平衡商业目标与艺术价值,才能创作真正有深度和影响力的作品。

  AI技术研发应精心调配

  从产业角度看,例如,在全球范围内有众多抑郁症患者,AI生成的新内容是否适宜这类群体,确实值得探讨和商榷。尽管如此,这类内容拥有巨大潜力,能够开启全新体验。其可以被应用于医疗、教育和宣传等方面,为人们带来美的体验,治愈心灵,陪伴成长。虽然这类内容在各类平台上的推广可能面临困难,广告购买意愿不高,盈利能力有限,但考虑其低成本和高价值,我们应给予更多重视。

  在我们的理念中,无论是从事美术创作、音乐制作,还是从事文本生成,抑或是进行智能体的研发,都希望从业者走在人工智能前面,学习AI,运用AI,驾驭AI,而绝非被AI所取代。在内容生产的每一个环节,我们都致力于使AI成为提升生产力的工具,而非替代人类的存在,生产力提升的最终目标仍是为人服务。

  在此前提下,我们必须强调三个核心概念,这些概念构成了玩具与工具的根本区别。首先是“可控性”,其次是“一致性”,最后是“高精度”。例如,在AI绘画领域,尽管AI能够绘制画作,但在完成作品后,其并未展现足够的实用性和稳定性。为此,我们开发了一款名为“行者丹炉”的产品。这个名称源于我们认为人工智能研发就像用丹炉“炼丹”一样,是一种自我调侃。在人工智能领域,研发过程指的是通过不断调整和优化算法参数,以获得更好模型效果。这与传说中的炼丹术有着异曲同工之妙,都需要经过精心调配和磨砺。

  通过我们的产品,用户可以训练属于自己的画风模型。从学术角度来看,这相当于一个模型训练器,它可以为用户创建独特画风提供支持,并通过“行者丹炉”将其转化为独一无二的模型。这样,AI就能够根据用户的画风进行创作,既保证了作品独特性,又避免了侵权问题发生。这正是我们所追求的可控性和一致性的体现。

  另外,AI写真作为一种先进技术应用,主要是针对个人脸部特征进行模型训练。一旦脸部模型训练完成,即可生成多样化的、属于个人的写真集,从而保证一致性和可控性。从高精度方面来看,AI已经可以生成16K超高清大图,属于工业化AI工具所应达成的标准,远超一般消费者级应用。据真实用户反馈,使用此技术,工作效率平均提升3至5倍,这便是AI技术在美术领域的独特价值。

  在AI音乐领域,我们秉持相同理念,即追求可控性、一致性和高精度。尽管Suno具备AI作曲功能,但在细节调整方面,仍存在局限。相比之下,我们的交互式创作工具支持对细节的精细调整。

  AI为产业发展带来无限可能

  我们研发的AI智能体,面向更高层次智能推理,如在电子竞技领域,AI智能体可以发挥强大陪练作用。在AI应用中,安全性至关重要。在利用AI创作丰富多样的内容时,如何确保这些内容的合规性成为亟待解决的问题。为此,我们遵循全球各地的法律法规,建立了各种审核标准。目前,我们支持22个国家和地区的语言,能够在全球范围内进行AI合规性审查,确保所创作的内容符合各项法律法规。

  我们在探索教育场景的应用时,把AI音乐跟我们的音乐学习结合起来,开启交互式沉浸式体验。例如,在音乐创作中包括写词、作曲、编曲、演唱等,创作手法和过程很复杂。利用AI技术,用户可以轻松地获得自动谱曲的服务,而我们则提供精细调整和优化。在这个过程中,AI会为用户提供创作模板,用户可以在此基础上二次创作,加入自己的独特元素。

  如果用户觉得某个部分不理想,AI能够重新生成,直至满足用户审美要求。这种实际应用场景在学校音乐创客教室中得到了充分体现。我们融合了大量音乐知识点,通过一边创作一边复盘的方式,帮助学生提升音乐创作能力。该系统曾连续被中央电视台报道,并在全国各地帮助众多学生学习音乐创作。此外,AI技术还能辅助师生进行实时沟通交流,提升互动体验。

  同样,我们的AI应用可以跟文旅结合,打造丰富多样的用户体验。例如,中国传统文化中的皮影,就可以用AI生成各种各样的风格,我们与中国皮影博物馆的合作项目便是这一点的生动体现,其中所有内容均由AI创作完成。

  何为交互式体验呢?比如,AI和皮影博物馆结合,当你进入博物馆时,可以使用AI技术拍摄自己的照片并生成自己的皮影形象。无论你走到哪里,皮影都会紧随其后,为你提供一种全新的探索寻宝体验。这种体验不仅更加有趣,并且每一次来访都会带给你全新感受。更为重要的是,我们的AI技术能够实时生成内容,不受任何限制,可以创造无限可能。

  (作者尹学渊系行者AI创始人兼CEO)

关注读览天下微信, 100万篇深度好文, 等你来看……