生成式AI生成物的版权风险及规制路径建构

来源:互联网周刊
关键字:ChatGPT,版权风险,规制路径
发布时间:2024-04-15 10:38

　　文/张淇1) 张潼2) 1）山西财经大学法学院 2）河南旬日建筑工程有限公司

　　摘要：生成式AI具有智慧性、泛用性和复杂性的综合技术特征，但也引发了一系列的版权风险。在本体论上，生成式AI生成物面临版权保护的牢笼困境；在外部性上，生成式AI生成物在数据挖掘、处理和传播的过程中较容易产生一系列的侵权风险。为此，要将生成式AI生成物视为作品，纳入版权保护的范畴，并且要通过“自律+他律”相结合的手段对版权风险加以规制。

　　关键词：生成式AI；ChatGPT；版权风险；规制路径

　　1. 越过奇点：生成式AI的技术特征与突破

　　一石激起千层浪，自2022年11月30日OpenAI公司发布ChatGPT（chat generative pre-trained transformer）以来，有关此类生成式AI在文本撰写、图像、视频生成、即时人机对话等功能的优越表现便广受业界和人们的关注。比尔·盖茨称赞ChatGPT与手机和互联网一样具有革命性意义。总体而言，以ChatGPT为代表的生成式AI具有以下特征。

　　（1）智慧性。生成式AI是借由大规模预训练语言模型所驱动的自然语言处理工具，通过综合运用算法、模型、指令程序等自动化程序，输出能够为自然人所直接识别阅读的文本、代码、图片、视频等多项内容，在内容处理和信息输出上更加具有智慧性。尤其是ChatGPT引入了人工操作的奖惩反馈机制（reinforcement learning form human feedback，RLHF），可以生成奖励模型（reward model，RM），以根据人工标注为传输的文本设置标量奖励，不断对ChatGPT算法进行反馈、训练和微调，最终使得ChatGPT实现类人化表达。这就相当于让算法模型在动态环境中根据一定的奖惩反馈而不断进化与自适应，从而在机能上渐次完备。

　　（2）泛用性。不同于传统AI只针对特殊领域的运用，ChatGPT实现了跨领域、破壁垒式的强运用。无论是轻松愉悦的人机沟通，还是专业度极高的文本、代码生成，ChatGPT都可以轻松完成。这也就意味着，ChatGPT用来运作所收集利用的数据集将不会仅局限于某个领域，而是来源于互联网的广阔数据库，甚至其又丰富拓展了数据的来源，用户与ChatGPT之间的沟通对话内容也将成为大模型喂养的重要“养分”。

　　（3）复杂性。客体上，与以往简单、单链条式的算法指令动作不同，以ChatGPT为代表的生成式AI融合了庞大的数据资源、层层嵌套的算法结构以及高耗能的算力支撑，一经算法设计师、投资者开发创造，即可“脱手”进行自我系统性工作，除特殊情况外，无须内部员工介入运行，从而导致难以第一时间采取针对措施解决问题。另外，生成式AI产品一旦构成侵权，其在责任主体的认定上也存在一定的复杂性，在固有的侵权责任主体语境下，目前有关采取何种侵权责任追究办法，以及责任最终归咎于何方，学界依旧有较大争议，生成式AI的设计师、投资者、运营者、使用者甚至用户都有可能成为潜在的追责主体[1]。

　　2. 成因解构：生成式AI生成物的多重版权风险

　　2.1 生成物版权权属争议风险

　　有关是否赋予人工智能生成物版权保护的争议由来已久，目前有三种主流观点：一是“否定说”，有学者认为人工智能生成物并不具备作品中所需的智力参与，因此不应当将其生成物认定为作品；二是“法人说”，认为可以参照《著作权法》中有关法人作品制度的规定，将人工智能开发设计者视为著作权人；三是“邻接权说”，认为人工智能生成物是在极少人类参与过程中创造的，其符合我国《著作权法》中有关邻接权客体独创性不足的特点[2]。以上三种观点在静止的、机械性的人工智能技术发展阶段具有一定的合理性，但生成式AI技术具有了初步的智慧性、泛用性和复杂性特征，因此，应当对其重新认识，重点把握生成式AI生成物在版权领域中的客体认定。

　　在当今ChatGPT等生成式AI技术正飞速发展的关键时期，我国不应当严苛地将生成物是否具有人格性视为认定作品的关键，其应当被视为作品。首先，ChatGPT生成物的产生并不能缺少用户的参与，其在目前也正是处于一种人类辅助的角色和定位，无论是照片、代码还是视频都掺杂着用户和使用者的主观选择，并不能脱离自然人的意识选择和指令。其次，ChatGPT生成物具有独特性。即使用户输入的指令完全一样，ChatGPT和文心一言等生成式AI也不会输出一模一样的作品，其输出机制具有灵活性。最后，在我国，已有支持人工智能生成物属于《著作权法》中所规定的作品的先例——在“腾讯诉网贷之家著作权侵权案”中，法院认为腾讯旗下的人工智能写作产品Dreamwriter所生成的新闻具有一定的“独创性”，因此受到著作权法的保护。

　　2.2 生成式AI生成物的负外部性风险

　　2.2.1 复制权侵权

　　生成式AI生成物侵犯复制权主要有两种途径：一是用户即时对话信息。根据OpenAI官网中的《使用条款》介绍，用户所输入的内容会默认成为算法模型训练的文本数据来源之一，但在实际运用过程中，不少用户的信息会在未知情的情况下被收集利用。例如，亚马逊的律师称其在ChatGPT中发现了与公司机密“非常相似”的文本内容，怀疑正是因为员工在使用ChatGPT生成代码或文本时，输入了公司内部有关的数据，而导致这些内容被训练库加以复制利用。二是来自未经授权的信息内容。此种一般是通过“爬虫”技术对广泛未授权的网络数据进行抓取，并进一步以数字化手段将非直接可读性的内容转译为可供数据库接收、利用的数字格式，从而产生复制权侵权情形。例如，2023年1月就发生了全球第一起有关人工智能生成物的侵权案件——盖蒂图片社（Getty Lmages）将Stability诉之于法庭，原因是其图片库里的“数百万非法加工图像”在未被告知的情况下被Stability复制粘贴于其旗下的Stable Difussion，同时另有三位艺术家也同样对Stability予以状告，认为它导致数以百万计的艺术家的版权被侵犯[3]。

　　2.2.2 改编权、汇编权侵权

　　我国《著作权法》[4]第十条对著作权所包括的人身权和财产权作了定义，其中第（十四）项、第（十六）项分别规定了改编权和汇编权。不可否认以ChatGPT为代表的生成式AI所形成的生成物具有一定的创造性，但究其根本ChatGPT是通过运用大模型计算排列组合所生成的产物，不能完全摆脱对原始材料和框架的依赖，并依靠海量数据库进行材料整合、重组和产出，所以其生成物大部分仍应当属于改编或汇编之物的范畴。然而，此类组合再创造的生成式AI作品却难以依照《著作权法》中的有关规定取得原作品权利人的知情同意，因为传统的单独授权模式在海量的产出中会产生较高成本，严重影响产品的运行效率。

　　2.2.3 信息网络传播权侵权

　　数字时代，以ChatGPT为代表的生成式AI可以通过互联网得到快速传播。我国《著作权法》第十条第（十二）项规定了信息网络传播权。ChatGPT、文心一言等生成式AI如果对元数据进行挖掘，并且在未得到原作品著作权人的授权同意时，也将侵犯其信息网络传播权。另外，我国对发行权的定义是“以出售或者赠与方式向公众提供作品的原件或者复制件的权利”。考量到ChatGPT只是出于商业利益的追求而对原件进行的使用和利用行为，并不意图占有原件，因此，在我国，生成式AI生成物较难被认定为对原件的发行权侵权。例如，在2019年“腾讯诉盈讯科技著作权”一案中，法院就判定盈讯科技公司因未经授权而公开传播了腾讯公司所开发的Dreamwriter软件所自动形成的一篇财经成果，从而侵害了原告腾讯公司所享有的信息网络传播权而不是发行权。

　　3. 规制手段：打造版权保护与风险预防的结合路径

　　应当注重对生成式AI生成物的版权保护，并搭建具体的准则路径，以防范其可能产生的负外部性风险。

　　3.1 确立对生成式AI生成物的版权保护方案

　　3.1.1 明晰并保护作者利益

　　生成式AI生成物具备作品的客观构成要素和外观，但并不意味着其可以成为作品的作者，这两个概念不能相混淆。虽然ChatGPT目前展现出了类人化特征，有着向智慧大脑进化的趋势，但就其当下的算法模型框架而言，还难以彻底摆脱“工具论”的范畴。因此，其并不能属于《著作权法》第十一条中所规定的“自然人作者”。又因生成式AI生成物的产生非法人组织意愿所招致的，因此其也不能成为“法人作者”。

　　此外，也不应当将生成式AI的设计者、开发者和投资者视为作者，而选择用户作为生成物AI生成物的著作权人更为合适。一是ChatGPT的独立运行已然具备了较强的自主性和随机创造性，设计者、开发者和投资者并不具备对任一生成物创造的任何主观指导意识，其可以考虑成为生成式AI机器人的著作权主体，但并不应当成为生成物作品的作者。相对应地，生成式AI使用者对生成物的创造具有实际上的智力贡献，能够通过下达指令来创造出指定物，其满足《著作权法》领域对于作者的相关要件规定。二是从利益分配的角度来看，ChatGPT的设计者、开发者和投资者对于人工智能产品已通过付费经济手段而对生成式AI获得了一定的著作权保护，如若再将版权利益加以其上，将会导致用户（使用者）丧失了可得、应得利益，进一步致使技术研发者与使用者主体之间的利益失衡，这将不利于生成式人工智能运用市场的长期繁荣与稳定[5]。综合以上原因，应当坚持“人在回路”的基本理念，将人类用户（使用者）设定为著作权人，享有因创作而产生的法律上的权益。

　　3.1.2 扩大合理使用范围的认定

　　合理使用制度能够在特定条件下充分发挥知识成果的使用和利用价值，从而更好地促进社会总成果的产出。一方面，我国《著作权法》第二十四条通过列举的方式规定了合理使用的12种情形，并在《著作权法实施条例》第二十一条规定了“属于法定合理使用情形—不影响作品正常使用—未损害著作权人合法利益”的“三步检测法”。但碍于该准则是司法活动中的辅助性裁决手段，且大陆法系国家法官有限的自由裁量权，将难以保证其作出合理判断。因此，建议法律明确规定生成式AI的合理数据挖掘行为属于合理使用的范畴。当然，仍应当坚持生成式AI对数据利用的合法、合理前提，对于在传播和输出阶段以纯商业营利性为目的行为予以排除处理。另一方面，在我国“三步检测法”的基础上，建议在立法中引入英美法系中的四要素做法，如《美国版权法》第107条有关合理使用的四要素规定：所使用的目的及性质、作品的本质属性、使用部分占原作品的重要比重、使用情形对市场需求变化的影响[6]。如此一来，一是可以对合理使用制度进行精细化的规定，二是虽然大陆法系国家法官并没有解释法律的能力和职权，但通过严格适用“三步检测法”和“四要素判断法”的法律规定，仍可以在最大程度上保障对合理使用范围的司法适用。

　　3.2 搭建自律与他律相结合的负外部性风险预防路径

　　3.2.1 加强生成式AI运营商的软法自治

　　首先，针对生成物的著作权权属问题争议，应当提前在用户使用协议中予以明确规定，并对重要的条款内容做重点标识，尽到应有的提示义务；其次，OpenAI等公司应当做好事前的版权合规工作，与明确的重点数据来源提供方之间尽早签订长期的授权使用协议，并定期评估和审查版权合规风险；最后，还应当在用户协议中预留专门的知识产权争议解决渠道，为潜在的、尚未取得授权许可的原数据持有方提供便捷、迅速的沟通协商路径。

　　3.2.2 补充司法和行政手段予以全过程规制

　　司法上，应进一步鼓励法官在法律允许的范围之内充分发挥自由裁量权，并充分遵循著作权法对于保护、促进知识成果交流的基本原则，对生成式AI在科研、文艺创作和教育教学方面的数据挖掘、利用和信息传播行为作出公正裁决。另外，在我国“叶根友诉无锡肯德基”一案中，法院裁决认为著作权人免费将“书库”上传网络且不限制其被使用的行为在实际上构成了“默示许可”[7]。但在司法实践中，“授权选择进入”机制仍是著作权法保护的主流做法，此种模式对生成式AI大数据挖掘运作而言明显成本过高。因此，建议在行政法规中针对生成式AI的数据挖掘行为引入具体的“默认许可”制度，即对于已线上公开共享的数据，除非权利人明确否认不可为生成式AI产品所利用以外，都应当默认其可以被生成式AI用于合理的开发和使用活动[8]。

　　结语

　　生成式AI的出现预示着人工智能技术取得了新的显著突破，具有了类人化思考运作的机制。一方面，生成式AI生成物具备了作品的形式外观，并且从关键要素来看，生成式AI生成物符合独创性的基本要求。因此，应当将生成式AI生成物纳入著作权法的保护范畴。同时，为预防生成式AI生成物免受不必要的版权风险，应当由“单独授权许可”制度逐步过渡到“选择退出”制度，从而促进大数据的加速利用。另一方面，为消减生成式AI生成物的负外部性风险，应当通过运营商自律及司法、行政他律的双重手段予以规制。

　　参考文献：

　　[1]令小雄,王鼎民,袁健.ChatGPT爆火后关于科技伦理及学术伦理的冷思考[J].新疆师范大学学报(哲学社会科学版),2023,44(4):123-136.

　　[2]詹爱岚,姜启.人工智能生成物的邻接权保护探析[J].浙江工业大学学报(社会科学版),2021,20(4):412-417.

　　[3]聂洪涛,马可可.生成式人工智能绘画侵权的样态分析与规制路径[J].行政与法,2023(12):86-98.

　　[4]中华人民共和国著作权法[EB/OL].(2021-03-09)[2023-03-02].https://www.ncac.gov.cn/chinacopyright/contents/12230/353795.shtml.

　　[5]张峣.人工智能生成成果的著作权法保护[J].河南工业大学学报(社会科学版),2022,38(6):73-80,97.

　　[6]宋伟锋.生成式AI传播范式：AI生成内容版权风险与规制建构——以全球首例AIGC侵权案为缘由[J].新闻界,2023(10):87-96.

　　[7]王国柱.著作权“选择退出”默示许可的制度解析与立法构造[J].当代法学,2015,29(3):106-112.

　　[8]郑飞,夏晨斌.生成式人工智能的著作权困境与制度应对——以ChatGPT和文心一言为例[J].科技与法律(中英文),2023(5):86-96.

　　作者简介：张淇，硕士研究生，研究方向：数字法学、人工智能法学。

关注读览天下微信， 100万篇深度好文，等你来看……

立即购买本期杂志

查看本期更多内容