■ 中国工业报 银昕
在AI大模型技术日臻成熟之后,技术公司将版权属于其他公司的内容作为“语料”,“投喂”给AI模型,使其经过大量训练和自我学习之后变得更加“聪明”,已是寻常做法。所谓“语料”,是包括但不限于图片、视频、音乐和文章等所有类型的互联网信息;所谓“AI投喂”,是指将上述互联网内容输入给AI模型,供其自我学习和训练,不断优化其性能。
“AI‘投喂’现阶段最尴尬的问题是缺乏高质量的knowhow内容,一旦技术公司的触角伸向了这些内容,就会引来Knowhow内容持有者的极大反弹。”不久前,美国特拉华州法院在一起涉及AI“投喂”的案件中,将“投喂者”RossIntelligence公司使用检索平台WestLaw的内容作为训练内容,供AI强化学习的行为判定为侵权后,启洋科技负责人卫强对中国工业报如此评论AI产业的现状。卫强所称的Knowhow内容,是指各个行业的顶尖人才,掌握的心得和经验,包含丰富的关键技巧和切身体验,可谓“躬身入局”的秘传心法。
根据记者不完全统计,美国关于“AI投喂”的知识产权争议案件已有数起,这是第一例判决“投喂者”侵权的案件。
值得注意的是,作为在英语世界中较有权威的智能法律检索平台,WestLaw的功能不仅限于检索相关法律和法条,还能根据使用者的具体需求,检索出相关案件的文书,其中包括控辩双方的答语和辩词,这些细节对法律工作者来说尤为重要。“目前大多数智能检索系统,可以随意调取法律和法条内容,但如果检索者想知道如何去切入一个案件,如何获取关键证据,又如何找到最佳的辩护策略,检索系统便无能为力了。”卫强说。而此案中,正因为“投喂者”切入了含有控辩双方答辩词的knowhow内容,才引发了掌握knowhow内容者的强烈反弹。
随着侵权“第一案”的宣判,在AI领域的“投喂”边界,必将逐渐清晰起来。
“投喂”从一开始就很无序
“最重要的是我们不清楚边界在哪儿,如果要收费使用‘语料’,定价权就会完全掌握在唱片公司那边,整个行业就不存在了。”音乐行业从业者周亚平对中国工业报表示,目前电子音乐软件Suno已经拥有了很强大的“作曲”功能,当使用者输入一段指令之后,Suno一般都会表现不俗地创作出一段指令所要求风格的乐曲。
周亚平告诉记者,他目前已经开始部分使用Suno进行创作,特别是在他不熟悉又特别想使用的乐曲风格中,“如果我想创作一段民族曲风的前奏,但我确实不懂,就只好请Suno帮忙了。”周亚平说,他已经无法想象,一旦没有了Suno,这些需要“帮忙”的跨界创作将怎样完成。
以Suno为代表的音乐软件,之所以能完成指令下的创作,源于得到了“投喂”,技术公司将市面上公开的几乎所有流行音乐、摇滚和古典音乐都当做“语料”喂给了Suno。
然而,这场“投喂”不可避免地为Suno招来了官司。
2024年6月,索尼、环球和华纳三大唱片公司对音乐软件领域的两家公司Suno和Udio提起诉讼,指控两家公司未经许可便大规模地使用了三家唱片公司拥有版权的音频文件来训练AI模型。三家唱片公司的诉求有二:禁止Suno和Udio继续侵犯版权,并要求两家公司对已侵权行为进行赔偿,定价为每件作品15万美元(超过100万元人民币)。
如前文中卫强所说,AI“投喂”行为一旦遇到了巨大诉讼危机,一定源于掌握Knowhow内容者的反弹。随着Suno等音乐软件的不断完善,创作能力日益强大,传统工业时代的唱片公司感到了深深的危机。“Suno最终的目标,是要集合几乎所有人类音乐的风格、曲调,融合全球各种民间音乐和地域特色音乐,在这个集合之上再创作自己的音乐,这就大有替代人类的趋势。”周亚平对记者表示,早年间所谓“机器人只能替代人类左脑活动,而右脑活动无法替代”的说法,已经不复存在了,每每想到这些,他都“不寒而栗。”
然而,如果上述案件最终真的要Suno等公司按照唱片公司的定价进行赔偿,那无异于毁掉了AI音乐产业。“这也是我们不愿意看到的。”周亚平说。
AI界对“投喂”规则、底线以及所应付出的经济成本一无所知,而事关定价等具体的缺失,使行业都在“摸着石头过河”。
“中国同行应当高度重视这四个裁判规则”
早在2023年,中国就出台了针对生成式人工智能的暂行管理办法,其中明确提到了“投喂”与版权之间的关系:《生成式人工智能服务管理暂行办法》第七条对开展预训练、优化训练等训练数据处理活动做出要求——涉及知识产权的,不得侵害他人依法享有的知识产权。
北京市律师协会著作权法律专业委员会副主任赵虎对中国工业报表示,暂行办法虽然对知识产权提出了要求,但相应的行业规则并没有同步建立起来,AI“投喂”在国内还处于摸索阶段。“所以,美国WestLaw起诉RossIntelligence这个案件,法院所采用的裁判规则,应当被中国同行借鉴,并引以为警示。”赵虎说。
此案中的第一个裁判规则,是看“投喂者”有没有对“语料”所有者构成直接的对位竞争。很明显,RossIntelligence使用WestLaw的“语料”后,自己也生成了一个法律文书检索系统,同样可以根据指令检索有关的法律文书,包括控辩双方的答辩词,其功能和WestLaw完全相同,形成了直接竞品的关系,这最后成为了被认定侵权的重要权重。
其次,是“投喂”的目的,在技术性和商业性上,哪一个占比更大。根据被告方的辩词,RossIntelligence认为其“投喂”的目的是用于“技术研发”以及研发后的转话性,比如学术研究或公共数据库,但最终没有被采纳。赵虎告诉记者,合理使用的转化性需体现公共利益增值,而非单纯商业利益攫取。
第三个裁判规则是“框架性主体内容的使用”,即便“投喂”者没有逐字逐句地使用WestLaw的全部内容作为“语料”,但毕竟在摘要和法律术语上使用了“核心法律分析框架”,从而构成了对作品实质部分的使用。
最后,法律文书并非原生平台从无到有创作出来的内容,而是基于既定事实而汇编而成的“法律数据库”,被告方认为这类汇编内容并不属于创作内容,不足以享有与原创内容相当的法律地位。然而最终,法院认为“事实汇编”虽不属于原创内容,但并不影响Rossintelligence“投喂”行为构成侵权的大局。
赵虎认为,这四个裁判规则的权重不一,第一个和第二个规则的权重明显更大。“也就是说,今后如果谁利用AI‘投喂’,用侵犯对方知识产权的方式,创造出了一个与对方竞争的竞品,是肯定不行的;表面为了‘技术探索’,实际具有极大商业属性,也是绝对不行的。”赵虎认为,这两条规则对中国的AI同行也同样适用。
值得注意的是,这份判决书明确写明了此判例只适用于“非生成式人工智能”,也就是只适用于智能检索领域,拥有“创作”功能的生成式AI不在此列。
然而,中国政法大学传播法研究中心副主任朱巍认为,目前生成式AI和非生成式AI的界限正在变得模糊,此案对全行业的警示和示范作用绝不仅限于非生成式AI,“只要有‘投喂’行为,不论是不是生成式AI,都会受这个判例的影响,对‘投喂’行为画出的红线,在这个判例中已经比较清楚了。”朱巍说。
国内目前尚无侵权判例
“投喂”行为与知识产权的保护,也是国内AI界的热度话题,但一直尚未出现典型判例。
赵虎告诉记者,“投喂”本是一件悄无声息的事情。“投喂”者不会事先向掌握“语料”版权的公司申请授权,至今也没有如同RossIntelligence那样明目张胆地先“投喂”后推出竞品的公司,所以至今他在国内知识产权界还未听说有类似的案件。
启洋科技作为互联网营销公司,常常推荐客户使用AI翻译视频作为营销手段,所谓AI翻译视频,是将一种语言的人像视频,用AI模型翻译成另一种语言,人像中的口型也随之变化成另一种语言。这类模型要想实现不同口型之间的丝滑转换,就需要被“投喂”足够的人像视频和图片供其自我学习和训练。卫强告诉中国工业报,前段时间火爆视频网站的郭德纲用英语说相声的视频,就是此类模型的杰作,“值得庆幸的是,目前这类公司还没有遇到侵权诉讼,也可能是德云社也觉得这是仅供娱乐的一件好玩儿的事儿,既没有构成直接对位竞争关系,也没有多大商业规模。”卫强说。
朱巍认为,目前大多数国家的法学界所奉行的知识产权保护框架,是上一个时代的产物,其中对保护形态和保护类型的内容,其实是需要在智能时代更新升级的。作为对新技术采取相对鼓励且宽松政策的中国,反而有机会做到更加与时俱进。“我一直提议,应该利用区块链技术,构建一个版权使用库,‘投喂者’也不需提前向著作权权利人提出申请,而是直接进入库中使用作品就好,按照一定的价格以每次或每件为单位计费,版权方直接获得分成。”朱巍表示,目前知识产权保护的大趋势是更倾向于利于作品的传播和触达,不鼓励把作品锁进抽屉或束之高阁,“如果版权方对一部分作品就是不愿意拿出来分享,不把这些作品录入库中就行了。”
请输入验证码