社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  aigc

“全球AIGC版权侵权首判”留下的三个问题

数据何规 • 1 年前 • 242 次点击  
生成式人工智能长期以来面临版权争议,一方面,此类人工智能的训练数据为文字、图片、视频等在传统上受版权保护的作品内容;另一方面,AIGC的文学艺术表现力愈发接近人类创作的水准。人工智能大模型的出现加剧了此类争议:在预训练阶段,大模型以无监督的方式广泛获取各类型的版权内容,高质量的内容还能在监督微调阶段激发模型能力,更强大的模型则能够在简单的指令下生成更为“逼真”的内容。不论是文本、图像甚至视频,大模型生成内容的能力都发展到了惊艳甚至让人惊讶的程度,也让历经技术变革的版权制度再次面临诸多挑战。
作为回应,北京互联网法院在2023年11月率先做出裁判,认定用户使用提示词通过扩散模型生成的图片受版权保护,也是我国首例由司法判定人工智能“文生图”受版权保护的案例。而在2024年2月8日,广州互联网法院率先回应AIGC版权侵权问题,实现了“全球首判”。
近期大洋彼岸纽约时报版权人等也以侵犯版权为由起诉OpenAI和微软,繁杂的证据、多样的诉求、巨额的赔偿要求引发了全球热议。相比之下,广互案案情比较简单。此案原告为奥特曼系列作品的版权独占授权人(版权人为日本圆谷制作株式会社),被告通过API接口调用大模型服务,用户通过输入提示词“生成奥特曼”即显示和奥特曼形象一致的图片,也可生成包含奥特曼局部特征或具有特殊风格(如插画风)的图片。
法院认定被告侵权,AIGC生成和奥特曼类似的图片构成违法“复制”,基于奥特曼元素的AIGC再创作构成违法“改编”。被告被判令要求停止生成侵权图片,即用户正常使用与奥特曼相关的提示词,不能生成与案涉奥特曼作品实质性相似的图片。因被告未实际进行模型训练,法院没有支持删除训练数据的诉求。在计算损害赔偿方面,判决认定被告存在过错,原因是被告未按照《生成式人工智能服务管理办法》要求建立投诉举报机制,未对潜在风险进行提示,缺乏对生成内容的显著标识,判令被告赔偿原告损失合计10000元。
判决虽然认定调用API接口生成实质性相似的图片侵犯了原作品版权人的复制权和改编权,但受限于被告并非模型训练者,而仅仅提供图片生成服务这一事实,判决留下了三个未解决的问题。
一、能否从合理使用角度回应AIGC技术带来的版权侵权挑战
法院从最终生成图片的结果“近似”推导出AIGC对原作品进行了“复制”,但扩散模型对原始图像的“还原”或“再现”与版权法长期以来禁止的直接“拷贝”式的复制差异明显。此外“改编”在传统版权法含义里指的是利用原作品进行的“再创作”,有先后的顺序之分,但在AIGC技术中并没有此类差别。对此法院并未回应AIGC技术带来的核心差异,以及此类技术是否构成合理使用(包括转换性使用)。目前大模型生成能力愈发强大,一方面在各类场景中用户期待模型能够生成更为逼真的图片,而另一方面AIGC侵犯版权的风险依然普遍存在,对于各方期待的通过合理使用制度进行平衡,本案并没讨论。
二、在生成内容侵犯版权的情况下是否应当删除训练数据
判决不支持删除训练数据的原因是被告为AIGC服务提供者而不是大模型开发者,不涉及模型训练。但是判决并没有直接否定删除训练数据的可能性,在判决中也强调提示词阻断不能完全消除侵权图片的生成。值得指出的是,采用此前数字内容平台版权保护常用的“侵权通知-删除”规则并不适用与大模型输出内容的管理。大模型训练数据规模庞大、来源多样,判断所有数据的版权合规性难度很大,而且大模型版本往往经过多次迭代,模型的使用基本脱离了原始训练数据,删除原始数据的手段并不能解决输出端的版权侵权问题。
三、AIGC服务提供者的版权注意义务为什么和人工智能合规责任相关
判决认定被告的“过错”时,援引的并非版权法的规定,而是认定被告没有按照《生成式人工智能服务管理暂行办法》建立投诉举报机制,未对潜在风险进行提示,缺乏对生成内容的显著标识,从而构成版权法意义上的“过错”。然而《暂行办法》核心在于要求提供者承担内容管理责任,保护用户的合法权益,其出发点并不是把提供者作为“平台”,要求其按照避风港规则处理版权人的保护请求。而从《深度合成服务管理规定》开始建立的人工智能生成内容水印和标识制度,也并未在本意上用于识别、追踪和保护版权作品。判决将版权注意义务和人工智能合规责任混同,其内在原因和适用边界还待进一步探讨
总体来看,大模型研发投入大、迭代快、竞争强,在多模态发展的关键阶段亟需稳定、可预期的制度环境,扩大模型数据供给,降低模型数据合规压力。本判例适用范围有限,也未能解决各方关注的大模型版权侵权中的核心问题。如何平衡用户对AIGC更准更真的实际需求和版权保护的要求,应当采取哪些更为合理的手段控制侵权内容生成,以及怎么界分AIGC服务提供者版权责任和其他合规义务,还期待进一步的探讨和澄清。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/167616
 
242 次点击