Anthropic 被控在歌词诉讼中引用人工智能“幻觉”
币圈网报道:
亚马逊支持的公司 人择的一名人工智能专家被指控在一份法庭文件中引用了一篇伪造的学术文章,该文件旨在为该公司辩护,反对该公司未经许可使用受版权保护的歌词训练其人工智能模型的指控。
该文件由 Anthropic 数据科学家 Olivia Chen 提交,是该公司对环球音乐集团、Concord、ABKCO 和其他主要出版商提起的 7500 万美元诉讼的法律回应的一部分。
这 出版商声称在 2023 年的诉讼中,Anthropic 非法使用了数百首歌曲的歌词来训练其 Claude 语言模型,其中包括碧昂丝、滚石乐队和海滩男孩的歌曲。
陈氏宣言引用了一篇文章美国统计学家旨在支持 Anthropic 的论点,即克劳德只在极少数特定条件下复制受版权保护的歌词,根据路透社 报告.
在周二于圣何塞举行的听证会上,原告律师马特·奥本海姆 (Matt Oppenheim) 称该引文是“完全捏造的”,但他表示,他不相信陈故意编造,只是她很可能使用克劳德本身来生成来源。
Anthropic 的律师 Sy Damle 告诉法庭,陈的错误似乎是错误引用,而不是捏造,同时批评原告在诉讼程序后期才提出这个问题。
每路透社美国地方法院法官苏珊·范库伦 (Susan van Keulen) 表示,这个问题“非常严重”,并指出“漏开传票和人工智能产生的幻觉之间存在着天壤之别”。
她拒绝了立即质询陈的请求,但命令 Anthropic 在周四之前正式回应这一指控。
Anthropic 没有立即回应解密请求评论。
法庭上的人类学
针对 Anthropic 的诉讼于 2023 年 10 月提起,原告指控 Anthropic 的 Claude 模型接受了大量受版权保护的歌词的训练,并根据需求进行复制。
他们要求赔偿损失、公开训练集并销毁侵权内容。
Anthropic 回应2024 年 1 月,否认其系统旨在输出受版权保护的歌词。
报告称,任何此类复制行为都是“罕见的错误”,并指责出版商没有提供任何证据证明普通用户遇到了侵权内容。
2024 年 8 月,该公司受到另一起诉讼这次是来自作家安德里亚·巴茨 (Andrea Bartz)、查尔斯·格雷伯 (Charles Graeber) 和柯克·华莱士·约翰逊 (Kirk Wallace Johnson),他们指责 Anthropic 使用盗版书籍训练克劳德。
GenAI 和版权
该案件是针对生成人工智能公司日益增长的强烈反对的一部分,这些公司被指控未经同意将受版权保护的材料输入训练数据集。
OpenAI 面临多重诉讼来自喜剧演员莎拉·西尔弗曼、作家协会和《纽约时报》指控该公司未经许可或授权使用受版权保护的书籍和文章来训练其 GPT 模型。
元被命名为类似的诉讼原告声称其 LLaMA 模型是使用来自盗版数据集的未经授权的文学作品进行训练的。
与此同时,今年 3 月,OpenAI 和谷歌敦促特朗普政府放松对人工智能训练的版权限制,并在即将出台的美国“人工智能行动计划”的正式提案中称其为创新的障碍。
在英国,一项允许人工智能公司在未经许可的情况下使用受版权保护作品的政府法案本周遭遇阻碍,此前上议院支持一项修正案要求人工智能公司披露其模型中使用的受版权保护的材料。