美国地区法院裁定Anthropic使用版权书籍训练AI属于“合理使用”,为AI行业在版权诉讼中开创了先例,预示着AI训练数据的法律边界正被重塑。然而,法官同时强调创新并非盗版行为的通行证。此判决对全球AI产业的商业模式、内容生态及正在进行的版权争议具有深远影响,预示着一个法律与技术共振的新时代。
2025年6月23日,一纸裁决犹如一道闪电,划破了围绕人工智能(AI)训练数据版权归属的法律迷雾,并可能彻底重塑数字时代的知识产权图景。美国地区法官威廉•阿尔苏普(William Alsup)做出历史性裁定,支持估值高达615亿美元的AI新贵Anthropic,认定其使用受版权保护的书籍训练AI模型Claude的行为,在特定条件下,受到美国《版权法》中“合理使用”(fair use)原则的保护1。这是美国法院首次在此类AI版权诉讼中,将天平倾向于科技公司而非创意产业,无疑为AI行业的合法性探索注入了一剂强心针。
这一裁决的震撼力在于,它为OpenAI、Meta、微软、谷歌等一众深陷版权泥淖的AI巨头指明了潜在的出路。此前,人工智能公司与内容创作者之间的摩擦日益加剧,作家、艺术家和出版商们普遍指责AI模型未经授权使用他们的作品进行训练,构成“盗窃”。而AI公司则坚称,如果必须为每一项训练数据付费,高昂的交易成本将扼杀创新,甚至导致AI技术开发的停滞。阿尔苏普法官的判决,正是在这一激烈对峙中,为AI产业的商业模式和未来发展开辟了关键的法律空间。
值得注意的是,就在同一周(6月25日),另一位地方法官文斯·查布里亚(Vince Chhabria)也裁定Meta使用受版权保护书籍训练AI并未违法,理由是原告未能提供足够证据证明其使用行为造成了损害1。这些判决,加之此前美国版权局长因否认AI训练为“合理使用”而迅速被解职的事件,共同勾勒出美国AI版权法律正在经历的深刻转折,其影响波及互联网上的每一个人。
解构“合理使用”:法庭为何青睐AI训练
“合理使用”原则是美国版权法的核心概念,旨在平衡版权保护与公共利益。它允许在特定目的下(如批评、评论、新闻报道、教学、学术研究等),未经版权所有者许可使用受版权保护的材料。《版权法》第107条提供了四项考量因素,以确定特定使用是否构成合理使用。然而,将这些百年旧法应用于高速迭代的AI大模型训练,本身就是一场司法对技术本质的深刻诠释。
阿尔苏普法官在此案中对“合理使用”的解释,充满了对AI训练机制的洞察与类比:
- 训练等同于“人类阅读和写作”:法官认为,AI大模型的训练过程,与人类阅读、学习进而创作新事物的过程具有高度相似性。他强调,Anthropic的Claude模型借鉴作品并非为了复制或取代它们,而是为了“另辟蹊径,创造出不同的东西”1。这种“变革性使用”(transformative use)是合理使用认定的核心标准。如果作者不能阻止他人阅读其作品进行学习和创作,那么也不应阻止AI进行类似的学习。
- 内部性使用:尽管Anthropic是一家商业机构,并能从模型训练中获取商业利益,但法官特别区分了书籍使用的“内部性”与“外部性”。他指出,Anthropic并未制作新副本在外部分享或出售,而仅仅是用于其内部大模型的训练1。法官认为,Anthropic购买的印刷版书籍已销毁,数字替代品也未以其原始内容向外分发,这符合合理使用的标准。
- 合理必要性:原告方曾质疑Anthropic复制整个作品并使用数百万本书进行训练的量级是否超出了“合理必要”。对此,阿尔苏普法官裁定,“合理必要”并不意味着“严格必要”。他认为,即便使用较少的书籍也能训练出模型,但这并不妨碍Anthropic使用更多书籍来提升模型性能,甚至“使用任何一部作品来实际训练LLM都是合理的”1。
- 非竞争性替代:法官指出,AI的输出并非作家出版作品的“竞争性替代”。他认为,大量书籍用于训练特定大模型,本身并不会减少市场对作者作品的需求。即便有所减少,也并非《版权法》旨在关注的那种竞争性或创造性替代1。他进一步解释,版权法旨在促进原创作品创作,而非保护作者完全免受竞争。这意味着,AI模型基于学习产生的内容,与原作品的市场定位和功能存在本质差异。
盗版红线:创新并非免罪金牌
尽管阿尔苏普法官对AI训练的“合理使用”持开放态度,但他同时划定了一条清晰的红线:创新绝不能成为盗版的免罪金牌。
在Anthropic购买正版书籍进行训练之前,该公司曾下载了超过700万本盗版书籍。Anthropic试图辩称,即便这些盗版书籍只是用于构建数字图书馆或训练语料库,也应被视为“高度变革性的用途”,从而获得法律的正面评价。然而,法官对此予以坚决驳回。
阿尔苏普法官明确指出,盗版行为本身就是不可挽回的侵权。无论盗版书籍的最终用途如何,从法律性质上,它与购买正版书籍的行为截然不同1。他裁定,Anthropic复制并存储这些超过700万本的盗版书籍,严重侵犯了作者的版权,不构成合理使用。法院已下令于12月开庭审理,以确定Anthropic应承担的侵权赔偿金额,根据美国版权法,故意侵权最高可面临每部作品15万美元的法定赔偿1。
这一区分至关重要。它向整个AI行业发出了明确信号:虽然从受版权保护作品中学习可以被视为“合理使用”,但AI公司不能简单地从最容易获取的非法来源获取材料。这种裁决是在人工智能产业迅速扩张的背景下,美国法院急于区分合法变革性使用与超出创新范畴的纯粹抄袭的关键一步。它要求AI公司在获取训练数据时必须高度谨慎,确保其来源的合法性。
塑造未来:法律、创造与AI的十字路口
Anthropic的胜诉无疑对正在进行的数十起AI版权诉讼产生了巨大影响,其中不乏OpenAI、Meta、Midjourney和谷歌等行业巨头面临的案件。创作者与科技公司之间的旷日持久的法律战,正进入一个关键的转折点。虽然此次裁决并不能保证其他法官也会效仿,但它确实为法院在未来同类案件中站在科技公司一边奠定了基础。阿尔苏普法官在知识产权领域的丰富经验,尤其是他曾主持谷歌诉甲骨文案(Google v. Oracle)初审的经历,使得他的判决更具说服力和影响力。
与此同时,美国版权局正经历前所未有的动荡。2025年5月,在版权局发布了一份关于生成式AI训练和合理使用的报告后不久,其局长珀尔穆特被突然解职1。随之而来的,是版权局“出于谨慎”立即暂停了版权登记证书的发放,影响了约2万份登记。尽管此后恢复工作,但现在发出的登记证书上局长签名处却变成了空白,成为一份可被挑战的法律文件,版权局内部实际上处于“无人掌权”的局面。这种不确定性进一步加剧了AI版权领域的复杂性。
这场法律博弈的结果,将深刻影响数字信息生态系统的未来。如果AI公司能够普遍获得“合理使用”的授权,那么它们将能够以更低的成本、更快的速度开发出更强大的模型,推动技术进步。然而,这也将引发对创作者经济模式的深层次担忧。如果作品可以被自由地用于训练AI而不获得报酬,那么创作者的激励机制将受到冲击,可能导致原创内容的萎缩。
未来的挑战在于,如何在鼓励AI创新与保护创作者合法权益之间找到微妙的平衡。这不仅仅是法律问题,更是关于社会如何定义知识、创造力以及数字时代价值分配的哲学拷问。随着AI技术日益深入社会肌理,这一判决仅仅是漫长对话的开始,而非终点。