2026年3月,一场牵动全球科技与版权领域的诉讼悄然打响——拥有近260年历史的《大英百科全书》及其旗下子公司韦氏词典,正式将微软支持的OpenAI告上美国曼哈顿联邦法院。诉状中,那句隐含的质问振聋发聩:“AI生成的答案源自我们的原创内容,凭什么抹去出处、署上自己的名字,还分流我们的用户与收益?”这场诉讼看似是一次普通的版权维权,实则跳出了过往AI训练数据侵权的窠臼,直指生成式AI最核心的合规痛点,成为划分AI行业版权边界的标志性事件。
这场诉讼的爆发并非偶然,而是权威内容方与AI科技巨头长期矛盾的集中爆发。作为人类知识传播史上的标杆,《大英百科全书》自1768年诞生以来,始终以专业、严谨的内容编撰立足,历经纸质时代到数字时代的转型,如今依靠高质量在线内容订阅和教育机构授权维持运营,其每一篇词条、每一段释义都经过专业编辑的反复核查与打磨,背后是高昂的创作与维护成本。而韦氏词典作为美国最权威的英语词典品牌,其在线版每月拥有数千万访问量,同样以精准、规范的释义构建起品牌护城河。这两家“知识老字号”的核心资产,正是那些经过系统化整理、具有独特表述逻辑的结构化知识内容——而这恰恰成为了OpenAI训练大模型的“免费原材料”。
根据双方提交的诉状及外媒披露,本次诉讼的核心指控聚焦于三大层面,每一项都直击OpenAI的合规软肋。其一,非法复制与训练侵权。大英百科指控OpenAI未经任何许可,擅自抓取其近10万篇在线文章、百科词条及韦氏词典条目,用于ChatGPT等人工智能模型的训练及检索增强生成(RAG),这种行为直接侵犯了其著作权。其二,输出端的实质性替代。与以往多数聚焦“训练阶段侵权”的诉讼不同,本次大英百科明确指出,ChatGPT在特定提示下,会输出与大英百科原文“几乎逐字相同”的内容,甚至直接照搬韦氏词典的词条定义,这种行为彻底斩断了用户访问原网站的路径,分流了官网流量,“蚕食”了其订阅与广告收益。其三,商标侵权与信息误导。OpenAI不仅暗示自身获得了使用相关内容的授权,还在AI生成的虚假“幻觉”信息中不当引用大英百科的名称,导致用户混淆信息来源,损害了其长期积累的权威品牌信誉。
事实上,这并非大英百科首次针对AI企业发起版权维权。早在去年,它就曾对人工智能初创公司Perplexity AI提起类似诉讼,目前该案仍在审理中。而此次选择向行业巨头OpenAI发难,背后折射出的是整个内容行业对AI无序发展的焦虑。长期以来,AI行业普遍奉行“拿来主义”,以“互联网公开内容可自由使用”为由,大量抓取受版权保护的作品用于模型训练,却始终回避授权与付费问题。OpenAI的一贯抗辩理由是,模型对版权内容的使用属于“合理使用”,其核心是学习语言规律与知识逻辑,而非复刻原作品,属于“转化性使用”的范畴。但这一主张,在大英百科的精准指控面前显得苍白无力。
本案最具标志性的意义,在于它将AI版权争议的焦点从“训练阶段”转向了“输出阶段”,彻底改写了行业维权的逻辑。在此之前,全球范围内的AI版权诉讼大多围绕“模型是否有权读取版权内容用于训练”展开,由于技术细节复杂、“合理使用”的界定模糊,法院往往难以形成明确裁判。而大英百科此次跳出这一困境,将举证重点放在了AI的输出结果上——当用户输入关键词,ChatGPT能直接吐出近乎逐字复刻的百科内容,这种行为已经超出了“学习知识”的范畴,构成了对原作品市场价值的实质性替代。正如法律界人士所言,版权法的核心边界从来都是“允许技术学习知识,绝不允许替代原作变现”,模型“学会知识表达逻辑”与“按需复现他人原创表达”,在司法认知上有着天壤之别。
从法律层面来看,大英百科的指控极具杀伤力。百科、词典类内容虽依托公共知识编撰,但其中的内容架构、措辞表述、定义逻辑都具有高度的原创性和独特辨识度,属于明确的版权保护客体。而ChatGPT“记忆”并复现这些内容的行为,恰好触碰了版权保护的核心——保护原创表达,而非事实本身。更值得注意的是,当前全球司法界对AI“合理使用”的认定正逐渐收紧。2025年美国多起AI版权案件中,法院虽认可模型训练的转化性价值,但始终将“对原作品市场的损害”列为核心审查要件,并未给AI行业颁发无条件的“合规通行证”。最高人民法院也在近期表示,正在起草相关司法政策文件,拟对人工智能生成物独创性认定规则、数据训练行为的法律性质进行明确,力求平衡创新者、竞争者与社会公众的多元利益。
这场诉讼的背后,更是两种知识分发模式的生死较量。大英百科的商业模式建立在“专业创作-付费订阅”的闭环之上,其核心竞争力是“权威性”与“可溯源性”,用户为精准、可靠的内容付费,本质上是为专业创作者的劳动买单。而OpenAI的模式则是“抓取内容-免费输出-商业变现”,依靠海量免费训练数据构建模型优势,以便利性吸引用户,却忽视了内容创作者的合法权益。当用户可以直接向ChatGPT获取“现成答案”,无需访问大英百科官网,这种“零点击搜索”的趋势,正在彻底架空权威内容方的生存空间——一个中学生写论文时,更可能直接询问AI“解释量子纠缠”,而非去 Britannica.com 查阅条目,这种市场替代的伤害,远比单次内容复制更为致命。
目前,该案尚未有进一步的审理进展,大英百科方面也未明确提出具体的经济赔偿金额,但其核心诉求十分清晰:要求法院判令OpenAI承担相应赔偿责任,并下达禁令禁止其相关侵权行为。而这场诉讼的影响,早已超越了案件本身,成为全球AI行业合规发展的“风向标”。它向所有AI企业释放出明确信号:AI的创新不能建立在侵犯他人版权的基础上,与权威内容库的授权合作,将从“可选项”变为“高风险场景的必选项”;同时,AI输出内容的溯源与规范,也将成为行业合规的核心要求。
从更宏观的视角来看,大英百科与OpenAI的较量,本质上是新技术与旧秩序的碰撞,是创新自由与版权保护的博弈。生成式AI的发展无疑为人类知识传播带来了便利,但这种便利不能以牺牲创作者的合法权益为代价。正如欧盟《AI法案》所强调的,监管不是束缚创新的绳索,而是防止技术坠崖的护栏。未来,如何构建一套合理的版权补偿机制,让内容创作者能够从AI发展中获得应有回报;如何明确AI训练与输出的版权边界,实现技术创新与版权保护的共赢,将成为全球科技界与法律界共同面临的课题。
这场诉讼的最终结果,或将重塑AI行业的发展格局。无论判决倾向哪一方,都将为全球AI版权纠纷提供重要判例,推动行业走向更规范、更可持续的发展道路。而对于每一个内容创作者而言,这起案件也有着深刻的启示:在AI时代,版权从来不是阻碍创新的枷锁,而是保护创新、激励创作的基石——唯有尊重每一份原创劳动,才能让知识的源泉永不枯竭,让AI真正成为推动人类进步的力量。
如有其它法律问题,请咨询伍品网律师。