纽约时报掐架OpenAI：为什么这场对决将影响人类的命运？-钛媒体官方网站

图片来源@视觉中国

文 | 太平洋科技

全球都在关注着这个可能决定人类命运的官司。

在2023年的年尾，AI界的巨头OpenAI和其合作伙伴微软，一同被老牌头部媒体《纽约时报》告上法庭。

指控的理由，是ChatGPT非法使用了《纽约时报》数百万篇原创文章，严重侵犯了《纽约时报》的权益。

在沉默了近两周之后，OpenAI终于作出了回应：毫不避讳地承认了使用过《纽约时报》文章的事实，但称其是“合理使用”，并且表示如果不使用受版权保护的作品，ChatGPT这样的AI产品就无以发展。

这不禁让人想起十年前，因算法模式而强势崛起的今日头条，同样因侵犯版权被众多媒体起诉；更早的二十年前，全球最大科技公司之一的谷歌，因建立数字图书馆而被作者协会集体上诉。

这些往事都早已有了结局。今日头条选择花钱“交个朋友”，邀请媒体入驻，并且定期支付千万级别的版权费用。而谷歌在经历了漫长的十年纠缠之后，以“合理使用”原则赢得了诉讼。

此时此刻，恰如彼时彼刻，如今站上法庭的AI科技巨头与媒体大亨，同样因内容版权问题而交锋。不过，历史虽然总是惊人的相似，但绝不会简单地重复。

新旧世界的对决

故事的主角OpenAI，可以说是AI科技行业当之无愧的“C位”，被视为构建AGI（通用人工智能）的“金种子”，人类社会通往下一个时代的钥匙。

而另一位主角《纽约时报》是美国老牌媒体，依靠数字订阅服务，依然在互联网时代保持着行业翘楚的地位，是全球新闻内容市场的中坚力量。这场比拼，可谓精彩绝伦。

在第一轮的对决中，《纽约时报》就直接要求“摧毁”所有大语言模型以及包含其版权内容的数据集，并且赔偿损失和相关费用。

PConline查阅发现，《纽约时报》69页的上诉书中，近50页的内容都在描述OpenAI及微软侵犯版权的证据。

上诉书不仅以可视化的形式展现了ChatGPT的侵权行为，还补充了许多数据支撑，资料厚度是从前AI版权案例的几倍，内容之详细，逻辑之清晰，都体现了《纽约时报》为起诉做足了准备。

因此知名律师Cecilia Ziniti在看过上诉书之后，认为这将会是一次AI侵权领域“里程碑式的案件”。

《纽约时报》列出的证据，红色为ChatGPT与《纽约时报》内容一致的部分

《纽约时报》获得了一波网友的支持，许多人都认为AI在“毫无底线”地侵犯版权。但对于《纽约时报》的诉求—— “摧毁”大语言模型，网友们都持怀疑的态度。

其实OpenAI也对《纽约时报》抛出过合作的橄榄枝。有消息称，OpenAI曾向《纽约时报》提出过500万美元或更少的赔偿条件。然而，在《纽约时报》的上诉书中，虽然没有要求具体的赔偿金额，但表达过要求OpenAI赔偿其数字业务受损害的部分。而这一部分，也正是《纽约时报》的支柱业务。

《纽约时报》2022年的财报显示，数字订阅收入达到14.79亿美元，占全年总收入的64.08%。这样看来，OpenAI提出的500万美元确实显得没有诚意。但从主动寻求合作的行为中不难看出，OpenAI自知理亏。所以在多次公开发言中，OpenAI选择另一个“防护盾”——合理使用。

“合理使用”是版权法的一种宽松处理，对于一些特殊的场景给予使用版权的权利。判断是否“合理使用”时，有多个考虑因素：使用版权对市场/公共利益的影响、使用版权的主体是否盈利等。

OpenAI选择站在科技发展、公共利益的角度为自己辩护：极力强调庞大的数据训练集是AI发展的必经之路。并且，只使用公共领域的内容的话，AI的发展水平就达不到当前社会的需求。

当然，在公共利益的话题上，《纽约时报》也是有备而来。

《纽约时报》早已料到OpenAI会作此反应，在上诉书中，专门提到了“AI幻觉”的问题。“AI幻觉”是指AI有时会生成一些看似连贯，实则错误的回答。但错误或虚假的信息会误导用户，从而造成不良的公共影响，所以OpenAI能否证明其公共利益的属性，还得存疑。

另外，《纽约时报》直指OpenAI的“盈利目的”。OpenAI起初为“非营利”组织，但现在早已不再开源，依靠AI的服务，每月收入8000万美元。（据消息称，OpenAI在2023年的年收入已经超过16亿美元。）

双方在不同的价值追求下，对自身的立场都有着同样的执着。科技行业和新闻出版行业似乎每十年都会进行一次这样的“巅峰对决”。但更有趣的是，“对决”背后的草灰蛇线。

科技VS新闻出版：宿敌还是盟友？

将时间倒转二十年，在美国声名鹊起的科技企业谷歌提出了一个雄心勃勃的项目——谷歌图书，试图通过扫描创建图书的数字版本，然后将电子图书合并到谷歌的搜索功能中。

当时，每天都有几大卡车的图书送到谷歌总公司进行扫描，场面颇为壮观。但这个项目很快引起了作者和出版商们的不满。

作家协会以侵犯版权为由对谷歌提起诉讼。谷歌立即搬出“合理使用”的法律盾牌，声称这一项目是有利于公众，同时也没有损害原创作品的市场。同时谷歌也积极寻求和解，但被原告方拒绝。

这个案件可谓历经波折，耗费了约十年的时间，最终法院基于“合理使用”的原则宣判谷歌胜诉。这也为数字时代版权评判标准的健全，补上了一块拼图。

十年前，相似的事情又在中国互联网上演。2013年，被称“新闻搬运工”的今日头条在上线后，火速侵噬了新闻行业的大部分流量。

以《广州日报》为首的传统媒体随即对今日头条发起诉讼。《新京报》等众多知名媒体也迅速群起而攻之，接连发表声明，谴责今日头条的侵权行为。

今日头条一边表态不存在侵权问题，一边和媒体积极推进合作。最终今日头条和众多媒体达成和解，不仅花大价钱购买了新闻版权，还积极邀请各大媒体入驻，给予流量扶持和收益分成。

如今看来，OpenAI是想沿着“前辈们”的脚步过河。在对《纽约时报》上诉的第一次正式回应中，OpenAI将“与新闻机构合作并创造新的机会”作为首要立场，还搬出了和美联社的合作作为支撑论据。

纵观这三个案件，谷歌图书案开始于门户网站的兴起阶段，搜索引擎的兴盛是那个时代的标志；今日头条案发生在移动互联网的崛起时刻，流量是当时抢占市场的关键；而今天的OpenAI案是AI技术获得突破性进展，大显身手的前夜，拥有像ChatGPT这样生成式AI产品是公司股价飞升的秘诀。

这三个案件，虽处于不同的时代，但都发生在新技术“引爆”新时代之前。并且，故事的主角都是科技和新闻出版这样两个行业。

这一点，并不难理解。对于科技行业来说，技术的落地一定需要内容来支撑。而新闻出版业就是内容的集大成者。对于新闻出版行业来说，内容也需要迎合时代的发展，更新内容的形式。当然，科技的发展总是领先于时代，所以带来了“技术的磨合期”——相应的市场规则和法律文书在这一阶段进行完善。

“读书人的事儿，能叫抄吗？”

但AI的情况又有所不同。在科技公司看来，AI技术是以类人为导向的，许多AI大模型的衡量标准就是看输出的内容能否接近，甚至超越人类专家的智慧。

所以技术的发展逻辑也是按照人的成长机制来践行的。在学校里学习公开的材料，通过和身边的人互动来增强对社会的认知，本质上与AI大模型的学习训练是有共通之处的。只不过一个人在学校里用到的课本有几十本，而ChatGPT则是“学习”了约1.76万亿个数据。

但AI公司们似乎没意识到这套逻辑仍然难以自洽，学生们去学校学习知识再加以应用，以获得个人的成长，是需要付出成本的，比如学费、书本费等，只不过这个成本往往是由社会福利来买单，无论谁来支付这笔成本，都明确显示了成本是真实存在的。

但AI公司们似乎并不愿意聊到这个成本，他们普遍希望像OpenAI一样免费获取“纽约时报”们的内容来学习。与此同时，他们也并不愿意承担AI造成的负面后果。

美国国家AI咨询委员会成员Navrina Singh在参加一档谈话节目时就曾表示，目前科技公司很难对AI输出的内容负责，因为他们没有工具来细致处理“万亿”级别的数据。这也是科技巨头们正在努力的方向。这也是OpenAI与《纽约时报》这场巅峰对决产生的意义——AI和人类的“磨合期”已经到来。不仅是AI侵权问题，还有“AI幻觉”、失业潮等都是“磨合期的阵痛”。AI技术需要适应人类社会，我们也需要了解新的技术，在新的时代找到自己的定位。

时代滚滚向前，时间会证明潮水的方向。谷歌图书案之后，数字生态逐渐成为了极具公益价值的一环，越来越多的古籍文物再也无惧岁月变迁，在数字世界中成为了人类永恒的财富；今日头条案之后，传统媒体加快融媒转型的步伐，在新的媒介传播时代中焕发新生；相信在这次《纽约时报》诉OpenAI案之后，AI产业会激发出更多意想不到的创新。

不管这次案件判决如何，都有着巨大的象征意义。毕竟与传统产业“对决”的输赢，并不是AI发展的最终目的，各方寻求共赢的合作，共创AI时代的未来才是。