文 | 太平洋科技
全球都在关注着这个可能决定人类命运的官司。
在2023年的年尾,AI界的巨头OpenAI和其合作伙伴微软,一同被老牌头部媒体《纽约时报》告上法庭。
指控的理由,是ChatGPT非法使用了《纽约时报》数百万篇原创文章,严重侵犯了《纽约时报》的权益。
在沉默了近两周之后,OpenAI终于作出了回应:毫不避讳地承认了使用过《纽约时报》文章的事实,但称其是“合理使用”,并且表示如果不使用受版权保护的作品,ChatGPT这样的AI产品就无以发展。
这不禁让人想起十年前,因算法模式而强势崛起的今日头条,同样因侵犯版权被众多媒体起诉;更早的二十年前,全球最大科技公司之一的谷歌,因建立数字图书馆而被作者协会集体上诉。
这些往事都早已有了结局。今日头条选择花钱“交个朋友”,邀请媒体入驻,并且定期支付千万级别的版权费用。而谷歌在经历了漫长的十年纠缠之后,以“合理使用”原则赢得了诉讼。
此时此刻,恰如彼时彼刻,如今站上法庭的AI科技巨头与媒体大亨,同样因内容版权问题而交锋。不过,历史虽然总是惊人的相似,但绝不会简单地重复。
新旧世界的对决
故事的主角OpenAI,可以说是AI科技行业当之无愧的“C位”,被视为构建AGI(通用人工智能)的“金种子”,人类社会通往下一个时代的钥匙。
而另一位主角《纽约时报》是美国老牌媒体,依靠数字订阅服务,依然在互联网时代保持着行业翘楚的地位,是全球新闻内容市场的中坚力量。这场比拼,可谓精彩绝伦。
在第一轮的对决中,《纽约时报》就直接要求“摧毁”所有大语言模型以及包含其版权内容的数据集,并且赔偿损失和相关费用。
PConline查阅发现,《纽约时报》69页的上诉书中,近50页的内容都在描述OpenAI及微软侵犯版权的证据。
上诉书不仅以可视化的形式展现了ChatGPT的侵权行为,还补充了许多数据支撑,资料厚度是从前AI版权案例的几倍,内容之详细,逻辑之清晰,都体现了《纽约时报》为起诉做足了准备。
因此知名律师Cecilia Ziniti在看过上诉书之后,认为这将会是一次AI侵权领域“里程碑式的案件”。
《纽约时报》获得了一波网友的支持,许多人都认为AI在“毫无底线”地侵犯版权。但对于《纽约时报》的诉求—— “摧毁”大语言模型,网友们都持怀疑的态度。
其实OpenAI也对《纽约时报》抛出过合作的橄榄枝。有消息称,OpenAI曾向《纽约时报》提出过500万美元或更少的赔偿条件。然而,在《纽约时报》的上诉书中,虽然没有要求具体的赔偿金额,但表达过要求OpenAI赔偿其数字业务受损害的部分。而这一部分,也正是《纽约时报》的支柱业务。
《纽约时报》2022年的财报显示,数字订阅收入达到14.79亿美元,占全年总收入的64.08%。这样看来,OpenAI提出的500万美元确实显得没有诚意。但从主动寻求合作的行为中不难看出,OpenAI自知理亏。所以在多次公开发言中,OpenAI选择另一个“防护盾”——合理使用。
“合理使用”是版权法的一种宽松处理,对于一些特殊的场景给予使用版权的权利。判断是否“合理使用”时,有多个考虑因素:使用版权对市场/公共利益的影响、使用版权的主体是否盈利等。
OpenAI选择站在科技发展、公共利益的角度为自己辩护:极力强调庞大的数据训练集是AI发展的必经之路。并且,只使用公共领域的内容的话,AI的发展水平就达不到当前社会的需求。
当然,在公共利益的话题上,《纽约时报》也是有备而来。
《纽约时报》早已料到OpenAI会作此反应,在上诉书中,专门提到了“AI幻觉”的问题。“AI幻觉”是指AI有时会生成一些看似连贯,实则错误的回答。但错误或虚假的信息会误导用户,从而造成不良的公共影响,所以OpenAI能否证明其公共利益的属性,还得存疑。
另外,《纽约时报》直指OpenAI的“盈利目的”。OpenAI起初为“非营利”组织,但现在早已不再开源,依靠AI的服务,每月收入8000万美元。(据消息称,OpenAI在2023年的年收入已经超过16亿美元。)
双方在不同的价值追求下,对自身的立场都有着同样的执着。科技行业和新闻出版行业似乎每十年都会进行一次这样的“巅峰对决”。但更有趣的是,“对决”背后的草灰蛇线。
科技VS新闻出版:宿敌还是盟友?
将时间倒转二十年,在美国声名鹊起的科技企业谷歌提出了一个雄心勃勃的项目——谷歌图书,试图通过扫描创建图书的数字版本,然后将电子图书合并到谷歌的搜索功能中。
当时,每天都有几大卡车的图书送到谷歌总公司进行扫描,场面颇为壮观。但这个项目很快引起了作者和出版商们的不满。
作家协会以侵犯版权为由对谷歌提起诉讼。谷歌立即搬出“合理使用”的法律盾牌,声称这一项目是有利于公众,同时也没有损害原创作品的市场。同时谷歌也积极寻求和解,但被原告方拒绝。
这个案件可谓历经波折,耗费了约十年的时间,最终法院基于“合理使用”的原则宣判谷歌胜诉。这也为数字时代版权评判标准的健全,补上了一块拼图。
十年前,相似的事情又在中国互联网上演。2013年,被称“新闻搬运工”的今日头条在上线后,火速侵噬了新闻行业的大部分流量。
以《广州日报》为首的传统媒体随即对今日头条发起诉讼。《新京报》等众多知名媒体也迅速群起而攻之,接连发表声明,谴责今日头条的侵权行为。
今日头条一边表态不存在侵权问题,一边和媒体积极推进合作。最终今日头条和众多媒体达成和解,不仅花大价钱购买了新闻版权,还积极邀请各大媒体入驻,给予流量扶持和收益分成。
如今看来,OpenAI是想沿着“前辈们”的脚步过河。在对《纽约时报》上诉的第一次正式回应中,OpenAI将“与新闻机构合作并创造新的机会”作为首要立场,还搬出了和美联社的合作作为支撑论据。
纵观这三个案件,谷歌图书案开始于门户网站的兴起阶段,搜索引擎的兴盛是那个时代的标志;今日头条案发生在移动互联网的崛起时刻,流量是当时抢占市场的关键;而今天的OpenAI案是AI技术获得突破性进展,大显身手的前夜,拥有像ChatGPT这样生成式AI产品是公司股价飞升的秘诀。
这三个案件,虽处于不同的时代,但都发生在新技术“引爆”新时代之前。并且,故事的主角都是科技和新闻出版这样两个行业。
这一点,并不难理解。对于科技行业来说,技术的落地一定需要内容来支撑。而新闻出版业就是内容的集大成者。对于新闻出版行业来说,内容也需要迎合时代的发展,更新内容的形式。当然,科技的发展总是领先于时代,所以带来了“技术的磨合期”——相应的市场规则和法律文书在这一阶段进行完善。
“读书人的事儿,能叫抄吗?”
但AI的情况又有所不同。在科技公司看来,AI技术是以类人为导向的,许多AI大模型的衡量标准就是看输出的内容能否接近,甚至超越人类专家的智慧。
所以技术的发展逻辑也是按照人的成长机制来践行的。在学校里学习公开的材料,通过和身边的人互动来增强对社会的认知,本质上与AI大模型的学习训练是有共通之处的。只不过一个人在学校里用到的课本有几十本,而ChatGPT则是“学习”了约1.76万亿个数据。
但AI公司们似乎没意识到这套逻辑仍然难以自洽,学生们去学校学习知识再加以应用,以获得个人的成长,是需要付出成本的,比如学费、书本费等,只不过这个成本往往是由社会福利来买单,无论谁来支付这笔成本,都明确显示了成本是真实存在的。
但AI公司们似乎并不愿意聊到这个成本,他们普遍希望像OpenAI一样免费获取“纽约时报”们的内容来学习。与此同时,他们也并不愿意承担AI造成的负面后果。
美国国家AI咨询委员会成员Navrina Singh在参加一档谈话节目时就曾表示,目前科技公司很难对AI输出的内容负责,因为他们没有工具来细致处理“万亿”级别的数据。这也是科技巨头们正在努力的方向。这也是OpenAI与《纽约时报》这场巅峰对决产生的意义——AI和人类的“磨合期”已经到来。不仅是AI侵权问题,还有“AI幻觉”、失业潮等都是“磨合期的阵痛”。AI技术需要适应人类社会,我们也需要了解新的技术,在新的时代找到自己的定位。
时代滚滚向前,时间会证明潮水的方向。谷歌图书案之后,数字生态逐渐成为了极具公益价值的一环,越来越多的古籍文物再也无惧岁月变迁,在数字世界中成为了人类永恒的财富;今日头条案之后,传统媒体加快融媒转型的步伐,在新的媒介传播时代中焕发新生;相信在这次《纽约时报》诉OpenAI案之后,AI产业会激发出更多意想不到的创新。
不管这次案件判决如何,都有着巨大的象征意义。毕竟与传统产业“对决”的输赢,并不是AI发展的最终目的,各方寻求共赢的合作,共创AI时代的未来才是。
根据《网络安全法》实名制要求,请绑定手机号后发表评论