文 | 太平洋科技
AI行业也要“过年关”了。在大家都准备轻松跨年的时候,AI巨头们却一个个眉头紧锁。
最近,OpenAI、微软被纽约.时报一纸诉讼送上被告席,要求数十亿美元的赔偿。而大名鼎鼎的AI制图平台Midjourney,也因为新版本V6表现得太好而惹了众怒,深陷舆论漩涡。
此前的传统AI制图工具经常出现常识性错误,比如人有6根手指、点燃的香烟没有烟雾等,但在Midjourney的新版本中,这些错误都得到了优化。
Midjourney还通过光影、纹理等细节的升级,让生成的图片极其逼真,再也不是从前粗糙的“AI画风”。甚至不少网友表示,AI生成的图片实在是太过逼真,甚至和人们平时拍摄的实景照片一模一样了。
这次史诗级的更新也为Midjourney带来了一波用户增长。但很快有用户就发现了问题:生成的图片居然和电影的原画面相似度极高!
不仅是《复仇者联盟》,还有《小丑》《沙丘》等多部电影,甚至动画、商标等都纷纷中招。
网友们普遍认为Midjourney的AI模型极有可能逐帧学习了这些电影、动画,才有可能做到这样的高相似度。然而问题来了,这些影视内容,Midjourney从未得到过版权许可。
在这场舆论漩涡中,Reid Southen作为一名资深电影概念艺术家和插画家在推特平台公开表达了不满,并详细揭露了Midjourney的版权侵犯行为。
他使用Midjourney生成黑寡妇电影画面时,故意将黑寡妇演员的名字拼错,但Midjourney仍能精准生成几乎能够以假乱真的电影画面。
Southen认为,这恰恰说明了Midjourney有着严重的侵权行为。因为理论上来说,AI只有在数据训练中学习过大量正版、高分辨率的电影画面和信息,才能不断加强电影画面和演员名字信息之间的关联。
这种关联会随着学习次数的增多而越来越强,甚至只要触发了“黑寡妇”的关键词,哪怕拼错,AI都能自动修正并关联到对应的电影画面。
Southen的一条推文激起了千层浪,不少使用Midjourney的网友开始跟帖发声,发布Midjourney侵权的各类“证据”。
连夜修改服务条款,Midjourney慌了?
Midjourney对此也很快作出了回应,但并不是解决问题,而是解决了提出问题的人——禁止Reid Southen继续使用他们的服务,并且将他曾使用过的提示词、生成的图片等信息全部删除。
这一操作让以Southen为首的内容创作者们更加愤怒。不仅如此,Southen发现Midjourney在没有主动告知用户的情况下“偷偷”更新了服务条款。
Midjourney原有的服务条款中涉及知识版权的部分显得十分潦草随意,只是简单地警告了用户不要侵犯版权,如果牵扯到了Midjourney,用户会面临平台的索赔。然而,连夜修改后的服务条款变得十分严苛,更加细致地限制了用户的行为,扩大了平台的权力。
纽约大学神经科学教授Gary Marcus发现,和旧版中的警告不同的是,在新的服务条款中,用户如果有试图侵权的行为,Midjourney都有权对其起诉。这一修改很明显就是对Southen这些发声者的威胁。Marcus随即在推特呼吁不要再使用Midjourney,直到平台重新修改这些“傲慢、甩锅”的条款政策。
目前平台和用户仍在“剑拔弩张”般僵持着。实际上,在AI行业这样的场面并不少见。有关版权的纠纷是自AI大模型诞生后一直被追问却一直没有得到答案的问题。
隐身的科技巨头们
就在Midjourney V6版本发布的两天前,曼哈顿联邦法院受理了一起有关知识产权保护的案件。11位非虚构类小说作家一同指控OpenAI和微软使用他们的书籍作品来训练ChatGPT和其它AI模型。
在上诉的小说作家中,不乏像Taylor Branch、Stacy Schiff和Kai Bird这样业内有名的作家(他们是电影《奥本海默》原作的创作者并且获得过普利策奖)。
他们在相关起诉文件中控诉称,OpenAI践踏了版权保护的法律法规,直接盗取了大量受版权保护的材料来训练,微软无疑是这种侵权行为的幕后黑手。
两家公司不约而同地否认了这些指控。但PConline仔细查阅其服务条款时,发现了问题。
谈及侵权相关的问题时,OpenAI先对用户表达了自己会负责所有赔偿。但是细读后发现,如果是用户无意上传了有版权保护的内容,造成侵权的情况,OpenAI把自己摘得干干净净。并且也丝毫没有提到自己使用的训练数据是否侵权以及如何处理的情况。
在微软的服务条款中又是另一幅场景。
PConline在微软旗下的搜索引擎Bing的官网中找到《Bing对话体验和图像创建程序条款》文档。其中关于内容版权时,文档里直接表明用户使用AI服务创作的内容所有权归用户自己所属,但授予微软、关联公司以及第三方合作伙伴版权,任何人都可以随意使用,无需支付报酬。并且在涉及AI相关的版权纠纷等所有其它问题,微软给出的答案是“您自行负责”。
在版权纠纷的问题上,这三家目前最受欢迎的AI科技巨头态度几乎一致——由用户自行承担后果。
然而,纵观主流AI服务的过程,我们发现,科技巨头们未经许可使用受版权保护的内容来训练AI能力。得到先进的AI功能后,再向想要使用这一功能的用户收取并不便宜的月租金(ChatGPT订阅每月20美金、Midjourney专业订阅每月48美元)。
而用户在使用过程中,极易调用起受版权保护的内容,无意中作出侵犯版权的行为。一旦陷入版权纠纷,科技巨头们“美美隐身”,用户只能“自求多福”,吃下这哑巴亏。
版权到底谁来负责?
事实上,版权一直是AI模型发展的暧昧地带,也是悬在科技巨头们上方的达摩克利斯之剑。
在2022年,福布斯杂志就曾采访过Midjourney创始人David Holz,提问其AI训练之前是否向在世艺术家或创作者们征求过版权许可。Holz明确地回答了没有。
在他看来,目前版权的技术和管理无法应对AI的自动抓取。图像中没有嵌入有关版权的元数据,也没有所谓的版权“注册表”,没有办法在互联网上找到一张图片然后自动追踪它的所有者。可以说,创始人一年前埋下的雷,在今天终于引爆。
纵然追踪版权、获得许可是一件困难且需要付出巨大的精力和时间的事情,但将侵权的风险完全转移给用户的做法也不是根本的解决之道。
当然,也有人正在为之努力。美国两名众议员Anna Eshoo 和 Don Beyer在近日提交了新法案《2023人工智能基础模型透明法案》。
法案里提到,国家标准与技术研究所所长、版权登记处、科学技术政策办公室主任以及其他相关利益相关者都应参与版权问题的讨论。
并且法案中还详细地指出了AI模型应当提供的信息资料,其中包括训练数据的概述和来源、科技公司对训练数据进行的操作流程,并且要求科技公司阐述自身模型的局限性或风险。
在这份长达14页的文件中,多次围绕版权强调了进行数据透明化培训的重要性。这似乎是解决版权纠纷的一个好方向。然而理想总是美好的,现实总是脱轨的。美国法案从提出到落地往往需要几十个月之久,甚至数年。
版权保护还有很长的路要走,但版权侵害却时时都在发生。
截止到今年年底,几乎所有科技巨头都收到过涉嫌侵犯版权的诉讼,但OpenAI等人工智能公司常用“合理使用”和“避风港规则”一套组合拳来反驳上诉。
“合理使用”是美国对版权法的一种宽松处理,对于一些特殊的场景给予使用版权的权利,例如批判、新闻报道、教育、学术研究等。判断是否为“合理使用”时,有多个考虑因素:受版权保护内容的类型、使用版权对市场的影响以及使用版权的实体是否盈利等。
但很明显,这些科技巨头已经赚得盆满钵满(在福布斯最近公布的2023Top10财富增长富豪中,有7位都是科技富豪),“合理使用”原则并不适用。
而“避风港规则”则是为了保障科技公司的服务能够正常运营而开设的规则,即网络服务提供者在知道侵权行为或侵权内容的存在后有义务采取措施,如删除用户侵权内容等。只要采取了措施,就可以免责,所以又称为“通知-删除”规则。
但“避风港规则”逐渐被滥用,本是作为互联网良好运营发展的保护盾,却慢慢变成了侵犯版权的趁手利剑。
“退一万步讲,难道版权就没错吗?”
当然,也有网友争论,AI大语言模型本身就是需要大量学习人类的创作才能成长,才能更加“类人”。不可能“既要马儿跑,又要马儿不吃草”。
并且,AI在抓取内容时,学习的也可能是盗版内容。互联网上盗版资源满天飞,AI也可能无法辨认,这是无法解决的版权问题。
这种“退一万步讲,难道他就没错吗?”的受害者有罪论,实在不利于解决当下的问题,并且模糊了重点。
版权问题的关键不是AI是否应该学习人类的创作,而是在AI学习人类创作的过程中,作为AI的管理者——科技巨头们该承担的责任、履行的义务并没有做到位。
作为技术发展和商业收益之间的桥梁,科技公司一方面应该把控AI的训练材料,保障版权的妥当处理;另一方面,对用户尽到基本的审查义务,不能纵容甚至帮助其侵权行为的发生。
现在,像抖音、小红书这样的平台都会对用户发布的内容进行审查,还会有“疑似AI生成”的判定,在用户页面会强制显示。虽然只是一小步,但可以见得,在技术层面上,对内容进行审查是可以实现的。
不管是Midjourney这样只有11个人的小公司,还是微软这样全球有超20万雇员的大企业,作为AI领域的佼佼者,他们应该做的事还有很多。
参考资料:
- Midjourney用户服务条款原文:https://docs.midjourney.com/docs/terms-of-service
- 新闻John Grisham, other top US authors sue OpenAI over copyrights:
- https://www.reuters.com/legal/john-grisham-other-top-us-authors-sue-openai-over-copyrights-2023-09-20/
- OpenAI服务条款原文:https://openai.com/policies/business-terms
- 微软Bing服务条款原文:https://www.bing.com/new/termsofuse
- 新闻Midjourney Founder David Holz On The Impact Of AI On Art, Imagination And The Creative Economy:
- https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the-creative-economy/?sh=214e28202d2b
- 《2023人工智能基础模型透明法案》(The AI Foundation Model Transparency Act):https://eshoo.house.gov/media/press-releases/eshoo-beyer-introduce-landmark-ai-regulation-bill
根据《网络安全法》实名制要求,请绑定手机号后发表评论
版权法这东西太老了,根本不适应AI时代的创新,艺术家的失业问题应该靠政府发福利来解决
ai应该是工具,而不是取代人类活动,如果完全ai生成的东西拥有版权,那么它学习过程中使用的所有人类数据版权费用如何支付呢?
AI作品受不受著作权法保护,取决于其中包含多少人类独创性智力成果