刚发布不到48小时的谷歌史上最强的人工智能(AI)大模型Gemini,如今却引发了一些争议。
钛媒体App 12月8日消息,谷歌公司(Google)近日公布了一段6分钟互动视频引发关注。该视频中以“一镜到底”形式展现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。
然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,实际上手时发现Gemini并不能达到视频中的效果。同时,这类营销方法甚至遭到了谷歌内部员工的批评。
截至钛媒体App发稿前,谷歌在官方社交账号上已经承认该视频经过编辑。“出于本演示的目的,为了简洁起见,延迟已减少,Gemini输出也已缩短。”谷歌表示。
据悉,当地时间12月6日,谷歌发布迄今为止功能最强大、最通用的多模态 AI 大模型Gemini 1.0系列(中文译为“双子座”),共包括Ultra、Pro和Nano三个版本。其中,Gemini Ultra已超越了GPT-4,甚至在MMLU测试得分高达90.0%,成为第一个超越人类专家水平的 AI 模型。
谷歌CEO桑达尔·皮查伊 (Sundar Pichai) 表示,Gemini是 AI 模型领域的巨大飞跃,最终将影响几乎所有的谷歌产品。同时,人类也正式迎来了Gemini新时代。(详见钛媒体App前文:《疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?》)
然而,随着基于Gemini Pro微调版本的谷歌聊天机器人Brad已对外使用,越来越多的用户对其早期版本的印象并不良好,仍存在事实性错误内容、信息过于陈旧等问题。尽管Gemini确实改进了Bard技术能力,但与ChatGPT-4相比,用户体验提升不大,因此其实际表现受到质疑。
宾夕法尼亚大学沃顿商学院教授伊桑·莫里克(Ethan Mollick)在社交媒体上表示,输入同样的指令后,GPT-4给出的回复与Gemini类似;TechCrunch作者希望提供乌克兰冲突最新情况的摘要时,Gemini提供的信息已经过时一个多月;彭博社专栏作家帕米·奥尔森(Parmy Olson)也撰文表示,Gemini视频演示的所展示的多个功能并不是独一无二的,也可以通过ChatGPT Plus所复制。
而此次被认为造假的谷歌官方演示视频,主要展示了如何通过双手、图画或其他物体的照片与Gemini互动,如人向Gemini发出文本提示,可识别反馈人展示的静态图像,以及Gemini可以与人进行流畅的语音对话等,主要还是展现Gemini大模型的多模态技术能力。
截至钛媒体App发稿前,这段6分钟谷歌官方的YouTube视频播放量已超过160万次,在社交媒体上的查看量也超过80万次。
而在引发争议之后,目前,谷歌已表明该视频经过编辑,“出于本演示目的,为了简洁起见,延迟已经减少,Gemini输出(时间)也已缩短。”
那么这意味着,模型每个响应所花费的时间实际上比视频中展示的时间长。
谷歌DeepMind产品副总裁伊莱·柯林斯(Eli Collins)表示,视频中的画鸭子演示仍然是研究级别的功能,至少目前还没有出现在谷歌的实际产品中。
谷歌DeepMind研究和深度学习负责人副总裁奥里奥尔·维尼亚尔斯(Oriol Vinyals)则表示,“视频中的所有用户提示和输出都是真实的,只是为了简洁而缩短了。”他强调,演示视频不是实时的,而是使用了原始镜头中的静止图像帧,然后编写了文本提示,并要求它通过预测来做出回应。这只是Gemini多模式能力的一个例子,以提供日常创作灵感。
而这种营销方法已遭到谷歌内部员工的批评。据彭博社报道,多位谷歌员工表示,他们认为这段Gemini介绍视频描绘了一幅不切实际的画面,另有员工称对演示并不太感到惊讶,因为他们已经习惯了公司公开定位其产品的某种程度的营销炒作。“我认为大多数使用过大语言模型技术的员工都知道要对这一切持保留态度。”该员工称。
科技网站The Verge评论指出,企业经常编辑演示视频,特别是因为许多公司希望避免现场演示带来的任何技术问题,稍微调整一下是很常见的。但谷歌有制作可疑演示视频的历史,因此这一次的视频事件会让人们更加怀疑Gemini的可用性。“至少在公众看来,谷歌已经被OpenAI今年的巨大成功打了个措手不及。如果它想激励开发人员,就不能通过精心编辑的、可能歪曲人工智能能力的精彩视频。”
目前,谷歌官方层面仍在有条不紊地推进Gemini大模型产品落地,展现其技术优异性。
12月8日,谷歌DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)对外强调,Gemini是 AI 领域的新品种——“原生多模态”,区别于现有的“拼凑多模态”模型,即从一开始就使用多种模态(例如音频、视频和图像)训练而成。因此,Gemini开辟了一条 AI 领域前所未见的道路,可能会带来重大的新突破。
作为其最强的技术竞品,12月8日下午,OpenAI研发的聊天机器人ChatGPT在社交媒体上意味深长的回应称,目前ChatGPT模型没有更新过,而模型行为可能是不可预测的,团队正在研究修复它。
根据谷歌的规划,自12月13日起,开发者和企业客户可以通过谷歌AI Studio或谷歌云Vertex AI访问Gemini Pro的API。同时,对标GPT-4的高级版本Gemini Ultra预计将在2024年对外发布。
(本文首发钛媒体App,作者|林志佳)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
为了跟微软和OpenAI竞争,谷歌都拿出视频剪辑的手段了,看来GPT4是真的强啊
Gemini回避,让ChatGPT来主持公道
以后这种大模型的发布会还得是现场演示,起码得是实际操作的原始录像,搞这种精修视频,搁这儿骗兄弟呢?
同样是印度人,微软那位老哥,手段和能力真是吊打Google 的这位老乡