文 | 硅基研究室,作者 | 山核桃
2013年,在美国内华达州的一个酒店舞厅里举办了一场私人聚会。几十名工程师、计算机科学家们围坐在一起,他们正在庆祝一个人工智能组织的成立。
“这是一场天堂里的婚礼”。说这话的人叫做杨立昆,除了「卷积神经网络之父」的称号,在这一年,他做了一个重要的决定,从实验室走进Facebook,成为这家科技公司人工智能研究院FAIR的第一代领导者,由此开启了深度学习的浪潮。
但请注意这是2013年,当时科技行业的大多数人甚至都没有听说过深度学习,彼时的Meta(在当时还是Facebook)还是一家社交网络公司,人们天然地认为,它的使命不该是探究最前沿的技术,而是快速扩充规模。但扎克伯格没有这么做,他下定决心要押注最前沿的技术,比谷歌、微软等巨头们更快。
细数扎克伯格和他的Meta,曾一度是AI界仅次于谷歌、微软的存在。不仅在深度学习浪潮早期就占尽人和,将杨立昆等明星科学家纳入麾下,同时也拥有最前瞻性的目光,扎克伯格甚至参与过DeepMind的竞购,从微软里抢走不少的人才。
十余年过去,在微软、OpenAI、谷歌等一众科技巨头的「AI军备竞赛」中,Meta沦为了第二梯队,但扎克伯格并不愿意承认这一点。在近期接受The Verge 的访谈中,很久没有现身的扎克伯格对外宣布了Meta打造通用智能的野心,不仅公布了最新的大模型动态,还大秀算力储备,借AI之风,Meta股价创历史新高,市值超过1万亿美元。
只是这一次,扎克伯格的AGI野心真的能实现吗?
Meta AI 前传:占尽天时、地利和人和
在AI浪潮中,曾经的Meta是可以和谷歌、微软掰手腕的存在。
这得益于扎克伯格自身的「野心」,也是「天时」。扎克伯格很早就决定加入谷歌、微软、苹果等巨头的战争,即便规模尚小,他渴望通过下一项变革性技术,成为领导者,因此当谷歌率先通过收购「深度学习之父」辛顿的初创公司进入深度学习领域时,扎克伯格就意识到他也必须抵达那里。
2013年,当杨立昆决定加入Facebook,成为人工智能研究院的第一任主任前,这位学者向扎克伯格提了两个条件:一个是不会离开纽约大学,另一个则是坚持企业研究的「开放哲学」。
扎克伯格同意了这两个条件,某种程度上也为Meta在AI时代的领先位置奠定了基础。
「不会离开纽约大学」让FAIR始终致力于追赶最前沿的技术,充满着理想主义。据当时从谷歌跳槽到FAIR的根据实验室华人成员田渊栋介绍,FAIR实验室不像谷歌那样条条框框很多,有各种各样的限制,相对非常自由,没有产品压力。“我到了Facebook之后就好像回到了读博时的状态,特别有兴奋感,在工作上特别有动力,整个人就好像活过来了。”田渊栋说。
可以说,彼时规模尚小的Facebook并未有谷歌「大象难转身」的难题,FAIR这种自由包容的研究氛围可以被视为是第一重「地利」,同时扎克伯格凭借Facebook牢牢掌握着流量入口,社交网络上的图片、视频、语音等种种多模态的数据,这是深度学习成长的沃土,这是第二重「地利」。
杨立昆所提出的另一个条件——企业研究的「开放哲学」则为Meta带来了「人和」。
杨立昆坚信「开放研究」,并以此为条件,让这种愿景变成了Meta的规范。“因为如果你的研究秘密进行,你的研究质量会很差,你无法吸引最好的人才,你不会招募到有能力推动最先进技术发展的人。”杨立昆曾这样说。
在这样的企业研究哲学下,Meta不走封闭的AI路线,而是尽可能地对外开源研究代码、数据集和工具。一方面,取得了看得见的研究成果,直接推动了AI的进程,其中最典型的案例有两个。
一个是自监督和生成模型(Self-supervised learning and generative models)。SSL一直都是Meta布局AI的重要方向。杨立昆曾将SSL视为「人工智能的暗物质」。他认为,区别于监督学习这种范式,SSL可以利用大量未标记数据来扩大人工智能规模,这对于识别和理解世界更微妙、更不常见的表示模式很重要。2014年,当Ian Goodfellow提出了GANs模型(生成对抗网络)时,科技巨头们先后跳上了研究GANs的彩车,连一向在AI上鲜少发声的苹果也在当时发布了一篇「如何更好地利用 GANs」的研究论文。
Meta无疑走在前列,从2015年开始,Meta就关注GANs的不同变体,让其从研究人员着迷的「玩具」变成可辅助人类生产的「工具」。
2017年,Facebook联合罗格斯大学和查尔斯顿学院艺术史系,针对GANs提出了名为CAN(创造性对抗网络),让AI绘画真正走入大众视野。据当时研究人员的测试,请观众去判断由CAN模型生成的AI艺术作品是人类艺术家的作品,还是人工智能的创作。结果,有53%的观众认为艺术作品出自人类,这也是历史上类似的图灵测试里首次突破半数。
另一个案例则是AI框架PyTorch。作为时下流行的开源深度学习框架,PyTorch被广泛应用于人工智能和机器学习领域,其地位一度逼近谷歌的TensorFlow。杨立昆曾说:“当初谷歌的TensorFlow确实比Torch更火。然而Meta的PyTorch出现之后,现在其受欢迎程度已经超过TensorFlow了。”
而根据中信建投对Github上的项目数量、关注人数的对比,在AI工程领域,Meta工程领域相关能力仅次于微软和谷歌。
这种「开放开源」更深远的影响就是吸引了众多顶尖人才的加入。深度学习发展的历史,就是一部科技巨头的抢人史。彼时的FAIR可以被视为深度学习「研究与工程」的人才库。有ResNet网络的发明人何恺明、VC维和SVM的缔造者Vladimir Vapnik、提出随机梯度下降法理论的Léon Bottou等。
天时、地利、人和,Meta似乎具备成为AI时代的霸主的因素,那么究竟为什么,Meta和扎克伯格会错过这次浪潮呢?
FAIR的两次重组:Meta错过的时代
2014年,扎克伯格开启了自己的「亚洲行」,到访中国时,在清华大学经管学院舜德楼内,用中文演讲的扎克伯格阐述了当时十岁的Facebook在「下一个十年」的三个方向:连接整个世界、发展人工智能、虚拟现实。
“第一,我们想要连接整个世界,所以我们要帮助所有人用互联网,第二,我们想要发展人工智能,第三是所有人用手机以后,我相信下个平台是虚拟现实(virtual reality),Oculus是第一产品,我们希望还有别的很多产品。”
三大方向对应当时Facebook最重要三个业务板块:连接,即对应来自社交媒体平台所创造的收入。VR,也就是扎克伯格所坚信的「下一代互联网」,也是后来他口中的「元宇宙」。而人工智能,既是彼时扎克伯格对外展示的野心,也同样可视为支撑其他业务的重要技术组件。
扎克伯格曾在说服杨立昆加入时,向这位学者描述过自己的愿景——未来,社交网络上的互动变成独立完成任务的技术驱动,在短期内,这些技术将识别照片中的人脸,识别语音指令,并在不同的语言之间进行翻译。从长远来看,智能体或机器人将巡视Facebook的数字世界,接受指令,并根据需要执行指令。
当杨立昆问Facebook是否有任何不感兴趣的人工智能研究领域时,扎克伯格说:“可能是机器人学。”但其他一切——数字领域的一切——都在扎克伯格兴趣范围之内。
按照这样的战略逻辑,依靠领先的技术、社交网络规模化的收入以及VR作为硬件载体,Facebook理应走出一条更顺畅的发展道路。但事实上,谁也难以预料技术的发展与周期变化,扎克伯格与他的Facebook也毫不例外。
理解Meta为何没有成为当下最热门的AI企业,FAIR的两次重组是一个很好的观察窗口。
在2018年之前,FAIR实验室主要负责学术研究,另一个被称为应用机器学习部门(下文简称:AML)则是负责产品团队成果的转化,双方互不干涉,相对比较独立。一个强调最前沿的技术,另一个则是注重转化,因此如何强调团队之间的协作,成为了关键。但好在,尽管工作方式不同,但两个团队的共识都是一致的,比如强调开放,因此上述问题还并没有显露。
转折的点发生在2018年,FAIR的第一次重组。
2018年,杨立昆宣布卸任FAIR的职位,转任首席AI科学家一职,接任杨立昆的是当时AML的领导者 Jér me Pesenti。这次调动不同的点在于,削弱了FAIR的独立性,Pesenti同时拥有FAIR和AML两个部门的话语权。杨立昆在一次采访中这样评价这次变动:「AML和FAIR向CTO汇报,随着AI重要性、围绕深度学习建立更多系统重要性的提升,CTO再也不用担心了。」
杨立昆的「言外之意」其实有二:一是FAIR正在去集中化,这意味着未来将更多为产品和业务服务。二是在当时Facebook陷入到了严重的监管,CTO必须要用技术解决公众的信任危机,因此FAIR加大了在识别型AI的投入,以促进人工智能的公平、透明和可解释性。
第二次重组则发生在2022年6月,Meta再次宣布FAIR重组调整,明确提出AI部门不再「集中化研究」,而是分布式的下放到每个组织部门中去。这项改动加速AI技术在Meta实际业务中的应用,而被引入到不同产品组的业务部被称为「AI创新中心」。其中,FAIR也将成为Reality Labs Research旗下部门,就在一年前,Facebook正式改名为Meta。
科技公司的组织变动非常常见,毕竟技术的变化太快了。但不同于微软、苹果等科技公司,FAIR之于Meta,两次重组的不同点有二:
一是AI都是「救急」,而非创新。无论是用以服务社交媒体,识别与解决假新闻等问题,还是应对不成熟的VR业务,FAIR本身聚焦前沿技术的创新被大大稀释了。
二是缺乏战略的稳定性。「拥抱变化」尽管是科技公司经常挂在嘴边的一句话,但参考微软、苹果的经验,总有一个稳定长期的「主线」。例如,苹果尽管市场被吐槽「挤牙膏创新」,但在围绕C端的软硬件迭代上始终放大自己的生态、供应链等核心优势。
至此,如果回头看看十年前扎克伯格给自己留的三个方向:连接整个世界、发展人工智能、虚拟现实,似乎三个都没有助力其成为TOP1。
重新变酷的Meta,不愿再走老路
“我们可以发现的一点是说,Meta又变酷了。”曾在Meta担任AI架构总监,如今创业的贾扬清如此评价Meta的新变化。
在由chatGPT所开启的生成式AI浪潮中,之所以说Meta「重新变酷」的关键有二:一是区别于OpenAI等巨头的闭源路线,Meta加入战场的姿态是「开源」。
从LLaMA系列开始,Meta相继开源了一系列的模型,包括视觉领域的SAM和DINOv2、音频领域的AudioCraft系列模型、多模态大模型ImageBind等。而据扎克伯格的最新透露,Meta正在训练Llama 3,且该模型具备更强的代码生成能力。
而由LLaMA所引发的「开源和闭源」之间的讨论已足以证明了Meta的变化。杨立昆曾这样形容开源社区与闭源模型在生成式AI上的发展。“开源人工智能模型正走在超越专有模型的路上”。
第二个「重新变酷」的原因则是扎克伯格态度的转变。区别于过去对增长的迷恋以及混乱的AI策略,无论是与微软合作,还是宣布对开源大模型的押注,Meta的AI策略逐步从分散走向整合。具体来说,一是延续开源路线,加大AI生态的繁荣,这既符合对FAIR当初的承诺,也有利于在开发者和公众间,改善Meta的形象。二是借助AI更快抵达元宇宙,一方面利用AI降低开发门槛,另一方面,发挥应用优势,更好地优化体验。
据「硅基研究室」梳理,区别于谷歌、亚马逊等巨头,Meta的AI能力主要集中在C端和视觉,包括图像识别和目标检测、图像生成、增强现实(AR)和虚拟现实(VR)、人脸识别和人脸相关技术以及社交网络数据处理和隐私保护。这些技术储备在生成式AI时代具备先发优势。
可以肯定的是,扎克伯格和他的Meta都不愿重走过去的老路,曾经的AI王者是否能够再度翻身,这是时代交给扎克伯格的新命题了,毕竟Meta所面临的挑战还有很多。
首先,是老生常谈的Reality Labs的盈利问题。从Meta去年第三季度财报状况来看,广告业务强势复苏,但VR/AR业务持续亏损。去年9月,Meta发布了首款消费级MR头显Quest 3,据天风国际证券分析师郭明錤的分析,Quest 3头显销量将明显少于最初的预期。据机构IDC的估计,2023年AR/VR头显的出货量为810万台,同比下降8.3%,尽管有苹Vision pro的热度加持,但市场回暖依旧需要一定的时间。
其次,即便不走过去的老路,AI战略已逐渐连贯,但比起微软、OpenAI等巨头,Meta想做的还是太多了。如「互联网怪盗团」的评价,当所有科技巨头都在集中投入AI这一个「研发焦点」时,Meta却必须将资源分散在两个「研发焦点」,这不可避免地要面临资源和精力的分配问题。
时间拨回2012年,彼时Facebook尚未改名,面对当时股价的低迷、移动化战略的失误,扎克伯格回应道:“我能承受人们的低估,因为我宁愿被低估,这样才能真正让他们刮目相看。”如今在这场关于AI的新战事中,扎克伯格回到了原点,他和Meta都急需一场胜仗。
参考资料:
- 1、福布斯:杨立昆希望用开源战胜OpenAI?
- 2、甲子光年:三次误判后,扎克伯格这次终于做对了
- 3、远川研究所:差一步称霸AI:历史进程中的扎克伯格
- 4、互联网怪盗团:Meta的逆袭:扎克伯格到底做对了什么?
- 5、深度学习革命,凯德·梅茨
根据《网络安全法》实名制要求,请绑定手机号后发表评论
RPG 游戏发展到一定程度,自然而然就实现了元宇宙
现在AI和上一轮AI的本质不同,就在于这一轮AI的含金量和成色高得多
元宇宙不能说凉而是没起步,现在的科技起步不了,这事还得水到渠成
互联网领域,别看PPT,看现实
要不直接把公司名改成LLAMA吧?