那些年扎克伯格的错过与过错-钛媒体官方网站

图片来源@视觉中国

文 | 硅基研究室，作者 | 山核桃

2013年，在美国内华达州的一个酒店舞厅里举办了一场私人聚会。几十名工程师、计算机科学家们围坐在一起，他们正在庆祝一个人工智能组织的成立。

“这是一场天堂里的婚礼”。说这话的人叫做杨立昆，除了「卷积神经网络之父」的称号，在这一年，他做了一个重要的决定，从实验室走进Facebook，成为这家科技公司人工智能研究院FAIR的第一代领导者，由此开启了深度学习的浪潮。

但请注意这是2013年，当时科技行业的大多数人甚至都没有听说过深度学习，彼时的Meta（在当时还是Facebook）还是一家社交网络公司，人们天然地认为，它的使命不该是探究最前沿的技术，而是快速扩充规模。但扎克伯格没有这么做，他下定决心要押注最前沿的技术，比谷歌、微软等巨头们更快。

细数扎克伯格和他的Meta，曾一度是AI界仅次于谷歌、微软的存在。不仅在深度学习浪潮早期就占尽人和，将杨立昆等明星科学家纳入麾下，同时也拥有最前瞻性的目光，扎克伯格甚至参与过DeepMind的竞购，从微软里抢走不少的人才。

十余年过去，在微软、OpenAI、谷歌等一众科技巨头的「AI军备竞赛」中，Meta沦为了第二梯队，但扎克伯格并不愿意承认这一点。在近期接受The Verge 的访谈中，很久没有现身的扎克伯格对外宣布了Meta打造通用智能的野心，不仅公布了最新的大模型动态，还大秀算力储备，借AI之风，Meta股价创历史新高，市值超过1万亿美元。

只是这一次，扎克伯格的AGI野心真的能实现吗？

Meta AI 前传：占尽天时、地利和人和

在AI浪潮中，曾经的Meta是可以和谷歌、微软掰手腕的存在。

这得益于扎克伯格自身的「野心」，也是「天时」。扎克伯格很早就决定加入谷歌、微软、苹果等巨头的战争，即便规模尚小，他渴望通过下一项变革性技术，成为领导者，因此当谷歌率先通过收购「深度学习之父」辛顿的初创公司进入深度学习领域时，扎克伯格就意识到他也必须抵达那里。

2013年，当杨立昆决定加入Facebook，成为人工智能研究院的第一任主任前，这位学者向扎克伯格提了两个条件：一个是不会离开纽约大学，另一个则是坚持企业研究的「开放哲学」。

扎克伯格同意了这两个条件，某种程度上也为Meta在AI时代的领先位置奠定了基础。

「不会离开纽约大学」让FAIR始终致力于追赶最前沿的技术，充满着理想主义。据当时从谷歌跳槽到FAIR的根据实验室华人成员田渊栋介绍，FAIR实验室不像谷歌那样条条框框很多，有各种各样的限制，相对非常自由，没有产品压力。“我到了Facebook之后就好像回到了读博时的状态，特别有兴奋感，在工作上特别有动力，整个人就好像活过来了。”田渊栋说。

可以说，彼时规模尚小的Facebook并未有谷歌「大象难转身」的难题，FAIR这种自由包容的研究氛围可以被视为是第一重「地利」，同时扎克伯格凭借Facebook牢牢掌握着流量入口，社交网络上的图片、视频、语音等种种多模态的数据，这是深度学习成长的沃土，这是第二重「地利」。

杨立昆所提出的另一个条件——企业研究的「开放哲学」则为Meta带来了「人和」。

杨立昆坚信「开放研究」，并以此为条件，让这种愿景变成了Meta的规范。“因为如果你的研究秘密进行，你的研究质量会很差，你无法吸引最好的人才，你不会招募到有能力推动最先进技术发展的人。”杨立昆曾这样说。

在这样的企业研究哲学下，Meta不走封闭的AI路线，而是尽可能地对外开源研究代码、数据集和工具。一方面，取得了看得见的研究成果，直接推动了AI的进程，其中最典型的案例有两个。

一个是自监督和生成模型（Self-supervised learning and generative models）。SSL一直都是Meta布局AI的重要方向。杨立昆曾将SSL视为「人工智能的暗物质」。他认为，区别于监督学习这种范式，SSL可以利用大量未标记数据来扩大人工智能规模，这对于识别和理解世界更微妙、更不常见的表示模式很重要。2014年，当Ian Goodfellow提出了GANs模型（生成对抗网络）时，科技巨头们先后跳上了研究GANs的彩车，连一向在AI上鲜少发声的苹果也在当时发布了一篇「如何更好地利用 GANs」的研究论文。

Meta无疑走在前列，从2015年开始，Meta就关注GANs的不同变体，让其从研究人员着迷的「玩具」变成可辅助人类生产的「工具」。

Meta的科学家和工程师们认为，GANs真正有趣的部分是它们对未来的意义，上图展示了可参与时尚单品的创作图源：Meta

2017年，Facebook联合罗格斯大学和查尔斯顿学院艺术史系，针对GANs提出了名为CAN（创造性对抗网络），让AI绘画真正走入大众视野。据当时研究人员的测试，请观众去判断由CAN模型生成的AI艺术作品是人类艺术家的作品，还是人工智能的创作。结果，有53%的观众认为艺术作品出自人类，这也是历史上类似的图灵测试里首次突破半数。

另一个案例则是AI框架PyTorch。作为时下流行的开源深度学习框架，PyTorch被广泛应用于人工智能和机器学习领域，其地位一度逼近谷歌的TensorFlow。杨立昆曾说：“当初谷歌的TensorFlow确实比Torch更火。然而Meta的PyTorch出现之后，现在其受欢迎程度已经超过TensorFlow了。”

而根据中信建投对Github上的项目数量、关注人数的对比，在AI工程领域，Meta工程领域相关能力仅次于微软和谷歌。

这种「开放开源」更深远的影响就是吸引了众多顶尖人才的加入。深度学习发展的历史，就是一部科技巨头的抢人史。彼时的FAIR可以被视为深度学习「研究与工程」的人才库。有ResNet网络的发明人何恺明、VC维和SVM的缔造者Vladimir Vapnik、提出随机梯度下降法理论的Léon Bottou等。

天时、地利、人和，Meta似乎具备成为AI时代的霸主的因素，那么究竟为什么，Meta和扎克伯格会错过这次浪潮呢？

FAIR的两次重组：Meta错过的时代

2014年，扎克伯格开启了自己的「亚洲行」，到访中国时，在清华大学经管学院舜德楼内，用中文演讲的扎克伯格阐述了当时十岁的Facebook在「下一个十年」的三个方向：连接整个世界、发展人工智能、虚拟现实。

“第一，我们想要连接整个世界，所以我们要帮助所有人用互联网，第二，我们想要发展人工智能，第三是所有人用手机以后，我相信下个平台是虚拟现实（virtual reality），Oculus是第一产品，我们希望还有别的很多产品。”

三大方向对应当时Facebook最重要三个业务板块：连接，即对应来自社交媒体平台所创造的收入。VR，也就是扎克伯格所坚信的「下一代互联网」，也是后来他口中的「元宇宙」。而人工智能，既是彼时扎克伯格对外展示的野心，也同样可视为支撑其他业务的重要技术组件。

扎克伯格曾在说服杨立昆加入时，向这位学者描述过自己的愿景——未来，社交网络上的互动变成独立完成任务的技术驱动，在短期内，这些技术将识别照片中的人脸，识别语音指令，并在不同的语言之间进行翻译。从长远来看，智能体或机器人将巡视Facebook的数字世界，接受指令，并根据需要执行指令。

当杨立昆问Facebook是否有任何不感兴趣的人工智能研究领域时，扎克伯格说：“可能是机器人学。”但其他一切——数字领域的一切——都在扎克伯格兴趣范围之内。

按照这样的战略逻辑，依靠领先的技术、社交网络规模化的收入以及VR作为硬件载体，Facebook理应走出一条更顺畅的发展道路。但事实上，谁也难以预料技术的发展与周期变化，扎克伯格与他的Facebook也毫不例外。

理解Meta为何没有成为当下最热门的AI企业，FAIR的两次重组是一个很好的观察窗口。

在2018年之前，FAIR实验室主要负责学术研究，另一个被称为应用机器学习部门（下文简称：AML）则是负责产品团队成果的转化，双方互不干涉，相对比较独立。一个强调最前沿的技术，另一个则是注重转化，因此如何强调团队之间的协作，成为了关键。但好在，尽管工作方式不同，但两个团队的共识都是一致的，比如强调开放，因此上述问题还并没有显露。

转折的点发生在2018年，FAIR的第一次重组。

2018年，杨立昆宣布卸任FAIR的职位，转任首席AI科学家一职，接任杨立昆的是当时AML的领导者 Jér me Pesenti。这次调动不同的点在于，削弱了FAIR的独立性，Pesenti同时拥有FAIR和AML两个部门的话语权。杨立昆在一次采访中这样评价这次变动：「AML和FAIR向CTO汇报，随着AI重要性、围绕深度学习建立更多系统重要性的提升，CTO再也不用担心了。」

杨立昆的「言外之意」其实有二：一是FAIR正在去集中化，这意味着未来将更多为产品和业务服务。二是在当时Facebook陷入到了严重的监管，CTO必须要用技术解决公众的信任危机，因此FAIR加大了在识别型AI的投入，以促进人工智能的公平、透明和可解释性。

第二次重组则发生在2022年6月，Meta再次宣布FAIR重组调整，明确提出AI部门不再「集中化研究」，而是分布式的下放到每个组织部门中去。这项改动加速AI技术在Meta实际业务中的应用，而被引入到不同产品组的业务部被称为「AI创新中心」。其中，FAIR也将成为Reality Labs Research旗下部门，就在一年前，Facebook正式改名为Meta。

科技公司的组织变动非常常见，毕竟技术的变化太快了。但不同于微软、苹果等科技公司，FAIR之于Meta，两次重组的不同点有二：

一是AI都是「救急」，而非创新。无论是用以服务社交媒体，识别与解决假新闻等问题，还是应对不成熟的VR业务，FAIR本身聚焦前沿技术的创新被大大稀释了。

二是缺乏战略的稳定性。「拥抱变化」尽管是科技公司经常挂在嘴边的一句话，但参考微软、苹果的经验，总有一个稳定长期的「主线」。例如，苹果尽管市场被吐槽「挤牙膏创新」，但在围绕C端的软硬件迭代上始终放大自己的生态、供应链等核心优势。

至此，如果回头看看十年前扎克伯格给自己留的三个方向：连接整个世界、发展人工智能、虚拟现实，似乎三个都没有助力其成为TOP1。

重新变酷的Meta，不愿再走老路

“我们可以发现的一点是说，Meta又变酷了。”曾在Meta担任AI架构总监，如今创业的贾扬清如此评价Meta的新变化。

在由chatGPT所开启的生成式AI浪潮中，之所以说Meta「重新变酷」的关键有二：一是区别于OpenAI等巨头的闭源路线，Meta加入战场的姿态是「开源」。

从LLaMA系列开始，Meta相继开源了一系列的模型，包括视觉领域的SAM和DINOv2、音频领域的AudioCraft系列模型、多模态大模型ImageBind等。而据扎克伯格的最新透露，Meta正在训练Llama 3，且该模型具备更强的代码生成能力。

而由LLaMA所引发的「开源和闭源」之间的讨论已足以证明了Meta的变化。杨立昆曾这样形容开源社区与闭源模型在生成式AI上的发展。“开源人工智能模型正走在超越专有模型的路上”。

第二个「重新变酷」的原因则是扎克伯格态度的转变。区别于过去对增长的迷恋以及混乱的AI策略，无论是与微软合作，还是宣布对开源大模型的押注，Meta的AI策略逐步从分散走向整合。具体来说，一是延续开源路线，加大AI生态的繁荣，这既符合对FAIR当初的承诺，也有利于在开发者和公众间，改善Meta的形象。二是借助AI更快抵达元宇宙，一方面利用AI降低开发门槛，另一方面，发挥应用优势，更好地优化体验。

据「硅基研究室」梳理，区别于谷歌、亚马逊等巨头，Meta的AI能力主要集中在C端和视觉，包括图像识别和目标检测、图像生成、增强现实（AR）和虚拟现实（VR）、人脸识别和人脸相关技术以及社交网络数据处理和隐私保护。这些技术储备在生成式AI时代具备先发优势。

可以肯定的是，扎克伯格和他的Meta都不愿重走过去的老路，曾经的AI王者是否能够再度翻身，这是时代交给扎克伯格的新命题了，毕竟Meta所面临的挑战还有很多。

首先，是老生常谈的Reality Labs的盈利问题。从Meta去年第三季度财报状况来看，广告业务强势复苏，但VR/AR业务持续亏损。去年9月，Meta发布了首款消费级MR头显Quest 3，据天风国际证券分析师郭明錤的分析，Quest 3头显销量将明显少于最初的预期。据机构IDC的估计，2023年AR/VR头显的出货量为810万台，同比下降8.3%，尽管有苹Vision pro的热度加持，但市场回暖依旧需要一定的时间。

其次，即便不走过去的老路，AI战略已逐渐连贯，但比起微软、OpenAI等巨头，Meta想做的还是太多了。如「互联网怪盗团」的评价，当所有科技巨头都在集中投入AI这一个「研发焦点」时，Meta却必须将资源分散在两个「研发焦点」，这不可避免地要面临资源和精力的分配问题。

时间拨回2012年，彼时Facebook尚未改名，面对当时股价的低迷、移动化战略的失误，扎克伯格回应道：“我能承受人们的低估，因为我宁愿被低估，这样才能真正让他们刮目相看。”如今在这场关于AI的新战事中，扎克伯格回到了原点，他和Meta都急需一场胜仗。

参考资料：