2024 T-EDGE文章详情页顶部

这个神秘部门,是 Facebook 玩转AR、VR的幕后功臣

Facebook 在AR、VR上的一系列动作都有一个幕后功臣——人工智能实验室FAIR,一个由非典型大牛带领、不直接参与常规产品开发,而是着眼长远、把梦想化为现实的非典型Facebook团队。

图片来源/numerama.com

图片来源/numerama.com

不知不觉,Facebook的年度F8开发者大会也步上了苹果每年发布会的后尘,成为各方一边密切关注一边吃瓜吐槽的焦点。甚至有外媒毫不客气地这样怼:“如果模仿是最诚挚的恭维方式,那么由于Facebook多年苦心孤诣的拷贝,Snapchat应该被奉上神坛。”

然而不得不说,Facebook这回算是“青出于蓝”。以“相机”为名的AR平台让用户能够实时地加入视频滤镜,比Snapchat多了场景深度,还把SDK与工具开放给用户供自由创作;可给现实世界添加基于地理信息与物体识别的数字标签,其他用户可扫描查看。小扎还提到了增强现实未来在游戏等其他领域的应用前景,可见其野心之大、在AR方面下了多大的注。

这些领先成果的实现,幕后功臣之一就是Facebook的人工智能实验室FAIR,一个由一位非典型大牛带领、不直接参与常规产品开发,而是着眼长远、把梦想化为现实的非典型Facebook团队。

FAIR:独居一隅,厚积薄发

FAIR的办公室在Facebook门罗帕克总部的3000英里之外,在曼哈顿市中心一栋老旧的米色大楼里。看似灰头土脸,他们实则目标远大:创造出智能与人类比肩的电脑。

虽然梦想的实现还有很长的路要走,但FAIR团队目前已经成果颇丰。他们的AI程序创作的画作与人类艺术家相比几可乱真,可以完成从维基百科上筛选出来的问答测验,还会玩星际争霸这样的复杂游戏。

从各个角度来看,FAIR似乎都是Facebook团队里的异端。FAIR成员不直接参与开发Instagram、WhatsApp、Messenger等狭义上跟Facebook直接相关的社交产品,而是主攻视觉、预测和语音三大方向,研究成果则全面渗透、反哺到Facebook的产品与功能上。

比如,在AI的加持下,Facebook的图片滤镜足以跟Snapchat匹敌,并通过分析图片内容来决定在你的主页News Feed上呈现怎样的内容、提高用户粘性,同理也用于监控与清除垃圾内容。 FAIR还与AML(Facebook的另一人工智能实验室)定期互通有无,把研究结果合作应用到Facebook产品上,除了用来决定在你的News Feed上展示什么内容,还用于Facebook内部的内容翻译,并用在了Facebook的摄像头上,根据你的具体动作来创造特效。

FAIR的风格或许与它的负责人Yann LeCun有关。

Yann LeCun。图片来源/sohu

Yann LeCun。图片来源/sohu.com

LeCun是卷积神经网络(Convolutional Neural Network)深度学习技术的发明人之一,如今这种技术被视为开发自然语言识别、图像识别工具甚至是语音识别和图片搜索系统的基础模块。 他从不受待见的人工智能理念提出者,到现在成为业界大牛,颇经历了一段风雨。

上世纪八十年代,还在巴黎读大学的Yann LeCun就有信心自己能让计算机获得视觉,并相信这一领域或能“让机器学会做许多任务,包括感知。” 然而,这个理论尚属先锋,当研究结果达不到鼓吹的高度,看似科学理论本身存在问题时,资金投入和人们的兴趣都会顺势跌落,技术进展也随之停止。LeCun在人们对神经网络的质疑声中仍然选择投身研究,结果受到这波“AI寒冬”的极大影响。

九十年代中期,LeCun加入贝尔实验室参与AI研究,就在刚取得一点成绩时,公司的内部斗争导致团队解散。与此同时,其他研究方法逐渐受到主流研究者的青睐。尽管那些思路后来很快便失去活力,但当时支持神经网络的LeCun仍因而遭到忽视。到了本世纪初,其他学术界人员甚至依然反对他在学术会议上发表论文。

2003年,LeCun时来运转。该年,他加入纽约大学,并跟神经网络先驱、谷歌工程师Geoff Hinton等人达成合作,希望复兴神经网络的研究。终于,计算能力的提升使得神经网络得以快速运转、有了实际应用价值,互联网的广泛应用促使图片、文本等可用数据显著增加,从而让神经网络有了学习的“资本”。 在LeCun等人打下的基础之上,计算机视觉在二十一世纪的第二个十年之处终于迎来爆发,电脑逐渐能够识别出图片、视频乃至直播中的物体,LeCun也得以从边缘人走到舞台中央、成为业界领袖。

2013年12月,LeCun加入Facebook。

对一位致力于把AI研究应用到图片领域的学者而言,Facebook提供的环境可谓理想。在Facebook,LeCun带领的团队有80位研究员,有了Facebook的高薪与雄厚财力撑腰,他拥有极大的自由度,可以视情况在他认为必要时调整FAIR,包括增加人手以及调整结构。

在LeCun眼中,成功的关键在于对“开放”的专注。他接受美国商业杂志Fast Company网站的采访时曾说,

“我有很多朋友,从拥有开放文化的实验室走出并加入(大型科技企业),他们试图改变企业的文化,但是却彻底失败。”

他在加入Facebook之前最先问的一个问题就是,Facebook对给开源社区做贡献的开放程度,以及公司文化的开放程度如何。

多年饱受批评、被边缘化之后,56岁的LeCun扬眉吐气,主流市场也终于肯定了他的工作。但LeCun仍谨慎表示,革命之路还有很远,成就也远非他一人之功。

目前,FAIR正在教给计算机如何像人类一样预测结果。

LeCun介绍,他们让AI看大量相关视频,在中间暂停,然后向程序提问接下来会发生什么事情。

“在某种程度上,智能的本质就是预测能力,”他认为,“如果你能预测行动的后果,你就能够计划,规划出实现特定目标的一连串行动。”

另一方面,AI还得学会在不确定的情形下预测。帮助AI理解并接受不确定性,是AI领域“无监督学习”的部分内容,也是研究前沿。当AI观察得足够多,知道世界如何运转、能够预测接下来的事态进展时,机器的思考就能像人类靠拢,学会一些常识。LeCun认为,这是让机器更聪明的关键。

说到做到的扎克伯格早先已经炫耀过他自己写的人工智能管家Jarvis、实现了自己的16年愿望。而在LeCun的标准里,他希望打造的AI助理得能够真正理解用户说的话,“(是)能够跟你对话的机器,能够提前规划的机器,不会让你因为机器的愚钝而烦心。”

当前,相关研究尚无蓝图,但FAIR的工作或许有助于开疆拓野。一方面,要让AI对世界有初步的认识,训练它的预测能力,另一方面,要让AI学会读写,而这正是FAIR运用神经网络主攻的方面。

对电脑来说,一幅图、一句话、一段文本都能用一串数字来表示,因此研究员能够用神经网络的架构来识别图片中的物体、句子中的词语或是文本里的主语。现在AI对文字的理解还比不上理解图片的程度,但LeCun心里已经有了AI助理的理想模样——具有常识,有能力跟其他助理沟通。

Facebook正在测试的简化版数字助理“M”由Messenger团队负责运营,“M”是依托FAIR的一些研究成果。

最近,Messenger推出了“M建议”功能,M会在它认为自己能够派上用场的时候跳进对话给你提议,比如在对话涉及个人位置时让你选择一键发送自己的地理位置。

M只是Facebook在AI语义理解方面的一个应用。FAIR团队成员Y-Lan Boureau早已开始训练AI,让它在Facebook上推动建设性的对话氛围,而非让用户习惯性、选择性地忽视与己相反的看法,创造一个尽可能多元包容的世界。

AI可以帮助理清文本中的模式,认清对话如何走偏,进而有可能设法改变对话走向。

未来:对抗机器学习

LeCun深知一波又一波的炒作周期可能危害AI研究,我们当前就身处这样的浪潮中。

根据彭博社报道,2013年第一季度还只有六家公司在财报中提及AI,四年后的现在,这个数字增长到了244家。

谈到未来时,LeCun的措辞慎之又慎。他警告公众,AI离人类水平的智能,后说通用人工智能还差得远。 但是,他也不时地表露出自己那无法抑制的热情,尤其是在对抗训练(Generative Adversarial Nets,GAN)方面。

这是一种相对较新的AI研究方式,有助于解决不确定性和预测问题,其方法是让两个AI系统相互对弈,比如让其中一个系统画图,让另一个系统判断该图是否为人类所画,前者再通过后者的反馈来优化绘画技能。

LeCun表示,对抗训练“是过去十年乃至二十年里,机器学习领域最好、最酷的想法。”

Facebook数年前在AI上的积累还是几乎一无所有,目前已经拥有FAIR和AML两大实验室,同时布局于基础研究以及产品应用。

Facebook应用机器学习团队(AML)负责人Joaquin Candela评价:“人们在Facebook全套产品上的综合体验与AI密不可分。今天的Facebook已经离不开AI了。”(本文首发钛媒体,综合自外网,编译/陈倩敏)

本文系作者 元婕 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

AWARDS-文章详情右上

扫描下载App