2012年12月,美国内华达州边界的太浩湖(Lake Tahoe)旁哈拉斯赌场酒店731房间里,杰弗里·辛顿(Geoffrey E. Hinton)紧张地指挥着两个学生把坐垫、熨衣板和湿毛巾藏起来。
这位刚获得2024年诺贝尔物理学奖,被称为“人工智能(AI)教父”的65岁男人当时非常紧张,他努力挺直腰板,不想在来人面前透露出任何老态。
差不多十分钟后,来自大洋彼岸的百度战略投资副总裁汤和松带领团队敲开了辛顿的房门。
这次会面对于辛顿和他两个学生来说,意义尤为不同,因为辛顿团队即将会卖掉他们刚成立、没有任何产品的小公司DNNResearch,而他本人也要选择加入一家公司展开前沿AI技术研究。
与此同时,距离辛顿10000多公里的北京海淀,一家中国顶尖AI技术公司研究者们也在紧张工作当中。一篇由辛顿等人发表的9页论文《基于深层卷积神经网络的 ImageNet 分类》,让百度创始人、董事长兼首席执行官李彦宏敏锐地发现这项研究的价值,随即促使汤和松与辛顿取得联系,发出橄榄枝,邀请辛顿加盟百度。
数小时后,辛顿坐在731房间里,美国科技巨头谷歌(Google)和微软,中国科技巨头百度以及英国AI初创公司DeepMind四家公司代表,用线上竞拍方式争夺辛顿的DNNResearch。
这成为了一场全球中美AI军备竞赛的开始。
尽管出于不想高龄远渡重洋等种种原因,辛顿最终决定加入谷歌,与百度擦身而过,但这件事却促使百度All in AI,激发和成就百度成为中国最牛AI公司的决心,并招揽大量顶尖AI人才,与谷歌、微软等科技巨头们同时发展前沿AI技术应用。
回顾过去12年,百度一跃成为全球大厂中第一个发布生成式AI产品的公司,同时让中国自主研发的AI技术跻身世界第一梯队。
“中国AI与西方的最大区别在于应用。中国有数百个基础模型,但人们越来越多地在讨论什么是AI时代的超级应用。应用驱动了中国AI的快速发展。在中文上,我们一定要比世界上任何模型都做得好。现在,文心大模型4.0的中文能力已经超过了GPT-4。”李彦宏表示。
今天的诺奖得主辛顿,12年前差点加入中国公司
10月8日下午,瑞典皇家科学院宣布将 2024 年诺贝尔物理学奖授予美国普林斯顿大学教授约翰·霍普菲尔德 (John J. Hopfield)和辛顿,表彰他们通过人工神经网络实现机器学习的基础性发现和发明。
“I have no idea that will happen(我没想到)”。辛顿是深度学习和AI技术的重要推动者,以辛顿等人提出的AlexNet为代表的深度神经网络所带来的震撼性“ImageNet时刻”,让AI发展彻底突飞猛进。同时,他也是今天活跃在生成式AI领域并坚持相信神经网络的潜力最终看到这项技术大爆发的代表,他的多份研究成果已经是从计算机视觉系统到大语言模型(LLM)的基础。
实际上,12年前,美国斯坦福大学的吴恩达(Andrew Ng)在研究如何将AI和人脑研究相结合。神经网络研究刚刚兴起之时,吴恩达就对学生说过,世界上一定有人知道怎样开展神经网络工作。随后,吴恩达加入辛顿在加拿大组建的研究团队,是少数真正参与到神经网络研究的人。
2012年,经过长时间研究,辛顿和他的博士生Alex Krizhevsky、前OpenAI首席科学家伊利亚·萨茨克维尔(Ilya Sutskever)等人终于发现,只要借助两样东西就能让神经网络成功识别出图片物体:一是数据,也就是海量的图片,因此数据集对他们的研究至关重要;二是强大的计算处理能力。而Alex发现,他写的GPU代码可以训练一个小型卷积网络,并在60秒内输出很不错的结果。
天时、地利、人和,在同年ImageNet竞赛上,神经网络AlexNet识别物体的准确率远超其他方法,在比赛中一举夺魁,人们由此真正认识并承认神经网络的强大。辛顿团队的研究成果和深度学习技术助力了对话式数字助理、自动驾驶、机器人、自动化医疗等诸多领域发展。
随后,吴恩达将这一想法分享给了时任Google联合创始人Larry Page,他告诉后者,神经网络技术将不仅推动语音识别和图像识别的进展,甚至将彻底改写谷歌的命运。他还说,神经网络技术就是在重建大脑,并且他提到了AGI(通用人工智能)的概念,即只要是大脑能够做的工作,AGI都能胜任。
2014年,谷歌收购的英国AI公司DeepMind实现了AI领域的“圣杯”——AI机器人AlphaGo击败了世界围棋冠军、职业九段选手李世石(又译李世乭)。而2020年,其研发的AlphaFold2 AI模型能够预测2亿种蛋白质的结构,使得全球AI技术加速发展。
回到国内,虽然12年前中国公司错过了辛顿的加入,但百度反而开始了“深度学习”之火在中国的“星火燎原”之路,坚定了投入深度学习、加快布局AI技术的决心,与大洋彼岸的谷歌、微软等巨头们赛跑。
2012年,百度便开始探索深度学习技术及应用,2013年,百度率先建立全球首个专注深度学习研究的深度学习研究院(IDL)。同期,百度开始布局研发深度学习框架。2014年,百度邀请谷歌大脑创始人吴恩达加入,并在研究院任首席科学家。
吴恩达加入百度时,当天有六位顶级的AI专家通过邮件表达了加入百度的意向。三年间,百度人工智能团队增长至1300人,其中百度研究院成员300人。
如Anthropic的联合创始人兼CEO Dario Amodei,从斯坦福大学博士后毕业后的第一份工作,是在百度硅谷AI实验室(SVAIL)担任研究员(research scientist),随后,Dario amodei又招募了Jim fan,现在英伟达人工智能的一号位。
日后人们回顾来看才意识到,百度入局AI研究的时间之早,这种“先机”促使百度能够在全球生成式 AI革命当中不断领先,同时,这些优秀人才也推动了百度在AI领域不断进步与发展。
5年培养500万AI人才,百度撑起了中国AI技术骨架
回望深度学习和AI领域,过去的黄金十年群星闪耀。
李彦宏、辛顿、伊利亚、吴恩达、2024年诺贝尔化学奖得主丹米斯·哈萨比斯(Demis Hassabis)、杨立昆等人,在AI领域默默耕耘多年,随着生成式AI技术革命,这些守望者和开拓者逐渐走入舞台中央,尽享赞誉,更多才华横溢的新人不断涌现,为AI的发展推波助澜。
2023年,在百度文心一言向公众开放三天后,《时代周刊》发布了史上第一份全球百大AI人物榜单,将李彦宏与吴恩达、马斯克、OpenAI CEO奥尔特曼(Sam Altman)、Dario Amodei等人共同评为全球AI领袖。评语中,《时代周刊》称他为“中国最杰出的未来主义者”。
“我是人工智能的长期信仰者”,这是现年55岁的李彦宏对自身的定义。
如今,生成式AI爆炸式增长推动AI技术能够实现各种以前无法做到的逻辑推理。李彦宏回顾过往时称,自己在30多年前的北大本科时就已经学习AI课程,从此就是AI的长期信仰者。
在百度过去24年的发展中,李彦宏意识到,AI是解决搜索引擎问题的核心技术,因为两者的本质,都是让机器理解人类语言。“所以在十多年前,我们就开始积极投入研发 AI,尤其是与自然语言相关的AI。”
技术成果的诞生,源于百度多年来对技术的压强投入。作为一家以技术立身的企业,百度连续多年保持着超过15%的研发投入强度,占比一度达到营收的23%,这样的研发占比也让百度在全球主要互联网科技公司中位居前列,和谷歌、亚马逊等科技巨头位居科技公司研发第一梯队。
李彦宏曾经说过,“有1块钱的时候,我们会投进技术里;有1个亿,我们会投进技术里;有100个亿,我们还是会投进技术里。”
“当下的中国,无疑是科技从业者最好的时代。”李彦宏预测,未来十年人工智能领域将有八项关键技术会实现量变到质变,分别是自动驾驶、数字城市运营、机器翻译、生物计算、深度学习框架、知识管理、AI芯片和个人智能助手。
2020年6月,百度宣布未来5年预计培养AI人才500万,为中国智能经济和智能社会的发展提供AI人才保障。2024年4月,百度宣布计划已经提前完成。
随着大模型成为AI发展的热点方向,在百度世界2023上,百度首席技术官王海峰发布了百度人才培养星河计划,将为社会再培养500万大模型人才。
百度成为中国乃至全球AI人才汇聚的热土,据中国信息通信研究院报告,百度以85.5分位居“AI产业创新人才”全国第一,并在预训练大模型、深度学习、自然语言处理等7大领域均排名第一。最近五年,百度AI人才的AI专利申请量和授权量连续五年位居全国第一。
中国乃至全球AI行业中,百度系人才开枝散叶处处皆是,既有吴恩达Dario Amodei这样的顶尖人物,也有余凯(地平线创始人、CEO)、黄畅(地平线联合创始人兼CTO)、楼天成(小马智行联合创始人兼CTO、中国公认的大学生计算机编程第一人)等创业者,在自动驾驶圈也占据半壁江山。
百度撑起了中国AI技术骨架。百度曾在2020年的《致股东信》中说,百度是一家技术公司的另一个含义是:我们培养技术人才,我们输出技术文化,让更多企业看到技术的价值并重视对技术的投入,搭建起中国互联网的技术骨架,这是一件意义非凡的事情。
在漫长的投身于AI的时间里,曾经有人说,百度有昨天、有明天,唯独没有“今天”。如今,百度,终于抵达了“明天”,在这背后,不断寻找顶尖人才是百度撑起中国AI发展的关键“秘诀”。
百度坚持人才培养,百度走得早,需要的技术人才很难找到现成的,要自己培养。李彦宏创立百度时,曾希望像硅谷一样招5年左右工作经验的工程师加入,不用从头培养,但当时中国市场上还没有能为互联网所用的技术人才,所以只招到了清一色的毕业生。而百度形成独特人才培养“熔炉机制”,让平凡人做不平凡的事,从实习生到顶尖科学家,培养了一批批具有“务实、自驱、负责到底”品格的人才。
如今,中国已经在全球AI领域处于领先地位。其中,作为国内最早进入AI领域的百度,已经稳居第一梯队。2024年3月份国内权威机构清华大学基础模型研究中心发布《SuperBench大模型综合能力评测报告》显示,中文理解能力上,文心大模型4.0排名第一。现在,文心大模型4.0的中文能力已经超过了GPT-4。
“百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,而是用大模型技术重构产品。”李彦宏表示,百度作为一家有社会责任的公司,将推动每个AI大模型技术融入实体经济,提升各行各业的工作效率和质量。
以百度十余年在AI领域的长期巨额研发投入,以及百度在AI人才领域的贡献,已经让该公司成为国内AI行业当之无愧的头雁。而今年诺贝尔物理学奖得主辛顿等人不断推动中国AI技术创新和进步,也让世界对中国AI有了更新的了解和认知。
“过去几年,每个人都对技术的发展速度感到震惊,但对我来说,它太慢了。”AI的概念首次提出至今已超过70年,历经多次技术浪潮,但仍然未达到真正的“AGI时代”。
李彦宏认为,若想达到“AGI时代”,最少还需要十年时间。
(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)
根据《网络安全法》实名制要求,请绑定手机号后发表评论