钛媒体App获悉,9月3日百图生科和播禾创新联合主办的第二届中国生物计算大会上,北京智源人工智能研究院顾问、美国国家工程院外籍院士张宏江,以“大模型驱动的科研新范式”为题目发表了近30分钟的演讲。
张宏江院士表示,以ChatGPT为代表的大语言模型,是人工智能(AI)行业第三波浪潮经过十几年的发展后的一个新拐点。
过去几年,技术瓶颈和商业化难题让AI企业商业化不顺,高估值泡沫逐渐破裂,找不到核心应用,AI 的赋能和增值有限。今天,随着大模型的发展和普及,可以通过“大模型+微调”这种新的技术范式,将AI的能力更好地更有效地用到各类应用场景中,而不再需要每家都自己开发模型,可极大降低开发成本。而且如今,ChatGPT让 AI 从技术圈走向全民讨论,迎来了 AI 的网景/iPhone 时刻。
“2007年苹果iPhone推出之后,真正为我们带来了移动互联网革命,出现了大量APP(应用程序),使移动互联网的时代真正到来。我们相信,ChatGPT所带来的将是 AI 时代一个新的突破。”张宏江表示。
张宏江强调,GPT不止是大模型,而是新一代超级计算机,会重构用户的交互、软件的执行和计算。
据悉,自2023年起,美国OpenAI公司研发的聊天机器人ChatGPT火遍全球,半年圈粉10亿月活用户,微软、谷歌、阿里、百度等全球科技巨头纷纷跟随、研发大模型。行业普遍认为,大模型将成为每个数字化系统的标配,手机、汽车、生物医药等场景均可部署,大模型将在社会无处不在。
据赛迪近日发布的一份数据报告显示,今年1-7月,国内共发布了64个大模型。截至2023年7月,中国累计已经有130个大模型问世。
百图生科开放平台总经理高亮则做了一个估算,今年2月GPT引爆国内大模型浪潮以来的不到30周时间内,几乎每周都有新的大模型创业公司出来。
张宏江认为,自然语言(NLP)是 AI 领域的“圣杯”,攻克NLP意味着通用人工智能的临近。从更大的角度看,人和动物的根本区别在于是否具有能够描述虚拟事物的语言,有了语言(语音),人类才能描述那些从不存在的事情,按自己的理解描述世界,开始讲述自己的故事,从而建立起文化和传承。而图灵测试的本质是对话测试,拥有人类对话能力,在某种意义上即拥有了人类智能。从这一点来看, ChatGPT已经达到一定人的智能水平。
张宏江直言,ChatGPT是第一个理解了人类语言逻辑的 Al。AI 不再是鹦鹉学舌,而是自此建立在对语义理解的基础上,拥有了推理和创造能力。而ChatGPT在常识、调用工具能力、探索科研的边界、推理、解决问题、抽象思维等方面表现出色。
在他看来,AI 技术的新奇点将要来临。而大模型作为基础平台会推动所有产业进入新范式,不只是IT产业,而是决定了下一代超级入口。同时,Al 模型将重写所有软件应用,重塑所有产业,提升每个领域的生产力;没有Al大模型的平台公司不再会是平台公司,新的平台、产品,新的商业模式和盈利模式,新的商业和创业机会到来;利用GPT Copilot等作为未来的组织形式,公司效率极大提升,组织形式将发生根本变化。
“大模型是一个新平台,会形成新生态,形成新的产业,就像计算机是一个生态一样,大模型底下AI芯片是云计算平台,之上不管是开源还是闭源的大模型,再之上才是应用。”张宏江提到。
对于AI For Science,张宏江在演讲中指出,AI 大模型将带来新科学的新范式,无论是在对话机器人、元宇宙、新药研发等场景应用,还是更垂直的专业化AI能力和基础设施,都将有极大的潜力,尤其AI+大分子药物领域成为新的趋势,有望被应用于癌症等疾病的新型治疗方案中。
“IT经过了最早的信息化、第二代的智能化到未来的自主化,我们将在未来看到一个自主智能的世界。”张宏江称。
具体来说,智源研究院从分子的表征、分子的关系和ScientificLLM三个方向展开了研究。
- 在分子的表征方向上,智源研发了基于结构的大、小分子预训练模型,通过预训练模型可以在下游生化性质预测、以及量子化学性质预测等8项任务上达到世界领先(SoTA),在单体蛋白的性质预测和目前的最好模型持平,在多体任务如抗体设计任务上远超过其他方法。
- 智源还研发探索Scientific LLM边界的大模型,构建了一套对齐蛋白质理解的指令(instruct)数据,进一步挖掘了如何把大模型现有的能力嫁接到分子的预训练模型上,以构建基于知识的多模态模型。
- 基于分子的表征和关系上,智源构建了OpenComplex模型,该模型在蛋白质、RNA多体结构预测上取得了世界领先,并基于结构预测能力,展现出了蛋白质生成能力。
张宏江表示,AI 和大模型在制药流程中具有非常强大的能力,无论在靶点识别、药物和靶向结合特性,还是药代动力学等方面,在 AI 的帮助下,生命科学也有望达成融合物理、数据以及知识的ChatGPT时刻,为生命科学的研究启动新的范式。而大模型的新范式有望解决大分子药物的设计复杂度,为解决全球健康问题提供新的可能。
张宏江强调,人类将迎来通往 AI4Life Science(人工智能驱动的生命科学研究)的ChatGPT时刻。
(本文首发钛媒体App,作者|林志佳)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
所谓,“智能”包括三个方面的含义和应用 : 第一, 是产生信息和加工处理信息的能力 --- AIGC 第二, 是与其他对象进行信息互动的能力 --- AI agent 第三, 是以信息来指导自身行为活动的能力--- 机器人技术 [咖啡][握手]