文 | 润土投资
2023年,“人工智能驱动的科学研究”成为全球人工智能新前沿,科学研究第五范式AI for Science俨然已成燎原之势。
8月10日,2023中关村论坛系列活动——2023科学智能峰会(AI for Science Congress)在京举行,会议期间,2023 版《AI4S 全球发展观察与展望》隆重发布。
该报告在详细阐述AI for Science的发展历史和技术现状的同时,还对过去一年AI的发展进行了追踪并阐述其如何影响AI for Science的发展路径,整理汇总了数十家领先企业和科研机构的经验方法,深度解析相关技术、产品、产业、政策的演化,并以全新的框架重新梳理AI for Science的要素、沿革、展望,更加详尽地描述了其在各行各业的原理与实践。
本文根据2023版《AI4S 全球发展观察与展望》(下称《展望》)摘录总结要点,希望助力从业者更好地把握AI for Science的应用现状与未来趋势,共同推动AI for Science领域的融合创新。
核心观点:创新地提出了AI4S的“四梁N柱”发展框架与新基建思路
1、“四梁N柱”发展框架
近期,AI的讨论几乎等同于大型语言模型(LLM)的讨论。随着ChatGPT在各行各业的爆发,“是否能将LLM用于科研场景”成为了一个水到渠成的问题。然而,对AI for Science的讨论并未止步于LLM在科学领域的应用。那些令人兴奋的研究,并不是无源之水,更不是“拿着锤子找钉子”的AI万能论。
首先,将复杂的科学问题表述为0101的计算机语言本身就是极难的任务,需要能融合“基本原理与数据驱动的算法模型和软件系统”;
其次,为了给AI提供高质量的训练数据,我们也需要“高效率、高精度的实验表征系统”;
第三,我们需要最大化利用LLM给科研效率带来的提升,建立“替代文献的数据库与知识库系统”;
第四,以上的智能系统都需要运行在“高度整合的算力平台系统”之上。
以上的考量,《展望》将其概括称为AI for Science的“四梁”,而将AI for Science落地于各个学科和交叉学科领域的系统性工程,将其统称为“N柱”。而完成“四梁N柱”的系统建设,一来要面临着高度抽象化的领域知识门槛,二来要摆脱“作坊模式”推动科研向“平台模式”转变,这其中科学问题与工程问题相互交织、相互影响,因此推动科学家与工程师的充分协作是高效实现AI for Science时代科研基础设施建设的关键因素。
2、AI4S的发展阶段
当把时间周期拉得更长,或者以一个更宏观的视角总结和预测AI4S行业的发展,按照行业总体上需要解决的问题,可以把AI4S的历史和未来十年可预见的发展大致分为三个阶段:以科学家为主导的“概念导入期”(2016-2021)、以科学家和工程师协作为标志的“大规模基础设施建设期”(2021-2026),和以工程师为主导的“成熟应用期”(2026年及以后),三个时期的演进也是人们对AI for Science开发程度不断加深、使用范围不断扩大的过程。
AI for Science的发展不仅取决于AI算法的应用,还取决于大量经典算法的改进和提升。算法迭代层面会经历从“简单模拟”到“智能化搜索”3个阶段:
1.0阶段的关键词是“模仿”,即基于实验的思路,在实验基础上进行简单的外推和扩大;
2.0阶段的关键词是“预测”,即有边界地预测,有明确、可验证的置信区间;
3.0阶段的关键词是“搜索”,即算法可以非常准确地对真实场景进行建模,并在此基础上根据特定需求设计并返回所需结果。
《展望》指出,目前我们正处于2.0阶段,预测未来几年内AI for Science的相关领域都将会完成2.0阶段的算法升级,而后将逐步进入到智能化设计的3.0阶段,最终实现AI for Science的广泛普及。
AI for Science的发展既包含AI行业的要素,也包含科学领域的要素,更需要来自产业和公共管理侧的发展要素,所有这些要素相互交织影响,共同促成AI for Science发展的正反馈。
3、“N柱”:AI4S在多个领域的产研实践
2023新版《展望》着重介绍了AI for Science在生命科学、材料科学、能源、半导体、地质学与环境科学等众多领域及细分领域的产研实践。整体而言,在具体的实践中,如何更好地构建AI-Science之间的纽带是核心的创新点,而这在不同的科学场景中其思路也不尽相同。
3.1 生命科学领域
在过去的十余年间,大量基于机器学习和深度学习的理解基因调控的方法被开发出来,AI在驱动药物研发和个性化医疗中取得新突破。如今,AI正在药物研发、疾病筛查、生物学机制研究等方面发挥着越来越重要的作用,未来,随着AI的渗透,很多疾病的通路和影响因素将不再神秘,最终有望引导人类健康乃至整个生命科学领域的系统进步和重大突破。
以药物研发为例,新药开发过程是个多环节、漫长且昂贵的过程,每个环节的效率提高都有巨大的商业价值。如今,将AI与底层生物机制结合的新范式(AI for Life Science),正在从底层技术的突破为整个行业注入崭新活力,带来更多机会。
在AI for Life Science范式下,药物研发过程中的大部分实验可以像汽车、飞机等工业领域实现仿真模拟,通过计算手段进行测试和筛选,再通过真实实验进一步的验证和筛选,能够大幅减少真实实验带来的时间和经济成本消耗。
3.2 合成生物学领域
合成生物学被中国“十四五”规划列为科技前沿攻关方向、被美国国防部誉为未来“重点关注的六大颠覆性基础研究领域”。目前已应用于医疗健康、食品、化学品、环境监控及农业领域,包括利用糖类合成医药产品,人造食品,生物肥料,工业酶,生物燃料等用途,随着技术的发展,应用场景也在不断地拓宽:比如材料和医疗。人工合成胰岛素、角鲨烷、皮革和真丝替代物推进了动物保护进程。开发抗疟疾药物、以及通过基因驱动法来消除携带登革热的蚊子等,都是合成生物学对医疗行业的助力。
生物机制的研究是合成生物学发展的基石,AI4S在解决生物机制问题上有着独特的优势。其设计与合成生物学的工程模式相辅相成,共同打造“假设、构建、测试、学习”的闭环(DBTL),并且还有可能基于自动化实验室利用AI对于实验的定量设计来反向补充数据库,以及探索更多的规律,突破理性设计的瓶颈。
并且,最终可实现全基因组水平定制化工厂的设想,完成实验室的小规模理性化设计到大规模制备工艺的生产。甚至有可能实现从底层对于微生物系统的模拟搭建,到宏观的海洋系统甚至生态系统的模拟,实现对物种分布和梯度影响的生态过程有所模拟和了解,最终我们可以真正推演出类似“蝴蝶效应”的过程。
3.3 材料科学领域
材料研发的核心是建立准确的构效关系,更具体地说,是对“组分-结构-工艺-性能”之间的关系的研究,虽然材料科学家们对于“结构决定性能”这一点有高度的共识,但组分、加工工艺都对材料微观结构产生着复杂的影响,几者之间又存在着十分复杂的关联,这为材料的研发带来了巨大困难。再加上算法、平台的不成熟,数据库的不完善和计算资源的限制,传统材料研发难以真正实现对传统方法的突破。
其次,材料科学是跨学科领域,需要结合物理、化学、工程学等多学科知识,从原子和分子出发,根据需求优化和设计材料。但是,材料空间结构复杂,涉及多个尺度的结构特征,且材料组分复杂,在多个尺度存在不均匀分布,并且工艺复杂,工艺特异性要求多,还存在成本高、时耗高等多重问题。因此,需要将计算和实验组合,缩小材料创新的搜索空间,才能加速材料创新进程。
AI4S可以从第一性原理出发,预测材料成分分布和微观结构的多尺度特征,并整合现有材料的数据库、专家知识和人工智能方法。在不少领域,已有科研人员成功利用AI4S方法进行了关键问题的攻坚。
3.4 能源科学领域
能源是世界经济发展的重要动力。但当今世界,化石能源大量使用,带来环境、生态和全球气候变化等领域一系列问题,加快能源转型发展、大力发展清洁低碳能源是未来趋势所在。加快能源新技术与现代信息、材料和先进制造技术深度融合,随着太阳能、新能源汽车等技术的不断成熟,大规模储能、氢能源、核能等技术有望进一步突破,丰富能源利用新模式。
除了发展新能源之外,推进化石能源的清洁利用也是能源革命战略中的重要一环。加强对化石能源使用过程中的污染控制,推动其清洁高效地开发利用。针对上述发展要求,除了要从产业链整体出发,还需要从科学的角度突破当前能源材料的技术难点。AI4S的应用,有助于大规模数据的分析和处理,跨尺度物理模型的构建等,能够帮助高效地探索能源材料“组分-结构-工艺-性能”之间的关系,从而加速能源科学研发,让高效利用清洁、安全、多样能源的未来不再遥远。
3.5 半导体领域
半导体技术是信息时代的基础。随着摩尔定律的衰退,关于半导体未来的发展,形成了两个不同的路线:“more Moore”和“more than Moore”。前者是为了解决随着器件尺度不断减小,新制程的开发愈发困难的现状;而后者则是开发硅基半导体之外的新材料体系和工艺路线。
在传统硅基半导体技术中,三星近期官宣了3nm芯片量产工艺。三星和台积电等头部芯片企业在研发先进制程时已经遇到微观尺度的建模瓶颈,靠传统DFT软件在效率和精度上难以满足要求。随着器件尺度的不断减小,两大挑战成为硅基半导体材料发展的瓶颈。
第一个是由于尺寸缩小,栅氧化层的厚度仅仅只有几个原子那么厚,量子隧穿效应此时凸显,加剧了晶体管的漏电效应。因此在减少漏电的同时又能保证高性能计算和移动计算,成为该挑战的破局点。如high-κ栅极电介质、栅极全方位的新架构等,AI4S有望通过对微尺度的高效高精度建模,助力相关新材料和器件体系的开发和应用。
第二,由于制程进步,对工具、工艺等环节要求越来越高,其中原子层沉积、光刻、蚀刻等工艺环节尤为严重。AI4S有望通过工艺仿真→预测→搜索优化流程为工艺的改进助力。
另一方面,AI4S借助高性能计算、物理建模和机器学习相结合的方式,不仅可以通过仿真模拟等手段,对半导体材料的工艺进行模拟,加速工艺的商业化应用,还可以对缺陷的生长过程进行计算建模,实现对缺陷的预测。此外,在化学抛光等方面AI4S还可以结合高通量实验发掘最有效的抛光液材料。
3.6 地质学与环境科学领域
在地球科学的基础研究中,AI与地质学的结合更是广泛且深入。但由于目前实验手段的限制,研究人员无法自由地对地球内部形态和性质进行有效的观测,因此计算建模手段成为了重要的研究手段。
例如,通过分析和模拟地质年代学数据,AI可以帮助我们重建地球的地质历史和演变过程;通过学习和理解岩石圈、大气层和水圈等地球系统的相互作用,AI可以预测和模拟地球的未来气候和环境变化;通过研究地壳的构造、组成和动力学过程,AI可以帮助我们预测和防止地质灾害,如滑坡、地裂缝等。
此外,AI还可以与地下水学、火山学、土壤学等地质学分支学科深度结合,从而实现更多的可能性。AI在地质学领域的应用和可能性是广阔且多元的。通过深度学习、数据和基本原理的融合,AI for Science不仅可以帮助我们更好地理解和保护地球,也可以帮助我们有效地开发和利用地球的资源。
环境科学方面,科学家们已经利用AI4S方法为天气预测、污染治理和碳中和、海水淡化等方面提出了研究的新路径。例如AI4S有望通过探索新的碳捕捉路径,从研发端出发找到捕碳低成本路径,如将二氧化碳高效转化为淀粉、燃料等物质,实现高效“再利用”;也可以借助AI4S优化和管理系统的作用,模拟捕捉过程,降低实际生产中的浪费等,拉近实验与产业距离,推进碳捕捉技术未来的产业化应用。未来,面对更高要求的绿色发展,AI4S新范式有机会为环境科学开辟一条发展的“快车道。
3.7 工业仿真领域
工业仿真是利用计算机技术模拟工业系统的过程,目的是在虚拟环境中测试不同的方案,以优化生产流程和设备使用。工业仿真在汽车、航空航天和电子等行业有着广泛的应用。
AI在工业设计中的重要角色是生成式设计。生成式设计算法利用机器学习技术,在给定一组约束(如材料、成本、性能等)和目标的前提下,生成众多设计选项。这种方法使工程师能够探索比传统方法更广阔的设计空间,从而产生创新且有时与直觉相反的设计建议。这些设计往往有更好的性能,减少了材料的使用,更加适应了如3D打印这样的制造技术。
而反向设计是AI可以产生重大影响的另一个领域。反向设计在给定一组特定的期望输出或性能指标的前提下,利用优化算法逆向工作,确定实现这些输出的最优设计参数。这种方法可以与生成式设计结合,以得到更好的结果。在逆设计中,《展望》确定了一些AI可以辅助并且有大量机会的应用,例如飞机形状设计、离子推进器设计、控制核聚变、芯片制造、水下机器人形状设计、应对气候变化、纳米光子学、电池设计等。
总的来说,AI有潜力革新整个工业设计和仿真的周期,从初步设计阶段,到验证,再到制造和维护。公司通过采用AI,可以增强创新能力,缩短开发时间,提高产品性能,最终获得竞争优势。然而,AI在工业设计中的整合也带来了诸如数据隐私、算法透明度和员工重新技能培训等挑战,这些都需要得到解决,以便成功实施。但AI并非万能的,它只是工程师们的一个工具。在使用AI时,我们还需要充分考虑到实际的工程背景和需求,以确保得到的仿真和设计结果能够真正满足工业生产的需要。
本期《润·研》的主要信息来源自北京科学智能研究院、深势科技、络绎科学联合发布的2023版《AI4S全球发展观察与展望》,版权属于原作者,本文仅供科研分享,助力科学传播,不做盈利使用。
参考资料
- 北京科学智能研究院、深势科技、络绎科学联合发布的2023版《AI4S全球发展观察与展望》
根据《网络安全法》实名制要求,请绑定手机号后发表评论