号称“全能医疗AI”， GMAI有多厉害？-钛媒体官方网站

图片来源@视觉中国

文 | 追问NextQuestion，编译：李鹏

肉眼可见地，人工智能领域正在以螺旋式上升的态势飞速发展。

其中，基于根基模型（Foundation Models）的AI应用程序数量也在迅猛增长。根基模型之所以叫这个名字，是因为它为AI系统提供了一个新的范式，开发人员可以在它的基础上构建新的专业应用模型或生成多个应用程序。

像ChatGPT这样的生成式AI就是由根基模型提供支持的。显然，这类大型AI已经显现出复杂推理、知识推理和超出分布稳健性的能力，能够完成用户提出的各种任务。

然而，一些小规模、专业化的模型却不具备这些能力。由于难以获取大型、多样化的医疗数据集，以及医疗领域具有复杂性的特征，快速发展的根基模型并未广泛渗透到医疗人工智能行业之中。当前的医学人工智能模型仍大多采用特定任务的方法。例如，一个胸部X光模型可以在一个数据集上进行训练，通过大量的注释来分析每个明确标记为肺炎阳性或阴性的图像。这也就意味着，这个模型只能检测肺炎，无法适配到全面的放射学报告诊断中。

这种基于特定任务的方法所训练出的模型不太灵活，仅限于执行由训练数据集及其标签预定义的任务。这样的模型如果在另一个数据集上进行再训练，通常就不能适应其他任务（甚至无法完成同一任务的不同数据分布）。在获得美国食品药品监督管理局（FDA）批准的500多种临床药物人工智能模型中，大多数的模型只被批准用于1到2个狭窄的任务中。然而，以ChatGPT为代表的大模型的日益成熟，让医疗AI的研究者看到了打造通才型（全能型）医疗AI的希望。

▷图注：发表论文封面 图片来源：nature

4月12日，Nature发表了一篇题为《通用医学人工智能的基础模型》（Foundation models for generalist medical artificial intelligence）的文章，作者来自斯坦福大学、哈佛大学、多伦多大学和耶鲁大学医学院。这篇文章为医学人工智能提供了一种新的范式，称为通用医疗人工智能(generalist medical AI, GMAI)。

GMAI模型可以使用少量数据或没有指定标记的数据来执行不同的任务。通过在大型、多样化的数据集上进行自我监督，GMAI将灵活地解释不同的医疗模式组合，包括来自影像、电子健康记录、实验结果、基因组学、图表或医疗文本等多种形式的数据。在输出方面，模型可以通过其先进的医学推理能力呈现出易于理解的结果，如自由文本解释、口头建议或在图像上加以注释。

▷图注：GMAI模型概述。a、GMAI模型通过诸如自我监督学习之类的技术在多种医学数据模式上进行训练。为了实现灵活的交互，数据模式（如EHR的图像或数据）可以与文本或语音数据形式的语言配对。接下来，GMAI模型需要访问各种医学知识来源以执行医学推理任务，释放可用于下游应用的丰富功能。由此产生的GMAI模型然后执行用户可以实时指定的任务。b、 GMAI模型为临床学科的众多应用奠定了基础，每个应用都需要仔细的验证和监管评估。图片来源：nature

从上图不难看出，GMAI模型有望在多种医疗场景中解决多样化和具有挑战性的任务，它为用户提供了通过自定义查询从而与模型交互的能力，这可以使包括医生、护理人员、检验人员、患者在内的不同受众都能理解人工智能给出的解决方案。使用者可以不断地给GMAI指定新任务、解决新问题，而不再需要重新给出训练模型让AI从零开始学习训练后再投入使用，这大大节省了机器训练的时间和成本。此外，GMAI可以通过其接受的医疗领域的先验知识来解决更多问题，基于最新的检索方法，在现有的数据库中检索出文章、图像或临床案例等它所需要的知识。

▷图注：GMAI三种潜在应用的说明。a、GMAI可以实现多功能的床边决策支持。b、放射学报告配备了可点击的链接，将每个发现可视化后提供给医生。c、GMAI有可能对模型开发过程中从未遇到过的现象进行分类。在增强程序中，通过利用医学领域知识背景逐步推理来解释发现的罕见的异常值。图片来源：nature

研究者给出了多种可以在临床上使用GMAI的潜在方案。例如，在放射科功能报告中提示放射科医生，显示之前图像中没有出现的新的多发性硬化症病灶。参与团队的外科手术（如内窥镜手术）过程，将整个过程可视化，或提供口头信息，如在跳过手术步骤时发出警报，或在医生遇到罕见的解剖现象时阅读相关文献，给出手术建议。

GMAI所面临的机遇与挑战

作为一个基于AI的聊天界面，GMAI会利用人类的反馈来强化学习和改进模型，以此来适应下游程序。这样的学习能力是GMAI模型自然生成的，但这样的灵活性可能也是一把双刃剑：在基础模型中存在的任何故障都可能会导致其所有下游应用程序受到影响。

如前所述，当前的医疗AI模型大多是为特定任务而设计的，因此对专业的模型来说，只需通过一两个适用的数据集即可完成验证，但对于通才型选手GMAI来说，由于其前所未有的通用性，将非常难以被验证，加上GMAI可能会面对它们从未见过的任务，预测它们是成功还是失败，将是一项非常有挑战性的工作，因为临床医生可能无法处理比它更复杂的信息，自然就更难判断它的决策正确与否。由此，GMAI这种广泛的应用能力或许需要相关机构和政府加强监管，重塑新的责任制度。

结语

GMAI的出现让医疗行业的研究人员看到，AI也具有巨大的潜力以改变整个医疗健康体系。作为一种高级的根基模型，GMAI将可互换地解析多种数据模式，动态地学习新任务，并利用医学领域知识，在几乎无限范围的医疗任务中提供决策。它的灵活性允许其在新的环境中保持相互关联，并与新兴的疾病和技术保持同步，而不需要不断地从头进行再培训。

尽管颇具前景，但它仍然面临着独特的挑战。它们的多功能性使之难以被全面验证，它们的大小可能会增加计算成本。毕竟GMAI的训练数据集不仅要很大，而且要多样化，并需要充分考虑医疗数据的隐私保护问题。但无论如何，GMAI为医疗AI行业带来了前所未有的可能性，我们期待它能在健康医疗管理体系中发挥重要作用，造福人类健康。

参考文献：

[1] Jason Wei, Yi Tay, Rishi Bommasani et al. Emergent Abilities of Large Language Models. arXiv:2206.07682, (2022).
[2] Food and Drug Administration. Artificial intelligence and machine learning (AI/ML) enabled medical devices. https://www.fda.gov/medical-devices/software medical device sa md/artificial intelligence and machine learning aiml enabled medical devices (2022).
[3] Moor, M., Banerjee, O., Abad, Z.S.H. et al. Foundation models for generalist medical artificial intelligence. Nature 616, 259–265 (2023).

号称“全能医疗AI”， GMAI有多厉害？

GMAI所面临的机遇与挑战

结语

敬原创，有钛度，得赞赏