对话蚂蚁支小宝团队：国内大模型竞争加剧，AI金融管家如何释放更大价值？

（图片来源：钛媒体app编辑拍摄）

7月4日-6日，2024世界人工智能大会暨人工智能全球治理高级别会议（WAIC 2024）在上海召开。

本届大会由外交部、国家发展改革委、教育部、科技部、工业和信息化部、国家网信办、中国科学院、中国科协和上海市政府共同主办，围绕“以共商促共享以善治促善智”主题，世界顶级科学家以及企业家、投资人等将齐聚上海，共商AI领域前沿技术、产业动向、向善治理。

相比去年由生成式人工智能（AIGC）崛起引发的大模型“竞技热”，本届大会又将成为AIGC落地应用的“检验场”。

钛媒体AGI了解到，今年WAIC期间，蚂蚁集团应用大模型技术的“三大 AI 管家”将首次集中亮相，包括生活管家、金融助理、就医助理三大 AI 智能体（Agent）产品。而依托在金融、医疗、生活等具体服务场景的多年探索，蚂蚁的AI管家为行业AIGC落地应用探索了新的范式和路径。

其中，作为蚂蚁重点推进的AI应用，据披露， AI 金融助理“支小宝”已服务超过4300万个人投资者，提供市场解读、持仓分析、保险选配等理财保险服务。

当前，在腾讯元宝、月之暗面Kimi等国内大模型超级应用风靡一时下，“支小宝”这种聚焦行业领域的AI助理为何热衷“做专”，又将如何在财务、保险这样的严谨应用中释放更大的价值？对此，近日，蚂蚁集团的“支小宝”团队多位负责人和钛媒体AGI进行了深入交流。

“支小宝定位于为普通人提供高质量的金融服务。但知易行难，当要用最新的大模型技术去实现‘支小宝’这样一个严谨产业应用，有许多具体的问题需要解决。我们为此自下而上做了三层工作，底层是我们面向严谨应用定制的凤凰大模型Finix，中间层是模仿专家思考和工作流程的agentUniverse专业智能体框架，支撑了最上层支小宝的有效顾问服务。”支小宝技术负责人陆鑫（花名）对钛媒体AGI表示， “支小宝”的目标是让每位投资者都有一个AI“私人理财专家”，目前暂时还没有一个大模型或是一个智能助手往这个目标发展。

中国7.2亿投资群体急需AI助手

这些年，中国大众群体对于财富投资的热情在不断攀升。

公开数据显示，当前中国股市投资者有2.2亿人次，基金投资者超过7亿。近年随着移动互联网的普及，很多大众投资者都能便捷地投资各类专业的理财产品，但与此同时，专业的金融服务依旧离普通人较远。

蚂蚁集团财富保险智能服务算法总监陈鸿向钛媒体AGI表示，尽管中国有7亿投资者，但国内的持牌财务顾问人数只有大约20万。这意味着，平均每个顾问要面对3600个投资者，依靠现有人力无法有效填补供给缺口。另一方面，金融服务的门槛又很高，它依赖专业知识，复杂不确定的决策，细致共情的沟通，对行业的专业人才培养提出挑战。大模型压缩了金融通识，同时具备很强的语言交互、认知推理能力，为专业服务的数字化普惠带来一个很大的破局空间和机会。

早在2018年，蚂蚁内部便启动立项要构建一个 AI 助理，起初代号为“安娜”——“支小宝”的前身。

“支小宝要解决的是高质量金融服务的稀缺性，让高质量的专业金融服务普惠到尽可能多的人，”陈鸿坦言。

而随着2022年底大模型和AIGC风靡全球，蚂蚁长期专注在专业服务上，选择聚焦解决大模型落地严谨应用的挑战，逐渐形成严谨应用大模型Finix ，和专业多智能体框架Agent Universe的组合，推动“支小宝”从1.0进化到2.0版本，带来新的蜕变。

新版“支小宝”面向投顾、保顾这样的专业应用大幅优化了其严谨性、专业性以及合规安全。

据支小宝产品负责人杨帆介绍，“支小宝”的金融意图识别准确率从80%提升到95%以上。与此同时，“支小宝”的多轮对话能力也有明显的进步，和用户的对话轮次有40%以上的改进。

陆鑫透露，基于严谨应用大模型Finix和专业智能体框架aU ，“支小宝”产品模仿专业团队，分步建立对宏观、中观、微观金融信息的分析能力，大到整个市场、每个板块，小到具体的基金产品和企业等。通过多智能体协同能力的加持，像人类金融分析师那样提供专业化的服务。“如果想要真正要为用户带来专业的有洞察的信息或者观点，就需要让智能体像这些分析师一样走的更深。”

大模型“幻觉”成行业挑战，如何破局？

当前，AI 大模型应用也面临“幻觉”和数据对齐、安全和治理、市场竞争加剧导致商业化艰难等诸多挑战。

在这其中，投资用户更需要的是准确的数据来源。因此，对于“支小宝”这种AI金融助理来说，减少“幻觉”是“支小宝”团队必须推进的重要工作之一。

陈鸿坦言，在产业里落地大模型技术，为了实现严谨，专业和安全，和大模型不可避免的幻觉对抗是一项关键技术，面向产业真实问题，要建设一个能胜任严谨应用的大模型，就不能讳疾忌医，需要正面面对问题，且从数据、对齐、智能体、测试攻防全链路施策。

“就像人去学开汽车是一样的，人也会有各种内在的缺陷，而大模型也会有内在缺陷，会有幻觉。人也有，也会有注意力分散，也没有办法精准预判会不会撞车，但是我们坐上汽车上路的时候还是可以基本信任司机。并不是说有内在缺陷，这件事情就不能做了。我们依然可以通过一系列的机制和系统性的安排，去让这个事情变得安全可控。对于驾驶而言，是司机必需的驾照培训让他对齐了’安全驾驶’的习惯，叠加汽车和交通系统的一系列安全措施。”，陈鸿表示，对于大模型而言，通过类似的持续对齐训练、教会模型严谨对待数字、实体、计算、事实，识别自身知识边界之外的问题，叠加数据链路、知识增强、工具校验、智能体反思等一系列系统方案，可以有效保障专业应用的严谨性。

陈鸿对钛媒体AGI表示，团队一直在持续对大模型做面向产业的训练和优化，从而更好服务更多用户。

陆鑫则从数据和问答反馈上，列举了两个减少“幻觉”风险的尝试。

其中，数据层面，陆鑫谈到，“支小宝”团队面向专业应用，建设了很多高质量指令集，以保证金融专业性、合规性和数据计算的严谨性。包括支小宝讲出来的金融观点和论据的一致与严谨都做了大量的技术优化，团队为此不惜投入，从大量数据中清洗过滤出有限的高质量数据；问答反馈层面，“支小宝”为了提供更专业的服务，而不只是问答。

陆鑫强调，“支小宝”基于模拟专家协同的多智能体框架agentUniverse，通过内置的评价和反省角色，通过用户反馈识别“支小宝”的能力边界，并不断迭代，让“支小宝”有了一定的自省能力。

在支小宝不断改进认知能力的同时，陆鑫坦言，过去一年，大模型也对其造成了“认知上的最大改变”，从大规模底座，到对齐训练，到多智能体，不断技术升级。

“从2023年到2024年，我基本上是每个月被推着往前去迭代认知和技术栈。如果抱残守缺，守在原来技术层上不往前走的话，认知层面可能会快速的落后，会影响作出正确的决策。”陆鑫表示。“我们可以更乐观地去看到大模型对人类的改变和深远的影响。AI不为替代人而生，而是为每一个人而生。包括理财、理赔这些领域的专家，我们希望让严谨应用大模型技术栈真的帮到他们，成为这些专业人士在AI时代的助力。”

陆鑫指出，今年“支小宝”将不断进行技术更迭，对标领域专家，持续提高 AI 金融助理严谨处理专业问题的能力、个性化服务能力、共情交流能力等，从模拟专家到成为专家，在真实的产业应用中，交付严谨且专业的服务。

陆鑫强调，“我们希望高质量的AI金融服务，能像扫码支付一样走进每个人的日常生活。”

（本文首发于钛媒体App，作者｜林志佳，编辑｜胡润峰）

对话蚂蚁支小宝团队：国内大模型竞争加剧，AI金融管家如何释放更大价值？｜直击WAIC 2024

中国7.2亿投资群体急需AI助手

大模型“幻觉”成行业挑战，如何破局？

敬原创，有钛度，得赞赏