银行业大模型落地，遇到五大难题｜钛媒体金融-钛媒体官方网站

开发阶段的技术门槛、人员和成本问题，数据来源、数据质量和隐私保护问题，运行过程中的算力和存力配置问题，对客层面的可解释性和信任度问题，开发后的内部员工“恐惧”问题。

AI生成图片

由于银行业本身的特性，不管是政府层面还是行业监管层面对银行数据的合规性、安全性、准确性、可信性都存在较高要求，因此运用在银行业的大模型技术都是研发成熟品。从整个大模型行业来看，部分业内人士认为，银行业大模型的落地进展略滞后于整体行业。软通动力孙洪军表示，他们最初预测金融行业可能会最先大规模使用大模型，但从最终对接客户的情况来看，金融行业不如法律、招聘等行业走得快。

银行业的大模型正面临着落地困境，因此对于现阶段还未开发大模型的银行，第一步是列举出目前银行的大模型困境，并思考如何解决这些“桎梏”，而不是盲目跟风训练大模型。

目前限制银行大模型发展的难题主要来源于五个方面，分别是，开发阶段的技术门槛、人员和成本问题，数据来源、数据质量和隐私保护问题，运行过程中的算力和存力配置问题，对客层面的可解释性和信任度问题，开发后的内部员工“恐惧”问题。

开发阶段的技术门槛、人员和成本问题

由于银行大模型需要进行大量数据的训练和长时间的实验，因此开发银行大模型需要长期战略发展规划，需要投入高性能设备、庞大的算力资源、长期的无回报资金以及专业的技术人员支持等，这使得该技术在开发阶段就存在很高的准入门槛。据公开财报数据显示，多家国有银行在金融科技方面投入都是百亿级别，多家股份制银行投入占比在近几年出现明显提升。

除了技术门槛高，成本高之外，最不确定的是人才的缺失，对于目前金融人工智能领域，不仅仅是技术人才的缺失，更多缺乏的是复合型人才。银行大模型人才不止需要拥有人工智能领域的知识储备，还需要具备所处垂直行业的知识，也可以说即使学了大模型知识但缺乏对于行业、业务流程、数据的认知也是无法称之为大模型人才。腾讯云副总裁胡利明表示，AI大模型的人才缺口非常之大，头部机构目前都在招一些AI专业相关人才，如算法博士等。

当然，银行虽然可以从大模型厂商处获得一定的技术支持，但落地到场景中还是需要银行具备一定内储人才，能够对整个大模型的场景应用进行构建、运营、规划以及创新，在内部使用中不断试验新参数、新场景，不断与外部厂商协作，共同调准、调优和调精大模型，不断拓展大模型应用的场景和效果。业内人员表示，“大模型是半生品，离成品还差得很远，必须是领域内的人一块努力才能做成成品。”大模型的应用可以解决传统效率上的问题，但是归根到底要使银行得到真正的提升还是得回归到打造一支既有技术又明白银行战略规划和需求的团队上。

数据来源、数据质量和隐私保护问题

银行内部存在海量的数据，其中包括交易数据、客户信息数据、风控数据、绩效数据等，由于对数据源头的存档要求，银行数据中包含了大量非结构化数据，如图片扫描数据，这些非标数据不仅占用了大量的存储资源，还可能产生重复记录，但因无法进行标准化整合、分析和利用，大大降低了员工和设备的运行效率。大模型的出现可以很好解决这个问题，但是它也需要大量的数据进行训练。由于存在改制、变更、优化等因素，银行积累的数据可能存在数据质量问题，包括数据遗漏、数据约束、数据安全等问题。

一是数据遗漏，也可以称为数据缺失，它包括完全随机丢失、随即丢失和完全非随机丢失，造成数据缺失遗漏的原因可能是信息暂时无法获取，人为没有记录、遗漏或丢失，数据采集设备、存储介质等设备故障等，特别是年份越久远的数据越可能出现缺失。在这样缺失的数据库背景下，训练出来的大模型可能会产生“偏见”，失去部分有用信息和反馈，特别是对于特殊案例，由于数据量少，这个数据群体表现出显著的特殊性和不确定性，一旦数据产生缺失可能导致确定性成分再次降低，从而使得大模型输出的结果不准确。

二是数据约束。由于银行之间存在信息壁垒，仅仅依靠自家数据所训练的大模型可能存在“偏见”，例如有些银行对公部门强但零售较弱，就可能出现对公数据较全面但零售数据缺失的现象，因此训练来的零售大模型精准度存在一定偏差。金融大模型需要大量的数据，而目前银行业之间进行数据共享存在难度，这不仅仅是公司层面的“不愿意”，用户也会担心隐私信息泄露，因此目前大行的大模型准确度优于其他银行便是因为它占据了数据源更丰富的优势。

三是数据安全，能解决数据约束问题最好的方式就是数据融合和数据共享，但是这便面临着数据安全的问题。由于大模型的普世性较低，更多被理解为“暗箱”、“黑盒”，这也是许多LLM（大语言模型）的通病，而金融行业对于决策的容错性很低，一旦发生问题，后果则非常严重，会出现公司和客户隐私泄露、资金损失、金融欺诈等风险，因此这样“不可解释”的结果并不能给用户传递安全感，从而导致部分客户的抵制。

运行过程中的算力和存力配置问题

大模型可以将传统应用中耗时几月进行数十亿级别的文件处理压缩到一天内，这是一个百倍千倍的提升，这也同样对算力和存力进行了相应的提升要求。

首先是算力建设，对于大模型的研发来说，最大的挑战之一就是对庞大的算力基础设施的需求。训练大模型的算力平台并不是算力的简单累加，随着模型的规模的增大，低单卡算力也会被淘汰，因此伴随着大模型的升级以及算力的提升，硬件的成本也在持续上升。此外，算力平台的构建的难点在于服务器、存储、网络等硬件设备的集成以及继承后训练设备软硬件兼容性和性能的know-how，要搭建最坚实算力平台的方法就是自建算力，但这也存在成本高昂的缺点，目前只适用于资金实力雄厚的大型银行机构。对于中小银行而言，由于投入成本和回报率原因，更多采用算力混合部署的方式，即在敏感数据不出域的情况下，接受从公有云上调用大模型服务接口，同时通过私有化部署的方式处理本地的数据服务，但这也存在安全性低的缺点。

其次是存力建设，存储平台实现数据的高效流动，从而衔接整个大模型的开发训练和应用，没有高性能的存力性能则无法支撑大规模数据的存储、读写和传输。大模型数据集要求加载的速度，这就需要有匹配的存力支持，以避免无法将数据及时加载到GPU中，造成昂贵算力空转。当数据和处理文件达到一定数量时，大模型要求存储系统具备强大的元数据管理能力，这包括数据加工处理、数据调度、数据异常处理等能力。此外，高存力能够保证模型训练中断后能快速回复训练，且尽可能不出现前后不一致的现象。

对客层面的可解释性和信任度问题

大模型的决策过程往往难以解释，这使得银行难以向客户解释模型背后的计算逻辑，这也是部分客户不信任大模型不愿意托付数据的原因。此外，大模型在生产内容的过程中，可能会产生“幻觉”，即由于训练数据及模型的不全面而产生事实性的错误，这更加重了阴谋论者对大模型的猜忌。目前已有公司正在尝试解决这一问题，OpenAI 公司加强了对大模型迁移学习和对抗训练，数据显示，在经过调教过后的大模型回答准确性提高了40%。由此可见，随着模型的优化和数据库的建设和完善，大模型的准确率是可以得到大量提升的，一旦在银行端的应用回答准确率达到一定水平就可以解决客户信任度的问题。

开发后所引发的内部员工“恐惧”问题

伴随大模型越来越广泛的应用，已在银行业内掀起了一波“将本增效”热潮，这对金融行业的人员结构带来新的挑战和变革。招行金融科技高层人员分享了大模型对人的替代效应，他表示如今招行内部已建立文档信息归总的大模型，它能够对每日会议内容快速形成纪要，能够撰写高满意度的汇报文案……大模型对内部员工工作的执行效率进行了质的提升，可以说它替代了以前“白嫖”实习生和初级员工所能进行的工作。

随着越来越多工作被人工智能替代，甚至代码都可自动化，这就意味着一切与数据、编程相关的岗位都受到了大模型的“威胁”。据钛媒体APP了解，目前许多互联网、金融科技公司正在裁员，其中包括大数据分析师、产品经理等多种与数据相关的岗位，而银行保险业则早就在裁员行列中的，这也是“打工人们”所担心的。

大模型设计的初衷是将本增效，虽然一定程度上会减少重复劳动力，但不代表完全替代人类劳动力。部分银行明确不希望大模型带来减员，如拥有20万网点员工的工行，它明确向华为提出，他们不希望员工被大模型取代，而应该是大模型带来新的机会，提升员工的服务质量和工作效率，同时也释放出部分员工，做更多高价值的事情。大模型发展是人员优化为目标而非人员缩减，这其中存在对公司员工和结构稳定性的考量，同时也因为银行仍存在很多机会和岗位人才缺口，这部分工作是大模型暂时无法取代的，因此这部分工作需要员工先进行开发。据钛媒体APP了解，重点发展金融科技银行的IT部门仍承担了很多工作和排期问题，存在“劳动力不足”的情况，因此大模型的出现是为了帮助员工将效率提高，更快实现需求的落地，而非裁员。

目前从学术学校层面出发，人工智能专业知识已相对完备并且学习人工智能专业的人才已比比皆是，相比之下，拥有大模型课程的学校则少之又少。市面上已有对人工智能专业的学校排名榜单，但对于大模型专业的信息却非常局限，一是缺乏开设相关专业的学校，二是学校缺乏相关专业的老师进行授课，三是缺乏系统性学习的材料。目前大模型行业的专家多是出自于传统计算机科学与技术专业，由此可见科技的发展带动人才的转型，专业并不限定职业和发展。

银行大模型的稳定和成熟还需要时间

有业内人士认为，金融大模型的热度还可能持续一年至两年，到第三年在专业领域或许会大规模涌现成熟应用，第五年后开始进入高速增长期。一项新兴技术大致都需要经历快速涌现、试错发展、监管整治、理性发展四个阶段，对于现阶段的银行大模型，技术仍处于探索和试错阶段，因此要解决上述困境并不是技术上的不可达到，而是需要时间上的尝试和积累。（本文首发于钛媒体APP，作者｜李婧滢，编辑｜刘洋雪）

更多宏观研究干货，请关注钛媒体国际智库公众号：