文|赵艳秋 周享玥,编|牛慧
央国企落地大模型,正在进入新阶段。9月的一场大会上,一位资深行业人士告诉数智前线,大模型的落地,已经不局限于某行某业,而是各行各业全面开花,在各企业内部的落地深度和广度,也都往前又走了一大步。
业界观察,一些领先的央国企已经率先完成大模型初步落地试点,开始逐步向更核心的场景迈进。“从今年5月份开始,随着大模型价格战的持续发酵,大模型落地进一步加速,一批场景开始被探索出来,大规模复制,并在财务层面,实现了ROI转正。”百度副总裁谢广军告诉数智前线。
今年下半年,大模型落地再度向前迈进,仅两个半月内,市场上公开可统计的大模型相关中标项目数,已超过上半年六个月的中标项目总数。单月中标项目也已进入上百个阶段。大模型正加速在各行各业全面开花。其中,尤以能源、金融、教育、互联网等行业极为活跃。
快速变化更迭的技术浪潮下,行业交流正在加快。最近几个月,各地已纷纷涌现出各种大大小小的AI大会,而百度,据悉也将在9月25日,召开2024百度云智大会。更多技术的交流和碰撞即将到来。
01 央国企们,又往前迈了一大步
2024年,南方电网已完成了多个大模型相关项目的招采工作,如“南网总调电力系统AI基础训练设施关键技术项目-电力系统NLP大模型技术研究与应用”、“ 南网科研院2024年面向电力行业大模型的安全训练及推理功能集设计研究与组件开发”等。相关团队正联合百度智能云进行联合创新。
在金融行业,某大型国有银行,去年还只是在客服助手、柜台助手场景,展开几千人的小范围试点,今年已将这些功能正式上线全国几大客服中心,并面向全国一线柜台员工推广,大模型的日活达到数万。
在汽车领域,吉利研究院人士在近期一场大会上坦言,“现在车企出去卖车,车上没有搭载大模型,都不好意思卖自己的产品”。大模型在卷智能座舱、自动驾驶,也赋能数字营销、用户运营等场景,最近已开始为吉利旗下所有公司做赋能。
在政务市场,各地政府结合当地产业都做了大模型规划。“先做智算中心建设,今年底到明年Q1,智算中心将规模落地,之后将开启大模型和地方产业的结合。”一位政务人士谈及市场进度。而科教文卫已开始应用落地。“一些三甲医院,甚至已投资数千万,做场景尝试。”一位医疗人士称,院长们关注的是病例生成、人财物的管理、科研这些与服务水平、管理和科研水平紧密相关的场景。
港口这个进出口贸易大通路,也已探索和布局。“我们看到,很多客户把大模型写进了未来三年的IT规划。”百度智能云物流运输解决方案总经理扈维告诉数智前线,不同于过去几轮技术变迁,这一轮里“观望的少,上手试的多”。
比如,货物吞吐量全球第一的山东港,目前已完成大模型在智能问答和智能问数的试点探索,这两项功能已面向全体员工上线。
在化工行业,中化信息和百度智能云一起,探索利用大模型进行新材料的研发,知识助手“化小易”能够通过自然语言提问,检索回答分子特性、分子合成路线等专业知识。目前,特定分子的检索效率提升5倍以上,研发工作效率得到极大提高。
这种热烈情绪,也反映在招投标市场。公开数据显示,今年1-8月,国内大模型中标项目数量已经达到2023年全年数量的5倍,中标金额达到去年全年的2倍。其中,头部大模型厂商在拿单上依然占据主导。百度在大模型中标项目数量、中标金额、覆盖行业以及覆盖央国企数量,四个关键指标上排名第一。
而据数智前线不完全统计,7月1日至9月15日,仅两个半月内,大模型相关中标项目总数至少有286个,成功赶超上半年6个月的项目总数。
采购方中,运营商、能源、教育、政务、金融等,依然出单最多。一个明显迹象是,一些企业提出更多更细分的需求,数据采集和治理、大模型安全、人才培育等采购都在大幅增加。
比如南方电网,在7月至9月中旬的两个半月内,完成了至少15个大模型相关项目的招采工作,国家电网也在Q3有多个大模型相关项目完成招投标。
百度智能云能源电力行业总经理李超告诉数智前线,南网早在去年9月,就发布了自主可控大模型——“大瓦特” 。其中,百度智能云千帆大模型平台为电力调度场景提供了技术支持。今年Q3,南网完成了最核心业务部门——南网总调的大语言模型选型工作,百度成功入选技术服务方。
02 大企业们,讲求“顺势而为”
这轮最早向大模型跃迁的企业,原来几乎都有小模型的底子。如工行在2021年前后已立项,想用“更大的模型”搭建OCR等业务应用。“ChatGPT来了之后,他们顺势把大模型项目立了起来。”一位金融人士告诉数智前线。
安全生产市场受到政策监管,对央国企而言几乎是一个底线。此前,国家能源集团最大的风电二级公司龙源电力,采用传统小模型安全方案,纳管了旗下200多个风场、1万多台风机,形成生产现场从安全监视、分析、告警到处理的闭环。今年二季度,百度中标了该项目升级版,将结合CV大模型的泛化、识别更准确的特点,以及大语言模型的能力,让之前大量采集的信息真正用起来。
什么是原来小模型不能干、现在大模型可以发挥价值的?扈维举例说,港口里的调度,人员排班、泊位、堆场等,以前都用小模型分别做过,效果也不错,像堆场计划,其实是一个数学算法问题,小模型非常合适。但是,将这些合到一起做“一体化调度”,小模型实现不了跨数据集、跨设备之间的大规模协同计算、协同统筹。“我们特别希望大模型能够解决,挑战是港口里的数据汇聚,要花时间。”
在工业行业,传统CV小模型在遇到小样本时,识别率比较低。而借助CV大模型,可以提升小样本数据的识别率。
不少企业也缺少知识管理、沉淀和应用平台。现在借助大模型和知识检索,企业可以形成知识管理的平台能力,完成隐性知识的显性化、显性知识的结构化、结构知识的关联化、关联知识的流动化这些工作。
很多企业定期要召开生产经营会,对齐数据是一个非常困难的事。而借助大语言模型,可以更快、更准地去汇总、抽取结果,完成初步分析,对用户来说价值非常高。
03 走入核心业务,要找到“手和脚”
李超观察,过去两年,大模型的应用还属于起步期,集中在办公、客服这些助手场景里。这与投资达数千万、上亿甚至百亿规模的央国企管理层的期待,是完全不一致的。现在,大模型要深入企业的核心业务。
“在能源行业,我们在投入一个方向——仿真优化。”李超说。在行业里,有大量的工作任务与机理、科学计算相关,这是大语言模型或CV大模型没办法做的。“这些问题不解决,我们所畅想的未来——以大模型为能力中心,提供一个完整的Agent服务,是无法实现的。”李超说,未来一定是大模型结合专业领域的小模型,才能深入到客户核心业务场景里去。
“过去几年,我们在这个方向上打了一些基础。”李超说,百度提供仿真优化引擎,与行业伙伴一起进入电网调度、石油石化炼化、油气勘探场景,探索电网调度的电网潮流稳态分析、石油石化的空能岛运行优化、脱硫脱硝等与机理模型相关的实际项目落地。今年9月,百度也参与了国家管网智能调度的投标。
“这些都是客户非常关注的核心生产方向。而且,我们认为这些方向是未来以大模型为调度中枢,整体构建一些智能体的服务时,必不可少的这个‘手和脚’。”李超说,他们将特别投入精力,来规划这些“手和脚”。大模型是大脑,有了这些“手和脚(专业的API)”,才能真正实现核心场景服务。
“在港口,我们先通过问答和问数,让客户看到,原来大模型是靠谱的,然后再逐步切入核心业务系统。”扈维说,“我们在山东港口集团已在规划下一期,会更多深入到业务场景。”港口是一个复杂的交通枢纽,最核心的就是货、人、卡车、龙门吊等的调度。此前,港口引入的TOS系统(码头操作系统),逐步加入了AI算法。而大模型能进一步解决更多元数据接入的问题。
随着大模型走向生产核心系统,全球大模型核心比拼的一项能力是逻辑推理。“我们在客户现场做的测试中发现,不同大模型对于复杂问题的逻辑推理,差距比较大。”另外,以前港口里布置的大量摄像头产生的视频资源,其实没有用起来。现在的一个方向,就是把这些原有的硬件和图像资源,利用多模态大模型做整合,从而达到一个更好的全局协同。“这是我们在探索的一个方向。”
04 74%的AI工作负载都在云上
大模型落地是个复杂的系统工程,随着企业进入深水区,一些落地的门道和路径,正在加速浮上水面。
“我们去对接客户时,第一件事,是要帮他们摸清大模型的边界。”扈维告诉数智前线,为避免认知不统一而导致后期出现交付不了或离客户预期太远的局面,他们现在基本每个项目,都会经过“轻咨询+落地实施”的完整过程。
在智算算力的搭建上,IDC的数据显示,74%的AI工作负载都在云上。但今天智算的技术范式已发生变化。在CPU云时代,大家最关注弹性和极致性价比,而GPU云则是能不能发挥一个大集群的算力能力。这样的集群不仅成本高昂,也有一定的技术门槛,因此,云厂商仍然是一个主要角色。
除了算力,数据的重要性在不断显现。据数智前线不完全统计发现,2024年Q3,数据购买、采集、治理等相关的采购正大幅增加。
在数据层面,比如港口客户的数据都存在各码头公司的服务器里,扈维建议客户成立专门的数据小组。
谈到数据,还有更深层次的问题。“现在业界谈大模型必谈数据,但坦率来讲,很多都是空谈。”一位行业人士坦言。
“大模型时代,数据到底要怎么准备,怎么治理,怎么把不同的数据应用到大模型训练的不同阶段里,绝大部分人都还是在盲人摸象。”李超表示,百度也在这个过程中踩过不少坑。
比如,当基于通用模型训练行业模型时,数据该怎么配比就有技术门道。喂给大模型少了,效果不明显;喂多了,模型又不容易收敛,甚至可能导致模型的通用能力下降……这些踩过的坑,后来都被沉淀了下来,形成了一套工具和方法论,通过千帆平台和专门的技术服务团队,对外输出。
大模型技术和应用之间也容易出现断层,很多“用户单位不了解AI,AI的单位不了解行业”。李超介绍,为解决断层,他们除了配备具有行业背景的解决方案架构师外,也会在伙伴挑选时有所侧重。“能源行业合作伙伴,我们基本只选两类,一类是客户产业单位,一类是在客户产业公司里做人力外包服务的公司。”李超告诉数智前线,他们的共同特点是,既深度参与和理解客户业务,又了解IT行业。
此外,大模型在具体场景的落地过程中,还需要做很多工程化工作。比如大模型习惯以“总分总”形式输出答案,回答每次也有所不同,但有些客户更习惯“先分后总”的方式,并且希望回答能实现“复现”。“即便只有语序、语法的微小变化,有些港口领导也是不能接受的”,扈维举例说,这就要求他们做很多工程化工作,保证大模型的输出符合客户预期。
从企业落地整体情况来看,客户的需求维度是360度的。有趣的是,目前所有云公司都在从云的合作伙伴,转向AI转型战略伙伴,围绕AI基础设施、算法模型、数据、部署调优以及定制化等,进行整体技术能力升级。
05 人的因素
一位科技企业CIO在大模型建设和应用推广中,遇到了不小的阻力:一线员工和部门不配合,哪怕是领导说了也没用。当公司上了代码助手后,综合效率提升了1/3。“虽然我们很少谈论减人,但确实意味着写代码的人,要往开发的前端或后端转岗。”一线员工担心被裁员,一些业务部门有地盘意识,这都是现实问题。
在很多传统行业大企业,最大的阻力来自工作惯性。很多一线员工都是老师傅,现在让他用上设备检修助手,他会说,“有事情还不如我自己倒腾试一下,或者我给老张打个电话,一辈子就是我们仨一块干的”。
“大模型是个一把手工程。”一位金融业人士观察,需要从上到下推进。高层领导在公开场合支持标杆项目。“有时不反对也是一种支持。”
“在前期把业务部门拉进来,一起参与到建设和最后采纳推广中。”爱分析创始人CEO金建华说。像维修助手,可能集团有集团的想法,子公司有子公司的想法,一线员工有一线员工的想法,怎么把大家的收益预期对齐?这是一个有关平衡的问题。比如,有些知识图谱建设由二级公司老专家来做,让大家为共同目标推进。
企业也需要定期披露标杆项目运行情况和业务收益,公开予以激励。“比如给员工一些积分,并与一些制度挂钩,兑换一些礼品。”扈维观察。“我们会与绩效、奖金直接挂钩。”一家科技企业CIO说,“虽然有些简单粗暴,但确实有效果。”这需要管理层的配合,以及调动HR资源。
第一次使用的留存率也很重要。要想办法把改版迭代后员工第一次登录的体验做好,比如入口做得足够清楚,以前不准的现在准了,企业员工就会持续使用。
从业务部门视角,设计有感染力、有画面感的故事,让一些老师傅现身说法,可能会有感染性。项目的日活、月活等数据同样重要。这些都是培养企业的AI文化。
大模型的落地浪潮还在持续汹涌。激流之下,产业链上各路玩家,都在持续加码, 推动更多企业实现数智跃迁。
根据《网络安全法》实名制要求,请绑定手机号后发表评论