人力赛道+大模型，没有砸出想象中的水花 | 钛媒体深度-钛媒体官方网站

图片来源@视觉中国

大模型在企业级市场落实一段时间后，没有砸出想象中的水花。

“都是公网数据，企业不敢用。实际应用场景也很少。”一位HR企业级软件的售前专家告诉钛媒体。

现在这家企业主要将场景落地在了人才发现、简历评估和面试提问追问三个核心场景。钛媒体了解到，现在市场上能够感受到企业裁员、收紧招聘需求的信息，但这并不影响高质量人才的流动，尤其是对于中大企业的招聘需求，需要对人才的识别、人效挖掘上有一定的能力提升；同理，到了简历评估和面试环节，也需要减少依靠经验判断不足，或者得不出有效结果的情况。

但实际上，这家企业的客户案例不多，为客户训练出的大模型被称为“不断迭代的过程”，收费则是计划以订阅模式收费，目前接受这一做法的试点客户来自全球500强的跨国公司和国内业界领先的企业。

实际上，客户需求市场对生成式AI产品或大模型技术也充斥着不同见解。钛媒体了解到，尤其是对于大企业客户，虽然有不少企业客户公开宣传在积极尝试大模型，恨不得以此解决当前业务遇到的所有痛点，但同时，也有企业客户对此不屑一顾，认为自身已经积累的经验和人才，不会简单被大模型所替代。

“大模型的开发训练依然很复杂，能不能做到更加简洁？”在与国内某头部ICT厂商的闭门会上，一家传统能源行业客户提出了这样一个疑问。

该客户明确指出：“虽然过去推进智能化取得了一定成果，但跟我们的想象还存在非常大的差距。”除了该行业本身生产作业复杂的自然条件外，各个下设厂家对智能化理解的不足，导致投入了大量资金，却仍然各自为战。

另一方面，大模型现阶段并不“便宜”，能用得起大模型的企业，要么具备一定的生产体量，要么手里有一定预算，认为大模型所带来的生成式技术值得尝试和布局。

某AI上市企业负责人近期谈及大模型创业时指出，“市面上大模型具备一些基本能力，但只是玩具或工具，大模型不只是这些能力，更关键的是实现商业变现。”

事实上，无论是文生图、还是文生文，大模型技术驱动的生成式AI确实展现出了其巨大的应用场景。据钛媒体不完全统计，目前相继参与其中的巨头公司、AI创企已不下50家，而通用大模型也在尝试接入多个云平台，供企业调用或定制开发私有模型。

值得一提的是，OpenAI在11月6日举办的首届开发者大会上，对其接下来发力的方向进行了说明，包括：加强文本输入长度，输出模式符合预定模式，更多更优质的训练数据，更多的多模态，领域知识和业务逻辑，以及更优惠的价格等方面。

这对于其他AI开发者或使用方而言是个好消息，但对在座的各位大模型技术创业派而言却是悬顶之剑。

与此同时，生成式内容的合规审查和隐私安全也是大模型或生成式AI技术想要在市场中普及的必要前提。

在国内，10月11日，全国信息安全标准化技术委员会官网发布《生成式人工智能服务安全基本要求》（征求意见稿），面向社会公开征求意见。这是国内首个专门面向生成式AI安全领域的规范意见稿，也是对7月网信办等七部门推出的《生成式人工智能服务管理暂行办法》的支撑。

相比大模型到来时的狂热与喧嚣，到了真正落地的阶段，大模型在行业内如何深入应用的探索和考验才刚刚开始。

每款产品都值得大模型重做？

“每个产品都值得用大模型重做一遍”，这是初入大模型应用层企业的普遍叙事。

但在将产品重做一遍之前，还有一个更基础的问题：大模型能用在哪儿？

在B端市场，这个问题可能更难回答，或者很难有唯一的答案。

从国外Meta的LLaMA系列、Stability AI的StableLM系列、MPT等模型的开源，以及国内通用大模型面向企业级API的内测，激起了更多创企的跟进试用。

如果将一套招聘流程拆解为简历收集、筛选、测评、面试、Offer及入职，在整个链条上，大模型驱动下的自然语言交互技术，最直接体现在提高HR招聘效率和改善用户体验。

作为一家智能招聘管理软件企业，MOKA倡导用AI对核心人力系统进行改造。今年6月底，MOKA公布上线基于大模型的智能产品解决方案Eva，包括简历筛选、定制面试题、AI写面评、对话式BI、员工ChatBot。例如，员工Chatbot功能用于员工完成与招聘、人事相关的任务并获取相关信息，类似于提供咨询的AI助手。对话式BI以自然语言的界面进行交互，让员工快速访问数据库，查询关键指标，支持业务决策和管理。

类似地，北森首先公布了基于百度文心一言大模型的内测功能——招聘JD撰写和招聘海报制作。在5月的春季发布会上，北森还推出了全新AI产品个人领导力教练Mr.Sen，用于新晋领导者的转型适应、团队管理、个人发展、绩效反馈等方面。据北森CEO纪伟国透露，AI面试、员工服务机器人、陪练机器人等都将是大模型可结合的场景。

用友、金蝶则选择通过融合通用大模型能力，结合基于自身私域数据，以训练应用于人力、财务、供应链等流程软件场景的企业级领域模型。

用友高级应用架构师包飞与钛媒体交流时指出，“现阶段大模型距离行业落地还是比较远的，客户最关心的是能在行业里带来怎样的价值。”

目前用友YonGPT所支撑的领域模型应用名单包括：企业经营洞察、智能订单生成、供应商风控、动态库存优化、智能人才发现、智能招聘、智能预算分析、智能商旅费控、代码生成等数十种。

而金蝶苍穹GPT目前主要在财务、人力、程序研发场景。例如，金蝶首个公布的财务大模型，实现类似一个财务AI助手，提供财务问答、费用报销、合同审批、报告生成、分析预测等服务。

钛媒体此前报道，金蝶中国执行副总裁、研发平台总经理赵燕锡在调研时发现企业对大模型确实有浓厚兴趣，但提及率最高的两个反馈，一是“AI焦虑”，怕不用AI则会落后；二是“AI迷茫”，不知道怎么用到业务里。金蝶的策略是，先找一批原型客户做业务场景的试点验证，更贴近企业的实际业务。

在i人事CTO王景飞看来，“客户关注更多的不是用了哪个大模型，而是大模型对于业务的帮助是什么。老板关注企业经营，就会关注经营指标，如人均产出，投入分析，成本优化等；HR会关注员工体验，工作效率，如更流畅的人事流程（入转调离、加班调休等等）。”

专注于核心人事+人效的i人事，也在跟钉钉合作推出运营效率、风险管理和业务专家三类智能化方案，其目的就是解决企业老板最关注的问题：用最科学的方法、在风险最低的前提下，最高效地实现企业战略。

运行效率方面，通过大模型能力，可以为员工提供7*24小时，全年无休的人力资源咨询、流程和其他支持；人事风险管理专家，可对人力资源中可能会出现的风险进行管理，如对劳动合同内容的潜在风险进行预警、提出修正建议和风险预案等；业务专家中的绩效专家，可以指导企业员工如何完成OKR的目标拆解、对齐和复盘工作。

找试点场景、找原型客户，也是绝大多数大模型应用厂家的策略。

是技术黑盒的问题，也是现实投入的窘境

但落地到最终用户那里，由于企业业务逻辑、组织形态的千差万别，大模型从“测试”到“全面落地”，是ChatGPT还是“ChatPPT”，仍存在一定迷惑性。

“我们没说我们已经做到了，但是能在客户刚好有这么一个强需求的时候，给客户做个技术参考，因为有时技术太前沿的话，客户管理还跟不上，这也只能让客户产生一种垂涎三尺的感觉。”一位HR SaaS团队负责人A对钛媒体表示。这家企业目前计划在SaaS版本融入第三方AI大模型能力，在问及是否已经落地时，该负责人不置可否。

在上述不同厂家的内测产品描述中，大模型并没有在各自领域的应用范式带来颠覆性改变，更多是针对不同环节增加了多一项交互方式的选择，衡量的标准无非是“够不够理解人类语言，能不能产生相关智能化动作”。换言之，智能化水平强弱并非由软件所决定，而是由背后使用的大模型决定。

客观上，大模型是个概率模型，生成什么样的内容完全属于改变，想要取得更精准的结果还受限于数据、场景、人才、成本等问题，这都跟现实条件的投入情况相挂钩。另外，应用厂家还会选择跨多个模型开发，目的是降低因模型企业经营和政策引发的潜在风险。

这是作为大模型面向市场必须考虑的问题。

据Oracle Cloud HCM产品负责人透露，Oracle产品约80%的迭代都是由客户需求推动。目前Oracle已经确定了100多个人力资源生成人工智能的高价值场景，如辅助编写、推荐方案、汇总等，并且才刚刚开始。

Oracle Cloud HCM是以OCI云平台为基础，内嵌生成式AI相关能力。一方面，客户可以使用自己的数据来优化模型，平台提供对客户敏感信息和专有信息的保障，同时，通过内置提示词生成更符合用户需要的内容，同时减少事实错误和偏差。

为尽可能将大模型适用于企业级场景，包飞指出，目前用友的解决方案是，一部分会依赖于专家经验，同时也会实现业务化的流程管控，包括在大模型更上层增加一个管控层，针对于生成结果进行可靠性和合规性管控。

而在8月大模型监管法规出台之后，i人事会优先考虑国内大模型以及开源大模型。对于通用的一些信息，如“法律助手”中的法律法条等公开数据，会使用国内大模型来完成训练和微调；而对于与企业、员工相关的信息，则考虑使用开源模型，自主完成训练，以保障个人信息的安全。

王景飞指出，模型训练过程中势必需要自身积累的“私域”数据，为保障企业训练大模型的数据合规，目前底层的基础模型大模型提供方，提供了一些接入能力，允许私有数据库接入大模型，与大模型结合使用。除此之外，大部分国内大模型在其他方面的数据安全方面提供了支持。

与此同时，应用厂商接入大模型并不顺畅。

某HR SaaS产品负责人告诉钛媒体，“HR厂商跟AI厂商不同，过去双方是处于一个相互期待对方，但合作相对来讲不够深入的阶段。AI厂商最大的问题是有优秀的算法，但没有相关垂直业务的数据；业务方有大量数据，AI能力是相对缺失的。AI公司的数据以及这种业务公司的这些数据，相对来讲会慢慢结合，我觉得这肯定是个趋势。”

比如在大模型出现之前，这家企业就已经在尝试AI面试，尽管有不少企业在尝试这一新鲜事物，但其应用还不是很广泛。这家企业认为，决定企业是否选择AI面试作为应用场景，取决于所招聘的岗位、AI面试能力的可信度等，“在实际场景中，用人单位对AI面试评价候选人的能力存在疑虑，系统评价候选人的标准不一，是否客观可信，都有待验证，也需要一个时间去接受。”

而上述创企负责人A也指出，在产品层面会跟友商合作，或自主研发，也会一些互联网公司对接，直接封装其技术方案。

“AI在HR SaaS领域的应用比较有限。”这家企业所涉及的AI产品主要有：简历解析、身份证/银行卡自动识别、人脸识别、电子签名，应用环节主要围绕在了人岗匹配和招聘模块。

在薪酬环节，很多中大型企业的薪酬体系还是比较复杂的，包括佣金、奖金的计算，如果是灵活用工的派遣方式，薪酬体系有的是按时的、有的是按件计算，同时实践过程中，这些数据来源有很多，也就是系统很多，如果无法做接口（税、社保、银行、政府），那么就需要其他技术将数据同步起来。

“当前大模型的成本相对来说还是比较高的，所以对于高频低价值的场景和低频高价值的场景，性价比差异就会比较大。i人事目前推出的人事法务助手、劳动合同风险分析、绩效辅导专家，属于低频高价值场景，同时，我们也在积极探索高频高价值的用户场景。”王景飞告诉钛媒体。

为此，i人事首先选择绩效环节，成本方面是考量之一，更重要的是i人事基于“人力资源管理专家”数字角色的考量。绩效管理，尤其是OKR，需要大量方法论和实践结合才能做好。i人事会提供大量专家，通过赋予AI这些专家的能力，将专家影响力发挥到最大。

在王景飞看来，应用方想要安全、便捷地用好基础大模型还得从以下几个层面着手：

（1）采用向量数据库配合大模型使用。自建向量数据库用来存储客户的数据，这些数据只存储在i人事的服务器中，不会对外部模型开放。

（2）采用自建大模型。针对一些垂直领域的大模型，如“人事法务助手”，需要大量的文档和数据积累，自建模型+微调的方式会更合适。i人事也在自建模型的基础上，基于法律的特征进行微调。

（3）采用数据脱敏。有些数据一定需要外部大模型进行分析的，就可以将这些数据脱敏之后传输给大模型。脱敏之后的数据，在大模型看来只有一串数字和一个标识数据所有者的一个随机ID，大模型在完成分析之后将对应的ID返回i人事系统，然后i人事在内部完成映射之后，返回给客户。

反思

其实不止HR赛道，其他行业同样面临大模型落地的难题。

4月，钉钉抢先展示了其智能化成果：通过接入阿里通义大模型，在群聊、文档、视频会议、应用开发等四个高频场景实现AI“魔法棒”能力。从最近成效来看，在超过50万家企业内测后，钉钉“AI魔法棒”正式上线，在钉钉聊天、文档、知识库、脑图、闪记、Teambition等17项产品、60+场景全面开放测试。

谈及接入大模型的过程，叶军在此前与钛媒体交流中谈到两点：一是在交互层，做钉钉各个产品应用界面和千问大模型API的连接，二是模型之间的对接，千问大模型需要来自于知识库文档的一些通用文字文本。

在叶军看来，与大模型对接不难，难的是怎么将钉钉平台上不同的业务系统与大模型实现对接。“现在钉钉上面的很多数据是有业务含义，对接模型就复杂一些，理论上它不是传统意义上的大模型，而是有一定行业特征的，或者有一定应用系统结构化的一些中型模型。所以对接我觉得投入的时间周期会更长，这也是企业级应用跟传统通用搜索之间很大的差异。”

关于商业化，叶军表示钉钉会考虑两种模式：一是针对比较高价值的商业服务，直接做订阅式收费，将其组合到钉钉专业版、专属版、专用版的底座；二是会参考Midjourney的收费模式，按照调用次数一次性付费，如钉钉个人版可能首先尝试走这个模式。

而由于钉钉本身连接了非常多的生态应用，怎么通过钉钉让SaaS创企去直接调用平台的模型能力，对SaaS产品进行改造，这是作为平台应用所能承载的事情。上述钉钉与i人事的合作，或许会是未来典型路径之一。

“对于企业应用而言，大模型是需要训练的，不仅效率要高、准确性要好，这跟写个散文或简单的人机对话完全不同。”谈及Oracle（甲骨文）在HCM领域的大模型实践经验时，甲骨文公司副总裁及中国区董事总经理吴承杨告诉钛媒体。他认为，Oracle的特点在于，已经在跟Cohere这样的大模型企业密切合作，同时在数据层面，会将向量搜索与存储在Oracle数据库的客户业务数据相结合，加之RAG架构等生成式AI技术，“只有这些技术结合起来，才会有一个颠覆性改变。”

所有软件都值得用大模型重写一遍——这样的结论是理想主义的乐观远眺，但在企业实际的场景和业务当中，还要考虑“是否值得”的实际考量。

再回到HR SaaS与大模型的结合当中，跟“人”高度相关的简历信息、面试信息、胜任力评测等信息，如果大模型能够用更精准的专有数据训练，那么这个HR SaaS系统将是企业效能最高的管理终端，但是这个包含个人高度隐私的数据是否获得个人授权，用于训练？所以现阶段用数据，用什么样层级的数据？怎么用？用到什么地步？其中所要承担的风险与收益，都是厂商必须考虑的，而并非一味追求技术的先进。

当下，许多招聘平台都在紧密的与大模型产品/服务积极接入或者合作，但得到相对成熟应用场景的确实不多，招聘场景、面试陪练场景、人才测评场景，这几个场景的数据恰好介于公有数据和专有数据之间，就是所谓巧妙地用到合适层级的数据，用于这些对企业以及面试者双向获益的场景中。

值得一提的是，尽管企业可以接入开源平台训练大模型，但势必要遵守更加严格的合规和安全保护准则。目前业内已经在警醒开源技术关停的风险。接入开源平台，甚至私下使用GPT进行内测，都在冒巨大风险。

目前看来，HR SaaS的场景中”选、用、育、留、离”大环节中的千百个场景，都需要HRSaaS厂商去一一试错，这个成本或许跟重写一套产品也相差不大了。

此外，能否商业化才是生成式AI的终极命题，至少在ToB市场里，技术要为商业服务才是本质。

无论是选择开源大模型蒸馏，还是第三方API调用，企业和厂商都在跃跃欲试，不过对AI大模型的应用最终是提供给员工一款场景应用。外界普遍期待AI能将一线人员从繁琐、危险、重复性的工作中解放出来，但现阶段，生成式AI主要只是在各自领域增添了新的功能体验。未来还会有更多AI技术的加持，但它会对企业产生多少经济价值，是否足以赢得客户方与一线员工的共同认可、买单……这条AI应用的探索之路才刚刚开始。

（本文首发钛媒体APP，作者 | 杨丽）

人力赛道+大模型，没有砸出想象中的水花 | 钛媒体深度

每款产品都值得大模型重做？

是技术黑盒的问题，也是现实投入的窘境

敬原创，有钛度，得赞赏