大模型在企业级市场落实一段时间后,没有砸出想象中的水花。
“都是公网数据,企业不敢用。实际应用场景也很少。”一位HR企业级软件的售前专家告诉钛媒体。
现在这家企业主要将场景落地在了人才发现、简历评估和面试提问追问三个核心场景。钛媒体了解到,现在市场上能够感受到企业裁员、收紧招聘需求的信息,但这并不影响高质量人才的流动,尤其是对于中大企业的招聘需求,需要对人才的识别、人效挖掘上有一定的能力提升;同理,到了简历评估和面试环节,也需要减少依靠经验判断不足,或者得不出有效结果的情况。
但实际上,这家企业的客户案例不多,为客户训练出的大模型被称为“不断迭代的过程”,收费则是计划以订阅模式收费,目前接受这一做法的试点客户来自全球500强的跨国公司和国内业界领先的企业。
实际上,客户需求市场对生成式AI产品或大模型技术也充斥着不同见解。钛媒体了解到,尤其是对于大企业客户,虽然有不少企业客户公开宣传在积极尝试大模型,恨不得以此解决当前业务遇到的所有痛点,但同时,也有企业客户对此不屑一顾,认为自身已经积累的经验和人才,不会简单被大模型所替代。
“大模型的开发训练依然很复杂,能不能做到更加简洁?”在与国内某头部ICT厂商的闭门会上,一家传统能源行业客户提出了这样一个疑问。
该客户明确指出:“虽然过去推进智能化取得了一定成果,但跟我们的想象还存在非常大的差距。”除了该行业本身生产作业复杂的自然条件外,各个下设厂家对智能化理解的不足,导致投入了大量资金,却仍然各自为战。
另一方面,大模型现阶段并不“便宜”,能用得起大模型的企业,要么具备一定的生产体量,要么手里有一定预算,认为大模型所带来的生成式技术值得尝试和布局。
某AI上市企业负责人近期谈及大模型创业时指出,“市面上大模型具备一些基本能力,但只是玩具或工具,大模型不只是这些能力,更关键的是实现商业变现。”
事实上,无论是文生图、还是文生文,大模型技术驱动的生成式AI确实展现出了其巨大的应用场景。据钛媒体不完全统计,目前相继参与其中的巨头公司、AI创企已不下50家,而通用大模型也在尝试接入多个云平台,供企业调用或定制开发私有模型。
值得一提的是,OpenAI在11月6日举办的首届开发者大会上,对其接下来发力的方向进行了说明,包括:加强文本输入长度,输出模式符合预定模式,更多更优质的训练数据,更多的多模态,领域知识和业务逻辑,以及更优惠的价格等方面。
这对于其他AI开发者或使用方而言是个好消息,但对在座的各位大模型技术创业派而言却是悬顶之剑。
与此同时,生成式内容的合规审查和隐私安全也是大模型或生成式AI技术想要在市场中普及的必要前提。
在国内,10月11日,全国信息安全标准化技术委员会官网发布《生成式人工智能服务安全基本要求》(征求意见稿),面向社会公开征求意见。这是国内首个专门面向生成式AI安全领域的规范意见稿,也是对7月网信办等七部门推出的《生成式人工智能服务管理暂行办法》的支撑。
相比大模型到来时的狂热与喧嚣,到了真正落地的阶段,大模型在行业内如何深入应用的探索和考验才刚刚开始。
每款产品都值得大模型重做?
“每个产品都值得用大模型重做一遍”,这是初入大模型应用层企业的普遍叙事。
但在将产品重做一遍之前,还有一个更基础的问题:大模型能用在哪儿?
在B端市场,这个问题可能更难回答,或者很难有唯一的答案。
从国外Meta的LLaMA系列、Stability AI的StableLM系列、MPT等模型的开源,以及国内通用大模型面向企业级API的内测,激起了更多创企的跟进试用。
如果将一套招聘流程拆解为简历收集、筛选、测评、面试、Offer及入职,在整个链条上,大模型驱动下的自然语言交互技术,最直接体现在提高HR招聘效率和改善用户体验。
作为一家智能招聘管理软件企业,MOKA倡导用AI对核心人力系统进行改造。今年6月底,MOKA公布上线基于大模型的智能产品解决方案Eva,包括简历筛选、定制面试题、AI写面评、对话式BI、员工ChatBot。例如,员工Chatbot功能用于员工完成与招聘、人事相关的任务并获取相关信息,类似于提供咨询的AI助手。对话式BI以自然语言的界面进行交互,让员工快速访问数据库,查询关键指标,支持业务决策和管理。
类似地,北森首先公布了基于百度文心一言大模型的内测功能——招聘JD撰写和招聘海报制作。在5月的春季发布会上,北森还推出了全新AI产品个人领导力教练Mr.Sen,用于新晋领导者的转型适应、团队管理、个人发展、绩效反馈等方面。据北森CEO纪伟国透露,AI面试、员工服务机器人、陪练机器人等都将是大模型可结合的场景。
用友、金蝶则选择通过融合通用大模型能力,结合基于自身私域数据,以训练应用于人力、财务、供应链等流程软件场景的企业级领域模型。
用友高级应用架构师包飞与钛媒体交流时指出,“现阶段大模型距离行业落地还是比较远的,客户最关心的是能在行业里带来怎样的价值。”
目前用友YonGPT所支撑的领域模型应用名单包括:企业经营洞察、智能订单生成、供应商风控、动态库存优化、智能人才发现、智能招聘、智能预算分析、智能商旅费控、代码生成等数十种。
而金蝶苍穹GPT目前主要在财务、人力、程序研发场景。例如,金蝶首个公布的财务大模型,实现类似一个财务AI助手,提供财务问答、费用报销、合同审批、报告生成、分析预测等服务。
钛媒体此前报道,金蝶中国执行副总裁、研发平台总经理赵燕锡在调研时发现企业对大模型确实有浓厚兴趣,但提及率最高的两个反馈,一是“AI焦虑”,怕不用AI则会落后;二是“AI迷茫”,不知道怎么用到业务里。金蝶的策略是,先找一批原型客户做业务场景的试点验证,更贴近企业的实际业务。
在i人事CTO王景飞看来,“客户关注更多的不是用了哪个大模型,而是大模型对于业务的帮助是什么。老板关注企业经营,就会关注经营指标,如人均产出,投入分析,成本优化等;HR会关注员工体验,工作效率,如更流畅的人事流程(入转调离、加班调休等等)。”
专注于核心人事+人效的i人事,也在跟钉钉合作推出运营效率、风险管理和业务专家三类智能化方案,其目的就是解决企业老板最关注的问题:用最科学的方法、在风险最低的前提下,最高效地实现企业战略。
运行效率方面,通过大模型能力,可以为员工提供7*24小时,全年无休的人力资源咨询、流程和其他支持;人事风险管理专家,可对人力资源中可能会出现的风险进行管理,如对劳动合同内容的潜在风险进行预警、提出修正建议和风险预案等;业务专家中的绩效专家,可以指导企业员工如何完成OKR的目标拆解、对齐和复盘工作。
找试点场景、找原型客户,也是绝大多数大模型应用厂家的策略。
是技术黑盒的问题,也是现实投入的窘境
但落地到最终用户那里,由于企业业务逻辑、组织形态的千差万别,大模型从“测试”到“全面落地”,是ChatGPT还是“ChatPPT”,仍存在一定迷惑性。
“我们没说我们已经做到了,但是能在客户刚好有这么一个强需求的时候,给客户做个技术参考,因为有时技术太前沿的话,客户管理还跟不上,这也只能让客户产生一种垂涎三尺的感觉。”一位HR SaaS团队负责人A对钛媒体表示。这家企业目前计划在SaaS版本融入第三方AI大模型能力,在问及是否已经落地时,该负责人不置可否。
在上述不同厂家的内测产品描述中,大模型并没有在各自领域的应用范式带来颠覆性改变,更多是针对不同环节增加了多一项交互方式的选择,衡量的标准无非是“够不够理解人类语言,能不能产生相关智能化动作”。换言之,智能化水平强弱并非由软件所决定,而是由背后使用的大模型决定。
客观上,大模型是个概率模型,生成什么样的内容完全属于改变,想要取得更精准的结果还受限于数据、场景、人才、成本等问题,这都跟现实条件的投入情况相挂钩。另外,应用厂家还会选择跨多个模型开发,目的是降低因模型企业经营和政策引发的潜在风险。
这是作为大模型面向市场必须考虑的问题。
据Oracle Cloud HCM产品负责人透露,Oracle产品约80%的迭代都是由客户需求推动。目前Oracle已经确定了100多个人力资源生成人工智能的高价值场景,如辅助编写、推荐方案、汇总等,并且才刚刚开始。
Oracle Cloud HCM是以OCI云平台为基础,内嵌生成式AI相关能力。一方面,客户可以使用自己的数据来优化模型,平台提供对客户敏感信息和专有信息的保障,同时,通过内置提示词生成更符合用户需要的内容,同时减少事实错误和偏差。
为尽可能将大模型适用于企业级场景,包飞指出,目前用友的解决方案是,一部分会依赖于专家经验,同时也会实现业务化的流程管控,包括在大模型更上层增加一个管控层,针对于生成结果进行可靠性和合规性管控。
而在8月大模型监管法规出台之后,i人事会优先考虑国内大模型以及开源大模型。对于通用的一些信息,如“法律助手”中的法律法条等公开数据,会使用国内大模型来完成训练和微调;而对于与企业、员工相关的信息,则考虑使用开源模型,自主完成训练,以保障个人信息的安全。
王景飞指出,模型训练过程中势必需要自身积累的“私域”数据,为保障企业训练大模型的数据合规,目前底层的基础模型大模型提供方,提供了一些接入能力,允许私有数据库接入大模型,与大模型结合使用。除此之外,大部分国内大模型在其他方面的数据安全方面提供了支持。
与此同时,应用厂商接入大模型并不顺畅。
某HR SaaS产品负责人告诉钛媒体,“HR厂商跟AI厂商不同,过去双方是处于一个相互期待对方,但合作相对来讲不够深入的阶段。AI厂商最大的问题是有优秀的算法,但没有相关垂直业务的数据;业务方有大量数据,AI能力是相对缺失的。AI公司的数据以及这种业务公司的这些数据,相对来讲会慢慢结合,我觉得这肯定是个趋势。”
比如在大模型出现之前,这家企业就已经在尝试AI面试,尽管有不少企业在尝试这一新鲜事物,但其应用还不是很广泛。这家企业认为,决定企业是否选择AI面试作为应用场景,取决于所招聘的岗位、AI面试能力的可信度等,“在实际场景中,用人单位对AI面试评价候选人的能力存在疑虑,系统评价候选人的标准不一,是否客观可信,都有待验证,也需要一个时间去接受。”
而上述创企负责人A也指出,在产品层面会跟友商合作,或自主研发,也会一些互联网公司对接,直接封装其技术方案。
“AI在HR SaaS领域的应用比较有限。”这家企业所涉及的AI产品主要有:简历解析、身份证/银行卡自动识别、人脸识别、电子签名,应用环节主要围绕在了人岗匹配和招聘模块。
在薪酬环节,很多中大型企业的薪酬体系还是比较复杂的,包括佣金、奖金的计算,如果是灵活用工的派遣方式,薪酬体系有的是按时的、有的是按件计算,同时实践过程中,这些数据来源有很多,也就是系统很多,如果无法做接口(税、社保、银行、政府),那么就需要其他技术将数据同步起来。
“当前大模型的成本相对来说还是比较高的,所以对于高频低价值的场景和低频高价值的场景,性价比差异就会比较大。i人事目前推出的人事法务助手、劳动合同风险分析、绩效辅导专家,属于低频高价值场景,同时,我们也在积极探索高频高价值的用户场景。”王景飞告诉钛媒体。
为此,i人事首先选择绩效环节,成本方面是考量之一,更重要的是i人事基于“人力资源管理专家”数字角色的考量。绩效管理,尤其是OKR,需要大量方法论和实践结合才能做好。i人事会提供大量专家,通过赋予AI这些专家的能力,将专家影响力发挥到最大。
在王景飞看来,应用方想要安全、便捷地用好基础大模型还得从以下几个层面着手:
(1)采用向量数据库配合大模型使用。自建向量数据库用来存储客户的数据,这些数据只存储在i人事的服务器中,不会对外部模型开放。
(2)采用自建大模型。针对一些垂直领域的大模型,如“人事法务助手”,需要大量的文档和数据积累,自建模型+微调的方式会更合适。i人事也在自建模型的基础上,基于法律的特征进行微调。
(3)采用数据脱敏。有些数据一定需要外部大模型进行分析的,就可以将这些数据脱敏之后传输给大模型。脱敏之后的数据,在大模型看来只有一串数字和一个标识数据所有者的一个随机ID,大模型在完成分析之后将对应的ID返回i人事系统,然后i人事在内部完成映射之后,返回给客户。
反思
其实不止HR赛道,其他行业同样面临大模型落地的难题。
4月,钉钉抢先展示了其智能化成果:通过接入阿里通义大模型,在群聊、文档、视频会议、应用开发等四个高频场景实现AI“魔法棒”能力。从最近成效来看,在超过50万家企业内测后,钉钉“AI魔法棒”正式上线,在钉钉聊天、文档、知识库、脑图、闪记、Teambition等17项产品、60+场景全面开放测试。
谈及接入大模型的过程,叶军在此前与钛媒体交流中谈到两点:一是在交互层,做钉钉各个产品应用界面和千问大模型API的连接,二是模型之间的对接,千问大模型需要来自于知识库文档的一些通用文字文本。
在叶军看来,与大模型对接不难,难的是怎么将钉钉平台上不同的业务系统与大模型实现对接。“现在钉钉上面的很多数据是有业务含义,对接模型就复杂一些,理论上它不是传统意义上的大模型,而是有一定行业特征的,或者有一定应用系统结构化的一些中型模型。所以对接我觉得投入的时间周期会更长,这也是企业级应用跟传统通用搜索之间很大的差异。”
关于商业化,叶军表示钉钉会考虑两种模式:一是针对比较高价值的商业服务,直接做订阅式收费,将其组合到钉钉专业版、专属版、专用版的底座;二是会参考Midjourney的收费模式,按照调用次数一次性付费,如钉钉个人版可能首先尝试走这个模式。
而由于钉钉本身连接了非常多的生态应用,怎么通过钉钉让SaaS创企去直接调用平台的模型能力,对SaaS产品进行改造,这是作为平台应用所能承载的事情。上述钉钉与i人事的合作,或许会是未来典型路径之一。
“对于企业应用而言,大模型是需要训练的,不仅效率要高、准确性要好,这跟写个散文或简单的人机对话完全不同。”谈及Oracle(甲骨文)在HCM领域的大模型实践经验时,甲骨文公司副总裁及中国区董事总经理吴承杨告诉钛媒体。他认为,Oracle的特点在于,已经在跟Cohere这样的大模型企业密切合作,同时在数据层面,会将向量搜索与存储在Oracle数据库的客户业务数据相结合,加之RAG架构等生成式AI技术,“只有这些技术结合起来,才会有一个颠覆性改变。”
所有软件都值得用大模型重写一遍——这样的结论是理想主义的乐观远眺,但在企业实际的场景和业务当中,还要考虑“是否值得”的实际考量。
再回到HR SaaS与大模型的结合当中,跟“人”高度相关的简历信息、面试信息、胜任力评测等信息,如果大模型能够用更精准的专有数据训练,那么这个HR SaaS系统将是企业效能最高的管理终端,但是这个包含个人高度隐私的数据是否获得个人授权,用于训练?所以现阶段用数据,用什么样层级的数据?怎么用?用到什么地步?其中所要承担的风险与收益,都是厂商必须考虑的,而并非一味追求技术的先进。
当下,许多招聘平台都在紧密的与大模型产品/服务积极接入或者合作,但得到相对成熟应用场景的确实不多,招聘场景、面试陪练场景、人才测评场景,这几个场景的数据恰好介于公有数据和专有数据之间,就是所谓巧妙地用到合适层级的数据,用于这些对企业以及面试者双向获益的场景中。
值得一提的是,尽管企业可以接入开源平台训练大模型,但势必要遵守更加严格的合规和安全保护准则。目前业内已经在警醒开源技术关停的风险。接入开源平台,甚至私下使用GPT进行内测,都在冒巨大风险。
目前看来,HR SaaS的场景中”选、用、育、留、离”大环节中的千百个场景,都需要HRSaaS厂商去一一试错,这个成本或许跟重写一套产品也相差不大了。
此外,能否商业化才是生成式AI的终极命题,至少在ToB市场里,技术要为商业服务才是本质。
无论是选择开源大模型蒸馏,还是第三方API调用,企业和厂商都在跃跃欲试,不过对AI大模型的应用最终是提供给员工一款场景应用。外界普遍期待AI能将一线人员从繁琐、危险、重复性的工作中解放出来,但现阶段,生成式AI主要只是在各自领域增添了新的功能体验。未来还会有更多AI技术的加持,但它会对企业产生多少经济价值,是否足以赢得客户方与一线员工的共同认可、买单……这条AI应用的探索之路才刚刚开始。
(本文首发钛媒体APP,作者 | 杨丽)
根据《网络安全法》实名制要求,请绑定手机号后发表评论