2024年的百度大模型，离「钱」越来越近-钛媒体官方网站

大模型谈钱，不寒碜。

前些日子朱啸虎和杨植麟的隔空对话，代表了技术派和市场派的两种观点。朱啸虎不看好大模型创业，认为现阶段大模型公司缺乏场景和数据，估值过高，且面临开源模型的竞争，投资风险大。他更倾向于投资能快速商业化、变现的应用层项目。

杨植麟坚定看好大模型创业，认为这是未来十年唯一有意义的事，并将其视为一个结合科学、工程和商业的系统，需要长期投入和坚持，最终目标是实现AGl。

虽然两者观点看起来针锋相对，但有一点并不冲突，不论是在通向AGI的过程中“沿途下蛋”，还是现在就投资能看到产出的大模型应用公司，今年大模型的商业化，一定是离钱越来越近。

若论国内对大模型商业化最热衷的企业，百度一定是其中之一。据此前报道，2024年百度创始人李彦宏在百度智能云方向的OKR就是，跑通以大模型为核心智能云发展路径，并且在收入和利润方面都有要求。

百度智能云是百度AI能力的输出口，海外市场大模型与云服务结合得比国内更紧密，这也是百度智能云希望努力的方向。

3月21日，百度智能云千帆大模型平台就一口气发布了5款新模型，包括3个轻量级大模型、2个垂直场景大模型，并且千帆ModelBuilder以千帆AppBuilder也同步升级。钛媒体App了解到，百度后续还将发布大模型应用产品，譬如销售、客服、办公等产品。

可以说，目前百度大模型商业化只有一条主线，让尽可能多的一部分人先用大模型，由此改变自己的产品和面向客户的服务。

大模型落地“值不值”

初期大模型的火热，未必能转化为实实在在的订单，在大模型技术和产业的高速发展期，有些厂商已经被历史的车轮碾过，但却丝毫不起一丝波澜。

“惨烈，我觉得是很惨烈，从去年到现在有很多基础模型厂商参与到市场竞争，也有很多的企业资金链受到了一些挑战，也反映出新技术发展过程中的一些矛盾。”百度智能云AI与大数据平台总经理忻舟说道。

这其中一个很重要的因素，就是大模型供需之间的错位，大量企业没有掏出真金白银，而是处在观望阶段。从企业使用大模型的角度，主要关注三个因素，一是效果好不好，二是成本是否足够低，三是效率，因此多数企业并不关心大模型或者小模型，只会结合自己的预期评估大模型落地到自己的场景“值不值”。

百度也提出了自己“效价比”的理念，除了极少的大客户对大模型有极致的效果追求，更多的企业和机构往往要综合考量大模型的使用效果、性能以及成本，即“效价比”

面向大模型如何落地，业内想了各种各样的技术方法，比如RAG、插件、MoE、小型化、大小协同等等各种各样的问题，轻量级模型就是公认的“效价比”突出的方案。

“业界也逐渐形成一个共识，模型不见得是参数规模越大越好。在很多实际的场景当中，用小尺寸的专家模型也能够达到我们通用大模型的效果，小尺寸专家模型的推理成本会更低，更便宜。”百度副总裁谢广军表示。

他还提到，本次发布的三款模型都是开发专家模型的基座模型，主要面向两个场景：一是客户、合作伙伴结合自己的数据，去做垂类场景模型。二是百度也会基于这些小的基座模型，去开发第一方的行业垂类场景模型，比如做教育行业的教辅答题和解题，可以用一个小尺寸的模型加上一些数据，精调出一个效果很好的解题助手模型。

“3+2”，5款新模型

一月初，OpenAI发布了多款新模型，价格下降，性能提升，百度本次也是同样的策略，百度智能云千帆ModelBuilder发布了包括ERNIE Speed、ERNIE Lite、ERNIE Tiny在内，参数量由大到小的三款轻量级大模型。千帆ModelBuilder的概念就是生产平台，提供整个模型训练的工具链，让模型开发变得更简单。

对于轻量级模型，谢广军表示，基座模型本身的效率一定要好，百度基于文心大模型的技术领先优势积累，再把尺寸做小，模型的效果就会做得很好，在很多场景它能够达到大模型的效果。

同时，百度发布的轻量级模型具备再生产能力，比如支持post-pretrain、sft、lora精调能力，基座模型加上精调数据来达到垂直场景下的效果，同时成本更低。

具体来看，ERNIE Speed在推理场景下拥有最高128k的上下文长度，在处理知识问答等任务时，能够更好的处理上下文的依赖关系，同时，针对特定场景可以将ERNIE Speed作为基座模型进行精调，模型效果可以追平甚至超过旗舰级大参数规模大模型，效价比大幅提升。

ERNIE Lite的参数量则更小，更适合搭载在低算力的AI加速卡上处理推理任务，作为ERNIE-Bot-turbo模型的升级版，ERNIE Lite在情感分析、多任务学习、自然推理等场景下的应用效果提升了20%，推理调用成本大幅下降了53%。

参数量最小的ERNIE Tiny则主打极致低成本、低延迟，可用于检索、推荐、意图识别等高并发、低延时等应用场景中，在某对话推荐业务场景中，精调后的ERNIE Tiny在搜索引擎推荐词激发环节，相比ERNIE 3.5，对话轮次增长了3.5%，成本下降了32%。

此外，百度智能云千帆ModelBuilder还推出了ERNIE Character和ERNIE Functions两款垂直场景大模型，分别适配客户在角色扮演类应用场景（如游戏NPC、客服对话等）和工具调用场景（对话中使用外部工具、调用业务函数等）中的使用需求。

结合企业实际使用大模型的过程，有些企业起初就用最好的模型看最好的效果，再决定投入的资源程度。有些场景需要快速验证，企业可以先上轻量级模型，轻量级模型总结一句话——“轻归轻，可破冰”，在一些场景下完全可用，作为大模型落地的先锋军。

对于注重私有数据的企业和行业，私有数据跟大模型结合也可以先用轻量级模型，不管是知识资产还是数据分析，都可以跑出效果。

“把大模型应用，喂到企业嘴边”

千帆大模型平台上的客户需求主要分为三种，第一类是在AppBuilder开发应用；第二类，直接调用百度的基座模型的，比如直接调用文心4.0、 3.5版本；第三类是生产模型，客户数据和百度基座模型结合做一个新的垂类模型。

AppBuilder去年年底推出，从应用的视角让开发者能够便捷地开发基于大模型的AI原生应用，百度第一方也做了非常多的AI原生应用，也是基于这套平台做的，本次AppBuilder也进一步升级，进一步降低应用开发门槛。

升级后的AppBuilder开放的工具组件多达55个，包括基于百度多年技术积累和自有业务沉淀的大模型组件、AI能力组件，也包括搜索等百度特色的业务组件、和多场景的第三方API工具，另外还提供了 RAG（知识检索问答）、GBI（生成式数据分析）等根据典型应用场景深入调优的高级能力组件。

在组件之上，千帆AppBuilder推出的Agent（智能体）应用框架，具备精准的任务自主规划能力，对多种应用工具的自动编排准确率超过90%。AppBuilder还支持开发者接入自定义工具，实现更复杂场景应用的需求定制。

谢广军介绍，AppBuilder分两个形态，一个是代码态，百度提供SDK，甚至提供底层的组件和能力，这种是大B端的场景下的典型客户画像。另一个是零代码态，以小企业、个人开发者为主，现在零代码态开发者的数量比较多，百度这两条路都要走。

根据百度智能云公布的数据，千帆大模型平台已经服务8万企业用户，累计帮助用户精调1.3万个大模型，帮助用户开发出16万个大模型应用，自2023年12月以来百度智能云千帆大模型平台API日调用量环比增长97%

大模型未来一段时间还会不断快速演进，百度AI团队主抓基础模型，智能云团队主抓商业落地，构成了百度自己的大模型商业落地模式。

（本文首发钛媒体APP 作者｜张帅，欢迎添加作者mr3right爆料、交流）