10月31日消息,钛媒体App获悉,王小川创立的通用 AI 公司百川智能今天发布包括Baichuan4-Turbo、Baichuan4-Air两款模型在内的一站式大模型商业化解决方案,即1+3产品矩阵(全链路优质通用训练数据,Baichuan4-Turbo、Baichuan4-Air两款模型和全链路领域增强工具链)。
百川智能表示,相比Baichuan4,Baichuan4 Turbo模型效果提升50%,推理成本下降85%,首Token速度提升51%,Token流速度提升73%;Baichuan4 Air是首创PRI(金字塔、残差、区间)、MoE(混合专家)架构模型,效果持平下推理成本下降99%,首Token速度提升77%,Token流速度提升93%。同时,企业可以将两款模型进行调优和增强,百川智能1+3产品矩阵将模型多场景可用率提升到96%。
百川智能创立于2023年4月10日,由搜狗公司创始人、前CEO王小川创立,旨在打造中国版的OpenAI,构建中国最好的大模型底座,帮助大众轻松、普惠地获取世界知识和专业服务,并在医疗与行业领域应用落地。
公司成立以来,百川智能以月度为单位相继推出14款大模型,包括Baichuan-7B/13B、Baichuan2-7B/13B、Baichuan3系列、Baichuan-53B、Baichuan2-53B、Baichuan2-192K、Baichuan2-Turbo、Baichuan-NPC等,涵盖开源、闭源、学术科研、国产算力等多个维度。
当前,百川智能业务方向主要是“超级智能+超级应用”双轮驱动,发力领域(AI顾问)和医疗大模型(AI医生)。
模型领域,今年5月,百川智能发布多模态能力的Baichuan 4模型,通用能力提升超过10%,数学和代码能力分别提升14%和9%,基准评测中,模型能力位列国内第一。同时,百川已经推出首款AI助手“百小应”,不仅支持多步搜索、智能定向搜索等能力,而且希望让 AI 从工具变为伙伴,逐步具备完整能力。
医疗领域,今年7月,百川智能首次对外展示To B 端 AI 健康顾问,基于自研的通用医疗增强大模型产品。
融资方面,截至目前,百川智能已公布以200亿估值开启B轮融资,公开融资总额已超过50亿元人民币,投资方包括阿里、腾讯、小米、深创投、基石资本等机构,已跻身于大模型独角兽行列。
具体到此次产品上,由于Baichuan4-Turbo、Baichuan4-Air均为百川智能自研,所以这些优质通用训练数据与两者的数据分布高度一致,结合超参动态搜索和自适应配比等算法,与企业私有数据混合微调,显著提升了两个模型多场景下的可用率,在金融、教育、医疗等场景下的专业细分任务平均可用率高达96%,位居行业首位。
- Baichuan4-Turbo的文本生成、知识问答、多语言处理等核心能力相比Baichuan 4均有显著提升,只需2卡4090的算力即可完成部署,在GPT-4o同档位效果的模型中部署成本最低,非常适合企业探索复杂场景。
- Baichuan4-Air百川智能的首个MoE模型,首创了PRI架构,即Pyramid(金字塔架构)、Residual(残差结构)、Interval(区间结构),与标准的MoE架构相比保持了MLP(多层感知机)和Attention(注意力机制)的内部结构不变,在相同训练数据下,Baichuan4-Air不仅时效率更高,性能也大幅领先于GPT4-style、Mixtral-style结构的MoE模型,更适用于已经验证过的较大规模流量的场景,其效果与Baichuan 4基本持平,但推理成本行业最低,仅为Baichuan 4的1%,百万Token只需0.98元。
硬件层面,百川智能通过大量适配工作解决了不同硬件的适配问题,目前能够高效适配英伟达4090/A/H系列、华为昇腾、寒武纪、高通、MTK、天数(智芯)等企业的多种主流AI芯片。
商业化层面,目前百川智能已经服务了数千家客户,包括北电数智、完美世界游戏、爱奇艺、360集团、生学教育、爱学堂等,并且与信雅达、用友、软通动力、新致软件、达观数据、华胜天成等多家行业生态伙伴,以及华为、中科曙光等硬件厂商,中国移动、中国电信、中国联通等运营商达成合作,构建百川大模型生态。
百川智能强调,全新的一站式解决方案,能够帮助企业以最低成本实现效果最佳的私有化部署,并支持企业将专有数据与百川智能自用的全链路优质训练数据混合,实现行业更高的多场景可用率。
(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)
根据《网络安全法》实名制要求,请绑定手机号后发表评论