钛媒体App获悉,12月15日,中国科学院孵化的国内人工智能(AI)公司中科闻歌,在北京推出全自主知识产权、全系列模型开源的雅意2.0国产大模型。
雅意2.0系列是一款拥有300亿参数的 AI 模型,支持128k上下文窗口,相当于20万字文本处理。具备图文交互的多模态能力,支持10余种主流语言,全系列模型将通过GitHub和Hugging Face开源免费申请商用,多个30B模型支持超过10种的智能插件调用。此外,中科闻歌基于雅意2.0推出面向多个行业大模型的智能应用产品,涵盖安全、媒体、金融、舆情、法律、中医等领域。
中科闻歌表示,在中文知识问答能力的评测方面,雅意2.0在AGIEval、CMMLU数据集评测中排名第一;零样本中文信息抽取能力获多项SOTA(最佳性能表现)。因此,在知识实体抽取方面,雅意2.0模型实现了中文第一、英文全面对标ChatGPT。
据悉,中科闻歌成立于2017年,定位于认知与决策智能技术型企业,提供面向媒宣、舆情、金融、治理、安全等领域的多语言、跨模态和深度认知智能大数据与 AI 基础平台及解决方案。截止目前,中科闻歌已累计完成六轮超过10亿元融资,投资方包括国开金融、中网投、盈富泰克、深创投、中科院资本等。
今年6月,中科闻歌发布了企业级专属大模型雅意(YAYi)大模型,具备实时联网问答、知识问答、多模态内容生成等能力,共100多个特色技能,应用于媒体、金融、宣传、治理、安全等领域。(详见钛媒体App前文:《中科闻歌发布自研雅意大模型,支持离线、联网和私域部署|钛快讯》)
此次,中科闻歌自主研发的雅意2.0模型,基于240TB多源基础数据,拥有2.65万亿Tokens高质量训练数据,确保训练数据语料的安全可控,可面向行业应用场景自主训练和微调,支持多款国产算力硬件兼容。同时,基于雅意2.0,中科闻歌还公布YAYI-UIE信息抽取大模型、YAYI Chat 30B对话模型、YAYI-File、YAYI Bot等应用产品。
- YAYI-Chat:具备从海量数据和大规模知识中理解、学习和生成的能力,支持与人、数据库、离线文档、在线网页等多种数据形态交互,支持快捷构建行业Prompt。
- YAYI-UIE:是基于雅意2.0的信息抽取大模型,可实现中英双语的统一信息抽取框架,完成实体、关系、事件信息抽取集成。
- YAYI-File:支持用户数据自主接入、海量文档阅读理解、高效检索召回等,专注海量长文档智能解析的知识库问答AI助手,支持用户创建和管理自己的知识库,提供基于单文档或多文档的智能解析、智能检索、智能问答、答案溯源等功能。
- YAYI Bot:是一款移动端APP,希望成为用户身边的智能助手。
而作为企业级通用大模型,基于雅意2.0,中科闻歌推出政务智能和商业智能行业模型体系,面向安全、媒体、金融、舆情、法律、中医等领域构建行业大模型应用,包括公布的安全大模型2.0、媒体大模型2.0、舆情大模型2.0、金融大模型2.0、律法大模型、中医大模型等产品,构建雅意模型生态。另外,中科闻歌DIOS认知与决策智能基础平台也发布2.0版本,为政企客户构建“数据-模型-决策”完整的数智决策生态。
截至目前,雅意大模型主要拥有MaaS(模型即服务)、知识连接模式、知识增强模式三种服务形式,支持云端使用、本地一体机部署、自主私有训练部署三种使用版本。其中,中科闻歌此次还升级大模型一体机,包括YaYiFile一体机、YaYiUIE一体机、YaYi训推一体机等产品全面适配以华为昇腾和鲲鹏为代表的国产 AI 算力。
另外,中科闻歌还宣布与新华网、北京银行、新一代人工智能研究院、华为云、并行科技、宁夏移动、中国电力知库、中科软等企业建立意向签约合作。
中科闻歌董事长王磊表示,雅意大模型是全国产化的基础模型,而雅意2.0是为数不多的从头进行预训练的国产原生大模型。未来的大模型发展方向将不唯参数规模,而是做“小”做“精”做“深”大模型,打造更高效、更经济的轻量化行业专用模型,从而支持行业数智化发展。
(本文首发钛媒体App,作者|林志佳)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
中科院参股不控股还想靠中科院忽悠人
要不是挂着中科院的招牌,估计公司都开不下去
雅意2.0的发布是中科闻歌在人工智能领域的重要突破
给小编加鸡腿