时隔仅3个月,商汤“日日新”AI大模型正式更新,部分能力超越了基于GPT-3.5的ChatGPT,并且这家AI巨兽开始把重心放到大模型规模化落地应用中。
钛媒体App获悉,在2023世界人工智能大会(WAIC)上,商汤科技董事长兼CEO徐立宣布,“商汤日日新SenseNova”大模型体系进行了多方位全面升级,以及公布在该体系下的一系列大模型产品更新和落地成果、应用实践等。
其中包括,商汤更新千亿级参数自然语言处理模型“商量”2.0版本,支持阿拉伯语和粤语,并推出小模型商量S版(SenseChat S)等不同参数量级的模型版本,可适配移动端等不同终端及场景的应用需求;全新秒画3.0则将参数量提升至70亿量级;如影2.0将语音和口型流畅度提升30%以上;琼宇2.0空间重建效率提升20%,渲染性能提升50%;格物2.0对物品纹理及材质的渲染精细度达到毫米级。
据悉,今年3月商汤科技发布的2022财年报中,公司愿景和战略目标从“以人工智能实现物理世界和数字世界的连接,促进社会生产力可持续发展,并为人们带来更好的虚实结合生活体验”,转型为“将通用人工智能(AGI)作为核心战略目标,以期在未来几年内实现AGI技术的重大突破”。
基于此变革,商汤科技建立并执行AI for All的发展目标,将重点放到以SenseCore Al大装置作为大模型生产的核心平台,以及以商汤AIDC人工智能计算中心平台作为大算力AI基础设施能力,从而打造通用能力的多模态大模型,而且进一步做垂直领域的行业、更具专长的专业大模型,从根本上降低大模型的下游应用成本和门槛,确保AI技术的发展惠及全人类。
今年4月10日,商汤正式首次公布“日日新SenseNova”大模型体系,以及自研的中文语言大模型应用平台“商量”,参数量达千亿,可实现文本生成、图像生成、多模态内容生成等能力与场景应用。同时商汤科技还与上海 AI 实验室研发了多模态、多任务通用大模型“书生”。(详见钛媒体App前文:《商汤版ChatGPT来袭,中国激战千亿“大模型”》)
本届WAIC上,商汤更迭日日新SenseNova大模型体系以及一系列大模型、数字人、文生图产品应用,在整个性能、数据准确度和精度等方面均有提升。
- “日日新”大模型体系下,自然语言处理模型“商量”2.0版本突破了大语言模型输入长度的限制,推出不同参数量级的模型版本,可适配移动端、云端等不同终端及场景的应用需求,降低部署成本。
- 文生图生成式AI模型“秒画”3.0的模型参数从今年4月首次发布以来的10亿提升至70亿量级,实现专业摄影级的图片细节刻画。
- 数字人生成平台“如影”2.0相较1.0版本的语音和口型流畅度提升30%以上,实现4K高清视频效果,具备AIGC生成形象及数字人歌唱功能,可应用于线上短视频、直播平台。商汤将与多个头部企业共建“云+AIGC+短视频直播”生态,带来高效低成本的AI视频和营销工具。
- 3D内容生成平台“琼宇”2.0(场景生成)的空间重建效率提升20%,渲染性能提升50%,1200TFLOPS/秒算力支持下,每100平方公里场景的建图时间仅38小时即可完成。
对于商汤大模型商量2.0,徐立透露,其AI代码助手性能全面提升,推理效率提升619%,HumanEval测试集一次通过率达48.7%,超过GPT-3.5的48.1%。而且,无需训练模型,就可以快速融合知识生成,搭配企业知识库可以快速解决相关领域问题。此外,“针对前端、终端的应用需求,我们推出了小模型,小模型不但性能上有一定突破,在前端的运行上也能够跑到高通骁龙8 Gen2的终端芯片上,使得我们更多的终端应用变得可能。”徐立表示。
算力方面,目前商汤在上海临港AIDC已经有接近3万块的GPU(图形处理器),目前算力已达到5000 PetaFLOPS(1 PetaFLOPS等于每秒1千万亿次浮点运算),能够支持更多千亿规模的大模型算力训练。同时,商汤现已支撑10家以上的单位机构在临港的智能计算中心中去训练他们的大模型。
另外,商汤还现场展示基于日日新SenseNova大模型体系的产业升级和应用落地。
- 在金融领域,商汤与银行、保险、券商等客户展开合作,利用数字人进行智能客服、智慧营销等工作,并通过接入大语言模型能力,提供投研分析、研报撰写等新功能,实现降本增效;
- 在医疗场景,商汤基于医学知识和临床数据开发了中文医疗语言大模型“大医”,提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力,未来将支持医学图像、文本、结构化数据等多模态综合分析。
- 面向线下场景,商汤通过大模型能力为电网巡检带来长尾故障识别、复杂缺陷判断等智能解决方案;
- 基于琼宇2.0的空间重建,商汤为济南马山镇区域开发、合肥中国视界园区、上海瑞金医院等打造实景空间的数字孪生,提升运营管理效率;
- 在珠宝行业,依托格物2.0商汤为珠宝品牌进行珠宝首饰复刻,细致展现商品工艺特点,提升顾客购物体验。
此外,在智能汽车的智能座舱方面,商汤致力于建立“车舱大脑”。基于感知决策一体化的自动驾驶通用大模型UniAD,商汤构建车路云协同的交通体系,凭借多模态多任务通用大模型开发路侧视觉感知大模型,结合“琼宇”2.0及“格物”2.0构建智能交通孪生与仿真,并利用“商量”2.0的感知推理和人机交互能力,推动车路云共同向大模型对话式交互演进。
据徐立透露,商汤自动驾驶通用大模型UniAD在多目标追踪准确率上实现了20%以上的提升,车道线准确率超过30%,运动预测误差降低40%,规划误差降低了30%。据商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚透露,目前该模型正在面向量产,UniAD框架测试下整个智能驾驶有比较显著的提升。
钛媒体App了解到,截至今年5月,基于商汤大装置SenseCore和日日新大模型体系,商汤已获得超过10个大模型客户,超过40个KA(核心关键)客户,超过5个前沿领域覆盖,超过20个行业场景落地。
财报显示,2022财年,商汤科技营收为38.09亿元人民币,其中数字人、AIGC等智慧生活业务板块营收9.55亿元,同比增长129.9%,加上智能汽车业务收入占比为总营收的33%。
商汤CFO王征在年报会议上提到,预计到2025年,商汤两个“火箭”业务(生活和汽车)总占比将高达50%-60%左右。(本文首发钛媒体App,作者|林志佳)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
中国这个企业真的能笑死人!用人家的大模型包装一下 在上面训点数据就是自己的大模型了,真棒👏🏻
A.在信息的世界里,信息资源、信息处理/加工工具、信息关系这三者应该是三位一体、同等重要的关系。 B.在当下的信息世界里,最短的板是--- 信息关系:关于信息关系的发现、建立、保持、管理和提升。 C.通用人工智能更主要地是“超级信息处理/加工工具”,它的出现将更加凸显“信息关系”的重要性和当下发展的不足。 [咖啡][握手]