科大讯飞刘庆峰：大模型不在一朝一夕，重要的是落地解决刚需和自我造血-钛媒体官方网站

科大讯飞董事长刘庆峰

进入2023年，由ChatGPT带动的AI产品成为了科技行业的新热点，国外的谷歌、Meta相继跟进，国内百度的“文心一言”，阿里的“通义千问”，商汤科技的“日日新”也先后入局。

5月6日，科大讯飞发布了讯飞星火认知大模型，并于发布会现场演示了产品的七项核心能力，包括语音输入，实时互动、文本生成、语言理解、知识问答、逻辑推理和数学能力，目前星火认知大模型已可应用于教育、办公、汽车、数字员工四个领域。

在被问到为何产品姗姗来迟的时候，科大讯飞董事长刘庆峰表示，大模型的竞争关键不在于发布日期那一朝一夕，更重要的是，要今早落地转化为产品，解决用户的刚需，实现自我造血。

正视数据算力差距，用国产化降低不确定性

图片来源：视觉中国

目前，以GPT为首的大模型产品，主要是通过机器的不断学习去实现人工智能的进化。期间需要原始的数据资料，通过各家的算法，调用GPU的算力去执行。

对于国内厂商而言，要打造一款大模型产品，由于OpenAI的GPT珠玉在前，算法目前来看并不会是瓶颈，而数据和算力会是相对的短板。

数据方面，由于中文互联网起步较晚，且微信、头条、微博、百度各家的数据较为封闭，导致可用于大模型训练的数据量不多。

从数据质量方面，中文互联网也没有优势。科大讯飞副总裁、研究院院长刘聪对钛媒体App举了一个例子：“中文技术论坛经常出现的情况是，一开始都是在讨论学术，到最后就变成了吵架。”

对此，刘聪表示科大讯飞目前正在使用中英文混合的数据库，希望能够将英文有价值的东西转化成中文资料的增量，借此实现对AI的提升。此外，科大讯飞在教育等行业已经有了多年的积累，相关数据也能够进一步帮助AI进行训练。

算力方面，此次科大讯飞与华为、寒武纪、曙光等公司合作，借此实现国产化，降低不确定性。

但刘庆峰也坦言，虽然目前算力方面不会受到国外的限制，但整体与国外相比，存在至少一代的差距。但算力和数据是中国厂商共同的的短板，而非科大讯飞一家的短板。

全球首款搭载大模型的AI学习机：科大讯飞AI学习机T20 Pro

刘庆峰表示，未来大模型的关键并不是算力，而是要把教育、办公、汽车、数字员工一类的子模型联动起来，形成“1+N”的布局。

其中“1”作为大模型的本身，具备自己的商业价值，而“N”则是教育、办公、汽车、数字员工一类的子模型，可以让产品更快落地，快速形成商业模式。随后不同的任务、不同的数据再回归到1，组成一整个循环的过程。

据科大讯飞介绍，目前星火认知大模型的核心团队在200人以上，外围团队2000人以上，另外还有大量负责数据标注的人员。

根据第三方中文通用大模型基准SuperCLUE测试基准的测试显示，目前科大讯飞星火认知大模型仅次于人类、GPT4和GPT3.5，在众多大模型中名列第四位，在中国厂商中排名第一。

刘庆峰透露，今年6月9日星火大模型将突破开放式问答，多轮对话能力和数学能力将再次升级；8月15日，星火认知大模型将突破代码能力，多模态交互再升级；10月24日，星火认知大模型通用模型将直接对标ChatGPT，其中中文能力超越后者，英文能力与后者相当。

在谈到未来是否可能被美国制裁的话题时，刘庆峰表示已做好相关准备，并积极推进国产化替代，当然前提是把产品做好。（本文首发钛媒体App，作者/吴泓磊，编辑/钟毅）