进入2023年,由ChatGPT带动的AI产品成为了科技行业的新热点,国外的谷歌、Meta相继跟进,国内百度的“文心一言”,阿里的“通义千问”,商汤科技的“日日新”也先后入局。
5月6日,科大讯飞发布了讯飞星火认知大模型,并于发布会现场演示了产品的七项核心能力,包括语音输入,实时互动、文本生成、语言理解、知识问答、逻辑推理和数学能力,目前星火认知大模型已可应用于教育、办公、汽车、数字员工四个领域。
在被问到为何产品姗姗来迟的时候,科大讯飞董事长刘庆峰表示,大模型的竞争关键不在于发布日期那一朝一夕,更重要的是,要今早落地转化为产品,解决用户的刚需,实现自我造血。
正视数据算力差距,用国产化降低不确定性
目前,以GPT为首的大模型产品,主要是通过机器的不断学习去实现人工智能的进化。期间需要原始的数据资料,通过各家的算法,调用GPU的算力去执行。
对于国内厂商而言,要打造一款大模型产品,由于OpenAI的GPT珠玉在前,算法目前来看并不会是瓶颈,而数据和算力会是相对的短板。
数据方面,由于中文互联网起步较晚,且微信、头条、微博、百度各家的数据较为封闭,导致可用于大模型训练的数据量不多。
从数据质量方面,中文互联网也没有优势。科大讯飞副总裁、研究院院长刘聪对钛媒体App举了一个例子:“中文技术论坛经常出现的情况是,一开始都是在讨论学术,到最后就变成了吵架。”
对此,刘聪表示科大讯飞目前正在使用中英文混合的数据库,希望能够将英文有价值的东西转化成中文资料的增量,借此实现对AI的提升。此外,科大讯飞在教育等行业已经有了多年的积累,相关数据也能够进一步帮助AI进行训练。
算力方面,此次科大讯飞与华为、寒武纪、曙光等公司合作,借此实现国产化,降低不确定性。
但刘庆峰也坦言,虽然目前算力方面不会受到国外的限制,但整体与国外相比,存在至少一代的差距。但算力和数据是中国厂商共同的的短板,而非科大讯飞一家的短板。
快速落地,形成商业模式
刘庆峰表示,未来大模型的关键并不是算力,而是要把教育、办公、汽车、数字员工一类的子模型联动起来,形成“1+N”的布局。
其中“1”作为大模型的本身,具备自己的商业价值,而“N”则是教育、办公、汽车、数字员工一类的子模型,可以让产品更快落地,快速形成商业模式。随后不同的任务、不同的数据再回归到1,组成一整个循环的过程。
据科大讯飞介绍,目前星火认知大模型的核心团队在200人以上,外围团队2000人以上,另外还有大量负责数据标注的人员。
根据第三方中文通用大模型基准SuperCLUE测试基准的测试显示,目前科大讯飞星火认知大模型仅次于人类、GPT4和GPT3.5,在众多大模型中名列第四位,在中国厂商中排名第一。
刘庆峰透露,今年6月9日星火大模型将突破开放式问答,多轮对话能力和数学能力将再次升级;8月15日,星火认知大模型将突破代码能力,多模态交互再升级;10月24日,星火认知大模型通用模型将直接对标ChatGPT,其中中文能力超越后者,英文能力与后者相当。
在谈到未来是否可能被美国制裁的话题时,刘庆峰表示已做好相关准备,并积极推进国产化替代,当然前提是把产品做好。(本文首发钛媒体App,作者/吴泓磊,编辑/钟毅)
根据《网络安全法》实名制要求,请绑定手机号后发表评论