钛媒体App获悉,2024年1月30日下午,人工智能(AI)上市公司科大讯飞(SHE: 002230)董事长刘庆峰正式发布首个基于全国产算力训练的全民开放大模型——讯飞星火认知大模型V3.5(以下简称“讯飞星火V3.5”)版本。
刘庆峰表示,相比3.0版本。此次发布的讯飞星火V3.5在文本生成、语言理解、知识回答、逻辑推理、数学能力、代码能力、多模态能力这七大能力上均全面提升,分别提高7.3%、7.6%、4.7%、9.5%、9.8%、8%、6.6%。
“今天我们正式发布的讯飞星火3.5,既是对科大讯飞在通用 AI 领域核心技术和创新能力的一次展示,同时也是对我们国产算力平台能否支撑起未来大模型研发的一次非常重要的检验。”刘庆峰表示,讯飞星火V3.5不仅在各项能力中越来越逼近全球最好的GPT-4 Turbo水平,而且在语言理解、语言理解、数学能力上超过了GPT-4 Turbo,代码达到GPT-4 Turbo的96%。
刘庆峰强调,中国发展通用 AI 是“势在必干”的事情,绝不能只用开源模型做应用落地,将来随时随地会被别人“死死的给你掐住”。
值得注意的是,刘庆峰在会上反驳了360董事长周鸿祎的看法,他直言中国需要建立创新生态,绝不是说“今天的大模型像‘茶叶蛋’一样,已经成了一个不值钱的东西”。
“能够真正对标美国最先进的 AI 大模型,全中国将来没有几个,我希望讯飞星火一定是其中之一,而且我们希望能够自我期许也好,我们的目标也好,一定要走在前列、走在最前面。”刘庆峰称。
据悉,随着基于 AI 大模型(LLMs)的聊天机器人产品ChatGPT风靡全球,2023年5月,科大讯飞公司正式发布讯飞星火大模型1.0版本,成为国内首批亮相的大模型产品;去年9月,讯飞星火大模型获得备案批准,正式对外开放使用;如今,经过269天、5次重大技术迭代,科大讯飞让其产品的技术能力对标美国OpenAI公司的GPT-4.0 Turbo。
1月29日晚,科大讯飞发布的2023年度业绩预告显示,该公司预计2023年实现营业收入超过200亿元,同比增长约7%;实现归母净利润6.45-7.3亿元,同比增长15%-30%;实现扣除非经常性损益后的净利润8000万元-1.2亿元,同比下降71%-81%;截止2023年底,该公司经营性现金流量净额超过3亿元。
这是科大讯飞继2022年归母净利下滑63.94%之后再次迎来回升。不过,其营收增长仍然是个位数。
此次发布会上,科大讯飞主要公布讯飞星火V3.5的四个部分的技术产品:
- C端的讯飞星火大模型平台的情感语音讯飞友伴、可以做PPT的讯飞智文、教师 AI 助手的星火智慧黑板、音视频创作的讯飞智作、图文创作的星火内容运营大师等应用全面升级,以及赋能讯飞听见、讯飞星火等如那件;
- B端的国产算力平台;在保险、运营商、电商、能源等领域的赋能应用,以及全栈自主可控的星火优化套件;
- 硬件端:基于全新讯飞语音大模型的讯飞翻译机、讯飞智能本、讯飞录音笔的 AI 能力全面提升;
- 讯飞星火开源大模型首次发布,以及星火开源-13B(13亿参数)与华为昇思开源社区联合首发上线。
首先是To C消费端,刘庆峰透露,目前讯飞听见用户量达到6500万人,讯飞星火用户量达2400万人,讯飞输入法用户量达1.4亿人次,讯飞智能本和录音笔已累计有超过60万用户、后台能力调用量共计达650万次。
他认为,全新的讯飞星火V3.5大模型可以做到“人机完全自然”的对话,它可以赋能整个万物智联时代,开始进入到每个人的生产生活中。在语义理解、拟人合成等方面,讯飞星火V3.5已经超过了GPT-4 Turbo水平,而多轮对话、情绪感知等方面还在快速跟进中。“我们训练时间还短,我们非常有信心,今年上半年还会有非常大的提升。”
语音方面,刘庆峰还发布了全新讯飞语音大模型,即日起面向开发者正式开放。据悉,讯飞语音大模型基于大语言模型框架,结合讯飞多维度语音属性解耦表征进行预训练的,在多语种语音识别中,首批37个主流语种效果超过了OpenAI Whisper V3语音模型;超拟人语音合成中,拟人度达到83%以上,基本达到与ChatGPT同等水平。另外,讯飞语音大模型还将赋能在讯飞翻译机、讯飞智能本、讯飞录音笔等硬件产品中。
其次是企业端,刘庆峰表示,星火大模型正在加速赋能保险、运营商、电商、能源等各行业头部企业客户,目前大模型总开发者数达35万,企业开发者数量达22万,客户数量超万家,包括华为、交通银行、中国移动、奇安信、韵达、平安科技等企业。
“华为徐直军说过,我们不仅用科大讯飞的中文,而且全世界语种都使用科大讯飞。今天会让语音大模型进一步赋能,星火大模型会让赋能更透彻、更彻底。”刘庆峰指出,从数字劳动力到代码,从汽车到大型央国企管理,星火大模型全面赋能,而且通过全栈自主可控的星火优化套件,加速企业大模型的应用落地。
刘庆峰表示,全链条工具链可以支撑星火行业大模型高效构建,训练提效90%以上。同时,千亿通用大模型训练成本大概在1200万-1500万美金,万亿模型约6000万美金。而利用讯飞星火优化套件,可以将通用大模型训练成本降低5-10倍以上。另外,在13B/65B/175B等多尺寸方面,讯飞星火支持异构算力调度。
最后是开源模型,科大讯飞今天正式推出基于国产算力的“讯飞星火开源大模型”,包括iFlytekSpark-13B-base、Lora、chat、Charater四款。
刘庆峰称,这是针对国产生态的开源13B模型版本,希望开源以后能够增进学术合作,推动产业的联合创新。与同尺寸第三方开源大模型相比,星火开源大模型效果要领先20%,文本生成、语言理解、文本改写、行业问答、机器翻译等领域要比行业领先,在多个公开榜单中名列前茅。
对于国产算力,刘庆峰称,基于科大讯飞发布的首个支撑万亿参数大模型训练的国产算力平台“飞星一号”,通过带宽利用率提升、并行训练算法优化等方面,在华为910B芯片上,讯飞星火模型训练实现了英伟达A100的90%的算力能力,而且在部分专用能力领域甚至超越(英伟达)。
“讯飞星火V3.5能力的提升,已经达到了量质齐飞的关键点。”刘庆峰表示,2024年讯飞星火认知大模型的应用,一定会在越来越多的场景和领域中大放异彩。
展望2024年,刘庆峰表示,中国必须要发展通用 AI 技术。这既决定了产业链安全,也决定了国家安全。如果中国没有大模型,工业、民生以及科研等各个专用领域都会极大地落后于世界,而中国又有条件,是全世界唯一的能够成为“智慧涌现”第二极的。中国没法用英伟达、谷歌、微软的算力,只能靠自己。
“当然,2024年我们依然在通用大模型的底层能力上持续对标国际最先进水平,我们要看到差距。尽管我们目前跟GPT水平还有差距,但我们有信心,今年上半年我们就赶上现在的水平。可是我们一定要知道,人家也在训4.5、5.0,你赶上了,它又有新的版本出现了,所以一定要预判下一个阶段。科大讯飞既要有决心坚定不移地持续对标,同时也要从算法研究、更小的算力等方面能做出相对更优的效果,这都将是我们2024年非常重要的研究方向。”刘庆峰指出。
刘庆峰表示,结合科大讯飞在语音技术上的优势,公司有信心星火大模型是全世界最好的,而且行业应用“我们一定要实现超越”,另外也要构建完全自主可控的一个繁荣的通用人工智能生态。
刘庆峰强调,“我们需要顶天立地的长期主义精神,顶天就是我们希望源头核心技术在底层的大模型能力上,一定要向国际世界最先进的能力看齐,立地要能够大规模产业化。”
“我觉得,2024年一定可以实现‘星火燎原’。通用人工智能不仅能够在中国各大领域深度且广泛的应用,而且我们在源头技术创新、大模型的底层能力上会再上全新的台阶。”刘庆峰在结尾表示。
(本文首发钛媒体App,作者|林志佳)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
我其实还是挺看好科大讯飞在这一块的实力的
gpt在汉语方面确实不太行,做一个专门汉语的还是有希望的
我是相信科大讯飞的,至少中国科学技术大学就是神一样的存在
讯飞输入法pc都做得普普通通,搜狗都打不赢要领先全世界
我不知道吹讯飞的都是咋想的,因为这个技术马上会普及到讯飞提供的ai骚扰电话中