ChatGPT发布一周年将到来之际,中国、美国的 AI 大模型进展迅速,行业持续“狂飙”。
10月20日,AI 大模型领域独角兽企业 北京智谱华章科技有限公司(以下简称“智谱AI”)宣布,已完成新一轮融资,今年以来,智谱 AI 累计融资额超过25亿元人民币。
此轮投资方阵容豪华,包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构,而君联资本等部分老股东跟投,华兴资本担任独家财务顾问。据悉,智谱 AI 创始团队来自清华大学,公司估值据传已超过100亿元。
无独有偶。美国OpenAI公司于20日上线了DALL-E 3 AI 绘图功能在ChatGPT Plus付费版中,而且该公司还公布DALL-E 3关键技术论文,用19页叙述“提示词遵循”等技术细节。
事实上尽管美国加码芯片出口管制措施以阻止中国的AI发展,但考虑到目前大模型行业的趋势,中国国产算力仍然有望迎难而上。这意味着,中国的AI应用产业仍然具有一定的竞争优势,从而在未来全球数字经济变革中承担重要地位。
大模型浪潮下,阿里、腾讯向清华系独角兽投资25亿
以ChatGPT为代表的生成式 AI,一夜之间火热“出圈”,瞬间掀起了新一波技术浪潮。
美国弗吉尼亚大学经济学教授Anton Korinek直言,相比过去20年,预计生成式 AI 将在未来10年把生产力提高10%-20%。
事实上,早在2019年6月,智谱 AI——这家由清华大学计算机系知识工程实验室的技术成果转化公司,瞄准了当时还未爆火的大模型技术。公司集结了一群清华大牛——CEO张鹏毕业于清华计算机系,总裁王绍兰为清华创新领军博士,清华大学计算系教授唐杰也参与研发中国最大规模预训练模型悟道2.0。
2020年,智谱AI开始了GLM预训练架构的研发,并训练了100亿参数模型GLM-10B。2021年,公司利用MoE架构成功训练出万亿稀疏模型,并于2022年公布了1300亿级超大规模预训练通用模型GLM-130B,而且还以此打造大模型平台及产品矩阵。
2023年,智谱AI推出千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6B等,部署于个人开发者和企业应用领域。今年6月,智谱AI 迭代出ChatGLM2,包括6B、130B、12B(120亿参数)、32B、66B等参数的模型,效果全面提升,推理速度增长42%。据张鹏透露,相比GPT-4版的ChatGPT,ChatGLM2-12B、32B和66B性能分别提升16%、36%和280%。
当前,智谱 AI 开源模型在全球下载量已超过1000万次。同时,公司也进行了商业化探索,打造了AIGC(生成式 AI)模型及产品矩阵,包括已获批上线的智谱清言、高效率代码模型CodeGeeX等。
融资方面,创立至今的四年来,智谱AI 共完成三轮融资,最近一次消息是2022年9月公司宣布的B轮,投资方包括华控基金、启明创投、君联资本、中科创星、将门创投等机构。
如今,智谱AI又完成了一轮25亿元融资,阿里、腾讯、小米、蚂蚁等巨头纷纷参与。公司称,上述融资将用于基座大模型的进一步研发,更好地支撑行业生态。
据财新,目前智谱AI 公司估值已超过100亿元。
OpenAI罕见公布新模型技术
10月20日,OpenAI向hatGPT Plus 和 Enterprise 用户上线了最新的DALL-E 3文生图模型的访问权限。
据悉,DALL-E 3于上个月首次发布,相比DALL-E 2,OpenAI第三代文生图技术首次内置在ChatGPT当中,可允许用户提供更直观的描述性信息从而生成图片,而且新技术生成的图像更逼真,效果更好。OpenAI 表示,其为DALL-E 3模型提供安全堆栈技术,从而为扩展功能做好准备。
与此同时,OpenAI 团队还非常罕见的公布了DALL-E 3的部分技术细节,因为ChatGPT、GPT-4到目前为止都没有全部公布相关技术论文。
此次论文中,OpenAI详细阐述了DALL-E 3的技术改进,首先团队提出了一种改进图像生成系统的方法“提示词遵循”,通过训练高质量的生成图像标题来提高文本生成图像的能力。而且,团队还创建了一个比较庞大、精准的提示词数据,该数据集详细描述了每个图像的内容,包括主要对象、周围环境、背景、图像中的文本、风格、颜色等。
其次,作者使用新的数据集对基础提示词进行微调,生成“描述性合成提示词”。随后,作者利用研发的“图像生成器”,应用于文生图数据集的每个图像,生成关键提示词用于后续实验。
最终,OpenAI团队使用95%的合成提示词和5%的真实反馈的数据集训练了DALL-E 3模型,并内置在ChatGPT应用中,以发挥模型的最大潜力,和实现高精确度的文生图反馈。
此外,团队还让DALL-E 3在多个测试中跑分,已显示出较好的性能。在CLIP得分评估中,DALL-E 3明显优于 DALL-E 2 和开源的Stable Diffusion XL模型;在Drawbench基准评估中,DALL-E 3 同样优于 DALL-E 2 和 Stable Diffusion XL,差距在20%-30%左右。
OpenAI公司CEO奥特曼(Sam Altman)此前已表示,新的DALL·E 3效果相当惊人。“如果不尝试的话,很难理解这是多么了不起的事情。”
另据报道,OpenAI去年开始研发的一款轻量化模型,内部代号为“Arrakis”,现已停止开发,原因主要是大模型的商业化步伐放缓。据市场机构Appfigures的数据,ChatGPT在过去9个月的收入增长超过了30%,但到了9月,其增速仅为20%,显示出增长放缓趋势。
然而,相比于OpenAI,由于美国不断加码芯片出口管制措施,中国 AI 大模型之路更为严峻,。
10月17日,美国商务部下属工业与安全局(BIS)发布了对中国半导体出口管制最终规则,在去年10月7日出台的临时规则基础上,进一步加严对 AI 相关芯片、半导体制造设备的对华出口限制,并将多家中国实体增列入出口管制“实体清单”。
这一措施已影响到大模型算力巨头英伟达、英特尔、AMD等厂商在华产品销售。英伟达已表示,包括A100/H100、A800/H800、L40s/L40、RTX4090等产品受出口管制影响。公司创始人黄仁勋直言,这一管制措施将对英伟达在中国市场有很大影响。
Counterpoint分析师Brady Wang表示,“从长远来看,如果美芯片制裁持续下去,这将影响到中国 AI 发展。”
当然,国产大模型算力能力依然也在不断增强。科大讯飞在10月19日第三季度业绩会上表示,出口管制对将构建在英伟达算力上的大模型厂商产生较大影响,但科大讯飞已于2023年初与华为昇腾启动专项攻关,合力打造中国通用人工智能新底座,让国产大模型架构在自主创新的软硬件基础之上。
科大讯飞方面强调,当前华为昇腾910B能力已经基本做到可对标英伟达A100。
10月20日,工信部新闻发言人、总工程师赵志国表示,中国正加快推动算力基础设施建设发展。下一步,工信部持续推进算力发展,加强基础设施建设,构建梯次化算力基础设施体系架构,使多方算力互联互通,促进技术创新和应用融合。
(本文首发钛媒体App,作者|林志佳)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
大模型技术最终会迎来寡头竞争局面,讯飞有成为巨头的实力