清华系独角兽融资超25亿，中美大模型持续“狂飙”

尽管美国加码芯片出口管制措施以阻止中国 AI 发展，但考虑到目前大模型行业的趋势，国产算力仍然有望迎难而上。这意味着，中国的AI应用产业仍然具有一定的竞争优势。

（图片来源：TiPost/Intel）

ChatGPT发布一周年将到来之际，中国、美国的 AI 大模型进展迅速，行业持续“狂飙”。

10月20日，AI 大模型领域独角兽企业北京智谱华章科技有限公司（以下简称“智谱AI”）宣布，已完成新一轮融资，今年以来，智谱 AI 累计融资额超过25亿元人民币。

此轮投资方阵容豪华，包括社保基金中关村自主创新基金（君联资本为基金管理人）、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构，而君联资本等部分老股东跟投，华兴资本担任独家财务顾问。据悉，智谱 AI 创始团队来自清华大学，公司估值据传已超过100亿元。

无独有偶。美国OpenAI公司于20日上线了DALL-E 3 AI 绘图功能在ChatGPT Plus付费版中，而且该公司还公布DALL-E 3关键技术论文，用19页叙述“提示词遵循”等技术细节。

事实上尽管美国加码芯片出口管制措施以阻止中国的AI发展，但考虑到目前大模型行业的趋势，中国国产算力仍然有望迎难而上。这意味着，中国的AI应用产业仍然具有一定的竞争优势，从而在未来全球数字经济变革中承担重要地位。

大模型浪潮下，阿里、腾讯向清华系独角兽投资25亿

以ChatGPT为代表的生成式 AI，一夜之间火热“出圈”，瞬间掀起了新一波技术浪潮。

美国弗吉尼亚大学经济学教授Anton Korinek直言，相比过去20年，预计生成式 AI 将在未来10年把生产力提高10%-20%。

事实上，早在2019年6月，智谱 AI——这家由清华大学计算机系知识工程实验室的技术成果转化公司，瞄准了当时还未爆火的大模型技术。公司集结了一群清华大牛——CEO张鹏毕业于清华计算机系，总裁王绍兰为清华创新领军博士，清华大学计算系教授唐杰也参与研发中国最大规模预训练模型悟道2.0。

智谱AI CEO 张鹏

2020年，智谱AI开始了GLM预训练架构的研发，并训练了100亿参数模型GLM-10B。2021年，公司利用MoE架构成功训练出万亿稀疏模型，并于2022年公布了1300亿级超大规模预训练通用模型GLM-130B，而且还以此打造大模型平台及产品矩阵。

2023年，智谱AI推出千亿基座的对话模型ChatGLM，并开源单卡版模型ChatGLM-6B等，部署于个人开发者和企业应用领域。今年6月，智谱AI 迭代出ChatGLM2，包括6B、130B、12B（120亿参数）、32B、66B等参数的模型，效果全面提升，推理速度增长42%。据张鹏透露，相比GPT-4版的ChatGPT，ChatGLM2-12B、32B和66B性能分别提升16%、36%和280%。

当前，智谱 AI 开源模型在全球下载量已超过1000万次。同时，公司也进行了商业化探索，打造了AIGC（生成式 AI）模型及产品矩阵，包括已获批上线的智谱清言、高效率代码模型CodeGeeX等。

融资方面，创立至今的四年来，智谱AI 共完成三轮融资，最近一次消息是2022年9月公司宣布的B轮，投资方包括华控基金、启明创投、君联资本、中科创星、将门创投等机构。

如今，智谱AI又完成了一轮25亿元融资，阿里、腾讯、小米、蚂蚁等巨头纷纷参与。公司称，上述融资将用于基座大模型的进一步研发，更好地支撑行业生态。

据财新，目前智谱AI 公司估值已超过100亿元。

OpenAI罕见公布新模型技术

10月20日，OpenAI向hatGPT Plus 和 Enterprise 用户上线了最新的DALL-E 3文生图模型的访问权限。

据悉，DALL-E 3于上个月首次发布，相比DALL-E 2，OpenAI第三代文生图技术首次内置在ChatGPT当中，可允许用户提供更直观的描述性信息从而生成图片，而且新技术生成的图像更逼真，效果更好。OpenAI 表示，其为DALL-E 3模型提供安全堆栈技术，从而为扩展功能做好准备。

与此同时，OpenAI 团队还非常罕见的公布了DALL-E 3的部分技术细节，因为ChatGPT、GPT-4到目前为止都没有全部公布相关技术论文。

此次论文中，OpenAI详细阐述了DALL-E 3的技术改进，首先团队提出了一种改进图像生成系统的方法“提示词遵循”，通过训练高质量的生成图像标题来提高文本生成图像的能力。而且，团队还创建了一个比较庞大、精准的提示词数据，该数据集详细描述了每个图像的内容，包括主要对象、周围环境、背景、图像中的文本、风格、颜色等。

其次，作者使用新的数据集对基础提示词进行微调，生成“描述性合成提示词”。随后，作者利用研发的“图像生成器”，应用于文生图数据集的每个图像，生成关键提示词用于后续实验。

最终，OpenAI团队使用95%的合成提示词和5%的真实反馈的数据集训练了DALL-E 3模型，并内置在ChatGPT应用中，以发挥模型的最大潜力，和实现高精确度的文生图反馈。

此外，团队还让DALL-E 3在多个测试中跑分，已显示出较好的性能。在CLIP得分评估中，DALL-E 3明显优于 DALL-E 2 和开源的Stable Diffusion XL模型；在Drawbench基准评估中，DALL-E 3 同样优于 DALL-E 2 和 Stable Diffusion XL，差距在20%-30%左右。

OpenAI公司CEO奥特曼（Sam Altman）此前已表示，新的DALL·E 3效果相当惊人。“如果不尝试的话，很难理解这是多么了不起的事情。”

另据报道，OpenAI去年开始研发的一款轻量化模型，内部代号为“Arrakis”，现已停止开发，原因主要是大模型的商业化步伐放缓。据市场机构Appfigures的数据，ChatGPT在过去9个月的收入增长超过了30%，但到了9月，其增速仅为20%，显示出增长放缓趋势。

然而，相比于OpenAI，由于美国不断加码芯片出口管制措施，中国 AI 大模型之路更为严峻，。

10月17日，美国商务部下属工业与安全局（BIS）发布了对中国半导体出口管制最终规则，在去年10月7日出台的临时规则基础上，进一步加严对 AI 相关芯片、半导体制造设备的对华出口限制，并将多家中国实体增列入出口管制“实体清单”。

这一措施已影响到大模型算力巨头英伟达、英特尔、AMD等厂商在华产品销售。英伟达已表示，包括A100/H100、A800/H800、L40s/L40、RTX4090等产品受出口管制影响。公司创始人黄仁勋直言，这一管制措施将对英伟达在中国市场有很大影响。

Counterpoint分析师Brady Wang表示，“从长远来看，如果美芯片制裁持续下去，这将影响到中国 AI 发展。”

当然，国产大模型算力能力依然也在不断增强。科大讯飞在10月19日第三季度业绩会上表示，出口管制对将构建在英伟达算力上的大模型厂商产生较大影响，但科大讯飞已于2023年初与华为昇腾启动专项攻关，合力打造中国通用人工智能新底座，让国产大模型架构在自主创新的软硬件基础之上。

科大讯飞方面强调，当前华为昇腾910B能力已经基本做到可对标英伟达A100。

10月20日，工信部新闻发言人、总工程师赵志国表示，中国正加快推动算力基础设施建设发展。下一步，工信部持续推进算力发展，加强基础设施建设，构建梯次化算力基础设施体系架构，使多方算力互联互通，促进技术创新和应用融合。

（本文首发钛媒体App，作者｜林志佳）

清华系独角兽融资超25亿，中美大模型持续“狂飙”｜钛媒体焦点

大模型浪潮下，阿里、腾讯向清华系独角兽投资25亿

OpenAI罕见公布新模型技术

最近资讯

敬原创，有钛度，得赞赏

关注喜欢的作者

参与互动讨论

作品投稿