近日,大模型创业公司月之暗面完成新一轮超10亿美金的融资,投资方包括红杉中国、小红书、美团、阿里等,上一轮的老股东继续跟投,本轮融资后月之暗面估值已达约25亿美金。
这是自大模型创业潮兴起以来,中国大模型赛道金额最大的一笔单轮融资。
月之暗面2023年4月成立于北京,创始人杨植麟是毕业于清华大学的学霸,师从唐杰教授;之后获得卡内基梅隆大学计算机博士学位,师从苹果公司人工智能负责人Ruslan Salakhutdinov。中国35岁以下NLP领域引用最高的研究者,Transformer-XL和XLNet两篇论文的第一作者——两者均为大语言模型领域的核心技术;另外两位联合创始人周昕宇和吴育昕,则有超过10000+的Google Scholar引用。
2023年6月,在硅谷极具影响力的科技媒体The Information中,杨植麟成为“中国OpenAI”的五个候选之一,其余四位为MiniMax、智谱AI、光年之外以及澜舟科技。
其核心团队曾参与过Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发中,这是一支在大模型道路上已探索多年的队伍。
值得一提的是,月之暗面团队成立不到2个月就获得了红杉中国、今日资本、真格基金、砺思资本等知名VC投资,目前团队人数已超80人。
作为90后创业者,月之暗面的成长速度惊人。成立不到1年里就完成了从通用大模型到上层应用的布局。在大模型层已训练了千亿级别的自研通用大模型;在应用层,正式推出首个面向C端的产品智能助手 Kimi 能支持 20 万汉字的输入,是 Anthropic 的 Claude 2 -100k(约 8 万字)的 2.5 倍,OpenAI 的 GPT-4-32 K(约 2.5 万字)的 8 倍。
老股东表示,“较于国内其他的ChatGPT产品,Kimi Chat给出的信息质量非常不错。”
杨植麟认为,在 B2C 领域,AI Native 将开辟新的流量渠道,它们有望成为 AI 时代的 Super App,带来巨大的商机。
国内通用大模型领域的第一梯队也已经清晰展现。据当前公开信息,除月之暗面以外,包括智谱AI、MiniMax、百川智能、零一万物在内的创业公司,估值都已达10亿美金后。
一位 AI 从业者称,在去年下半年这个时间点,月之暗面也是中国头部大模型公司里投资性价比相对高的一家:它在去年 10 月的 20 亿元人民币 A 轮融资后,估值约为 8 亿美元,低于当时估值已接近 20 亿美元的 MiniMax 和智谱 AI 以及已是独角兽的百川智能。
据悉,月之暗面正在研发通用多模态模型,并预计在今年内推出,多模态模型是近期大模型创业公司的核心竞争点。
月之暗面在多模态相关技术上多有储备,团队成员曾发明了包括基于对比学习的视觉预训练范式MoCo、最高效的视觉网络结构之一ShuffleNet等,也有团队成员主导开发了detectron2,后者是一个被广泛使用的视觉开源项目,曾被集成到Meta全线VR/AR产品中。(本文首发钛媒体App,作者|郭虹妘,编辑|陶天宇)
根据《网络安全法》实名制要求,请绑定手机号后发表评论