燧原科技发布中国最大的AI计算芯片,加速推进三大业务方向落地 | WAIC 2021

预计“邃思2.0”将于今年底量产。

燧原科技发布的邃思2.0实物图

燧原科技发布的邃思2.0实物图

钛媒体7月8日消息,在2021世界人工智能大会(WAIC 2021)期间,上海燧原科技推出第二代人工智能(AI)训练产品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”训练加速卡和“云燧T21”训练OAM模组,全面升级的“驭算TopsRider”软件平台以及全新的“云燧集群”。

燧原科技成立于2018年3月,专注研发针对云端数据中心的深度学习高端芯片,定位于AI训练及推理解决方案,是国内第一家同时拥有高性能云端训练和云端推理产品的创业公司。经过三年多的飞速发展,截止今年5月,燧原科技员工人数已超500人,其中90%为研发人员。

据介绍,燧原科技发布的邃思2.0是迄今中国最大的AI计算芯片,尺寸为57.5毫米×57.5毫米(面积为3306mm2),达到了日月光2.5D封装的极限,与上代产品一样采用格罗方德12nm FinFET工艺,内部共整合9颗芯片,单精度FP32算力为40TFLOPS,单精度张量TF32算力为160TFLOPS,整数精度INT8算力为320TOPS。相比之下,英伟达基于Ampere架构的A100 GPU的单精度浮点计算能力仅为19.5TFLOPS。

同时,邃思2.0也是首个支持最先进内存HBM2E的产品。云燧T20/T21则是基于邃思2.0而打造,预计“邃思2.0”将于今年底量产。

在新品发布会上,中国科学院院士陈国良致辞祝贺,称非常看好且充分理解燧原科技是一家致力做大芯片、拼硬科技为宗旨的公司。当下因中美问题使得针对中国计算机工业的制裁接踵而来,中国希望与世界一起发展,但发展也要“打铁自身硬”。在这种背景下,发展自主可控的计算机工业系统是当务之急。“这个过程中,中国未来需要燧原科技这样一群有建设性的公司,把自主可控这件事落到实处。”

燧原科技CEO赵立东则表示,第二代AI训练产品的发布,是燧原科技开发原始创新的算力产品和构建自主生态又一重要的里程碑。

具体而言,2019年底,燧原科技发布了从启动项目研发到发布用时仅18个月的云端训练芯片邃思1.0,基于邃思1.0的云燧T10加速卡单精度算力高达20TFLOPS,以及AI推理加速卡云燧i10和配套的“驭算”软件平台。

而在两年后的今天,燧原科技在第二代新品系列中进行了四大核心的全新升级迭代,其计算能力、存储和带宽、互联能力较第一代训练产品有巨大提升,对超大规模的模型支持能力获得显著增强:

1、架构升级实现算力飞跃。邃思2.0进行了大规模的架构升级,新一代全自研的GCU-CARA全域计算架构,针对AI计算的特性进行深度优化,夯实了支持通用异构计算的基础;支持全面的计算精度,涵盖从FP32、TF32、FP16、BF16到INT8,并成为中国首款支持单精度张量TF32数据精度的AI芯片。

2、HBM2E存储带来海量吞吐。邃思2.0的中心是主芯片,在边缘有4颗三星最先进的存储芯片HBM2E,高配支持64GB内存,最大带宽达1.8TB/s。据悉,这是中国第一个支持世界最先进存储HBM2E和单芯片64GB内存的产品。

3、高速互联支撑算力扩展。新的计算架构带来了全新GCU-LARE全域互联技术——这是燧原专为人工智能训练集群研发的互联技术,提供双向300 GB/s互联带宽,支持数千张云燧CloudBlazer加速卡互联,实现优异的线性加速比。

4、不止是芯片,燧原也进行了全新软件调配,推出燧原科技自主知识产权的计算及编程平台驭算TopsRider。通过软硬件协同架构设计,充分发挥邃思2.0的性能;基于算子泛化技术及图优化策略,支持主流深度学习框架下的各类模型训练;利用Horovod分布式训练框架与GCU-LARE互联技术相互配合,为超大规模集群的高效运行提供解决方案。

另外,燧原科技推出与了合作伙伴(浪潮等)共同打造的全新产品品牌云燧智算集群CloudBlazer Matrix 2.0,集合8192张云燧训练卡,可实现最高1.3E(130000T)的单精度智能算力集群。据悉,E(Exascale)级计算就是百万兆级的计算,是目前全球顶尖超算系统新的追逐目标。

在发布会上,燧原科技COO张亚林展示了T20与友商(英伟达V100、A100)的Benchmark对比跑分。

由图可见,云燧T20 TF32精度性能平均2.5倍于友商次旗舰。而在多类模型测试中,云燧T20与友商旗舰性能几乎不分伯仲,即6种测试项目中有4个超越了友商旗舰的性能表现。

张亚林强调,邃思2.0大幅提升了算力指标,升级后的驭算软件平台更加便捷易用和客户友好,燧原科技也可针对客户的场景和业务模型提供软件定制化服务和优化,打造差异化解决方案;而基于云燧T20和T21训练产品、GCU-LARE互联技术和新一代驭算,燧原科技可以打造超大规模的集群产品CloudBlazer Matrix,可有效降低AI超算集群的整体复杂度和成本。
燧原科技CEO赵立东(左)与 燧原科技COO张亚林(右)共同发布“云燧T20”训练加速卡和“邃思2.0”芯片

燧原科技CEO赵立东(左)与 燧原科技COO张亚林(右)共同发布“云燧T20”训练加速卡和“邃思2.0”芯片

据介绍,燧原科技的产品重点落地在泛互联网、传统行业(金融、交通、电力、医疗、工业等)以及新基建三大业务方向。

在本次发布会上,赵立东宣布了燧原的异构计算生态——“燎原”计划,目标是以AI为起点构建通用异构计算生态,构建标准化技术体系,共建完整生态服务数字中国。另外,燧原通过与之江实验室、上海交通大学、西安交通大学等高校的合作,构建生态的同时培养人才。当日,燧原科技还和上海银行、浪潮等生态合作伙伴进行了战略合作框架签约。

在融资方面,成立至今,燧原科技连续获得过5轮融资,累计融资额近32亿元人民币。投资方包括腾讯、武岳峰资本、红点中国、真格基金、亦合资本、中信产业基金、中金资本旗下基金、春华资本等明星基金公司。

  • 2018年4月,燧原科技完成由真格基金、亦合资本、达泰资本联合领投的种子轮;
  • 2018年7月,燧原科技完成3.4亿元人民币pre-A轮融资,领投方为腾讯;
  • 2019年5月,燧原科技完成3亿人民币A轮融资,领投方为红点创投中国;
  • 2020年5月,燧原科技完成7亿元人民币B轮融资,领投方为半导体产业基金武岳峰资本,老股东腾讯继续跟投;
  • 2021年1月,燧原科技完成的18亿人民币C轮融资,由中信产业基金、中金资本旗下基金、春华资本领投。

钛媒体了解到,燧原科技计划到2023年打造3款云端训练计算产品、3款云端推理计算产品,将性能功耗比提升至初代的14倍,并同步升级Matrix集群,有望全面“国产替代”美国半导体公司的相关AI芯片产品。

(本文首发钛媒体App,作者|林志佳)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
  • 给小编加鸡腿🍗
  • 爱了爱了😁
  • 挺有深度的,不错
  • 紧跟时事,赞一个👍🏻👍🏻
  • 真不错,收藏了
  • 写的很不错,关注了
  • 都没有那么简单
  • 这么厉害的吗
  • 学到了学到了
  • 商场如战场,竞争激烈啊
  • 行业发展都是有周期的
  • 企业的发展都不是一番风顺的
  • 说的好有道理😄
  • 内容值得人们反思
  • 数据还是很详细的
  • 内容很精彩,夸一夸
  • 又学到了很多知识
  • 内容很详细👍🏻
  • 小编辛苦了
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
197
187

扫描下载App