阿里巴巴、智源研究院、清华大学联合发布国内最大预训练AI模型“文汇”

2021.01.12 06:00

钛媒体1月12日消息，阿里巴巴、智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”。该模型不仅能提升AI的理解能力，还可基于常识实现AI创作，未来将应用于文本理解、人机交互、视觉问答等场景。据了解，“文汇”是目前国内规模最大的预训练模型，参数量级达113亿，采用阿里自研的统一多种并行策略的高性能分布式框架，使用模型并行、流水并行、数据并行训练进行分布式训练。“文汇”突破了多模态理解与多模态生成两大难题，可轻松理解文本图像信息，并能完成创造性任务。例如，仅需输入诗歌题目、朝代以及作者，“文汇”即可自动生成仿古诗词。目前，“文汇”已支持基于认知推理的多种自然语言及跨模态应用任务，部分应用即将上线。

本文内容仅供参考，不构成投资建议，请谨慎对待。