中国电信确定大模型开源时间表,发布首批12个行业大模型

“网络+云计算+AI+应用”成为中国电信的数字化标签。

中国电信成为大模型领域一股重要力量。在2023数字科技生态大会上,中国电信展现了从液冷数据中心到智算平台,从基础大模型到行业大模型的全面布局,“网络+云计算+AI+应用”成为中国电信的数字化标签。

全面披露大模型布局

7月初世界人工智能大会上,中国电信发布了百亿参数的星辰语义模型,中中国电信人工智能科技有限公司总经理何忠江表示,中国电信在进行商业化落地过程中碰到了三个主要问题,幻觉问题、外推窗口问题以及多轮逻辑推理问题。

本次中国电信发布的星辰千亿参数语义大模型,一定程度缓解如上问题。例如针对幻觉问题,中国电信通过数据切片溯源的机制,将一个复杂逻辑问题拆解为多轮逻辑相对简单,数据可溯源的小问题来进行SFT训练,在千亿参数规模下,自测幻觉率能够降低一半左右。接下来中国电信将通过量化蒸馏的手段,让模型能够低成本商用。

值得关注的是,中国电信的AI团队宣布了开源开放的时间表,将于今年年底之前开源百亿参数模型,明年4月开源千亿参数模型,所有底层代码都会开源。同步将开放超过1T的高质量清洗数据,以及各种基于星辰大模型底座的工具链,满足各类开放用户需求,并面向开发者提供各类大模型工具支持。

此外,中国电信研发的多模态大模型主要聚焦在提升图文生成、图文理解的能力,中国电信训练了超过12亿的各种风格数据,目前支持写实、彩墨画、赛博朋克等接近20种绘画风格,由于在训练中特意加强了语义和图像映射的attention学习,所以对于中文的理解,语义的细粒度理解提升不少。

人工智能领域除了算力和算法,核心环节还有数据。一是支撑大模型数据语料的积累,中国电信目前已经完成了超500TB文本数据、12亿张图文数据、日采集2PB的视频数据的积累,并且中国电信作为首家运营商单位加入中国大模型语料数据联盟。

二是参与建设数据要素市场化,中国电信通过建设开放共享的隐私计算平台,吸引合作数据和技术伙伴入驻。目前在海南,已协助市政府构建了“数据超市产品”,中国电信作为独家运营方,促成了2000亿的数据资源汇聚,运营了超5亿的交易项目。

基于基础大模型,中国电信进一步展现了行业大模型布局。中国电信政企信息服务事业群总经理潘天舒介绍,中国电信首批试商用12个行业大模型,包括星辰教育大模型、治理大模型、政务服务大模型、应急大模型、医保大模型、交通大模型、住建大模型、金融大模型、神农一号大模型、出行大模型、旅游导览大模型、矿山大模型。

以星辰教育大模型为例,中国电信基于教育行业亿级服务数据沉淀,训练出具有国家中英文作文特级教师水平的“精准教学大模型”,15秒就能完成一篇中英文作文的打分、点评和改进建议让每一个学生每一篇作文都能享受到特级教师的辅导,教师一场考试作文评分与点评时间由4个小时缩短至30分钟。目前已在河南1.2万师生教学中应用并取得良好的效果。

再如星辰基层治理大模型,主要支撑三大场景:一是矛调助手,14种矛调手段智能匹配,让基层调解员、尤其是新手在遇到疑难时能迅速获得支持,调解成功率提升2倍以上;

二是法律明白人,为每一名基层调解员配备了一个“线上法律顾问”;

三是公文助手,支持7大类公文智能输出,只需10分钟即可完成原先1小时的公文报告;目前已在福州多个基层社区上线应用。

此外,中国电信还推出“星辰MaaS生态服务平台”,为不同客户提供专属定制版、通用行业版和客户自训练版等三种大模型一站式服务。同时在全国首创推出“智能算力车”,采用“基础算力+轻量版天翼云骁平台+专用电源车”模式,满足了部分客户数据安全管理的规定,已在雄安新区等为客户完成了定制训练

大模型加持,天翼云升级

大模型不断扩大的参数规模和快速迭代的技术路线,跨越式地提升了模型的能力,但是同时也为大模型的训练和应用带来了很多挑战。比如算力利用率的瓶颈日益凸显、算力成本压力进一步增大、模型的构建难度不断提升,模型的行业落地更加复杂。

天翼云公司总经理胡志强表示,大模型对于云服务商提出了新要求,天翼云也全面升级,构建了全栈大模型智算服务,包括打造智算数据中心AIDC、升级云智超一体化基础设施平台“云骁”、推出一站式智算服务平台“慧聚”,构建国云大模型生态,形成云智一体的智算服务体系。

智算基础设施是整个体系的基石,针对AI高强度运算带来的散热问题,天翼云推出了液冷DC舱,融合定制化液冷智算服务器,实现低至1.12的PUE。

“云骁”升级成为云智超一体化基础设施服务平台,构建了高性能RoCE网络、并行文件存储等服务,重点提升训练加速、网络加速等核心能力,同时升级了运维体系,实现对基础设施的全面故障预测和感知。

在国产化方面,云骁平台率先在公有云加载天翼云RoCE网络+国产GPU方案并实现商用。

在平台层,天翼云全新发布大模型一站式智算服务平台“慧聚”,构建一站式全链路的大模型生产应用的流水线,能够大幅降低大模型训练、微调、部署、推理的门槛,让客户能够更专注于模型升级和应用落地。

据了解,慧聚平台成功突破了算子加速、模型并行、断点续训等技术难点,将高性能计算能力、分布式算力调度能力、训练和推理多环节加速技术、高性能数据存储技术进行封装;实现了万卡集群调度,稳定性、训练推理速度等核心指标大幅提升。

慧聚平台内置数据平台、模型训练平台、模型服务平台和应用服务平台四大平台,提供数据准备、模型开发、任务管理、模型优化等七大主要产品功能模块,每个功能模块又包含多级组件,功能与组件之间可以灵活组装,帮助用户打造针对不同场景的专属工具集。

“天衍”量子计算云平台发布

目前,中国是唯一在超导量子和光量子两种物理体系上都实现“量子计算优越性”的国家。如何将这些科研成果落地到实际场景中,推动科技变革、产业革命,在未来10年,量子计算云平台、超量融合将是量子计算走向实用化的主流形式。

中电信量子信息科技集团有限公司总经理吕品介绍,中国电信的“天衍”量子计算云平台,实现了“天翼云”超算算力和176个超导量子比特算力的融合,是具备“量子优越性”能力的超量融合云平台。

云平台基于超量混合云架构,提供量子云操作系统、量子计算编译、量子计算模拟、图形化编程等核心能力,实现了超算和量子计算在云上混合调度,降低了量子计算机的使用门槛。这将加速量子计算助力量子化学研究、新药新材料开发、能源气象模拟等场景,对推动量子计算走向实用化有着重要的意义。

吕品表示,天衍具备四大核心优势:首先,“天衍”平台对接的超导量子计算机,在处理随机线路取样等特定问题上,速度比目前最快的超算快1000万倍,真正实现了量子计算优越性;

其次,这是一款完全自主可控的量子云平台,实现了从真机到操控系统到编译软件全部国产化;

第三,量子计算未来有望在应用场景模拟上指数级提升计算速率,实现超量协同;

第四,中国电信携手超过两千家天翼云生态合作伙伴和20家量子计算生态伙伴,打造量子计算生态联盟,共同推进量子科技的发展。

据悉,中国电信将持续致力于量子计算云平台的性能提升,到2025年,接入不低于五百量子比特的量子计算机;到2030年,平台将对接不低于1万量子比特的超级量子计算机。

(本文首发钛媒体APP 作者|张帅,欢迎添加作者mr3right交流)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 这背后找的谁合作呢?蹭热点运营商从没输过

    回复 2023.11.12 · via netease
  • 弄这么多有啥用?

    回复 2023.11.11 · via netease
  • 不如把话费流量宽带费降一降

    回复 2023.11.11 · via netease
  • 这个奇元大模型听起来不错啊,备案360自研的两大模型都获得了批准,这可是个好消息。

    回复 2023.11.11 · via netease
  • 这些大模型产品,不都是为了给企业提供服务吗?怎么就有区别了呢?你说的平台化、行业化的发展方向,我可不太懂。

    回复 2023.11.11 · via netease
5

扫描下载App