大模型背景下,AI基础软件的实践路径是什么?| ToB产业观察

AGI
“未来影响大模型多样化路径发展的三大重要因素,算力、数据和基础软件。”

 图片来源@视觉中国

大模型的热潮,正推动AI(人工智能)基础设施走向新的历史舞台。

九章云极DataCanvas联合创始人尚明栋告诉钛媒体:“大模型,就跟过去的小模型一样会变得趋同化,也就是对算力成本的消耗会逐渐降低,在应用领域(场景)的落地能力得到了更强的扩大。从更长远来看,AI的落地会落实到某种具体业务的支撑,这同时也会导致某些角色(岗位)被替代掉。在新的稳态下,会形成新的基于大模型能力的产业链分工。”

九章云极DataCanvas定位于AI基础软件服务商,而不是一个单纯的模型方案提供商。这个思路,与当下大模型技术带来的产业变革密切相关。

尚明栋认为,大模型与过去训练的小模型出现了根本性区别,即模型两段论:首先有一个基础大模型,然后在这个基础之上基于模型微调,构建面向专业领域的大模型应用。

但聚焦于AI基础软件与通常意义上讲的EDA、ERP等工业核心软件不同,AI基础软件的价值体现不仅仅涉及到软件技术层面,它也体现了中国ToB对专业分工越来越尊重所形成的行业软件生态。目前九章云极DataCanvas提供AI基础软件,一方面会长期投入可形成核心壁垒的部分,比如包括AutoML、实时决策、因果学习,同时也在与金融、交通、制造等行业头部企业客户形成早期合作。

如今ChatGPT进行了一场非常成熟的全民性教育,因而大模型的能力建设在时间上会被极大的压缩。九章云极DataCanvas也在大模型训练的关键环节上“啃了硬骨头”,并具备快速形成标准化工具的能力。

根据赛迪顾问最近提出的一则观点:国内企业在大模型发展方向研判上呈现出跟随式发展态势。例如GPT4开启多模态大模型发展方向后,国内先发大模型也纷纷发展多模态,如何摆脱跟随式发展路径依赖,构建自主可控创新型大模型是当前重点任务。

大模型预计为产业带来了巨大影响,但同样存在不小的应用风险和商业化成本问题。这值得思考。从目前来看,大模型在企业场景中的应用形态还比较单一,更多局限于语音/文字交互,如金融行业可能就是一张金融报表或检索工具。

但大模型已经在增强模型泛化能力,意味着AI落地性增强了,与此同时也在对过去的基础设施进行冲击,过去需要的是计算、存储、网络三要素,而现在带宽支撑已经远远不够,算力密集型应用场景中需要大量的算力建设。

尚明栋认为,未来影响大模型多样化路径发展的三大重要因素,算力、数据和基础软件。未来随着算力性能逐渐同质化和标准化,数据的差异性和企业需求的个性化逐渐加大。作为模型生态系统的中坚力量,AI基础软件将会成为大模型应用落地的最主要的效率支撑,并通过大模型+小模型的方式,形成模型训练新范式。

以下为钛媒体与尚明栋的对话,主要解读了当下AI基础软件产业趋势、大模型带来的影响,以及九章云极DataCanvas在其中扮演了什么角色。以下内容经摘编:

钛媒体:九章云极DataCanvas在开源方面也做了一些工作,比如YLearn因果学习软件、DingoDB实时交互式分析数据库,观察国内外的企业组织,有哪些在开源生态运营或培育种子客户方面,有哪些值得借鉴或可以超越的地方?

尚明栋:我们希望能够持续在开源社区发声,更好地提高项目框架的开发者活跃度。我们也积极参与到开源生态里,对于需要行业工程化或能力复用的部分,会更好地根据行业或企业特性进行支持。

以DingoBD为例,DingoBD的出现本质上是源自其行业客户在实时数据应用过程中的能力不足。例如某企业客户此前搭建了一套传统数仓,后来又因非结构化数据搭建了数据湖,并引入流数据能力,以实现数据服务的实时化。

但在这个过程中,随着模型应用的实时化,会发现越来越多的模型在训练和推理过程中所需的实时框架,是原先内存式数据库所不能满足的。在解决存储问题的同时,实现高并发的实时计算,DingoBD原先解决的就是这样一个问题。

如今随着行业数据的丰富,最早的键值数据库的定义已经在改变,我们也会进行新的升级,在支持高并发的同时,提供向量存储,高性能搜索和分析的向量数据库。

钛媒体:如何理解九章云极DataCanvas在做的大模型基础设施的事情,是通用基础大模型吗?

尚明栋:其实我们偏向于构建行业大模型,这与九章云极DataCanvas一开始的定位有关,一是服务于多个行业,二是打造的工具栈基本也是面向ToB为主。目前已经非常明显地出现了行业模型的分化,所以我们更多也是基于行业的大模型。

钛媒体:但难度还是存在的,除了算力和数据,是不是意味着会跟业内其他大模型企业合作?

尚明栋:从长远看,大模型跟小模型一样会更加趋同化,对算力的成本消耗会持续降低。大模型的构建具备一定的数据规模和技术门槛,同时起应用领域得以在更广的范围拓展。大模型会逐渐构成新的产业链分工,因此AI的工业落地一定会落实到对于某个具体业务的价值体现。

例如大模型中涉及的专业知识库的构建,原先可能都需要数据分析师利用SQL语言进行软件涉及,而未来可能直接通过自然语言交互,从而降低了很多对专业性技能的依赖,无形中对行业的技术能力需求进行重构。

钛媒体:领域大模型或垂类大模型,如果引入银行客服、风控、反欺诈等场景,大模型的底层应用逻辑是什么?看到或预判了什么样的场景?

尚明栋:我们的思考是,过去小模型解决的是“场景”,大模型往往代替的是“分工”和“角色”。大模型一方面为企业带来了收益,同时也在为企业节省出了人工成本。根据这样一个逻辑,与我们自身行业生态结合比较紧密的,或者说消耗了大量人力成本的环节或角色,更有可能成为被大模型替代或驱动的目标。

目前银行业的风控、营销、运营等场景,都在非常密集地使用AI模型,用于替换原有的专家规则系统,本质上起到了开源节流的效果。

钛媒体:除了有大B的客户群体,什么最终决定了我们的产品设计,包括推出云中云战略?

尚明栋:结合国家在“十四五”期间对于大数据、人工智能的定调,我们认为中国数字经济的三驾马车是算力建设、企业云和大模型。

算力方面根据摩尔定律从长远看价格不再成为鸿沟。企业云特别是运营商云的建设增速极快,体量已经比肩头部的云厂商。当前迎来了大模型和小模型的融合发展和众多行业的落地应用,我们积极顺应时代潮流,参与到国家在大数据和人工智能的生态建设洪流中。

钛媒体:哪些行业是数据密集型,其典型的需求特征是什么?

尚明栋:数据不会凭空产生,未来模型也是数据资产的一部分,从趋势上看,数据的产生是一个持续建设的过程。例如,互联网行业属于信息化与数据更加密集的行业。

九章云极DataCanvas最早进入的其实是金融银行业,然后逐步拓展至证券、保险、基金,进而从金融行业延伸到了运营商、智能制造、交通、能源电力等行业。另外,伴随企业信息化建设的延续,如物联网感知设备数量的增长,产生了非常多的非机构化、半结构化数据。而这些数据大多都在处于非利用的存储态,因而行业对数据的典型需求是数据价值的挖掘和再利用,大模型提供了一个恰逢其时,价值明确的契机。

(本文首发钛媒体APP,作者 | 杨丽) 

本文系作者 杨丽_ 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
  • 给小编加鸡腿🍗
  • 爱了爱了😁
  • 挺有深度的,不错
  • 紧跟时事,赞一个👍🏻👍🏻
  • 真不错,收藏了
  • 写的很不错,关注了
  • 都没有那么简单
  • 这么厉害的吗
  • 学到了学到了
  • 商场如战场,竞争激烈啊
  • 行业发展都是有周期的
  • 企业的发展都不是一番风顺的
  • 说的好有道理😄
  • 内容值得人们反思
  • 数据还是很详细的
  • 内容很精彩,夸一夸
  • 又学到了很多知识
  • 内容很详细👍🏻
  • 小编辛苦了
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
24

扫描下载App