2024ITValue-文章详情顶部

商汤联合创始人杨帆:未来要推动 AI 数据的基础设施化,使中国 AI 产业持续发挥优势|钛媒体 2023T-EDGE

今年上半年,商汤发布了国内第一个综合能力超越GPT-3.5-turbo的大语言模型,让商汤生成式 AI 相关收入实现了670.4%的增长。

12月1日-2日,2023 T-EDGE全球创新大会暨EDGE AWARDS创新评选在北京751D·PARK传导空间举办,大会主题为“新视野 新链接”。

作为中国科技与商业创新领域备受瞩目的国际交流盛典,2023T-EDGE全球创新大会与全球创新者一同见证国际化浪潮下,全球商业创新思路与业务增长逻辑的爆炸式变革。

大会首日上午,商汤科技联合创始人、副总裁、大装置事业群总裁杨帆发表题为《中国人工智能产业的发展方向和机会》的演讲。

杨帆表示,人工智能(AI)技术正在推动核心生产力的不断进步和发展。在这其中,中国的所有科技进步更加聚焦于实体产业、生产性行业和基础服务业,而 AI 已经在推动科技产业发展与落地。

杨帆坦言,以商汤为代表的AI 原生公司,大家面对“盈利难”这一挑战问题,最大诟病就是研发成本太高、解决问题成本非常高,这在大模型时代更加突出,性价比是一个非常具有挑战性问题。

实际上,AI 三要素包括数据、算力和算法。其中,数据是 AI 发展的基石。

在杨帆看来,如今 AI 大模型时代下,数据变得越来越重要,未来,数据会持续以多种复杂形态进入到我们生活、生产的方方面面。而伴随着 AI 技术的场景创新,更大量的资源规模,能带来更加强大的智能,但核心驱动力还是高质量的数据。那么,建立 AI 数据基础设施化就变得更加重要。

商汤从2019年做视觉类大模型,逐步扩展到多模态场景。2023年3月,商汤集团宣布愿景和战略目标升级为“将通用人工智能(AGI)作为核心战略目标,以期在未来几年内实现AGI技术的重大突破”。

随后,商汤发布基于通用 AI 基础设施的SenseCore、“日日新”大模型体系研发的多个生成式AI产品商量、秒画、如影、琼宇、格物,为智慧商业、智慧生活、智慧汽车、智慧城市四个场景板块的客户提供相关能力和服务方案。商汤集团董事长、CEO徐立曾表示,2023年上半年,商汤发布了国内第一个综合能力超越GPT-3.5-turbo的大语言模型,让商汤生成式 AI 相关收入实现了670.4%的增长。

杨帆在演讲中表示,在大模型中文数据有效总量不及英文环境下,未来,中国需要发展关键性数据要素,尤其推动 AI 数据作为人工智能核心要素的基础设施化,从而使得中国 AI 产业发展持续发挥优势。

“我认为,越是没有得到很好答案的东西,对我们未来 AI 发展成败愈发重要。我希望,未来能跟大家一起思考和探讨相关话题。”杨帆在结尾表示。

以下为杨帆演讲实录,略经钛媒体App编辑:

尊敬的各位来宾,大家上午好,很荣幸今天能在这里跟大家分享一下我们所做的工作。

我刚才在下面也听了很多嘉宾的分享,我相信我跟在座各位一样,都能为最近一、两年我们看到的一些技术突破,以及所展现的未来新的科技的可能性,而感到非常雀跃和激动。

下面,我想跟大家分享一下我们更多的思考。

当我们有了一些0到1技术突破之后,那么接下来1到100,如何让整个科技创新对于产业产生更大的影响,我们需要做哪些事情,特别在中国这片希望土地上我们需要做哪些工作,或者哪些事情对于创新落地产生实际价值更加重要的思考,希望能够在这里抛砖引玉,跟大家共同的探索。

首先,我们回到一个可能比较宏观的概念。

我们都知道,生产力和生产关系之间的矛盾决定历史唯物主义。如果用更长期的视角看待这一问题,我们相信的一点是,伴随着整个社会核心生产力的不断进步和迭代,有人说智能是一次单独的革命,也有人说智能是信息化过程中最后最关键的核心要点。当看到整个社会的底层生产力结构发生大的变化时候,其实我们可以映射中间很多环节,会因此进行一些要素的改变。未来,它都会引导我们进行产业结构、社会结构的改变。

我举一个例子,数据。我们怎么看待数据这件事?或未来数据会产生怎样的形态?

大家都知道,国家今年成立了国家数据局,推动很多数据要素发展,AI 时代下,“数据”变得越来越重要,成为关键要素。那么未来,这个要素是一种怎样的交易形式,产权如何界定,跟历史上的土地、石油、资源都不一样。要素会低成本复制,未来会有很多不同东西、问题需要我们探索,但不可辩驳的事实是,未来(数据)会成为更加关键的要素,会以更加复杂的形态进入到我们生活、生产的方方面面。

大家可以想一下,信息时代或者智能化时代生产力与核心生产关系、核心工具到底是什么,从而对整个智能化进程中会带来什么样的改变。

其次,实际上,确实像刚才几位嘉宾提到,最近两年,整个 AI 技术取得全新0到1的技术突破。我们有理由相信,这样技术突破在未来产生更大的产业价值。

商汤科技从2019年做视觉类大模型,逐步扩展到多模态场景。今年,我们也发布了大模型系列,并探索线上客服、线下客服、营销等产业场景。

实际上,营销已经成为产业实践中改变非常大的领域。今天,大家看大量的24小时直播,这已经是全自动的生成的。甚至从图像、视频、语音内容再到文案,现在都是全自动AI生成的。虽然GPT大模型技术在国内落地只有半年左右,但这在某种程度上,已经对于这个(营销)行业产生了巨大的改变。我们相信,更多行业还在路上,不管国外还是国内都有比较多的探索和实践。

中国有一个较重要的点在于,所有的科技进步更加聚焦于实体产业、生产性行业和基础服务业,那么到底这将带来什么样的改变和提升。不管是政府引导,还是产业界,我们都倾向于更愿意在这个(科技进步)方面关注更多事情。

除了传统消费侧,今天,我们可以看到金融、能源等领域具有很多的数字化创新。例如,整个能源领域的电网优化、调度,让新能源发出来的电不要被无效地浪费掉,通过更优化的电网调度进行解决。但到今天为止,这依然是挑战性课题。

那么,我们可以看到,最新以大模型为代表的AI技术,能在汽车、医疗等领域有所建树。例如汽车领域,我们看到自动驾驶、智能车舱都有大量的尝试;医疗领域,中国医疗资源紧缺持续供需不平衡,这是个普遍性问题,这个过程中如何用自动化方式替代掉专业门槛是非常关键的环节,这是很多人关心的问题。

今天,当我们有了更好的 AI 模型,这些方面上有更好、更专业、成本非常低的选择,而上述这些产业化提升都已经在过去半年内发生。我相信,未来1—2年,(大模型)会产生更大的变化,包括文化旅游等。

实际上,文化旅游产业有大量的文物、历史信息,我们正在把它以某种形式数字化,能够在整个文化行业、旅游行业、电子化周边生成等领域应用,从而更有助于用新的形态,对中华历史文化进行很好的传承和弘扬。另外,在这个过程中,用AI实现从景区到旅游整个场景的深度融合,可以帮助我们优化服务业体验。

从诞生 AI 到今天,AI原生企业一直以来的垢病或者挑战是,你(企业)的研发成本太高了,解决问题成本非常高,这个问题在大模型时代更加突出。今天做一个大模型,随便一个创业公司投入上千万起,最终出来的大模型还不知道最后能不能用。从性价比来讲,这是非常具有挑战的问题。

那么,为什么会产生这样的问题,以及未来这一状态可能会走向何方。

我们讲,AI 三要素包括算力、算法、数据。这么多年来,我们有个认知是,AI 产业往前走,我们希望它能真正提供一个好的服务,除了互联网、个人消费端应用之外,它(希望 AI)可以把成本摊薄。而 AI 进入到生产行业、B端行业进行更好的服务、有效的生产力提升,需要做的是,如何提升整体的 AI 创新的性价比。

如何做?我认为,要么获得更优秀的AI能力,从而解决更大的问题;要么就是降低 AI 技术创新成本和门槛。那么,如果是后者,中间的一个很重要的概念就是:AI 基础设施化。

今天我们可以看到,大模型时代下,算力、算法两个关键要素都在做基础设施化。但问题在于,短时间内使用极大算力很难进行,我们真的需要这么多、若干个基(础)模型吗?如果说,基础模型未来会以能力服务的形式提供出来,并让别人做行业、场景的模型,而场景模型又可能是以能力服务形式提供给应用方。

我认为,基模型本质上就是算法的基础设施化。但接下来的问题是,数据的基础设施化又该是什么样的形态?怎样的形式?这是值得产业中所有人需要共同思考的。

我们看 AI 进步。所谓的基础设施化,伴随着 AI 技术原生的场景创新。我们会看到,过去20年来,所有 AI 技术进步,只有伴随着AI技术的场景创新,更大量的资源规模,能带来更加强大的智能,但核心驱动力还是高质量的数据。

我们需要做的是,GPT-5需要更多的数据,需要比GPT-4更多的数据,中间有很多价值论证的东西,比如资源持续扩张下如何把成本真正的下降。特别是算力,在中国高性能 AI 算力受到不公平的限制和封禁情况之下,我们如何持续取得技术进步、产业推广和扩展,这是非常具有挑战性的课题。

总结来说,大模型时代下,算力、算法、数据依赖非常大,如GPT对训练数据需求仍然在持续增大。

最后,我们回到 AI 三要素。

我认为,三要素之间有驱动关系的,最核心的驱动就是更多的数据。如果说今天我们为何要更大的算力,那么背后的核心就是,构建更大、更复杂的模型结构,而更复杂的模型结构需要更多的算力训练。这就是为什么有更多参数的模型,千亿、万亿往上爬,只有更复杂的参数,才能消化理解更大量数据的知识,而最后的一切原点,来自于我们对数据的消化和理解。

有很多科学家认为,这个路径是错的,人类不需要学习、汇聚这么多海量的知识。但这个路径现在是清晰、有明确回报、现实的路径。即便不是最终正确的路径,但我们仍然不可否认,数据在整个 AI 技术迭代和进步中所处在关键性的地位。

中国需要发展关键性数据要素。我们存在这样优势和机制,但也存在巨大的挑战。

比如,我们都知道,大模型是用的互联网上的数据训练的,但中文数据有效信息量或中文的数据,有效信息量或者有效总量是整个英文世界的10%,这样对于技术突破、技术产业化应用面临很大的挑战。

但与此同时,如果我们产业人口能够更好的形成合力,朝着目标持续推动工作,以及充分的市场竞争机制,特别是中国在 AI 市场竞争中非常充分,那么发展关键性数据要素,有助于我们推动科技创新。

我相信,其实中国 AI 产业落地往前走,很重要的关键点在于,我们如何回答数据要素解决核心问题,我们该如何定义它、设计它的所有权和交换机制,去推动 AI 数据作为人工智能核心要素的基础设施化。

上述这些问题我跟业内很多人聊过,但直到今天,我并没有得到很好的答案。我认为,越是没有得到很好答案的东西,对我们未来 AI 发展成败愈发重要。我希望未来跟在座各位同仁和业界个人同仁一起思考和探讨相关话题。

谢谢大家。

(本文首发钛媒体App,作者|林志佳)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 人工智能技术正在推动核心生产力的不断进步和发展

    回复 2023.12.03 · via android
  • 数据是AI发展的基石

    回复 2023.12.03 · via android
  • 数据在人工智能技术中具有基础性和重要性

    回复 2023.12.03 · via h5
  • 看看chatgpt如今还是无人超越就足见AI领域研发的困难

    回复 2023.12.02 · via h5
  • 人工智能技术在当今社会处在非常核心的位置,今年的大模型群魔狂舞就是很好的展示

    回复 2023.12.02 · via android
  • 这个第二回发!

    回复 2023.12.02 · via netease

快报

更多

2024-09-21 22:58

币安创始人赵长鹏确认即将出狱

2024-09-21 22:27

我国发布全球首个百亿级遥感解译基础模型

2024-09-21 21:45

我国成立首个国家卓越工程师实践基地

2024-09-21 21:04

AIGC产业联盟在京成立,推动AI生成内容技术创新与应用

2024-09-21 20:36

巴菲特继续抛售美国银行,2个月减持近81亿美元

2024-09-21 20:24

推进城中村改造迈出更大步伐,陈吉宁龚正在城中村改造工作推进会上作部署

2024-09-21 20:03

9月21日新闻联播速览20条

2024-09-21 19:34

汽车零部件供应商博世CEO:尚未排除关闭德国北部Hildesheim电动汽车工厂的可能性

2024-09-21 19:01

马斯克旗下社交平台X任命巴西法律代表

2024-09-21 18:47

杨勇平任兰州大学校长

2024-09-21 18:22

签约金额超600亿,京港洽谈会今日闭幕

2024-09-21 18:16

上海市委常委会审议通过《关于优化投资促进机制加强招商和服务一体化推进的实施方案》

2024-09-21 17:40

我国著名航空发动机专家刘松龄逝世

2024-09-21 17:04

深交所迎来西南地区首单消费REITs,中邮保险成为最大外部战配投资者

2024-09-21 17:01

乘联会崔东树:全国乘用车市场8月末库存315万台、库存46天

2024-09-21 16:51

市场监管总局:严查侵权网店、直播带货假冒商品,淘宝拼多多等81家平台签署自律公约

2024-09-21 16:33

同比增长19.08%,2023年我国数字出版产业达16179.68亿元

2024-09-21 16:01

中国贸促会副会长于健龙会见英中贸易协会首席执行官彼得·博内特

2024-09-21 15:50

打击资本市场“小作文”,三名造谣者被罚

2024-09-21 15:42

江苏:全省临床检验结果将逐步实现线上共享互认

6

扫描下载App