3月23日,2024全球开发者先锋大会(GDC)在上海开幕。
本届GDC大会以“模速空间—开发者的模力之源”为主题,围绕大模型上下游产业链及应用场景,超过100个国内外知名生态社区代表、100多家国内外知名投资机构,线下开发者超3万人次参与,涵盖1场开幕式、1场顶尖青年开发者交流会、5场前沿技术讲坛、10+场平行技术讲坛,以及数百位嘉宾线下演讲。
同时,大会期间还将展示超过100个国内外知名模型、最新趋势和创新成果等。就在23日上午,阶跃星辰、商汤、RWKV、上海人工智能实验室、幂方科技等企业的六款最新大模型全面亮相。
据上海市人民政府副市长陈杰披露,目前上海有24款大模型进行了备案,多款人形机器人也即将发布。
23日的开幕式上,“空间计算之父”、RealityPrime和XR Guild主席Avi Bar-Zeev;美国硅谷创业教父、创业孵化器Founders Space创始人史蒂夫·霍夫曼(Steve Hoffman);OpenAI前全球商业化负责人Zack Kass;美国国家工程院外籍院士沈向洋;商汤科技董事长兼首席执行官徐立;上海人工智能实验室主任助理、领军科学家乔宇等人展开演讲。
硅谷创业教父:AI 不是一种商业模式
事实上,AI 是新一轮科技革命和产业变革的重要驱动力量。当前,以大模型为代表的生成式 AI 等前沿技术正在持续迭代发展,与社会生产生活各方面加速融合,形成新质生产力,也引发了创新创业的热潮。
据工业和信息化部副部长王江平披露,截至2023年底,中国软件产业规模超过12万亿元。
在3月23日上午的开幕式上,被称为硅谷“船长”的创业教父、创业孵化器Founders Space创始人史蒂夫·霍夫曼(Steve Hoffman)在2024 GDC大会开幕式上表示,AI不是一种商业模式,而是一种技术。
“大家经常会搞混,如果我有AI,我的企业就成功了,不是这样的。众多企业只用一下AI,不一定能成功,而是AI能够为你的客户带来什么,企业最终还是要服务客户,因为客户提出了对产品和服务的需求,利用AI能够给你的客户带来独创价值,竞品无法做到,您就会鹤立鸡群。”霍夫曼表示。
他在演讲中坦言,“大家(企业)要思考自己的“护城河”,这比历史以往更加重要,单单考虑应用AI还不够,你需要在自己的业务周围建立护城河。这个不是来自于AI本身,因为大家都可以利用AI,利用API,利用ChatGPT的API,每个人都可以做到。单单使用API,你没有竞争优势,超越竞品要有更加广泛的思考,我如何让用户获得更好的服务,如何和客户建立更加独特的关系,我能够将什么技术申请专利,我有什么样的自有数据得以在我公司生成,这些是你利用AI成功的要点,你要超越AI本身。你要记住,如果你在大平台公司,比如OpenAI、谷歌,前进道路上的过程当中,他们会将你压碎,你只会成为他们公司产品的一个特征。”
不过,霍夫曼也认为,AI 发展很快,已经开始做了一些事情。比如,AI 可以做一个面试官,替你选人才,从而可以节约你的时间和资源。同时,AI可以帮助他们进行员工训练,所以你就不需要投入相关的资源去训练新入(职)的员工。
“这个员工是否要辞退或者雇佣,很多管理者的决策可以基于AI。”霍夫曼表示,AI可以解决很多复杂、困难的问题。而利用数据,利用 AI 赋能各种行业,可以帮助你决策等。
霍夫曼非常看好人形机器人、数字孪生、程序化的搜索引擎优化等各种新的行业,预计将被 AI 技术所赋能和加速发展。
“大家都在讲Sora,Sora之所以特别棒,它不仅可以创建某一个视频,它能够对其进行编辑。到此时此刻,我们直接可以和视频对话,然后进行改变,改变这个人戴的帽子,改变他的面孔。我们和视频进行对话,和视频对话能够进行编辑,生成难以置信的质量。在未来5年,这样的视频不会只有1分钟,可以长达1小时,任何人在家里都可以创建专业质量的视频。”霍夫曼称。
在演讲之后的“开发者十问”圆桌上,霍夫曼直接表示,在 AI 领域,初创企业不要和大厂直接竞争,和大厂竞争太难。
他直言,企业在做战略规划时,要看看自己的专业能力和核心技术。
“在正确的赛道才是大热门,如果不是AI初创企业,现在就拿不到任何资金支持,现在太难了,很多企业在死亡。”霍夫曼表示,不管是生命科学、金融科技,还是客户服务、销售,利用 AI 的各个行业都需要关注 AI 如何给你带来更好的竞争力。
霍夫曼强调,Midjournuy原来做得也很好,非常棒的开发工具,但是谷歌、微软现在把众多的产品免费了,Midjournuy就“死”掉了,所以,如Pika这家公司现在要和Sora竞争的话,需要要思考如何开发新产品,而不是直接和大的平台进行竞争。
OpenAI Zack Kass:2030年AGI时代将会到来
OpenAI前全球商业化负责人Zack Kass在GDC演讲中表示,在未来10年内,计算机、手机等设备将经历重大变革,人们甚至可以通过戴眼镜来操作电器,电器将变成公共工具,我们的生活也将因此发生改变。
“2030年AGI(通用人工智能)时代即将到来。”Zack Kass表示。
Zack Kass认为,AI技术的发展可以分为三个阶段:首先,应用增强阶段,AI功能日益强大,如ChatGPT的出现,使得我们通过简单的手机操作就能享受到AI的便利;其次,AI自动化阶段,预计在未来两年内实现。在这一阶段,AI能够自动执行任务,无需手动打开应用程序。用户可以通过语音命令或耳机传达指令,实现直接操作。最后是AI赋能的操作系统阶段,这将是一个更加革命性的变革。随着CPU的发展,人们对工具和设备的期待也在不断提高。
当下AGI的时代已经到来,我们该如何做好准备?Zack Kass称,面对技术的发展,非常重要的一点是一定要学会区分技术能做什么,能为我们服务什么。AGI技术的发展,对每个开发者来说,意味着技术的成本越来越低。ChatGPT 3.0刚开始问世的时候,成本非常高,而现在已经接近于零成本。
“而且开发者一定要牢记哪些是当下我们面临的技术瓶颈,比如每年在高速公路上或者无人驾驶的事故率也有很多,我们应该进行风险评估。”Zack Kass称。
Zack Kass也提到要警惕AI技术发展产生的陷阱。他提到,AI能够解决许多个性化的需求,也会让人们对这类AI工具产生依赖,这可能会导致人类智力的退化。此外,AI的普及可能引发人们对身份认同的困惑,许多人担心失业问题。
针对当下的“AI复活”技术,Zack Kass指出,“我们需要分清人类与技术的界限,我自己在生活中更愿意与人互动,而不是和机器互动,人与人的互动是非常重要。”
Zack Kass认为,机器缺乏灵魂,而人的复活在现实中是不可能的。AI“复活”亲人是一种奇怪的想法,并不是我们生活的现实世界。Zack Kass表示,人是什么,机器是什么,我们需要分清界限。在生活当中,他更愿意和人互动,而不是和机器互动,这些互动不是做很多实验、做很多研究可以替代的,机器无法读出人类的想法。
大会圆桌期间,AI创业还面临高投入、变现难等问题。Zack Kass坦言,这是一个老问题,但乐观的是,整个价格或者开发的成本会变,很多依赖于ChatGPT,会发现成本削减了一半,因为由于大模型的开发成本不断地下降,大模型的开发成本慢慢在变低,甚至接近到零。营运成本还需要密切关注,一定要让大模型商业运营,商业化很重要。
“另一个是成本的投入,可能对于初创企业来说,成本投入很重要。”Zack Kass表示。
在演讲最后,Zack Kass建议大家要规划好个人生活,要去思考,AI把人类的知识技能商业化之后,我们人类还能做什么。
沈向洋:大模型将横扫所有垂直行业,算力是门槛
“大模型大到一定地步以后就涌现出来。多大才涌现出来?没人讲得清楚。”23日开幕式上,美国国家工程院外籍院士沈向洋在《大模型时代的机遇和挑战》的演讲中分享了对大模型的思考。
首先,沈向洋表示,AI 技术蓬勃发展,但人们对智能的本质并没有清晰认知。物理学是Theory of Everything,而深度学习就是Theory of Anything。
过去这几年,大模型的发展风起云涌,Text to Text、文生图、文生视频等形式不断涌现。
沈向洋认为,文生图使得一言胜千图,一个简单的提示就可以做出了不起的图片。ChatGPT使得一句顶一万句,提出一个问题可以得到很多答案。Sora的出现使得输入几句提示就能产生大片效果。
“大模型这个事情出来以后,国内已经有非常多的公司,很多开发者已经在做这方面的工作了。有一个数字说,全中国大概有200多家做大模型的公司,所以叫百模大战不夸张,我觉得更像是‘群模乱舞’。”沈向洋表示,大模型对开发者和做科研的人来讲是很振奋的事情,它给我们一个机会,实际上你把科研做好的话,创新非常重要,而且需要有影响力。
这三件事让人们产生一个个焦虑,未来开发者的机会在哪里?沈向洋认为是多模态。他认为,多模态是AGI的必经之路,以OpenAI代表的技术实际上是对不同模态的理解。
“OpenAI的内部有两套体系,一是从文生图延展到文生视频,走的是Stable Diffusion路线,二是文生文,走的是Transformer路线。到现在为止,这两条线路还没完全统一起来,相信接下来中国的开发者、世界的开发者,很快会有这方面的突破。”沈向洋称。
随后,沈向洋分享了关于大模型的五方面思考。
第一,大模型的到来,强迫人类重新思考人机关系。“我们受到的冲击,到底有多少是机器智能的发展,有多少是人机交互的震撼。”他认为,不管是什么技术,最终目的是帮助人更好运用机器,不忘初心。
第二,大模型将横扫所有垂直行业。大模型可分为通用大模型、行业大模型、企业大模型和个人大模型。“一个通用大模型如果没有万卡、不上1万亿参数,基本上以后就不太好意思说这是一个通用模型了。行业大模型大致上是千亿参数、千亿卡的训练规模。企业大模型可能只需要100张卡、百亿参数。最有意思的是个人大模型,利用个性化参数,结合云和端,这是非常有意义的。”
第三,算力是门槛。影响算力的两大因素是模型大小和数据规模,随着参数增加,对算力的需求几乎是几何级的。“千卡万卡是钱堆出来的。以前有一句话叫贫穷限制想象力,现在贫穷可能扭曲想象力,因为如果没有卡,能想象要做的项目可能就不太一样了。”
第四,AI带来社会冲击。这些冲击包括对民众的冲击、企业的冲击、政府监管的冲击、社会发展的冲击,带来一本正经胡说八道、深度伪造等伦理问题,很多国家开始立法,这需要共同推动治理、向前发展。
第五,智能的本质。AI 蓬勃发展,但人们对智能的本质并没有清晰认知。
“大模型改变了几乎所有的事情,”沈向洋表示,“很多人相信scaling law(规模法则),但今天的深度学习,理论非常欠缺。从宇宙到量子,物理学有一套大一统的理论统一起来,叫作Theory of Everything。今天深度学习没有这样的理论,所以叫作Theory of Anything。”
最后,沈向洋指出,他相信创新有三个层次:一个是技术的创新,一个是产品的创新,一个商业模式的创新。有计算和没计算机完全两码事,没有互联网就不存在电商这件事情,这三件事情最根本的创新,特别是对开发者来讲肯定是技术的创新。
“所以以前大家都非常激动地讲,做得好的话要做一个PMF(product market film),今天大模型时代给我们带来更大冲击的是TFF(technology market film),出道即巅峰,ChatGPT一出来两个月一亿用户,这些都会给我们开发者,特别是在上海的开发者一些鼓励,(大模型)系统好好地建立起来。”沈向洋在演讲结尾称。
空间计算之父:“元宇宙”将改变未来的网络生态
演讲开始的时候,“空间计算之父”、RealityPrime和XR Guild主席Avi Bar-Zeev戴上了苹果Vision Pro设备,展示了虚拟现实设备画面。
“我戴的这个眼镜用了很长时间。但我不代表苹果,我代表的是整个团队,他们一起开发了这个产品——这就是空间计算。我们把电脑放弃,直接来看这样一个苹果Apple Glasses,大家看到我前面的屏幕,对于大家来说不是3D的,但对我来说是3D,也就是说我进入了一个新世界。”Avi Bar-Zeev表示。
Avi Bar-Zeev详细谈及VR(虚拟现实)、AR(增强现实)和空间计算之间的区别。他指出,空间计算是指我坐在椅子上体感中看到的手、头等与计算机进行交流(突破屏幕的交流),当然有很多冲突(包括利益冲突)。与VR、AR相比技术是类似的,需要及时区分。“空间计算有不同的层次和维度,其实它们之间没有真正的冲突,实际上是可以共存的,它们之间的界限已经非常模糊了。”
对于“元宇宙”和空间计算的区别,Avi Bar-Zeev指出,它们之间有重大的区别。其中一点是,在同一房间里对于“空间计算”和“元宇宙”中的物品感知——一个是现实、一个是世界。空间计算更加安全、更个性化,所以大家可以有不同的感受。“它(空间计算)是一个起点,之后我们可以进军到‘元宇宙’。”
Avi Bar-Zeev认为,那些炒作“元宇宙”会让大批人失业,对社会造成冲击等,实际不然。从一个“金字塔”学术角度看,技术是以人为本,这与我们以往的世界是不一样的。
“‘元宇宙’改变了未来的网络生态,我们一定要解决一对一、一对多的小规模的互动。”Avi Bar-Zeev强调,未来“元宇宙”相关设备会对娱乐业产生影响,体验XR设备的机会可能更多一些。
徐立:基于 AI 的生产力工具目前只能解决10%以下问题,突破或有限
3月23日上午的开幕式上,AI 上市公司商汤科技董事长兼CEO徐立发表了主题为《AI 2.0时代的新质生产力工具》的演讲。
徐立表示,以ChatGPT为代表的生成式 AI 技术推动人类进入AI 2.0时代。中国对于ChatGPT、Copilot、生产力工具、英伟达Blackwell等词语的关注度最高,位居所有国家的榜首。这代表着,中国近千万的开发者以及普罗大众对于“AI 能够带来什么样变化”的热切关注。
然而,徐立直指,尽管人们对于生成式 AI 技术提高生产效率的需求不断提升,但现状却是,这些AI 2.0时代的生产力工具当前的情况并不尽如人意,目前解决的问题在10%以下,生产链上能带来的突破可能还有限。
“虽然中国对于这部分的关注度非常高,但我们真正在使用这部分的应用当中排在了美国印度之后,我想这里面还有一个问题——语言问题。如果用自然语言来完成编程的任务、设计的任务,目前来说英语和现在的程序匹配非常得完整,有大量的现成的数据,但是到中文相信需要有更好的中文语言的工具。”徐立称。
徐立提到,有意思的是,大家的认知中,如果我的编程经验越丰富,越能够用好新的生产力工具?事实上统计数据显示是相反的:经验在五年以下的程序员,往往能够用到生产力工具解决的问题时长是超过一小时的,但是五年以上的程序员,每周能节省的时间反倒是更短的。这代表,越是高阶的任务、越是复杂的任务,对于大家用好现在的 AI 工具来说还是有一定的挑战。
徐立称,生产力工具的 AI 模型分成能力圈的三层(KRE),之间互有依赖但不完全相关:第一层知识层Knowledge;第二层推理层(Reasoning),第三层是执行层Execution。
徐立十分看好“具身智能”和人形机器人领域发展。他提到,从某种意义上来说,执行就是“具身智能的大脑”,预计未来会有很大的突破。
近期,商汤推出了代码小浣熊——基于商汤大语言模型的软件智能研发助手,覆盖软件需求分析、架构设计、代码编写、软件测试等环节,满足用户代码编写、编程学习等各类需求。代码小浣熊支持Python等90+主流编程语言和主流IDE。
在实际应用中,代码小浣熊可帮助开发者提升编程效率超50%。徐立则透露,代码小浣熊至少能节省30%的工作量。
徐立强调,未来,AI2.0时代的生产力工具如果在知识能力、推理能力、执行能力上有所突破,首先受益的是广大开发者以及场景化的核心应用。“对于我们来说,我们会把我们的办公小浣熊全部免费推广给所有开发者。”
上海人工智能实验室乔宇:数据、算力、人才等创新要素都具备下,才能超越OpenAI
上海人工智能实验室主任助理、领军科学家乔宇在题为《书生通用大模型体系:进展与趋势》的演讲中表示,与现在相比,大模型至少还有1~2个数量级的提升。预计到2030年,我们需要再把大模型提高两个数量级,才有可能实现真正的 AGI。
那么,大模型是按照什么规律在演进?
乔宇认为,大模型是按照Scaling Laws(缩放定律)的方法演进,这意味着下一代的模型一定比上代模型如果能力有明显提升的话,算力、数据往往要大一个数量级,这是为什么从GPT2到3再到GPT4、5每次都是数量级的提升,未来大模型将向多模态、具身方向演进。
乔宇指出,“大模型的本质是什么?有人说大模型的本质是人的智能,用一个词让我概括的话,我愿意选择“生成式压缩”。以Lama2为例,我们需要把一个10Tb的文本压缩到一个100GB的模型文件,这里面大概是上千,甚至是上万倍的压缩。
“我们正处于专用智能时代到通用智能时代的关键阶段。”乔宇表示,面向未来的AGI,有两条发展路线,一是延续大模型路线,用更大的算力扩大模型规模,拓宽能力边界,向产业渗透;二是探索强化学习、知识计算、符号推理、类脑计算及其他新型路径。这两条技术路选并非孤立和互相替代的,而是要通过探索新的技术路线解决大模型现有路线中的固有问题。
作为诞生在上海的 AI 领域新型研究机构,上海人工智能实验室构建了全链条的开源体系,用开源支持创新和应用生态的发展。
“一方面大模型目前面临着效率可信、安全等很多挑战,而解决这些挑战不是光靠工程就可以的,我们需要原始的创新。在过去两年中间在实验室里,我们获得了关于CVPR国际顶级会议的论文奖励。第二,我们要通过原始创新,驱动大模型性能能力的提升;最后一点是开源开放,通过开源的方式,我们可以为学术社区、产业社区提供高性能、更安全、更方便易用的大模型。”乔宇坦言,这是其做大模型的三个初衷。
乔宇强调,现在的AGI大模型已经不再是一个简单的软件工具,所以需要用更多的系统性思维,来审视大模型的安全。
“大模型有智能涌现,我们是不是能把安全或者跟相关智能技术,也成为现在大模型体系发展的一个重要基础?”在演讲结尾,乔宇发出这样的思考。
而谈及当前到底是模型还是应用创造价值,乔宇回应称,“到底是应该更关注模型,还是关注应用。模型和应用事实上是不可或缺的一体两翼,现在基础模型的提升能为我们建立应用创造更大的空间,特别是现在在应用中间,包括幻觉、效率很多瓶颈,事实上都取决于我们在基础领域突破才能解决的。另外,大模型的发展绝对不是为了显示自己有多强,更重要的是能够推动应用的发展,能够在应用中产生实际的效益和价值,从而为人类创造更加美好的生活。所以基础大模型的发展也需要应用的牵引,需要统筹来看一体两翼的问题。”
百余个 AI 模型“群魔乱舞”,机器人、芯片、编码应用全面展示
除了开幕式演讲,3月22日、23日两天,钛媒体App编辑也探访了大会展馆,整体来看,主要分为四个板块:AI模型和基础设施,AIGC应用,AI+机器人,以及 AI 人才。
首先是AI模型和基础设施方面,联通、阿里云、MiniMax、HiDream、百川智能、无问芯穹、蜜度等厂商均有参展。
其中,阿里云在此次大会期间公布阿里云魔搭社区“ModelScope-Sora开源计划”,将为类Sora模型开发提供一站式工具链,涵盖数据处理工具、多模态数据集、类Sora基础模型、训练推理工具等。现阶段,魔搭发布了业界首个开源的多模态数据处理系统Data-Juicer,包含100多种高效算子,可大幅提升视频数据处理效率和质量。
据透露,阿里云魔搭目前已汇聚3000多款优质模型及上千数据集,为超过400万开发者提供模型及免费算力服务。
MiniMax则在本届展会期间展示MiniMax开放平台面向企业级用户和开发者的大模型应用解决方案。
蜜度则展示两个自研垂类大模型——蜜巢和文修,其最新落地应用页同步亮相,以及好玩、有趣的“AI变身秀”——文生图应用进行互动体验。
据蜜度透露,“AI变身秀”的背后,是多模态融合生成技术的应用成果。该技术集成了多项先进算法,通过利用生成式扩散模型生成多类动漫风格形象,同时通过对色彩、光影、构图等进行精细调整,结合特征条件提取和AI超分等技术,进一步提升了“AI变身秀”富有个性化的画面。
其次,AIGC应用方面,中国农业银行、Rokid、Dify、思岚、Xmind、中科曙光、Zilliz等公司展示了基于全新 AI 技术的重要场景应用。
再次,本届GDC展区,机器人是其中重要的展示方向。云深处科技、宇树科技、傲鲨智能、开普勒、如身机器人、梅卡曼德等公司展示了人形机器人、四足机器人、服务机器人等多款产品,机器人行走活灵活现,十分有趣,观赏性十足。
而在展区外面,特斯拉Cybertruck皮卡也引起很多人驻足观看。
最后,AI 人才方面,展区专门搭建了 AI 人才招聘区域,猎聘、万兴、上海人工智能实验室、特斯拉、数坤等企业均开启了招聘通道,包括开发工程师、算法工程师等职位。很多 AI 企业都希望在“金三银四”时期招揽新 AI 时代人才。
整体来看,随着2024年中国大模型进入落地年,金融、文字、医疗等大量领域和场景将会被 AI 所变革。面对50万亿数字经济市场,中国在全球 AI 模型竞争下半场当中会获得大量优势。
陈杰表示,面对 AI 的蓬勃发展,作为上海重点发展的先导产业,上海 AI 产业将进一步发挥超大城市的综合优势,加快建设具有更高影响力的 AI 高地。
他指出,第一,上海将加强核心技术突破,打造更多元开放的智能计算生态,支持通用大模型和垂直大模型研发,积极推进大模型和具身智能的融合发展;第二,进一步加大开源开放力度,探索大模型的新型开源和推广模式,降低广大创新创业团队、中小企业等大模型训练门槛,推出更多具有示范性、标志性的应用场景,牵引大模型在金融、教育、医疗、制造等典型领域的垂直应用;第三,加快培育创新创业生态,深化载体建设,提升服务能级,完善标准体系、安全准则、伦理规范,推动 AI、区块链、元宇宙等前沿技术的开发和应用。
“我们希望今天所有的嘉宾和所有 AI 的开发者,都能够在穹顶之下仰望苍穹,共同为 AI 的全球治理,为 AI 更高质量的发展作出更大的贡献。”陈杰表示。
(本文首发钛媒体App,作者|林志佳)
根据《网络安全法》实名制要求,请绑定手机号后发表评论