7月1日下午,2024全球数字经济大会AI专题论坛在中关村国家自主创新示范区会议中心举办。论坛以“应用即未来——大模型赋能千行百业,新生态拥抱产业未来”为主题,重大政策、仿生机器人大赛启动、“伙伴计划”、体验券等计划集中发布。
同时,阿里、百度、百川智能、智谱 AI、澜舟科技等14家大模型企业负责人齐聚论坛,围绕大模型技术应用与探索,立足企业自身的实践,分别发表主题演讲和论坛。
备案约占全国一半左右,补贴超6000万
据披露,截止目前,中国大陆已备案的大模型产品达到166个,其中北京市独占71个,占比接近一半。
论坛上,“伙伴计划”成果首次发布。共发布101个AI大模型训练的数据集,数据总量超1150 TB;累计40余家模型企业参与了数据交易合作,累计交易金额近千万
在算力方面,北京共收集算力供需信息200余条,其中“算力伙伴”企业已为“模型伙伴”企业提供约8500P的算力支持;2023年以来为70多家次企业发放算力券补贴超6000万元。在投资方面,31家“投资伙伴”总管理市值超5000亿元,累计投资了110个项目。
为了进一步加速大模型在传统消费领域的应用场景测试,北京人工智能产业联盟联合在京备案的阿里云、火山引擎、小米科技、网易有道等大模型企业,共同开展“大模型体验券”的发放体验活动。
此外,当下在大模型应用中,且与通用人工智能密切相关的具身智能,已经成为大模型产业的技术创新前沿阵地与焦点。早在今年4月,海淀区就发布了《关于打造全国具身智能创新高地的三年行动方案(2024-2026年)》,此次中关村仿生机器人大赛就是其中“生态雨林打造行动”的重要一部分。
阿里、百川、智谱、360等行业头部大佬齐聚,共话大模型落地实践路径
主题演讲环节,360公司、阿里、百度、百川智能、智谱 AI、澜舟科技等大模型领域企业的领袖和负责人齐聚论坛,围绕大模型技术应用与探索,立足企业自身的实践,分别发表主题演讲。
360集团创始人周鸿祎指出,如今全国各地都在谈论打造新质生产力,以数字化技术为主要抓手,通过科技创新来推动传统产业的数字化转型、智能化改造,推动经济高质量发展,其中,AI已经成为推动数字经济和新质生产力发展重要引擎,而“大百姓+百行千业”是打造新质生产力的必然路径。
“大语言模型出现之后,AI不再是过去的人工智障,拥有了真正的智能将引领社会进入智能化时代。对生活方式特别是企业的生产方式带来深远影响,大模型为代表的AI技术会掀起新一轮工业革命。”周鸿祎表示。
在他看来,大模型不是摧毁各个行业,而是重塑每个行业,席卷每个行业。最近英伟达市值超过苹果、微软,成为全世界第一,标志着AI时代的真正来临。
周鸿祎指出将大模型从“神坛”拉下的重要性,意味着政企不能仅仅依赖于像OpenAI这样的超级通用人工智能。通过构建专业化的小模型组合,企业和政府可以在降低成本的同时,提高模型的适用性和效率。
周鸿祎强调,小模型训练难度对人才要求大大降低,导致大模型从原子弹变成了“茶叶蛋”。
百川智能创始人、CEO王小川提出,与互联网时代主要改变生产关系不同,智能时代将直接提升生产力,通过模型产生知识而非仅仅是信息。这种转变将带来生产力的质的飞跃,使得AI成为新质生产力的重要组成部分。
王小川指出,ChatGPT只是智能时代第一个应用的代表,未来将有更多新的应用涌现。这些应用将不再仅仅是工具,而是能够像人一样提供服务能力和陪伴能力。这种转变将使得AI在各个领域发挥更大的作用,赋能千行百业,提升整体社会的生产力水平。
针对AI应用的未来趋势。王小川提出两个观点:
第一,在个人助理领域,尽管过去的智能助理产品表现并不尽如人意,但随着技术的不断进步和应用场景的不断拓展,未来的智能助理将能够更好地满足人们的需求,提供更加个性化、智能化的服务。
第二,王小川在阐述百川在AI领域的战略选择时,特别强调了医疗作为大模型应用的重要领域,并称之为“大模型皇冠上的明珠”。这一观点深刻揭示了医疗领域在AI发展中的核心地位,以及大模型技术在医疗领域所展现出的巨大潜力和价值。
他认为,互联网医疗虽然在一定程度上改变了医疗服务的生产关系,但并未真正解决医生供给不足的问题。通过大模型技术的辅助,可以在医院内实现医生助理和健康顾问的功能,为患者提供全病程的健康管理服务。
这一过程中,大模型不仅能够收集更多的临床数据,还能够像医生一样进行科研和总结,推动医疗知识的快速迭代和精准建模。最终,这将使得医疗服务的预防、诊断和治疗水平得到全面提升。
王小川表示,当大模型技术达到AGI水平时,将有望实现L4级别的医疗应用,即造出能够像医生一样工作的通用AI。而到了L5级别,AI将超越医生的水平,在健康管理全过程中发挥更大的作用。此时,大模型将不再仅仅是语言模型,而是向生命模型转变,为AI在科学研究领域的应用开辟新的道路。
智谱AI CEO张鹏则在演讲中表示,技术的不断进步为AGI的实现提供了可能,而市场需求的不断增长则推动了技术的进一步应用和优化。而这一切的基础,都源自于基座大模型GLM的强大能力。
GLM作为智谱AI自主研发的预训练模型框架,不仅在技术层面实现了多项创新突破,还在实际应用中展现出了强大的泛化能力和多任务处理能力。这种能力使得GLM能够成为支撑AGI发展的核心基础设施,为AGI技术的研发和应用提供强有力的支撑。
最新一代的GLM模型不仅在通用性、上下文处理能力、跨模态能力等方面实现了提升,更重要的是具备了逻辑推理、任务规划等智能体能力。这使得模型能够像人类一样对复杂问题进行拆解、规划,并使用工具完成任务求解。这种能力对于提升生产效率、解放人类劳动力具有重要意义。
面壁智能联合创始人、CEO李大海指出,大模型训练成本、耗电量、碳排放急剧攀升,打造全球领先的轻量高性能大模型,成为大模型未来竞争新的重要方向。面壁智能MiniCPM以较低的能耗和成本提供高性能的端侧AI能力,助力大模型在各场景应用落地。
端侧模型的优势主要体现在两个方面:第一,端侧模型的可靠性;第二,随着隐私法规的日益严格,端侧模型可以减少数据上传到云端的需求,从而降低隐私泄露的风险。
百度智能云副总裁喻友平也谈道,去年是大模型技术元年,今年是大模型应用元年。在通用的企业领域中,知识管理、客服和企业营销是企业通过大模型实现增收提效的最佳路径。
阿里云副总裁、中国信息化百人会执委安筱鹏提出,算力与大模型技术发展的基本规律——Scaling Law。尽管这一规律存在争议,但多数专家认为在未来2-3年内它仍然适用。这意味着大模型技术的主要竞争赛道将继续聚焦于大语言模型的高参数竞争,而高参数则直接对应着对算力的巨大需求。因此,大算力集群成为了全球大模型竞争的必要基础设施。
同时,安筱鹏提出智算集群的“三个不等式”:芯片性能不等于智算集群性能、自主可控不等于技术封闭、技术可用不等于商业可行,大规模智算需要具备技术先进、生态开放、商业可行三大特点。因此,安筱鹏表示,尽管大模型训练需要巨大的算力投资,但商业回报却是一个需要深入思考的问题。为了实现商业可行性,需要不断优化算力集群的性能、降低训练成本、提高应用效率,并探索多元化的商业模式和盈利途径。
中国电信北京公司党委副书记、副总经理孙健指出了当前企业在拥抱AI过程中面临的困境:高期望与现实挑战并存。企业领导层对AI寄予厚望,希望它能迅速带来颠覆性变革,但实际操作中却常因数据治理不足、应用场景不明确、算力组织困难等问题而受阻。
这种“鸿沟”需要全产业链共同努力去填平,包括技术提供商、服务提供商以及企业自身。中国电信依托自身资源禀赋联合相关合作伙伴推出“大模型生态合作计划”,共建开放AI生态,推进大模型在各领域加速应用落地。中国电信通过AI提升自身的效率和效益,如网络规划、运营、客服、营销等领域的智能化改造,均取得了显著成效。
生数科技联合创始人兼CEO唐家渝表示,生数科技构建全球首个 Diffusion Transformer 架构 U-ViT,在多模态大模型领域具备全栈自主研发能力。
深势科技创始人兼CEO孙伟杰认为,AI for Science是实现产业创新的关键,是通往AGI的必由之路。AI for Science不仅仅是一个简单的模型或工具,而是一个综合性的平台,它集成了深度学习、强化学习、物理模拟等多种先进技术,能够系统地学习并应用科学规律。AI for Science可以在药物研发、材料科学、能源技术等关键领域提供前所未有的计算能力和预测精度。
而深势科技为AI for Science研发新范式打造微尺度大模型,包括蛋白折叠、基因序列、分子模拟、分子构象、晶体结构表征等多个领域,在当前最关键的医药、能源、材料等领域的微尺度研发方面提供技术支持。
澜舟科技联席CEO李京梅表示,大模型技术正助力企业在不同行业打造超级应用,提高生产力。澜舟科技的孟子大模型专注于垂直领域,提供“产模一体”解决方案,通过智能知识库和AI应用搭建工具平台,推动企业智能化转型,实现知识管理和决策支持的效率革命。
在应用方向上,澜舟科技还推出了澜舟智慧和澜舟智搭等解决方案,分别面向会议场景的智能分析和企业个性化、定制化应用的快速搭建。这些解决方案与孟子大模型紧密结合,形成了完整的“产模一体”解决方案体系,助力企业打造超级应用,加速提升新质生产力。
理想汽车智能空间副总裁勾晓菲表示,汽车行业大模型落地主要有三个趋势:第一,硬件的同质化是汽车行业迈向智能化、实现软件定义汽车的重要前提;第二,未来的UI界面必须具备高度的原子化和动态生成能力,能够根据用户的语义实时构建出符合需求的界面;第三,未来AI在汽车领域的应用将更加注重专用化、个性化的发展。
联想集团副总裁、联想研究院人工智能实验室负责人范建平博士表示,联想通过大模型压缩、定向增强、异构推理加速和混合意图理解等技术,构建AI PC领域的端侧个人智能体。联想AI PC结合了端侧大模型和异构计算存储芯片,提供自然交互体验,同时确保了用户隐私和数据安全。另外,联想AI PC将AI Agent与联想全栈设备紧密结合,打造了一个集强大智能与全面硬件支持于一体的个人电脑产品。
同方知网总经理张宏伟表示,大模型的本质是对人类知识的压缩,数据是AI的基石,数据要素与AI产业发展相辅相成、相互促进,赋能人工智能产业持续高质量发展。在众多类型的数据中,出版数据因其承载着人类知识文明的传承而具有独特的价值,这些数据不仅是人类知识的精华,还蕴含着丰富的价值观和文化内涵。因此,在大模型的训练和价值对齐过程中,出版数据发挥着不可替代的作用,它们能够提升大模型的专业性和可信度,使其生成的内容更加专业、有深度和可溯源。
旅行行业,去哪儿早在初创时期,就已经工程技术聚合机票价格进行搜索比价。在大模型应用当面,去哪儿网通过AI判别模型,可以根据用户的需求提供个性化的搜索推荐,并且通过提高代码开发效率和质量提升了内部工作效率。
去哪儿网副总裁孙斌认为,面对AI技术的突破性发展,特别是ChatGPT等大模型产品的出现,去哪儿网迅速响应,通过内部技术培训和外部合作,加速了AI技术在旅游行业的落地应用。全能个人旅行管家时代已经到来。基于大模型能力,个人助手可以为用户解决旅行前、中、后的各项个性化需求。
一方面,大模型要快速深入行业应用,另一方面企业渴望改变自身能力去拥抱AI,这中间存在大模型供给和客户需求的鸿沟,这就需要全产业链的玩家共同发力。
大模型应用落地的探索、挑战与未来
在论坛圆桌对话环节,北京市前沿国际AI研究院理事、英诺天使合伙人王晟主持,与众多AI企业高管围绕“大模型应用落地的探索、挑战与未来”这一主题深入交流,从AIGC、工业、安全、法律、教育、舆情等不同垂类领域视角带来独家观点。
瑞莱智慧合伙人、高级副总裁朱萌指出,AI这项技术就像硬币的正反面,正面是应用,反面是安全。大模型不再仅仅是简单的问答工具,而是能够深入企业内部,对业务线进行更加复杂和精细的拆解与重构。这种变化要求企业不仅要具备技术实力,能够驾驭大模型这一先进技术,还需要深刻理解自身业务,以便将大模型技术精准地嵌入到生产流程的各个环节中。因此,培养既懂技术又懂业务的复合型人才成为了技术公司面临的重要挑战。
对于大模型技术带来的安全风险,企业也需要给予高度重视。在大模型技术深入应用到企业各个环节的过程中,必须建立完善的安全防护体系,确保数据安全、隐私保护和算法透明度等方面的合规性。只有这样,才能在充分利用大模型技术优势的同时,有效防范潜在的安全风险。
开普云总裁严妍表示,科技发展中的安全重要性,特别是在大模型技术的快速发展和应用背景下,这一点尤为重要。她指出,追求模型的高质量和高效率固然重要,但绝不能以牺牲安全为代价。
为了实现科技与安全的协调发展,企业需要建立科技与安全的双轮驱动机制。这意味着在技术研发和应用的过程中,必须同步考虑安全因素,将安全融入产品设计的每一个环节。同时,企业还需要加强安全技术研发和创新能力,不断提升产品的安全性能。
拓尔思副总裁林松涛指出,大模型在落地过程中面临的一个核心挑战——场景的困局。大模型虽然拥有强大的数据处理和学习能力,但单纯依赖其技术能力并不足以确保在各行各业中的有效应用。这是因为不同行业、不同产业有着各自独特的业务场景、流程规范以及专业知识,这些都需要有深入了解和丰富经验的行业专家来引导和配合。
要加速大模型在行业中的落地,必须结合懂行业、懂产业的专业人才。这些人才能够基于自身的行业知识和经验,与大模型的技术能力相结合,共同探索适合该行业的特定应用场景。这种结合不仅有助于发现并解决大模型在应用中可能遇到的问题,还能够推动大模型技术在行业中的深度定制和优化,从而更好地满足行业需求。
猿力科技党委书记、副总裁程群表示,教育行业对大模型的准确性和可信度要求极高。这是因为教育内容是知识传递的载体,任何错误或误导性的信息都可能对学生产生深远的影响。
因此,教育行业垂类大模型在设计和训练过程中,必须确保数据的准确性和模型的可靠性,以避免出现“幻觉”问题,即模型生成与事实不符或误导性的信息。为了实现这一目标,需要采用高质量的数据集、严格的验证流程和先进的算法技术来确保模型的准确性和可信度。
其次,教育行业垂类大模型对信赖度和可解释性要求也非常高。信赖度是指用户或教师对模型输出结果的信任程度,而可解释性则是指模型输出结果的透明度和可理解性。
在教育领域,大模型不仅需要提供准确的答案或建议,还需要能够解释其决策过程和依据,以便教师和学生能够理解和接受这些结果。这种可解释性不仅有助于建立用户信任,还能够促进教育过程的互动性和反思性。所以在训练大模型时,需要注重模型的可解释性设计,采用易于理解的算法和模型结构,并提供清晰的解释和说明。
京东方AI技术中心副院长刘玉宇表示,当前,随着人工智能技术的快速发展,文本大模型和视觉大模型已经取得了显著进展,并在多个领域得到了广泛应用。然而,在工业制造这一特定领域,符合其复杂需求、能够实现精准多模态处理的大模型却相对匮乏。
首先,工业制造场景的数据往往具有高度的专业性和复杂性,数据获取和标注成本高昂,且难以形成大规模的高质量数据集;其次,由于工业制造场景的多样性和复杂性,大模型的训练和优化过程需要充分考虑多种因素和变量,对算法和计算资源提出了更高要求;第三,尽管大模型在理论上具备强大的能力,但在实际工业制造场景中,如何将其与现有生产系统无缝集成、实现高效协同工作仍是一个亟待解决的问题。
中国法研院政企事业群总经理李晓智提到,司法权确实包含多个紧密相连的环节,从当事人提出问题、案情分析、判决预测、文书生成,到对案件后续走势的法律建议、时间成本、精力投入及费用预估等,每一个环节都至关重要且相互影响。这种复杂性要求大模型具备高度的精准性、全面性和可解释性。
通过不断的技术创新和实践探索,大模型有望在司法权链条中发挥更加重要的作用,为法律从业者提供更加高效、精准和全面的支持。然而,这一过程需要政府、企业、学术界和法律从业者等多方面的共同努力和协作。
此外,在论坛上,2024年中关村仿生机器人大赛正式启动,是国内首次聚焦具身智能的仿生机器人大赛,推动人才、技术、产品、市场、资本、服务等创新创业要素全面对接。大赛设置了3个主赛道,即人形仿生机器人、具身大模型、多足仿生机器人;1个创新赛道,包括但不限于水下仿生机器人、飞行仿生机器人、爬行仿生机器人、仿生灵巧手等。
具体的赛制分为三轮,初赛由专家评委进行基本情况审查,复赛为现场答辩及参赛机器人基本技能演示,决赛依据比赛规则进行现场竞技。
此次大赛的评委包括中国工程院院士刘宏为大赛专家委员会主席,中国科学院院士丁汉、中国工程院院士王耀南、中国工程院院士于海斌和中国工程院外籍院士、德国国家工程院院士、德国汉堡科学院院士张建伟为专家委员会联席主席,以及20位知名专家学者组成大赛专家委员会,负责各赛道规则制定及评审。
主赛道共设置24个奖项及全能优胜奖9名,第1名奖金15万元、第2名奖金10万元、第3名奖金5万元;创新赛道共设置5名创新优胜奖,奖金3万元。除了255万元的总奖金池外,本次大赛还通过市区镇三级联动以及银行机构,对企业在空间落地、融资、人才教育、租金等诸多领域全方位支持。北京市经信局、中关村科学城管委会、海淀区金融办、四季青镇、东升镇、温泉镇、海新域集团协同北京银行中关村分行为企业提供了一系列的落地支持。
结语:国内AI大模型竞赛持续升温,海淀将发挥“头雁”作用
2023年,北京市实现数字经济增加值1.8万亿元,同比增长8.5%,占全市GDP的比重达到42.9%,今年一季度实现了8.7%的高增长。
去年,北京市已经率先出台了《关于更好发挥数据要素作用进一步加快发展数字经济的实施意见》,并推出AI产业、算力基础设施、数据资产等系列政策,产业数字化转型正在提速。
在这其中,海淀区是国内AI领域创新基础最好、人才资源最密集、研发能力最雄厚、产品迭代最活跃的地区。
据统计,北京海淀的 AI 领域学者已经超过1.23万人,占全市比例超过80%,基本形成了芯片、框架、大模型、数据技术与处理服务等全产业链部署,集聚企业超过全市七成。大模型相关单位超过100家,通过备案的大模型超过了49款,占全市七成以上。
去年,第二批北京市通用人工智能产业创新伙伴计划名单公布,一年时间,这些玩家就实现了从最初概念验证到实际应用、单一技术突破到全方面的行业解决方案,不断加速大模型应用。与此同时,包含工业大模型应用、服务政策咨询大模型、数据开源开放平台、法律知识系统项目、算力、金融等诸多领域的第三批伙伴计划也于今年7月公布。
如今,作为新一代AI技术的核心引擎,从通用大模型到行业大模型,再到端侧大模型,AI 正不断赋能金融、医疗、政务等领域落地应用,推动传统产业智能化升级。
未来,随着AI大模型规模的增长,对算力和数据的需求将持续增加。算力资源的优化和高质量训练数据集的扩展将成为推动大模型发展的关键。其次,AI生成内容将从“好用”向“高效”迈进,可能会经历多次技术范式的颠覆。同时,Transformer等根技术的优化和创新将进一步提升大模型的性能。
总的来说,随着技术的不断进步和政策的持续支持,大模型将在更多领域实现落地应用,在此背景下,国内AI产业的大模型产品落地与应用加速,海淀区作为北京市乃至于全国数字经济建设发展的高地,拥有AI产业、机器人玩具、创新场景应用的诸多优势,为国内玩家抢抓AI发展的新机遇提供了关键支撑。
(本文首发于钛媒体App,作者|窦悦怡、林志佳,编辑|林志佳)
根据《网络安全法》实名制要求,请绑定手机号后发表评论