习惯于“软硬一体”进行封闭式创新的苹果,第一次在核心软件业务上,选择与外部公司合作。
根据市场的最新消息,苹果公司正计划用生成式AI技术彻底改造 Siri 虚拟助手,新系统将首次允许Siri控制应用程序内的所有功能。Siri的这一变化,需要使用大语言模型进行iOS的系统底层改造,OpenAI则会帮助苹果实现这一切。
与此同时,苹果也仍在与谷歌母公司Alphabet Inc.进行谈判,以便未来可以使用Gemini大模型,而不是让OpenAI成为单一来源供应商。
一直以来,苹果被认为是人工智能时代中掉队的那个,尤其是在智能手机领域。
过去的2023年,华为率先将大模型接入手机,使得手机可以执行文本生成、知识查找、资料总结、智能编排、模糊/复杂意图理解等复杂任务。之后,包括小米、荣耀、vivo、OPPO和三星都迅速跟进,选择在智能手机产品上增加各种AI功能,以此来提升产品的竞争力。
在主流手机厂商此起彼伏的AI竞争中,苹果是唯一缺席的品牌。苹果最新一季的财报电话会上,华尔街的分析师几乎都在询问有关AI的问题。但苹果CEO库克几乎没有透露苹果未来的AI功能或服务,也没有透露苹果如何利用它们赚钱。
“我不想抢在我们发布公告之前发表言论。”库克表示,生成式AI是苹果的一个关键机会,苹果相信自己拥有在这个新时代脱颖而出的优势,包括苹果独特的无缝硬件、软件和服务集成组合。
但在最新的AI进展中,苹果倾向于与OpenAI合作,原因之一是后者拥有更强大的AI大模型。
OpenAI最新的GPT-4o 模型的多模态能力大幅提升,可以实时对音频、视觉和文本进行推理,语音响应时间短至232毫秒,与人类反应速度一致。在无延迟语音对话中,GPT-4o的节奏、语气甚至接梗,与真人无异。而这些能力的升级,与苹果的Siri语音助手几乎完全贴合。
此前,Siri的功能主要局限于播放音乐播放列表、查找信息或控制智能家电等更广泛的命令。而据报道,Siri将成为此次WWDC 发布会的重点。
新系统将允许Siri更精确地控制iPhone或iPad,包括利用Siri能够打开单个文档、将笔记移动到另一个文件夹、发送或删除电子邮件、打开Apple News中的特定出版物、通过电子邮件发送网络链接,以及要求设备提供文章摘要。
但需要注意的是,部分新的生成式AI功能可能会有泄露用户数据隐私的风险,这对于一向重视保护用户隐私的苹果是一个挑战。
比如,生成文章摘要、图片视频剪辑,这些AI功能可以在本地完成,用户数据被泄露的风险较小。但若是让Siri帮助自动收发邮件,则需要通过联网才能实现,一些用户数据需要传输到服务器,利用云端算力进行自动处理。这会触发用户的隐私风险。
事实上,如何在AI时代更好地保护用户隐私,一直是苹果试图解决的问题,也是这家公司在大模型上进展缓慢的部分原因。
一个可以支撑的案例是,苹果在选择训练数据时,采用的方式是与主要新闻和出版机构进行谈判,提出了价值至少 5000 万美元的多年期协议,以获得新闻文章档案的授权。
苹果保守的路线对于生成式AI的发展有利有弊,这一做法的好处是,通过在更有针对性的信息集训练人工智能模型,苹果最终可能会推出更可靠的产品;而弊端在于,苹果大模型的推出时间会被延迟。
相较之下,OpenAI的做法则更激进。这家公司用于训练ChatGPT的数据,大部分来源于网络信息,但这会导致信息的不准确,甚至出现虚假信息。同时,OpenAI与新闻机构的版权争议,也是一个绕不开的问题。
比如,《纽约时报》在2023年12月就以“违法使用数据、抄袭”为由,起诉了OpenAI。《纽约时报》称,OpenAI大模型几乎能一字不差地输出《纽约时报》的报道原文,而且这一输出既没有引用链接,还删除了原文附加的返利链接,这直接影响了自身的流量和实际收入。OpenAI则表示,如果不使用受版权保护的内容,就不可能训练当今领先的人工智能模型。
因此,苹果此次与OpenAI的合作,大概率只涉及到端侧大模型的应用,也就是开发只在手机本地就能运行的AI功能。在这方面,苹果“软硬一体”的封闭优势,将得到更好的发挥。
以苹果的M4芯片为例,该处理器NPU运算速度达到了每秒38万亿次(38 TOPS),比上一代芯片M3的运算速度高出一倍还多。同时,自研芯片让苹果可以更快地根据大模型架构,进行芯片架构的调整,让硬件更好的服务软件。这些,都是目前普遍采用高通芯片的手机厂商无法做到的。
而针对于云端算力和大模型部署,苹果的方案还未明显表露。但不论如何,关于AI Phone的竞争,苹果已经宣告正式入场了。(本文首发于钛媒体APP,作者 | 饶翔宇 编辑 | 钟毅)
根据《网络安全法》实名制要求,请绑定手机号后发表评论