Siri“改头换面”，苹果求援，AI Phone战场全员到齐

习惯于“软硬一体”进行封闭式创新的苹果，第一次在核心软件业务上，选择与外部公司合作。

根据市场的最新消息，苹果公司正计划用生成式AI技术彻底改造 Siri 虚拟助手，新系统将首次允许Siri控制应用程序内的所有功能。Siri的这一变化，需要使用大语言模型进行iOS的系统底层改造，OpenAI则会帮助苹果实现这一切。

与此同时，苹果也仍在与谷歌母公司Alphabet Inc.进行谈判，以便未来可以使用Gemini大模型，而不是让OpenAI成为单一来源供应商。

一直以来，苹果被认为是人工智能时代中掉队的那个，尤其是在智能手机领域。

过去的2023年，华为率先将大模型接入手机，使得手机可以执行文本生成、知识查找、资料总结、智能编排、模糊/复杂意图理解等复杂任务。之后，包括小米、荣耀、vivo、OPPO和三星都迅速跟进，选择在智能手机产品上增加各种AI功能，以此来提升产品的竞争力。

在主流手机厂商此起彼伏的AI竞争中，苹果是唯一缺席的品牌。苹果最新一季的财报电话会上，华尔街的分析师几乎都在询问有关AI的问题。但苹果CEO库克几乎没有透露苹果未来的AI功能或服务，也没有透露苹果如何利用它们赚钱。

“我不想抢在我们发布公告之前发表言论。”库克表示，生成式AI是苹果的一个关键机会，苹果相信自己拥有在这个新时代脱颖而出的优势，包括苹果独特的无缝硬件、软件和服务集成组合。

但在最新的AI进展中，苹果倾向于与OpenAI合作，原因之一是后者拥有更强大的AI大模型。

OpenAI最新的GPT-4o 模型的多模态能力大幅提升，可以实时对音频、视觉和文本进行推理，语音响应时间短至232毫秒，与人类反应速度一致。在无延迟语音对话中，GPT-4o的节奏、语气甚至接梗，与真人无异。而这些能力的升级，与苹果的Siri语音助手几乎完全贴合。

此前，Siri的功能主要局限于播放音乐播放列表、查找信息或控制智能家电等更广泛的命令。而据报道，Siri将成为此次WWDC 发布会的重点。

新系统将允许Siri更精确地控制iPhone或iPad，包括利用Siri能够打开单个文档、将笔记移动到另一个文件夹、发送或删除电子邮件、打开Apple News中的特定出版物、通过电子邮件发送网络链接，以及要求设备提供文章摘要。

但需要注意的是，部分新的生成式AI功能可能会有泄露用户数据隐私的风险，这对于一向重视保护用户隐私的苹果是一个挑战。

比如，生成文章摘要、图片视频剪辑，这些AI功能可以在本地完成，用户数据被泄露的风险较小。但若是让Siri帮助自动收发邮件，则需要通过联网才能实现，一些用户数据需要传输到服务器，利用云端算力进行自动处理。这会触发用户的隐私风险。

事实上，如何在AI时代更好地保护用户隐私，一直是苹果试图解决的问题，也是这家公司在大模型上进展缓慢的部分原因。

一个可以支撑的案例是，苹果在选择训练数据时，采用的方式是与主要新闻和出版机构进行谈判，提出了价值至少 5000 万美元的多年期协议，以获得新闻文章档案的授权。

苹果保守的路线对于生成式AI的发展有利有弊，这一做法的好处是，通过在更有针对性的信息集训练人工智能模型，苹果最终可能会推出更可靠的产品；而弊端在于，苹果大模型的推出时间会被延迟。

相较之下，OpenAI的做法则更激进。这家公司用于训练ChatGPT的数据，大部分来源于网络信息，但这会导致信息的不准确，甚至出现虚假信息。同时，OpenAI与新闻机构的版权争议，也是一个绕不开的问题。

比如，《纽约时报》在2023年12月就以“违法使用数据、抄袭”为由，起诉了OpenAI。《纽约时报》称，OpenAI大模型几乎能一字不差地输出《纽约时报》的报道原文，而且这一输出既没有引用链接，还删除了原文附加的返利链接，这直接影响了自身的流量和实际收入。OpenAI则表示，如果不使用受版权保护的内容，就不可能训练当今领先的人工智能模型。

因此，苹果此次与OpenAI的合作，大概率只涉及到端侧大模型的应用，也就是开发只在手机本地就能运行的AI功能。在这方面，苹果“软硬一体”的封闭优势，将得到更好的发挥。

图片来源苹果官网

以苹果的M4芯片为例，该处理器NPU运算速度达到了每秒38万亿次（38 TOPS），比上一代芯片M3的运算速度高出一倍还多。同时，自研芯片让苹果可以更快地根据大模型架构，进行芯片架构的调整，让硬件更好的服务软件。这些，都是目前普遍采用高通芯片的手机厂商无法做到的。

而针对于云端算力和大模型部署，苹果的方案还未明显表露。但不论如何，关于AI Phone的竞争，苹果已经宣告正式入场了。（本文首发于钛媒体APP，作者 | 饶翔宇编辑 | 钟毅）

Siri“改头换面”，苹果求援，AI Phone战场全员到齐 | 钛媒体焦点

敬原创，有钛度，得赞赏