8月14日,谷歌在其硬件大会上发布了旗下第一款真正意义上的AI Phone——Pixel 9系列新品。这颠覆了谷歌在硬件发布方面的一项惯例,即Pixel系列智能手机历来都是在下半年发布。然而,此次谷歌却选择提前行动,抢在了新款iPhone发布之前。
“谈到人工智能,已经有太多的承诺,太多的即将推出的功能,但在现实世界中却没有足够的帮助,这就是为什么今天我们要实事求是。”谷歌设备和服务高级副总裁里克·奥斯特洛 (Rick Osterloh) 表示。
从新发布的Pixel 9 系列来看,此次谷歌主要进行了软件方面的升级,核心就是将AI融入进来,构建新的手机功能。但这些功能并没有超出市场的预期,大多都是苹果和其他手机厂商已经公开的方向,只不过谷歌提前了一步。
AI Phone,是智能手机陷入创新瓶颈之后的一个新物种。现在,这个新物种正陷入到另一种雷同的平庸之中。
万变不离其宗的“手机助手”
也许是从苹果那里得到的启发,谷歌在新的Pixel 9 系列上,也在试图进行手机助手的AI改造。
谷歌最新的进展是,通过Gemini访问手机屏幕,来实现更个性化的功能。比如,用户召唤Gemini后,可以点击“询问此屏幕”或“询问此视频”,让模型指向你正在查看的内容,从而给出上下文回复。谷歌表示,这意味着Gemini可以执行一些操作,例如将YouTube旅游视频中的餐厅列表添加到谷歌地图中。
同时,谷歌正在推出自己的ChatGPT语音聊天版本,名为Gemini Live。其表示,该功能可实现自然对话,因此用户可以在Gemini中途打断或暂停对话,稍后再继续。谷歌表示,即使屏幕锁定,Gemini Live也可以使用。不过,该功能仅适用于Gemini Advanced订阅者。
此外,谷歌还称得益于Gemini 1.5 Flash等新模型,Gemini作为语音助手的速度将更快,并且不会像以前的助手版本那样经常出错。谷歌还为Gemini添加了更多扩展,因此它将能够从Keep、Tasks、Utilities和Google日历等应用程序中提取信息或在应用程序内执行操作。
需要注意的是,以上这些都不是任何意义上新的发明,而是一些乏味的重复。
在WWDC上,苹果首次推出了Apple Intelligence,核心之一就是Siri的改造。按照苹果的说法,苹果正计划用生成式AI技术彻底改造Siri虚拟助手,新系统将首次允许Siri控制应用程序内的所有功能。Siri的这一变化,需要使用大语言模型进行iOS的系统底层改造,OpenAI则会帮助苹果实现这一切。
比如,新系统将允许Siri更精确地控制iPhone或iPad,包括利用Siri能够打开单个文档、将笔记移动到另一个文件夹、发送或删除电子邮件、打开Apple News中的特定出版物、通过电子邮件发送网络链接,以及要求设备提供文章摘要。
无独有偶,华为也计划在原生的鸿蒙系统里干同样的事情。
华为试图将AI大模型的能力植入鸿蒙系统底层,以此来同时调用多个APP的功能,让终端设备可以完成复杂度更高的人机交互方式。不同的是,鸿蒙所使用的AI大模型为华为自研,而苹果则选择与OpenAI这样的第三方公司合作。
利用华为自研的盘古大模型,华为手机的语音助手“小艺”,可以化身为一个AI agent,帮助用户自动调取日历信息、输入法、通讯录、文件,并生成文本并发送短信或是邮件。在第三方APP中,小艺可以识别位置信息、图片,自动导航或是购物。当然,前提是这些APP同意AI调用这些信息。
更多的个性化,更多的重复
除了对于手机助手的改造,谷歌此次还披露更多新的个性化AI功能,但依然还是重复着已有的技术路线。
谷歌新推出的Pixel截图功能,这是一个集截图管理、智能分析和自然语言搜索于一体的应用。 基于该功能,手机可以保存整理截图中的重要信息,将其转变为一个更便于搜索的数据库。用户查找之前的截图信息时,可以变得更容易。谷歌表示,这是Pixel设备独有的。
但是,这并不是Pixel独创的。早在今年5月,微软就宣布为Windows 11推出回顾功能 (Recall),该功能可以记忆用户打开过的各种窗口或文件,然后在必要的时候可以快速回到当时使用的时刻。
在具体的操作过程中,当用户启用该功能后,电脑每隔几秒会对屏幕内容进行截图,截取的内容将通过加密保存在设备本地,接下来这些数据将交给AI在本地完成分析。之后,用户可以通过时间轴浏览最近的各种活动,例如查看过的网页等,而AI则会在本地完成分析,用户可以搜索特定关键词回到某个时刻。
回顾功能还允许用户直接打开当时保存的原始截图,后续该功能被完善后,它还可以以屏幕截图的形式打开实际的源文档、网站或电子邮件等。
此外,谷歌还在添加一项叫作Circle的AI功能。当用户使用该功能时,可以分享图片或屏幕的部分内容。比如,用户可以圈出图片的文字信息,按住分享按钮通过发送文本信息。
巧合的是,类似的功能此前荣耀已经推出过。在荣耀手机的任意门功能中,用户通过长按所在界面的文字、图片、文件、视频等元素,将其拖至左右两侧屏幕边缘处,即可触发“任意门”功能,快速流转至其他应用服务。更早之前,类似的交互逻辑也在锤子手机的“onestep”功能上出现。
总的来看,将“AI Phone“视为智能手机重新崛起新机会的手机厂商们,至今还未推出一款真正意义上的新产品。在AI Phone的起跑线上,手机厂商推出的新功能,大多都是沿着类似的技术路线和交互逻辑而展开。(本文首发于钛媒体APP,作者 | 饶翔宇 编辑 | 钟毅)
根据《网络安全法》实名制要求,请绑定手机号后发表评论