文 | 孟永辉
当OpenAI首席技术官米拉·穆拉提发布桌面版本的ChatGPT和新的旗舰模型—GPT-4o,OpenAI的发展,进入到了一个真正意义上的奇点时刻。
OpenAI的短短26分钟的发布会,却依然引发了不少波澜。
无论是ChatGPT-4o的完全免费,抑或是推出PC桌面版的ChatGPT,无一不为我们显示出OpenAI的领先。
然而,如果仅仅只是一味地尬吹OpenAI的领先,必然是没有太多裨益的。
原因在于,OpenAI的确在很多方面具备着相对领先的优势,这样一种领先,并不仅仅只是体现在它与谷歌的差距上,同样还体现在它与中国AI玩家们的差距上。
透过OpenAI的发布会,我们需要更多地看到的是,时下的AI行业,正在发生着的深刻变化,并由此来找到适合当下发展趋势的新机会。
如果一定要找到OpenAI的这场短短发布会带给我们的启示的话,我更加愿意将其看成是AI正走在互联网道路上的一种直接体现。
以此为开端,AI将会真正从一个局限于实验室里的存在,成为一个被越来越多的大众所认识、所使用、所接受的存在。
如果我们将ChatGPT-4o之前的OpenAI,看成是一个布道者的话,那么,ChatGPT-4o之后的OpenAI,则更像是一个实践者。
一句话,OpenAI正在open AI。
未来,我们将会看到越来越多的场景和行业当中,开始出现AI的影子,我们将会看到越来越多的玩家们,开始加入到普及与落地AI的过程当中。
认识到这一点,我们或许才能更好地把握OpenAI这样一个短短26分钟的发布会,带给我们的更深层次的意义。
01
OpenAI这样一个发布会扔出的「王炸」,其实就是推出了ChatGPT-4o这样一个完全免费的应用。
从表面上来看,OpenAI之所以会进行完全免费,其中一个很重要的原因在于,它的用户的增长业已进入到瓶颈期,为了拓展更多的用户,OpenAI便开始通过免费的方式来获得新的用户。
自去年ChatGPT推出后,在2023年5月达到流量峰值,网络访问量达到18亿次,但之后流量出现下滑情况。2024年3月,ChatGPT的访问量依然稳定在了18亿次,不再有明显增长。
当OpenAI通过ChatGPT-4o完全免费进一步降低使用门槛,首先起到立竿见影效果的,便是用户量的增长。
对于业已陷入到用户增长瓶颈期的OpenAI来讲,无疑是一个非常不错的尝试。
如果我们将ChatGPT-4o的完全免费,看成是OpenAI为了提升用户量所做的一次尝试的话,那么,ChatGPT-4o此次将更多的场景应用到端侧模式以及代码生成能力的场景应用,则是将OpenAI的用户量的增长拓展到了更为广阔的领域之中。
这其实是和互联网行业的发展,有着异曲同工之处的。
我们都知道,早在互联网尚未风靡的时候,人们对于互联网的使用,并不是像现在这样普及,甚至在很多情况下,人们对于互联网的使用,如同现在人们对于AI的使用一样,必须要付费。
很显然,通过付费的方式,很难让互联网释放出更大的发展潜能,很难成就一个叫做「互联网」的时代的。
于是,为了让互联网释放出更大的发展潜能,为了让互联网真正成就一个时代,必然需要做的,便是将以往收费的互联网服务进行免费,并且真正用这样一种方式来实现互联网的最大限度的普及。在此基础上,我们再去寻找「互联网+」的商业模式。
可以说,免费,真正让互联网成为了一种「基础设施」,而免费同样促进了「互联网+」模式的不断成熟和完善。
对标到AI的身上,其实同样如此。
毋庸置疑的是,OpenAI通过ChatGPT让我们看到了AI的强大,让我们看到了对于效率提升的积极影响。
然而,在很多时候,人们对于AI的感知依然是在收费的情况下完成的,依然是受到收费的掣肘的。
在这样一种情况下,AI很难成为一种基础设施,更加难以释放出新的更大的发展潜能的。
因此,如果一定要找到AI走在互联网上道路上的具体表现的话,完全免费,并以此来促成AI最大限度的普及,并以此来孕育出更多新的商业模式,无疑是最直接的表现。
当OpenAI撕开了免费的口子,我们或许还将会在未来看到更多玩家加入其中,从而真正将人们带入到人人皆可使用AI,万物皆可AI的全新发展阶段。
02
除了ChatGPT-4o的完全免费之外,OpenAI在发布会上更多地为我们展示的是,GPT-4o的模型能力、基准测试、模型安全性和局限性。
模型能力上,在GPT-4o之前,ChatGPT语音模式对话的平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。
如今借助 GPT-4o,OpenAI跨文本、视觉和音频端到端地训练了一个新模型,这意味着所有输入和输出都由同一神经网络处理。
传统基准测试层面上,GPT-4o 在文本、推理和编码智能方面实现了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉功能上均处于高位。
在5次MMLU(常识问题) 上,GPT-4o创下了87.2%的新高分,远超谷歌Gemini Pro 1.5、Ultra 1.0,以及自己的GPT-4T和GPT-4等。
模型安全性和局限性上,GPT-4o 通过过滤训练数据和通过训练后细化模型行为等技术,在跨模式设计中内置了安全性。以及创建了新的安全系统,为语音输出提供防护。
根据对网络安全、CBRN、说服力和模型自主性的评估表明,GPT-4o 在这些类别中的任何类别中的得分都不高于中等风险,而且团队继续降低发现的新风险。
如果要找到ChatGPT-4o这些特征为我们传递出来的信息的话,说到底,就是为了让更多的用户可以更加快速、更加安全、更加高效地使用ChatGPT-4o。
简单来讲,OpenAI在ChatGPT-4o上的这些进化,正是为了其产品更好地进行商业化。
透过这一点,我们同样可以看出,AI的发展,正走在互联网的道路上。
我们都知道,在互联网时代,我们经历了DOS系统,Windows系统以及后来的iOS系统、安卓系统等操作系统。
如果对这些操作系统进行总结和定义的话,说到底,它们进行不断地升级的一个终极目的,就是为了让互联网可以更好地商业化,可以让互联网更好地与商业场景结合在一起。
当互联网有了这样的进化,我们才看到了衍生于互联网的门户网站、「互联网+」应用以及移动互联网时代所诞生出来的各式各样的应用。
可以说,互联网的不断的迭代和升级所带来的一个最为直接的结果,便是互联网的商业化的普及。
对于AI来讲,其实,同样是在遵循这样一种发展脉络。
说到底,AI最终还会要落脚在商业化上,才能够真正将自身的发展潜能释放到最大。
否则,所谓的AI,依然仅仅只是一个讲给资本市场听的美好的故事,当资本的热情不再,特别是当AI的发展真正需要自我造血的时候,它的发展,依然还是会面临这样那样的问题。
无论是百度的李彦宏,还是360的周鸿祎,乃至是金沙江创投的朱啸虎,其实都在不同的场合表达过对于AI的这样一种看法。
说到底,他们所表达的观点,其实都是一个中心思想。
这样一个中心思想,其实就是让AI更多地聚焦场景和应用,更多聚焦在商业化上,而不仅仅只是一个停留在实验室里,并不仅仅只是局限于有限场景之中的小众存在。
透过ChatGPT-4o的发布,我们可以看出,OpenAI在探索和实践商业化的方式和方法,以此为开端,我们将会看到更多有关AI沿着互联网的道路发展的新迹象的出现。
03
回顾互联网的发展,不难看出,互联网之所以会获得如此大的发展,之所以会成为人们的一种生活方式,其中一个很重要的原因在于,互联网得到了最大限度的普及。
时至今日,互联网,业已成为了几乎所有人的生活方式。
以直播、短视频为主导的全新时代的来临,更是将互联网的普及率,带入到了一个全新的高度。
对于AI来讲,欲要获得新的发展,欲要成为一种全新的生活方式,必然需要重新演绎以往互联网所走过的道路,必然让以往互联网所做的普及的动作,重新在自己的身上得到演绎。
如果我们要寻找OpenAI这样一场发布会提供给我们的新启示的话,它不断地让AI进行普及,不断地将AI成为一个被B端和C端都能够接受的存在,或许才是值得关注的另外一个方面。
当OpenAI以ChatGPT的聊天机器人出现在人们的面前,它仅仅只是在聊天这样一个场景下存在,它仅仅只是解决的是较为简单的逻辑推理的能力。
时至今日,ChatGPT早已不再是简单意义上的聊天机器人,它不仅可以聊天对话、文生图片,还能文生视频,甚至还可以像人的反应速度一样与人们进行交互。
OpenAI表示,GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。
GPT-4o可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,与人类的响应时间相似。
它在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配,在非英语文本上的性能显着提高,同时 API 的速度也更快,成本降低了 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。
说到底,OpenAI其实就是通过不断地提升ChatGPT的交互能力来提升人与AI沟通和交流的门槛,不断地让OpenAI的产品更好地进行普及。
如果将OpenAI在交互上的提升与互联网以往的发展脉络进行总结和定义的话,它们共同的终极目的,其实就是为了让AI可以更好地普及,并且真正让AI成为一种全新的生活方式。
因此,如果我们要找到OpenAI的发布会给我们的新启示的话,不断地让AI普及,不断地沿着互联网的方向前进,无疑是另外一个最值得我们关注的方面。
正如OpenAI CEO奥特曼在发布会后的博客里所说的那样:
「我为我们能在ChatGPT中免费提供世界上最先进的模型感到非常自豪,这一切都没有广告或其他干扰。最初,OpenAI的设想是开发AI技术,并利用它为全球带来益处。然而,现实是我们开发了AI技术,而其他人则利用这些技术创造了令全世界受益的杰出成果。作为一家企业,我们有很多服务是需要收费的,但不妨碍我们支持向全球数十亿用户提供免费的顶尖AI服务。」
「新推出的语音(及视频)模式是我使用过的最佳计算界面。它给人一种电影中AI的感觉,让人不禁惊叹这竟是真的。达到与人类相似的响应速度和表达能力,标志着一个重大的转变。最初的ChatGPT已经展示了语言界面的潜力;而这一新技术则在体验上有了质的飞跃。它反应迅速、智能、有趣、自然且实用。以前,我与计算机对话从未感觉如此自然;但现在,我终于有了这种感觉。随着我们逐步增加个性化选项、获取个人信息的权限、代表用户执行操作的能力等功能,我真的可以预见到一个激动人心的未来:我们能够利用计算机完成以往无法想象的更多事务。」
结语
如果一定要寻找OpenAI这样一场短短26分钟的发布会传递出来的信息的话,OpenAI正走在互联网的道路上,无疑是再清晰不过的了。
可以说,通过这样一场发布会,OpenAI完成了从AI布道者向实践者的完美转身。
对于AI来讲,其实是需要这样一场免费化、普适化和商业化的。
至此,OpenAI开始open AI。
原因在于,只有经历了这样一场普及和商业化,AI的发展,才不仅仅只是一个停留在实验室里的存在,才不仅仅只是一个小众化的存在,而是成为了一个类似互联网的,可以与万千场景,千行百业都实现了深度融合的存在。
以此为开端,ChatGPT才能真正成为英伟达CEO黄仁勋口中的「iPhone时刻」,而GPT-4o,无疑是OpenAI的奇点时刻。
根据《网络安全法》实名制要求,请绑定手机号后发表评论