OpenAI推出全新GPT-4o mini免费上线，2年内GPT大模型成本骤降99%

“推动我们可以免费提供 AI 技术的极限，是确保 AGI 造福全人类追求的一部分。”ChatGPT官方账号在社交平台上表示。

（图片来源：unsplash）

就在刚刚，ChatGPT再度上新。

北京时间7月19日凌晨，美国OpenAI公司推出一款新的 AI 模型“GPT-4o mini”，即GPT-4o的更小参数量、简化版本。

OpenAI表示，GPT-4o mini是目前功能最强大、性价比最高的小参数模型，性能逼近原版GPT-4，成本相比GPT-3.5 Turbo便宜60%以上，支持50种不同语言，替代GPT-3.5版本的ChatGPT，但该公司没有透露其训练参数规模信息。

OpenAI表示，API层面，GPT-4o mini支持128k、16k输入tokens（图像和文本）；价格层面，GPT-4o mini每百万输入tokens为15美分（约1.09元人民币），每百万输出tokens为60美分（约4.36元）。

按照规划，GPT-4o mini即日起向ChatGPT免费用户以及 ChatGPT Plus和Team付费订阅用户开放，并将于下周向ChatGPT Enterprise企业版客户开放。另外，未来几天内，OpenAI还将开放GPT-4o mini微调版本。

“推动我们可以免费提供 AI 技术的极限，是确保 AGI 造福全人类追求的一部分。”ChatGPT官方账号在社交平台上表示。

OpenAI CEO奥尔特曼（Sam Altman）还透露，仅仅两年前，世界上最好的模型还是GPT-3的text-davinci-003版本，与今天相比表现差得多，还要贵上100倍。

换句话来说，短短两年，GPT大模型每token的成本价格已经下降99%。

实际上，早在今年5月14日，OpenAI推出可免费使用的全新旗舰AI模型GPT-4o。

OpenAI首席技术官米拉·穆拉蒂 (Mira Murati)表示，GPT-4o里的“o”是Omni（全能模型）的缩写，可实时进行音频、视觉和文本推理，它可以在短至232毫秒、平均320毫秒的时间内响应音频输入，与人类在对话中的反应速度一致。

米拉·穆拉蒂指出，在API使用方面，相比去年11月发布的GPT-4-turbo，GPT-4o价格降低一半（50%），速度提升两倍（200%）。

OpenAI CEO奥尔特曼（Sam Altman）当时称，新的GPT-4o是OpenAI有史以来最好的模型，它很智能，速度很快，是原生多模态，并且GPT-4o语音助手可供包括Plus、免费版本在内的所有ChatGPT用户使用。

然而，GPT-4o语音助手却意外地迎来推迟。今年6月22日，OpenAI宣布，原计划在6月下旬向一小群 ChatGPT Plus用户推出的GPT-4o语音功能，将推迟到7月，还需要一个月时间才能达到发布标准。至于原因，OpenAI称是因为需要更多时间进行安全测试。

“我们正在提高模型检测和拒绝某些内容的能力，同时努力改善用户体验，并准备我们的基础设施扩展到数百万，同时保持实时响应。”OpenAI表示。

如今，OpenAI似乎又重新调整，推出了小参数模型GPT-4o mini。而一般来说，这类小参数模型规模大约不到7B（70亿），可用于笔记本电脑、手机等端侧设备。

具体来说，GPT-4o mini 在文本智能和多模态推理方面的学术基准测试中超越了 GPT-3.5 Turbo 和其他小型模型，并且支持的语言范围与 GPT-4o 相同。它还在函数调用方面表现出色，这可以使开发人员构建获取数据或使用外部系统采取行动的应用程序，并且与 GPT-3.5 Turbo 相比，它的长上下文性能有所提高。

推理任务： GPT-4o mini 在涉及文本和视觉的推理任务上优于其他小型模型，在文本智能和推理基准 MMLU 上的得分为 82.0%，而 Gemini Flash 为 77.9%，Claude Haiku 为 73.8%。
数学和编码能力： GPT-4o mini 在数学推理和编码任务中表现出色，优于市场上之前的小型模型。在测量数学推理的 MGSM 上，GPT-4o mini 得分为 87.0%，而 Gemini Flash 得分为 75.5%，Claude Haiku 得分为 71.7%。在测量编码性能的 HumanEval 上，GPT-4o mini 得分为 87.2%，而 Gemini Flash 得分为 71.5%，Claude Haiku 得分为 75.9%。
多模态推理： GPT-4o mini 在多模态推理评估 MMMU 上也表现出色，得分为 59.4%，而 Gemini Flash 为 56.1%，Claude Haiku 为 50.2%。

性价比方面，GPT-4o mini发挥优异。目前，GPT-4o mini 现已作为文本和视觉模型在 Assistants API、Chat Completions API 和 Batch API 中提供。开发人员每 100 万个输入令牌支付 15 美分，每 100 万个输出令牌支付 60 美分（大约相当于标准书籍的 2500 页）。

OpenAI表示，这比之前的 Frontier 型号便宜一个数量级，比 GPT-3.5 Turbo 便宜 60% 以上。