推荐使用国际直连GPT,立即访问: www.chatgp1.com
OpenAI宣布推出其最新的零食级生成模型——GPT-4o mini。与标准的GPT-4o模型相比,GPT-4o mini在资源消耗和运行成本上更为低廉,为开发人员将AI技术融入更广泛产品提供了可能。
对于开发人员和应用程序而言,这无疑是一次重要的升级。同时,它也进一步扩展了ChatGPT免费版的功能,并减少了相关限制。即日起,GPT-4o mini将面向ChatGPT网页和应用程序的免费版、Plus版以及Team版用户和开发人员开放使用,而ChatGPT Enterprise订阅用户则将于下周获得访问权限。此外,GPT-4o mini将取代公司现有的小型型号GPT-3.5 Turbo,供最终用户使用。若开发人员暂时不愿切换到GPT-4o mini,他们仍可通过API继续使用旧型号。但公司表示,旧型号最终将停用,具体日期尚未确定。
自5月起,GPT-4o已向免费的ChatGPT账户开放,但存在使用限制。根据更新后的常见问题解答页面,GPT-4o本身的使用限制依旧存在,但当用户达到限制时,将降级为GPT-4o mini,而非GPT-3.5。这对于尚未升级到ChatGPT Plus的用户而言,无疑是一个巨大的福音。
据Artificial Analysis数据显示,OpenAI的最新AI模型在MMLU推理基准测试中获得了82%的分数,比Gemini 1.5 Flash高出3%,比Claude 3 Haiku高出7%。值得一提的是,迄今为止最高的MMLU基准测试得分由谷歌的顶级AI模型Gemini Ultra创下,分数为90%。
此外,OpenAI声称GPT-4o mini的运行成本比GPT-3.5 Turbo降低了60%。开发人员每百万输入代币需支付15美分,每百万输出代币需支付60美分。据CNBC报道,OpenAI表示GPT-4o mini是“目前功能最强大、成本效益最高的小型模型”。
这些成本节省源于何处?其实,并非所有通过AI增强的任务都需要GPT、Claude或Gemini等全尺寸模型的全部功能。使用标准尺寸的LLM(大型语言模型)来执行简单但数量庞大的任务,就像用大炮打蚊子一样,既浪费金钱又浪费计算资源。这正是小型LLM,如Google的Gemini 1.5 Flash、Meta的Llama 3 8b或Anthropic的Claude 3 Haiku的用武之地。与更大规模的迭代相比,它们能够更快、更经济高效地执行这些简单、重复的任务。
OpenAI表示,GPT-4o mini将具有与全尺寸版本相同的上下文窗口大小,即128,000个token(大约相当于一本书的内容),并且知识截止时间也相同,为2023年10月。不过,公司并未透露新模型的确切大小。目前,该模型API仅提供文本和视觉功能,但未来还将提供视频和音频功能。
就在几周前,OpenAI发布了备受期待的GPT-4o高级语音模式更新。公司的更新表明,较小的alpha版本将于7月底发布,更广泛的发布则计划在今年秋季进行。