推荐使用国际直连GPT,立即访问: www.chatgp1.com
ChatGPT问世之际,其凭借由GPT-3.5大型语言模型驱动的自然语言能力,令世人惊叹不已。而当备受瞩目的GPT-4大型语言模型横空出世时,它更是颠覆了我们对AI潜力的想象,有人甚至将其视为通用人工智能(AGI)的雏形。
GPT-4究竟是何方神圣?
GPT-4是OpenAI推出的最新一代语言模型,而GPT-4o则是其精心打造的特定版本。它在ChatGPT所采用的技术基础上进行了改进,虽然ChatGPT最初基于GPT-3.5,但后续已进行了更新迭代。GPT,即生成式预训练Transformer的首字母缩写,是一种利用人工神经网络模拟人类书写方式的深度学习技术。
OpenAI宣称,这款下一代语言模型在创造力、视觉输入处理以及语境理解三个关键领域相较于ChatGPT更为先进。在创造力方面,GPT-4在创作及与用户合作开展创意项目时表现更佳,涵盖音乐、剧本、技术写作等多个领域,甚至能“学习用户的写作风格”。
更长的上下文处理能力也发挥了重要作用。GPT-4现在能够处理用户提供的多达128,000个文本标记。用户甚至可以直接向GPT-4发送网页链接,并要求其与该页面上的文本进行交互,这有助于创建长篇内容以及“扩展对话”。
GPT-4还具备查看和分析上传图像的能力。在GPT-4网站提供的示例中,聊天机器人会接收到一些烘焙原料的图片,并被询问可以用它们制作什么美食。然而,值得注意的是,ChatGPT目前尚无法以同样的方式分析视频片段。
OpenAI还表示,GPT-4在安全性方面相较于上一代有所提升。据称,在OpenAI的内部测试中,GPT-4能够产生40%以上的事实响应,同时“响应不允许的内容请求”的可能性降低了82%。
OpenAI透露,其已通过人类反馈进行训练以取得这些进步,并与“超过50位专家合作,在人工智能安全和安保等领域提供早期反馈”。
在GPT-4首次推出后的数周内,用户纷纷发布了他们利用该模型完成的惊人成果,包括发明新语言、详细阐述逃离现实世界的方法,以及从头开始为应用程序制作复杂的动画。有用户甚至让GPT-4在短短60秒内使用HTML和JavaScript的混合代码创建了一个Pong游戏的可运行版本。
GPT-4的推理能力使OpenAI能够在近几个月内为ChatGPT平台推出了一系列新功能和新能力。例如,今年9月,该公司发布了备受期待的高级语音模式(AVM),使用户无需基于文本的提示即可与AI进行交谈。该功能于10月下旬在PC和Mac桌面上推出,而该公司目前正致力于将设备摄像头的视频源集成到AVM的界面中。
此外,OpenAI还推出了两项新的搜索功能。聊天历史搜索允许用户参考和回忆与AI的先前对话中的详细信息,而ChatGPT搜索则会搜索整个网络,直接为用户的查询提供对话式、最新的答案,而非像Google搜索那样仅提供潜在网站的列表。然而,GPT搜索的早期结果并不尽如人意,因为系统很难返回准确的答案。
OpenAI还计划在1月份推出其新的AI代理功能,该功能将使聊天机器人能够采取独立行动,例如总结会议并生成后续行动列表,或预订航班、餐厅和酒店等。不过,该功能的发布可能与OpenAI的下一代模型(代号为“Orion”)的发布同时进行。
如何使用GPT-4?
OpenAI提供的每个订阅层级的用户均可使用GPT-4。但免费层级的用户将只能有限地访问完整的GPT-4模型(3小时内约80次聊天),之后将切换到更小、功能更弱的GPT-4o mini,直至冷却计时器重置。要获得更多GPT-4访问权限以及能够使用Dall-E生成图像的功能,用户需要升级到ChatGPT Plus。只需在ChatGPT侧栏中点击“升级到Plus”,输入信用卡信息后,用户便能够在GPT-4和旧版本的LLM之间自由切换。
若不想付费,用户仍可通过其他方式体验GPT-4的强大功能。例如,在微软的Bing Chat中试用GPT-4。微软透露,它一直在Bing Chat中使用GPT-4,且完全免费。尽管Bing Chat缺少一些GPT-4功能,并与微软自己的一些专有技术相结合,但用户仍可以访问扩展的LLM及其附带的高级智能。需要注意的是,虽然Bing Chat免费使用,但每次会话限制为15次聊天,每天限制为150次会话。
目前,还有许多其他应用程序也在使用GPT-4,如问答网站Quora等。
GPT-4何时发布?
GPT-4于3月13日正式发布,微软也提前确认了这一消息,并首先通过ChatGPT-Plus订阅和Microsoft Copilot向用户开放。GPT-4还以API的形式提供给开发人员,供其构建应用程序和服务。一些已经集成GPT-4的公司包括Duolingo、Be My Eyes、Stripe和Khan Academy等。GPT-4的首次公开演示在YouTube上进行了直播,展示了其新功能。
GPT-4o mini是何方神圣?
GPT-4o mini是OpenAI GPT-4模型系列的最新版本,是大型GPT-4o模型的精简版,更适合处理简单但量大的任务。这些任务从快速推理速度中获益更多,而非从利用整个模型的功能中获益。
GPT-4o mini于2024年7月发布,并已取代GPT-3.5成为用户在ChatGPT中交互的默认模型,一旦他们使用GPT-4o的查询次数达到三小时的限制。据Artificial Analysis的数据显示,GPT-4o mini在MMLU推理基准上的表现明显优于类似大小的小型模型,如谷歌的Gemini 1.5 Flash和Anthropic的Claude 3 Haiku等。
GPT-4是否比GPT-3.5更胜一筹?
ChatGPT的免费版本最初基于GPT 3.5模型,然而自2024年7月起,ChatGPT现在运行在GPT-4o mini上。这个更大的GPT-4o模型的精简版本甚至比GPT-3.5 Turbo还要出色得多。它能够理解和响应更多输入,拥有更多保护措施,提供更简洁的答案,并且运行成本降低了60%。
GPT-4 API
GPT-4以API的形式提供给过去至少向OpenAI成功支付过一次款项的开发者。该公司通过其API为开发者提供了多个版本的GPT-4以及传统的GPT-3.5模型。在发布GPT-4o mini时,OpenAI指出GPT-3.5仍可供开发者使用,尽管它最终将被下线,但公司并未设定具体的时间表。
该API主要面向开发新应用的开发人员,但也给消费者带来了一些困惑。例如,Plex允许用户将ChatGPT集成到该服务的Plexamp音乐播放器中,但这需要ChatGPT API密钥。这是与ChatGPT Plus分开购买的,因此如果用户需要该功能,则需要注册一个开发者帐户才能获得API访问权限。
GPT-4是否变差了?
尽管GPT-4在首次发布时给人留下了深刻印象,但一些用户注意到,在接下来的几个月里,其答案质量有所下降。开发者社区的重要人物注意到了这一点,甚至直接在OpenAI的论坛上发布了这一消息。然而,这一切都是传闻,OpenAI的一位高管甚至对此表示反对。根据OpenAI的说法,这只是人们的错觉而已。
随后发表的一项研究表明,随着模型的未来更新,答案的质量确实会受到影响。通过比较3月至6月之间的GPT-4表现,研究人员发现GPT-4的准确率从97.6%下降到了2.4%(这一数据可能存在误解或夸张,因为通常准确率不会如此大幅度地下降,此处可能是为了强调变化而采用的表述方式)。
2024年11月,GPT-4o的能力再次受到质疑。Artificial Analysis通过帖子宣布,他们完成了对OpenAI发布的GPT-4o的独立评估,并发现其评估分数远低于8月份发布的GPT-4o。GPT-4o在GPQA Diamond基准测试中的表现也从51%下降了11分至39%,而其MATH基准测试从78%下降至69%。相反,研究人员确实发现,在同一时间段内,GPT-4o对用户查询的响应时间几乎翻了一番。
GPT-4中的视觉输入功能如何?
GPT-4中最令人期待的功能之一是视觉输入功能,它使ChatGPT Plus能够不仅处理文本,还能与图像进行交互,从而使模型真正成为多模式模型。上传图像供GPT-4分析和操作就像上传文档一样简单——只需点击上下文窗口左侧的回形针图标,选择图像源并将图像附加到提示中即可。
GPT-4存在哪些局限性?
在讨论GPT-4的新功能时,OpenAI还指出了新语言模型的一些局限性。与之前的GPT版本一样,OpenAI表示最新模型仍然存在“社交偏见、幻觉和对抗性提示”的问题。
换句话说,它并不完美。它仍然会给出错误的答案,网上已经有很多例子证明了其局限性。但OpenAI表示,这些都是该公司正在努力解决的问题。总的来说,GPT-4的答案“缺乏创造力”,因此不太可能编造事实。
另一个主要限制是,GPT-4模型是在2023年12月之前使用互联网数据进行训练的(GPT-4o和4o mini于当年10月停止训练)。但是,由于GPT-4能够进行网络搜索,而不仅仅是依赖其预训练的数据集,因此它可以轻松地从互联网上搜索和追踪更新的事实。
目前,GPT-4o是GPT-4系列的最新版本(不包括新的o1版本),而GPT-5仍在开发中。