推荐使用国际直连GPT,立即访问: www.chatgp1.com
人工智能(AI)巨头OpenAI宣布了其最新的大型语言模型GPT-4o的推出,这一升级使得其AI助手ChatGPT变得更加智能且用户友好。作为去年发布的GPT-4的增强版,GPT-4o将免费向所有用户开放,确保每个人都能通过ChatGPT体验到OpenAI最前沿的技术。
原生多模态能力
据OpenAI介绍,升级后的模型不仅“速度更快”,还在“文字、视觉和音频功能”上实现了显著提升。GPT-4o的功能将“通过持续更新逐步推出”,而其中的文字和图像功能已率先在ChatGPT中上线。OpenAI首席执行官Sam Altman强调,该模型具备“原生多模态”特性,能够分析用户上传的屏幕截图、照片、文件或图表,并围绕这些内容进行对话。
人脸情绪识别
在发布会上,OpenAI团队成员还展示了新模型的音频功能,比如帮助某人在公开演讲前放松心情。OpenAI研究员Mark Chen指出,该模型能够“感知用户情绪”,并妥善处理用户打断或要求分析面部表情的情况,识别出用户可能正在经历的情绪状态。
卓越的音频处理能力
根据一篇博客文章,OpenAI计划在未来几周内对语音模式进行测试,并让ChatGPT Plus付费订阅者率先体验。OpenAI还透露,新模型能在“短短232毫秒内(平均320毫秒)回应用户的音频提示,与人类在对话中的反应时间相近”。更令人惊叹的是,OpenAI的新模型在音频模式下还能充当实时翻译器,具备记忆功能,能从先前的对话中学习,在两个使用不同语言的人交流时,即时翻译成各自的语言。
全民免费享用
在发布会直播中,OpenAI技术长Mira Murati表示,GPT-4o将免费提供给所有用户,而Plus付费用户将继续享有“免费用户五倍的使用量”。此外,对于希望利用GPT-4o进行开发的程序员来说,他们可以以GPT-4 Turbo一半的价格获得该模型的API访问权限。