推荐使用国际直连GPT,立即访问: www.chatgp1.com
OpenAI的首席执行官兼联合创始人Sam Altman于周四在X平台(原Twitter)上宣布,其备受期待的高级语音功能将于“下周”率先向部分特定的ChatGPT-Plus订阅用户推出。
公司计划采取分阶段推进的策略,“首先邀请一小部分用户参与alpha测试,旨在收集宝贵的反馈意见,并根据测试结果逐步扩大测试范围。”
Advanced Voice功能取消了文本输入的局限,使用户能够如同与人类对话一般,流畅地与人工智能进行直接交流。该功能最初于今年5月在OpenAI的春季更新活动中与GPT-4模型一同亮相(注:原文GPT-4o疑为笔误,应为GPT-4)。与Siri、Google Assistant等现有的数字助理相比,这些助理往往只能提供预设的答案来回应用户查询,而ChatGPT的Advanced Voice则能够生成近乎人类的回应,几乎无延迟,并且支持多种语言。
GPT-4模型在接收音频输入后,平均能在320毫秒内迅速作出回应,这一速度与人类在正常对话中的反应速度不相上下。在演示视频中,该模型能够同时与多位用户进行交谈,用英语和葡萄牙语即兴提出话题要点和问题,并通过类似人类的情感表达(包括“笑声”)来传达信息。
关于Alpha测试参与者的具体选拔标准,目前尚不清楚,但仅限于每月支付20美元订阅费的ChatGPT Plus用户。原本计划在6月推出的Alpha测试因需“达到我们的发布标准”而推迟,以加强公司检测和拒绝违禁内容的能力,并提升IT基础设施以应对预期的用户负载增长。
正如OpenAI在六月份所宣布的那样,该功能的全面推出至少要等到今年秋季,具体时间还需视其是否“满足我们高安全性和可靠性标准”而定。
让ChatGPT能够与用户进行自然流畅的对话,无疑是一项重大的技术突破。取消上下文窗口的需求,不仅降低了用户的硬件要求,还拓宽了AI的潜在应用场景和集成方式,例如为身体活动或灵活性受限的用户提供更多便利。
此外,这一功能还有望降低技术门槛,吸引那些对快速工程技术感到陌生但习惯于通过“嘿 Siri”等语音指令与计算机交互的用户,从而加速公众对这一技术的接受度。