新智元报道
编辑:耳朵庸庸
OpenAI 官方账号宣布,ChatGPT MAC 版本桌面应用程序今日起向公众免费开放使用,但原定于 6 月底向 Plus 用户开放的语音功能将推迟一个月上线,据悉这是出于安全因素和用户体验的保证。
适用于 macOS 的 ChatGPT 桌面应用程序现已可供所有人使用了!该应用程序是在今年早些时候公司的春季发布会上与其他更新一起发布的。
只是,OpenAI 推迟了千呼万唤的 GPT-4o 新高级语音功能的发布,理由是需要进一步改进。
ChatGPT Mac 版本向所有用户开放
虽然语音功能爽约,但 ChatGPT 桌面应用程序,这回终于向所有用户开放了,不过只适用于 MacOS,Windows 用户仍要等待。
像之前演示的那样,用户可以和 ChatGPT 随时展开聊天,各种类型的输入 ChatGPT 都可以 hold 住,用户可以上传文件、照片以及屏幕截图,还可以选择文档中的一段文本向 ChatGPT 提出问题。
快速调用
桌面应用程序使 ChatGPT 比其网站更易于访问,因为用户可以使用 Option+Space 键盘快捷键从任何屏幕触发它。
屏幕会弹出一个类似于 Apple Spotlight 功能的搜索栏,用户在其中输入问题就好。
截图
编程时遇到问题,直接截屏提问
上传文件
随时把文献交给 GPT 批量总结
问你想问
快捷地问你想问的任何问题
分享图片
读图(手写体也可识别)
搜索对话
可以搜索你和 GPT 的聊天记录
点击 ChatGPT 搜索栏右侧的耳机图标,就可以从桌面开始与 ChatGPT 进行语音对话。
只可惜,Sky 已经下架,用户现在仅可以从四种语音风格中进行选择:Breeze、Ember、Cove 和 Juniper。
自推出以来,适用于 macOS 的 ChatGPT 只向高级用户开放。目前,该应用程序开始向所有用户开放。
除了 macOS 之外,OpenAI 已经拥有适用于 Android 和 iPhone 的原生 ChatGPT 应用程序。
只是,ChatGPT 的 Windows 桌面应用程序还在制作中,感兴趣的用户将不得不等到「今年晚些时候」。
GPT-4o 语音功能推迟交付
Open AI 表示,他们还需要一个月的时间来实现之前在春季发布会上演示的 GPT-4o 语音功能。
原定计划是「在 6 月底向一小部分 ChatGPT Plus 用户推出 alpha 模式」,但现在这个日期向后推迟了一个月,也就是说,灰度测试将在 7 月开始,所有 Plus 用户都能使用则要等到秋季。
延迟出于两个方面的考虑:安全和用户体验。
OpenAI 希望提高「模型检测和拒绝某些类型内容的能力,从而可能防止滥用并确保负责任的 AI 交互」。他们还专注于「改善用户体验并准备好他们的系统来处理数百万用户的计算量,同时保持实时响应」。
我们在此分享春季更新中演示的高级语音模式的最新进展,我们对此仍然非常兴奋: 我们原计划在 6 月底向一小部分 ChatGPT Plus 用户推出 alpha 模式,但还需要一个月的时间才能达到推出的标准。例如,我们正在改进模型检测和拒绝某些内容的能力。我们还在努力改善用户体验,并准备将我们的基础设施扩展到数百万用户,同时保持实时响应。 作为迭代部署策略的一部分,我们将从一小群用户开始进行 alpha 阶段,收集反馈并根据所学知识进行扩展。我们计划在秋季让所有 Plus 用户都能使用。具体时间取决于能否达到我们的高安全性和可靠性标准。我们还在努力推出我们单独演示过的新视频和屏幕共享功能,并将随时向您通报这一时间表。 ChatGPT 先进的语音模式可以理解并回应情绪和非语言暗示,让我们更接近与人工智能进行实时、自然的对话。我们的使命是为您带来这些贴心的新体验。
对 OpenAI「拖延症」发作,网友们表示见怪不怪,推迟发布属于基操。
笑死,「几周」变成了4-6 个月,OpenAI 基操。
网友甚至预判「计划在秋季让所有 Plus 用户都能使用」,言外之意是取秋季三个月的 deadline。
别忘了各位,秋天包括九月、十月、十一月。
甚至有用户表示对 OpenAI 诚挚的道歉和延期的理由并不买账,发出退订威胁——OpenAI 屡次向用户「画饼」,对用户的承诺提前好几月就侃侃而谈,功能的交付却永远在路上。
或许到了我该退订的时候了…
太长懒得看:过早的承诺然后永远在交付途中…又一次这样了。
也有网友用 Claude 研发速度和成果催促 OpenAI,别睡了!起来交货!
Claude 正在交货,OpenAI 睡得正香。
可以看出,网友对 OpenAI 推迟语音功能的大众情绪多为失望和不满,质疑 OpenAI 是为了吸引 Plus 用户订阅而夸大其词。
reddit 也新开了一个讨论贴,为什么人们对 4o 语音如此不耐烦或渴望?
GPT-4o 是 OpenAI 公司最新的 GPT4 版本,在发布会上最引人注目的特点就是像与真人对话的丝滑流畅,甚至能识别用户的情绪且响应速度极快。
因此,对于语音功能的完全上线用户们自然是望眼欲穿,语音作为多模态输入的一个重要部分也将大大提高用户的使用效率和使用体验。
发布会展示的语音功能对话 0 延迟,功能交付却延迟一个月,期待落空自然引起大批用户的不满。
高赞评论是——
不耐烦的情绪一方面来自 OpenAI 的种种前科,一方面来自对于这种屡次「事前画饼,事后道歉」的行为,把话说满,虚假宣传,对于大公司来说,会逐渐消磨它在大众中的公信力。
如果他们解释说发生了他们无法控制的事情,我会多宽容谅解一些,但也不会太多...... 像这样提前宣传的事应该是违法的。 如果你的所有客户目前无法购买到商品那么你就不能宣布或泄露它。 这并非没有先例。在首次公开募股(IPO)的静默期,你不能进行市场推广或任何形式的公开宣传。 这个规定一直沿用至今,我敢肯定,公开市场对这个规定也没有异议。
问题是他们提到的是「未来几周」。要知道,OpenAI 是一家大公司,人们当然很容易相信他们。你知道,就像你在网上买东西一样,在你真正收到东西之前,你无法确定它是否是真的。如今,连评论都可能是假的。
灰度测试
TestingCatalog 发布的一则推文透露了与语音功能灰度测试有关的讯息。
「It is coming!」
ChatGPT Voice Alpha 邀请界面
ChatGPT iOS 应用程序再次更新,新增了一些 UI 组件,这些组件可能会向即将推出的高级语音模式的 alpha 测试者展示。
在邀请界面,我们可以看到最重要的几点在于——
- 自然对话,实时回复
- 具有情绪和语气,能够感知和回应幽默、讽刺等
- 视频聊天,轻点相机图标即可分享周边环境
虽然一些用户对推迟表示失望,但 OpenAI 专注于在发布前把事情做好是有道理的。希望当高级语音模式和新的多模式功能真正到来时,将会带来更好、更安全的体验。
参考资料:
- https://x.com/OpenAI/status/1805716393524183136?t=_quxGDt--E6_HFJvehEvsg&s=19
- https://x.com/OpenAI/status/1805679342439284831?t=ITNAuGXckpW5FHJmcROyng&s=19
- https://www.reddit.com/r/OpenAI/comments/1do6va2/why_are_people_so_impatient_or_eager_for_4o_voice/
- https://x.com/testingcatalog/status/1805288828938195319