新智元报道
编辑:桃子乔杨
【新智元导读】ChatGPT 横空出世以来,首次迎来界面史诗级升级!全新 canvas 界面,开启了人类与 AI 协作研究、编码的新时代,更代表着终极 AGI 人机交互形态。
时隔两年,ChatGPT 终迎来界面全新升级!
这一次,OpenAI 官宣推出 canvas。它不再是简单的对话框,而是能与 ChatGPT「并肩作战」的全新界面。
不论是写作,还是编码,都可以开启全新的合作方式。
canvas 基于 GPT-4o 构建,目前仍在测试阶段,可在所有模型中手动选择。
而且所有 Plus 用户不用等待,直接可用。未来,OpenAI 还计划向所有免费用户全面推出。
canvas 不仅可以让你与 ChatGPT 一起做研究,还能写代码、邮件等等,最重要的是还能帮你一起脑洞。
有趣的是,canvas 还可以添加 emoji。奥特曼在线发起投票,看看有多少人喜欢这个功能。
另外,canvas 面板中,还多了一个快捷菜单,让协作更加轻易便捷了。
审查代码、修改 bug、添加评论、log 等等,一键完成。
在 Canvas 界面助力下,GPT-4o 编码性能飞跃 18%!
这是要纷纷取代了 GitHub Copilot、Cursor 编码神器了。网友们惊叹道,OpenAI 绝杀了 Cursor。
还有人说,canvas 的推出,是 OpenAI 对最大劲敌 Anthorpic 的 Claude artifacts 最大的回击。
在经历如此巨大人事变动同时,OpenAI 近日多次发布更新,是向外界、投资者给出了我们依旧有实力的反馈。
话不多说,看看历经两年,ChatGPT 究竟带了怎样划时代的巨变。
肝代码研究,原来这么轻松
canvas 项目负责人 Karina Nguyen 表示,我对终极 AGI 界面的愿景,是一张空白的画布。
随着时间的推移,它会根据人类偏好,自我改进。
而且,它会创造与人类互动的新方式,重新定义人类与 AI,以及整个互联网的联系。
canvas 便是,这样一种终极 AGI 界面的完美「代言人」。
那么,它究竟如何帮人类研究、写代码、创作呢?
接下来,让我们一睹为快。
做研究
当你需要完成一项艺术史研究报告,在 canvas 便可以完成研究。
首先,将你的需求告诉 ChatGPT,它便开始搜索一切所有相关的报道——Rembrandt 的自画像技巧。
随之,canvas 在屏幕右侧开启了全新界面,一篇研究报告,正在速成。
当你对其中生成的一句话,不太确定是否正确。只需要选中,然后即刻就能唤醒 ChatGPT,随地取问。
又或者,当你想要更改文中的小标题,不如让 ChatGPT 给点建议。
最惊艳的是,右下角「铅笔」样子的图表,可以开启文献的阅读模式,可以一句一句地浏览。
最后,你可以让 ChatGPT 为你添加参考文献、书目引用。
写邮件
你还可以让 ChatGPT 搜索一家最好的餐厅,它会帮你汇总所有在 SF 城市米其林餐厅。
然后让它在为你写一封邮件,发给最好的朋友。
写代码
另外,你还可以在 canvas 界面中,完成代码的生成,还是可以编辑的那种。
以往 ChatGPT 只是给出结果,并不能一同编辑。
让 ChatGPT 用 Rust 写一 API 网络服务器,它便同以往一般,为你生成了代码。
然后,要求对其中一段代码,添加登录注册路由。
并且,你还可以自己改写其中的内容。
在界面右下角,还有一个工具栏,可以进行代码审查、转换语言、修改 bug、添加 log、还有添加评论功能。
比如,针对刚刚生成代码进行审查,以及修复 bug,ChatGPT 瞬间就完成了。
发明新食谱
更惊艳的是,在 canvas 模式下,还可以创造发明新的 idea。
比如,你想做一个不一样的苹果派,可以让 ChatGPT 搜索总结出,最通用的苹果派的食谱。
假设你没有其中一种材料——Nutmeg(肉豆蔻),然后你们可以一同创作全新的做法。
与 ChatGPT 并肩作战
目前,ChatGPT 已常被用于协助写作和编码方面的任务。
尽管聊天界面易于使用并且适用于许多任务,但对于需要编辑和修订的项目,仍然有些不便。
canvas 的推出,正是要为这类工作提供新的界面,而且能让 ChatGPT 更好地理解用户提供的任务上下文。
当 ChatGPT 检测到可能有帮助的场景时,canvas 会自动打开,也可以直接在提示词中包含「使用 canvas」的字样来处理现有项目。
对于写作任务,快捷编辑栏中包含 5 种选项,从下至上依次为:
- 建议编辑:ChatGPT 为指定内容提供内联建议和反馈
- 调整长度:将文字内容编辑得更短或更长
- 更改阅读级别:调整文字的阅读难度,从幼儿园到研究生院
- 最后润色:检查语法、清晰度和一致性
- 添加表情符号:为强调或有颜色标记的内容添加相关 emoji 符号
比如,可以高亮特定部分来引起 ChatGPT 的关注,并让模型在考虑整个项目的同时,提供内联反馈和建议。
奥特曼还发起了在线投票,「添加 emoji 是不是 OpenAI 有史以来发布的最好功能?」
对于编码任务,快捷键又和写作不同:
快捷键从下至上依次为:
- 检查代码:ChatGPT 提供内联建议以改进代码
- 添加日志(logs):插入 print 语句以帮助调试和理解代码
- 添加注释:为代码添加注释
- 修复 bug:检测并重写有问题的代码以解决 bug
- 移植到一种语言:将您的代码转换为 JavaScript、TypeScript、Python、Java、C++或 PHP
「点到哪里改哪里」,修改代码也将和修改文字一样直观简单。
为什么要更新用户界面?
OpenAI 在博客中表示,如果要让人工智能变得更有用、更易用,就需要重新思考我们如何与它互动。而 canvas,就是一种全新的方法,未来还将经历快速迭代。
终极 AGI 界面 canvas,GPT-4o 也被优化了
为了让模型更适应 canvas 模式,团队也对 GPT-4o 进行了必要的修法,添加了一些核心行为:
- 触发 canvas 的打开,进行书写和编码
- 生成多样化的内容类型
- 进行有针对性的编辑
- 重写文档
- 提供内联形式的修改意见
值得一提的是,对 GPT-4o 进行的这些训练采用了 OpenAI 的合成数据生成技术,包含了从 o1 模型中提取的输出。
此外,团队还使用了 20 多项自动内部评估来衡量进展情况。
首先,一个关键的挑战是定义何时触发 canvas。模型既需要灵敏识别有检查、修改需求的任务,比如「写一篇关于咖啡豆历史的博客文章」,同时也要避免过度触发,比如「帮我做一份新的晚餐食谱」这种一般的任务就不太需要 canvas。
与带有提示指令的基线模型相比,调整后的 GPT-4o 的触发决策正确率分别达到了 83% 和 94%
第二个挑战涉及在 canvas 被触发后调整模型的编辑行为,特别是决定何时进行有针对性的编辑而不是重写整个内容。
这就要训练模型,在用户明确选择文本时,更倾向于执行有针对性的编辑而非重写。随着模型不断完善,这种行为的能力也在不断发展。
相比基线模型,带有 canvas 的 GPT-4o 在写作和编码任务上有 18% 的性能提升
最后,训练模型以生成高质量的代码注释同样需要细致的迭代过程。
这个评估任务与前两种情况不同。canvas 是否触发以及是否进行了有针对性的编辑行为,很容易进行自动化评估,但以自动化方式衡量代码注释的质量,因此团队选择了人工评估。
相比基线模型,集成 canvas 后的 GPT-4o 在注释准确性方面有 30% 的提升,质量提高了 16%。
这表明,与带有详细指令的零样本提示相比,合成数据的训练显著提高了模型的响应质量和行为。
网友玩疯了
canvas 一经发布,已在全网掀起热议。
Every 初创公司创始人表示,很明显,OpenAI 不仅仅是在构建聊天机器人,他们还试图为 AI 时代构建一种全新的操作系。
一名开发者表示,canvas 界面是游戏改变者。
他刚刚通过 canvas 和 ThreeJS 一起创建了一个 tesseract/Hypercube 可视化工具,并称自己喜欢统一的 UX 聊天、在线评论和观看 GPT-4o 在代码上发挥其魔力,所有这些都在一个地方完成完成,永不过时。
还有网友表示,canvas 界面做的非常好,而且一切都是实时流畅的。
不过,它让我们意识到一个重要的问题,我们还不确定与 AI 协作写作的最佳方式是什么。
话虽如此,canvas 让工作更加集成集成(cyborglike),而不是简单地轮流进行任务(centaurlike)。
还有人纷纷悼念 Cursor。
核心贡献团队
canvas 背后核心团队也随之全部公布。
研究主管是 Karina Nguyen,还有 3 位核心研究人员 Kai Chen, Michael Wu, Tarun Gogineni,12 位核心工程/产品/设计师。
值得一提的是,提供支持技术领导人当中,还有离职的 CTO Mira Murati。
Karina Nguyen
在加入 OpenAI 之前,Karina Nguyen 曾在 Anthropic 任职,专注研究模型对齐能力和诚实研究,以减少 LLM 的幻觉。
值得一提的是,她曾领到了 Claude Instant 1.2 训练,在 API 中制作了该模型。
此前,作为一名设计工程师,Nguyen 与 Primer.ai、Dropbox、Square 和《纽约时报》的团队在研发原型、新闻工具和产品功能方面进行了合作。
Kai Chen
Kai Chen 在宾夕法尼亚大学获得了计算机科学本科学士学位。
她于 2023 年初加入 OpenAI,此前 Kai Chen 还联合创办了两家公司,一个是 AI 助手领域的 Dispatch、还有一家自动化劳动任务项目的 Port Tecjnologies。
Michael Wu
Michael Wu 目前是 OpenAI 的应用研究员。
此前,他曾以应用研究科学家身份,在 Facebook 工作了三年,任职期间训练了自然语言理解和深度学习模型。
此外,他还在 Primer AI 担任机器学习工程师、Dropbox 担任软件工程师,在 Naver Corp 担任机器学习实习生,在苹果公司担任机器学习实习生。
2015 年,Michael Wu 在麻省理工学院获得了计算机科学和数学学士学位。
参考资料: