新智元报道
编辑:定慧好困
Grok 连夜上线图片编辑功能,继 Gemini 引爆图片编辑热潮后,动动嘴就能实现「证件照换西装」、「黑发变金发」等专业级P图效果。随着 AI 巨头内卷加剧,很多工作可能会经历「从复杂操作到简单交互」的范式转移,大模型内卷,受伤可能是传统软件。
Grok 连夜上线图片编辑功能。
昨晚,Grok 上线图片编辑功能,可以通过文字描述直接修改图片。
比如你可以上传一张个人证件照,「动动嘴」让 Grok 给你 PS 一套全新的西服。
看起来效果非常不错,Grok 还「体贴地」给你设计了四种不同风格,比如领带「带花纹」和「不带花纹」。
不过该功能目前应该还是在灰度测试中(作为 Premium 氪金用户的 Grok 主页暂时还没有编辑按钮)。
Grok 手机 APP 同步上线
Grok 也同步上线了X的手机 APP, 你也可以在手机上体验图片编辑功能。
比如上传一张照片,让图片中人物的「黑发」变成「金发」。
不过作为手机内部的 Grok 功能,目前同样是在灰度测试中。
由于 Grok 灰色测试,目前全网还没有太多讨论。
不过从一些博主的测试作品来看,Grok 应该是对自己的效果很有信心。
比如这位有 6 万粉丝的 Borriss 博主,他的头像是一件「黑色高领毛衣」。
但是经过 Grok 的P图后,换成了一套「西服」。
「黑毛衣秒变西服」,AI 编辑的能力目前看起来效果并不赖。
其他陆续有用户放出了自己使用 Grok 编辑图片的效果,不过这次 Grok 犯了一个错误,把用户的脸也给换了。
比如,可以将图片风格变成 Egon Shiele 的画作风格。
或者是给马斯克加一顶帽子。
大模型「内卷」,PS 受伤
Grok 这次「连夜」上传图片编辑功能,大概率是被 Google 的 Gemini2.0 火出圈的「动动嘴」PS 功能给刺激到了。
Google 发布 Gemini-2.0-flash 的 Experimantal 版本靠着简单的文本描述就能「P图」的能力着实火了一把。
比如将两张照片P在一起还不违和,并且可以添加人物动作。
或者,将白色风格的裙子换成红色,还能给人物打个领带。
从 Gemin2.0 到 Grok 的图片编辑,能看出目前 SOTA 模型的「内卷」依然还在进行。
大模型也在「抢占」用户心智。
以后人们谈起P图,第一个想到也许不是 Photoshop 这种传统的图片编辑软件,而是 AI 赋能各种大模型功能。
从P图这件事情可以窥见一些苗头,AI 的发展很可能会带来一个很大的「范式转移」。
未来的很多工作会从「复杂操作」变成「简单交互」。
比如在图片编辑领域,Gemini 和 Grok 等大模型将持续降低图片编辑的技术门槛。
从原来需要专业软件、复杂步骤,到只需一句自然语言指令即可实现高质量图片编辑。
当然在目前的大模型P图效果依然停留在「可玩」的层面,专业的图片编辑还需要专业的 UI 工程师使用特定的软件才能完成。
不过 SOTA 模型的内卷依然没有结束。
正如 Alvaro Cintas 所说,为什么 OpenAI 还没有发布原生图像生成和编辑功能。
也许快了,说不定哪天 ChatGPT 就放出编辑原生图片。