国思软件 - 谷歌连放大招：Gemini Pro支持中文，Bard学会画画，还上了新模型

　　丰色发自凹非寺

　　量子位公众号 QbitAI

　　在竞技场超车 GPT-4 的 Bard“抓住势头”，刚刚释出重大更新：

　　一是集成的 Gemini Pro 全面铺开，新增 40 多种语言支持，包括中文在内（之前只能用英文）。

　　并且这些语言全部支持二次检查，也就是回答完了再主动验证一遍答案的正确性。

　　△点击“G”图标即可开始

　　二是终于能生成图像了。

　　要知道，Bard 诞生近一年都不支持，现在直接可用谷歌最强的 Imagen2 开始创作，且是免费的那种。

　　赶紧来瞧瞧。

　　Bard 文生图终于来了

　　虽然是免费使用，但目前 Bard 只支持英文指令来进行画图创作。

　　效果看起来还是很不错的，两张官方示例图感受一下这拉满的细节：

　　提示词：一位老年亚洲男模特剪影的侧面时尚头像，右侧有红色背光，左侧有青色背光

　　提示词：一位老妇抱着一只狗走在布拉格街道上的特写镜头；捕捉女人饱经风霜的脸、温柔的微笑和狗满足的表情这些细节。

　　具体操作中，不需要我们点击按钮进行功能切换什么的，直接在提示框中键入“Generate xxx”即可（再次提醒，得用英文）。

　　如下图所示，我们可以一边让它帮咱写文章，一边让它生成配图，实用且便携。

　　背后的工程师（来自谷歌 DeepMind）也在网上分享了一组 Bard 新鲜出炉的作品，尽管提示词简单，但内容看起来还不错。

　　量子位也实测了一些。

　　例如“一幅含大海和植物元素的拼贴艺术画”：

　　又或者这个带有春节气息的的龙：

　　不满意可以让它继续画。

　　总的来看生成速度还需进步，不算秒出，得等个半分钟的样子。

　　有意思的是，有网友试玩发现：

　　Bard 有点严格，让它生成一只“世界上最丑的狗”竟然被拒绝了。

　　理由不免有些“冠冕堂皇”：

我知道你要一只世界上“最丑”的狗的图片。然而，我无法生成这种本质是宣传负面外观的图像。相反，无论狗的身体特征如何，我都鼓励你看到它们身上的独特美丽和个性……

　　眼看如此，网友便修改提示词，让它来一个“不那么吸引人的”。

　　结果还是被判定带有“歧视、负面、刻板印象”。

　　这次，Bard 倒是给出建议，说它可以生成一个独特外观的狗，或者一只“处于尴尬或混乱”情况下的狗。

　　总而言之，不能使用负面词汇。

　　这个案例也是遭到了网友的无情嘲讽。

　　不过，谷歌在今天的宣传稿中确实专门强调了“负责任性”，任何暴力、攻击性或色情内容都不许产生（前几日的“霉霉事件”倒是确为前车之鉴）。

　　基于此，任何在 Bard 中生成的图像也会打上数字水印，方便检测是否为谷歌 AI 生成。

　　这其实也是谷歌为什么总是“速度这么慢”的原因之一。

　　谷歌聊天机器人 Bard 于 2023 年 3 月开放测试、5 月全面开放，但一直都没有文生图功能。

　　论能力，谷歌本身是不缺的，其 Imagen 模型 2022 年 5 月就诞生，并且实力也是相当强大：一登场就打败刚新鲜出炉一个月的 DALL·E 2。

　　奈何这样优秀的作品却没有及时“发光发热”，其中一个原因就是谷歌一直比较谨慎，对 AI 产品要顾及各种风险等。

　　这不，直到 2023 年 10 月，诞生一年半之久的 Imagen 才刚刚上线谷歌搜索。

　　然后就是 12 月份，Imagen2 发布，它解决了 AI 画手等难题，细节把控能力再次完爆 DALL·E 3 和 Midjourney。

　　好在终于从 Imagen2 开始，谷歌的节奏快了一些。

　　如我们今天所见，它已集成到了 Bard 之中，帮助 Bard 开启了“千呼万唤始出来”的文生图功能。

　　对了，说到文生图，谷歌还在这次一起推出了一个ImageFX工具：

　　主打堆砌简短提示词快速生成图像。

　　不过它目前还是一个实验功能，并没有上线谷歌的主力产品中。

　　Bard 高级版将至，告别免费模式

　　关于 Bard 的另一则消息：

　　本月初，就有消息传谷歌正在开发 Bard 升级版（Bard Advanced）。

　　它将集成 Gemini 最强的 Ultra 版本，提供更复杂的推理性能。

　　这两天，谷歌 CEO 皮查伊在财报电话会议上已正式确认并表示，这一新版本要走订阅付费模式。

　　因此可以看成是对标 ChatGPT Plus 的一个重大更新。

　　不过有消息说会先免费 2 个月。

　　具体定价和推出时间呢？目前也都还不清楚。且让我们拭目以待。

　　参考链接：

　　[1]https://twitter.com/googledeepmind/status/1753074755388018996

　　[2]https://techcrunch.com/2024/02/01/google-launches-an-ai-powered-image-generator/

　　[3]https://blog.google/products/bard/google-bard-gemini-pro-image-generation/

　　[4]https://twitter.com/lmthang/status/1753113142035706103

　　[5]https://www.tomsguide.com/ai/google-confirms-youll-need-to-pay-for-bard-advanced-heres-what-it-can-do

谷歌连放大招：Gemini Pro支持中文，Bard学会画画，还上了新模型

我们的产品

相关链接

关于我们

联系我们