IT 之家 10 月 5 日消息,科技媒体 NeoWin 昨日(10 月 4 日)发布博文,报道称谷歌公司即将商用 Gemini 1.5 Flash 8B 模型,成为谷歌公司最便宜的 AI 模型。
IT 之家曾于今年 8 月报道,谷歌公司推出 3 款 Gemini 实验性模型,其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的更小尺寸模型,拥有 80 亿参数,专为多模态任务而设计,包括大容量任务和长文本摘要任务。
相比较原版 Gemini 1.5 Flash,Gemini 1.5 Flash 8B 延迟更低,特别适合聊天、转录和长文本翻译任务。
Gemini 1.5 Flash 8B 的另一个亮点是亲民的价格,相关计费将于 10 月 14 日星期一生效,IT 之家附上相关信息如下:
-
在低于 128K 上下文窗口下,每百万 tokens 输入提示词费用为 0.0375 美元(当前约 0.26 元人民币)
-
在低于 128K 上下文窗口下,每百万 tokens 输出提示词费用为 0.15 美元(当前约 1.1 元人民币)
-
在低于 128K 上下文窗口下,每百万 tokens 缓存提示词费用为 0.01 美元(当前约 0.071 元人民币)
作为对比,Gemini 1.5 Flash 模型的每百万输出 tokens 成本为 0. 3 美元,这一价格是在 2024 年 8 月 12 日开始实施的,意味着新版 Gemini 1.5 Flash 8B 的价格相比较原版直接腰斩。