豆包模型家族升级,助力企业AI转型,豆包就是“都包”

  来源:封面新闻

  7 月 25 日,火山引擎 2024“AI 创新巡展”首站成都站正式启航!不航则已,一航惊人。据悉,截至 2024 年 7 月,豆包大模型日均 Tokens 使用量超过 5000 亿,发布 2 个月以来,平均每家企业客户日均 Tokens 使用量增长 22 倍。

  此次巡展将首次发布了豆包图生图模型,以及升级了文生图模型、语音合成模型和声音复刻模型。在豆包图生图模型中你可以把自己的照片一键转换成当下最流行的黏土风、莫奈风。在声音复刻模型的应用中居然可以听到“太白金星”在线讲外语。都让人不得不感叹豆包大模型的功能之强大。

  在价格上豆包大模型的“更强模型、更易落地、更低价格”不只是说说而已。既要方便企业试错落地,又要功能强大能打。豆包大模型家族模型丰富,应用场景多样化。帮助企业低成本轻松构建高质量 AI 应用,在带来创新业务体验的同时,驱动业务增长。

  一、大模型能力测试“遥遥领先”:

  所谓“三强争霸”,就是在模型、价格和落地性上脱颖而出。大模型优质在于使用量,大使用量才能打磨出更好模型,豆包大模型经过数千亿日 Tokens“千锤百炼”下的持续打磨,在能力和推理效果上都得到了广泛认可。

  根据 6 月智源研究院旗下的 FlagEval 大模型评测平台发布最新评测榜单。榜单显示,在闭源大模型的“客观评测”中,豆包大模型(Doubao-Pro-4k)获得国产大模型第一名。

  豆包大模型率先以最强版本,以更强模型,更低价格,帮助企业进行低成本试错。例如本次登榜的豆包通用模型 pro,其 32k 版模型推理输入价格仅为 0.0008 元/千 Tokens。简单翻译一下,就像处理《三国演义》75 万字的文字量级,只需花 1 块钱就可以处理 3 本,处理《哈利波特》中文版 8 本书(274 万字),只需 1.5 块钱还有剩余。即使在大模型市场竞争如此激烈的情况下,豆包在性价比方面也是做到了极致。

  二、国产大模型豆包就是有“钞”能力:

  据火山引擎副总裁张鑫介绍,在字节内部,有超过 50 多个业务在使用豆包大模型,覆盖了协同办公、数据分析、文案创作、辅助编程、内容审核、客服、游戏 NPC、角色对话、教育等各种场景,基于豆包大模型打造的新技术引擎正在加速业务创新。此外豆包大模型的外部客户已覆盖手机、汽车、金融、消费、互娱等 30 多个行业,并联合 OPPO、vivo、荣耀、小米、三星、华硕等知名终端厂商和吉利汽车、长城汽车、捷途汽车、赛力斯、智己汽车等 20 余家汽车厂商分别成立了智能终端大模型联盟和汽车大模型生态联盟。

  例如 OPPO,在情感陪伴、内容创作、百科出行、智慧办公等多个 AI 服务场景进行探索和投入。此外,多所知名高校也利用相关技术为课程和实验搭建了“AI 助手”““图书馆找书”以及“网信办服务助手”。

  作为豆包大模型西南区域的企业客户典型,蓝领招聘平台鱼泡科技和智能客服企业晓多科技也各自分享了接入豆包大模型实现业务增长的案例经验。其中,鱼泡科技的豆包大模型日均调用量已超 1 亿 Tokens,应用场景覆盖了岗位要求识别、工种识别、求职意向识别、推荐系统相似度识别等。

  未来,火山引擎将持续探索大模型在千行百业里的实践应用,继续沉淀字节跳动内部和外部客户的实践经验,通过豆包大模型、火山方舟的全栈 AI 服务,帮助企业 AI 转型落地,释放增长潜能,实现商业价值达到“钞”能力的增长。让各行各业都能运用豆包大模型赚到钱。

  三、“豆包家族”阵容强大,个个能打:

  豆包模型家族在 5 月正式发布全面亮相,提供的就是一个有多模态能力的模型家族。主要包括通用模型 pro、通用模型 lite、语音识别模型、语音合成模型、文生图模型等九款模型。个个天赋异禀,超级能打。

  本次,豆包模型家族升级了文生图模型和语音模型。升级后的豆包·文生图模型具备更能读懂“中国话”更精准地了解用户的表达,能够生成图文一致的高美感图片。豆包·语音合成模型在升级后实现了智能识别文本情绪并对语速、语调动态调整,使之情绪更加饱满;声音复刻模型仅需 5 秒就能高保真复刻人声,并支持多种小语种。

  值得一提的是,豆包模型家族此次官宣了一位新成员——豆包·图生图模型。基于文生图模型打造,豆包·图生图模型能实现高度还原人物特征,生成更像你自己的图片。50 多种风格场景自由转换。该模型能力已经在抖音、剪映、豆包、星绘等字节系 App 中落地,并通过火山引擎服务了三星、努比亚等企业客户,目前日均图生图数量达到数千万张。

  三星 GalaxyAI 全新推出的智绘人像功能,通过引入豆包图生图模型的单图写真能力,以更强的图片处理能力提升用户的摄影体验,让用户能以更个性化的方式,高效处理所拍摄的照片,为照片增添实用性与趣味性。火山引擎 AI 解决方案经亿级 DAU 的产品不断打磨,在 AI 写真方面拥有杰出能力。三星用户只需上传单张照片,就能把它转化为商务、3D 卡通、赛博朋克等多种不同风格的全新图片,实现图片的个性化应用。

  自豆包 APP 上线一年来,月活用户超过 2600 万。这些实战路上的“打怪升级”大量应用,让豆包大模型越来越强悍。越来越多的用户运用豆包进行工作、生活、学习。

  四、字节系大模型工作生态链已成:

  除了效果好,价格便宜,豆包大模型还给出了最高可达同梯队模型数倍的每分钟处理 Tokens 限额,让模型服务具备更强的承载力。据火山引擎大模型服务算法架构师孙帆介绍,豆包通用模型 pro 为客户提供了业内最高标准的初始 TPM(每分钟 Tokens)和 RPM(每分钟请求数),有助于企业的业务在高并发场景中落地。“我们希望用扎实的技术实力给客户更好的选择,帮助企业解除成本包袱,让客户更积极更大胆地尝试、迭代,让大模型应用大踏步向前。”孙帆说。

  火山引擎还升级了头条抖音同款插件服务,新增网页解析、计算器等插件,进一步扩宽模型能力的边界,支持企业多样的应用需求,同时带来了扣子专业版、HiAgent 平台等多款产品和云基础设施的最新进展。

  火山引擎总裁谭待此前接受采访时曾对此表示,大模型的超低定价,来自对技术的信心,火山引擎能通过技术手段实现大模型推理成本的优化。在火山引擎的 2024 年 AI 创新巡展大会中,印证了当下大模型时代“应用为王”的趋势。在豆包大模型的生态宇宙中,我们可以乘上火山方舟,携手豆包“海纳百川”,共同奔赴属于大模型的星辰大海!

  封面新闻记者李琪