文|科技新知,作者丨林曦,编辑丨赛柯
在人工智能领域,OpenAI 的一举一动牵动着全球从业者的心。近日,OpenAI 宣布停止对中国的 API 服务,将对中国“断供”。
北京时间 6 月 25 日凌晨,有开发者收到了 OpenAI 的邮件,邮件写道:“数据显示,您组织的 APl 流量来自 OpenAl 目前不支持的地区。”并表示:“从 7 月 9 日起,我们将采取额外措施,阻止来自不在我们支持的国家和地区列表中的地区的 APl 流量。”
根据 OpenAI 官网,支持访问 API 服务的国家和地区总计 161 个,不包括中国内地与中国香港。OpenAI 官网还提到,除了被允许的国家和地区外,“访问或提供访问我们的服务,可能会导致您的账户被封锁或暂停。”
科技新知从多位 AI 大模型从业者处获知,确实收到了这封邮件。业内人士认为,OpenAI 出于对成本以及数据安全的考量而停止在中国的 API 服务。
2023 年 3 月,OpenAI 宣布开放 API,允许第三方开发者通过 API 将 ChatGPT 集成至他们的应用程序和服务中。The Information 报道,自去年 12 月起, OpenAI 年化收入翻了一倍,达到 34 亿美元,其中 32 亿美元源自其订阅服务与 API 访问。
借助 OpenAI 大模型“套壳”创业的公司,将迎来毁灭式打击。“对于依赖 OpenAI API 的‘套壳’公司来说,他们可能需要寻找其他的 API 服务供应商或者寻找替代方案来维持其服务。”中国人工智能学会专家、深度科技研究院院长张孝荣对科技新知表示,“这可能需要对新的供应商进行调查,了解其服务的特点、质量和价格,并进行相应的技术调整和适配。”
国内厂商“抢单”
技术社区的讨论很快传导到市场,OpenAI 的“停服”消息一出,国内 AI 大模型公司纷纷上线“迁移计划”,且一举打出“免费”旗号。
6 月 25 日,百度智能云千帆推出大模型普惠计划,为新注册企业用户提供 0 元调用、0 元训练、0 元迁移等服务,其中,文心旗舰模型首次免费,针对 OpenAI 迁移用户额外赠送与 OpenAI 使用规模对等的 ERNIE3.5 旗舰模型 Tokens 包。
阿里云百炼宣布,将通义千问 GPT4 级主力模型 Qwen-plus 的 API 定价为 OpenAI 的1/50,并为中国开发者提供 2200 万免费 tokens 和专属迁移服务。
腾讯云为新注册企业用户免费赠送腾讯混元生文 1 亿 Tokens,还将为新迁移企业用户提供免费专属迁移工具和服务。
除了头部大厂,国内几个 AI 大模型代表性初创企业也纷纷争夺这波流量。智谱 AI 推出了“OpenAI API 用户特别搬家计划”,为开发者提供 1.5 亿 Token,以及从 OpenAI 到 GLM 的系列迁移培训;Kimi 当天发布迁移方案,称 Kimi 开放平台接口完全兼容 OpenAI,最快 5 分钟实现搬家;零一万物发起“Yi API 二折平替计划”,推出了平滑迁移至 Yi 系列大模型的服务。
硅基流动(SiliconFlow)甚至将 Qwen2-7B、GLM-4-9B、Yi-1.5-9B 等开源大模型永久免费,创始人袁进辉在朋友圈称:“今天 SiliconCloud 把一大批模型都免费了,大家轻薅,别给整破产了。”
显然,国内大模型公司试图抓住这一关键“窗口期”,为自己争取到更多的开发者用户。
著名财经金融评论员余丰慧对科技新知表示,“大模型公司如百度智能云等推出‘特别搬家计划’,不仅是为了抢占市场份额,也是在展现其技术支持和服务能力,有助于快速建立用户信任。”
实际上,早在 618 前夕,国内大模型公司就已经展开了价格战。从降价到免费,这波降价潮也体现了国内大模型行业的激烈竞争。
5 月,大模型行业开始加码性价比。发布 GPT-4o 时,OpenAI 宣布调用 GPT-4o 模型 API 的价格比 GPT-4Turbo 下降一半,处理 100 万 Token 只用 5 美元;Google 也将其主力模型 Gemini 1.5 Pro 的调用价格调低了一半,处理 100 万 Token 只要 3.5 美元。
但国内大模型公司可不是打五折这么简单,而是动辄 90% 的降价幅度。
5 月 11 日,智谱 AI 降价 80%,入门级产品 GLM-3 Turbo 模型调用价格从 5 元/百万 Tokens 降到 1 元/百万 Tokens;5 月 15 日,字节的豆包大模型对外提供服务,并将处理输入文本的价格定在 0.8 元/百万 Tokens,宣称比行业水平便宜了 99.3%;5 月 21 日,阿里 Qwen-Long API 输入价格降到 0.5 元/ 百万 Tokens;百度宣布主力模型文心一言 ERNIE Speed 和 Lite 模型免费;腾讯宣布轻量大模型 “混元-lite” 免费,最高配置的万亿参数模型 “混元-pro” 降至 300 元/百万 Tokens,降幅 70%。
“通过提供价格优惠和高质量的替代服务,这些公司不仅能够在短期内吸引客户,还有机会在长期内培养用户忠诚度。一旦用户习惯了新的服务,并发现其满足或超越了他们的期望,他们可能会长期留存。”大数据业务分析师、北京社会科学院副研究员王鹏对科技新知表示。
用低价扩大用户规模,再用服务留存用户,这是正确的思路。然而,便宜并不等于好用,在尚未跑通应用场景的情况下,国内大模型公司开始卷价格,AI 热潮下的市场焦虑极其严重。
AGI 行业面临洗牌
OpenAI 停服,国内大模型公司反应迅速,意味着市场将极速调整。
API 即应用程序编程接口(Application Programming Interface),应用开发者等企业用户可通过接入 OpenAI 的大模型服务,在各类应用软件中植入 ChatGPT 机器人的 AI 能力,将一个普通软件升级为 AI 应用。
因此,OpenAI 停止对中国的 API 服务,直接冲击了不具备自研大模型能力的大模型开发商。目前,他们可以使用海外服务器,绕开限制接入 API;否则,他们就必须选择国内其他的大模型 API。
对此,余丰慧指出,依赖 OpenAI API 的初创企业和研发团队可能会面临服务中断,影响产品开发进度和用户体验。其次,对于使用其技术进行 AI 创新的研究机构和高校,可能会阻碍相关研究项目的进展。
此外,这可能会促使行业加大对本土 AI 技术的投资与自主研发,长期看有利于本土生态的构建,但短期内可能遭遇技术替代的挑战。
6 月 26 日,360 集团创始人、董事长@周鸿祎在微博发布视频称,他认为“OpenAI 对中国地区停止服务,只能加速中国自己大模型产业的发展,未必是坏事”,他解释道,“OpenAI 的 API 无法调用,这逼着国内应用只能选择国产大模型,而国产大模型与 GPT 的差距已经逐渐缩小了。”
国产自研大模型的能力,仅次于美国,正逐渐展现出竞争力。
根据斯坦福最新公布的大模型测评榜单 HELM MMLU,通义千问 Qwen2-72B 得分为 0.824,与 GPT-4 并列全球第四。
6 月 25 日,每日经济新闻发布了《每日经济新闻大模型评测报告》(第一期),报告显示,国产大模型正在全面赶超海外大模型。
零一万物 Yi-Large 成为最大“黑马”,在“财经新闻标题创作”“微博新闻写作”“文章差错校对”“财务数据计算与分析”四大应用场景的总分排名第一。幻方求索 DeepSeek-V2、百川智能 Baichuan4 则在“财务数据计算与分析”场景显示出强大的数据计算和分析能力。而一直备受各界推崇的 GPT 4.0 在本次评测中表现不佳,甚至在“财经新闻标题创作”场景中排名垫底。
事实上,在中文语境中,国内自研大模型展现出了显著的优势,特别是在处理中文自然语言任务方面,这些模型能够更好地理解和生成中文内容,从而在中文问答、对话、翻译等任务中表现出色。
例如,腾讯混元大模型,作为腾讯全链路自研的通用大语言模型,其参数规模超过万亿,展现了卓越的中文理解与创作能力、逻辑推理能力以及可靠的任务执行能力,其 AI 助手 App 腾讯元宝即展现了强大的 AI 能力和丰富的应用场景。
此外,中国的大模型更加注重图像、视频等多模态数据的研究,展现出强大的适应性和泛化能力。
近日,智源研究院院长王仲远在接受网易科技采访时指出,“(AI 行业)基础模型依然亟待突破,整个国内的大模型依然处在赶超 GPT3.5 的阶段。国内大模型在中文的语境下已经开始能够接近逼近 GPT4,但是 GPT4 也在不断研发新版本,所以依然处于追赶的局面。”
国产大模型创新路
摈弃 GPT,走向全面自研,这对于国产大模型来说,这是一条真正创新的道路。
实际上,去年 12 月,OpenAI 公司就已经暂停字节跳动访问 API,而这是因为,字节跳动使用 OpenAI 的技术来帮助开发自己的人工智能大模型。根据第一财经报道,字节跳动承认,公司 2023 年初开始探索构建大模型,有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中。
无独有偶,去年 11 月,零一万物也被传出套壳消息,其回应媒体称,在训练模型过程中,沿用了 GPT/LLaMA 的基本架构,但需要说明的是,借鉴架构并不能跟“套壳”或者“抄袭”直接划等号。
过去,国产大模型的自研之路,或多或少都借鉴了 OpenAI 等国外大模型的技术,这是不可否认的事实。
“随着外部竞争的减少,国内 AGI(通用人工智能)行业或将进入一个加速整合与创新的阶段。”
余丰慧指出,企业间的竞争将更加聚焦于技术突破、应用场景的拓展以及用户体验的优化。头部企业可能会加大研发投入,推动算法模型的迭代升级,力求在性能上超越国际同类产品。
王鹏也表示,OpenAI 的停服,将加速国内 AGI 行业的技术创新。为了减少对外部技术的依赖,国内企业需要加大研发投入,突破技术壁垒,开发出更高效、更智能的大模型。
目前,随着算法和算力等技术提升,国产大模型正纷纷进入万亿参数时代。现阶段,从算法创新到数据端比拼,国产大模型跟国际水平仍有一定差距。
从技术路线看,国内大模型不具备原创理论支撑,研发以追随海外先进成果为主。例如,人工神经元模型、知识图谱、深度学习框架、Transformer 架构等开创性技术,大多由美国科学家提出。
从全球范围来看,中文语料库跟英文数据集的差距不容小觑。受制于搭建数据集较高的成本以及尚未成熟的开源生态,国内开源数据集在数据规模和语料质量上相比海外仍有较大差距,数据来源较为单一,且更新频率较低,模型的训练效果受限。
技术攻坚后,推动场景应用落地,发挥商业化的价值,也是国内 AGI 行业需要前进的方向。随着 OpenAI 的退出,外狼”正在减少,国产大模型行业需要走出自己的新道路。