国思软件 - 喜马拉雅音频大模型亮相，AI赋能内容创作者

　　9 月 19 日，2024 云栖大会在杭州云栖小镇开幕，此次大会以“云启智跃，产业蝶变”为主题，吸引了众多前沿技术企业展示 AI 时代云上创新的潮流科技。喜马拉雅珠峰 AI 音频多模态大模型亮相云栖大会，在“人工智能+”主题馆吸引众多市民驻足围观体验。

　　AI（人工智能）已经在深刻影响着我们的生活，也影响和改变着内容创作行业。作为在线音频头部企业，今年成立 12 年的喜马拉雅以科技赋能文化，围绕音频建立了一个丰富多元的“声音宇宙”，截至 2023 年 12 月底，喜马拉雅已经累积了包含 459 个品类的 4.88 亿条音频，总内容时长超过 36 亿分钟，能满足用户从-1 岁到 100 岁不同年龄阶段的不同需求。

　　喜马拉雅从成立之初就十分重视技术投入，特别是布局 AI，将 AI 技术突破作为平台发展和演变的主要驱动力，以便能在不断变化的数字环境中提高自身运营效率及满足用户需求。

　　在 2024 云栖大会上，喜马拉雅展示了“珠峰 AI 音频多模态大模型”（简称“喜马拉雅音频大模型”）的强大功能、应用场景及商业化案例。据悉，“珠峰 AI 音频多模态大模型”是喜马拉雅自主研发的 AI 音频生成大模型，依托其超百万小时的自有版权音频数据进行深度学习与训练，具备情感输出、自然表达、语种互译、极速克隆等技术能力，并在音频生成领域实现了多维度突破，正广泛应用于有声书等领域，未来将不断推动音频大模型行业的创新与发展。近日消息，喜马拉雅音频大模型已成功通过国家备案。

　　基于“珠峰 AI 音频多模态大模型”，喜马拉雅在云栖大会展示了“珠峰 AI 创作服务平台”：珠峰 AI 音视频创作平台，依托通义文本大模型对文本内容语义的深度理解，打造珠峰 AI 音频大模型，结合喜马拉雅独有的全品类音色库和数字人大模型，为创作者提供高品质的 AIGC 音频和数智人服务。用户可以在“珠峰 AI 数智人平台互动体验区”体验 AI 为声音创作带来的变革，比如极速体验全领域多品类 535 种 AI 音色库生成全品类 AIGC 音频内容、15 秒真人数智人形象快速定制、10 秒声音极速克隆（不单音色克隆，更包含韵律、腔调、口吻等“语流”信息）等等，感受 AI 高效便捷地赋能内容创作者。

　　AI 正在深刻赋能和影响着喜马拉雅的发展。数据显示，2023 年喜马拉雅全场景平均月活跃用户达 3.03 亿。截至 2023 年 12 月，喜马拉雅平台 AIGC 内容达 2.4 亿分钟，占其音频内容的 6.6%。同时，喜马拉雅移动端平均月活跃用户的 AIGC 渗透率已达 14.8%。

　　据了解，喜马拉雅音频大模型具备“产模一体生态系统、持续进化的生态飞轮”的模型优势，已广泛应用于内容创作、数智分身、语音交互等场景，并已实现商业化。

　　上游新闻记者马亮

喜马拉雅音频大模型亮相，AI赋能内容创作者

我们的产品

相关链接

关于我们

联系我们