百万年薪职位,千亿美元赛道,AIGC大爆发我能怎么赚钱?

  新智元报道

  编辑:Aeneas 好困

  AIGC 火爆出圈,搅动了全球市场。有机构预测,2030 年的市场规模将达到 1100 亿美元。而反应快的玩家,已经在布局这个赛道了。

  整个 2022 年,AIGC 火成了现象级的词汇。

  到了今年,更是有人靠着 AIGC 拿到了百万年薪。

  除此之外,小扎在自家平台上官宣,Meta 将组建顶级 AI 团队,All in AIGC。

  马斯克那边也传出消息,据说正忙着 DeepMind 挖一位叫 Igor Babuschkin 的大佬,成立 AI 实验室,开发 ChatGPT 的「替代品」。

  大厂纷纷入局,AIGC 实火。而它背后,是一个几年后千亿美元的市场。

  万物皆可 AIGC

  去年,红杉资本就在研究报告中指出,到 2030 年,文本、代码、图像、视频、3D、游戏都可以通过 AIGC 生成,并且达到专业开发人员和设计师的水平。

  到了今年,我们眼睁睁地见证了这一预测逐渐成真。比尔盖茨说,聊天机器人等 AI 新技术的出现,意义不亚于个人电脑和互联网的诞生。

  美国银行认为,到 2030 年,AI 利用数据的能力会使世界经济增长高达 15.7 万亿美元,而全球的人工智能市场到 2026 年可能达到 9000 亿美元。

  根据商业咨询机构 Acumen Research And Consulting 预测,若考虑下一代互联网对内容需求的迅速提升,2030 年 AIGC 市场规模将达到 1100 亿美元。

  那么,AIGC 的商业落地何以成为可能?

  其实,靠的都是底层技术的突破。最开始,传统的 AI 绘画采用的是 GAN,但结果输出效果不敢恭维。直到 2021 年,OpenAI 团队开源了深度学习模型 CLIP,以及 7 月出现的 Diffusion,AI 产生图片和文字的效果才有了大的飞跃。

  2022 年 4 月,OpenAI 发布的 DALL-E 2 生成的人像和图片已经效果惊人,而到了 8 月,Stability AI 发布的 Stable Diffusion 模型,更是取得了质的突破,AIGC 的作品,已经完全可以媲美专业画师。

  击败人类获得艺术大奖的 AIGC 作品《太空歌剧院》

  而在 AI 生成视频方面,Meta、谷歌已经纷纷发布了模型。

  去年 9 月,Meta 发布了 AI 生成视频工具 Make-A-Video,具有文字转视频、图片转视频、视频生成视频三大功能。

  谷歌也紧随其后,发布了 Imagen Video 和 Phenaki。其中 Phenaki 可以通过文字生成一段情节完整、连贯的视频。

  B 站 up 主「秋之雪华」发布的《夏末弥梦》,是全球首个由 AI 绘制、AI 配音的动画,一经发布就震撼了广大网友。

  来源:秋之雪华

  AIGC 商业化的潜力如此之大,但究竟有哪些落地场景呢?

  从融资角度来看,目前 AIGC 有 3 个商业化的方向:

  • 第一个方向是通过 AI 生成文字,比如自动写邮件和文案。

  • 第二个方向是利用 AI 生成绘画,主要技术是结合多模态神经语言模型 CLIP 和图像扩散模型 Diffusion,仅需提供一些关键字描述即可。

  • 第三个方向是 AIGC 的底层技术模型开发,Stable AI 是这个方向的顶流之一。

  而这些方向,都可以指向丰富的应用场景,其中非常有代表性的领域,就是游戏、电商、广告传媒。

  游戏

  开发游戏周期长、成本高,通常需要花费几年时间和上千万资金,好在 AIGC 可以极大提高游戏的开发效率。

  具体来说,游戏中的剧本、人物、头像、道具、场景、配音、动作、特效、主程序未来都可以透过 AIGC 产生。

  AIGC 的加入,让游戏开发者的所需的时间和成本大幅降低。根据竞核对一位开发者的采访,现在为一张图片生成概念图的时间,已经从 3 周下降到了 1 个小时,减少了 120 比1。

  现在,他们只需要画出动画的轮廓,然后由成本较低的 AI「画师」大军完成耗时的工作,为动画胶片上色、填充线条即可。

  甚至,已经有游戏开发商开始让玩家通过 AIGC 自己创建头像。玩家只需要自己描述,就能生成头像的图片。

  在关卡设计上,AIGC 工具可以瞬间生成一个 1920 年艳舞时代的纽约的世界,或者是神秘的刀锋战士式的未来,或者是托尔金式的幻想世界。

  根据 AIGC 在文字和图像方向的推进速度,以上应用在五到十年之内应该可以实现。

  现在,已经有不少游戏大厂开始着手开发 AI 作画、NLP 等大模型了;而中大型游戏厂商则积极接入已有大模型,为游戏生成流程打造专属的小模型。

  电商

  当前,随着数字技术的发展和应用、消费模式的转变和升级,沉浸式购物体验将逐渐成为电商领域发展的新方向。

  AIGC 正可用于商品三维模型、虚拟人主播乃至虚拟货场的构建,通过和 AR、VR 等新技术的结合,实现视听等多感官交互的沉浸式购物体验。

  比如,基于商品在不同角度下拍摄的图像,利用视觉算法,就可以生成商品的三维模型和纹理,让客户可以在线上进行虚拟观看、试穿等行为。

  根据电商平台数据显示,三维购物的转化率平均值约为 70%,较行业平均水平提升了九倍左右。

  广告传媒

  另外,AIGC 作为新型的内容生产方式,可以为媒体的内容生产全面赋能。

  比如 AI 可以基于算法自动编写新闻,帮助媒体更快、更智能化地生产内容;AI 还可以通过视频字幕生成、视频锦集、视频拆条、视频超分等智能化剪辑工具,帮助我们实现智能视频剪辑。

  而在新闻播报中,已经出现了越来越多的 AI 合成主播,新华社、中央广播电视总台、人民日报社等媒都推出了「新小微」、「小C」等虚拟新闻主持人。

  AI 手语主播在与央视新闻主播朱广权进行互动

  在传媒领域,AI 绘画、AI 合成视频、AI 文字创作等工具,都将大大提高创意素材的生成效率。

  可以看到,AIGC 产业生态的加速,会带我们走向「模型即服务」的未来。

  目前,AIGC 的应用主要在三大层——基础层、中间层、应用层。

  • 基础层主要是由预训练模型的技术投入,主要代表为上游基础设施提供方如 Open AI、Stability AI 等;

  • 中间层是垂直化、场景化、个性化的模型和应用工具;

  • 应用层即面向C端的用户的文字、图片、音视频等内容生成服务等。

  初创公司的三大挑战

  可以说,AI 绘画、AI 聊天等 AI 服务能力强大的背后,离不开预训练大模型的支持。

  然而,大模型就意味着更高计算资源以及高效的平台进行训练和推理。据报道,ChatGPT 的训练使用了成百上千张 GPU 卡,单次训练成本 450 万美金,整体训练成本高达 1200 万美金。

  甚至,对于那些想要入局的新玩家来说,更是有三个挑战不得不去面对:

  • 前期投入大

  数据、算力、算法是驱动 AIGC 发展的三驾马车,要实现 AIGC 的发展,这三者缺一不可,但每一项的发展,都需要企业投入大量的资金,尤其是前期的硬件投资更是占企业投入资金的大多数。

  • 算力要求高

  从 AI 生成图片到 AI 生成视频要用到大量数据训练模型,对算力要求呈指数级的提升,同时也需要快速高效的方式来处理数据集。

  • 缺乏成熟的算法模型

  市场上模型过多,缺乏被广泛验证的成熟模型,模型的好坏及算法调优的经验决定了产出内容的质量。

  即便是以 AI 绘画走红全球的新晋独角兽公司 Stability AI,也是如此。

  2022 年 8 月,由 Stability AI 推出的开源 AI 模型 Stable Diffusion,可以说是 AI 图像生成发展过程中的一个里程碑。

  借助这一模型,任何人只需要提供一段文字描述,就有机会创作出任意风格的绘画作品。不仅如此,对于开发者来说,Stable Diffusion 的运行速度也非常快,并且有资源和内存的要求也很低。

  然而,想要训练这类机器学习基础模型,却不那么容易。因为你不仅需要一个具有数千张显卡的高性能计算集群,而且还需要能有效利用该集群的软件。

  据报道,Stable Diffusion 这样的模型训练起来也非常困难,需要使用超过 5400 个 NVIDIA A100 GPU 训练,共花费 15 万个 GPU 小时,仅训练模型就花了 60 万美元。

  为了解决这一问题,Stability AI 在 2022 年 11 月的时候正式宣布,选择亚马逊云科技作为首选云计算供应商。

  在 Amazon SageMaker(AWS 的端到端机器学习服务)及其模型并行库的加持下,Stability AI 的模型训练时间和成本减少了 58%。

  与此同时,通过使用 SageMaker 托管的基础设施和优化库,Stability AI 能够使其模型训练具有更高韧性和性能。这些优化和性能改进适用于具有数百或数千亿参数的模型。

  无独有偶,美国明星 AI 创企 Hugging Face,最近也将自己的开源工具集成进了 Amazon SageMaker。

  如此一来,不仅可以帮助 Hugging Face 加速构建生成式 AI 应用的大型语言模型和大型视觉模型的训练、微调和部署,而且也让云计算客户可以针对特定用例进一步优化其模型的性能,同时降低成本。

  综上所述,我们不难看出,AIGC 大模型的训练和推理,往往是需要强大的「AI 软件工具和平台」的支持的。

  为何做出如此选择?

  在这场热潮中,亚马逊云科技从未缺席。

  据了解,亚马逊云科技目前已经联合了相当多的行业客户,共同探索 AIGC 的落地场景,并尝试打造可商业化和可复制的行业应用案例。

  作为全球最大的公有云供应商,亚马逊云科技于 2017 年在 re:Invent 全球大会上推出了全球首个用于机器学习的集成开发环境(IDE)Amazon SageMaker。

  借助这项完全托管的机器学习服务,开发人员、数据科学家、还是商业分析师都能够快速、轻松地准备数据,并在规模上构建、训练和部署高质量的机器学习模型,然后直接将模型部署到生产就绪托管环境中,大大降低了机器学习的使用门槛。

  在 IDC 评估的 8 家供应商中,亚马逊云科技凭借其机器学习旗舰产品 Amazon SageMaker 强大的功能、不断提升的交付能力以及在保持开源方面的领先优势,被 IDC 列入「领导者」阵营,并居于图中最高最远位置。

  来源:IDC

  具体来说,亚马逊云科技具有以下优势:

  • 计算资源丰富

  户无需前期硬件投入,即可随时使用。

  • 自研芯片性价比高

  自研的 AI 加速芯片 WS Trainium 和 AWS Inferential ML,在提供高性能解决方案的同时,还可为用户节省高达 50% 的训练成本,以及 70% 的推理成本。

  • 超大规模工作负载时成本最优

  用户可以在 Amazon SageMaker 中使用托管式 Amazon EC2 Spot 实例轻松训练机器学习模型。与按需实例相比,使用托管的 Spot 实例可以将成本优化高达 90%。

  • 拥有广泛验证的算法模型

  Amazon SageMaker JumpStart 提供了 350 多种内置算法、预训练模型和预构建的解决方案模板。 不仅有着 Stable Diffusion 和 Bloom 这两种最先进的模型 ,同时还提供如 TensorFlow、PyTorch、Hugging Face 和 MXNet 等 SOTA 的开源模型,并且可以实现一键部署。