生成式CAD即将到来,600亿美元市值的Autodesk正内测CAD大模型

  CAD 巨头 Autodesk 也在落地生成式 AI 了。

  截至发稿,Autodesk(US:ADSK)股票 2024 年年内涨超 20%,报 293.32 美元/股,总市值 630.64 亿美元。

  "我们正在开发与任何模型都不同的生成式 AI 基础模型。"Autodesk 执行副总裁兼首席技术官 Raji Arasu 近日在出席一场公开活动时表示。Raji Arasu 所说的基础模型,即 2024 年 5 月被曝出的名为“ Be​​rnini ”的生成式 AI 项目,该项目可将文本、手绘草图等转换成 3D 文件。

  就当前的大模型市场来说,图生 3D 功能的实现似乎已经不是什么新鲜事。谷歌 DeepMind 刚刚发布的 Genie 2、国内的腾讯混元以及生数科技的 VoxCraft 等等,都可以实现类似的功能。但是作为一家全球 CAD 巨头,Be​​rnini 之于 Autodesk 的实际业务具有很大的现实意义。

  揭秘Be​​rnini 

  Be​​rnini 以 17 世纪意大利著名雕塑家和建筑师 Gian Lorenzo Bernini 命名。在训练数据的选择上,该模型由 Autodesk AI 实验室与香港中文大学合作,基于 1000 万种公开可用 3D 形状进行训练。

  之所以说 Be​​rnini 与其他基础大模型不同,是因为 Be​​rnini 在生成 3D 图像上有三大特性:

  1.  生成 3D 图像结构为功能性 3D 结构。例如生成的水壶是中空的,真正具备装水的功能,而不仅仅是生成外观相似的模型;

  2.  分离形状和纹理。能够分别生成形状和纹理,让使用者可以自由地调整变量,将它们融合在一起或进行其他设计,避免了将 3D 物体的纹理和轮廓混淆的问题;

  3.  提供多种变体。特别针对专业几何工作流进行了优化,能够从单一输入生成多个功能性的 3D 形状变体,为设计师提供选择并加速其创意工作流程。

Autodesk 使用界面

Autodesk 使用界面截图

  这其中,基础模型要实现上述特性需要克服设计、制造过程的天然障碍,即 AI 需要完全贴合设计工作输入输出的复杂逻辑。“接受多模态输入,如文本、草图、体素、点云,这些复制了创作者的设计过程。”Raji Arasu 介绍。

  此外,由于生成 3D CAD 这样的几何图形需要基于物理定律的空间和结构来进行推理,对精度和准确性也提出了较高要求。

  所以从时间上看,Be​​rnini 的推出似乎算不上迅速。自 2024 年 5 月被曝出 Be​​rnini 进展到现在,已经过去大半年。彼时,Be​​rnini 只是放出了一部分概念视频。而在 10 月份 Autodesk 在圣地亚哥举行的用户大会上,CEO Andrew Anagnost 才放出 Be​​rnini 预览版。

  但 Andrew Anagnost 表示,Be​​rnini 用公开数据进行训练,目前还不能用于商业用途,已向 AI 社区开放。但是他也披露了 Be​​rnini 可能的商业计划:“训练 Be​​rnini 的方法是不依赖于数据的,所以客户在需要的情况下,可以使用自己的数据来优化 Be​​rnini,不断改进这个模型。”

  Be​​rnini是如何“炼”成的

  Be​​rnini 的训练过程也同样使用了英伟达 GPU,但在 GPU 之外,Raji Arasu 认为训练模型更为重要的是对“数据”的处理和使用。演讲中,Raji Arasu 进一步披露了这一过程。她将构建过程分为数据处理、数据准备、兼顾成本与效率的模型训练和模型推理的复杂性管理。

  “需要处理数十亿个不同大小、形状和工作负载的对象和 PB 级数据。”Raji Arasu 表示。

  Autodesk 需要基于其海量的大型设计文件,来构建云端的数据底座,为此选择了 Amazon DynamoDB 作为主要数据库并创建了一个规范数据模型,从而能够跨数百个分区进行写入,并具备高吞吐量和近乎于零的延迟。

  在解决数据性能的基础上,Autodesk 又通过结合 Amazon EMR、Amazon EKS、Amazon Glue 和 Amazon SageMaker 等云服务轻松完成基础模型训练的数据准备流程,将大量复杂的历史数据进行了特征化、标记化和分词等操作。

  在模型训练阶段,Autodesk 也面临 GPU 选型等诸多问题,它最终使用了 Amazon SageMaker 来统一解决实例测试、基础设施管理等,团队的更多精力放在了数据准备、模型开发以及面向客户的 AI 功能开发等方面。

  在大规模模型推理管理时,需要妥善处理延迟、成本和性能表现。“Amazon SageMaker 的自动缩放和多模型端点,无缝支持实时和批量推理,实现了高吞吐量、最小延迟和最大成本效率。”Raji Arasu 表示。

  可以看到,Autodesk 构建 Bernini 的过程大量使用了 Amazon SageMaker,这是亚马逊云科技最广为人知的人工智能和机器学习服务,包括 Autodesk 在内的很多知名企业正在利用其中的 Amazon SageMaker HyperPod 进行模型训练。Amazon SageMaker HyperPod 在近期正式推出了几项重磅更新,如灵活训练计划可以创建更自动化的训练作业,通过高效利用各种更高性价比的计算资源来优化成本;以及任务治理功能,可以为不同的训练任务进行优先级排序,从而在模型训练、微调和推理过程中最大化资源利用率。

  基于这些创新,Autodesk 最终将基础模型部署时间缩短了一半。在保持运营成本稳定的同时,将 AI 生产力提高了 30%。Raji Arasu 也透露,Autodesk 已经开始向客户推出基于这些基础模型构建的 AI 功能

  “作为客户的设计伙伴,帮助他们平衡参数,如材料强度、成本,以便他们能够确定最佳设计。所有这些都是为了最大限度地减少繁琐任务,最大限度地提高创造力。”Raji Arasu 说。

  数据正确,训练大模型的前提

  ChatGPT 之后,英伟达 GPU 成为各大 AI 公司追逐的热门标的,某大型公司一年订购多少张英伟达 GPU 甚至能够成为媒体的头版头条。不过,总结 Be​​rnini 的诞生过程,GPU 固然重要,但数据决定了大模型训练的质量

  而训练一个能够真正在业务中起作用的大模型,是一个涉及多方面的全栈系统问题。

  “大模型只是生成式 AI 应用创新的一部分。生成式 AI 应用创新要做好的话,还需要其他能力的增强。首先需要确保生成式 AI 能用企业自己的数据来增强生成式 AI 应用的大模型能力。”亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松也在一次演讲中表达了类似的观点。

  就拿大模型现在备受关注的幻觉问题来说,也可以从“元数据”的角度来着手解决,即在训练大模型之前确保知识库中的数据质量。“数据库中的元数据即被审查和批准的高质量数据,有助于减少延迟,提升大模型的响应。”亚马逊云科技技术副总裁 Mai-Lan Tomsen Bukovec 表示,他提醒有正在进行大模型训练的企业,要注意分清哪些由人创建、哪些数据由人工智能生成。

  正是由于数据的重要,大模型加速了企业数据资产的变现方式。2 个月前,一家来自中国的 3D 空间设计平台酷家乐母公司群核科技也公布了新的商业计划,其面向具身智能等推出数据训练平台,开放全球最大室内场景认知深度学习数据集。这家公司披露,平台已经拥有超过 3.2 亿的 3D 模型,平均每月活跃访问者达 7780 万。该公司将面向 AIGC、具身智能、AR/VR 等企业开放物理正确的 3D 空间数据资产、空间认知解决方案以及空间智能训练相关服务。

  数据显示,约有 77% 的公司将在 3 年内增加或大力增加对人工智能和新兴技术的投资,人工智能将最先发生效率的 3 个方面分别是:Automation、Analysis、Augmentation(自动化、数据分析、辅助增强)。

  “AI 正在重塑所有行业”已经不再是一句口号。“越来越多的行业在生成式 AI 领域变得越来越积极。” 亚马逊云科技全球服务副总裁 Uwem Ukpon 表示,在生成式 AI 的行业应用领域,已从最开始的金融行业逐渐扩展各行各业,包括公共部门、传统行业、政府机构,以及生命科学和医疗等行业。与此同时,生成式 AI 也给各个企业提供了新的商业机会,Autodesk 所押注的正是基于大规模数据的生成式 CAD 这个潜力巨大的未来市场。