出品|网易科技《智见访谈》
作者|赵芙瑶
编辑|丁广胜
云计算时代以来,云数据库以高可靠、高可用、高性能,高弹性、自动化智能部署与运维等优势,对传统数据库市场发起冲击。云原生数据库作为一种新型数据库技术,逐渐在国内外市场崛起,引领了行业的发展趋势。当前,云原生数据库已成为越来越多企业和开发者的首选。
与此同时,人工智能、5G 技术、ChatGPT 的发展也为云原生数据库带来了新的机遇。越来越多的数据库厂商开始将人工智能技术融入云原生数据库,以实现智能化数据处理。这些技术的应用能够帮助企业更高效地处理数据,提高数据处理质量,降低成本,从而为企业带来更大的竞争优势。
在这一大背景下,以 PolarDB 为代表的阿里云瑶池数据库正积极推进“云原生+一站式”的数据管理与服务。那么 AI 将为数据库带来哪些“质变”?AIGC 又将给数据库带来哪些挑战?PolarDB 如何与其他技术进行深度结合?此次网易科技深度对话阿里巴巴集团副总裁、阿里云智能数据库事业部总负责人李飞飞,探寻其对未来云数据库领域的展望以及战略考量。
深度解读“四化”与“四做”
网易科技:阿里云此次反复提到“四化”的概念,您认为在数据库行业,新“四化”的发展趋势是怎样的?对开发者有怎样的意义?
李飞飞:提“四化”是因为它带来了正向冲击和变化,类似于中国改革开放 40 年前的“四个现代化”。在数据库领域,各方面看似不同,但本质相似。云计算和数据库领域面临关键、重要且具有巨大机会的转折点。我们提出“四化”概念:云原生化、平台化、一体化、智能化,这不仅仅是从阿里云瑶池数据库的角度提出,而是站在整个云数据库赛道上思考。
首先是云原生化,现在应该没有人质疑数据库向云原生化演进的必要性和现实紧迫感。例如,存储计算分离技术、存储池化、计算池化等,这些都是云原生的具体表现。
其次是平台化,这意味着构建一个具有多个引擎的平台,提供一整套一站式能力和解决方案。平台化能降低边际成本,实现商业效益。平台化还要求支持标准 API,以适应未来人机交互、机器与机器交互的趋势。
第三是一体化,基于平台化的基础上,打破数据孤岛,实现 TP、AP、NoSQL、大数据 PaaS 之间的一体化。包括离在线一体化、处理分析一体化、多模数据一体化和集中分布一体化。客户无需再关心什么时候使用集中式或分布式数据库,数据库应自动在两者之间切换和转化。
最后是智能化,AI 可用于数据库运维,如异常检测、HA 切换、参数调参等。同时,数据库也可为 AI 服务,例如在 PolarDB 中使用自然语言进行查询。今年下半年,我们将正式发布 PolarDB 全新接口。
简而言之,“四化”指的是云原生化、平台化、一体化和智能化,我个人认为,今天想在数据库这么竞争激烈的赛道上走到下一个春天,接下来必须全面拥抱“四化”,不拥抱“四化”的厂商是没有任何机会的,阿里云瑶池数据库肯定会全力以赴做“四化”,我们也提到是“四做”,做深基础、做强核心、做精场景、做好体验。
AIGC 为数据库带来新的挑战
网易科技:未来操作数据库的还是程序员吗,还是谁都可以来操作数据库?
李飞飞:今天早上 CTO 提到了一个核心理念:以算力为基础,以数据为核心,以技术为牵引。算力服务化就是将计算能力变得像电力一样普及,云计算正是实现这个目标的关键。将独立服务器整合到一个或多个 IDC 中,像超级大电脑一样统一调动资源。
第二点是以数据为核心。算力服务化之后,没有数据,这些算力就毫无意义。数字化已经基本完成,接下来的任务是实现物理世界和生物世界的数字化。数据库在这个过程中扮演着至关重要的角色。
最后是以智能为牵引。我认为这句话可以改为“以智能为裂变”。数据为基础,结合代表性的人工智能技术,如 ChatGPT 和多模技术,实现数据和智能的核裂变。数据库将成为这个核裂变过程中的关键组件之一,这是一个令人振奋的时代。核心要素是算力+数据+智能,共同构成信息化、数字化时代的核裂变,这是我对未来的预测。
网易科技:AIGC 应用近期非常火爆,您认为这种需求对数据库带来哪些挑战?我们应该如何应对?
李飞飞:我认为有三个层面。首先是运维管控层面,随着 AI 平民化,运维和调优将变得更智能化。智能调参、智能运维、高可用检测告警等方面都会与 AI 深度结合。这个趋势已经发展几年,未来一两年会加速。
其次,在数据库方面,支持 AIGC 应用的前提是能处理海量多模态数据。灵动已具备这一基础,但还需支持丰富、灵活、强大的模型导入和使用。我们要通过开放平台化方式,无缝导入第三方模型,包括开源模型和用户自建模型。为保证模型安全,用户导入的模型将放在机密容器里。结合多模态数据和第三方模型,想象空间将非常广阔。
第三,除多模态数据库外,传统结构化关系型数据库的交互方式也将变得更自然、智能。例如,我们已实现自然语言生成 SQL 的技术,并正与 PolarDB 深度结合。
5G 催生数实融合 PolarDB 实现集中分布一体化
网易科技:关于 5G 在云原生数据库和中小企业数字化转型方面的影响,您有什么看法?
李飞飞:5G 确实是个争议话题,尤其是关于 5G 应用爆发的疑问。我认为 5G 将催生数实融合,云原生数据库已成事实标准。如果 AI 在未来一两年加速演进,比如 ChatGPT,AI 也将成为事实标准,那么 5G、6G、XG 等技术需求将变得刚性。5G 尚未实现爆炸式应用的一个原因是缺乏高效智能处理数据的能力,导致下游应用无法爆发式产生,影响 5G 需求。
未来,AI 将催生物理世界和生物世界的数字化。物理世界数字化将推动 5G 发挥关键作用,例如在大厂区或运营商提供的公共 5G 网络。马斯克的星链也是 XG 的一种形态,即太空中的基站。
数据库在此过程中将扮演关键角色,支持多模态数据成为事实标准,因为宏观和微观世界数字化将产生大量数据。同时,要支持多模态数据的存储和处理,如 PolarDB+Ganos 实现对数字孪生世界的处理能力。结合 AI,我们可以看到未来五到十年将是一个波澜壮阔、令人激动的时刻。总之,随着宏观和微观世界的数字化,5G 和 XG 等技术一定会有更大的应用空间。
网易科技:分布式与集中式数据库一体化时,我们常谈论前移和兼容,站在 PolarDB 角度(基于分布式),一体化体征如何理解?是否更多关注兼容性?
李飞飞:首先,我们要理解数据库分类应该分为传统数据库和云时代数据库。在这两个类别下,又分别有集中式和分布式。云原生数据库的特点是资源池化和资源解耦,这使得集中式和分布式之间的转换变得平滑,业务无感知。
在云原生框架下,资源池化和资源解耦使得集中式和分布式数据库一体化成为可能。在这个前提下,一体化的具体表现就是集中分布一体化。此外,离在线一体化也是一种趋势,它使得客户无需关心在线和离线数据搬迁和同步等问题,平台会自动处理。
今天发布的 PolarDB 一体化就是把处理分析一体化,PolarDB 自身实现了集中分布一体化。从 PolarDB 云原生共享存储、共享状态到无共享状态,这也是集中分布一体化的具体表现。所以,一体化是指在云原生框架下,通过资源池化、资源解耦和智能化调度等技术,实现集中式和分布式数据库的无缝融合,以及在线和离线处理的统一。