PPTV创始人姚欣AI再创业,“分布式推理”终于有人做了

  克雷西发自凹非寺

  量子位公众号 QbitAI

  这个月,PPTV 创始人姚欣再次站到了聚光灯下,组织了一场分布式云计算论坛,向外界揭开了他的新篇章。

  姚欣的第二次创业,瞄准了云服务,要打造 AI 时代的基础设施。

  但姿势独特:公司没有自建 IDC 和购买 GPU,而是通过独特的方式成为了全国最多节点的云服务商

  成立六年来,PPIO 派欧云已获三轮共 4 亿元的融资,包括百川智能创始人王小川、迅雷创始人程浩、前微软 Azure 中国总裁申元庆在内的 19 位 CEO 都参与了天使投资。

  姚欣,曾是互联网视频时代的开拓者,2004 年,他在华中科技大学读研时辍学创业,发明了 P2P-Streaming 协议,创办了覆盖全球 4.5 亿用户的视频平台 PPTV,比 YouTube 还早 1 年

  PPTV 在 PC 时代创立,移动互联网早期就迅速崛起,2012 年位列中国视频网站用户规模第 2 名。然而,2014 年,姚欣将 PPTV 出售,似乎淡出了公众视野。

  姚欣重回到公共视野的当下,我们不禁想问,在市场接近饱和的环境下,为何姚欣坚持要选择云服务赛道?又因何受到投资者如此青睐?

  一方面,时势造英雄,2020 年 Gartner 开始推崇的分布式云概念,给了姚欣这个“分布式信徒”难得的发展机遇

  另一方面,英雄造时势,姚欣也前瞻性地选择跳过训练算力业务,全部聚焦发展分布式推理算力,下注 AI 应用普及对于推理算力的巨大需求。

  当分布式计算遇见 AI Infra

  要理解姚欣的再创业,可以先从这样的具体案例中感知——

国内某 Top3 小说推广 APP,开始为创作者提供 AIGC 生图功能,吸引了更多的作者和读者。

  AI 技术带来的流量增长自然是一件好事,但与此同时带来的运维压力也陡然上升。

  而且随着这样的新功能被更多人所熟知,后台服务器性能也遇到了瓶颈,高峰时期生成速度明显变慢的情况开始逐步显现。

  在过去,解决的方式简单粗暴——扩容,但一味地选择这种方式,实际并非长久之计,不仅代价高昂,而且在面对不确定性增长时显得力不从心。

  而 PPIO 的分布式架构,就是针对这种场景和痛点而生。

  这不仅是一种技术选择,更是一种为未来打下基础的架构方案。

  它打破了传统集中式架构的瓶颈,不仅为企业大幅降低了运维压力,还将系统的处理效率提升到了一个全新的高度。

  △PPIO CTO 王闻宇介绍派欧算力云产品

  利用 PPIO 提供的 AI 推理平台,免去了自行部署后台服务的繁冗过程,通过 API 即可调用服务,不再需要自行运维,成本直接减少了 40%

  速度方面,得益于 PPIO 庞大的分布式算力网络,网络拥堵现象大幅降低。

  据了解,采用 PPIO 服务后,该小说 APP 的平均生图时间从 10 秒缩短到了 2 秒,生产效率提升了 50%

  姚欣还介绍,如果海外 AI 应用使用其推理服务,能够获得比硅谷还要高的综合性价比。

  这得益于 PPIO 遍布全球的分布式云服务网络,无论用户身处何地,总能找到近距离的算力节点,获得 20 毫秒级的低延迟体验。

  姚欣选择分布式推理并非偶然,而是基于他多年对整个行业的深入理解。

  根据 TIRIAS research 的研究,随着 AI 的快速发展,未来算力需求的构成将发生重大变化,95% 的算力需求来自推理,训练算力仅占5%。推理将逐渐成为 AI 计算的核心

  姚欣看准了 AI 时代算力结构转型的机遇,将重心放在推理侧。

  推理计算的核心在于实时处理用户请求,低延迟和高效率是它的生命线。

  而分布式技术,恰恰是实现这一需求的不二之选——

  通过将推理计算分布到全球多个节点,PPIO 能够最大限度地减少到用户的时延;

  同时根据不同区域的需求波动智能调度算力资源,确保全局计算效率始终保持最佳状态。

  分布式推理不仅是一次技术创新,更是一种新的商业模式,让中小企业和开发者不再为算力门槛所困,让他们也能走进 AI 世界。

  相比之下,传统的大型数据中心虽然具备强大的处理能力,但其成本高昂,不仅包括硬件设备的购置和系统维护,还包括高度集中带来的大量散热能耗的需求。

  分布式云通过调度分布在全国各地的中小型数据中心或边缘计算节点,充分利用当地高性价比能源和算力资源,降低总体运营成本。

  当然,姚欣还提出了“三年内降本 1000 倍”的期望,要想成功实现,除了庞大的分布式算力网络,还要有更多创新技术的支撑。

  为此,姚欣给出了他的答案——Serverless 弹性调度和推理加速优化

  其中,Serverless 架构被用来解决跨区域服务过程中节点数量庞大、用户请求复杂的问题。

  该架构通过智能整合分布式算力,自动实现弹性伸缩与按需付费。

  用户可将自有镜像或模型托管到该平台,不用再担心海量用户的并发响应问题,亦无需亲自管理和维护大量算力服务器。

  △派欧算力云 Serverless 产品自动弹性触发时延和单实例冷启动速度

  除此之外,PPIO 还通过算法、系统和硬件的协同创新,推出了针对大语言模型特点的推理加速引擎。

  借助全链路 FP8 量化、KV Cache 稀疏压缩算法,以及投机采样等技术,显著提升了推理的加速性能,打破了显存、算力和带宽的限制,释放了大模型推理的更大潜能。

  此次的分布式云计算论坛,标志着姚欣的第二次创业取得了阶段性的成功。

  这背后除了有姚欣自己对行业的独到见解,还有分布式云自身与云服务发展形势的契合。

  分布式云的天时地利

  在国内的云服务领域,有很多我们耳熟能详的选手,华为、百度、腾讯、阿里等众多互联网大厂,都拥有自己的云服务产品。

  但这些云服务无一例外都采用了集中式的方式,更加衬托出了姚欣做的分布式云系统的别具一格。

  不过,姚欣强调,分布式与集中式并非对立的选择,而是相互补充的合作模式

  技术上看,PPIO 采用了集中式云服务也在用的基于 K8S 技术的云原生架构,能够与集中式云进行标准的互联互通

  商业模式上看,用户也不会过度关注自己的产品究竟运行在哪种云,他们更在意的,是最终的运行效果。

  归根结底,究竟应该采用哪种运算方式,取决于具体的应用场景。

  在竞争与合作共存的格局当中,分布式云的独特优势在于,它能够解决集中式云难以应付的需求

  随着 AI 新应用的大量落地,产生了大量的实时数据计算和海量 IO 吞吐,AI 带来的新算力需求以超越摩尔定律的方式不断膨胀。

  正是这些大量实时计算需求的涌现,让传统的集中式算力中心显得捉襟见肘,但这真的是因为算力总量不够用吗?

  答案是否定的。

  据统计,我国有 47%,也就是将近一半的算力都处于闲置状态,未被充分利用。

  造成这一现象的核心原因,是算力需求与供给的不匹配。数据中心和超算中心的建设过于超前,但数据产生地与算力节点往往相距甚远,造成了算力不足的表象。

  所以,算力唯有“去中心化”,下沉分布到网络侧边缘,才能解决时延和海量数据 IO 吞吐问题。

  PPIO 做的就是这样的工作,其本身不生产算力,而是作为空闲算力的“搬运工”和“指挥员”,解决算力时空分布不均、利用效率低下的窘境。

  当然,姚欣的愿景不仅限于当前的云服务,他提出了算力发展的三条曲线,目前已经基本建成的,是其中的前两条——边缘云(红色)和算力云(绿色)。

  去年,PPIO 更是根据这两条“曲线”,将公司的业务线拆分成了两个事业部。

  而“第三条曲线”,则是实现各个组织机构间,力资源的实时调度和自由交易

  姚欣认为,从技术角度看,业界已经有能力实现这种模式,但在产业共识和商业模式上,还需要参与者的共同努力。

  但就像从云计算诞生之初,人们都不相信公有云,到后来公共云服务逐渐成为主流一样,这种“算力共享”也将经历一个形成共识的过程。

  而之所以选择这条与众不同的创业之路,源自姚欣丰富的创业经历与技术信仰。

  创业者姚欣:立志把分布式技术写进教科书

  公众眼中的姚欣有很多标签:大学创业、网络电视、互联网、投资人等。

  然而,常常被忽略的是,他在技术方面同样拥有着深厚的积淀

  事实上,姚欣自从高中时起就是一名学霸。

  他曾连续两年获得全国奥林匹克计算机竞赛一等奖,1999 年被保送进入华中理工大学(现在的华中科大)。

  也正是在大学生涯之中,姚欣接触到了分布式计算这个概念——他的老师金海教授(华中科技大学教授,中国计算机学会副理事长),正是将这一概念带入中国的第一人。

  金海教授早在 2002 年就开始负责中国教育网的网格计算(分布式计算的一种)建设,2007 年也是第一批从事虚拟化和云计算研究的科研专家。

  一直到现在参与设计国家提出的“东数西算”和算力网络,是中国分布式计算领域的领军人物。

  当时,金海教授就跟姚欣讲了算力大众化的愿景:

当有一天网格(当时的叫法)足够分布的时候,我们每个人用算力就像用电用自来水一样,随时随地接上插头、打开水龙头就可以使用到。

  金老师所描绘的技术普惠理念深深影响了姚欣,并植入了他的创业初心。

  除了金海教授让姚欣接触到了分布式计算,姚欣的创业的另一大源动力是他对身边事物的观察。

  姚欣读大学时正值 2002 年世界杯,在校园中观看足球比赛就成了一个火热的需求。

  其间,姚欣发现了一个不寻常的现象——

  像 HTTP、FTP 这样的传输协议,用的人越多速度也就越慢,但如果用 BitTorrent 这种 P2P 的传输方式,用的人越多,速度反而越快。

  网格计算需要连接很大的计算节点,但可以整合每个人电脑的上行带宽,构建一个分布式的存储和传输的网络,提供基于 P2P 技术的网络电视服务。

  这一想法促使姚欣创建了 PPLive(PPTV 的前身),起初 PPLive 只是一个简陋到没有界面的学生作品,但是很快就获得了过亿的下载量。

  PPTV 的成功,毫无疑问依赖于技术优势。相比(当时的)优酷、土豆等竞争对手,PPTV 的视频处理成本仅为其1%。

  后来,卖掉了取得成功的 PPTV 后,姚欣开始重新思考自己的未来目标。

  他不再满足于“一人的成功”,而是想将其转变为“众人的成功”,希望通过聚集更多人的力量来实现改变生活的技术创新。

  从视频行业中暂时淡出的姚欣,也始终未曾远离分布式计算的技术愿景——

  在 PPTV 的成功背后,正是他对资源整合和计算效率提升的深刻理解,而这些理念也是他对分布式计算长久关注的理论基础。

  这也直接推动了他后续的技术创业选择,并在分布式推理领域的发展中得到了实践。

  在姚欣看来,创业者最重要的,不是随大流,不是去模仿,而是要有足够的差异化和独特竞争力

  所以即使在今天看来,PPIO 选择的分布式赛道,依然如同 PPTV 一样,显得十分“另类”而新颖;

  自己不建大型数据中心,而是整合利用大量的闲置数据中心,这种商业模式也是独树一帜。

  从 P2P-Streaming 到分布式推理,姚欣的创业路径看似从互联网内容平台转向了技术基础设施,但实际上,这两者本质上是一脉相承的

  姚欣始终在探索如何通过网络的集体力量提升效率、降低成本,并以分布式技术为基础,解决计算中的瓶颈问题。

  如今,他将同样的理念应用于 AI 推理领域,专注于解决算力供需不平衡的问题。

  走到今天,姚欣的志向已经不只是把企业做大做强,而是希望能够开创出具有时代意义、能够被写进计算机教科书的技术

  正是出于这一理想,PPIO 聘请了金海教授担任公司技术委员会主席。

  金海教授将为公司技术团队提供深入全面的指导,将分布式云技术边界进一步拓展,推动更多应用的落地,让更多创业者轻装上阵

  One More Thing

  在刚刚结束的 2024 分布式云计算论坛上,PPIO 除了推出了 AI 算力云产品外,还联合 PingCAP、Zilliz、AscentStream 和 CSDN,共同启动了“Pioneers AI 初创加速计划”

  面向 AI 初创企业和开发者,提供包括分布式算力、分布式关系型数据库、分布式向量数据库、分布式消息队列、开发者社区等全面的资源和技术服务,助力初创团队在分布式云上实现快速成长,加速其创新成果的落地。

  正如姚欣在分布式云计算论坛上说的那样,他的终极目标不仅是推动分布式云成为广泛应用的技术标准,更是通过持续创新,帮助更多企业和开发者在 AI 时代中获得成功

我们站在 AI 时代的门槛前,正在见证一批又一批满怀梦想的开拓者纷纷涌现。

  正如当年那个 24 岁的姚欣一样,他们需要的,不仅仅是资金和技术,更需要来自同路人、来自先行者的经验和鼓励,就像当年的金海教授一样。

  现在,轮到了我们承担起这样的使命,用分布式的力量,做新一代应用的基础设施,支撑起新时代的开拓者砥砺前行!

  “Pioneers AI 初创加速计划”入口:

  https://www.ppio.cn/campaign/ai-pioneers