万物智联时代,算力已成为数字经济发展的新引擎。作为数字经济时代的新型生产力,算力正在加速融入经济社会的各个领域。
但是,我国算力产业高速发展的同时,算力的调度和使用仍然主要基于单一服务商。面对“东数西算”、大模型计算等场景,业界亟需通过算力互联互通提升算力资源综合使用效率。
6月21日,“2023算力互联互通大会”在北京召开,会上发布了北京算力互联互通验证平台二期等多项重磅成果。北京算力互联互通验证平台是全国首个算力互联互通验证平台,在北京市通信管理局委托下,由中国信通院牵头并联合中国科学院计算机网络信息中心、天翼云等单位共同成立。
(资料图片)
作为北京算力互联互通验证平台的支撑平台,天翼云算力分发网络平台“息壤” 不仅能够实现对通用算力的需求,也可以实现人工智能、超算等业务场景下对多样化算力的需求。
“息壤”是天翼云针对分布式应用、算力应用、算网融合调度等场景,自主研发的算力分发网络平台,能够对边缘云、中心云、第三方资源等全网算力进行统一管理和调度,从而构建起一个独特的“算网大脑”。由“息壤”支撑的北京算力互联互通验证平台的落地与应用,标志着算力互联网新纪元正式开启。
算力互联网三大挑战:跨服务商、跨架构、跨地域
近年来,我国算力基础设施发展成效显著。根据工业和信息化部数据显示,我国算力总规模已达180EFLOPS,位居全球第二,年增长率近30%。
不过,我国在算力技术创新、应用赋能等方面仍面临诸多挑战,主要原因是算力并不均衡。一是东西部算力不均衡;二是算力模式不均衡,我国通用计算、超算较为领先,而智算相对落后;三是拥有者不均衡,目前大部分算力聚集在少部分企业和单位中,对许多中小企业、初创企业来说,要获取算力难度较高。随着AIGC、大模型浪潮袭来,未来会有越来越多的初创企业需要智算资源,将形成更大的算力需求矛盾。
算力互联互通,则是解决这些矛盾的最好办法,既能够提升算力的利用率,又能够实现算力普惠。只有最有创造力的中小企业、初创企业掌握到需要的算力,中国数字经济才有望取得更蓬勃的发展。
在会上,天翼云智能边缘事业部副总经理鄢智勇表示,算力基础设施的发展经历了三个阶段。第一个阶段是虚拟化,以资源池为核心,第二个是云原生阶段,是以应用为核心,现在进入到第三个阶段,是以算网全域调度,也可以叫做算网云原生为代表。解决算力互联互通问题,则要打破三大壁垒,即跨服务商、跨架构和跨地域。
鄢智勇说:“ 20多年以来,人类对算力的追求始终都是理想的,算力网络的前身是网格计算,网格计算里Grid来源即是电网。所以我们对于理想算力的需求,一直希望能够像使用电力一样非常方便。算力数据中心对应的就是发电厂,算网调度对应输电、变电、配电系统,用电时直接插上插座就可以使用。我们对算力的期待也是希望能够达成这样的效果,只要把算力需求提升上去,就可以自动匹配供应,最终实现统一算力服务输出。”
为了实现算力统一,算力调度的作用非常重要。鄢智勇说:“我们参考之前互联网和电网调度都是分层的,算力调度也可以简化成两层,一层是算力互联互通,即跨服务商、跨资源池、跨地域的调度;第二层是在资源池内如何实现高效的调度,通过一个资源池能够同时提供通用算力、智算、超算混合计算模型。“
算力互联网的本质,是通过系统化的方式解决算力的需求和供给问题。“息壤”就是完成了跨资源池、跨服务商、跨地域的调度。只有打破这三大壁垒,未来算力的使用才会像电力一样,可以“一点接入、即取即用”。
天翼云让算力“无处不在”
作为云服务“国家队”,天翼云已经走过了十年科技创新之路,形成广泛资源布局和自研产品能力的双重优势,真正做到让算力“无处不在”。
从算力的维度来看,天翼云已经明确了“2+4+31+X+O”的资源布局,其中“2”是内蒙和贵州;“4”是京津冀、长三角、粤港澳、川陕渝四大区域,满足大规模、集群化、低成本的算力需求;“31”则是在31省的重点城市布局区域云;“X”则是全国多个地市以及更多的县区,按照“一城一池”的标准推进边缘云的覆盖,提供敏捷算力,承载就近接入、超低时延、数据本地化的近场级算力需求;“O”是指海外节点。通过这样的布局,天翼云可为各类用户提供高速泛在的算力。
从技术创新的角度来看,天翼云坚持关键技术全栈自研,包括操作系统、数据库和核心组件。
通过打造定制化的宿主机操作系统CTyunOS和云操作系统TeleCloudOS4.0,天翼云构建了业界领先的云网底座,突破超大规模计算管理与调度、多AZ大规模云网络服务、超大规模存储集群、多AZ大规模集群纳管与监控等多项核心技术,支持多AZ能力,让集群管理规模提升了10倍以上,使得其资源池集群管理调度能力也进入国内云服务提供商第一阵营。
作为IT基础设施领域重要组成部分,数据库是云计算技术的压舱石。随着数字化的不断深入,单一数据库已难以满足日益多元化的企业业务需求。为此,天翼云推出了自研的TeleDB云原生分布式数据库,为政企客户提供就近按需的云服务部署,以及统一的云平台管理能力,助力客户实现更加高效的数据流转与业务创新。目前,该数据库已实现了全面国产化适配,并兼容各类社区生态。
随着数据爆发式增长,计算需求不断走高,业务场景也愈加复杂化,传统以CPU为核心的计算架构已无法满足随时随地的计算需求。这样的行业现状呼唤新型高性能计算架构的产生,来推动算力普惠发展,DPU正是在这样的背景下诞生。
天翼云是较早探索DPU的云厂商。凭借在云领域的成熟技术和应用实践,天翼云在2022年推出了完全自研的紫金DPU芯片,并且以紫金DPU为基础打造了为云而生的全新一代云计算体系结构,将计算、存储、网络和安全算力迁移到完全自研的软硬结合体系中,构建了面向不同算力、全国产化自主可控的第二平面。天翼云紫金DPU全面释放算力的同时,也将对软硬件系统带来创新变革,推动千行百业的业务层数字化应用更流畅、更绿色,推动数字经济与产业高质量发展。
作为北京算力互联互通验证平台的设计方、核心建设者、资源提供者与标准制定者,天翼云基于自主研发的云操作系统、紫金DPU、算力分发网络平台“息壤”等能力,充分展现了天翼云作为云服务国家队的使命与担当,大力推进算力互联互通,为行业发展作贡献。同时,这也标志着我国在优化算力基础设施布局、结构和功能上实现了跨越式发展,是我国算力调度、算力资源服务化探索的重要一步。
“息壤”构建算力底座,加快建设数字中国
算力互联互通与算网一体化调度是解决数据高效流动、优化算力资源布局及数据流动的关键手段,也是数字中国建设的必然发展趋势。
“息壤”好比是一个算力传输的枢纽,能够在全国范围内实现每分钟数万次,每天上千万次的算力统筹和调度,满足各领域对算力的极致需求。
算力与电力调度有非常大的不同,电力是可以实现传输的,从A点传输到B点。但是算力本质上是没办法传输的。我国算力部署在西部,那么计算肯定也是发生在西部,所以算力调度也是分成两步去做,第一步通过编排把应用部署到了目标资源所在地,第二步是把数据和请求调度到应用运行,从而实现算力调度。
目前,“息壤”已经能够按照超广覆盖、超高可靠、超低时延、超大速率、云网一体的标准要求,对边缘云、中心云、第三方资源等全网算力进行统一管理和调度。
这一平台让数据找到了通往最匹配算力中心的最佳路径,真正实现了成本、算力、时延的最优。
可以说,在“息壤”加持下,天翼云可以让客户实现“算力自由”,无论业务对算力的需求是多少,“息壤”都可以规划出满足需求的算力资源并且有效调度,实现业务性能和成本的最优。
凭借优秀的算力调度能力,“息壤”也获得了业内广泛认可,包括入选国资委“2022年度央企十大超级工程”;在第六届数字中国建设成果展览会最佳成果遴选颁奖仪式上,荣获第六届数字中国建设峰会“十大硬核科技” 称号;在第三届国有企业数字化转型论坛上入选国资委发布的“典型数字技术成果”。
算力互联互通平台是落实全国算力一体化调度政策、实现算力资源跨区域高效配置的战略基础设施。
不过,将分布在国内各地的数据中心进行统筹和连接,还是算力服务网络的第一步,能否基于业务场景需求向市场输出算力、算法、数据、应用高度协同的一体化资源,同样是算力服务商必须要应对的问题。
算力要和应用产生更加紧密的联系,才能真正促进数字经济生产力。
在算力服务网络方兴未艾的当下,衡量一家服务商竞争力的标准,应该上升到多元化算力的调度能力、一体化的算力运营能力以及生态整合的综合能力,这是连接算力价值的必备因素,也是在算力服务网络争夺赛中胜出的关键。
天翼云作为首个算力互联互通验证平台的设计方、建设方、资源提供方和标准制定参与方,在大力推动全国算力互联互通平台建设的同时,还将推动算力普惠发展和产业数字化转型,为农业、工业、物流、金融、能源等多个领域客户提供服务,不断释放出新的经济增长动能和社会价值,加速中国算力奔跑向前。
中国算力速度仍在不断刷新。在推动我国成为全球算力强国的路上,以天翼云为代表的越来越多的科技企业正以创新为驱动,迈出做大做强数字经济的稳健步伐。
关键词: