移动云孙少陵:大云天穹算网大脑已在全国全网全面商用
近日举行的“2024算网融合产业发展大会”主论坛上,中国移动云能力中心副总经理孙少陵表示,算力网络从各地方政府、超算互联网、运营商的分头实践,逐步成为国家政策关注的要点工作,形成国家产业共识。中国移动启动“百川”算力并网行动,并入社会算力资源,形成企业“条状”算力网络。
孙少陵指出,算网融合是算力网络的本质特征之一,将发挥算网大脑融合编排、调度能力,实现算力融通和算网一体化服务。中国移动聚焦以下四个方面,推动算网融合发展。
一是攻关算力核心技术,推进通算智算一体化演进。孙少陵认为,“目前整个智算发展处在非常初期的阶段,人工智能的发展突飞猛进,一定程度上带来算力供给能力不足。”聚焦摆脱传统CPU性能瓶颈、解决A|生态碎片化问题、提升智算集群效能等核心任务,中国移动研发COCA异构计算架构,布局国产化智算生态、共建自主产业联盟、联创高性能网络技术三个方面,带动国产算力产业成熟发展。
二是探究算间互联技术和并网模式,汇聚海量普惠算力。面对算力资源孤岛化、碎片化等问题,依托云专网构建算力网关和网络弹性能力,实现异构算力跨域互联,联合产业链合作伙伴开展算力并网行动,汇聚“通、智、超、量”四类社会算力,助推算力成为普惠级社会服务,赋能千行百业。
对于算力并网,中国移动提出“一二四四”能力要点,即一个运营入口,全地域、全类型、多供应商算力一站式订购;两项算网创新能力,依托云专网构建算力网关实现异构算力跨域互联,以及2M~10Gbps网络弹性能力;四种技术对接方式,运营层对接、云原生对接、编管层对接和资源层对接;四大算力类型,通用算力、智能算力、超算算力和量子算力。截至目前,中国移动已经并入3.4 EFlops(FP32)算力,完成2家国家超算中心、3家量子计算和5家权威智算中心建设。
三是构建算网大脑智能中枢,实现资源融通一体供给。面向云计算领域存在的算网资源利用率不均等问题,攻坚全域感知、多要素能力纳管、融合精准调度等关键技术,全面融合智能,实现移动云资源全面纳管和业务一体化支撑,助力区域算力公共服务平台算力整合、统一调度。
中国移动大云天穹算网大脑,结构上采取5+2的设计,即设计、编排调度、智能、能力和感知五大中心,以及算力域和网络域两大能力网关。通过全域感知算网地图、多要素能力纳管、算网融合精准调度和全面智能赋能四大能力,全面纳管移动云算网资源,支撑移动云运营。目前,中国移动算网大脑已经在全国全网进行全面商用。
四是构建超大规模算力底座,实现算网原生。面对算网供需失衡问题,研发超大规模分布式云原生底座,基于算网大脑,结合云原生Less^3(Regionless、Serverless、Platformless)能力,将海量异地异构算力打造成一台容量无限、一直在线、智能高效、即开即用“超级计算机”。
对于未来的合作发展,孙少陵提出如下3点倡议:一方面,加强国内产学研协同推进DPU、GPU、CPU、交换芯片领域的技术突破与创新;另一方面,通过标准开源形式建立产业生态,如完善GPU算子库、 RoCE通信协议等,让GPU网络实现异厂家系统互通,逐步扩大国际影响力;与此同时,打造应用开发标准,如应用开发AP1、应用构建与迁移等,助力算力网络超级计算机构建。
孙少陵表示,中国移动愿意秉承开放创新、融合共赢的理念,把握算网融合发展的机遇,推动算力网络成熟。
评论