算力网络解决方案
| 方案背景
随着AIGC技术赋能产业持续升级,AI大模型算力消耗惊人,单一计算设备已远远无法满足模型训练的算力需求,尽管分布式训练可以通过多个GPU节点并行训练,但随着AIGC快速发展,模型参数数量不断飙升,AI集群的GPU节点数也在不断增加,瓶颈也越来越突出。在这个背景下,GPU利用率成为提升AI大模型训练速度的主要保障,而影响GPU利用率的关键因素之一就是网络通信效率。
影响网络通信效率的因素抛开硬件性能的限制,针对端处理时延、内部排队时延和丢包重传时延三大动态因素优化网络拥塞和时延,已经成为提升AI集群网络通信性能最具成本效益的方法。基于这些思考,中仕普信致力于提升通信带宽利用率,降低动态时延以及实现无损的网络传输,以提升AI集群网络通信性能。中仕普信面向下一代AI云服务的智算中心网络建设,重磅发布了中仕普信算力网络解决方案。
| 方案介绍
基于云原生技术提供统一的算力应用平台,具备高效部署、资源调度、服务发现和动态伸缩的算力服务能力。为客户提供一次开发,一次发布,全球部署的灵活算力服务。
算力节点遍布全球、多租户集群化管理、支持可视化编排、全球应用负载均衡,为客户提供无缝跨云、跨算力、跨地域的算力应用平台
| 方案价值
1. 资源优化配置:算力网络能够根据业务需求,在云、边、端之间按需分配和灵活调度计算资源、存储资源以及网络资源,实现资源的优化配置。
2. 提升效率:通过算力网络,可以提高云、边、端三级计算的协同工作效率,类似于电力网络和水力网络对于各自领域的影响。
3. 泛在智能:算力网络构建了海量数据、高效算力、泛在智能之间的互联网络,为个人、家庭、组织带来智能化服务。
4. 降低成本:通过算力网络的“东数西算”策略,可以实现东西部资源的协调,降低东部沿海发达地区的数据中心运维成本,同时利用西部地区的可再生能源和适宜气候,减少能耗和成本。
6. 技术创新推动:算力网络的发展推动了如SD-WAN、全光网络、SRv6、边缘计算等先进技术的应用,促进了网络通信技术的创新和发展。
7. 产业数字化转型支撑:算力网络作为新型信息基础设施,支撑国家产业数字化转型,提供从边缘到中心的多层算力节点服务,服务于多种视频业务和创新增值业务。
8. 绿色发展:算力网络强调绿色供给,通过智能化的数据中心支持算网资源能力的发挥,同时满足可持续发展的要求。