统筹谋划全国一体化算力体系建设
算力是数字经济时代的新型生产力,是社会数字化、智能化转型的重要基础。加快算力建设,能有效激发数据要素创新活力,催生新技术、新产业、新业态、新模式,为数字经济与实体经济深度融合、建设现代化产业体系注入动力。随着人工智能应用迅速发展,我国对智能算力资源的需求愈发旺盛。将算力进一步转化为现实生产力,必须科学推进全国一体化算力体系建设,加强算力资源统筹衔接和高效调度,适度超前布局数字基础设施,充分发挥算力对经济发展效能的放大、叠加、倍增作用。
算力是支撑数字经济蓬勃发展的重要底座
通俗地讲,算力就是计算能力,是指对数据的处理能力。算力存在于手机、计算机、机器人、数据中心、超算中心和各类智能终端设施,其核心是CPU(中央处理器)等计算芯片,由计算机、服务器、高性能计算集群承载。算力作为数字经济的核心生产力,是推动人工智能、大数据、物联网等技术创新与应用的基础支撑。
算力分为基础算力、智能算力和超算算力三种类型:基础算力面向基础通用计算;超算算力的高精度数值计算主要用于科学与工程计算等高端领域;智能算力则面向人工智能计算,是支撑人工智能技术和产业发展的“最优解”。近年来,我国算力结构随着应用需求不断变化,预计今后几年智能算力占比将大幅提高。
随着数字技术向经济社会各领域全面持续渗透,数据已经成为与土地、劳动力、资本、技术并列的一大生产要素,与之相关的存储、计算、传输、应用等算力需求将大幅提升,预计每年仍将以20%以上的速度快速增长。近年来,人工智能大模型发展迅猛,相关场景更加丰富,需要更加强大的算力支撑。算力已成为衡量国家经济发展程度的一项重要指标。根据《2021—2022全球计算力指数评估报告》显示,国家计算力指数与数字经济发展和GDP的走势呈现显著的正相关,从15个重点国家的计算力指数看,算力指数平均每提高1个点,数字经济规模和GDP将分别增长3.5‰和1.8‰。截至2023年底,我国提供算力服务的在用机架数达到810万标准机架,各类算力提供主体超5000家,算力总规模位居全球第二位,算力日益成为推动数字经济发展的重要驱动力。
把握算力建设领域的关键问题
加快形成全国一体化算力体系,适度超前部署建设数字基础设施,是事关全局的长远之策,具有重大战略意义。全国一体化算力体系本质上是一个规模庞大、跨区跨域、要素复杂、应用多样、不断演化的复杂巨系统,在实践层面仍面临一些挑战,需要准确理解和把握算力建设领域的几个关键问题,科学谋划,切实推进算力经济高质高效持续发展。
一是防止“重建设轻需求、重设施轻应用”,做好供需匹配和设施应用精准对接。与水网、电网的调度机制不同,算力不能通过网络调度,即算力无法沿着网络流动。算力本身是固定在算力中心的,物理上不可移动,需通过网络把数据、业务和应用从异地汇聚到算力中心进行计算,本质上调度的是“计算任务”。算力网和物联网一样,需要有真实的应用场景牵引,根据实际应用需求进行分级、分域、分区的互联互通。如果没有真实的应用场景牵引,就没有对算力设施进行普遍互联的需求;没有业务应用支撑,算力设施就无法发挥应有作用,反而会造成设施空置和能源空耗。由于用户数据类型多样、业务需求各异,跨区域“数”“算”匹配需处理好网络性能、算力实时性、数据安全等问题,在业务应用层面做好供需匹配和精准对接,加强各地各领域多层级协调配合,开展性能、价格、效益、安全等多方面评估和测算,形成应用需求牵引和安全可信的长效动力机制。此外,由于超级计算机的处理器、加速卡等各不相同,算力基础设施要解决好兼容性问题,通过搭建智能异构算力平台,突破异构算力适配等关键技术,实现跨区域算力资源的精准高效匹配。
二是在全国一体化算力体系总体布局下,科学理解“东数西算”的定位。“东数西算”可直观理解为把东部的算力需求调到西部来计算。从目标上看,“东数西算”工程将主要面向智能算力和超算算力进行任务调度和统筹,适用于视频渲染、离线分析、报表分析、存储备份等延时不敏感的应用和非实时算力需求;而工业互联网、远程驾驶、远程医疗、即时通信等实时性较强的延时敏感型应用需求则主要由基础算力承载。构建全国一体化算力体系的核心是开展全国范围内算力资源的布局和优化,是相对总体性的概念,“东数西算”工程是其中的一项重要内容。要推动全国相关算力中心和枢纽节点联通组网,建立成熟的调度系统和机制,更好实现面向业务需求、符合服务质量和成本要求的全网、实时、动态的任务优化调度,加快建设全国一体化算力体系,稳步推进“东数西算”工程,持续夯实算网根基。
三是聚焦算力资源统筹协调,构建智能调度的算力网络体系。构建全国一体化算力体系,一方面,要“摸清家底”,做好统筹衔接。数据资产和算力资源既包括处于活跃状态、正在使用的数据资产和运行中的算力资源,又包括处于静态环境存储的数据资产和算力资源。只有“摸清家底”,才能实现算力资源的优化调配和预储备,使各类数据得到及时分析处理,真正做到“心中有数”。要切实发挥规划引领作用,做好算力枢纽节点、数据中心集群与各地算力设施的统筹、衔接和配合,形成合理分工、科学联动、高效协作机制,实现数据资源“一本账”、算力资源“一盘棋”。另一方面,要具备算力资源统筹和任务智能调度的枢纽设施——算力网络。算力网络的核心是复杂巨系统的多资源联合优化和多目标联合优化,其功能相当于把全网当成一台计算机进行任务调度。要根据动态需求实现云、网、边、端的按需灵活分配计算,按照不同用户需求实现资源调度。
以智能计算为重点建设数字基础设施
随着社会数字化、智能化快速推进,数据总量持续增长,各行业各领域对智能算力的需求日趋强烈。在适度超前建设数字基础设施的过程中,加快布局建设智能计算中心(以下简称“智算中心”)成为算力建设的重点方向,将为人工智能及相关产业发展提供良好基础。
智算中心是基于最新人工智能理论,采用领先的人工智能计算架构,提供人工智能应用所需算力服务、数据服务和算法服务的新型算力基础设施,通过算力生产、聚合、调度和释放,高效支撑数据开放共享、智能生态建设、产业创新集聚,有力促进AI产业化、产业AI化。智算中心以多元异构的强大算力机组为算力底座,不断提升智能计算能力和速度,满足人工智能应用场景下大规模、多线程的计算需求,从硬件、软件、算法、服务等全环节开展关键技术落地与应用。
算力技术与算法模型是智算中心的关键核心技术。算力技术以AI芯片、AI服务器、AI集群为载体,算法模型当前主要以AI大模型为代表。通过智算中心操作系统对算力资源池进行高效管理和智能调度,可以使智算中心更好提供算力、数据和算法等服务,支撑各类智慧应用场景落地。软件生态则是智算中心“好用”“用好”的关键支撑。
智算中心具有典型的技术密集型特征。推进智算中心建设,有利于汇聚各类要素资源和创新人才,推动AI产业化,打造科技创新的区域增长极和周边辐射带。通过系统优化布局,加强算力、网络、数据、能源等的协同联动,推动产业AI化,实现产品快速迭代和规模化应用,提升科技创新水平。
(作者系国家信息中心信息化和产业发展部主任)