“东数西算”统筹优化算力资源
在数字经济时代,算力是数字化转型的重要抓手。2022年2月,我国正式启动“东数西算”工程,规划建设8个算力网络国家枢纽节点以及10个国家数据中心集群。经过一年发展,“东数西算”工程进入全面实施阶段。本期邀请专家围绕相关问题进行研讨。
主持人 本报理论部主任、研究员 徐向梅
8个国家算力枢纽节点建设深化实施
主持人:如何理解“东数西算”,国家对此有哪些政策支持?
何宝宏(中国信通院云计算与大数据研究所所长):“东数西算”工程是实现算力资源优化配置,国家利益、社会价值最大化的重要途径。从数据中心建设到数据要素跨域流通,“东数西算”工程是一个系统性课题,通过将东部地区对时延性要求不高的数据传输到西部地区进行计算,系统化合理布局数据中心资源,实现全国数据中心一体化发展。
“东数西算”工程通过数据流引领带动资金流、人才流、技术流,有助于打通东西部数字经济大动脉,实现数字资源、数字算力、数字产业、数字服务等合理布局,助力数字中国建设。
东部地区经济较发达,在数据需求市场、科研人才和技术等方面存在优势,需要处理的数据资源较多,算力需求量大,但土地、能源等资源紧张,数据中心建设成本高。在“东数西算”工程背景下,东部地区将时延性要求高的业务继续留在东部进行计算,把时延性要求不高的数据传输到西部地区,享受水、电、可再生能源等丰富资源,有利于减少成本。
西部地区具有能源丰富、温度低等优势,利用自然风冷、可再生能源,有助于降低数据中心PUE值(能源使用效率指标),降低能源消耗。在弃风弃光地区建设数据中心集群,既承接东部地区算力需求,又充分使用当地水、电、可再生能源等丰富资源,推动清洁能源开发利用。同时,西部地区为东部迁移的企业提供优惠政策,吸引更多企业向西部搬迁,加速西部地区企业数字化转型,提升数字经济发展水平;完善相关人才引入政策,吸引更多人才到西部发展,提升人才引领发展支撑力。
数据中心产业发展单纯依靠产业努力不够,政策引导十分关键。“东数西算”工程需要顶层设计:一是加快实现数据中心集约化、规模化、绿色化发展,形成“数网”体系;二是加快建立完善云资源接入和一体化调度机制,降低算力使用成本和门槛,形成“数纽”体系;三是加强数据流通与治理,打造数字供应链,形成“数链”体系;四是深化大数据在多领域协同创新,繁荣各行业数据智能应用,形成“数脑”体系;五是加快提升大数据安全水平,强化对算力和数据资源的安全防护,形成“数盾”体系。
“东数西算”工程发展有四个重要时间节点。2021年5月份,国家发展改革委等部门联合发布《全国一体化大数据中心协同创新体系算力枢纽实施方案》,提出在京津冀、长三角、粤港澳大湾区、成渝,以及贵州、内蒙古、甘肃、宁夏等地布局建设全国一体化算力网络国家枢纽节点,加快实施“东数西算”工程,提升跨区域算力调度水平。同年12月份,国家发展改革委等部门联合发布《贯彻落实碳达峰碳中和目标要求推动数据中心和5G等新型基础设施绿色高质量发展实施方案》,提出到2025年,数据中心和5G基本形成绿色集约一体化运行格局。2022年1月份,国务院发布《“十四五”数字经济发展规划》,提出要加快实施“东数西算”工程,推进云网协同发展,提升数据中心跨网络、跨地域数据交互能力,加强面向特定场景的边缘计算能力,强化算力统筹和智能调度。2021年12月份和2022年2月份,国家发展改革委等部门函复同意宁夏回族自治区、内蒙古自治区、贵州省、甘肃省、京津冀地区、长三角地区、成渝地区、粤港澳大湾区启动建设全国一体化算力网络国家枢纽节点。至此,“东数西算”工程建设全面启动,正式进入实施阶段。
按照全国一体化大数据中心体系布局,8个国家算力枢纽节点将作为我国算力网络的骨干连接点,发展数据中心集群,开展数据中心与网络、云计算、大数据之间的协同建设,并作为“东数西算”工程的战略支点,推动算力资源有序向西转移,促进解决东西部算力供需失衡问题。
“东数西算”工程自启动至今,初见成效。从算力设施来看,目前,8个国家算力枢纽节点建设方案均进入深化实施阶段,起步区新开工数据中心项目达到60余个,新建数据中心规模超过110万标准机架,项目总投资超过4000亿元,算力集聚效应初步显现。特别是,西部地区数据中心占比稳步提高,全国算力结构逐步优化。另外,国家发展改革委会同有关部门,充分运用中央预算内投资、政策性开发性金融工具、地方政府专项债等,支持建设国家算力枢纽和数据中心集群建设。同时,鼓励和支持各地出台电力、网络、用水、用能等方面的配套政策,特别是在绿色能源使用方面大胆探索、创新方式,保障国家算力枢纽顺利建设。
同时,8个国家算力枢纽所在地方政府高度重视,在体制机制、顶层规划等方面建设不断深入,积极出台相关政策,统筹规划全面推进集群建设。宁夏回族自治区人民政府办公厅印发《全国一体化算力网络国家枢纽节点宁夏枢纽建设2022年推进方案》《关于加快推进“东数西算”工程建设全国一体化算力网络国家枢纽节点宁夏枢纽建设若干政策的意见》;贵州省人民政府办公厅印发《关于加快推进“东数西算”工程建设全国一体化算力网络国家(贵州)枢纽节点的实施意见》;四川省发展改革委等部门印发《全国一体化算力网络成渝国家枢纽节点(四川)实施方案》;甘肃省庆阳市人民政府办公室印发《庆阳市建设全国一体化算力网络国家枢纽节点(甘肃·庆阳)暨“东数西算”工程要素保障方案》;等等。八大枢纽节点十大集群重大项目不断推进,多个数据中心及上下游产业相关项目已启动建设,腾讯、阿里、快手等互联网企业,中国移动、中国联通、中国电信等运营商,万国数据、世纪互联、秦淮数据等第三方数据中心运营商,均加快集群规划和布局。大数据、云计算、区块链、物联网、人工智能、电子信息制造、大数据硬件制造、软件服务等行业头部企业加快构建“东数西算”数字经济全产业链生态体系,加速产业转型升级。
东西部算力协同作用突出
主持人:“东数西算”工程所涉地区建设进展如何?请分享有代表性的案例经验。
徐彬(国家发展改革委创新驱动发展中心副主任):截至目前,“东数西算”工程正在稳步推进,且已初步呈现出以下几方面向好趋势。
算力向规模化集约化方向加速升级。截至目前,我国数据中心规模已超600万标准机架。2022年,全国八大算力枢纽新建数据中心规模超110万标准机架,其中90%是大型和超大型数据中心。通过一体化布局,算力规模实现稳步有序增长,算力使用效率也得到进一步提升。近日,位于四川省成都市的天府国家数据中心集群,瞄准中小企业和创新团队的算力使用需求,首创“算力券”机制。成都市每年拟发放总额不超过1000万元的“算力券”,用于支持算力中介服务机构、科技型中小微企业和创客、科研机构、高校等使用国家超算成都中心、成都智算中心算力资源。鼓励全市企业、高校、科研机构联合国家超算成都中心、成都智算中心,参与承接国家、省级人工智能重大产业化项目等,对于申报成功的项目牵头企业或机构,分别按照算力成本的30%申领总额不超过300万元、150万元的“算力券”奖励。
东西部之间算力协同作用越发突出。自“东数西算”工程启动以来,西部地区新开工建设的数据中心项目数量稳步增长。2022年,西部国家算力枢纽新建数据中心规模超过60万标准机架,规模同比翻一番,占全国新建数据中心规模的45%,西部地区对东部地区数据计算需求的支撑作用越发明显。例如,位于内蒙古自治区的和林格尔国家数据中心集群,定位为“助京援东”,为京津冀地区高实时性算力需求提供助力,为长三角等地区提供非实时算力支援。当地搭建了数据信息“高速公路”,建设开通了呼和浩特国家级互联网骨干直联点、和林格尔国际互联网数据专用通道,并正在组织申报建设国家新型互联网交换中心。目前,和林格尔集群的数据传输网络总出口带宽已达到35.9T,与国内18个主要城市实现直连,与北京互访时延仅为10ms左右,已形成了内联全国、外接俄蒙及欧洲的高速宽带网络和国际通信业务通道。依托良好配套条件,和林格尔集群已支持落地了中国银行、中国农业银行、中国建设银行等多家银行的灾备中心,同时也为华为、腾讯、优刻得等云服务商,以及阿里、快手等互联网应用企业提供了算力建设保障。
算力投资的乘数效应初步显现。数据中心本身产业链条长,上游涉及IT设备制造、软件研发、发电输电配电储能系统等,下游涉及大量行业应用和服务外包产业。据测算,“东数西算”工程将每年撬动新增投资近4000亿元。通过算力设施由东向西布局,将带动相关产业有效转移,促进东西部数据流通、价值传递,延展东部发展空间,助力形成西部大开发新格局。例如,位于贵州省的贵安国家数据中心集群,以国产化、智能化、网络化、绿色化、安全稳定为导向,打造“一中心+一基地”的“前店后厂”模式。在满足京津冀、长三角、粤港澳大湾区等东部地区算力需求的同时,聚力发展本地算力产业,加快打造数据中心、智能终端、数据应用3个千亿元级主导产业集群,提升数字经济整体发展水平。
“东数西算”工程助力实现碳达峰碳中和目标。据测算,我国数据中心用电量已占全社会用电量的2%,国外机构预测全球范围这一比重未来有可能达到6%至8%。通过“东数西算”工程,将一部分数据中心引导至西部建设,有利于提升数据中心绿色能源使用率,提高算力绿色化水平。目前,我国数据中心绿电使用率在20%左右,如果这一比例提高到80%,在2025年当年就可以减少1.6个北京市的碳排放总量。实施“东数西算”工程,相当于多种了很多树,是一件利国利民的大好事。近日,位于河北省的张家口国家数据中心集群发布建设方案,提出依托张家口可再生能源示范区,支持数据中心建设企业推广“源网荷储”一体化模式,即在张家口建设风光电一体化电站,持续生产绿色电力,提供给数据中心集群,提升可再生能源电力就地消纳水平。目前,张家口“源网荷储”一体化项目总装机规模550万千瓦,首期项目全部完工后,每年将提供100亿千瓦时绿电为数据中心使用。此外,针对数据中心机房设备产生的大量热能,该市正在探索实施余热回收模式,并已启动了怀来云交换、合盈数据等企业数据中心余热回收供热供暖试点工作,预计可利用余热实现20万平方米供热供暖。
摸清家底数算匹配智能调度
主持人:我国推进“东数西算”工程的算力优势有哪些?如何进一步推进工程建设?
单志广(国家信息中心信息化和产业发展部主任):算力正成为数字经济时代的重要驱动力,“东数西算”工程的全面启动开启了我国算力资源全国范围内跨区域统筹布局的新篇章。算力通俗讲就是计算能力,是指对数据的处理能力。算力存在于手机、电脑、服务器、机器人、无人驾驶汽车、数据中心等各种智能硬件设施,是推动人工智能、大数据、物联网、区块链等技术创新与应用的基础支撑。当今世界,以算力为代表的算力经济正在蓬勃发展。人工智能、量子计算、类脑计算等新技术与计算产业相结合,拓展了全方位计算能力,OpenAI发布的研究显示,2012年以来,人工智能应用对于算力的需求平均每年增长10倍。算力已经成为衡量国家经济发展程度的重要指标,《2021—2022全球计算力指数评估报告》显示,国家算力指数与数字经济发展和GDP的走势呈现显著的正相关,从15个重点国家的算力指数看,算力指数平均每提高1个点,数字经济规模和GDP将分别增长3.5‰和1.8‰。
当前,我国算力总规模已超过140EFLOPS(每秒浮点运算次数,用于衡量计算机计算能力),近五年年均增速超过30%,算力规模排名全球第二位。2020年,罗兰贝格咨询公司统计的《世界各国人均算力水平估算结果》显示,发达程度越高的国家,其人均算力水平也越高。美国、新加坡、日本等发达国家人均算力值普遍高于或接近1000GFLOPS,属于高算力国家,我国人均算力值为553GFLOPS,属于中算力国家。随着数字经济深入发展,数据已成为与土地、劳动力、资本、技术等并列的生产要素,与之相关的存储、计算、传输、应用等算力需求都在大幅提升,预计每年仍将以20%以上的速度快速增长。
“东数西算”工程的直观理解就是把东部的数据拿到西部进行计算。需要强调的是,应在全国一体化大数据中心总体布局下科学理解“东数西算”工程的定位。构建全国一体化大数据中心体系的核心是开展全国范围内算力资源的布局和优化,是相对总体性的概念,而“东数西算”工程相对是小概念,是全国一体化大数据中心的一类应用模式。全国一体化大数据中心理论上包括所有“A数B算”,A、B可为东、西、南、北、中等各方位的任意排列组合,“东数西算”是其中一种情况,当前比较现实的主流情况还是“A数A算”。“东数西算”是在8个国家枢纽节点和10个国家数据中心集群形成后才出现的应用模式,因此“东数西算”不是现在时,而是全国一体化大数据中心建设的将来时。当全国各个节点全部打通形成网络并且建立起成熟的调度系统和机制时,才能实现面向业务、服务质量和成本要求的全网、实时、动态优化调度,从而真正意义上实现“东数西算”。
“东数西算”工程对于促进节能减排具有重大意义。西部地区光伏、风电等可再生能源发电后直接入网供西部数据中心使用,节省了西电东送的长距离输电线路损耗。将数据中心建在气温偏低的西部可以降低制冷系统能耗,东西部电价差大(0.2元/千瓦时电左右),西部空间大且地价便宜,中西部局部地区的工业用地成交价格甚至是珠三角地区的50%,降低了初始投资成本。此外,“东数西算”工程还有利于西部地区新能源消纳以及相应产业调整为西部地区带来收益等。
全国一体化大数据中心体系和“东数西算”工程本质上是一个规模庞大、跨区跨域、要素复杂、应用多样、相互作用、不断演化的复杂巨系统,需要优化调度、科学谋划、系统推进。当前推进过程中需要重点关注以下几个方面。
摸清家底,统筹衔接。由于数据资产和算力资源都具有持续性和动态性,必须实时摸清当前处于活跃状态的、正在被处理的数据资产和运行中的算力资源,以及处于静态环境里被保存的数据资产和储备算力资源,由此才能实现最优化的算力资源调配,使得各类数据资产能得到最为及时的分析处理。这需要对各类相关算力资产摸清家底,以便更精准地进行能源资源的消耗调配和预储备,真正做到心中有数。要做好国家算力枢纽节点、国家数据中心集群与现有的全国各地各类型算力设施的统筹、衔接和配合,科学合理地管理和统筹新旧节点的联动关系,形成合理分工、科学联动、高效协作的机制,切实发挥国家布局的引领和示范作用,实现数据资源“一本账”、算力资源“一盘棋”。
“数”“算”匹配,安全可信。因数据类型多样、业务需求各异,如何确保“东数西算”的“数”和“算”供需匹配,是由政府牵头还是由市场调控,目前尚无合理解决方案。如果数据来自珠三角等东部地区,而算力设施位于宁夏、贵州、甘肃等西部地区,网络性能、算力实时性、数据安全等各方面影响难以评估。因此,“东数西算”要在业务层面上做好供需匹配和精准对接,解决谁的“东数”由谁来“西算”。没有业务保障,算力设施就无法发挥应有作用,从而造成设施空置和能源空耗。这种供需匹配需要在国家、地方、企业、业务等多层级开展性能、价格、效益、安全等多方面的评估和测算,形成真正的应用需求供给和安全可信、可持续的长效动力机制。“东数西算”工程目前主要是面向超算算力和智算算力进行调度和统筹,由于基础算力承载的多是电子游戏、短视频、即时通信等实时性较强的需求,就目前的技术而言,实时性的本地数据无法搬到异地计算,因此西部目前主要考虑的是承载后台加工、离线分析、存储备份等非实时算力需求。即使对于能搬到西部的超级计算机来说,一对一进行固定匹配而不是动态调度的可能性较大。不同超级计算机的处理器、加速卡、框架等不同,算力基础设施面临异构化挑战。这需要搭建智能异构算力平台,突破异构算力适配、异构算力网络调度等关键技术,从而优化东西部各类算力资源的精准高效配比。
算力网络,智能调度。全国一体化大数据中心和“东数西算”工程最核心的技术挑战是要具备实现算力统筹和智能调度的枢纽设施——算力网络,从而实现在全国范围内,根据动态业务需求,在云、网、边之间实现按需分配和灵活调度计算、存储、网络等资源。与电力系统完善的分级调度不同,算力网络的实现机制、调度机制和运行机制短期内尚无法建立。算力网络的功能是将不同所有方的计算、存储等资源通过网络整合起来,按照用户业务的不同需求提供最优的资源服务与网络连接,核心是复杂巨系统的多资源联合优化,相当于把全网当成一台计算机进行调度,需要全国范围内、实时、全网、面向任务调度的高QoS(服务质量)资源调度。目前算力网络尚处在概念提出期,还没有真正从实践上形成产品和方案的能力。算力网络是一台超级计算机还是分领域的调度器,或是一种分布式的调度系统,目前尚无结论。从计算机科学角度,要实现目前大家设想的算力网络这种理想状态的枢纽调度器,在理论上可描述,但在实践上可能无法实现,因为全域、全网、实时、按需、动态、安全的调度本身可能就是NP难问题,可能由于复杂计算导致的“系统状态空间爆炸问题”而无法及时获得系统实时最优解,需要在整网最优解难于获得的情况下,走降维、降阶、系统分解、分而治之、局部优化、近似优化、求次优解之路。