7月16日,“信息化百人会第八届信息战略论坛”在京举行,论坛以“算力时代,“东”风正起——东数西算的战略抉择与产业创新”为主题,深入探讨了算力时代的新趋势以及“东数西算”带来的发展机遇与挑战。
清华大学计算机系教授郑纬民表示,数字经济发展水平与算力的规模密切相关。据统计,算力规模前20个国家中有17个是全球排名前20的经济体。
中国电信集团有限公司原总经理李正茂在“算力三定律”中指出,算力每12个月增长一倍,算力每投入1元,会带动3-4元GDP经济增长。
中国工程院院士李国杰认为,信息社会进入智能化新阶段,所需要的基础设施主要不是解决连通的问题,而是对物理世界和人类社会的理解。算力和GDP呈正相关关系。未来算力指数可能比电力的指数还重要。
工业和信息化部信息通信发展司一级巡视员陈家春认为,算力作为数字经济时代新的生产力,是支撑数字经济发展的坚实基础,“东数西算”工程是算力基础设施建设布局的重要组成部分。
中国信息通信研究院院长余晓晖表示,“东数西算”是算力资源在国家范围内的优化配置。京津冀、长三角、粤港澳和成渝等产业基础和需求强劲,西部资源禀赋突出,针对西部地区在承接“东数西算”过程中,推动自身数字经济发展的需求,要解决好西部地区如何扩大“东数西算”的产业溢出问题。
亚信联合创始人田溯宁认为,推动东数西算工程,“算力运营商”是不可或缺的角色——通过编排、调度东西部算力资源池,满足算力用户多样化算力需求。通过不断的数据积累、感知,及数据知识化,算力运营商可以对未来从感知、认知走向预知。
信息化百人会学术委员会主席、工业和信息化部原副部长杨学山认为,“东数西算”是新课题,从宏观层面关系整体布局,从微观层面则关系到商业模式,当我们点亮灯塔进入无人区时要慎重。
国家电网有限公司副总信息师王继业认为,“东数西算”有助于解决数据中心东西部算力供需失衡等问题。“东数西算”工程将会推动我国数据中心差异化、互补化、协同化、规模化的发展,为推动我国数字经济快速增长和发展提供了良好支撑。
华为昇腾计算业务总裁张迪煊表示,过去有电力网、信息网,未来一定会有算力网络。面向最终的企业用户、个人和家庭用户提供分布式多方协同的业务,算力网络可实现算力、算法、数据、模型,和应用高效率、低成本流通,实现一站式算力获取,跨网算力交易和结算。
算力网络的提出,不仅仅是技术发展趋势,也将满足市场竞争的需求。电信运营商希望在原有连接基础之上,进一步满足计算一体化的服务场景,实现业务拓展,避免被管道化。
余晓晖认为,算力网络需要考虑算力感知、计量、路由寻址、算力的可靠性和质量保证,算网一体化要融合考虑,算力的分层与颗粒度等。“当内容和算力在网络中变得重要时,网络架构也会发生重大变化。”
田溯宁亦认为,过去的网络架构是为通信做的,未来围绕着算力,它的路由架构,网络架构将会发生很大变化。
科学研究的第三范式、第四范式与算力有关,主要涉及HPC算力、AI算力、数据中心算力三大方向。郑纬民认为,在HPC算力方面,过去十年,我国在顶尖超算系统研制和部署处于世界先进水平,但领先的算力如何高效转换为解决科学与工程难题的能力依然是挑战。
李国杰表示,“信息高速公路遵循无序共享的原则,用户感知服务质量存在极大的不确定性,总体效率不高。现在,信息高速公路已经出现了技术天花板,算力网络应该为减墒做贡献,而信息高铁便是高通量的低墒算力网。”
信息高铁体现了一横一纵,“一横”是利用联邦制方式连通大大小小数据中心和各类算力资源,为用户提供统一封装、抽象易用的算力资源;“一纵”是纵向打通云、网、边、端全链路基础设施资源,通过全链路多维度测调、控域隔离,实现端到端服务质量的保证。
杨学山认为,“东数西算”工程需要解决好三个层面问题:
从技术层面看,算力是计算能力和用户应用需求之间的匹配,解决问题的“能力”才叫算力,而不是计算中心集中了多少算力,这是两个不同的概念,“不同需求与计算能力之间的布局,怎样才是最合理的?”
从商业层面看,投入与产出是否匹配,需要综合考虑投资、折旧、维护、带宽的成本,每一个建设单位要认真考虑东数西算的成本和营收问题。
从体制机制层面看,因为第三方服务和基础设施的管理方式和投资的方式不一样,需要明确哪些算力中心是基础设施,哪些是第三方投入,针对性采用政府手段和市场手段解决问题。
李国杰认为,计算机界和通信界,对未来信息基础设施有着不同的视角。
从计算机界的视角看,计算思维核心是分层次抽象,屏蔽不同云的差异,实现跨云计算。未来的信息基础设施是互联云,以云为中心,强调“云调网”、云网融合、一云多网,解决各种软硬件不兼容问题。算力网的核心是做任务交换和高通量计算,追求低墒有序。
从通信界的角度看,以网络为中心,把计算和存储能力看作可调动的资源,也就是“网调云”,强调算力资源评估、交易和调度,重视算力感知、算力标识和算力资源的标准化等等,也“把算力网络看成是6G的一部分”。
李国杰指出,基于云网融合,通信领域专家考虑网调云的时候,要充分理解哪些计算资源是可以通过网络进行调配的,目前,只有相当少量的计算资源是可以调配的。
同时,他认为,现在计算机内部的通信是纳秒级,广域网上通信是毫秒级。目前,算力网只能在毫秒级层面谈分布式计算,只能做到粗粒度的分布式任务调度。
因此,他建议,未来,新型信息基础设施要通盘考虑,算力网、通信网和电力等能源网络配合协同,做好算力、通信、电力网等全国一盘棋顶层设计,统筹兼顾,力争全局的优化。
“要基于经济社会发展的大逻辑、大格局、大趋势,做好顶层路线图的设计,避免只见树木不见森林。”
余晓晖指出,算网融合过程中存在四大挑战:一是,网络的算力感知挑战,面对算力的多样性和网络无感知状况要如何解决;二是,网络的算力路由和寻址挑战,面对算力的无序性和只能按地址选择,而不能根据算力需求选择路由的问题如何解决;三是,网络的可靠性与质量保障挑战,面对算力的分散性和负责计算的网络质量该如何保障;四是,算网一体的安全可信挑战,如何保障算力和网络的安全可信。
媒体经常把算力网络和交通网络、电力网络等量齐观,认为算力可以象供水和供电一样方便。李国杰表示,算力不是公共品,每一个算力产品都是通过专有特性赢得竞争,算力网络的实现比交通和能源网络更复杂、困难,需要很多基础性的原始创新和大量技术攻关。
陈家春建议,加快构建全国一体化大数据中心体系,统筹布局东西部算力资源,加速打造数网协同、数云协同、云边协同绿色智能的多层次算力设施体系;尽快补足算力枢纽节点间网络薄弱环节,重点提升蒙贵甘宁区域的网络能力,启动一批“东数西算”光缆建设项目,优化算力网络支撑;逐步建立算网协同联动机制,推动算力网络需求和供给有效对接;通过算力设施由东向西布局,带动相关产业有效转移,促进中西部地区数据流通、价值传递,推动算力设施能效水平和绿色用能水平的提升;强化算力应用需求牵引,降低算力使用门槛,增强算力应用赋能水平,挖掘算力服务在数字政府、工业互联网等创新应用场景下的深化应用。
随着数据的爆炸式增长、算法的日益复杂,处理数据的能力,即算力成为推动数字经济发展的核心资源、核心生产力,数字经济时代生产要素已经由以前的土地、能源等转化为数据。
近五年来,算力规模快速增长,平均增速超过30%。截止到2021年底,我国数据中心算力总规模已超过140亿EFLOPS。
李正茂认为,“今天,对数据的认识如果仅仅停留在对‘大数据’中文翻译的基础上,是会有欠缺的。如果按照十年一周期,个人推测数据量会增长100万倍,以这样的增长速度,处理数据显然不可能靠人力,这是算力时代产生的原因。”
王继业表示,随着“东数西算”工程的逐步推进,国家一体化大数据中心体系逐步形成。对于数据中心的计算密度、能效、资源调度、自主可控等等方面提出了新的要求。
在传统数据中心L0到L3的四层中,L2层在网络设备方面采用普通服务器堆叠,密度不够、效率不高,大量增加机柜简单扩展,网络部署静态,调度不灵活,“容易造成数据中心内部网络经常发生堵塞”;其次,L3层业务应用和底层各个环节没有联动。
王继业进而指出,高效能的数据中心可实现四层之间相互联动,优化选址、跨层调控、设备高密度,网络动态部署,业务应用灵活跨层联动,通过业务应用把底层网络设备,包括制冷和配电设备按需联动。
“我们不仅仅关注枢纽节点和集群,还应该关注更多中型、中大型的省级数据中心,和行业中心、商业化运营中心。同时,关注边缘计算节点,构成国家级、省级、边缘型的一体化数据中心体系。”
此前,工信部出台《新型数据中心发展三年行动计划2021-2023年》,提出四高、三协同的发展方向和路径(四高是指新型数据中心具备高技术、高算力、高能效、高安全的特征,三协同是指数网、数云、云边协同发展)。
余晓晖建议,在基础设施方面,要开发利用以风电、光伏和储能为代表的新型供配电系统,以及新型制冷系统;IT设备、软件与服务方面,发展全国性交付中心、区城性技术外包服务中心以及结合当地产业的特色信息技术服务;数字化转型﹣新兴产业培育方面,可以通过工业互联网、智慧减市、智慧医疗应用和能力建设,推进经济社会数字化,培育新兴数字产业;数字化绿色化双重转型﹣新兴产业培育方面,要注重打造数字底座+绿色底座,培育数字化绿色化产业,形成新产品、新服务、新业态。
王继业建议,提高新建、改造数据中心相关建设标准,增加PUE、能效比、资源利用率等指标要求;采用边缘数据中心一体化装备对于企事业单位、社会团体内部中小型数据中心进行升级改造;加强枢纽型、大型、中小型数据中心及边缘数据中心站之间的规划、协同、调度和应用,一张网,实现无处不在、无时不有、应有尽有的算力服务。
张迪煊表示,华为以鲲鹏+昇腾作为算力底座,把云、计算、存储、网络和能源融合在一起,推出了一体化的集群计算解决方案。纵向上,从算力的硬件、软件、操作系统、数据库到人工智能框架,横向上打通配电、网络、计算、存储、云等跨领域,实现了L0-L3协同联动,走向全栈一体化。
网络算力化、计算网络化、算网安全一体,是“东数西算”对算力基础设施的需求所在。
余晓晖指出,目前,理想的目标是实现云边端算力按需调度,随需供给,按量付费。基于此,他提出一套可能的架构,算力设施作为底层,其上设置算网大脑,连接算网服务和运营。
郑纬民认为,算力网络需要将并网和调度两件事做好,应成立专业公司做算力调度。
田溯宁认为,算力运营商需要具备算力交易能力,需要进行算力度量、感知、路由、编排以满足使用户极致的服务需求。算力消费者、算力运营商、算力需求方形成从算力供给、交易到使用的良性循环,打造算力时代三方共赢的新商业模式。展望未来,田溯宁建议要推动算力运营商标准体系完善,加速算力网络原创技术成熟,打造算力网络健全产业生态。
李国杰建议,国家的算力网应当由三部分组成,第一,以国家和地方建立的公共算力基础设施;第二,电信运营商和龙头云服务商建设骨干企业的算力基础设施。第三,大量中小型信息服务企业,通过协作建立算力网。
算力网要做到全局统一,又要做到环节解耦,形成东西互补、南北贯通的一体化算力网。环节解耦是算力设备提供商、运营商和增值服务商解耦,消费者按照统一定价支付费用,可以得到多样化服务,而“不是绑定在一家运营商,过分强调一家企业端到端的一体化工作,不利于算力网络发展”。
截止到2021年底,我国数据中心和算力布局逐步优化,中西部数据中心占全国比例达到37%。
陈家春认为,新建数据中心特别是大型、超大型数据中心,逐渐向中西部,以及一线城市周边转移,已基本形成京津冀、长三角、粤港澳大湾区、成渝等核心区域协调发展,中西部地区协同补充的发展格局。
李国杰认为,现在启动“东数西算”工程,可以促进我国西部地区的数字经济发展,但不能把“东数西算”看成我国算力基础设施的整体战略和全部内容。把“东数西算”做到像西电东输和南水北调一样的实效,需要努力。
余晓晖表示,西部承接是全局优化的过程。产业溢出和付出的能源和资源相匹配。“有这么大的算力在西部,它一定能够更好的推动自身数字化转型,比如工业互联网、智慧城市、医疗等等。从这个意义上看,它可以培育出一些新型的数字产业。”
对于算力时代下的东数西算,时延是非常重要的约束因素,很多对时延要求苛刻的游戏、支付和工业互联网必须靠近需求进行部署算力;对一些冷数据,时延要求并不高的数据,适合放在西部,这需要做精细规划,需要与需求进行匹配。“东数可以西存,容灾和备份也可以。”
2020年,我国算力总规模达到135EFlops,全球占比约31%,保持55%的高速增长(全球增速16%)。我国智能算力占比由2016年的3%提升至2020年的41%,预计2023年,新增算力中AI算力将达到70-80%。
余晓晖表示,人工智能算力在中国算力结构中的提升速度,明显高于全球平均水平。
郑纬民表示,人工智能的三架马车包括,数据、算法、算力;人工智能应用包括图像检测、视频检索等等。自然语言处理,包括语言翻译、自动回答、生成文本摘要、创作等。基于语言模型使得人工智能快速向大模型发展,每3.4个月需要机器算力翻一倍。他希望,HPC+AI+大数据三类计算系统融合发展。
李国杰认为,计算能力和大数据也将成为新型信息基础设施的关键。预计到2025年,我国人工智能算力将超过通用算力,这些算力中相当的比例是不需要实时的。
计算应用大体上分实时和非实时两大类。一般而言,有实时要求的应用对算力要求并不强;面向基础研究的科学计算、人工智能的训练,不要求实时,需要使用超级计算机和一些超大规模的人工智能训练平台。
“新药的研制,新材料的研发,集成电路的新产品设计等等,都需要巨大的算力。非实时计算可能对国家发展具有更加基础、更加长远的作用,实时性强的工业互联网和金融网络多数来自企业自建,所以,国家财政投入算力网络建设时,应该考虑非实时的高性能计算,而边缘计算、物联网中有很多是实时要求,算力网得重视确定性网络的研究。”
张迪煊认为,未来算力主要增长在AI方面,计算将全面从通用计算走向通用计算+人工智能多样性计算。
目前,大模型创新非常活跃,需要有序的规划和牵引,针对AI发展方向,华为正在与产业界共同规划大模型沙盘,通过智算网络赋能大模型科研创新。
过去一年多,随着鹏城云脑和武汉人工智能计算中心的上线,开启了各地人工智能计算中心的建设。目前,全国已经有20多个算力领先城市,基于昇腾AI建设了人工智能计算中心。在计算中心与算力网络的建设过程中,全栈协同是基础,一体服务是目标,自主创新是根本。张迪煊表示,通过算力网络可实现多样性算力、全网共享、布局优化,支撑我国“东数西算”、“东数西训”、“东数西存”,使能数字经济高质量发展。
作者:赵宇
责编/版式:沈新竹
审核:申晴
监制:刘启诚