近年来,数字经济已成为了我国经济的重要增长点,而算力已成为全社会数智化转型的基石,将直接影响数字经济的发展。习近平总书记指出,要加强战略布局,加快建设以5G网络、全国一体化数据中心体系、国家产业互联网等为抓手的高速泛在、天地一体、云网融合、智能敏捷、绿色低碳、安全可控的智能化综合性数字信息基础设施,打通经济社会发展的信息“大动脉”。国家“十四五”信息通信行业发展规划中也多次提到构建新型数字基础设施,其中“多层次的算力设施体系”就是关键一环。
在全社会数据总量爆发式增长的今天,应用与算力融合催生全新泛在服务形态,通过在国内建立多个算力网络枢纽节点,并围绕这些数据中心重构网络格局,来解决我国数据中心算力供需失衡等问题。对于算力网络来说,网络一体化是必然的趋势,它包括了围绕集群建设数据中心直连网、推进新型互联网交换中心、互联网骨干直连点建设等多方面工作要求。因此,算为中心,网为根基,对于持有覆盖全国的通信网络的运营商而言,构建算力网络就成为其特有的优势。
同时,面对着计算需求不断更新迭代、5G等新技术相继面世的趋势,不同运营商也制定了不同的战略来迎接时代的变迁,实现自身由传统通信服务运营商向综合服务运营商的转型。中国电信从2016年开始实践“云网融合”的战略,将通信网与云计算技术相结合,为最终用户提供更优体验;中国联通将全面发力数字经济主航道,将“大联接、大计算、大数据、大应用、大安全”作为主责主业;中国移动则重点推动布局“算力网络”,即算力和网络的紧密融合,推动算力成为水、电一样“一点接入,即取即用”的社会级服务。对于运营商而言,做好算力网络,既是完成自身转型的战略契机,也是在多方面竞争压力下抢占先机的重要抓手。
AI之光,点亮算力网络
有了算力网络这个数字地基,我国就可以通过深度融合人工智能、5G、边缘计算、数字孪生等技术要素,来全面助力行业数字化转型。
首先,人工智能已经成为我国的核心战略。习近平总书记指出,“加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手,是推动我国科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源。”从人工智能技术的发展要素来看,中国人口众多,互联网用户数量多,不断为人工智能技术的发展提供着海量数据。中国企业对人工智能相当高的接受度,也使得人工智能技术在中国有着丰富的应用场景。数据和需求的相互促进之下,人工智能呈现出广阔的发展前景,在中美科技竞争的国际背景之下,人工智能也可能成为我国“弯道超车”的关键技术。另一方面,从人工智能在我国的发展阶段来看,中国AI算力市场空间年均增长>50%,人均算力还有很大增长空间,这也解释了中国数字经济,特别是AI市场冠绝全球的增长速度。
其次,从人工智能本身的特性来说,它需要建设在集约化、网络化的“算力网络”上。一方面,人工智能需要的算力规模巨大、算力资源昂贵,以OpenAI公司的GPT-3模型为例,其包含了1750亿个参数,使用1024个英伟达V100 GPU也需要一个月以上的时间进行训练,训练一次的费用超过460万美元,因此,人工智能需要的算力适合集约化建设、服务化供给。另一方面,人工智能训练任务在算力需求巨大的同时又具有非实时性,对数据传输时延不敏感,因此,它适合对算力进行跨区域调度,在降本增效、节能减排的同时,以西部充足的AI算力满足东部城市丰富的AI需求。
人工智能作为各行业核心业务场景的关键使能技术,其在关键行业的渗透率正在快速提升,成为行业数字化的刚需。对于“算力网络”的建设者之一的运营商来说,随着5G+AI技术引领行业数字化转型,面向政企市场的收入也将在未来几年快速提高,人工智能也就成为了运营商拓展政企市场的不可或缺的抓手。
技术自主,筑牢平台根基
对于人工智能在我国的高速发展,我们需要有清醒的认识。目前我国AI领域发展的主要重点仍然是应用层面,而在AI框架、算法、编程语言、芯片等软硬件“根技术”方面,我国仍然缺少国产化意识,技术上处于被动地位。以深度学习框架为例,目前在世界范围内,无论是应用还是科研、教学,都是以美国的TensorFlow、PyTorch等框架为绝对的主流,对于我国企业自研的AI框架,则产业化的应用与实践偏少。如此对我国的科技安全构成威胁的同时,也对建设AI算力网络的运营商造成了隐患。
在通用计算领域,我国已经在芯片架构、芯片设计、操作系统、应用生态等多个方面尝过了“卡脖子”的滋味。以芯片架构为例,现在仍被大量计算机、服务器依赖的x86架构仍有大量受专利保护的扩展指令集,我国企业也因此难以在不获得授权的前提下制造高性能的芯片产品。在AI领域,我们不应重蹈覆辙。诚然,许多国外技术框架将开源作为卖点,但仅仅是开源并不意味着我们可以高枕无忧,仍有很多因素能够威胁我国AI算力网络的安全,例如,谷歌、脸书等美国公司仍然牢牢把持着TensorFlow、PyTorch等框架的演进方向,托管这些开源框架代码的平台也受美国出口管制等法律的规制等等。可以说,在现阶段世界全方位竞争的背景下,如果不在AI技术的布局阶段就做好技术自主化的准备,那么AI算力网络建设成型后,一旦遭遇技术孤立、制裁,运营商将蒙受无法估量的损失,我国数字基建工程也将遭遇重创。因此,从运营商的角度上说,建设AI算力网络时优先在软硬件层面选用国产化技术以顺应时代发展要求。
AI创新实验室:运营商与企业的联合实践
从现状来看,运营商已经逐步重视起AI技术,正在不断优化数据中心全国布局架构,但其主要优势仍然是覆盖全国的通信网络。随着主流科技公司不断对AI进行战略投入,在AI领域与技术领先的企业强强联合,建设AI算力网络已经成为运营商切入AI市场的先手举措。
首先,运营商应把握“东数西算”的良机,利用西部枢纽节点的算力优越条件,就近建立AI训练中心,依托大算力集群进行算法训练,形成算法成果进而实现服务全国;其次,运营商的优势在于网络,在AI时代,运营商需要顺势而为,及时推进网络能力的进阶升级,建设覆盖全国的高品质网络;第三 ,运营商可以结合本地周边AI产业需求情况,建立地区性的AI训练推理平台,并以其为底座逐步构筑AI应用生态体系,这种地区性的生态循环可以为运营商本地行业数字化的业务进行服务,进而使运营商在当地的数字经济赋能中快人一步。
企业则在AI算力网络的建设中提供全栈的支撑服务。从硬件层面来说,企业可以依靠技术优势提供更低能耗、更高性能的硬件产品。从软件层面来说,企业可以通过整合产业模型库、场景算法,提供敏捷高效的开发平台、开发工具等方式,使运营商能够快速实现算法和应用创新。
目前,我国已有多家AI技术企业可以提供相关技术支持。硬件方面,昇腾、寒武纪思元等都是国内自主设计的通用NPU(神经网络处理器)品牌,以及其他主要针对特定任务的国产芯片品牌至少三十余家;软件方面,不少国内主体也推出了自研的AI开发框架,如百度飞桨、昇思MindSpore、北大河图、清华计图、旷视天元等。以华为公司为例,其提供的包括应用使能平台、AI开发平台、AI框架、计算架构、计算服务器等在内的多项软硬件技术支撑全国20余个城市AI计算中心建设,为AI赋能科研大模型、孵化AI成果并哺育相关产业提供了成功案例。
运营商与企业的这种合作模式已经多次在实践中得到了验证。上海移动在最近联合华为发布了“自主创新新型算力核心能力”,通过实现“多级算力架构、统一算力调度、高效区域协同”来赋能上海数字经济发展。浙江移动也发布了依托昇腾AI基础软硬件平台打造的“智能视频”“数字孪生开发”“数智人定制”等多项“数智赋能”服务。湖南移动通过自身提供5G和云底座,并在系统、业务层面整合宏视科技、海康威视、华为提供的软件、算法、硬件,实现了5G+AI的整合,为客户提供了智能转钢的解决方案,实现了有效的提产降本。河北移动依托京津冀区位优势,与华为合作建立了省级数据中心,并借助人工智能融合赋能平台“训推一体、云边协同”的优势,吸引了算法厂家对质量检测、生产安全、设备看护等多个场景中的AI应用进行了创新探索,服务于本省的实践应用。
在数字经济高速发展的今天,数据源源不断地从数字经济中产生,算力成为了新的生产力,而AI则是未来全球算力的主要应用方向。目前,运营商与企业合作推进AI算力网络的建设,并进一步推进AI能力产业化的模式已经具有的相当多的成功案例。在未来,通过加大AI应用场景的探索和相关模型、算法的创新,也将在提升AI算力网络的商业价值的同时,进一步深化运营商自身的能力转型。