当前,高质量发展是全面建设社会主义现代化国家的首要任务。工业和信息化部发布的《“十四五”信息通信行业发展规划》指出,要“加快推进数字基础设施建设,统筹布局绿色智能的数据与算力设施,强化数据采集、数据存储、加工处理、智能分析等能力。”在国家数字经济大战略下,数据作为生产要素,已成为重要的资产。随着大数据产业的不断发展,我国数据呈指数级增长,同时,数据流速也在不断加大,存储作为承载数据的关键设施,其重要性更加凸显。
2022年,中国信通信院发布《中国存力白皮书(2022年)》指出,数据存储在国家信息技术和高科技领域的基础地位日益凸显,已成为数字经济发展的战略要地。同年,华为和IDC联合编写了《运营商数据存力指标白皮书》,希望建立一套数据存力的评估体系帮助运营商全面评估数据基础设施,旨在打造稳定、可靠、高效的数据底座。2022年12月,存储产业技术创新战略联盟和中国电子技术标准化研究院联合编写的《存储产业标准化白皮书(2022)》正式发布,提出新一代存储产业标准化体系框架和建议,推动国内存储标准化工作发展。
数据存力被视为继算力之后,各行业数字化能力建设的一种进阶,在数字经济时代中不可或缺。业界普遍认为,数据存力与算力同等重要,是数字经济稳定发展的基石,而建设强大的数据基础设施则是提升数据存力水平的关键所在。
数据存储产业发展分析
政策分析
数据资源是数字经济的关键生产要素,有数据的地方就需要数据存储。数据存储通过直接、间接、衍生等方式影响数字经济,促进GDP增长,与经济社会发展呈现高度正相关关系;通过直接影响ICT基础设施行业,间接带动经济和就业的发展。
世界主要国家数据战略相关政策和国内数据相关政策如表1、表2所示。
表1 世界主要国家数据战略相关政策汇总
表2 国内数据相关政策汇总
“十四五”规划中多次提及数据存储领域,地方政府加紧贯彻落实。其中,《湖北省国民经济和社会发展第十四个五年规划和2035年远景目标纲要》中提出集中力量和资源推进国家存储器基地建设,加快实现技术赶超和规模提升,建成全国先进存储“产业航母”。四川省推进数字经济发展领导小组办公室印发了《四川省“十四五”存储产业发展规划》,即以SSD研发制造为核心,以深化产业赋能、推动融合发展为手段,加快发展存储产业,力争到2025年,技术先进、应用繁荣、安全可控、保障有力的存储产业体系基本形成,并明确了四项主要工作任务,其中包括“聚力存储应用生态、树立存储产业应用新标杆。着力打造存储应用生态圈,加快布局存储技术标准规范体系建设,健全数据安全自主可控保障体系,推进‘存储+’千行百业新应用。”
2022年2月,“东数西算”工程正式全面启动,东部数据将送到西部进行存储和计算,在“东数西算”的战略布局下,存储将成为新型数据中心建设的发力点。
产业分析
数据存力涉及产业链企业广泛,上至晶体制造、整机生产,下至系统集成、数据应用等。据IDC预测,全球数据圈(每年被创建、采集或复制的数据体量)将从 2018年的32ZB增至2025年的175ZB,增幅超过5倍。其中,中国数据圈增速最为迅速,2018年,中国数据圈占全球数据圈的比例为23.4%,即7.6ZB;预计到2025年将增至48.6ZB,占全球数据圈的27.8%,中国将成为全球大的数据圈。数据存力不仅是容量的概念,还有对性能表现、可靠程度、绿色节能的多维度考量。数据产生量的爆发式增长驱动存储需求的大幅增长,也促进了存储方式的进一步创新和发展,数据存力设施的演进方向如图1所示。
图1 数据存力设施的演进方向
市场分析
Gartner调研显示,从存储市场规模来看,2019年机械硬盘市场规模约为585亿美元,占总体市场的32.25%;DRAM市场规模约为603亿美元,占33.24%;FLASH市场规模约为480亿美元,占26.46%。当前,数字经济成为全球经济高质量发展的引擎,数据规模不断增长。相比数据的快速攀升,目前数据中心已获取数据的平均留存率仅为2%,存储基础设施建设仍有较大发展空间,大量的数据还没被处理和利用就被丢弃了。随着数据要素成为国家和企业的战略资产,这一状况有望得到改善,存储市场规模将持续冲高。
技术分析
《数据存力:高质量发展的数字基石》将数据存储的发展归纳为4个阶段,在以外部市场需求驱动为主的前3个阶段中,逐步确定了数据存储的主要形态,如图2所示。当前,数据存储正处于第四发展阶段中,技术的变革带来的性能、可靠性、效率、绿色等全方位的突破,将更好地响应各行业对数据存储的诉求。
图2 数据存储的4个发展阶段
《存储业标准化白皮书》指出存储标准体系应涵盖基础共性、产品、支撑技术、通用技术、行业、应用场景、安全7个方面,如图3所示。
图3 存储标准体系结构
《数据存力高质量发展的数字基石》提出数据存力是以存储容量为核心,包含性能表现、可靠程度和绿色低碳等在内的综合能力。
数据存力面临三大挑战
一是有限的存储容量无法满足不断增长的数据总量的需求。然而由于存储系统架构以及成本等原因,实际存储下来的数据占比在持续减少,据统计,2020年仅有15%的数据被实际保存,数据“存不下”的问题日益严重。
二是数据存储效率难以满足教据应用的实时性需求。据预测,到2025年,所有的数据中心超过25%的数据将是实时数据,如金融市场应用实时交易获取最佳成交价以提升投资收益、电子商务应用实时翻译以促成新订单并增加用户黏性、远程医疗用实时传输病患数据提升诊断效率等。这些应用场景都离不开存储设备更快地存储、传递更多的数掘,而我国对于闪存等先进存储设备的投资力度不够,应加大对创新发展的推动力度。
三是难以满足高质星发展对数据安全与绿色低碳等提出的新要求。截止到 2022 年年底,我国在用数据中心机架数量达到 670万架,近五年年均复合增速超过 30%。其中信息技术(IT)设备在数据中心的能耗占比中达50%-70%,而数据存储能耗在IT设备能耗占比中高达35%。
三大发展建议
作为全球高速稳定发展的主要经济体,我国数据总量也呈现急剧增长的态势。我国数据总量的增长依托于数字经济的发展,数字经济的稳步发展将带来更为迅速的数据增长。为应对数据存力面临的挑战,笔者提出以下三大发展建议。
在政策方面,国家要鼓励数据存力基础设施建设,通过更加优化和前置的产业和项目的规划,以及市场培育等手段,促进存储产业形成完整且良好的产业发展环境。
在标准方面,不同的企业和机构对存力的概念解读不一,为争夺市场主导权也纷纷提出各自的存储标准体系。为规范业界数据存力的发展,笔者建议产业各方需加强沟通,建立并完善数据存力发展成熟度的指标体系。
在产业方面,构建应用生态,促进存储产业相关行业应用的融合。推动关键节点的知识产权数据中心改造,协同算力产业快速发展,激发数字经济发展的活力。