冷存储是不经常访问但却是必需数据的术语。人们需要了解冷存储如何工作,以及如何帮助大数据

已经有一些企业侧重于分层存储算法,其基于数据需要被访问的频率,将数据路由到最合适的存储介质,特别注意第一层,数据需要快速和频繁的最快速的访问存储恢复器。

但是在“数据副本”中,高达85%的企业数据驻留在很少被访问的存储介质中,同时也存在一个迫在眉睫的危机,即如何以最低成本优化管理和维护这些数据,以及适当的数据存储,检索,安全和访问策略。

这种不常访问但仍然必要的数据的名称是“冷存储”。确定数据是“热”(经常访问),“暖”(适度访问)还是“冷”(不常访问)通常是存储管理员的工作,评估各种类别的数据访问。在某些情况下,数据中心甚至开始使用自动化存储分层软件来做出这些数据存储决策。

大数据因素进入讨论,因为有这么多的。为了治理的目的(即使不定期使用数据也需要保留数据),业务连续性(大数据和“常规”数据需要多个数据存储库,并用于灾难恢复故障转移)因为需要知道一切是什么,网站必须寻找低成本,缓慢的冷存储解决方案,所以他们可以承受这些必须保存但很少被访问的数据管理的成本。

适用于私有云环境的冷却数据服务提供商Storiant公司创始人兼首席执行官杰夫?福罗尔斯表示:“当我们研究存储市场时,我们认识到需要大容量冷存储,并且看到组织所有大数据流正在积累,这是一个日益严重的问题。”

福罗尔斯表示,他们可以在防火墙后安全保留数据,每月每GB每月只需0.01美元。亚马逊公司等大型公共云服务提供商也提供冷存储服务,但区别在于Storiant公司将其提供给用于企业的私有企业云;这吸引了许多企业使用公共云服务来提供他们的数据。

冷存储如何工作,以及如何帮助大数据

“大数据来自大的数据块,大数据分析经常需要处理大数据量的大数据对象。”福罗尔斯说。“使用冷存储,可以将一个存储大量数据的数据湖通过Hadoop计算节点扫描。”

像Storiant公司提供这样的解决方案可以容纳大型数据对象,这些数据对象包含表征最大数据的非结构化数据,以及日益包含大数据的物联网(IoT)数据(如网站日志文件)。当企业IT使用冷存储解决方案,并决定哪些存储容器要将大数据的特定块(或对象)分类到哪个存储容器时,企业可以对所有这些数据进行分类。在同一时间,可以分配给建立在容器中访问数据的每个容器的权限。

福罗尔斯表示,互联网服务提供商正在迅速实施这种风格的基于云计算的冷存储来存储大数据,因为它是弹性的,其能力可以满足扩展或收缩的需要。基于云计算的冷存储还具有财务灵活性,因为它消除了长期摊销数据中心资本支出(CAPEX)的需要,有利于更灵活地转换为资本性支出(OPEX)的冷存储方法,企业可以在短期内控制。

他说,“我们相信物联网将继续得到指数性增长,企业将需要管理自世界各地数以百万计的设备和数据源供应大量的大数据量,金融机构,医药公司,以及政府需要大规模,低成本的大型数据冷存储,最终,企业必须找到一种方法来安全地运行,并进行低成本分析,而私有云设置中的冷存储服务提供了这些优点。”

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2019-07-31 13:34:00
大数据资讯 贵州省人大审议大数据安全保障条例(草案)
7月29日,贵州省十三届人大常委会第十一次会议举行第一次全体会议,听取了贵州省人大法制委员会关于《贵州省大数据安全保障条例(草案)》审议结果的报告,并分组审议了《 <详情>
2019-07-31 13:28:21
大数据资讯 贵州:大数据服务队为传统企业“会诊”
日前,贵州省大数据发展管理局和国家工业信息安全发展研究中心共同主办的大数据与实体经济深度融合全国行在贵阳举行启动会。贵州以大数据为传统企业的转型升级“把脉问诊” <详情>
2019-07-31 13:23:06
大数据技术 贵州大数据让脱贫攻坚“大”有可为
前几年,大数据这个词在不少人眼里恐怕还是“高大上”的代名词。随着近几年信息技术高速发展、互联网的快速普及,全球数据爆发增长、海量集聚,大数据应用渗透到我们生活的 <详情>
2019-07-31 09:58:00
大数据技术 运用大数据实现扶贫脱贫“精准”性
2019年中央一号文件将聚力精准施策,决战决胜脱贫攻坚作为一项硬任务,明确要求到2020年确保现行标准下,农村贫困人口实现脱贫、贫困县全部“摘帽”、解决区域性整体贫困。从 <详情>
2019-07-31 09:05:34
大数据技术 中云数据:用去中心化打破孤岛,“数工场” 实现工业数据互联|创业
“工业数据比电商数据复杂的多,首先它多且杂,传统工业企业产生大量数据但不知道如何应用;其次是它数据产生的频率不规律但是要求很严格,尤其数据不能出错,不然会影响整 <详情>