工业生产过程会产生海量时间序列数据,如同源源不断的石油,借助大数据技术对时序数据进行挖掘,将带来巨大价值。时序数据库作为时间序列数据的专业存储、查询和分析工具,在大数据挖掘和分析中起着关键作用。随着大数据的普及,时序数据库应用场景也越来越广泛,尤其在工业设备监控、制造质量提升等方面作用明显。
时序数据库结合大数据迸发新生
维基百科解释“时序数据库是一种针对时间序列数据进行了专门的优化,用来存储时间序列数据,并以时间点或区间建立索引的软件。”时序数据库在工业、金融、互联网以及IT运维等领域应用悠久,近年来大数据技术与时序数据库结合产生巨大价值,也催生了新一代时序数据库产品及更多玩家。比如Facebook开源内存数据库Beringei、Basho公司开源了它的时序数据库产品Riak TS 1.3等。
据DB-engines时序数据库排行榜显示,截至本月已经有20+种以上的产品位列其中。时序数据库开源、免费和商业等版本数量众多,还存在安装包、私有云和公有云等不同的交付方式,功能、性能也有很大差异。对于时序数据库的选择,寄云科技大数据产品总监杨敏认为,要根据时序数据的特点,从数据接入、存储、查询和展现,以及易用性、扩展性和安全性等多方面、多角度去考量,需要具备存储容量大、存取效率高、支持复杂数据来源集成处理,支持用户自定义丰富的展示面板,并具备良好的扩展性。
寄云时序数据库套件能力担当
寄云时序数据库套件包含时序数据库和展现平台两部分。通过数据采集模块,对外部历史文件数据进行批量采集,对传感器实时产生的数据进行实时采集,采集后数据经过数据交换、数据处理、数据存储后,在展现平台进行时序数据指标的动态监控,完成数据分析仪表盘等功能,或数据导出进行高级的数据挖掘服务。
杨敏表示,该产品套件是寄云科技在风电、交通、航天等众多高端领域服务的过程中开发的,已经成功在这些大型客户之中应用。其性能达到每秒百万级测点的加载速度,实现加载即索引;亚秒级查询响应、支持上千的并发查询,可视化界面支持类SQL查询;支持私有云/公有云部署,易用性、扩展性和安全性极佳。
时序数据库技术及相关应用系统的商业开发,国外相对更为发达。但这些国外商业系统应用价格高,封闭特性强,不能进行二次开发与定制,很难满足国内工业企业的需求。大家都期待一种开放、价格合理、适应国情,且要经过大型场景验证的商业产品和方案的问世。寄云时序数据库产品套件将为更多国内的工业客户提供更好的服务,也将为国内用户提供更多的选择。