张浩

大家好,今天我要跟各位讲的是星环科技在金融行业客户的创新实践的案例,以及我们最新的基于容器化技术上,私有云部署上,包括公有云的大数据平台的技术发展和演进的研发的方向和一些成果。

今天给各位先介绍一下我们星环科技目前的状态,市面上目前星环科技在大数据领域里边还是非常火的领军人物,星环科技在成立四年里边,我们有500家行业客户案例,还是全球Hadoop发行版出商之一。我讲一下我们技术发展的成果,在2016年Gartner发布的数据,数据仓库和数据报告当中,在技术领先性和技术前瞻性,尤其大数据研发前瞻性上,具有足够的优势。2016年7月份的时候,Gartner发布的数据仓库关键能力排名,星环成为前十的平台厂家。

我们也很关注很专注我们金融客户和其他行业用户的体验,所以在整个平台服务和销售市场拓展过程中我们新注重平台技术之上的,比如像解决方案,还有数据建模,还有数据挖掘,很多这些领域我们都可以给用户提供整套的技术服务支持和解决方案的支撑。

目前星环科技四年的时间里边我们已经经历了C轮融资状态,在C轮融资里边领头方是腾讯投了2.35亿,目前星环科技股指35亿人民币左右。我们C轮之后我们合作力度比以往深了很多。同时跟腾讯的合作中,在国内尤其政府行业私有云沟通和部署当中才能已经采用了星环的大数据平台,作为唯一的私有云云化大数据平台部署的软件。

下面是星环目前公司的定位,我们想正确全球领先的基础软件服务提供商,所以谈到了基础软件,这四个字里边我们专注度偏到了下层,对于星环现在整个研发体系里边我们专注在基础架构数据平台和算法数据建模数据分析,在这些领域上我们提供相应的技术研发的支持和服务。

星环科技在目前国内行业案例里边有500家,主要行业以金融为首,其次有运营商,还有公安交通,还有其他能源电力互联网,还有政府和制造业企业,这是我们目前在国内专注的一些行业客户。

这个logo墙展示了我们目前在客户当中的地位,凡是做了大数据项目的客户里边,星环科技市场份额大概在50%左右,已经有60多家客户了,我们在中国人民银行分洗钱监测中心给他们提供全国金融反洗钱业务项目数据平台的服务,新三板在证券业里边,很多中小企业想要做融资,或者一定范围内限制融资的时候,都会通过新三板。还有全国性国有企业银行,中国银行,中国邮政储蓄银行,联通,中国银联,还有股份制行里边现在有四家客户,民生银行,恒丰银行,平安和渤海银行。其他大部分都是城商行和省级农信社和城市的一些农商行。证券和保险是我们目前比较看中的一些行业客户,只是前期前三年用户在大数据技术上的投入力量并不是特别的丰富,近两年我已经看到大家有券商基金和保险客户有非常大项目建设的势头,所以我们客户目前在证券保险基金里面客户群并不是很大,未来这个数字会快速的突破。

下面是星环科技主要的大数据平台功能以及相关的自由研发的组件。星环科技最新hadoop发行版本是5.0版本,中间六个深蓝色区块是星环科技在大数据里边提供六个最主要的功能组件,第一个(英文)是数据仓库和分析引擎的功能组件,支持标准了(英文)存储过程以及各类的数据方言,方便用户用比较低的成本迁移原有数据库的应用,这是我们最重要的一个功能组件。第二功能组件是流氏计算引擎,如果玩过开源技术的同仁可能会了解,以前事物处理开源技术hadoop组件一般用的最多是(英文),对于星环来说兼顾了功能组件两种流氏模式,我刚才提到的两个都是星环自主研发的功能组件。

第三个是(英文)是基于开源技术研发的,是开源技术的(英文)劣势数据库,主要使用的业务场景是精准查询,或者固定报表,还有一些多维分析的业务,这些都是在(英文)呈现的。第四个组件是(英文)是星环开源组件(英文)的组件改造后形成新的大规模搜索的计算引擎,主要使用用户前端业务场景是比如像全文检索,模糊查询,不管前模糊,中模糊后模糊各类模糊查询,包括数据关联分析这些都在我们大规模搜索引擎里边提供。

第四个(英文),对于星环平台来说这两个功能组件也是非常重要的数据挖掘功能组件,(英文)主要一些开发模式和(英文)有些区别,它的开发要求比较高,需要功能组件相应的人员技术,比如R的编程,这种方式对于技术人员的要求比较高,对于数据分析师业务分析师技术能力要求是比较高的。但是(英文)的组件,它会用比较低的方式,比较低的门槛给用户提供数据挖掘的方式,它可以通过拖拉拽的方式,你可以见到一流的分布式框架,比如(英文),类似像深度学习和机器学习的框架,这些算法都包含在(英文)组件里边,尤其国内金融客户里边,大家的反响是非常热烈的。

介绍完中间的六个,最主要的功能组件之后,我要跟各位介绍的是两端的组件,左边是基于开发的组建,右边是集群安装部署运维监控管理组件。深蓝色所有组件都是星环研发或者基于开源技术改造后的功能组件。大家回到上面有一条自己的产品线,在两年前成立的,在(英文)研发的都是数据处理类的工具,比如第一个(英文)是做标准开发的开发工具的图形化的工具,现在在我们一侧提供数据服务和数据平台运维支持这块的客户群上,百分之百的客户都会选用这个功能组件作为日常数据的开发和数据应用的开发。

第二个功能组件是(英文)内部建成是TT,主要使用功能是做数据准实时数据同步以及轻量级数据的(英文),这个也是星环自主研发的。第三个功能组件是(英文)工作流引擎是实现数据处理任务的流程调度工具,这个在市面上以前玩数据的用户已经用过了,星环现在研发的,日常数据处理任务前后的逻辑,包括关联关系等等都做在了(英文),这个也是图形化的,是拖拉拽式任务调度和编排。第四是(英文)基于大数据平台之上,提供数据字典和数据分析比较基础原数据的功能。第五(英文)是应用面里边应用最广的数据,它是数据立方体的建模,这个需要高性能的低延时快速的毫秒级在海量数据终把你的所需要的报表结果输出的业务场景中,(英文)工具现在应用面非常广,尤其在金融行业客户现在已经有40%左右的客户用到了最新的工具,做它日常数据维度的设计和数据立方体的设计。

再往右侧有积极学习深蓝色区块的工具(英文),这个工具就是在数据挖掘建模领域上提供图形化拖拉拽的工具。大家可以看到星环专注底层hadoop研发基础之上我们这两年研发出非常多的图形化可信的数据工具,便于客户用于数据服务和数据管理。

接下来讲一下星环(英文)5.0的变化,前三个变化已经在4.0已经完整的体现,比如我们SQL已经非常好体现。第二(英文),我们并发性,都比大平台数据软件高很多,第三是我们独有的知识产权的专利,是基于hadoop分布式存储架构下的分布式事物支持能力,可以在分布式数据存储上保证数据的一致性,隔离性和完整性。这个是我们分布式事物的支持能力。

第四是我们5.0中最新加入的一个功能,称之为混合附载功能,这个功能在老的用了星环平台两三年以上的客户,它的反响是非常热烈的是因为在原有数据处理集群上,包括后端比较重的任务,包括前端短查询业务我们在同一个集群上响应的,如果后端起比较重的任务,占用大量了大数据资源和存储资源里边,响应的周期非常慢,我们为了排解客户面临的实际问题,我们希望加入了混合负载,我们可以约定在平台之上,比较重的任务不让它用太多的资源,加一些权重,这样可以保证前端高速高频查询的交易,一些任务,可以快速的在数据平台响应,并且处理完毕,相当于留出不同限速的道路的通道,给不同的任务使用,这个过程也是很多客户反响非常好的功能。

接下来看一下我们(英文)各项工具简单的截屏,这是我们所有图形化处理的截屏。星环科技在目前客户当中我们很荣幸的在真实生产环境中落地了基于(英文)私有云云化部署的大数据hadoop平台,这个客户目前在我们集群规模上已经达到了200个节点,但是实际计算资源现在也分了用(英文)技术做了动态化用户权限管理和划分。简单的来说当用户这侧它的租户资源发生变化,需要削减的时候都会把资源可以动态的扩展,或者动态的收回来,以备其他业务利用在前端访问和使用,这种容器化的技术目前在国内已经有了真实生产环境的落地案例。目前就我知道国内真正把hadoop技术搬在容器化云上,私有云云化部署上第一家的客户案例。

接下来是我们目前国内大多数的客户,他们拿大数据平台做什么事情,做了哪些业务创新,我选举了一些比较典型的案例跟各位分享。第一个是机遇和挑战,有一些变化,在我们整个大数据技术创新路线中我能看到最大的变化就是科技部门慢慢从后台成本运营中心浮现出来,作为科技创新部门引领的部门,尤其大数据技术应用比较深的客户群里边,有一个普遍的共性科技部门开启引领金融行业的创新。

第二是民生银行的案例,利用大数据平台快速构建了自己小微企业的在线融资平台,也提供了可利用的资信报告。第二个是恒丰银行,恒丰银行是目前国内最早把传统数据仓库全部迁移到hadoop平台上的第一家客户,恒丰银行也是目前所有金融客户里边最快的一家客户,上线创新业务达到6000多个,开发和迭代周期是三个月左右,让我感觉到很惊人。还有一个江苏银行,江苏银行作为区域的比较有知名度的城商行主要做业务层面是集市层面。

浙江省农信它的准实时(英文)前端核心交易系统的数据,现在同步时长达到15分钟行内领导15分钟可以看到15分钟之前柜面之前交易的数据,已经到(英文)数据仓库里边,这个也是比较客观的。还有一个四川省农信主要在营销反欺诈应用上做区域必须有特点的科技创新业务。还有证券行业第一创业证券,它的迭代周期非常快,(英文)迁移时间在六个月之内全部完成,全部迁移到hadoop上来,目前的性能提升是5-10倍左右。

还有一个比较有特点的大数据创新业务场景,就是企业投资与认知关系的图谱分析,因为应用了图计算,这个在大数据里边最早用于社交,国外的facebook就是用图计算做的,这个面会比以前的社交网络越来越多。中间下方的图是动态可伸缩可拖拉的企业图谱。还有在保险公司做的大数据业务创新的点,基本在产品定价和组合营销上给用户提供一些精准的营销投放和精准的客群分类。

这张图是我们现在在国内很多大数据,基于大数据的数据仓库之上的逻辑架构图,这个里面简单讲一下,中间逻辑数据仓库里边和传统的多出了右上方的凉快,图计算和图建模。让分析师在上面做数据模型的挖掘和实验,用这种方式帮助行内用户达到自己的经营管理预期,这是目前在金融客户里边普遍看到的特点。

左边实时留处理技术(音),包括浙江省农信已经开始做准实时仓库,包括准实时应用,包括实时分控,实时营销推荐,这些在实时里边,包括提到的在人行之前中标的项目,在反洗钱实时数据分析规则判别上,也是现在很多金融机构在尝试用流氏技术打造创新点,在这个创新点里边我们hadoop目前可以替换到你市面上所有看到的数据仓库,目前hadoop技术越来越成熟,会逐步替换到所有传统数据仓库的数据平台。

接下来跟各位分享的就是数据驱动的智慧银行业务,在业务点里边分成四大类,第一是平台,第二是客户服务,第三经营分析,第四风险。在我已列的20个应用场景里边,在星环客户群里边都已经实现了,已经上线到自己的生产系统当中了。很有特点的是经营分析里边像财富管理,像统一绩效考核平台,还有像风控里边全面风险预警,信用风险,很多这些包括现在实时领域里边对接的,刚才提到交易欺诈,反洗钱,包括证券行业里边正在做新一代侦查系统,做股票、期货、交易监察的云化的创新服务系统,现在在大数据业务里边都有所创新。基于这个,之前我们看到国内60多家金融客户,在大数据用于拓展创新的精神。总结下来,科技金融在数据驱动的发展趋势上,总结下来分为以下七个层次。在这七个层次里边,我相信所有的金融客户都能找到大数据技术创新独特的业务点。

接下来应用趋势展望,我不得不谈的就是星环有了第一个私有云云化的hadoop平台,在未来三年之内我相信私有云云化和容器化hadoop平台将会遍地开放,这种对于大规模数据存储来说,第一点毋庸置疑会受到好评,运维复杂程度会极大降低。我们以前单集群1600个计算和存储节点,大家可想而知1600多台物理主机在机房里,管理运维人员达到非常好的运维目标是非常困难的,所以在云化在最终hadoop技术发展趋势上一定会取代原有的全是物理机的部署架构,谢谢,我分心的到此结束,谢谢。

主持人:感谢张浩给我们带来的精彩分享,让我们看到了在过去金融服务的创新实践。那今天各位嘉宾的分享,也给我们带来特别多的干货,让我们脑力激荡,让我们看到在金融行业当中发挥越来越重要的作用。那今天非常感谢各位嘉宾的到来,希望在我们未来专业服务当中为金融云更好的添砖加瓦,感谢大家的支持,我们今天的大会到此结束,我们明年再见,谢谢大家的到来,谢谢。

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-08-11 13:27:24
大数据资讯 近年来我国政府公共数据相关政策解读
各自为政、条块分割、烟囱林立、信息孤岛”是困扰我国政务信息化向纵深发展的老大难问题。“十二五”以来,通过统筹国家政务信息化工程建设、推进“互联网+政务服务”、实 <详情>
2017-08-11 10:57:27
市场情报 FMI2017----让人工智能与大数据为时代赋能
2017年8月5日,由飞马网主办的“FMI人工智能&大数据高峰论坛”在北京国家会议中心召开。大会围绕着“大数据”和“人工智能”两大主题展开,20余位来自京东、搜狗、eBay、中 <详情>
2017-08-11 10:30:10
大数据技术 青铜到王者,快速提升你 MySQL 数据库的段位!
王者荣耀都可以分段位,那么工作于技术这个领域更是层级分明。 <详情>
2017-08-11 10:09:00
区块链 接棒“互联网+” 区块链技术有望成下一个热捧对象
近两年来,区块链技术吸引多方眼球,俨然成为科技界和金融圈里的“网红”。 <详情>