12月22日,第十二届中国IDCC产业年度大典·金融科技高峰论坛暨《管理体系在银行业数据中心的创新与实践》首发仪式在国家会议中心举行。
2017年被誉为金融科技元年,区块链、人工智能、大数据、云计算对银行业的影响正在不断深入,这其中面临更严峻的网络安全、监管、容灾等问题。针对这一现状,中国银行总行、IBM、中国信息通信研究院、平安科技、中国银行数据中心(上海)、腾讯、中国信息安全认证中心、中国电信、中国银行江苏省分行等数位企业高层就金融科技当下趋势及问题进行演讲。
腾讯金融云技术总监曹骏带来以《大数据与人工智能技术在金融行业的应用》为主题的演讲。
曹骏:首先非常感谢各位领导给我们这样一个机会,之前我不知道大家接触腾讯做这种会议的多不多,但是从我个人来讲是比较意外的,一般客户对于腾讯的印象更多的是QQ、微信、王者荣耀这些,但是实际上来讲腾讯目前我们在跟企业合作这个领域都是非常靠前。
尤其是我们经过多年的互联网运营之后我们有很多技术是和金融行业的很多应用场景息息相关的,今天我想借这样一个机会跟各位汇报一下,腾讯我们和金融行业客户合作过程当中的一些过程和感悟。
首先,可能各位领导应该会知道BATJ最近都找了一些合作伙伴跟市场合作,腾讯跟中行有很深度的合作,腾讯是一家从技术层面很专一的公司,所以我们投入了很多有技术,有资源,做了很深入的研讨。今天我们就研讨的一部分,刚刚提到的大数据和人工智能的领域我们做分享。
今天的内容包括几个部分,第一块想简单介绍一下,腾讯在我们金融行业的定位,可能大家对这块比较感兴趣,另外会分享一下在大数据、人工智能这两个领域,互联网公司和银行合作的一些进展。首先我们看一下第一块,腾讯在金融行业的定位。
这张图它展示的是腾讯我们在和金融行业合作过程中的一个价值定位,这里面中间有一条分割线,其实我们经常把腾讯和阿里这样的公司混合在一起来讲,其实这两个公司的风格差异比较大,腾讯是一家专精在产品层面,我们一直以来做的事情无非就是一个是社交,第二个是做数字媒体,第三个支付和云计算,这是我们三块核心业务,再往上层的金融业务这个领域阿里比较多一些,腾讯我们通过投资的方式涉足,分割线在整个跟金融行业合作过程中的话,腾讯的价值定位。目前我们主要提供几个支撑平台给到金融行业,第一个提供一个技术平台,是腾讯自身在运营互联网过程当中逐渐积累的金融产品我们做一些输出。另外在场景应用层面也做一些输出,因为腾讯现在目前大概会掌握到中国互联网流量的三分之一,三分之一的流量到腾讯里面去,有一些是为了访问腾讯的资源积累的流量,还有一些用户希望获取一些金融服务,或者一些其他类型的服务。这种情况下,我们一般的模式,做一个导引,导引给上层金融行业的客户,这我们提供的第二块的支撑,以场景流量支撑我们合作伙伴的业务。中间,同时对外输出一些运营经验,现在腾讯在国内我们运营了差不多一百万台服务器,这些服务器,我们长期运营过程中,在对高可用性,对敏捷等等有独到的经验,这块我们也会做一些输出。
在整个输出里面,技术平台和运营经验是由腾讯云这个体系支持的。具体来讲,在腾讯云这个体系里面整个发展分成几个阶段。第一个阶段,其实我们叫沉淀阶段,在这个阶段,腾讯自己的资源自己用,我们另外支撑我们的QQ、微信、游戏、媒体服务。我们花了很多精力介入腾讯的体系,大家用腾讯的服务的话,发现移动互联网的业务,如果说网络不好的时候,首先能连上是腾讯的业务,我们投了很多,我们自己的应用,框架等等,投入非常多。这是第一个阶段,这个阶段腾讯自己的产品,自己的服务,自己的平台自己使用,在第二个阶段,腾讯我们借助云这个平台做了输出,我们之前投资了很多公司,目前为止大概投资了接近500家公司,这些公司的IT基础设施是由腾讯支撑的,现在有很多种新的互联网创业型公司可能做的是移动互联网的方向,自己本身可以不是技术专家,他们只需要用云资源做运营就好了,这是我们做的比较多的事情。
前两个阶段的时候,腾讯不太懂银行业务的,第三个阶段,微众银行是腾讯持股30%的银行,腾讯我们给微众银行提供了支撑,IaaS的支撑是腾讯提供的,PaaS是我们支撑的,整个支撑过程中我们逐渐掌握了金融行业客户对安全性,可控性的要求,有了这样一个技术之后,我们逐渐开始对外合作,包括在最近这一两年时间,跟我们合作的银行已经非常非常多了,这是整个的发展历程。
未来腾讯还会持续和不同行业客户做结合,帮助行业客户向线上业务,互联网业务做共同的发展,这是整个大的背景。所以腾讯云,实际上来讲支撑了腾讯对企业客户去做技术平台输出的任务。
接下来,谈一下关于大数据和AI这两个方向,刚刚主持人也谈到了,AI对于每一个人的生活其实都有很多种改变,这一点我们深信不疑。之前,像互联网公司,对于数据的应用觉得是比较深入的,现在腾讯内部大的大数据处理群,大概有32000多台服务器,这些服务器是跑在腾讯内部处理腾讯内部所有跟数据相关的任务,这是非常庞大量的集群,这个称之为腾讯的大脑,所有的前端系统进来,分析完了之后拉回去,这个体系从2009年开始建,到现在有8年的时间了,建设一个成果还是比较显著的,另外一个,确实成为了腾讯业务支撑很重要的组成部分。这我们已经在建的平台。在建平台过程中我们有很多的经验积累,当我们开始和金融行业客户沟通,发现很多金融客户告诉我说,我们想先开始做人工智能,甚至先开始做深度学习,从我们发展来讲,我们一般建议用户考虑先去做一个大数据平台,就我们的了解,现在有很多,一个是很多金融行业的客户,对于用户的数据的搜集,其实可能更多的存在于各个业务里面,分析系统中数据并没有真正的汇聚到一起来,银行有很多很多很有价值的数据,但是这些数据都是被固化在某一个业务里面,所以我们首先建议客户说,我们要把数据从已有的业务系统中收集到一个类似于腾讯的里面去,把数据搜集,才能做利用。
第二个差异,像互联网公司我们一般收集很多过程数据,A和B是好友,由于转帐发生过程输出我们都会搜集,甚至用户做了点击,我们都会记录,基于这样记录数据我们可以做深度挖掘和分析,找到用户的需求。在银行里面我们看到很多银行的场景里面用户比较关注交易数据,比如说A给B转帐多少钱,但是他们对于过程数据,用户感兴趣某一个点的产品,这些信息遗失掉了,我们跟银行合作,先建议把用户的行为数据也做记录,放在大数据平台里面来,腾讯大数据里面有几百个PB的数据,这些数据结合在一起,分析之后会产生能量,银行这个产品也是一样的,我们和银行合作的时候,逐渐一起共同建立这样一个体系,能够把银行的除了交易数据之外的数据也能搜集过来,最后集中到一起分析。这些数据是再往后做数据的精准推荐,精准营销,精准风控这样的一个非常重要的基石。
整个建设过程中跟很多银行用户聊到,很多情况下,像甲方的领导思维说,我们先弄一个分析系统,我们把报表做的更好,给到领导察看,比如说我们做互联网运营的时候,从我们的角度来说,可能更重要的一点是能够让每一个业务人员都能够看到现在这样一个趋势。比如说腾讯里面每一个负责运营的人都会去看今天增加了多少客户,这个客户年龄层次,地域是怎么样的,这些是每个业客户做运营的基础。合作过程中我们逐渐逐渐跟行业客户一起把分析模式建立起来了,让企业里面每一个人都可以看数据,用数据,基于数据做数据智能。我们做的最多的一个东西叫用户画像,其实用户画像背后会揭示很多东西,上层应用,我们有了大数据之后,我们就可以去把用户在各个不同的业务层里面的一些行为搜集过来,比如说第一个简单的用户信息,他的年龄、他的学历,他的性别,婚恋状态,这些搜集过来。除此之外还会有更多的信息,比如说行为轨迹这些信息,它的商业性这些信息,这些信息都可以拿得到。腾讯借助我们很多业务平台,我们可以拿到这个用户的付费习惯,他愿不愿意买一些付费产品,他换手机的频率等等,其实有很多信息,通过平台把这些数据进行分析,还可以结合很多用户的行为偏好。
一般来讲,我们和银行合作的时候,利用我们这样的一个平台和技术,会逐渐建议用户把体系建起来,帮助银行从海量的数据终挖掘一些含金量比较高的数据,我们经常说互联网数据是沙子,沙子里面有金子,所以我们需要扒大量的数据,如果我们把数据拿过来进行精准分析,其实可以揭示很多很多很有价值的信息, 我们先掌握用户的行为把画像画出来,画像有了之后,下一个步骤结合业务场景,比如说类似于做精准营销,要做风险防范,或者我们去做一种算法驱动的行动,比如说去做客户价值模型的预估,去做客户产品偏好的预估,用户流失量的预估,通过预估我们可以把用户标签进一步非常化。
银行掌握数据,价格比较高。但是对于社交数据,我们有一句话叫他山之石可以攻玉,把这个数据拿过来可以做更多的事情,通常来讲有一个内外部数据互通的形式,结合这个数据之后,就能够把用户的画像做进一步的丰富化。一旦丰富化了,我们从基本属性逐渐向用户的交易属性,像黑名单,像风险属性,舆论属性去做丰富,丰富好之后下一个步骤我们就可以看到有非常多的很有价值的信息,就比如说有很多营销其实是可用基本属性去做的,如果你给20岁的人卖保险基本上会失败,你给40岁左右中年男性已婚的卖保险一定会成功,有很多基本属性可以揭示很多事情。
另外一个常用渠道,旅行特征,房产特征可以揭示很多事情,我们结合模型预测,用户属于哪个风险层次,他的偏好是什么,有了这些数据之后银行再去做很多营销就非常非常容易了。有了这样一个数据框架之后,银行去挖掘自己的数据,就会挖掘出很多用来做基础营销的线索。在大数据分析平台之前对于很多银行而言,这些数据都是沉淀在,或者是被固化在一个一个垂直的业务场景当中。这个仅仅是银行用自己的数据优化业务。
另外一个还有更大的空间,现在的话除了银行自己手里有这样一些数据之外,其实在外部,在互联网界里面还有很多数据,这些数据虽然会面临一些互相分享的风险。我们数据安全法,比如说像不同机构之间的数据是不能够做分享,用户数据是不能够分享的。但是其实在有些场景下面,场景其实可以做一些合作的,如果基于这种合作,可以进一步的扩大整个数据利用的效率,就比如说在有一些用的比较多的精准的营销广告,基于刚刚的分析的图谱里面我们找到了用户感性的行为习惯,我们希望给他营销新的产品,或者把他变成某一项客户的话,这种情况下,我们就可以结合一些外部的数据,比如说精准广告推送。我们可以很精准的把某个产品的营销信息精准的推送到满足条件的一系列客户手边上去,让他精准的获取这个信息。
另外还可以由一些类似于更加精准的,我们利用机器学习算法做种子生长式的,给一万个种子客户生长出更多的客户,这些可以结合内部的银行的数据以及外部互联网数据来去做这样一个营销,这个未来的空间会更大。
刚刚提到利用大数据,我们可以做很多获客、营销这样的场景。其实除了获客、营销之外,银行的客户更关注的一点是如何去做风控,防范风险,这块的风险是非常大的。腾讯其实我们之前就基于我们自己的数据,我们做了这样一个风控体系,因为腾讯,我们有一个优势,基本上来讲任何一个网民都是腾讯的客户,这些网民的手机上,PC上多半都会有我们客户端的产品,我们跟用户交互的过程中不断的搜集很多信息,我们腾讯自己有很大的黑产数据库,一旦我们互联网上发现有坏人就会把它记录下来,现在这种黑的IP,IP是一个坏人在掌握IP大概是有两亿,每天还要增加近百万,黑卡有大概500万张,每天近千张的激增。这些都是我们已知的黑产数据库,腾讯利用这个数据库防范我们的交易风险。我们在跟银行合作过程中,发现银行业面临这个风险,因此我们跟有些银行我们做了协议接口,我们可以通过一个算法生成我们用户在端上的设备指纹,如果发现设备有异常,身份证有异常,我们可以建议他立刻阻断这个交易,可以防范大量的线上去做业务代理风险。像消费金融的,线上贷款,都是要非常快捷的完成整个交易,没有机会让人们去做这个验证,通过黑产数据库的形式,我们可以非常好的帮助金融机构防范风险。现在基本上在业界一些主要的线上金融机构都已经用这个体系了。
前面是比较成熟的技术,最近我们在跟一些银行合作的一件事情,通过知识图谱这些形式,来去防范金融风险。这个最开始的时候其实也是在腾讯内部使用的,因为我们发现人和人之间的关系,其实会揭示很多事情,而腾讯数据库里面大概有20亿个实体,比如说人或者手机的信息,20亿个实体,这实体在一起,如果以图的形式展现出来之后我们经过分析发现很多很有意思的事情。如果说是两个申请留同一个电话会揭示一些事情。另外比如说还有一些场景下,人和人,如果说一个黑产的人,周边的这些人也是黑产的情况,比例是比较高的,如果说在一个人圈子里面有两个以上做黑产的情况基本上来讲这个人的风险比较大,通过这个图谱可以揭示很多风险,基于手机号,设备号可以揭示很多东西,跟银行,像对公和对私贷款模式很像,在银行里面有一个人多投做贷款,有一个法人机构有循环担保这样一些事情。我们现在也带尝试着通过把之前腾讯分析我们内部人和人之间的关系的软件,拿到银行里面帮助银防范整个交易的风险,贷款的风险,这个效果非常非常不错。
前面谈的是一些大概列举了一下腾讯我们在大数据这个层面和银行合作的典型业务场景,现在已经有落地的案例了,大数据这个平台是一个相对来讲比较成熟的领域。另外在人工智能非常非常火的领域,在金融行业的应用更多,我们先列举一个相对来讲,我们先把人工智能的比较火的几个场景我们列一下,看看整个的情况。现在机器学习,人工智能平台,通用的应用领域主要有三个,第一个叫做语音识别,第二个是自然语言处理,第三个是图像识别,不知道各位领导了不了解,在整个三项里面其实有一项是目前来讲解决不好的,整个业界还没有特别大进展的方向,另外两个是比较好的,这两个分别是语音识别和图像识别,到现在近几年由于深度神经网络的技术发展,这两块已经非常好了,基本上来讲,在很多情况下是强于人眼的,比如我看这个人,有可能人分析不出来,但是机器可以,像iphoneX可以用影像解锁,这个电脑也可以影像解锁。就是因为这几个领域进展已经非常非常好了。中间这个自然语言处理这个领域,目前看其实还是有困难的,目前技术上解决并不完美。腾讯在三个方面都做了很多的投入。一会儿我们可以一个一个来看。首先是在语音识别这个领域,语音识别其实可能每个人都在用腾讯的语音识别,拿出微信来,我们输入一段话可以不用手输,可以用语音识别进入输入,最近我们升级一个版本,其实这个一方面是由于腾讯算法上的发展,另外一个是因为我们搜集到大量的用户数据,优化之后,性能大大提升。除了这个领域之外,我们还和很多机构合作,把语音识别应用带智能语音这个领域,我们的客服,因为这个客服是一个比较烦琐的事情,经常他们处在一个不是很好的状态里面,这个过程中服务的态度,服务的效果怎么样,是需要去考核的。在这里我们通过自动化的方式,让机器给我们做语音支持,推广之后效果非常非常好,对情绪的检测非常准确,另外关健词的准确率都非常准确,以这个形式能够节省大量的人工工作。同时一旦发现异常之后可以立刻报警,立刻有警告,这个是应用的非常成熟的领域。
除了语音识别之外,我们还把图像识别在金融行业做了很多落地的应用,刚刚提到图像识别,现在计算机能够做到比人做的更好,就比如人脸相似度识别,现在识别到58%,现在通过平台去做了一个产品,这个产品大概通过率98%,错误率低于万分之一,以这个形式来去做人脸的处理,审核成本大概能够降低95%。这一块是我们应用非常成熟的领域,刚刚提到的微众银行,腾讯自己发展的一家银行,在微众银行开户不需要提供,像面对面一样做很复杂的处理,我们只需要人脸说一段话就可以通过,以这个形式获得相应的开户的功能。
除了可以开户之外,像核保,转帐的信息认证,原来很多时候用UP,但是这种模式在移动时代是不太好使的,可能更多情况,我们可以通过人脸来去做验证,我转帐一百万可以验证的时候用人脸做,这个精度更高,更加自然,成本更低,这都是典型的人脸识别的应用场景。
这里是一个非常典型的验证的流程,首先一般来讲,验证过程,在验证过程中先拿出手机对准自己的脸,摄像头会主动获取关键点,看这个人是不是数据库里面的人,做身份验证,身份认证的同时还会做活体验证,如果这个人是照片怎么办?是个模型怎么办?我们这个算法让用户念一段数字,捕获的唇语和声音做比对,唇语和声音做比对之后完成之后才能够完成,如果验证不通过,进入人工审核这个阶段,这是目前操作非常非常成熟的应用,除了微众银行还有其他的银行做开户,转帐验证等等,这是AI领域我们用的比较成熟的一个例子。
图像识别还有一个典型的应用,叫做OCR识别,OCR是一个比较成熟的技术。近些年AI技术的发展,它大大提升了手写体的识别准确率。因为以前单纯用手写识别其实还是比较麻烦的。通过AI的技术,通过深度学习之后,我们把模型训练好之后,它可以做很多很深层次的手写识别,银行里面有大量的单据,这些单据搜集好之后都可以做自动化的识别,录入整个单据工作量减少特别多。
像以前我们跟一家外资银行合作的过程中,帮他们扫描大量的单据,我们跟顺丰合作过程中,当时案例是在两个小时之内扫描了两千万张单据,相当于几千个工作人员进行的效果,这个效果已经完全成熟和使用了。前面讲的一个做人脸的识别,一个做图像识别,一个做声音识别,这两个领域,我们在跟银行合作的过程中,如果需要的时候我们都可以广泛应用,技术上是我们叫做训练的过程。
有一个领域目前为止整个业界进展还不是太大,这个领域,就是刚刚提到自然语言处理这个领域,自然语言处理领域是AI这个领域最活跃的一个分支。因为在这个领域里边有几件事情解决不好,多轮的人机对话,知识推理,机器翻译做的也不好,今年我们发现机器翻译这个技术做的非常好,同声传译现在在很多会场上面广泛使用,就是因为深度学习的应用,通过先进的算法可以很快的把一种语言翻译成另外一种语言,这是非常精准的阶段。
还有三件事情做不好,通用阅读理解,我们给机器人一段银行的制度规定,让它去做客服,这个事情他做不了。第二个,知识推理它做不了,我们跟它说一个故事让他推理一下,它做不了。多轮人机对话,这块目前来看还是做不好。但是现在的话有一块对于深度神经网络,对于AI用的比较多的场景,其实是叫做智能客服,智能客服目前看是自然语言处理在银行应用的典型的场景,自然语言处理我们目前解决的不好,原因是因为机器很难理解自然界,在这里面自然语言处理这个领域是类似的。如果我们想在一个自然界里面来教计算机做这件事情的话很难做得到,如果在银行业务支持这个领域让计算机学会是有可能的,我们借助知识图谱告诉计算机,某个银行我们的业务是怎样的,是对公还是对私,卡里面有借记卡,有信用卡,这些信息我们是可以教给机器的。机器了解这些信息之后就可以来做自然语言处理了。
另外在客服的领域里面,还有一个优势,客服人员会不断的做客服的工作,这个数据给计算机大量的训练数据,类似于我们用阿尔法狗学围棋一样,我们有大量的数据,计算机是有可能学得会的,围棋这个问题已经很好了,目前未知智能客服解决的还不是那么好,现在已经完全具备使用价值了,现在很多银行在做跟智能客服相关的合作。
智能客服我们有一个例子,微众银行他开发这个业务的时候很早期一下子可以拿到两千万客户,如果要去做客服的话,大概需要800个电话客服,每天工作10个小时,这个刚刚创立的时候很快去有这么多的资源投入做客服工作后来他们跟我们一起合作,做了一个自动化的客服,我们叫做智能机器人来去服务他,最后发现一个智能机器人,加上8个人工客服就可以服务两千万人了,工作量聚减,97.9%服务的任务是由机器完成的,2.1% 是需要人来做。智能机器人越用越精确,用了之后会不断优化,完了之后会越来越精确,如果机器能够更多的承担客服的任务的话意味着这个公司的成本会越来越降低,目前银行里面做的很多热点,我们现在跟多家银行合作,通过我们的自然语言技术支撑他们的客服体系。
前面讲到有很多大数据、AI在银行应用的案例。现在我们到目前这个阶段,这些大数据的应用AI的应用,在银行的应用场景里面刚刚开始,未来我们可以预计还有很多很多事情可以去做,跟安全相关的,跟营销相关的,跟效益相关的,这里有特别多的事情可以去做。我们深信一点AI技术和银行业务结合,未来的前景是非常非常好的,可以帮助银行更好的获取利润,同时降低成本,同时提升用户体验,今天时间关系我们的交流到此结束,如果有感兴趣的话可以会下交流。谢谢大家!