9月1日,由工业和信息化部指导,中国信息通信研究院、中国通信标准化协会主办,数据中心联盟承办的“2016可信云大会”在京隆重召开。在云计算重点行业应用分论坛上,七牛云高级副总裁杜江华发表了题为“平步云端,数据为先”的演讲。
七牛云高级副总裁 杜江华
以下是演讲全文:
大家下午好,我是七牛的合伙人之一杜江华。今天是可信云的大会,我的理解可能和大家理解的不太一样,我特别想结合我们七牛过去四五年的实践,从数据本身,从数据服务这个产业本身谈一下我们的一些认知,希望能给大家有一些收获。
那么,过去四五年,我们七牛在整个大的环境下面,就是整个助力创新创业的环境下面,帮助了超过四五十万的一些创业者跟开发者能够很好的用到我们这个云的一个服务。我今天想讲的一个主要的思想就是说,我们认为在这种励创新创业鼓的大背景下,数据服务的产业到底有什么样的重要性。在这个重要性里面,我会谈一下云的本质,我们理解的云的本质是什么。然后,讲一下我们七牛在云的浪潮里面可以提供什么样的产品和解决方案,以及我们做了什么样的事情。
首先,我们看一下我们看到的一些历史性的机会,大家可以看到最近几年,整个社会这种开放式的环境,还有是对创新的试错的一种包容性已经得到一种前所未有的一个大潮中了。大家如果想要做事情,想要去融资,特别是前几年非常方便,也会有非常多的热的资本,可能今年有一些收缩。
在这种大的历史机遇下面,我们要去考虑,我们做平台的怎么尽可能的提供更多的标准化的平台体系,能够让那些创新者能够像搭积木一样搭各种各样新的业务,这是我们从业者需要去思考的一个方向。
所以,我们认为数据服务这个产业实际上是创新创业的一个重要支撑,从互联网经济的一个特点来看,大家可以明显感觉到有这四个阶段。首先,传统的互联网阶段。然后过渡到O2O,从线上到线下,再过渡到当前,我认为是属于产业互联网的一个阶段,这是从线上、线下的一个融合。将来可能是一种体验式的经济,包括最近也很热的一些增强现实、虚拟现实,体验式经济这样各种的阶段。
但是,无论在哪个阶段,我们始终认为要做好体验式的服务,你的数据的收集跟整理是最最关键的前提。无论从现有的哪个比较成功的商业模式来看,基本上都是能够从对用户的一个数据的获取跟使用是比较成功的。
举个例子,最近几年很快成为巨无霸的一些打车类的公司,本质上成功的把基于地理位置的使用者跟车辆的一些信息的数据做了一下很好的匹配。所以,本质上就是能够对相关用户的数据做一个有效的整理、获取跟用。
那么,从这个角度来讲,做产品创新的人,做创业的人如何从创造一个独特的功能,到变成能够创造一个独特的数据使用的视角,如果从这方面有所突破,将会对整个创业会有一些更多的成功可能性。如果只是一个功能上的变化,可能没有太多的作用。
那么,从整个产业来讲,整个数据服务产业的完善程度也决定了整个创业的门槛的边界。相信在越来越多的数据相关的服务产业,包括今天的可信云大会的所有的同行,我们这个产业的完善跟规范程度将决定了整个国家我们创业到底有多难,或者整个边界是怎么样子的。
同时,我们认为服务产业是整个技术平台体系的一个重要组成。我们认为IT世界就是由数据以及围绕数据的计算工具所构成,分为三大类:第一,数据库的数据,也叫结构化数据。第二,日志类的数据,叫半结构化数据。比如说,你去访问一个电商的网站,留下一条记录,这个落款文件,这个日志。第三,非结构化数据,也叫文件类型的数据。比如说,平时用的非常多的音频、视频、图片,这种文件型的数据,我们叫非结构化数据。那么,互联网里面85%以上的新增数据是来自于第三类,就是非结构化数据。那么,从如何能够去管理这些海量的非结构化数据切入,我们能够帮助广大的创业者能够去持续的提供收集跟处理这些数据的能力。
所以,从我们的角度来看,所谓的业务云就是怎么样去管好数据,并且持续的提升数据管理的能力。这个数据有可能是你很重要的一个生产型的数据库的一个报表,也可能是一个日志文件,也可能是说你有些可以分享的一些音视频的一些非结构化数据。这是我们理解业务上云的本质。
那么,在这个业务上云的过程里面,七牛在过去几年做了很多的实践。我们希望从一个比较大的一个全景图的角度来看,我们是有一个非常强大的基础架构,基础架构包含了存储、计算、网络这么三层的一个体系,这里面有完全自研的分布式存储跟容器化的技术,这是我们核心的技术壁垒。
在这个基础设施中间我们提供了一层平台层的服务,这个平台层的服务包含了我们的富媒体云,包括最近年中发布的直播云,包括现在很热的直播行业,就是怎么样把视频的交互能够做的特别好,帮助创业者快速的上线一个好的视频服务。
最后一个就是我们的咨询服务,就是帮助广大的产业互联网的用户,利用七牛在过去五年帮助互联网用户的一些经验去帮助传统产业进行互联网化的改造,包括提供一些中间件,还有一些行业解决方案,以及方案的一些咨询和时。
从业务模型来讲,公有云是我们一个基础的能力,也是我们对基础软件的一个最基本的运营模式。所以,所有的我们的关键业务模型都是基于公有云的能力去展开。在这个共有能力的基础上,我们会通过一些中间件来帮助一些偏传统的企业搭建一个混合云的业务系统,或者是基于托管云的一个业务系统。
刚才提到基础设施,稍微具体展开讲一下。能做存储的公司很多,为什么七牛在过去几年能够成为国内做存储做的最靠谱的公司之一,是有以下几个原因的,我稍微做下广告。第一,我们的存储系统是完全的自主研发,用Google的J语言编写,所有的处理效率比同类的C语言写的都会快很多。第二,我们的成本可以做到其他一般的存储系统的36%,我们的可靠性可以达到16%,就是我们有一些自主研发的比较核心的一些算法跟技术,能够保证我们的可靠性在业内是绝对领先的。
第二个基础设施讲的是容器计算云。这个可能市面上很多公司都在基于容器做一些计算的东西。但我们的核心理念可能会想的稍微长远一点,我们希望在这个计算领域,不再只是提供一个虚拟一台机器,而是真正从使用的颗粒度来讲,提供更细的一个颗粒度,真正能够按照CPU跟内存的消耗来提供计算的一种服务。然后,我们也会在规模化的能力方面能够去同时支持数亿个容器同时进行,这也是我们规模上的突破,在自动化运营跟开发性方面我们跟Docker跟相关的开源社区保持了非常好的交流,虽然这个东西还没有推出来,我们内部研发将近有一年多时间了。
刚才介绍过平台服务,稍微展开一下。最近很热门的就是直播,无论是游戏直播,秀场直播,还是直播+生活,直播+电商,直播+体育,直播+教育,所以各行各业都在利用直播的一种交互方式来提供一些创新的业务。我们是怎么来做的?我们就是提供了整个直播推流的SDK加播放器的SDK,再加一个流媒体分发系统的CDN,让所有想做直播应用的开发者能够快速的发布他的直播应用,如果他自己做SDK,自己买一些服务器相关的设备可能需要两周时间,但是用我们七牛的直播云可能只要两个小时就可以上线他的直播应用。如果他要落存储,可以用我们刚才介绍的存储系统落下来,因为国家对秀场有些行业有要求,可能必须要存15天,有一些监管的要求。所以,这里面我们一站式的解决。如果要落存储,就可以落在我们七牛自主研发的存储上面,如果不用落,直接就通过CDN网络分发出去,要看的时候可以让用户看你的东西。所以,我们在过去短短一年多时间,在这个平台,在富媒体,特别是直播这块我们也是收获了很多客户的认可。
还有一个平台服务是我们的大数据分析平台,我们不会为了做大数据而去做大数据,因为本身七牛自己就是一个很好的客户,或者说是一个很好的用户,因为在我们自己的平台上面有海量的日志,我们的日志怎么把它收集好、分析好,就是一个很好的实践。如果我们能够服务好我们自己,意味着我们的办理在服务同样的海量系统的时候是具有可验证的价值。当然,我们这里面也有很多创新,包括我们在实时分析跟离线计算方面都有很大优势,这也是我们本身希望能够通过一些摸索,能够给相关行业的同仁输出我们大数据分析的一个平台。
前面讲的有一些我们的基础设施,还有我们的平台服务,可能比较抽象。具体来讲,通过一些案例就可以看出我们在帮助整个创新创业的浪潮里面到底做了哪些事情,这个看到的最左边的是互联网跟移动互联网的,大家可以看到像大众点评、陌陌、唱吧、美拍、蘑菇街,比如移动互联网领域有海量用户的应用,它的数据的产生、存储跟分发都是基于七牛在打造。我们基本上已经覆盖了所有的互联网的细分行业,包括电商,包括垂直的社交、娱乐、O2O,基本上都是我们的客户案例。
中间这一类相当于是在传统里面技术能力比较强的一类公司,就是像智能硬件、物联网,我们也帮助像OPPO、步步高,还有像大疆、中兴通讯、海康威视这些非常有名的公司弥补他们在智能化运营过程中间的缺失。大疆无人机是市值超过100亿美金的创业公司,但是他在视频类的数据怎么收集跟分享,我们七牛帮助他们做了很多实践,也帮助他们提高了整个视频相关的用户社区的活跃度。还有一个例子是步步高,步步高去年有一款应用,产品很火,就是小天台(音译)电话手表,它里面就是一个智能硬件,既也卫星的功能,也有手机的功能,又可以打电话,又可以语聊,所以里面有很多数据的交互。在这个数据交互怎么设计的更好,让用户体验更好,所以这个过程里面七牛也是帮助他们做了一个改良。
另外,像很多传统的一些大客户,比如广电的像Sobey,金融像平安,平安有很多互联网创新的应用,比如有平安好车、平安好医生、平安好房,都是面对2C的应用,因为有海量的互联网的访问,所以他在做APP设计的时候有一种好的云的服务能力,或者怎么帮助他的数据做一些管理跟创新。举个例子,平安好医生现在平台上也有几十万的医生用户,这些医生用户分享他的学术观点,或者基于视频或者图片的一些资料的时候,通过我们整个云服务就可以得到很大的一个帮助。
这里还有安利,安利是一个卖日用品的电商平台,所以它有一个工作站,它有一个WorkShop工作站,因为安利的销售人员特别多,可能有几十万,或者上百万的销售人员,销售人员获取这些商品跟电商资料的时候,或者说视频,或者图片都是去基于互联网的这么一个服务,然后我们也提供了一个很好的解决方案。
但是,偏传统的整体来讲,表现出非常强的兴趣,但是核心业务要去上云可能还比较早期试水的阶段。所以,我们刚才也提到,如果传统的他希望能够不要放到公有云,就会是一种折中的状态,就是做一个混合云的部署,或者做一种托管云的方案,现在很多厂家也能够提供这种方案的能力。但是,七牛在这方面是互补的能力,因为我们差异化的场景还是比较明确的,就是我们基于互联网的海量的产生数据的时候我们的方案是非常有优势的。
最后,讲的一个是把我们刚才讲的整套,包括公有云,包括数据处理整个平台,包括咨询,做的一套比较完整的一个方案,就是是国内最有名的一个监控的公司,我前面也列了,现在也不说哪个。我们从终端视频,摄像头开始,从视频的产生,到存储,到分发,到视频信息的提取,以及分析这个视频上面提炼有效的信息,通过一些Hadoop的计算,部署一些软件,提供一些事后的分析,然后还可以在这个平台上打造直播的一个服务。
比如说,某个景点,或者某个重要的路口,可以每天看到下午五点到六点是什么样的道路状况,可以预测,比如现在看到这个时间点,可以给你提供一个决策依据,就是根据历史的表现,能不能判断出今天去会不会堵,堵的概率有多大,这种整体的一套云的方案。
最后,稍微过一下整个我们七牛的一个历史。我们是可能在座很多人不知道,包括我刚才跟主持人初次见面的时候她说也没听过,我说很正常,因为我们以前做互联网,偏政府的领域可能没有什么知名度。所以,这里大概介绍一下。我们是2011年成立。我们在海量存储的领域有超过十年的技术积累。创业之前就是在WPS金山软件,还有盛大的创新院做了很长时间的自主研发的团队技术的积累,这么多年大概有10倍的增长,目前我们已经完成第一轮融资,第一轮融资大概一亿美金,投资人在国内比较有名气,像互联网的经纬、启明、宽带资本,还有嘉实基金等,我们在北京、深圳、广州、杭州、成都基本上都有我们的办公室。我们希望在数据服务领域帮助大家有更多的一些实践。谢谢大家!