大家下午好!今天我代表我们团队来讲一下“粤教云”2.0,今天分为三部分:第一,简单介绍一下“粤教云”,第二,什么叫“粤教云”2.0,以及我们做的IT实验云。
对于“粤教云”是源自于2012年我们团队承担了广东省重大科技专项计划项目,名字就是“粤教云”,实际上是广东省教育云的缩写,经过“十二五”期间的发展,目前成为真正落地的行业云,具体表现在省政府和教育厅是比较认可它的,在省政府三个主要文件当中都提到了“粤教云”的地位,包括我们省的云计算发展规划,互联网+行动计划,以及广东省教育的“十三五”发展规划。我们是广东省云服务工程技术研究中心,它的角色是支撑“粤教云”计划的协同创新的平台,同时也是整个项目团队依托的单位是设在我们这里的。我们中心主要任务有两类,第一,负责“粤教云”总体设计,技术标准和解决方案,给教育厅提供咨询。第二,依托一些省的项目进行关键技术攻关和系统解决方案提出。“粤教云”发展到今天,基本上包含下面的内容,在数据中心层面,已经有几个地市数据中心建成了,包括建在广州的省数据中心,包括深圳、佛山、珠海都有。在数据中心之上是一个云管理平台,目前来说有三种方式,一种是购买商业化的VMWare产品,还有一些是采用OpenStack,还有一些是物理机加操作系统。在云管理平台基础之上建立一个“粤教云”公共管理平台,它的目的是提供一些共性服务,包括统一身份认证,基础数据管理,在公共服务平台之上是一些教育云应用,我们知道服务端教育云应用主要分为三大类,一类是教育管理,第二是教学管理,比如来支撑它的课堂学习,课前、课后、师生交互,其中有一类比较特殊是把教育资源类管理提出来了。现阶段“粤教云”是处于1.0阶段,它的主要特点有三个,一个是以基础设施和运维人员为核心的,主要采用虚拟化技术,建设的重点是体现在IaaS和SaaS两个层次上,我们可以看省教育中心和珠海中心跑了一些应用。它的特点和不足体现在什么地方呢?第一,从资源管理来说,它的资源利用率是比较低的,因为它是以虚拟机为单位分配资源,另外资源和上面跑的应用是静态绑定的。第二,人力成本比较高,管理规模有限。从应用管理来说,是缺少通用的标准,各个应用不能无缝衔接和远程部署。这些特点并不是我们“粤教云”项目单独有的问题,无论是现在教育部正在主导的三通两平台,还有各地正在建设的政务云也都有类似的问题。
在“十三五”期间,广东省在教育信息化有几个重点工程,一个是教育大数据,一个是智慧教育,一个是优质教育资源共享的。如果还按照以前的建设模式,就是再建一批数据中心,专门跑这些业用,专人手工管理,这样做的话会造成资源浪费而且人力成本也是比较高的。因此我们在“十三五”期间应该建设2.0,它的含义是什么呢?根据1.0的不足,原先我们是以虚拟机为单位来分配资源,现在是强调以容器来为单位,原来是静态绑定的,现在希望是动态共享的模式,原先是人工分散的管理各个地方的数据中心,现在希望有自动管理的统一管理系统,在应用管理层,希望实现标准化、自动化的管理。它的实现实际上在原先的1.0基础上,增加一层应用引擎,它的功能很简单,向上自动管理应用的生命周期,向下自动管理数据中心。云应用引擎是什么呢?我们用一句话总结它的特点,就是采用容器和容器云实现的标准化、通用PaaS,功能有两类,向下自动管理服务器集群,这个集群有可能是跨数据中心的,有可能是物理机,也有可能虚拟机,潜在规模也可能比较大的。向上要自动管理应用的生命周期。总的来说,我们提出应用引擎体系架构,涵盖整个应用的生命周期,比如从开发阶段,到构建、打包,到部署、运行,运行之后对外提供访问模式,包括它的维护以及管理,完全实现自动化手段。
根据以上的这些内容,我们分析2.0主要任务分为三大类,第一,标准化体系制定宣传推广。这里的标准包括两大类,一类是平台层标准,包括容器镜像,运行时、分发以及编排标准。第二,在应用层,希望实现跑在“粤教云”上的所有应用实现数据互通和功能组合。第二个任务是要实现云应用引擎研发部署和运维,包括试点运行和全面部署两个阶段,目前我们已经实现了它的研发,即将开始试点运行,希望在“十三五”全面部署起来。最后希望“粤教云”实现向上管理云应用基础之上,把它的应用领域拓展,因为目前的“粤教云”主要是在基础教育,希望扩展到职业教育、高等教育的领域,开展一项叫做IT实验云服务,在SaaS层拓展。我们说的IT实验云,用一句话总结,希望它是面向大规模用户,提供IT全栈在线实验服务。包含两项关键技术:一个是大规模实验环境自动构架,另一个是实时大数据分析与评价。这里面的大规模用户是什么呢?首先是面向广东省全体职业院校计算机专业的师生们,这里的IT全栈根据ACM和IEEE2013制定的体系标准。这些横跨几个层次,包括平台、运算和分布式计算。针对这样的知识体系,它实际上需要三类实验环境的,一个是单机类,第二是多机类的,还有一类比较特殊的就是编程类的,要想实现这样的实验环境,对于机器类实现标准有两大类,第一类是虚拟机或者采用硬件辅助虚拟化实现的虚拟化容器,第二类是直接用操作系统虚拟化实现的容器技术也可以,也是包括两大类,一个是系统容器,一个是应用容器。编程类就希望提供集成的开发环境,好是在线的,另外要提供持续集成和持续部署的服务,来支撑编程类的实验。如果要支撑大规模用户,这么多学科,显然我们需要容器云平台把它支撑起来,按需实现实验环境,实验环境可以是虚拟机类,也可以是容器类的,统一管理起来,用户在里面做完他的实验以后,他操作的过程信息和结果信息,源源不断送到大数据分析引擎当中,形成一个分析报告。这里所谓的实时大数据分析与评价包含几个要点,第一,它搜集的信息是实验过程当中交互的信息,包括两类:一类是操作序列,另外一类是编写程序。这些信息搜集到一个Spark框架里进行处理,利用一些无论是统计分析方法还是机器学习方法,希望能够识别出实验过程当中,我们会给他一个判断,你做对没有,如果做错了应该分析出错在哪里,应该从哪里改正,希望达到这样的效果,所以我们做一个事情起了一个比较时髦的名字DeepTutor,这里面采用类似的算法,跟谷歌在 AAAI 2017 上发表的 DeepFix 差不多。它的是利用神经网络把错误识别好进行改正,我们主要是着眼于识别程序错误,这也是我们做的IT实验云的工作。以上就是我今天向大家汇报的内容,包括我们“粤教云”大概是什么项目,“粤教云”2.0具体要做什么工作,最后我们要开发IT实验云的项目服务,如果大家有什么问题或者有什么合作的意向可以发电子邮件,我们进一步探讨,谢谢大家!