随着云计算大数据的不断发展和成熟,人工智能引发了新一轮的技术变革,成为未来信息技术发展的风向标,计算力作为人工智能的三要素之一,GPU/FPGA芯片的加速能力也得到业界的广泛关注和重视。基于此,国内云服务商开始发力GPU云主机市场,加大对基础设施的投入。

500640785_wx

由于FPGA与GPU相比,FPGA使用门槛较高,因而GPU应用更为广泛。目前,GPU云主机主要用于机器(深度)学习、图形处理、科学计算、视频编解码等场景,为了顺应市场发展需求,由中国信息通信研究院主导的可信云评估体系新增了对GPU主机的评估标准,相对于云主机,GPU云主机在服务形态仍有所差异,性能无疑是用户重点关注的指标之一。

首批评估对象囊括了国内公有云厂商的第一梯队, 阿里云、腾讯云、华为云、百度云、天翼云、UCloud六大厂商齐聚首,堪称行业水平实力担当。为了更好的让用户认识和了解GPU云主机,本次评估重点考察了大家关注的指标和GPU云主机特有的指标,如服务功能、资源调配能力和性能。 GPU云主机目前应用于机器(深度)学习占据了较大比例,今天主要讨论基于深度学习的性能评估测试。

资源选型

1

目前主流的GPU型号主要是Nvidia的Tesla K、M和P系列,本次评估的资源选型基于P系列两个型号进行,6家厂商分为P40和P100两组,在资源规格上,阿里云和腾讯云可同时提供A卡和N卡。GPU性能指标官方数据主要体现在单精度和双精度,对用户不具有实际的参考意义, 模拟用户进行机器学习训练,直观反映GPU主机性能,更加贴近用户需求。

深度学习模型

深度学习的训练主要依靠模型和数据集,国际上比较具有代性的训练模型主要有:AlexNet模型、Cifar10模型、MNist模型、ResNet模型,此次评估选择其中三个机器学习模型,数据集上的选择,ImageNet数据量相对权威,但是有数据量过大,国内镜像较少,不适合用于短期的测试验证。本地评估测试主要基于机器学习模型默认数据集或数据精简集。以下是常见的深度学习模型:

01 AlexNet模型:

是Alex和Hinton参加ILSVRC2012比赛的卷积网络模型,网络结构是开启更深CNN的开山之作,其对CNN的一些改进成为以后CNN网络通用的结构。

02 Cifar10模型:

是典型的卷积神经网络结构,包含相应的卷积层,池化层,修正线性单元以及最顶层带有分类器的归一化采样层。数据集为一个使用非常广泛的物体识别图像数据集,CIFAR-10数据中包含了60000张32×32的彩色图像,其中训练集50000张,测试集10000张。

03 Mnist模型:

MNIST是一个入门级的计算机视觉数据集,它包含各种手写数字图片,包含60000行的训练数据集(mnist.train)和10000行的测试数据集(mnist.test)。

04 ResNet模型:

深度残差网络。该网络对residual block和shortcut connection的引入,使网络能够达到更高的层数并且不会发生网络退化现象。ResNet是由KaiMing He在2015年发表,并基于该模型获得了当年ImageNet detection,ImageNet localization,COCO detection等多个比赛的冠军。

测试环节

在实际测试环节,首先要做的是搭建环境,如GPU驱动、CUDA等必要条件,其中部分厂商已经在操作系统镜像集成了GPU驱动,减少了安装的工作量;在配置深度学习库TensorFlow时,需要正确安装对应版本的CUDA、cuDNN、Python等环境,也有厂商帮用户提供好了容器的镜像文件,细节体现差异,真正做到省时省力;结果处理环节,首先保证足够多的数据量,将各个模型测试结果保存到本地文件,去除首末端噪点数据,再对数据进行去除坏值,求最大、最小值、平均值、中位数、方差等数据,最终将数据可视化。

应用案例性能测试

除了使用经典机器学习模型进行性能测试之外,同期举办的云计算性能创新大赛广泛征集了高校优秀案例,对GPU云主机性能进行了验证。案例的取材包含了大型仿真、机器学习、科学计算等热门应用场景,其中来自清华和兰大的应用案例得到了专家评审的一致高度认可,体现了学术界和产业界的完美结合,成为云计算助力行业应用的成功典范。

目前首批评估的测试工作即将接近尾声,结果也将于3月22日的云计算开源产业大会高性能分论坛公布,如果您关注高性能计算、关注GPU云服务,一定不要错过这此盛会。

相关链接:http://www.idcquan.com/Special/OSCAR2018/reg.html

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2018-03-14 09:52:00
云资讯 印象笔记发布官宣:即日起正式将服务迁移至腾讯云
印象笔记团队在官方博客发布了维护通知称印象笔记工程师团队将于北京时间 2018 年 3 月 13 日至 17 日正式将印象笔记服务搬迁至腾讯云。帐户数据迁移会分批进行,每一批帐 <详情>
2018-03-13 16:49:33
国内资讯 工信部:腾讯云 奇虎等厂商违规自建传输网络
3月8日,工信部下发《关于集中力量核查违规线索查处违法企业的函》,针对违规企业违法自建传输网络等行为进行了通报批评,违规企业主要分为三类:自建传输网络、开展跨境经 <详情>
2018-03-13 10:10:00
云资讯 腾讯云与爱数达成合作,推出“云数”解决方案
在合作模式中,腾讯云服务器、腾讯云数据库、腾讯云存储与爱数AnyShare Cloud共同打造基于公有云网盘、混合云网盘的企业网盘体系,将用户内部和外部的文件分开,比较私密的 <详情>
2018-03-12 14:30:01
云资讯 外媒:又一片红海 阿里腾讯争夺云计算业务
如今,腾讯阿里两家公司正投资云端的数据存储和软件服务,开发企业和政府客户,阿里巴巴约占中国市场的60%,截至12月底,该季度客户数量超过100万,收入达5.53亿美元(约35 <详情>
2018-03-09 18:29:06
云资讯 腾讯云携手星家加,共建云端智慧零售生态体
3月9日,腾讯云计算(北京)有限公司(以下简称“腾讯云”)、星家加(母公司为深圳市启明星电子商务有限公司)共同举办以“共创智慧零售新未来”为主题的签约仪式,山东凌 <详情>