虚拟化改变了计算机使用存储的方式。就像物理机器抽象成虚拟机(VM:VirtualMachine)一样,物理存储设备也被抽象成虚拟磁盘(VirtualDisk)。今天我们就来聊聊虚拟化存储(StorageVirtualization)技术,究竟虚拟磁盘是怎样实现的?
虚拟磁盘的实现
我们知道,服务器扩展存储的手段主要有直连存储(DAS)、存储区域网络(SAN)和网络附加存储(NAS)这三种类型。那么哪种存储类型可以用来实现虚拟磁盘呢?
在虚拟化环境中,类似VMWare这样的虚拟机管理程序hypervisor,要同时给很多VM分配存储空间。这个过程中,我们需要先把物理存储资源重新划分成虚拟磁盘,然后再分配给VM.
显然我们不能用DAS方式把物理磁盘直连到VM上,如果这样,需要的物理磁盘就太多了。SAN是以逻辑单元(LUN:LogicUnit)的形式提供存储资源,但虚拟环境下的VM数量很大,LUN的数量也不足以支撑这么多虚拟磁盘。更重要的一点,虚拟磁盘对于众多的VM来说是共享的,因为VM需要随时创建、删除或者迁移,在迁移VM的时候就需要共享存储,只有这样原来的数据才不会丢失。无论DAS还是SAN,都不适合共享存储。
考虑到资源分配以及共享的问题,hypervisor采用NAS的方式来实现虚拟磁盘。VMware通常采用VMFS(VirtualMachineFileSystem)或NFS协议来实现虚拟磁盘,VMFS是专门针对虚拟机环境的文件系统协议。
每个虚拟机的数据实际上就是一堆文件,最主要的文件就是虚拟磁盘文件(VMDK文件),此外还有交换分区文件(vswp文件,相当于swap)、非易失性内存文件(nvram相当于bios)等。每个VM对虚拟磁盘的IO操作,实际上是对这个虚拟磁盘文件的读写。
VMFS的设计、构建和优化针对虚拟服务器环境,可让多个虚拟机共同访问一个整合的群集式存储池,从而显着提高了资源利用率。采用VMFS可实现资源共享,使管理员轻松地从更高效率和存储利用率中直接获益。
那么我们如何在云计算中使用虚拟磁盘呢?
实例存储
最主要的一种使用虚拟磁盘的方式就是实例存储,每一个VM就是一个虚拟机实例,hypervisor在每个实例中提供仿真的硬件环境,包括CPU、内存和磁盘。这种方式,使得虚拟磁盘成为虚拟机实例的一部分,就像物理世界一样。VM删除后,虚拟磁盘也会被删除。
这种实例存储模型中,虚拟磁盘与虚拟机之间的存储关系,实际上是DAS存储。但虚拟磁盘的底层实现,上面我们说了,是用NAS方式实现的。而hypervisor的作用就是把VM层的存储模型,与虚拟机下层的实现协议(VMFS或NFS)分离开了。
卷存储
实例存储有它的限制,开发者一般希望把实例数据(比如OS以及安装的一些服务器应用软件)和用户数据分开,这样重建VM的时候可以保留用户的数据。
这个需求衍生出另外一种存储模型:卷存储。卷是存储的主要单位,相当于一个虚拟的磁盘分区。不属于虚拟机实例的一部分,可以认为是虚拟机的外置存储设备。
卷可以从一个VM卸下,然后附加给另外一个VM.这样我们就实现了实例数据与用户数据的分离。OpenStack的Cinder就是一个卷存储的实现。
除了实例存储和卷存储,最后我们再说一说另外一种比较特殊的虚拟化存储:对象存储。
对象存储
很多云应用需要在不同的VM之间共享数据,经常需要跨越多个数据中心,对象存储可以解决这个问题。
在对象存储模型中,数据存储在存储段(bucket)中,按字面意思bucket也可以被称为“桶”。我们可以用硬盘进行类比,对象就好比文件,存储段就像是文件夹(或目录)。对象和存储段可以通过统一资源标识符(URI:UniformResourceIdentifier)查找。
对象存储的核心设计思想其实也是虚拟化,具体说来,就是把文件的物理存储位置,比如卷、目录、磁盘等,虚拟化为bucket,把文件虚拟化为对象。对应用层来说,简化了对数据的存取访问,屏蔽了底层存储技术的异构性和复杂性。
当然你也许会问,NAS存储技术不是也可以解决数据共享的问题吗?
由于对象存储的规模优势和成本优势,很多云环境采用对象存储来代替NAS.由于对象存储将遍布于很多节点且最新的数据并非总是可用,所以对象存储的数据一致性不强。如果对强一致性有要求,那么可以使用NAS.目前在云计算环境下,NAS和对象存储是共存的关系。和NAS一样,对象存储也是软件架构,不是硬件架构。应用直接通过RESTAPI来访问对象存储。
结语
在实际的云平台应用中,我们需要根据自己的实际情况来合理运用不同的虚拟化存储技术。
对于非结构化的静态数据文件,如音视频、图片等,我们一般使用对象存储。对于系统镜像以及应用程序,我们需要使用云主机实例存储或者卷存储。对于应用产生的动态数据,我们一般还需要利用云数据库来对数据进行管理。