将所有数据存储在硬盘服务器上似乎不太实际。因此,外部数据存储是扩展服务器容量的一种流行方式。然而,它们的特性和初始成本差异很大。因此,我们总结了它们的优缺点,以便您更轻松地选择。在某种程度上,创建具有理想参数的外部存储是相当困难的。有大量的硬件组件、软件类型和协议,从而为存储提供了特定的功能。
为了区分基本标准,使用缩写NAS、SAN 和 DAS。为了能够解释这些,有必要介绍两个基本类别的外部存储。因此,存储是根据数据读取和记录的级别来定义的。第一种类型处理文件级别的数据,这意味着这种存储基本上作为具有自己文件系统的服务器工作。因此,客户端的服务器发出“将 X 位写入此文件”或“从该文件中检索 X 位”的命令。这种存储被分配为 NAS。
另一种选择是访问块级别的数据。因此,服务器和存储之间的通信速度更快,因为它直接工作,即“写入信息块 X”或“检索块 X”。此类存储相互连接,并与服务器作为 DAS 或通过 SAN 连接。
NAS 作为基于文件的存储
网络附加存储 (NAS) 是通过网络连接的存储。由于数据是在文件级别处理的,因此 NAS 在服务器看来是一个拥有自己文件系统的网络服务器。NAS 存储可能有多种形式;例如,可以将包含不同数量的可交换硬盘的其他服务器、虚拟机和/或所谓的磁盘站连接到处理服务器。
这些可能被安排为一个大单元,或作为一个RAID 阵列。在这种情况下,数据以特定的方式类比存储在两个或多个独立磁盘上,因此如果其中一个磁盘发生故障,则不会有任何损失。通常,为了描述安全级别,使用术语 RAID 和编号。例如,与 RAID 1 相比,RAID 6 具有更高的数据安全性。
使用通过 Internet远程访问文件的协议,以便服务器与 NAS 存储进行通信。网络文件系统 (NFS) 既适用于 Linux 系统,也适用于 Windows 中的服务器消息块 (SMB)。
SAN 和 DAS 以及面向块的存储
面向块的存储包括两个子类别,具体取决于它们连接到服务器的方式。首先,可以应用直接连接到服务器的直接附加存储(DAS)。其次,磁盘阵列和存储通过称为存储区域网络(SAN)的专用数据网络连接。
硬盘、SSD 和磁盘阵列可以用作 DAS。这些存储以多种方式连接——通常应用SAS 或 SATA。与 SAN 相比,DAS 效率更高且通常更便宜。另一方面,DAS 的可扩展性不大。连接的计算机数量受 DAS 上 SAS 端口数量的物理限制。关于磁盘阵列,通常的数量是四个。
这就是为什么许多公司和机构更喜欢通过 SAN 连接的面向块的存储。这个数据网络连接了几个独立的磁盘阵列,或者可能是 NAS,它们相互之间联网,并通过交换机连接到服务器。如果某些节点受到物理损坏,其他存储不会受到威胁,从而降低了数据丢失的风险。
独立存储和服务器之间的信息传输是通过高度可扩展的分离网络促进的,因此可以连接大量存储和终端服务器。为了在 SAN 架构中的存储和服务器之间交换数据,应用了各种网络技术,例如光纤通道 (FC)、以太网和/或以太网光纤通道 (FcoE)。对于更长的距离,光缆主要用作传输介质。金属直连铜缆 (DAC) 有助于缩短距离。
根据网络,或根据需要,需要选择一种方便的传输协议。光纤通道协议 (FCP)、互联网小型计算机系统接口 (iSCSI) 和最近的 NVME-oF(NVM Express over Fabrics)是最常实施的。FCP 可以与网络技术 FC 或 FcoE 一起使用。ISCI 协议适用于以太网,但它可能会出现故障,特别是考虑到数据丢失。因此通常使用无线融合以太网。
目前,使用最广泛的协议之一是NVME-oF协议,因为 SSD 存储可以通过它共享,同时保持高性能。旧类型的协议建立在普通磁盘上,但在连接 SSD 磁盘时,它们的工作效果不如 NVME-oF。
确保高可用性
通过 SAN 连接的 NAS 和面向块的存储都可以(但不是必须)实现高数据可用性。这并不总是必要的。例如,要归档税务记录,您实际上并不需要立即获得数据。如果将存储中的数据用于移动应用程序或大型电子商店,则必须具备高可用性。它可以通过两种基本方式提供,软件或硬件,Dell EMC 等公司为其制造合适的组件。关于 NAS、FreeNAS、NasLite 和GlusterFS——它们也在我们的 DC 中实施——使用了程序。通过 SAN 连接的面向块的存储可以使用CEPH、vSAN(用于VMware vSphere虚拟化)软件或 Microsoft Storage Spaces 应用。
SAN和NAS的比较
通过 SAN 数据网络和 NAS 存储类型连接的面向块的磁盘阵列用于通过网络扩展服务器或计算机的容量。在这两种情况下,数据都可以在多个节点中共享,因此它们不必单独存储在每个服务器和计算机上。NAS 的一大优势是更易于实施和管理。这显然取决于NAS的具体级别;考虑更复杂的解决方案,必须有专家在场。即使没有更深入的管理知识,也可以连接和设置最简单的。
相反,SAN 连接了许多软件和硬件组件,因此与具有相同容量的要求不高的 NAS 相比,成本更高。就在几年前,只有银行等大型机构——它们的工作需要高级存储——才能负担得起连接在 SAN 中的块存储。但是,这不再相关;由于 SAN 的价格已大幅降低,因此一般公司都可以使用它。不幸的是,它的设置和管理仍然非常昂贵。然而,为了存储机密或其他敏感数据,这是必须的。由于分离的网络,为数据提供了更高的安全性。
通过 SAN 连接的块存储 | 面向文件的 NAS 存储 | |
使用的网络 | 专用(隔离)网络 | 与普通流量共享的数据网络 |
数据存储 | 块级 | 文件级 |
连接到服务器 | 作为本地硬盘 | 作为文件网络服务器 |
协议 | NVMe-oF、FCP、iSCSI | NFS、中小企业 |
管理和维护 | 具有挑战性,需要专业知识 | 易于更简单的变体 |
文件系统 | 服务器级 | 存储级 |
购置和运营成本 | 很高 | 相对较低 |
适用用途 | 高IOPS数据工作与共享 | 存档和共享未调整的数据 |
选择通过 SAN 连接的块存储,还是 NAS 足够?
上述两种解决方案在很多方面都不同;因此,在实践中它们被用于各种目的也就不足为奇了。而且,存储的优势结合在企业中是很常见的;由于特殊的多协议,服务器能够与NAS进行适当的通信,并根据需要在SAN的框架内。尽管如此,重要的是提前考虑您将使用网络存储的目的。
例如,NAS 非常适合在公司内部共享文件。因此,每个人都可以访问他们经常用于工作的相同手册、照片和文件。同时应该理所当然地认为NAS中共享的文件不会经常调整。考虑到其较低的购置和维护成本,NAS 用于存储和归档大量数据,尤其是视频等非结构化数据。因此 NAS 主要用于存储安全摄像机镜头。NAS 网络存储偶尔用于扩展虚拟和/或普通服务器内存,特别是对于不经常读取和/或重写的数据。
SAN 特性,例如高性能和可用性,以及低延迟,通常用于频繁调整且必须立即可用的数据。使用高速隔离网络以及整个 SAN 架构的通信允许高频率的 IOPS(每秒输入和输出)。因此,它们适用于拥有大量访客的大型电子商店。它还适用于使用数据库或其他活动数据的应用程序,这些数据不切实际或不可能存储在安装应用程序的服务器上。以极少的延迟快速备份大量数据也很受欢迎。由于其特性和可预测的性能,连接 SAN 的存储设备也可用于视频流。
只知道存储类型是不够的
但是,要为特定目的谨慎地选择数据存储,您必须知道比哪种数据访问类型和服务器连接更合适。硬件组件、存储类型、协议、网络以及在某些情况下甚至软件的整个组成和设置都是炼金术,这通常需要专业经验。
在 MasterDC 中,我们提供具有单独数量的磁盘和 RAID 级别的 NAS 存储服务器,既适用于共享生产数据,也适用于数据备份和存档。对于要求高可用性和低延迟的更高要求的客户,我们还提供通过 SAN 连接的磁盘阵列。
我们的高级管理员还实施、设置和管理软件定义的存储。关于 NAS,我们使用开源程序 GlusterFS。对于在 SAN 中连接的更高级的软件定义存储,我们使用与 VMware vSphere 兼容的 CEPH 和/pr vSAN 优化存储。