更新时间:2024-05-21 17:37
自动分层存储是指能够在同一阵列的不同类型介质间迁移数据的技术。
自动分层技术的系统可以在子LUN级(在多数情况下是子文件级)针对不同数据类型进行自动层级化。有了这种能力,系统能够压缩分解不频繁使用的数据。其还可以根据同样的能力进行数据迁移,此外,其也能够比较这些子文件分节段的部分来进行存储和去重。通过元数据,阵列能够判断哪些部分应该去重,那些不应该。所有这一切需要的只是一个重复数据删除引擎。
自动分层存储(Automated Tiered Storage management,ATS)管理系统的基本业务加之是能够将数据安全地迁移到较低的存储层中并削减存储成本。这里的“安全”是指当进行迁移的时候,使用这些数据的应用在SLA下仍然是发挥其功能的,用户很乐意看到这一点。在其他的情况下,有必要将数据迁移到更高性能的存储层中。
一个自动分层存储管理系统由以下几个部分构成:
2、一个设置规则、收集和保存信息、执行这些规则和监控成功与否的软件层;
很多年前,阵列产品中就开始提供这种动态且非破坏性的迁移功能,一些解决方案甚至提供了阵列之间的数据迁移功能。不过,手动转移阵列的工作是既耗费时间又充满风险的,对于存储管理员来说是相当不利的。实现这一流程自动化的软件产品的出现对于减轻存储管理员负担和最大限度降低故障风险来说是很重要的。
当三年前固态硬盘首次在存储阵列中现身的时候,不管是从技术本身或者成本上考虑,自动分层存储从那时起就被认为是一个实施上最难逾越的障碍。虽然现在看起来,固态硬盘也不是在所有存储阵列里都会有,然而起码没有人会抱怨在选择存储阵列的时候,不会没有自动分层的选项。
自动分层软件在当今大多数存储阵列里是很常见的。比如说Dell在他们的Compellent产品中就有Data Progression,EMC公司的全自动分层存储(FAST),HP公司在他们3PAR阵列里应用的Adaptive Optimization,HDS公司的Dynamic Tiering以及IBM公司的Easy Tier等等。这些应用在其所支持的层级数量以及给客户能控制的程度有所不同,但从本质上来看,都是基于子LUN的分层技术。
自动分层的基本原理是,数据在创建后随着时间推移价值会逐步降低。数据主要在其创建后的72小时内被访问。在此之后访问量会骤然减少,访问频率越来越低,30天以后数据只会被偶尔访问。在这时,数据就成了“被动数据”或“冷数据”。
随着数据价值的降低,数据应当迁移到低速、低成本的存储层上。如果要手动这样做的话,这种重复操作显然非常乏味,难以满足所需工作量。换句话说,没有人会这么做。自动分层技术会基于诸如数据创建时间、访问频率、最后访问时间或响应时间之类的策略进行数据迁移。
早期的自动分层数据迁移通常是整个卷(LUN)的数据或共享文件。这涉及到海量的数据迁移,可能会导致诸多不同的结果。某单个文件的存取可能会影响许多数据。现在,数据迁移都是基于更小的计算单位,比如子LUN、文件段(各种称为块或片的数据块)、文件、对象,甚至是部分的文件或对象。
自动分层存储产品的好处是它们可以使大多数随机密集的环境受益。在少部分的数据集(<10%)被频繁访问的OLTP(联机事务处理)数据库环境中,这些产品运行良好。假设被频繁访问的数据库的百分比适合高性能介质的容量,性能就可以得到极大的提升。这可以使它们以在更短的响应时间内处理更多的事务,不会与把重做日志(redo log)、临时表(temp table)和索引(index)放进固态存储相混淆,还能提高数据库的性能。
自动分层存储系统有很多种,其中影响最小也是最安全的使用方式就是将其作为保存动态数据的缓存。缓存类型的自动分层存储系统将动态数据从传统机械存储中拷贝到基于高速内存的缓存 (RAM或者闪存固态盘)中。在这种拷贝模式中,自动分层存储系统被用作一个大型的读取缓存,几乎不保留数据的唯一副本。即使当他们通过缓存入站写入的写入加速器,保留唯一数据副本也仅仅需要几分钟的时间。