TFS - 知识百科

TFS

更新时间：2022-08-26 11:23

TFS（Taobao File System）是一个高可扩展、高可用、高性能、面向互联网服务的分布式文件系统，主要针对海量的非结构化数据，它构筑在普通的Linux机器集群上，可为外部提供高可靠和高并发的存储访问。TFS为淘宝提供海量小文件存储，通常文件大小不超过1M，满足了淘宝对小文件存储的需求，被广泛地应用在淘宝各项应用中。它采用了HA架构和平滑扩容，保证了整个文件系统的可用性和扩展性。同时扁平化的数据组织结构，可将文件名映射到文件的物理地址，简化了文件的访问流程，一定程度上为TFS提供了良好的读写性能。

特性

1。全部扁平化的数据组织结构, 遗弃了传统文件系统的目录结构

2。使用HA架构和平滑扩容

3。支持多种客户端

4。支持大小文件存储

5。可为外部提供高可靠和高并发的存储访问

6。支持大文件功能

7。 Resource Center Server，用于管理TFS集群的用户资源配置

8。 TFS服务程序开发框架，统一TFS网络客户端库，并新增异步回调功能

9。优化数据流，让写请求尽可能均匀的分布在不同的DataServer

总体架构

一个TFS集群由两个NameServer节点（一主一备）和多个DataServer节点组成。这些服务程序都是作为一个用户级的程序运行在普通Linux机器上的。

同时为了考虑容灾，NameServer采用了HA结构，即两台机器互为热备，同时运行，一台为主，一台为备，主机绑定到对外vip，提供服务；当主机器宕机后，迅速将vip绑定至备份NameServer，将其切换为主机，对外提供服务。图1中的HeartAgent就完成了此功能。

TFS的设计目标是海量小文件的存储，所以在TFS中，将大量的小文件（实际数据文件）合并成为一个大文件，这个大文件称为块（Block），每个Block拥有在集群内唯一的编号（BlockId），Block Id在NameServer在创建Block的时候分配， NameServer维护block与DataServer的关系。Block中的实际数据都存储在DataServer上。而一台DataServer服务器一般会有多个独立DataServer进程存在，每个进程负责管理一个挂载点，这个挂载点一般是一个独立磁盘上的文件目录，以降低单个磁盘损坏带来的影响。

免责声明

隐私政策

用户协议

目录 22

0{{catalogNumber[index]}}. {{item.title}}