HDF

更新时间:2022-08-25 11:06

Hierarchical Data Format,可以存储不同类型的图像和数码数据的文件格式,并且可以在不同类型的机器上传输,同时还有统一处理这种文件格式的函数库。大多数普通计算机都支持这种文件格式

背景及简介

文件格式是指计算机存储和处理数据的方式 。目前常用的图像文件格式很多, 如 GIF , JPG , PCX ,TIFF 等 。这些格式共同的缺点是结构太简单 ,不能存放除影像信息外其他的有用数据 ,像遥感影像的坐标值、参数等都无法在其中保存 ,而且用不同格式存储影像数据使得读取 、传输、共享变得复杂, 因此,有必要建立一种标准格式以解决上述问题。

HDF(Hierarchical Data File)是美国国家高级计算应用中心(National Center for Supercomputing Application,NCSA)为了满足各种领域研究需求而研制的一种能高效存储和分发科学数据的新型数据格式 。HDF可以表示出科学数据存储和分布的许多必要条件。HDF被设计为:

自述性:对于一个HDF文件里的每一个数据对象,有关于该数据的综合信息(元数据)。在没有任何外部信息的情况下,HDF允许应用程序解释HDF文件的结构和内容。

通用性:许多数据类型都可以被嵌入在一个HDF文件里。例如,通过使用合适的HDF数据结构,符号、数字和图形数据可以同时存储在一个HDF文件里。

灵活性:HDF允许用户把相关的数据对象组合在一起,放到一个分层结构中,向数据对象添加描述和标签。它还允许用户把科学数据放到多个HDF文件里。

扩展性:HDF极易容纳将来新增加的数据模式,容易与其他标准格式兼容。

跨平台性:HDF是一个与平台无关的文件格式。HDF文件无需任何转换就可以在不同平台上使用。

科学家通常在不同的机器上生成和处理数据文件。各式各样的软件包被用来多种处理文件,同时也与其他使用不同机器和软件的人共享数据文件。在一组文件里,这些文件也许包含不同类型的信息。这些不同类型的信息混合结构在一个文件里的意义与在另一个文件里的意义不同。这些文件也许概念上有关但在实质上却不同。例如,一些数据(符号、数字和图形)也许在不同文件中被分开,但在程序中却是在一起。有些数据也许在科学家的概念中是相关的,但实际上并不存在物理联系。HDF通过提供一个一般目的的文件结构来表明这些问题:HDF为程序提供一个从数据文件本身获取数据(数据元)信息的机制,而不是其他来源。

使用户把不同来源的混合数据存放在一个文件里,同时也可以把数据和与之相关的信息存放在不同的文件里,即便是用同一个应用程序也可以处理这些文件。常用的许多类型数据集,如光栅图像多维数组,对其格式和描述实行标准化。支持使用标准的数据格式,因为所有的机器和程序都会生成一个有明确含义的数据文件。HDF实质上能被用于任何类型的数据。

HDF 最初产生于 20 世纪 80 年代 , 到现在已经具有两个不同的产品。从 HDF1 到 HDF4 的各个版本在本质上是一致的 , 因而 HDF4 可以向后兼容早期的版本 。HDF5 推出于 1998 年, 相较于以前的HDF 文件, 可以说是一种全新的文件格式, 它与HDF4 只在概念上一脉相承 ,而在数据结构的组织上却截然迥异。HDF5 的产生与发展反映了 HDF 在不断适应现代计算机发展和数据处理日益庞大复杂的要求。HDF5 紧跟时代变化也为其自身注入活力,使它被愈来愈多的领域采纳、运用 ,许多遥感影像采取HDF 格式存取, 一些大的图像处理软件也开始提供接口读取 HDF 文件。 HDF 强大的机制适应了遥感影像的特点 ,能够有条不紊 、完备地保存遥感影像的属性和空间信息数据 , 同时使查询和提取相关数据也很方便容易 。

数据类型

HDF提供6种基本数据类型:光栅图像(RasterImage),调色板(Palette),科学数据集(ScientificDataSet),注解(Annotation),虚拟数据(Vdata)和虚拟组(Vgroup)。

RasterImage数据模型被设计成能为光栅图像数据的存储和描述提供一个灵活的方法,包括8比特和24比特光栅图像。Palette作为颜色查找表提供图像的色谱。它是一个表格,其表中每列的数字表示特定颜色的数字。ScientificDataSet模型是用来存储和描述科学数据的多维数组。Vdata模式是用来存储和描述数据表格的结构。HDF的Annotations是文本字符串,用来描述HDF文件,或HDF文件包含的HDF数据对象。Vgroup结构模型被设计为与相关数据对象有关。一个Vgroup可以包含另一个Vgroup以及数据对象。任何HDF对象都可以包含在一个Vgroup中。

HDF文件的3层交互

HDF文件可以在几个交互层次中可视。在最底层,HDF是一个存储科学数据的物理文件格式。在它的最高层,HDF是集工具和应用于一体的数据文件,可以对HDF文件中的数据进行修改、显示和分析。在这两个层次之间,HDF是一个能提供高层和底层编程接口的软件库。

基本接口层,或称为底层的应用编程接口(API),是为软件开发者保留的。它是为数据流的直接文件I/O、错误处理、内存管理和物理存储而设计的。它是一个为有经验的HDF程序员提供的软件工具。比较目前从高层接口得到的功能,通过使用这些基本接口层,HDF程序员创建HDF文件时能够做更多的事。底层接口例程只提供C语言。

HDFAPIs(HDF应用编程接口)分为两类:多文档接口(用于新版本)和单文档接口(用于旧版本)。多文档接口是提供从一个应用中同时连接几个HDF文件的接口,这点很重要,但单文档接口并不支持这点。用户在开发新的接口和界面时,必须提醒他们是在一个改进了的新接口版本下开发的。为了向上兼容,旧版本仍然保留。

HDFAPIs包含几个独立的例程集,每个例程集是专门为简化一种数据类型的存储处理而设计的。尽管每个接口都要求程序调用,但所有底层细节都可以忽略。大多数情况下,只须在正确的时间调用正确的函数,剩下的事就由接口程序处理。多数HDF接口例程都有FORTRAN-77和C语言。也有用于Java程序员访问HDF文件的JavaHDF接口程序。

HDF4和HDF5

简述

新一代的HDF5是由NCSA于1998年发布。NCSA支持HDF4并还将继续支持几年(细节如下)。HDF5被设计为改善HDF4的一些局限性。HDF4的某些局限性有:

单个文件不能存放多于20000个对象,单个文件大小也不能大于2G字节。

数据模式的兼容性不够好,有过多的对象类型,数据类型太严格。

库函数过时和过于复杂,不能有效地支持并行口的I/O,很难用于线程应用中。

HDF5包含如下的改进:

被设计为一种新的格式用来改进HDF4.x,特别是每个文件可以存储更大的文件和更多的对象。

数据模式更简洁、更全面,它包含两个基本结构:多维数组记录结构,和分组结构。

更简洁、更利于工程库和应用编程接口,支持并行I/O,线程和其他一些现代系统和应用要求。

虽然HDF5比HDF4有明显的优势,但HDF4仍然是在科学界使用得最为广泛。许多应用软件都是基于HDF4库开发的,许多数据产品是按HDF4格式生成的。把这些应用和数据产品从HDF4转换为HDF5需要花费时间和费用。因此,NCSA仍然支持HDF4并还将持续几年。

HDF4 与 HDF5 的文件组织与比较

总结

HDF 是一种功能强大 ,广泛运用于科学领域的文件格式。研究它的组织结构特别是HDF5 的组织结构对于处理和管理地理信息系统的海量图形数据和属性数据具有一定的借鉴作用。掌握和运用NCSA提供的API 提取影像数据 ,可以节省时间, 提高程序编写效率。

二胺

异硫氰酸荧光素 (fluorescein isothiocyanate, FITC) 的衍生物。FITC纯品为黄色或橙黄色结晶粉末,易溶于水和酒精溶剂。有两种异构体,其中异构体Ⅰ型在效率、稳定性与蛋白质结合力等方面都更优良。FITC分子量为389.4,最大吸收光波长为490~495nm,最大发射光波长为520~530nm,呈现明亮的黄绿色荧光。FITC在冷暗地干燥处可保存多年,是目前应用最广泛的荧光素。其主要优点是人眼对黄绿色较为敏感,通常切片标本中的绿色荧光少于红色。

中文名称:异硫氰酸荧光素

分子式:H21H11NO5S

分子量:389.390

外观:黄色粉末

含量:≥98%

纤维板

high-density fiberboard,又称Hardboard。与刨花板不同的是,虽然通常会添加树脂,木纤维的粘合不需要添加其它材料。且不像刨花板,它不会断裂和破碎。

加工方式:有干法和湿法两种加工方式:湿法一面光滑,干法两面光滑。

血液透析模式:血液透析滤过。

缩写

化工大学附属中学 化大附(hua da fu)

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}