第四节 空间数据的元数据
一、元数据概念与分类
1.元数据概念
“meta”是一希腊语词根,意思是“改变”,“Metadata”一词的原意是关于数据变化的描述,即关于数据的数据。到目前为止,科学界仍没有关于元数据的确切公认的定义。但从各专家的定义中可以发现如下共同点:
元数据的目的:无数据的根本目的是促进数据集的高效利用,另一个目的是为计算机辅助软件工程(CASE)服务。
元数据的内容:包括对数据集的描述;对数据集中各数据项、数据来源、数据所有者及数据序代(数据生产历史)等的说明;对数据质量的描述,如数据精度、数据的逻辑一致性、数据完整性、分辨率、源数据的比例尺等;对数据处理信息的说明,如量纲的转换等;对数据转换方法的描述;对数据库的更新、集成方法等的说明。
元数据的性质:元数据是关于数据的描述性数据信息,它应尽可能多地反映数据集自身的特征规律,以便于用户对数据集的准确、高效与充分的开发与利用。不同领域的数据库,其元数据的内容会有很大差异。
元数据的作用:通过元数据可以检索、访问数据库,可以有效利用计算机的系统资源,可以对数据进行加工处理和二次开发等。
2.元数据的类型
进行无数据分类研究的目的在于充分了解和更好地使用元数据。分类的原则不同,元数据的分类体系和内容将会有很大的差异。下面列出了几种不同的分类体系。
1)根据元数据的内容分类
造成元数据内容差异的主要原因有两个:其一,不同性质、不同领域的数据所需要的元数据内容有差异;其二,为不同应用目的而建设的数据库,其元数据内容会有很大的差异。根据这两个原因,可将元数据化分为三种类型:
(1)科研型元数据 其主要目标是帮助用户获取各种来源的数据及其相关信息,它不仅包括诸如数据源名称、作者、主体内容等传统的、图书管理式的元数据,还包括数据拓扑关系等。这类元数据的任务是帮助科研工作者高效获取所需数据。
(2)评估型元数据 主要服务于数据利用的评价,内容包括数据最初收集情况、收集数据所用的仪器、数据获取的方法和依据、数据处理过程和算法、数据质量控制、采样方法、数据精度、数据的可信度、数据潜在应用领域等。
(3)模型元数据 用于描述数据模型的元数据与描述数据的元数据在结构上大致相同,其内容包括:模型名称、模型类型、建模过程、模型参数、边界条件、作者、引用模型描述、建模使用软件、模型输出等。
2)根据元数据描述对象分类
根据元数据描述对象分类,可将元数据划分为三种类型:
(1)数据层元数据 指描述数据集中每个数据的元数据,内容包括:日期邮戳(指最近更新日期)、位置戳(指示实体的物理地址)、量纲、注释(如关于某项的说明见附录)、误差标识(可通过计算机消除)、缩略标识、存在问题标识(如数据缺失原因)、数据处理过程等。
(2)属性元数据 是关于属性数据的元数据,内容包括为表达数据及其含义所建的数据字典、数据处理规则(协议),如采样说明、数据传输线路及代数编码等。
(3)实体元数据 是描述整个数据集的元数据,内容包括:数据集区域采样原则、数据库的有效期、数据时间跨度等。
3)根据元数据在系统中的作用分类
根据元数据在系统中所起的作用,可以将元数据分为两种:
(1)系统级别(System-level)元数据 指用于实现文件系统特征或管理文件系统中数据的信息,例如访问数据的时间、数据的大小、在存储级别中的当前位置、如何存储数据块以保证服务控制质量等。
(2)应用层(Application-level)元数据 指有助于用户查找、评估、访问和管理数据等与数据用户有关的信息,如:文本文件内容的摘要信息、图形快照、描述与其它数据文件相关关系的信息。它往往用于高层次的数据管理,用户通过它可以快速获取合适的数据。
4)根据元数据的作用分类
根据元数据的作用可以把元数据分为两种类型:
(1)说明元数据 是专为用户使用数据服务的元数据,它一般用自然语言表达,如源数据覆盖的空间范围、源数据图的投影方式及比例尺的大小、数据集说明文件等,这类元数据多为描述性信息,侧重于数据库的说明。
(2)控制元数据 是用于计算机操作流程控制的元数据,这类元数据由一定的关键词和特定的句法来实现。其内容包括:数据存贮和检索文件、检索中与目标匹配方法、目标的检索和显示、分析查询及查询结果排列显示、根据用户要求修改数据库中原有的内部顺序、数据转换方法、空间数据和属性数据的集成、根据索引项把数据绘制成图、数据模型的建设和利用等。这类元数据主要是与数据库操作有关的方法描述。
本文标题:元数据概念与分类-空间数据的元数据
手机页面:http://m.dljs.net/dlsk/gisdao/50300.html
本文地址:http://www.dljs.net/dlsk/gisdao/50300.html