数据治理中的核心元素——元数据

本文转自:中国发展网
数据治理中的核心元素——元数据
文章图片

文章图片

一、关于元数据
1、什么是元数据
元数据(metadata)是关于数据的组织、数据域及其关系的信息 , 简单来说 , 元数据就是被用来描述数据的数据 。
概念阐述总归生涩 , 下面用几个简单的例子来比喻一下:
例1:元数据是“户口本” 。有了“户口本” , 我们不仅能了解此人的出生年月等基本信息 , 还能知晓他的亲属关系 。这些信息就构成了对这个人的详细描述 , 这些信息就是描述这个人的元数据 。
例2:元数据是“图书目录” 。图书馆中的图书目录包含图书名称、编号、作者、位置等信息 , 有了它 , 图书管理员就能快速查找图书 。元数据能够帮助数据管理员管理数据 。
例3:元数据是“藏宝图” , 按图索骥就能找到宝藏 。元数据能够帮助企业盘点自己有哪些数据 , 以及这些数据的位置、来源、去向、路径等 。
收集元数据 , 能够帮助企业回答下面的问题:我们有哪些数据?数据的使用人数有多少?如何查找数据?数据的流转情况如何?通过血缘关系进行溯源和问题分析等等 。
那么在实际业务场景中 , 元数据又是怎样的呢?
示例:比如 175 这个数字 , 它在特定场景下 , 有如下的元数据:
数据治理中的核心元素——元数据
文章图片

文章图片

2、元数据&元数据管理的重要性在表格中 , “175”是实体数据 , 而业务元数据、技术元数据、操作元数据、管理元数据 , 分别从各自的角度描述了“175”这个数字 , 所以 , 它们都在元数据的范畴内 。
数据治理的前提是要有数据 , 并且要求数据类型全、量大 , 并尽可能的覆盖数据流转的各个环节 , 而元数据是“所有系统、文档和流程中包含的所有数据的语境 。是生数据的知识 。”换句话说 , 如果没有元数据 , 组织IT系统中收集和存储的所有数据都会失去意义 , 也就没有业务价值 。
要想获得元数据的价值 , 需要根据建立的流程、在行业标准和最佳实践指导的范围内管理元数据 。在“DAMA车轮图”中 , 元数据管理占据了十大数据管理领域其中很重要的一环:
数据治理中的核心元素——元数据
文章图片

文章图片

元数据管理是一项和主数据管理、数据治理一样重要的功能 , 因为元数据管理是每一个这些准则的基础组件 。不管理好元数据 , 是不能管理好主数据的 。
二、元数据的分类
按照不同领域和功能 , 元数据一般来说可分为:技术元数据、业务元数据、操作元数据、管理元数据 。由于使用视角不同会影响到对元数据的分类 , 所以具体的分类标准并不严格 。(比如数据安全等级指标——从安全部门的视角来看 , 属于业务元数据;从开发部门的视角来看 , 就属于管理元数据 。)
1、技术元数据
技术元数据是用于开发和日常管理数据仓库时用的数据 。它作为数据的结构化 , 能够方便计算机、数据库对数据进行识别、存储、传输和交换 。
对开发人员来说 , 它有助于明确数据的存储、结构 , 为应用开发和系统集成打牢基础;对业务人员来说 , 它有助于理清数据关系 , 从而能够更加快速地找到想要的数据 , 进而对数据的来源和去向进行分析 , 支持数据血缘追溯和影响分析 。