一、数据地图与数据架构
1.很多人包括之前我理解的数据地图就是从业务系统->数据仓库->数据应用的所有表血缘构成的一张大地图亦或是将企业数据全面呈现的散点图,经过3年的数据治理工作后,逐渐对该概念有了更深的理解。
数据地图=数据血缘+维度建模涉及的数据实体构成的复杂网状图,具有清晰的实体关联关系、上下游关系,可通过该地图快速找到一个数据实体的所有相关实体。一般数据地图不包括数据应用场景下的特性"不规范"数据集。
2.企业构建数据地图 能解决哪些业务或者数据问题:
数据孤岛问题、脏数据问题、数据加工异常问题、数据时效性问题=》进而解决数据开发问题、业务系统缺陷问题、业务操作不规范问题
3.数据地图很多人将其纳入元数据管理范畴,其实是比较片面的,纳入数据架构、数据模型管理范畴其实更合理。
4.数据地图管理:管理对象是数据血缘+维度建模涉及的数据实体构成的复杂网状图。
5.数据地图管理活动:维度建模、数据分层建表、构建数据血缘(通过自动化工具或手动,包含上下游血缘和ER关系血缘)、血缘可视化呈现。
6.数据架构管理:管理对象是数据模型,包括:主题模型(目录图,明确数据分类归属)、概念模型(E-R图,明确数据实体对应关系[多对多等])、逻辑模型(UML图,明确数据表关联属性、核心属性)、物理模型(用数据库表结构表示,明确数据表的所有字段及定义)
7.数据架构管理活动:基于关系建模(业务系统)或者维度建模(数据仓库)构建主题模型、构建概念模型、构建逻辑模型、构建物理模型、模型的维护与变更。
二、元数据管理与数据标准管理
元数据管理:管理对象是表及表属性,强调各业务系统的表及表的属性均可解释
数据标准管理:管理对象是数据实体及实