一:数据架构的定义
根据DAMA-DMBOK数据管理知识体系指南定义:
数据架构:识别企业的数据需求(无论数据结构如何),并设计和维护总蓝图以满足这些需求,使用总览图来指导数据集成,控制数据资产,并使数据投资和业务战略保持一致。
DCMM对数据架构的定义:
通过组织级数据模型定义数据需求,指导对数据资产的分布控制和整合,部署数据的共享和应用环境,以及元数据管理的规范。
根据华为数据之道中的定义:
数据架构:是指以结构化的方式描述在业务运作和管理决策中所需要的各类信息及其关系的一套整体组件规范。
二:通用数据架构组件
每个企业的数据架构都会有差异,但一般来讲,都会涉及到数据的全生命周期,包括数据模型、数据流、数据集成、数据标准、数据资产。
数据模型:数据模型是数据架构的核心组件,它定义了数据的结构、语义和约束,以及数据之间的关系。数据模型可以分为不同的层次,例如主题域模型、概念模型、逻辑模型和物理模型,以反映数据的不同抽象程度和细节程度。
数据流:数据流是数据架构的另一个重要组件,它描述了数据在不同的数据源、数据存储、数据处理和数据消费之间的流动和转换过程。数据流可以用于展示数据的来源、目的地、质量、血缘和生命周期等信息。
数据集成:数据集成是数据架构的扩展组件,它涉及了将来自不同的数据源和数据格式的数据进行统一、协调和整合的方法和技术。数据集成可以实现数据的共享、交换和分析,提高数据的价值和利用率。
数据标准:数据标准是数据架构的支撑组件,它规定了数据的命名、编码、分类、定义、格式和质量等方面的规范和要求。数据标准可以保证数据的一致性、可比性和互操作性,促进数据的沟通和协作。
数据资产:数据资产目录是数据架构的管理组件,它记录了数据架构中的各种数据资产的元数据信息,包括数据的名称、描述、位置、所有者、权限、标签、评价等。数据资产目录可以帮助数据的发现、理解和使用。
三:华为数据架构组件
华为数据架构包括:数据资产目录、数据标准、数据模型、数据分布
1.数据资产目录:通过分层结构的表达,实现对数据的分类和定义,建立数据模型的输入,形成完善的企业资产地图,也在一定程度上为企业数据治理、业务变革提供了指引。基于数据资产目录可以识别数据管理责任,解决数据问题争议,帮助企业更好地对业务变革进行规划设计,避免重复建设。
2.数据标准:数据标准定义公司层面需共同遵守的属性层数据含义和业务规则,是公司层面对某个数据的共同理解,这些理解一旦确定下来,就应作为企业层面的标准在企业内被共同遵守。
3.数据模型:是从数据视角对现实世界特征的模拟和抽象,根据业务需求抽取信息的主要特征,反映业务信息(对象)之间的关联关系。数据模型不仅能比较真实地模拟业务(场景),同时也是对重要业务模式和规则的固化。
4.数据分布:定义了数据产生的源头及在各流程和IT系统间的流动情况
EA之家 » EA之家原创讲解数据架构组件,附华为数据架构开发方法.ppt(52页pdf)非常值得参考的好文件