【转载】主数据管理(MDM)与元数据管理 - bada130 - 博客园
主数据(Master Data)和元数据(Meta Data)是两个完全不同的概念。元数据是指表示数据的相关信息,比如数据定义等,而主数据是指实例数据,比如产品目录信息等。比如,某省地税开发了一套 征收管理软件,以市为单位部署了17套,每套征收管理软件中的元数据都是一样的,但是主数据还是需要进行管理的。主数据管理和传统数据仓库解决方案不是一 个概念,数据仓库会将各个业务系统的数据集中在一起在进行业务的分析,而主数据管理系统不会把所有数据都管理起来,只是把需要在各个系统间共享的主数据进 行采集和发布。相对于传统数据仓库解决方案的单向集成,主数据管理更注重将主数据的变化同步发布到各个关联的业务系统中(主数据管理数据是双向的)。
以下为常见的六 大数据形式:
- 元数据:数据的数据,平时我们设计表时,大部分属性字段就是元数据。比如,性别,国籍,出生省份等。这个是最接近自然意义的的数据。
- 引用数据:元数据的可能取值范围,我们设计表时所说的数据字典往往就是引用数据。比如,性别只能是男和女,男和女就是引用数据。国家的引用数据就是世界上这100多个国家和地区;
- 主数据:在我们数据库设计中最重要的一些实体,是由元数据和引用数据实例的集合。DMReview 专栏作家 Jane Griffin 将主数据定义为“...用于为核心业务实体创建和维护全企业‘记录系统’,以记录业务交易并评定这些实体的业绩所需的信息。”平时我们常碰到的客户信息, 产品信息都属于主数据。对于主数据的介绍,我们会在后面详细展开说明。
- 企业结构化数据:企业业务中所需的数据实体 ,可能是多个主数据的集合。不同行业的结构化数据会有很大不同。
- 交易活动数据:主数据之间活动产生的数据。比如客户购买产品的交易记录就是交易活动数据,工厂生产产品,生产记录也是交易活动数据。
- 交易审计数据:我们对数据的所有活动都通过交易审计数据进行记录。比如我们对客户信息修改的操作,对交易的增加和删除操作,这些活动在很多关键系统(比如银行)都需要记录,以合符相应法规的要求(如 Basel II、萨班斯—奥克斯利法案)。
下图中数据模型中的蓝色越深代表语义相关性越强和数据质量越重要,而黄色越深代表数据的数据数量越多、更新的频率越快、实时抓取的数据越快、数据的生命越短。下图可以看到,元数据的数据语义性最强,几乎不更新,数据量最少,生命周期最长。
主数据是企业应用系统中最基本的业务单元,下面是一段英文的原文:Master Data are the fundamental
business data in the company, typically long-lived and used across
multiple applications。Core Master Data are operational entities,
supporting all fundamental business activity transactions being executed
on this level. The Core Master data are common and shareable within the
organization。
我觉得很好理解,比如一个产品系统,它处理的基本数据就是生产数据。HR系统处理的基本数据是雇员;CRM
系统是客户。一般来说核心主数据包含:Customers, Contracts, Suppliers,
Distributors/Partners,Employees等等。另外,各个行业对于主数据的管理的需求和期望会有很大不同,因此行业经验对于主数
据管理也是很重要的。(注:能否直接理解为系统的基础数据就是主数据?这里一般不能这样理解,主数据一定是基础数据。但是如果该基础数据没有跨业务系统边界,往往不作为主数据。主数据的一个重点是跨越了业务流程边界,在诸多业务流程的不同阶段会使用到。)
主数据管理的概念
从
上面的介绍可以了解,主数据并不是什么新的概念,但为什么之前没有主数据管理的产品呢?其实,解释这个问题和解释数据集成出现的原因很类似。因为之前主数
据依附于各个单独的业务系统,比如HR,
ERP,SCM,企业的网站,商业合作伙伴的系统都可能对某一个主数据有存储,比如某个产品。问题随之来了,如系统间数据编码不一致;数据的冗余;某些系
统数据的不完整。举个实际的例子,如果我们新建一个BI的系统,那么有可能我需要从生产系统,财务系统,物流系统,企业合作伙伴系统多个系统拿到一个完整
的关于主数据的信息。显然,需要一种解决方案,能够提供一个单一的主数据访问接口,以提高主数据访问的效率;为企业的市场、销售、客户关系管理等活动提供
可靠的数据,提高企业的敏捷性。(对问题分析的不够,提供单一完整视图仅仅是主数据的一个作用。另外重要作用包括数据质量管理,统一数据源头和编码体系,统一数据的创建申请和变更流程,实现数据的集中收集和分发等。)
主数据管理:主数据管理是数据管理的一种高级形式,它必须构建于ETL或者EII(Enterprise Information
Integration)等技术之上,因此很多主数据管理平台本身就包含了数据抽取、数据加载、数据转换、数据质量管理、数据复制和数据同步等功能。也有
某些厂商把MDM作为数据集成产品的一个模块交付给客户。