什么是数据血统?

数据沿袭的名字是特定类型的元数据,其中包含的完整的历史主题。血统的元数据描述的数据是指的起源,并提供《盗梦空间》以来的任何操作的细节。

数据沿袭为什么重要?

数据很少呆在一个地方,特别是在现代企业环境中。数据可以被复制从一个平台到另一个地方,与其他数据源合并,进行数据清理程序,并通过ETL处理。

即使在一个系统,可以改变的数据查询。最终的结果是,一块数据可能已经通过多个转换在到达最终目的地之前,和这些转换可能会影响数据的有效性。

数据沿袭作品作为一种为这个数据的更新日志,记录每个操作都有发生。这可能是有用的:

  • 审计:在审计期间,数据沿袭将澄清数据从何而来,以及它如何开始以来已经改变了。
  • 合规:一些组织可能需要存储数据沿袭元数据以满足合规义务,如因GDPR。
  • 质量控制:如果有一个损失的质量或在一个错误ETL数据沿袭,将有助于确定出现问题的位置。
  • 活动监控:数据沿袭文档数据的点查询或修改。这可以帮助识别系统依赖关系或未经授权的活动。

数据沿袭通常是数据治理策略的一个重要元素在大型组织。

数据沿袭的过程是什么?

基本沿袭手工数据可以收集和存储在电子表格或文档。大量企业数据源,血统数据自动捕获函数包含在系统中情景应用程序Informatica、专用工具等Octapai

在所有情况下,数据沿袭必须包括一些关键细节:

  • 数据的性质是什么?特别是数据沿袭捕获数据的隐私级别,这样很容易告诉敏感信息(如客户或雇员数据)从敏感信息(如产品信息。)万博max手机网页登录
  • 创建或修改的数据是什么时候?每个事务时间戳在一个统一的格式,这样交易日期可以很容易地分析。
  • 谁有对数据执行操作?行动必须确定的来源,尽管这可能并不是指一个人。它也可以指一个系统进程或一个API调用。
  • 为什么这个数据存储?这个问题等规定的背景下尤其重要GDPR,个人数据必须存储只对一个合法的商业目的。
  • 这个数据是如何被使用?这应该大纲所有应用程序都依赖这些数据,以及任何报告,包括数据的结果。

的术语表

一个数据集成技术的术语指南。

Baidu
map