什么是数据丰富?

数据充实是通过附加另一个数据库或以其他方式填充空白字段来完成部分记录或扩展现有记录的过程。

丰富数据的好处是什么?

数据可以描述真实世界的实体,比如客户或员工。然而,对于每个实体,该数据可能并不总是详尽无遗。

考虑一个这样的客户数据库:

这些记录在某种程度上都是不完整的,这可能会妨碍外展营销活动,以及影响组织执行详细分析的能力。

数据充实是填写所有相关字段的过程,以便有一个详细的数据库记录。在本例中,这将是一个包含全名、电子邮件地址、电话号码和邮政编码的客户记录。

还可以通过添加额外的字段来丰富数据。在上面的示例中,可以通过向每个客户记录添加完整的邮政地址来扩展数据。

数据丰富过程可以应用于数据中描述的任何内容。在充实过程的最后,每个记录应该包含关于它所描述的实体的更详细的信息。

什么是数据丰富过程?

数据丰富需要两个数据源:目标数据源和新数据的数据源。

获取新数据有三种方式:

  1. 直接:就个人资料而言,资料当事人可提供任何遗失的资料。例如,客户可以回答一项调查或完成他们的在线资料,这些信息将被添加到CMS
  2. 内部:内部数据库,如CMS、ERP、数字服务或其他生产系统,可能包含可用于充实的数据。万博max手机网页登录一旦确定了该数据,就可以导出、清理并与目标数据源合并。
  3. 外部:部分企业可能会选择从第三方购买数据。这些数据通常将作为数据文件(如JSON或CSV)交付。一旦接收到新数据,组织必须清除它,删除任何损坏的数据或无效的条目。如果数据来自外部来源,则必须对其进行验证以确保其准确性。

清理完新数据后,就可以与现有数据库合并了。此步骤可在提取,转换,加载(ETL)过程,以确保任何生产系统都有最新的信息。万博max手机网页登录

在开始合并过程之前,数据所有者应该决定如何处理冲突。最好是覆盖现有记录或忽略新条目,这取决于数据源的可靠性。如果数据丰富导致向现有表添加新列,则数据所有者需要确保在视图和查询中准确引用这个新字段。

为了审计的目的,应该这样标记丰富的数据。数据所有者需要保存更改日志,其中包含所使用数据源的完整记录,特别是在处理个人信息时。

术语汇编

数据集成技术的命名法指南。

Baidu
map