什么是数据完整性?

简而言之,数据完整性是指企业收集和审查的数据的完整性、准确性和一致性,以获得可用于为大规模决策提供信息的见解。可操作的数据可以推动业务向前发展,但前提是这些数据是可靠的。数据的可靠性影响着公司的各个方面,从销售、营销到运营。糟糕的数据完整性可能会导致决策过程崩溃,从而影响业务的成功。

数据完整性的主要特征

数据完整性的一个过于简化的观点是数据集没有错误。这是至关重要的,但这只是整个过程的一小部分。把您的数据集合看作业务知识。你希望这些知识是一致的、相关的、可操作的。如果它不符合数据完整性的准则,它就不再有用。

分析人员不仅在业务案例中定义数据完整性,还在数据管理上下文中定义数据完整性。这是数据分析师查看与现有数据库和系统相关的信息的方式。对于数据分析师来说,问题不是“这是否实现了提高销售的数据完整性目标?”而是“这是否满足当前系统的数据完整性参数?”

为了更清楚地说明这种区别,请考虑分析师寻找的特征确定数据完整性

完整性:如果填充了所有可用字段,则数据集完整。假设您的CRM跟踪客户的姓名、地址、电子邮件、电话、上一次购买的金额和一生中的总花费。只包括姓名和地址的客户记录是不完整的。

因此,将来自不同来源的信息输入CRM可能会降低数据完整性。也许一个来源只跟踪客户姓名和购买金额。虽然这些数据增加了您所知道的内容,但当与具有更完整信息的数据集结合使用时,可能会降低整体数据的完整性。

独特性:将信息从源移动到数据仓库可能会导致相同的记录出现两次。ManBetX万博客服重复的记录不仅仅是资源的浪费。万博手机登录平台它们是降低数据完整性的另一个因素。也许你通过你的网站和你的一个销售代理向同一个人销售。该客户将在您的系统中出现两次,当您组合数据集时,您将希望确保您的CRM只有该客户的一条记录。

准确性:技术进步并没有消除数据错误的可能性。事实上,人为错误仍然是其中之一实现数据完整性的挑战.错误有很多种形式:销售代理在将客户姓名输入系统时拼错了。客户端在填写在线表格时,将电话号码中的数字颠倒。或者分析师不小心给电子表格贴上了错误的标签,删除了一行,或者合并了单元格,因此信息不再有效。

获得正确的信息是一个目标数据清理这是转换数据以获得更高可靠性的一个方面。

一致性:对于数据来说,沟通与业务中的其他任何事情一样重要。数据一致性要求数据每次都传递正确的信息和相同的信息。当不同的来源使用同一个词来指代不同的事物时,就没有一致性。当来自这些源的数据合并到一个列表中时,它的完整性水平较低。

假设您的现场销售团队有一个名为“clients”的数据字段,并且您的网站后端也有一个“clients”记录。你的销售代理总是把客户当成客户,不管距离上次销售有多少个月。相比之下,该网站每六个月清洗一次“客户”名单。在这种情况下,“客户”的合并记录不一致。现场销售团队记录是“所有客户”,而网站记录是“当前客户”。

有效性:数据分析师希望将一段数据链接到一个数据源。这种跟踪功能有助于确保数据是有效的。知道数据沿袭让分析师们对信息的可靠性保持信心。它还有助于持续监视系统数据流,因为信息不断地从一个地方移动到另一个地方。即使信息通过提取、转换、加载(ETL)过程进行了转换,数据沿袭也是可跟踪的。

及时性:数据可能是正确的,但如果不是最新的,就会降低整体数据的完整性。客户可能在13个月前购买了升级。但是,如果记录没有反映出客户在六个月前恢复了低价套餐,那么这条信息就不那么有效了。及时性是指与时俱进。你应该有信心,看看你的数据,你档案上的内容包括最近发生的事情。

使用Xplenty确保数据完整性

ETL是将数据从多个源移动到一个集成源的最有效方法。但是这个过程所要做的不仅仅是将信息从A点、B点和C点驱动到d点。它还必须确保经过改进的数据的完整性尽可能健壮。Xplenty平台不仅帮助数据专家构建ETL管道,而且它的简单、易用、无代码接口还允许组织中的任何人优化数据。联系我们,了解更多关于我们的14天试验

术语汇编

数据集成技术的命名指南。

Baidu
map