什么是信息生命周期管理?

信息生命周期管理(ILM)是一种基于策略的数据处理方法,从数据创建的时刻到组织从所有存储库中删除数据的时刻。工业光魔是数据治理

信息生命周期管理vs数据生命周期管理

信息生命周期管理(ILM)和数据生命周期管理(DLM)经常可以互换使用,因为它们都是覆盖组织数据的策略。

然而,两者之间是有区别的。工业光魔从根本上讲是关于信息的,包括数字数据值和物理存储的信息。例如,客户的姓名和地址是信息项。工业光魔的政策决定了这些信息的处理,包括寄出的信件。

DLM与此类似,但它主要关注包含数据的文件。客户关系管理数据库将属于DLM策略。相反,存储在数据库中的值将是工业光魔的事情。

信息生命周期的阶段是什么?

数据的生命周期分为六个阶段:

1.创建

首先,事件必须在组织的系统中创建数据。这个事件可以通过几种方式发生,例如:

  • 手工创建:当用户手动向系统输入数据时,就会发生这种情况。
  • 数据摄取:这是从另一个数据源(如外部数据库)导入数据。
  • 自动生成:设备或系统自动生成数据,然后将这些数据传输到组织的数据库中。物联网数据和网络统计数据是生成数据的例子。
  • 元数据:关于数据的数据。元数据描述另一个数据库或提供关于存储在其他地方的文件的信息。
  • 分析数据分析工具生成属于工业光魔政策的大量数据。例如,回归分析可以创建关于客户未来购买的新信息。

2.转换

新数据可能不能立即与基础设施中的其他系统兼容。由于这个原因,数据通常要经过一个集成过程,以便为其目的地做好准备。

这些过程的例子包括:

  • 数据转换:数据经过一个映射过程,从当前模式映射到与目标兼容的新模式。
  • 数据清理:清除损坏值、空值和重复值,保证数据的完整性。
  • 数据集成:新数据与其他数据源合并,产生更详细的记录。这可能涉及到用来自其他来源的信息替换某些值。
  • 数据浓缩用户或流程将附加数据添加到记录中,以生成更详细的信息。例如,一个公司可能有一个客户数据库,他们通过在每个文件中添加电话号码来丰富这个数据库。

数据在其生命周期中可以多次通过转换层。例如,提取、转换、加载过程在处理阶段之前对数据进行转换。

3.应用程序

大多数数据都是作为某些流程的一部分而存在的。例如,当客户下订单时,他们创建订单信息。然后,该信息被传递到物流系统进行执行,并被传递到支付系统进行支付处理。

应用阶段通常涉及新数据,尽管有时系统可能需要召回旧数据来完成一个操作。ILM策略必须确保所有用户和进程接收到的数据是:

  • 准确的:在组织所知的范围内,信息应该是准确的。
  • 清洁:数据应该没有任何错误、重复或损坏的值。
  • 最近:所有信息都应该是最新的版本,并带有时间戳来指示数据的最近时间。
  • 完整的:搜索结果应提供所有相关资料。
  • 可用:用户和进程应该能够在他们需要的时候访问他们需要的任何数据,并且有最小的延迟。

许多组织关注生命周期的这个阶段,因为它对生产力和服务的影响最大。万博max手机网页登录然而,在此之后还有三个同样重要的阶段。

4.传播

数据有时需要离开组织。例如,在报税季即将到来之际,公司可能会将其财务数据发送给会计公司。

传播或出版是一个单向的过程。一旦数据存在于其他地方,组织就不再有任何控制权。因此,数据传播必须:

  • 安全:数据的外部传播总是涉及一定程度的风险。工业光管的政策应规定可接受的数据发布渠道。
  • 标准化:的数据必须采用在目的地可用的格式。一些组织使用EDI (电子数据交换)用于标准化B2B数据传输的协议。
  • 可追踪性:组织应该记录所有的传播,以便审计员能够准确地看到第三方是如何以及何时收到数据的。

当传播发生时,它在目的地创造了一个全新的信息生命周期。

5.存储

当数据不使用时,组织通常会将数据移动到专用的存储库中。这些存储库可以采用多种形式,但主要有两种结构用于存储大量数据:

  • ManBetX万博客服:这是一个用于存储大量结构化数据的大型关系数据库存储库。信息通常经过一个转换过程,例如提取、转换、加载(ETL)。
  • 数据湖:数据湖存储结构化数据和非结构化数据。信息在摄入过程中没有转化。相反,该湖使用提取、加载、转换(ELT)过程,在此过程中,分析师可以在需要时转换数据。

组织可能需要将数据保存一段时间。例如,财务记录和客户数据通常有法律规定的最低和最高存储时间。

6.删除

当组织确认不再为任何目的需要数据时,数据删除可能发生。它也可能发生在响应根据隐私法(如GDPR)提出的删除请求时。

ILM策略通常包括记录数据生命周期中发生的活动的方法。这可能是一个手工记录,也可能以元数据的形式存在,例如数据沿袭.该记录在信息生命周期的最后一步中非常重要,因为它允许组织跟踪在信息生命周期中可能发生的任何数据复制。该记录还将提供传播到外部数据库的任何数据的详细信息。

这些记录有时以手工日志的形式存在,例如Excel电子表格。对于较大的数据集,平台可能会自动记录数据沿袭元数据。

术语汇编

数据集成技术的命名法指南。

Baidu
map