什么是低延迟?

低延迟网络是在尽可能短的时间内执行任务并返回结果的系统。低延迟意味着任何依赖系统都可以以最大速度运行,这提高了生产率并改善了用户体验。万博max手机网页登录

如何衡量低延迟?

延迟是任务发起和完成之间的延迟。没有一个系统是零延迟的,因为总是存在某种处理开销,即使这只是一秒钟的极小部分。

因此,低延迟在某种程度上是一个定性的术语。在某些上下文中,系统架构师可能愿意接受较高的延迟率,但在另一些上下文中则不愿意。例如,当用户刷新一个网页时,他们通常无法检测到任何小于1秒的延迟。

在其他系统中,比如高速金融交易系统,一微秒就可能影响交易的结果。这些系统对延迟的容忍度很差,因此网络必须在几分之一秒内返回数据库结果。

有两种主要的测量延迟的方法:

  • 时间到第一字节(TTFB):从客户端发送请求的第一个字节到服务器端接收到请求的时间。
  • 往返时间(RTT):数据包从服务器到客户机的总旅行时间。

许多工程师将通过基准测试来判断延迟,这意味着将他们的系统与类似的系统进行比较。基准测试可能涉及对数百万个查询的比较。有效延迟率是系统间TTFB或RTT的差异。低延迟意味着有效延迟率低于或处于所需水平。

是什么阻碍了低延迟?

在执行任务期间的任何时刻,延迟都可能增加。例如,考虑一个向数据库发送查询的应用程序。数据库处理查询并返回一些结果。当这两个系统进行通信时,延迟可能会出现,原因有很多:

  • 可怜的配置:初始请求可能没有正确的配置。发送方可能组织了糟糕的查询,或者在凭证方面犯了错误。非致命错误将导致更大的延迟。
  • 网络流量:在网络繁忙时,报文到达目的地的时间较长。如果网络流量激增,网络没有足够的带宽,或者网络基础设施没有正确配置,就会发生这种情况。
  • 资源可用性:如果服务器繁忙,将需要一些时间来处理传入的查询。像上面例子中提到的数据库查询,必须等到服务器能够分配处理资源。万博手机登录平台
  • 处理开销:复杂查询执行时间较长。查询的复杂性是底层数据质量的函数,因此查询在经过清洗和整合过程。数据存储库,例如ManBetX万博客服数据仓库往往更快地返回结果,因为在返回结果之前不需要预处理数据。
  • 中断:在某些情况下,基础架构组件可能不可用。这可能是离线的云服务、已经崩溃的内部系统或网络故障。
  • 安全:数据安全性是不容置疑的,但它会产生一些延迟开销。正确的配置和软件可以最小化与基本安全措施相关的额外延迟。

这些因素都可能增加延迟。如果总体延迟低于基准测试目标,则网络为低延迟。否则,组织可能需要考虑减少延迟的方法。

数据仓库如何实现低延迟?

低延迟通常是关于网络架构、IT基础设施和数据治理策略的良好决策的结果。没有一种技术能够保证低延迟。相反,企业会努力做好基本工作,比如:

把数据存储在正确的地方

数据应该接近依赖该数据的流程。这可能不是指物理位置(尽管地理位置会增加延迟),而是指网络。例如,如果外部数据请求必须通过一些额外的安全层,这可能会增加延迟。

将数据集成到单个源中

减少整体延迟的方法是尽可能合并任务。对于数据库任务,这意味着集成多个源到单个存储库中。对于单个源中的数据,单个查询可以产生详细的结果。这将使查询多个源的总体处理时间更快。

尽可能预处理数据

大数据平台等Hadoop和Spark拥有复杂的工具,可以在短时间内浏览大量非结构化数据存储库。但是,这可能比处理已正确转换和集成的数据库要慢。转换后的数据在统一的模式中,任何查询的执行速度都比在不同的模式上快。

确保网络是适合的

网络延迟是整个系统延迟的主要因素之一。通常,这可能是一个网络工程问题,需要重新配置网络以动态分配资源。万博手机登录平台在企业设置中,一致的延迟可能是进行大规模网络升级的理由。

在云和本地系统之间明智地选择

本地系统本身并不比云系统更快。虽然内置系统有一些明显的优势,比如数据的网络传输更短,但还有其他因素会影响延迟。例如,云服务器的底层硬件通常比内部系统更好,这意味着处理团队更快。这有助于降低整体的延迟率。

在比较选项时,基准测试是必要的,因为不同因素之间的权衡可能最终导致低延迟。

术语汇编

数据集成技术的命名法指南。

Baidu
map