本站点使用Cookies,继续浏览表示您同意我们使用Cookies。 Cookies和隐私政策>

首页 信息速查 产品智能选型 IP知识百科

什么是xFlow

xFlow提供全网全流智能分析、应用网络一体化运维功能。华为xFlow智能全流分析解决方案可以实现应用网络一体监控、应用故障一键诊断、应用体验主动保障解决传统方案下的数据分散、成本过高、性能消耗等问题。

为什么需要xFlow

传统数据中心网络运维挑战

业务与网络数据分析主要面临以下三个方面的挑战:
  • 跨组织运维,人肉式协同业务/网络各自独立运维,多部门联合定位故障耗时3天;
  • 运维数据分散,多系统割裂网络数据分散在多个系统无法满足一体化运维分析诉求
  • 生产数据量大,业务回溯企业存储生产数据量达1 PB/数据庞大多元,业务回溯难。

基于NPM的网络性能分析仍有局限性

根据Gartner定义,NPM(网络性能管理与分析,Network Performance Management)是利用数据源组合的监控工具包括网络设备健康度和事件、网络设备生成的流量数据、原始网络数据包,同时也是对用户体验到的网络服务质量进行测量、诊断优化的过程,提供历史、实时和预测性的视图,深入了解网络及在网络上运行的应用的可用性和性能

NPM数据分析方案在数据中心监控领域,主要进行网络性能分析,是应用和网络故障定位的关键必备工具,能够通过数据包分析,洞察网络及应用的可用性和性能。NPM方案着眼于解决传统业务与网络数据分析独立运维耗时长、运维数据分散、数据量大导致业务回溯难等问题。

然而,随着数据中心SDN云化,传统NPM方案的局限性日益凸显:
  • Fabric内存在管理盲区。SDN云化后,数据中心内部的东西向流量比例高达71.5%,使大量应用间交互发生在Fabric内,而NPM仅监测南北向流量,只覆盖Fabric边界设备,无法感知Fabric内部逐跳转发问题,导致云化网络定界具体节点的故障。
  • 云/网络无法快速定界。应用故障频发,导致fabric内所有leaf节点的流量需要镜像到NPM进行分析。对此,传统NPM方案部署成本过高,且云运维团队无法定界。
  • 缺少关联分析网络设备对业务的影响。基于业务流识别异常,缺少关联分析网络设备对业务的影响。

华为xFlow智能全流分析解决方案

为了适应SDN云化新趋势,华为iMaster NCE-FabricInsight V100R023C00版本全新打造xFlow智能全流分析特性,提供全网全流智能分析、应用网络一体化运维功能。

首先,xFlow新型数据分析方案弥补了NPM方案在网络监测上的缺陷。应对NPM方案无法感知Fabric内部交互导致的云化网络故障定界问题,xFlow实现了Fabric内逐跳定界,端/网/应用分钟级诊断,全量日志聚合溯源,90+典型网络故障,1分钟感知3分钟定位。

其次,为解决NPM部署成本高问题,xFlow方案在Fabric内按需全流免拉线,减少TAP网络及连线,降低了Leaf网络部署成本。

最后,应对缺少关联分析网络设备对业务影响的问题,xFlow实现网络设备和业务应用流双监控,提供网络风险评估、故障分析、日志聚合渊源,有效解决了该问题。在业务体验保障上,xFlow能够独立实现一体化分析业务和网络,主动保障业务体验;协同应用,快速定界故障,提前干预隐患。

xFlow镜像网络组网拓扑

xFlow镜像网络组网拓扑如图1 xFlow镜像网络组网拓扑示意图所示:
xFlow镜像网络组网拓扑示意图
xFlow镜像网络组网拓扑示意图
  • 镜像方式(流怎么出来):
    • 端口镜像:全流可使用端口/VLAN/本地流镜像,以端口镜像为主
    • ERSPAN特征流、按需全流使用ERSPAN远程流镜像;
  • 转发网络(流怎么转发):
    • 带外网络:端口/VLAN/本地流镜像,需要观察口拉线直连到TAP网络,需额外占用物理口;
    • 带内转发远程流镜像场景,交换机转发所有被镜像流量到采集器,不额外占用物理口
  • 采集平面(流怎么接收):
    • xFlow探针:探针直连设备观察口,通过直连链路收包;探针直连TAP场景,通过TAP规则转发收包
    • FI采集器:采集器集群南向平面IP,作为ERSPAN目的地址;在连接采集器的交换机上配置静态路由,接入交换机将路由发布到Underlay网络。

xFlow关键技术

xFlow全流镜像

xFlow全流镜像,即通过在关键网络位置开启全流镜像,实时记录网络性能。具体如下:
  1. 镜像方式(流怎么出来):xFlow全流镜像可使用端口/VLAN/本地流镜像,一般以端口镜像为主。
  2. 转发网络(流怎么转发):
    • 端口/VLAN/本地流镜像,需要观察口直连到xFlow探针,额外占用物理口,适合小规模镜像场景;
    • 端口/VLAN/本地流镜像,需要观察口拉线直连到TAP网络,额外占用物理口,适合中大规模镜像场景;
  3. 采集平面(流怎么接收):
    • xFlow探针通过直连链路收包,支持IP报文或VXLAN报文解析;
    • xFlow探针直连TAP网络接收包, 支持IP报文或VXLAN报文解析。
xFlow全流镜像如图1 xFlow全流镜像示意图所示:
xFlow全流镜像示意图
xFlow全流镜像示意图

xFlow特征流镜像

xFlow特征流镜像基于ERSPAN技术,实现业务真实路径精准可视。具体而言,xFlow特征流镜像通过ERSPAN对TCP控制面报文(如SYN、FIN、RST等)进行镜像,实现对整网TCP流的采集和分析。分析器iMaster NCE FabricInsight可以获取到一条TCP流的以下信息:
  • 报文转发路径信息(IP接入位置、逐跳设备、出入接口等);
  • TCP会话开始时间,结束时间,传输的Bytes;
  • 会话异常:建连失败(TCP重传、被异常Reset等)、转发时延超阈值、TTL<3(疑似环路)等。
xFlow特征流镜像如图2 xFlow特征流镜像示意图所示:
xFlow特征流镜像示意图
xFlow特征流镜像示意图

xFlow按需镜像

xFlow按需镜像沿真实路径按需抓包,用更低成本实现应用报障诊断。对于ERSPAN流镜像最后一跳难定界、无质差定界能力这两个不足,xFlow解决方案通过三步解决问题:
  1. 输入报障的IP对,页面呈现IP接入位置、流路径路况;
  2. 选择设备按需抓包,缩小故障域,系统自动下发配置,实时抓包,免拉线;
  3. 系统逐包实时分析,给出故障定界结论、报文举证。
xFlow按需镜像如图3 xFlow按需镜像示意图所示:
xFlow按需镜像示意图
xFlow按需镜像示意图

xFlow解决方案典型应用场景

xFlow技术所应用于以下关键方案。

全网性能监控

某银行通过NPM监控70+的核心业务系统,但无法看到网络设备状态和性能,需要登录多套系统监控。然而,监控多系统割裂,无全局视角,运维数据孤立,NMS系统监控设备指标,无法看清应用体验,NPM又看不见设备异常;此外,网络亚健康无法预测,被动排障缺少系统性预防手段。

xFlow解决方案可以实现应用网络一体化监控,应用/网络全域140+性能指标端到端可视,主动评估关键应用体验和全网质量,对40+的关键网络风险进行预测,系统性预测网络潜在风险,构筑主动预防体系,从而主动保障应用最佳体验。

故障诊断定界

面对传统网络系统故障定界难、耗时长、举证难的问题,xFlow解决方案采用镜像位置与策略:
  • xFlow全流镜像,网络关键位置部署,全包分析,识别会话异常,分段定界;
  • xFlow特征流镜像,POD内逐跳部署,还原流在POD内转发路径,逐跳定界;
  • xFlow按需镜像,部署在指定leaf节点按需镜像全流。

通过采用镜像位置与策略,xFlow可以实现:

  • 易操作:应用通断与质差问题全覆盖,一键式诊断;
  • 排障快:应用网络关联分析,全路径分钟级定界;
  • 举证全:网络路况、原始报文双重举证,数据可信可回溯。

关键应用重保

某智能制造厂商的生产线上Tibco等业务出现问题后损失巨大,因此对实时监控业务运行质量、途径网络质量的能力提出要求,希望可以有劣化早处理,避免影响生产业务。对此,xFlow解决方案拥有以下两方面的关键能力:
  • 端/网络/应用全局实时监控,质量画像分析;
  • 应用和网络协同,故障快速定界,隐患提前干预。
基于上述能力,xFlow解决方案可以实现:
  • 一览全局:重保业务 端/网/应用 全局监控;
  • 分析全域:“业务路径-网络路径-设备”协同,故障一键定界;
  • 提早干预:路径上隐患早发现早处理,保障业务体验。

业务网络一体化运维

传统方案中,银行交易失败后难以定位是应用侧问题还是网络问题。

xFlow解决方案与现网某BPC系统对接,采用业务—交易—网络一体化运维策略,通过“值班室收到业务报障—业务部门分析交易性能—网络部门协同定界”三个步骤解决问题,由此实现:
  • 一站式SSO单点登录,UI一站式下钻操作;
  • 一体化:看清“业务-交易-网络”一体化运维;
  • 一键式:应用故障一键式诊断,网络数据自证清白。
词条统计
  • 作者: 杨雪晨
  • 最近更新: 2023-11-02
  • 浏览次数: 2231
  • 平均得分:
分享链接到: