什么是xFlow
xFlow提供全网全流智能分析、应用网络一体化运维功能。华为xFlow智能全流分析解决方案可以实现应用网络一体监控、应用故障一键诊断、应用体验主动保障,解决传统方案下的数据分散、成本过高、性能消耗等问题。
为什么需要xFlow
传统数据中心网络运维挑战
- 跨组织运维,人肉式协同。业务/网络各自独立运维,多部门联合定位故障耗时3天;
- 运维数据分散,多系统割裂。网络数据分散在多个系统,无法满足一体化运维分析诉求;
- 生产数据量大,业务回溯难。企业存储生产数据量达1 PB/天,数据庞大多元,业务回溯难。
基于NPM的网络性能分析仍有局限性
根据Gartner定义,NPM(网络性能管理与分析,Network Performance Management)是利用数据源组合的监控工具,包括:网络设备健康度和事件、网络设备生成的流量数据、原始网络数据包,同时也是对用户体验到的网络服务质量进行测量、诊断和优化的过程,提供历史、实时和预测性的视图,深入了解网络及在网络上运行的应用的可用性和性能。
NPM数据分析方案在数据中心监控领域,主要进行网络性能分析,是应用和网络故障定位的关键必备工具,能够通过数据包分析,洞察网络及应用的可用性和性能。NPM方案着眼于解决传统业务与网络数据分析独立运维耗时长、运维数据分散、数据量大导致业务回溯难等问题。
华为xFlow智能全流分析解决方案
为了适应SDN云化新趋势,华为iMaster NCE-FabricInsight V100R023C00版本全新打造xFlow智能全流分析特性,提供全网全流智能分析、应用网络一体化运维功能。
首先,xFlow新型数据分析方案弥补了NPM方案在网络监测上的缺陷。应对NPM方案无法感知Fabric内部交互导致的云化网络故障定界问题,xFlow实现了Fabric内逐跳定界,端/网/应用分钟级诊断,全量日志聚合溯源,90+典型网络故障,1分钟感知3分钟定位。
其次,为解决NPM部署成本高问题,xFlow方案在Fabric内按需全流免拉线,减少TAP网络及连线,降低了Leaf网络部署成本。
最后,应对缺少关联分析网络设备对业务影响的问题,xFlow实现网络设备和业务应用流双监控,提供网络风险评估、故障分析、日志聚合渊源,有效解决了该问题。在业务体验保障上,xFlow能够独立实现一体化分析业务和网络,主动保障业务体验;协同应用,快速定界故障,提前干预隐患。
xFlow镜像网络组网拓扑
- 转发网络(流怎么转发):
- 带外网络:端口/VLAN/本地流镜像,需要观察口拉线直连到TAP网络,需额外占用物理口;
- 带内转发:远程流镜像场景,交换机转发所有被镜像流量到采集器,不额外占用物理口;
- 采集平面(流怎么接收):
- xFlow探针:探针直连设备观察口,通过直连链路收包;探针直连TAP场景,通过TAP规则转发收包;
- FI采集器:采集器集群南向平面IP,作为ERSPAN目的地址;在连接采集器的交换机上配置静态路由,接入交换机将路由发布到Underlay网络。
xFlow关键技术
xFlow特征流镜像
- 报文转发路径信息(IP接入位置、逐跳设备、出入接口等);
- TCP会话开始时间,结束时间,传输的Bytes;
- 会话异常:建连失败(TCP重传、被异常Reset等)、转发时延超阈值、TTL<3(疑似环路)等。
xFlow按需镜像
- 输入报障的IP对,页面呈现IP接入位置、流路径路况;
- 选择设备按需抓包,缩小故障域,系统自动下发配置,实时抓包,免拉线;
- 系统逐包实时分析,给出故障定界结论、报文举证。
xFlow解决方案典型应用场景
xFlow技术所应用于以下关键方案。
全网性能监控
某银行通过NPM监控70+的核心业务系统,但无法看到网络设备状态和性能,需要登录多套系统监控。然而,监控多系统割裂,无全局视角,运维数据孤立,NMS系统监控设备指标,无法看清应用体验,NPM又看不见设备异常;此外,网络亚健康无法预测,被动排障缺少系统性预防手段。
xFlow解决方案可以实现应用网络一体化监控,应用/网络全域140+性能指标端到端可视,主动评估关键应用体验和全网质量,对40+的关键网络风险进行预测,系统性预测网络潜在风险,构筑主动预防体系,从而主动保障应用最佳体验。
故障诊断定界
- xFlow全流镜像,网络关键位置部署,全包分析,识别会话异常,分段定界;
- xFlow特征流镜像,POD内逐跳部署,还原流在POD内转发路径,逐跳定界;
- xFlow按需镜像,部署在指定leaf节点按需镜像全流。
通过采用镜像位置与策略,xFlow可以实现:
- 易操作:应用通断与质差问题全覆盖,一键式诊断;
- 排障快:应用网络关联分析,全路径分钟级定界;
- 举证全:网络路况、原始报文双重举证,数据可信可回溯。
关键应用重保
- 端/网络/应用全局实时监控,质量画像分析;
- 应用和网络协同,故障快速定界,隐患提前干预。
- 一览全局:重保业务 端/网/应用 全局监控;
- 分析全域:“业务路径-网络路径-设备”协同,故障一键定界;
- 提早干预:路径上隐患早发现早处理,保障业务体验。
业务网络一体化运维
传统方案中,银行交易失败后难以定位是应用侧问题还是网络问题。
- 一站式:SSO单点登录,UI一站式下钻操作;
- 一体化:看清“业务-交易-网络”一体化运维;
- 一键式:应用故障一键式诊断,网络数据自证清白。
- 作者: 杨雪晨
- 最近更新: 2023-11-02
- 浏览次数: 2381
- 平均得分: