《标准与产业推进委员会:2020年网络数据面基于主动遥测方案的智能探针技术研究(22页).pdf》由会员分享,可在线阅读,更多相关《标准与产业推进委员会:2020年网络数据面基于主动遥测方案的智能探针技术研究(22页).pdf(22页珍藏版)》请在三个皮匠报告上搜索。
1、主动测量的一个重要的研究课题是测量要素和探针部署方式的确定,对此本文提出了一种通用的智能探针架构如图十四,其涉及的主要因素包括测量参数的选取、探针的数量、探针的位置、测量包的大小、测量频率、以及测量路径等,通过灵活的数据封装和控制算法组合,适配各种场景的需求。上述方案主要涉及的流程是应用侧根据自己的需求智能布放探针,网络侧根据布放探针的类型收集性能数据,并最终将此数据转化为测量报告,返回给对应应用。(一)网络故障发现随着网络规模的增长,对可靠性和易用性提出了更高的要求,及时发现网络故障对于一个健康网络来说具有重要意义,可以极大的缩短故障持续的时间。传统网络故障发现主要以来与日志和告警的分析,费
2、时费力。此处展示了一种基于主动测量的网络故障方案,其通过部署覆盖所有link的探针来监控网络的状态,精确的判断网络中是否存在异常。图十五展示了一种探针的部署方案:1.探针布放算法约束1:基于IGP拓扑,计算能够覆盖全网link的探针路径约束2:可指定探针注入点,以及最大SR栈深目标:最少的探针数量、最少的网络探测代价2.故障检测算法初始阶段:测量各探针路径对应的时延基准值(可用均值/方差等)监控阶段:检测各探针路径的时延和丢包变化,当端到端时延值或丢包超过正常范围时,进行故障上报通过探针的持续探测以及对探测数据的分析,可以快速及时的发现网络问题,指导运维人员有针对性的解决网络故障。注:测量过程
3、中可根据需求调整测量包的优先级,测量手段为支持指定路径性能测量的TWAMP。网络故障发现是网络故障恢复的基础,需要结合网络故障定位及时定位到故障发生的具体位置,从而采取适当的措施进行故障恢复,使网络回归到一种正常状态。此处针对前述方案检测到的一条存在故障的路径进行具体的链路或者节点的故障定位,最终得到故障的具体位置,辅助运维人员进一步确定故障的根因从而解决故障,当前存在两种形式探测方式。网络性能收集可用于指导网络的规划和业务的部署,如收集网络中每条link的传输时延可用于控制器基于时延算路。当前链路时延的测量方法主要是通过逐link部署TWAMP,测量到每link时延后通过IGP进行全网泛红,并最终通过BGP-LS的方式上送控制器,此种方式不仅配置量大容易出错,而且拓扑发生变化时需要更新配置,不易于管理维护,而本文提出的基于逐跳TWAMP性能测量的方案则可以解决这些问题。