《Keynote:阿里云网络领域关键创新技术解读.pdf》由会员分享,可在线阅读,更多相关《Keynote:阿里云网络领域关键创新技术解读.pdf(11页珍藏版)》请在三个皮匠报告上搜索。
1、Robust Networking for Intelligent Innovation on the Cloud 云智创新,网络随行 阿里云网络领域关键技术突破 I 构筑高可靠、高性能、高弹性、智能的云上连接基座 Major Breakthroughs in Alibaba Cloud Networking|Building Intelligent Cloud Networks with High Reliability,Performance,and Elasticity云网络演进之路:始终围绕客户需求,坚持创新Evolution of Cloud Network:Technologica
2、l Innovation Centered Around Customer Needs云应用1.0云应用2.0传统架构云化架构云原生架构云网络技术演进 云网络用户需求传统网络大规模上云 硬件SDN 应用&IT设施软件SDN 封闭网络 坚定企业安全上云的信心云网络 1.0支撑业务大规模上云及全球化部署云网络 2.0支撑企业应对万物互联&AI新趋势云网络 3.0VPC,基础安全隔离高性能,大规模,全球化高可靠,超高性能,超高弹性,智能大规模容器化AI云网络是云计算的连接基石飞天盘古存储神龙计算洛神网络安全CIPU云存储服务弹性计算服务云网络服务云安全服务数据计算与管理AI与机器学习云原生应用面向未
3、来 高弹性应用连接 实时流量感知 自适应弹性 全网深度观测,一键诊断 智能网络运维 高可靠网络连接 自感知路径调度 秒级故障收敛高性能网络接入 软硬深度协同 确定性性能飞天洛神云网络,以创新让网络更简单易用Apsara Luoshen Cloud Network:Innovative Services for Easy NetworkingCloud Networks:The Cornerstone of Cloud Computing数据面转发的挑战软硬深度协同的高性能转发技术CPUCPUCPUCPUUnified network datapathSoC(Software)HostVM1VM
4、2VM3Preprocessor(parse,preclassify,)Postprocessor(fragment,xmit,)ASIC/FPGA(Hardware)硬件预解析,批处理加速,提升转发性能硬件网络微处理单元软硬件优势互补,提供转发性能的确定性软硬协同的流水线编排技术实现内存管理、无中断处理、数据包高速转发等核心能力自研网络微内核提升数据传输效率 转发性能30%提升短连接性能 新建性能67%高性能网络接入High-performance Networking基于 自研的硬件网络微处理单元,网络微内核,以及 软硬协同的流水线编排技术,打造软硬深度协同的高性能网络硬件转发高速的流量处
5、理性能 功能丰富度受限软件转发灵活的流量处理能力 处理性能不高Empowered by Hardware-Software Co-design:In-house Microprocessors,Microkernels,and Pipeline OrchestrationHigh-performance Forwarding Powered by Hardware-Software Co-design Challenges for Forwarding on Data Plane容器场景对网络的挑战ENI部署密度受制于内存资源,单节点ENI密度有限,无法满足容器场景需求ENI创建速度受制于中心
6、化管控和网卡 插拔的性能瓶颈,ENI创建 速度无法提升NodeK8S MasterVPC 管控分布式 管控VPC CNI容器网络数据面VPCVPCVPCVPC提供基于VPC的容器网络,无缝集成k8s生态全新推出VPC CNI优化路由存储和快查算法,提高容器网络密度基于路由表优化等内存压缩技术无锁化创建网卡和设备插拔,提升ENI创建速度ENI 网卡高速插拔技术高性能网络接入全新推出VPC CNI,并通过ENI网卡高速插拔 以及 基于路由表优化等内存压缩技术,打造高性能高密度容器网络基于VPC的高性能高密度容器网络技术ENI/秒900 单物理机Pod密度 ENI4,000 单物理机Pod创建性能
7、High-performance,High-density Container Networks Built with Brand-new VPC CNI,Easy-to-swap ENIs,and Memory Compression Techniques Like Routing OptimizationHigh-performance NetworkingHigh-performance,High-density Container Networks Built with VPCsChallenges in Container NetworkingAI网络新挑战Access switch
8、Distributed switchDistributed switchDistributed switchAccess switchAccess switchDistributed switch1234SACK1234134134VPCGPU直通跟VPC融合,兼顾高带宽和VPC数据无缝访问AI网络&VPC融合技术高精度随路检测,故障路径秒级切换高敏高精随路检测技术逐包多路径转发和保序,提升AI训练大流量吞吐能力多路径转发技术稳定的带宽逐流hash冲突,故障恢复时间长严重拖慢整体训练时长超大的带宽AI训练单流大,数量小 单卡带宽要求数百G高性能网络接入基于AI网络&VPC融合,多路径转发 以及
9、 高敏高精随路检测技术,打造高性能AI网络基于VPC多路径转发和弹性拥塞控制的AI网络技术故障快速恢复助力提供稳定大带宽网络故障恢复1S持续为AI训练提供稳定大带宽吞吐 带宽利用率60%High-performance Networks for AI Scenarios Based on VPCs,Multi-path Forwarding,and Sensitive and Fine-grained Route DetectionHigh-performance NetworkingAI Networking That Supports VPC Multi-path Forwarding a
10、nd Elastic Congestion ControlChallenges in AI Networking路径选择探测任务探测数据切换指令探测探测任务1链路感知2分析决策3重路由阿云阿云阿云阿云跨地域网络的挑战30s长传链路阿云阿云RegionRegion阿云阿云RegionRegion自研多平面的探测协议,主动快速感知故障多平面网络异常检测技术多链路批量秒级切换,实时故障恢复秒级重路由路径调整分级多指标调度算法,自动选择最优路径多因子分级最优路径决策技术链路抖动不可预测链路割接/劣化等因素不可控设备异常难以避免故障定位复杂依赖BGP收敛速度慢且覆盖不全 多类型异构设备故障定位能力差异高
11、可靠网络连接High-reliability Networking基于多平面网络异常检测,多因子分级最优路径决策 以及 秒级重路由路径调整的全新主动式重路由技术ZooRoute:主动式重路由技术业界最高SLA 99.995%故障收敛1s,业务无感知1SProactive Rerouting Based on Multi-plane Fault Detection,Multi-factor Route Selection,and Route Switchover Within SecondsZooRoute:Proactive ReroutingChallenges in Inter-regio
12、n Networking全网开启7000次/月 用户业务0受损7,000弹性连接的诉求1ECS资源弹性2单ECS带宽弹性流量流量流量弹性流量实时感知业务的新建、并发等多指标并弹性伸缩多维度负载实时感知技术针对全局水位与资源成本的最优化自适应全局水位均衡技术通过动态credit调配应对租户业务微突发微突发实例动态调控技术业务增长 实例有规格限制 带来额外管理代价 业务抖动 用户负载难以预测无法支持瞬时波动NLB带宽分钟级弹性01 Tbps无需预测业务流量 和规划网络规格自适应弹性TR单实例带宽弹性050 Gbps高弹性应用连接High-elasticity Application Network
13、ing 基于多维度负载实时感知,微突发实例动态调控 以及 自适应全局水位均衡,打造动态感知的自适应弹性动态感知的自适应弹性技术Adaptive Resilience:Dynamic Scaling and Load-aware Scheduling for Balanced Resource DistributionDynamic Traffic-aware and Adaptive ScalabilityChallenges in Scalable Connections智能化 异常预警可视化 故障诊断云网络运维新挑战网络异常发现难网络状态变化快 难以实时观测网络质量网络故障恢复慢网络路径复
14、杂 出现故障难以定位Cloud region ATenants VPC(s)Cloud region BFull-mesh probingbetween virtual switchesVM pair probingOn each virtual switchCross-region path pruningInternet borderprobingPublic IPSNATVM-to-VM top-Nbusy path selectionInternrt(pDst)状态感知风险预警故障诊断意图化 网络测量13类网络故障 主动通知主动预警57个观测项 全场景覆盖深度观测148个网络诊断项 秒
15、级定位一键诊断智能网络运维Intelligent Network O&M基于虚拟网络测量,多租户智能基线算法 以及 全链路异常定位&诊断,打造意图感知的高精度网络运维体系意图感知的高精度网络运维技术Intention-aware,High-precision Network O&M Based on Virtual Network Measurement,Intelligent Multi-tenant Baseline Generation Algorithms,and Fault Locating&DiagnosticsIntention-aware,High-precision Netw
16、ork O&MChallenges in Cloud Network O&M持续技术深耕自研重路由技术 分布式多活 自研分布式 网元虚拟化平台自研网络加速芯片+高性能网关超高性能软硬一体化 转发超高弹性NFV架构高可靠多层次 高可用架构云网络智能运维平台丰富产品服务服务全球客户400万+服务全球客户38%的世界500强1000万+开发者700万+VPC管理规模以技术创新普惠千行百业,持续为客户创造价值服务全球400万+客户,38%的世界500强,700万+VPC管理规模全球覆盖云网络基础设施连接稳定 I 安全 I 弹性云网络基础产品和服务 应用交付和托管本地组网简单云网络基础商品CDT-云数据
17、传输阶梯按量CU-云数据处理全球组网*来自阿里云数据库,2023/10/27Serving over 4 Million Customers Worldwide,Including 38%Fortune 500 Companies;Managing over 7 Million VPCsCreating Value for Various Industries Through Tech Innovation 获得产业认可Gartner 云厂商网络能力评估业界排名No.1 Gartner Solution Scorecard for IaaS+PaaS 2021计算机网络研究机构全球TOP10 Aminer公布了2022年度AI 2000人工智能最具影响力榜单入选国际知名会议篇论文10+连续入选SIGCOMM 5年一等奖浙江省 技术发明奖中国计算机学会 技术发明奖Continuous InnovationVaried ServicesWorldwide CustomersIndustry-recognized Achievements一等奖THANKS