上海品茶

7.DeepFlow基于eBPF的高度自动化可观测性实践.pdf

编号:161321 PDF 19页 2.25MB 下载积分:VIP专享
下载报告请您先登录!

7.DeepFlow基于eBPF的高度自动化可观测性实践.pdf

1、首届中国eBPF研讨会首届中国eBPF研讨会可观测性:解决复杂系统的可控性问题复杂系统可观测性外部输出=零侵扰内部状态=多维度有限时间=实时性控制理论中的可观测性是指:系统可以由其外部输出推断其内部状态的程度。NASA sent Apollo 11July 20,19691969年阿波罗11号完成登月壮举可观测性实现飞船控制I believe we should go to the moon.一系统具有可观测性当且仅当:针对所有的状态向量及控制向量,都可以在有限时间内,只根据输出信号来识别目前的状态。John F Kennedy May 25,19611961年肯尼迪提出十年内实现登月此时尚未

2、有可观测性理论首届中国eBPF研讨会kafka单个服务越来越简单,服务发布越来越快速通用逻辑逐渐卸载至基础设施,开发语言和框架越来越自由连接微服务的基础设施路径越来越长、多代理进程PodNodeHost代理进程PodNodeHost应用进程应用进程框架代码框架代码业务代码业务代码APPSYSNETSTORGWMQDB复杂系统可观测性外部输出=零侵扰内部状态=多维度有限时间=实时性#服务=N#路径=N2?路径N2服务N全栈可观测性越来越重要,如何消除业务开发与基础设施之间的鸿沟?首届中国eBPF研讨会代理进程PodNodeHost代理进程PodNodeHost应用进程应用进程框架代码框架代码业务

3、代码业务代码APPSYSNETSTOR零插码零重启零配置标准采集自动关联GWMQDB复杂系统:由数十种语言实现的高速迭代的云原生应用AutoMetrics从 cBPF 到 eBPF微服务的动态应用拓扑AutoTracing从 InProc 到 Distributed用户请求的零侵扰分布式追踪AutoLogging从 Kprobe 到 Uprobe应用事件的细粒度回溯日志promtail全栈可观测性首届中国eBPF研讨会AutoMetrics从 cBPF 到 eBPF微服务的动态应用拓扑AutoTracing从 InProcess 到 Distributed用户请求的零侵扰分布式追踪AutoLo

4、gging从 Kprobe 到 Uprobe应用事件的细粒度回溯日志123首届中国eBPF研讨会Kernel 3.10+Kernel 4.14+采集:Packet、Syscall Data、Func Data 聚合:L4 Flow、L7 Session 聚合:生成全栈性能 Metrics 提取:结构化 FlowLog/RequestLog(Span)关联:基于 Span 生成 Distributed Trace业务代码框架/库代码服务网格 sidecar容器网络 iptables/ipvs云网络 ovs/linuxbr网关、数据库首届中国eBPF研讨会我的服务HostK8sNodePIDPID

5、PIDPIDPIDPIDPodPodPodPodPodPodSingle IPSNAT下游服务GW不插码,你真的知道谁在访问你吗?某互联网用户,使用 DeepFlow 5 分钟内从数万个 Pod 中定位 RDS 访问量最大的Pod、服务、团队。即便插码,你真的知道你在访问谁吗?某金融用户,信用卡核心业务上线受阻,使用 DeepFlow 5 分钟内发现两个服务之间 API 网关是性能瓶颈。代理进程PodNodeHost代理进程PodNodeHost应用进程应用进程框架代码框架代码业务代码业务代码APPSYSNETSTOR零插码零重启零配置标准采集自动关联GWMQDB12453全栈可观测性首届中国

6、eBPF研讨会代理进程PodNodeHost代理进程PodNodeHost应用进程应用进程框架代码框架代码业务代码业务代码APPSYSNETSTOR零插码零重启零配置标准采集自动关联GWMQDB全栈混合云:KVM 宿主机+容器K8S 虚拟机NodevSwitchDeepFlow采集器进程业务POD业务POD采集PODbr业务POD全栈混合云:KVM 宿主机+容器K8S 虚拟机NodevSwitchDeepFlow采集器进程业务POD业务POD采集PODbr业务POD24567从云基础设施到云原生应用的全栈性能指标:应用性能:吞吐、时延、异常(RED)应用协议:HTTP(S

7、),RPC,SQL、MQ、DNS、系统性能:新建连接、活跃连接、建连异常、网络时延:建连时延、系统时延、数据时延、网络性能:吞吐、重传、零窗、传输层载荷、某互联网用户,使用 DeepFlow 5 分钟定位服务间 K8s 网络瓶颈。某金融用户,使用 DeepFlow 5 分钟定位 ARP 异常导致的 Pod 无法 Ready。某系统软件用户,使用 DeepFlow 5 分钟定位客户端未及时收包导致 gRPC 超时。全栈可观测性首届中国eBPF研讨会代理进程PodNodeHost代理进程PodNodeHost应用进程应用进程框架代码框架代码业务代码业务代码SYSNETSTOR零插码零重启零配置标准

8、采集自动关联GWMQDB123678智能 NAT 追踪:追踪一个四元组前后经过若干次 SNAT、DNAT、FULLNAT 变化后的流量拓扑和逐跳访问路径。45某金融用户,使用 DeepFlow 5 定位困扰云厂商多日的路由环路造成的一个服务上云下云时延周期性飙升。某金融用户,使用 DeepFlow 5 分钟内定位某个 NFVGW 实例对一组服务流量丢包导致客户端频繁重试。TGW-LTGW-WTGW EIPVPCGWJNSGWPVGWDCGWPCGWUNATGWNATGWSTGW-WSTGW-L专有云网络:十余种云网关多种隧道封装协议十余种通信端点上百种穿越 NFV 区的路径iptablesip

9、vsOvSK8s Node/KVM/Hyper-V NAT:NFVGW NAT:DeepFlow 与阿里飞天、腾讯 TCE、华为 HCS 已合作三年,深度适配。APP全栈可观测性首届中国eBPF研讨会AutoMetrics从 cBPF 到 eBPF微服务的动态应用拓扑AutoTracing从 InProcess 到 Distributed用户请求的零侵扰分布式追踪AutoLogging从 Kprobe 到 Uprobe应用事件的细粒度回溯日志123首届中国eBPF研讨会Istio Bookinfo Demo代理进程PodNodeHost代理进程PodNodeHost应用进程应用进程框架代码框架

10、代码业务代码业务代码SYSNETSTOR零插码零重启零配置标准采集自动关联GWMQDB1167五种语言高速迭代云原生APP全栈可观测性首届中国eBPF研讨会1.零插码:且无需向 HTTP 头注入 TraceID 或 SpanID2.全链路:4 个调用、38 个 Span,分为 24 eBPF Span+14 cBPF Span3.多语言:Java、Python、Ruby、Node.js 及 C/C+(curl/envoy)4.全栈:追踪两个微服务之间的网络路径,从 Pod 到 Node 到 KVM,IPIP/VXLAN,并关联网络 Metrics5.全栈:追踪微服务内从

11、Envoy Ingress 服务 DNS Envoy Egress 全过程案例:某互联网用户,使用 DeepFlow 5 分钟内定位客户端慢服务端不慢的经典扯皮问题。业务开发团队服务网格团队容器运维团队云运维团队Curl(C)Envoy(C+)ProductPage(Python)Details(Ruby)Reviews(Java)Ratings(Node.js)Ingress Envoy(Recv)Ingress Envoy(Send)应用进程(Recv)应用进程(Send)Egress Envoy(Recv)Egress Envoy(Send)IPIP/VXLAN无需插码快速定界DNS L

12、ookupEnvoy(C+)Envoy(C+)Envoy(C+)Envoy(C+)Envoy(C+)Envoy(C+)客户端应用进程客户端 Pod 网卡客户端 Node 网卡服务端 Node 网卡服务端 Pod 网卡服务端应用进程=云网络消耗首届中国eBPF研讨会ServiceServiceServiceServiceServiceServiceService追踪两个服务间的网络路径:TCP.SEQ、TimeWindow、追踪一个服务前后的入出请求:同线程追踪:ThreadID、SyscallTraceID、跨线程追踪:SessionID、X-Request-ID、跨协程追踪:Coroutin

13、eID、eBPF HookseBPF+cBPF Hooks首届中国eBPF研讨会AutoMetrics从 cBPF 到 eBPF微服务的动态应用拓扑AutoTracing从 InProcess 到 Distributed用户请求的零侵扰分布式追踪AutoLogging从 Kprobe 到 Uprobe应用事件的细粒度回溯日志123首届中国eBPF研讨会应用访问日志网络流日志TCP 包头时序图PCAP 报文回溯从应用到基础设施全栈文件IO日志*代理进程PodNodeHost代理进程PodNodeHost应用进程应用进程框架代码框架代码业务代码业务代码SYSNETSTOR零插码零重启零配置标准采集

14、自动关联GWMQDB1167某政府用户,使用 DeepFlow 流日志替代了全包存储,回溯查询速度 10 x,存储时长 100 x。某金融用户,使用 DeepFlow TCP 包头时序图 5 分钟内发现 Cloud GW 转发 SYN 时延大。APP全栈可观测性首届中国eBPF研讨会grep-rnF.symbol=agent/src/ebpf/user/./go_tracer.c:173:.symbol=runtime.casgstatus,./go_tracer.c:179:.symbol=crypto/tls.(*Conn).Write,./go_tracer.c:1

15、85:.symbol=crypto/tls.(*Conn).Write,./go_tracer.c:191:.symbol=crypto/tls.(*Conn).Read,./go_tracer.c:197:.symbol=crypto/tls.(*Conn).Read,./go_tracer.c:206:.symbol=net/http.(*http2serverConn).writeHeaders,./go_tracer.c:212:.symbol=golang.org/x/net/http2.(*serverConn).writeHeaders,./go_tracer.c:220:.sy

16、mbol=net/http.(*http2serverConn).processHeaders,./go_tracer.c:226:.symbol=golang.org/x/net/http2.(*serverConn).processHeaders,./go_tracer.c:234:.symbol=net/http.(*http2clientConnReadLoop).handleResponse,./go_tracer.c:240:.symbol=golang.org/x/net/http2.(*clientConnReadLoop).handleResponse,./go_tracer

17、.c:248:.symbol=net/http.(*http2ClientConn).writeHeader,./go_tracer.c:254:.symbol=golang.org/x/net/http2.(*ClientConn).writeHeader,./go_tracer.c:262:.symbol=net/http.(*http2ClientConn).writeHeaders,./go_tracer.c:268:.symbol=golang.org/x/net/http2.(*ClientConn).writeHeaders,./go_tracer.c:277:.symbol=g

18、oogle.golang.org/grpc/internal/transport.(*loopyWriter).writeHeader,./go_tracer.c:285:.symbol=google.golang.org/grpc/internal/transport.(*http2Client).operateHeaders,./go_tracer.c:293:.symbol=google.golang.org/grpc/internal/transport.(*http2Server).operateHeaders,./ssl_tracer.c:46:.symbol=SSL_write,

19、./ssl_tracer.c:52:.symbol=SSL_write,./ssl_tracer.c:58:.symbol=SSL_read,./ssl_tracer.c:64:.symbol=SSL_read,grep-rnF KPROG agent/src/ebpf/kernel/./include/bpf_base.h:200:#define KPROG(F)SEC(kprobe/_stringify(F)int kprobe_#F./socket_trace.c:1152:KPROG(_sys_sendmsg)(struct pt_regs*ctx)./socket_trace.c:1

20、189:KPROG(_sys_sendmmsg)(struct pt_regs*ctx)./socket_trace.c:1235:KPROG(_sys_recvmsg)(struct pt_regs*ctx)./socket_trace.c:1271:KPROG(_sys_recvmmsg)(struct pt_regs*ctx)./socket_trace.c:1320:KPROG(do_writev)(struct pt_regs*ctx)./socket_trace.c:1353:KPROG(do_readv)(struct pt_regs*ctx)grep-rnF TPPROG ag

21、ent/src/ebpf/kernel/./include/socket_trace.h:189:#define TPPROG(F)SEC(tracepoint/syscalls/_stringify(F)int bpf_func_#F./socket_trace.c:1019:TPPROG(sys_enter_write)(struct syscall_comm_enter_ctx*ctx)./socket_trace.c:1035:TPPROG(sys_exit_write)(struct syscall_comm_exit_ctx*ctx)./socket_trace.c:1050:TP

22、PROG(sys_enter_read)(struct syscall_comm_enter_ctx*ctx)./socket_trace.c:1065:TPPROG(sys_exit_read)(struct syscall_comm_exit_ctx*ctx)./socket_trace.c:1086:TPPROG(sys_enter_sendto)(struct syscall_comm_enter_ctx*ctx)./socket_trace.c:1102:TPPROG(sys_exit_sendto)(struct syscall_comm_exit_ctx*ctx)./socket

23、_trace.c:1123:TPPROG(sys_enter_recvfrom)(struct syscall_comm_enter_ctx*ctx)./socket_trace.c:1138:TPPROG(sys_exit_recvfrom)(struct syscall_comm_exit_ctx*ctx)./socket_trace.c:1176:TPPROG(sys_exit_sendmsg)(struct syscall_comm_exit_ctx*ctx)./socket_trace.c:1214:TPPROG(sys_exit_sendmmsg)(struct syscall_c

24、omm_exit_ctx*ctx)./socket_trace.c:1256:TPPROG(sys_exit_recvmsg)(struct syscall_comm_exit_ctx*ctx)./socket_trace.c:1302:TPPROG(sys_exit_recvmmsg)(struct syscall_comm_exit_ctx*ctx)./socket_trace.c:1338:TPPROG(sys_exit_writev)(struct syscall_comm_exit_ctx*ctx)./socket_trace.c:1371:TPPROG(sys_exit_readv

25、)(struct syscall_comm_exit_ctx*ctx)./socket_trace.c:1385:TPPROG(sys_enter_close)(struct syscall_comm_enter_ctx*ctx)./socket_trace.c:1407:TPPROG(sys_enter_getppid)(struct syscall_comm_enter_ctx*ctx)./socket_trace.c:1437:TPPROG(sys_exit_socket)(struct syscall_comm_exit_ctx*ctx)首届中国eBPF研讨会0246810CPUMEM

26、DISK1111011.551.57.5资源消耗对比(标准 Tag)DeepFlow+ClickHouseClickHouse(LowCard)ClickHouse(String)10 x降低7.5x降低随机生成一组长度为 16 字符串标签,Cardinality 为 5000,持续极限速率写入。资源池区域可用区云平台租户云资源宿主机云服务器容器服务容器集群容器节点命名空间容器服务IngressWorkloadPODK8s labelsappversionenvownerstagecommitId.Annotations*biz/terminalTypecicd/deploymentId.OS

27、 ENV*MODULE_NAME.222222222203040506070809060708090100资源消耗 vs.#(标准+自定义 Tag)DeepFlow其他方案TAG总数量50 x降低标准 Tag:开销 10 x 降低自定义 Tag:零开销ApplicationServiceNameFunctionNameEndpointTraceIdSpanIdRequestId.网络资源VPC子网CIDRIP地址NATGWALB.SELECT any_tag FROM any_tableWHERE any_tag GROUP BY any_tagdatadataAgent

28、Serverdatataginttagstrtagstr.20+datatagstr.100+编码标准 Tag关联自定义 Tag解码标准 Tag假设标准 TAG 固定 20 个,自定义 TAG 从 0 个增长到 80 个。Tag without LimitAutoTagging&SmartEncoding首届中国eBPF研讨会AgentDeepFlowObservability with Automation and CollaborationAny Stackapplication,infra,.kafkaSouthbound IntegrationsStorage optionsServerControllerQuerierIngesterLabelerEurekaAny Tagsvc,instance,endpoint,.Northbound IntegrationsSLSkafkaAutoTaggingAutoMetricsAutoTracingAutoLoggingdatametaSmart E Landscape ProjecteBPF Landscape Project首届中国eBPF研讨会Thanks!2022/11/

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(7.DeepFlow基于eBPF的高度自动化可观测性实践.pdf)为本站 (张5G) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
会员动态
会员动态 会员动态:

177**45... 升级为至尊VIP  wei**n_... 升级为至尊VIP

 wei**n_... 升级为至尊VIP 微**...   升级为标准VIP

 wei**n_...  升级为标准VIP wei**n_... 升级为标准VIP 

139**16...  升级为至尊VIP wei**n_... 升级为标准VIP  

wei**n_...  升级为高级VIP  182**00... 升级为至尊VIP

 wei**n_...  升级为高级VIP  wei**n_...  升级为高级VIP

 wei**n_... 升级为标准VIP   133**67... 升级为至尊VIP

 wei**n_... 升级为至尊VIP 柯平 升级为高级VIP

shi**ey...  升级为高级VIP 153**71...  升级为至尊VIP 

  132**42... 升级为高级VIP wei**n_...  升级为至尊VIP

178**35... 升级为至尊VIP    wei**n_...  升级为高级VIP

 wei**n_... 升级为至尊VIP wei**n_...  升级为高级VIP 

 wei**n_...  升级为高级VIP 133**95... 升级为高级VIP

 188**50... 升级为高级VIP  138**47... 升级为高级VIP 

 187**70... 升级为高级VIP Tom**12...  升级为至尊VIP 

微**...   升级为至尊VIP wei**n_... 升级为至尊VIP

 156**93... 升级为至尊VIP  wei**n_... 升级为高级VIP 

wei**n_...  升级为至尊VIP  wei**n_... 升级为标准VIP 

 小敏 升级为高级VIP hak**a9... 升级为至尊VIP

185**56... 升级为高级VIP  156**93... 升级为标准VIP 

 wei**n_...  升级为至尊VIP  wei**n_...  升级为至尊VIP

Br**e有... 升级为至尊VIP  wei**n_... 升级为标准VIP

 wei**n_... 升级为高级VIP wei**n_... 升级为至尊VIP  

156**20... 升级为至尊VIP    wei**n_...  升级为至尊VIP

 微**... 升级为标准VIP  135**45... 升级为标准VIP

wei**n_... 升级为至尊VIP   wei**n_...  升级为高级VIP

157**60...  升级为高级VIP 150**45...   升级为至尊VIP

wei**n_... 升级为标准VIP  wei**n_...  升级为至尊VIP

151**80...   升级为高级VIP 135**10...  升级为标准VIP

wei**n_... 升级为高级VIP  wei**n_... 升级为高级VIP 

wei**n_...  升级为至尊VIP  wei**n_... 升级为标准VIP

wei**n_... 升级为高级VIP  wei**n_... 升级为高级VIP 

135**22...  升级为高级VIP  wei**n_...  升级为至尊VIP

 181**62... 升级为至尊VIP  黑**...  升级为至尊VIP

wei**n_... 升级为至尊VIP  178**61...  升级为高级VIP

 186**20... 升级为高级VIP wei**n_...  升级为标准VIP

  wei**n_... 升级为高级VIP wei**n_... 升级为标准VIP 

  wei**n_... 升级为至尊VIP wei**n_... 升级为标准VIP

152**94...  升级为高级VIP  wei**n_... 升级为标准VIP

wei**n_... 升级为标准VIP   185**27... 升级为标准VIP

135**37... 升级为至尊VIP  159**71...  升级为高级VIP

139**27... 升级为至尊VIP   wei**n_... 升级为高级VIP

wei**n_... 升级为高级VIP    188**66... 升级为标准VIP

 wei**n_... 升级为至尊VIP wei**n_...  升级为高级VIP

wei**n_...  升级为至尊VIP  wei**n_... 升级为高级VIP 

 wei**n_... 升级为高级VIP wei**n_... 升级为至尊VIP  

 177**81...  升级为标准VIP 185**22...  升级为标准VIP

138**26... 升级为至尊VIP  军歌 升级为至尊VIP

 159**75... 升级为至尊VIP wei**n_... 升级为标准VIP 

 wei**n_...  升级为至尊VIP wei**n_...  升级为高级VIP