《企业发现云成本优化的新秘密武器-于功波.pdf》由会员分享,可在线阅读,更多相关《企业发现云成本优化的新秘密武器-于功波.pdf(42页珍藏版)》请在三个皮匠报告上搜索。
1、企业发现云成本优化的新秘密武器FinOps on cloud cost optimization Azul SystemsGC Tech VP/Gavin YuConfidential|Do Not Distribute2于功波于功波Confidential|Do Not Distribute3Confidential|Do Not Distribute4 KPI:FinOps 降本且增效20232023年终总结年终总结Confidential|Do Not Distribute5内卷的由来和内卷的由来和JavaJava的困境的困境Confidential|Do Not Distribute6
2、JDKJDK 2121的新特性的新特性AzulAzul platformplatform PrimePrime (JDK 8/11/17/21)(JDK 8/11/17/21)JavaJava的新武器的新武器(升级换代升级换代?)?)C4:The Continuously Concurrent Compacting CollectorReady Now OrchestratorFalcon:A better LLVM-based JIT compilerCNC:Cloud Native CompilerBug fixed in timeCVE fixed in timeConfidential
3、|Do Not Distribute7Performance EngineeringPerformance EngineeringJVM FinOps Solution JVM FinOps Solution Confidential|Do Not Distribute8提高生产效率、时间价值和性能提高生产效率、时间价值和性能利用利用 OpenJDK 直接替换,无需更改任何代码直接替换,无需更改任何代码提高人员生产效率提高人员生产效率减少工程时间、分类时间和操作/支持工单 提高时间价值提高时间价值释放工程资源,专注于价值交付,缩短产品上市时间提高应用程序性能提高应用程序性能即使负载增加也能提高
4、 SLA,确保对延迟敏感系统最快响应立即减少立即减少 95%故障单,提高运营效率免去每年免去每年 2,190 小时小时 性能调整,在高容量下以微秒为单位 加速欺诈检测提升提升 80%的微秒级性能 提升提升 50%十微秒内的极致穿透时延消灭毫秒级的延迟 Confidential|Do Not Distribute9云的成功通常伴随高昂的成本云的成功通常伴随高昂的成本缺点:缺点:成本超支成本超支缺乏或毫无云成本优化计划的组织仓促上阵进行云技术投资 最终超支高达最终超支高达云的价值云的价值按需容量弹性敏捷性即付即用可用性可扩展性自动化70%来源:“在迁移到云后实现成本节约”,Gartner 金融研究
5、团队,2021 年 4 月Confidential|Do Not Distribute10存储存储计算约占云支出的计算约占云支出的 60%网络网络计算计算计算实例计算实例共享服务共享服务1.https:/ Not Distribute11所需的云计算实例数量所需的云计算实例数量根据可接受的故障率提供实际负载根据可接受的故障率提供实际负载决定决定实际部署的计算实例数量实际部署的计算实例数量Confidential|Do Not Distribute12重新设计/重构/重组应用程序以提高效率和弹性使用更高效的 JDK调优和配置操作系统使用最新的处理器和计算实例类型如何减少云计算实例总数?如何减少云
6、计算实例总数?直接替换/无代码更改。Confidential|Do Not Distribute13存储存储无需任何代码更改即可将云计算减少无需任何代码更改即可将云计算减少 20%-50%网络网络计算计算计算实例计算实例共享服务共享服务Confidential|Do Not Distribute1403:00Jun 1700:00Jun 1709:00Jun 1706:00Jun 1715:00Jun 1812:00Jun 1721:00Jun 1818:00Jun 1803:00Jun 1800:00Jun 1809:00Jun 1806:00Jun 1815:00Jun 1812:00Ju
7、n 1821:00Jun 1918:00Jun 180:00Jun 19云计算普遍云计算普遍的现实问题的现实问题*匿名客户真实案例支付了支付了 100%实际使用率只有实际使用率只有 10%-30%CPU 利用率阈值通常设置在 35%-50%之间1实际利用率通常远低于阈值2出于对弹性的考虑,实例通常不会在非高峰期停转3Confidential|Do Not Distribute15投入考量,第一部分:投入考量,第一部分:更快的更快的 Java 应用程序应用程序更少的计算实例更少的计算实例更低的云成本更低的云成本Confidential|Do Not Distribute16投入考量,第二部分:投
8、入考量,第二部分:更高的实例利用率更高的实例利用率更少的计算实例更少的计算实例更低的云成本更低的云成本Confidential|Do Not Distribute17投入考量投入考量更高的实例更高的实例利用率利用率更快的更快的 Java 应用程序应用程序更少的计算实例更少的计算实例更低的云成本更低的云成本Confidential|Do Not Distribute18C1 compiled codeInterpreterC2 compiled code(with deoptimisations)GC pausesJVM Performance GraphJVM Performance Grap
9、hConfidential|Do Not Distribute19运行 Java 代码的速度提高 20%-50%优化代码执行以充分利用最新处理器 使用更好的基于 LLVM 的 JIT 编译器改进推测优化 在较高负载下保持一致的服务水平随着时间的推移减少 CPU 使用中的噪声消除暂停、抖动和停滞利用 C4 世界上最好的无暂停垃圾回收器 显著减少因添加新实例而引起的中断和故障从一开始便全速运行使用 ReadyNow!技术调整、自学习和迭代优化配置文件 全球最快、最高效的全球最快、最高效的 JVM代码执行更快,代码执行更快,Java 应用程序更快应用程序更快一致性更高,利用率更高一致性更高,利用率更
10、高预热改善,弹性增加预热改善,弹性增加它是它是 OpenJDK 的增强版本,具有卓越的性能、一致性和承载能力的增强版本,具有卓越的性能、一致性和承载能力Confidential|Do Not Distribute20综合投入考量综合投入考量更高的更高的实例利用率实例利用率更快的更快的 Java 应用程序应用程序更少的计算实例更少的计算实例更低的云成本更低的云成本更快的更快的代码执行代码执行经过改善的预热经过改善的预热更高的一致性更高的一致性Confidential|Do Not Distribute2103:00Jun 1700:00Jun 1709:00Jun 1706:00Jun 1715
11、:00Jun 1812:00Jun 1721:00Jun 1818:00Jun 1803:00Jun 1800:00Jun 1809:00Jun 1806:00Jun 1815:00Jun 1812:00Jun 1821:00Jun 1918:00Jun 180:00Jun 19云计算的普遍现实云计算的普遍现实Azul Platform Prime 降低云成本的 4 个步骤*匿名客户真实案例大多数公司将 CPU 阈值设置在 35%-50%容量之间,以应对负载的意外波动支付了支付了 100%实际使用率只有实际使用率只有 10%-30%Confidential|Do Not Distribute2
12、203:00Jun 1700:00Jun 1709:00Jun 1706:00Jun 1715:00Jun 1812:00Jun 1721:00Jun 1818:00Jun 1803:00Jun 1800:00Jun 1809:00Jun 1806:00Jun 1815:00Jun 1812:00Jun 1821:00Jun 1918:00Jun 180:00Jun 19使用 Azul Platform Prime 时,由于代码执行更快、更高效,初始 CPU 使用率会降低。1云计算的普遍现实云计算的普遍现实Azul Platform Prime 降低云成本的 4 个步骤*匿名客户真实案例Con
13、fidential|Do Not Distribute2303:00Jun 1700:00Jun 1709:00Jun 1706:00Jun 1715:00Jun 1812:00Jun 1721:00Jun 1818:00Jun 1803:00Jun 1800:00Jun 1809:00Jun 1806:00Jun 1815:00Jun 1812:00Jun 1821:00Jun 1918:00Jun 180:00Jun 19云计算的普遍现实云计算的普遍现实Azul Platform Prime 降低云成本的 4 个步骤*匿名客户真实案例接下来,减少实例计数,使 CPU 使用率升至原始水平(节
14、省成本)2Confidential|Do Not Distribute2403:00Jun 1700:00Jun 1709:00Jun 1706:00Jun 1715:00Jun 1812:00Jun 1721:00Jun 1818:00Jun 1803:00Jun 1800:00Jun 1809:00Jun 1806:00Jun 1815:00Jun 1812:00Jun 1821:00Jun 1918:00Jun 180:00Jun 19然后,由于一致性和更高负载下保持服务级别能力的提高,实例计数进一步减少,CPU 阈值增加(节省更多成本)3云计算的普遍现实云计算的普遍现实Azul Pla
15、tform Prime 降低云成本的 4 个步骤*匿名客户真实案例45%Confidential|Do Not Distribute2503:00Jun 1700:00Jun 1709:00Jun 1706:00Jun 1715:00Jun 1812:00Jun 1721:00Jun 1818:00Jun 1803:00Jun 1800:00Jun 1809:00Jun 1806:00Jun 1815:00Jun 1812:00Jun 1821:00Jun 1918:00Jun 180:00Jun 19*匿名客户真实案例45%最后,由于实际弹性,在较低负载周期内,实例计数会进一步减少,这是因为
16、启动时中断显著减少(支出与实际需求更匹配)(节省更多成本)4云计算的普遍现实云计算的普遍现实Azul Platform Prime 降低云成本的 4 个步骤Confidential|Do Not Distribute26案例分享案例分享1 1GC无忧Prime1.消除GC扰动2.增加订单吞吐量3.免除开发JVM优化和测试JVM调优引入无暂停C4回收器采用更高效JIT编译器ReadNow技术解决预热问题收益收益痛点痛点1.订单延迟抖动2.毛刺导致无法满足SLA3.大量代码优化和JVM调优Confidential|Do Not Distribute27 某头部证券(自营自营交易系统交易系统)将Ho
17、tspot的GC延迟从几百毫秒减少到几毫秒 快速预热提升业务处理性能满足交易系统SLA的需求 提升Kafka吞吐量痛点痛点1.交易延迟抖动2.毛刺导致无法满足SLA3.大量代码优化和JVM调优1.消除GC扰动,并提供快速启动2.增加两倍吞吐量,节省服务器基础架构3.免除开发JVM优化和测试JVM调优收益收益案例分享案例分享2 2Confidential|Do Not Distribute28更高的吞吐量;更少的基础架构使用后使用后(With Azul Prime JDK)(With Azul Prime JDK)Producer ClientsProducer ClientsConsumer
18、ClientsConsumer ClientsProducer ClientsProducer Clients使用前使用前(No Azul JDK)(No Azul JDK)更高吞吐;更少规模;成本更低最终客户更满意;更多的营收;SLA保证易于管理;更高效Consumer ClientsConsumer Clients30003000 TPSTPSSLA P99.51ms,P99.910msKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka K
19、afka ServerServerKafka Kafka ServerServerKafka Kafka ServerServer10001000 TPSTPSSLA P99.51ms,P99.910msKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka
20、Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServerKafka Kafka ServerServer3000 TPS3000 TPS SLA P99.51ms,P99.910ms1000 TPS1000 TPS SLA P99.51ms,P99.910ms案例案例2 2分析分析某头部证券某头部证券OMSOMS系统系统Confidential|Do Not Distribute29FinOps on Kafka(Cloud Cost Saving Optimization)FinOps on Kafka(Cloud
21、Cost Saving Optimization)Confidential|Do Not Distribute3003:00Jun 1700:00Jun 1709:00Jun 1706:00Jun 1715:00Jun 1812:00Jun 1721:00Jun 1818:00Jun 1803:00Jun 1800:00Jun 1809:00Jun 1806:00Jun 1815:00Jun 1812:00Jun 1821:00Jun 1918:00Jun 180:00Jun 19FinOps on Kafka(Cloud Saving Optimization)FinOps on Kafka
22、(Cloud Saving Optimization)Confidential|Do Not Distribute31行业专家对增强型行业专家对增强型 JVM/JDK 的看法的看法“IT 团队正在应对严峻的预算环境和高性能应用程序需求的双重挑战。优化的 Java 虚拟机为两者提供了解决方案”IDC 智能 CloudOps 研究副总裁,Jevin Jensen“Platform Prime 使 Java 开发人员能够更高效地利用服务器资源或云实例。.Forrester 对四位现有客户的访谈和随后的财务分析发现,这些受访客户的组织获得了 224%的投资回报率。”Forrester总体经济影响研究重
23、新评估云战略的组织需要重新审视产品组合中的核心技术,并确定如何优化工作负载以在云中本地运行云原生 JVM 可以在不损失任何传统功能或兼容性的情况下实现”-首席研究分析师,John Abbott“Azul Platform Prime 是一个高性能的基于 OpenJDK 的发行版本,具有优化的 JIT 编译器、低延迟和高吞吐量的垃圾回收器、低内存使用率以及快速启动和预热等功能。”选择 Java 运行时,GartnerConfidential|Do Not Distribute32Platform Platform PrimePrime使得开源项目运行使得开源项目运行 更快、更稳和更安全更快、更稳
24、和更安全Prime Prime 对开源项目的性能提升对开源项目的性能提升可以比可以比OpenJDKOpenJDK提升多少性能提升多少性能?Cassandra+35%Elasticsearch/Solr+37%Kafka+45%Confidential|Do Not Distribute33Confidential|Do Not Distribute33Platform Prime Platform Prime 让让 AWS Arm64 Graviton AWS Arm64 Graviton 运行得更好运行得更好新新!支持 AWS 的 Graviton 3 处理器Graviton/Arm64 硬
25、件的最佳 JVM令人惊叹的性价比组合20-29%比Corretto/OpenJDK更快的性能Confidential|Do Not Distribute34PerformancePerformance S-curveS-curve ChartChartConfidential|Do Not Distribute35下一步建议下一步建议估算您的 Java 资产和主要用例的大小 确认您所使用的技术 根据您的业务目标选择如何使用云成本优化:立即节省运营费用:立即节省运营费用:关闭实例,用更少的资源满足相同的需求12节省额外的运营费用:节省额外的运营费用:通过一致的性能和改进的预热提高利用率3回收容量
26、回收容量,为未来增长提供动力:为未来增长提供动力:在容量受限的环境中释放资源,用相同的资源满足更多需求4充分利用已承诺的云支出:充分利用已承诺的云支出:在 AWS Marketplace 上轻松购买 Azul Platform Prime5降低每个增量单位的服务成本:降低每个增量单位的服务成本:随业务增长提高盈利能力6投资新项目:投资新项目:释放预算以推动更多自筹资金创新7支持您的支持您的 FinOps 战略:战略:将其作为下一步云成本战略Confidential|Do Not Distribute36Azul Java PlatformAzul Java Platform 公众号公众号Con
27、fidential|Do Not Distribute38Confidential|Do Not Distribute39AzulAzul平台平台Azul Zulu Builds of OpenJDK全连接的运行环境Azul智能云Azul分析套件Azul优化套件Azul Platform Core(曾用名 Zulu Enterprise/Embedded)Azul Platform Prime(曾用名 Zing)AzulAzul支持支持技术支持,培训支持,迁移服务GatewaysApplied Machine Learning浏览 客户案例客户案例GatewaysApplied Machine
28、 Learning浏览 技术技术Confidential|Do Not Distribute40客户降低云成本客户降低云成本服务器占用空间服务器占用空间 减少减少 30%以上以上节省了数百万美元基础设施将增加基础设施将增加 5 倍倍无需借助 Azul Platform Prime回收回收 20%以上未使用的以上未使用的 CPU承载能力,改善玩家体验借助基于云的财务系统借助基于云的财务系统 每笔交易的成本降低 85%通过提高性能通过提高性能基础设施支出减少 38%回收回收 50%未使用的基础设施用于电子交易 Confidential|Do Not Distribute41年云支出估算年云支出估算基于 HG Insights(Intricately)提供的数据进行估算您的年度成本借助成本借助 Azul 预预计可节省计可节省:230-290 万美元万美元您每年在云和数据中心云和数据中心的总支出预计为的总支出预计为:*7,920 万美元万美元Confidential|Do Not Distribute42Azul Azul 是支持是支持JavaJava战略的最佳合作伙伴战略的最佳合作伙伴