《RTO_8s :OceanBase 极致高可用的探索之旅_刘浩.pdf》由会员分享,可在线阅读,更多相关《RTO_8s :OceanBase 极致高可用的探索之旅_刘浩.pdf(14页珍藏版)》请在三个皮匠报告上搜索。
1、刘浩OceanBase 高级技术专家RTORTO 99.999%(5.26分钟)否则,热搜见 数据库容灾技术数据库容灾技术 数据库容灾技术的演进客户对客户对RTORTO的多样诉求的多样诉求OceanBase的初心STEP 01某大型金融客户STEP 02某跨境电商客户STEP 03解决支付宝核心业务的可用性难题从大机“降配”到PC服务器,如何保证服务连续性不降配?上云-多云-跨云部署,对RTO提出了哪些更高的要求?从从30s30s到到8s8s,不断追求极致的,不断追求极致的OceanBaseOceanBaseRPO=0,RTO 30sOceanBase V1V3:RPO=0,RTO 8sOce
2、anBase V4:更多场景:kill-9、reboot、网络分区、core、磁盘hang零调参全对等节点全链路:应用恢复 vs 数据库恢复多云/跨云部署RTORTO(基于(基于V4V4社区版)社区版)业务如何访问业务如何访问OceanBaseOceanBaseAPPAPPAPPF5/SLBOBProxyOBProxyOBProxyOBServerOBServerOBServer小于小于8s8s的时间内发生了什么?的时间内发生了什么?故障发生故障检测恢复启动新主上任路由刷新业务恢复RTO 8s如何快速准确的判定故障?发生故障后,数据库如何快速恢复?数据库恢复后,如何帮助业务快速恢复?面对的挑战
3、如何快速准确的判定故障如何快速准确的判定故障全新设计的选举与一致性协议基于TCP/RPC框架的故障检测机制 新的选举协议:去掉NTP依赖,Lease 4s PALF:Paxos-backed Append-only Log File System010203大幅减少故障恢复单元 Paxos Group:从分区到日志流发生故障后,数据库如何快速恢复发生故障后,数据库如何快速恢复Follower节点实时并回放 写入有多快,Follower回放就有多快解决支付宝核心业务的可用性难题解决支付宝核心业务的可用性难题统一设计的故障检测框架与有主改选基于RPC的路由信息刷新策略 等待Lease过期不是必须的010203 路由信息查找去中心化数据库恢复后,如何帮助业务快速恢复数据库恢复后,如何帮助业务快速恢复OBProxy基于建连的探活策略避免请求排队的影响,大幅减少误判概率OBProxy对故障节点实时拉黑与洗白实时判定节点故障,请求动态分配0102Q&AGitHub:/oceanbase/服务号:OceanBase数据库星球论坛: