《火山引擎:从ClickHouse到ByteHouse(2022)(49页).pdf》由会员分享,可在线阅读,更多相关《火山引擎:从ClickHouse到ByteHouse(2022)(49页).pdf(49页珍藏版)》请在三个皮匠报告上搜索。
1、1:山引堕III Byt,eHouse 1.4 JJ、结一ClickHouse 是 个主要用于 OLAP 的开源列式数据库管理系统(RDBMS)。在计算速度上,芭比传统数据库快1001000倍,每台服务器在1秒内最多可以处理超10亿行数据。在使用规模上,字节跳动已成为国内最大的 ClickHouse 用户,内部的 ClickHouse 节点总数超过1.8万个,管理总数据量超过700PB,最大的单个集群部署规模约为2400余个节点。作为分析型数据库,ClickHouse 在数据写入性能,数据查询性能、系统兼容性和资源消耗成本上都具有明显的优势。1.多:大规模并行计算框架,支持高效的写入离线和流式
2、数据2.快:极致的查询性能,尤真是在大宽表场景下几乎性能无敌3.好:无侵入式架构,轻松集成到现高系统,上下游数据应用对接很方便4.省:充分利用硬件资源,以极低的成本实现海量数据分析06 1:山引堕III Byt,eHouse 2.4小结ClickHouse 拥高强劲的数据查询性能,能很好地支撑对分析查询性能和时效性高较高 要求的业务场景,比如:实时数仓、行为分析和交E式分析等,就是 ClickHouse 应用场景的典型代表。墓于 ClickHouse 构建的实时数仓场景,主要是满足业务分析中对于数据实时性的要求,解决传统离线数仓 T+1 甚至 T+n 的高延时问题。墓于 ClickHouse
3、实时分析能力构建的行为分析场景,主要是满足业务更为精细化的运营与营销需求,通过行为分析掏建多维度、立体化的数据洞察体系。ClickHouse 交E式分析场景,主要解决了 PB 级数据分析带来的性能、扩展性问题,大幅度提高数据分析的效率,拓展数据分析的应用范围。12 1:山引堕I II Byt,eHouse 3.3 IJ、结为了更好的满足一些场景,ByteHouse 深入改造了一些ClickHouse模块,例如有自研表引擎、查询优化器、存储计算架构改造。自研表引擎HaMergeTree解决了集群稳定性问题;HaUniqueTree解决了奇唯一键约束场景需求;HaKafka 引擎让Kafka 消费
4、有了HA的保障。查询优化器的百入可以提升ClickHouse在复杂查询上的性能提升,解决多表Global Join的性能问题。存储计算架构的改造让存储和计算解辑,各自可以搜需扩展,使用更加灵活。在广告行业里,ByteHouse非常适合受众分析的场景,让亿级别的人群分析变成交E式分析,加强业务洞察时效性,提高获取有效受众效率,精;佳广告投放以及评估广告价值。在金融行业里,ByteHouse 可以充当各种数据分析场景底下的引擎底座,在对App运营场景能很好的支持运营分析和用户行为分析,提升用户使用App体验,减少用户流失。在工业E联网场景,ByteHouse较于传统数据引擎能更好的解决海量数据引发的一系列问题,写入吞吐,查询性能,实时数擂台并等问题在使用ByteHouse后迎刃而解,数据量不再成为IOTI IIOT场景下的瓶颈。32