上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

2017年实时大数据分析之利器Druid.pdf

编号:92455 PDF 28页 2.11MB 下载积分:VIP专享
下载报告请您先登录!

2017年实时大数据分析之利器Druid.pdf

1、实时大数据分析之利器Druid2017/12议程 关于品友 大数据分析的繁花似锦 历史和发展 架构 技术优势 应用 其他分析工具品友:中国程序化营销的领跑者59.8%品牌程序化市场占有率独立第三方广告技术领先者:创新&执行力1.5P每日处理1P的数据量4亿每日覆盖4亿个网页260亿每日处理260亿条日志20T每日20T新增日志8.9亿8.9亿Cookies人群5.3亿5.3亿日独立用户设备品友大数据计算平台大数据分析的繁花似景大数据分析的CAP性能(Performance)成本(Affordable)能力(Capacity)例如:Druid:A,P Vertica:C,P Presto:C C

2、lickHouse:P,C,A?DRUID介绍 2011 Metamarket 开发,2012年开源 初始用于广告分析,程序化分析+150贡献者 典型应用 300亿事件/天(品友互动)10亿事件/分钟(Jolata)用户行为分析(今日头条)广告实时分析(小米)性能监控分析(OneAPM)等等2017,8,Druid 中国 第五次Meetup2017,3,Druid 中国 第四次MeetupDruid简介 高可用性,Segment Shard机制 高性能,亚秒级查询响应 高吞吐,支持实时数据接入,批量数据接入 正确性,lambda架构能够在T+1时间校正实时数据 查询有segment级别缓存 堆

3、外内存复用,避免GC问题数据分析的演化阶段DRUID 架构Druid 的类 LSM-tree 近似直方图和分位数 预估数据(Data Sketch)地理索引和查询 路由器(Router)Kafka 索引服务 Druid一些高级特性DruidKafkaHDFSPivot(imply.io)Caravel(AirBnb)Calcite(Apache)PlyQL(imply.io)MetaBasePulsar(eBay)Imply(imply.io)spark-druid-Olap(SparklineData)Docker-Druid(druid.io)Druid-Console(druid.io)

4、Tranqulity(druid.io)PyDruid(druid.io)RDruid(Druid.io)SQL4D(srikalyc)S3Storm数据源访问扩展数据可视化分析平台数据管理Druid管理Druid数据分析生态系统数据分析生态系统Druid-Metrics-Kafka(quantiply)Druid-C(quantiply)Grafana-plugins(quantiply)Druid-Spark-Batch(MetaMarkets)Calcite(Apache)Druid行业应用:程序化广告平台分析Druid实时大数据分析Druid的应用:头条用户行为分析From:第四次中国

5、Druid用户组MeetupDruid的应用:OneAPM监控Druid实时大数据分析Druid的应用:网易行为分析From:第四次中国Druid用户组MeetupDruid的应用:知乎数据分析 行为分析 留存分析 查询报表From:第四次中国Druid用户组MeetupDruid不是银弹虽然快,但是聚合是一个双刃剑对CAP追求的执着发现新物种?(类百度统计 or Google Analytics)数据量:200+亿事件/天,100K+分析查询/天,数百万网站ClickHouse的不完美:1.不支持Transaction,OLTP2.聚合结果必须小于一台机器的内存大小3.缺少完整的Update

6、/Delete操作4.不适合典型的Key-Value存储5.不支持Blob/Document类型数据6.仅仅支持Ubuntu OS,其他用DockerEvent-oriented RDBMSClickHouse的技术特性和不完美ClickHouse/Metrica发展简史第一阶段MYISAM(LSM-Tree)(2008-2011)阶段二:Metrage(从2010-现在/End)阶段三:OLAPServer(2009-2013)第四阶段:ClickHouse(2011-现在)ClickHouse为什么这么快?性能为王的原则,每一个改动都需要经过性能测试。Vectorized Query Execution技术 利用CPU的SIMD(Single Instruction Multiple Data)来自VectorWise公司(Actian now!)参考“Vectorization vs.Compilation in Query Execution”Runtime Code Generation技术 Java JIT/Reflection;C+LLVM;C+14特性 TCMalloc类似技术百度 Palo的整体架构 列存储和压缩 两层分区与分级存储(SSD,SATA)向量化&LLVM 物化视图(切表)

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(2017年实时大数据分析之利器Druid.pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部