上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

何军-Native Flink on K8s在小红书的实践.pdf

编号:101898 PDF 30页 4.08MB 下载积分:VIP专享
下载报告请您先登录!

何军-Native Flink on K8s在小红书的实践.pdf

1、何军/小红书Native Native FlinkFlink on on KubernetesKubernetes在小红书的实践在小红书的实践多云部署架构多云部署架构#1支持业务场景支持业务场景#2HELMHELM集群管理集群管理#3Native Native FlinkFlink on K8son K8s实践实践#4流批一体作业管控平台流批一体作业管控平台#5未来展望未来展望#6#1#1多云部署架构多云部署架构多云部署模式Tencent K8SCOS云基础设施作业运维监控报警作业开发版本管理元数据管理数据血缘SDK资源管理流批一体作业管控平台KafkaRocketMQESStarRocksC

2、lickhouseRedKV业务数据前端打点后端打点Ali K8S OSSHuawei K8S OBSFlink RuntimeFlink SqlFlink JarEvent BusOLAPOnline Service#2#2业务场景业务场景应用场景-实时算法训练FeatureJoiner训练实时查询GravityOLAP表OLAP离线处理系统/报表系统离线Hive表数仓打点服务APPSessionLabeler汇总样本数据Summary标签数据Refer数据流SessionLabeler归因原始打点流KV:特征数据Breakdown在线引擎Training应用场景-实时数仓主题域分流Data

3、 CenterData CenterStarRocksCacheKafkaETL业务逻辑Flink业务数据后端日志前端日志实时实时DAUDAU实时实时RGMVRGMV实时直播归因实时直播归因实时广告计费实时广告计费RocketMQ#3#3HELMHELM集群管理模式集群管理模式为什么用HELMKubernetes包管理器:定义,安装,升级k8s应用和服务描述复杂应用降低管理降低管理复杂度复杂度无须修改提交job代码升级简单升级简单版本管理,方便共享,发布到公有或私有服务器易于共享易于共享低成本回滚到指定旧版本易于回滚易于回滚基于HELM管理的任务生命周期1.start启动任务ClientHel

4、m client百川平台百川平台JobManagerFlinkFlink clustercluster2.helm install3.JM Alive check4.Job submitTaskManager5.status check1.stop停止任务4.helm del2.cancel job3.Job status checkFink clientTaskManagerClientHelm client百川平台百川平台Fink clientJobManagerFlinkFlink clusterclusterTaskManagerTaskManagerjobmanager&taskma

5、nger podsJM/TM Deployment1 14 45 56 63 32 2Hadoop configurationConfigMapFlink web-uiIngressJM/TM communicationNodePort ServiceRocksdb backend SSDBatch data diskVolumnEds redkvServiceMeshHelm资源管理Helm多云环境支持volumningressconfigmapservicemeshtm deploymentjm deploymentTencent flink clusterTencent flink cl

6、usteringressconfigmaptm deploymentjm deploymentAli flink clusterAli flink clusteringressconfigmaptm deploymentjm deploymentHuawei Huawei flinkflink clustercluster百川平台TencentkubeconfigAlikubeconfigHuaweikubeconfigHelm ClientHelm template 1Helm template 2Helm template 3Job config实际生产遇到的问题UDF管理复杂度高k8S资

7、源瓶颈(NodePort/Service ClusterIP)ServiceMesh配置成本过高资源泄漏镜像版本难以收敛#4#4Native on Native on kuberneteskubernetes管理模式管理模式更短的failover时间资源托管更加便捷的HAWhy Native Flink on KubernetesArchietecture of Native Flink on KubernetesK8s ApiServerConfigMapPodTaskManagerPodTaskManagerFlink Master DeploymentDispatcherClusterE

8、ntrypointK8sResMngrJobMasterSVCFlink ClientK8s ClientFlinkDashBoard10UDF 管理模式Platform Build-inUser-definedfunctions:-name:red_json_array_field_sumtype:scalar className:red.data.platform.flink.hub.udf.scalar.JsonStrArraySumFunc-name:red_row_to_jsontype:scalarclassName:red.data.platform.fli

9、nk.hub.udf.scalar.RowToJsonFunccreate function extractMongoID as .red.rec.olj.udf.ExtractMongoIDFunc using jar cosn:/xhs-xxx/udf/algo/project-11/udf-4.5/aaa.jar;镜像版本管理引擎版本Connector版本插件版本Flink Image 引擎/connector/plugin版本分离 更低的引擎打包频繁 更低的发版耗时 版本动态配置Run JobJobAttemptsdk_version_plainBackendBaichuan-k8sF

10、linkJobFlink ContainerFlink Job GraphClasspath:/opt/flink/connector-lib/kafka/xxx.jarApolloHabordocker- ClusterIP不足解决方案Headless serviceIngressStatus DBJobstatusBaiChuanJob Status ListenersHeadless serviceJobManagerQuery StatusStatus ReportIngress部署模式的迁移Flink SQL兼容转化工具兼容检测工具迁移工具引擎兼容规则集兼容转化工具 Field De

11、finition Connector Version Case Sensitive 兼容检测工具 OperatorId name Max parallelism Compile result引擎兼容迁移工具 低影响时间 状态不丢失 异常自动回滚 Aggregate Function to the new type system FLINK-15803 Implement all the data structures and serializers around RowData FLINK-16996 serialVersionUID变动 FLINK-21896Application Mode

12、问题及解决方案Jobmanager Failover重新拉起一批TM,资源double,资源不足时failver失败Failover时从首次启动是指定的recover path进行恢复,重复消费Fail The Job#5#5流批一体作业管控平台流批一体作业管控平台平台功能作业运维监控报警作业开发版本管理元数据管理数据血缘SDK资源管理流批一体作业管控平台作业开发及运维开发运维作业版本管理Flink SQLFlink JAR资源隔离及推荐CPU usageMemory usageDelay metricsCloud regionBusiness typeStream/batch mode批任务

13、管理Rugal调度平台SDK百川任务管理平台rocketmq_topic_namesrv:“srv1”rocketmq_topic_name:“topic1”yesterday_timestamp:00today_timestamp:002021-10-02实例参数:rocketmq_topic_namesrv:“srv1”rocketmq_topic_name:“topic1”yesterday_timestamp:00today_timestamp:002021-10-03实例参数:Job_Instance_20211002Job_Instance_20211003sdksdk#6#6未来展望未来展望动态资源调整跨云多活方案批任务资源调度优化1 12 23 3

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(何军-Native Flink on K8s在小红书的实践.pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部