上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

DataFun-下午-2nd-腾讯内容生态中的数据科学-irisyyu(于扬).pdf

编号:111490 PDF 20页 3.74MB 下载积分:VIP专享
下载报告请您先登录!

DataFun-下午-2nd-腾讯内容生态中的数据科学-irisyyu(于扬).pdf

1、内容生态中数据科学于扬 腾讯 数据科学家|01数据是什么样子的?02我们可以做什么?03我们是怎么做的?目录 CONTENT|01数据是什么样子的?正态分布:Bell shaped&symmetricMean=median=mode例子:成年人身高的分布新生儿体重的分布考试分数的分布对工作满意程度的分布|统计101中的数据:正态分布Power Law:Heavy tail and long tailMean median mode例子:城市人口数量的分布机场航线数量的分布Startup价值的分布地震强度、深度的分布|生活中的数据:the Power LawTurkey 2020年之前所有 4.

2、0级以上地震的深度2000年美国超过1万人的城市的人口数量分布抽象机制:Human-related networks1.人的偏好、喜好的共性2.人的选择|Why Power Law(PL)?理论机制:1.Proportional random growth 2.Transformations of PLsPL is conserved under addition,multiplication,min,max and power transformation.The fatter-tailed one dominates.13.Matching and equilibrium Economic

3、s of superstars 2:10%的内容贡献了90%的流量Truncated log-normalPower law|内容生态的数据:the Power Law|02我们可以做什么?常用的厚尾分布:1.Exponential distribution2.Log-normal distribution3.Power LawPareto distributionZeta distributionZipfian distribution|厚尾分布及其性质二八法则:Pareto principle,80%of outcomes are due to 20%of causes.Pareto di

4、stributions with shape value of log45 1.16 precisely reflect it.Existence of moments(power law):k 2:finite meank 3:finite variance The classic CLT fails for k 2:finite meank 3:finite variance The classic CLT fails for k 2:finite meank 3:finite variance The classic CLT fails for k 秒、分钟vs全量索引池 100b-小时

5、、天Knowledge GraphHot vs coldvs实体书店 Barnes&Noble 100k 书Amazon 30%的销售来自Barnes&Noble 没有的书|Power Law=抓主要矛盾,以小搏大1M URLs AA test significant differenceExperiment on queriesDID,propensity score matching/weighting|03我们是怎么做的?内容生产收集处理内容分发用户消费|内容中台:全链路统筹优化,以小换大内容生产收集处理内容分发用户消费数据科学可解释/可落地:时间序列:发文量预估整数规划:发文供给优化概

6、率论:发文异动归因图论:创作者擅长树模型:原创、搬运、人格化、高生态价值创作者similarity search:风格、发文相似创作者因果推断:结算、流量对发文量的影响大小|内容中台:全链路统筹优化,以小换大|整数规划:发文策略优化整数规划MIP with linear constraints and objective function +Branch and cut内容生产piecewise linear+concave r+convex c linear可降低X%内容、Y%账号的补贴对业务影响收益影响小于1%X,Y 1|图论:创作者擅长领域定义&挖掘需求:粒度适中、话题类的创作者擅长标签

7、Nodes:内容tagEdges:Odds ratio 1 Community detection:Girvan-NewmanBetweenness centrality:top 5 words of each community as topic 擅长程度:加权的消费指标应用:前端展示;业务间创作者引入线索precision 10%-50%+收集处理|因果推断:结算策略变化对创作者行为的影响大小T1 结算发放T2单价下调T3单价回调业务变动:流量的结算单价变化方法:difference in differences观察 T1结算发放刺激创作者在账号1发文账号1视频发文:上涨9%账号2视频发文

8、:上涨4%账号2图文发文:无显著影响观察 T2单价下调对新活跃的创作者留存率负面影响最大活跃早期cohort:留存下降13%活跃中期cohort:留存下降6.2%活跃成熟期cohort:无显著影响新开始活跃CP对单价变化感知最明显辅助决策:T3部分品类高等级账号单价回调发钱 vs 不发钱内容分发|Reference1 Jessen,Hedegaard Anders,and Thomas Mikosch.Regularly varying functions.Publications de Linstitut Mathematique 80.94(2006):171-192.2 Gabaix,Xavier,and Augustin Landier.Why has CEO pay increased so much?.The Quarterly Journal of Economics 123.1(2008):49-100.3 Gabaix,Xavier.Power laws in economics and finance.Annu.Rev.Econ.1.1(2009):255-294.非常感谢您的观看|

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(DataFun-下午-2nd-腾讯内容生态中的数据科学-irisyyu(于扬).pdf)为本站 (会议专家) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部