上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

2019年房源质量打分中深度学习应用及算法优化.pdf

编号:95904 PDF 45页 3.45MB 下载积分:VIP专享
下载报告请您先登录!

2019年房源质量打分中深度学习应用及算法优化.pdf

1、2019 KE.COM ALL COPYRIGHTS RESERVED1AI选房中深度学习的实践及优化2019 KE.COM ALL COPYRIGHTS RESERVED4目录 为什么要做AI选房 如何做AI选房 模型演变历程 实践应用 总结&思考2019 KE.COM ALL COPYRIGHTS RESERVED5为什么做AI选房?2019 KE.COM ALL COPYRIGHTS RESERVED6贝壳找房发展&挑战20万经纪人98门店平均房源2.1万门店10-25经纪人熟悉房源70%跨店成交占比1.87亿房屋3000万月活跃用户需要强大的房源质量盘点工具找到好房难度大,成本高挑战2

2、00万贝壳全部房源2019 KE.COM ALL COPYRIGHTS RESERVED7目标&价值平台 提升去化率经纪人 提升效率和业绩客户 降低看房成本业主 缩减销售时长 市场需求恒定,优先成交好房核心思想 选出好房核心问题 提升带看效率 加速成交核心价值2019 KE.COM ALL COPYRIGHTS RESERVED8人工选房方法人工选房标准每周举行周例会讨论并投票选出好房选房成本高选房带有主观性无法盘点所有房源质量存在问题人工选房流程2019 KE.COM ALL COPYRIGHTS RESERVED9AI选房本质上是TopN排序问题2019 KE.COM ALL COPYRI

3、GHTS RESERVED10AI选房-房源质量打分好房定义AI选房建模Y=f(X)Y:未来?天能否成交 X:最近?天房源产生的所有行为 样本:挂牌满?天的房源2019 KE.COM ALL COPYRIGHTS RESERVED11AI选房建模 成交/带看具有周期性 周期性单位:周2019年3月每天的成交量和带看量作业周期性分析时间选择:周的倍数2019 KE.COM ALL COPYRIGHTS RESERVED12AI选房建模 Y:未来?天能否成交 X:最近?天房源产生的所有行为 样本:挂牌满?天的房源 时间太短:信息传递不充分 时间太长:-中间出现其他原因导致成交-无法及时反馈效果 综

4、合考虑,并对比测试:选择2周Y=f(X)时间太短:行为信息不足 时间太长:浪费机器资源 对比测试:选择2周 Y:未来?天能否成交 X:最近?天房源产生的所有行为 样本:挂牌满?天的房源2019 KE.COM ALL COPYRIGHTS RESERVED13AI选房建模 Y:未来?天能否成交 X:最近?天房源产生的所有行为 样本:挂牌满?天的房源Y=f(X)行为特征选择14天进行聚合 挂牌不足14天房源,行为特征信息不足 结论:选择挂牌满14天的房源2019 KE.COM ALL COPYRIGHTS RESERVED14模型演变历程2019 KE.COM ALL COPYRIGHTS RES

5、ERVED15模型演变历程v1.0初版模型系统v2.0深度学习模型v2.0+效果持续优化XGBoostDNN+RNN特征建设v1.0初版模型系统2019 KE.COM ALL COPYRIGHTS RESERVED16v1.0-初版模型系统概览房源特征静态特征时序特征特征处理特征提取特征组合离散化模型预测XGBoost分数映射房源质量分数M2019 KE.COM ALL COPYRIGHTS RESERVED17房源特征 6大方向设计了90维特征 静态特征:69维 时序特征:21维 一套房源能否成交同很多因素相关客源17维性价比9维业主14维市场12维经纪人9维基本属性29维成交2019 KE

6、.COM ALL COPYRIGHTS RESERVED18时序特征提取050002200042000620008200001320181014 均值 方差 极值 浏览 关注 IM聊天 电话 带看 跟进 最近14天浏览量均值 最近7天浏览量均值时序特征21维提取函数8个提取特征168维2019 KE.COM ALL COPYRIGHTS RESERVED19v1.0-小结存在的问题新上房源与库存房源在行为特征上差异巨大引

7、入新上房源,会严重干扰模型 很难兼容新上房源 时序数据特征爆炸时序特征进行特征提取,得到的特征数量庞大随着迭代的进行,新加入特征边际效应递减,但是成本高解决的问题 人工-机器 解决了人工选房的问题 选房成本低 选房没有主观性 可以盘点所有房源质量2019 KE.COM ALL COPYRIGHTS RESERVED20模型演变历程v1.0初版模型系统v2.0深度学习模型v2.0+效果持续优化XGBoostDNN+RNN特征建设2019 KE.COM ALL COPYRIGHTS RESERVED21RNNRNNLSTM2019 KE.COM ALL COPYRIGHTS RESERVED22D

8、NN2019 KE.COM ALL COPYRIGHTS RESERVED23深度学习模型结构 混合模型:DNN+RNN Deep neural networks(DNN)-全连接的多层感知机-BatchNormalization-激活层(RELU)-dropout正则化 Recurrent neural networks(RNN)-LSTM2019 KE.COM ALL COPYRIGHTS RESERVED24模型系统对比房源特征特征处理MXGBoost分数映射房源特征分数映射DNN+RNNv1.0v2.02019 KE.COM ALL COPYRIGHTS RESERVED25模型指标对

9、比v1.0v2.0AUC0.8140.831Top1000去化率30.72%+0.83%Top2000去化率25.28%+1.2%Top3000去化率22.13%+1.24%2019 KE.COM ALL COPYRIGHTS RESERVED26模型演变历程v1.0初版模型系统v2.0深度学习模型v2.0+效果持续优化XGBoostDNN+RNN特征建设2019 KE.COM ALL COPYRIGHTS RESERVED27v2.0+:持续优化0.5%业主诚意0.5%区域竞争力特征维度现状分析房源基本属性可以完善补充客户可以挖掘市场可以挖掘业主体现不完善经纪人 考虑完整性价比 考虑完整1%

10、经纬度1.5%潜在热度2019 KE.COM ALL COPYRIGHTS RESERVED28v2.0+:持续优化业主诚意类型占比成交56%在售34%定金5%暂不出售5%2019 KE.COM ALL COPYRIGHTS RESERVED29v2.0+:持续优化 巧妇难为无米之炊:行为稀少 能做什么?业主诚意2019 KE.COM ALL COPYRIGHTS RESERVED30v2.0+:持续优化潜在热度已有客户潜在客户一套房源的用户组成结构 客户潜在的热度,反映市场偏好2019 KE.COM ALL COPYRIGHTS RESERVED31v2.0+:持续优化潜在热度 单套房源的客

11、户潜在热度商圈偏好小区偏好居室偏好面积偏好价格偏好 对房源偏好 购房意愿强度潜在客户对房源偏好潜在客户购房意愿强度X()所有潜在客户2019 KE.COM ALL COPYRIGHTS RESERVED32v2.0+:持续优化区域竞争力 是否成交与周围竞争者有关 体现竞争力的特征 价格:总价、单价 行为:浏览、带看 区域内排名(门店/商圈)2019 KE.COM ALL COPYRIGHTS RESERVED33v2.0+:持续优化经纬度房源地理位置信息 市场偏好 反映地段偏好 区域竞争力 结合体现竞争力的特征 反映某一距离范围内的竞争力2019 KE.COM ALL COPYRIGHTS R

12、ESERVED34 指标TopN去化率N=2.5*周成交量效果评估32个城市平均值TopN去化率:31.7%自然去化率:3.8%去化率(一周平均值)2019 KE.COM ALL COPYRIGHTS RESERVED35人工选房 VS AI选房 人工选房和AI选房重合率48%三种模式下的去化率人工+AI:33%纯AI:26%纯人工:21%条件:基于相同的名额下进行比较人工+AI去化率33%纯人工去化率21%纯AI去化率26%2019 KE.COM ALL COPYRIGHTS RESERVED36实践应用2019 KE.COM ALL COPYRIGHTS RESERVED37分数映射 模型

13、输出 房源质量分数根据概率值排名进行映射分数分布比较稳定10分制易于业务使用每天不稳定,范围波动大分数分布不合理不易于业务使用MinMaxScaler(1)分数映射公式2019 KE.COM ALL COPYRIGHTS RESERVED38库存&新上房源数量分布 新上房源分数略高2019 KE.COM ALL COPYRIGHTS RESERVED39库存&新上房源去化率 分数越高,质量越好2019 KE.COM ALL COPYRIGHTS RESERVED40了解分 分数解释:打分是怎么计算的 如何操作可以提升打分?优质房(A)次优房(B)一般房(C)经纪人的疑问质量分数具有排序意义很难

14、引导经纪人2019 KE.COM ALL COPYRIGHTS RESERVED41雷达图雷达图明示数据的核心打分维度每个维度展示特征的优缺点引导经纪人,提高分数举例:-业主诚意-性价比维度选择正相关的核心维度2019 KE.COM ALL COPYRIGHTS RESERVED42房源质量分数-B端场景2019 KE.COM ALL COPYRIGHTS RESERVED43AI选房-B端场景辅助经纪人选房高分房源直接推为好房辅助经纪人盘房2019 KE.COM ALL COPYRIGHTS RESERVED44AI选房-C端场景2019 KE.COM ALL COPYRIGHTS RESERVED45总结&思考2019 KE.COM ALL COPYRIGHTS RESERVED46总结&思考 AI选房解决的是房地产领域的TopN排序问题 AI选房采用了DNN+RNN的混合网络结构-DNN,静态数据;RNN,时序数据-DNN+RNN的混合模型,提供了静态数据+时序数据的解决方案 模型输出值并不能直接适用于业务,需要做一些转换-为了便于经纪人理解和指导经纪人,采用分数映射和雷达图两种方式2019 KE.COM ALL COPYRIGHTS RESERVED48JOIN US

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(2019年房源质量打分中深度学习应用及算法优化.pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部