上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

2017年人工智能驱动的内容生产与分发.pdf

编号:95376 PDF 30页 1.72MB 下载积分:VIP专享
下载报告请您先登录!

2017年人工智能驱动的内容生产与分发.pdf

1、人工智能驱动的内容生产与分发 人工智能驱动的内容生产与分发 提纲 提纲 内容消费的行业现状 人工智能辅助内容生产 内容质量控制模型 内容分发/推荐系统 内容消费的行业现状 什么是内容消费?一种直接或间接以一种直接或间接以内容产品和内容服务内容产品和内容服务为消费对象的经济活动 为消费对象的经济活动?内容从生产者、传播渠道、到用户,全程单向传播,一次内容消费的完成就意味着一次传播行为的终结?内容传播的媒介相对独立,传播媒介的属性限定了内容的类型,如视频类内容几乎只能在电视频道上传播,供需调节难?内容生产成本高;图文内容、视频内容的生产者之间有较大的壁垒,内容的供给以生产者为主,内容产量相对低 内

2、容消费满足了用户的什么需求?覆盖每一个用户生活的方方面面 泛娱乐内容 知识型内容 观点型内容 高频 海量 碎片 刚需 适量 粘性 刚需 少量 需求特点 需求特点 内容供给 内容供给 兴趣 决策 消遣&流行 成长 用户需求类型 用户需求类型 需求满足方式的 可替代性 低 高 内容消费为什么重要?1.内容消费已经发展成为了一个影响所有人日常生活的庞大产业 数据来源:Top10行业用户规模、用户总时长和同比增长率来源于Quest Mobile的移动互联网2017年Q2夏季报告 398.2 134.2 130.6 82.4 76.4 27.5 23.7 20.8 8.2 7.9 8.3%15.8%33

3、.1%72.7%-0.3%9.5%0.9%7.3%17.1%55.1%?Top 10?2017?6?(亿小时/月)9.16 8.21 6.3 5.97 5.6 5.6 5.49 5.09 4.76 4.5 5.2%23.4%21.5%5.6%6.0%33.9%39.2%9.1%-1.1%17.5%?Top 10?2017?6?(亿月活用户)内容消费为什么重要?2.更是国民经济杠杆,关乎社会主流价值观的塑造 2,023 3,668 5,567 38,000 47,000 56,000 5%8%10%2015A 2016A 2017E -2017?3,400 2,400

4、631?/?与美国差距81.4%与日本差距73.7%内容消费每增加100亿元,可带动国民经济增长338亿元 1 数据来源:1)2013年工业和信息化部电信研究院数据;2)人均信息消费:世界银行及恒丰银行研究院商业银行研究中心统计数据 对需求的知晓程度 对需求的知晓程度 完全知道 部分知道 完全不知道 人 人 工 工 机 机 器 器 内容消费行业地图 人工+机器,多种消费形态组合 搜索 关注 推荐 排行榜 门户/垂直APP BBS 社区 问答 聊天 秘书化 内容消费的主要形态 从搜索到推荐,是内容获取方式的必然演进 知道 我知道 知道 我不知道 不知道 我不知道 我不知道 聊天/阅读/社区 推荐

5、 搜索 推荐 内容消费的三大变化趋势 媒介融合 角色融合 消费升级 作者深度赋能 优质内容识别 精准个性推荐 需要解决的问题 消费升级消费升级 从关注到最终的分享可循环,内容散落在消费的各个环节,影响力扩大 消费结构变化,用户需要更多专业垂直、精细、多元化的内容 角色融合 角色融合 生产门槛降低,人人都是生产者,人人都是消费者,内容生产者猛增 从专业生产(PGC)发展到社会化生产(UGC),内容海量爆发 媒介融合媒介融合 一个媒介上可以获取多种内容,同一内容也可以在多个媒介上分发 获取内容的方式大发展,从传统的人找内容,发展到内容找人 百度智能驱动的内容消费生态 始于2016年6月 定制生产、

6、优质生产、高效生产 定制生产、优质生产、高效生产 选题推荐:大数据+知识图谱 内容选材:知识图谱+自动配图 图片处理:智能裁图 文字处理:自动标题推荐+语义纠错 视频识别:视频去重+长短关联 智能写作:AI智能写作 多维度识别优质内容资源多维度识别优质内容资源 质量先验:基于半监督学习构建对于篇章质量的全方位的理解框架,多维度丰富信息 质量后验:基于NLP和CNN,识别用户正负反馈,评价内容质量 精准个性化推荐及推送 精准个性化推荐及推送 搜索:从关键字,到语音、图片交互 个性化推荐:百度特有的超大规模实时个性化推荐系统,千亿规模参数下的多目标最优化 推送:基于用户兴趣点、地理位置、天气等综合

7、因素 03-内容分发 03-内容分发 搜索+推荐,满足用户内容需求 双引擎 手机百度,“搜索+推荐”双引擎内容分发 手机百度,“搜索+推荐”双引擎内容分发 极速搜索极速搜索 一站搜索全网,搜文字、搜图片,快速识别,帮助用户主动获取所需内容 精准推荐精准推荐 精选资讯、视频、小说、漫画等优质内容,结合智能个性化推荐算法,满足用户潜在内容消费需求 Google Feed,2017年7月上线 人工智能辅助内容生产 内容生产流程 1 选题推荐选题推荐 内容选材 图片处理 文字处理 视频识别 智能写作 选题推荐 选题推荐 基于7亿互联网民每天60亿次搜索请求的大数据积累,挖掘实时热点事件,结合用户画像和

8、知识图谱技术,智能推荐给相关作者,邀请作者写作,解决作者选题环节的痛点 相比普通作者自选题文章平均用户点击率提高2.7倍 知识图谱 知识图谱 全网搜索大数据 全网搜索大数据 实时热点,建议选题,稀缺主题,实时热点,建议选题,稀缺主题,内容生产流程 2 选题推荐 内容选材 图片处理 文字处理 视频识别 智能写作 内容选材内容选材 基于知识图谱的内容推荐:通过语义分析技术识别作者写作主题,结合百度知识图谱、指数、百科、正版图库等产品,帮助作者发现写作素材 自动配图自动配图 基于图像识别能力的自动配图功能,根据图像清晰度、美观度、图文相关性等特征选取优质图片 模糊图片识别准确率71%,清晰图片识别准

9、确率96%以上;自动配图准确率90%选题推荐 内容选材 图片处理 文字处理 视频识别 智能写作 智能裁图 智能裁图 利用基于深度学习的图像处理技术,自动识别图片主要内容区域并进行截取 准确率97%以上,百家号文章头图的不合格率降低60%智能裁图 内容生产流程 3 选题推荐 内容选材 图片处理 文字处理 视频识别 智能写作 标题推荐 标题推荐 基于语义理解技术,识别文章内容,推荐优质标题 语义纠错语义纠错 运用机器学习的能力,让机器理解文章中的句子含义,来找出不符合语义的错别字 纠错准确率99%内容生产流程 4 选题推荐 内容选材 图片处理 文字处理 视频识别 智能写作 视频识别 视频识别 视频

10、查重:基于图像及语音的比对技术,识别内容近似的短视频,应用于审核前原创作者保护,线上降低重复视频推荐;准确率达到97.5%长-短视频关联:将影视截取的短视频匹配到其来源长视频,利用知识图谱获取关联信息、进行相关推荐;准确率90%-短视频片段获取长视频结构化信息-影视剧名称:三生三世十里桃花 演员:杨幂,赵又廷,张智尧、迪丽热巴 年份:2017 类型:古装剧 百看不厌,经典画面,赵又廷与挚爱杨幂在十里桃花再次相遇 重复 1232次播放 内容生产流程 5 选题推荐 内容选材 图片处理 文字处理 视频识别 智能写作 智能写作 智能写作 大数据+知识图谱,自动挖掘现实生活中动态热度变化,再通过算法自动

11、生成文章 百度智能写作示例 2014年美联社就启用机器人进行财经报道,每季度能完成对4000家公司的财报报道,此前靠记者仅能完成400家 2015年起,机器人用于体育新闻报道,完成梦幻橄榄球赛报道,还在行文中大展幽默(技术支持为自动化洞察力公司,其开发的软件Wordsmith在16年共写了15亿篇文章,涉及金融、房地产、体育等多领域)2015年9月,推出自动化新闻写作机器人Dreamwriter,发布了关于消费价格指数的报道 2015年11月启用机器人写稿系统“快笔小新”,供职于体育部、经济信息部和中国证券报,撰写体育和财经稿件 内容生产流程 6 内容质量控制模型 内容质量控制模型 构建全方位

12、的篇章质量理解框架,多维度理解内容质量 低质内容识别 内容优质度计算 基础数据 基础技术 内容低俗 内容令人不适 标题党 旧闻新发 恶意广告 可读性 时效性 原创度 源权威度 内容影响力 基础文法硬伤 题材吸引力 作者信息 Feed用户行为 自然语言理解 数据挖掘 网页搜索 机器学习 作者行为 全网用户行为 低质内容示例 篇章质量理解框架 先验质量识别:基于半监督的多目标统一内容分类框架 Shared feature representation CNN Layer Max Pooling Task related Full Connected Hidden Layer Task Relate

13、d Full Connected Layer With Softmax Output Concatenate other task related advanced features Task-related Features Shared Semantic Features RNN Decoder 全量资源 Unlabeled 任务相关标注 Labeled +RNN Encoder .淫秽色情 标题党 Task-related Features Shared Semantic Features+内容质量控制模型 后验质量识别:基于NLP语义理解的评论正负反馈分析 特征词挖掘 GBDT模型 用

14、户评论 类别种子词 评论语料集 新词发现 凝固度 信息熵 词频 基于共现统计筛选 类别特征词 主体特征词 CNN模型预测 文章是否低质 特征词词典 mdzz、制帐 骗流量、瞎写、胡编乱造 小编、编辑、百度 又骗老子流量、牛头不对马嘴、小编标题狗 密集恐惧症要犯了、感觉头皮发麻、不行了要吐了 内容质量控制模型 内容分发/推荐系统 内容分发/推荐系统 基于知识图谱,构建关注点关系图谱 关注关系图谱示例 科技 智能手机 虚拟现实 无人机 汽车 新车 汽车产业 新能源汽车 谷歌发布 VR摄像机 无人驾驶 特斯拉 失控 人工智能 北京车展 比亚迪 特斯拉 VR眼镜 三星手机 爆炸 内容理解:关注点抽取

15、训练数据 训练数据 Feed日志挖掘 网页挖掘 模 模 型 型 训 训 练 练 内容特征 关注点 文字/图片/视频向量表示 关注点向量表示 内容分发/推荐系统 用户理解:用户兴趣挖掘 数据来源 行为数据:搜索query、Feed阅读、贴吧、全网浏览数 画像数据:百度用户画像数据.基于行为数据的挖掘策略 针对搜索Query和Feed阅读内容,基于内容理解技术提取兴趣主题和关注点 根据关注点/主题在内容中的权值、展现数、点击数计算相应的强度 根据点击数和持续周期,区分长期和短期兴趣点 基于画像数据的挖掘策略 画像兴趣体系到Feed兴趣体系映射 基于画像属性的人群划分和推荐触发 用户模型示例 内容分发/推荐系统 推荐策略:多维度的推荐队列召回、排序和融合 推荐价值相关的多目标学习系统(Multi-Task Learning)模型输入:千亿规模参数 用户信息:兴趣、属性、偏好,等 内容信息:吸引力、质量、相关性,等 匹配信息:用户-内容 模型输出:多目标 内容点击、时长、收藏、评论、分享,等 内容点击 内容点击 时长 时长 收藏 收藏 用户信息 内容信息 匹配信息 内容分发/推荐系统 DNN上线,核心兴趣点强相关内容推荐准确度显著提升 DNN上线前 DNN上线后 人工智能 房价调控 英超 白鹿原 用户核心兴趣点 内容分发/推荐系统

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(2017年人工智能驱动的内容生产与分发.pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部