《快手-车浩-语音技术在快手生产中的应用.pdf》由会员分享,可在线阅读,更多相关《快手-车浩-语音技术在快手生产中的应用.pdf(28页珍藏版)》请在三个皮匠报告上搜索。
1、3亿+ 日活跃用户 16000亿+ 用户点赞及评论 1800万+ 每天UGC视频 200亿条 视频总量 用户日均使用时长 150亿条 每日视频播放 快手大数据 80分钟+ 内容 消费 内容 分发 内容 生产 自动字幕 智能配音 生产工具生产工具 语音降噪 语音分离 回声消除 语音去混响 激活检测 声学前端声学前端 音频指纹 翻唱识别 哼唱识别 音乐转谱 风格分类 音乐理解音乐理解 声学模型 语言模型 解码器 文本后处理 多模识别 语音识别语音识别 语音合成 声音转换 歌声合成 可视化合成 语音合成语音合成 声纹识别 语种识别 情绪识别 事件检测 性别识别 音频分类音频分类 旋律生成 歌词生成
2、音乐渲染 音乐生成音乐生成 人工标注 自动挖掘 训练数据训练数据 关 键 技 术 应 用 场 景 自动配乐 AI作曲 直播助手 语音游戏 语音搜索 智能硬件 AI教育 虚拟主播 智能音乐智能音乐人机交互人机交互未来场景未来场景 基 础 支 撑 自建平台 开源工具 训练工具训练工具 运维平台 端上SDK 后台服务 线上系统线上系统 QA团队 质量评估质量评估 语音技术在内容生产中应用全景图 更好的记录内容生产中的智能语音 便 捷 生产工具 个 性 化 智能音乐 好 玩 语音交互 更好的记录内容生产中的智能语音 便 捷 生产工具 自动字幕 智能配音 decoder今天天气怎么样 encoder h
3、1 Feature Extracting h2h3hT-1hT yi1 a Speech Char embedding Text 语音识别语音合成 语音识别与合成 语音识别语音合成 语音识别与合成 更好的记录内容生产中的智能语音 个 性 化 智能音乐 传统配乐 限制用户的自由度 视频内容生成音乐 用户可以自由发挥 智能配乐 智能配乐 拍摄视频 自动配乐的节奏变化 智能配乐 智能配乐 基于给爱德琳的诗衍化的作品 AI作曲 一路向北衍化旋律 勇气的和弦与配器 一首新歌 AI作曲 别说我需要理由 要一起在一起 只要你的微笑 我的爱已有意义 我们都有幸福 若与你在一起 记忆中雨中的你 钻进我心里 我的你 AI作曲 旋律演唱 更好的记录内容生产中的智能语音 好 玩 语音交互 直播间语音助手 重要技术点: 语音唤醒 语音识别 NLUDM 语音合成 语音交互游戏 你画我猜 猜词游戏 更好的记录内容生产中