1、OPERATING SYSTEMCLOUD COMPUTINGDATATECHNOLOGYTEAMOnline and Mobile Commerce Platform$BUYERSSELLERSMarketingFinancing&Payment SolutionProfessionalService ProvidersDigitalEntertainmentLogisticsMobile BrowserLocation-Based文字图片声音动态视频1080p/HDR立体声互联网全视角全景声5G非结构化信息的结构化促进高效应用AI?人物自然物理世界高清视频+网络视频+VR视频+数字世界4智
2、能理解智能生产人:身份识别物:服化道识别自然:地标识别行为识别自动分类UGC标签视频指纹智能审核智能拆条描述生成智能缩略图智能配乐集锦生成虚拟人多语言字幕生成供给、效率、成本供给、效率、成本智能播放智能分发智能推荐多模态搜索多语言搜索只看他视频增强视频行业与细分市场媒体Ai算法产品视频云OSS云盾鉴黄暴恐血腥旗帜共11个能力智能审核视频指纹视频指纹音频指纹结构化标签静态标签动态标签智能生产GIF首图赛事集锦拆条虚拟人阿里云渠道传媒泛娱乐电商体育泛视频行业数据智能被集成输出优酷 微博淘宝 闲鱼弹内业务赋能集团内合作方UC图像审核识别智能审核视频指纹视频关系计算视频段落定位结构化标签静态标签:人、
3、物、场景、字幕动态标签:行为、事件智能生产GIF首图赛事集锦拆条虚拟人媒体Ai算法能力图像审核标签Contents01目录0203New Future on Cloud01多模态理解:视觉+语音+文本的多模态识别人、物、自然、文字的充分理解多维解构:人、物、场景、服化道、动作、事件、概念Open-set 识别系统:轻量定制化引擎人物标注视觉标签语音识别多模态标签文字识别视频审核)1.如何利用增量数据提升性能2.如何利用不同域数据训练3.只对增加数据的标签性能提升,而不影响其他标签性能4.快速训练,无需对所有数据重新训练1.跨模态表征,多模态搜索2.向量化与ID化表征3.结构化+向量化的定制化系
4、统02New Future on Cloud同源相似161.1.视频质量变化2.noise,contrast,gamma,blur,re-encoding,rotation3.2.时空域变换4.PIP,insertion,mirroring,ratio,cropshift5.3.视频拼接6.4.复合变换功能:短查短 短查长 长查长应用场景:1.版权保护、原创认证2.广告追踪、分成3.视频去重、分发打散、搜索等4.结构化的最细粒度03New Future on Cloudvideo21进球Backward retrievalForward retrieval庆祝Time-space Domain retrieval生产平滑集锦传球