《海天瑞声-AI算法的“加油站”-210822(21页).pdf》由会员分享,可在线阅读,更多相关《海天瑞声-AI算法的“加油站”-210822(21页).pdf(21页珍藏版)》请在三个皮匠报告上搜索。
1、我们认为,机器学习算法迭代的天然需求与应用场景的创新是 AI 基础数据服务行业扩张的主要驱动力:专业化的训练数据是当前 AI 算法发展迭代的刚需。算法模型从技术理论到应用实践的落地过程依赖于大量的训练数据。模型不是一次性构建的,需要持续学习,通过“收集行为数据收集反馈数据-模型训练模型应用”全流程提升业务效果,避免传统模型的效果随着时间衰减的弊端。AI 所能带来的价值与数据量的增加有正向关性,需要通过喂数据反复迭代算法,从而使得产品从“可用”逐步进化到“好用” 状态。然而,从自然数据源简单收集取得的原料数据并不能直接用于有监督的深度学习算法训练,必须经过专业化的采集、加工,形成相应的工程化训练
2、数据集后才能供深度学习算法等训练使用。目前,应用有监督学习的算法对于训练数据的需求远大于现有的标注效率和投入预算,基础数据服务将持续释放其对于算法模型的基础支持价值。深度学习模型对训练数据的数据量、多样性和更新速度方面提出较高要求,需要专业数据商提供服务。根据麦肯锡研究数据显示,为充分发挥技术潜能,深度学习模型需要海量且涵盖图像、视频及语音在内等多种类型的训练数据进行模型训练。此外,人工智能技术要求算法模型根据潜在的应用场景变化而持续更新,因此,算法模型所使用的训练数据亦需要定期更新。具体而言,约 1/3 的算法模型每月至少更新一次,约 1/4 的算法模型每日至少更新一次,算法模型持续更新的特点将进一步拓展各领域训练数据的需求空间。智能物联网、产业互联网等新型场景催生增量新需求。随着人工智能商业化进程的演进,新兴应用场景如智联网 AIoT、AI PaaS、产业互联网等将展现出巨大的发展潜力,并逐步促进 AI 技术和算法模型的优化和创新。因此,在创新应用场景和新型算法的带动下,具有前瞻性的训练数据产品和高定制化的训练数据服务需求将逐步成为主流。