《2-融360-从0到1机器学习产品的精益质量-艾辉.pdf》由会员分享,可在线阅读,更多相关《2-融360-从0到1机器学习产品的精益质量-艾辉.pdf(50页珍藏版)》请在三个皮匠报告上搜索。
1、从0到1,机器学习产品的精益质量 艾辉 机器学习测试入门与实践作者 1.机器学习基础知识的概述 2.机器学习产品的测试痛点 3.机器学习测试方法的演进 4.机器学习测试技术的实践 5.测试开发技术的转型升级 CONTENTS 1.1 AI的主要应用场景 1.2 机器学习的常见名词解释(一) 过拟合:一味追求对训练数据的预测 能力,模型复杂度高于真实模型,泛 化能力差。 欠拟合:模型没有很好的捕捉到数 据特征,不能很好的拟合数据。 模型:抽象数据,描述客观世界规律的数学模型。 通过数据分析,找到了其中规律,此规律即是模型。 训练:从数据中分析得到模型的过程。 训练的目的:不仅对已知数据而且对未知
2、数据都有 很好的预测能力。 泛化能力:算法对未知数据的预测能力。 样本数据:划分为训练集与测试集。 训练误差/经验误差:模型在训练集上的误差。 测试误差:在测试集上的误差。 泛化误差:在新样本上的误差。 1.3 机器学习的常见名词解释(二) * 数据 将数据转化成机器 能够学习的属性 数据和特征决定了机器学 习的上限,而模型和算法 只是逼近这个上限而已 标签 我们要预测的事物,即简单 线性回归中的y变量。如: 小麦未来的价格,图片中的 动物品种等等。 特征 输入变量,即简单线性回归 中的x变量。以垃圾邮件检测 举例,特征可能包括,发件 人的地址,发送电子邮件的 时段等。 样本 指数据的特定实例
3、:X。 样本分为两类,有标签样本、无标签 样本。 有标签样本同时包含特征和标签,无 标签样本只包含特征。 使用有标签样本训练模型之后,基于 该模型来预测无标签样本的标签。 特征 1.4 什么是建模?打一个比喻 * 给出口令 训练动物 调整动作 循环直到满意 不同的模型 逻辑回归 神经网络 随机森林 不同的动物 小狗 大象 海豹 让动物做出 动作 预期与实际 作对比 奖惩 输入信息 训练模型 调整参数 循环直到满意 让模型输出 结果 目标函数奖惩 1.5 从特征挖掘到模型预测 1.6 机器学习算法和模型, 能区分清楚吗? * 模型是一个数学公式, 是算法实现的结果。 可以修改模型的参数 来训练模型,以获得 更好的结果。 模型代表了机器学习 系统从训练数据中学 到的东西。 1.7 机器学习算法与解决问题的映射关系 1.8 一个典型的机器学习系统架构 1.机器学习基础知识的概述 2.机器学习产品