《面向机器学习的开发环境 CodeLab 介绍.pdf》由会员分享,可在线阅读,更多相关《面向机器学习的开发环境 CodeLab 介绍.pdf(24页珍藏版)》请在三个皮匠报告上搜索。
1、面向机器学习的开发环境CodeLab介绍 马如悦 2020.12 全新数据科学与机器学习开发环境 ALL New Data Science and Machine Learning Development Environment 数据科学与机器学习平台,正在成为基础数据软件之一 Linkedin 2017年,机器学习工程师和数据科学家成为美国增速 最快的两个职业。 Glassdoor, a popular job site 2016, 2017, 2018年,连续三年,数据科学家都是美 国排名第一的最好职业。 Google Trends 在过去的5年,“数据科学”的搜索量每天都在增大 SAS客
2、户覆盖 SAS 覆盖了全球近10万家客户,2015年财富全球 500强名单前100家公司中有91家使用了 SAS。 Data-Based Business Operation Data-Assisted Decision Making Data-Driven Application Development 数据库数据库 数据仓库数据仓库 与商业智能与商业智能 数据科学数据科学 与机器学习与机器学习 新技术的进步,催生下一代产品 4 云计算模式 硬件进步大数据与人工智能 软件新的交付模式 云计算成为toB新的交付方式,新的交付 方式将更加高效、节省成本,也会促进大 量中小企业使用;是颠覆传统产品
3、和开源 产品的有利时机。 Cloud Native优化 云原生软件,可以依赖完备的云计算基础 设施,提供先前产品难以实现的一些功能 ,比如弹性伸缩,异地多活,存储计算分 离等 大数据 数据总量指数增加,数据驱动的业务模式 原来越多 机器学习与人工智能 先进的模型算法技术层出不穷,不但赋能 了前所未有的新业务,也带动对底层数据 处理基础设施的需求 计算能力提升 Intel CPU多核和加速指令,Nvidia GPU 等各类计算加速芯片 内存容量增大 从10年前的每服务器4GB-8GB,到现在 的256GB-512GB 存储能力增强 NVME SSD单机可达10TB-20TB,IOPS 高达几十万,吞吐高达每秒10GB 网络能力增强 单机网络从10年前的1Gbps提升到现在的 25Gbps-100Gbps 第三代数据科学与机器学习平台替换第一和第二代的机遇 5 诞生于科研 (单机小数据计算)