上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

百度智能云:2021年“云智一体”技术与应用解析系列白皮书——企业AI开发篇(60页).pdf

编号:93336 PDF    PPTX 60页 10.33MB 下载积分:VIP专享
下载报告请您先登录!

百度智能云:2021年“云智一体”技术与应用解析系列白皮书——企业AI开发篇(60页).pdf

1、目 录CONTENS一、云智一体,促进数字化转型与智能化升级一步到位1.1产业智能化,数字经济发展新阶段1.2百度智能云战略升级1.3云智一体的百度智能云架构2.0,加速产业智能化二、构建适应未来发展趋势的AI开发平台2.1场景先行2.2自主创新2.3效能为要三、云智一体的AI开发全栈模式 四、适合跑AI的云:AI开发基础设施4.1AI计算层4.2AI存储层4.3AI容器层五、飞桨企业版:AI开发双平台5.1零门槛AI开发平台:EasyDL5.2全功能AI开发平台:BML六、企业AI能力生产与集中化管理平台:AI中台 七、云智一体AI开发全栈模式的行业实践7.1打造国网人工智能平台,推动电网智

2、能化应用7.2为陕西汉中插上翅膀,AI助力打赢精准脱贫战7.3更多行业案例参考八、关于本报告020303040506060708 4354云智一体,促进数字化转型与智能化升级一步到位 1.1 产业智能化,数字经济发展新阶段当前,我们正处在科技创新和产业发展最好的时代,以人工智能、大数据、云计算、5G等为代表的新一代信息技术蓬勃发展,驱动新一轮科技革命和产业变革。在产业应用新兴技术和数据资源转型升级的过程中,数字化是基础;而随着人工智能等新一代信息技术的发展,以及数据的爆发式增长,产业加快应用智能技术,从海量数据中发现规律、训练模型、提炼知识,促进产出

3、增加和效率提升,实现企业生产经营的智能化,进而实现整个产业的智能化升级。因此,数字经济既包括数字化转型,也包括智能化升级,产业智能化是数字经济发展的新阶段。1.2 百度智能云战略升级百度是拥有强大互联网基础的领先AI公司。从成立的第一天起,百度搜索引擎就与人工智能、云计算等技术息息相关。经过多年的技术积累和产业实践,百度已形成了全面布局,从基础的算力和数据技术、深度学习算法及框架,到语音、视觉、自然语言处理等感知、认知技术,以及飞桨深度学习开源开放平台等,具备云智一体的独特优势。基于百度的技术优势和对产业发展的洞察,经过跟合作伙伴的共同成长与产业实践,百度智能云的战略升级为:以“云计算为基础”

4、支撑企业数字化转型,以“人工智能为引擎”加速产业智能化升级,云智一体“赋能千行百业”,促进经济高质量发展。云智一体的“云”为数字化转型提供安全、稳定、灵活的数字化底座,“智能化引擎”为智能化升级提供领先的创新技术和平台。我们推荐客户数字化转型与智能化升级一起做,一步到位,这样效率更高,效果更好。同时,如果客户只做数字化转型,我们有丰富的云计算产品可以支持;或者客户已经有了数字化基础,我们的智能化引擎也可以助力智能化应用。百度智能云的“云”,不仅为数字化转型提供安全稳定、弹性灵活的云计算服务,同时也是适合跑AI的云,我们称之为“AI原生云”,继承云原生的优势,面向AI场景,提供极致弹性的高性能异

5、构算力,打造简洁、高效的AI应用开发架构。“云智一体”的智,是百度将深耕十余年的AI技术,以及AI赋能产业的实践经验,沉淀为助力产业智能化升级的技术、平台及方法论,是以加速产业智能化升级为己任、懂场景的AI。“云智一体”技术与应用解析 企业AI开发篇020302“云智一体”技术与应用解析企业AI开发篇云智一体,促进数字化转型与智能化升级一步到位 1.1 产业智能化,数字经济发展新阶段当前,我们正处在科技创新和产业发展最好的时代,以人工智能、大数据、云计算、5G等为代表的新一代信息技术蓬勃发展,驱动新一轮科技革命和产业变革。在产业应用新兴技术和数据资源转型升级的过程中,数字化是基础;而随着人工智

6、能等新一代信息技术的发展,以及数据的爆发式增长,产业加快应用智能技术,从海量数据中发现规律、训练模型、提炼知识,促进产出增加和效率提升,实现企业生产经营的智能化,进而实现整个产业的智能化升级。因此,数字经济既包括数字化转型,也包括智能化升级,产业智能化是数字经济发展的新阶段。1.2 百度智能云战略升级百度是拥有强大互联网基础的领先AI公司。从成立的第一天起,百度搜索引擎就与人工智能、云计算等技术息息相关。经过多年的技术积累和产业实践,百度已形成了全面布局,从基础的算力和数据技术、深度学习算法及框架,到语音、视觉、自然语言处理等感知、认知技术,以及飞桨深度学习开源开放平台等,具备云智一体的独特优

7、势。基于百度的技术优势和对产业发展的洞察,经过跟合作伙伴的共同成长与产业实践,百度智能云的战略升级为:以“云计算为基础”支撑企业数字化转型,以“人工智能为引擎”加速产业智能化升级,云智一体“赋能千行百业”,促进经济高质量发展。云智一体的“云”为数字化转型提供安全、稳定、灵活的数字化底座,“智能化引擎”为智能化升级提供领先的创新技术和平台。我们推荐客户数字化转型与智能化升级一起做,一步到位,这样效率更高,效果更好。同时,如果客户只做数字化转型,我们有丰富的云计算产品可以支持;或者客户已经有了数字化基础,我们的智能化引擎也可以助力智能化应用。百度智能云的“云”,不仅为数字化转型提供安全稳定、弹性灵

8、活的云计算服务,同时也是适合跑AI的云,我们称之为“AI原生云”,继承云原生的优势,面向AI场景,提供极致弹性的高性能异构算力,打造简洁、高效的AI应用开发架构。“云智一体”的智,是百度将深耕十余年的AI技术,以及AI赋能产业的实践经验,沉淀为助力产业智能化升级的技术、平台及方法论,是以加速产业智能化升级为己任、懂场景的AI。“云智一体”技术与应用解析 企业AI开发篇020302“云智一体”技术与应用解析企业AI开发篇1.3 云智一体的百度智能云架构2.0,加速产业智能化基于百度智能云的战略升级,云智一体的百度智能云架构2.0同时发布,包含数字化底座、智能化引擎和全场景应用(如图1.3-1所示

9、)。数字化底座,包括基础云、数据库、物联网、边缘计算、区块链等基础平台,以及视频云、大数据、云原生开发和地图服务等;同时还有安全模块,为技术创新和产业转型升级保驾护航。在数字化底座之上是智能化引擎,百度自主研发的飞桨深度学习平台为核心,软硬一体AI大生产平台-百度大脑为支撑,包括AI中台和知识中台等。智能化引擎与行业深度融合,帮助企业建设自己的智能化中台,助力智能化升级。基于数字化底座和智能化引擎,百度智能云深入行业场景,打造智能应用,同时与生态伙伴一起,在制造、能源、城市、金融、医疗、媒体等领域,助力数字化转型和智能化升级一步到位。构建适应未来发展趋势的AI开发平台 我们希望以百度智能云为纽

10、带,联合技术和产业生态伙伴,通过开源开放平台降低AI开发的门槛,加快人工智能融入传统产业,帮助越来越多的行业大步快跑,加入产业智能化的大潮。百度智能云:全新发布架构2.0(图1.3-1)智能化引擎全场景应用智能客服企业搜索智能办公智能推荐工业质检智能创作智慧城市智慧交通智慧金融智能制造智慧能源智慧媒体智慧医疗数字化底座云为底座 飞桨为核 生态为翼AI中台知识中台软硬一体AI大生产平台产业级深度学习开源开放平台存储网络大数据服务视频云云原生开发服务区块链数据库物联网边缘计算基础云安全地图服务计算“云智一体”技术与应用解析 企业AI开发篇04051.3 云智一体的百度智能云架构2.0,加速产业智能

11、化基于百度智能云的战略升级,云智一体的百度智能云架构2.0同时发布,包含数字化底座、智能化引擎和全场景应用(如图1.3-1所示)。数字化底座,包括基础云、数据库、物联网、边缘计算、区块链等基础平台,以及视频云、大数据、云原生开发和地图服务等;同时还有安全模块,为技术创新和产业转型升级保驾护航。在数字化底座之上是智能化引擎,百度自主研发的飞桨深度学习平台为核心,软硬一体AI大生产平台-百度大脑为支撑,包括AI中台和知识中台等。智能化引擎与行业深度融合,帮助企业建设自己的智能化中台,助力智能化升级。基于数字化底座和智能化引擎,百度智能云深入行业场景,打造智能应用,同时与生态伙伴一起,在制造、能源、

12、城市、金融、医疗、媒体等领域,助力数字化转型和智能化升级一步到位。构建适应未来发展趋势的AI开发平台 我们希望以百度智能云为纽带,联合技术和产业生态伙伴,通过开源开放平台降低AI开发的门槛,加快人工智能融入传统产业,帮助越来越多的行业大步快跑,加入产业智能化的大潮。百度智能云:全新发布架构2.0(图1.3-1)智能化引擎全场景应用智能客服企业搜索智能办公智能推荐工业质检智能创作智慧城市智慧交通智慧金融智能制造智慧能源智慧媒体智慧医疗数字化底座云为底座 飞桨为核 生态为翼AI中台知识中台软硬一体AI大生产平台产业级深度学习开源开放平台存储网络大数据服务视频云云原生开发服务区块链数据库物联网边缘计

13、算基础云安全地图服务计算“云智一体”技术与应用解析 企业AI开发篇0405随着数据量的激增、算法的突破、算力的爆发,人工智能技术进入了快速发展期,迎来了与产业应用场景广泛结合的新阶段。因此,在企业数字化和智能化的转型过程中,亟需构建一套与应用场景相结合、灵活易用、效能为先的适应未来发展趋势的AI开发平台。在业务需求的牵引下,通过十余年的技术积累,百度自研深度学习框架、构建人工智能平台、结合对集群和算力的管理与调度,逐渐形成了业内领先的云智一体的AI开发全栈模式。因此,百度不仅是资深的AI开发平台使用者,同时也是AI开发平台的提供者。在企业使用人工智能赋能业务场景的过程中,相信大多数企业和开发者

14、都在思考自己到底需要一个什么样的AI开发平台,如何有效地开展AI开发工作?我们认为可以从如下三个方面分析:2.1 场景先行使人工智能充分发挥价值和作用的前提,是要与实际的应用场景相结合。根据业务场景对需求进行定义,是成功进行AI算法模型开发的基础。百度在过去多年为企业提供服务的过程中发现,超过80%的需求都需要根据实际应用场景进行定制。同时,在AI开发过程中,使用与应用场景相配套的流程工具是提高AI算法模型开发效率的关键。例如,百度的AI开发平台,面向质检、巡检、OCR、遥感图像分析、文本分类、文本处理、情感分析、商品检测等系列场景,都建设了一系列配套的组件、算法和工具,有效地帮助企业建立以场

15、景导向、业务应用为前提的AI开发基础。2.2 自主创新AI开发是一个动态进化的过程,是在与应用场景持续交互的过程中,通过不断获得反馈、获取动态新数据,持续进行迭代优化的过程。同时,人工智能的应用场景非常分散,并且需要与业务逻辑紧密结合。因此,对于企业和开发者而言,需要有足够灵活、易用的平台进行自主创新。在灵活性方面,适应未来发展趋势的AI开发平台,需要广泛地适配各类主流硬件,充分发挥各种硬件的能力且具有足够灵活性。百度飞桨企业版是业内芯片适配最广泛的AI开发平台,广泛适配包括飞腾、华为、百度昆仑等在内的国产芯片和服务器,这使得人工智能的创新应用可以建立在充分的灵活性基础之上。在易用性方面,适应

16、未来发展趋势的AI开发平台,应该不仅能够支持算法工程师、数据科学家等专业开发人员进行便捷的模型开发和训练,也应该能够支持业务一线人员等零基础的开发者参与到AI开发过程中来。百度飞桨企业版,面向不同的使用者,既提供全功能开发模式满足资深研发人员的开发需求,也提供适合一线业务人员的零门槛模式,使得专业AI开发的部分更极致,同时又能充分发挥更多的创造力。2.3 效能为要AI开发相较于传统的软件开发而言,从数据获取、数据标注、数据增强、模型开发、模型训练、模型评估到模型部署各个环节更加的复杂和多维。适应未来发展趋势的AI开发平台,应该具备从多个层面优化资源调度、提升开发效能的能力。在开发层面,除了全流

17、程端到端的开发支持,更重要的是在每个环节中贴心为开发人员打造的细节。在百度飞桨企业版中,例如数据标注环节的智能清洗和自动标注能力,大幅降低标注成本;又如预置的大规模预训练模型和迁移学习能力,使得更少数据更好效果成为可能;再如基于数据闭环实现模型的持续迭代优化等能力,在各个环节中提升AI开发的效率、缩短开发周期。在算力层面,纵向从AI芯片、AI服务器、AI容器到AI开发平台,应该做到全方位、集中式的AI算力管理。百度AI开发全栈模式,提供高密度的算力集中管理、多样的AI计算套餐、先进的调度系统、开放的算力生态,可实现对算力成本的极致优化。综上所述,人工智能技术从理论创新、技术突破、到工程实现,还

18、有很多想象空间与未知领域可探索,企业在选择并建设适应未来发展趋势的AI开发平台方面,建议关注“场景先行、自主创新、效能为要“三个关键要素,进行统一规划和建设。这样不仅可以保障数据与模型资产的统一积累、沉淀和复用,更重要的是,还可以系统性的获得算法、工程等方面的最新成果,使企业能够在更高的基座上进行创新实践。“云智一体”技术与应用解析 企业AI开发篇0607随着数据量的激增、算法的突破、算力的爆发,人工智能技术进入了快速发展期,迎来了与产业应用场景广泛结合的新阶段。因此,在企业数字化和智能化的转型过程中,亟需构建一套与应用场景相结合、灵活易用、效能为先的适应未来发展趋势的AI开发平台。在业务需求

19、的牵引下,通过十余年的技术积累,百度自研深度学习框架、构建人工智能平台、结合对集群和算力的管理与调度,逐渐形成了业内领先的云智一体的AI开发全栈模式。因此,百度不仅是资深的AI开发平台使用者,同时也是AI开发平台的提供者。在企业使用人工智能赋能业务场景的过程中,相信大多数企业和开发者都在思考自己到底需要一个什么样的AI开发平台,如何有效地开展AI开发工作?我们认为可以从如下三个方面分析:2.1 场景先行使人工智能充分发挥价值和作用的前提,是要与实际的应用场景相结合。根据业务场景对需求进行定义,是成功进行AI算法模型开发的基础。百度在过去多年为企业提供服务的过程中发现,超过80%的需求都需要根据

20、实际应用场景进行定制。同时,在AI开发过程中,使用与应用场景相配套的流程工具是提高AI算法模型开发效率的关键。例如,百度的AI开发平台,面向质检、巡检、OCR、遥感图像分析、文本分类、文本处理、情感分析、商品检测等系列场景,都建设了一系列配套的组件、算法和工具,有效地帮助企业建立以场景导向、业务应用为前提的AI开发基础。2.2 自主创新AI开发是一个动态进化的过程,是在与应用场景持续交互的过程中,通过不断获得反馈、获取动态新数据,持续进行迭代优化的过程。同时,人工智能的应用场景非常分散,并且需要与业务逻辑紧密结合。因此,对于企业和开发者而言,需要有足够灵活、易用的平台进行自主创新。在灵活性方面

21、,适应未来发展趋势的AI开发平台,需要广泛地适配各类主流硬件,充分发挥各种硬件的能力且具有足够灵活性。百度飞桨企业版是业内芯片适配最广泛的AI开发平台,广泛适配包括飞腾、华为、百度昆仑等在内的国产芯片和服务器,这使得人工智能的创新应用可以建立在充分的灵活性基础之上。在易用性方面,适应未来发展趋势的AI开发平台,应该不仅能够支持算法工程师、数据科学家等专业开发人员进行便捷的模型开发和训练,也应该能够支持业务一线人员等零基础的开发者参与到AI开发过程中来。百度飞桨企业版,面向不同的使用者,既提供全功能开发模式满足资深研发人员的开发需求,也提供适合一线业务人员的零门槛模式,使得专业AI开发的部分更极

22、致,同时又能充分发挥更多的创造力。2.3 效能为要AI开发相较于传统的软件开发而言,从数据获取、数据标注、数据增强、模型开发、模型训练、模型评估到模型部署各个环节更加的复杂和多维。适应未来发展趋势的AI开发平台,应该具备从多个层面优化资源调度、提升开发效能的能力。在开发层面,除了全流程端到端的开发支持,更重要的是在每个环节中贴心为开发人员打造的细节。在百度飞桨企业版中,例如数据标注环节的智能清洗和自动标注能力,大幅降低标注成本;又如预置的大规模预训练模型和迁移学习能力,使得更少数据更好效果成为可能;再如基于数据闭环实现模型的持续迭代优化等能力,在各个环节中提升AI开发的效率、缩短开发周期。在算

23、力层面,纵向从AI芯片、AI服务器、AI容器到AI开发平台,应该做到全方位、集中式的AI算力管理。百度AI开发全栈模式,提供高密度的算力集中管理、多样的AI计算套餐、先进的调度系统、开放的算力生态,可实现对算力成本的极致优化。综上所述,人工智能技术从理论创新、技术突破、到工程实现,还有很多想象空间与未知领域可探索,企业在选择并建设适应未来发展趋势的AI开发平台方面,建议关注“场景先行、自主创新、效能为要“三个关键要素,进行统一规划和建设。这样不仅可以保障数据与模型资产的统一积累、沉淀和复用,更重要的是,还可以系统性的获得算法、工程等方面的最新成果,使企业能够在更高的基座上进行创新实践。“云智一

24、体”技术与应用解析 企业AI开发篇0607云智一体的AI开发全栈模式 08企业数字化、产业智能化需要与云计算、人工智能等技术进行深度结合。由于各类企业的智能化需求都是多种多样的,很多需求需要定制,很难用通用的AI模型去满足所有需求。根据2018年百度与波士顿咨询公司的联合调研,市场上86%的需求为定制AI需求。定制模型的数量从2017年至2020年激增了6倍之多(如图3-1所示)。因此,对企业而言,需要根据自己的需求进行模型开发。市场上的需求为定制AI需求2017至2020年定制模型数量非定制AI需求定制AI需求20020数据来源:2018年百度与波士顿咨询公司的联合调研

25、数据来源:百度AI开放平台(图3-1)86%翻6倍产业智能化正与AI技术深度结合86%14%09“云智一体”技术与应用解析企业AI开发篇云智一体的AI开发全栈模式 08企业数字化、产业智能化需要与云计算、人工智能等技术进行深度结合。由于各类企业的智能化需求都是多种多样的,很多需求需要定制,很难用通用的AI模型去满足所有需求。根据2018年百度与波士顿咨询公司的联合调研,市场上86%的需求为定制AI需求。定制模型的数量从2017年至2020年激增了6倍之多(如图3-1所示)。因此,对企业而言,需要根据自己的需求进行模型开发。市场上的需求为定制AI需求2017至2020年定制模型数量非定制AI需求

26、定制AI需求20020数据来源:2018年百度与波士顿咨询公司的联合调研数据来源:百度AI开放平台(图3-1)86%翻6倍产业智能化正与AI技术深度结合86%14%09“云智一体”技术与应用解析企业AI开发篇正是因为AI模型定制需求的激增,企业对自己的AI开发能力也提出了更高的要求(如图3-2所示)。一方面,对AI模型精度和AI开发效率有了更高的要求;另一方面,对AI算力资源的需求也呈现爆发式的增长。AI开发是一个非常消耗资源和能源的过程,企业亟需一套高性价比、高性能、高利用率的AI开发基础设施硬件,从而在AI开发过程中达到效能和成本的最佳平衡点。(图3-2)高质量数据高

27、精度效果高易用工具高性能高性价比高利用率效能成本对精度与开发效率的高要求对AI算力资源的爆发需求智能应用需求爆发,对AI开发提出了更高要求在AI开发过程中,涉及从数据收集、数据预处理、数据标注、模型训练、模型评估和模型部署等一系列任务。在这一系列过程中,不仅需要对所有流程调优、最大化提升开发人员的研发效率。而且,AI模型的训练和推理都需要大量的算力资源支持、并且要合理高效地利用这些庞大的算力资源来提升机器资源利用效率。这些都需要一套高性能、高效能、适应未来发展趋势的AI开发平台来提供。具体来说,在智能时代,适应未来发展趋势的AI开发平台需要提供如下能力:在算力资源方面,要对接和管理好性能、高利

28、用率、高性价比的AI算力资源在研发效率方面,要提供全流程的优化和开发效率的调优针对企业的实际业务场景和定制需求,提供整体的解决方案对此,百度智能云“云智一体的AI开发全栈模式”(如图3-3所示),能够很好的满足上述需求。百度作为AI原生公司,基于百度全球领先的 AI 技术和生态优势,从基础硬件、存储、容器、开发平台,到上层AI模型和应用的每个环节都融入了“云智一体”,为企业提供满足实际业务场景需求的、低成本高效率、全流程AI开发支持的全栈解决方案,加速产业智能化升级。在全栈产品架构设计方面,百度智能云“云智一体”将“AI基础设施”和“AI开发双平台”紧密结(图3-3)百度“云智一体”AI开发全

29、栈产品架构AI开发框架PaddlePaddle、TensorFlow、PyTorch等主流深度学习和机器学习开发框架AI开发平台数据处理零门槛AI开发平台EasyDL全功能AI开发平台BML模型训练模型管理模型部署AI存储数据上云对象存储BOS+AI加速对象存储BOS高速Cache智能处理AI计算X-MAN百度太行.高性能计算实例RDMAGPU百度昆仑InfiniBandAI容器GPU调度集群管理容器CCE+AI优化AI作业调度容器网络弹性训练容器存储AI加速引擎镜像仓库智能应用工业能源金融互联网智能硬件零售合在一起:百度智能云“AI开发基础设施”,是针对AI开发过程进行AI优化和AI加速等特

30、殊调优后的AI计算、AI存储、AI容器等基础设施。调优后的“AI开发基础设施“使“AI开发平台”的训练速度更快、精确度更高、模型效果更优。是业内适合跑AI的云。百度智能云“AI开发双平台”,是基于百度飞桨(PaddlePaddle)深度学习开源平台,推出的企业版AI开发平台,包括面向各类开发者的零门槛开发平台EasyDL和全功能开发平台BML。百度“AI开发双平台”可帮助各类用户实现数据处理、模型训练、模型管理、模型部署全流程全栈式的开发和部署。同时,百度智能云“AI中台”,是为企业构建的一套AI能力的生产和集中化管理的平台。AI中台的核心包括了AI服务运行平台、AI开发平台、AI样本中心、A

31、I模型中心和AI资产共享平台五大产品模块,结合与之配套的完善的计算资源管理、数据资源接入等运维管理体系,帮助企业实现集约化的AI能力的生产和管理、实现统筹的企业智能化升级。“云智一体”技术与应用解析 企业AI开发篇1011正是因为AI模型定制需求的激增,企业对自己的AI开发能力也提出了更高的要求(如图3-2所示)。一方面,对AI模型精度和AI开发效率有了更高的要求;另一方面,对AI算力资源的需求也呈现爆发式的增长。AI开发是一个非常消耗资源和能源的过程,企业亟需一套高性价比、高性能、高利用率的AI开发基础设施硬件,从而在AI开发过程中达到效能和成本的最佳平衡点。(图3-2)高质量数据高精度效果

32、高易用工具高性能高性价比高利用率效能成本对精度与开发效率的高要求对AI算力资源的爆发需求智能应用需求爆发,对AI开发提出了更高要求在AI开发过程中,涉及从数据收集、数据预处理、数据标注、模型训练、模型评估和模型部署等一系列任务。在这一系列过程中,不仅需要对所有流程调优、最大化提升开发人员的研发效率。而且,AI模型的训练和推理都需要大量的算力资源支持、并且要合理高效地利用这些庞大的算力资源来提升机器资源利用效率。这些都需要一套高性能、高效能、适应未来发展趋势的AI开发平台来提供。具体来说,在智能时代,适应未来发展趋势的AI开发平台需要提供如下能力:在算力资源方面,要对接和管理好性能、高利用率、高

33、性价比的AI算力资源在研发效率方面,要提供全流程的优化和开发效率的调优针对企业的实际业务场景和定制需求,提供整体的解决方案对此,百度智能云“云智一体的AI开发全栈模式”(如图3-3所示),能够很好的满足上述需求。百度作为AI原生公司,基于百度全球领先的 AI 技术和生态优势,从基础硬件、存储、容器、开发平台,到上层AI模型和应用的每个环节都融入了“云智一体”,为企业提供满足实际业务场景需求的、低成本高效率、全流程AI开发支持的全栈解决方案,加速产业智能化升级。在全栈产品架构设计方面,百度智能云“云智一体”将“AI基础设施”和“AI开发双平台”紧密结(图3-3)百度“云智一体”AI开发全栈产品架

34、构AI开发框架PaddlePaddle、TensorFlow、PyTorch等主流深度学习和机器学习开发框架AI开发平台数据处理零门槛AI开发平台EasyDL全功能AI开发平台BML模型训练模型管理模型部署AI存储数据上云对象存储BOS+AI加速对象存储BOS高速Cache智能处理AI计算X-MAN百度太行.高性能计算实例RDMAGPU百度昆仑InfiniBandAI容器GPU调度集群管理容器CCE+AI优化AI作业调度容器网络弹性训练容器存储AI加速引擎镜像仓库智能应用工业能源金融互联网智能硬件零售合在一起:百度智能云“AI开发基础设施”,是针对AI开发过程进行AI优化和AI加速等特殊调优后

35、的AI计算、AI存储、AI容器等基础设施。调优后的“AI开发基础设施“使“AI开发平台”的训练速度更快、精确度更高、模型效果更优。是业内适合跑AI的云。百度智能云“AI开发双平台”,是基于百度飞桨(PaddlePaddle)深度学习开源平台,推出的企业版AI开发平台,包括面向各类开发者的零门槛开发平台EasyDL和全功能开发平台BML。百度“AI开发双平台”可帮助各类用户实现数据处理、模型训练、模型管理、模型部署全流程全栈式的开发和部署。同时,百度智能云“AI中台”,是为企业构建的一套AI能力的生产和集中化管理的平台。AI中台的核心包括了AI服务运行平台、AI开发平台、AI样本中心、AI模型中

36、心和AI资产共享平台五大产品模块,结合与之配套的完善的计算资源管理、数据资源接入等运维管理体系,帮助企业实现集约化的AI能力的生产和管理、实现统筹的企业智能化升级。“云智一体”技术与应用解析 企业AI开发篇1011适合跑AI的云:AI开发基础设施 在企业数字化的过程中,“数据上云”已成为企业和行业的共识。企业的智能化和数字化是一项系统性工程,包括构建算力、存储、网络等基础设施,这些都是AI开发及应用必不可少的重要环节。得益于近年来算法、算力、数据等多方面的突破性进展,AI技术在各行业的应用越来越广泛。AI开发工程的发展也趋于追求更大的数据和模型、更快的训练速度,这也意味着需要投入更多的资金(如

37、图4-1所示)。(图4-1)AI开发工程领域的发展趋势如何选择高性能、高性价比、高利用率的“云”,是企业智能化和业务创新过程中需要考虑的重要因素(如图4-2所示)。对此,百度智能云的AI开发基础设施,作为业内适合跑AI的云,系统化的满足企业在AI开发过程中对AI开发基础设施的高性能、高性价比、高利用率的需求。行业对AI开发基础设施的诉求(图4-2)高性能更大的数据和模型高性价比更快的训练高利用率更高的投入13“云智一体”技术与应用解析企业AI开发篇12适合跑AI的云:AI开发基础设施 在企业数字化的过程中,“数据上云”已成为企业和行业的共识。企业的智能化和数字化是一项系统性工程,包括构建算力、

38、存储、网络等基础设施,这些都是AI开发及应用必不可少的重要环节。得益于近年来算法、算力、数据等多方面的突破性进展,AI技术在各行业的应用越来越广泛。AI开发工程的发展也趋于追求更大的数据和模型、更快的训练速度,这也意味着需要投入更多的资金(如图4-1所示)。(图4-1)AI开发工程领域的发展趋势如何选择高性能、高性价比、高利用率的“云”,是企业智能化和业务创新过程中需要考虑的重要因素(如图4-2所示)。对此,百度智能云的AI开发基础设施,作为业内适合跑AI的云,系统化的满足企业在AI开发过程中对AI开发基础设施的高性能、高性价比、高利用率的需求。行业对AI开发基础设施的诉求(图4-2)高性能更

39、大的数据和模型高性价比更快的训练高利用率更高的投入13“云智一体”技术与应用解析企业AI开发篇12百度昆仑AI芯片,算力进一步提升百度智能云AI高性能计算服务(如图4.1-1所示),主要包含以下三个特点:(图4.1-2)AI高性能计算服务(图4.1-1)丰富AI芯片类型X-MAN AI超级服务器百度太行.弹性裸金属自研百度昆仑AI芯片多规格商业GPU/FPGA第一款四路AI服务器CPU性能提升50%+GPU多卡NVLink高速通信统一新一代百度太行计算架构云产品无缝接入零损耗高性能百度昆仑1百度昆仑2已量产在百度搜索引擎全量部署相比T4GPU性能在不同模型下提升1.53x2021年量产采用7n

40、m先进工艺性能比昆仑1提升3x百度智能云通过AI计算、AI存储、AI容器三层设施,构建的软硬一体、高性价比的“AI开发基础设施”(如图4-3所示):AI计算层:为AI开发过程提供高性能、高性价比的算力支撑AI存储层:在AI开发过程中提供对数据的快速处理、高速存储、极速分析等能力AI容器层:对AI开发工程中的资源配置和任务进行统一管理百度智能云软硬一体高性价比AI开发基础设施(图4-3)AI存储数据上云对象存储BOS+AI加速对象存储BOS高速Cache智能处理AI计算X-MAN百度太行.高性能计算实例RDMAGPU百度昆仑InfiniBandAI容器GPU调度集群管理容器CCE+AI优化AI作

41、业调度容器网络弹性训练容器存储AI加速引擎镜像仓库4.1 AI计算层百度智能云AI高性能计算服务,是基于百度自主研发的硬件虚拟化技术,重构的百度智能云的算力基础设施,同时拥有云服务器的资源弹性和物理机的高性能体验,满足AI原生时代对海量算力的需求。搭配百度自研百度昆仑AI芯片、以及英伟达TelsaGPU等,满足AI应用各场景需求、提供高性价比的算力支持。特点一 支持丰富的AI芯片类型:包括百度自研的百度昆仑芯片以及行业多规格的主流数据中心级GPU,以满足不同场景、不同性价比的AI算力需求。在芯片领域,百度自研的百度昆仑芯片目前已发布两代产品(如图4.1-2所示)。其中百度昆仑1已经到了大规模部

42、署阶段,已在智慧城市、计算中心等领域得到了大规模应用。2021年量产的百度昆仑2,采用7nm先进工艺,较百度昆仑1性能提升约3倍。“云智一体”技术与应用解析 企业AI开发篇1415百度昆仑AI芯片,算力进一步提升百度智能云AI高性能计算服务(如图4.1-1所示),主要包含以下三个特点:(图4.1-2)AI高性能计算服务(图4.1-1)丰富AI芯片类型X-MAN AI超级服务器百度太行.弹性裸金属自研百度昆仑AI芯片多规格商业GPU/FPGA第一款四路AI服务器CPU性能提升50%+GPU多卡NVLink高速通信统一新一代百度太行计算架构云产品无缝接入零损耗高性能百度昆仑1百度昆仑2已量产在百度

43、搜索引擎全量部署相比T4GPU性能在不同模型下提升1.53x2021年量产采用7nm先进工艺性能比昆仑1提升3x百度智能云通过AI计算、AI存储、AI容器三层设施,构建的软硬一体、高性价比的“AI开发基础设施”(如图4-3所示):AI计算层:为AI开发过程提供高性能、高性价比的算力支撑AI存储层:在AI开发过程中提供对数据的快速处理、高速存储、极速分析等能力AI容器层:对AI开发工程中的资源配置和任务进行统一管理百度智能云软硬一体高性价比AI开发基础设施(图4-3)AI存储数据上云对象存储BOS+AI加速对象存储BOS高速Cache智能处理AI计算X-MAN百度太行.高性能计算实例RDMAGP

44、U百度昆仑InfiniBandAI容器GPU调度集群管理容器CCE+AI优化AI作业调度容器网络弹性训练容器存储AI加速引擎镜像仓库4.1 AI计算层百度智能云AI高性能计算服务,是基于百度自主研发的硬件虚拟化技术,重构的百度智能云的算力基础设施,同时拥有云服务器的资源弹性和物理机的高性能体验,满足AI原生时代对海量算力的需求。搭配百度自研百度昆仑AI芯片、以及英伟达TelsaGPU等,满足AI应用各场景需求、提供高性价比的算力支持。特点一 支持丰富的AI芯片类型:包括百度自研的百度昆仑芯片以及行业多规格的主流数据中心级GPU,以满足不同场景、不同性价比的AI算力需求。在芯片领域,百度自研的百

45、度昆仑芯片目前已发布两代产品(如图4.1-2所示)。其中百度昆仑1已经到了大规模部署阶段,已在智慧城市、计算中心等领域得到了大规模应用。2021年量产的百度昆仑2,采用7nm先进工艺,较百度昆仑1性能提升约3倍。“云智一体”技术与应用解析 企业AI开发篇1415特点二支持X-MAN架构超级服务器:百度自研X-MAN架构服务器,支持Intel/AMD旗舰CPU以及高速异构加速卡专属总线通信。除了标准的2路服务器配置,X-MAN是第一款能够搭配4路CPU的超级AI计算机。在CPU高负载业务中,能更好的释放GPU能力,让CPU不再成为GPU利用率的约束。特点三搭配百度太行智能网卡:高性能计算实例的服

46、务器资源百分百服务于业务本身,实现云上零损耗的高性能实例,给予客户物理机级别的性能体验。并且,实例能无缝衔接云存储、云网络、大数据,充分发挥AI超级服务器的算力和能力,为企业提供高性能、多规格、高性价比的算力服务。在AI超级计算机领域,百度自研的“百度太行”弹性裸金属服务器,将百度云存储、云网络、云大数据产品无缝融合,充分发挥AI超级服务器的算力和能力,其算力能力在云上的结构和形态(如图4.1-3所示):NVSwitchGPU0GPU1GPU2GPU3GPU4GPU5GPU6300GB NVLink100Gb IB/RoCE25Gb/100Gb VPC接入GPU7云服务器高速对象存储弹性裸金属

47、服务器RDMAVPC百度太行-高性能计算实例云上架构图(图4.1-3)面向AI计算的存储服务(图4.2-1)4.2 AI存储层AI存储层的核心是基于百度的对象存储服务以及面向AI场景的加速和处理能力,解决客户AI开发过程中的数据存储和分析问题。为此,百度智能云特别提出了面向AI计算的存储服务架构,并分为如下几个层面(如图4.2-1所示)数据上云:帮助客户数据快速高效上云,百度既提供面向离线传输的磁盘传输方式,也提供面向在线的CloudFlow产品,支持客户创建各种模型的在线传输任务。离线传输支持单台百TB的数据迁移能力,在线数据流转CloudFlow兼容业界7种对象存储接口。数据存储:百度以对

48、象存储为核心提供高性价比的存储服务。百度对象存储提供业界最全的4级数据存储,并提供智能的生命周期管理和业界领先的读写性能,满足客户在大数据场景下的性价比需求(如图4.2-2所示)。智能高速处理数据安全流转上云离线传输BOSCloudFlow百度智能云A云T云私有云大规模数据对象存储BOS高速Cache标准存储低频存储冷存储归档存储高性价比低OPEXRegionBRegionNRegionA高速介质元数据加速智能处理AI处理图片音视频文档数据预加载缓存管理AI 加速智能处理数据存储数据上云如上图所示,左侧为基于X-MAN的AI服务器单机多卡内部结构,单台服务器可支持八路GPU板卡的统一管理与资源

49、调度,GPU之间通过NVLINK、NVSwitch进行高速专属总线数据交互。右图为多节点高性能计算实例拓扑,这些计算节点之间,通过100G/200G RDMA网络高速互联,完成高速计算任务,以及通过25G/100GVPC虚拟网络与云上其他服务器实例和BOS存储进行通信。不论是单机多卡通信、跨节点多机多卡通信以及与云的上其他产品通信,百度太行弹性高性能计算实例均构建了整套高速AI基础设施,满足大模型通讯需求。“云智一体”技术与应用解析 企业AI开发篇1617特点二支持X-MAN架构超级服务器:百度自研X-MAN架构服务器,支持Intel/AMD旗舰CPU以及高速异构加速卡专属总线通信。除了标准的

50、2路服务器配置,X-MAN是第一款能够搭配4路CPU的超级AI计算机。在CPU高负载业务中,能更好的释放GPU能力,让CPU不再成为GPU利用率的约束。特点三搭配百度太行智能网卡:高性能计算实例的服务器资源百分百服务于业务本身,实现云上零损耗的高性能实例,给予客户物理机级别的性能体验。并且,实例能无缝衔接云存储、云网络、大数据,充分发挥AI超级服务器的算力和能力,为企业提供高性能、多规格、高性价比的算力服务。在AI超级计算机领域,百度自研的“百度太行”弹性裸金属服务器,将百度云存储、云网络、云大数据产品无缝融合,充分发挥AI超级服务器的算力和能力,其算力能力在云上的结构和形态(如图4.1-3所

51、示):NVSwitchGPU0GPU1GPU2GPU3GPU4GPU5GPU6300GB NVLink100Gb IB/RoCE25Gb/100Gb VPC接入GPU7云服务器高速对象存储弹性裸金属服务器RDMAVPC百度太行-高性能计算实例云上架构图(图4.1-3)面向AI计算的存储服务(图4.2-1)4.2 AI存储层AI存储层的核心是基于百度的对象存储服务以及面向AI场景的加速和处理能力,解决客户AI开发过程中的数据存储和分析问题。为此,百度智能云特别提出了面向AI计算的存储服务架构,并分为如下几个层面(如图4.2-1所示)数据上云:帮助客户数据快速高效上云,百度既提供面向离线传输的磁盘

52、传输方式,也提供面向在线的CloudFlow产品,支持客户创建各种模型的在线传输任务。离线传输支持单台百TB的数据迁移能力,在线数据流转CloudFlow兼容业界7种对象存储接口。数据存储:百度以对象存储为核心提供高性价比的存储服务。百度对象存储提供业界最全的4级数据存储,并提供智能的生命周期管理和业界领先的读写性能,满足客户在大数据场景下的性价比需求(如图4.2-2所示)。智能高速处理数据安全流转上云离线传输BOSCloudFlow百度智能云A云T云私有云大规模数据对象存储BOS高速Cache标准存储低频存储冷存储归档存储高性价比低OPEXRegionBRegionNRegionA高速介质元

53、数据加速智能处理AI处理图片音视频文档数据预加载缓存管理AI 加速智能处理数据存储数据上云如上图所示,左侧为基于X-MAN的AI服务器单机多卡内部结构,单台服务器可支持八路GPU板卡的统一管理与资源调度,GPU之间通过NVLINK、NVSwitch进行高速专属总线数据交互。右图为多节点高性能计算实例拓扑,这些计算节点之间,通过100G/200G RDMA网络高速互联,完成高速计算任务,以及通过25G/100GVPC虚拟网络与云上其他服务器实例和BOS存储进行通信。不论是单机多卡通信、跨节点多机多卡通信以及与云的上其他产品通信,百度太行弹性高性能计算实例均构建了整套高速AI基础设施,满足大模型通

54、讯需求。“云智一体”技术与应用解析 企业AI开发篇1617AI加速智能处理:在加速层面,百度提供基于全闪存介质的高速存储产品和针对元数据加速的Cache服务,以提供更高性能的存储能力,同时也在对象存储上默认集成了一些AI智能处理能力。百度的高速缓存能力,在一些场景下训练速度能提升4倍以上,同时也融合集成了几十种智能处理能力。此外,针对视频、图像、大容量文件等类型,百度智能云在BOS侧更好的封装集成了百度相关的AI能力,包括几十项图像的审核能力,以及图像增强和特效能力,这些特有能力的集成,能够轻松的降低编码复杂度(如图4.2-3所示)。用户可以直接通过BOS的事件触发框架,在数据访问或者数据上传

55、时,通过统一的接口拓展和调用这些智能处理能力、及时得到AI处理的效果,让数据分析和存储更近,降低管理、运维的复杂性。(图4.2-2)(图4.2-3)面向AI计算的存储系统特性云智融合的数据智能处理4级数据存储,业内最全生命周期智能生命周期管理,业内领先的读写性能高效存储离线传输单台百TB数据迁移CloudFlow兼容七种常见对象存储接口智能高速缓存,大训练集训练4倍速提升,几十种智能处理能力融合智能处理快捷上云4.3 AI容器层百度智能云的AI容器服务(如图4.3-1所示),提供GPU显存和算力的共享与隔离,集成PaddlePaddle、TensorFlow、Pytorch等主流深度学习框架,

56、支持AI任务编排、管理等。百度智能云的AI容器服务的关键特性主要有三点(如图4.3-2所示):支持GPU的共享能力,支持用户进行1/2、1/4等颗粒度的GPU算力资源管理。在AI作业的调度层面,支持Gang、Spread、Binpack等调度算法,以及针对NVLink等GPU架构感知调度能力。在加速引擎层面,提供算子和通信加速引擎,算子加速在具体场景下可以提升数倍的推理效率,通信库可以支持千卡规模的通信加速能力。(图4.3-1)(图4.3-2)AI容器服务AI容器服务特性AI 优化GPU共享调度GPU架构感知GPU调度AI作业调度作业优先级调度作业调度容错弹性伸缩弹性训练加速引擎AI专属镜像A

57、I专项优化容器基础设施X-MAN百度昆仑计算云服务器BCC百度太行RoCEVPC网络高速CacheBOS存储容器 通用能力集群生命周期管理节点自动扩容节点组管理容器网络流量接入容器存储用户管理RBAC角色管理OIDC镜像管理安全扫描镜像迁移集群管理容器网络与存储访问控制镜像管理GPU 容器虚拟化GPU资源二分之一、四分之一等粒度管理AI 容器调度Gang、Spread和Binpack调度,NVLink/Klink等GPU/XPU架构感知调度加速引擎支持通信加速和算子加速引擎,通信库可支持千卡规模,算子加速提升数倍推理效率数据+AI处理全面融合业务易集成30+处理能力融合集成10+AI图像审核能

58、力10+AI图像增强和特效一键封装触发数据处理,实时高效数据访问+处理统一接口图形化一站式管理,业务运维成本低融合智能处理的对象存储BOS图片音频文本视频OCR图片处理音视频处理VCS智能封面智能效果智能场景智感超清修复增强图审服务视频审核服务智能标签音频审核服务“云智一体”技术与应用解析 企业AI开发篇1819AI加速智能处理:在加速层面,百度提供基于全闪存介质的高速存储产品和针对元数据加速的Cache服务,以提供更高性能的存储能力,同时也在对象存储上默认集成了一些AI智能处理能力。百度的高速缓存能力,在一些场景下训练速度能提升4倍以上,同时也融合集成了几十种智能处理能力。此外,针对视频、图

59、像、大容量文件等类型,百度智能云在BOS侧更好的封装集成了百度相关的AI能力,包括几十项图像的审核能力,以及图像增强和特效能力,这些特有能力的集成,能够轻松的降低编码复杂度(如图4.2-3所示)。用户可以直接通过BOS的事件触发框架,在数据访问或者数据上传时,通过统一的接口拓展和调用这些智能处理能力、及时得到AI处理的效果,让数据分析和存储更近,降低管理、运维的复杂性。(图4.2-2)(图4.2-3)面向AI计算的存储系统特性云智融合的数据智能处理4级数据存储,业内最全生命周期智能生命周期管理,业内领先的读写性能高效存储离线传输单台百TB数据迁移CloudFlow兼容七种常见对象存储接口智能高

60、速缓存,大训练集训练4倍速提升,几十种智能处理能力融合智能处理快捷上云4.3 AI容器层百度智能云的AI容器服务(如图4.3-1所示),提供GPU显存和算力的共享与隔离,集成PaddlePaddle、TensorFlow、Pytorch等主流深度学习框架,支持AI任务编排、管理等。百度智能云的AI容器服务的关键特性主要有三点(如图4.3-2所示):支持GPU的共享能力,支持用户进行1/2、1/4等颗粒度的GPU算力资源管理。在AI作业的调度层面,支持Gang、Spread、Binpack等调度算法,以及针对NVLink等GPU架构感知调度能力。在加速引擎层面,提供算子和通信加速引擎,算子加速在

61、具体场景下可以提升数倍的推理效率,通信库可以支持千卡规模的通信加速能力。(图4.3-1)(图4.3-2)AI容器服务AI容器服务特性AI 优化GPU共享调度GPU架构感知GPU调度AI作业调度作业优先级调度作业调度容错弹性伸缩弹性训练加速引擎AI专属镜像AI专项优化容器基础设施X-MAN百度昆仑计算云服务器BCC百度太行RoCEVPC网络高速CacheBOS存储容器 通用能力集群生命周期管理节点自动扩容节点组管理容器网络流量接入容器存储用户管理RBAC角色管理OIDC镜像管理安全扫描镜像迁移集群管理容器网络与存储访问控制镜像管理GPU 容器虚拟化GPU资源二分之一、四分之一等粒度管理AI 容器

62、调度Gang、Spread和Binpack调度,NVLink/Klink等GPU/XPU架构感知调度加速引擎支持通信加速和算子加速引擎,通信库可支持千卡规模,算子加速提升数倍推理效率数据+AI处理全面融合业务易集成30+处理能力融合集成10+AI图像审核能力10+AI图像增强和特效一键封装触发数据处理,实时高效数据访问+处理统一接口图形化一站式管理,业务运维成本低融合智能处理的对象存储BOS图片音频文本视频OCR图片处理音视频处理VCS智能封面智能效果智能场景智感超清修复增强图审服务视频审核服务智能标签音频审核服务“云智一体”技术与应用解析 企业AI开发篇1819飞桨(PaddlePaddle

63、)是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台,由飞桨深度学习开源平台和飞桨企业版两大版块构成。其中,飞桨深度学习开源平台部分,包含核心框架、基础模型库、端到端开发套件与工具组件,持续开源核心能力,为产业、学术、科研创新提供基础底座。飞桨企业版则是基于飞桨开源深度学习平台,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。企业通过这套AI开发双平台,就可以在各种应用上发挥人工智能的价值,包括工业、能源、金融、互联网、智能硬件和零售等领域。AI开发是一个非常系统的工程,仅仅通过写几行代码,无法得到一个满意的模型效果。企业需要从基础资源、机器管理、分析工具、配置管理、流程

64、管理、监控等多个方面都投入非常大的精力。除此之外,AI开发的流程包括数据获取、特征提取、模型选择、模型评估、模型部署、推理服务等很长的过程(如图5-1所示)。AI开发是一个系统工程数据获取特征提取模型选择模型评估参数调优模型部署模型训练推理服务配置管理机器资源管理流程管理工具服务基础设施监控分析工具核心算法开发和调优只占一部分工作数据获取/标注/处理、模型部署往往耗时耗力基础设施和工具必不可少(图5-1)飞桨企业版:AI开发双平台 2120“云智一体”技术与应用解析企业AI开发篇飞桨(PaddlePaddle)是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台,由飞桨深度学习开源平台和

65、飞桨企业版两大版块构成。其中,飞桨深度学习开源平台部分,包含核心框架、基础模型库、端到端开发套件与工具组件,持续开源核心能力,为产业、学术、科研创新提供基础底座。飞桨企业版则是基于飞桨开源深度学习平台,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。企业通过这套AI开发双平台,就可以在各种应用上发挥人工智能的价值,包括工业、能源、金融、互联网、智能硬件和零售等领域。AI开发是一个非常系统的工程,仅仅通过写几行代码,无法得到一个满意的模型效果。企业需要从基础资源、机器管理、分析工具、配置管理、流程管理、监控等多个方面都投入非常大的精力。除此之外,AI开发的流程包括数据获取、特征提取

66、、模型选择、模型评估、模型部署、推理服务等很长的过程(如图5-1所示)。AI开发是一个系统工程数据获取特征提取模型选择模型评估参数调优模型部署模型训练推理服务配置管理机器资源管理流程管理工具服务基础设施监控分析工具核心算法开发和调优只占一部分工作数据获取/标注/处理、模型部署往往耗时耗力基础设施和工具必不可少(图5-1)飞桨企业版:AI开发双平台 2120“云智一体”技术与应用解析企业AI开发篇百度更关注AI应用开发者的细分需求百度更关注AI算法开发者的细分需求(图5-2)(图5-3)百度通过关注AI开发者在AI开发过程中的细分需求,发现在百度AI开发平台上有两类开发者:第一类开发者是AI应用

67、开发者(如图5-2所示),他们非常熟悉自己的业务、并且发现可以通过人工智能技术实现效率的提升,但他们对于人工智能的技术并不是特别熟悉和了解,因此他们非常希望自己提供业务数据、通过一个AI开发平台做简单的、自动的特征提取、模型选择、参数调优后得到一个满意的AI模型,并且能部署在各个硬件平台上。第二类开发者是AI算法开发者(如图5-3所示),他们更关注的是算法的效果,他们在特征提取、模型选择、参数优化、模型训练等这些步骤里,会投入更多的精力。数据获取特征提取模型选择模型评估参数调优模型部署模型训练推理服务配置管理机器资源管理流程管理工具服务基础设施监控分析工具AI能力定制少量数据、简单易用AI 模

68、型AI 应用开发者0.01.00.90.80.70.60.50.40.30.20.10.00.10.20.30.40.50.60.70.80.91.0ExcellentGoodWorthlessFalse positive rateTrue positive rateAI算法开发强大的集成开发环境AI 算法开发者数据获取特征提取模型选择模型评估参数调优模型部署模型训练推理服务配置管理机器资源管理流程管理工具服务基础设施监控分析工具百度智能云推出的飞桨企业版:AI开发双平台(如图5-4所示),可以很好的同时满足这两类AI开发者的需求。飞桨企业版将模型训练、算法库、模型训练、模型仓库、数据处理、数

69、据标注等核心功能聚合形成能力中心,同时产生了两个不同的开发界面:一个是零门槛开发平台EasyDL,EasyDL更关注的是从数据输入、模型输出的简单易用的效果,并且预置了很多视频、图像、文本、语音、OCR等等场景化的算法模型;另外一个是全功能AI开发平台BML,BML面向AI算法开发者提供了非常多的建模方式、预置模型方式、可视化建模等,充分满足算法开发者对开发效率的要求、以及在开发过程中对辅助工具的需求。飞桨企业版-AI 开发双平台模式(图5-4)资源管理模型部署模型仓库算法库+框架数据标注模型训练零门槛EasyDL面向AI应用开发者BML面向AI算法开发者数据处理视频图像文本语音OCR结构化数

70、据商品检测Notebook建模Pipeline建模预置模型调参可视化建模模型产线建模实验管理全功能“云智一体”技术与应用解析 企业AI开发篇2223百度更关注AI应用开发者的细分需求百度更关注AI算法开发者的细分需求(图5-2)(图5-3)百度通过关注AI开发者在AI开发过程中的细分需求,发现在百度AI开发平台上有两类开发者:第一类开发者是AI应用开发者(如图5-2所示),他们非常熟悉自己的业务、并且发现可以通过人工智能技术实现效率的提升,但他们对于人工智能的技术并不是特别熟悉和了解,因此他们非常希望自己提供业务数据、通过一个AI开发平台做简单的、自动的特征提取、模型选择、参数调优后得到一个满

71、意的AI模型,并且能部署在各个硬件平台上。第二类开发者是AI算法开发者(如图5-3所示),他们更关注的是算法的效果,他们在特征提取、模型选择、参数优化、模型训练等这些步骤里,会投入更多的精力。数据获取特征提取模型选择模型评估参数调优模型部署模型训练推理服务配置管理机器资源管理流程管理工具服务基础设施监控分析工具AI能力定制少量数据、简单易用AI 模型AI 应用开发者0.01.00.90.80.70.60.50.40.30.20.10.00.10.20.30.40.50.60.70.80.91.0ExcellentGoodWorthlessFalse positive rateTrue posi

72、tive rateAI算法开发强大的集成开发环境AI 算法开发者数据获取特征提取模型选择模型评估参数调优模型部署模型训练推理服务配置管理机器资源管理流程管理工具服务基础设施监控分析工具百度智能云推出的飞桨企业版:AI开发双平台(如图5-4所示),可以很好的同时满足这两类AI开发者的需求。飞桨企业版将模型训练、算法库、模型训练、模型仓库、数据处理、数据标注等核心功能聚合形成能力中心,同时产生了两个不同的开发界面:一个是零门槛开发平台EasyDL,EasyDL更关注的是从数据输入、模型输出的简单易用的效果,并且预置了很多视频、图像、文本、语音、OCR等等场景化的算法模型;另外一个是全功能AI开发平

73、台BML,BML面向AI算法开发者提供了非常多的建模方式、预置模型方式、可视化建模等,充分满足算法开发者对开发效率的要求、以及在开发过程中对辅助工具的需求。飞桨企业版-AI 开发双平台模式(图5-4)资源管理模型部署模型仓库算法库+框架数据标注模型训练零门槛EasyDL面向AI应用开发者BML面向AI算法开发者数据处理视频图像文本语音OCR结构化数据商品检测Notebook建模Pipeline建模预置模型调参可视化建模模型产线建模实验管理全功能“云智一体”技术与应用解析 企业AI开发篇22235.1 零基础AI开发平台:EasyDL百度智能云2017年推出的零门槛AI开发平台-EasyDL,是

74、业内最早推出的自动化机器学习平台。根据全球权威咨询机构 IDC(国际数据公司)2021 年 6 月发布的中国深度学习框架和平台市场份额报告显示,百度的“零门槛AI开发平台EasyDL”继连续两年位列中国机器学习平台市场份额第一之后,2021上半年继续保持第一(如图5.1-1所示)。(图5.1-1)数据来源:IDC深度学习框架和平台市场份额2021.6数据来源:IDC百度EasyDL中国机器学习平台市场份额(2021.6)EasyDL的操作使用非常简单易用。开发者仅需准备好与业务相关的数据,输入至EasyDL平台后,EasyDL就会对数据进行处理,在这个过程中,EasyDL提供了非常多的自动化的

75、工具,包括AutoDL、超大规模预训练模型等,让数据通过EasyDL自动生产能够应用于业务的模型。还可通过EasyDL的模型部署功能,最终把此模型应用到工业质检、生产安全等多个领域(如图5.1-2所示)。(图5.1-2)以零件分拣业务场景为例EasyDL 零门槛 AI 开发平台以一个零件分捡业务举例子,最快15分钟就可以定制一个AI服务(如图5.1-3所示)。通过选择模型类型,物体检测,上传标注的数据,模型训练,便可产出优秀的模型效果,最终集成在软硬一体的硬件上使用。EasyDL 最快15分钟即可获取定制 AI 服务(图5.1-3)数据准备模型训练AutoDL工具数据采集数据清洗数据扩充数据标

76、注可视化管理数据回流图片文本视频音频结构化数据模型部署公有云部署私有化部署设备端部署软硬一体部署应用构建工业质检安全生产智能硬件零售快消互联网AutoDL Transfer迁移学习 AutoDL Finetuner自动超参搜索Auto Augment自动数据增强超大规模预训练模型分布式训练加速适应产业应用算法集合场景自适应训练优化模型评估与归因分析视觉语义(飞桨文心 ERNIE)多种效果/性能算法选型选择模型类型集成使用上传并标注数据物体检测模型发布模型发布为设备端 SDK集成在 EdgeBoard中离线计算训练模型选择高精度算法mAP96.92%完成65张包含螺丝螺母数据的标注“云智一体”技

77、术与应用解析 企业AI开发篇24255.1 零基础AI开发平台:EasyDL百度智能云2017年推出的零门槛AI开发平台-EasyDL,是业内最早推出的自动化机器学习平台。根据全球权威咨询机构 IDC(国际数据公司)2021 年 6 月发布的中国深度学习框架和平台市场份额报告显示,百度的“零门槛AI开发平台EasyDL”继连续两年位列中国机器学习平台市场份额第一之后,2021上半年继续保持第一(如图5.1-1所示)。(图5.1-1)数据来源:IDC深度学习框架和平台市场份额2021.6数据来源:IDC百度EasyDL中国机器学习平台市场份额(2021.6)EasyDL的操作使用非常简单易用。开

78、发者仅需准备好与业务相关的数据,输入至EasyDL平台后,EasyDL就会对数据进行处理,在这个过程中,EasyDL提供了非常多的自动化的工具,包括AutoDL、超大规模预训练模型等,让数据通过EasyDL自动生产能够应用于业务的模型。还可通过EasyDL的模型部署功能,最终把此模型应用到工业质检、生产安全等多个领域(如图5.1-2所示)。(图5.1-2)以零件分拣业务场景为例EasyDL 零门槛 AI 开发平台以一个零件分捡业务举例子,最快15分钟就可以定制一个AI服务(如图5.1-3所示)。通过选择模型类型,物体检测,上传标注的数据,模型训练,便可产出优秀的模型效果,最终集成在软硬一体的硬

79、件上使用。EasyDL 最快15分钟即可获取定制 AI 服务(图5.1-3)数据准备模型训练AutoDL工具数据采集数据清洗数据扩充数据标注可视化管理数据回流图片文本视频音频结构化数据模型部署公有云部署私有化部署设备端部署软硬一体部署应用构建工业质检安全生产智能硬件零售快消互联网AutoDL Transfer迁移学习 AutoDL Finetuner自动超参搜索Auto Augment自动数据增强超大规模预训练模型分布式训练加速适应产业应用算法集合场景自适应训练优化模型评估与归因分析视觉语义(飞桨文心 ERNIE)多种效果/性能算法选型选择模型类型集成使用上传并标注数据物体检测模型发布模型发布

80、为设备端 SDK集成在 EdgeBoard中离线计算训练模型选择高精度算法mAP96.92%完成65张包含螺丝螺母数据的标注“云智一体”技术与应用解析 企业AI开发篇2425EasyDL作为零门槛的AI开发平台,针对AI应用开发者的核心诉求(如图5.1-4所示),在AI开发及部署过程中做了非常贴心的细节优化,为这类开发过程提供了非常丰富的任务场景,而且提供便捷的数据标注服务,同时考虑到开发者对训练效果的高要求,提供超高精度的模型训练效果,在模型训练完成后提供灵活的模型部署方案,以便开发者实现在各种场景的部署和应用。(图5.1-4)AI应用开发者的核心诉求丰富任务场景便捷的数据服务超高精度训练效

81、果灵活部署方案零门槛AI开发平台EasyDL,支持图像、文本、视频、语音、OCR、结构化数据、零售行业版7大方向,17种任务类型(如图5.1-5所示),支持公有云、本地服务部署、设备端、软硬一体四种部署方案,已服务超过90万用户。综上所述,简单易用的EasyDL,其全景功能,主要可分为数据服务、模型训练、模型部署三个大部分。EasyDL 丰富任务场景-7大方向、16种任务类型(图5.1-5)图像分类物体检测图像分割图像OCR模板定制声音分类零售行业版文本分类单标签文本分类多标签情感倾向分析文本实体抽取文本实体关系抽取文本视频视频分类目标跟踪OCR语音识别语音结构化数据时序预测表格数据预测商品检

82、测EasyDL 智能数据服务-EasyData(图5.1-6)EasyDL全景功能的第一部分是“数据服务”EasyDL不仅可提供丰富的任务场景模型,而且在数据处理方面还内置了强大的EasyData,业内首个智能数据服务平台(如图5.1-6所示)。对于机器学习的数据来说分两个大部分,一是数据获取,二是数据处理。这两个部分都非常耗时,尤其是非结构化数据的获取,往往会涉及到采集端的硬件选型和设备调试,由于不同的应用场景对数据的要求不同,对硬件规格的需求也不同,开发者一旦选错方案,就会严重耽误开发周期。EasyData提供了软硬一体的数据采集方案,很大程度避免了开发者自行硬件选型和对接开发的成本。同时

83、EasyData还在数据标注处理方面提供全流程的智能化方案,开发者可通过EasyDL进行软硬一体的数据采集、自动数据清洗/扩充、智能数据标注,整个过程使手工操作的成本减少75%。模型训练与发布反复且耗时人力成本高 周期长软硬一体数据采集数据采集周期从周提升到小时自动数据清洗/扩充人工处理成本降低80%数据需求量降低90%智能数据标注数据标注量降低70%支持多人标注自动数据闭环手工操作减少75%硬件选型硬件调试数据获取难例挖掘数据扩充数据传输数据标注模型训练服务部署模型迭代“云智一体”技术与应用解析 企业AI开发篇2627EasyDL作为零门槛的AI开发平台,针对AI应用开发者的核心诉求(如图5

84、.1-4所示),在AI开发及部署过程中做了非常贴心的细节优化,为这类开发过程提供了非常丰富的任务场景,而且提供便捷的数据标注服务,同时考虑到开发者对训练效果的高要求,提供超高精度的模型训练效果,在模型训练完成后提供灵活的模型部署方案,以便开发者实现在各种场景的部署和应用。(图5.1-4)AI应用开发者的核心诉求丰富任务场景便捷的数据服务超高精度训练效果灵活部署方案零门槛AI开发平台EasyDL,支持图像、文本、视频、语音、OCR、结构化数据、零售行业版7大方向,17种任务类型(如图5.1-5所示),支持公有云、本地服务部署、设备端、软硬一体四种部署方案,已服务超过90万用户。综上所述,简单易用

85、的EasyDL,其全景功能,主要可分为数据服务、模型训练、模型部署三个大部分。EasyDL 丰富任务场景-7大方向、16种任务类型(图5.1-5)图像分类物体检测图像分割图像OCR模板定制声音分类零售行业版文本分类单标签文本分类多标签情感倾向分析文本实体抽取文本实体关系抽取文本视频视频分类目标跟踪OCR语音识别语音结构化数据时序预测表格数据预测商品检测EasyDL 智能数据服务-EasyData(图5.1-6)EasyDL全景功能的第一部分是“数据服务”EasyDL不仅可提供丰富的任务场景模型,而且在数据处理方面还内置了强大的EasyData,业内首个智能数据服务平台(如图5.1-6所示)。对

86、于机器学习的数据来说分两个大部分,一是数据获取,二是数据处理。这两个部分都非常耗时,尤其是非结构化数据的获取,往往会涉及到采集端的硬件选型和设备调试,由于不同的应用场景对数据的要求不同,对硬件规格的需求也不同,开发者一旦选错方案,就会严重耽误开发周期。EasyData提供了软硬一体的数据采集方案,很大程度避免了开发者自行硬件选型和对接开发的成本。同时EasyData还在数据标注处理方面提供全流程的智能化方案,开发者可通过EasyDL进行软硬一体的数据采集、自动数据清洗/扩充、智能数据标注,整个过程使手工操作的成本减少75%。模型训练与发布反复且耗时人力成本高 周期长软硬一体数据采集数据采集周期

87、从周提升到小时自动数据清洗/扩充人工处理成本降低80%数据需求量降低90%智能数据标注数据标注量降低70%支持多人标注自动数据闭环手工操作减少75%硬件选型硬件调试数据获取难例挖掘数据扩充数据传输数据标注模型训练服务部署模型迭代“云智一体”技术与应用解析 企业AI开发篇2627EasyDL全景功能的第二部分是“模型训练”EasyDL预置了超大规模的图像预训练模型,这是EasyDL之所以能够生产出超高精度模型的秘诀(如图5.1-7所示)。在图像分类预训练模型方面,EasyDL基于海量互联网数据,提供10万+类tag、6500万图片,显著提升了模型训练精度;在物体检测预训练模型方面,EasyDL提

88、供了800+tag、170万图片、1000万+检测框,明显提升了模型训练平均准确率。EasyDL 超高精度训练-预置超大规模图像预训练模型同时,EasyDL集成了国内外市场上都闻名遐尔的语义理解框架飞桨文心(ERNIE)。这是百度自研的超大规模自然语言处理的预训练模型(如图5.1-8所示)。ERNIE通过对预置数据的学习,掌握了大量的文本和语义相关的背景知识,将这些背景知识应用到自然语言处理技术NLP中,例如对话、问答、情感分析这些模型训练任务上,可以有效提升模型效果。EasyDL超高精度的模型训练,给开发者带来两方面的价值。一方面是助力业务冷启动,企业在进行AI模型开发时,通常情况下并没有具

89、备足够多的数据,开发者可使用EasyDL提供的预训练模型,再加上非常少量的样本数据,就能够得到比较满意的模型效果。另一方面是提升业务效果,即使开发者已经具有足够多的数据,EasyDL预训练模型仍然能够显著提升包括NLP和CV在内的多项业务指标(如图5.1-9所示)。EasyDL超高精度训练-预置NLP预训练模型ERNIE(图5.1-8)持续学习的语义理解框架,让企业站在海量大数据的肩膀上飞桨文心 ERNIE1500万篇百科语料和词语、实体知识700万句人类对话知识3亿文章因果结构关系10亿搜索查询-结果句对知识2000万语言蕴含关系知识对话问答情感分析语言推理阅读理解信息抽取海量中文数据、知识

90、提供核心燃料,结合NLP应用任务,持续学习、持续迭代持续学习海量知识全面提升NLP任务效果(图5.1-7)花卉植物叶子手绘简笔画10个数据集8个数据集图像分类预训练模型,基于海量互联网数据,10万+类tag,6500万图片物体检测预训练模型,基于海量互联网数据,800+tag,170万图片,1000万+检测框平均精度 7.73%TOP-1平均准确率 4.53%Iou=0.5预训练模型77.8%68.6%87.9%分类预训练模型98.9%76.55%91.1%ImageNet数据集检测预训练模型88.3%81.4%73.6%车牌照检测游戏中物体检测车辆与行人检测预训练模型76.1%80.1%66

91、.7%ImageNet数据集飞桨大规模飞桨大规模“云智一体”技术与应用解析 企业AI开发篇2829EasyDL全景功能的第二部分是“模型训练”EasyDL预置了超大规模的图像预训练模型,这是EasyDL之所以能够生产出超高精度模型的秘诀(如图5.1-7所示)。在图像分类预训练模型方面,EasyDL基于海量互联网数据,提供10万+类tag、6500万图片,显著提升了模型训练精度;在物体检测预训练模型方面,EasyDL提供了800+tag、170万图片、1000万+检测框,明显提升了模型训练平均准确率。EasyDL 超高精度训练-预置超大规模图像预训练模型同时,EasyDL集成了国内外市场上都闻名

92、遐尔的语义理解框架飞桨文心(ERNIE)。这是百度自研的超大规模自然语言处理的预训练模型(如图5.1-8所示)。ERNIE通过对预置数据的学习,掌握了大量的文本和语义相关的背景知识,将这些背景知识应用到自然语言处理技术NLP中,例如对话、问答、情感分析这些模型训练任务上,可以有效提升模型效果。EasyDL超高精度的模型训练,给开发者带来两方面的价值。一方面是助力业务冷启动,企业在进行AI模型开发时,通常情况下并没有具备足够多的数据,开发者可使用EasyDL提供的预训练模型,再加上非常少量的样本数据,就能够得到比较满意的模型效果。另一方面是提升业务效果,即使开发者已经具有足够多的数据,EasyD

93、L预训练模型仍然能够显著提升包括NLP和CV在内的多项业务指标(如图5.1-9所示)。EasyDL超高精度训练-预置NLP预训练模型ERNIE(图5.1-8)持续学习的语义理解框架,让企业站在海量大数据的肩膀上飞桨文心 ERNIE1500万篇百科语料和词语、实体知识700万句人类对话知识3亿文章因果结构关系10亿搜索查询-结果句对知识2000万语言蕴含关系知识对话问答情感分析语言推理阅读理解信息抽取海量中文数据、知识提供核心燃料,结合NLP应用任务,持续学习、持续迭代持续学习海量知识全面提升NLP任务效果(图5.1-7)花卉植物叶子手绘简笔画10个数据集8个数据集图像分类预训练模型,基于海量互

94、联网数据,10万+类tag,6500万图片物体检测预训练模型,基于海量互联网数据,800+tag,170万图片,1000万+检测框平均精度 7.73%TOP-1平均准确率 4.53%Iou=0.5预训练模型77.8%68.6%87.9%分类预训练模型98.9%76.55%91.1%ImageNet数据集检测预训练模型88.3%81.4%73.6%车牌照检测游戏中物体检测车辆与行人检测预训练模型76.1%80.1%66.7%ImageNet数据集飞桨大规模飞桨大规模“云智一体”技术与应用解析 企业AI开发篇2829EasyDL 训练精度显著提升(图5.1-9)助力业务冷启动25354555657

95、58595without ERNIEERNIE60 68 75 83 90 NLP情感分析任务数据量减少90%CV多个任务平均数据量减少70%0 1,000 2,000 3,000 4,000 5,000 6,000 数据量0 500 1,000 1,500 2,000 2,500 3,000 3,500 4,000 4,500 数据量准确率等指标准确率、mAP等指标NLP多种任务指标显著提升CV多种任务指标显著提升传统开发模式预训练模型开发模式ImageNet预训练百度超大规模视觉预训练提升业务效果传统开发模式预训练模型开发模式在模型训练完成后,如何判断模型效果,这同样也是开发者非常关注的问

96、题。EasyDL的“智能归因”功能能够很好的帮助开发者进行模型的调优(如图5.1-10所示)。例如对于一个分类模型,EasyDL提供多种归因分析,不仅可对模型的总体指标、详细指标进行剖析,而且还提供三种常见的归因分析工具可对模型效果进行归因分析:归因分析工具一:混淆矩阵。通过数据统计,不仅可以帮助开发者精准判断模型在哪些类别上容易出错,而且还能帮助开发者在这些类别上增加数据、调优模型效果。归因分析工具二:热力图。可以分析出样本数据里模型关注的是哪些具体的地方,进一步地解释模型的决策依据,在整图范围内给出影响模型识别结果的像素重要程度。归因分析工具三:噪声样本挖掘。根据混淆矩阵和热力图,直接挖掘

97、影响模型效果的噪声样本,帮助开发者有针对性的进行模型迭代。经过EasyDL对模型的自动化的智能归因分析和模型调优循环,能够使调忧效率平均提升50%、模型精度效果平均提升21%。EasyDL超高精度训练-智能归因助力模型调优(图5.1-10)模型调优效率提升50%模型精度效果提升21%5060708090100模型精度原效果补充易混淆类别数据根据热力图丰富干扰背景图片根据噪声样本修正错标数据1234查看详细指标圈定精度欠佳标签通过归因分析洞察原因收集易混淆类别数据模型有针对性的迭代混淆矩阵噪声样本挖掘热力图指标总体指标详细分析归因“云智一体”技术与应用解析 企业AI开发篇3031EasyDL 训

98、练精度显著提升(图5.1-9)助力业务冷启动2535455565758595without ERNIEERNIE60 68 75 83 90 NLP情感分析任务数据量减少90%CV多个任务平均数据量减少70%0 1,000 2,000 3,000 4,000 5,000 6,000 数据量0 500 1,000 1,500 2,000 2,500 3,000 3,500 4,000 4,500 数据量准确率等指标准确率、mAP等指标NLP多种任务指标显著提升CV多种任务指标显著提升传统开发模式预训练模型开发模式ImageNet预训练百度超大规模视觉预训练提升业务效果传统开发模式预训练模型开发模

99、式在模型训练完成后,如何判断模型效果,这同样也是开发者非常关注的问题。EasyDL的“智能归因”功能能够很好的帮助开发者进行模型的调优(如图5.1-10所示)。例如对于一个分类模型,EasyDL提供多种归因分析,不仅可对模型的总体指标、详细指标进行剖析,而且还提供三种常见的归因分析工具可对模型效果进行归因分析:归因分析工具一:混淆矩阵。通过数据统计,不仅可以帮助开发者精准判断模型在哪些类别上容易出错,而且还能帮助开发者在这些类别上增加数据、调优模型效果。归因分析工具二:热力图。可以分析出样本数据里模型关注的是哪些具体的地方,进一步地解释模型的决策依据,在整图范围内给出影响模型识别结果的像素重要

100、程度。归因分析工具三:噪声样本挖掘。根据混淆矩阵和热力图,直接挖掘影响模型效果的噪声样本,帮助开发者有针对性的进行模型迭代。经过EasyDL对模型的自动化的智能归因分析和模型调优循环,能够使调忧效率平均提升50%、模型精度效果平均提升21%。EasyDL超高精度训练-智能归因助力模型调优(图5.1-10)模型调优效率提升50%模型精度效果提升21%5060708090100模型精度原效果补充易混淆类别数据根据热力图丰富干扰背景图片根据噪声样本修正错标数据1234查看详细指标圈定精度欠佳标签通过归因分析洞察原因收集易混淆类别数据模型有针对性的迭代混淆矩阵噪声样本挖掘热力图指标总体指标详细分析归因

101、“云智一体”技术与应用解析 企业AI开发篇3031(图5.1-12)EasyDL全景功能的第三部分是“模型部署”为了满足不同应用场景的需求,EasyDL支持非常灵活的模型部署方式(如图5.1-11所示)。提供公有云 API、本地服务器部署、设备端 SDK、软硬一体产品的四大部署方式。用户只需经过简单的设置,就可以将训练好的模型转换为满足业务场景需求的服务。在设备端SDK上,适配了NVJetson系列、Intel神经加速棒、华为NPU、华为Atlas、高通DSP、RK等超过20种主流芯片与四大操作系统,是业界适配最广泛的AI开发平台。其中,软硬一体的产品矩阵,针对不同的应用需求,提供了高效能的边

102、缘计算的节点、高性能嵌入式的AI计算方案和低成本便携式端AI侧应用(如图5.1-12所示)。EasyDL灵活部署方案-软硬一体产品矩阵专项适配与加速,高中低全矩阵覆盖,轻松打造嵌入式AI应用(图5.1-11)EasyDL 支持灵活模型部署方案公有云 API高可用云服务弹性扩缩容自动数据闭环本地服务器部署一键打包终身设备授权全面安全保障软硬一体产品6款方案专项适配与加速高中低全矩阵覆盖模型识别速度最高提升10倍设备端 SDK适配最广泛15+芯片类型4大操作系统EasyDL-EdgeBoard(FZ)计算盒软硬一体方案EasyDL-Jetson Xavier软硬一体方案超高性能边缘AI计算节点高性

103、能嵌入式AI计算方案低成本、小功耗便携式端侧AI应用EasyDL-Jetson TX2软硬一体开发套件EasyDL-EdgeBoard(VMX)加速卡软硬一体方案EasyDL-Jetson Nano软硬一体开发套件EasyDL-EdgeBoard(Lite)软硬一体方案(图5.1-13)在端云一体的部署过程中,百度智能云提供了非常有价值的端云协同部署方案(如图5.1-13所示)。端云协同部署基于百度开源的智能边缘BIE框架搭建,开发者可以轻松在云端管理各类端与边缘设备。只需集成百度边缘套件,就可以在本地设备上轻松获得AI模型的本地推理、视频流接入等功能。同时在云端可以进行服务的下发和更新、报表

104、统计和节点管理等功能。端云协同部署适合具有联网(或部分联网)条件下的业务场景,开发者训练好模型,仅需1分钟,就可以将新的模型下发更新到边缘端进行验证或者批量部署。可以极大提升AI模型开发的部署效率。EasyDL端云协同的部署方案可以运行在各式各样的智能终端,如边缘设备终端、一体机、服务器,在这些边缘设备上,同时还可以接入各式传感器(如摄像机、MIC等)。结合EasyDL的公有云部署和本地服务器部署,可以方便地构建出云边端融合的一整套AI解决方案,满足各种业务场景下的AI应用需求。提升AI模型开发部署效率,构建云边端融合的AI解决方案EasyDL灵活部署方案-端云协同云端服务端/边缘设备Came

105、raMICNVRDrone日志收集自动更新统计报表配置管理状态监控边缘节点管理数据存储/资源调度/计算队列管理服务下发APP数据上行服务下行AI端服务部署短至1分钟视频流接入AI模型本地推理百度智能边缘(BIE)操作系统:Windows/Linux嵌入式终端智能盒子私有服务计算集群一体机AI“云智一体”技术与应用解析 企业AI开发篇3233(图5.1-12)EasyDL全景功能的第三部分是“模型部署”为了满足不同应用场景的需求,EasyDL支持非常灵活的模型部署方式(如图5.1-11所示)。提供公有云 API、本地服务器部署、设备端 SDK、软硬一体产品的四大部署方式。用户只需经过简单的设置,

106、就可以将训练好的模型转换为满足业务场景需求的服务。在设备端SDK上,适配了NVJetson系列、Intel神经加速棒、华为NPU、华为Atlas、高通DSP、RK等超过20种主流芯片与四大操作系统,是业界适配最广泛的AI开发平台。其中,软硬一体的产品矩阵,针对不同的应用需求,提供了高效能的边缘计算的节点、高性能嵌入式的AI计算方案和低成本便携式端AI侧应用(如图5.1-12所示)。EasyDL灵活部署方案-软硬一体产品矩阵专项适配与加速,高中低全矩阵覆盖,轻松打造嵌入式AI应用(图5.1-11)EasyDL 支持灵活模型部署方案公有云 API高可用云服务弹性扩缩容自动数据闭环本地服务器部署一键

107、打包终身设备授权全面安全保障软硬一体产品6款方案专项适配与加速高中低全矩阵覆盖模型识别速度最高提升10倍设备端 SDK适配最广泛15+芯片类型4大操作系统EasyDL-EdgeBoard(FZ)计算盒软硬一体方案EasyDL-Jetson Xavier软硬一体方案超高性能边缘AI计算节点高性能嵌入式AI计算方案低成本、小功耗便携式端侧AI应用EasyDL-Jetson TX2软硬一体开发套件EasyDL-EdgeBoard(VMX)加速卡软硬一体方案EasyDL-Jetson Nano软硬一体开发套件EasyDL-EdgeBoard(Lite)软硬一体方案(图5.1-13)在端云一体的部署过程

108、中,百度智能云提供了非常有价值的端云协同部署方案(如图5.1-13所示)。端云协同部署基于百度开源的智能边缘BIE框架搭建,开发者可以轻松在云端管理各类端与边缘设备。只需集成百度边缘套件,就可以在本地设备上轻松获得AI模型的本地推理、视频流接入等功能。同时在云端可以进行服务的下发和更新、报表统计和节点管理等功能。端云协同部署适合具有联网(或部分联网)条件下的业务场景,开发者训练好模型,仅需1分钟,就可以将新的模型下发更新到边缘端进行验证或者批量部署。可以极大提升AI模型开发的部署效率。EasyDL端云协同的部署方案可以运行在各式各样的智能终端,如边缘设备终端、一体机、服务器,在这些边缘设备上,

109、同时还可以接入各式传感器(如摄像机、MIC等)。结合EasyDL的公有云部署和本地服务器部署,可以方便地构建出云边端融合的一整套AI解决方案,满足各种业务场景下的AI应用需求。提升AI模型开发部署效率,构建云边端融合的AI解决方案EasyDL灵活部署方案-端云协同云端服务端/边缘设备CameraMICNVRDrone日志收集自动更新统计报表配置管理状态监控边缘节点管理数据存储/资源调度/计算队列管理服务下发APP数据上行服务下行AI端服务部署短至1分钟视频流接入AI模型本地推理百度智能边缘(BIE)操作系统:Windows/Linux嵌入式终端智能盒子私有服务计算集群一体机AI“云智一体”技术

110、与应用解析 企业AI开发篇3233最后,在模型部署完成后,EasyDL结合自研的计算图优化、模型压缩、端到端硬件加速、异构计算编排等机制,大幅提升本地推理性能,帮助开发者将模型高效的应用在端上(如图5.1-14所示)。(图5.1-14)EasyDL灵活部署-本地部署服务性能大幅提升结合自研的计算图优化、模型压缩、端到端硬件加速、异构计算编排等机制,大幅提升本地推理性能05000250000500600700800900FasterRCNN050002500YoloV3-Darknet性能优化平均精度损失低于1%推理速度/ms推理

111、时延降低62%内存占用/MB内存/显存占用降低60%体积/MB模型体积减少84%原始模型+论文实现推理优化加速后模型+EasyEdge推理套件原始模型优化压缩后模型JDE原始模型优化压缩后模型5.2 全功能AI开发平台:BML云智一体的AI开发双平台:零算法AI开发平台EasyDL是面向AI应用开发者构建的,全功能AI开发平台BML,则是面向AI算法开发者构建的(如图5.2-1所示)。全功能AI开发平台BML与零门槛AI开发平台EasyDL的架构较为接近,因为它们的核心算法和模块是可共享的。主要区别是在于模型构建和模型管理上,BML提供了更加丰富的构建方式,提供了更好的调优工具,更好的预训练模

112、型。在模型管理上也提供了模型存储、模型转化、模型评估和模型优化的功能。可以说BML面向专业算法开发者提供了更灵活和更强大的AI开发平台。(图5.2-1)BML 全功能 AI 开发平台数据准备模型构建AutoDL工具数据采集数据清洗数据扩充数据标注可视化管理数据回流图片文本视频音频结构化数据模型管理应用构建模型部署模型存储公有云部署模型转换私有化部署模型评估设备端部署模型优化软硬一体部署工业质检安全生产智能硬件零售快消互联网AutoDL Transfer迁移学习 AutoDL Finetuner自动超参搜索Auto Augment自动数据增强超大规模预训练模型丰富开发方式视觉主流机器学习和深度学

113、习开发框架高性价比的算力资源语义(飞桨文心 ERNIE)NoteBook 建模预置模型调参可视化建模Pipeline 建模模型产线建模“云智一体”技术与应用解析 企业AI开发篇3435最后,在模型部署完成后,EasyDL结合自研的计算图优化、模型压缩、端到端硬件加速、异构计算编排等机制,大幅提升本地推理性能,帮助开发者将模型高效的应用在端上(如图5.1-14所示)。(图5.1-14)EasyDL灵活部署-本地部署服务性能大幅提升结合自研的计算图优化、模型压缩、端到端硬件加速、异构计算编排等机制,大幅提升本地推理性能050002500005006007

114、00800900FasterRCNN050002500YoloV3-Darknet性能优化平均精度损失低于1%推理速度/ms推理时延降低62%内存占用/MB内存/显存占用降低60%体积/MB模型体积减少84%原始模型+论文实现推理优化加速后模型+EasyEdge推理套件原始模型优化压缩后模型JDE原始模型优化压缩后模型5.2 全功能AI开发平台:BML云智一体的AI开发双平台:零算法AI开发平台EasyDL是面向AI应用开发者构建的,全功能AI开发平台BML,则是面向AI算法开发者构建的(如图5.2-1所示)。全功能AI开发平台BML与零门槛AI开发平台EasyDL的架构

115、较为接近,因为它们的核心算法和模块是可共享的。主要区别是在于模型构建和模型管理上,BML提供了更加丰富的构建方式,提供了更好的调优工具,更好的预训练模型。在模型管理上也提供了模型存储、模型转化、模型评估和模型优化的功能。可以说BML面向专业算法开发者提供了更灵活和更强大的AI开发平台。(图5.2-1)BML 全功能 AI 开发平台数据准备模型构建AutoDL工具数据采集数据清洗数据扩充数据标注可视化管理数据回流图片文本视频音频结构化数据模型管理应用构建模型部署模型存储公有云部署模型转换私有化部署模型评估设备端部署模型优化软硬一体部署工业质检安全生产智能硬件零售快消互联网AutoDL Trans

116、fer迁移学习 AutoDL Finetuner自动超参搜索Auto Augment自动数据增强超大规模预训练模型丰富开发方式视觉主流机器学习和深度学习开发框架高性价比的算力资源语义(飞桨文心 ERNIE)NoteBook 建模预置模型调参可视化建模Pipeline 建模模型产线建模“云智一体”技术与应用解析 企业AI开发篇3435BML 全功能 AI 开发平台核心优势全功能AI开发平台BML具有以下四个核心优势:建模方式全面、预置高性能AI套件、交付灵活、同时还提供多种国产化解决方案,为企业提供自主可控广泛适配的AI开发平台(如图5.2-2所示)。(图5.2-2)高性能AI套件灵活交付部署国

117、产解决方案建模方式全面全功能AI开发平台BML的核心优势一:全面的建模方式BML提供Notebook、代码、可视化、预置模型调参等多种开发方式,能够覆盖多种不同的开发场景(如图5.2-3所示)。BML 建模方式全面-覆盖不同开发场景(图5.2-3)超越原生Jupyter Notebook的端云开发环境支持多种框架的代码开发可视化拖拉拽,预置丰富组件基于预训练的低代码建模 预置模型调参 脚本编辑器 预训练模型 网络 代码 算法框架 代码文件 启动命令 输出路径 可视化 Notebook 运行 编辑 在实践中,AI开发者在外围基础设施的建设方面往往需要花费80%的精力,而在最影响模型效果的核心建模

118、环节,仅占了20%的开发时间。对此,BML在“预置模型调参”的开发方式中预置了大量的网络结构和模型,涵盖了大多数的常见场景(如图5.2-4所示)。这可以为AI开发者在开发过程中节约大量的开发时间、将主要精力集中在最影响模型效果的核心建模环节。(图5.2-5)BML预置模型调参-基于预训练的低代码建模影响模型效果80%的环节只占20%的开发时间(图5.2-4)清洗数据数据增强预训练模型分布式训练外围基础设施的建设需要花费80%时间,而算法工程师最关注的建模环节才是决定模型效果的关键模型评估模型部署核心建模核心超参易变高层网络复杂任务网络优化Tricks数据分片/读取同时,BML在“预置模型调参”

119、的开发方式中,提供的自动超参搜索功能是创新基于随机微分方程的无梯度优化的调参算法,收敛速度快,不依赖平滑性假设,并可支持大规模的并行搜索调参。在开启自动超参搜索之后,BML线上多场景的模型精度平均可提升10%以上(如图5.2-5所示)。自动超参搜索大幅提升模型效果自动超参搜索 创新基于随机微分方程的无梯度优化的调参算法,收敛速度快,不依赖平滑性假设 支持大规模并行搜索调参BML线上多场景模型精度均有显著提升随机搜索启发式高效搜索AutoML ServiceManagerSearchSpaceTuner收集结果TrialTrialTrialTrialTrialTrial失败重试Trial并发实验

120、Trial10.950.90.850.80.750.70.650.6珠宝品类识别Base自动数据增强自动数据增强+超参数搜索集装箱卡车号牌识别模型数度香烟过滤嘴质检“云智一体”技术与应用解析 企业AI开发篇3637BML 全功能 AI 开发平台核心优势全功能AI开发平台BML具有以下四个核心优势:建模方式全面、预置高性能AI套件、交付灵活、同时还提供多种国产化解决方案,为企业提供自主可控广泛适配的AI开发平台(如图5.2-2所示)。(图5.2-2)高性能AI套件灵活交付部署国产解决方案建模方式全面全功能AI开发平台BML的核心优势一:全面的建模方式BML提供Notebook、代码、可视化、预置

121、模型调参等多种开发方式,能够覆盖多种不同的开发场景(如图5.2-3所示)。BML 建模方式全面-覆盖不同开发场景(图5.2-3)超越原生Jupyter Notebook的端云开发环境支持多种框架的代码开发可视化拖拉拽,预置丰富组件基于预训练的低代码建模 预置模型调参 脚本编辑器 预训练模型 网络 代码 算法框架 代码文件 启动命令 输出路径 可视化 Notebook 运行 编辑 在实践中,AI开发者在外围基础设施的建设方面往往需要花费80%的精力,而在最影响模型效果的核心建模环节,仅占了20%的开发时间。对此,BML在“预置模型调参”的开发方式中预置了大量的网络结构和模型,涵盖了大多数的常见场

122、景(如图5.2-4所示)。这可以为AI开发者在开发过程中节约大量的开发时间、将主要精力集中在最影响模型效果的核心建模环节。(图5.2-5)BML预置模型调参-基于预训练的低代码建模影响模型效果80%的环节只占20%的开发时间(图5.2-4)清洗数据数据增强预训练模型分布式训练外围基础设施的建设需要花费80%时间,而算法工程师最关注的建模环节才是决定模型效果的关键模型评估模型部署核心建模核心超参易变高层网络复杂任务网络优化Tricks数据分片/读取同时,BML在“预置模型调参”的开发方式中,提供的自动超参搜索功能是创新基于随机微分方程的无梯度优化的调参算法,收敛速度快,不依赖平滑性假设,并可支持

123、大规模的并行搜索调参。在开启自动超参搜索之后,BML线上多场景的模型精度平均可提升10%以上(如图5.2-5所示)。自动超参搜索大幅提升模型效果自动超参搜索 创新基于随机微分方程的无梯度优化的调参算法,收敛速度快,不依赖平滑性假设 支持大规模并行搜索调参BML线上多场景模型精度均有显著提升随机搜索启发式高效搜索AutoML ServiceManagerSearchSpaceTuner收集结果TrialTrialTrialTrialTrialTrial失败重试Trial并发实验Trial10.950.90.850.80.750.70.650.6珠宝品类识别Base自动数据增强自动数据增强+超参数

124、搜索集装箱卡车号牌识别模型数度香烟过滤嘴质检“云智一体”技术与应用解析 企业AI开发篇3637BML预置的第二个核心套件,是飞桨文心ERNIE开发套件,飞桨的可持续学习语义学习模型(如图5.2-8所示)。除此之外还提供三十多个算法工具,二十多个细化的预训练模型,二十多个数据处理的工具和二十多个基础开发的工具,使整个数据标注投入的算法、开发时长都有大幅度降低,效率大幅度提升。此外,BML还具有数据优化和增强的功能,开放超过40种算子和工业级的算法,有效提升模型效果(如图5.2-6所示)。例如对于苹果物体,BML可实现对它进行自动的剪切、平移、旋转、对比度、反色等处理,让这样单一的样本,自动扩展出

125、多个不同维度的样本。实现小数据量的模型训练也能得到较丰富的效果,使多个场景的平均精度提升7%以上。(图5.2-8)BML 高性能 AI 套件飞桨文心(ERNIE)NLP开发套件文本分类ERNIE2.0通用模型ERNIEIE信息抽取模型ERNIETiny轻量模型情感分析文本匹配文本审核信息抽取阅读理解问答匹配文本增强微调工具文本清洗模型蒸馏文本采样参数搜索编码转换一键式部署其他算法工具30+预训练模型20+数据处理工具20+基础开发工具20+数据标注90%投入算力90%开发时长85%全功能AI开发平台BML的核心优势二:预置高性能AI套件BML预置了两个核心的高性能AI套件。其中一个是高性能的机

126、器学习套件,用于数据分析机器学习场景下的加速,并且其接口具有很强的兼容性(如图5.2-7所示)。使用高性能的机器学习套件,相比其他开源工具平均加速高达6倍以上。自动数据增强有效提升模型效果(图5.2-6)自动数据增强剪切随机遮挡模型数度Base自动数据增强10.950.90.850.80.750.70.650.6珠宝品类识别集装箱卡车号牌识别香烟过滤嘴质检BML线上多场景模型精度平均提升7%以上 开放超过40种算子,灵活配置 工业级搜索算法,搜索效率更高BML 高性能 AI 套件高性能单机引擎(图5.2-7)测试环境:CPU 28逻辑核,intel(R)Xeon(R);Gold 5117 CP

127、U 2.00GHz;内存:256G;GPU:7卡 Tesla P40;显存:24G;五个场景取自 Kaggle 上公开数据集0500025003000相比开源工具平均加速6倍以上pandas+sklearn airlinenyc_ taxiusa_ incomefb_ biddingpilot awareness高性能单机引擎 数据分析、机器学习场景下的加速10倍于开源工具的数据处理能力兼容 Pandas/sklearn/SQL 接口“云智一体”技术与应用解析 企业AI开发篇3839BML预置的第二个核心套件,是飞桨文心ERNIE开发套件,飞桨的可持续学习语义学习模型(如

128、图5.2-8所示)。除此之外还提供三十多个算法工具,二十多个细化的预训练模型,二十多个数据处理的工具和二十多个基础开发的工具,使整个数据标注投入的算法、开发时长都有大幅度降低,效率大幅度提升。此外,BML还具有数据优化和增强的功能,开放超过40种算子和工业级的算法,有效提升模型效果(如图5.2-6所示)。例如对于苹果物体,BML可实现对它进行自动的剪切、平移、旋转、对比度、反色等处理,让这样单一的样本,自动扩展出多个不同维度的样本。实现小数据量的模型训练也能得到较丰富的效果,使多个场景的平均精度提升7%以上。(图5.2-8)BML 高性能 AI 套件飞桨文心(ERNIE)NLP开发套件文本分类

129、ERNIE2.0通用模型ERNIEIE信息抽取模型ERNIETiny轻量模型情感分析文本匹配文本审核信息抽取阅读理解问答匹配文本增强微调工具文本清洗模型蒸馏文本采样参数搜索编码转换一键式部署其他算法工具30+预训练模型20+数据处理工具20+基础开发工具20+数据标注90%投入算力90%开发时长85%全功能AI开发平台BML的核心优势二:预置高性能AI套件BML预置了两个核心的高性能AI套件。其中一个是高性能的机器学习套件,用于数据分析机器学习场景下的加速,并且其接口具有很强的兼容性(如图5.2-7所示)。使用高性能的机器学习套件,相比其他开源工具平均加速高达6倍以上。自动数据增强有效提升模型

130、效果(图5.2-6)自动数据增强剪切随机遮挡模型数度Base自动数据增强10.950.90.850.80.750.70.650.6珠宝品类识别集装箱卡车号牌识别香烟过滤嘴质检BML线上多场景模型精度平均提升7%以上 开放超过40种算子,灵活配置 工业级搜索算法,搜索效率更高BML 高性能 AI 套件高性能单机引擎(图5.2-7)测试环境:CPU 28逻辑核,intel(R)Xeon(R);Gold 5117 CPU 2.00GHz;内存:256G;GPU:7卡 Tesla P40;显存:24G;五个场景取自 Kaggle 上公开数据集0500025003000相比开源工具

131、平均加速6倍以上pandas+sklearn airlinenyc_ taxiusa_ incomefb_ biddingpilot awareness高性能单机引擎 数据分析、机器学习场景下的加速10倍于开源工具的数据处理能力兼容 Pandas/sklearn/SQL 接口“云智一体”技术与应用解析 企业AI开发篇3839全功能AI开发平台BML的核心优势四:提供软硬一体的国产化解决方案BML全面支持从国产深度学习框架飞桨,到麒麟等国产操作系统,再到国产CPU和GPU以及长城、曙光、联想、浪潮推出的各类硬件形态,构成了一套自主可控、适配广泛的AI开发及部署方案(如图5.2-10所示)。其中,

132、百度自研基于天蝎的整机柜方案,对功耗、性能、散热都做了非常多的优化,并通过模型加密、代码加固、TPM可信鉴权、主机防护等方式强化了安全保障。(图5.2-10)BML 一体机-自主可控 适配广泛基于天蝎提供整机柜方案(长城、曙光、联想、浪潮)提供通用机架式服务器方案CPU(飞腾、申威、鲲鹏、海光)ASIC/FPGA(百度昆仑、比特大陆、寒武纪)GPU(英伟达)(长城、曙光、联想、浪潮)安全能力模型加密代码加固TPM可信鉴权主机防护硬件形态算力支撑深度学习框架(PaddlePaddle)操作系统(麒麟、统信)企业AI能力生产与集中化管理平台:AI中台 全功能AI开发平台BML的核心优势三:灵活交付

133、BML有四种满足不同需求的交付方式,包括公有云、私有云、混合云、一体机(如图5.2-9所示)。(图5.2-9)BML 灵活交付部署-四种选择满足不同需求混合云弹性伸缩私有云灵活集成公有云按需付费一体机即插即用“云智一体”技术与应用解析 企业AI开发篇4041全功能AI开发平台BML的核心优势四:提供软硬一体的国产化解决方案BML全面支持从国产深度学习框架飞桨,到麒麟等国产操作系统,再到国产CPU和GPU以及长城、曙光、联想、浪潮推出的各类硬件形态,构成了一套自主可控、适配广泛的AI开发及部署方案(如图5.2-10所示)。其中,百度自研基于天蝎的整机柜方案,对功耗、性能、散热都做了非常多的优化,

134、并通过模型加密、代码加固、TPM可信鉴权、主机防护等方式强化了安全保障。(图5.2-10)BML 一体机-自主可控 适配广泛基于天蝎提供整机柜方案(长城、曙光、联想、浪潮)提供通用机架式服务器方案CPU(飞腾、申威、鲲鹏、海光)ASIC/FPGA(百度昆仑、比特大陆、寒武纪)GPU(英伟达)(长城、曙光、联想、浪潮)安全能力模型加密代码加固TPM可信鉴权主机防护硬件形态算力支撑深度学习框架(PaddlePaddle)操作系统(麒麟、统信)企业AI能力生产与集中化管理平台:AI中台 全功能AI开发平台BML的核心优势三:灵活交付BML有四种满足不同需求的交付方式,包括公有云、私有云、混合云、一体

135、机(如图5.2-9所示)。(图5.2-9)BML 灵活交付部署-四种选择满足不同需求混合云弹性伸缩私有云灵活集成公有云按需付费一体机即插即用“云智一体”技术与应用解析 企业AI开发篇4041在上述介绍的发展过程中,特别是从一个单点垂直场景的应用探索发展到多个业务场景的全面升级过程中,企业往往会面临来自AI能力的生产、应用和运维等方面的管理问题(如图6-2所示),例如数据、算力、算法等AI时代的核心资产的管理和共享,有时候会面临着核心资源形成孤岛、无法实现及时的构建和共享,从而影响企业的核心经验和资产的沉淀。另外,跨业务场景的AI能力的共用和统一升级也会面临困难。最后,当企业建立多个智能应用的时

136、候,这些智能应用由于分散部署、分散运维,从而带来一些资源调配上的难题。这些问题往往会导致企业的开发经验和技术能力难以快速复用和沉淀,从而影响整个企业智能化转型和升级的进程。(图6-1)企业智能化升级的发展路径第一阶段应用探索第二阶段垂直深化第三阶段全面升级第四阶段持续创新企业智能化升级的发展路径往往会经历四个阶段(如图6-1所示):第一阶段是应用探索,即对单点AI的应用探索。第二阶段是垂直深化,即在某一个业务场景中垂直深化的AI技术应用。第三阶段是全面升级阶段,从探索阶段发展到在多个业务场景、业务流程各个环节中的全面升级,最后进入到第四个阶段,持续创新的阶段。AI中台正是以上问题的解决方案,即

137、为企业构建一套AI能力的生产和集中化管理的平台(如图6-3所示)。AI中台的核心包括了AI能力引擎、AI开发平台两部分。再结合与之配套的完善的数据管理、服务管理、全线资源运维管理体系,帮助企业构建一套智能化升级的基础设施,通过这样的基础设施帮助企业实现集约化的AI能力的管理,实现统筹化的企业智能化升级。AI能力引擎,是AI中台的核心模块之一。百度智能云结合业务实践,沉淀了超过330项AI技术能力和方案(如图6-4所示),这些技术能力和方案,通过即拿即用的便利服务形态,并且结合产业的实际场景提供了多种形态的灵活部署方案,从而支撑企业在这基础之上构建多样化的场景应用。(图6-3)AI中台为企业构建

138、智能化升级必备的基础设施企业AI能力的生产和集中化管理平台统筹企业智能化升级集约化管理企业AI能力企业专属人工智能平台AI能力引擎AI开发平台人脸图像OCR数据管理服务管理权限管理资源管理运维管理视频语音ARNLP场景化定制平台KGEasyDLBML(图6-2)企业智能化升级发展过程中的管理痛点痛点AI能力的运维数据、模型的管理与共享AI服务运行情况监控不同厂商、不同来源的模型难以集中管理多个智能应用的统一运维和资源调配存在困难痛点AI能力的应用模型部署与优化场景化应用建设采购第三方的模型,后期难以自主优化跨业务场景的AI能力共用和统一升级,实现难度高痛点AI能力的生产采购第三方模型自主开发模

139、型数据、算力、算法模型等核心资产形成孤岛,资源利用效率低出现重复建设,难以形成经验沉淀,实现共建共享“云智一体”技术与应用解析 企业AI开发篇4243在上述介绍的发展过程中,特别是从一个单点垂直场景的应用探索发展到多个业务场景的全面升级过程中,企业往往会面临来自AI能力的生产、应用和运维等方面的管理问题(如图6-2所示),例如数据、算力、算法等AI时代的核心资产的管理和共享,有时候会面临着核心资源形成孤岛、无法实现及时的构建和共享,从而影响企业的核心经验和资产的沉淀。另外,跨业务场景的AI能力的共用和统一升级也会面临困难。最后,当企业建立多个智能应用的时候,这些智能应用由于分散部署、分散运维,

140、从而带来一些资源调配上的难题。这些问题往往会导致企业的开发经验和技术能力难以快速复用和沉淀,从而影响整个企业智能化转型和升级的进程。(图6-1)企业智能化升级的发展路径第一阶段应用探索第二阶段垂直深化第三阶段全面升级第四阶段持续创新企业智能化升级的发展路径往往会经历四个阶段(如图6-1所示):第一阶段是应用探索,即对单点AI的应用探索。第二阶段是垂直深化,即在某一个业务场景中垂直深化的AI技术应用。第三阶段是全面升级阶段,从探索阶段发展到在多个业务场景、业务流程各个环节中的全面升级,最后进入到第四个阶段,持续创新的阶段。AI中台正是以上问题的解决方案,即为企业构建一套AI能力的生产和集中化管理

141、的平台(如图6-3所示)。AI中台的核心包括了AI能力引擎、AI开发平台两部分。再结合与之配套的完善的数据管理、服务管理、全线资源运维管理体系,帮助企业构建一套智能化升级的基础设施,通过这样的基础设施帮助企业实现集约化的AI能力的管理,实现统筹化的企业智能化升级。AI能力引擎,是AI中台的核心模块之一。百度智能云结合业务实践,沉淀了超过330项AI技术能力和方案(如图6-4所示),这些技术能力和方案,通过即拿即用的便利服务形态,并且结合产业的实际场景提供了多种形态的灵活部署方案,从而支撑企业在这基础之上构建多样化的场景应用。(图6-3)AI中台为企业构建智能化升级必备的基础设施企业AI能力的生

142、产和集中化管理平台统筹企业智能化升级集约化管理企业AI能力企业专属人工智能平台AI能力引擎AI开发平台人脸图像OCR数据管理服务管理权限管理资源管理运维管理视频语音ARNLP场景化定制平台KGEasyDLBML(图6-2)企业智能化升级发展过程中的管理痛点痛点AI能力的运维数据、模型的管理与共享AI服务运行情况监控不同厂商、不同来源的模型难以集中管理多个智能应用的统一运维和资源调配存在困难痛点AI能力的应用模型部署与优化场景化应用建设采购第三方的模型,后期难以自主优化跨业务场景的AI能力共用和统一升级,实现难度高痛点AI能力的生产采购第三方模型自主开发模型数据、算力、算法模型等核心资产形成孤岛

143、,资源利用效率低出现重复建设,难以形成经验沉淀,实现共建共享“云智一体”技术与应用解析 企业AI开发篇4243AI开发双平台,是AI中台的另一个核心模块。百度基于产业实践的经验,创新性的推出了EasyDL+BML双平台的AI开发模式,通过双平台的模式进一步拓展了AI模型开发的人群,极大的降低了整个AI开发过程的门槛和成本。同时面向一些垂直化的场景,百度AI中台提供了场景化的定制平台,例如对于对话场景,提供了智能对话定制服务平台UNIT,帮助企业快速实现对话、问答等一些智能AI能力的生产和构建;再如对于文档分析的场景,AI中台提供了智能文档分析平台TextMind,帮助企业快速实现包括定制化文档

144、的信息抽取、解析、比对等多样化基于文档分析的场景应用。(如图6-5所示)全面、领先的AI能力引擎,支撑多样化场景应用(图6-4)(图6-5)多模式AI开发平台,助力AI能力的高效生产面向 AI 应用开发者面向 AI 算法开发者AI开发双平台EasyDLBML零门槛全功能智能对话定制与服务平台智能文档分析平台场景化定制平台UNITTextMind对话场景文档场景语音视觉短语音识别极速版实时语音识别音频文件转写在线合成-基础音库语音自训练平台呼叫中心语音解决方案鸿鹄语音芯片短语音识别在线合成-精品音库语音合成语音硬件远场语音识别离线语音合成语音识别办公文档营业执照公式护照银行卡港澳通行证名片户口本

145、出生证明仪器仪表网络图片文字识别通用票据彩票二维码定额发票火车票出租车票数字通用机打手写通用高精度含位置通用文字识别智能结构化识别文字识别通用含位置文字识别通用高精度文字识别试卷分析医疗发票增值税表格行驶证驾驶证台湾通行证身份证保险单银行汇票车辆合格证车牌VIN码机动车发票OCR自训练行程单活体检测人脸搜索人脸对比医美特效人脸识别3D模型生成人脸属性情绪识别人脸关键点人脸检测AR人脸特效皮肤分析自然语言处理与知识图谱语种识别通用/垂类翻译语音/拍照翻译AI同传机器翻译事件属性抽取事件图谱资讯事件判别事件相似度语言处理应用技术语言处理基础技术对话情绪识别评论观点抽取文章分类情感倾向分析文本纠错文

146、本/词义相似度词法/句法分析文本审核地址识别词向量表示DNN语言模型文章标签新闻摘要动物识别植物识别菜品识别快消商品检测地标识别花卉识别通用物体场景果蔬食材识别图像识别LOGO识别图像主体检测货币识别红酒识别虚拟换妆人脸融合人像互动车流统计车型识别属性识别人像动漫化美颜滤镜车辆分割车辆分析美发染色虚拟形象损伤识别车辆检测图像搜索无损放大图像去雾图像色彩增强图像对比度增强拉升图恢复商品图检索绘本图检索天空分割图像效果增强相同图检索相似图检索图像风格转换黑白图像上色作文检索汉语检索知识理解智能招聘/合同智能创作BGraph知识问答实体标注图数据库场景方案与平台TextMind图像审核手势识别手部关

147、键点驾驶行为分析图像质量检测危险行为识别人体分析人体关键点人像分割公众人物识别图文审核人流量统计人体检测/属性恶心/广告/水印色情/暴恐/政敏“云智一体”技术与应用解析 企业AI开发篇4445AI开发双平台,是AI中台的另一个核心模块。百度基于产业实践的经验,创新性的推出了EasyDL+BML双平台的AI开发模式,通过双平台的模式进一步拓展了AI模型开发的人群,极大的降低了整个AI开发过程的门槛和成本。同时面向一些垂直化的场景,百度AI中台提供了场景化的定制平台,例如对于对话场景,提供了智能对话定制服务平台UNIT,帮助企业快速实现对话、问答等一些智能AI能力的生产和构建;再如对于文档分析的场

148、景,AI中台提供了智能文档分析平台TextMind,帮助企业快速实现包括定制化文档的信息抽取、解析、比对等多样化基于文档分析的场景应用。(如图6-5所示)全面、领先的AI能力引擎,支撑多样化场景应用(图6-4)(图6-5)多模式AI开发平台,助力AI能力的高效生产面向 AI 应用开发者面向 AI 算法开发者AI开发双平台EasyDLBML零门槛全功能智能对话定制与服务平台智能文档分析平台场景化定制平台UNITTextMind对话场景文档场景语音视觉短语音识别极速版实时语音识别音频文件转写在线合成-基础音库语音自训练平台呼叫中心语音解决方案鸿鹄语音芯片短语音识别在线合成-精品音库语音合成语音硬件

149、远场语音识别离线语音合成语音识别办公文档营业执照公式护照银行卡港澳通行证名片户口本出生证明仪器仪表网络图片文字识别通用票据彩票二维码定额发票火车票出租车票数字通用机打手写通用高精度含位置通用文字识别智能结构化识别文字识别通用含位置文字识别通用高精度文字识别试卷分析医疗发票增值税表格行驶证驾驶证台湾通行证身份证保险单银行汇票车辆合格证车牌VIN码机动车发票OCR自训练行程单活体检测人脸搜索人脸对比医美特效人脸识别3D模型生成人脸属性情绪识别人脸关键点人脸检测AR人脸特效皮肤分析自然语言处理与知识图谱语种识别通用/垂类翻译语音/拍照翻译AI同传机器翻译事件属性抽取事件图谱资讯事件判别事件相似度语言

150、处理应用技术语言处理基础技术对话情绪识别评论观点抽取文章分类情感倾向分析文本纠错文本/词义相似度词法/句法分析文本审核地址识别词向量表示DNN语言模型文章标签新闻摘要动物识别植物识别菜品识别快消商品检测地标识别花卉识别通用物体场景果蔬食材识别图像识别LOGO识别图像主体检测货币识别红酒识别虚拟换妆人脸融合人像互动车流统计车型识别属性识别人像动漫化美颜滤镜车辆分割车辆分析美发染色虚拟形象损伤识别车辆检测图像搜索无损放大图像去雾图像色彩增强图像对比度增强拉升图恢复商品图检索绘本图检索天空分割图像效果增强相同图检索相似图检索图像风格转换黑白图像上色作文检索汉语检索知识理解智能招聘/合同智能创作BGr

151、aph知识问答实体标注图数据库场景方案与平台TextMind图像审核手势识别手部关键点驾驶行为分析图像质量检测危险行为识别人体分析人体关键点人像分割公众人物识别图文审核人流量统计人体检测/属性恶心/广告/水印色情/暴恐/政敏“云智一体”技术与应用解析 企业AI开发篇4445除此之外,AI中台还提供了一套完善的管理功能与机制(如图6-7所示),全面提升企业运营的效能。(图6-7)完善的管理功能与机制全面提升企业运营效能AI中台是企业IT的智能中枢正是这样一套AI能力的生产和集中化管理的平台,作为企业IT的智能中枢,能够有效的帮助企业高效实现AI能力的生产、实现集中化管理(如图6-6所示)。(图6

152、-6)企业中台业务中台客服中台AI中台 服务中心通用AI能力专用AI能力预测执行前台业务应用智能巡检安全生产监控智能质检智能风控智能营销办公管理财务管理对内管理应用财务中台运营中台数据存储开发中心训练调试模型中心私有云PaaS镜像管理中间件服务资源管理计算服务监控告警网络服务服务管理存储服务集群管理备份服务IaaS预测执行预测执行知识运用知识生产知识获取知识组织知识应用知识中台数据服务数据分析存储计算数据资产数据中台数据中心这套管理功能与机制包括三个方面。首先,是对资产的纳管,包括数据、算法、模型的统一管理和共享,通过构建基础设施帮助企业实现核心资产和经验的沉淀和复用,从而构建企业核心竞争力。

153、其次,是统一服务,AI中台帮助企业构建集合通用AI能力、场景化AI能力为一体的统一服务平台,提供对AI服务的统一管理、注册、接入、分发的全流程机制,从而实现便捷、灵活地支撑上层应用的快速接入。最后,是统一运维,帮助企业实现AI服务的统一监控,以及资源的统一分配和调度。因此,AI中台作为企业IT的智能中枢,连通了企业内部的数据、知识和业务,使企业能够更快更高效地支撑上层智能化业务的应用和智能化业务的创新。资产纳管数据、算法、模型的统一 管理和共享统一服务通用AI能力、场景化AI能力,统一服务平台统一运维统一的服务监控资源分配与调度综上所述,百度智能云AI中台,作为企业智能中枢,能够为企业带来三个

154、方面的显著价值(如图6-8所示):第一点,集约化管理,包括模型统一纳管、样本数据集中管理和算力资源的统筹调度。第二点,高效率生产,通过AI开发双平台,面向企业提供更低门槛上手、更多模式开发的高效率开发工具和生态环境。第三点,统筹化升级,帮助企业实现模型的持续应用、应用的持续集成、资产的共建共享,从而促进企业形成持续创新、不断迭代的自身演化能力。模型统一纳管样本集中管理资源统筹调度低门槛上手多模式开发高效率协同模型持续优化应用持续集成资产共建共享集约化管理高效率生产统筹化升级在实际落地过程中,AI中台结合行业场景的业务特点和发展状况,已形成多个行业的AI中台的解决方案。目前已经在媒体、金融、能源

155、、城市等多个领域沉淀了百度的行业AI中台方案(如图6-9所示)。例如金融领域,百度AI中台助力邮储银行成立了全行级的人中智能平台,也就是邮储大脑模块。再如在能源领域,百度AI中台帮助山东电力构建了样本管理、模型管理、开发训练平台、服务运行平台等一套基础设施。(图6-8)AI中台作为企业智能中枢,驱动智能化业务创新“云智一体”技术与应用解析 企业AI开发篇4647除此之外,AI中台还提供了一套完善的管理功能与机制(如图6-7所示),全面提升企业运营的效能。(图6-7)完善的管理功能与机制全面提升企业运营效能AI中台是企业IT的智能中枢正是这样一套AI能力的生产和集中化管理的平台,作为企业IT的智

156、能中枢,能够有效的帮助企业高效实现AI能力的生产、实现集中化管理(如图6-6所示)。(图6-6)企业中台业务中台客服中台AI中台 服务中心通用AI能力专用AI能力预测执行前台业务应用智能巡检安全生产监控智能质检智能风控智能营销办公管理财务管理对内管理应用财务中台运营中台数据存储开发中心训练调试模型中心私有云PaaS镜像管理中间件服务资源管理计算服务监控告警网络服务服务管理存储服务集群管理备份服务IaaS预测执行预测执行知识运用知识生产知识获取知识组织知识应用知识中台数据服务数据分析存储计算数据资产数据中台数据中心这套管理功能与机制包括三个方面。首先,是对资产的纳管,包括数据、算法、模型的统一管

157、理和共享,通过构建基础设施帮助企业实现核心资产和经验的沉淀和复用,从而构建企业核心竞争力。其次,是统一服务,AI中台帮助企业构建集合通用AI能力、场景化AI能力为一体的统一服务平台,提供对AI服务的统一管理、注册、接入、分发的全流程机制,从而实现便捷、灵活地支撑上层应用的快速接入。最后,是统一运维,帮助企业实现AI服务的统一监控,以及资源的统一分配和调度。因此,AI中台作为企业IT的智能中枢,连通了企业内部的数据、知识和业务,使企业能够更快更高效地支撑上层智能化业务的应用和智能化业务的创新。资产纳管数据、算法、模型的统一 管理和共享统一服务通用AI能力、场景化AI能力,统一服务平台统一运维统一

158、的服务监控资源分配与调度综上所述,百度智能云AI中台,作为企业智能中枢,能够为企业带来三个方面的显著价值(如图6-8所示):第一点,集约化管理,包括模型统一纳管、样本数据集中管理和算力资源的统筹调度。第二点,高效率生产,通过AI开发双平台,面向企业提供更低门槛上手、更多模式开发的高效率开发工具和生态环境。第三点,统筹化升级,帮助企业实现模型的持续应用、应用的持续集成、资产的共建共享,从而促进企业形成持续创新、不断迭代的自身演化能力。模型统一纳管样本集中管理资源统筹调度低门槛上手多模式开发高效率协同模型持续优化应用持续集成资产共建共享集约化管理高效率生产统筹化升级在实际落地过程中,AI中台结合行

159、业场景的业务特点和发展状况,已形成多个行业的AI中台的解决方案。目前已经在媒体、金融、能源、城市等多个领域沉淀了百度的行业AI中台方案(如图6-9所示)。例如金融领域,百度AI中台助力邮储银行成立了全行级的人中智能平台,也就是邮储大脑模块。再如在能源领域,百度AI中台帮助山东电力构建了样本管理、模型管理、开发训练平台、服务运行平台等一套基础设施。(图6-8)AI中台作为企业智能中枢,驱动智能化业务创新“云智一体”技术与应用解析 企业AI开发篇4647百度在多个行业落地AI中台解决方案的过程中发现,企业AI中台的建设,不是一蹴而就的过程,而是一个持续建设、共同运营的过程。这个过程不仅包括基础设施

160、的构建,也包括企业内的组织能力的建设、运营和优化工作(如图6-10所示)。这其中的每一个环节,都需要百度和企业客户投入大量精力,因此,百度一直致力于和企业客户一起不断地共同努力,持续创新,帮助企业实现智能化的升级。AI中台体系建设方法论,持续建设共同运营(图6-9)百度AI中台行业落地方案AI中台软件基础应用集成业务应用集成基础设施构建CBA应用场景分析场景数据积累模型训练持续优化共建共享持续运营优化组织变革流程创新人才培养组织能力建设(图6-10)云智一体AI开发全栈模式的行业实践 “云智一体”技术与应用解析 企业AI开发篇4849百度在多个行业落地AI中台解决方案的过程中发现,企业AI中台

161、的建设,不是一蹴而就的过程,而是一个持续建设、共同运营的过程。这个过程不仅包括基础设施的构建,也包括企业内的组织能力的建设、运营和优化工作(如图6-10所示)。这其中的每一个环节,都需要百度和企业客户投入大量精力,因此,百度一直致力于和企业客户一起不断地共同努力,持续创新,帮助企业实现智能化的升级。AI中台体系建设方法论,持续建设共同运营(图6-9)百度AI中台行业落地方案AI中台软件基础应用集成业务应用集成基础设施构建CBA应用场景分析场景数据积累模型训练持续优化共建共享持续运营优化组织变革流程创新人才培养组织能力建设(图6-10)云智一体AI开发全栈模式的行业实践 “云智一体”技术与应用解

162、析 企业AI开发篇48497.1 打造国网人工智能平台,推动电网智能化应用人工智能、云计算等技术在能源行业的规模化应用正在加速。随着电网数字化和信息化技术日渐成熟,发、输、配、用各环节数据均已实现有效采集。然而,剧增的数据量如何更高效的分析、处理、匹配,并进行更深入的挖掘和创造新的价值,这些问题也成为了中国电科院人工智能所平台室主任王晓辉日常探索的方向。2020年,国网公司提出建成具有中国特色国际领先的能源互联网企业的战略目标(如图7.1-1所示)。基于这个战略目标,需要实现电网、企业管理以及客户服务的数字化的转型。在2020年7月,国网公司召开了一次云签约的仪式,与国内包括百度在内的多家互联

163、网企业,签署战略合作协议,发布了数字新基建的十项重大任务。其中,在人工智能方面提出要构建电力人工智能平台,助力十三个典型场景的应用。在国网公司制定十四五发展规划的过程中,也对人工智能方面提出要求,包括突破人工智能的关键技术,包括开展典型的应用示范,以及在后续构建和推广智能的电力应用系统。国网公司战略(图7.1-1)战略目标0104国网公司“十四五”科技规划突破基础支撑技术开展典型应用示范开发业务智能化系统建设标准体系0302“数字新基建”重点建设任务电力人工智能开放平台样本库、模型库和训练平台运维、调试、客服等13类典型应用“2020年至2025年,基本建成具有中国特色国际领先的能源互联网企业

164、,智能化数字化水平显著提升,能源互联网功能形态作用彰显。”国家电网公司响应国家发展新一代人工智能的号召,落实中央关于加快新型基础设施建设的决策部署,从公司战略、重点建设任务、科研规划等多角度引导和推动电力人工智能工作布局步伐。人工智能技术对于解决能源互联网所含有的非线性、不确定性、强耦合性、多变量等特点的问题具有天然优势,是能源互联网的必然选择。嘉宾王晓辉在百度智能云2021云智技术论坛AI开发专场中分享指出:对于组织架构庞大,分支机构众多的电力行业,针对“智慧化”“智能化”的建设,更需要从全局来思考与部署。通过调研发现,国网智能化存在以下问题:首先,存在单点建设的问题,缺乏体系化。第二,有些

165、智能电网应用对基础AI能力的实现不够充分。比如不同业务线在构建AI能力时会采购一些硬件来实现,但实际上这些硬件不够灵活,在技术层面上无法满足业务需求。第三,则是对技术标准不够统一。例如在智能巡检的过程中,设备拍摄的方位、尺寸、关注点可能都不相同,而且拍完的照片在标注层面有时也没形成统一的规范。这样就导致针对同样的场景,训练出的模型不能共享使用等问题。最后,因为电力行业属于传统行业,缺乏对人工智能方面的专业技术人才,需要实现电力人员更低门槛的使用和应用AI。针对这几方面的原因,基于百度AI中台构建的国网人工智能平台(如图7.1-2所示),主要解决了以下几方面问题:首先,构建了一套基础能力;其次,

166、打造了自动化、可视化的工具,能让有较少经验或者基本没接触人工智能的工作人员能充分的使用平台的能力;再者,沉淀了一些共性的模型服务,包括通用模型,例如图像识别、人脸识别、语音、文本、知识图谱相关的通用服务能力,并形成持续优化、持续迭代的过程。最后,基于这些服务能力,助力上层的业务应用。基于百度AI中台构建的国网人工智能中台(图7.1-2)服务公司变压器渗漏油识别线路金具缺销钉识别未戴安全帽违章识别计算机视觉图像识别视频分析自然语言处理信息检索问答对话智能语音语音识别语音合成知识图谱图谱构建图谱服务模型库模型管理镜像封装样本库样本标注样本管理人工智能平台模型训练模型部署图谱构建图谱服务客户工单分析

167、电力文本查看舆情分析预警客户语音质检变压器声纹识别设备故障诊断电网设备故障事件抽取电网事件演进关系抽取缺陷设备属性抽取设备运维电网调度客户服务安全管控CPU计算资源GPU计算资源存储资源网络资源国网云企业经营保障体系应用层服务政府服务客户人工智能中台服务层平台层安全防护人才队伍技术研究共建共享生态建设标准规范“云智一体”技术与应用解析 企业AI开发篇50517.1 打造国网人工智能平台,推动电网智能化应用人工智能、云计算等技术在能源行业的规模化应用正在加速。随着电网数字化和信息化技术日渐成熟,发、输、配、用各环节数据均已实现有效采集。然而,剧增的数据量如何更高效的分析、处理、匹配,并进行更深入

168、的挖掘和创造新的价值,这些问题也成为了中国电科院人工智能所平台室主任王晓辉日常探索的方向。2020年,国网公司提出建成具有中国特色国际领先的能源互联网企业的战略目标(如图7.1-1所示)。基于这个战略目标,需要实现电网、企业管理以及客户服务的数字化的转型。在2020年7月,国网公司召开了一次云签约的仪式,与国内包括百度在内的多家互联网企业,签署战略合作协议,发布了数字新基建的十项重大任务。其中,在人工智能方面提出要构建电力人工智能平台,助力十三个典型场景的应用。在国网公司制定十四五发展规划的过程中,也对人工智能方面提出要求,包括突破人工智能的关键技术,包括开展典型的应用示范,以及在后续构建和推

169、广智能的电力应用系统。国网公司战略(图7.1-1)战略目标0104国网公司“十四五”科技规划突破基础支撑技术开展典型应用示范开发业务智能化系统建设标准体系0302“数字新基建”重点建设任务电力人工智能开放平台样本库、模型库和训练平台运维、调试、客服等13类典型应用“2020年至2025年,基本建成具有中国特色国际领先的能源互联网企业,智能化数字化水平显著提升,能源互联网功能形态作用彰显。”国家电网公司响应国家发展新一代人工智能的号召,落实中央关于加快新型基础设施建设的决策部署,从公司战略、重点建设任务、科研规划等多角度引导和推动电力人工智能工作布局步伐。人工智能技术对于解决能源互联网所含有的非

170、线性、不确定性、强耦合性、多变量等特点的问题具有天然优势,是能源互联网的必然选择。嘉宾王晓辉在百度智能云2021云智技术论坛AI开发专场中分享指出:对于组织架构庞大,分支机构众多的电力行业,针对“智慧化”“智能化”的建设,更需要从全局来思考与部署。通过调研发现,国网智能化存在以下问题:首先,存在单点建设的问题,缺乏体系化。第二,有些智能电网应用对基础AI能力的实现不够充分。比如不同业务线在构建AI能力时会采购一些硬件来实现,但实际上这些硬件不够灵活,在技术层面上无法满足业务需求。第三,则是对技术标准不够统一。例如在智能巡检的过程中,设备拍摄的方位、尺寸、关注点可能都不相同,而且拍完的照片在标注

171、层面有时也没形成统一的规范。这样就导致针对同样的场景,训练出的模型不能共享使用等问题。最后,因为电力行业属于传统行业,缺乏对人工智能方面的专业技术人才,需要实现电力人员更低门槛的使用和应用AI。针对这几方面的原因,基于百度AI中台构建的国网人工智能平台(如图7.1-2所示),主要解决了以下几方面问题:首先,构建了一套基础能力;其次,打造了自动化、可视化的工具,能让有较少经验或者基本没接触人工智能的工作人员能充分的使用平台的能力;再者,沉淀了一些共性的模型服务,包括通用模型,例如图像识别、人脸识别、语音、文本、知识图谱相关的通用服务能力,并形成持续优化、持续迭代的过程。最后,基于这些服务能力,助

172、力上层的业务应用。基于百度AI中台构建的国网人工智能中台(图7.1-2)服务公司变压器渗漏油识别线路金具缺销钉识别未戴安全帽违章识别计算机视觉图像识别视频分析自然语言处理信息检索问答对话智能语音语音识别语音合成知识图谱图谱构建图谱服务模型库模型管理镜像封装样本库样本标注样本管理人工智能平台模型训练模型部署图谱构建图谱服务客户工单分析电力文本查看舆情分析预警客户语音质检变压器声纹识别设备故障诊断电网设备故障事件抽取电网事件演进关系抽取缺陷设备属性抽取设备运维电网调度客户服务安全管控CPU计算资源GPU计算资源存储资源网络资源国网云企业经营保障体系应用层服务政府服务客户人工智能中台服务层平台层安全

173、防护人才队伍技术研究共建共享生态建设标准规范“云智一体”技术与应用解析 企业AI开发篇5051通过基于百度AI中台构建的国网人工智能中台,国网实现了全流程协同的开发模式(如图7.1-3所示)。使得国网的模型开发人员、应用开发人员、业务应用人员,通过使用百度提供的基础能力和丰富的开发工具,以及各种接口服务的模式,具备了智能化的服务能力。嘉宾王晓辉同时介绍了人工智能在电力系统的一些典型应用场景(如图7.1-4所示),例如传统的大数据和机器学习技术,在分布式能源预测场景、包括数据治理、用户画像、设备画像等场景都有典型的应用;再如计算机视觉技术,在设备巡检、现场作业的安全管控、OCR文本识别方面应用广

174、泛;又如自然语言处理和知识图谱技术,在国网的企业内搜、构建电网一张图的管理、电网调度等场景已经成熟应用;最后,智能机器人技术也已在智能应答助手、带电作业机器人等场景进行实际使用。面向人工智能应用业务人员、模型开发人员、应用开发人员等不同用户,开展图像、视频、文本、语音等电力人工智能样本收集与标注、模型训练、模型评估,基于成熟模型为业务应用提供在线服务。多模式开发平台提升全流程协同效率(图7.1-3)应用步骤应用组件应用人员业务人员需求分析数据收集数据集入库样本标注样本库模型库人工智能平台(训练环境)样本入库样本调用算法选择模型训练模型评估模型服务业务系统应用开发人员模型开发人员数据预处理多人协

175、同标注数据集管理标注质量校对可视化模型训练模型管理模型封装模型部署人工智能平台(运动环境)资源配置服务管理服务监控标注质量校对算法管理人工智能在电力系统的应用场景(图7.1-4)其中,在输电巡检场景中,联研院、中国电科院等单位攻克图像识别等关键技术,形成了覆盖输电线路本体和通道巡视的8大类29小类缺陷的智能分析模型,并通过国网云平台实现了全公司范围内的输电线路人工智能图像识别云服务,已在国网公司27个省、约300个地级市单位试点应用,获得广泛认可和好评(如图7.1-5所示)。为解决输电线路分布广泛、户外环境复杂,人工巡视工作繁重的问题,联研院、中国电科院等单位攻克图像识别等关键技术,形成覆盖输

176、电线路本体和通道巡视的8大类29小类缺陷的智能分析模型,并通过国网云平台实现全公司范围内的输电线路人工智能图像识别云服务,已在公司27个省,约300个地级市单位试点应用,获得广泛认可和好评。输电设备巡检(图7.1-5)日均检测图片数量超过5000张累计发现隐患7000处常见典型缺陷识别率达到 94%运行效率是传统人工查缺方式的60倍每月节省人力成本480万元本体巡视通道巡视烟火施工机械闯入导地线断股销钉缺失机器学习计算机视觉自然语言处理电力智能机器人发电输变电配用电电网安全与控制企业经营管理服务政府社会灾害预报光伏功率预测光伏板清扫风电场巡视无人机巡线绝缘漆喷涂变电站巡检配网带电作业营业厅导航

177、调度智能助手RPA流程自动化应急抢修指挥主设备状态评价作业现场预警人员姿态检测应急指挥抢修智慧客户服务电网状态全息感知现场安全作业管控电网调度系统决策二次设备状态评价电网事故智能处置上下游用户画像综合能源服务智慧物资管控OCR文档处理财务智能管控企业知识库电力复工复产征信信贷电力天眼政务一站式服务支撑智慧城市用电服务指南分布式电源功率预测光伏风机主动运维本体与输电通道检测变电站智能监测运维营配调贯通治理配网重过载预警用电行为分析调度监控自动预警源网荷储协同分析人在回路混合增强电网一张图主设备缺陷智能分析“云智一体”技术与应用解析 企业AI开发篇5253通过基于百度AI中台构建的国网人工智能中台

178、,国网实现了全流程协同的开发模式(如图7.1-3所示)。使得国网的模型开发人员、应用开发人员、业务应用人员,通过使用百度提供的基础能力和丰富的开发工具,以及各种接口服务的模式,具备了智能化的服务能力。嘉宾王晓辉同时介绍了人工智能在电力系统的一些典型应用场景(如图7.1-4所示),例如传统的大数据和机器学习技术,在分布式能源预测场景、包括数据治理、用户画像、设备画像等场景都有典型的应用;再如计算机视觉技术,在设备巡检、现场作业的安全管控、OCR文本识别方面应用广泛;又如自然语言处理和知识图谱技术,在国网的企业内搜、构建电网一张图的管理、电网调度等场景已经成熟应用;最后,智能机器人技术也已在智能应

179、答助手、带电作业机器人等场景进行实际使用。面向人工智能应用业务人员、模型开发人员、应用开发人员等不同用户,开展图像、视频、文本、语音等电力人工智能样本收集与标注、模型训练、模型评估,基于成熟模型为业务应用提供在线服务。多模式开发平台提升全流程协同效率(图7.1-3)应用步骤应用组件应用人员业务人员需求分析数据收集数据集入库样本标注样本库模型库人工智能平台(训练环境)样本入库样本调用算法选择模型训练模型评估模型服务业务系统应用开发人员模型开发人员数据预处理多人协同标注数据集管理标注质量校对可视化模型训练模型管理模型封装模型部署人工智能平台(运动环境)资源配置服务管理服务监控标注质量校对算法管理人

180、工智能在电力系统的应用场景(图7.1-4)其中,在输电巡检场景中,联研院、中国电科院等单位攻克图像识别等关键技术,形成了覆盖输电线路本体和通道巡视的8大类29小类缺陷的智能分析模型,并通过国网云平台实现了全公司范围内的输电线路人工智能图像识别云服务,已在国网公司27个省、约300个地级市单位试点应用,获得广泛认可和好评(如图7.1-5所示)。为解决输电线路分布广泛、户外环境复杂,人工巡视工作繁重的问题,联研院、中国电科院等单位攻克图像识别等关键技术,形成覆盖输电线路本体和通道巡视的8大类29小类缺陷的智能分析模型,并通过国网云平台实现全公司范围内的输电线路人工智能图像识别云服务,已在公司27个

181、省,约300个地级市单位试点应用,获得广泛认可和好评。输电设备巡检(图7.1-5)日均检测图片数量超过5000张累计发现隐患7000处常见典型缺陷识别率达到 94%运行效率是传统人工查缺方式的60倍每月节省人力成本480万元本体巡视通道巡视烟火施工机械闯入导地线断股销钉缺失机器学习计算机视觉自然语言处理电力智能机器人发电输变电配用电电网安全与控制企业经营管理服务政府社会灾害预报光伏功率预测光伏板清扫风电场巡视无人机巡线绝缘漆喷涂变电站巡检配网带电作业营业厅导航调度智能助手RPA流程自动化应急抢修指挥主设备状态评价作业现场预警人员姿态检测应急指挥抢修智慧客户服务电网状态全息感知现场安全作业管控电

182、网调度系统决策二次设备状态评价电网事故智能处置上下游用户画像综合能源服务智慧物资管控OCR文档处理财务智能管控企业知识库电力复工复产征信信贷电力天眼政务一站式服务支撑智慧城市用电服务指南分布式电源功率预测光伏风机主动运维本体与输电通道检测变电站智能监测运维营配调贯通治理配网重过载预警用电行为分析调度监控自动预警源网荷储协同分析人在回路混合增强电网一张图主设备缺陷智能分析“云智一体”技术与应用解析 企业AI开发篇5253另外,在营销智能客服场景中,为应对客户日益增强的多元服务需求,国网通过构建电力客服领域知识图谱,在95598客服热线、国网信息系统等应用场景中,充分使用意图识别、自然语言理解、图

183、像识别等技术,建设了多渠道智能客服体系,为广大电力用户提供更高质量、高效率、便捷智能化的服务(如图7.1-6所示)。营销智能客服(图7.1-6)此外,在智能调度场景中,国网公司为解决电网调度的故障处置问题,基于知识图谱技术构建了电网故障处理系统和电网调控知识网络,实现故障处理动态知识路径的自动推理判断以及提供知识检索、问答及业务流程引导服务,知识问答准确率达到95%以上,辅助调度员进行调度运行的有效决策,有效增强了调度人员的电网事故处理能力,显著提升了电网事故管控水平(如图7.1-7所示)。为应对客户多元服务需求的日益增强,国网客服中心通过构建电力客服领域知识图谱,利用意图识别、自然语言理解、

184、图像识别等技术,建设了多渠道智能客服体系,为广大电力用户提供更高质量、高效率、便捷智能化的服务。营业厅机器人智能语音人工替代率44.88%智能在线人工替代率56.78%智能答复答复率90%95598电话客服语音智能识别与服务推荐公众号客服机器人有效分流降低成本分流人工话务量减少人工座席需求量降低人力成本余额查询密码查询密码重置密码重置电费查询突发故障交费最后,嘉宾王晓辉介绍,在电力人工智能发展方面,国家电网公司提出了电力人工智能发展路线,从基础支撑和应用层面阐明前沿技术、业务融合攻关方向,实现电网核心业务的人工智能常态化决策,迈入智慧能源系统发展期。并指出电力人工智能的未来发展路线主要有两个阶

185、段性目标。第一个阶段目标,在2035年之前实现电网的数字化转型和智能化跨越,实现电网整个业务的数字化转型,同时将包括深度学习、强化学习、群体智能等相关的技术,纳入到整个电网运行的过程中。第二个阶段目标,远期目标要实现整体电网运行的全智能化,把人工智能作为工具,全面融入到电网的运行过程中。国家电网也会加大人工智能方面技术的研发和应用的力度,也希望一方面跟百度继续开展合作,在相关的前沿技术的攻关方面去进行合作、研发;另一方面也希望有更多的合作伙伴能和我们一起助力电网的智能化应用。(如图7.1-8所示)为解决电网调度的故障处置问题,基于知识图谱构建电网故障处理系统,基于电力本体知识图谱建立统一的调控

186、知识网络,实现故障处理动态知识路径的自动推理判断以及提供知识检索、问答及业务流程引导服务,有效增强了调度人员的电网事故处理能力,提升了电网事故管控水平。调度故障智能处置(图7.1-7)基于知识图谱的调度知识库知识问答准确率95%以上,知识检索准确率98%以上电网故障判断与处置效率提升20%以上基于知识图谱的电网故障处理系统界面“云智一体”技术与应用解析 企业AI开发篇5455另外,在营销智能客服场景中,为应对客户日益增强的多元服务需求,国网通过构建电力客服领域知识图谱,在95598客服热线、国网信息系统等应用场景中,充分使用意图识别、自然语言理解、图像识别等技术,建设了多渠道智能客服体系,为广

187、大电力用户提供更高质量、高效率、便捷智能化的服务(如图7.1-6所示)。营销智能客服(图7.1-6)此外,在智能调度场景中,国网公司为解决电网调度的故障处置问题,基于知识图谱技术构建了电网故障处理系统和电网调控知识网络,实现故障处理动态知识路径的自动推理判断以及提供知识检索、问答及业务流程引导服务,知识问答准确率达到95%以上,辅助调度员进行调度运行的有效决策,有效增强了调度人员的电网事故处理能力,显著提升了电网事故管控水平(如图7.1-7所示)。为应对客户多元服务需求的日益增强,国网客服中心通过构建电力客服领域知识图谱,利用意图识别、自然语言理解、图像识别等技术,建设了多渠道智能客服体系,为

188、广大电力用户提供更高质量、高效率、便捷智能化的服务。营业厅机器人智能语音人工替代率44.88%智能在线人工替代率56.78%智能答复答复率90%95598电话客服语音智能识别与服务推荐公众号客服机器人有效分流降低成本分流人工话务量减少人工座席需求量降低人力成本余额查询密码查询密码重置密码重置电费查询突发故障交费最后,嘉宾王晓辉介绍,在电力人工智能发展方面,国家电网公司提出了电力人工智能发展路线,从基础支撑和应用层面阐明前沿技术、业务融合攻关方向,实现电网核心业务的人工智能常态化决策,迈入智慧能源系统发展期。并指出电力人工智能的未来发展路线主要有两个阶段性目标。第一个阶段目标,在2035年之前实

189、现电网的数字化转型和智能化跨越,实现电网整个业务的数字化转型,同时将包括深度学习、强化学习、群体智能等相关的技术,纳入到整个电网运行的过程中。第二个阶段目标,远期目标要实现整体电网运行的全智能化,把人工智能作为工具,全面融入到电网的运行过程中。国家电网也会加大人工智能方面技术的研发和应用的力度,也希望一方面跟百度继续开展合作,在相关的前沿技术的攻关方面去进行合作、研发;另一方面也希望有更多的合作伙伴能和我们一起助力电网的智能化应用。(如图7.1-8所示)为解决电网调度的故障处置问题,基于知识图谱构建电网故障处理系统,基于电力本体知识图谱建立统一的调控知识网络,实现故障处理动态知识路径的自动推理

190、判断以及提供知识检索、问答及业务流程引导服务,有效增强了调度人员的电网事故处理能力,提升了电网事故管控水平。调度故障智能处置(图7.1-7)基于知识图谱的调度知识库知识问答准确率95%以上,知识检索准确率98%以上电网故障判断与处置效率提升20%以上基于知识图谱的电网故障处理系统界面“云智一体”技术与应用解析 企业AI开发篇5455国家电网公司提出了电力人工智能发展路线,从基础支撑和应用层面阐明前沿技术、业务融合攻关方向,实现电网核心业务的人工智能常态化决策,迈入智慧能源系统发展期。未来展望(图7.1-8)7.2 为陕西汉中插上翅膀,AI助力打赢精准脱贫战“伟大的时代造就伟大的事业,伟大的事业

191、造就伟大的人。”2021年3月27日,来北京参加“百度智能云2021云智技术论坛”的汉中市扶贫信息中心副主任刘乐,在活动现场分享过去一年“脱贫攻坚战”的创新经验时发出如此感慨。“1120个驻村工作队”、“产业扶贫项目3752个”、“覆盖贫困人口27.24万户”自2016年至今,汉中市累计脱贫52.4万人,并在全省的脱贫攻坚考核中取得了三连优。汉中的扶贫“攻坚战”打得响亮也艰辛。第一阶段第二阶段2035年2050年。发展路线基础理论群体智能混合增强智能跨媒体智能电网优化控制人机融合决策业务能力知识自主发现电网优化决策核心业务人工智能常态化决策基础与应用解决难题电网实现数字化转型和智能化跨越,数据

192、与知识融合的人工智能技术突破,实现能源互联网的运行自主优化与安全智能防御。电网全面数字化并实现核心业务的常态化人工智能决策。地处秦岭、巴山之间的陕西汉中,位于中国地理几何版图中心,又是三大经济圈的融合之地,四季分明、气侯宜人,是南水北调的水源涵养地。然而受自然条件等因素制约,人口居住分散、基础设施建设滞后、生产生活条件较差,增收难度大。汉中九县两区全部都曾纳入扶贫范围。嘉宾刘乐分享说:“我们在工作中发现了很多问题,比如基层工作效率不高、贫困人口识别不精准、填表造册多、工作难实时共享等。刚开始扶贫的时候他们称我们为表哥、表姐,因为我们整天在填表。我们后来推出了汉中市脱贫攻坚云计算平台,核心思想是

193、数据同源、信息共享,用到云计算、百度AI智能技术。”刘乐记得刚接到要“筛选22万户贫困户照片”的任务是2019年3月。“我们要通过照片筛选并标记出疑似饮水和住房不达标的所有居民,并要在当年10月前完成。我的第一反应就是留给我们的时间不多了!当时急得差点发动学生们帮我们人工筛选照片,后来我们就发现百度EasyDL它的低成本、易开发和零代码,成了我们整个项目的破题之选。”(如图7.2-1所示)(图7.2-1)为什么要引入AI贫困户“两不愁三保障”安全饮水、安全住房是两项核心指标,直接影响着脱贫成色,也是各级督导考核的重点,如何快速识别全市22.3万户贫困户饮水、房屋是否达标迫在眉睫。EasyDL的

194、低成本、易开发、零代码等优势成为了破题之选。饮水 房屋 家用电器 人居环境“云智一体”技术与应用解析 企业AI开发篇5657国家电网公司提出了电力人工智能发展路线,从基础支撑和应用层面阐明前沿技术、业务融合攻关方向,实现电网核心业务的人工智能常态化决策,迈入智慧能源系统发展期。未来展望(图7.1-8)7.2 为陕西汉中插上翅膀,AI助力打赢精准脱贫战“伟大的时代造就伟大的事业,伟大的事业造就伟大的人。”2021年3月27日,来北京参加“百度智能云2021云智技术论坛”的汉中市扶贫信息中心副主任刘乐,在活动现场分享过去一年“脱贫攻坚战”的创新经验时发出如此感慨。“1120个驻村工作队”、“产业扶

195、贫项目3752个”、“覆盖贫困人口27.24万户”自2016年至今,汉中市累计脱贫52.4万人,并在全省的脱贫攻坚考核中取得了三连优。汉中的扶贫“攻坚战”打得响亮也艰辛。第一阶段第二阶段2035年2050年。发展路线基础理论群体智能混合增强智能跨媒体智能电网优化控制人机融合决策业务能力知识自主发现电网优化决策核心业务人工智能常态化决策基础与应用解决难题电网实现数字化转型和智能化跨越,数据与知识融合的人工智能技术突破,实现能源互联网的运行自主优化与安全智能防御。电网全面数字化并实现核心业务的常态化人工智能决策。地处秦岭、巴山之间的陕西汉中,位于中国地理几何版图中心,又是三大经济圈的融合之地,四季

196、分明、气侯宜人,是南水北调的水源涵养地。然而受自然条件等因素制约,人口居住分散、基础设施建设滞后、生产生活条件较差,增收难度大。汉中九县两区全部都曾纳入扶贫范围。嘉宾刘乐分享说:“我们在工作中发现了很多问题,比如基层工作效率不高、贫困人口识别不精准、填表造册多、工作难实时共享等。刚开始扶贫的时候他们称我们为表哥、表姐,因为我们整天在填表。我们后来推出了汉中市脱贫攻坚云计算平台,核心思想是数据同源、信息共享,用到云计算、百度AI智能技术。”刘乐记得刚接到要“筛选22万户贫困户照片”的任务是2019年3月。“我们要通过照片筛选并标记出疑似饮水和住房不达标的所有居民,并要在当年10月前完成。我的第一

197、反应就是留给我们的时间不多了!当时急得差点发动学生们帮我们人工筛选照片,后来我们就发现百度EasyDL它的低成本、易开发和零代码,成了我们整个项目的破题之选。”(如图7.2-1所示)(图7.2-1)为什么要引入AI贫困户“两不愁三保障”安全饮水、安全住房是两项核心指标,直接影响着脱贫成色,也是各级督导考核的重点,如何快速识别全市22.3万户贫困户饮水、房屋是否达标迫在眉睫。EasyDL的低成本、易开发、零代码等优势成为了破题之选。饮水 房屋 家用电器 人居环境“云智一体”技术与应用解析 企业AI开发篇5657刘乐介绍,自己将零门槛开发平台EasyDL的开发过程总结为四个步骤:首先,进行照片筛选

198、,把认为有明显区别的200张照片上传到EasyDL平台。其次,进行不断优化和调整照片数量和照片内容。然后,为了提高准确率,同时使用EasyDL平台的“图像分类”和“物体检测”功能进行交叉比对来提高准确度。最后,检验模型实际效果。刘乐介绍通过四个步骤,真实的识别准确率高达85%以上。随后,汉中扶贫办信息中心还把AI的应用实践贯穿到整个脱贫攻坚的全过程:一方面,把识别出的数据上传到数据库,并为基层干部开发了一键筛查功能,比如让督导考核人员、模拟第三方评估人员,为他们提供数据线索。另一方面,是在引入家庭成员指数计算范围内,汉中扶贫办使用EasyDL设计了一套算法,通过这套算法,每一个贫困户得到一个值

199、,直观地呈现并分析他的贫困程度。这套算法一共涉及五十多项指标,而通过AI来获得数据的指标就有八项,还都是核心指标。通过对22万户进行计算,使用百度EasyDL点状图标注,得到贫困户家庭成员指数分布图,很大程度提高了精准扶贫的准确率。应用实践在使用了智能的AI分析后,汉中市扶贫办在当年就紧急将三千多户纳入到监测范围进行重点关注与帮扶。在工作重、任务紧的“攻坚战”中,优化资源的投入就是帮贫困户们抢时间、抢安全。此外,百度AI在房屋的裂缝识别、人居环境、饮水环境上的准确度在85%以上。2019年汉中扶贫办在引入百度AI之后,准确识别出部分贫困户的住房和安全饮水风险点,并推迟了一千多户贫困户的当年脱贫

200、计划,对三千多户纳入到监测范围进行重点关注,同时对AI发现的问题点进行再次复盘,发现与真实发现情况吻合达到80%以上。但脱贫摘帽不是终点,是新生活,也是新奋斗的起点。刘乐分享到:“下一步,我们已经有了数字乡村规划纲要,截止2025年一定要在数字乡村上取得重要进展。2050年全面完成数字乡村建设,助力乡村振兴。随着乡村振兴的开始,乡村治理能力和乡村数字化水平要有质的提高。近日,汉中已全面启动实施乡村振兴战略,列出任务图、时间表,着力实施“八大行动”、推动“七项改革”、强化“四个保障”,为“三农”加快发展、乡村全面振兴打造新的“助推器”和“加速器”,其中,如 AI 病虫害防治的智慧大棚建设、智慧城

201、市和乡村网格化管理建设等等,都已提上日程。(图7.2-3)应用成效百度AI人工智能图像识别技术对照村7条、户5条脱贫标准开展自动分析2019年,运用百度AI识别出部分贫困户住房和饮水尚存风险点,推迟1507人脱贫,纳入预警监测7733人。对运用百度AI、地图技术等分析的疑似问题进行针对性督导,问题吻合度达在80%以上。对帮扶干部上传的房屋、饮水、家居、环境照片进行扫描分 发 给 各 个 帮 扶 干部,提醒核查对裂缝住房、水源卫生条件差、生活环境恶劣等疑似不达标项自动筛查引入到家庭成员指数计算范畴(图7.2-2)“云智一体”技术与应用解析 企业AI开发篇5859刘乐介绍,自己将零门槛开发平台Ea

202、syDL的开发过程总结为四个步骤:首先,进行照片筛选,把认为有明显区别的200张照片上传到EasyDL平台。其次,进行不断优化和调整照片数量和照片内容。然后,为了提高准确率,同时使用EasyDL平台的“图像分类”和“物体检测”功能进行交叉比对来提高准确度。最后,检验模型实际效果。刘乐介绍通过四个步骤,真实的识别准确率高达85%以上。随后,汉中扶贫办信息中心还把AI的应用实践贯穿到整个脱贫攻坚的全过程:一方面,把识别出的数据上传到数据库,并为基层干部开发了一键筛查功能,比如让督导考核人员、模拟第三方评估人员,为他们提供数据线索。另一方面,是在引入家庭成员指数计算范围内,汉中扶贫办使用EasyDL

203、设计了一套算法,通过这套算法,每一个贫困户得到一个值,直观地呈现并分析他的贫困程度。这套算法一共涉及五十多项指标,而通过AI来获得数据的指标就有八项,还都是核心指标。通过对22万户进行计算,使用百度EasyDL点状图标注,得到贫困户家庭成员指数分布图,很大程度提高了精准扶贫的准确率。应用实践在使用了智能的AI分析后,汉中市扶贫办在当年就紧急将三千多户纳入到监测范围进行重点关注与帮扶。在工作重、任务紧的“攻坚战”中,优化资源的投入就是帮贫困户们抢时间、抢安全。此外,百度AI在房屋的裂缝识别、人居环境、饮水环境上的准确度在85%以上。2019年汉中扶贫办在引入百度AI之后,准确识别出部分贫困户的住

204、房和安全饮水风险点,并推迟了一千多户贫困户的当年脱贫计划,对三千多户纳入到监测范围进行重点关注,同时对AI发现的问题点进行再次复盘,发现与真实发现情况吻合达到80%以上。但脱贫摘帽不是终点,是新生活,也是新奋斗的起点。刘乐分享到:“下一步,我们已经有了数字乡村规划纲要,截止2025年一定要在数字乡村上取得重要进展。2050年全面完成数字乡村建设,助力乡村振兴。随着乡村振兴的开始,乡村治理能力和乡村数字化水平要有质的提高。近日,汉中已全面启动实施乡村振兴战略,列出任务图、时间表,着力实施“八大行动”、推动“七项改革”、强化“四个保障”,为“三农”加快发展、乡村全面振兴打造新的“助推器”和“加速器

205、”,其中,如 AI 病虫害防治的智慧大棚建设、智慧城市和乡村网格化管理建设等等,都已提上日程。(图7.2-3)应用成效百度AI人工智能图像识别技术对照村7条、户5条脱贫标准开展自动分析2019年,运用百度AI识别出部分贫困户住房和饮水尚存风险点,推迟1507人脱贫,纳入预警监测7733人。对运用百度AI、地图技术等分析的疑似问题进行针对性督导,问题吻合度达在80%以上。对帮扶干部上传的房屋、饮水、家居、环境照片进行扫描分 发 给 各 个 帮 扶 干部,提醒核查对裂缝住房、水源卫生条件差、生活环境恶劣等疑似不达标项自动筛查引入到家庭成员指数计算范畴(图7.2-2)“云智一体”技术与应用解析 企业AI开发篇5859

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(百度智能云:2021年“云智一体”技术与应用解析系列白皮书——企业AI开发篇(60页).pdf)为本站 (皮匠报告) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部