《人工智能行业研究框架:奔赴人工智能的星辰大海-230816(69页).pdf》由会员分享,可在线阅读,更多相关《人工智能行业研究框架:奔赴人工智能的星辰大海-230816(69页).pdf(69页珍藏版)》请在三个皮匠报告上搜索。
1、奔赴人工智能的星辰大海人工智能研究框架2023年08月16日行业专题研究姓名:李沐华(分析师)邮箱:电话:证书编号:S08805190800092诚信 责任 亲和 专业 创新人工智能研究框架培训请参阅附注免责声明目录/CONTENTS人工智能旨在利用计算机模拟和执行各领域的智能任务01人工智能发展史:人工智能发展已历经三次浪潮02算力是人工智能的基础设施,算法是人工智能的灵魂03人工智能技术的应用前景广阔04风险提示053诚信 责任 亲和 专业 创新人工智能研究框架培训请参阅附注免责声明01人工智能旨在利用计算机模拟和执行各领域的智能任务诚信 责任 亲和 专业 创新4人
2、工智能研究框架培训请参阅附注免责声明从日常生活中可以随处瞥见人工智能的影子01人工智能在生活中的常见应用:人脸识别考勤系统+APP智能推送人脸识别打卡人脸识别打卡是一种快速、高效的考勤方式,相比传统的打卡方式,具有以下优势:1.准确率高:人脸识别技术可以在不同光线、角度、表情等情况下,准确地识别员工的面部信息,避免了手工打卡时出现的误差和作弊行为。2.安全性强:人脸识别技术通过人脸特征识别,确保只有正式员工才能进行考勤,防止了非法人员的进入和作弊行为。3.便捷性高:人脸识别打卡无需员工携带打卡卡片或密码,只需要站在识别设备前进行识别即可,方便快捷。APP智能推送智能推送是一种机器学习方法,可以
3、识别和预测各种用户的兴趣或偏好,从而有针对性地、及时地向用户主动推送所需信息,以满足不同用户的个性化需求。诚信 责任 亲和 专业 创新5人工智能研究框架培训请参阅附注免责声明人工智能旨在利用计算机能够模拟和执行各领域的智能任务01人工智能(Artificial Intelligence,简称AI)是一门研究如何使计算机能够模拟和执行人类智能任务的科学和技术领域。通俗来说就是,先让计算机进行学习,然后让计算机预测未知。传统计算机程序人工智能 根据人类经验制定规则,让计算机学习并预测未知 优势:计算能力和存储容量远超人类脑力水平,可以处理海量数据 弊端:现实生活中很多经由人类经验解决的问题难以制定
4、规则,也就无法转换成机器语言让其学习 通过输入大量资料数据,让计算机学习算法,总结出模型,之后再输入相似样本时,就可以识别结果 优势:模仿人类经验学习的过程,无需人为制定规则数据来源:国泰君安证券研究现如今计算机的计算能力已非常强大,信息管理也越来越数据化,积累的资料越来越多,使我们有足够多的数据可以喂给计算机进行学习。正是这两个因素的成熟,才使得当下是人工智能爆发的时代。机器学习算法图1:机器学习等算法和自我迭代是AI区别于传统计算机能力的主要因素数据来源:国泰君安证券研究自我迭代诚信 责任 亲和 专业 创新6人工智能研究框架培训请参阅附注免责声明人工智能涵盖四大主要的功能维度01 人工智能
5、的功能维度从“计算感知认知创造”层层递进 计算智能指对数据的基础逻辑计算和统计分析;感知智能指基于视觉、听觉的信号,对目标进行模式识别与分类;认知智能指实现对信息的认知、理解、推理和决策,并实现人、物、企业等智慧实体的认知与协同;智能创造指利用人工智能技术进行文学、艺术等方面的创造性创作以及工业领域的智能制造。它的出现不仅改变了传统的创作方式、思维方式和工业模式,也为拓宽人类的能力边界增添了新的可能性。计算智能感知智能认知智能智能创造图2:人工智能经历了四个能力维度的进阶数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新7人工智能研究框架培训请参阅附注免责声明计算智能是人工智能的基础性功能
6、,赋能产业领域较广01 人工智能在计算智能领域的实际应用能带来巨大产业价值 计算智能,通常指基于清晰规则的数值运算,比如数值加减、微积分、矩阵分解等。计算智能得益于计算机存储与硬件的快速发展,已给互联网、金融和工业等多个领域带来产业价值。计算智能也面临显著困境。以金融场景为例,计算智能受限于指定的数据逻辑规则,虽计算智能可以高性能地计算股票的统计特征,但无法运用专家知识,也难以进行深度、动态和启发式的推理,对投资、博弈等业务贡献的价值有限。计算智能所需的高性能硬件和网络支持等,也给企业带来了巨大的成本压力。图3:AI在计算智能领域的应用可以赋能各大产业数据来源:国泰君安证券研究诚信 责任 亲和
7、 专业 创新8人工智能研究框架培训请参阅附注免责声明感知智能开始让AI具备了模拟人类的感知能力01 人工智能在感知智能领域的实际应用开始涉及到与人类的交互 感知智能,其核心在于模拟人的视觉、听觉和触觉等感知能力。感知智能目前用于完成人可以简单完成的重复度较高的工作,比如人脸识别、语音识别等。感知智能的核心业务目标是提高效率且降低成本。智能交通通过感知交通状况和行车习惯,智能交通系统可以提高交通效率和安全性智能家居通过感知用户的行为和需求,智能家居可以自动调整室温、照明等设备,提高生活的舒适度智能医疗AI感知设计可以帮助医疗设备更好地理解患者的病情,从而提高医疗效率和安全性图4:AI的感知智能能
8、够针对人类交互相关的产业领域产生巨大变革数据来源:百度,国泰君安证券研究诚信 责任 亲和 专业 创新9人工智能研究框架培训请参阅附注免责声明认知智能在前两者基础上,提升了对各类信息的处理能力01 人工智能在认知智能领域的实际应用进一步拓宽 认知智能需要具有对采集的信息进行处理、存储和转化的能力,在这一阶段需要运用计算智能、感知智能的数据清洗、图像识别能力。认知智能需要拥有对业务需求的理解及对分散数据、知识的治理能力。认知智能需要能够针对业务场景进行策略构建和决策,提升人与机器、人与人、人与业务的协同、共享和博弈等能力。通过语音或文字的方式与用户交互并提供帮助智能客服根据用户的需求,从海量数据中
9、精准获取相关信息智能搜索将一种自然语言翻译成另一种自然语言智能翻译对肿瘤、病变等医学图像进行分析和判断智能影像利用视觉技术和传感器管理车辆行驶智能驾驶图5:认知智能的主要应用场景如下所示数据来源:国泰君安证券研究 诚信 责任 亲和 专业 创新10人工智能研究框架培训请参阅附注免责声明智能创造开始让AI具备了自主“生成式”(AIGC)的能力01 人工智能的智能创造本质上是一种“生成式”能力 人工智能创造是指利用计算机程序和算法等技术,让计算机自动地生成具有一定艺术性、创造性的作品,包括音乐、诗歌、绘画、小说等;AI创作的基础是数据分析和模型训练。首先需要收集和整理有关主题、情感、语言等信息的数据
10、,通过机器学习、深度学习等算法进行训练,使得机器能够自动完成创作任务。这种方式不仅提高了创作效率,而且还能够创造出更加精准、深刻、个性化的作品。人工智能可以模仿人类的创作过程,产生类似于人类创作的作品。这在文学、音乐、电影等领域都有广泛的应用。数据来源:国泰君安证券研究图6:AI“生成式”下的创作场景部分如下所示诚信 责任 亲和 专业 创新11人工智能研究框架培训请参阅附注免责声明AIGC取长补短,有望成为主流内容生产模式01 AIGC所属内容生产生态的发展经历了专家生产内容(PGC)、用户生成内容(UGC)、AI辅助生产内容、AI生产内容(AIGC)四个阶段,目前处于一、二阶段为主,第三阶段
11、为辅的境况 AIGC克服PGC与UGC存在的质量、产量无法兼具的缺点,其有望成为未来主流的内容生产模式资料来源:foresightnews.pro,中国信通院,国泰君安证券研究PGCUGCAIGC辅助 由专业团队生产,内容质量高 内容生产门槛高,垄断严重 生产周期长,难以满足大规模生产需求电视,电影,游戏等 创作工具下放,用户可自行生产内容,创作门槛、成本降低 内容生产参与者众多,创作生态繁荣,个性化程度高 创作者参差不齐,内容质量不高短视频,社交媒体文章,播客等 AI技术学习的专业知识辅助内容生产环节,提高内容质量 AI技术实现自动化内容生产,减少创作耗时,提高内容生产规模天花板 人在关键环
12、节依然需要输入指令,没有做到完全自主性AI辅助文字创作,图片创作等AIGC 实现完全自主性AI自主文字创作,图片创作等图7:AIGC生态内容生产模式理论上会经历四个发展阶段诚信 责任 亲和 专业 创新12人工智能研究框架培训请参阅附注免责声明AIGC兴起背后是大模型的重大进步,大模型是深度学习的重要成果01大模型生成式人工智能(AIGC)模型模型的本质是对现实世界中数据和规律的一种抽象和描述。模型的目的是为了从数据中找出一些规律和模式,并用这些规律和模式来预测未来的结果。大模型是指具有非常大的参数数量的深度学习模型,通常具有数亿到数万亿参数。这些模型通常需要在大规模数据集上进行训练,并且需要使
13、用大量的计算资源进行优化和调整。生成式人工智能指基于人工智能通过已有数据寻找规律,并自动生成内容的生产方式。在大模型技术推动下,AIGC有了飞速发展,我们熟知的ChatGPT就是基于大模型的AIGC。大模型本质上也是一种深度学习领域的算法,基于一个庞大复杂的神经网络,需要通过存储更多的参数来增加模型的深度和宽度,从而提高模型的表现能力,参数从百亿起步,对大量数据进行训练并产生高质量的预测结果。数据来源:国泰君安证券研究图8:大模型推动AIGC的发展诚信 责任 亲和 专业 创新13人工智能研究框架培训请参阅附注免责声明01人工智能三要素算法,算力,数据人工智能算法算法(Algorithms):是
14、指人工智能的实现方式,包括机器学习、深度学习、自然语言处理等。算法是人工智能的灵魂,能够决定AI能力的效率和准确性。算力算力(Hardware):指的是计算机硬件资源,包括处理器、内存、存储等。算力是人工智能的基础设施,能够支持算法的运行和处理数据。数据数据(Data)是指训练算法和实现算法所需的信息。数据可以是事实、图像、声音、文本等,能够支持算法的训练和优化。数据是人工智能的发展前提,是推动人工智能发展的“原料”。实现AI 大模型能力的基础是AI“三要素”:算力、算法、数据 诚信 责任 亲和 专业 创新14人工智能研究框架培训请参阅附注免责声明算法是人工智能的灵魂所在01强化学习强化学习深
15、度学习深度学习传统机器传统机器学习学习.人工智能(本质上就是能帮人工智能(本质上就是能帮助人类解决问题的方法)助人类解决问题的方法)机器学习(实现机器学习(实现AI功能的主功能的主流算法之一)流算法之一)人工智能算法本质上是帮助人类解决相应问题的方式方法,它可以体现为数学方程、程序、工程架构等等众所周知,计算机最擅长处理的是数字,所以我们可以将现实问题抽象为数学问题,再让计算机帮我们解决。那么,其中的关键就是找到能够准确翻译该问题的数据公式,一般是某个函数关系f(x)。这个函数就叫做“算法/模型”。既然我们知道算法本质就是函数,那么影响算法准确程度的因素是什么?答案就是函数的参数。而机器学习的
16、本质就是它是一种可以通过反复带入数据从而自主调整参数的人工智能算法之一。机器学习不是某种具体的算法,而是很多算法的统称。机器学习下的算法纷繁复杂,从学习方法上来分,机器学习又可以分为传统机器学习(监督学习、无监督学习、半监督学习)、深度学习和强化学习等等。图9:人工智能的算法是其解决问题的核心思路和手段数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新15人工智能研究框架培训请参阅附注免责声明强化学习和深度学习渐成主流01深度学习强化学习深度强化学习 强化学习是一种通过与环境的交互学习最优行为策略的算法。通俗地说,强化学习类似于婴儿学习和发现世界,如果有奖励(正强化),婴儿可能会执行一个行
17、动,如果有惩罚(负强化),婴儿就不太可能执行这个行动。强化学习在游戏、机器人控制和自动驾驶等领域有广泛应用,比如熟知的AlphaGo。深度学习就是基于多层神经网络模型来学习数据表示和特征提取;所谓神经网络,就是让计算模仿大脑神经元来感知信息的一种方法。深度学习可以应用于各种领域,例如计算机视觉、自然语言处理和语音识别等。深度强化学习将深度学习的感知能力和强化学习的决策能力相结合,可以直接根据输入的图像进行控制,是一种更接近人类思维方式的人工智能算法。主流的深度强化学习算法DQN就是在现成的强化学习算法上,通过添加深度神经网络来实现一套新的深度强化学习算法。强化学习和深度学习都是目前机器学习算法
18、的主流分支,而深度强化学习则是博采众长的融合产物。数据来源:国泰君安证券研究图10:强化学习与深度学习的解释如下所示诚信 责任 亲和 专业 创新16人工智能研究框架培训请参阅附注免责声明算力是人工智能的基础设施01算力在人工智能领域扮演着至关重要的角色。算力在人工智能领域的作用是提供强大的计算资源,支持人工智能算法的训练、推理和预测,处理大规模的数据集,优化和调参模型,从而推动人工智能技术的发展和应用。训练深度学习模型 训练深度神经网络需要大量的计算资源来处理大规模的数据集和复杂的模型结构。高算力可以加快训练速度,从而提高模型的准确性和性能。推理和预测 在部署人工智能系统时,需要进行推理和预测
19、。这需要对训练好的模型进行实际应用,并在实时或近实时的情况下对新数据进行处理和响应。高算力可以加快推理速度,使得人工智能系统能够快速做出准确的决策和预测。大规模数据处理 人工智能应用通常需要处理大规模的数据集,包括图像、文本、语音等。算力可以加速数据的处理和分析,提取有用的特征和模式,从而支持更高级别的人工智能任务,如图像识别、自然语言处理和语音识别等。模型优化和调参 在人工智能领域,模型的优化和调参是提高性能和准确度的关键步骤。算力可以支持对模型的超参数进行优化搜索,以找到最佳的配置。此外,算力还可以用于模型架构搜索和自动化的机器学习流程,以提高模型的效果和效率。数据来源:国泰君安证券研究图
20、11:算力在人工智能全生命周期中,都扮演着重要的支撑性角色诚信 责任 亲和 专业 创新17人工智能研究框架培训请参阅附注免责声明数据是人工智能发展的土壤01 数据是指训练算法和实现算法所需的信息,它是训练模型推动AI算法的土壤。数据是人工智能成长的能源。人工智能的自我调整与学习的过程,本质上是对大量数据进行分析并找出规律,如无人车需要大量的试车数据不断地测试算法,并在业务场景上形成自我改进的反馈系统。可见如果没有数据的场景不可能实现人工智能,数据就是人工智能的引爆点。数据是人工智能结果准确的可靠性保证。对于人工智能结果的可靠性,数据要素的丰富性和准确性是关键,只有数据要素充分、准确,才能提高人
21、工智能结果的准确性。数据是人工智能应用的创新基础。在数据要素基础上,人工智能应用可以进行跨学科的整合,辅助解决大量的实际问题,如金融预测、物流运输、医疗诊断等,从而推动了各个领域的创新发展。人工智能创新的基础数据数据来源:国泰君安证券研究图12:数据相当于人工智能领域的“石油资源”诚信 责任 亲和 专业 创新18人工智能研究框架培训请参阅附注免责声明01资料来源:国泰君安证券研究 NLP、CV等是AI技术的重要子领域。这些细分领域的技术专长,又会进一步赋能产业应用计算机视觉(CV)让计算机和系统能够从图像、视频和其他视觉输入中获取有意义的信息,并根据该信息采取行动或提供建议自然语言处理(NLP
22、)在机器语言和人类语言之间沟通的桥梁,以实现人机交流的目的智能推荐(RES)深度智能挖掘用户和物品的关联关系,将对应场景的推荐结果推送给用户,提升用户体验和运营效率自动驾驶自动驾驶有四大核心支柱。感知、定位、规划、控制。随着神经网络的发展,深度学习在这四大领域中发挥了重要作用随着各类算法的演绎和迭代,人工智能的子领域明朗化情感分析机器翻译信息抽取电子商务搜索引擎位置服务图像分类目标检测目标分割实例分割感知定位规划控制新闻推荐诚信 责任 亲和 专业 创新19人工智能研究框架培训请参阅附注免责声明AI 子领域计算机视觉01计算机视觉(Computer vision,缩写作CV)是人工智能(AI)的
23、一个重要应用领域,是指让计算机和系统能够从图像、视频和其他视觉输入中获取有意义的信息,并根据该信息采取行动或提供建议。目前主要有以下几大基础任务:数据来源:国泰君安证券研究01020304图像分类图像分类任务主要的目的是判断一张图片的主要类别。图像分类可以是说计算机视觉中最基础的任务之一。目标检测目标检测任务是给定一张图像或是一个视频帧,让计算机定位出这个目标的的位置并且知道目标物是什么,即输出目标的Bounding Box(边框)以及标签。目标分割目标分割是检测到图像中的所有目标,解决“每一个像素属于哪个目标物或场景”的问题,属于像素级的,需要给出属于每一类的所有像素点,而不是矩形框。实例分
24、割实例分割其实就是目标检测和目标分割的结合。相对目标检测的边界框,实例分割可精确到物体的边缘。相对目标分割,实例分割需要标注出图上同一物体的不同个体。数据来源:国泰君安证券研究图13:CV的应用场景如下所示诚信 责任 亲和 专业 创新20人工智能研究框架培训请参阅附注免责声明01自然语言处理(英语:Natural Language Processing,缩写作NLP)是人工智能和语言学领域的分支学科,是指让计算机和系统能够从文本和语音信号输入中获取有意义的信息,理解人类语言,并作出决策。目前主要有以下几大基础任务:AI 子领域自然语言处理情感分析情感分析信息抽取信息抽取机器翻译,是指通过特定的
25、计算机程序将一种书写形式或声音形式的自然语言,翻译成另一种书写形式或声音形式的自然语言。目前,计算机主要能够实现语音翻译、图像翻译、VR翻译等。情感分析,即指通过计算技术对文本的主客观性、观点、情绪、极性的挖掘和分析,对文本的情感倾向做出分类判断。情感分析在评论机制的App中应用较为广泛。在互联网舆情分析中,尤其是在选举预测、股票预测等领域,情感分析起着举足轻重的作用。信息抽取,指从文本中抽取出特定的事实信息。被抽取出来的信息通常以结构化的形式直接存入数据库,可以供用户查询及进一步分析使用,为之后构建知识库、智能问答等提供数据支撑。机器翻译机器翻译数据来源:国泰君安证券研究图14:NLP的应用
26、场景如下所示21诚信 责任 亲和 专业 创新人工智能研究框架培训请参阅附注免责声明02人工智能发展已历经三次浪潮诚信 责任 亲和 专业 创新22人工智能研究框架培训请参阅附注免责声明“AI生成内容”(AIGC)是AI发展到一定阶段的必然产物02数据来源:国泰君安证券研究图15:全球人工智能产业关键事件时间轴如下图所示从人工智能关键历史事件可以看出,以大模型为基础支撑的“AI生成内容”(AIGC)功能是AI相关理论和技术发展到一定阶段的必然产物诚信 责任 亲和 专业 创新23人工智能研究框架培训请参阅附注免责声明AIGC 是从早期的“决策型”AI发展演化而来02 AIGC(生成式AI)起源于“决
27、策型”AI,决策型AI 发展过程中的技术积累为生成式AI的产生奠定基础 决策型AI其学习的知识局限于数据本身;生成式AI在总结归纳数据知识的基础上可生成数据中不存在的样本 最新生成式AI技术如GAN,Diffusion等,催生多款AIGC产品如:OpenAI系列、DALLE2(Diffusion),StarryA.I.(基于GAN)等资料来源:OpenAI官网,StarryA.I.官网,国泰君安证券研究决策型AI利用机器学习技术学习数据分布,进行如分类,预测等任务。发展过程中诞生了卷积神经网络,残差深度网络,Transformer网络结构等 推荐系统:挖掘用户与物品的关联关系 人脸识别:根据输
28、入人脸信息进行身份判别 文字识别:根据文字图片输出文本 生成式AI(AIGC)在学习归纳数据分布的基础上,学习数据产生的模式,并创造数据中不存在的新样本。在分析式AI技术基础上诞生大型Transformer网络,Diffusion等新模型 文字创作:通过提示文本生成完整文案 图像生成:根据关键信息生成风格多样图片,如博客配图,海报图片等 代码生成:根据上下文生成完整代码 数据学习数据学习+新数据生成图16:AIGC是在决策型AI的基础上,学习数据产生模式,实现新样本内容的创造诚信 责任 亲和 专业 创新24人工智能研究框架培训请参阅附注免责声明OpenAI 的ChatGPT也是“AI 生成内容
29、”(AIGC)浪潮的一部分02资料来源:中国信息通信研究院,国泰君安证券研究AIGC发展特点人工智能总体阶段早期萌芽阶段(20世纪50年代-90年代中期)沉淀积累阶段(20世纪90年代-21世纪10年代中期)快速发展阶段(21世纪10年代中期-至今)受限于技术水平,AIGC仅限于小范围实验AIGC从实验性向实用性转变,受限于算法瓶颈,无法直接进行内容生成深度学习算法不断迭代,人工智能生成内容百花齐放AIGC典型事件1950年,艾伦图灵提出著名的“图灵测试”,给出判断机器是否具有“智能”的方法1966年,世界第一款可人机对话机器人“Eliza”问世80年代中期,IBM创造语音控制打字机“Tang
30、ora”2012年,微软展示语全自动同声传译系统,可将英文语音自动翻译成中文语音2007年,世界上第一部完全由人工智能创作的小说1 The Road问世2014年,Lan J.Goodfellow提出生成式对抗网络GAN2018年,英伟达发布StyleGAN模型用于自动生成高质量图片2019年,DeepMind发布DVD-GAN模型用于生成连续性视频2022年,OpenAI发布ChatGPT模型用于生成自然能语言文本图17:随着算法的不断迭代,人工智能主动生成内容(AIGC)技术不断发展诚信 责任 亲和 专业 创新25人工智能研究框架培训请参阅附注免责声明以ChatGPT为例,其也是基于NLP
31、模型逐步进化而来02GPT模型是一种自然语言处理(NLP)模型,使用多层变换器(Transformer)来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本从 GPT-1 到 GPT-3 智能化程度不断提升,ChatGPT 的到来也是GPT-4 正式推出之前的序章资料来源:CSDN,国泰君安证券研究GPT-1(1.17亿参数)GPT-1 有一定的泛化能力,能够用于和监督任务无关的 NLP 任务中20022.01GPT-2(15亿参数)除了理解能力外,GPT-2 在生成方面表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至可以生成假新
32、闻、钓鱼邮件或在线进行角色扮演GPT-3(1750亿参数)GPT-3 作为一个自监督模型,可以完成自然语言处理的绝大部分任务:将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的哲学家预测生命的真谛InstructGPTInstructGPT是一个经过微调的新版 GPT-3,可以将有害的、不真实的和有偏差的输出最小化ChatGPTChatGPT 是 InstructGPT 的衍生产品,它将人类的反馈纳入训练过程,更好地使模型输出与用户意图保持一致2022.12图18:ChatGPT由GPT-1到InstructGPT模型的不断成熟而逐步形成诚信 责任 亲和 专业
33、创新26人工智能研究框架培训请参阅附注免责声明2022年总结来看,人工智能的历史沿革本质上是技术的进化演绎02资料来源:真格基金,国泰君安证券研究近期兴起的以ChatGPT为代表的大模型,是来自于机器学习、神经网络以及Transformer模型的多种技术的积累GPT-1GPT-2GPT-3Instruc-tGPTChatGPTT5BARTM2m-100BigBirdBERTRoBERTaXLMALBERTELECTRATransfo-rmerCNNRNN神经网络Machine Learning基于规则的少量数据处理1950年开始1980年开始1990年开始;2006年获得突破2017年2018
34、年2019年2020年基于模板和规则的前深度学习阶段根据一定范围的数据进行参数分类开始模仿人脑进行大量数据的标记和训练对人脑学习过程进行重点关注进行海量数据学习训练,人类的反馈信息成为模型学习的内容图19:ChatGPT经过多类技术积累,最终形成针对人类反馈信息学习的大规模预训练语言模型GANGPT-42023年27诚信 责任 亲和 专业 创新人工智能研究框架培训请参阅附注免责声明03算力是人工智能的基础设施,算法是人工智能的灵魂诚信 责任 亲和 专业 创新28人工智能研究框架培训请参阅附注免责声明算力是AI产业发展的根基03算力是承载人工智能应用发展的基础,是人工智能最核心的要素 数据的快速
35、增长对算力发展提出更高要求。随着信息化、数字化的持续推进,全球新产生的数据量正在快速增长,根据IDC数据显示,2021年全球新增数据总量达到84.5 ZB,预计到2026年全球新增数据总量将达到221.2 ZB,2021年至2026年间的年复合增速达到21.22%新应用场景的出现对数据实时性要求更高,从而使得边缘计算能力变得愈发重要,人工智能应用也越来越依赖边缘算力支撑。算法模型的复杂化和巨量化需要更强算力的支撑。近些年,算法模型的参数量和复杂程度都在呈现指数级增长态势,尤其是自然语言处理等新兴认知智能领域对算力的要求远超图像识别和语音识别等传统AI领域数据算法 算力、算法和数据是人工智能产业
36、发展的三个核心要素,在三大要素中,算力才是最核心的要素 数据的生产不再是问题,如何处理、分析和使用数据才是问题。算法经历了数十年的发展,在深度学习和加速计算出现之后,得到了迅速的发展和优化 算力是承载和推动人工智能走向实际应用的决定性力量算力图20:算力是AI产业发展的根基数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新29人工智能研究框架培训请参阅附注免责声明算力提升有极强的经济效益03算力的经济效益使其成为各国政策支持的重点根据清华大学全球产业院与浪潮信息联合发布的2021-2022全球计算力指数评估报告,通过对全球15个重点国家的计算力指数与数字经济及GDP的回归分析,得到15个重
37、点国家的计算力指数平均每提高1点,国家的数字经济和GDP将分别增长3.5和1.8进一步研究发现,当一个国家计算力指数分别达到40分及60分以上时,计算力指数每提升1点,其对GDP增长的推动力将分别增加到1.5倍及3倍。智能算力提升具备重大经济效益,对算力基础设施发展的支持性政策成为各国政策的重点。数据来源:2021-2022全球计算力指数评估报告,国泰君安证券研究图21:算力提升具有极强的经济效益诚信 责任 亲和 专业 创新30人工智能研究框架培训请参阅附注免责声明AI 数据中心需求激增,AI 服务器快速放量03AI 数据中心是专门用于支持人工智能计算和数据处理任务的设施或物理空间AI 数据中
38、心通常拥有大量高性能的服务器、GPU 加速器和专门的存储系统,以提供强大的计算能力并加速深度学习AI 数据中心配备了高速的网络设备和优化的软件框架,以支持高效的数据传输和算法训练通过这些专门的配置和优化,AI 数据中心能够为各种规模和复杂度的 AI 工作负载提供可靠稳定的计算环境,并满足大规模数据存储、备份和分析的需求AI 数据中心在推动人工智能技术的发展和应用方面起到关键作用,为各行各业的 AI 应用和服务提供了强大的支持软件支持网络宽带储存需求计算能力用于大规模并行计算,处理复杂机器学习和深度学习算法的高性能计算设备(如GPU和特定的AI芯片)用于快速数据传输和通信的高网络带宽、低延迟网络
39、,以满足对数据传输速度的敏感需求用于存储大规模数据集的大容量、高速存储针对机器学习和深度学习任务的软件支持,包括专门的AI框架、库和工具,以及优化的软件栈和分布式计算平台,以提高计算效率和性能数据来源:国泰君安证券研究图22:AI数据中心比普通数据中心需要更好的计算能力、存储需求、网络带宽和软件支持诚信 责任 亲和 专业 创新31人工智能研究框架培训请参阅附注免责声明AI 数据中心需求激增,AI 服务器快速放量03大模型的出现和技术创新对AI数据中心的发展起到推动作用大模型的出现带来了算力的增量需求根据 OpenAI 发布的有关 GPT-3模型的文档,它包含 1750 亿个参数,需要进行数千万
40、次的计算操作来完成一次推理任务ChatGPT 的总算力消耗约为 3640PF-days,需要78 个投资规模 30 亿、单体算力 500P 的数据中心才能支撑运行,这样的规模和复杂性需要高性能的计算设备和大规模的并行计算能力,带动了 AI 数据中心需求的增长新的处理器架构、高速网络、存储技术以及更高效的冷却和能源管理系统的出现,提升了数据中心的性能和效率,为 AI 数据中心的发展提供了技术支持图23:大模型时代使算力需求翻倍提升数据来源:IJCNN诚信 责任 亲和 专业 创新32人工智能研究框架培训请参阅附注免责声明AI 服务器中,GPU 价值量最大03AI 服务器是AI 数据中心重要的组成部
41、分AI 服务器是专门为人工智能应用而设计和配置的服务器,具备强大的计算能力和高效的数据处理能力,是执行 AI 任务和处理大规模数据的关键组件,为数据中心提供计算资源和算力,用于执行复杂的 AI 算法和模型。AI 服务器有两种主要架构:混合架构和基于云平台的架构。可以将数据存储在本地,利用本地的计算资源进行AI模型的训练和推理保证数据的安全性和隐私性可能受限于本地的存储和计算能力混合架构基于云平台的架构使用远程存储技术和混合云存储(一种联合本地存储和云存储的技术)进行数据存储,利用云端的计算资源进行AI模型的训练和推理提供弹性的存储和计算能力可能存在数据的安全性和隐私性问题描述优点缺点图24:A
42、I服务器主要使用混合架构和云平台架构数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新33人工智能研究框架培训请参阅附注免责声明AI 服务器中,GPU 价值量最大03AI 服务器中的主要元器件包括CPU、GPU 板组、内存、存储、网络接口卡、机箱、主板、散热系统和电源主板是AI服务器的核心电路板,连接各个部件并提供电源和数据传输的接口,承载着CPU、内存插槽、扩展插槽和其他重要组件电源提供服务器所需的电能,确保各个组件正常运行机箱是AI服务器的外部框架,提供支撑和保护内部组件的结构背板提供连接各个部件的接口,而布线则用于传输电力和数据信号散热系统用于控制服务器的温度并保持其在安全范围内运行
43、。散热片吸收和分散热量,而风扇则提供气流来冷却服务器内部。内存(RAM)用于临时存储数据和程序代码,提供快速的数据访问和处理能力。AI服务器通常配备大容量的内存,以支持大规模的数据集和模型CPU负责执行计算任务和处理数据,是服务器的主要计算引擎,可以进行复杂的算法和模型运算加速卡(如GPU、TPU)提供高性能的并行计算能力,用于加速机器学习和深度学习任务,可以加快模型训练和推理的速度图25:AI服务器拆箱图如下所示数据来源:英伟达官网,国泰君安证券研究诚信 责任 亲和 专业 创新34人工智能研究框架培训请参阅附注免责声明AI 服务器中,GPU 价值量最大03数据来源:国泰君安证券研究图26:整
44、个 AI 硬件产业链中的各个环节紧密合作,共同构建了支持 AI 应用和服务的完整生态系统 GPU 是AI 服务器中价值量最高的部件,承担了大部分的计算任务和深度学习模型的训练与推理AI服务器服务器GPU电源网络设备存储CPU冷却系统在整个AI服务器的投入比例中,GPU通常占据较大的比例,大约在整体投入的30%至60%之间。GPU提供了强大的并行计算能力和高效的深度学习加速,是实现高性能AI计算的关键。CPU作为服务器的核心计算单元发挥着重要作用,而存储、网络设备、冷却系统和电源等则在支持和维护服务器功能上起到关键作用。其他部件在整体投入中比例相对较小,但它们同样是确保服务器正常运行和数据中心高
45、效运作的必要组成部分诚信 责任 亲和 专业 创新35人工智能研究框架培训请参阅附注免责声明AIGC拉动AI算力需求,AI芯片将成为未来科技石油03基于APU架构的MI300预计于年底开始应用于超级计算机 随着AI 进入“大模型”时代,训练数据不断增长、算法复杂度不断提高,国内人工智能厂商对算力的需求陡升。AI芯片作为大模型及AI应用落地的算力基础,重要性日益凸显。广义的AI芯片指专门用于处理人工智能应用中大量计算任务的模块,即面向人工智能领域的芯片均被称为AI芯片。狭义的AI芯片即针对人工智能算法做了特殊加速设计的芯片。狭义的AI芯片与传统芯片(如CPU)相比,性能优势主要体现在专用性的侧重上
46、。数据来源:国泰君安证券研究图27:AI芯片产业链较为复杂IP授权授权设计设计晶圆代工晶圆代工AI芯片芯片云端云端/边缘端边缘端终端终端训练训练推理推理智能汽车智能汽车智能手机智能手机AIoT机器人机器人诚信 责任 亲和 专业 创新36人工智能研究框架培训请参阅附注免责声明AIGC拉动AI算力需求,AI芯片将成为未来科技石油03AI 芯片主要分为三种类型:通用型(GPU)、半定制型(FPGA)、定制型(ASIC)三类芯片代表分别有英伟达(NVIDIA)的GPU、赛灵思的FPGA和Google的TPU。GPU的计算能力最强,但是成本高、功耗高;FPGA可编程,最灵活,但是计算能力不强;ASIC体
47、积小、功耗低,适合量产,但是研发时间长,且不可编辑,前期投入成本高,带来一定的技术风险。数据来源:国泰君安证券研究表1:AI芯片分为GPU、FPGA、ASIC三种类型GPUFPGAASIC定制化程度定制化程度通用型半定制化定制化灵活性灵活性好好不好成本成本高较高低编程语言编程语言/架构架构CUDA,OpenCL等Verilog/VHDL等硬件描述语言,OpenCL、HLS/功耗功耗大较大小主要优点主要优点峰值计算能力强,产品成熟平均性能较高,功耗较低,灵活性强平均性能很强,功耗很低,体积小主要缺点主要缺点效率不高,不可编辑,功耗高量产单价高,峰值计算能力较低,编程语言难度大前期投入成本高,不可
48、编辑,研发时间长,技术风险大主要应用场景主要应用场景云端训练,云端推理云端推理,终端推理云端训练,云端推理,终端推理诚信 责任 亲和 专业 创新37人工智能研究框架培训请参阅附注免责声明AIGC拉动AI算力需求,AI芯片将成为未来科技石油03针对不同技术路径,国内厂商均已有所布局 GPU:国内GPU厂商已有部分产品落地,国产GPU迎来黄金发展期数据来源:国泰君安证券研究图28:国内GPU企业迎来较快发展景嘉微自主研发了一系列GPU芯片,包括JM54系列、JM72系列、JM92系列三代GPU产品公司于 2014 年成功研发出国内首颗国产高性能、低功耗 GPU 芯片JM5400,打破了国外产品长期
49、垄断我国 GPU 市场的局面,并不断研发更为先进的JM7200 和JM9系列2022 年5 月,公司 M9 系列第二款图形处理芯片成功研发,可以满足地理信息系统、媒体处理、CAD 辅助设计、游戏、虚拟化等高性能显示需求和人工智能计算需求,可广泛应用于各种设备海光 DCU 系列产品以基于通用的GPGPU架构,采用7nm工艺,兼容“类CUDA”环境以及国际主流商业计算软件和人工智能软件,软硬件生态丰富海光DCU系列产品深算一号已经实现商业化应用,于2021年实现规模化出货,未来将广泛应用于大数据处理、人工智能、商业计算等领域其产品性能达到了国际上同类型主流高端处理器的水平,具有较强的并行计算能力和
50、较高的能效比,在国内处于领先地位数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新38人工智能研究框架培训请参阅附注免责声明AIGC拉动AI算力需求,AI芯片将成为未来科技石油03针对不同技术路径,国内厂商均已有所布局数据来源:国泰君安证券研究表2:ASIC:国内ASIC厂商实力雄厚,积极追赶国外芯片巨头此前被全球最大FPGA厂商赛灵思收购的深鉴科技也基于FPGA来设计深度学习的加速器架构图29:CPU+FPGA:国内巨头纷纷布局CPU+FPGA的混合异构加速AI计算全球科技巨头纷纷布局云端FPGA生态,国内包括腾讯云、阿里云均在2017年推出了基于FPGA的服务,百度大脑也使用了FPGA
51、芯片数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新39人工智能研究框架培训请参阅附注免责声明AIGC拉动AI算力需求,AI芯片将成为未来科技石油03实现专用算法“硬件优化”,ASIC路线在AI领域的长期成长性值得期待数据来源:头豹研究院,国泰君安证券研究FPGA方案及ASIC方案成本曲线存在差异ASIC无法重新编程前期投入成本较高ASIC具备性能更强、体积更小、功耗更低、成本更低、可靠性更髙等优点,将更具备一定竞争优势图30:ASIC路线在AI领域的长期成长性值得期待诚信 责任 亲和 专业 创新40人工智能研究框架培训请参阅附注免责声明要解决人类指定的各类任务,先要让计算机模拟人类的学
52、习机制03人类跟计算机的能力维度各有优势,让计算机学习和模拟人类的解决问题的方法是各类算法的起点 人类会非常容易的辨别出垃圾邮件与猫狗,但是让计算机做却非常困难,因为这与发明计算机的最初任务有本质区别。比如对1亿数据进行混合四则运算或大小排序,这些任务让人类执行会非常低效,但计算机却可以快速完成。而人工智能要处理的任务与计算机最初的任务恰好相反。这就促使了让人们思考人类到底是怎么进行学习的。人类的学习机制:婴儿根本不知道猫狗到现在我们可以一眼分辨出猫狗,是一个经验学习过程:首先需要一定的样本资料,从小可能在电视中、现实中或图书中或家长教育中获得大量信息,然后大脑将接受的信息进行学习、归纳、整理
53、、总结,最后形成我们的知识与经验。对于计算机,它的优势是计算能力非常强,可以处理海量数据。我们需要给它提供成千上万的资料数据(猫狗照片)让它进行学习,然后计算机再面对新样本时才能以较高的准确率进行分辨。数据来源:AI有温度微信公众号,国泰君安证券研究图32:让计算机模仿人类来解决问题具备理论上的可行性图31:理解人类的学习机制,有助于让人工智能来有效复刻这种能力机制数据来源:AI有温度微信公众号诚信 责任 亲和 专业 创新41人工智能研究框架培训请参阅附注免责声明例如预测一封邮件是否是垃圾邮件、预测照片中的人是男性还是女性还是偏中性?这种结果只有两个值或者多个值的问题,我们可以把每个值都当做一
54、类,预测对象到底属于哪一类。对于结果只有两个值的问题,一般称为二分类问题,结果有多个值的问题称为多分类问题。基于AI习得的能力,AI 就能处理两大类任务03AI 所能处理的这些任务背后的根本任务只有两类,就是分类与回归 人类大脑每日处理的其实也是分类与回归问题。比如我们会思考晚上吃烧烤还是火锅,会选择出门穿哪件衣服,这些都可看做是分类问题;在称重上秤前我们会先估计自己多重,约会时会预计对方几点到达,这些都可看做是回归问题。数据来源:国泰君安证券研究分类人工智能要处理的任务多种多样。比如人脸识别、垃圾邮件检测、电源票房预测、降雨量预测等等。但是这些任务背后的根本任务只有两类,就是分类与回归。回归
55、例如要通过一个人的饮食预测一个人的体重,体重的值可以有无限多个,有的人60kg,有的人61kg,而且在60和61之间也有无限多个数。这种预测结果是某一个确定数,而具体是哪个数有无限多种可能,预测的这个变量(体重)因为有无限多种可能,在数轴上是连续的,所以称这种变量为连续变量。图33:分类和回归是人工智能所处理任务的主要类别分类任务:模型输出是:对象的所属类别;数据类型是:离散数据回归任务:模型输出的结果是:一个值;数据类型是:连续型数据 诚信 责任 亲和 专业 创新42人工智能研究框架培训请参阅附注免责声明分类任务:模型输出是对象的所属类别,数据类型是离散数据03分类任务:有二分类和多分类 二
56、分类任务包括前面提到的垃圾邮件检测与猫狗图像识别的例子。多分类任务场景包括下棋与自动驾驶等场景。在棋盘上可以落子的个数是有限的,所以每一步阿尔法Go要做的就是根据当前已落子信息,预测出落子在每个可落子位置的胜率,然后选取胜率最高的位置进行落子即可;自动驾驶车辆上装有多个摄像头和传感器来时刻监视车辆四周的环境信息,可根据这些环境的图像信息让它选择在每种情况下方向盘转动多少角度、油门或刹车踩多深来实现车辆的自动行驶。图34:棋牌类是多分类任务的场景案例之一数据来源:百度图35:自动驾驶也是一种多分类任务数据来源:广汽可给方向盘设置900个选择方案(普通车的方向盘一般是900度,也就是两圈半),给油
57、门刹车分别设置10个档位。那么整个自动行驶的过程,其实就是在每个时刻根据环境信息来对这三个关键部件进行操作选择,所以可以将它看作为分类任务。诚信 责任 亲和 专业 创新43人工智能研究框架培训请参阅附注免责声明回归任务:模型输出的结果是一个值,数据类型是连续型03以网约车出行预测以及股价预测来说明回归任务。回归任务和分类任务并非严格区分。案例一:可根据上下车地点、时间、天气情况、人流密度以及历史记录等因素,预测此刻某区域的网约车订单数,并以此为依据进行车辆调度,保证供需平衡。案例二:股价预测也可看做为一个回归问题。因为可根据历史走势、利弊政策、公司财报等因素对股价进行预测。其实分类问题在某种程
58、度上可以看做为一个回归问题:比如可以定义若一支股票涨幅会大于5%,就把它归为买入类;在-5%至5%之间,就将它归为持有类;跌幅大于5%的话就将它归为卖出类。图36:网约车出行流量预测是一种回归任务数据来源:百度地图图37:股价预测也是典型的回归任务数据来源:微软根据相应程序可以预测股价趋势,可看做回归问题诚信 责任 亲和 专业 创新44人工智能研究框架培训请参阅附注免责声明最终计算机解决这些任务的方案,我们称之为算法03从人工智能大的子领域来看,常用的算法类型有专家系统、传统机器学习与深度学习。专家系统通俗来说就是制定规则;传统的机器学习主要运用可解释的数学公式进行推导预测;而目前大火的深度学
59、习则是模拟人脑神经元进行学习与预测,通常不具有可解释性,但却能很好的解决问题(之后会详细解释)。利用以往知识与经验制定规则专家系统通过训练集,不断识别特征,不断建模,最后形成有效的模型,这个过程就叫“机器学习”!无论使用什么算法,使用什么样的数据,最根本的思路都逃不出上面的3步。传统机器学习模拟人脑神经元进行学习与预测,通常不具有可解释性深度学习图38:AI核心算法主要分为三大类数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新45人工智能研究框架培训请参阅附注免责声明专家系统算法:基于以往知识与经验来制定规则03早期AI 根据设定的规则,让电脑去执行预测。这种早期算法也叫做“专家系统”。
60、专家系统是模拟人类专家解决某一类具体问题的人工智能系统,如疾病诊疗、机械设计等。那么,如何让计算机模拟人类专家?思路很简单:想办法将专家掌握的知识抽取出来,利用这些知识,计算机就可以像专家一样工作了。例如,AI在互联网中的早期应用有识别垃圾邮件。邮箱每天会收到众多邮件,而把垃圾邮件剔除就可以大大节约人们在垃圾邮件中浪费的时间。传统的方法是制定规则,比如一篇文章中大量出现“免费”“特价”“发财”“代理”“稳赢”等等关键词,我们就把它定义为垃圾邮件,根据设定的规则,然后让电脑去执行预测。实现专家系统要解决两个问题:一是如何表示知识,二是如何利用知识解决问题 首先是知识表示的问题,即如何将专家的知识
61、梳理出来,并表示成计算机能读懂的结构。知识表示有很多种方法,最简单的是写成“如果.就.”这样的判断句,称为“产生式规则”。第二个问题涉及到推理方法,即如何利用既有知识解决问题。以诊疗系统为例,如果病人的表现是打喷嚏和发烧,人类的医生会基于打喷嚏和发烧这些表现,判断病人可能是感冒了,而治疗感冒的常用药物是阿司匹林,因此医生会告诉病人:吃几片阿斯匹林。这个过程就是人类的推理过程。计算机医生会模仿这个过程,首先会将病人发烧和打喷嚏作为前提在知识库中查找。图39:用IF 语句来举例理解专家系统基于该知识推论病人是否感冒。得出结论后,通过“感冒”,在知识库中继续查找,发现下面的知识IF 发烧 AND 打
62、喷嚏 Then 感冒知识表示数据来源:国泰君安证券研究IF 感冒 THEN 开阿司匹林解决问题基于该知识,计算机就知道要给病人开阿司匹林诚信 责任 亲和 专业 创新46人工智能研究框架培训请参阅附注免责声明单一的专家系统算法会遇到诸多瓶颈03但在实践过程中,有些任务本身的规则很难定义。一个典型的例子就是图像识别。在图像识别领域中,一个最基础的问题就是分辨这个图像是什么。举例来说,告诉你一张图像不是猫就是狗,现在给你一张图片,让你分辨一张图片到底是猫还是狗。人类可以轻松地分辨出左侧是猫右侧是狗,但是让你具体说出你是究竟根据什么来分辨出猫与狗的,突然发现这个问题很难回答。例如,猫跟狗都有五官与体毛
63、,并有基本相同的姿势等等,计算机量化描述这些规则的话,难度和复杂度极大。数据来源:AI有温度微信公众号图41:因为图像的细节特征太多,编写规则来进行判断的难度极大图40:识别图像的工作极大提升了传统算法的难度数据来源:AI有温度微信公众号诚信 责任 亲和 专业 创新47人工智能研究框架培训请参阅附注免责声明传统的机器学习主要运用可解释的数学公式进行推导运算03案例任务:收集鸢尾花 花萼的长度与宽度,来判断它具体属于哪一品种(由于可视化与易推导的需求,此处将数据维度降到2维或3维来说明传统机器学习的原理。而现实中的数据通常是具有多种特征的,比如鸢尾花的数据集原本有4个特征,其实我们应该在一个4维
64、空间对数据进行切分)。机器学习背后的数学保证了低维空间的算法推导到高维空间也同样适用。图42:传统的机器学习主要运用可解释的数学公式进行推导预测数据来源:AI有温度微信公众号,,国泰君安证券研究首先将花萼的长度与宽度绘制在一张二维图中,红色代表一类,蓝色代表一类根据两组数据计算出一条f(x)=k1x1+k2x2+b(可理解为y=kx+b)的直线将两类数据分离:如果再来一组数据落入直线上方,就归属于红色类;若落入直线下方,则属于蓝色类诚信 责任 亲和 专业 创新48人工智能研究框架培训请参阅附注免责声明传统的机器学习对图像识别有天然优势03传统机器学习同样可以运用到图像领域 可以看到在鸢尾花分类
65、任务中的特征都有明确的含义,每个数字代表什么意思。而其实在机器学习中,特征可以是很抽象的,在图像识别领域中,通常将每一个像素点看做一个特征。在数字识别任务中,将图像放大,每一个像素由一个方块表示,方块颜色的深浅不同就对应着不同的值,所以可以用28*28=784个特征来代表这张图像,然后将数字按顺序排开喂给机器机进行学习,并归纳整理每个位置的值与最终结果的关系。在算法领域中特征可能是不具有含义的,而是抽象的,甚至这个特征与最终结果毫无关系。图44:传统机器学习的工作流程如下所示数据来源:华为云官网图43:利用机器学习来处理像素点可以实现图像识别数据来源:雷锋网诚信 责任 亲和 专业 创新49人工
66、智能研究框架培训请参阅附注免责声明根据机器学习训练方式,又分监督学习、无监督学习和强化学习03 监督学习需要有明确的目标,很清楚自己想要什么结果。比如:按照“既定规则”来分类、预测某个具体的值 监督并不是指人站在机器旁边看机器做的对不对,而是具有四个步骤的流程。图45:监督学习可以处理回归 和 分类 两种任务,下面以芝麻信用评分(回归任务)来说明监督学习选择一个合适的数学模型01 01 合适的模型先把部分已知“问题和答案”(训练集)给机器去学习02 02 提供训练数据机器总结出了自己的“方法论”0303 训练出方法论人类把”新的问题”(测试集)给机器,让他去解答04 04 在新数据上使用方法论
67、步骤1 1:构建问题,选择模型首先找出个人信用的影响因素,从逻辑上讲一个人的体重跟他的信用应该没有关系,而财富总额貌似跟信用有关,所以根据判断,找出了下面5个影响因素:付款记录、账户总金额、信用记录跨度(自开户以来的信用记录、特定类型账户开户以来的信用记录)、新账户(近期开户数目、特定类型账户的开户比例)、信用类别(各种账户的数目)步骤2 2:收集已知数据为了找出公式 f,需要先收集大量的已知数据,这些数据必须包含一个人的5种数据和他的信用状态(把信用状态转化为分数)。把数据分成几个部分,一部分用来训练,一部分用来测试和验证。步骤3 3:训练出理想模型有了这些数据,通过机器学习,就能”猜测”出
68、这5种数据和信用分数的关系。这个关系就是公式 f。然后再用验证数据和测试数据来验证一下这个公式是否OK。步骤4 4:对新用户进行预测当我们想知道一个新用户的信用状况时,只需要收集到他的这5种数据,套进公式 f 计算一遍就知道结果了!数据来源:easyai官网,国泰君安证券研究 诚信 责任 亲和 专业 创新50人工智能研究框架培训请参阅附注免责声明主流的监督学习算法种类较多03图:朴素贝叶斯决策树SVM逻辑回归线性回归回归树K邻近 Adaboosting神经网络贝叶斯分类法是基于贝叶斯定定理的统计学分类方法。它通过预测一个给定的元组属于一个特定类的概率,来进行分类。朴素贝叶斯分类法假定一个属性值
69、在给定类的影响独立于其他属性的类条件独立性。分类任务回归任务回归+分类决策树是一种简单但广泛使用的分类器,它通过训练数据构建决策树,对未知的数据进行分类。支持向量机把分类问题转化为寻找分类平面的问题,并通过最大化分类边界点距离分类平面的距离来实现分类。逻辑回归是用于处理因变量为分类变量的回归问题,常见的是二分类或二项分布问题,也可以处理多分类问题,它实际上是属于一种分类方法。线性回归是处理回归任务最常用的算法之一。该算法的形式十分简单,它期望使用一个超平面拟合数据集(只有两个变量的时候就是一条直线)。回归树(决策树的一种)通过将数据集重复分割为不同的分支而实现分层学习,分割的标准是最大化每一次
70、分离的信息增益。这种分支结构让回归树很自然地学习到非线性关系。通过搜索K个最相似的实例(邻居)的整个训练集并总结那些K个实例的输出变量,对新数据点进行预测。Adaboost目的就是从训练数据中学习一系列的弱分类器或基本分类器,然后将这些弱分类器组合成一个强分类器。它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络。图46:主流的监督学习算法包括朴素贝叶斯、决策树、SVM等多种算法,目前也在逐步丰富中数据来源:国泰君安证券研究诚信 责任 亲和 专业 创新51人工智能研究框架培训请参阅附注免责声明无监督学习跟监督学习相比,主要有三个特点03 无监督学习是一种
71、机器学习的训练方式,它本质上是一个统计手段,在没有标签的数据里可以发现潜在的一些结构的一种训练方式。下面通过跟监督学习的对比来理解无监督学习:监督学习是一种目的明确的训练方式,你知道得到的是什么;而无监督学习则是没有明确目的的训练方式,你无法提前知道结果是什么。监督学习需要给数据打标签;而无监督学习不需要给数据打标签。监督学习由于目标明确,所以可以衡量效果;而无监督学习几乎无法量化效果如何。图47:举例说明无监督学习案例1:发现异常案例2:用户细分案例3:推荐系统背景:有很多违法行为都需要”洗钱”,这些洗钱行为跟普通用户的行为是不一样的,到底哪里不一样?如果通过人为去分析是一件成本很高很复杂的
72、事情,我们可以通过这些行为的特征对用户进行分类,就更容易找到那些行为异常的用户,然后再深入分析他们的行为到底哪里不一样,是否属于违法洗钱的范畴。通过无监督学习,可以快速把行为进行分类,虽然不知道这些分类意味着什么,但是通过这种分类,可以快速排出正常的用户,更有针对性的对异常行为进行深入分析。数据来源:easyai官网,国泰君安证券研究用户细分对于广告平台很有意义,不仅把用户按照性别、年龄、地理位置等维度进行用户细分,还可以通过用户行为对用户进行分类。比如大家在淘宝、天猫、京东上逛的时候,总会根据你的浏览行为推荐一些相关的商品,有些商品就是无监督学习通过聚类来推荐出来的。系统会发现一些购买行为相
73、似的用户,推荐这类用户最”喜欢”的商品。诚信 责任 亲和 专业 创新52人工智能研究框架培训请参阅附注免责声明强化学习不需要大量的“数据喂养”,通过自我尝试学会技能03 跟监督、无监督学习类似,强化学习并不是某一种特定的算法,而是一类算法的统称。强化学习算法的思路非常简单,以游戏为例,如果在游戏中采取某种策略可以取得较高的得分,那么就进一步强化这种策略,以期继续取得较好的结果。这种策略与日常生活中的各种绩效奖励非常类似。强化学习和监督学习、无监督学习最大的不同就是不需要大量的“数据喂养”。而是通过自己不停的尝试来学会某些技能。图48:强化学习的主流算法包括免模型学习(Model-Free)和有
74、模型学习(Model-Based)数据来源:easyai官网,国泰君安证券研究有模型学习(Model-Based)对环境有提前的认知,可以提前考虑规划,但是缺点是如果模型跟真实世界不一致,那么在实际使用场景下会表现的不好。免模型学习(Model-Free)放弃了模型学习,在效率上不如后者,但是这种方式更加容易实现,也容易在真实场景下调整到很好的状态。所以免模型学习方法更受欢迎所以免模型学习方法更受欢迎,得到更加广泛的开发和测试。诚信 责任 亲和 专业 创新53人工智能研究框架培训请参阅附注免责声明深度学习的灵感来自大脑的结构和功能03 深度学习的概念源于人工神经网络的研究,但是并不完全等于传统
75、神经网络,可以看做神经网络的升级版本 根据李开复在人工智能内容,以识别图片中的汉字为例来解释深度学习:假设深度学习要处理的信息是“水流”,而处理数据的深度学习网络是一个由管道和阀门组成的巨大水管网络。网络的入口是若干管道开口,网络的出口也是若干管道开口。这个水管网络有许多层,每一层由许多个可以控制水流流向与流量的调节阀。根据不同任务的需要,水管网络的层数、每层的调节阀数量可以有不同的变化组合。对复杂任务来说,调节阀的总数可以成千上万甚至更多。水管网络中,每一层的每个调节阀都通过水管与下一层的所有调节阀连接起来,组成一个从前到后,逐层完全连通的水流系统。那么,计算机该如何使用这个庞大的水管网络来
76、学习识字呢?比如,当计算机看到一张写有“田”字的图片,就简单将组成这张图片的所有数字(在计算机里,图片的每个颜色点都是用“0”和“1”组成的数字来表示的)全都变成信息的水流,从入口灌进水管网络。我们预先在水管网络的每个出口都插一块字牌,对应于每一个我们想让计算机认识的汉字。这时,因为输入的是“田”这个汉字,等水流流过整个水管网络,计算机就会跑到管道出口位置去看一看,是不是标记由“田”字的管道出口流出来的水流最多。如果是这样,就说明这个管道网络符合要求。如果不是这样,就调节水管网络里的每一个流量调节阀,让“田”字出口“流出”的水最多。与训练时做的事情类似,未知的图片会被计算机转变成数据的水流,灌
77、入训练好的水管网络。这时,计算机只要观察一下,哪个出水口流出来的水流最多,这张图片写的就是哪个字。图49:深度学习就像自来水管系统,不断调节各个阀门,让对应出口的流量符合要求数据来源:easyai官网、人工智能,国泰君安证券研究深度学习大致就是这么一个用人类的数学知识与计算机算法构建起来的整体架构,再结合尽可能多的训练数据以及计算机的大规模运算能力去调节内部参数,尽可能逼近问题目标的半理论、半经验的建模方式。诚信 责任 亲和 专业 创新54人工智能研究框架培训请参阅附注免责声明机器学习VS 深度学习03 机器学习与深度学习有着明显的异同点 在数据准备和预处理方面,两者是很相似的。他们都可能对数
78、据进行一些操作:数据清洗、数据标签、归一化、去噪、降维。核心区别:传统机器学习的特征提取主要依赖人工,针对特定简单任务的时候人工提取特征会简单有效,但是并不能通用;深度学习的特征提取并不依靠人工,而是机器自动提取的。这也是为什么都说深度学习的可解释性很差,因为有时候深度学习虽然能有好的表现,但是我们并不知道他的原理是什么。图50:深度学习与机器学习在不同阶段有不同的异同点数据来源:国泰君安证券研究数据预处理特征提取选择分类器数据预处理设计模型训练传统机器学习深度学习传统机器学习与深度学习的相似处传统机器学习和深度学习的核心区别图51:深度学习的优缺点如下所示优点1:学习能力强从结果来看,深度学
79、习的表现非常好,他的学习能力非常强。优点2:覆盖范围广,适应性好深度学习的神经网络层数很多,宽度很广,理论上可以映射到任意函数,所以能解决很复杂的问题。优点3:数据驱动,上限高深度学习高度依赖数据,数据量越大,他的表现就越好。在图像识别、面部识别、NLP 等部分任务甚至已经超过了人类的表现。同时还可以通过调参进一步提高他的上限。优点4:可移植性好由于深度学习的优异表现,有很多框架可以使用,例如 TensorFlow、Pytorch缺点1:计算量大,便携性差深度学习需要大量的数据很大量的算力,所以成本很高。缺点2:硬件需求高深度学习对算力要求很高,普通的CPU 已经无法满足深度学习的要求。主流的
80、算力都是使用GPU 和 TPU。缺点3:模型设计复杂深度学习的模型设计非常复杂,需要投入大量的人力物力和时间来开发新的算法和模型。大部分人只能使用现成的模型。缺点4:没有”人性”,容易存在偏见由于深度学习依赖数据,并且可解释性不高。在训练数据不平衡的情况下会出现伦理风险。数据来源:easyai官网,国泰君安证券研究诚信 责任 亲和 专业 创新55人工智能研究框架培训请参阅附注免责声明深度学习包括四种典型的算法03 4种典型的深度学习算法:卷积神经网络、循环神经网络、生成对抗网络、深度强化学习图52:深度学习的几种主要算法如下数据来源:easyai官网,国泰君安证券研究循环神经网络 RNNRNN
81、 是一种能有效的处理序列数据的算法。比如:文章内容、语音音频、股票价格走势深度强化学习 DL深度强化学习就是用深度学习来对强化学习中的State、Policy进行表示。区别的话,深度强化学习是深度学习的一个子类卷积神经网络 CNN 能够将大数据量的图片有效的降维成小数据量(并不影响结果)能够保留图片的特征,类似人类的视觉原理生成对抗网络 GANGAN 是最近2年很热门的一种无监督算法,他能生成出非常逼真的照片,图像甚至视频。我们手机里的照片处理软件中就会使用到它。诚信 责任 亲和 专业 创新56人工智能研究框架培训请参阅附注免责声明Transformer 模型是一种基于自注意力机制的深度学习模
82、型,主要用于自然语言处理和计算机视觉领域。它可以用于机器翻译、文本摘要、视觉问答等序列到序列的生成式任务,利用编码器和解码器的结构对输入和输出序列进行建模。它可以用于文本分类、情感分析等单序列的理解任务,利用编码器对输入序列进行特征提取。它可以用于视觉语言预训练、图像超分辨率、视频修复等跨模态的任务,利用自注意力机制融合不同模态的信息。它可以用于预训练语言模型,如 BERT、GPT 等,利用大规模无标注数据学习通用的语言表示,再迁移到下游任务上进行微调。Transformer技术框架是深度学习发展到一定阶段的产物03优点缺点 能够利用分布式 GPU 进行并行训练,提升模型训练效率。它能够通过自
83、注意力机制捕捉输入或输出序列中任意两个位置之间的关系,而不受距离的影响。它能够产生更具可解释性的模型,我们可以从模型中检查注意力分布,看到各个注意头(attention head)可以学会执行不同的任务。计算复杂度很高,需要大量的算力和内存,尤其是对于大型数据集和长序列。它的局部信息的获取能力不如 RNN 和CNN 强,可能会忽略一些细节和上下文。它的位置信息编码存在问题,因为位置编码与词向量相加可能会破坏词向量的语义信息,而且位置编码并不能很好地表征相对位置关系。它的顶层梯度消失问题,因为层归一化模块会阻断梯度流,导致顶层参数难以更新。数据来源:国泰君安证券研究图53:Transformer
84、的优缺点如下诚信 责任 亲和 专业 创新57人工智能研究框架培训请参阅附注免责声明Transformer标志着“基础模型”时代的开始03Transformer作为基础性模型,为其他模型(GPT、GPT-3、BERT等)的演化提供基本手段转移学习(Transfer Learning)使基础模型成为可能,预训练又是转移学习的主要方式 转移学习的思想是将从一项任务中学习到的“知识”(例如,图像中的对象识别)应用于另一项任务(例如,视频中的活动识别)。技术层面上,基础模型通过转移学习(Transfer Learning)(Thrun 1998)和规模(scale)得以实现。在Transformer模型
85、中,预训练又是转移学习的主要方法:“预训练”是将大量低成本收集的训练数据放在一起,经过某种预训方法去学习其中的共性,然后将共性“移植”到特定任务模型中,再使用相关特定领域的少量标注数据进行“微调”来适应感兴趣的下游任务。大规模化(scale)使基础模型更强大,因而GPT模型得以形成 大规模需要的三个要素:(i)计算机硬件的改进例如,GPU吞吐量和内存在过去四年中增加了10倍;(ii)Transformer模型架构的开发,该架构利用硬件的并行性来训练比以前更具表现力的模型;(iii)更多训练数据的可用性。基于Transformer的序列建模方法现在已应用于文本、图像、语音、表格数据、蛋白质序列、
86、有机分子和强化学习等,这些案例的形成使得使用一套统一工具来开发各种模态的基础模型这种理念得以成熟,象征着基础模型时代的到来。例如,GPT-3(Brown et al.2020)在上下文学习中,只需向下游任务提供提示(任务的自然语言描述),语言模型就可以适应下游任务,这是产生的一种新兴属性。资料来源:Attention Is All You Need 论文,CSDN,国泰君安证券研究58诚信 责任 亲和 专业 创新人工智能研究框架培训请参阅附注免责声明04人工智能技术的应用前景广阔诚信 责任 亲和 专业 创新59人工智能研究框架培训请参阅附注免责声明随着大模型技术引爆AIGC浪潮,AI 应用方向
87、愈发拓展04资料来源:国泰君安证券研究 AIGC产业:可以利用人工智能技术自动产生内容,常见如代码生成,文本问答等代码生成文本问答图像生成视频生成其他AIGCChatGPT 可与人类进行流畅的文本问答Copilot 可自动编写代码DALLE2 由文字描述生成图像,如:An astronaut riding a hourse as a pencil drawingSynthesia可将输入文本合成不同述说风格的视频图54:AIGC应用功能简单如下图所示诚信 责任 亲和 专业 创新60人工智能研究框架培训请参阅附注免责声明大模型加持下,人工智能也正在加速进入千行百业04 通用大模型的发展正在赋能各
88、行各业,行业专属大模型也在不断涌现。资料来源:哈尔滨工业大学社会计算与信息检索研究中心 ChatGPT这种通用大模型已经引爆垂直领域的千行百业,各行业龙头企业甚至初创企业都摩拳擦掌。金融、教育、医疗、法律、自动驾驶、智能物流、安防等多个领域的行业公司都已相继加入行业大模型的研发中。星环科技研发出金融行业专属大模型无涯,它是一款面向金融量化领域、超大规模参数量的生成式大语言模型。无涯能够对股票、债券、基金、商品等各类市场事件进行全面的复盘、传播和推演,从时间和空间、深度和广度等多个方面扩展投资研究的视角,实现了全新的智能量化投研新范式。哈工大提出了一种基于医学知识增强的大型语言模型指令微调方法,
89、打造出中文医学大模型“本草”。”本草“在中文医疗问诊场景中展现出一定的性能提升,模型能够根据用户的问题,提供较准确、可靠的诊断建议和治疗方案,满足非专业人士对医学知识的需求。此外,模型具备一定的自适应能力,能够在不同的中文问诊场景中进行有效的应答,提升用户体验。此外,学而思研发的教育大模型“MathGPT”,理想汽车研发的自动驾驶大模型“MindGPT”。幂律联合智谱AI联合发布了基于中文千亿大模型的法律垂直大模型“PowerLawGLM”。这些都表明,垂直大模型的蓬勃发展。图55:金融垂直大模型无涯架构如下所示图56:医疗垂直大模型本草如下数据来源:星环科技,国泰君安证券研究诚信 责任 亲和
90、 专业 创新61人工智能研究框架培训请参阅附注免责声明AI+产业领域:促进数实共生,助力产业升级04AI与教育、金融、医疗、制造、传媒、计算机等多个领域结合,助力产业升级图57:”AI+“在各个领域应用前景广阔资料来源:国泰君安证券研究AI可以成为虚拟世界与物理实体之间的桥梁。“数字场景”可以将驾驶路线、环境场景重构为3D,用于训练机器人和自动驾驶;AI+制造=“数字生产”+“工艺突破”AI+制造AI+教育AI+教育=“老师”。帮助教学内容生产降本增效,实现因材施教、有针对性的自适应性教学等,使得因材施教和自适应学习变得更加便捷和容易AI可以通过快照构建3D建模,应用于房屋设计、服装设计等方面
91、;AI将虚拟形象提升至更高的现实水平。同时,在音乐领域,AI将文字赋予生命力,谱写旋律AI+传媒AI+金融一方面,金融机构可以通过AI实现金融资讯、金融产品介绍内容的自动化生产,提升金融机构内容生产的效率;另一方面,可以通过AI塑造虚拟理财顾问,让金融服务更有温度ChatGPT可以根据精确或模糊的自然语言,了解用户的意图,并生成本文,写备忘录和诗歌,改写研究论文,解决数学问题,甚至编写软件。AI可以建立强大的搜索机制,在海量内容中完成精细化的搜索AI+计算机AI+医疗微软旗下Nuance推出由GPT-4驱动的AI医用软件DragonAmbienteXperience(DAX)Express,可
92、几秒钟内自动生成临床笔记草稿。它代表了医疗保健领域的下一个突破,也是大规模自动化临床文档之旅中的一个重要里程碑数据来源:雪球,国泰君安证券研究AI+诚信 责任 亲和 专业 创新62人工智能研究框架培训请参阅附注免责声明AI+传媒:拓宽创作素材,提升作品质量04ChatGPT可以根据大众的兴趣身定制影视内容,从而更有可能吸引大众的注意力,获得更好的收视率、票房和口碑ChatGPT可以为剧本创作提供新思路,创作者可根据ChatGPT的生成内容再进行筛选和二次加工,从而激发创作者的灵感,开拓创作思路,缩短创作周期。ChatGPT 有着降本增效的优势,可以有效帮助影视制作团队降低在内容创作上的成本,提
93、高内容创作的效率,在更短的时间内制作出更高质量的影视内容2016年,纽约大学利用人工智能编写剧本Sunspring,经拍摄制作后入围伦敦科幻电影48小时前十强2020年,美国查普曼大学的学生利用OpenAI的GPT-3模型创作剧本并制作短片律师国内海马轻帆科技公司推出的“小说转剧本”智能写作功能,服务了包括你好,李焕英流浪地球等爆款作品在内的剧集剧本30000多集、电影/网络电影剧本8000多部、网络小说超过500万部图58:内容生成在影视领域运用广泛,ChatGPT在影视领域的商业化大有可为资料来源:中国信息通信研究院,国泰君安证券研究案例1案例2案例3诚信 责任 亲和 专业 创新63人工智
94、能研究框架培训请参阅附注免责声明万兴已有商用账号开通GPT-4的API接口,相关产品效果显著万兴播爆具备AI数字人、场景化模板、多语言配音、智能脚本等创意功能。万兴播爆:输入文案,一键生成“真人”营销视频,并且可用上百套专业级模板,覆盖不同场景视频需求。AI+营销:万兴科技相关产品赋能显著04图59:万兴播爆有上百套专业级模板,覆盖不同场景视频需求资料来源:万兴科技官网,国泰君安证券研究图60:万兴播爆属国内领先AIGC短视频生成软件资料来源:万兴科技官网,国泰君安证券研究诚信 责任 亲和 专业 创新64人工智能研究框架培训请参阅附注免责声明AI+办公:解锁生产力,释放创造力04Copilot
95、嵌入办公软件后,以前需要手工操作的任务可以自动化、智能化执行微软于2023年3月16日正式发布Microsoft 365 Copilot,并集成在微软365的多个应用程序中,包括Word、Excel、PowerPoint、Outlook、Teams等。它还提供了一个全新体验:商务聊天(Business Chat),它可以跨越LLM、微软365应用程序和用户的数据,根据用户的自然语言提示生成文本内容。微软Copilot的本质仍然是聊天机器人,但它的功能远比简单地“将ChatGPT嵌入到Microsoft 365中”更强大。图61:Microsoft 365 Copilot可以帮助用户释放创造力,
96、解锁生产力,提升技能资料来源:微软官网,国泰君安证券研究根据用户的简短提示,在Word中生成文档的初稿。在PowerPoint中创建漂亮的幻灯片,并根据用户在微软图形中的数据添加相关内容。在Excel中帮助用户分析数据,生成图表和报告,并提供有用的见解和建议。在Teams中帮助用户协作沟通,分享信息,创建任务和计划,并提供相关的反馈和建议。遵循微软对数据安全和隐私的承诺,在企业环境中保护用户的数据不被滥用或泄露。在Outlook中帮助用户管理日程安排,回复邮件,编写摘要和提纲,并提供适当的语气和礼貌。诚信 责任 亲和 专业 创新65人工智能研究框架培训请参阅附注免责声明AI+写代码:“自动补全
97、代码”开启AI辅助人类工作时代04GitHub Copilot“自动补全代码”开启AI辅助人类工作时代微软在Copilot领域的布局由来已久。最早GitHub Copilot是GitHub和OpenAI合作开发的一个人工智能工具,用户在使用Visual Studio Code、Microsoft VisualStudio、Vim、Cursor或JetBrains集成开发环境时可以通过GitHub Copilot自动补全代码;Power Platform Copilot:引领AI生成式低代码应用开发新时代微软Power Platform正通过AI驱动的无代码智能方式重塑软件开发2023年3月16
98、日,Power Platform宣布在Power Apps、Power Automate和Power Virtual Agents中加入Copilot,进一步实现开发普及化,让更多人能够通过自然语言创建创新的解决方案。也就是说,如果你能想象出一个解决方案,并能够用简单的日常语言描述它,Copilot就可以通过直观且智能的低代码体验帮助你创建出来。Copilot in Power Apps可以轻松地把数据置于每个应用程序的中心,只需描述你构建应用程序的目的,Copilot就会自动生成数据表;Power Automate能将繁琐的业务流程数字化并提高效率,开发者可以极大地缩短应用程序上市时间;Co
99、pilot in Power Virtual Agents可以帮助开发者快速构建和修改机器人,在几分钟内就能构建起智能对话式机器人。图63:自从2019年以来,AI就被注入低代码开发,实现编程开发普及化资料来源:微软,国泰君安证券研究图62:Copilot 的功能能够帮助程序员减省阅读软件文档的时间,快速浏览不熟悉的编码框架和语言,其发展历史如下所示资料来源:微软诚信 责任 亲和 专业 创新66人工智能研究框架培训请参阅附注免责声明04自动驾驶有四大核心支柱。感知,即发现周围的环境和障碍;定位,即确定了自己的位置,精度在1-3 cm;规划,即利用感知和定位,确定了从 A 到 B 的轨迹;控制,
100、即产生方向盘转向角度和加速度值来沿着轨迹行进。而随着神经网络的发展,深度学习在这四大领域中发挥了重要作用。AI+自动驾驶:深度学习赋能自动驾驶深度强化学习已经开始出现同时在规划和控制中,而且是和ALVINN 一样的端到端的方法。规划是无人驾驶汽车的大脑。从障碍物预测到轨迹生成。其核心是决策制定。而深度强化学习为决策的准确度提供了保障。及时定位和地图构建需要运用深度学习算法,远比传统的GPS定位精度高。感知感知中运用了大量计算机视觉算法。近年来,利用深层神经网络进行激光雷达检测的技术正在蓬勃发展。这是自动驾驶汽车研究中最活跃的领域之一。定位规划控制自动驾驶数据来源:国泰君安证券研究图64:深度学
101、习赋能自动驾驶四大支柱67诚信 责任 亲和 专业 创新人工智能研究框架培训请参阅附注免责声明05风险提示诚信 责任 亲和 专业 创新68人工智能研究框架培训请参阅附注免责声明风险提示051)下游需求不及预期的风险 AI计算产业下游需求目前仍以政企客户为主,若未来政企客户购买力受到冲击,可能出现下游需求不及预期的风险。2)核心元器件受制裁的风险 AI计算核心元器件数据科技前沿领域,对半导体先进制程有一定以来,若未来海外制裁加剧,可能带来核心元器件断供风险。3)市场竞争加剧的风险 AI计算行业尚处于发展早期阶段,未来市场竞争有可能加剧。本公司具有中国证监会核准的证券投资咨询业务资格分析师声明作者具
102、有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,本报告清晰准确地反映了作者的研究观点,力求独立、客观和公正,结论不受任何第三方的授意或影响,特此声明。免责声明本报告仅供国泰君安证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为本公司的当然客户。本报告仅在相关法律许可的情况下发放,并仅为提供信息而发放,概不构成任何广告。本报告的信息来源于已公开的资料,本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证
103、券或投资标的的价格、价值及投资收入可升可跌。过往表现不应作为日后的表现依据。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议。在任何情况下,本公司、本公司员工或者关联机构不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。投资者务必注意,其据此做出的
104、任何投资决策与本公司、本公司员工或者关联机构无关。本公司利用信息隔离墙控制内部一个或多个领域、部门或关联机构之间的信息流动。因此,投资者应注意,在法律许可的情况下,本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。在法律许可的情况下,本公司的员工可能担任本报告所提到的公司的董事。市场有风险,投资需谨慎。投资者不应将本报告作为作出投资决策的唯一参考因素,亦不应认为本报告可以取代自己的判断。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。本报告版权仅为本公司所有,未经书面许可
105、,任何机构和个人不得以任何形式翻版、复制、发表或引用。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“国泰君安证券研究”,且不得对本报告进行任何有悖原意的引用、删节和修改。若本公司以外的其他机构(以下简称“该机构”)发送本报告,则由该机构独自为此发送行为负责。通过此途径获得本报告的投资者应自行联系该机构以要求获悉更详细信息或进而交易本报告中提及的证券。本报告不构成本公司向该机构之客户提供的投资建议,本公司、本公司员工或者关联机构亦不为该机构之客户因使用本报告或报告所载内容引起的任何损失承担任何责任。免责声明北京地址:北京市西城区金融大街甲9邮编:200032电话:(010)83939888电话:(021)38676666上海深圳地址:深圳市福田区益田路6009号邮编:518026电话:(0755)23976888国泰君安证券研究所E-mail:地址:上海市静安区新闸路669号邮编:200041