《计算机行业动态研究:GPT~4o、Gemini新品接连发布多模态技术奇点加速到来-240516(19页).pdf》由会员分享,可在线阅读,更多相关《计算机行业动态研究:GPT~4o、Gemini新品接连发布多模态技术奇点加速到来-240516(19页).pdf(19页珍藏版)》请在三个皮匠报告上搜索。
1、国海证券研究所请务必阅读正文后免责条款部分2024 年年 05 月月 16 日日行业研究行业研究评级:推荐评级:推荐(维持维持)研究所:证券分析师:刘熹STable_TitleGPT-4o、Gemini 新品接连发布,多模态技术新品接连发布,多模态技术奇点加速到来奇点加速到来计算机行业动态研究计算机行业动态研究最近一年走势行业相对表现2024/05/16表现1M3M12M计算机5.1%6.2%-25.0%沪深 3003.7%8.2%-8.5%相关报告计算机事件点评:运营商 AI 服务器订单超预期,国产化不断提速(推荐)*计算机*刘熹2024-04-22计算机行业动态研究:阶跃星辰发布 Step
2、-2 万亿参数模型,AI 应用+算力景气上行(推荐)*计算机*刘熹2024-03-26AI 算力月度跟踪(202403):NVIDIA B200 再创算力奇迹,液冷、光模块持续革新(推荐)*计算机*刘熹2024-03-24计算机行业事件点评:NVIDIA H20 或将与国产算力同步高增(推荐)*计算机*刘熹2024-03-03计算机行业月报:英伟达业绩再超预期,国产算力需求再扩大(推荐)*计算机*刘熹2024-02-28事件:事件:2024 年 5 月 14 日,OpenAI 在官网正式发布新旗舰模型在官网正式发布新旗舰模型 GPT-4o 多模多模态大模型态大模型,其中其中 o 代表的是代表的
3、是 omni,即即“全能全能”,GPT-4o 可以实时对音可以实时对音频频、视觉和文本进行推理视觉和文本进行推理,相较于相较于 GPT-4 Trubo 速度更快速度更快、价格更便宜价格更便宜。2024 年 5 月 15 日,2024 年谷歌 I/O 大会正式召开,会上谷歌将搜索业谷歌将搜索业务做了最彻底的务做了最彻底的 AI 改造,更新升级了改造,更新升级了 Gemini1.5Pro 版本,推版本,推出出Gemini1.5Flash 轻量化小模型轻量化小模型、生成视频模型生成视频模型 Veo、AI 智能体智能体 ProjectAstra,并展示了与,并展示了与 GPT-4o 相似的语音视觉交互
4、功能相似的语音视觉交互功能 Gemini Live。投资要点投资要点:GPT 持续迭代,持续迭代,GPT-4o 推动人机交互再上新台阶推动人机交互再上新台阶OpenAI 持续升级 GPT 版本,2023 年 3 月发布 GPT-4 在图片识别、图文数据综合处理及逻辑推理等能力实现质变;2023 年 11 月发布GPT-4Turbo,支持 125 万 tokens 的同时也在上下文等多个领域实现显著进步。本次发布 GPT-4o 带来各种能力升级:多模态交互,具有更优质的视频和音频理解以及图像生成能力:多模态交互,具有更优质的视频和音频理解以及图像生成能力:GPT-4o 能够接受文本、音频和视频的
5、任意组合作为输入,并生成文本、音频和图像的任意组合作为输出。与现有模型相比,GPT-4o 在视觉和音频理解方面有更好的表现;在理解和生成图像方面的能力优于现有模型,能完成过往模型无法完成的任务。情绪感知情绪感知:GPT-4o 能够结合视频和音频感受对话者的情绪,并给出充满人类情感的反馈。例如:在根据工作人员要求讲故事时,工作人员可以随时插话打断并提出新要求,GPT-4o 能几乎毫无停顿地接上话题并按照要求变化音色、语调、情感等。毫秒级响应:毫秒级响应:GPT-4o 对音频输入的响应时间可以快到 232 毫秒,平均为 320 毫秒,这与人类在对话中的响应时间相近,此前 GPT-4 的语音响应约
6、5.4 秒。性能性能成本优势成本优势:在传统基准测试中,GPT-4o 在文本、推理和编码智能方面,达到了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉能力方面创下了新高。相比 GPT-4 Turbo,GPT-4o 推理速度提升 2倍的同时,价格降低 50%。证券研究报告请务必阅读正文后免责条款部分2打造全新打造全新 GPT 语音助手且免费开放语音助手且免费开放,合作苹果微软加速端侧落地合作苹果微软加速端侧落地OpenAI 通过通过 GPT-4o 打造的语音版打造的语音版 ChatGPT 助手,当前已助手,当前已在在ChatGPT 中开放使用,同时模型中开放使用,同时模型 API
7、 同步放出。同步放出。GPT 语音助手主要功能包括与用户跨音频、视频进行交流,例如,让 GPT-4o 进行实时翻译、唱歌、做数学题、讲笑话等。未来,OpenAI 将会在 ChatGPT Plus 中推出新版语音模式 GPT-4o 的 alpha 版。OpenAI 与苹果合作,加速与苹果合作,加速 ChatGPT 在端侧落地。在端侧落地。OpenAI 宣布推出一款适用于 macOS 的桌面级应用,使用键盘快捷键就可向 ChatGPT提问。用户可通过电脑与 ChatGPT 语音对话,GPT-4o 的新音频和视频功能后续将推出。据每日经济新闻援引彭博社 5 月 10 日报道,苹果被曝正与 OpenA
8、I 敲定一项协议,今年将后者的部分技术引入 iPhone。借此苹果将能提供由 ChatGPT 支持的“聊天机器人”,作为 iOS 18 中人工智能功能的一部分。谷歌发布谷歌发布 Project Astra、Veo 等,多模态技术奇点加速到来等,多模态技术奇点加速到来2024年5月15日凌晨,Google I/O 开发者大会上发布了通用 AI 智能体 Project Astra,可实现跨文本、音频、视频多模态实时推理。同时,谷歌正式发布一款全新的视频生成模型 Veo,谷歌声称,Veo 能够根据文本、图像创建超过 60 秒的高质量 1080P 视频,用户可以对光照、镜头语言、视频颜色风格等进行设定
9、。我们认为,OpenAI、谷歌等新品的推出谷歌等新品的推出,体现出多模态大模型技术体现出多模态大模型技术的持续升级的持续升级,GPT-4o 的发布将革新人机交互模式的发布将革新人机交互模式,推动大模型在终端加推动大模型在终端加速推广。随着多模态技术奇点加速到来,未来基于大模型的创新应用将速推广。随着多模态技术奇点加速到来,未来基于大模型的创新应用将更值得期待,大模型技术将全面赋能教育、办公等行业和场景。更值得期待,大模型技术将全面赋能教育、办公等行业和场景。行业评级及投资策略:行业评级及投资策略:GPT-4o、Gemini 新品陆续发布,多模态大新品陆续发布,多模态大模型技术奇点加速到来,大模
10、型的商业价值、模型技术奇点加速到来,大模型的商业价值、AI 应用的创新突破以应用的创新突破以及及 AI 算力需求的持续增长可期,算力需求的持续增长可期,维持对计算机行业“推荐”评级。相关相关个股:个股:(1)大模型:)大模型:科大讯飞、三六零、拓尔思、云从科技;(2)AI 应用应用:金山办公、万兴科技、福昕软件、焦点科技、虹软科技、彩讯股份、佳发教育、鸥玛软件、拓维信息;(3)AI 终端终端:华勤技术、软通动力、海康威视、大华股份、芯海科技、联想集团、飞荣达;(4)AI 算力算力:浪潮信息、工业富联、中科曙光、神州数码、紫光股份、中际旭创、沪电股份、新易盛、海光信息、寒武纪等。风险提示:风险提
11、示:宏观经济影响下游需求、大模型发展不及预期、市场竞争加剧、中美博弈加剧、相关公司业绩不及预期等。fYbUbZfVaV8XcWcW7NcM8OoMrRpNnRkPpPqNfQmOmM9PpOmMwMrQoOvPnPpP证券研究报告请务必阅读正文后免责条款部分3重点关注公司及盈利预测重点关注公司及盈利预测重点公司重点公司股票股票2024/5/15EPSPE投资投资代码代码名称名称股价(元)股价(元)20232024E2025E20232024E2025E评级评级002230.SZ 科大讯飞42.840.280.360.57150.90119.5174.86买入601360.SH三六零8.51-0
12、.070.010.03-123.471,293.77266.70未评级300229.SZ拓尔思16.630.050.300.41362.6954.8240.23未评级688111.SH金山办公279.502.853.654.9297.9576.6056.86买入300624.SZ 万兴科技83.350.630.770.95133.14107.2787.62增持688095.SH 福昕软件54.88-0.99-0.260.26-55.21-209.09208.67未评级002315.SZ 焦点科技31.951.201.511.8426.7121.1817.37未评级688088.SH 虹软科技3
13、1.090.220.350.48142.6589.2664.56未评级300634.SZ 彩讯股份18.700.730.841.0425.7922.3617.95未评级300559.SZ 佳发教育11.270.330.490.6534.3623.0517.30未评级002261.SZ 拓维信息12.300.040.070.10342.86173.21119.50未评级603296.SH 华勤技术71.213.734.304.9319.0916.5714.45买入301236.SZ 软通动力38.900.560.681.0569.4356.9437.11增持002415.SZ 海康威视33.09
14、1.511.782.0721.8918.5416.01未评级002236.SZ 大华股份17.392.231.191.397.7814.5612.51增持688595.SH 芯海科技28.02-1.01-0.280.14-27.82-99.77199.54买入300602.SZ飞荣达14.050.180.650.8978.6921.7215.71买入000977.SZ 浪潮信息39.951.211.642.2532.9924.4017.71买入601138.SH 工业富联25.581.061.231.5424.1520.7416.66买入603019.SH 中科曙光44.531.251.571
15、.9635.5028.3122.72买入000034.SZ 神州数码29.001.752.152.5816.5713.5111.22买入000938.SZ 紫光股份22.190.740.901.0830.1824.7720.64未评级300308.SZ 中际旭创170.502.716.128.2262.9827.8620.75未评级002463.SZ 沪电股份32.880.791.181.4741.6027.9422.43未评级300502.SZ新易盛82.730.972.042.9585.3240.4628.09未评级688041.SH 海光信息72.540.540.720.98133.48
16、100.3074.34买入688256.SH 寒武纪-U181.66-2.04-1.25-0.44-89.20-145.14-409.31未评级资料来源:Wind 资讯,国海证券研究所(注:已评级标的盈利预测来自国海证券,未评级标的盈利预测来自 wind 一致预期)证券研究报告请务必阅读正文后免责条款部分4内容目录内容目录事件:.6评论:.61、GPT 持续迭代,GPT-4o 推动人机交互再上新台阶.62、打造全新 GPT 语音助手且免费开放,合作苹果微软加速端侧落地.103、谷歌发布 Project Astra、Veo 等,多模态技术奇点加速到来.134、相关个股.155、风险提示.16证券
17、研究报告请务必阅读正文后免责条款部分5图表目录图表目录图 1:GPT 发展历程.6图 2:GPT 视频解题.7图 3:GPT-4o 将 OpenAI 的 logo 印到杯垫上.7图 4:GPT-4o 将输入的文字排版为手写体.7图 5:输入几段文字就可以得到一组漫画分镜.8图 6:由生活照生成海报.8图 7:研发负责人现场演示与 GPT-4o 对话并展现其情绪感知能力.8图 8:英伟达科学家 Jim Fan 评论.9图 9:GPT-4o 在 5-sho 常识问题上创 87.2%高分.9图 10:GPT-4o 显著提高所有语言的语音识别性能.9图 11:GPT-4o 语音翻译在 MLS 基准测试
18、优于 Whisper-v3.10图 12:在所有语言基准测试中 GPT-4o 都比 GPT-4 更强.10图 13:API 速度飙升 2 倍,价格减半.10图 14:OpenAI 的员工与 GPT-4o 视频.11图 15:两个 GPT-4o 语音助手互相对话并唱歌.11图 16:GPT-4o 以家教的方式一步步引导解题.11图 17:GPT-4o 实时翻译.11图 18:OpenAI 将 GPT-4o 在免费套餐中提供.12图 19:适用于 mac 的桌面级应用.12图 20:桌面端可直接截图提问.13图 21:总结截图的内容.13图 22:GPT 完美理解了代码中的内在逻辑.13图 23:
19、概述代码生成的图表并回答问题.13图 24:Astra 对所有听到、看到的东西进行解读.14图 25:Astra 对草图、物品进行深度解读和联想.14图 26:Veo 根据文字内容生成视频 1.14图 27:Veo 根据文字内容生成视频 2.14证券研究报告请务必阅读正文后免责条款部分6事件:事件:2024 年 5 月 14 日,OpenAI 在官网正式发布新旗舰模型 GPT-4o 多模态大模型,其中 o 代表的是 omni,即“全能”,GPT-4o 可以实时对音频、视觉和文本进行推理,相较于 GPT-4 Trubo 速度更快、价格更便宜。2024 年 5 月 15 日,2024 年谷歌 I/
20、O 大会正式召开,会上谷歌将搜索业务做了最彻底的 AI 改造,更新升级了 Gemini1.5Pro 版本,推出 Gemini1.5Flash 轻量化小模型、生成视频模型 Veo、AI 智能体 Project Astra,并展示了与 GPT-4o 相似的语音视觉交互功能 Gemini Live。评论:评论:1、GPT 持续迭代,持续迭代,GPT-4o 推动人机交互再上新台推动人机交互再上新台阶阶GPT 持续迭代历程:持续迭代历程:OpenAI 自 2018 年发布第一代 GPT 以来,持续对其能力与版本进行迭代更新;2023 年 3 月发布的 GPT-4,在图片识别、图文数据综合处理、逻辑推理等
21、能力实现质变飞跃,也引发了全球 AI 领域的热潮;2023 年11 月,OpenAI 发布 GPT-4Turbo,支持高达 12.8 万 tokens 的同时也在上下文等多个领域实现显著进步。对于 GPT5,Sam Altman 表示“OpenAI 今年将会推出一个非常棒的模型,GPT-5 将带来类似于 GPT-3 到 GPT-4 那样的能力飞跃。”图图 1:GPT 发展历程发展历程资料来源:国家发改委、澎湃新闻、APPSO 等、国海证券研究所2024 年年 5 月月 14 日,日,GPT-4o 加持的加持的 ChatGPT 再次实现能力上的颠覆性跨越再次实现能力上的颠覆性跨越,将人机交互推入
22、新时代将人机交互推入新时代,兼具多模态交互兼具多模态交互+情绪感知能力情绪感知能力,同时实现毫秒级响应同时实现毫秒级响应。证券研究报告请务必阅读正文后免责条款部分7多模态交互多模态交互,具有更优质的视频和音频理解以及图像生成能力具有更优质的视频和音频理解以及图像生成能力。此次更新后,GPT-4o 可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合输出。与现有模型相比与现有模型相比,GPT-4o 在视觉和音频理解方面有更好的表现在视觉和音频理解方面有更好的表现:研发负责人 Barret 手写了一个方程,并打开摄像头拍给 ChatGPT,让它扮演老师的角色帮助自己解题
23、,最终 GPT 随着 Barret 在摄像头中解题实时给出鼓励和引导,并在要求下一步一步说出解题步骤。图图 2:GPT 视频解题视频解题资料来源:机器之心GPT-4o 在理解和生成图像方面的能力优于现有模型在理解和生成图像方面的能力优于现有模型,可以完成许多以前的模型无法完成的事情,图图 3:GPT-4o 将将 OpenAI 的的 logo 印到杯垫上印到杯垫上图图 4:GPT-4o 将输入的文字排版为手写体将输入的文字排版为手写体资料来源:机器之心资料来源:机器之心证券研究报告请务必阅读正文后免责条款部分8图图 5:输入几段文字就可以得到一组漫画分镜输入几段文字就可以得到一组漫画分镜图图 6
24、:由生活照生成海报由生活照生成海报资料来源:机器之心资料来源:机器之心情绪感知情绪感知。研发负责人 Mark Chen 向其表述略有紧张的情绪时,GPT 可以通过带有情感的方式给予安慰。此外在交互过程中此外在交互过程中,GPT-4o 与过往的语音助手最与过往的语音助手最大的不同表现在:大的不同表现在:1、可以随时打断、可以随时打断 AI,开启下一轮对话;,开启下一轮对话;2、充分理解人类情、充分理解人类情感,同时自身也可以表现情感,具备共情能力。感,同时自身也可以表现情感,具备共情能力。图图 7:研发负责人现场演示与研发负责人现场演示与 GPT-4o 对话并展现其情绪感知能力对话并展现其情绪感
25、知能力资料来源:机器之心跨越语音、文本、视觉多种形式直接进行推理,响应速度平均跨越语音、文本、视觉多种形式直接进行推理,响应速度平均 320 毫秒。毫秒。传统语音助手:传统语音助手:在 GPT-4o 发布之前,通过语音模式(Voice Mode)与ChatGPT 对话,平均延迟为 2.8 秒(GPT-3.5)和 5.4 秒(GPT-4)。主要原因系语音模式通常需要通过一个简单模型将音频转录成文本;GPT-3.5 或 GPT-4 接收文本并输出文本;第三个简单模型将文本转换回音频;以上三个步骤,导致信息丢失的同时无法直接观察语气、也无法表达情感。GPT-4o 实现跨越语音实现跨越语音、文本文本、
26、视觉多种形式直接进行推理视觉多种形式直接进行推理,达到毫秒级响达到毫秒级响应应。GPT-4o 是 OpenAI 首个端到端训练的跨越文本、视觉和音频的新模型,意味着所有输入和输出都由相同的神经网络处理,能以平均 320 毫秒做出响应,最快可以在 232 毫秒的时间内响应音频输入。证券研究报告请务必阅读正文后免责条款部分9英伟达科学家英伟达科学家 Jim Fan 对此评论对此评论:从技术角度来看,OpenAI 已经找到了一种方法,可以将音频直接映射到音频作为一级模态,并将视频实时传输到transformer。这些需要对 token 化和架构进行一些新的研究,但总体来说是一个数据和系统优化问题。图
27、图 8:英伟达科学家英伟达科学家 Jim Fan 评论评论资料来源:机器之心性能和成本优势有望加速性能和成本优势有望加速 AI+场景应用场景应用性能性能:在传统基准测试中,GPT-4o 在文本、推理和编码智能方面,达到了GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉能力方面创下了新高。图图 9:GPT-4o 在在 5-sho 常识问题上创常识问题上创 87.2%高分高分图图 10:GPT-4o 显著提高所有语言的语音识别性能显著提高所有语言的语音识别性能资料来源:机器之心资料来源:机器之心证券研究报告请务必阅读正文后免责条款部分10图图 11:GPT-4o 语音翻译语音翻译在在
28、MLS 基准测试优于基准测试优于 Whisper-v3图图 12:在所有语言基准测试中在所有语言基准测试中 GPT-4o 都比都比 GPT-4 更强更强资料来源:机器之心资料来源:机器之心成本:成本:在处理英语文本和代码方面,GPT-4o 的性能与 GPT-4 Turbo 相当,但在处理非英语文本时有显著改进。同时,相比 GPT-4 Turbo,推理速度提升 2 倍,且价格降低 50%。图图 13:API 速度飙升速度飙升 2 倍,价格减半倍,价格减半资料来源:新智元2、打造全新打造全新 GPT 语音助手且免费开放语音助手且免费开放,合作苹果合作苹果微软加速端侧落地微软加速端侧落地OpenAI
29、 通过通过 GPT-4o 打造的语音版打造的语音版 ChatGPT 助手助手,可以与用户跨音频可以与用户跨音频、视频视频进行交流进行交流,例如,让 GPT-4o 进行实时翻译、唱歌、做数学题、讲笑话等。具体给的功能展示如:应用场景应用场景 1:通过手机与:通过手机与 GPT-4o 视频,让其解读使用者的想法;视频,让其解读使用者的想法;GPT-4o可以描述 OpenAI 的员工拿着手机拍摄的周围场景,可以回答员工让其猜测的问题,也会像人一样表现出惊讶和停顿,这是以往任何语音助手都不具备的技术特征。证券研究报告请务必阅读正文后免责条款部分11应用场景应用场景 2:OpenAI 总裁兼联合创始人总
30、裁兼联合创始人 Greg Brockman 让两个让两个 GPT-4o语音助手互相对话并唱歌。语音助手互相对话并唱歌。图图 14:OpenAI 的员工与的员工与 GPT-4o 视频视频图图 15:两个两个 GPT-4o 语音助手互相对话并唱歌语音助手互相对话并唱歌资料来源:AIGC 开放社区资料来源:AIGC 开放社区应用场景应用场景 3:GPT-4o 不会像以往的 Chat GPT 一样直接给出答案,而是会一步步引导的方式帮助解答,充当教教的角色;应用场景应用场景 4:通过 GPT-4o 实时翻译了,当说完一句话时,GPT-4o 已经翻译好并实现语音输出。图图 16:GPT-4o 以家教的方
31、式一步步引导解题以家教的方式一步步引导解题图图 17:GPT-4o 实时翻译实时翻译资料来源:AIGC 开放社区资料来源:AIGC 开放社区GPT-4o 的文本和图像功能已经在的文本和图像功能已经在 ChatGPT 中开放使用中开放使用,免费注册用户也可以体验该功能,Plus 用户则提升 5 倍消息限制。同时 GPT-4o 模型的 API 也被同步放出,可以部署各种下游应用程序上。开发人员通过 API 可以访问 GPT-4o 的文本和视觉功能。未来几周内,OpenAI 会在 ChatGPT Plus 中推出新版语音模式 GPT-4o 的 alpha 版。证券研究报告请务必阅读正文后免责条款部分
32、12图图 18:OpenAI 将将 GPT-4o 在免费套餐中提供在免费套餐中提供资料来源:Any 硬科技苹果苹果 PC+移动端布局移动端布局,GPT 加速端侧落地加速端侧落地。PC 端端:OpenAI 宣布推出一款适用于 macOS 的桌面级应用,使用键盘快捷键就可向 ChatGPT 提问。用户可通过电脑与 ChatGPT 语音对话,GPT-4o 的新音频和视频功能后续将推出。移动端移动端:据每日经济新闻援引彭博社 5 月 10 日报道,苹果被曝正与 OpenAI 敲定一项协议,今年将后者的部分技术引入 iPhone。借此苹果将能提供由 ChatGPT支持的“聊天机器人”,作为 iOS 18
33、 中人工智能功能的一部分。图图 19:适用于适用于 mac 的桌面级应用的桌面级应用资料来源:新智元证券研究报告请务必阅读正文后免责条款部分13桌面级桌面级 GPT 支持在应用程序中直接截图并进行提问。支持在应用程序中直接截图并进行提问。图图 20:桌面端可直接截图提问桌面端可直接截图提问图图 21:总结截图的内容总结截图的内容资料来源:新智元资料来源:新智元看代码能力看代码能力。桌面级桌面级 GPT 可以理解画面中的代码并给出完整的描述,比如准确对应了函数名及其功能,并识别出了其中取平均值、最高值等操作的意图。图图 22:GPT 完美理解了代码中的内在逻辑完美理解了代码中的内在逻辑图图 23
34、:概述代码生成的图表并回答问题概述代码生成的图表并回答问题资料来源:新智元资料来源:新智元此外据此外据 IT 之家消息之家消息,OpenAI 在官方公告中表示在官方公告中表示 GPT 端侧应用今年晚些时候将端侧应用今年晚些时候将推出推出 Windows 版本。版本。3、谷歌发布谷歌发布 Project Astra、Veo 等等,多模态技术奇多模态技术奇点加速到来点加速到来AI Agent 是指人工智能代理,是一种能够感知环境、进行决策和执行动作的智是指人工智能代理,是一种能够感知环境、进行决策和执行动作的智能实体能实体,其核心驱动力是大模型其核心驱动力是大模型,在此基础上增加规划、记忆和工具使
35、用三个关键组件。原理是基于感知与理解、知识表示与推理、决策与执行以及学习与自适应等技术来实现的。它能够模拟人类的智能行为,处理复杂的任务,并根据环境的变化进行自适应和学习,从而提高智能化水平和性能。证券研究报告请务必阅读正文后免责条款部分14表表 1:AI Agent 的技术原理的技术原理技术原理技术原理主要内容主要内容感知与理解AI Agent 能够通过传感器、摄像头、语音识别等技术感知环境信息,并理解任务需求和目标,知识表示与推理AI Agent 通常采用知识表示和推理技术来处理感知和理解的信息。知识表示是将信息转化为可理解和可用的格式,而推理则是基于这些知识进行逻辑分析和推断。决策与执行
36、基于感知和理解的信息以及知识表示与推理的结果,AI Agent 需要制定相应的决策并执行相应的动作学习与自适应AI Agent 通过不断的学习和自适应,能够逐渐改进自身的性能和表现。资料来源:电子发烧友网、国海证券研究所谷歌谷歌 I/O 开发者大会发布多项重大更新。开发者大会发布多项重大更新。2024 年 5 月 15 日凌晨,Google I/O开发者大会上发布了通用 AI 智能体 Project Astra,可实现跨文本、音频、视频多模态实时推理。同时,谷歌正式发布一款全新的视频生成模型 Veo,谷歌声称,Veo 能够根据文本、图像创建超过 60 秒的高质量 1080P 视频,用户可以对光
37、照、镜头语言、视频颜色风格等进行设定。图图 24:Astra 对所有听到、看到的东西进行解读对所有听到、看到的东西进行解读图图 25:Astra 对草图、物品进行深度解读和联想对草图、物品进行深度解读和联想资料来源:AIGC 开放社区资料来源:AIGC 开放社区图图 26:Veo 根据文字内容生成视频根据文字内容生成视频 1图图 27:Veo 根据文字内容生成视频根据文字内容生成视频 2资料来源:机器之心资料来源:机器之心证券研究报告请务必阅读正文后免责条款部分15我们认为,OpenAI、谷歌等新品的推出谷歌等新品的推出,体现出多模态大模型技术的持续升级体现出多模态大模型技术的持续升级,GPT
38、-4o 的发布将革新人机交互模式的发布将革新人机交互模式,推动大模型在终端加速推广推动大模型在终端加速推广。随着多模态随着多模态技术奇点加速到来,未来基于大模型的创新应用将更值得期待,大模型技术将技术奇点加速到来,未来基于大模型的创新应用将更值得期待,大模型技术将全面赋能教育、办公等行业和场景。全面赋能教育、办公等行业和场景。4、相关相关个股个股GPT-4o、Gemini 新品陆续发布,多模态大模型技术奇点加速到来,大模型的新品陆续发布,多模态大模型技术奇点加速到来,大模型的商业价值商业价值、AI 应用的创新突破以及应用的创新突破以及 AI 算力需求的持续增长可期算力需求的持续增长可期,维持对
39、计算机维持对计算机行业行业“推荐推荐”评级。评级。(1)大模型:)大模型:科大讯飞、三六零、拓尔思、云从科技;(2)AI 应用应用:金山办公、万兴科技、福昕软件、焦点科技、虹软科技、彩讯股份、佳发教育、鸥玛软件、拓维信息;(3)AI 终端终端:华勤技术、软通动力、海康威视、大华股份、芯海科技、联想集团、飞荣达;(4)AI 算力算力:浪潮信息、工业富联、中科曙光、神州数码、紫光股份、中际旭创、沪电股份、新易盛、海光信息、寒武纪等。证券研究报告请务必阅读正文后免责条款部分16重点关注公司及盈利预测重点关注公司及盈利预测重点公司重点公司股票股票2024/5/15EPSPE投资投资代码代码名称名称股价
40、(元)股价(元)20232024E2025E20232024E2025E评级评级002230.SZ 科大讯飞42.840.280.360.57150.90119.5174.86买入601360.SH三六零8.51-0.070.010.03-123.471,293.77266.70未评级300229.SZ拓尔思16.630.050.300.41362.6954.8240.23未评级688111.SH金山办公279.502.853.654.9297.9576.6056.86买入300624.SZ 万兴科技83.350.630.770.95133.14107.2787.62增持688095.SH 福
41、昕软件54.88-0.99-0.260.26-55.21-209.09208.67未评级002315.SZ 焦点科技31.951.201.511.8426.7121.1817.37未评级688088.SH 虹软科技31.090.220.350.48142.6589.2664.56未评级300634.SZ 彩讯股份18.700.730.841.0425.7922.3617.95未评级300559.SZ 佳发教育11.270.330.490.6534.3623.0517.30未评级002261.SZ 拓维信息12.300.040.070.10342.86173.21119.50未评级603296.
42、SH 华勤技术71.213.734.304.9319.0916.5714.45买入301236.SZ 软通动力38.900.560.681.0569.4356.9437.11增持002415.SZ 海康威视33.091.511.782.0721.8918.5416.01未评级002236.SZ 大华股份17.392.231.191.397.7814.5612.51增持688595.SH 芯海科技28.02-1.01-0.280.14-27.82-99.77199.54买入300602.SZ飞荣达14.050.180.650.8978.6921.7215.71买入000977.SZ 浪潮信息39
43、.951.211.642.2532.9924.4017.71买入601138.SH 工业富联25.581.061.231.5424.1520.7416.66买入603019.SH 中科曙光44.531.251.571.9635.5028.3122.72买入000034.SZ 神州数码29.001.752.152.5816.5713.5111.22买入000938.SZ 紫光股份22.190.740.901.0830.1824.7720.64未评级300308.SZ 中际旭创170.502.716.128.2262.9827.8620.75未评级002463.SZ 沪电股份32.880.791.
44、181.4741.6027.9422.43未评级300502.SZ新易盛82.730.972.042.9585.3240.4628.09未评级688041.SH 海光信息72.540.540.720.98133.48100.3074.34买入688256.SH 寒武纪-U181.66-2.04-1.25-0.44-89.20-145.14-409.31未评级资料来源:Wind 资讯,国海证券研究所(注:已评级标的盈利预测来自国海证券,未评级标的盈利预测来自 wind 一致预期)5、风险提示风险提示1)宏观经济影响下游需求:宏观经济环境下行,将影响客户对信息化基础设施的采购需求;2)大模型发展不
45、及预期:行业主要驱动因素之一是大模型持续发展,若大模型等相关技术推进不及预期,或导致行业内公司业绩增速下行;3)市场竞争加剧:IT 产品和服务行业是成熟且完全竞争的行业,新进入者可能加剧整个行业的竞争态势;证券研究报告请务必阅读正文后免责条款部分174)中美博弈加剧:国际形势持续不明朗,美国不断通过“实体清单”等方式对中国企业实施打压,若中美紧张形势进一步升级,将可能导致中国半导体供应链供应受到影响;5)相关公司业绩不及预期:市场环境变化、公司治理情况变化、其他非主营业务经营不及预期等原因或将导致相关公司的整体业绩不及预期。国海证券股份有限公司国海证券研究所请务必阅读正文后免责条款部分【计算机
46、小组介绍】【计算机小组介绍】刘熹,计算机行业首席分析师,上海交通大学硕士,多年计算机行业研究经验,致力于做前瞻性深度研究,挖掘投资机会。新浪金麒麟新锐分析师、Wind 金牌分析师团队核心成员。【分析师承诺】【分析师承诺】刘熹,本报告中的分析师均具有中国证券业协会授予的证券投资咨询执业资格并注册为证券分析师,以勤勉的职业态度,独立,客观的出具本报告。本报告清晰准确的反映了分析师本人的研究观点。分析师本人不曾因,不因,也将不会因本报告中的具体推荐意见或观点而直接或间接收取到任何形式的补偿。【国海证券投资评级标准】【国海证券投资评级标准】行业投资评级推荐:行业基本面向好,行业指数领先沪深 300 指
47、数;中性:行业基本面稳定,行业指数跟随沪深 300 指数;回避:行业基本面向淡,行业指数落后沪深 300 指数。股票投资评级买入:相对沪深 300 指数涨幅 20%以上;增持:相对沪深 300 指数涨幅介于 10%20%之间;中性:相对沪深 300 指数涨幅介于-10%10%之间;卖出:相对沪深 300 指数跌幅 10%以上。【免责声明】【免责声明】本报告的风险等级定级为 R3,仅供符合国海证券股份有限公司(简称“本公司”)投资者适当性管理要求的客户(简称“客户”)使用。本公司不会因接收人收到本报告而视其为客户。客户及/或投资者应当认识到有关本报告的短信提示、电话推荐等只是研究观点的简要沟通,
48、需以本公司的完整报告为准,本公司接受客户的后续问询。本公司具有中国证监会许可的证券投资咨询业务资格。本报告中的信息均来源于公开资料及合法获得的相关内部外部报告资料,本公司对这些信息的准确性及完整性不作任何保证,不保证其中的信息已做最新变更,也不保证相关的建议不会发生任何变更。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。报告中的内容和意见仅供参考,在任何情况下,本报告中所表达的意见并不构成对所述证券买卖的出价和征价。本公司及其本公司员工对使用本报告及其
49、内容所引发的任何直接或间接损失概不负责。本公司或关联机构可能会持有报告中所提到的公司所发行的证券头寸并进行交易,还可能为这些公司提供或争取提供投资银行、财务顾问或者金融产品等服务。本公司在知晓范围内依法合规地履行披露义务。【风险提示】【风险提示】市场有风险,投资需谨慎。投资者不应将本报告视为作出投资决策的唯一参考因素,亦不应认为本报告可以取代自己的判断。在决定投资前,如有需要,投资者务必向本公司或其他专业人士咨询并谨慎决策。在任何情况下,国海证券股份有限公司国海证券研究所请务必阅读正文后免责条款部分本报告中的信息或所表述的意见均不构成对任何人的投资建议。投资者务必注意,其据此做出的任何投资决策
50、与本公司、本公司员工或者关联机构无关。若本公司以外的其他机构(以下简称“该机构”)发送本报告,则由该机构独自为此发送行为负责。通过此途径获得本报告的投资者应自行联系该机构以要求获悉更详细信息。本报告不构成本公司向该机构之客户提供的投资建议。任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无效。本公司、本公司员工或者关联机构亦不为该机构之客户因使用本报告或报告所载内容引起的任何损失承担任何责任。【郑重声明】【郑重声明】本报告版权归国海证券所有。未经本公司的明确书面特别授权或协议约定,除法律规定的情况外,任何人不得对本报告的任何内容进行发布、复制、编辑、改编、转载、播放、展示或以其他任何方式非法使用本报告的部分或者全部内容,否则均构成对本公司版权的侵害,本公司有权依法追究其法律责任。