上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

电子行业“FPGA五问五答”系列报告二:FPGA和CPU、GPU有什么区别?为什么越来越重要?-230417(16页).pdf

编号:122787 PDF 16页 2.70MB 下载积分:VIP专享
下载报告请您先登录!

电子行业“FPGA五问五答”系列报告二:FPGA和CPU、GPU有什么区别?为什么越来越重要?-230417(16页).pdf

1、 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 行业研究 东兴证券股份有限公司证券研究报告 FPGAFPGA和和CPUCPU、GPUGPU有什么区别?有什么区别?为什么越来为什么越来越重要?越重要?“FPGA五问五答”系列报告二 2023 年 4 月 17 日 看好/维持 电子电子 行业行业报告报告 分析师分析师 李美贤 电话: 邮箱 limx_ 执业证书编号:S04 投资摘要:近年来,诸如 TPU、MPU、DPU 等的“X”PU 们似乎层出不穷,市场经常会对这些新创造出的名词感到困惑:为什么会出现这么多的单元?作为我们作为我们 F FPGAPG

2、A 五问五答五问五答系列报告系列报告二二,在在这篇报告中,这篇报告中,我们我们进一步回答进一步回答投资人最投资人最常常问问的问的问题之一:题之一:F FPGAPGA 和和 C CPUPU、G GPUPU有什么区别有什么区别?为什么越来越重要?为什么越来越重要?我们认为,这个问题不是简单回答他们的区别就可以解决的,因此我们单拎出来解答。我们认为,众多“X”PU 出现的原因,本本质上是由于质上是由于 CPU 的算力到达瓶颈了,背后是通用计算时代的终结。的算力到达瓶颈了,背后是通用计算时代的终结。从发明以来,CPU 算力的提升主要依靠两大法宝:一是提高时钟频率,二是增加处理器内核数,但这些方法到现在

3、也遇到瓶颈了,人们开始放弃使用一个超强的 CPU 完成所有事情,而是对某些重复的场景,卸载到专用的加速器,以达到新一阶段的降低功耗,提升性能的目的,这就是“XPU”等加速器兴起的原因。同时,自 2010 年 AI 兴起,AI 模型的训练所需的算力是爆发式的增长,且“加&乘”的本质使得算力要求愈发偏向高并行而不是高串行,因此 CPU 越来越难以胜任高算力的场景,通用计算时代终结,数据中心走向加速器时代。未来未来 10 年,在数据中心高性能计算及年,在数据中心高性能计算及 AI 训练中,训练中,CPU 这一这一“主角主角”的重要性下降,而以往的的重要性下降,而以往的“配配角们角们”,即,即 GPU

4、、FPGA、TPU、DPU等的加速器的重要性在上升。等的加速器的重要性在上升。FPGA 相比相比 CPU 的巨大优势在于确定性的低时延,这是架构差异造成的。的巨大优势在于确定性的低时延,这是架构差异造成的。CPU 的利用率越高,处理时延便越大,而 FPGA无论利用率大小,其处理时延是稳定的。在汽车和工业这些需要确定低时延的场景,FPGA具有非常大的优势。此外,FPGA相比 CPU,具有更高的灵活性。FPGA相比相比 GPU的优势在于更低的功耗和时延。的优势在于更低的功耗和时延。GPU 无法很好地利用片上内存,需要频繁读取片外的 DRAM,因此功耗非常高。FPGA 可以灵活运用片上存储,因此功耗

5、远低于 GPU。FPGA“无批次(Batch-less)“的架构,使其在 AI 推理中相比GPU 具有非常强的时延优势。此外,GPU 的接口单一,而 FPGA在接口灵活性上具有无可比拟的优势,特别适合工业场景。为什么为什么 FPGA是战略芯片?是战略芯片?我们认为,未来科技发展有两个领域处于战略地位:一是 AI,二是太空。AI 代表人类更高级别的生产力工具,而太空是可供人类开发探索的广阔而未知领域。FPGA凭借其架构带来的时延和功耗优势,在 AI 推理中具有非常大的优势。同样,FPGA独特的优势使其在航空航天领域有非常广泛的应用。目前,我们看到太空活动发生新变化,背后是太空不断增长的算力需求。

6、目前,我们看到太空活动发生新变化,背后是太空不断增长的算力需求。变化 1:地球观测、探火活动在增加;变化 2:寻求扩大 AI 在太空的应用,以及宽带卫星通信的快速增长,提高了算力要求;变化 3:航天级器件的代际差在缩小,处理能力越来越接近目前最高水平。当今全球地缘政治紧张的背景下,各国自有卫星星座需求激增,太空活动进入新活跃期。FPGA在航天领域为什么更具有优势?在航天领域为什么更具有优势?主要有两点原因:1)FPGA可以降低项目的时间和金钱成本。航空航天存在着小批量多品种的应用,本质是一个长尾的市场,能够适配的 ASSP 较少,而如果专门设计一颗 ASIC 成本则会非常高,时间也会变得非常长

7、,由此造成的时间成本不是线性的。FPGA“万能”的特点,可以节省 ASIC 的 NRE 成本,设计周期也大幅缩短,避免重复的可靠性认证,加快项目进展;2)FPGA 动态可重构的特点可以降低在轨错误。太空项目本质是风险厌恶的,一旦发生错误,可能导致数亿美元甚至生命的损失。航天级的 FPGA 可以通过定期刷新回读、动态重构的方式,避免或者减轻宇宙射线对自身造成的破坏,是其它器件所无法做到的。风险提示:风险提示:下游需求不及预期,中美贸易战超预期。P2 东兴证券深度报告东兴证券深度报告 FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 敬请参阅报告结尾处的

8、免责声明 东方财智 兴盛之源 目目 录录 1.为什么会有这么多的为什么会有这么多的“X”PU?“配角们配角们”的时代的时代.3 2.相比相比 CPU,FPGA的并行性和灵活性更高,能提供确定性的时延的并行性和灵活性更高,能提供确定性的时延.5 3.相比相比 GPU,FPGA的时延和功耗更有优势的时延和功耗更有优势.8 4.FPGA 的战略意义:的战略意义:AI&Space.11 风险提示风险提示.14 插图目录插图目录 图图 1:CPU面临算力瓶颈的原因面临算力瓶颈的原因.3 图图 2:2010年兴起以来,年兴起以来,AI 模型对算力的要求呈现爆发式增长,速度远超摩尔定律模型对算力的要求呈现爆

9、发式增长,速度远超摩尔定律.4 图图 3:MLP网络本质是并行的乘法和累加,非常适合在网络本质是并行的乘法和累加,非常适合在 FPGA中实现中实现.4 图图 4:微软的微软的 Azure使用使用 FPGA加速加速 Bing 搜索,网络吞吐量大幅上升,时延下降了搜索,网络吞吐量大幅上升,时延下降了 80%.5 图图 5:FPGA能完成能完成 SIMD、MISD和和 MIMD 的处理,特别适合并行计算的处理,特别适合并行计算.6 图图 6:将将 CPU的核心简化以加快执行速度,是的核心简化以加快执行速度,是 GPU设计的思想设计的思想.6 图图 7:FPGA的时延远低于的时延远低于 CPU,是因为

10、其架构不需要在获取指令、编译指令、分支预测等方面花费时间,是因为其架构不需要在获取指令、编译指令、分支预测等方面花费时间.7 图图 8:FPGA确定性的低时延,使其在工业和汽车上具有非常大的优势确定性的低时延,使其在工业和汽车上具有非常大的优势.7 图图 9:FPGA可以灵活利用片上内存,不需要像可以灵活利用片上内存,不需要像 CUDA一样从一样从 DRAM 来回读写数据来回读写数据.8 图图 10:FPGA 仅用仅用 200MHz,就可以实现比,就可以实现比 CPU快快 43倍、比倍、比 GPU快快 3 倍的效果,而且功耗仅为倍的效果,而且功耗仅为 GPU的的 20%.9 图图 11:FPG

11、A 的时延低于的时延低于 GPU,无批次的结构,使其在,无批次的结构,使其在 AI 推理特别有优势推理特别有优势.10 图图 12:FPGA 更适合更适合 AI 推理,在低时延、非标准化的场景非常有优势推理,在低时延、非标准化的场景非常有优势.10 图图 13:近近 5年来,在地缘政治紧张的态势下,中美两国太空发射次数迅速增长年来,在地缘政治紧张的态势下,中美两国太空发射次数迅速增长.11 图图 14:美国太空活动的新变化,反映出航空航天领域不断增长的算力需求美国太空活动的新变化,反映出航空航天领域不断增长的算力需求.12 图图 15:FPGA 在航天项目的参与度非常高在航天项目的参与度非常高

12、.12 5X9UgVjZeYlWsXvUqZ6MaOaQoMqQmOoNkPrRrNlOpOsN7NoPxPuOnRqNwMrRqO 东兴证券深度报告东兴证券深度报告 FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 P3 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 1.为什么会有这么多的为什么会有这么多的“X”PU?“配角们配角们”的时代的时代 近年来,诸如 TPU、MPU、DPU 等的”X”PU 们似乎层出不穷,市场经常会对这些新创造出的名词感到困惑:为什么会出现这么多的单元?本质上是为什么会出现这么多的单元?本质上是由于由于 CPU 的算

13、力的算力到达瓶颈了到达瓶颈了,背后是背后是通用计算通用计算时代时代的终结的终结。从发明以来,CPU 算力的提升主要依靠两大法宝:一是提高时钟频率提高时钟频率,但时钟频率提升面临瓶颈了。但时钟频率提升面临瓶颈了。因为越高的时钟频率,意味着每秒可执行的运算次数越高,但随着电压下降到 0.6v 的“底限”,Dennard 缩放定律(Dennard Scaling)在 05 年开始崩溃,再提高时钟频率就会使得功耗以指数级别增长,因此我们在 05 年后遇到了频率墙;二是增加处理器内核数增加处理器内核数,换取频率降低带来的功耗预算,但由于核间调度同样需要时延和功耗花销,很快,核数的增长又遇到了瓶颈,由于数

14、据中心的散热技术约束了功率增长,导致处理器上许多核无法同时工作,这就是暗硅效应。因此,人们人们开始放弃使用一个超强的开始放弃使用一个超强的 CPU 完成所有事情,而是对某些重复的场景,完成所有事情,而是对某些重复的场景,卸载到专用的加速器,以达到卸载到专用的加速器,以达到新一阶段的降低功耗,提升性能的目的,这就是新一阶段的降低功耗,提升性能的目的,这就是“XPU”等加速器兴起的原因。等加速器兴起的原因。图图1:CPU面临面临算力瓶颈的原因算力瓶颈的原因 资料来源:Intel,Princeton University,东兴证券研究所绘制 同时,自自 2010 年年 AI 兴起,兴起,AI 模型的

15、训练所需的算力模型的训练所需的算力是是爆发式爆发式的的增长增长,且且“加“加&乘”的本质乘”的本质使得使得算力要求算力要求愈愈发偏向发偏向高并行高并行而不是而不是高串行高串行。CPU 越来越难以胜任高算力的场景,将需要大规模、高密度的计算任务卸载到在某一方向做了优化的专用处理器,就产生了这些不同的“X”PU,他们之间区别在于在某些场景的专用性。P4 东兴证券深度报告东兴证券深度报告 FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 图图2:2010 年年兴起兴起以来,以来,AI 模型模型对算力的要求对

16、算力的要求呈现呈现爆发式增长爆发式增长,速度远超摩尔定律,速度远超摩尔定律 资料来源:OpenAI,东兴证券研究所绘制 通用计算时代终结,通用计算时代终结,数据中心走向加速器时代数据中心走向加速器时代。未来未来 10 年,年,FPGA 的重要性的重要性不断上升不断上升。随着 CPU 算力逐渐达到瓶颈,越来越无法满足神经网络指数级增长的算力需求。在数据中心这一人类算力需求最高的设施中,算力发展的方向愈发转向专用性,以寻求更高的性能、更低的能耗和成本。我们看到,未来 10 年,在数据中心高性能计算及 AI 训练中,CPU 这一“主角”的重要性下降,而以往的“配角们”,即 GPU、FPGA、TPU、

17、DPU 等的加速器的重要性在上升。图图3:MLP 网络本质是并行的乘法和累加,非常适合在网络本质是并行的乘法和累加,非常适合在 FPGA中实现中实现 资料来源:FPGA Neurocomputers,东兴证券研究所 东兴证券深度报告东兴证券深度报告 FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 P5 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 因此,从从 2017 年开始,年开始,越来越多的大型公有云越来越多的大型公有云开始正式开始正式使用使用 FPGA、GPU 作为加速器作为加速器,以以获得数百倍于获得数百倍于CPU 的性能提升的性能提升

18、。例如,微软的 Catapult 项目就使用了 FPGA以加速 Bing 的搜索速度,AWS的 F1 Instances将 FPGA 的算力作为服务提供给客户,阿里云使用了 FPGA 为其“双十一”进行了零售交易系统的加速。图图4:微软的微软的 Azure 使用使用 FPGA加速加速 Bing 搜索搜索,网络吞吐量大幅上升,时延下降了,网络吞吐量大幅上升,时延下降了 80%资料来源:微软,东兴证券研究所 2.相比相比 CPU,FPGA的的并行并行性性和灵活性和灵活性更高更高,能提供确定性的时延,能提供确定性的时延 处理器负责对外界输入的数据进行处理,处理器负责对外界输入的数据进行处理,CPU、

19、GPU、FPGA 等处理器的区别在于处理流程等处理器的区别在于处理流程,CPU 的处理流程使其擅长串行计算,以复杂的控制为特征,GPU 和 FPGA 的则更擅长大规模的并行计算:CPU 是冯诺依曼架构下的处理器,遵循“Fetch(取指)-Decode(译码)-Execute(执行)-Memory Access(访存)-Write Back(写回)”的处理流程,数据要先通过控制单元获取存在 RAM 中的指令,再解码得知用户需要对数据做何种运算,然后再将数据送到 ALU 进行对应的处理,结束运算后存回 RAM,再获取下一个指令。这一处理流程,即 SISD(Single Instruction Si

20、ngle Data),决定了 CPU 擅长决策擅长决策和控制,但在和控制,但在多多数据处理任务中效率较低。数据处理任务中效率较低。现代的 CPU 可以同时做到 SISD 和 SIMD 的处理,但在并行规模上依然不如 GPU 和 FPGA。GPU 遵循的是 SIMD(Single Instruction Multiple Data)的处理方式,通过在多个线程上运行统一的处理方式,即 Kernel,来达到将 CPU 发送过来的数据做高并行处理的目的。由于去除了现代 CPU 中分支预测、乱序执行、存储预取等模块,也减少了许多 cache 的空间,GPU 中经过简化后的“核”能实现非常大规模的并行运算

21、,并且节省了大部分 CPU 需要花费在分支预测、重排的时间,但缺点是需要数据适应 GPU 的处理框架,例如需要数据做批次对准,因此依然无法达到最大的实时性。FPGA 则是由用户自定义处理流程,可以直接决定片上的 CLB 是如何相连的,数十万个 CLB 可以独立运算,即 SIMD、MISD(Multiple Instruction Single Data)和 MIMD(Multiple Instruction Multiple Data)的处理都可以在FPGA实现,由于处理流程已经映射到硬件上,不需要再额外花费时间获取和编译指令,同样不需要像CPU一样花费时间在乱序执行等步骤,这使得FPGA在数

22、据处理中具有非常高的实时性。P6 东兴证券深度报告东兴证券深度报告 FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 图图5:FPGA能完成能完成 SIMD、MISD和和 MIMD的处理,特别适合并行计算的处理,特别适合并行计算 资料来源:Flynn,东兴证券研究所绘制 因此,GPU 和和 FPGA 都是作为都是作为 CPU 的任务卸载单元,在并行计算的效率都高的任务卸载单元,在并行计算的效率都高于于 CPU。在数据中心高性能计算的场景中,GPU 和 FPGA 往往以分立的加速卡形式存在,即 CPU

23、将部分密集计算的任务“卸载”到GPU 或者 FPGA,这些“器件”通过 PCIe 和 CPU 互联,以完成高并行的计算加速。图图6:将将 CPU的核心简化以加快执行速度,是的核心简化以加快执行速度,是 GPU设计的思想设计的思想 资料来源:Virginia Tech,东兴证券研究所绘制 东兴证券深度报告东兴证券深度报告 FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 P7 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 FPGA 相比相比 CPU 的巨大优势在于确定性的的巨大优势在于确定性的低低时延时延,这是架构,这是架构差异差异造成的造成的。C

24、PU 的时延是不确定的,当利用率升高时,CPU 需要处理更多的任务,这就需要 CPU 进行任务调度重排,因此造成处理时延往往是不可控制地变大,即任务越多算得越慢。而 FPGA 的时延之所以是确定的,是因为在布局布线阶段,设计工具就已经确保能够让最差路径满足时序要求,不需要再花费时间在获取指令、解码指令等通用处理器需要的步骤,也避免了随之而来的重排执行顺序、指令调度等待的问题。图图7:FPGA的时延远低于的时延远低于 CPU,是因为,是因为其其架构不需要在获取指令、编译指令、架构不需要在获取指令、编译指令、分支预测等分支预测等方面方面花费时间花费时间 资料来源:Parker,东兴证券研究所绘制

25、CPU 的利用率越高,处理时延便越大的利用率越高,处理时延便越大,而,而 FPGA 无论利用率大小,其处理时延是无论利用率大小,其处理时延是稳定稳定的的。FPGA 可以提供纳秒级的处理时延,而 CPU 通常在毫秒级。例如,在自动驾驶系统中,将摄像头的数据直接传输到 FPGA的 MIPI 接口中,其最好和最差情况下的处理时延差距仅为 22ns,而在有 CPU 参与数据传输的情况下,这一差距在 23ms 以上,相当于 CPU 在繁忙情况下时延翻倍。此外,当利用率上升到 90%时,CPU 的处理时 图图8:FPGA确定性的低时延,使其在工业和汽车上具有非常大的优势确定性的低时延,使其在工业和汽车上具

26、有非常大的优势 资料来源:Intel,东兴证券研究所绘制 P8 东兴证券深度报告东兴证券深度报告 FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 间长达 46ms,对于以 100km/h 的速度行驶的汽车,46ms 意味着摄像头从看到障碍物,到汽车系统采取制动措施时,车子已经开出了至少 1.28 米的距离,而 FPGA 仅有 3-6米,即可以等同为瞬间就能反应,省去的这 1.28m 的距离,就可能减少许多碰撞事故的发生概率。因此,在汽车和工业这些需要在汽车和工业这些需要确定低时延的场景,确定低时延的

27、场景,FPGA 具有非常大的优势。具有非常大的优势。FPGA 相比相比 CPU,具有更高的灵活性。,具有更高的灵活性。在工业现场往往有许多需要细微调整,例如,根据传送带磨损情况对马达进行细微的控制调整,为设备更新新的协议等等,CPU 往往难以做到,由于 FPGA 是动态可重构的,可以在使用现场调整,随时适应新的变化。此外,FPGA 还可以同时融合工业现场的 PLC、网关、传感器、马达、HMI 等设备,实现不同设备的实时控制和通信。3.相比相比 GPU,FPGA的的时延时延和和功耗功耗更有优势更有优势 GPU 的功耗非常高的功耗非常高,因为其无法,因为其无法很好地很好地利用片上内存,需要频繁读取

28、片外的利用片上内存,需要频繁读取片外的 DRAM。尽管在吞吐量上的优势使得 GPU 几乎垄断了深度学习领域,但 GPU 依赖片外存储的处理流程,使其在功耗和时延上对比 FPGA有非常大的弱势。以英伟达的 GPU 为例,使用 CUDA 进行训练,主要有四个步骤:1)将数据从 CPU 的外部存储(DRAM)复制到 GPU 的存储中;2)CPU 加载(Lauch)需要进行的计算,即 Kernel 到 GPU 中;3)GPU 执行 CPU 发送过来的指令;4)GPU 将结果最终存回 CPU 的 DRAM 中,再进行下一个 Kernel 的计算。因此,CUDA涉及了两次存储读写。而 FPGA可以将第一个

29、 Kernel 的结果缓存到片上星罗棋布的 BRAM中,完全可以不需要读写外部存储就能完成整个算法。由于读取 DRAM 所消耗的能量是 SRAM 的 100 倍以上,是加法的 6400 倍,GPU 这一需要频繁读取 DRAM 的处理,使其功耗远高于 FPGA,而且 DRAM 的带宽往往成为了性能的瓶颈。一片 FPGA 的典型功耗通常是 30W 50W,而单片 GPU 功耗就可以高达 图图9:FPGA可以灵活利用片上内存,不需要可以灵活利用片上内存,不需要像像 CUDA一样一样从从 DRAM 来回读写数据来回读写数据 资料来源:NVIDA,东兴证券研究所绘制 东兴证券深度报告东兴证券深度报告 F

30、PGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 P9 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 250W 400W,使得单机柜的功率密度可能高达 28kw,这对数据中心的现有的散热造成了巨大压力,往往需要专门更改制冷和供电系统,以适应单柜 15kw 以上的功率密度,而 FPGA 数十瓦的功耗可以和现有数据中心散热兼容,不需要额外改造。FPGA 可以灵活运用片上存储,因此功耗远低于可以灵活运用片上存储,因此功耗远低于 GPU。FPGA 完全可以不需要读 DRAM,整个算法在片上完成。例如,深鉴科技利用 FPGA 做出了 ESE 的模型并在不同的

31、处理器(CPU/GPU/FPGA)上运行,发现FPGA 上训练时长最短,能耗最小。在能耗上,CPU Dense 耗能 11W、CPU Sparse 耗能 38W、GPU Dense耗能 202W,这是耗能最大的一种情况、GPU Spare 耗能 136W,相比之下 FPGA 仅需 41W;在训练时延上,FPGA 用时 82.7s,远小于 CPU 的 6017.3s,也仅为 GPU 训练时长的三分之一。图图10:FPGA仅用仅用 200MHz,就可以实现比,就可以实现比 CPU快快 43倍、比倍、比 GPU快快 3 倍倍的效果,而且功耗仅为的效果,而且功耗仅为 GPU的的 20%资料来源:ESE

32、:Efficient Speech Recognition Engine with Sparse LSTM on FPGA,Energy table for 45nm process,东兴证券研究所绘制 FPGA“无批次无批次(Batch-less)“)“的架构,的架构,使使其在其在 AI 推理中推理中具有具有非常强的时延非常强的时延优势优势。受限于网络条件和时延,许多决策来不及上传云端,只能本地执行,这就是边缘计算。边缘计算通常面临时延和功耗两大约束。GPU需要等待批次的特点,使其时延要高于 FPGA。GPU 通常需要将不同的训练样本划分成固定大小的“Batch(批次)”,为了最大化达到并行

33、性,需要将数个 Batch 都集齐,再统一进行处理,每个 Batch 的数据一般有近百个。这使得 GPU 在训练大型样本时非常有优势,但在做涉及小样本的推理时,这一优点成为了劣势,因为推理通常只需要很小的输入数据,而 GPU 的架构额外引入了时延。FPGA 的架构是无批次(Batch-less)的,可以根据数据特点确定处理方式,不需要像 GPU 一样将输入的数据划分成 Batch,因此可以做到最低的时延,使得 FPGA 在进行 AI 推理时具有非常大的优势。FPGA 在接口灵活性上具有无可比拟的优势,特别适合工业场景。在接口灵活性上具有无可比拟的优势,特别适合工业场景。工业实质是高度分散的小批

34、量场景,存在大量的非标准的接口,例如,工业的图像传感器的 LVDS 编码格式往往没有统一的标准,工程师很难找到对应的专用芯片去对接。GPU 的接口单一,只有 PCIe 一种,而 FPGA 的可编程性使其能与任何的器件进行通信,能够适应任何的标准和非标准的接口,这种硬件可编程带来的高度灵活性是 FPGA 在工业场景的优势。目前,阻碍目前,阻碍 FPGA 市场进一步扩大的原因是其较高的使用门槛市场进一步扩大的原因是其较高的使用门槛,正通过,正通过 HLS 等工具解决等工具解决。CPU 使用人员更多是软件工程师,语言基本为 C/C+等编程语言,GPU 亦有 CUDA 等非常完善的开发框架,而 FPG

35、A 的使用者更多像是硬件工程师,需要自行定义电路功能、进行时序优化等步骤,语言基本为 Verilog/VHDL 这两种 P10 东兴证券深度报告东兴证券深度报告 FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 图图11:FPGA的时延低于的时延低于 GPU,无批次的结构,无批次的结构,使其在,使其在 AI 推理特别有优势推理特别有优势 资料来源:Xilinx,东兴证券研究所绘制 硬件描述语言,需要使用者精通软件和硬件,难度因此更大。因此,为了降低使用门槛,FPGA 学界和业内合作推出了 HLS(Hi

36、gh-level Synthesis,高层次综合)的工具,可以通过 C/C+语言直接生成能供 FPGA使用的 RTL 网表,跳过中间的硬件描述环节,让工程师更加专注 AI 算法的开发和迭代。图图12:FPGA更适合更适合 AI 推理,在低时延、非标准化的场景非常有优势推理,在低时延、非标准化的场景非常有优势 资料来源:BERTEN,东兴证券研究所绘制 东兴证券深度报告东兴证券深度报告 FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 P11 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 4.FPGA 的战略意义:的战略意义:AI&Space 为什

37、么为什么 FPGA 是战略芯片?是战略芯片?我们认为,未来科技发展有两个领域处于战略地位:一是 AI,二是太空。AI 代表人类更高级别的生产力工具,而太空是可供人类开发探索的广阔而未知领域。FPGA 凭借其架构带来的时延和功耗优势,在 AI 推理中具有非常大的优势。同样,FPGA 独特的优势使其在航空航天领域有非常广泛的应用。全球地缘政治紧张下,各国自有卫星星座需求激增,太空活动进入新活跃期。全球地缘政治紧张下,各国自有卫星星座需求激增,太空活动进入新活跃期。上一个太空发射活跃期在1957-1977 年,美苏在太空领域展开激烈竞争,两国年平均发射活动均超 40 次。随着美苏太空竞赛结束,20

38、年间太空发射数大幅回落。而在近年地缘政治紧张态势下,各国部署自有通信卫星星座需求激增。中美两国在近 3 年的太空发射活动剧升,仅去年全年,中美发射次数合计占全球 76%。由于频段和低轨空间是不可再生资源,各国的低轨卫星计划实际承担“占频保轨”的任务。随着大批的低轨卫星计划在未来 4-5 年内完成发射组网,太空活动实际已进入新的活跃期。图图13:近近 5 年来,年来,在地缘政治紧张的态势下,在地缘政治紧张的态势下,中美两国太空发射次数中美两国太空发射次数迅速迅速增长增长 资料来源:Launch Logs,东兴证券研究所绘制 目前,目前,我们看到我们看到太空活动发生太空活动发生了了三大三大新变化,

39、新变化,背后背后反映的是反映的是太空太空不断增长不断增长的的算力算力需求需求。美国 JPL(Jet Propulsion Laboratory,喷气推进实验室)是美国国家航空航天局(NASA)负责无人太空探测的机构,我们统计了 JPL 目前的所有任务目标,发现了以下三大变化:1)地球观测地球观测、探火活动、探火活动在在增加。增加。以地球为目标的太空活动占比 35%,目的主要有气象和环境观测,构建与外太空交流的深太空网络(DSN),利用合成孔径雷达对地面进行高精度观测等,主要是出于军事及科研目的;而火星相关的活动占比高达 15%,是因为火星是与地球最相似的行星,了解火星表面的岩石、气候,目的是了

40、解火星在过去是否有生命存在,可以为人类探索和开发火星做准备。P12 东兴证券深度报告东兴证券深度报告 FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 2)寻求扩大)寻求扩大 AI 在太空的应用,以及宽带卫星通信的快速增长,提高了算力要求。在太空的应用,以及宽带卫星通信的快速增长,提高了算力要求。以观测卫星为例,地球60%图图14:美国美国太空活动的新变化,反映出太空活动的新变化,反映出航空航天领域不断增长的算力需求航空航天领域不断增长的算力需求 资料来源:JPL,Xilinx,东兴证券研究所绘制 以

41、上的面积常年被云层覆盖,只有 10%的区域是晴空无云的状态,以往观察卫星都是不加甄别,将拍摄的照片全部回传地面处理。如今,在观察卫星上使用 AI 识别出含有云层的照片并丢弃,只回传清晰的照片,可以节省本就有限的星地通信的带宽。除此之外,宽带卫星通信要求卫星具备星上处理和转发数据的能力,以降低时延,减少对地面站的依赖;3)航天级器件的代际差在缩小航天级器件的代际差在缩小,处理能力越来越接近目前最高水平,处理能力越来越接近目前最高水平。过去,航天级 FPGA 的推出时间一般晚于对应商业级器件 3-5 年,长期落后于当时最领先的器件 1-2 个代际,10-15 年前的 FPGA 依然在航天器上广泛使

42、用。然而,近两年来,我们看到 FPGA 龙头赛灵思加快了宇航级 FPGA 的推出。目前,赛灵思最先进的FPGA 产品是 19 年推出的 Versal(7nm),而赛灵思在 21 年初就推出了宇航级的 Versal XQR,做到了和商业级同代际。Versal XQR 不仅逻辑单元数相比往代大幅增加,还嵌入了 AI 处理单元、高速的收发器等,大幅提高了低轨卫星的处理能力和反应时间。图图15:FPGA在航天项目的参与度非常高在航天项目的参与度非常高 东兴证券深度报告东兴证券深度报告 FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 P13 敬请参阅报告结尾

43、处的免责声明 东方财智 兴盛之源 资料来源:Xilinx,NASA,东兴证券研究所绘制 FPGA 在航天领域为什么更具有优势在航天领域为什么更具有优势?主要有两点原因:1)FPGA 可以降低可以降低项目的项目的时间和金钱成本。时间和金钱成本。航空航天存在着小批量多品种的应用,本质是一个长尾的市场,因此能够适配的 ASSP 较少,而如果专门设计一颗 ASIC 成本则会非常高,时间也会变得非常长,由此造成的时间成本不是线性的由此造成的时间成本不是线性的。例如,地球和火星大约每两年(780 天)距离最短,此时发射所需能量最小,窗口期大多只有 2 个月,如果没有来得及在窗口期完成发射,即使只差一个月,

44、下一次发射就要再等两年,而 FPGA“万能”的特点,可以节省 ASIC 的 NRE 成本,设计周期也大幅缩短,避免重复的可靠性认证,加快项目进展;2)FPGA 动态可重构的特点可以动态可重构的特点可以降低在轨错误。降低在轨错误。太空项目本质是风险厌恶的,因为一旦发生错误,可能导致数亿美元甚至生命损失。航天器运行在充满高能粒子的太空环境中,宇宙射线随时可能对电子器件造成损坏,而航天级的 FPGA 可以定期刷新回读,避免 SEU 等事件造成的故障。当在轨航天器发生错误时,地面可以直接发送指令让 FPGA 进行重构,即在轨动态重构;如果部分 LUT 被宇宙射线造成物理损坏,完全可以绕开损坏部分进行重

45、构;对于已经运行了多年的卫星,可以重构更新其功能,不需要发射新的卫星。FPGA这一在轨可重构是其它器件所无法做到的。P14 东兴证券深度报告东兴证券深度报告 FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 风险提示风险提示 下游需求不及预期,中美贸易战超预期。东兴证券深度报告东兴证券深度报告 FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 P15 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 分析师简介分析师简介 分析师:李美贤分析师:李美贤 中国人

46、民大学硕士,2019 年 7 月加入东兴证券研究所,从事通信及电子研究,关注新兴科技领域,重点覆盖 AI、云计算、工业互联网等产业链。分析师承诺分析师承诺 负责本研究报告全部或部分内容的每一位证券分析师,在此申明,本报告的观点、逻辑和论据均为分析师本人研究成果,引用的相关信息和文字均已注明出处。本报告依据公开的信息来源,力求清晰、准确地反映分析师本人的研究观点。本人薪酬的任何部分过去不曾与、现在不与,未来也将不会与本报告中的具体推荐或观点直接或间接相关。风险提示风险提示 本证券研究报告所载的信息、观点、结论等内容仅供投资者决策参考。在任何情况下,本公司证券研究报告均不构成对任何机构和个人的投资

47、建议,市场有风险,投资者在决定投资前,务必要审慎。投资者应自主作出投资决策,自行承担投资风险。P16 东兴证券深度报告东兴证券深度报告 FPGA 和 CPU、GPU 有什么区别?为什么越来越重要?“FPGA 五问五答”系列报告二 敬请参阅报告结尾处的免责声明 东方财智 兴盛之源 免责声明免责声明 本研究报告由东兴证券股份有限公司研究所撰写,东兴证券股份有限公司是具有合法证券投资咨询业务资格的机构。本研究报告中所引用信息均来源于公开资料,我公司对这些信息的准确性和完整性不作任何保证,也不保证所包含的信息和建议不会发生任何变更。我们已力求报告内容的客观、公正,但文中的观点、结论和建议仅供参考,报告

48、中的信息或意见并不构成所述证券的买卖出价或征价,投资者据此做出的任何投资决策与本公司和作者无关。我公司及报告作者在自身所知情的范围内,与本报告所评价或推荐的证券或投资标的不存在法律禁止的利害关系。在法律许可的情况下,我公司及其所属关联机构可能会持有报告中提到的公司所发行的证券头寸并进行交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。本报告版权仅为我公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制和发布。如引用、刊发,需注明出处为东兴证券研究所,且不得对本报告进行有悖原意的引用、删节和修改。本研究报告仅供东兴证券股份有限公司客户和经本公司授权刊载机构

49、的客户使用,未经授权私自刊载研究报告的机构以及其阅读和使用者应慎重使用报告、防止被误导,本公司不承担由于非授权机构私自刊发和非授权客户使用该报告所产生的相关风险和责任。行业评级体系行业评级体系 公司投资评级(A 股市场基准为沪深 300 指数,香港市场基准为恒生指数,美国市场基准为标普500 指数):以报告日后的 6 个月内,公司股价相对于同期市场基准指数的表现为标准定义:强烈推荐:相对强于市场基准指数收益率 15以上;推荐:相对强于市场基准指数收益率515之间;中性:相对于市场基准指数收益率介于-5+5之间;回避:相对弱于市场基准指数收益率5以上。行业投资评级(A 股市场基准为沪深 300

50、指数,香港市场基准为恒生指数,美国市场基准为标普500 指数):以报告日后的 6 个月内,行业指数相对于同期市场基准指数的表现为标准定义:看好:相对强于市场基准指数收益率5以上;中性:相对于市场基准指数收益率介于-5+5之间;看淡:相对弱于市场基准指数收益率5以上。东兴东兴证券研究所证券研究所 北京 上海 深圳 西城区金融大街 5 号新盛大厦 B座 16 层 虹口区杨树浦路 248 号瑞丰国际大厦 5 层 福田区益田路6009号新世界中心46F 邮编:100033 电话: 传真: 邮编:200082 电话: 传真: 邮编:518038 电话: 传真:

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(电子行业“FPGA五问五答”系列报告二:FPGA和CPU、GPU有什么区别?为什么越来越重要?-230417(16页).pdf)为本站 (小熊小小) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部