上海品茶

华为:泛在算力:智能社会的基石(77页).pdf

编号:77158  PDF   DOCX 77页 3.74MB 下载积分:VIP专享
下载报告请您先登录!

华为:泛在算力:智能社会的基石(77页).pdf

1、泛在算力:智能社会的基石立场文件2020 年 2 月计算是人类认知世界的一种模式。从大型机到个人计算机,从智能手机到可穿戴设备,计算能力日益成为人类能力的延伸。同时,计算模式也在不断演进,随着人工智能的发展,基于统计的计算模式将逐渐成为主流。预计 5 年后,人工智能所消耗的算力,将占到算力消耗总量的 80% 以上,计算产业正在进入一个新的智能时代。计算和联接技术的蓬勃发展,推动智能世界万物互联已成为不可逆转的趋势。未来社会将是万物感知,万物互联以及万物智能。同时“泛在算力”将是基础。要实现“泛在算力”的这个目标,需要行业和政府达成共识和共同努力。首先,泛在算力是智能社会的基石。正如人均 GDP

2、是衡量一个国家经济发展程度的重要指标一样,我们采用人均算力指标对主要国家进行了测算:根据目前各国算力发展情况,从低算力国家的 100 GFLOPS/人 到高算力国家的 2,500 GFLOPS/ 人 不等。但即便是高算力国家,当前也还处于智能社会的初级阶拥抱泛在算力,拥抱智能社会的美好未来梁华华为公司董事长段。 只有当人均算力发展到10,000 GFLOPS/人 时,才会进入智能社会的中级阶段。如同电力的普及奠定工业社会发展的基础那样,泛在的算力将成为智能社会发展的基石。其次, 构建多元算力生态, 能有效促进计算产业发展。智能社会的应用场景多样性和数据类型的多样性对算力提出了多元架构的诉求。要

3、构建繁荣的多元算力生态,既需要底层架构创新,也需要客户、行业伙伴、开发者携手合作,以加速生态的建设,为计算产业发展注入动力。比如,由多家国际领先服务器与云计算方案提供商以及中国高校、科研机构共同成立的“绿色计算产业联盟”,为算力架构多元生态的发展带来了显著产业资源与人才支持优势。再比如,欧洲处理器计划(EPI)作为欧洲处理器计划联盟(EPI Consortium)推动的落地计划之一,截至 2020 年1 月,汇集了来自 10 个欧盟国家的 27 家合作伙伴,覆盖了算力芯片研发、生产、应用场景等多个产业环节,通过产业联盟的形式推动欧洲算力产业的健康发展。最后,在算力上的投入将推动科技创新,促进经

4、济发展, 提高民生福祉, 进而带动国家整体竞争力的提升。通过多个行业的案例分析发现,在算力上的投入,不仅直接带来ICT行业的增长, 还对制造、 交通、 能源、零售、 农业等诸多行业带来创新改变, 推动经济增长。以制造业为例,在传统工厂改造为智能化工厂的场景下,算力上每 1 美元的投入,可以带动 10 美元的相关产值提升。算力投入还可以改善民生,如在教育、科研、医疗等领域的投入可有效提高居民的生活质量和幸福感,并进而提升国家的整体竞争力。因此需要把算力投入提升到战略高度进行总体规划和实施。以中国为例,我们今天已经享受了泛在算力发展的成果,从繁忙的都市,到偏远的乡村,每天有将近 9亿人在使用便捷的

5、移动支付。移动支付的每一笔交易,都需要无处不在的联接和强大的算力支持:数以亿计的移动设备随时随地接入网络,发起支付交易,从扫码就餐到乘车出行,从商场购物到网上消费,都可以瞬间完成,极大的提升了支付体验,并有效保障了支付安全。过去 30 年,基于对研发的大规模投入和持续创新,华为致力于打造世界上最好的联接;而随着智能世界的加速到来,我们从联接扩展到联接 + 计算,推动计算产业多元化发展,为世界提供充裕而经济的算力,并不断为客户创造价值,为社会发展做出贡献。未来 30 年,随着“泛在算力”的不断实现,人工智能将全面进入千行百业,触发行业变革;人工智能还将给每个家庭、每个人带来创新的体验,进而深刻地

6、改变我们的生活方式,人类社会也终将进入高度发达的智能社会。千里之行,始于足下。要最终实现“泛在算力”的美好未来, 需要行业的每一个人都全力参与, 躬身入局。华为也愿意与计算产业的合作伙伴一起,为实现“泛在算力”而努力!泛在算力:智能社会的基石立场文件目 录执行摘要第一章:算力的定义及发展趋势1.1 算力的定义及历史发展1.2 由云 - 边 - 端组成的泛在算力架构是技术发展至今的必然选择结果 1.3 随着社会的智能化进程,对泛在算力提出了 4A 的具体要求第二章:算力衡量指标体系2.1 算力衡量指标体系介绍2.2 算力指标衡量结论2.3 随着社会智能化进程的演进,对算力水平的需求呈指数级增长第

7、三章:算力对各国家 / 区域的效益分析 3.1 对算力的投入可以带来可观的直接性经济回报3.2 对算力的投入可以对众多行业带来极大的杠杆效应,创造巨大的延伸性经济增长3.3 此外,对算力的投入亦能从创新、公共服务、民生等三方面提升国家整体竞争力第四章:算力发展面临的挑战与政府的建议举措 4.1 算力的发展面临来自于功耗、网络和生态的现实挑战,并需重视基础设施建设及安全问题4.2 各国政府可采取规划倡议、设施 / 服务提供等抓手,针对性的推动算力发展 02 05. 05 . 07 . 14 26. 27. 35. 38 47. 47. 48. 51 54. 54. 6202泛在算力:智能社会的基

8、石立场文件从中国古代依靠人力计算的算盘,到当下无处不在的智能设备,算力经过了不同阶段的演变,正向着愈发性能强大和生态多样化的未来迈进。在芯片时代,算力的发展经历了单核、多核、网络化三大阶段:首先,由于技术和商业化可行性低,单核硅基芯片计算能力将在 3 纳米到达极限。与此同时,由于算力散失效应带来的多核堆叠性能提升受限,以及核心数增加带来的单位算力功耗提升,共同使得依靠核心数增加换取算力提升的步伐将在 128 核由于经济性原因迅速放缓,推动算力从单设备多核阶段向网络化阶段演进。而在智能社会对算力需求始终不断增长的大背景下,受限于网络技术发展及网络带宽成本,边缘端的算力部署将成为必然的演进方向,来

9、填补算力需求的错配, 最终形成云-边-端泛在算力部署的理想架构。而从需求侧来看,未来人类社会的智能化进程不可避免地需要人工智能、物联网、区块链、AR/VR 等核心技术加持,以多样化的智能应用场景改善生产水平、民生福祉、政务效率,而这些技术的应用亦将成为未来算力发展的核心驱动力,带动对计算设备(如云计算中心、边缘计算设备、高算力终端)的巨大需求。其中人工智能将全面赋能各行各业,预计到 2030 年将需要超过 16,000 EFLOPS1的算力支撑,相当于近 1,600 亿颗当下旗舰手机芯片(骁龙 855)NPU2所能提供的算力;物联网技术在工执行摘要厂和家居环境的应用拉动云端算力和终端算力提升,

10、2030 年需求将超 8,500 EFLOPS,相当于 79 亿台当下高端物联网边缘设备所用芯片(EPYC 7401)提供的算力;区块链技术在数字货币等领域的应用拉动全网算力提升,在 2030 年发展到超过 5,500 EFLOPS 的算力,相当于 13 亿台当下入门级矿机(蚂蚁 V9)的算力总和;AR(增强现实)/VR(虚拟现实)技术拥有极大的增长空间,通过需求拉动和普及的方式拉动算力增长,2030 年对于算力的需求将超过 3,900 EFLOPS,相当于 21 亿台当下顶级游戏机所(SONY PS4)提供的算力总和。而这些需求的实现将共同对算力形成随时、随地、随需、随形 (Anytime、

11、Anywhere、Any Capacity、Any Object) 的能力要求。而为了对算力拥有更为科学、具象的认识,我们设计了算力衡量指标体系,以有效衡量各国的算力水平。在算力的具体衡量方式上,由于算力的物理承载集中在云端、边缘端、终端三个环节,算力水平应基于云、边、端各层面典型设备的产品形态进行测算。在云端侧主要关注超级计算机与数据中心的算力水平,在测算其服务器数量及平均芯片计算能力的基础上综合考虑多核心损失效应以及网络传输损失效应;在边缘侧主要考量边缘服务器的算力水平,以 CDN3、智能网关等部署方式作为牵引,衡量各场景下的边缘服1 EFLOPS (exaFLOPS)为每秒浮点运算,是对

12、计算机性能的一种衡量方式。1 EFLOPS= 109 GFLOPS =1018 FLOPS 2 Network Processing Unit (NPU) 是为人工智能应用, 特别是人工神经网络、 机器视觉和机器学习而设计的一类微处理器或计算机系统。 3 CDN 的全称是 Content Delivery Network,即内容分发网络。CDN 是构建在现有网络基础之上的智能虚拟网络,在基于空间分布的基础上致力于提供终端客户更好的网络服 03泛在算力:智能社会的基石立场文件务器数量及平均算力,综合考量网络传输损失效应;在终端侧主要考量各类智能设备的算力水平,以智能手机、 笔记本电脑、 智能可穿

13、戴设备等形态作为牵引,衡量其数量及平均算力水平。而通过对全球 27 个国家基于以上方法的测算,算力水平的高低与一国的经济发展水平形成了紧耦合的绑定关系,是综合国力发展的重要表现。更重要的是,算力是未来智能社会阶段性演进中的重要标志。在智能社会的起步阶段,各产业的智能场景覆盖率较低,同时智能设备在产业内的应用刚刚起步,仅能实现自动化生产等初级应用,目前主要国家 / 地区的人均算力4预估在约100-2500GFLOPS5的量级;而当智能社会来到发展阶段,在制造、驾驶等产业将实现垂直化的高度智能行业覆盖及渗透,从而引领产业生态及商业模式的全面升级与重塑,具有主动分析能力的 AI 将大行其道,届时主要

14、国家 / 地区的人均算力水平将达到约10,000 GFLOPS 的量级;当智能社会进入最终的成熟阶段时,智能场景将实现所有行业的全方位覆盖及大部分行业内高渗透率,届时 AI 将具备自我进化能力,主要国家 / 地区的人均算力将超过约 29,000 GFLOPS 的量级。通过对全球各个国家算力水平的进一步分析,我们发现算力对国家可以带来可观的直接性经济回报,同时带动延伸性经济增长,并且推动政务高效和民生福祉。首先,作为具有高附加值的高科技产业,算力已为ICT产业带来了杠杆效应极强的直接性经济增长。通过在芯片、服务器、数据中心、智能终端、高速网络等领域进行研发、制造、使用、人才培育,每投入1 美元即

15、可以带动约 4.7 美元的直接产业产值增长。其次,由于算力投入带来的数字化智能技术加持,亦为包括制造、交通、零售在内多个行业带来延伸性效益,具体表现在产业产值增长、生产效率提升、商业模式创新、用户体验优化等方面。以制造业为例,在传统工厂改造为智能化工厂的场景下,每 1 美元的投入,可以带动 10 美元的相关产值提升。算力投入也可以在推动科技创新、政府高效和民生福祉方面发挥积极作用,带动国家整体竞争力提升。针对创新领域进行算力投入,可进一步提升国家科学技术水平,提高国家整体科研实力。针对公共服务业进行算力投入,可进一步提高政府工作效率,提高各级政府公共服务能力,进而创建平安和谐的社会环境。针对民

16、生进行算力投入,在教育、科研、医疗、就业、社区服务等领域不断加大建设数字化基础设施和生态系统,可有效提高居民的生活质量,提升居民的幸福感。即使智能计算本身存在的“边际效应”将导致单位算力投入带来的效益提升会随着社会智能化程度的成熟而下降,但所带来的收益仍然可观。算力的好处是不言而喻的,但是算力在发展的过程中4 人均算力 = 国家总算力 / 国家人口总数 5 gigaFLOPS 04泛在算力:智能社会的基石立场文件亦将遇到 3 大挑战和 1 个问题的影响,政府在其中需要积极承担重要角色,推动社会向智能化发展。- 首先,为奠定算力发展基础,政府应积极布局算力基础设施建设、同时推动云计算、AI 等关

17、键应用技术的普及与发展。- 未来,针对未来算力功耗激增的挑战,政府的核心目标应在于引导算力基础设施的部署,并同时推动节能型“绿色算力”发展,以实现智能化社会的可持续发展。可采取的政策手段包括 1)倡议行业联盟设节能目标;2)设立新能源投资计划,以直接政府投资带动新能源规模提升;3)建立能源碳排放交易机制,通过以高额成本换取有限排放配额机制,引导企业主动减排。- 针对网络质量提升的挑战,政府部门的核心目标应在于利用各种政策手段及资源,提高国家整体网络基础水平,为泛在算力部署的实现打下坚实基础。核心政策抓手包括 1)形成地理覆盖与网速布局的矩阵式监控体系,持续推动网络建设进程;2)利用公私合营(P

18、PP)的模式,以少量政府财政投入牵引社会资本投入网络基建。- 针对生态多样化发展的挑战,政府的核心目的应在于拓展多样化的企业类型及吸引高端人才,以确保多样化的智能应用场景可实现,且算力资源可充分利用。可采取的抓手包括 1)政府规划算力生态企业多样性发展目标、自身推动移动化场景发展,拉动多样化架构的市场占有率,切实牵引多种算力生态的发展;2)可通过建立多样化生态联盟,助力各类架构缔结产业上下游资源、同时为产业发展提供人才支持;3)放宽算力相关市场准入门槛,优化相关政务治理流程与效率,切身支持行业发展。除以上挑战外,算力的安全问题亦尤为重要,各国政府还需关注算力安全漏洞的风险防范,重点关注智能社会

19、创建与运转的安全红线,提升对于算力风险漏洞的监测及预防能力,可用政策包括 1)各国政府联合共同制定国际化标准安全规范;2)通过公共财政提供专项资金,建设安全监测专业机构,且支持第三方安全机构持续监测运营;3)针对未遵循算力相关法规者建立并完善究责机制。05泛在算力:智能社会的基石立场文件图 1.1 第一章主要观点介绍1.1 算力的定义及历史发展 算力作为近年来的一个热门话题引发了全社会的大量讨论,然而其定义仍然众说纷纭。其中,2018 年诺贝尔经济学奖获得者 William D. Nordhaus 在计算过程一文中对算力进行定义:“算力是设备根据内部状态的改变,每秒可处理的信息数据量”。结合众

20、多权威的定义中算力的特征,我们定义算力是设备通过处理数据,实现特定结果输出的能力。第一章算力的定义及发展趋势 ?06泛在算力:智能社会的基石立场文件图 1.2 随技术的演进,算力的承载形态逐渐多样化 从古至今,算力的载体发展经历了以算盘和机械计算器为代表的时代(如图 1.2)。其中算盘作为最早出现的基于人脑的算力载体,是中国古代劳动人民发明创造的一种简便的计算工具,被广泛应用于人们的日常生活。算盘初步实现了计算功能,但由于完全依靠人力开展而导致效率低下。1642 年,法国科学家 Blaise Pascal引用算盘的原理,发明了第一部机械式计算器,解放了人力。之后,算力发展经历了以电子和集成电路

21、计算机为代表的时期。1937 年 John V. Atanasoff 和 Clifford Berry 设计了世界上第一台基于电子的计算机“阿塔纳索夫 - 贝瑞计算机”。依托于物理介质的改变,算力的计算效率实现了大幅提升。贝尔实验室发明晶体管(1947)和 Jack Kilby 和 Robert Noyce 发明集成电路(1958)后,算力载体的物理体积得以大幅度压缩,同时性能进入指数级增长轨道,出现集成电路计算机。而 1993 年,IBM 公司推出全球第一款智能手机Simon,正式标志着算力载体可携带,且不再被物理有源电缆所束缚,算力正式移动化。在过去 20 年,随着算力载体的丰富程度得到了

22、极大提升,从用于架设互联网基础平台的服务器,到用于日常办公及娱乐的手机和电脑,再到融入提升居住环境与健康水平的智能可穿戴设备,算力已经融入到了人类生活的每个角落,呈现多样化发展趋势。 ?07泛在算力:智能社会的基石立场文件图 1.3 技术的限制驱动了算力的架构形态 - 从单核至多核及网络化演进 1.2 由云 - 边 - 端组成的泛在算力架构是技术发展至今的必然选择结果 算力自 20 世纪 60 年代进入集成电路时代后,影响硅基芯片算力发展主要有性能、成本、功耗三大因素。性能因素,即影响算力处理及输出数据能力的因素,如物理效应、制造工艺、封装等;成本因素,即影响获取单位算力所需经济投入的因素,如

23、芯片设计成本、芯片制造成本等;功耗因素 , 即影响使用单位算力所需能耗的因素,如芯片功耗、单位算力功耗比等。 受这三大因素影响,硅基芯片算力的发展大致经历了从单核走向多核,再到目前的网络化的三个阶段。首先,由于技术和商业可行性低,单核芯片计算能力将在芯片制程为 3 纳米到达极限,推动芯片由单核逐步向多核发展。同时,随着核数增加放大处理器、存储介质、操作系统与软件间的不匹配而导致的算力散失效应(算力无法随着多核核心数增加而成比例上升)和难以继续提升的单位算力功耗,导致多核芯片核心数量在 128 核时接近上限。随后,由于芯片的单核算力上限和多核数量走向极限,在算力需求持续增长的背景下,需要“网络化

24、”算力对需求缺口进行补充。然而,由于网络技术限制导致的算力潮汐效应需要,更为灵活、低成本的边缘端设备可解决需求错配问题。所以,未来算力必然构建“云 - 边 - 端”泛在部署架构,满足社会智能化发展带来的算力需求 ( 如图 1.3)。 ?08泛在算力:智能社会的基石立场文件1.2.1 受硅基纳米制程提升引发的量子隧穿效应(性能)和先进制程芯片商业化可行性低(成本)影响,硅基单核芯片制程将在 3 纳米达到极限 1) 从性能方面来看,由于量子隧穿效应等硅基材料物理极限的存在,通过更低纳米制程工艺获得单核芯片性能增长的路径面临艰巨挑战。通常所说的 12 纳米、7 纳米制程工艺指的是 CPU 或 GPU

25、 芯片上栅极的宽度,被称为栅长。栅长越短,在相同尺寸的硅片上集成的晶体管越多。为了实现更强的单核芯片性能,芯片制造商必须不断降低纳米制程,缩小晶体管的尺寸,通过在芯片上塞入更多晶体管来提升芯片算力。但随着晶体管尺寸缩小,其栅长也随之缩短,硅基芯片晶体管的栅长在低于 3 纳米时极易发生量子隧穿效应(其原理为,当栅长缩小到一定程度的时候,即使没有加电压,源极和漏极都接近互通,晶体管便失去了开关的作用,因而无法实现逻辑电路)。因此,通过更加先进的纳米制程工艺提升单核芯片性能将面临技术上的严峻挑战。 2)从成本方面来看, 推动3纳米制程芯片所需的巨额投入将急剧拉高单芯片成本, 导致其难以被大众市场接受

26、,导致商业可行性低图 1.4 3 纳米制程旗舰级手机端 SoC 单芯片成本显著提升 我们分析,在千万级芯片出货量的假设下,3 纳米制程手机端旗舰级 SoC 单芯片(以高通骁龙 855 为例)成本较 7 纳米显著增加约 200 美元,恐难以被消费者接受。增加的成本主要来源于先进纳米制程工艺带来的巨额的芯片研发、设计和制造成本。以半导体制程中关键的光掩模开模成本为例,在 28 纳米制程下光掩膜版开模不超过 100 万美元,但 7 纳米至少需要 1000 万美元,增加 10 倍。大幅上涨的芯片成本导致的终端产品价格暴增难以被主流市场用户接受,仅有极高端的用户能够接受。其较低的商业可行性带来的狭小市场

27、规模无法?09泛在算力:智能社会的基石立场文件支撑芯片制造商进行技术投入,导致技术制程止步不前。2018 年,全球前五大晶圆代厂商中联电和格罗方德已先后对外宣布退出 7 纳米之后的高端制程竞赛。 1.2.2 同时,受存储、系统、软件限制(性能)和单位算力功耗显著上升(功耗)两大因素影响,芯片核心数量将在 128 核达到上限,推动算力从多核阶段向网络化阶段过渡多核处理器是指在一颗集成多个内核,能够进行并行计算的芯片,其天然适合以图像识别、自然语言理解为代表的 AI 训练以及 3D 建模、游戏渲染、视频编辑等高算力消耗类计算任务。然而,多核处理器的算力受到多种限制因素影响,单纯靠堆积核心数量增加算

28、力也并非没有极限。 1) 从性能方面来看,多核处理器受存储介质调用限制、操作系统限制与应用软件限制,随核数增加算力散失效应越发严重,导致多核处理器核心数量在超越 128 核后无法满足经济性要求,难以继续增长。图 1.5 通过增加核数提升算力的模式经济性无法满足要求 在现有的冯诺依曼架构下,通过拟合不同核心数量的芯片计算能力样本数据,我们发现多核处理器随核数增长,算力增长的倍数快 速下滑:从 4 核增至 8 核时,总算力可提升 1.74 倍,而当核数由 128 核增至 256 核时,总算力水平仅能提升已跌破 1.2 倍(1.16X),已显著丧失经济性。 ( 如图 1.4)。其核心原因在于存储介质

29、调用限制、操作系统内核原理、串行任务必然存在等三大因素。在存储介质调用限制方面,多核 CPU 的算?10泛在算力:智能社会的基石立场文件力输出能力会遇到瓶颈效应,导致随核心数量增长的算力无法被完全使用。瓶颈效应指的是当芯片与存储介质间的总线带宽无法与 CPU 计算能力相匹配时,便会产生传输的数据量小于 CPU 可处理的数据量,导致 CPU算力输出能力受限。在 CPU 与存储介质间存在着总线,CPU 通过总线从存储介质中调度数据进行处理。而随着芯片核心数的增加,CPU 计算能力也随之增加,但存储介质与芯片之间的总线带宽与芯片核心数量的增速存在差异(核心原因在于理论上核心数越多,其对内存等存储介质

30、的并发请求数也越多,相应存储介质的总线带宽需要被多核心共享,导致处理器数据处理时间与存储器访问时间的差距更加突出,瓶颈效应越发严重),导致了多核芯片算力无法得到全量发挥,算力散失效应明显。在操作系统限制方面,主要来自与操作系统设计时并未对多核处理器进行针对性设计,导致大量算力被浪费。由于多核处理器内部有多个核心,因此存在任务分配、调度、仲裁以及平衡负载等问题。所以,多核之间的任务调度是充分利用多核处理器性能的关键,目前的以 Windows、Linux 为代表等主流操作系统所采用的全局队列调度任务调度算法仍然针对于 8-16 核主流芯片优化。操作系统对大于 32 核的处理器的高效任务运行缺少优化

31、,难以满足超多核心处理器的数据实时处理的要求,导致多核处理器的算力大量闲置,无法有效利用多核处理器多核心算力。在串行计算任务限制方面,并不是所有的程序及任务都是可以被并行化切割的,导致该类任务天然难以充分利用多核处理器算力。在实际情况中,大量任务的运算过程存在前后依赖关系,即下一次运算依赖上一次的结果。这种计算任务只能采取串行计算,多核心芯片无法在此场景下发挥其并行计算优势。以典型的 RTS 游戏场景(实时战术游戏)为例,玩家所操纵单位的每一次动作、效果都是基于上一次的操作信号输入、受打击情况等计算得出,没有这些先决的计算结果,完全无法进行后续的演算。在这种场景下对任务进行并行化没有意义,无法

32、充分利用为并行计算而设计的多核芯片的性能。 2) 从功耗方面来看,随着核心数量增加,单位算力所需功耗显著提升,在算力需求显著增加且单设备承载功耗有限的条件下,需要通过“网络化”算力对缺口进行补充随着多核处理器的核心数量增加,其单位算力所需要消耗的功耗亦在显著增加,而在单设备功耗无法持续增长的前提下,通过堆核实现设备算力增长的方式必然会达到瓶颈。导致部分算力需求缺口需要通过“网络化”算力补充。以英特尔两款相同 14 纳米制程工艺、3.6GHz 相同主频的芯片为例,8 核的 i7-9700k 相较 6核的 i5-8600k 单位算力功耗从 1.11 W/GFLOPS 上升 11% 至 1.23 W

33、/GFLOPS。然而,在电池技术与散热技术不取得突破性进展的前提下,单设备所能承载的功耗有限,无法满足算力需求的不断提升,需要通过其他方式对算力需求进行补充。以分布式计算为代表的“网络化”算力存在形式应运而生。“网络化”算力是指通过网络传输手段将分布在不同位置的算力进行连接以实现分布式计算。在单设备功耗有限但算力需求持续提高的背景下,可以通过此种形式对算力需求缺口进行有效补充。11泛在算力:智能社会的基石立场文件在实际应用场景中,分布式计算可以通过网络将世界各地成千上万台计算设备所具备的算力串联,形成算力池,然后通过分布式计算模式分配计算任务,完成需要庞大计算量的项目。例如世界最大的粒子物理实

34、验室 - 欧洲核子研究组织 (CERN) 通过大型强子对撞机夸克实验项目6, 利用网络将全球超级计算机进行连接组件 “网络化”算力池,帮助科学家们从 5 年积累的约 100PB 海量实验数据(相当于 6 百万张蓝光碟能存储的数据)中证明希格斯玻粒子7的存在。其发现希格斯粒子的过程依赖于世界各地的研究所通过高效的网络互连与分布式算力分配实现计算资源共享。该项目充分利用 DCN(数据通信网络)8构建计算节点内部的网络并利用 DCI(数据中心网络)9推动计算节点之间的互联,都对大量高性能计算设备释放算力起到至关重要的作用。同时,该项目的算力分配模式采取多层级的金字塔式,从位于 CERN 的零级站点

35、(Tier-0) 通过最高可达 100Gbps 的高速网络链接全世界的 12 个一级站点 (Tier-1) 进行数据分发 , 近 200 个二级站点 (Tier-2) 再从一级站点接收数据。 再比如从 1999 年 5 月 17 日开始正式运行的国际项目 SETIhome10,充分利用个人计算机闲置算力组成分布式计算网络寻找外星智慧。该项目通过将射电望远镜采集到的海量数据拆分成零碎的数据包上传到互联网,分配给每一台安装了 SETIhome 软件的计算机,利用计算机闲置算力对数据进行分析。短短 5 年间该项目借助闲置的处理器资源积累了近 200 万年的 CPU 运行时间,处理了超过 13 亿个数

36、据单元,进行了近51021次浮点运算 , 是算力“网络化”的成功实践。1.2.3 在算力未来需求持续增加的情况下,网络带宽和时延限制(性能)和网络带宽成本限制(成本)导致的算力需求错配需要通过在边缘端部署算力进行支撑,构成“云 - 边 - 端”泛在算力部署方案 在“网络化”算力有效补充了单设备无法满足的大部分算力需求后,仍然有部分算力需求受不同类型网络带宽及时延限制,仍然无法满足低时延、大带宽、低传输成本的算力需求场景,如智慧安防网络、CDN 加速等。近年来,许多场景中出现了边缘计算(即通过将算力部署在更加靠近终端设备的位置来满足算力需求)的形式,以实现更快、更低时延、更低成本的算力输出。英特

37、尔公司高级专家公开表示,“数据在不断增加,如果全部传输到云端进行处理,显然当前的带宽和传输速度都难以满足要求,因此将数据处理从云端迁移到边缘端十分6 大型强子对撞机 (LHC) 是世界上最大、最强大的粒子加速器。它于 2008 年 9 月 10 日首次启动,至今仍是欧洲核子研究中心 (CERN)加速器综合体的最新成员。大型强子对撞机由一个 27 公里长的超导磁体环组成,环上有许多加速结构,可以在运行过程中提高粒子的能量 7 希格斯玻色子是希格斯场的量子激发。希格斯粒子的衰变能动会生成耦合实粒子 8 数据通信网络 (DCN) 利用各种有线和无线通信信道将数字数据从一台计算机传输到另一台计算机。互

38、联网是该网络的代表 9 数据中心网络 (DCI) 技术是通过高速分组光连接将两个或多个数据中心在短、中、长距离上连接在一起 10 SETIhome(“SETI at home”) 是一个基于互联网的公共志愿者计算项目,采用了伯克利 SETI 研究中心创建的 BOINC 软件平台,由加州大学伯克利分校空间科学实验室主办。它的目的是分析无线电信号,寻找地外文明的迹象,因此是作为世界范围 SETI 进行的活动之一 12泛在算力:智能社会的基石立场文件有必要”11。同时,将算力部署在边缘端也能显著节省网络带宽成本,是更加经济的算力部署模式,引入边缘计算后,计算、存储、网络成本可以节省约 30% 以上1

39、2。1) 从性能方面来看,由网络带宽对云端算力的全量发挥的限制和网络时延的影响所带来的算力错配要通过增设边缘端来弥补,因此未来形成“云13、边14、端15”多层级算力部署方案是必然趋势图 1.6 网络传输带宽和时延导致算力错配,需要边缘算力支撑 网络带宽及网络时延共同决定了网络信道的传输质量, 影响到网络算力的全量发挥 (如图1.6) 。 具体而言, “网络化”算力的使用需要经历终端与云端的数据双向传输过程,这段过程是通过网关、基站、数据中心等不同网络节点之间的信道所实现的,其中信道的容量决定了传输的速率(带宽),信道的长度与材质决定了数据传输的时延,两者共同影响了数据传输的效率,而数据传输的

40、效率则决定了云端算力的输出功率,即数据传输的效11 与非网边缘计算市场不断扩张,计算力远没走到尽头2018 12 中国电子技术标准化研究院边缘云计算技术及标准化白皮书2018 13 云端的算力是由 GPU 或 NPU 等芯片产生的,通过在虚拟平台调度服务器上处理复杂的数据来实现合理使用 14 边端的算力由 CPU、FPGA 等芯片产生,通过边端服务平台的实时数据过滤和响应,可以保证网络的稳定性且降低延迟15 终端的算力是由 CPU、GPU 或 DSP 等芯片产生的。更好的用户体验可以通过操作系统上的软硬件资源管理来实现?13泛在算力:智能社会的基石立场文件16 多接入边缘计算 (MEC),也可

41、称为移动边缘计算,是 ETSI 赋予的网络架构概念,支持云计算能力和蜂窝网络或任何网络边缘的 IT服务环境 17 虎牙是一个集游戏、娱乐、体育为一体的视频直播平台率越高,云端算力就能够发挥更大的效用。但由于目前网络技术的限制,带宽受传输网类型、传输方式等因素影响,时延受网络技术、传输距离、干扰等因素影响,导致云端算力始终无法做到全量输出(如图 1.7)。 受两大网络因素影响,算力供给与算力需求间会产生错配,部分算力需求需要通过增设边缘算力满足。智能化社会发展过程中由新兴技术、应用、场景带来的数据量持续增长,对整体算力提出了持续的要求。然而,受两大网络限制因素与成本限制,网络化的算力与算力需求间

42、将会产生算力错配,在不同的时间会出现算力盈余和算力缺口。所以,通过部署更灵活、成本更低的边缘计算设备,完善在云、边缘、现场终端不同层级的算力,可以减弱云端和终端长距离数据传输的网络限制问题。如在 5G 时代的 MEC16部署可以降低传输距离,满足如智慧工厂、 智慧港口、 智慧交通等场景下的超低时延和大带宽的网络要求。 同时减小低价值流量占用网络 (重复性数据)或者超大规模流量(视频图像)对于网络资源的消耗。以智慧港口为例,对起重机的控制级通信操作,需要其网络满足超低时延(10-20 毫秒以内),及超过 99.999% 的可靠性,当前的 4G 网络远远无法满足。在云端,算力由 GPU、NPU 等

43、芯片产生,通过虚拟平台调度服务器设备进行复杂的数据处理,实现高性能算力的合理运用。在边缘端,算力由 CPU、FPGA 等芯片产生,依托于网关设备,通过边缘服务平台在边缘节点实现数据筛选和实时响应,保障数据传输的稳定性和低延时性。在终端,算力由 CPU、DSP 等芯片产生,操作系统可进行软硬件资源管理,使终端设备拥有更流畅的用户体验。 2) 从成本方面来看,在边缘端部署算力能有效节省网络带宽成本,是更加经济性的算力部署方案。尽管网络技术的发展将提升网络质量,但仍然存在使用网络服务的带宽成本。部署边缘计算可将一部分算力放在靠近接入网的机房,在降低传输时延的同时更能有效降低网络的带宽成本。2018

44、年,阿里云和虎牙直播17共同建设了边缘节点服务,不仅实现了边缘节点网络连接小于 5 毫秒的低时延,更节省了 30% 以上的网络带宽成本。 14泛在算力:智能社会的基石立场文件图 1.7 泛在算力架构由芯片、设备、软件组成综上所述,算力在进入网络化阶段后,受到网络技术发展和网络带宽成本限制,增设边缘侧设备成为必然趋势,未来将形成云端侧负责大体量复杂计算、边缘侧负责简单计算执行、终端侧负责感知交互的泛在算力部署形式(如图 1.7)。 整体来看,算力从单核到多核再到网络化,算力最终走向云 - 边 - 端多层级泛在部署的理想方案。在此期间,无论是集成电路时代大规模生产制造对于计算设备的需求,还是信息化

45、时代全球互联互通对于移动端计算能力的依赖,都足以证明算力需求的持续高速提升来自于社会智能化程度的提高。 1.3 随着社会的智能化进程,对泛在算力提出了 4A 的具体要求1818 “4A”是指“Anytime, Anywhere, Any Capacity, Any Object”,即随时、随地、随需、随形 ?15泛在算力:智能社会的基石立场文件图 1.8 分布领域、底层技术和应用场景共同支持智能社会发展 未来社会将逐步走向智能化,其背后的关键技术(人工智能 / 物联网等),是算力需求发展的核心驱动因素(如图 1.8)。具体来看,每一次的生产力变革,都带来了全社会的飞跃式发展。随着以人工智能、物

46、联网、区块链、AR/VR 等关键信息技术的逐渐成熟,我们认为未来这些技术可推动大量的智能场景的实现。人工智能技术将推动无人驾驶、智能办公、智慧医疗等场景的有效落地,物联网技术将推动智能消防、智慧工厂、智慧农场、智能家居等场景落地,区块链技术将推动应用于数字证书、信息加密等场景落地,AR/VR 技术则可推动智慧商场、游戏、智慧课堂等场景落地。这些场景未来将在产业领域实现跨越式发展、助力各产业创新、增强产业数字化程度并增强市场活力,在政务领域帮助政府提升运行效率、提高城市管理水平、加强居民生活幸福度,在民生领域推动社会民生保障、创造宜居空间、实现可持续化发展,共同推动社会向智能社会发展。 ?16泛

47、在算力:智能社会的基石立场文件图 1.9 算力在智能社会可以做到随时、随地、随需、以随形存在 未来人工智能、物联网、区块链、AR/VR 技术发展将带来对算力随时、随地、随需、随形 (Anytime、Anywhere、Any Capacity、Any Object) 的 4A 能力要求(如图 1.9): 在随时层面,未来算力发展将关注低时延与连续性,低时延要求算力对数据处理的及时反馈,而连续性要求算力不间断的支撑。以无人驾驶汽车场景为例,面对复杂多变的路况信息,无人驾驶汽车需要确保针对行驶过程中的任何突发性状况进行实时反映;同时在行驶的旅途中始终如一地保证算力对于路况、车况监控的的“专注度”。未

48、来 L4 & L5 级别对网络带宽的需求将大于 100Mbps,时延要求达到 5-10 毫秒的水平。在随地层面,高速增长的技术应用场景与终端设备使得算力需要大量应用在不同地点。因此在未来社会中,算力将因为智能应用场景的不断涌现而无处不在。无论是应用在政务领域的人脸识别、智能安防,民生领域的智能出行、移动支付,亦或是产业领域的智慧工厂、智慧农业,所有智慧场景都与算力密不可分。在随需层面,未来的算力应能够满足任意量级场景与终端设备的算力需求,并按照实际需求进行自适化的调配。如,无人驾驶领域的算力需能够同时满足车辆出行低峰期与高峰期的算力需求。在随形层面,未来算力形态将不仅限于人脑,同时算力将在以大

49、型数据中心、数据中心为代表的云端,以智慧路桩、边缘计算单元为代表的边缘端,以人脑、无人驾驶汽车、IoT 设备、个人电脑、AR/VR 一体机为代表的终端,形成算力“云、边、端”泛在算力部署架构。 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?17泛在算力:智能社会的基石立场文件1.3.1 人工智能技术的发展对于算力的驱动及要求 人工智能技术将全面赋能各行各业。预计到 20

50、25 年,人工智能涉及的场景规模将达到 2,081 亿美金19,并在无人驾驶、智慧金融、智慧医疗、智慧零售、文娱等领域大显身手。人工智能技术对于算力的核心拉动点在于未来各应用场景内单设备芯片算力的增长和人工智能技术的行业渗透率的进一步提升,带动对云计算中心、边缘设备和终端 NPU 的巨大需求。整体预计在 2030 年,人工智能相关领域对于算力的需求将达到 16,000 EFLOPS,相当于 1,600 亿颗高通骁龙 855 内置的人工智能芯片所能提供的算力。 图 1.10 人工智能技术对算力需求逐步提升 以无人驾驶场景为例,人工智能技术对算力的核心拉动方式主要有 3 点: 1)单车算力需求几何

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(华为:泛在算力:智能社会的基石(77页).pdf)为本站 (沧海一笑) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
会员动态
会员动态 会员动态:

183**89... 升级为标准VIP   wei**n_... 升级为至尊VIP

8**的... 升级为至尊VIP   Goo**ar... 升级为至尊VIP

131**21...  升级为至尊VIP   139**02... 升级为标准VIP

wei**n_... 升级为高级VIP   wei**n_... 升级为高级VIP

  wei**n_... 升级为至尊VIP wei**n_...  升级为至尊VIP

138**05...  升级为至尊VIP wei**n_... 升级为高级VIP 

wei**n_... 升级为至尊VIP   wei**n_...   升级为至尊VIP

 wei**n_... 升级为至尊VIP   131**77...  升级为高级VIP

wei**n_... 升级为标准VIP  186**06...  升级为高级VIP

150**97... 升级为至尊VIP  wei**n_...  升级为标准VIP 

wei**n_... 升级为至尊VIP  185**72... 升级为至尊VIP

186**81...  升级为至尊VIP 升级为至尊VIP

159**90...  升级为标准VIP  ja**me 升级为高级VIP

wei**n_... 升级为标准VIP  wei**n_... 升级为至尊VIP 

 黑碳 升级为高级VIP  黑碳  升级为标准VIP

wei**n_...  升级为高级VIP  Fro**De... 升级为至尊VIP

 wei**n_... 升级为高级VIP 185**28...  升级为标准VIP

 HO**T 升级为至尊VIP  cic**hu 升级为高级VIP 

wei**n_... 升级为标准VIP  wei**n_...  升级为高级VIP

Mor**so... 升级为至尊VIP 158**06... 升级为至尊VIP 

缘**  升级为至尊VIP wei**n_... 升级为标准VIP 

136**62...  升级为至尊VIP  wei**n_... 升级为高级VIP

微**... 升级为标准VIP xin**in... 升级为高级VIP 

131**25...  升级为标准VIP wei**n_...  升级为高级VIP

栀**...  升级为至尊VIP wei**n_... 升级为高级VIP 

 wei**n_... 升级为高级VIP   wei**n_...  升级为标准VIP

wei**n_... 升级为至尊VIP  bai**in... 升级为高级VIP 

wei**n_...   升级为高级VIP  561**55... 升级为高级VIP

 wei**n_... 升级为至尊VIP  159**67... 升级为高级VIP

 158**19...  升级为高级VIP  wei**n_... 升级为标准VIP

186**95... 升级为至尊VIP   135**62... 升级为至尊VIP

 138**86... 升级为至尊VIP 139**30... 升级为高级VIP 

wei**n_... 升级为标准VIP  想**... 升级为标准VIP  

182**61...   升级为标准VIP car**e2...  升级为至尊VIP 

 wei**n_... 升级为高级VIP wei**n_...  升级为至尊VIP

 wei**n_... 升级为标准VIP   195**85...  升级为高级VIP

  138**90... 升级为高级VIP wei**n_... 升级为至尊VIP 

 134**18... 升级为至尊VIP 158**81...  升级为至尊VIP 

 wei**n_...  升级为至尊VIP  Am**cc 升级为至尊VIP

 137**04...  升级为至尊VIP 186**88...  升级为至尊VIP

  wei**n_... 升级为至尊VIP  wei**n_... 升级为至尊VIP 

 137**78... 升级为至尊VIP  180**21... 升级为至尊VIP 

 135**63... 升级为至尊VIP wei**n_... 升级为标准VIP

wei**n_...  升级为至尊VIP 186**46...  升级为高级VIP

Jin**hx 升级为标准VIP  wei**n_... 升级为高级VIP 

 wei**n_...  升级为至尊VIP   wei**n_... 升级为标准VIP

皮皮**n...  升级为标准VIP wei**n_...  升级为标准VIP

 137**38... 升级为至尊VIP wei**n_... 升级为标准VIP  

134**49...  升级为高级VIP  wei**n_...  升级为标准VIP

188**75... 升级为至尊VIP  186**77... 升级为至尊VIP