上海品茶

用时:66ms

信息技术报告-PDF版

您的当前位置:上海品茶 > 互联网 > 信息技术
  • 中国移动研究院:通算融合共生:关键技术和系统设计思考(2023)(14页).pdf

    通算融合共生:关键技术和系统设计思考中国移动研究院李男业务和技术双重驱动无线接入网演进业务和技术双重驱动无线接入网络架构不断演进业务需求技术趋势架构演进2G 3G 4G 5G 5G-A/6G IP化云化(SDN,NFV,MEC)服务化(SBA)、智能化(AI/ML)、通算融合共生语音移动互联网定位视频直播URLLC:车联网eMBB:XR智慧泛在通感一体mMTC:工业互联网数字孪生无线接入网基站和终端设备向算力化演进基站设备向异构算力方向演进加速板方式1方式2通用算力1.方式1:专用硬件扩展通用算力板卡,算力卡 软件包形式提供通算融合服务2.方式2:通用服务器扩展5G加速卡,服务器 软件包 形式提供通算融合服务空间池化业务池化1:N 算力资源插花组网多站复用算力资源时间池化基站算力资源池化可提升硬件基础设施利用效率,节约建设投资、复用运维资源,已成为无线产品演进方向基站服务能力软件快速重构硬件资源时分复用CT IT OT融合部署运维形成边缘云网一体服务终端呈现海量、多样化、轻量化特点,部分终端算力快速增强个人终端(1Tops1000 Tops)(十亿级:手机,亿级:PC/平板,千万级:智能车)家庭终端(10Tops)(亿级:网关,千万级:摄像头、路由器)行业终端(1Tops1000 Tops)(百万级:工业网关、边缘设)备通算融合潜在应用场景2C2B基站算力池化组网,运维优化AI下沉,业务体验保障,增强感知能力p关键业务体验保障:基于基站本地业务识别,优化和保障关键业务体验(如:医院场景中的支付应用、医院自由应用app的业务体验保障)p基站AI优化:基于信道的基站定位计算,实现精细化网络覆盖感知和优化p网络AI运维下沉:智能故障与隐患识别、高负荷小区优化p基站/网络协作AI(如:分布式推理、协同推理、联邦学习等)、空口协作AI面向2B本地化场景的通信计算业务一体服务,灵活敏捷,降低综合成本服务能力拓展网络智能增强p园区:工业视觉AI检测(智能终端协作的分布式学习)、智能安防、智能巡检等p车联网:智能碰撞预测、路口视觉融合、自动驾驶仿真等p无人机:路径管理、入侵检测等基站边缘云服务可复用大网运维资源,通过大网服务体系降低边缘云运维成本,实现云网一体运维,基站算力池化共享组网满足极低时延/大带宽应用本地计算需求p基于大模型的内容生成和个人AI代理p虚拟环境构建:XR本地业务渲染、元宇宙等p新型服务模式:云手机、云游戏、手势/动作识别、轨迹追踪等网络智能化是通算融合的重要场景,产业链条较短,较容易实现运营商内部闭环,可作为通算融合应用突破口基于基站的2C/2B算网业一体服务也是重要的拓展场景生成式人工智能成为下一代通信服务的核心场景无线网络与智能终端的通信和计算协同将助力打开新型信息服务产业价值空间个人专属AI代理用户场景化数据和AI大模型在网络中频繁交互多模态内容生成成本趋近于0的生成内容在网络中爆发位置信息用户习惯信息历史对话信息环境/场景信息生成式AI涌现,逐步向个性化服务演进*Tesla FSD HW4.0,单片约 200TOPS 手机大模型推理能力加速增强 智能体间协作控制需求扩大 智能汽车*人形机器人*家庭终端 AI原生可穿戴形态产品涌现高通骁龙8Gen3AI处理器HexagonNPUAI算力超过73TOPS。运行100亿参数大模型每秒处理20 Tokens0.6秒生成Stable Diffusion图片联发科天玑9300AI处理器APU 790运行330亿参数模型内存硬件压缩技术AIGC端侧LoRA融合秒级文生图 智能可穿戴设备作为AI代理实体,依靠网络或云端实时计算推理 具有多模态数输、低延迟、个性化、低功耗的需求胸针眼镜吊坠 将涌现大量的低时延的多智能体间协作 结合网络提供的计算能力和通感服务,确定性的端到端时延保障 端侧推理需要网络提供稳定大模型文件传输 端侧可支撑分布式模型学习或端/边/云协同学习终端能力快速增强,形态多样化生成式AI大规模应用带来的业务需求从内容数据传输到10GB-100GB体量大模型的传输LLAMA2-13B 模型文件13GB,Stable Diffusion模型几GB到十几GB不等低延时和个性化的AI代理服务带来跨应用、场景化的信息收集和频繁大模型微调多智能体协作和AI原生可穿戴设备要求靠近用户的AI计算和低时延高可靠通信*Nvidia Drive Orin自动驾驶芯片,单片254 TOPS核心技术难点和系统设计问题通算资源角度:如何发挥泛在无线接入网基础设施价值,以有效满足技术发展需求?无线通算融合异构平台网络功能角度:面向无线网络高动态环境、计算能力的空时波动和碎片化等特性,及通算资源受限约束,如何实现通算智一体服务和保障?计算感知的无线协议功能和接口流程设计通感算智多维资源一体调度和控制无线用户面动态虚数据拟锚点和转发无线封闭数据的实时/按需/跨域采集、关联挖掘和安全开放服务能力角度:如何实现无线通信、计算和智能资源/功能/服务协同动态按需编排和开放?RAN domain的通算智服务编排、开放机制及与中心编排系统的协同系统设计问题核心技术难点通算融合性能指标体系面向通信计算融合的无线系统,除了网络通信指标外,如何考量系统的计算性能?通算融合的系统架构高动态多设备协作组网针对无线系统通信环境变化和计算资源的不同状态,如何设计合理的计算协同模式,高效执行计算任务?如何在连接的基础上,基于统一系统架构弹性高效实现对多种计算业务(如AI训练/推理业务、感知类业务的支持?技术探索1-1:无线通算融合异构基础设施平台Communication-Aware Orchestration of ComputeHARDWAREX86ARMRISC-VFPGADPUIPUGPUOthers:Switch/Router,RU,etcSmartNICLINUX KERNELOPERATINGSYSTEM&DRIVEROtherDriverGPUDriverDPUDriverIPUDriverFPGADriverSmartNICDriverPhyiscal Infrastructure ManagerVIRTUALIZATIONLAYERHypervisorContainer Runtimecoroutine/thread managementPluginsAgentsvDriversOthersVirtual Infrastructure ManagerSERVICEPaaS VMVMContainerCoroutine/Thread.SERVICE FaaSSERVICETaaS FunctionTASKTASKTASKDesignFrameworkFunctionFunctionFunctionFunctionFunctionRANaaSSDN Controller with SRv6Cloud ManagerCoroutine/ThreadvDUService Mesh Observibility ToolsCode/ImageRepovCURICxAppContainerAIaaSXaaSXaaSXaaSXaaS122234构建适配无线网络和多样化业务需求的高效异构平台,对无线算力资源实时共享、分配和管理硬件抽象和虚拟化:针对CPU、GPU和DPU等异构硬件的资源管理和调度 服务扩展:从物理和虚拟资源到FaaS/TaaS,构建无线领域的FaaS/TaaS数据平面增强:基于算力路由和微服务,通过软硬件卸载来加速service-mesh性能云管和调度:利用分布式/混合/边缘设备云管系统和插件,支撑通信和计算联合调度技术探索1-2:基于业务模型的无线算力度量无线通算融合网络功能层计算任务实时控制与调度计算性能映射模型任务生成服务拆解无线网络功能无线基础设施GPU1VendorAGPU2VendorBGPUnVendorNGPU3VendorCSSD ResNet-34 training渲染、定位.无线通算联合编排与服务开放操作系统Hypervisor/Container Runtime虚机/容器编排管理通算联合调度AI服务请求Inception V3 Inference度量方式1:基于硬件资源模型的度量,可增加扩展考虑能耗因素示例1:2 CPU cores,4G memory,128GStorage,2*10GE Server configuration:Skylake-D 2177 etc.示例2:GPU TF32 120TFLOPS,CPU 795GFLOPS度量方式2:业务模型或原子功能驱动的计算能力度量示例1:AI Training 4830 Samples per second示例2:LDPC decoding capability 20Gbps不同业务应用在不同计算硬件的计算能力有较大差异,算力资源调度需考虑业务模型与计算硬件的适配能力多种AI模型在不同硬件的推理处理能力测试多种AI模型在不同硬件的模型训练处理能力测试技术探索2-1:计算能力/任务的实时感知及控制无线接入网扩展对终端和基站的计算能力和任务实时感知,通信计算资源联合控制保障用户体验问题:传统面向移动性管理保障通信的连续性,通算融合场景,还要考虑计算任务的连续性和任务多维度质量要求技术方向:多维要素考量:相邻小区通信状态,例如,用户数,信道环境,业务负载;算力资源状态,例如任务所需算力资源,基站/终端可用资源等决策锚点选择:分布式站间CCF协商、集中式如无线算力池内CCF,核心网决策问题:AI、感知等新服务能力,需要本地化的网络计算功能支持技术方向:基站扩展计算控制功能(CCF),实现终端算力资源感知和计算任务感知,同时支持计算执行CCF可接入核心网总线,使能核心网感知无线基站和终端算力信息核心网Loop2:站间计算感知Loop3:终端/基站/核心网计算感知Loop1:终端基站计算感知计算也切CCF1控制无线算力池CCF间协商完成任务迁移核心网CN控制任务在CCF1和CCF2迁移计算控制功能CCF通算实时感知任务实时控制通算资源联合调度控制面用户面SRB 04DRBSRB*SRB 04DRBCRBOpt1:SRB*承载算力和计算任务信息Opt2:CRB承载算力和计算任务信息算力类型多样网络高动态变化通信和计算联合决策连接和计算任务按需解耦迁移,保障业务端到端体验连接切,计算不切连接切4312计算控制CCF计算执行技术探索2-2:通算资源一体调度典型用例面向VR场景的无线通算一体编排终端和基站协同AI推理IoV场景下的通算联合调度目标:最大化系统AI推理精度基站的算力和带宽约束通信:基站时频资源分配比例因子通信:基站时频资源分配比例因子推理:模型退出点模型切分:模型切分点和退出点目标:最大化满足端到端延迟要求的VR用户数量通信需求 计算需求 通信和计算约束设置业务帧率60、90、120FPS&背景用户数50,帧压缩后2Mb,无线环境设置UMa场景时,无线算网联合编排算法相比于VR用户就近接入方式提升60FPS接入VR用户数10%以20个AI推理任务为例,覆盖较好场景下(SNR20dB到30dB),相比基准算法至少可以提升0.4%系统推理精度,系统可以提升11%的AI推理任务数,至少提高28%的谱效率目标:最大化工作完成率,最小化总体低时延和成本变量:子任务与计算节点的适配关系约束:传输速率和计算资源约束以随机任务依赖关系模型为例,当到达8个工作(每个工作中包含5个子任务)时,所提方法的工作完成率可以提高7%,但时延和成本至少分别降低19%和14%N.Li,Q.Sun,X.Li,et al.,“Towards the Deep Convergence of Communication and Computing in RAN:Scenarios,Architecture,Key Technologies,Challenges and Future Trends,China Communications,2023.技术探索2-3:无线计算数据转发和路由纵向封闭管道式的用户面机制已无法满足计算数据需求,用户面泛在开放、动态路由、一体服务能力将成为演进方向典型场景:高移动性,高可靠性计算任务,如车联网增强方向:增强RAN对计算数据实时路由决策能力典型场景:云/边/端协同计算,如XR、AI等增强方向:终端、基站数据和业务体验等数据按需采集、存储和共享,可综合参考无线资源、传输资源、计算资源、业务需求,考虑面向网络AI的数据服务机制,如数据服务总线Bearer and DataFlowData Offloading Anchor PointCompute Data BusCompute Data Tunnel典型场景:大规模无线数据本地处理、超低时延工业控制增强方向:非单一数据卸载锚点,数据按需就近转发开放技术探索3:通算智资源/功能/服务协同编排和开放从传统网络管理向通算资源/功能/服务协同编排演进,助力面向业务意图/需求的闭环保障和智能自治跨域设备:终端,基站多维资源:通信资源、计算资源RAN通算资源统一管理RAN通算服务自动化编排业务驱动:面向业务意图闭环保障:面向连接 计算综合服务智能自治:基于AI/ML的意图转译、故障/性能预测、智能决策开放能力类型:RAN管理编排能力、用户/切片/应用级通算服务定制、RAN算力开放对象:跨域编排器/第三方App开放方式:管理编排层、协同核心网/RAN能力开放RAN通算服务能力开放RAN通算服务按需编排场景示意通算服务需求通算能力开放本地应用跨域编排器通算管理与编排通算联合编排业务编排通算能力开放RAN FCAPS多维数据统一管理通算功能与资源联合编排RAN 功能LCMRAN异构计算资源管理计算拓扑管理计算资源性能故障管理算力度量AI/ML管理AI/ML模型管理AI/ML模型训练AI/ML模型性能监测业务/服务编排通算功能与资源联合编排SLA模板/意图统一基础设施通算一体,一网多能服务/功能按需编排DeviceAIAIAIRANEdge Cloud通算资源上报通算策略/配置无线通算融合技术探索与实践 面向无线AI应用,建立无线基站算力池实现跨站算力协同基于宏站的无线算力编排云小站剩余算力资源部署轻量5GC、IMS、咪咕AR业务等应用基于云小站的无线算力共享 咪咕AR业务编排至云小站,总耗时降低46%、传输耗时降低70%高清场景卡顿现象,较公网中心云部署方案明显降低 构建宏基站算力池,跨基站算力借闲补忙的算力互助,部署智能AMC应用获得稳定的增益效果,下行中远点吞吐量提升10%,频谱效率提升4%*数据依据:64Rx*2Tx*1632RE 836KBytes,每5ms 最大2用户,连续上报,平均每用户3小区分布式高精定位大容量场景下业务体验保障无线协议栈弹性扩展痛点:海量信道数据处理导致传输资源受限解决方案:基站本地算力预处理信道数据,主服务小区进行定位计算,相比原始数据传输,带宽需求从1GBps降至19KBps*痛点:高负载和智能化需求下,单站算力受限解决方案:自适应算力调度、资源共享异构算力补充,提升站点可用算力;智能识别、分层调度,保障差异化业务需求痛点:小基站无法动态适配业务量,算力共享效率低解决方案:容器化无线协议栈弹性设计,自动执行通算协同策略,动态调度无线算力,实现最优算力使用,提升资源效率联合产业界开展外场实验,初步验证无线通算融合的技术可行性和价值持续深挖无线通算融合高价值场景,2C精确保障业务体验,2B助力行业数智化转型【广东/河北】【安徽】【广东】产学研协同推进无线通算融合共生技术发展基础理论和关键技术研究 国家自然科学基金企业联合基金 清华/北邮/东南-中国移动研究院联合创新中心 鹏城实验室-中国移动开放创新平台国内/国际标准预研和制定 IMT2030/CCSA 无线通算融合共生架构/关键技术预研 适时发起国际标准推进,将体系架构中成熟部分在5G-Advanced中引入,并为6G网络设计奠定重要技术基础测试验证和落地应用 以网络智能化和行业应用为突破口,联合产业伙伴开展通算融合共生技术创新验证,加速无线通算融合共生技术的成熟与应用 共同探索新的商业模式和应用场景

    浏览量0人已浏览 发布时间2023-12-01 14页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 国家电网:2023中国的碳捕集、封存与利用和PtX技术报告(20页).pdf

    State Grid Energy Research Institute12 October 2023国网能源研究院有限公司2023年10月12日ECECP Investment and Technologies for Net-zero Carbon InfrastructureECECP净零碳基础设施投资和关键技术研究Contents22PtXICCUS 碳捕集、利用与封存电转其他能源3(1)Importance of CCUS 碳捕集、利用与封存技术的定位CCUS is the only technological option to realize low-carbon utilization of fossil energy.CCUS 是目前实现化石能源低碳化利用的唯一技术选择。It is estimated that by 2050,fossil energy will account for 10%-15%of Chinas energyconsumption.到2050 年,化石能源仍将扮演重要角色,占中国能源消费比例的10%。CCUS can maintain the flexibility of power system to realize carbon neutrality.CCUS 是碳中和目标下保持电力系统灵活性的主要技术手段。By avoid an early phasing out of coal-fired power stations,the necessary support forsystem inertia and frequency control is then guaranteed when facing the great volatilityof renewable energy and potential seasonal power shortages.火电加装CCUS是具有竞争力的重要技术手段,可实现近零碳排放,提供稳定清洁低碳电力,平衡可再生能源发电的波动性,并在避免季节性或长期性的电力短缺方面发挥惯性支撑和频率控制等重要作用。4(1)Importance of CCUS 碳捕集、利用与封存技术的定位CCUS is a feasible technology option for hard-to-abate sectors,like steel and cement.CCUS 是钢铁水泥等难以减排行业低碳转型的可行技术选择。After implementing measures like efficiency improvement,raw material substitution,and etc,it is estimated that 34%of carbon emissions in the steel industry and 48%ofcarbon emissions in the cement industry are hard to abate.预计到2050年,钢铁行业通过采取工艺改进、效率提升、能源和原料替代等常规减排方案后,仍将剩余34%的碳排放量,即使氢直接还原铁(DRI)技术取得重大突破,剩余碳排放量也超过8%。水泥行业通过采取其他常规减排方案后,仍将剩余48%的碳排放量。CCUS coupled with renewable energy could realize negative emissions.CCUS 与新能源耦合的负排放技术是实现碳中和目标的重要技术保障。CCUS coupling with bio-energy,usually referred to as BECCS,could realize negativeemssions.Negative emission technologies can neutralize greenhouse gas emissions andprovide important support for achieving the goal of carbon neutrality.BECCS及其他负排放技术可中和该部分温室气体排放,推动温室气体净零排放,为实现碳中和目标提供重要支撑。Source:China CCUS Annual Report 2021.CCUS projects in ChinaCCUS Projects in China There are about 40 CCUS projectsthat are in operation or underconstruction in China.The capturecapacityisaround3milliontons/yearandthecumulativestorage capacity is 2 million tons.中国已投运或建设中的CCUS示范项目约为40个,捕集能力300万吨/年,累计封存200万吨CO2。(2)CCUS projects in China 碳捕集、利用与封存项目开展情况Source:China CCUS Annual Report 2021.CCUS projects in ChinaCCUS Projects in China TheexistingCCUSpilotdemonstration projects focus ondemonstratingcarboncapturetechnology and EOR technology.Large-scale,full-chain projects arerare.现有的CCUS试点示范项目主要关注展示碳捕集技术和EOR技术。大规模、完整链条的项目相对较少。China has the design capability ofa large-scale,full-process systemand is actively preparing for thefull-chain CCUS industrial clusters.中国具备大规模、全过程系统的设计能力,并积极准备建设完整链条的CCUS工业集群。(2)CCUS projects in China 碳捕集、利用与封存项目开展情况7(3)CCUS technology costs in China 技术成本情况Chinas CCUS demonstration projects are small in scale and expensive.The cost of CCUS mainlyincludes economic costs and environmental costs.中国的CCUS示范项目规模较小且成本较高。CCUS的成本主要包括经济成本和环境成本。Economic costs include fixed costs and operating costs.经济成本包括固定成本和运营成本。Environmental costs include environmental risks and energy consumption.环境成本包括环境风险和能源消耗。2025-2060年CCUS技术的成本Cost for CCUS Technologies in 502040203520302025Year20-4030-5050-7070--180燃烧前捕集Pre-combustion捕集技术Capture70---280230-310燃烧后捕集Post-combustion80---390300-480富氧燃烧Oxy-fuel combustion0.5-10.5-1.10.6-1.10.7-1.20.8-1.30.9-1.4罐车Truck运输Transport(RMB/tkm)0.40.450.50.60.70.8管道Pipeline20-2525-3030-3535-4040-5050-60封存StorageSource:China CCUS Annual Report 2021.8(3)Carbon capture technology in China 碳捕集技术现状 Chinas thermal power industry will reach apeak for unit renewal from 2035 to 2045.Considering the development of carboncapture technology,before 2035,the first-generation capture technology should bethe mainstream while after 2035,the-second generation technology should be themainstream.2035年前后将是捕集技术实现代际升级的关键时期。我国火电行业在2035-2045年间将迎来机组更新高峰。综合考虑火电行业的发展规律与捕集技术的发展趋势,2035年前应以采用第一代捕集技术的存量火电机组改造为主,2035年后应以采用二代捕集技术的新建火电机组为主。Energy ConsumtionBest time for CCS retrofitEnergy consumption for first-generation capture technologyEnergy consumption for second-generation capture technologyCost for first-generation capture technologyCost for second-generation capture technologyLevelised additional electricity costs for coal-fired power units suitable for retrofitting 适合改装的燃煤发电机组的电力水平化附加成本Notes:the first-generation capture technology are ready to be used on a large scale.The second-generation capture technologys energy consumption and cost will decrease to more than 30%compared to the first-generation.注:第一代捕集技术指现阶段已能进行大规模示范的技术,如胺基吸收剂、常压富氧燃烧;第二代捕集技术指技术成熟后能耗和成本可比成熟后的第一代技术降低30%以上的新技术,如新型膜分离技术、新型吸收技术等。The potential for CO2storage in China Oil fields:Songliao Basin,Bohai Bay Basin,Ordos Basin and Junggar Basin.CO2-EOR,5.1 billion tons.石油区域:松辽盆地、渤海湾盆地、鄂尔多斯盆地、准噶尔盆地。CO2-EOR,51亿吨。Gas fields:Ordos Basin,Sichuan Basin,Bohai Bay Basin and Tarim Basin.Depleted gas fields:15.3 billion tons;CO2-EGR:9 billion tons.天然气区域:鄂尔多斯盆地、四川盆地、渤海湾盆地和塔里木盆地。已枯竭的天然气田:153亿吨;CO2-EOR,90亿吨。The potential for CO2storage The potential for CO2storage in China is about 1.21-4.13 trillion tons.中国地质封存潜力约为1.214.13 万亿吨。Ref:RoadmapforCarbonCaptureandStorageDemonstrationandDeployment.(4)Carbon storage in China 碳封存技术现状The potential for CO2storage in China Deep saline aquifer:2420 billion tons.Songliao Basin:694.5 billion tons;Tarim Basin:552.8 billion tons;Bohai Bay Basin:490.6 billion tons;Subei Basin:435.7 billion tons;Ordos Basin:335.6 billion tons.深层咸水含气层:24200亿吨。松辽盆地:6945亿吨;塔里木盆地:5528亿吨;渤海湾盆地:4906亿吨;苏北盆地:4357亿吨;鄂尔多斯盆地:3356亿吨。The potential for CO2storage Ref:RoadmapforCarbonCaptureandStorageDemonstrationandDeployment.(4)Carbon storage in China 碳封存技术现状The potential for CO2storage in China is about 1.21-4.13 trillion tons.中国地质封存潜力约为1.214.13 万亿吨。11(5)Retrofitting coal-fired power stations with CCUS 煤电机组的CCUS改造Source:Decarbonizing the Coal-Fired Power Sector in China via Carbon Capture,Geological Utilization,and Storage TechnologySuitability Criteria for Power Plants发电厂适用性标准 ProximitytoCO2storagesite800km;距离二氧化碳储存地点 800公里 Unit age 40 years;使用年限 40年 Unit size 600 MW,or the totalamountofcapturableCO210Mt/year and annual operating hours 4000.单元容量 600兆瓦,或可捕获二氧化碳总量 10百万吨/年且年运行小时数 4000。Distribution of coal power plants with suitability results12(5)Retrofitting coal-fired power stations with CCUS 煤电机组的CCUS改造Source:Decarbonizing the Coal-Fired Power Sector in China via Carbon Capture,Geological Utilization,and Storage Technology At least 613 GW or 508 plants(73%of totalinstalled capacity or 63%of total coal plants)appear suitable for CCUS retrofits.The total CO2emission is about 2.2 Gt/year.至少有613千兆瓦或508座电厂(占总装机容量的73%或总煤电厂的63%)适合进行碳捕获利用与储存(CCUS)的改造。总二氧化碳排放约为每年22亿吨。Almost all selected coal power plants with oneor more generating units of more than 600 MWcapacity were built between 2005 and 2015.Theseplantsstillhavemanydecadesofexpected operational life.几乎所有含有一个或多个容量超过600兆瓦发电单元的燃煤电厂都建于2005年至2015年之间,这些电厂仍有数十年的预期运营寿命。Distribution of coal power plants with suitability results Retrofitting CCUS to the existing coal fleet would increase the LCOEs by an average of 24.1-37.2 USD/MWh for theentire fleet with between 50%and 85%net mitigation rates.将碳捕获利用与储存(CCUS)改装到现有的燃煤电厂将使整个电厂的电力生产成本(LCOEs)增加,净减排率在50%至85%之间的电厂平均增加24.1-37.2美元/兆瓦时。Source:Decarbonizing the Coal-Fired Power Sector in China via Carbon Capture,Geological Utilization,and Storage Technology(5)Retrofitting coal-fired power stations with CCUS 煤电机组的CCUS改造Contents142ICCUS PtX碳捕集、利用与封存电转其他能源Most of the PtX technologies are based on power-to-hydrogen,except for power-to-cool and power-to-heat.除了电转冷、电转热以外,大部分PtX技术都是基于电转氢。Source:Research on P2X Technology Progress and its Participation in Power System Operation Optimization SimulationStageTechnologiesLimitationAdvantagesNamecommecial application商业应用air conditioners空调-clean,convenient清洁、便利Power to Cool(P2C)电转冷initial stage of commecialapplication商业应用初始阶段heat pumps,electric boiler,electric heater热泵、电锅炉、电暖器low energy efficiency in a complete cycle,high cost 在一次完整循环中,能效较低、成本较高clean,safe,convenient清洁、安全、便利Power to Heat(P2H)电转热demonstration&initial stage of commercial application示范&商业应用初始阶段electrolysers电解槽low energy efficiency in a complete cycle,high cost在一次完整循环中,能效较低、成本较高clean,flexible清洁、灵活Power to Gas(P2G)电转气demonstration示范electrolysers,synthesis电解,合成high cost成本高clean清洁Power to Liquid(P2L)or Power to Fuels(P2F)电转液或电转燃料demonstration示范electrolysers,synthesis电解,合成high cost成本高clean清洁Power to Chemicals(P2C)or Power to Products(P2P)电转化学或电转产品demonstration示范fuel cells燃料high cost,low efficiency成本高,能效低long storage time长周期存储Power to Power(P2P)电转电Main technologies of PtX(1)Technologies included in PtXPtX中的技术16(2)Hydrogen production and consumption in China 中国氢能的产消Ref:China hydrogen energy and fuel cell industry development report 2020.Refining&Coal Chemical IndustryAmmoniaTransportationOther pureMethanolOther mixedCoalNatural gasElectrolysisBy-productCoalNatural gasBy-productElectrolysisUnit:104tonThe supply structure of hydrogen in ChinaThe hydrogen flow diagram in ChinaThe current hydrogen production is fossil-fuel based(coal,natural gas and industrial by-product).Thelargest share of hydrogen demand is from the chemicals sector for the production of ammonia(10.8 milliontons/year,32.3%)and methanol(9.1 million tons/year,27.2%).目前的氢气生产主要依赖化石燃料(煤炭、天然气和工业副产品)。氢气需求的最大份额来自化工行业,用于氨的生产(每年1080万吨,占32.3%)和甲醇的生产(每年910万吨,占27.2%)。17(3)Scale of power-to-hydrogen in China 中国电制氢的规模The production of hydrogen in 2019 is 33.42 million tons,around 1/3 of the worlds total(115 million tons).2019年,中国的氢气产量为3342万吨,约占全球总产量(1.15亿吨)的三分之一。Development of renewable hydrogen capacity under 100 GW scenariosSource:Opening Chinas Green Hydrogen New Era:A 2030 Renewable Hydrogen 100 GW RoadmapGreen Hydrogen Now:161 projects are planned,12 are in operation,22 under construction,23100 tons per year.计划161个项目,12个在运营,22个在建,每年23100吨。2030:7.7 million tons per year,100GW electrolysers.770万吨/年,100GW电解槽。2060:75-100 million tons per year.每年0.75-1亿吨。18(4)Technical iusses and cost of power-to-hydrogen in China 中国电制氢的技术问题及成本Source:Opening Chinas Green Hydrogen New Era:A 2030 Renewable Hydrogen 100 GW RoadmapProduction cost of green hydrogen AEMSOECPEMALK4.5-5.53.0-4.054.2Efficiency(kWh/Nm3)能效-2001400Single electrolyser(Nm3/h)单个电解槽R&DDemonstrationInitial Stage of CommercializationCommercial ApplicationStage 应用阶段Green Hydrogen Production The proton exchange membrane and catalyst(platinum,iridium)are highly dependent on import.质子交换膜和催化剂(铂、铱)高度依赖进口。As the scale of electrolyzers expands to 100 GW,the investment cost of ALK electrolyzers in China will decrease from 2000 RMB/kW in 2020 to 1500 RMB/kW in 2030.随着电解槽规模扩大到100 GW,中国的ALK电解槽投资成本将从2020年的每千瓦2000元降低到2030年的每千瓦1500元。The average total cost of green hydrogen will drop to 13 RMB/kg.绿色氢气的平均总成本将下降到每千克13元。19(5)Industrial application of power-to-hydrogen in China 中国电制氢技术的工业应用Source:Opening Chinas Green Hydrogen New Era:A 2030 Renewable Hydrogen 100 GW RoadmapGreen hydrogen projects are beccoming more and more common.However,hydrogen producers arereluctant to interact with the power grid.绿氢项目越来越常见,然而产氢端与电网互动较少。Representative Projects Ningxia:National demonstration project for H2produced through elecytrolysis powered by solar energy,largest in the world,200 MW PV 30000 Nm3/h eletrolysers,H2used for chemical synthesis.宁夏:通过太阳能电解制氢的国家示范项目,是世界上最大的项目,包括200 MW光伏发电和30000 Nm3/h的电解槽,生产的氢气用于化学合成。Xinjiang:Kucha project,will build 300 MW PV station(618 GWh of electricity)and 52000 Nm3/h of electrolysers,H2used for refining.新疆:库车项目,将建设300 MW光伏电站(发电量为618 GWh)和52000 Nm3/h的电解槽,用于炼油过程中的氢气生产。Northeast base:wind power,biomass hydrogen production pipeline mixingXinjiang base:wind and solar based hydrogen production new power systemNingdong base:PV hydrogen chemical industryInner Mongolia base:wind and solar based hydrogen production chemical industryNorth China base:wind power based hydrogen transportation steelEast China base:wind power based hydrogen transportation tradeSouth China base:wind power based hydrogen transportation tradeSichuan base:hydro based hydrogen ammonia synthesis shipping20(6)Hydrogen and the power grid 氢能和电网的关系Ref:Comparison of Different Coupling Modes between thePower System and the Hydrogen System Based on a PowerHydrogen Coordinated Planning Optimization ModelDifferent Power-hydrogen Coupling Modes powerhydrogen coupling at the load side 受端电氢耦合 powerhydrogen coupling at the source side 源端电氢耦合for power transmission 输电for hydrogen transport 输氢for local usage 就地利用 Reducing VRE curtailment降低弃风弃光率 Long-term energy storage长周期储能Hydrogenstorage,hydrogen-fueledgasturbines and fuel cells can realize long-termenergy storage.储氢结合燃氢机组或燃料电池,保障新能源为主体下的全时段电力电量平衡。Providinggrid-balancingservicesviaelectrolysers 为电网提供调峰、调频等辅助服务 Transporting renewable power over longdistances as H2将可再生能源转化为氢能实现大范围优化配置Little investment is needed to adapt naturalgas infrastructure to transport hydrogen.利用新能源尖峰出力制氢,利用天然气管道或氢气管道进行输送,缓解电网外送新能源的压力。

    浏览量0人已浏览 发布时间2023-12-01 20页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • LiveVideoStack:2024音视频技术发展报告(53页).pdf

    2024音视频技术发展报告着眼现在、探究未来、创造新价值出 品 人:LiveVideoStack责任编辑:包 研执行编辑:张 余编 委:李志成 高 芃 刘 旻 赵 琪 薛 笛 刘 然 王 军 王雅光 .

    浏览量0人已浏览 发布时间2023-11-30 53页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 清华大学:2023年SAVA-X 域间源地址验证技术白皮书(39页).pdf

    SAVA-X 域间源地址验证技术白皮书White Paper for Source Address ValidationArchitecture-eXternal(SAVA-X)清华大学华为技术有限公司新华三技术有限公司2023 年 11 月前 言缺乏对源地址真实性的验证机制是当前互联网体系结构存在的一个重大安全设计缺陷。当前互联网面临的主要安全威胁中,以伪造源地址为基础的攻击手段(如身份哄骗、中间人攻击、分布式拒绝服务攻击、路由劫持、域名系统缓存投毒等)占据了重要地位,对互联网的安全性和可用性造成极大的破坏,使得网络的安全可信面临极大的挑战,真实源地址验证成为亟需突破的互联网核心技术之一。源地址验证体系结构将源地址验证技术分为了三个层次:接入网层、地址域内层、地址域间层。其中地址域间层处于多个不同网络运营商的管理范围,网络连接复杂多变,网络用户缺乏信任,同时域间网络往往是网络的核心所在,承担的流量极其庞大,需要平衡效率和安全,因此需要一套简单、轻量、高效的机制,以抵御域间源地址伪造攻击。域间源地址验证(SAVA-X)方案构建了层次化信任联盟机制,将现有网络按照一定的标准,划分为层次化可自嵌套的地址域层级联盟;通过联盟链维护地址域数字资源信息,保证地址域信息真实可靠不可篡改;地址域之间两两维护一对时间同步状态机,通过时间触发状态机的状态迁移同时生成加密标签,实现无通信开销的标签轮换机制。在数据面通信时,地址域的边界路由器处理数据包中携带的标签,源端地址域添加标签、中间地址域验证替换标签、目的端地址域验证移除标签,通过标签的正确性,保证源地址的真实性,实现域间源地址验证。清华大学联合华为和新华三,共同攻关真实源地址验证关键技术,目前已经完成了体系结构的总体设计和支撑平台的研发,华为的 NE8000 系列核心路由器,新华三的CR16000 和 CR19000 系列核心路由器均已经支持域间源地址验证能力,可以开展现网实验并支持实际商业化部署。ii目 录前 言ii第一章互联网源地址安全现状1第二章项目背景52.1源地址伪造问题.52.2域间源地址验证方案.62.2.1基于域间路由信息的方案.62.2.2基于加密标签签名的方案.8第三章源地址验证体系结构12第四章层次化域间源地址验证技术154.1总体机制.154.2地址域管理.164.3控制平面.184.4数据平面.224.5数据包签名机制.23第五章系统实现与典型应用265.1系统实现.265.1.1控制服务器端实现.265.1.2核心路由器端实现.275.2典型应用.305.2.1真实可信网络.30iiiiv目 录5.2.2高价值网络防御.31第六章标准化进展33附录 A 缩略语列表34附录 B 编写组成员名单35第一章互联网源地址安全现状自 1967 年美国实施 ARPANET 计划以来,互联网从最初的 4 个主机节点发展到了今天的全球自治互联。互联网成功渗入了政治外交、经济金融、军事战争、社会生活、文化娱乐等各个方面,互联网的持续发展极大的便利了人们的生产生活,促进了社会的长足进步和经济的持续发展,已成为最重要的人类社会信息基础设施和国家战略资源。互联网的成功是天时地利人和共同作用的结果,但最为重要的是构建了 TCP/IP(Transmission Control Protocol/Internet Protocol)体系结构,如图1.1所示,TCP/IP 体系结构是互联网发展成功的关键所在。图 1.1 互联网窄腰模型互联网协议(Internet Protocol,IP)作为最为重要的两个互联网的标准协议之一,“IP on everything”和“everything over IP”,使得 IP 起着承上启下的作用,保证了全网通达。IP 是异构网络互联的基础,也是体系结构的核心,更是互联网能够快速迭代发展的基石。作为互联网早期设计者的 Vinton Cerf 指出 IP 在设计上:与通信技术无关:仅转发数据包,可运行于任何通信技术之上;与边缘创新无关:增加边缘创新应用/服务,网络无需做任何改变;支持大规模扩展:支持十亿级规模扩展;完全开放:对所有新协议、新技术、新应用提供开放服务。12第一章互联网源地址安全现状在 20 世纪 80 年代设计运行之初,互联网节点稀疏,节点之间彼此信任,同时受限于当时通信技术的发展,互联网采用了“尽力而为”的转发方式,中间节点转发 IP 数据包的时候,不会检查数据包的源 IP 地址,只是根据目的 IP 地址进行转发。尽管依托于 IP 协议良好的高瞻远瞩式设计,互联网能够高速迭代发展至今,但是伴随互联网的蓬勃发展,用户节点数量激增,纷繁复杂的网络连接致使节点间信任缺失。作为重要的基础设施之一,互联网由于网络初始设计上的缺陷,缺乏对源 IP 地址真实性的验证机制,致使网络自身的安全性和可靠性仍然难以得到保障。IP 协议是互联网的核心协议,源 IP 地址真实性的缺失影响到互联网体系结构的各个层面。当前互联网面临的主要安全威胁中,以伪造源 IP 地址为基础的攻击手段,如身份哄骗、中间人攻击、分布式拒绝服务攻击、路由劫持、域名系统(Domain Name System,DNS)缓存投毒等,占据了重要地位。利用这一缺陷发起的网络攻击层出不穷,不仅对网络的持续发展产生了一定的制约,而且对人们的生产生活造成了重大困扰。互联网巨擎 VintonCerf 指出,当前的互联网体系结构缺乏安全可信基础,很容易发生网络攻击,值得深入研究。IP 地址具有语义二重性,使得 IP 地址既可以作为用户的身份信息标识,又可以作为用户的地理位置信息标识,身份信息标识体现为用户在网络中的身份,位置信息标识则体现在用于从目的设备向源设备反向发送数据。伪造 IP 地址则既可以隐藏攻击者身份,又可以隐藏攻击者位置。承担着位置和身份双重角色的 IP 地址,在数据传输过程中暴露出的严重缺陷是互联网最根本的威胁,使得应用伪造 IP 地址已经成为大量攻击成功的一个先决条件。同时,伪造 IP 地址的威胁不仅存在于网络层:基于 IP 协议的许多协议,使用 IP 地址这个并不安全的标识作为通讯对方的标识,因而只要伪造了源地址,相应地就欺骗了这些协议,这使得伪造源地址攻击的能力超出网络层范围,危害到其它更上层的协议。通过禁用或者过滤源 IP 地址这种简单的策略并不会明显减少攻击流量,导致受害者遭受攻击的时无法进行有效的反制以及防御,同时使得定位溯源攻击者也变得异常困难。网络设备使用假冒的源 IP 地址发起网络攻击或进行不正当网络活动的行为被称为源 IP 地址伪造,即源 IP 地址伪造是指网络设备使用并不属于它的 IP 地址作为源地址发送数据包的行为,经过修改后的源地址称为伪造源地址。利用源地址伪造的手段,网络攻击的发起者可以隐匿自己的身份和位置,逃避法律的制裁。使用伪造的源地址的网络攻击行为难以被追溯,这是当前伪造源地址行为泛滥的原因。借助伪造源地址发起的分布式拒绝服务攻击(Distributed Denial of Service,DDoS)是当前互联网公认的最大的安全威胁之一。随着源地址伪造手段的大量使用,基于真实地址的网络计费、管理、监控和安全认证等都无法正常进行,对互联网基础设施和上层应用都造成了严重的危害。随着互联网的发展,基于源地址伪造的网络攻击愈发猖獗,IP 地址可伪造、不可信等问题给网络可信安全访问带来严重的威胁,甚至严重危害到社会和国家的安全。总的来说,源地址伪造主要带来了如下 3 方面的安全问题:31.一些攻击类型,例如远程访问注入攻击(CWE-78)1,在原理上依赖于假冒源地址,它们需要伪造特定的地址才能成功发起攻击;2.一些攻击类型,例如分布式拒绝服务攻击,虽然可以不伪造特定源地址就可以发起攻击,但是一旦采用了伪造源地址,则可以起到隐藏攻击真实源头的目的,令管理者不易发现和制止;3.目前很多应用以源地址为资源使用的标识,例如可使用 IP 登录的应用网站,在地址假冒的情况下,攻击者可以盗用网络资源,损害了网络运营者的利益。根据应用互联网数据分析中心(Center for Applied Internet Data Analysis,CAIDA)的统计报告2,如图1.2所示,当前互联网,在不支持网络地址转换(Network AddressTransition,NAT)技术的 IPv4 网络中,有 18.8%的 IP 地址块可以被伪造,有 30.4%的自治域支持伪造源地址;在支持 NAT 技术的 IPv4 网络中,有 8.5%的 IP 地址块可以被伪造,有 24.7%的自治域支持伪造源地址;在 IPv6 网络上有 17.4%的 IP 地址块可以被伪造,有 35.0%的自治域支持伪造源地址。测量结果表明,在互联网上伪造源地址是相对容易实现的。,3Y1$71$7,3Y1$7,3Y,3Y1$71$7,3Y1$7,3Y图 1.2 IP 源地址可伪造现状令人不可思议的是,作为防御手段的最佳实践 BCP383,在实际部署中,入口过滤的部署率小于出口过滤部署率:67.0%的 IPv4 自治域和 74.2%的 IPv6 自治域,不会1https:/cwe.mitre.org/data/definitions/78.html2https:/spoofer.caida.org/summary.php,2023.04.253https:/www.rfc-editor.org/info/bcp384第一章互联网源地址安全现状过滤声称来自他们网络的外部流量4。这表明大多数自治域的路由器使用的是一种“宽进严出”的策略,即自治域网络管理者基于某种考虑,可能是防御手段的假阳性,也可能是用户体验,即便知道进入本自治域的一些数据包是伪造的,也没有进行过滤,这体现了源地址伪造的猖獗和治理的复杂性。4https:/www.caida.org/projects/spoofer/spoofer-flyer.pdf第二章项目背景2.1源地址伪造问题网络设备使用并不属于它的 IP 地址作为源地址发送数据包的行为称之为源地址伪造。源地址伪造可以发生的根本原因是互联网设计时假设了网络内部成员互相之间都是可以信任的,并没有充分地考虑随着网络规模扩大和网络信息开放,网络成员之间信任缺失带来的安全威胁。在网络中,终端设备通信时发出数据包,以路由器等为代表的中间转发设备只是根据数据包的目的地址进行转发,而不对数据包的源地址进行任何校验和检查,为源地址伪造的发生提供了基础设施上的支持。源地址可伪造是互联网的一个核心安全问题,众多类型的网络攻击都需要直接或者间接地借助于源地址伪造技术。当网络中的设备使用伪造的 IP 源地址进行通信时,ISP 在管理上将面临以下两方面的困难:难以追溯攻击者的身份和位置。IP 地址具有语义二重性,IP 地址是一台终端设备在网络中的唯一标识,它既标识设备在网络中的位置,同时也标识设备在网络中的身份。数据包中伪造的 IP 源地址同时隐藏了攻击者的地理位置及其身份信息,导致通过 IP 地址对攻击者进行溯源追踪难以实现,使得攻击者可以逃脱法律的惩戒和制裁。难以追溯攻击者的身份和位置是当前互联网中依托于伪造源地址发起网络攻击行为泛滥的重要原因。难以防御基于伪造源地址的网络攻击。现在使用的两个 IP 协议版本中,IPv4 的地址空间有 232个地址,IPv6 的地址空间则扩大到了 2128个地址,即便是去掉标准规定的私有地址和保留地址之后,IP 地址空间仍然十分庞大。过于庞大地址空间就导致网络管理者无法使用访问控制列表(Access Control List,简称 ACL)等简单的策略,通过禁止某些 IP 地址访问的方式来防御网络攻击。TCP/IP 协议栈是互联网事实上的协议栈标准。根据 TCP/IP 协议栈的设计,IP协议是互联网的核心协议之一,起着承上启下的作用。TCP/IP 协议栈中,IP 的上层协议如 TCP、UDP 等,依赖于不安全、不真实的 IP 地址作为通信双方的标识,一旦使56第二章项目背景用了伪造的 IP 源地址,也就实现了对基于 IP 的上层协议的欺骗和伪造,危害到了上层协议的安全性和真实性。互联网已经成为社会生活中重要的基础设施,是国家的战略资源。然而基于源地址伪造的网络攻击愈发频繁和猖獗,严重威胁到了社会中重要网站和服务的安全性和可用性,给现实社会带来了巨大的经济财产损失。增强互联网中的端系统和路由设备对数据包源地址的验证和过滤能力,对于提升互联网的安全性、可用性、鲁棒性以及人类社会健康良好的生产生活都具有重要意义。2.2域间源地址验证方案在国内外工业界和学术界的一致努力下,当前对于 IP 源地址进行验证过滤已经提出了比较多的方案。按照清华大学在 2008 年在 IETF 提出的 RFC 5210 的分类方法,可以将源地址验证工作分为三层:接入网源地址验证层(简称接入层)、自治域内源地址验证层(简称域内层)、自治域间源地址验证层(简称域间层)。三层之间保护粒度越来越粗,保护范围越来越大。由于接入层和域内层都是位于同一个 ISP 运行、维护、管理下,其部署相对方便,但是域间层涉及到不同 ISP 的协作,容易发生不信任的情况,更有可能发生源地址伪造。因此,在本文中只关注并分析自治域间源地址验证技术方案。自治域间源地址验证技术,通常需要不同的自治域之间相互协作,通过分工协作来传递过滤规则,共同完成源地址验证并且过滤伪造源地址数据包的任务。自治域间源地址验证方案根据技术原理以及特点可以分为两个大类:一类是借助于域间路由信息,通过现有的路由协议携带数据包转发路径上的源地址相关属性信息,验证相关信息正确性保证源地址真实性;另一类是基于加密标签签名的方案,通过对数据包进行加密或者签名,通过加密算法的安全性保证源地址真实性。2.2.1基于域间路由信息的方案基于域间路由信息方案的基本假设是,在一般情况下,攻击者能够伪造数据包中的源地址,但是并不能更改数据包的转发路径。基于域间路由信息的源地址验证方案通过BGP 等外部边界网关路由协议,来携带数据包转发路径上的源地址属性信息,这些属性通常是一些自治域级别的信息,例如自治域路径、路径长度以及路径标识等信息。自治域的边界路由器通过源地址属性信息来检验经过它的流量是否发生了源地址伪造问题。单播反向路由查找技术(unicast Reverse Path Forward,简称 uRPF)具有三种常见的工作模式:严格模式、宽松模式和可行模式。工作在严格模式下的 uRPF,检查数据包的入接口是否和反向到达数据包中 IP 源地址的出接口相匹配。如果不匹配,则认2.2域间源地址验证方案7为数据包使用了伪造源地址并进行过滤。由此可见,只有在对称路由的网络中可以启用严格模式的 uRPF,对称路由网络中数据包的转发方向和到达方向具有一致性。但是,随着 ISP 和用户对网络可用性和健壮性期望的提高以及新的自治域加入网络,两个对等自治域之间可达路径逐步增加,拓朴结构变得复杂,路由对称性难以得到保证,增加了数据包正向转发和反向转发非对称的可能性,导致严格模式下的 uRPF 方案假阳性问题严重。工作在宽松模式下的 uRPF,不关注数据包到底从路由器的哪个接口接收,而只检查路由表中是否存在和数据包 IP 源地址相对应的表项。如果存在对应表项,则认为数据包源地址是真实的,否则过滤数据包。宽松模式的 uRPF 并不能过滤已经存在于路由表项中的伪造源地址数据包,存在着严重的假阴性问题,其过滤能力比较差。在检查时去掉对默认路由的检查,这时如果路由表项包含了所有的合法可达地址,那么将能够提高宽松模式的 uRPF 过滤效果。工作在可行模式下的 uRPF,扩展了严格模式,增加了数据包到达接口的可行范围,在一定程度上降低了严格模式的假阳性,但同时也增加了假阴性。当网络中的等价路径较多时,增加数据包到达的可行接口实质上已经退化为了宽松模式,此时假阳性问题和假阴性问题都存在。出入口过滤(Ingress Egress Filtering,简称 IEF)是一种部署在网络的边界路由器上过滤数据包的技术,它过滤来自该网络但是其源地址却不属于该网络,以及发送至该网络但是其源地址却是该网络的数据包,前者为出口过滤(Egress Filtering),后者为入口过滤(Ingress Filtering)。由于网络庞大的 IP 地址空间,相比于出口过滤,入口过滤方法在网络中更为常见。入口过滤常常被使用在服务提供自治域(Provider AS)和客户自治域(Customer AS)之间的链路上以及自治域出口处,用于过滤伪造源地址的流量。入口过滤的过滤规则的建立依赖于手动配置或者依赖于路由表的 uRPF。由于只需要依赖于现有路由表而不需要其它额外的信息,入口过滤是一种非常高效的方法。实际上,如果每一个自治域的出口路由器都部署了入口过滤,那么互联网上自治域粒度的源地址就一定是真实的。但是根据调查研究,互联网上只有 80%的自治域部署启用了BCP 38 即入口过滤技术,剩下 20%的自治域则未启用该技术,方案的完整性受到破坏。而且当 Customer AS 使用的是和 Provider AS 无关的前缀时,或者 Customer AS是一个多宿主的自治域时,基于 uRPF 生成的过滤规则可能会存在假阳性问题,致使方案的可部署性遭受挑战。对于其它类型的自治域间链路,由于路由的对称性基本不存在,所以入口过滤并不完全适用。而基于手动配置的入口过滤,存在配置过于复杂以及很难适应网络动态变化的情况。分布式包过滤(Distributed Packet Filtering,简称 DPF)是一个重要的基于路由进行过滤的工作,其核心思想是在自治域间部署基于流和接口的绑定关系或者基于路由地址前缀的过滤规则。通过实验模拟,DPF 证明了其构建的过滤规则在互联网上是有效的,只需要 20%左右的自治域部署 DPF 就可以使 70%的自治域免于基于源地址伪造技术的攻击。但是 DPF 只是提出了一个方案框架,并没有给出如何生成过滤规则表。同时也没有说明为了避免“公共地的悲剧”,作为公共物品的源地址伪造防御方案,应8第二章项目背景该如何推进自治域的部署。DPF 的后续工作都在研究如何生成过滤规则表。这些工作可以分为两个方向,一是完全自治域本地化地生成过滤规则表;二是依赖于自治域合作生成过滤规则表。在第一个方向上的代表工作是域间包过滤方案(Inter-Domain PacketFilter,简称 IDPF),它通过学习 BGP 更新报文(BGP Update)来推断出源和目的自治域之间可能的路径信息和相互之间的关系。IDPF 依赖于 Valley-free 特性来生成本地的过滤表,“Valley-free”即自治域间商业关系的无低谷特性,任何自治域都不愿意为其自身以及 Customer AS 之外的任何流量付费。由于自治域间 Valley-free 路径的多样性,IDPF 生成的过滤规则表实际上比较宽松,限制了方案的过滤能力。DPF 在第二个方向上的代表工作有 BASE 和 BGP Selection Notice。BASE 和 BGP Selection Notice 都需要通过修改 BGP 协议来传播路径信息,以帮助其它自治域生成正确的过滤规则表。BASE 方案需要部署自治域向 BGP 宣告中加入标签,收到宣告的自治域学习到标签并将标签和源地址前缀进行绑定以建立过滤规则表。BGP Selection Notice 方案为 BGP新增加选路通知报文,将选路策略通过 BGP 宣告通知路径上的所有自治域,进而建立过滤规则表。基于跳数计数过滤方案(Hop Count Filtering,简称 HCF)是依赖于数据包从源自治域到检查点自治域的跳数和 IP 源地址前缀之间的关系,对数据包源地址进行验证的方法。在域间路由稳定的情况下,从一个源自治域到检查点自治域所需要经过的跳数是固定的。检查点自治域首先从数据包的 IP 数据包头中的 Time-To-Live(TTL)字段推断出数据包所设置的初始 TTL 值,然后用推断出的 TTL 值减去 TTL 现值就可以得到数据包所经历的跳数。如果事先建立了地址前缀和跳数之间的映射关系,那么就可以判断数据包源地址的真实性。HCF 最大的优势是:对于终端设备或者边缘网络等出口很少的网络,上述基于路由方向的过滤方案无法很好地工作,而这时基于跳数过滤可以起到较好的效果。另外地址前缀和跳数的对应关系也可以通过学习或者探测的方式获得,无需制定新的协议。但是自治域间网络抖动以及路由动态性的存在使得 HCF 方案获得的是一个区间范围的可行解集,为了减少假阳性,其源地址验证保护粒度相当粗放,同时由于初始 TTL 值是可以伪造的,HCF 方案假阴性问题严重,造成其实际应用相当困难。2.2.2基于加密标签签名的方案基于加密标签签名的技术方案主要依靠源端自治域在数据包中打上特定的标记,然后由目的端自治域负责检查标记和数据包源地址的匹配关系,这是一类端到端的验证方案。端到端验证的一个明显优势就是与路由无关,所以不用处理路由带来的动态性和复杂性,然而其明显的缺陷就是需要同时修改路由设备的控制平面和数据平面。首先这类方案需要一个控制平面的协议来交换密钥信息,此外,必须在数据包中添加一些额外信息。除去处理效率方面的考虑,这种模式可能会影响其它协议的工作。此外,如果数据包本身已经是最大长度且网络不支持分片,这时也就无法向数据包中插入信息。2.2域间源地址验证方案9IPSec 方案是一类经过了 IETF 标准化的方案,它可以为 IP 层的通讯提供认证和加密的机制。通讯中的双方可以通过在数据包中添加和检查认证头(AuthenticationHeader,简称 AH),IPSec 使用 AH 确保数据包来自于 IP 源地址的拥有者而非伪造源地址。IPSec 除了用在通讯双方的主机之间,也可以用在两个网络之间,或者主机和网络之间,通过使用协商好的密钥,构建一条端到端的隧道,隧道的机密性、完整性和不可篡改性由协商的端到端密钥和加密算法来保证。尽管 IPSec 经过多年的发展,已经是一项十分成熟的技术方案,在现在的网络中作为 VPN(Virtual Private Network,简称VPN)方案使用,但是 IPSec 在用于源地址保护时,却有着不可忽略的缺陷。如果使用互联网密钥交换技术(Internet Key Exchange,简称 IKE)来进行密钥交换,则 IPSec方案最大的问题在于,交换密钥的双方无法证明各自对于所使用地址的所有权,例如一个主机可以用一个同一个子网下没有被分配给它的地址和对方完成密钥交换,这可能来源于中间人攻击。此外,IPSec 的数据包验证采用摘要算法单向哈希如 MD5 或者SHA1,验证开销较大,使得路由器可能成为 DoS 攻击的目标,从而瘫痪网络,因此在实际中,AH 报文头应用较少,IPSec 常常作为一种 VPN 技术存在,并不能大范围应用于互联网全局。SPM 方案(Spoofing Prevention Method,简称 SPM)建立了信任联盟机制,每个部署 SPM 方案的自治域都必须加入信任联盟,但在决定部署 SPM 方案之前自治域则是自愿选择部署的。处于信任联盟之内的所有成员自治域都需要承担为其它成员自治域提供源地址验证过滤的义务。该方案需要事先协商要使用的特定标签,该标签具备方向性,源自治域到目的自治域和目的自治域到源自治域需要使用不同的标签。在通信时源端自治域的边界路由器向数据包添加标签,目的端自治域的边界路由器验证数据包中的标签,通过标签正确性来保证数据包源地址的真实性。而对于信任联盟之外的其它自治域,由于缺少必要的协商标签的过程,信任联盟内的自治域则不会为其提供该项源地址验证过滤支持。由此可知,SPM 最大的弊端是不会阻止信任联盟之外的源地址伪造,对于目的地址是信任联盟内部的自治域才会校验数据包的源地址,否则并不会进行过滤操作,因此 SPM 方案只有通过扩大信任联盟部署规模才能防止更多的源地址伪造。只有当全局部署时,SPM 的部署收益才能有显著地提升,部分部署时其部署收益变化不大。同时由于在自治域间通信时,SPM 方案所使用的标签是事先协商确定的,没有做到逐包变化,所以面临着标签重放攻击,攻击者可以线上窃听标签并进行重放,造成方案的假阴性问题。可审计 IP 方案(Accountable Internet Protocol,简称 AIP)将网络划分为独立的可审计域,在可审计域内和可审计域间可以进行源地址验证。网络设备和可审计域都使用一个 160 位的比特串作为自身标识,该标识使用了加密生成地址(CryptographicallyGenerated Addresses,简称 CGA)的技术来生成,其具有自验证的能力。每一个数据包中都包含了源网络设备标识、源可审计域标识、目的网络设备标识、目的可审计域标识这样的四元组,依靠标识的自验证能力,转发路径上的数据包转发者和数据包接收10第二章项目背景者都可以检查数据包源标识的真实性。AIP 的优势在于使用全局性的自验证地址可以避免引入验证所需要的密钥基础设施,同时可验证性的可审计域标识使得伪造源地址的数据包在汇聚到接收者之前就可以被大量过滤,避免了由于加密验证开销导致的资源耗尽式的拒绝服务攻击。但是 AIP 使用的加密生成地址的方式是一种非常激进的设计,和现在的互联网体系结构完全无法兼容,无法适用于 IPv4 或 IPv6 下的地址结构。即便不考虑地址的后向兼容性,由于 AIP 中的地址标识采用加密的方式完全随机生成,不具备地址前缀汇聚性,导致网络中每一个路由设备需要存储非常巨大的路由表,和现在的路由体系结构也无法兼容。这种方案在目前条件下看来还不具有可行性。Passport 方案可以在自治域内和自治域间进行源地址验证。Passport 方案设计时考虑了现有的网络体系结构,因此具备一定的向后兼容的性质。Passport 方案原理是在数据包中插入根据源端自治域和检查端自治域之间的密钥产生的加密内容,又称为消息认证码(Message Authentication Code,简称 MAC)。和 IPSec 的端到端的检查不同,Passport 方案考虑了路径上节点对数据包真实性进行检查的能力,因此它是一个结合了基于域间路由信息和基于加密标签签名的方案。在端系统上,端系统需要产生和自治域边界路由器之间的 MAC-P,以及和目的端之间的 MAC。边界路由器在检查数据包中的 MAC-P 通过之后会移除 MAC-P,并且在数据包中插入本自治域和路径上其它自治域之间的 MAC。MAC 会被路径上的自治域逐一检查,直到数据包到达目的端自治域。Passport 实际上是一种在数据包转发路径上也能够检查数据包 MAC 并进行替换的方案,这种检查替换的特性可以很好地防止伪造源地址的攻击流量汇聚到目的端受害者自治域。尽管 Passport 方案考虑了向后兼容性,但是它依然需要一个全局的信任基础设施来帮助其生成自治域之间的 MAC,以及一个自治域内的公钥基础设施来帮助产生主机和边界路由器之间的 MAC。此外,在数据包中插入 MAC,实际上是路由器和主机暂不具备的功能,所以需要 ISP 付出巨大的成本去大量的升级现有设备。此外,插入和检查 MAC 使用的对称密钥算法或者单向哈希摘要算法会给路由器带来较大的开销。除去性能和部署上的考虑,Passport 方案在终端设备地址真实性上的考虑略有欠缺。现在的终端设备配置的地址通常并非是固定不变的,而是依靠 DHCP 等协议动态分配的。在动态分配地址的情况下,边界路由器实际上很难知道终端被授权使用哪一个地址,这时检查源地址的真实性实际上是没有意义的。同时由于域间路由的动态性,Passport 方案在转发路径上使用了逐段检查,但是又没有使用如分段路由等源路由技术,这无可避免地增加了方案的假阳性。SMA 方案(State Machine-based Anti-spoofing)是一个基于时序状态机的轻量化的 SPM 演化方案。SMA 方案最大的优点是使用基于时序同步状态机的方式,在自治域本地通过状态机的运行生成一致性标签,取代了 SPM 繁琐的密钥交换过程,提升了控制面的安全性。SMA 作为一个端到端的方案,通过标签的真实性保证源地址的真实性,中间路由器无需感知如何处理标签选项头,可以和现有部署了 IPv6 但是没有部署SMA 机制的路由器兼容。但是一个比较严重的问题是 SMA 没有充分考虑互联网较为2.2域间源地址验证方案11明显的层次化拓扑分布,互联网上最多的自治域类型是 Stub AS,这种类型的 AS 没有下联自治域,其本身可能具有多个出入口,也可能只有唯一的一个出入口。由该类型自治域的上游自治域进行源地址验证,就可以保障该自治域的源地址真实性。由此 SMA机制实际上维护了大量的非必要的状态机,浪费了较多资源。同时,SMA 方案同其它端到端方案一样,其更大的弊端是没有实质性减少网络数据包转发路径中的伪造流量,这些流量只有到达了目的自治域的边界路由器才会因为源地址检查未通过而被丢弃,中间路由器没有对源地址进行检查,所以造成的后果是网络中仍然可能充斥着大量的伪造流量。通过合理的层次化让中间部署了源地址验证方案的路由器参与源地址验证有助于解决这两个问题。分布式协作系统(Distributed Collaboration System,简称 DISCS)是 SPM 的拓展方案,在其基础上完善了方案具体的实施方法。DISCS 依托于不同自治域之间的协作,其将信任联盟划分为了不同的防御联盟,一个自治域可以自愿加入和其存在共同利益的防御联盟。同时 DISCS 将可选、可传递的路径属性设置到 BGP 更新消息中,在联盟成员间进行传递,以区分不同的防御联盟。最终 DISCS 将整个互联网划分为多个并行的防御联盟,每个防御联盟内提供与 SPM 类似的防御保护能力,但防御联盟之间并不建立防御共识。DISCS 最大的贡献是可以按需调用防御功能,而不需要自治域边界路由器一直开启防御功能,这对于提升方案性能和执行效率具备实际意义。部署 DISCS的自治域需要实现 4 个防御函数,用于实现协同防御功能。这些防御函数包括目的保护、密码学的目的保护、源保护和密码学的源保护。联盟成员在收到攻击时,其可以请求其它联盟成员执行最适合的防御函数。当攻击停止时,其它联盟成员将会停止防御函数执行。按需调用的协作方式降低了防御开销,同时降低了假阳性问题。但是 DISCS的防御联盟建立依托于 BGP 协议的安全性,后者的安全性也是目前互联网亟待攻克的难题,因此 DISCS 的部署也受到了挑战。第三章源地址验证体系结构针对源地址可伪造这一国际互联网重大技术挑战,清华大学提出了分而治之、端网协同的真实源地址验证体系结构(Source Address Validation Architecture,SAVA)1。真实源地址验证体系结构 SAVA,用于在网络层提供一种透明的服务,确保互联网中转发的每一个分组都使用“真实源 IP 地址”,具备三层含义:经授权的:源 IP 地址必须是经互联网 IP 地址管理机构分配授权的,不能伪造;唯一的:源 IP 地址必须是全局唯一的;可追溯的:网络中转发的 IP 分组,可根据其源 IP 地址找到其所有者和位置。下一代互联网管理的现状是:不同的网络管理者负责管理各自的网络,这些网络的互联构成全球互联网。其中,一个网络管理者可以拥有一个或多个自治域(AutonomousSystem,AS),一个自治域也可以包含多个网络管理者的网络。由于 IP 地址作为互联网的通信标识具有全球唯一性,每个网络管理者拥有其独属的 IP 地址前缀集合,称其为地址管理域,简称地址域(Address Domain,AD)。按地址域划分接入网内、地址域内和地址域间三个层次、不同粒度的源地址验证体系,具有系统化、层次化、松耦合、多重防御、支持增量部署的优点,显著提升了源地址验证体系结构的灵活性和适应能力,更加适应下一代互联网实际运行管理现状。根据下一代互联网管理现状,改进的面向地址域的新型源地址验证 SAVA 体系结构,如图3.1所示,针对接入网、地址域内、地址域间三个层次,分别确定了单个地址、地址前缀、前缀集合的不同验证粒度,相应提出了地址同步、多模异构的真实源地址接入验证方法 SAVA-A(SAVA-Access),路由同步、动态过滤的真实源地址域内前缀验证方法 SAVA-P(SAVA-Prefix),多域同步、协作信任的真实源地址域间验证方法 SAVA-X(SAVA-eXternal),实现了:不同层次可以实现不同粒度的 IPv6 源地址真实性验证;1SAVA 工作已经于 2008 年在互联网工程任务组(Internet Engineering Task Force,IETF)进行了标准化,编号是 RFC 5210:A Source Address Validation Architecture(SAVA)Testbed and DeploymentExperience(https:/datatracker.ietf.org/doc/rfc5210/)1213 每一层次,允许不同网络运营商采用不同方法技术验证源 IP 地址真实性;整体结构简单性和各部分组成的灵活性的平衡。图 3.1 下一代互联网真实源地址验证体系结构 SAVA源地址验证体系结构中,接入层是地址粒度最细的层次,它保证了设备接口级别的安全,具有最精确的源地址验证保护粒度;地址域内层是中等地址粒度的层次,它保证了自治域内部的源地址的真实性,防止内部子网设备伪造源地址,保证地址前缀级别的安全,但是两者都不能保证来自更大范围的外部网络地址的真实性。同时接入网层和地址域内层基本都是属于同一网络运营者在管理,其相对于地址域间层的源地址验证较为简单,而域间层的源地址验证可能会涉及到不同 ISP 之间的相互信任与协作,迫切需要系统地解决分布式非协作网络跨域可信访问难等安全问题。域间真实源地址验证技术 SAVA-X 主要的目标是提供地址域前缀粒度的源地址真实性。SAVA-X 以地址域为单位,地址域是一个 IP 地址前缀所对应的所有 IP 地址组成的地址集合,由加入 SAVA-X 方案的所有地址域共同组成的信任联盟,内部经过划分形成分层的地址域信任联盟,称为地址域层级联盟,每一层都有其层级编号,编号从 0开始。地址域之间使用状态机进行端到端的源地址检查验证;部署 SAVA-X 的地址域共同组成信任联盟,联盟成员之间彼此可信任、可验证、可追溯,对联盟外的源地址伪造具有识别和过滤能力。扁平式的域间源地址验证方案不利于方案增量部署实施,且不能及时丢弃伪造流量,使得伪造流量只有到达目的端地址域才会被丢弃,浪费了宝贵的网络带宽。层次化域间源地址验证技术方案依据流量关系、地理位置等方式,将网络划分为层次化可嵌套的地址域,通过逐级验证替换标签的方式及时发现伪造流量,解决了上述两个问题。为了增加可扩展性、增强增量部署能力且能尽早过滤伪造源 IP 地址的数据包,SAVA-X设计了信任联盟的层次化方法,采用一种基于轻量级标签替换的地址域端到地址域端14第三章源地址验证体系结构的加密认证机制,使得整个信任联盟系统构成一种具有源地址验证功能的、层次化的体系结构。通过虚拟地址域、层次化标签替换等技术实现了多域协同、多域聚类的域间信任传递,解决了多径传输场景下地址域间 IP 地址前缀集合粒度的真实源地址验证问题。SAVA-X 提出了基于端到端验证的域间源地址验证机制 SMA(State Machine basedAnti-spoofing)。通过维护同步状态机生成加密标签签名来实现端到端源地址验证,是SAVA-X 方案的核心机制。基于状态机同步的域间源地址验证 SMA 技术,是一种端到端验证机制,通过引入状态机自动同步,实现低开销、轻量化的对称密钥更新机制。将SMA 技术应用于域间真实源地址验证,是以地址域为单位,地址域之间使用状态机进行端到端的源地址检查验证;部署的地址域共同组成信任联盟,联盟成员之间彼此可信任、可验证、可追溯,对联盟外的源地址伪造有识别和过滤能力,因此对部署方提供了保护和部署激励,支持增量部署。SAVA-X 设计了数据包防篡改机制,通过把数据包中的部分信息和状态机产生的标签进行拼接并计算其 Hash 值,达到逐包签名效果,并在目的端地址域的边界路由器上验证签名,从而有效抵御攻击者复用标签的攻击方式。SAVA-X 的具体技术内容在第四章介绍,SAVA-X 的实现部署应用工作在第五章介绍,在 CCSA TC3 WG2 以及 IETF 进行标准化的进展情况在第六章介绍。第四章层次化域间源地址验证技术4.1总体机制扁平信任联盟结构的域间源地址验证方案,要求加入信任联盟的每两个地址域之间都维护至少一个时间同步状态机1,协商初始状态以及状态迁移间隔等状态机相关参数。在时间同步后,各状态机在本地运行,由时间触发状态迁移的同时生成一个加密位串作为标签,源端地址域的边界路由器(AD Edge Router,AER)发送数据包时添加标签,目的端地址域的边界路由器收到数据包验证移除标签,通过标签的正确性,保证源地址的真实性。但是当信任联盟内包含大量的对等地址域时,以扁平信任联盟方式在互联网全局进行增量部署是比较困难的,尤其是在部署后期,每新增一个对等地址域,需要信任联盟内的所有地址域都与新增地址域维护一个时间同步状态机,这在网络管理运维上是及其困难的。同时在扁平模式下,中间节点地址域不会检查数据包,伪造流量只有在到达目的端地址域后才会被检查丢弃,伪造流量仍然充斥着整个网络,浪费了宝贵的网络带宽资源。为了增加可扩展性,并且能够尽早丢弃伪造流量,SAVA-X 设计了层次化的信任联盟方案。在扁平信任联盟结构的域间源地址验证方案的基础上,立足实际网络拓扑结构和域间路由机制,通过合理的分层标准,SAVA-X 将部署了验证机制的所有网络划分成多层级地址域信任联盟,每一级地址域联盟可以作为成员(抽象为一个系统整体)自下而上的参加更高级别的地址域信任联盟,形成一种多级并存的、层次化的信任联盟体系结构。SAVA-X 层次化结构示意图如图4.1所示,通过引入实现标签替换的“中继代理”联盟边界地址域(Trust Alliance Edge AD,TAE-AD),如 AD3、AD4,将每一层级联盟和外界网络隔离,在确保域间高速通信的同时使得下层联盟和更高层联盟内部的网络环境彼此互不可见、互无影响,有效降低了边界路由设备状态机存储、查找、同步和处理等验证开销,即使在规模较大的层次结构中仍然能保证验证的有效性和简单化,着力体现“先部署先受益”的特点,具有一定的增量部署激励。报文经过 TAE-AD 时,1状态机是有方向性的,且状态机存在轮换,由此如果双向标签不一致或者状态机即将到期,就需要维护两个及以上的状态机。本文后续考虑最简单情况,即不区分状态机方向、不考虑状态机轮换,因此两个地址域之间只维护一个状态机。1516第四章层次化域间源地址验证技术TAE-AD 的边界路由器会替换现有标签为跨地址域级别标签,路径上的多次检查可以提前发现伪造报文,减少互联网中伪造源地址报文数量。域间分布式共识基础设施现有Internet基础设施(RPKI)分布式共识算法成员信息成员信息(N-1)级地址域ADC1(N-1)级地址域ADC2N级地址域AD1N级地址域AD3N级地址域AD2N级地址域AD4N级地址域AD5PKTTagAD1-VADC1PKTPKTTagAD1-VADC1PKTTagADC1-ADC2PKTTagVADC2-AD5PKTPKTTagVADC2-AD5PKTTagADC1-ADC2PKT图 4.1 层次化信任联盟4.2地址域管理地址域(Address Domain,AD)是一种可自嵌套的层次化结构,地址域内部可以继续划分地址域,层级数依次递增,地址域具体的层级数取决于网络运营商(InternetService Provider,ISP)管理上的灵活方便以及地址域所辖网络规模。地址域其内部是可聚合的地址前缀集合,是对现在网络一种逻辑上的划分,形成一种分层形式的网络,细化网络的管理范围,这可使得网络在管理上更加灵活方便,增强网络的可管理性、灵活性和安全性。将地址域信任联盟按照商业关系、地理位置关系、社会经济关系、军事关系、联盟互助关系、路由策略、网络结构等标准,划分为不同的地址域层级联盟,形成的每一个顶级地址域称之为 0 级地址域,最终地址域的层级结构构成一棵逻辑上的树型或森林型结构。当跨越地址域层级通信时,可能会产生多径问题,即数据包可以从不同的边界地址域进行跨越地址域层级,SAVA-X 使用了虚拟地址域(Virutual AD,V_AD),其表示当前地址域的外部所有地址域,如 V _AD1 代表了 AD1 外部的所有地址域,当数据包发送至当前地址域外部时需要使用虚拟地址域标识来表示目的地址域。4.2地址域管理17SAVA-X 使用域间分布式共识基础设施负责地址域创建(加入)、查询、更新和删除(退出)管理,域间分布式共识基础设施构建及存储信息如图4.2所示。Block j-1Block jBlock j 1Block j 2Block j-1Block jBlock j 1Block j 2运营商成员教育网组织结构管理部门服务提供方其它参与方去中心化的域间信任联盟Block i 1Block i 2Block i-2Block i-1Block i父级地址域号本级地址域号IP地址前缀地址域公钥Block j-1Block jBlock j 1Block j 2Block j-1Block jBlock j 1Block j 2Block j-1Block jBlock j 1Block j 2单节点维护内容联盟成员私链联盟管理链图 4.2 域间分布式共识基础设施地址域信息管理地址域需要一个地址域号(Address Domain Identity,ADID)来标识,地址域号使用 32 位的二进制数,并以 10 进制文本形式表示。为了和现有的自治域号兼容,同时为了保护自治域内部的网络拓扑信息,在自治域内部的地址域其地址域号只需保证在当前自治域内唯一,即自治域上级包括自治域的地址域号都是唯一的,自治域之下的地址域号只在当前自治域内部保证唯一性。地址域号在地址域注册的时候进行分配。地址域在划分好层次之后需要进行注册并分配地址。地址域注册时,需要提交一个包含地址域相关信息的 CSR 文件给域间分布式共识基础设施。地址域相关信息 CSR文件(Certificate Signing Request,证书请求文件)需要使用域间分布式共识基础设施存储,在 CSR 文件中包含本地址域号、父级地址域号、地址域所拥有的 IP 地址前缀以及地址域的公钥信息。当域间分布式共识基础设施节点收到地址域提交的 CSR 文件之后,需要通过共识合约首先验证 CSR 文件中地址域相关信息其中的父级地址域号指向的地址域是否存在,如果不存在,则不能通过该地址域的注册请求;如果父级地址域存在了,则需要验证父级地址域所拥有的 IP 地址前缀,是否可以包含申请注册的地址域的 IP 地址前缀,如果不能包含或者父级地址域的 IP 地址前缀和申请注册的地址域 IP 地址前缀完全一致,则不能通过该地址域的注册请求;如果父级地址域 IP 地址前缀可以包含申请注册的地址域 IP 地址前缀,且父级地址域的 IP 地址前缀和申请注册的地址域 IP 地址前缀不完全一致,则验证本地址域号是否和已经存在的地址域的地址域号相互冲突,以及是否合法,如果冲突或者不合法,则需要重新分配一个地址域号给当前申请注册的地址域;之后将申请注册地址域的相关信息取出打包成块,存储在域间分布式共识基础设施18第四章层次化域间源地址验证技术上。地址域的信息管理使用分布式共识基础设施完成,地址域相关信息在域间分布式共识基础设施上的存储以及域间分布式共识基础设施的节点区块信息如图4.2所示的示例,每个区块存储的是一个或者多个地址域的相关信息。域间分布式共识基础设施是由所有地址域信任联盟的参与方共同组建的,当有新的参与方想要加入信任联盟的时候,需要它所要加入的链中已有的各参与方的确认,该确认过程需要使用共识合约,资质审核可以在线下协商完成,共识合约只负责验证信息资质的完整性。在域间分布式共识基础设施上存储的信息,为了管理上的方便,这里不要求通过地址域号来体现地址域的层级关系,域间分布式共识基础设施的管理委员会链由 0 级地址域的代表节点组成,存储的是所有 0 级地址域的相关信息,每个 0 级地址域内部组成一条子链,存储的是本 0 级地址域内部的分层地址域的所有的相关信息,这些信息不会区分层级关系,这些信息对于在当前的 0 级地址域内的所有地址域都是可见的;对于所有非该 0 级地址域的其它地址域以及外界都是不可见的,也是不该被感知的。当需要查询某个地址域的信息时,需要提供该地址域的地址域号,并验证该查询节点在域间分布式共识基础设施中具备访问被查询节点的权限,如果不具备相应的查询权限,则限制操作;如果具备访问权限,则由域间分布式共识基础设施的查询接口返回地址域的地址域号、父级地址域号、所拥有的 IP 地址前缀以及地址域公钥信息。当需要删除某个地址域的信息时,需要提供该地址域的地址域号,并使用私钥对地址域相关信息签名,其中信息需要严格匹配提交注册时候使用的地址域号、父级地址域号、所拥有的 IP 地址前缀以及地址域公钥信息。当删除地址域的时候,首先校验该删除节点在域间分布式共识基础设施中具备删除被删除节点的权限,如果不具备相应的删除权限,则限制操作;如果具备删除权限,则使用公钥验证签名之后,进行删除,并将地址域号回收。当需要更新某个地址域的信息时,需要提供该地址域的地址域号,并使用私钥对地址域相关信息签名。当域间分布式共识基础设施收到地址域更新信息的操作时,首先校验该更新节点是否在域间分布式共识基础设施中具备更新被更新节点的权限,如果不具备相应的更新权限,则限制操作;如果具备更新权限,则使用公钥验证签名之后,需要按照创建的信息验证流程重新验证,通过后才可以进行地址域信息的更新。4.3控制平面SAVA-X 由控制平面和数据平面共同组成。控制平面需要完成联盟成员注册与管理、状态机协商与同步、边界路由器配置的内容。如图4.3所示,其中地址域的管理由域间分布式共识基础设施完成,时间同步则在本文档范围之外,可以使用 RFC5905 规定的网络时间协议(Network Time Protocol,NTP)完成各设备之间的时间同步。地址域4.3控制平面19号以及地址前缀信息同步需要保证宣告的一致性、完整性,状态机信息域参数则是通过ACS 之间的通信进行保密协商。边界路由器 AER 需要接收 ACS 下发的地址域号信息、地址前缀信息、标签策略信息,并配置到自己本地,以用于域间源地址的验证,同时也要同 ACS 保持时间同步。图 4.3 SAVA-X 控制平面本方案以标签校验的方式防止源地址的伪造。报文发送方在报文中加入标签,以标识自己没有伪造源地址。验证方在收到报文时,检查报文中的标签与本地生成的标签是否对应,如果对应,则说明报文没有伪造。这种标签校验的过程,标签自身的安全性非常重要。由于可能存在窃听等非正常情况,标签有可能泄露。同时,标签的更新影响方案的安全性与性能。本方案的特征,在于能够以极低的开销,精细粒度地防止源 IP 地址伪造,削减DoS/DDoS 攻击,并且支持增量部署。方案的最大特点是设计了一种在源与目的之间自动同步、更新标签的技术,做到降低运行与管理开销,对 DoS/DDoS 以及其他基于源地址伪造的攻击拥有很强的鲁棒性。标签通过时间同步状态机生成,图4.4展示的是状态机工作原理的示意图。协商初始状态后,状态机在本地运行,由时间触发状态迁移,同时生成标签。状态机在到期停止之前不需要进行额外通信,减少了方案的通信开销以及标签协商开销。标签生成算法是状态机机制中的一个重要组成部分,实现同步状态机生成标签,有两类不同的标签生成算法:伪随机数算法和哈希链算法。在伪随机数生成算法中,通常使用一个初始的数字或字符串作为“种子”,它对应于状态机的初始状态。使用种子,通过某种算法如 KISS 伪随机数算法(Keep It Simpleand Stupid),生成一个伪随机数序列作为标签序列。KISS 算法中,状态 S 可以表示为(x,y,z,c)。算法盒为 KISS()。每经过一次计算,状态都经历一次转移 Sn=Sn 1,也即状态中的四个分量 x,y,z,c 都发生了变化。同时,生成一个伪随机数(x y z)。伪随机数生成算法的基本设计目标主要是周期长、分布好等,并没有或很少考虑到安全20第四章层次化域间源地址验证技术算法盒A-Box状态Sn时间触发状态Sn 1标签Tagn生成转移图 4.4 状态机工作原理示意图因素,比如,是否可以从当前的一个或几个随机数逆推出种子、或者预测出下一个随机数。基于哈希链的标签算法的设计可以参见 RFC1760 和 RFC2289 规定的 S/Key 一次性密钥系统。在 S/Key 中,存在一个加密端和一个验证端。加密端生成一个初始的 W,然后使用某种哈希算法 H()对 W 进行迭代的运算,得到一个字符串序列:H0(W),H1(W),HN(W),其中 Hn(W)表示对 W 进行 n 次 H()的迭代运算,H0(W)=W。把状态序列 S 定义为哈希链的逆序,即 Sn=HNn(W),举例来说,初始状态S0=HN(W),末状态 SN=H0(W)=W,所以转移函数 Transit()=H1()。与伪随机数生成算法不同的是,在哈希链中,标签就是状态本身,即 Generate()的输出与输入是一致的,Tagn=Sn。下面讨论的时候,暂时使用 Sn代替 Tagn,以为表述的方便。加密端把初始状态 S0发送给验证端,自己维护 S1 SN,S1 SN也是所使用的标签序列。加密端每次发送 Sn 1到验证端,验证端利用自己维护的 Sn通过运算Sn 1=Transit(Sn)来检验加密端的标签正确性。上面已经说明,Transit()=H1()。在应用中,通常使用一种安全的哈希算法作为 H(),而对于这些哈希算法,计算 H()很容易,但是计算 H1()却很难。所以,验证端收到 Sn 1后,计算 H(Sn 1)是否等于Sn,相等则说明验证成功,否则失败。哈希链具有很高的安全性,它很好的防止了逆推和预测不仅攻击者无法逆推或预测,甚至连验证端也不可以。哈希链的缺点是,加密端在使用标签前,需要把所有的标签序列计算出来,再把序列的最后一个发给验证端作为初始状态。同时,加密端需要保存一整个标签序列,虽然可以在每用完一个标签之后删掉它,但存储的代价确实是不可忽略的。状态机生成的位串以明文方式加入报文,通过验证位串是否匹配来验证源地址是否伪造,匹配则未伪造,否则是伪造。因此,此方案平衡了安全性和性能,能够防止标签猜测,安全性高且轻量高效,非常适合在路由器上实现和运行。同时本方案也支持使用控制服务器(AD Control Server,ACS)维护状态机,通过 ACS 定期将更新的标签下发给地址域边界路由器,减轻路由器计算负担,但是会加重路由器的通信开销。以明4.3控制平面21文方式直接将状态机生成的位串作为标签加入报文,会导致攻击者截获报文之后,就可以直接复用标签,产生假阴性问题。本章第4.5节给出了 SAVA-X 的包签名机制,用于隐藏明文标签信息,解决上述问题。由于成员的边界路由器之间存在着时间误差,为保证验证标签方法的正确运行,需要使得联盟内各设备向同一个时钟基准进行校准,需要使用到 NTP 协议,该协议是互联网络标准的时间协议。虽然时间同步协议可以保证 AER 之间时间的同步,但是 AER之间还是可能会存在微小的时间误差,这是不可避免的。因此,在 AER 上需要设置一个共享时间片,在该时间片内,刚刚到期的标签与新的标签均被认为是有效的,即存在一段时间,同时有多于一个标签有效,在做标签验证的时候,目的 AD 需要对所有的属于某一源 AD 的标签都做验证,有一个验证通过,就认为标签是正确的。因此这里存在一个共享时间片的概念。假设 AER 与 ACS 的时间误差最大为 te,我们在相邻两个标签之间设置一个长度为 2te 共享时间片(Shared Time Slice),在这个共享时间片内,前后两个标签在验证端均有效。加入了共享时间片的标签有效期如图4.5a所示。除了时间误差以外,还应该考虑到报文在网络中的传输延时。设最小延时为 tdmin,最大延时为 tdmax。则Tagn的有效期结束时间应该向后延长 tdmax,Tagn 1的有效期开始时间应该向后延迟 tdmin。根据传输延时修正后的共享时间片和标签有效期如图4.5b所示,Tagn的有效期结束时间向后延了 te tdmax,Tagn 1的有效期开始时间向前延了 te tdmin。te、tdmin、tdmax、共享时间片长度、标签的有效期等参数由验证端根据实际网络环境自行确定。在这两个“延长”的综合作用下,实际上一个标签的有效期为:Lifecycle=TransitionInterval 2tetdmin tdmax。共享时间片2teTagnTagn 1Tagn 生命周期 Tagn 1 生命周期(a)加入了共享时间片的标签有效期共享时间片2te-tdmin tdmaxTagnTagn 1Tagn 生命周期 Tagn 1 生命周期(b)修正后的共享时间片和标签有效期图 4.5 共享时间片注意,如果不能精确进行时间同步,可以按照在同一时间的同一路由器报文处理方向上,两个新旧标签同时有效,需要依次验证有效的标签。SAVA-X 在控制面除了需要实现地址域管理、状态机维护,还需要通过控制协议将联盟成员的信息、地址域前缀信息、状态机信息以及标签信息通过控制服务器(ADControl Server,ACS)下发给地址域边界路由器。22第四章层次化域间源地址验证技术4.4数据平面SAVA-X 的数据平面的参与主体是成员地址域的边界路由器,它主要负责标签的添加、验证、替换和移除,通过验证标签的正确性以实现对域间源地址真实性的验证。如图4.6所示,源端地址域在边界路由器上对出口报文打上标签,以传递源地址前缀的真实性,目的端地址域在边界路由器上对入口报文检查并去除标签,以验证所关联源地址的真实性,标签不一致则表明该报文是伪造,需要丢弃报文。中间节点对于标签的替换,可以看作是先收到带有标签的报文,对标签先做验证移除,再做标签添加的过程。源端地址域使用 Ingress Filtering(入口过滤,BCP38 和 BCP84)保证发往其他成员的报文携带真实的源地址(前缀)。对于源地址是本信任联盟内的地址,目的地址也是本信任联盟内的地址,但是没有添加标签或者添加标签有误,目的端即可以认为发生了源地址伪造,直接丢弃该数据包。对于源地址是本信任联盟之外的地址的数据包,则直接转发。通过对标签的验证,地址域彼此之间可以认证,同时对联盟外的地址域发来的伪造报文进行识别和过滤。图 4.6 SAVA-X 数据平面标签是通过状态机的随时间轮转生成并经由 ACS 下发给 AER。地址域层级联盟内,每一对具有同级关系的地址域(它们的直接上级地址域是同一个,如图4.7中的AD1021,AD1024,AD1027,AD1028,AD1029)或者具有直接上下级关系的地址域(如图4.7中的 AD1025 和 AD1021),相互之间协商一个私密的状态机,通过状态机同步的周期性的变迁来生成不断变化的标签。数据包转发以及标签处理流程,以图4.7为例,在同一直接上级地址域内进行通信时,则相当于是扁平式的域间源地址验证方案,此时不需要中间端验证替换标签信息,如 AD1021 和 AD1027 进行通信,则只需要直接使用 标签,源端添加、目的端验证移除即可。在不同直接上级地址域内的两个地址域进行通信,数据包经过地址域边界路由器时需要进行标签信息操作:源端添加、中间端验证替换、目的端验证移除。上行过程从源地址域 AD1027 发出的报文需要使用源和虚拟地址域的标签即,这样在数据包到达边界地址域 AD1024 或 AD1029 时使用的都是同一标签,得以解决数据包转发多径问题。在其直接上级地址域进行标签验证替换,然后再使用直接上级与其直接上级地址域的标签并发送,这种替换一直到数据包到达源地址域和目的地址域共同的上级地址域,即 到达AD1025 的边界路由器替换为,到达 AD1026 的边界路由器再替换为,到达最上层的 0 级地址域 AD1,此时需要使用平级4.5数据包签名机制23AD1AD3AD2AD1025AD1021AD1027AD1024AD1029AD1028未部署AD1026边界地址域AD2046边界地址域AD2048AD2047数据包签名1196数据包签名10 80数据包签名更新10 80数据包签名更新10 80数据包签名更新10 80数据包签名更新10 80数据包签名更新10 80数据包签名更新10 800级地址域1级地址域2级地址域3级地址域图 4.7 层次化信任联盟的标签即标签。下行过程到目的地址域处理流程类似,逐级验证替换标签,以尽可能将伪造流量排除在目的地址域之外。由于图中 AD3 和 AD1 以及 AD2 是同级关系,所以 AD31 或 AD3 是传输地址域,不参与该数据包标签 的处理,同理 AD1028 未部署 SAVA-X,也不会参与处理。4.5数据包签名机制SAVA-X 方案中,利用维护同步状态机生成一致性加密标签机制提供的端到端标记实现源地址真实性验证,但其中的状态机标签是和时间相关的,状态机由时间触发状态转移,并产生新的标签,在一段时间内,所有的数据包都使用同一个标签。而且,由于时间同步存在的细微差异,所以在一段时间内,新旧两个标签都是可以使用的,且标签以明文形式填充到数据包中,这导致攻击者可以通过简单的复制标签,就可以达到复用标签,进行基于标签的重放攻击的目的。本方案是 SAVA-X 中防止数据包篡改的机制,通过把数据包中的部分信息和状态机产生的标签进行拼接并计算其 Hash 值,达到逐包签名效果,抵御攻击者复用标签进行攻击,其处理流程如下图4.8所示。为了保证地址前缀和数据包不被仿冒、篡改,同时又可以把域内部署的源地址验证信息可信的暴露出去,可以使用包签名机制,通过调整签名字段、增加新的信息位、更改标识校验的机制实现上述两个目标。包签名机制的格式如下图图4.8所示。通过对原始标签(64bits)、源地址(128bits)、目的地址(128bits)、载荷前 8 位(8bits)、可信级别24第四章层次化域间源地址验证技术数据包签名可信级别可信前缀长度保留位32 bits 8 bits 8bits 16bits状态机生成标签目的地址载荷前n位源地址可信前缀长度可信级别附加信息Reserved附加信息类型HASH FOLD数据包签名计算顺序和规则1.从左至右,从上到下2.不足8bits,高位补064 bits128 bits 128 bits n bits8 bits 8 bits4 bits 8 bits 32 bits00:无01:SAVI10:SAVA-P11:SAVI SAVA-P图 4.8 AER 生成数据包的签名机制处理流程(8bits)、可信前缀长度(8bits)、AI Type(4bits)、Reserved(8bits)、附加信息(32bits)用HASH 算法做哈希运算、并折叠得到 32 位的数据包签名,之后再在数据包 32 位的签名后加上 8 位的可信级别、8 位的可信前缀长度以及 16 位的填充位构造成 64 位的新的标识。其中 AI Type 字段不足 8bits,计算 HASH 时会先扩充到 8bits,在高位补零。在源地址域的路由器上,这个标识将会附加到数据包的 Type=00111011 的 IPv6 DestinationOption Header 一个新建的选项格式的 Tag 字段中。在目的端接收到这个数据包之后,会再次使用本端的产生的标签拼接上数据包中的上述信息,通过 HASH 和折叠算法得到 32 位的数据包签名,如果这个数据包签名和接收到的数据包标识上的数据包签名一致,则代表该数据包未经过篡改。可信级别代表的是是否在地址域内部部署了域内方案或者接入方案,目前其取值有 4 个,00 代表没有部署任何域内或接入方案,01 代表部署了 SAVA-A 方案,10 代表部署了 SAVA-P 方案,11 代表混合部署了 SAVA-A 和 SAVA-P 方案。由于构建信任联盟的方式只能检测到信任联盟外的数据包是否伪造了源地址,而无法检测到信任联盟内的伪造源地址数据包,其粒度可能比较粗犷,达不到用户所需的保护验证精度。因此需要使用 SAVA-A 或 SAVA-P 进行额外的保护,本字段表示 SAVA-X 和 SAVA-A、SAVA-P 的协同过滤情况。默认该域为 00,表示只启用了 SAVA-X。可信前缀是在本域中能够保证的最长的可信前缀,在启用了 SAVA-A 或 SAVA-P 之后,可信前缀粒度得以进一步精细化。使用数据包签名,可以防止攻击者篡改、伪造源地址,同时原始标签对外不可见也4.5数据包签名机制25保证了原始标签的安全,做到了“逐包签名”,保证了攻击者无法直接复用标签,也无法篡改数据报文。第五章系统实现与典型应用5.1系统实现目前已经在 Linux 服务器上实现了 SAVA-X 的控制平面 ACS 的基本功能,但尚未接入联盟链功能;在新华三和华为的核心路由器平台上实现了 SAVA-X 的数据平面AER 的基本功能。在划分好层次化地址域后,启动 SAVA-X 时,需要先行启动 SAVA-X 的 ACS 服务器,然后再启动 AER 边界路由器。5.1.1控制服务器端实现由于 ACS 尚未接入联盟链维护地址域的功能,因此地址域信息是通过文件的形式存在于本地的。在启动 ACS 之前,需要先行配置地址域信息。ACS 和 AER 通信需要使用 OPENSSL 3.X 版本,以保护控制服务器和边界路由器之间的通信安全。编译完成后,以 root 用户,使用下述命令可以启动 ACS 控制服务器。启动前需要向某一时间基准服务器矫正时间,以实现时间同步。1saviacs-ca ACS_IPv6_ADDRESS启动后 ACS 控制服务器分为后台和前台,在前台交互端使用下述命令分别配置地址域的类型、当前地址域所在 0 级地址域号、自身地址域号类型及地址域号,以便于服务器在配置文件中定位地址域信息及判断和其它地址域关系。1settype AD_TYPE2setsuballi ADID_OF_LEVEL_03setad ADID_TYPE ADIDACS 启动后读取地址域信息,会自动与相关 ACS 建立连接,维护状态机并生成标签。可以使用下述命令分别查看和其它设备的连接情况、ACS 自身信息、地址域信息、地址域前缀信息、状态机信息、以及标签信息。265.1系统实现271linkstat#link state info2show 2#current ACS info3show 3#ARI info4show 4#API info5show 5#state machine info6show 6#tag info待查看 ACS 的相关信息没问题之后,使用下述命令可添加 AER,以向其发送地址域信息和标签信息,用于启用 SAVA-X 的数据平面功能。1addaer AER_ADDRESS AD_LEVEL5.1.2核心路由器端实现目前已经在新华三的 CR19000 核心路由器平台和华为 NetEngine 8000 核心路由器平台实现了 SAVA-X 的数据平面功能。(a)新华三 CR19000 设备(b)华为 NetEngine 8000 设备图 5.1 路由器设备28第五章系统实现与典型应用待路由器加电启动后,默认情况下 SAVA-X 功能是关闭的,需要网络管理员手动打开后再进行相关配置。开启 SAVA-X 前需要向某一时间基准服务器矫正时间,以实现各设备之间的时间同步。时间同步是设备独立于 SAVA-X 的功能,超出本文配置设置范围,请参照各设备手册进行操作。由于新华三和华为设备命令略有不同,下面分别进行介绍。新华三路由器配置开启 SAVA-X 功能需要进入路由器的系统视图,然后使能 SAVA-X 功能。使能后,后续命令若没有明确指明,皆在 SMA 视图下进行配置。1 system-view2H3C sma-anti-spoof ipv6 enable在成功使能 SAVA-X 功能后,使用下述命令,配置 AER 地址、ACS 地址以及地址域级别,以和 ACS 之间建立 TCP 连接用于接收 ACS 下发信息。在默认情况下不会使用 SSL 对 TCP 通信进行保护,建议配置时启用 SSL 相关配置,即配置 SSL 策略名称。可以配置多个 ACS 地址,这取决于 AER 所处位置和层级。1H3C sma-anti-spoof ipv6 server ACS_IPv6_ADDRESS clientAER_IPv6_ADDRESS ssl-client-policy POLICY_NAME address-domain-level AD_LEVEL使用下述命令分别配置本地址域号和 0 级地址域号,以确定 AER 所处于层级地址域信任联盟中的位置。1H3C sma-anti-spoof ipv6 address-domain ADID2H3C sma-anti-spoof ipv6 sub-alliance ADID_OF_LEVEL_0进入要配置路由器的接口的接口视图,使用下述命令配置接口类型。如果是 ingress类型,则无需指明其层级;如果是 egress 类型,则需要指明当前接口所在层级,以用于层级标签验证替换。1H3C interface INTF_TYPE INTF_NUMBER2H3C-INTF_TYPE_NUMBER sma-anti-spoof ipv6 port-type ingress|egress level LEVEL_VALUE 在默认情况下,AER 对于 ACS 的通信报文是全放行状态,以用于 ACS 或者 AER宕机后 SAVA-X 功能的重建工作,称之为“绿色通道”。使用下述命令可以关闭“绿色通道”功能。1H3C sma-anti-spoof ipv6 filter enable5.1系统实现29在 AER 接收到 ACS 下发的地址域信息、标签信息后,可使用以下命令分别查看。通过指定特定级别的 ACS,可以只查看当前级别的 ACS 下发下来的地址域前缀信息和标签信息。1H3C display sma-anti-spoof ipv6 address-prefix acs address-domain-level AD_LEVEL 2H3C display sma-anti-spoof ipv6 packet-tag acs address-domain-level AD_LEVEL 华为路由器配置华为路由器命令配置和华三路由器略有不同。华为路由器命令执行完毕后,并不会立刻生效,需要执行“commit”后才会生效。本文为求简略,只在最后进行统一提交配置使之生效。开启 SAVA-X 功能需要进入系统视图,然后再进入 SMA 视图,才能使能 SAVA-X功能。执行“sma”命令进入 SMA 视图后,通过配置“sma enable”命令使能 AER 设备的 SAVA-X 功能。使能后,后续命令若没有明确指明,皆在 SMA 视图下进行配置。1 system-view2HUAWEI sma3*HUAWEI-sma sma enable使能 SAVA-X 功能后,使用下述命令为 AER 设备配置 ACS 控制服务器的地址。在成功使能 SAVA-X 功能后,使用下述命令,配置 AER 地址、ACS 地址以及地址域级别,以和 ACS 之间建立 TCP 连接用于接收 ACS 下发信息。可以配置多个 ACS 地址,这取决于 AER 所处位置和层级。1*HUAWEI-sma server ipv6 address ACS_IPv6_ADDRESS进入要配置路由器的接口的接口视图,使用下述命令配置接口类型,以用于层级标签验证替换。不同于新华三路由器,ingress 和 egress 接口皆需指明层级值。1*HUAWEI interface INTF_TYPE INTF_NUMBER2*HUAWEI-INTF_TYPE_NUMBER sma role ingress|egress levelLEVEL_VALUE默认情况下,SAVA-X 工作在“绿色通道”状态下,使能过滤模式则会关闭“绿色通道”。下述命令用于配置过滤模式,该命令是可选的。1*HUAWEI-sma filter enable30第五章系统实现与典型应用在配置完成后,需要提交配置使得配置生效。1*HUAWEI-sma commit在 AER 端可使用下述命令分别查看 ACS 连接状态、前缀携带的地址域列表信息、前缀信息、ingress 或 egress 接口信息、标签信息、统计信息。其中统计信息可以是前缀信息、标签信息、KeepAlive 报文信息或者未知类型信息。以下命令在所有视图皆可使用。1 display sma acs peer2 display sma adidlist3 display sma prefix inactive|active 4 display sma interface5 display sma tag6 display sma statistics prefix|tag|alive|unknown acs ACS_IPv6_ADDRESS5.2典型应用本节将以教育网为例,介绍部署 SAVA-X 实现域间源地址验证,建立真实可信网络,同时依托于 SAVA-X 构建高价值网络防御系统。5.2.1真实可信网络如图5.2所示,按照 SAVA-X 的层次化信任联盟设计,教育网 CERNET 可以建立 4级的信任联盟:顶级信任联盟为 CERNET,可以和移动、联通、电信等国内主流运营商网络构成0 级地址域信任联盟;CERNET 内部依据地理位置,将 CERNET 划分为不同地区的子网,各个子网构成 1 级地址域信任联盟;同一个子网下将不同的大学划分为 2 级地址域信任联盟;同一大学下不同学院可以划分为 3 级地址域信任联盟。通过在 CERNET 部署层次化的 SAVA-X 域间源地址验证技术,即可保证在教育网内各个大学的地址前缀都是真实可信的,各部署者大学相互之间无法发送伪造源地址的报文。前期建议优先在骨干节点间进行部署,可以有效缩减网络中伪造源地址流量,为部署者提供最大化的收益。5.2典型应用31子信任联盟A(CERNET)子信任联盟B子信任联盟C(运营商网络)清华北大精仪系计算机系天津北京江苏南大0级地址域1级地址域2级地址域3级地址域图 5.2 教育网部署 SAVA-X 层级结构示例5.2.2高价值网络防御对于一些高价值的网络,本身凝聚了大量有价值的设备、数据、连接,比如各个大学购买的数据库服务、各个院系的实验数据等。而这些网络在接入公共网络,方便内部人员在外部访问的同时,也容易成为攻击者的攻击目标,面临诸如恶意攻击、木马、蠕虫病毒等混合威胁。在未部署 SAVA-X 方案时,在网络外部访问这类网络的人员,大多是通过 VPN(Virtual Private Network,虚拟专用网络)的方式进行接入。VPN 通过创建隧道、加密访问内容、进行身份验证等多重方式保证访问的安全性。但是过度信赖 VPN 的问题主要有:VPN 是不安全的。连接到 VPN 之后,网络本身就对连接者放开了。如果攻击者获取了 VPN 账号和密码,就能任意访问网络中的任何数据;VPN 需要通信双方事先搭好隧道才能访问网络。隧道隐藏了访问者的信息,无法对访问者的真实 IP 进行定位,也难以实现对访问者进行动态的权限设置;VPN 的提供商本身资质存在良莠不齐的可能性。因此单独使用 VPN,并不能保证安全可信可靠地访问内部网络。联合使用 SAVA-X,则可以依据网络的重要程度,将高价值网络划分为层次化的地址域,只有符合特定规则(例如前缀内容和前缀长度)的地址,才被允许访问特定网络,进而实现动态的权限控制管理。32第五章系统实现与典型应用我们正在 IETF 推动联合使用 RPKI(Resource Public Key Infrastructure,资源公钥基础设施)以及 IPsec(IP Security,IP 安全)来实现自治域间源地址验证。RPKI 用于绑定自治域编号和分配给自治域的地址前缀信息,通过简单扩展 RPKI,使之能够存储自治域的编号以及自治域联系服务器的 IP 地址,使得 RPKI 为域间源地址验证提供广播本自治域支持 SAVA-X 技术以及广播联系服务器 IP 地址的服务。自治域联系服务器的 IP 地址即自治域控制服务器的 IP 地址,用于代表自治域同其它地址域建立连接关系。IPsec 存在两种模式:传输模式和隧道模式。传输模式是以轻量化的方式,赋予IPsec AH(Authentication Header,认证头)报文新的保护自治域间源地址真实性的能力。隧道模式则使用 IPsec ESP(Encapsulating Security Payload,封装安全载荷),通过对通信流量进行加密保证报文的隐私安全。协商密钥的方式仍是使用互联网密钥交换协议(Internet Key Exchange,IKE)。我们提出的扩展使用 static-static ECDH(EllipticCurve DiffieHellman,椭圆曲线迪菲-赫尔曼秘钥交换)协商以及基于时间同步状态机的密钥轮换,则可以将 IKE 协商的 4 次消息传递过程缩减为 0 次,不过为了和现有协议兼容,暂时将这一部分作为了可选项内容提供。联合使用 RPKI 和 IPsec,需要两个自治域各自在 RPKI 中宣告本自治域支持SAVA-X 技术,同时获取对端联系服务器的 IP 地址,联系服务器之间通过 IKE 协商SA(Security Association,安全关联)包含安全参数。将依据安全参数生成的密钥分发给边界路由器,即可实现通信时使用支持真实源地址验证的 IPsec。在只需要使用真实源地址服务时,则可以使用 IPsec 传输模式,实现域间源地址验证,保证地址真实可信。需要联合使用 VPN 以及 SAVA-X 的用户,则需要使用 IPsec 隧道模式,实现高价值网络的动态防御和流量控制。第六章标准化进展目前 SAVA-X 技术已经成熟,方案已经完备,正处于标准化阶段。在中国通信标准化协会 CCSA 提出了 SAVA-X 系列标准,当前已经在工信部发布5 项,分别是:1.域间源地址验证(SAVA-X)技术要求第 1 部分:控制平面(YD/T 4432.1-2023);2.域间源地址验证(SAVA-X)技术要求第 2 部分:数据平面(YD/T 4432.2-2023);3.域间源地址验证(SAVA-X)技术要求第 3 部分:控制服务器和边界路由器通信协议(YD/T 4432.3-2023);4.域间源地址验证(SAVA-X)技术要求第 4 部分:地址域的创建、选择和注册指南(YD/T 4432.4-2023);5.域间源地址验证(SAVA-X)技术要求第 5 部分:地址域部署(YD/T 4432.5-2023)。已经在 CCSA 协会立项 2 项,分别是:1.域间源地址验证(SAVA-X)技术要求第 6 部分:OAM;2.域间源地址验证(SAVA-X)技术要求第 7 部分:基于 IPsec AH 报文。已经在 IETF 提交 draft 文稿 4 项,分别是:1.Control Plane of Inter-Domain Source Address Validation Architecture;2.Data Plane of Inter-Domain Source Address Validation Architecture;3.Communication Protocol Between the AD Control Server and the AD Edge Routerof Inter-Domain Source Address Validation Architecture;4.An RPKI and IPsec-based AS-to-AS Approach for Source Address Validation。33附录 A缩略语列表缩略语解释ACS控制服务器(AD Control Server)AD地址域(Address Domain)ADID地址域号(Address Domain Identity)AER地址域边界路由器(AD Edge Router)AH认证头(Authentication Header)AS自治域(Autonomous System)CSR证书请求文件(Certificate Signing Request)DDoS分布式拒绝服务攻击(Distributed Denial of Service)DoS拒绝服务攻击(Denial of Service)ECDH椭圆曲线迪菲-赫尔曼秘钥交换(Elliptic Curve DiffieHellman)ESP封装安全载荷(Encapsulating Security Payload)IETF互联网工程任务组(Internet Engineering Task Force)IKE互联网密钥交换(Internet Key Exchange)IP互联网协议(Internet Protocol)IPsecIP 安全(IP Security)ISP互联网服务提供商(Internet Service Provider)NAT网络地址转换(Network Address Translation)NTP网络时间协议(Network Time Protocol)RPKI资源公钥基础设施(Resource Public Key Infrastructure)SAVA源地址验证体系结构(Source Address Validation Architecture)SAVA-A接入层源地址验证体系结构(SAVA-Access)SAVA-P域内层源地址验证体系结构(SAVA-Prefix)SAVA-X域间层源地址验证体系结构(SAVA-eXternal)SMA基于状态机的域间源地址验证技术(State Machine-based Anti-spoofing)TAE-AD联盟边界地址域(Trust Alliance Edge AD)V_AD虚拟地址域(Virtual AD)VPN虚拟专用网(Virtual Private Network)34附录 B编写组成员名单清华大学徐恪、吴建平、郭阳飞、王晓亮华为技术有限公司陈克虎、韩爽、刘立全新华三技术有限公司李昊、吴斌、常向青35

    浏览量0人已浏览 发布时间2023-11-30 39页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • ODCC:2023冷板液冷标准化及技术优化白皮书(115页).pdf

    1冷板液冷标准化及技术优化白皮书ODCC-2023-02004编号 ODCC-2023-02004冷板液冷标准化及技术优化白皮书开放数据中心委员会2023-09 发布I冷板液冷标准化及技术优化白皮书ODCC-2023-02004版权声明版权声明ODCC(开放数据中心委员会)发布的各项成果,受著作权法保护,编制单位共同享有著作权。转载、摘编或利用其它方式使用 ODCC 成果中的文字或者观点的,应注明来源:“开放数据中心委员会 ODCC”。对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC 及有关单位将追究其法律责任,感谢各单位的配合与支持。II冷板液冷标准化及技术优化白皮书ODCC-2023-02004编写组编写组项目经理:项目经理:王舜北京秦淮数据有限公司工作组长:工作组长:李代程百度在线网络技术(北京)有限公司贡献专家:贡献专家:张炳华北京秦淮数据有限公司王长旺广州高澜创新科技有限公司耿曼广州高澜创新科技有限公司崔旭静北京奕信通科技有限公司李晓峰北京奕信通科技有限公司刘凯艳曙光数据基础设施创新技术(北京)股份有限公司徐欣曙光数据基础设施创新技术(北京)股份有限公司李金波浪潮电子信息产业股份有限公司韩玉普洛斯普瑞数据科技(上海)有限公司金超强普洛斯普瑞数据科技(上海)有限公司陈聪北京三快云计算有限公司李瑞雅北京秦淮数据有限公司刘永彬北京秦淮数据有限公司冯臣北京秦淮数据有限公司刘帆中兴通讯股份有限公司翁建刚中兴通讯股份有限公司李新起深圳市英维克科技股份有限公司黄强深圳市英维克科技股份有限公司王宏彬丹佛斯(中国)投资有限公司III冷板液冷标准化及技术优化白皮书ODCC-2023-02004李慧勇新华三技术有限公司陈立波新华三技术有限公司魏芳伟科华数据股份有限公司沈嘉辉科华数据股份有限公司董玉山中航光电科技股份有限公司杨占喜Colder Product Company李洁中国信息通信研究院郭亮中国信息通信研究院吴美希中国信息通信研究院阮迪中国信息通信研究院IV冷板液冷标准化及技术优化白皮书ODCC-2023-02004前前 言言本规范由开放数据中心标准推进委员会发布。2015 年,OpenAI 成立,通过 GPT(Generative Pre-trainedTransformer)算法,在 2018 年 6 月推出了 GPT-1(1.2 亿参数),在 2019 年 11 月增加了训练的数据量后推出了 GPT-2(15 亿参数),在 2020 年 6 月推出了 GPT-3(1750 亿参数)。随着数据参数的加大发现差异很小,后加入人工反馈强化学习来提升对话质量,在 2022年 3 月推出了 GPT-3.5;对话优化后,在 2022 年 11 月就推出了ChatGPT。月活人数突破 1 亿仅用时两个月。2023 年 2 月 7 日微软将 ChatGPT 引入到搜索引擎 Bing 正式发布。除了微软,谷歌、Meta、百度、腾讯、阿里巴巴纷纷入局进军生成式 AI。生成式 AI 模型需求的暴涨,使得对芯片的需求从 CPU 加速器转变为以 GPU 主导的大规模并行计算。未来,在单芯片性能之上,智算中心能够通过算力的生产-调度-聚合-释放,支持 AI 产业化发展。现阶段,单 CPU 热设计功耗为 150200W,最高可达 350W;单 GPU 热设计功耗为300400W,最高可达 700W。与此同时,服务器功耗从传统服务器的 1kW 增加到 AI 服务器的 6.510kW。空气冷却解决成本和难度大幅上升,英伟达、英特尔等芯片公司已经开始将冷却的方式转向液冷。液冷是指通过液体代替空气冷却芯片,根据液体与芯片是否接触可以分为直接液冷和间接液冷。直接液冷包括浸没液冷和喷淋液冷,浸没液冷又分为单相浸没和两相浸没。而间接液冷主要是冷板液冷。早在 20 世纪 60 年代,IBM 就推出了用冷板液冷冷却的计算V冷板液冷标准化及技术优化白皮书ODCC-2023-02004机产品。直到 21 世纪初,美国 GRC(Green Revolution Cooling)公司推出了单相浸没冷却解决方案。2017 年,广东合一推出了喷淋式液冷。2019 年曙光完成全球首个大规模刀片式浸没两相液冷商业应用项目。2021 年,微软发布了箱体式两相浸没液冷方案。而冷板液冷作为历史最悠久,技术最为成熟,生态系统最为丰富的液冷解决方案,它的爆发已经到来!本白皮书倾注了作者大量的时间和精力,其成文也仰仗各参编老师撰写并参与讨论,其次,本文得到程军先生、王锋先生、何智强先生和袁达人先生提供的产品资料,在此对上人员做出的贡献表示由衷的感谢。此外,本文很多化工类专有名词的解释均得益于ChatGPT,令人充分感受到科技的便利和 AI 的潜力。最后,作者尽量用实物照片为读者生动呈现相关技术和产品,希望通过本白皮书促进冷板液冷技术快速迭代优化,为读者在冷板液冷的实践和决策提供有价值的信息和建议。由于时间仓促,水平所限,错误和不足之处在所难免,欢迎各位读者批评指正。如有意见或建议请联系 。VI冷板液冷标准化及技术优化白皮书ODCC-2023-02004目目 录录版权声明.I编写组.II前 言.IV冷板液冷标准化及技术优化白皮书.1一、概述.1二、术语、定义和缩略语.1三、冷板液冷介绍.8(一)冷板液冷技术介绍.81.冷板液冷发展历程.82.冷板液冷技术原理.103.冷板液冷技术特点.124.冷板液冷关键技术.15(二)常用产品器件介绍.161.冷板组件.172.快速接头 QDC.203.软管.244.机柜工艺冷媒供回歧管 RCM.255.冷量分配单元 CDU.266.环路工艺冷媒供回歧管 LCM.297.冷源.308.工艺冷媒.34(三)冷板液冷发展面临的主要挑战.40VII冷板液冷标准化及技术优化白皮书ODCC-.水质.402.泄漏.423.冗余路由.444.高成本.445.建设周期长.456.能耗问题.457.冷源水耗.46四、工程标准化及设计要求.46(一)标准化现状及需求.461.标准化现状.462.标准化需求.48(二)工程标准化设计要求.501.二次侧管路.502.功能要求.54(三)典型案例介绍.551.江苏某大数据产业园项目.552.厦门某智算中心.573.山西某大规模冷板液冷数据中心.584.广州科云数据中心.59五、接液材料研究.60(一)传统材料.61(二)国外推荐材料.611.金属与金属合金类.612.合成橡胶、塑料和其它材料类.63VIII冷板液冷标准化及技术优化白皮书ODCC-2023-02004(三)国内常用非金属材料.651.管路及接头材料.652.密封件材料.69(四)新材料管路设计制造及测试方法.721.设计原则.722.管路制造.743.测试.74(五)其它行业领域冷板液冷新材料应用.761.直流输电领域.762.静止无功补偿装置 SVC 冷却领域.773.储能领域.78(六)数据中心新材料应用案例.811.国内数据中心案例.812.国外数据中心案例.83六、冷板液冷新技术展望.89(一)负压冷板液冷技术.891.技术背景介绍.892.负压 CDU 技术原理.893.负压液冷系统方案技术亮点.924.应用案例.94(二)相变冷板冷却技术.971.重力热管方案.972.动力热管方案.98(三)冷板液冷气-液混合技术.98IX冷板液冷标准化及技术优化白皮书ODCC-.风冷 CDU.992.气-液组合末端.1023.气-液同源冷源.102参考文献.1051冷板液冷标准化及技术优化白皮书ODCC-2023-02004冷板液冷标准化及技术优化白皮书冷板液冷标准化及技术优化白皮书一、一、概述概述随着AI时代的到来,冷板液冷技术作为一种解决高算力发热的冷却方式,已经成为行业最热门的话题之一,得到越来越广泛的关注。本文将分四个部分进行展开:第一部分:对冷板液冷技术进行介绍,从发展历程、技术特点、关键技术、器件组成等方面逐一介绍,并指出其发展面临的主要挑战。第二部分:对冷板液冷的工程标准化进行分析,从标准化的现状,到标准化的需求,并指出设计和功能要求,最后分享一些典型数据中心案例。第三部分:通过接液材料的详细描述,为读者呈现除传统材料外,其他行业领域和国内外数据中心对新材料的应用情况分享。第四部分:对近几年冷板液冷出现的新技术进行介绍和展望。二、二、术语、定义和缩略语术语、定义和缩略语AFLASAsahi Glass Fluoroelastomer的简写。它是由日本旭硝子株式会社(Asahi Glass Co.,Ltd.)开发的一种特殊的氟橡胶材料,学名是聚四氟乙烯-聚丙烯共聚物,它具有优异的耐化学性、耐高温性、耐油性和耐候性,常用于制造密封件。CDA铜发展协会(Copper Development Association)。CDU冷量分配单元(Coolant Distribution Unit)用于实现液冷系统的二次侧冷却环路驱动、稳压和自动配流,同时实现一二次2冷板液冷标准化及技术优化白皮书ODCC-2023-02004侧循环系统热量交换、物理隔离等功能的单元。CLF制冷负载系数(Cooling Load Factor),一般定义为数据中心制冷设备耗电与IT设备耗电的比值。本文提到的冷板液冷CLF指的是冷板液冷系统的耗电与对应液冷部分IT设备耗电的比值。CPU中央处理器(Central Processing Unit),它是服务器的核心组件之一。CPVC氯化聚氯乙烯(Chlorinated Polyvinyl Chloride),是一种特殊的塑料材料,是PVC经过氯化处理而制成的。它具有出色的阻燃性能和耐化学腐蚀性能,广泛应用于管道系统、化工设备、火灾喷淋系统、电力线路绝缘和建筑材料等领域。CRAC计算机房空调器(Computer Room Air Conditioner),其主要是指带压缩机的蒸汽压缩制冷循环系统,通过制冷剂蒸发将机房空气热量带到室外的空调。CRAH计算机房空气处理器(Computer Room Air Handler),其主要是指通过冷冻水将机房空气热量带走的冷冻水末端空调。CSPE氯磺化聚乙烯(Chlorosulfonated Polyethylene),也被称为海普隆Hypalon。它是一种通过将聚乙烯与氯和硫进行反应而制得的合成橡胶,其特性包括耐候性、耐辐射、抗化学腐蚀和电绝缘性能。DCLC直接接触式液体冷却(Direct Contact Liquid Cooling),DCLCTM被CoolIT公司注册,特指冷板液冷的间接式液冷,直接接触指的是冷板(而非工艺冷媒)与CPU等发热源的直接接触。EPDM三元乙丙橡胶(Ethylene Propylene Diene Monomer),是一种合成橡胶。EPR乙烯丙烯橡胶(Ethylene Propylene Rubber),是一种合成橡胶。ETP它是由乙烯(Ethylene)、四氟乙烯(Tetrafluoroethylene)和丙烯(Propylene)通过共聚反应制得的共聚物,ETP型氟橡胶是一种高性能的氟橡胶材料,具有出色的化学稳定性、耐热性和耐油性。FEP聚全氟乙丙烯(Fluorinated Ethylene Propylene),是一种热塑性聚合物,由四氟乙烯和含氟单体(如四氟乙烯醚)共聚3冷板液冷标准化及技术优化白皮书ODCC-2023-02004而成。它具有类似于PTFE的出色耐化学腐蚀性、低摩擦系数和优异的耐高温性能。相比于PTFE,FEP具有更低的熔融温度,更容易地加工成各种形状。FKM含 氟 弹 性 橡 胶(Fluoroelastomer),也 称 氟 碳 橡 胶(Fluorocarbon Rubber),是一种特殊的橡胶材料,具有出色的耐化学腐蚀性能和高温稳定性。FWS设施水系统(Facilities Water System),冷源与CDU之间的水系统,即一次侧冷冻或冷却水系统。GFGF型氟橡胶是由氟化碳单体聚合而成,添加了玻璃纤维(GlassFiber)增强剂的氟橡胶材料,玻璃纤维的添加可以增强氟橡胶的强度和刚度,提高其耐磨损性和耐冲击性。GPU图形处理器(Graphics Processing Unit),是一种专门用于处理图形和图像的处理器。与CPU相比,GPU在图形处理方面有着更强大的计算和并行处理能力。HDPE高密度聚乙烯(High Density Polyethylene),是一种常见的塑料材料。HNBR氢化丁晴橡胶(Hydrogenated Nitrile Butadiene Rubber),是一种耐油性较高的橡胶材料,通过氢化处理增加了耐热性和抗臭氧性能,被广泛应用于涉及高温、高压和化学腐蚀环境下的密封和橡胶制品。LCM环路工艺冷媒供回歧管(Loop Coolant Manifold)用于向环路内各支路分配工艺冷媒的装置。MFI熔融指数(Melt Flow Index),指热塑性塑料在一定温度和压力下,熔体在 10 分钟时间内通过测试器的小孔所流出的熔料重量,单位是以克/10 分钟表示。MFR熔体质量流动速率(Melt-mass Flow Rate),指热塑性树脂材料分子平均尺寸和流动性能的一项指标。NBR丁晴橡胶(Nitrile Butadiene Rubber),是一种常见的合成橡胶材料。OCP开放计算项目(Open Computer Project),它是由 Facebook(更名为 Meta)在 2011 年发起的,旨在通过共享设计和创新来构建高效、节能的数据中心设备和硬件基础架构。目前,OCP4冷板液冷标准化及技术优化白皮书ODCC-2023-02004同 ODCC、OPEN19 并称为全球三大开放计算组织。PA聚酰胺塑料(Polyamide),具有良好的综合性能,包括力学性能、耐热性、耐磨损性、耐化学药品性和自润滑性,且摩擦系数低,有一定的阻燃性,易于加工。PE聚乙烯(Polyethylene),是一种常见的塑料材料。PEEK聚醚醚酮(Polyether Ether Ketone),是一种高性能工程塑料,具有极高的热稳定性、耐化学腐蚀性和机械强度。PEX交联聚乙烯(Cross-Linked Polyethylene),由聚乙烯分子经过交联处理生成,交联可以提高材料的强度、耐热性和耐化学腐蚀性,是一种常用的供水管道材料。PFA聚全氟丙烯(Perfluoro Alkoxy),是一种氟塑料,属于全氟聚合物的一种类型。它具有出色的化学稳定性、高温耐性、电绝缘性和耐腐蚀性。它具有与 PTFE 类似的特性,但其可加工性更好,通过热塑性加工方法(如注塑或挤出)加工成管材、薄膜、块材和各种形状的制品。PFPE全氟聚醚(Perfluoropolyether),是一种特殊的氟化合物材料,具有出色的化学稳定性、热稳定性和润滑性能。PMVE全氟甲基乙烯基醚(Perfluoromethylvinylether),是一种全氟聚合物,具有出色的化学稳定性、高温稳定性和电气绝缘性能。PP聚丙烯(Polypropylene),是一种常见的热塑性聚合物。PPH均聚聚丙烯(Polypropylene Homopolymer),相比 PPR,具有更高的刚性和强度,广泛用于各种工业和建筑材料。PPO聚苯氧化物(Polyphenylene Oxide),是一种高性能工程塑料。它具有优异的耐热性、电绝缘性、机械性能和化学稳定性。PPR无规共聚聚丙烯(Polypropylene Random),相比 PVC,具有更高的耐热性和耐化学腐蚀性能,广泛用于家庭水管系统。PPS聚苯硫醚(Polyphenylene Sulfide),是一种高性能工程塑料。它具有优异的耐热性、耐化学腐蚀性、机械强度和电绝缘性能。5冷板液冷标准化及技术优化白皮书ODCC-2023-02004PPSU聚苯砜(Polyphenylsulfone),一种无定形的热塑性工程塑料,具有高度透明性、高水解稳定性,是所有高性能热塑性塑胶中最牢固的材料之一。该材料兼具强大的机械特性与耐热和耐化学性,因此非常适于通常负载较高和需接触化学品的各种要求严苛的应用。PSU聚砜(Polysulfone),是一种特定的高性能工程塑料,它具有高温稳定性、机械强度、耐化学腐蚀性、电绝缘性和耐磨性等特殊性能。PTFE聚 四 氟 乙 烯(Polytetrafluoroethylene),也 称 为 特 氟 龙TeflonTM,具有强抗腐蚀性,可以耐受包括王水在内的强酸强碱溶液;低摩擦系数,可用于轴承、垫片和密封环等高摩擦部件;电绝缘性,可作为电缆绝缘材料。PUE能源利用效率(Power Usage Effectiveness),是数据中心最重要的评价指标之一,定义为数据中心总耗电与 IT 设备耗电之比。PVC聚氯乙烯(Polyvinyl Chloride),是一种普遍使用的塑料,可以用于管道、电缆、地板、窗框等,但其耐高温性能较差,会释放出挥发性化合物危害人类健康。PVDF聚偏二氟乙烯(Polyvinylidene Fluoride),相比 PTEF,其刚性、硬度、电绝缘性、抗蠕变性能尤为突出,是最强韧的氟材料。QDC快速接头(Quick Disconnect Coupling),包括自锁式快速接头(手插和盲插)、球阀式快速接头。RCM机柜工艺冷媒供回歧管(Rack Coolant Manifold)用于向机柜内各液冷冷板分配工艺冷媒的装置。SFN二次侧流体管路(Secondary Fluid Networks),加拿大液冷厂商CoolIT的命名方式,同LCM。SUSSUS是日本JIS(日本工业标准)中使用的不锈钢材料标准的简称。在过去,日本的不锈钢材料常常使用SUS作为牌号的前缀,例如SUS304代表符合JIS G4303标准的304不锈钢。SVC静止无功补偿装置(Static Var Compensator),由电容器及各种电抗元件构成与系统并联并向系统供应或从系统吸收无功功率的装置。6冷板液冷标准化及技术优化白皮书ODCC-2023-02004TCS工艺冷媒系统(Technolgy Cooling System),冷板组件与CDU之间的系统,即二次侧系统。TDP热设计功率(Thermal Design Power),是处理器或显卡等计算机硬件热设计的一个主要参数。TDP是指处理器或其他硬件在满负荷工作情况下的最大热量产生值,代表了CPU或其他实际使用时的预计功耗极限,是散热器的设计和选择的重要参考依据。TFE四氟乙烯(Tetrafluoroethylene),是一种无色、无味且具有高度稳定性的气体。UHMWPE超 高 分 子 量 聚 乙 烯(Ultra-HighMolecularWeightPolyethylene),是一种特殊类型的聚乙烯,其分子量非常高,通常达到数百万至数千万克/摩尔。它具有许多优异的性能:高强度、高耐磨性、低摩擦系数、优异的耐化学性、良好的电绝缘性和优异的高温性能。UNS统一编号系统(Unified Numbering System),它是一种用于材料和金属标准化命名的编码系统。它由SAE(Society ofAutomotiveEngineers)、ASTM(AmericanSocietyforTesting andMaterials)和 ASME(AmericanSocietyofMechanical Engineers)等多个工程组织共同制定和管理的,不受国籍、材料种类、制造方式、化学成分等因素限制的开放式系统,在全球广泛应用。它由一个字母和五个数字组成,字母表示材料类型,数字表示材料化学成分、机械性能等相关参数,便于跨国贸易。WUE用水效率(Water Usage Effectiveness),是数据中心重要的评价指标之一,定义为数据中心总用水量与IT设备耗电量之比,单位为L/kWh。空气冷却Air Cooling,与液冷相对应,以空气为冷却介质,通过CRAC或CRAH设备将机房内的空气降温至1830左右的冷空气,将服务器产生的热量转移的过程。业内常被称为“风冷”。液冷Liquid Cooling或Direct Liquid Cooling,液体冷却的简称,以液体为冷却介质,通过CDU设备将进入服务器的工艺冷媒液体降温至1745左右,将服务器产生的热量全部或部分转移的过程。根据工艺冷媒是否与服务器接触分为直接液冷和间接液冷两大类。直接液冷的液体一般是不导电的油类或者氟化物;间接液冷的液体一般是去离子水,醇类溶液,还有氟化物。7冷板液冷标准化及技术优化白皮书ODCC-2023-02004气液比空气冷却和液体冷却混合布置的机房或者机柜,空气冷却和液冷功率(或发热量)的大致设计比例,一般指冷板液冷服务器。业内常被称为“风液比”。风冷风 冷 冷 却(AirCooled)或 风 冷 冷 凝(AirCooledCondensation)的简称,一般指冷却介质向空气尤其室外空气转移热量的过程。水冷水冷冷凝(Water Cooled Condensation)的简称,一般指冷却介质通过冷却水转移热量的过程。一次侧Primary Side,是指在间接热交换过程中,提供热量或冷量的一侧。在液冷领域,以CDU的板式换热器为界限,冷源侧为一次侧。二次侧Secondary Side,是指在间接热交换过程中,热量或冷量传递给待调节区域的一侧。在液冷领域,以CDU的板式换热器为界限,服务器侧为二次侧。工艺冷媒系统Technology Cooling System,简称TCS,是指用于冷却和保持电子设备运行温度在可接受范围内的系统。该系统即为二次侧所在系统,工艺冷媒即二次侧冷却液。逼近温度ApproachTemperature或MinimumDifferentialTemperature,是指二次侧供液温度与一次侧进水温度之差。微模块模块化数据中心的简称,Modular Data Center(MDC),是指完全按照模块化设计思路搭建的可快速部署的数据中心模型,数据中心内部由多个完全相同的微模块(Micro Module)组成;微模块则是以若干机架为基本单位,包含制冷模块、供配电模块及网络、布线、监控在内的独立的运行单元,全部组件可在工厂预制,并可灵活拆卸,快速组装。接液材料接液材料是指其表面与工艺冷媒直接接触的材料,必须和工艺冷媒具备兼容性,以将冷却回路中潜在的腐蚀风险和泄漏风险降至最低。8冷板液冷标准化及技术优化白皮书ODCC-2023-02004三、三、冷板液冷介绍冷板液冷介绍(一)(一)冷板液冷技术介绍冷板液冷技术介绍1.1.冷板液冷发展历程冷板液冷发展历程虽然液冷这个技术名词是近代才出现的,但是液冷或者说用水降温这种生活方式,却是与人类发展史紧密相伴的。用水降温是动物与生俱来的本领,人类还进一步利用液冷原理建造自然水冷建筑“含凉殿”。液冷技术并非从数据中心行业发展应用起来的,其最初的应用是在机械加工行业,也就是18世纪第一次工业革命发明的机械加工设备,使用水和油作为金属加工液进行降温。之后,19世纪第二次工业革命将人类社会带入电气时代,尼古拉特斯拉首次将液冷应用于变压器冷却。20世纪开始进入电子时代,随着科技的进步和制作工艺的发展,高性能、高功率的电子元器件的冷却要求不断提高,就需要选择效率更高的液冷技术,理论上沸腾的热水可以带走的极限热量是2MW/cm2。1944年美国人高格勒提出热管换热器概念,它是一种不附加任何动力,可以使冷凝的液体依靠吸液芯克服重力再回到上方,达到热量从一个地点传动到另一个地点目的的传热器件。经过热管技术的演进,闭合管路的冷板始于航天设备的应用,冷板的叫法据说来自20世纪60年代的美国阿波罗登月计划,登月设备中液冷已经广泛应用于高精度电子器件的冷却。19冷板液冷标准化及技术优化白皮书ODCC-2023-02004液冷技术首次在计算机上得到正式使用是在1951年,人类历史上第一台商用电子计算机UNIVAC I采用了水冷装置。之后的几十年,液冷技术的发展应用是曲折的,主要跟计算机性能需求和芯片技术发展紧密相关。1966年,IBM推出了System360大型计算机,这款计算机是当时运算速度最快、性能最强的机器,主要用于科学应用领域的高速数据处理(比如太空探索、亚原子物理学、全球气候预测等)。为确保该大型机在高速运算中不会发生过热宕机,IBM首度开发了用水冷却的液冷系统。但在随后的几十年,由于在较低热负荷时空气冷却成本更低、安装部署更为简单,液冷技术并未被重视。直到20世纪80年代,计算机性能飞速提升,为了满足散热的需要,空气冷却和液冷融合的气液混合系统开始出现,甚至有一段时间多种芯片级液冷技术得到深度应用并走向成熟。20世纪90年代,晶体管新技术的应用,推动着大型计算机和超级计算机芯片的功耗和热量断崖式下跌,散热又重新回到空气冷却的模式。21世纪初,随着数据中心应用规模的快速提升,液冷技术又一次步入发展的快车道。2008年,IBM对外发布基于Power6处理器的液冷超级计算机节点Power575,其在微处理器模块上使用了冷板液冷,使服务器工作温度降低了至少20。Power575液冷系统通过采用模块化的设计和快速连接接头的应用,尤其在系统侧和设备侧采用全流量互锁式快接,可以实现快速简单的连接和断开。国内随着信息技术赋能千行百业,数据中心能耗和芯片散热问题也得到重视,国家和地方出台了一系列数据中心能效水平限值要10冷板液冷标准化及技术优化白皮书ODCC-2023-02004求,如国家工信部规定新建大型、超大型数据中心PUE不超过1.3。液冷技术在国内有了迅速成长壮大的土壤,国内如曙光、华为、浪潮、联想、新华三和中兴通讯等代表性厂商已经纷纷推出了系列液冷产品。中科曙光最早于2015年推出国内首款标准化量产的冷板液冷服务器,同年,中科院大气物理研究所的“地球数值模拟装置原型系统”率先使用冷板液冷服务器,大大提高散热效率,也成为国内液冷服务器大规模使用的第一个公开案例,该系统并于2017年上榜当年全球高性能计算机(HPC)TOP500榜单。冷板液冷因对现有服务器芯片组件及附属部件改动量较小,可操作性更强,成为目前国内成熟度最高、应用最广泛的液冷散热方案。随着国内主流服务器厂商纷纷推出冷板液冷服务器产品,液冷技术开始逐步走向成熟并开始批量化、规模化使用。2.2.冷板液冷技术原理冷板液冷技术原理传统空气冷却方式以空气为介质进行散热,通过送入低温空气、经与电子器件进行热交换后,将其热量带走。液冷方式则以液体为介质进行散热,只需提供中温液体即可满足元器件散热需求,比空气冷却方式散热效率更高,也更加节能(如图3-1所示)。11冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 3-1 空气冷却及液冷工作原理冷板液冷技术是目前最为成熟、应用最为广泛的液冷散热方式。冷板液冷技术是指通过冷板(通常为铜、铝等导热金属构成的封闭腔体)将发热器件的热量间接传递给在封闭的循环管路中的冷却液体,通过冷却液体将热量带走的冷却形式2。冷板液冷技术利用工艺冷媒作为中间热量传输的媒介,将热量由热区传递到远端后再进行冷却。在该技术中,工艺冷媒与被冷却对象分离,工艺冷媒不与电子器件直接接触,而是通过冷板等高效热传导部件将冷却对象的热量传递到工艺冷媒中,因此冷板液冷技术又称为间接液冷技术。冷板液冷技术相较于传统空气冷却技术,不需改变现有服务器的形态,使用、维护等方面与现有服务器也较为接近。冷板液冷系统工作原理如图3-2所示,冷板液冷是将服务器内的主要散热元器件CPU、GPU、内存等产生的热量通过与冷板内的液体进行热交换并带出服务器,这一部分的热量占服务器总热量的50%-80%,剩余少部分的热量采用空气冷却,通过空气与服务器进行热交换。冷板液冷系统中的二次侧的中高温液体带走服务器的热量,流经CDU,传递给一12冷板液冷标准化及技术优化白皮书ODCC-2023-02004次侧冷却水,并通过冷源设备将热量传递到室外空气,这一过程中的主要动力装置为循环水泵以及冷源设备的风机。图3-2 冷板液冷系统原理示意图3.3.冷板液冷技术特点冷板液冷技术特点冷板液冷方案一般具备以下特点:(1)高效散热:液体的体积比热容是空气的1000-3500倍,意味着冷却液体可以吸收大量热量而不会显著升高温度;液体的对流换热系数是空气的10-40倍,同等空间情况液冷的冷却能力远高于空气;由液冷冷板套件替代CPU原散热套件,通过工艺冷媒在冷板中的强制对流,有效地将热量从设备中快速地带走,散热效率得到大幅提升。(2)高TDP方案:当CPU芯片TDP超过350W时,冷板液冷成为少数的解决方案(图3-3)。13冷板液冷标准化及技术优化白皮书ODCC-2023-02004图3-3 TDP变化与冷却方式的演进3(3)精确制冷:冷板套件直达服务器内部,实现更为高效的部件级精确制冷,CPU核温低至65左右,使元器件在更稳定更合适的温度下工作,可靠性更高。(4)支持高功率部署:冷板液冷技术散热效率更高,可支持单机柜功率高达60kW的部署需求,同时降低占地成本。(5)兼容性优:在不改变目前服务器主板的情况下即可实现,拆卸简单,安装方便。相比其他液冷技术,对机房的要求较低,与现有机房的兼容性优。冷板液冷可实现液冷微模块的形式,可实现与现有空气冷却服务器的兼容使用。在系统上,相比其他液冷技术,空气冷却改造液冷更为方便,可参见本文第六章第(三)节第1小节。(6)维护简便:服务器与机柜的连接采用快速接头,服务器上下架可实现冷却系统在线插拔,不影响其他服务器正常运行。另外,保留了原有服务器的形态及维护方式,不影响客户使用习惯。(7)生态更成熟:冷板液冷是液冷技术中应用最早,也是最为成熟的技术,同时,其产业链生态更成熟。14冷板液冷标准化及技术优化白皮书ODCC-2023-02004(8)支持定制:可根据特定的电子元件,考虑组件的尺寸、形状和散热要求,可优化工艺冷媒通过冷板的流动路径、增加翅片等手段以降低热阻(图3-4)。图3-4 某强化对流换热定制开发冷板CFD分析(9)支持超频:由于服务器的运行温度更低,可允许服务器超频运行,提升服务器算力挖潜。(10)更加节能:整个冷却系统采用中高温水作为冷却介质,不同于靠低温水或空气进行散热,从而大大降低了冷却系统能耗,可充分利用自然冷源,冷板液冷CLF可低至0.1以下,比传统空气冷却机房节能20%以上。(11)支持余热回收:一次侧回水温度约为38-45,虽属于低品位余热,但考虑到数据中心规模体量巨大,其产生的余热量可观且稳定、持续。因此可依据余热利用场景灵活选择设置,如办公及生活供暖、泳池加热、设施农业温室供热等方式就近消纳余热资源。(12)冷媒易获得:相比其它液冷技术,冷板液冷通常采用乙二醇或丙二醇等水基溶液作为工艺冷媒,具有容易获取的优点。15冷板液冷标准化及技术优化白皮书ODCC-.4.冷板液冷关键技术冷板液冷关键技术冷板液冷技术的关键技术包括以下几点:(1)冷板设计:冷板的设计对冷却系统至关重要。冷板必须与电子元器件保持良好的热接触,这样热量才能快速有效地从元器件传递到冷板。冷板流道通过机械加工、铲齿、挤压、锻压等工艺加工,密封采用搅拌摩擦焊、真空钎焊、气体保护焊等工艺焊接,需要具有良好的密封性。此外,冷板内通道流量大小、水阻和布局方式对散热效果起着至关重要的作用。(2)工艺冷媒的选择和水质管理:冷板液冷系统中使用的液体冷却剂通常是去离子水、乙二醇或丙二醇等水基溶液。去离子水会添加适当的药剂来抑制细菌滋生并减缓金属腐蚀。工艺冷媒须慎重选择,以保证与接液材料的兼容性。工艺冷媒必须具有良好的比热容、流动特性和低粘度,以确保有效的热传递。同时,需要对水基的工艺冷媒进行定期的水质监测和分析。近两年,陆续出现了氟化物代替水基溶液作为工艺冷媒进行冷却,详见本文6.2。除6.2外,本文其它章节所涉及工艺冷媒均基于水基溶液进行设计和介绍,特此说明。(3)RCM设计:RCM的流量分配设计将直接影响各支路流量,如何确保最不利的环路水流量仍然充足,需要进行相关设计考虑。(4)二次侧泵和LCM设计:用于循环工艺冷媒的二次侧泵设计必须确保LCM每个接口足够的流量和压力。二次侧泵必须支持长期可16冷板液冷标准化及技术优化白皮书ODCC-2023-02004靠连续运行,且噪音小。LCM的设计必须能够最大限度地减少压降并确保通过冷板和热交换器的高效流动。(5)二次侧系统可靠性测试:二次侧系统的长期稳定可靠直接影响服务器的稳定运行,因此,需要考虑鲁棒性设计和安全测试等。(6)冷源设计:冷源设计必须能够将电子元件产生的热量全部散入室外空气,并提供稳定的一次侧进水温度。需根据设计进水温度、当地气候水源条件、冗余要求、周边热回收设施等要素合理设计冷源。(7)冷却水水质管理:一次侧作为散热源侧,其水质管理至关重要。不恰当的水质管理会导致水流堵塞,将直接影响系统是否可以正常工作。冷却水水质管理除了泥沙冲洗,定期除垢除菌外,还需要考虑不同管道材质之间是否会因电势差而造成电化学腐蚀问题。(8)控制系统设计:控制系统负责监控和调节工艺冷媒温度和流量,以确保最佳的冷却性能。控制系统可以包括温度传感器、流量计和其他监测和控制组件,以确保系统在安全范围内运行。特别要注意的是,需要考虑防凝露和漏液监测设计,控制系统还可以包括用于监控系统性能并在出现任何问题时提供告警。(二)(二)常用产品器件介绍常用产品器件介绍冷板液冷系统一般由二次侧冷却环路和一次侧冷却环路构成,其中,二次侧冷却环路是通过工艺冷媒循环将发热元件产生的热量导出的冷却环路;一次侧冷却环路是通过工艺冷媒将二次侧冷却环17冷板液冷标准化及技术优化白皮书ODCC-2023-02004路导出的热量传递至室外环境或通过热回收系统回收利用的冷却环路。二次侧冷却环路由冷板组件、CDU和连接系统(包括RCM、QDC、LCM等)等构成;一次侧冷却环路由冷源和一次侧回路等构成,二次侧冷却环路与一次侧冷却环路在CDU处进行换热。图3-5给出了各部件位于液冷系统的位置示意。图 3-5 冷板液冷系统构成示意图1.1.冷板组件冷板组件基本组成基本组成冷板组件由冷板、配套管路、扣具、转接头、快速接头QDC、漏液检测装置等主要零部件构成,图3-6给出了冷板组件的构成示意,图3-7展示了冷板和冷板组件的实物照片。18冷板液冷标准化及技术优化白皮书ODCC-2023-02004图3-6 冷板组件构成示意图图3-7 冷板&冷板组件实物照片其中,各冷板组件描述如下:(1)冷板:以工艺冷媒为媒介,实现热量交换的紧凑型换热部件,与设备配套管路、QDC、CDU、RCM、LCM等形成二次侧冷却环路,并最终将处理器热量传递至室外。(2)设备配套管路:用于冷板与冷板或液体快速接头之间互连保障流通的部件。(3)扣具:为冷板与处理器贴合提供锁紧力的专用锁紧零部件。(4)转接头:在冷板系统中起到连接作用的零部件。19冷板液冷标准化及技术优化白皮书ODCC-2023-02004材质材质冷板组件的接液材料要与工艺冷媒保持良好的兼容性,数据中心设备冷板组件材质一般如表3-1所示:表 3-1 不同部件的材料冷板组件名称常用材料说明冷板散热模块:紫铜固定模块:铝散热模块为接液材料;一体式冷板不区分散热模块和固定模块。管路橡胶:EPDM 等塑料:PTFE、FEP 等接液材料,橡胶管路和转接头连接时需通过卡箍或卡环或压接等方式增加连接可靠性。扣具金属、塑料等非接液材料转接头紫铜、不锈钢等接液材料,材料类型需和冷板散热模块保持一致。快速接头不锈钢等接液材料关键设计指标参考关键设计指标参考表3-2以Intel EGS CPU的冷板设计为例,对冷板组件关键设计参数进行说明。表中参数不作为所有冷板组件的参考限值。表 3-2 设计参数关键设计项设计参数描述说明冷板内部流道小功率器件冷板可直接采用机加工流道、金属管嵌管等方案大功率器件(一般为散热模块为接液材料;一体式冷板不区分散热模块和固定模块20冷板液冷标准化及技术优化白皮书ODCC-W)冷板一般采用铲齿工艺,齿厚一般为 0.11.0mm,齿 间 隙 一 般 为210 倍过滤精度。例如,二次侧过滤为 50m,齿间隙一般为 0.10.5mm冷板内部流速冷板内部流道内、管路内部流速1.5m/s可以根据该流速计算出不同管径下的最大流量额定流量满足芯片散热要求基础上,流量越小越有优势,以下数据供参考:Intel EGS CPU 单冷板组件额定流量为 0.7L/min冷板所需流量小,单台CDU 能承担的节点更多,更节能冷板热阻冷板热阻是芯片表面温度与二次侧供液温度差值后,与芯片功耗的比值。满足芯片散热即可,以下数据供参考:Intel EGS CPU 标准冷板组件 的热 阻为 0.033/W0.7L/min冷板流阻冷板流阻是冷板流体流动时前后压差值。Intel EGS CPU 单冷板组件的流阻为1.6kPa0.7L/min2.2.快速接头快速接头 QDCQDC为方便服务器或机柜的安装和维护,宜在服务器的冷板组件和RCM,或 RCM 和 LCM 使用 QDC 连接,根据上述安装位置的不同,分为自锁式快速接头和球阀式快速接头。快速接头应具备可实现的快速21冷板液冷标准化及技术优化白皮书ODCC-2023-02004连接和断开功能,方便带压连接和断开,可实现单人单手操作。宜尽量降低流阻,节约二次侧泵的能耗。自锁式快速接头自锁式快速接头自锁式快速接头(图 3-8)具备流体截断功能的插拔组件,由插头与插座组成。自锁式快速接头通常用于冷板组件和 RCM 的连接(图 3-9),一般规格为 1/8 寸1/2 寸,可实现液冷系统带液插拔维护功能。当插头和插座连接时,流体接通;当插头和插座断开时,弹簧自复位确保供液中断,工艺冷媒不会溢出到系统外,以避免频繁工艺冷媒补液,污染甚至危及服务器。此接头需提供如图 3-10 流量-压降曲线,在 OCP 标准中,性能参数如下表 3-3,表中的 Cv 值,定义如下:Cv 值表示的是元件对介质的流通能力,即:流量系数,Cv 值越高在相同流量下流阻越低。计算公式 Cv=Q*(/P)0.5,Q 为流量,为流体密度,P 为压降。图 3-8 自锁式快速接头22冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 3-9 服务器冷板组件与 RCM 之间快速接头连接图 3-10 自锁式快速接头流量-压降曲线(供参考)表 3-3 UQD 快速接头 OCP 技术标准参数UQD02UQD04UQD06UQD08主体尺寸/in1/81/43/81/2标称流量直径/mm2.85.56.38.9最大工作压力/bar6.96.96.96.9最小爆破压力20.720.720.720.723冷板液冷标准化及技术优化白皮书ODCC-2023-02004/bar流量/Lmin-12.16.411.417.8最大溢出量/mL0.0200.0250.0350.070最小 Cv 值0.250.801.602.50工作温度/51765贮存温度/-4075-4075-4075-4075球阀式快速接头球阀式快速接头球阀式快速接头自带球阀,可手动调节球阀通断的快速接头,常用于 RCM 与 LCM 的连接处。此类接头最经典案例是丹佛斯 FD83(图 3-11),接头规格为 1 寸、2 寸两种,它的特点是:(1)左右两半接头完全相同,避免安装错误。(2)销锁设计:左右接头耦合前,阀芯不能开启;阀芯闭合前,左右接头无法断开。避免意外打开导致泄漏。(3)带压通断:可以实现热连接、断开和在线流体通断。(4)多种尾端:多种接口方式,可以直接连接软管和硬管。图 3-11 FD83 接头24冷板液冷标准化及技术优化白皮书ODCC-2023-02004FD83 接头的流量-压降曲线见图 3-12,相关技术参数见表 3-4。图 3-12 FD83 接头流量-压降曲线(供参考)表 3-4 FD83 接头技术参数接头规格最高工作压力/bar最低爆破压力/bar额定流量/Lmin-1Cv 值1 寸1020189302 寸.3.软管软管软管为挠性连接,可实现位移、长度伸缩补偿、缓冲、耐震功能,软管连接包括机柜级软管和服务器级软管,机柜级软管作用是连接 RCM 和 LCM,服务器级软管作用是连接 RCM 与冷板。软管根据连接端口型式,需要在管端安装软管接头、快速接头等配件以适配连接要求。25冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 3-13 软管示意软管材料:应满足与工艺冷媒兼容,常用材料如 EPDM,服务器级软管除了采用 EPDM 外,还有使用 PTFE、FEP。软管压力:软管建议满足工作压力不小于 5bar。工作温度:1575贮存温度:-4075管体颜色:为便于供液管路和回液管路的区分,建议采用不同颜色。此外,根据实际设计,考虑相关阻燃的要求。4.4.机柜机柜工艺冷媒工艺冷媒供回歧管供回歧管 RCMRCMRCM安装于液冷机柜内部,具备分液、集液和排气等功能的部件。RCM一般由排气阀、分支管路和主管路等组成。分支管路的软管端部26冷板液冷标准化及技术优化白皮书ODCC-2023-02004安装有QDC,实现与服务器内冷板组件的连接。主管路接口位于上端或下端,是工艺冷媒供回液冷机柜的接口,与LCM通过软管连接。RCM设计要求如下:(1)通常采用 304 以上方钢,20 个分支管路以上的 RCM,建议尺寸 3030mm 或 4040mm。(2)主路上限流量下的压损建议不超过 5kPa。(3)作为分集液器,应保证流量均匀,各分支管路的最大流量与最小流量之差建议不超过 10%。(4)设计压力建议不小于 1.0MPa。图 3-14 RCM5.5.冷量分配单元冷量分配单元 CDUCDUCDU的作用是将进入服务器冷板组件的工艺冷媒与冷源侧的冷却水进行隔离,并将冷却后的工艺冷媒分配给不同服务器的冷板的冷却设备。因此,CDU最主要的部件为液-液换热的板式换热器,其次是用于工艺冷媒循环输送的二次侧泵,再次是配置工艺冷媒系统(即二次侧)所需的调节、定压、补水、排气等装置,包括电动球27冷板液冷标准化及技术优化白皮书ODCC-2023-02004阀、定压罐、补水箱/袋、自动排气阀等,然后是冷却水系统(即一次侧)所需的装置,监测相关温度、压力、流量、漏液的传感器,以及相关的电器控制器件。图 3-15 CDU 内部器件示意CDU根据布置方式不同,分为机架式CDU和柜式CDU,见图3-16;如果一次侧冷却方式用空气散热代替冷却水散热,即液-液换热器改为空-液换热器,即为风冷CDU,其介绍详见本文第六章第(三)节第1小节,原理图见图3-17。机架式CDU柜式CDU图 3-16 CDU 不同型式示意28冷板液冷标准化及技术优化白皮书ODCC-2023-02004a)CDUb)风冷 CDU图 3-17 不同一次侧散热方式示意图目前,CDU 的规格设计五花八门,根据工艺冷媒或冷却水中是否有醇以及醇含量,一次侧和二次侧温差,以及供液温度条件,都会对制冷量有较大的影响。如 CoolIT 和 Nortek 等国外品牌一般会提供类似图 3-18 的计算曲线用于确认制冷量,但是曲线也是各不相同:图 3-18 a)表示二次侧采用 25%丙二醇溶液,流量为 400L/min情况下,一次侧在不同进水温度和流量下,不同逼近温度(Approach Temperature)下对应的制冷量(Heat Load),比如,二次侧 37供液,400L/min 流量的 25%丙二醇溶液,一次侧 27进水,360L/min 的冷却水,该设备的制冷量为 650kW。图 3-18 b)是在一次侧和二次侧流量均为 360L/min 条件下,一次侧液体的不同含醇量在不同逼近温度(Minimum DifferentialTemperature)下对应的制冷量(Percentage of Full Duty)。此外,还需要提供一次侧压降-流量曲线以及二次侧泵不同转速下的压头-流量曲线等。29冷板液冷标准化及技术优化白皮书ODCC-2023-02004a)b)图 3-18 国外 CDU 制冷量查询曲线6.6.环路环路工艺冷媒工艺冷媒供回歧管供回歧管 LCMLCMLCM一般安装于数据中心地板底部,有时也会安装于机柜顶部,具备分液、集液和排气等功能。LCM一般由排气阀、分支管路、主管路、阀件等组成。LCM将从CDU冷却的工艺冷媒,通过分支软管输送到RCM处,实物照片见图3-19。图3-19 LCM现场照片LCM的系统架构:LCM管路一般采用环状管网,用于提供供液管网的可靠性,在考虑CDU并机组环的台数时,应考虑故障域的大小,是否与业务的可靠性需求匹配。图3-20展示CDU不入列情况下,CDU30冷板液冷标准化及技术优化白皮书ODCC- 1和2 1并机组环的架构型式,图3-21展示CDU入列情况下,不同布局下LCM环管或者备份双管路布局型式。图 3-20 CDU 不入列 LCM 布置架构方案示意图3-21 CDU入列LCM布置架构方案示意7.7.冷源冷源根据工艺冷媒供液温度需求,CDU的换热能力,确定一次侧冷却水进水温度,根据此进水温度,结合当地的气候和水资源条件,选择合适的冷源方式,冷源可采用机械制冷或者自然冷却。机械制冷系统包括风冷冷冻水系统和水冷冷冻水系统,可提供1218的中温冷冻水。在室外条件允许的情况下,可直接采用自然冷却供冷。自然冷却系统可选用开式冷却塔、闭式冷却塔和干冷器等,可提供30以上的冷却水9。31冷板液冷标准化及技术优化白皮书ODCC-2023-02004机械制冷机械制冷(1)风冷冷冻水系统风冷冷冻水系统主要由风冷冷水机组、冷冻水泵及配套设施组成,其液态制冷剂在其蒸发器盘管内直接蒸发为气态,实现对盘管外的冷冻水吸热制冷,并通过风冷冷凝的方式将气态制冷剂冷却为液态。(2)水冷冷冻水系统水冷冷冻水系统主要由水冷冷水机组、冷冻水泵、冷却水泵、冷却塔及板式换热器等组成,其液态制冷剂在蒸发器盘管内直接蒸发为气态,实现对盘管外的冷冻水吸热制冷,并通过水冷冷凝的方式将气态制冷剂冷却为液态。自然冷却自然冷却(1)开式冷却塔开式冷却塔经过将循环冷却水直接喷淋到冷却塔填料上,同时由风机带动冷却塔内气流流动,通过室外空气与冷却水之间的热质交换冷却循环水,冷却后的循环水在冷却塔底部出水。开式冷却塔一般需要增设可拆卸的板式换热器隔离使用,否则易因水质问题导致CDU内不可拆卸的焊接式板式换热器脏堵。开式冷却塔的具体形式见图3-22:32冷板液冷标准化及技术优化白皮书ODCC-2023-02004图3-22 开式冷却塔示意图(2)闭式冷却塔闭式冷却塔是将管式换热器置于塔内,通过室外流通的空气、喷淋水与管内的循环冷却水进行热交换而实现向大气散热的设备。闭式冷却塔由内循环和外循环两个系统组成,其内循环通过与被冷却设备连接,构成一个封闭式系统,将系统热量带到冷却塔,即内循环水通过换热盘管将热量传递到大气中;外循环由循环喷淋泵、布水系统、集水盘及管路组成,外循环水不与内循环水相接触,只是通过冷却塔内的换热器吸收内循环水的热量,然后通过和空气直接接触来散热。闭式冷却塔的具体形式见图3-23:33冷板液冷标准化及技术优化白皮书ODCC-2023-02004图3-23 闭式冷却塔示意图(3)干冷器干冷器通过室外空气来冷却换热器盘管内的冷却水,从而降低冷却水的温度,达到冷却的目的。根据室外条件,可选择性增加喷淋设备强化冷却。干冷器中的冷却水通常使用乙二醇溶液来防冻,需要根据项目地冬季极端温度选取溶液浓度。干冷器的具体形式见图3-24:图3-24 干冷器示意图34冷板液冷标准化及技术优化白皮书ODCC-2023-02004由于一次侧进水温度的不同,所选择的室外冷源也会有所不同,即冷源的搭配形式有所不同。一次侧进水温度大致可分为五个等级,见表3-5。表3-5 不同一次侧进水温度等级下的冷源配置710液冷水温等级一侧进水温度冷源配置W1717冷水机组,辅以水经济器(板式换热器)W2727W3232冷却塔或干冷器,辅以冷水机组或区域热回收系统W4040W4545冷却塔或干冷器,辅以区域热回收系统W 45注:最低供水温度不低于2。8.8.工艺冷媒工艺冷媒冷板液冷的工艺冷媒主要选择纯水液和配方液,纯水液主要为去离子水,配方液主要为乙二醇或丙二醇溶液。此外,工艺冷媒需要添加抑菌剂和缓释剂,不同工艺冷媒之间不可以混用。去离子水具有良好的导热性能,超低电导率、制备工艺成熟,无毒安全,但需要注意对工艺冷媒的维护。去离子水的冰点为 0,在运输、储存、短时停机、业务量较少、服务器已安装未运行等情况下,需要考虑防冻问题。35冷板液冷标准化及技术优化白皮书ODCC-2023-02004对于配方液而言,具备高导电率,泄漏可能导致 IT 设备短路。乙二醇或丙二醇具有一定的毒性。目前,华为、曙光以 25%乙二醇溶液为主,浪潮、新华三以 25%丙二醇溶液为主,其中,浓度 25%并非定值。配方液浓度的高低会影响工质流动的快慢,散热的大小。当浓度过低时,无法起到防冻作用及抑制微生物的作用。当浓度在20%以上时,乙二醇溶液和丙二醇溶液对微生物可起到一定的抑制作用。具体项目采用的浓度大小需根据项目地点的气象参数和防冻要求即可4。表 3-6 不同工艺冷媒的物性参数(40,101kPa)对比4工艺冷媒去离子水25%乙二醇25%丙二醇工艺冷媒行标要求沸点/100.0103.8101.2冰点/0.0-12.2-10.0导热系数/(W/m)0.630.510.49比热容/(kJ/kg)4.1743.7433.96密度/(kg/m3)99210271014运动粘度/(mm2/s)0.65901.16581.3852在最低使用温度下液体运动粘度50mm2/s导电性混 合 杂 质 后导电混合杂质后导电混合杂质后导电初始液体电导率300s/cm毒性无有 一 定 毒性,乙二醇原溶液口服有 一 定 毒性,丙二醇原溶液口服液体允许接触浓度100ppm;使 用36冷板液冷标准化及技术优化白皮书ODCC-2023-02004致死量1.6g/kg致死量22g/kg液体要求无皮肤接触,无眼接触刺激,无细 胞 变 异 影响,对水生毒害无影响腐蚀性弱 腐 蚀 性,需加缓蚀剂弱腐蚀性,需加缓蚀剂弱腐蚀性,需加缓蚀剂环保性环 保,直 接排放需加水稀释后排放到污水管道需加水稀释后排放到污水管道臭氧破坏潜能ODP=0设备兼容性维 持 工 质 运行 环 境,来抑 制 管 路 材料 中 的 腐 蚀和 微 生 物 的滋 长,同 时也 配 有 添 加剂(缓 蚀 和杀菌)通过添加剂(缓蚀剂和杀菌)有效抑制管路中材料腐蚀和细菌的滋长通过添加剂(缓蚀剂和杀菌)有效抑制管路中材料腐蚀和细菌的滋长产业链及成本去 离 子 水 制备 工 艺 及 产业链较成熟与汽车防冻液共用产业链,大量应用,产业链成熟、成本低多 用 于 食品、饮料等有低毒性要求 的 产 业链,应用范围小,成本高冷板液冷用工艺冷媒 pH 宜稳定在弱碱性,以防止在冷板内部、管壁形成生物粘膜,有效防菌。具体的工艺冷媒检测项目及参数推荐见表 3-7。表 3-7 取样监测项目和参数推荐值关键水质参数单位数值pH(25)/8.09.537冷板液冷标准化及技术优化白皮书ODCC-2023-02004浊度NTU5电导率(25)s/cm20(去离子水)1500(缓蚀剂)微生物CFUs/mL100铜及铜离子ppm0.2铁及铁离子ppm0.1锌及锌离子ppm0.1铝及铝离子ppm0.1氯离子ppm10硫化物ppm1硫酸盐ppm10总硬度(以 CaCO3计)ppm20总悬浮固体ppm3冷板液冷用工艺冷媒测试方法参考见表 3-8。表 3-8 工艺冷媒测试内容及方法监控内容测试方法外观通过目测法观察工艺冷媒的外观情况。pH利用玻璃电极法测定水溶液的 pH 值。具体方法为:在某一特定温度下(如 25),先将电极浸泡到标准缓冲溶液进行校准,然后用水冲洗电极,用待测液体洗涤后,将电极插入待测液体读出 PH 值。也可选用在线式 PH 计进行实时监测系统中水溶液的 pH 值变化。在线式 pH 计带有温度传感器,可自动进行温度补偿。酸值利用颜色指示剂法或者电位滴定法测定绝缘液体的酸值。38冷板液冷标准化及技术优化白皮书ODCC-2023-02004具体方法为:(1)颜色指示剂法:将绝缘液体溶解在含有少量水的甲苯和异丙醇混合溶剂中,以氢氧化钾异丙醇标准溶液为滴定剂进行电位滴定。当 pH 值达到 11.5 时,每 1g 样品所需的碱量即为酸值,以 mgKOHg 表示。(2)电位滴定法:将绝缘液体溶解在含有少量水的甲苯和异丙醇混合溶剂中,并加入颜色指示剂,以氢氧化钾异丙醇标准溶液为滴定剂。当颜色有明显变化时,每 1g 样品所需的碱量即为酸值,以 mgKOHg 表示。电导率利用电导率仪测定水溶液的电导率。具体方法为:在试验前,用电导率不大于 200s/cm 的去离子水清洗电导率的传感器,然后再用待测溶液清洗至少两次,然后进行测定。或选用在线式电导率仪进行实时监测系统中水溶液的电导率的变化。在线式电导率仪带有温度传感器,可自动进行温度补偿。粘度利用玻璃毛细管粘度计测量液体的运动粘度和动力粘度。具体方法为:标定玻璃毛细管粘度的毛细管常数;在某一特定温度下(如 25),记录下一定体积的液体流过标定好的毛细管粘度计的时间;毛细管粘度计的毛细管常数与流动时间的乘积,即为该温度下液体的运动粘度;该温度下液体的运动粘度与该温度下液体的密度的乘积,即为该温度下液体的动力粘度。或选用在线式粘度计对工艺冷媒进行实时监控。冰点利用临界角折射率仪测定乙二醇或者丙二醇水溶液的冰点。具体方法为:(1)取几滴蒸馏水置于棱镜的表面上,合上盖板,进行仪器归零校准。有温度自动补偿功能的折射率仪无须进行校准,可直接使用;(2)将待测液体滴在棱镜的表面上,合上盖板,直接读出度数。注意:对于可同时测定乙二醇和丙二醇冰点的折射率仪器,应根据水溶液的类型从相应的刻度表读出读数。39冷板液冷标准化及技术优化白皮书ODCC-2023-02004倾点采用自动压力脉冲法测定绝缘液体的倾点。具体方法为:按照 SH/T 0771-2005,将试样注入样品杯后,首先将液体加热到规定温度,然后以 1.50.1/min 速度用珀尔帖装置冷却,仪器每降低 1或 3时施加一次压缩脉冲氮气到式样的表面,通过光源照射试样,当施加脉冲时使用光学检测器检测试样表面的移动。当施加压缩脉冲氮气时观察不到试样表面的移动时,就是试样的不流动点,最后一次施加压缩脉冲氮气时可以观察到试样表面移动的温度即是倾点。储备碱(保留碱度)测试方法为:将 10mL 的待测水溶液用水稀至约 100mL,再用浓度为 0.1 mol/L 的盐酸标准滴定溶液滴定到 pH 值为5.5。记录滴定所消耗的盐酸标准滴定溶液的毫升数,精确到 0.1mL。含水量参考 NB/T 42140-2017,用卡尔费休自动电量滴定法测定绝缘液体中水分的含量。浊度按照 HJ 1075-2019,利用一束稳定光源光线通过盛有待测水溶液的样品池,传感器处在与发射光线垂直的位置上测量散射光强度,测量出水溶液的散射浊度,单位为 NTU。或选用在线式浊度仪进行实时监测系统中水溶液的浊度的变化。颗粒物浓度按照 ISO 11500 进行颗粒物浓度测定。用在线或者离线的自动颗粒计数系统,测量出一定体积工艺冷媒中不同大小粒径的颗粒的分布情况。腐蚀产物元素含量采用电感耦合等离子体原子发射光谱(ICP-AES)测定工艺冷媒中金属(如 Ca,Mg,Al,Cu,Fe,Zn 等)和部分非金属元素(如 Si,S 和 P)的含量。有机物污染物采用傅里叶红外光谱仪(FTIR)分析氟化液或者油样中溶解的有机物(如塑化剂 DOP)的情况。缓蚀剂浓度采用分光光度计测量工艺冷媒中缓蚀剂(如有)的浓度。为了测量缓蚀剂的浓度,需要首先知道缓蚀剂的吸收峰的位置,然后用不同浓度的缓蚀剂溶液绘制出标准浓度曲线。测量出待测工艺冷媒在特定吸收峰出的吸光度后,根据标准浓度曲线发推出液体中缓蚀剂的浓度40冷板液冷标准化及技术优化白皮书ODCC-2023-02004菌落数测试方法为:将一定体积的待测液体滴在微生物培养基上,经过培养处理后,数出所生长出的菌落个数,计算出每毫升待测液体中可以培养出多少菌落数。如果菌落数太多,需要对待测液体进行预稀释处理。如果无条件制备培养基培养微生物菌落,也可选用商用的菌片进行培养处理。(三)(三)冷板液冷发展面临的主要挑战冷板液冷发展面临的主要挑战1.1.水质水质工艺冷媒和一次侧冷却水都存在水质问题,ASHRAE 提供了相关的标准见表 3-9。工艺冷媒的使用寿命更低,需要经常监测和加药维护,原因主要在于工艺冷媒常由水/醇类组成,在长期高温下运行时工艺冷媒中的的水、醇以及其它成分,可能由于蒸发、化学反应等原因,导致快速消耗。工艺冷媒一旦发生严重问题是需要采取换液措施的,工艺冷媒的更换是一个繁琐的任务,需要将设备停机,排液,清洗管路后再充注新的工艺冷媒。水质问题主要有四个,分别是腐蚀、微生物滋生、结垢和污垢。任意一个问题都会削弱冷板的散热能力,增加系统停机风险。腐蚀腐蚀腐蚀的类型主要有三种:均匀腐蚀,点蚀腐蚀和电化学腐蚀。均匀腐蚀也称为一般腐蚀,是指金属表面被腐蚀形成氧化膜,这是通常预期内的腐蚀,有时我们称之为钝化。点蚀是金属表面的局部腐蚀,在使用紫铜管的情况下,这种腐蚀可能导致漏水,典型的 MTTF 约为 2 年。41冷板液冷标准化及技术优化白皮书ODCC-2023-02004电化学腐蚀为两种电势差较大(一般大于 0.6V)的金属接触,且被浸润在同一电导率较高的工艺冷媒中,就会发生电化学腐蚀。这种电势差会迫使电子从电势较低的活泼金属流向电势较高的不活泼金属,失去电子的活泼金属将被腐蚀。此外,即使在金属不接触时,因为溶解的铜离子以非常低的浓度沉积在铝表面,造成铝被铜腐蚀。微生物滋生微生物滋生水系统中微生物滋生可能导致冷却回路中的沉积、污垢和腐蚀。防止微生物生长包括(1)确保硬件内部由不含生物有机体。(2)用杀生物剂处理以控制细菌种群。为了避免生物生长,硬件应运输并干燥储存。在运输和储存之前,必须尽一切努力吹净水,保持干燥。结垢结垢结垢是指在二次侧系统表面沉积致密的盐。当由于高浓度或温度升高而超过盐在水中的溶解度时,就会发生结垢。污垢污垢污垢是非结垢物质的沉积,如腐蚀物和有机物。真菌,如镰刀菌,会生长、污染和堵塞过滤器以及翅片散热器。它们通常生长在冷却塔水池或污水坑上。42冷板液冷标准化及技术优化白皮书ODCC-2023-02004表 3-9 ASHRAE 推荐的一次侧冷冻水和工艺冷媒的水质要求8一次侧冷却水 FWS工艺冷媒 TCSpH7.09.08.09.5缓蚀剂 Corrosion inhibitor(s)需要需要抑菌剂 Biocide/需要硫化物 Sulfide10 ppm1 ppm硫酸盐 Sulfate100 ppm10 ppm氯化物 Chloride50 ppm5 ppm细菌 Bacteria1000 CFUs/mL100 CFUs/mL总硬度(CaCO)Total hardness(asCaCO)200 ppm20 ppm电导率 Conductivity/0.220s/cm总悬浮固体 Total suspended solids/3 ppm蒸发后残留物 Residue afterecaporation500 ppm50 ppm浊度 Turbidity20NTU20NTU2.2.泄漏泄漏相比空气冷却,行业对冷板液冷的可靠性有很多顾虑,尤其漏液造成服务器短路的情况几乎无法接受,因此,行业需要完善的系统级、机柜级、节点级漏液检测、漏液集中回收、漏液保护等解决方案。43冷板液冷标准化及技术优化白皮书ODCC-2023-02004液冷循环体系中的腔体和流道,密封式基本功能,但由于结构材料、接口和密封方式众多,往往产生泄漏点,部分泄漏场景包含:(1)低温下工质凝固导致冷板鼓包、管路开裂。图3-25 冷板冻裂示意(2)电化学腐蚀,导致管路或 QDC 腐蚀。图3-26 部件腐蚀示意(3)软管总成,内部宝塔接头长期受管路的挤压产生蠕变,倒刺结构向内变形,软管和宝塔之间密封能力下降,产生泄漏。(4)非金属材料,如管路密封垫、排气阀浮子与工艺冷媒长期接触,出现水解开裂。44冷板液冷标准化及技术优化白皮书ODCC-2023-02004图3-27 材料水解开裂示意3.3.冗余路由冗余路由根据项目建设等级,冷板液冷系统冷源、冷却水泵、冷冻水泵、CDU、LCM 等设备需进行冗余配置。一二次侧液冷管网采用环网形式,但受限于机柜宽度尺寸,主管阀门建议采用单柜单阀门布置,当主管阀门发生故障时,导致两台机柜断液,无法满足单点故障维护要求,在后续管网设计时,需进行阀门小型化或其他应急措施,满足单点故障维护要求。4.4.高成本高成本相比空气冷却,冷板液冷 CAPEX 投资相对较高,对后续的应用规模有重要的影响:冷板组件、QDC、RCM、LCM、CDU 等因材料要求不锈钢或紫铜,成本较高,需要新材料或工艺进一步降低成本。由于需要保证材料兼容性、防腐抑菌和高效换热,所有部件均需要使用高性能、高耐腐蚀性和高导热性的材料,这些材料通常价格较高,直接导致液冷系统材料成本的增加。45冷板液冷标准化及技术优化白皮书ODCC-2023-02004为确保系统的可靠密封,需要对液冷部件进行精密加工和组装,如 LCM 的焊接、酸洗、钝化、拼装、测试等工艺,复杂的制造过程和精密工艺导致制造成本增加。5.5.建设周期长建设周期长冷板液冷数据中心涉及大量设备和工程管路,尤其是 LCM 和RCM 所在二次侧的无尘要求,需要反复冲洗;为防止金属离子析出,需要表面钝化处理,延长了相关建设周期。而用户侧,尤其是互联网用户,对快速交付的需求仍然存在,因此,有些集成商提出了诸如管路预制,冷源模块化,整机柜交付、集装箱预集成等措施。6.6.能耗问题能耗问题相比空气冷却,冷板液冷因较高效的散热,可以极大降低 PUE。在实际运行中,冷板液冷机房的气液比,一二次侧供回液温度和温差、冷通道温度要求、冷源方案等对 PUE 指标均有影响。为优化冷板液冷系统 PUE,需寻求多种节能途径:(1)降低气液比,尽量使用更高效的液体冷却。(2)提高工艺冷媒供液温度,提升自然冷却时长。(3)提高一二次侧供回液温差,降低系统流量;优化液冷系统流阻,降低循环泵扬程,降低泵功耗。(4)提升冷通道温度。46冷板液冷标准化及技术优化白皮书ODCC-2023-02004(5)尽量利用空气蒸发冷却,提升冷源换热效率。7.7.冷源水耗冷源水耗冷板液冷系统的耗水量主要来自一次侧冷源,一次侧冷源的选择对 WUE 影响较大。一般来说,WUE 的大小关系为:开式冷却塔闭式冷却塔干湿联合闭式塔带湿膜干冷器干冷器,因此,针对缺水地区,建议采用干冷器。四、四、工程标准化及设计要求工程标准化及设计要求(一)(一)标准化现状及需求标准化现状及需求1.1.标准化现状标准化现状国内标准方面,已发布 1 项与电子设备相关的冷板液冷国家标准,GB/T 15428-1995电子设备用冷板设计导则。该标准主要规定电子设备使用的冷板换热计算和结构设计,对于冷板核心参数定义,性能定义,材料定义,加工工艺,漏液检测定义和测试方法及要求均不涉及。目前与冷板液冷系统相关的标准,已发布 4 项行业标准,9 项团体标准,标准清单详见表 4-1。已有标准主要概述了数据中心冷板式液冷系统设计、CDU 和其他相关方面的技术要求与测试方法,适用于液冷系统的设计、施工、部署、运维、测试等环节的技术指导。47冷板液冷标准化及技术优化白皮书ODCC-2023-02004表 4-1 冷板液冷国内相关行业和团体标准清单级别级别标准编号标准编号标准名称标准名称公布日期公布日期发布单位发布单位行业标准YD/T 4024-2022数据中心液冷服务器系统总体技术要求和测试方法2022/4/24中国通信标准化协会行业标准YD/T 3983-2021数据中心液冷服务器系统能源使用效率技术要求和测试方法2021/12/2中国通信标准化协会行业标准YD/T 3982-2021数据中心液冷系统冷却液体技术要求和测试方法2021/12/2中国通信标准化协会行业标准YD/T 3980-2021数据中心冷板式液冷服务器系统技术要求和测试方法2021/12/2中国通信标准化协会团体标准T/CCSA 274-2019数据中心液冷系统冷却液体技术要求和测试方法2020/7/29中国通信标准化协会团体标准T/CCSA 270-2019数据中心冷板式液冷服务器系统技术要求和测试方法2020/7/29中国通信标准化协会团体标准T/CCSA 269-2019数据中心液冷服务器系统总体技术要求和测试方法2020/7/29中国通信标准化协会团体标准T/CCSA 239.1-2018服务器用液冷系统第 1 部分:间接冷板式2020/7/28中国通信标准化协会团体标准T/CIE 091-2020温水冷板式间接液冷数据中心设计规范2021/4/29中国电子学会团体标准T/CIE 090-2020数据中心温水冷板式间接液冷设备通用技术要求2021/4/29中国电子学会团体标准T/CIE 088-2020非水冷板式间接液冷数据中心设计规范2021/4/29中国电子学会团体标准T/CIE 098-2021液/气双通道热管冷板间接液冷数据中心设计规范2021/4/29中国电子学会团体标准T/CIE 097-2021液/气双通道热管冷板间接液冷数据中心 散热设备通用技术规范2021/4/29中国电子学会48冷板液冷标准化及技术优化白皮书ODCC-2023-02004对于服务器与存储设备用液冷部件冷板、连接系统、CDU 等本身的设计、生产、测试和评价标准整体规定方面,目前已发布 1 项标准 T/CESA 1249.1-2023服务器及存储设备用液冷装置技术规范第 1 部分:冷板,另有 3 项标准正处于征求意见阶段:服务器及存储设备用液冷装置技术规范 第 2 部分:连接系统,服务器及存储设备用液冷装置技术规范 第 3 部分:冷量分配单元,服务器及存储设备用液冷装置技术规范 第 4 部分:监控系统。国外标准方面,ASHRAE TC9.9 定义了供给冷量分配单元的一次侧冷却水的温度等级,从 W17 到 W 共 6 个温度等级(表 3-5)。综上,从全球范围看,信息技术领域冷板液冷的标准较少,在通用市场暂未形成大规模影响。2.2.标准化需求标准化需求基于不同类型业务场景,预计未来 2-3 年 CPU 类型业务液冷单机柜典型功耗在 20-30kW,GPU 类型业务液冷单机柜典型功耗在 40-50kW 范围。从快交付、低成本等基本诉求出发,宜考虑冷板液冷数据中心关键组件、系统架构标准化需求。从产品适配角度,通过推动标准化产品的普及,提升用户冷板式液冷产品的可选性、兼容性等。(1)组件标准化49冷板液冷标准化及技术优化白皮书ODCC-2023-02004冷板液冷系统的关键组件,包括冷板组件、QDC、CDU 及连接管路(RCM、LCM 和软管等)。这些关键组件的标准化,最直接的收益是降低成本,间接加速冷板液冷系统的推广及应用。从冷板组件标准化角度看,考虑服务器热设计功率随技术发展在不停演进,但不同业务类型散热功耗相对偏差不大。如单节点CPU 类型服务器液冷散热功耗预计在 1kW 范围;单节点 GPU 类型服务器液冷散热功耗预计在 10kW 范围。对于冷板组件,宜考虑不同代际散热需求,进行可选标准化散热功率设计,以供服务器节点选择。QDC 宜设立、推行适合国内应用场景的行业标准而非企业标准,以便降低不同 OEM(或 ODM)服务器替换、更新等场景液冷设施接驳的差异化需求。如,虽然 OCP 推行了 QDC 标准的快速接头,但其快速接头与 RCM 的连接底座螺纹型式,还是以美标螺纹为主。针对国内的配套产业链,还是应遵从国标要求为主。对于连接软管,因 RCM 的布置需与 I/O,PDU 等综合考量,服务器级软管,应推出可选梯次长度,供用户选择,而非定制长度。CDU 作为冷板液冷的核心组件,从中长期看,柜式 CDU 的需求量较大概率会超过机架式 CDU。针对柜式 CDU,更适宜考虑在不同液冷分级(见表 3-5)下,不同颗粒度规模(如典型 400kW、600kW、800kW、1000kW 或更高容量)的标准化产品。产业链设备厂商可考虑以某种液冷分级(如 W32,见表 3-5)、满足可在线冗余需求的基础上,设计基于标准化配置的 CDU 设备,进而量化设备尺寸、容50冷板液冷标准化及技术优化白皮书ODCC-2023-02004量等参数。同时,保留一定容量幅度范围的换热能力,设备的容量兼容能力可有效提升,提高设备产品力。从用户角度,降低 CDU 差异化选择,为冷板液冷系统标准化模型创造良好基础。(2)系统标准化冷板液冷单系统容量是实现楼栋级液冷乃至更高规模液冷集群的基础。从冷板液冷单系统容量标准化需求角度看,更适宜以数据中心常用变压器容量(如 2000kVA、2500kVA 等)为基本模数,推演基于不同 CDU 颗粒度规模,在不同液冷分级下(以 W32 为基准)标准的一、二次侧产品解决方案。考虑到一次侧及冷源的经济性,可在变压器基本模数的基础上,以 2 倍或 3 倍乃至更高倍数为框架,整体搭建室外冷源及一次侧管路系统。CDU 及二次侧管路应整体考虑可在线维护等冗余要求。(二)(二)工程标准化设计要求工程标准化设计要求1.1.二次侧管路二次侧管路材质材质与工艺冷媒接触的管路材质应具有良好的兼容性,LCM 及阀门,法兰等管件通常采用 SUS304 不锈钢及以上材质,出厂前应采取酸洗、钝化、清洗、烘干处理。需要焊接处理的不锈钢宜采用低碳(51冷板液冷标准化及技术优化白皮书ODCC-.03%)以避免敏化甚至腐蚀,焊接后需要使用酸洗钝化的方式去除热着色氧化物。密封材料应满足 RoHS 要求。密封材质应具备良好的密封性和抗老化能力;与工艺冷媒接触的材料表面不易发生腐蚀,禁止使用生料带等易腐易堵的密封方式及辅料。执行标准及承压执行标准及承压管路管径及壁厚选型在满足系统流量分配的前提下,同时应遵循 DIN11850 标准要求,管路承压能力不小于 1.0MPa。表面粗糙度表面粗糙度要求管路内壁表面光洁度高,金属特性稳定,表面的粗糙度(Ra)不大于 0.6m。预制化预制化管路要求采用工厂预制化方式,在工厂内完成所有管道模组的焊接加工、管道清洗、密闭性测试、洁净度测试、烘干等工作,宜氮气保压运输至工程现场进行组装,现场只允许进行管道组装及相关清洗工作,不建议在机房内动火焊接。管道清洗完之后电导率应不大于 10s/cm,且水体无杂质、表面无油污。密闭性测试可采用水压密封试验(建议 1012bar,保持 824h)或者气压密封试验(建议 28bar,保持 510min)。52冷板液冷标准化及技术优化白皮书ODCC-2023-02004LCM 深化设计时,须进行管路三维建模,确认与其它系统无结构干涉,以确保管路可实施性。LCM 应按单线图规定的数量、规格、材质选配管道组成件、并应按单线图标明管道系统号和按预制顺序标明各组成件的顺序号。不得对不同编号的管路进行交叉互换。不锈钢预制管路可少量配置不锈钢波纹软管进行建筑物与预制管路之间的公差配合。管路设计管路设计LCM 建议架空地板下敷设,环路设计,避免单点故障,架高地板顶面标高建议不小于 700mm,宜 900mm(此标高未考虑其它管线系统占用高度)。LCM 底部宜设置集液盘,以及安装排气阀、泄水阀等配件的空间,二次侧主管管径不宜大于 DN200;另外当尺寸大于 DN200 时配件多为工业级,导致工程成本增加,同时大管径载冷量更大,相同冷负荷前提下需布局的环路数量减少,整体可靠性也随之降低。环网管路应在适当位置安装自动排气阀,保证系统排气。排气阀建议设置隔离阀门,方便维护。LCM 的阀门安装应采用对焊或法兰对夹安装、端面密封,不宜采用螺纹安装(避免生料带及密封胶的使用,腐蚀堵塞冷板或QDC)。LCM 分支管应安装可快速物理断开的球阀,与机柜 RCM 接管进53冷板液冷标准化及技术优化白皮书ODCC-2023-02004行快拆连接。机柜分支关断阀、主管路分段阀以及主分支关断阀(蝶阀、球阀、分段法兰)阀体、阀板、阀球材质通常均采用 SUS304 不锈钢或以上材质,承压1.0MPa。安装方式应采用焊接、法兰、卡箍连接,端面密封。卡箍连接应采用高压卡箍,禁止采用单铆钉轻型卡箍。不允许螺纹安装。工艺要求工艺要求不锈钢管路安装前应提前进行安装环境管理,安装空间应处于洁净状态。不锈钢管路在安装运输过程中应小心轻放,并注意对非不锈钢金属材质 EPDM、PTFE 等柔性材质进行保护。不锈钢预制管路安装过程应按布置图纸编号进行分段安装,防尘包装不得提前拆除。不锈钢管路的安装支架和固定管卡宜采用不锈钢材质,当安装支架和固定管卡用非不锈钢的金属材质时,需采用 EPDM 或 PTFE 来对管路与支架之间进行有效隔离。不锈钢管路管件安装前应提前进行检查,管件无损伤且干净无灰尘。连接件(法兰或卡盘)连接应与管道同心,并应保证螺栓自由穿入。法兰螺栓孔应跨中安装。法兰间应保持平行,其偏差建议不54冷板液冷标准化及技术优化白皮书ODCC-2023-02004大于法兰外径的 1.5,且不大于 2mm;卡盘间应保持对称,错位偏差建议不大于 1mm,不得用强紧螺栓的方法消除歪斜。采用卡盘连接或者法兰连接时,垫圈不得扭曲移位,管路紧固时应对称的均匀用力,紧固力使密封圈压缩形变,行成无间隙密封。2.2.功能要求功能要求水力平衡水力平衡LCM 设计需考虑机柜流量均匀,液冷机柜最大流量和最小流量之间的不平衡率控制在 10%以内,且满足所有机柜设计散热流量需求;在最不利单点故障工况,不平衡率应不大于 15%。复杂大系统应提供不同工况下的水力平衡仿真报告。系统排水系统排水LCM 最低位置应设置排污(水)口等,配置排水阀,采用SUS304 不锈钢材质,排水阀口径不应小于 DN10。宜采用焊接或卡盘连接,禁止采用螺纹连接。保留足够的检修空间,方便维护。漏水检测漏水检测LCM 底部需设置集水盘,集水盘需采支持分段预制且可实现定向排水,集水盘建议设置不小于 i=0.003 坡度,内部需沿管路路由全部铺设米级定位式漏水告警绳,定位式漏水告警绳敷设应覆盖LCM 及阀门。漏水绳上需安装定位标识,漏水检测的告警信号应可55冷板液冷标准化及技术优化白皮书ODCC-2023-02004接入机房动环管理系统,当出现漏液告警时可将发生泄漏的物理位置定位到某个主管路。保温保温CDU 有防结露功能时,LCM 无需使用保温措施;另外,CDU 内部一次侧管路及换热器建议保温,CDU 内部二次侧无需保温。过滤精度过滤精度二次侧过滤精度宜不大于 50m(即不小于 300 目),一次侧过滤精度宜不大于 250m(即不小于 60 目),建议使用阻力小、在线维护方便的过滤器。应设置旁路管路,支持在线维护,不影响系统正常运行。流速限值流速限值如果流速超过 1.5m/s,所有管径小于 25mm 的管道和所有管径软管都有被侵蚀的风险,尤其是在弯管和接头处。管径 38mm76mm 的管道流速限值在 1.8m/s,管径76mm 的管道流速限值为 2.1m/s5。(三)(三)典型案例介绍典型案例介绍1.1.江苏某大数据产业园项目江苏某大数据产业园项目曙光数创全系统交付的 MW 规模大数据产业园液冷项目,致力于建设车联网、云计算、智能制造、区块链等相关领域区域数据中心,为用户提供个性化的定制化数据分析服务。56冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 4-1 大数据产业园项目现场单机柜功率:21kW,气液比:1:1CDU 颗粒度:445kW,3 1 备份。一次侧进出水温度:35/40二次侧供回液温度:40/45二次侧冷却介质:去离子水添加药剂单个服务器节点设计流量范围:1.01.2L/min单个服务器节点(含快速接头)流阻为 35kPa1L/min二次侧主管路按照环状管网设计,降低因管路水利不平衡造成的机柜流量分配不均的影响。每个环网中设计 8 个支路,每个支路布置 13-18 个液冷机柜。每两个机柜设置一组分段阀,在不大幅增加造价的同时尽量降低单点故障的影响。CDU 布置在空调间,通过接入主环网为系统供液。二次侧硬管道、阀门、管件材质均为 304 不锈钢,管道在工厂完成分段预制,在项目现场仅需完成组装,无需动火焊接。有维护需求的部位(手57冷板液冷标准化及技术优化白皮书ODCC-2023-02004动阀件连接处)采用法兰或卡箍连接,互锁型球阀、自动排气阀、传感器等附件采用螺纹连接,连接处均采用 0 型圈或组合密封圈密封,密封圈材质采用 EPDM 或 PTFE 材质。本项目在生产测试车间搭建与本项目单个环网 1:1 比例的测试平台。测试平台接入 CDU 及冷源设备,按照试验设计在管网中布置已完成权威检测机构标定的流量计、压差传感器、温度传感器等检测设备。进行均流测试时,采用“假负载”模拟现场机柜。图 4-2为厂验测试现场照片。图 4-2 厂验测试现场2.2.厦门某智算中心厦门某智算中心创新实验室面向能源、材料、半导体领域高速增长的研发需求与大规模科学计算需求,于2022年建成国内高校领先水平的智算中心,以实现多领域原创性突破与智能化转型。58冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 4-3 东部(厦门)某智算中心IT规模:800kW单机柜功率:50kW,100%冷板液冷CDU颗粒度:400kW,2 1备份一次侧进出水温度:35/45二次侧供回液温度:40/50二次侧冷却介质:去离子水室外冷源:700kW闭式冷却塔,1 1备份设计年均PUE:1.2特点:模块化设计,工厂预制3.3.山西某大规模冷板液冷数据中心山西某大规模冷板液冷数据中心秦淮数据MW规模部署的国内第一个冷板液冷数据中心,于2023年7月建成并完成测试交付。59冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 4-4 华北大型冷板液冷数据中心现场 CDU 和干冷器实景机柜功率:20 kW,气液比:1:1一次侧进出水温度:35/42二次侧供回液温度:40/45一次侧冷却介质:45%乙二醇溶液二次侧冷却介质:去离子水CDU规模:350kW,1 1备份冷源方式:干冷器,5 1特点:一次侧大环网,二次侧CDU小环网高可靠性4.4.广州科云数据中心广州科云数据中心广州科云数据中心作为行业先锋,早在2019年率先试点实践了冷板液冷技术。60冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 4-5 广州科云数据中心IT 规模:120kW单机柜功率:10kW,峰值 13.2kWCDU 颗粒度:120kW,1 1 备份一次侧进出水温度:12/18二次侧供回液温度:30/35二次侧冷却介质:乙二醇溶液冷冻水列间空调:40kW,1 1 备份设计年均 PUE:PUE1.18特点:冷板液冷试点早期实践五、五、接液材料研究接液材料研究详细了解所有冷却部件和所使用的材料至关重要,需要和所有接液材料部件及液体供应商建立密切合作,确保材料的相容性。有61冷板液冷标准化及技术优化白皮书ODCC-2023-02004关常见接液材料的描述,该列表并不是对所述材料相容性的承诺,具体材料选择或供应商切换时,仍然需要通过测试来确定。(一)(一)传统材料传统材料液冷系统接液材料要与工艺冷媒保持良好的相容性,不会产生腐蚀、劣化及其他理化性质的改变;具备良好的机械性能、环境适应性,且符合环保要求。ASHRAE 建议管路、接头、RCM、LCM 等金属部分使用紫铜、锌含量低于 15%无铅黄铜、304L 或者 316L 不锈钢,非金属部分使用EPDM5。目前,国内液冷 LCM、RCM 广泛使用的是卫生级不锈钢管材。(二)(二)国外推荐材料国外推荐材料OCP 在 2022 年 10 月的峰会上,由 Philip Yu 博士(纳尔科)和 Sean Barlett(Meta)牵头的项目6中,明确给出了二次侧接液材料的清单,并给出了最高水温不超过 66的适用条件,并把材料大致分为以下两类:1.1.金属与金属合金类金属与金属合金类表 5-1 OCP 金属与金属合金类材料推荐材料名称明细说明紫铜 CopperCDA110:99.95%铜 0.002%银CDA1020:99.95%铜 0.002%银(UNSC11000)62冷板液冷标准化及技术优化白皮书ODCC-2023-02004CDA1220:99.9%铜 0.02%磷CDA1100:99.9%铜 0.04%氧锌含量低于15%黄铜Brass of15%zinc大于 15%的锌具有更易腐蚀的相谨慎使用不锈钢StainlessSteel304L 或者 316L(推荐)必须考虑氯化物限值镍,高镍合金Nickel,highnickelalloys避免使用 B 型哈式合金及设计用于还原环境的合金B 型哈式合金:6570%镍 1.53%铬 12%铁 2532%铜 0.002%硼谨慎使用铬 Chromium电镀耐腐蚀材料谨慎使用钛 Titanium2 级(UNS R50400):99.75%钛 0.25%铝B-Ni-688.9%镍 11%磷铜冷板钎焊材料BCuP-293%铜 7%磷铜冷板钎焊材料BCuP-389%铜 5%银 6%磷 0.15%其它铜冷板钎焊材料BCuP-487%铜 6%银 7%磷铜冷板钎焊材料BCuP-580%铜 15%银 5%磷铜冷板钎焊材料TF-H600F74.9%铜 15.6%锡 5.3%磷 4.2%镍铜冷板钎焊材料63冷板液冷标准化及技术优化白皮书ODCC-.合成橡胶、塑料和其它材料类合成橡胶、塑料和其它材料类表 5-2 OCP 合成橡胶、塑料和其它材料类推荐材料名称明细说明EPDM三元乙丙橡胶 Ethylene propylene dienemonomerA 型氟橡胶Viton A亚氟乙烯六氟丙烯 Vinylidene fluoridehexafluoropropyleneGF 型氟橡胶Viton GF亚氟乙烯六氟丙烯四氟乙烯 Vinylidenefluoride hexafluoropropylenetetrafluoroethyleneETP 型氟橡胶Viton ETP乙烯 Ethylene、四氟乙烯tetrafluoroethylene(TFE)、全氟甲基乙烯基醚 perfluoromethylvinylether(PMVE)FEP全氟乙丙烯聚合物 Fluorinated ethylenepropylene polymerPTFE,Teflon聚四氟乙烯聚合物Polytetrafluorinatedethylene polymer特氟龙密封剂和波纹软管PP聚丙烯 PolypropylenePPR聚丙烯无规共聚物 Polypropylene RandomCopolymerPVDF聚偏二氟乙烯或聚偏二氟化乙烯Polyvinylidene fluoride or polyvinylidenedifluorideEPR乙烯丙烯橡胶 Ethylene propylene rubberPE聚乙烯 Polyethylene包括挤压交联聚乙烯(PEX)、超高分子量聚乙烯64冷板液冷标准化及技术优化白皮书ODCC-2023-02004(UHMWPE)、高密度聚乙烯(HDPE)NBR,Buna-N,Nitrile丙烯腈-丁二烯橡胶 Acrylonitrile butadienerubberPSU聚砜 PolysulfoneHDPE高密度聚乙烯 High density polyethyleneAFLAS聚四氟乙烯-聚丙烯共聚物Polytetrafluoroethylene polypropylenecopolymerPFA,D3307全氟烷氧基烷烃 Perfluoro alkoxy alkanesCPVC氯化聚氯乙烯 Chlorinated polyvinylchlorideHypalon氯磺化聚乙烯 ChlorosulfonatedPolyethylene(CSPE)合成橡胶Neoprene氯丁橡胶PPS聚苯硫醚 Polyphenylene SulfidePPO聚苯氧化物 Polyphenylene OxidePPSU聚苯砜 PolyphenylsulfonePEEK聚醚醚酮 Polyether ether ketonePFPE/PTFE全氟聚醚 Perfluoropolyether/聚四氟乙烯 Polytetrafluoroethylene润滑油氧化铝Aluminumoxide机械轴承和密封石墨/碳化硅复合材料Graphite一种高级陶瓷材料机械轴承和密封65冷板液冷标准化及技术优化白皮书ODCC-2023-02004loadedsiliconecarbide乐泰 567 胶水Loctite 567螺纹密封胶 Thread sealant其他螺纹密封剂可能是可接受的,但应进行验证;避免任何可能将颗粒引入流体的东西(三)(三)国内常用非金属材料国内常用非金属材料1.1.管路及接头材料管路及接头材料无规共聚聚丙烯无规共聚聚丙烯 PPRPPRPPR 是一种常用的聚合物材料,它具有优异的物理和化学性质,优良的耐化学腐蚀性,热稳定性好,良好的焊接性,耐磨性好,管道内表面光滑。此外,与金属材料相比,比重小,不导电,热塑性好,易加工。聚偏二氟乙烯聚偏二氟乙烯 PVDFPVDFPVDF 是一种相当纯净的聚合物,它不含紫外稳定剂、热稳定剂,软化剂、润滑剂或是阻燃剂等添加剂。特别适用于超纯水系统和半导体行业中纯净化学试剂的传输。由于 PVDF 的化学惰性,它几乎不与任何介质发生反应。PVDF 材料可以稳定地保持去离子超纯水的电阻率超过 18Mcm。由于它的易加工性和高性价比,PVDF 显示出良好的综合性能。PVDF 材料具有以下优点焊接性好,热塑性好,适用温度范围宽,66冷板液冷标准化及技术优化白皮书ODCC-2023-02004耐热变形温度高,非常好的耐化学腐蚀性,即使用在高温的连接下抗紫外性和 Y 射线辐射能力强,耐老化,磨耗低(低摩擦系数),耐磨性好,良好的力学性能,极好的介电性能,阻燃剂,无毒,易加工。均聚聚丙烯均聚聚丙烯 PPHPPHPPH 是一种改良的聚丙烯材料,是一种高分子量,低熔流率的均聚聚丙烯聚。经过改性具有细腻的结晶结构,不但材料的高结晶度确保了极好的耐化学腐蚀性、耐高温性以及良好的抗蠕变性,热稳定性好,耐老化,耐磨性好,摩擦阻力低,压损小,不导电,热塑性好,易加工,而且在低温下还具有优异的抗冲击性。聚全氟乙丙烯聚全氟乙丙烯 FEPFEPFEP 主要优点包括:熔点高,耐受工作温度范围可达-85200。绝缘性好,介电常数低,比体积电阻大。具有优异的化学稳定性。除与高温下的氟元素、熔融的碱金属和三氟化氯等发生反应外,与其他化学药品接触时均不被腐蚀。与 PTFE 相比,硬度及抗拉强度略有提高,摩擦系数相似。常被用于冷板液冷 RCM 与服务器连接管路。聚酰胺塑料聚酰胺塑料 PAPA67冷板液冷标准化及技术优化白皮书ODCC-2023-02004PA 的主要优点包括:机械强度高,韧性好,有较高的抗拉、抗压强度,拉伸强度高于金属,压缩强度与金属不相上下。抗拉强度接近于屈服强度,对冲击、应力振动的吸收能力强。耐疲劳性能突出:软化点高,可在 150下长期使用;耐磨、耐腐蚀,有很好的抗老化能力。电气性能优良:体积电阻很高,耐击穿电压高,在干燥环境下,可作工频绝缘材料,即使在高湿环境下仍具有较好的电绝缘性。表面光滑,摩擦系数小。因为 PA 的以上优点,在储能液冷领域有较多的应用,但是在冷板液冷少有应用,经研究发现,某些等级的 PA 会在水中产生铵离子,进而导致铜收到严重腐蚀,即使使用铜缓蚀剂也无法抑制腐蚀,因此,需要谨慎使用。表 5-3 管路及接头材料参数对比技术指标测试方法单位PPRPVDFPPHFEPPA物理性能比重 23ISO1183g/cm30.911.780.912.141.05熔融指数ISO1133g/10min/21-2719熔融流动速率 MFR190/5/0.5/MFR230/5/1.2560.25/MFI 范围ISO1872/1873/M003/68冷板液冷标准化及技术优化白皮书ODCC-2023-02004力学性能屈服拉伸应力ISO527MPa255030/47屈服伸长率ISO527910/30断裂伸长率ISO5270080300300-400/无缺口冲击强度, 23ISO179kJ/cm2无断痕124无断痕/110无缺口冲击强度,-30ISO179kJ/cm2/85缺口冲击强度, 23ISO179kJ/cm225/50/21缺口冲击强度,0ISO179kJ/cm2/11/缺口冲击强度,-30ISO179kJ/cm22/5/10洛氏硬度ISO2039-1MPa458060/邵氏硬度ISO868/56/挠曲强度(3.5%挠曲应变)ISO178MPa208028/弹性模量ISO527MPa90020001300/热性能维卡软化温度 VST/B/50ISO3066514091/100热挠曲温度HDT/BISO757014596/线性热膨胀系统DIN53752-110-41.61.21.6/热导率,20DIN52612W/(m)0.240.130.22/69冷板液冷标准化及技术优化白皮书ODCC-2023-02004可燃性UL94/94-HBV-094-HBV-0HBDIN4102/B2/B2/电性能比体积电阻VDE0303cm61018/比表面电阻VDE030331016/相对介质常数,1MHzDIN53483/2.37.252.3/介电常数VDE0303kV/mm7022752.03/其它卫生无毒EEC90/128/是是是是是食品及药物总局/是是是是是紫外稳定剂/无有无/颜色/RAL7032灰色本色RAL7032灰色白色透明黑、橙等注:数据来源于数据 Agru 产品手册。2.2.密封件材料密封件材料非金属管路密封件推荐三元乙丙橡胶(EPDM)、聚四氟乙烯(PTFE)及氟橡胶(FPM)。三元乙丙橡胶(三元乙丙橡胶(EPDMEPDM)EPDM 是乙烯、丙烯和少量的非共轭二烯烃的共聚物,EPDM 密度通常在 0.85-1.20g/cm3之间,硬度通常在 40-90Shore A 之间,拉伸强度通常在 10-20MPa 之间,断裂伸长率通常在 200-600%之间。耐老化性:EPDM 具有优异的耐天候、耐臭氧、耐热、耐酸碱、70冷板液冷标准化及技术优化白皮书ODCC-2023-02004耐水蒸汽、颜色稳定性、电性能、充油性及常温流动性,在通用橡胶中其老化性能最好。适合环境温度-5080,在 120下可长期使用。EPDM 橡胶中的臭氧浓度在 50PPHM 和 30拉伸的条件下,150h 不破裂。电绝缘性能:EPDM 具有优异的电绝缘和耐电晕性能。其体积电阻率 1016cm,击穿电压 3040MV/m。介电常数也较低,特别是浸水后其电性能变化也很小,介电常数(1kHz,20)2.27。化学特性:EPDM 优越的抗侵蚀性能,可耐氟里昂及多种制冷剂,不适用于矿物油,是应用较广的密封材料。聚四氟乙烯(聚四氟乙烯(PTFEPTFE)PTFE 由四氟乙烯经聚合而成的高分子化合物,PTFE 具有很低的摩擦系数及不粘性,摩擦系数在已知固体材料中是最低的,耐强酸、强碱、强氧化剂,即使温度较高,也不会发生作用。PTFE 不吸水、不受氧气、紫外线作用、耐候性好。主要应用于大管径不锈钢管连接密封,适合环境温度-40100。氟橡胶(氟橡胶(FKMFKM)FKM 是由含氟单体共聚而成的有机弹性体。其特点耐高温,耐酸碱,耐油性,抗辐射、耐高真空性能好。缺点是加工性差,价格昂贵耐寒性差,弹性透气性较低。适合环境温度-10220。71冷板液冷标准化及技术优化白皮书ODCC-2023-02004表 5-4 密封件材料参数对比技术指标测试方法单位EPDMPTFEFKM物理性能比重ASTMD792g/cm30.91.911.04机械性能洛氏硬度 R 标尺ASTMD785/80100拉伸强度 23ASTMD638MPa208.9655弯曲强度 23ASTMD790MPa2517.285弯曲模量 23ASTMD790MPa0悬臂梁缺口冲击23ASTMD256J/m25026.775摩擦系数动态/0.15/摩擦系数静态/0.2/剪切强度ASTMD732MPa/17.2/压缩强度ASTMD695MPa/48.3/热性能热变形未退火 0.45MPaASTMD64880104130电气性能表面电阻ASTMD257/IE5IE15阻燃性能防火等级UL94/HBV-0HB注:数据来源于塑造物性表及中塑在线。72冷板液冷标准化及技术优化白皮书ODCC-2023-02004(四)(四)新材料管路设计制造及测试方法新材料管路设计制造及测试方法1.1.设计原则设计原则材料选择材料选择(1)设计温度下的抗拉强度、抗压强度、弯曲强度、剪切强度和弹性模量;(2)设计条件下的抗蠕变强度;(3)许用应力;(4)延伸率、塑性及热膨胀系数;(5)耐冲击性和冷热急变性;(6)操作中可能出现的温度极限及材料所能承受的温度范围;(7)熔化和气化转变温度;(8)气孔和渗透性;(9)接头连接方法及可靠性;(10)使用中损坏的可能性。温度及压力设计温度及压力设计设计压力应不少于 1.0MPa,设计温度应考虑介质温度、环境温度、阳光辐射等造成的苛刻温度。73冷板液冷标准化及技术优化白皮书ODCC-2023-02004密封设计密封设计非金属管道法兰管道与管道之间宜采用法兰连接,法兰应具有较好的密封面,选用适当的垫片及螺栓,使管路耐压达到设计要求。支撑件设计支撑件设计(1)管道应适当加以支撑,在管道与支架之间应放置厚度不小于 3mm 的衬垫。(2)管道的支撑、导向和固定方式应防止对管道的损坏。(3)支撑件宜设置在荷载集中处,管道上有过大荷载的阀门或管道附件应设支撑。(4)管道在架空敷设时不得利用管道自身刚度作为支撑结构。(5)可能产生振动的管道,应设置减振措施。布置布置(1)管道的布置应方便检修及更换管道组件。(2)管路布置时,应尽量使管道的膨胀收缩和其它原因产生的位移引起的应力达到最小值,以防止发生泄露、变形、破坏。(3)管路布置不应存在气袋,水袋和盲肠(图 5-1),如无法避免应必须设置措施。(4)管路设置足够的柔性或有效的补偿措施。(5)当管道沿建筑物或与其它管道平行、交叉时,其净距不应74冷板液冷标准化及技术优化白皮书ODCC-2023-02004小于 100mm。(6)布置在管沟的管道,管底距沟底净空不应小于 300mm。a 气袋b 口袋c 盲肠图 5-1 气袋,水袋和盲肠示意图2.2.管路制造管路制造非金属管路焊接建议使用红外线对焊焊接工艺和热熔焊接工艺,管路焊接采用红外线对焊工艺。3.3.测试测试管材测试管材测试应对管材的密度、硬度、导热系数、线性膨胀系数、拉伸强度、断裂伸长率、吸水率、熔点、介电常数、表面粗糙、表面电阻抗及体积电阻抗等物性参数进行测试,确认管材是否满足选型要求。管路测试方法管路测试方法(1)耐水压测试热熔焊焊接管道耐水压测试条件:水温 255,水压 1.6MPa,时间 30min。合格判据:管道及焊缝应无渗漏或变形。75冷板液冷标准化及技术优化白皮书ODCC-2023-02004红外线对焊焊接管道耐水压测试条件:水温 255,水压2.0MPa,时间 1min,水压 1.6MPa,时间 30min。合格判据:管道及焊缝应无渗漏或变形。(2)焊接强度测试测试条件:使用拉力机对焊接管道进行拉伸,拉至断裂,出现断口位置应为管道母体而非焊缝。合格判据:拉力应大于 38kN 范围内,且端口为管道母体。(3)高温测试测试条件:水温 94-100,水压 0.6MPa,持续循环时间30min。合格判据:水管无渗漏、无裂纹、无明显变形、焊缝无裂纹。(4)流量均衡性测试测试条件:将测试管路与动力单元连接,通过测试工装模拟被冷却器件阻力进行流量分配测试。合格判据:RCM 不均匀性10%;LCM 不均匀性10%。(5)高低温交变实验表 5-5 高低温交变测试条件试验参数试验条件试验参数试验条件高温循环温度80高低温排水时间210s76冷板液冷标准化及技术优化白皮书ODCC-2023-02004高温单次循环时间15min高低温切换时间1min低温循环温度5循环次数260 次低温单次循环时间15min验证试验1.6MPa 压力测试实验合格判据:水压 1.6MPa,时间 30min,管道及焊缝应无渗漏或变形。(五)(五)其它行业领域冷板液冷新材料应用其它行业领域冷板液冷新材料应用1.1.直流输电领域直流输电领域为保障绝缘性,直流输电换流阀冷却系统配水管路使用非金属材质,其中主管、层间管采用 PVDF 材质,分水管采用 FEP、PPH 或PVDF。图 5-2 FEP 在直流输电领域的应用77冷板液冷标准化及技术优化白皮书ODCC-2023-02004表 5-6 直流输电案例配水管路参数工程项目阀体压降bar管径阀模块连接方式材质允许流量L/min500kV 广西柳南3.45201.9串联PVDF18 281100kV古泉站3.3251.9串联PVDF25 45800kV 深圳东方2.73161.9并联PVDF816800kV 山东青州3.2161.9并联PVDF816800kV 巴西二期2.95161.9并联PVDF816320kV 厦门柔直2.73161.9并联PVDF816420kV 渝鄂柔直2.5161.9并联PVDF8162.2.静止无功补偿装置静止无功补偿装置 SVCSVC 冷却领域冷却领域为保障绝缘性,静止无功补偿装置 SVC 冷却设备阀厅配水管道多使用非金属管道,如 PPR、PPH、FEP、PA。案例介绍:项目地点:黑龙江建龙钢厂冷却对象:SVC散热功率:75kW78冷板液冷标准化及技术优化白皮书ODCC-2023-02004供液温度:2545冷却介质:46%纯水 54%乙二醇表 5-7 SVC 阀厅管路参数序号层级材质管道设计流量计算流速管路长度1阀厅主管路PPR内径 36.2mm8.5m/h2.29m/s20m2阀厅支管路PPR内径 18.0mm8.5m/h3.09m/s3m图 5-3 SVC 阀厅管路3.3.储能领域储能领域随着储能系统容量的提高,电池发热密度随之增加,液冷技术凭借其优良的散热和均温能力成为储能热管理系统发展方向。因 PA管优良的弯曲性能和轻便性,且相较于其它管路材质成本优势巨大,成为储能液冷管路的优选材质。(1)(1)深圳某新能源公司储能项目深圳某新能源公司储能项目项目地点:广东肇庆79冷板液冷标准化及技术优化白皮书ODCC-2023-02004冷却对象:储能电池簇电池数量:48电池簇数量:8供液温度:183冷却介质:50%纯水 50%乙二醇表 5-8 储能配水管路参数序号层级材质管道设计流量计算流速管路长度1第一级管路SUS304内径 47.3mm11.52m/h1.78m/s12.4m2第二级管路PA内径 14.0mm11.52m/h2.52 m/s4.8m3第三级管路PA内径 12.0mm11.52m/h0.59 m/s1.0m图 5-4 储能电池簇及配水管路80冷板液冷标准化及技术优化白皮书ODCC-2023-02004(2)(2)内蒙古兴和五股泉风储电站内蒙古兴和五股泉风储电站 150MW/300MWh150MW/300MWh 储能项目储能项目项目地点:内蒙古兴和县五股泉乡项目时间:2023 年 1 月 12 日并网项目规模:150MW/300MWh液冷方案组成:液冷机组(风冷 CDU)、液冷管路、快速接头风冷 CDU 制冷量:40kW(图 5-5 左)液冷管路材质:PA&SUS304(图 5-6)冷板液冷方案优势:英维克提供整体液冷解决方案,液冷机组、液冷管路、快速接头,减少用户交付界面;液冷系统具备智能排气、自动补液功能,缩短调试运维时间;配置有自密封接头,实现单电池包维护,电池包更换更安全、环保。图 5-5 内蒙古兴和五股泉风储电站储能项目现场81冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 5-6 液冷管路材质:PA&SUS304(六)(六)数据中心新材料应用案例数据中心新材料应用案例1.1.国内数据中心案例国内数据中心案例目前国内二次侧管路主要采用不锈钢材质,但也有个别新材料的探索,下面分享两个国内案例。(1)(1)新疆克拉玛依某数据中心新疆克拉玛依某数据中心新疆克拉玛依某数据中心采用 PPH 作为二次侧管路材质进行了冷板液冷尝试,该项目已于 2022 年 1 月投产。IT 规模:40MW单机柜功率:30kW二次侧供回液温度:40/48二次侧冷却介质:去离子水 药剂一次侧冷却介质:去离子水 药剂,辅助电加热项目特点:二次侧 LCM 采用 PPH 材质。其中阀门的过流部件材质均为不锈钢,直管道三通弯头变径采用 PPH 材质,可以在法兰及82冷板液冷标准化及技术优化白皮书ODCC-2023-02004螺纹结构上可以实现尺寸兼容,敷设方式包含架空及地面支撑两种方式。PPH 管道比不锈钢管的表面粗糙度更低,水阻力更小。图 5-7 新疆克拉玛依某数据中心项目现场(2)(2)常熟某数据中心常熟某数据中心江苏常熟某数据中心率先在国内采用阔盛 PPR 蓝管作为冷板液冷二次侧管路材质进行实践,该项目将于 2023 年 9 月投产。单机柜功率:8kW一次侧进出水温度:35/40二次侧供回液温度:40/45二次侧冷却介质:去离子水 丙二醇一次侧冷却介质:20%乙二醇溶液项目特点:其中阀门的过流部件材质均为不锈钢,采用工厂预制化,现场拼装的方式。管道与管道、管道与阀门之间采用法兰连接,且在法兰上实现尺寸兼容,敷设方式为地面支撑。阔盛 PPR 蓝83冷板液冷标准化及技术优化白皮书ODCC-2023-02004管的管道摩擦系数为 0.007,低于不锈钢管道。图 5-8 常熟某数据中心项目现场2.2.国外数据中心案例国外数据中心案例国外超算普遍采用 CoolIT 的 SVF 解决方案,采用阔盛的 PPR 管。图 5-9 CoolIT SVF 工程现场其优势主要体现在以下 7 个方面:施工效率提升 1/3:管道采用热熔连接,连接速度和效率远高于不锈钢管,安装效率提升,施工成本降低。可靠性高:PPR 材料耐腐蚀,寿命可达 50 年以上,减少 LCM84冷板液冷标准化及技术优化白皮书ODCC-2023-02004更换成本;同时,热熔方式可免除密封圈的使用,无需考虑老化失效问题,提升整体可靠性。安装要求低:熔接质量依靠工具和设备,对施工人员工艺技术水平相比不锈钢焊接要求低。施工安全:现场无需动火,无火灾风险。重量轻:重量比钢管减少 3/4 以上,可有效降低建筑称重要求,提高搬运效率,降低搬运成本。低碳环保:阔盛 PPR 管道比不锈钢管可减少 5070%碳排放,且可完全回收。表面粗糙度低:减少循环泵阻力。(1)(1)SummitSummit supercomputersupercomputer项目地点:美国田纳西州奥克里奇国家实验室(Oak RidgeNational Laboratory 简称 ORNL)投产时间:2018 年 6 月单柜功率密度:50kW机房:9000 平方英尺,其中机柜占地 5600 平方英尺,260 个柜子,每柜可容纳 18 个计算节点(2U 服务器)。服务器:IBM AC922 系统,搭载 27000 Novia Volta GPUs 和9000 IBM Power9 CPUs,用于 AI 计算和科学探索。85冷板液冷标准化及技术优化白皮书ODCC-2023-02004自然冷设计时长:全年 75%时间。LCM:阔盛蓝管 PPR,位于机房顶部。二次侧泵:变频,3 台,N 1 配置,单台最大流量约 11000L/min。图 5-10 美国 Summit 超算现场图 5-11 二次泵冷却板换:不锈钢可拆卸板换,二次侧供液温度 21。86冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 5-12 冷却板式换热器(工艺冷媒和冷却水)图 5-13 冷冻板式换热器(工艺冷媒和冷冻水)空气冷却方式:水冷背板门。图 5-14 水冷背板门空气冷却二次侧过滤器:过滤精度 1m,过滤流量约 19000 L/min。图 5-15 二次侧过滤器动力变压器:1500kVA,1 1 备份,布置在设备间。87冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 5-16 动力变压器一次侧冷却塔规格:4 台*5000kW 1500t。图 5-17 冷却塔(2)(2)MagmaMagma supercomputersupercomputer项目地点:美国加利佛尼亚州劳伦斯利弗莫尔国家实验室(Lawrence Livermore National Labs,简称 LLNL)投产时间:2020 年初服务器:Intel Server System S9200WK,搭载 Intel XeonPlatinum 9242 处理器(760 个计算节点)和 Intel Xeon Platinum8000 处理器(12 个基础设施节点),用于模拟 2D 和 3D 物理系统(流体动力学、材料科学、分子动力学等)的参数研究。88冷板液冷标准化及技术优化白皮书ODCC-2023-02004液冷解决方案供应商:CoolIT Systems Rack DCLCLCM:阔盛蓝管 PPR图 5-18 Magma 超算现场89冷板液冷标准化及技术优化白皮书ODCC-2023-02004六、六、冷板液冷新技术展望冷板液冷新技术展望(一)(一)负压冷板液冷技术负压冷板液冷技术1.1.技术背景介绍技术背景介绍(1)随着以英伟达 A100/800、H100/800.GH200 为代表的高功率 GPU 已经成为数据中心市场新的发展趋势,同时,伴随着英伟达预计在 2025 年 Q2Q3 季度推出 Miranda(Hopper next)平台,将主推冷板液冷冷却方案。(2)GPU 的价格偏高,传统冷板液冷的可靠性问题被日渐重视,急需寻找新的更可靠的技术(即使 Capex 有所上升亦可能被接受),确保 GPU 的安全运行。基于以上两点,新的更安全的冷板液冷方案(如,负压液冷、氟化物相变液冷)将成为未来有潜力的技术新星。2.2.负压负压 CDUCDU 技术原理技术原理美国 Chilldyne 公司设计的 Cool-Flo 系统中的 CDU,具有以下特点(图 6-1,图 6-2):(1)有三个气密性较好的液腔,分别是主真空腔、储液腔、辅真空腔;主真空腔和辅真空腔交替保持高真空度确保工艺冷媒从服务器冷却环路流回,储液腔保持较低的真空度使工艺冷媒流进服务器冷却环路。90冷板液冷标准化及技术优化白皮书ODCC-2023-02004(2)二次泵采用低扬程潜水泵,安装于储液腔内部,该水泵流量可达 300L/min,当检测到二次侧供液温度低于机房的露点温度时,潜水泵将停止工作以确保不会有凝露产生。(3)配有真空泵等负压系统(包含气液分离器、消音排气口,空气流量传感器),用以保证三个腔体的真空度,最大真空度为-74.5kPa,最小真空度为-33.9kPa,真空泵的流量是液体流量的 5 倍,可长期运行在 80%转速,且可耐受常温清水。(4)三个腔体各配有两个气动开关阀,一个接通真空泵,另一个接通大气相连的气液分离器,用于控制各个腔体的真空度,以确保液体顺利循环。(5)配有为上述气动开关阀提供动力的空压机。(6)配有水处理添加剂储液罐以及对应控制电动球阀,自动补水阀和排水阀。图 6-1 Cool-Flo 系统原理图91冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 6-2 CDU 部件位置示意图循环过程:循环过程:工艺冷媒从储液腔抽出来,并对主真空腔抽真空(开启主真空腔与真空泵间的气动阀),通过服务器后进入主真空腔,当主真空腔几乎充满时,CDU 在辅真空腔抽真空(关闭主真空腔与真空泵间的气动阀,并开启辅真空腔与真空泵间的气动阀),并允许主真空腔内的工艺冷媒流入储液腔(开启主真空腔与气液分离器之间气动阀)。当辅真空腔充满时,循环往复;通过交替对主真空腔和辅真空腔施加真空,确保 CDU 产生稳定的水流量(图 6-3)。如果出现泄漏,漏点会将空气吸入到真空泵,通过气液分离器和消声器排出系统。即使与服务器的连接断开,也不会影响系统运行。92冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 6-3 真空腔示意图3.3.负压液冷系统方案技术亮点负压液冷系统方案技术亮点(1)出现漏点仍安全运行出现漏点仍安全运行:Chilldyne 负压液冷系统中的工艺冷媒循环管路始终保持负压,而其周围环境的空气为正常大气压,在服务器的供液或回液接管可能意外断裂或从接头处脱落的情况下,只有环境的空气被吸入液冷系统,称之为漏气,而工艺冷媒不会向外泄漏,此时 Chilldyne 负压液冷系统仍可运行。与服务器连接的供液软管(浅蓝色)上装有一个限流止回阀,回液软管(粉红色)上装有一个文丘里声波限流器(见图 6-4),一旦服务器有漏气的现象发生,止回阀和限流器将限制环境空气被吸入服务器机柜的供液分水器和回液集水器。在正常运行情况下,供液软管上止回阀的压降约为 340Pa,回液软管上声波限流阀的压降约为 3400Pa。在有漏气的情况下,限流止回阀能够将吸入供液分水器的环境空气流量限制在 2.0 L/min,这会导致位于发生漏气的服务器其下游服务器的工艺冷媒中出现一些气泡,最终结果是下游服务器温度可能上升1-3,但系统仍然可以对除有漏气的服务器以外的所有服务器继93冷板液冷标准化及技术优化白皮书ODCC-2023-02004续进行液冷,而有漏气的服务器可以利用空气冷却获得适度的冷却(如果冷板带有空气冷却翅片的话)。在回液软管一侧,文丘里声波限流器将吸入的气流限制在大约 10 L/min,这是因为在文丘里声波限流器中最狭窄的通道处气流不能再被压缩,因而流量受到限制。图 6-4 负压系统服务器进出分支软管(2)无需关断阀和无需关断阀和 QDCQDC:负压意味着可以在液冷系统运行的同时进行水管连接,且不会发生泄漏,并保持系统正常的冷却功能。因此,在工艺冷媒水管与机柜连接处不需要安装关断阀和 QDC。(3)服务器维护更省心服务器维护更省心:可以利用负压排空服务器内部冷板系统的水:当需要排空时,略微松开连接器使工艺冷媒自动从服务器中排出。服务器未连接到外部液冷系统时其内部冷却系统处于无水状态。对机柜中任何服务器进行排空操作后,即可将此服务器从机架上移出。(4)无活塞真空泵技术:无活塞真空泵技术:独有专利技术,利用气液分离器分离出的工艺冷媒密封,水封不会产生磨损。94冷板液冷标准化及技术优化白皮书ODCC-2023-02004(5)完备的控制系统完备的控制系统:控制进出口压差恒定,从而确保服务器末端变化情况下各服务器流量稳定。可远程实现注水、运行、补水、排水操作,实时计算消除的热量、露点温度、一次侧水流量等信息。(6)故障自动切换阀故障自动切换阀:自带控制系统,如果检测工艺冷媒流量过低或者温度过高后,自动切换负载到备用 CDU,同时支持手动自动切换,远程 SNMP 监控。图 6-5 故障自动切换阀(7)冷却液水质自动监控系统冷却液水质自动监控系统:机组内置冷却液添加剂储液罐,通过 TDS 感应器监测冷却液的水质,系统自动判断并实施对冷却液水质的调整,向系统注入添加剂或置换部分冷却液。4.4.应用案例应用案例美国能源部 Sandia Manzano 超算中心(图 6-6),采用负压冷板液冷技术,该项目已于 2021 年投产。由于负压 CDU 的扬程有限,因此对二次侧系统进行了详细的压降核算(表 6-1),CDU 入列布置(图 6-7)。单机柜功率:35kW,气液比:2:395冷板液冷标准化及技术优化白皮书ODCC-2023-02004机柜数量:24冷板热阻:0.085/W0.2L/minCDU 换热量:300kW,热备 170kW(每个 CDU 对 8 个柜),2 1 备份(图 6-8)CDU 提供有效压头:平均 37.25kPa,最大 57.56kPa200 L/min一次侧进出水温度:22/39二次侧供回液温度:24/38图 6-6 美国能源部 Sandia Manzano 超算中心表 6-1 各部件压降清单部件名称流量 L/min压降 kPa服务器0.412.87文丘里节流器0.43.39限流器止回阀0.40.3496冷板液冷标准化及技术优化白皮书ODCC-2023-02004机柜分水器24.81.691 英寸三通24.80.341 英寸直径软管(3m)24.81.021.25 英寸三通49.60.681.25 英寸直径软管(3m)49.61.35故障切换阀99.20.342 英寸直径软管(12m)99.26.77合计28.79图 6-7 项目机柜布局图97冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 6-8 项目冗余方式示意图(二)(二)相变冷板冷却技术相变冷板冷却技术如第六章第(一)节所说,氟化物作为工艺冷媒会有效提升冷板液冷系统可靠性(如泄漏为气态且不导电,不会危及服务器安全),同时,由于部分氟化物沸点较低,在冷板内吸收热量后蒸发汽化,大大提升冷板的散热能力,该技术可称为冷板液冷相变冷却技术。关于氟化物的选择,根据英伟达的资料,包括 R134a、R513A、R515B、R471A、R1233zd、R1234yf、3M Novec 系列 HFE-7000 均可使 用。根 据 介 绍,R134a 用 于 相 变 冷 板 方 式,可 解 决2.5kW/GPU,175kW/Rack 的散热,最大可支持 8 W/(cm2)的解热能力。关于该方案,有很多不同的演化:1.1.重力热管方案重力热管方案该方案可支持 100kW/柜的超高功率密度需求,PUE 可低至 1.07,该方案无需泵输配,利用热管原理,仅靠温度差驱动氟化物循环。无运动部件,且氟化物免维护,可靠性更高,极适合边缘计算场景。98冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 6-9 SEGUENTE 重力热管方案示意图2.2.动力热管方案动力热管方案英伟达(图 6-10)和国内厂商也有带制冷剂泵驱动的动力热管解决方案出现,这种方式可以使散热器与机柜的相对位置更加灵活,甚至可以支持多机柜的多联系统。但是目前都属于预研阶段,商业化程度还相对较低。图 6-10 动力热管相变冷板液冷示意图(三)(三)冷板液冷气冷板液冷气-液混合技术液混合技术关于空气冷却和液冷的混合应用也越来越被广泛关注,成为未来新的热点之一。混合的原因大多出于以下几种情况:99冷板液冷标准化及技术优化白皮书ODCC-2023-02004(1)老旧机房改造,希望原有空气冷却空调设备可以继续利用;(2)新建机房管综和地板下空间有限,冷板液冷的一二次管路占据空间,无法再进行冷冻水系统水管布管;(3)安装室外机(包括液冷的干冷器/冷却塔,空气冷却的冷凝器/冷却塔等)的空间位置受限,希望可以将空气冷却和液冷的室外机进行合并,可弹性适配不同气液比场景。基于以上三种情况,本文分别给出了相应的解决方案:1.1.风冷风冷 CDUCDU基于上述(1)场景,国外很早就有对应的解决方案,即将 CDU 的一次侧由水冷改为风冷,用空气-水换热器(如翅片铜管换热器,微通道换热器)代替传统的水-水换热器(钎焊式板式换热器)。比如,CoolIT 推出了 AHx 系列的 CDU 产品,制冷量从 2100kW,TOP-C 提供的可支持 110kW 的机柜式 CDU(图 6-12)。图 6-11 CoolIT 发布的 AHx 系列产品(从左到右制冷量依次为 2kW、10kW、100kW)100冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 6-12 TOP-C 风冷 CDU 示意图此外,浪潮也有多种型式的方案,主要有以下 3 种形式:一体式、机架式、背板门式。一体式是通过冷板将服务器的电子元器件热量传导到工艺冷媒中,通过循环泵循环到服务器内的冷排散热器,由设备出风对其进行散热降温,保障电子设备运行在适宜工作温度。图 6-13 给出了一体式风冷 CDU 示意。图 6-13 一体式风冷 CDU 示意101冷板液冷标准化及技术优化白皮书ODCC-2023-02004机架式风冷CDU由机柜系统、风液式冷量分配单元、工艺冷媒供回歧管、服务器冷板、管路辅助系统等组成。通过气-水换热器及风扇将热量排放到机柜外。系统实现工艺冷媒的温度和压力控制和监测,实现液冷服务器的散热需求。图6-14给出了机架式示意。图 6-14 机架式风冷 CDU 示意图背板门式风冷 CDU 将液冷服务器(CPU、GPU 等发热器件),通过液冷冷板,将加热的高温工艺冷媒,循环到背板门换热器进行散热,冷却后的工艺冷媒再通过泵组送回给液冷服务器冷板给电子器件散热。图 6-15 给出了背板门式示意。图 6-15 背板门式风冷 CDU 示意102冷板液冷标准化及技术优化白皮书ODCC-.2.气气-液组合末端液组合末端基于上述(2)场景,OCP 已经提出对应的解决方案:如图 6-16所示,用冷冻水背板门的型式和机架式 CDU 串联,27供水先过水冷门进行空气冷却,被水冷门加热到 34的温水再进入 CDU 进行液冷一次侧散热,44的热水再返回冷源进行冷却。图 6-16 空气冷却&液冷组合末端示意图113.3.气气-液同源冷源液同源冷源基于上述(3)场景,国外很早就有对应的解决方案:Nortek 采用微孔疏水隔膜蒸发(Microporous Hydrophobic Membrane)的SPLC(StatePointTMLiquid Cooling)冷水机组,它可以有效将循环水与室外空气隔离,同时实现近露点温度的冷水机组。但是,它只能提供高于当地空气露点温度的水温。103冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 6-17 微孔疏水隔膜蒸发原理图 6-18 Nortek SPLC 冷水机组适配末端示意图图 6-19 Nortek SPLC 冷水机组器件示意图秦淮数据创新性开发的复合蒸发冷水机组,通过间接 直接蒸发的复合蒸发冷却,可实现近露点温度供水。该产品目前已实际应用投产 74 台。104冷板液冷标准化及技术优化白皮书ODCC-2023-02004图 6-20 秦淮数据拥有自主专利的复合蒸发冷水机组以上两种方案的出水温度无法满足空气冷却要求,因此还需要额外配置带压缩机的冷水机组进行补充制冷。目前,新的融合 DX 制冷的集成式冷水机组已在 ODCC 立项。105冷板液冷标准化及技术优化白皮书ODCC-2023-02004参考文献参考文献1 李洁.液冷革命M.北京:人民邮电出版社,20192 中国通信标准化协会.YD/T 3980-2021 数据中心冷板式液冷服务器系统技术要求和测试方法S.北京,20213 ASHRAE Technical Committee 9.9.Emergence and Expansion of LiquidCooling in Mainstream Data CentersR.20214 中国移动通信集团有限公司等.电信运营商液冷技术白皮书(2023 年)R.北京,20235 ASHRAE Technical Committee 9.9.Liquid Cooling Guidelines forDatacom Equipment Centers(Second Edition)M.20146 Philip Yu,Sean Barlett.Fluid Serviceability and MaintenanceWorkstream for Cold Plate-Based Liquid CoolingC.OCP,20227 郭亮等.液冷(冷板式)技术要求R.北京,20188ASHRAETechnicalCommittee9.9,Water-CooledServersCommonDesigns,Components,and Processes M.20199 Intel 绿色数据中心创新实践 冷板液冷系统设计参考R 202210ASHRAEThermalGuidelinesforDataProcessingEnvironments(Fifth Edition)M 202111 Juan Carlos Cacho Alonso,Jabari George.White Paper:Evaluatinglimits of Door HX solutions in different applications C.OCP,2022

    浏览量0人已浏览 发布时间2023-11-29 115页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 中国移动研究院:通过总线技术实现数据中心级“先进封装”(2023)(14页).pdf

    演讲人:李锴演讲单位:中国移动研究院图片来源:AMD 在Chiplet条件下,Intel、AMD、Arm、Hygon等处理器的核心数量不断增加,通用服务器算存比没有大幅波动情况下,对服务器内存容量需求大幅提升;Intel Sapphire Rapids 提供多达60个内核,120线程,8个内存通道AMD Genoa 提供多达128个内核,256线程,12个内存通道图片来源:Intel不断增加的核心数量进一步提升了算力能力,与此匹配的服务器内存需求也同步匹配新一代人工智能依赖数据、算法和算力,然而,当前AI硬件的算力增长远远超过内存发展速度,导致原有内存的分层架构效果无法完全满足现在业务需求;在边缘场景下,海量、高维模型、稀疏特征数据需要强大的内存支持系统来实现更好的在线推理能力;在大模型的训练和推理场景,GPU/AI卡的显存或内存容量不足,呈现出明显的内存墙问题。这些数据的高维、稀疏特征又为计算和存储带来了很大的挑战,隐藏层大小可能就是数百万的量级,总参数量甚至能达到十万亿的量级,对显存/内存需求大训练、推理场景在应用需求对大内存迫切性增加需要通过芯片层级的架构改进来缓解内存墙瓶颈,例如将内存堆叠在逻辑芯片上,使内存更靠近处理器,从而更近、更快且更容易访问数据,无论在是通用计算还是智算都殊途同归;来源:AMD来源:NVIDIA来源:TSMC处理器内存加速器传统计算架构处理器内存加速器芯片级共封装内存内存芯片内部正在使内存更接近逻辑和加速器,内存将不是通过 PCB 连接的,而是放在封装之中,CPU和加速器的速度更快、性能更高同封装同封装面向大模型的训练、推理场景,单机8卡已经不能单纯作为单台服务器的边界,需要构建更大型的超级计算机提高计算效率和能力,通过实现计算架构的改进,以确保其满足算、存要求,使数百级别处理器进行总线级互联;做为另外一种“先进的封装技术”,其规模已扩大至数据中心,总线连接可被视为中介层;传统数据中心S架构数据中心处理器内存a-b加速器处理器内存b-c加速器处理器内存c-d加速器处理器内存d-e加速器交换机、路由器处理器内存a-e加速器处理器内存a-e加速器处理器内存a-e加速器处理器内存a-e加速器总线总线总线总线总线互联Server1Server2Server3Server4Super Server(S)实现总线互联的数据中心“先进封装”PCIe连接CXL连接当前业界有多种通过总线技术实现拓展带宽的技术,并将CPU、GPU、存储介质等异构部件实现全连接,增加缓存一致性、纳秒级时延、百处理器级别的技术能力,力争通过总线技术将大规模的存、算融为一体;PCIe/CXL、Nvlink、CCIX、AMBA等技术正在加速演进;总线协议CXL/PCIe 5.0NVLINK 4.0速率PCIe 5.0 32GT;PCIe 6.0 64GT;100Gbps;开放性开放封闭中国移动正在密切探索包括CXL在内的多种总线技术,目的统一异构部件的算力和存储资源,实现大带宽芯片连接;当总线可以实现多种应用场景,从现实需求的优先级来说,建议在构建统一内存池和GPU/AI芯片层级的总线互联进行同步推进;内存池可以实现处理器和内存设备之间的缓存一致性访问,扩大内存容量和带宽;0 01 12 23 34 45 5.N N一组有一组有N N张张GPUGPU/AI/AI卡卡0 01 12 23 34 45 5.N N一组有一组有N N张张GPUGPU/AI/AI卡卡计算总线总线总线 SwitchSwitch总线总线 SwitchSwitch总线总线SwitchSwitch总线总线 Switch Switch总线总线 Switch Switch总线总线 Switch Switch总线总线 Switch Switch更低延迟的内部通信更高效的数据读写更灵活的拓扑连接推进GPU/AI芯片层级的总线互联通过探索包括CXL在内的总线级内存池;新型总线的卡间互联模式,形成技术突破和应用推进总线互联的内存池0 01 12 23 34 45 5.N N多多ServerServer共享存储共享存储资源资源0 01 12 23 34 45 5.N N多多ServerServer共享存储资源共享存储资源总线总线 Switch Switch总线总线 Switch Switch总线总线 Switch Switch总线总线 Switch Switch计算总线ServerServerServerServerServerServer更灵活的存储结构更高效应用开发更多样的存储介质本次项目关注点SSDSSDSSDSSDSSDSSDSSDSSDSSDSSDDDRDDRDDRDDRDDRDDRHBMHBMHBMHBMHBMHBMType 1:主要用于连接处理器和SmartNic等加速器,以提高处理器的转发效率性能;Type 2:主要用于连接处理器、GPU等加速器和内存,以提高多处理器对内存的使用,提升多处理器协同效率。Type 3:主要用于连接处理器和扩展内存,以满足内存带宽和容量的拓展加速器加速器主机主机CXL.ioCXL.cacheDDRDDRDDRDDRDDRDDRCacheCache加速器加速器主机主机CXL.ioCacheCacheCXL.memCXL.cacheDDRDDRDDRDDRDDRDDR加速器加速器主机主机CXL.ioCacheCacheCXL.memType1Type2Type3允许加速器访问和缓存主机连接的DDR内存允许加速器访问和缓存主机连接的DDR内存允许主机访问加速器的易失性(RAM)和持久性非易失性(闪存)存储允许主机访问加速器的易失性(RAM)和持久性非易失性(闪存)存储SmartNICGPU/AIExpandor提供新型计算模型的解决方案,为云计算和数据中心提供更高的数据速率、更高的带宽和容量适用于多种类型存储器的通用标准接口,可以为系统灵活的利用DRAM、LPDDR等不同内存介质性能增强容量增大寄存器CacheDDR通过总线技术实现拓展MemorySSDHDD可以灵活地添加各种内存,而不会影响本机连接的 DIMM内存可以针对系统成本、容量、功率、带宽进行独立优化NVMe1ns10ns100ns250ns400ns10-40us3-10ms附加到CPU独立于CPU磁盘CPUDRAMDRAMDRAMDRAMDRAMDRAMDRAMDRAM(a)非总线场景CPUDRAMDRAMDRAMLPDDRNVMe(b)总线场景内存技术CXL等以CXL等总线级技术不仅提供了高速传输,还支持内存共享和虚拟化,使设备之间的协作更加紧密和高效。通过带宽提升、多样性存储介质有助于满足现代数据中心对大规模处理和分析的需求,同时也能够为 AI、机器学习等新兴应用提供更好的支持,从整体上降低TCO带宽带宽当前CXL 基于PCIe 5.0接口,支持32GB/s 的双向传输速率;通过利用主机处理器通过总线连接到各种内存接口来实现内存介质独立性;内存控制器可以设计为支持不同的内存类型,DDR4、DDR5 甚至持久内存或存储类内存;内存带宽提升内存带宽提升0101多样多样运行程序可在持久存储中,服务器断电内存数据不丢失;总线级互联可直接连接CPU和设备,共享内存空间,避免了多个接口之间的通信开销;可实现内存扩展和内存共享,包括非易失性存储介质,使得业务可以快速恢复;多样性存储多样性存储介质介质0202成本成本通过内存扩展器(Memory Expander)来增加 DRAM 的容量,可以在不改变系统结构的情况下,提高内存的可用性和灵活性。内存控制器提供的灵活性为提供比传统 DIMM 更精细的容量粒度提供了选择,允许系统实施者调整内存容量以适应其应用并降低成本;内存成本降低内存成本降低0303主机主机CPUCPU总线内存总线内存扩展器扩展器内存控制器内存内存一、本地内存主机主机0 0Multi PortMulti Port内存扩展器内存扩展器内存控制器1二、内存池化内存控制器2主机主机1 1主机主机2 2主机主机3 3总线Link总线Links三、Switch的全内存池化主机主机0 0总线总线SwitchSwitch主机主机1 1主机主机2 2主机主机3 3总线Links总线总线SwitchSwitch总线总线SwitchSwitch总线总线SwitchSwitch总线Links主机主机4 4主机主机5 5主机主机6 6主机主机7 7总线Links总线Links内存控制器内存控制器总线级互联可以在本地系统内实现内存扩展,实现允许跨多个主机池化/共享内存,增加Switch架构后可实现更多主机内存的池化;当前利用CXL是实现总线在内存池化的有效方法之一;在用户空间,总线连接的优化包括利用用户级驱动程序,最大程度发挥总线的高带宽和低延迟特性;在内核空间,需实现高效的内核模块,以确保CXL设备的无缝集成和高性能操作;对于BMC,应加强安全机制,确保总线在数据传输的安全性,同时整合远程监控和故障诊断功能以提高管理效率。软件层硬件层BMC管理userspaceuserspacekernelkernelCXL应用层软件优化用户调用、调度cxl相关的lib库CXL内核空间cxl EventMgt是一种用于管理CXL事件的软件组件,EventMgt还提供了一种机制,用于将事件传递给其他CXL驱动程序或内核组件;cxl Primary mailbox软件接口;CCI接口,提供接收cxl命令PCIe物理层DriverPrimary/Secondary/OOBCXL Type3 CCII2C/PCIe/CXL DriverAPI配置管理;探测技术;Web UI配置、事件、日志;监控;CXL lib库CXL内核空间cxl EventMgtcxl Primary mailbox软件接口;CCI接口,提供接收cxl命令MCTP Driver、I2C Driver主机BMC CXL Type3CCIPCIeI2C利用CXL等总线级技术提供内存拓展、分层、池化等多种能力,推动形成内存架构优化机会,实现内存即服务的能力;在拓展、分层、池化等多个层面进行优化,提供统一的MaaS服务能力;内存扩展提供了更高带宽和更大容量的内存解决方案,提供了存储资源扩展。内存扩展内存分层将cache、DRAM、NAND等多种存储和计算资源进行有效整合,提高数据处理效率。内存分层内存设备连接在一起,实现缓存一致性、低延迟和高带宽的数据传输。内存池化非易失持久内存利用持久内存介质来实现数据的持久性存储,同时通过CXL协议与处理器进行连接和访问。持久内存近存计算可通过CXL EP就近对CXL内存中的数据进行距离计算,把计算结果送到本地内存中,这样减少数据传送。近存计算在CXL技术中,Memory as a Service是一种内存服务模式,允许内存资源在多个处理器之间动态分配和释放,提高内存的资源利用率,降低TCO,增加灵活性和可用性。Memory as a service新池化新池化总线总线总线总线层级内存池化架构设计原则层级内存池化架构设计原则 可扩展性原则可扩展性原则 性能优化原则性能优化原则 总线级内存池化服务器设计总线级内存池化服务器设计要求要求 服务器硬件架构要求服务器硬件架构要求 服务器拓展服务器拓展expanderexpander规格规格等要求等要求 制定制定总线级总线级内存池化服务器设计标准内存池化服务器设计标准总线级总线级内存池化架构设计内存池化架构设计 内存池化架构的组成和功能内存池化架构的组成和功能 内存池化架构的接口和通信协议内存池化架构的接口和通信协议 内存池化架构的数据管理和调度策略内存池化架构的数据管理和调度策略总线级内存池化服务器总线级内存池化服务器实践实践 根据服务器拓展内存池系统根据服务器拓展内存池系统需求,细需求,细化内存池方案化内存池方案设计;设计;对内存池与整机进行适配对内存池与整机进行适配调优;调优;优先基于在CXL等总线协议分解内存需求,将内存资源从单个服务器中进行解耦,并在多服务器之间动态分配和共享。这种模式可以提高内存资源的使用效率,增加内存的利用率、灵活性和可用性;希望联合整机、部件、芯片、应用等相关单位,一同推动总线级内存池化架构设计规范,为计算产业转型升级助力;共内存共内存

    浏览量0人已浏览 发布时间2023-11-27 14页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 中国软件行业协会:2022版中国软件根技术发展白皮书-操作系统册(65页).pdf

    中国软件根技术发展白皮书(操作系统册)中国软件行业协会目 录前言.1一、操作系统概述.3 (一)操作系统定义.3 (二)操作系统分类.4 1.服务器操作系统.5 2.桌面操作系统.5 3.移动操作系统.5 4.云操作系统.6 5.嵌入式操作系统.7 6.物联网操作系统.7二、国产操作系统发展形势分析.9 (一)操作系统行业发展现状.9 1.微软 Windows 在桌面和服务器领域占据统治地位.9 2.谷歌 Android 和苹果 iOS 在移动领域形成双寡头垄断.11 3.巨头围猎云操作系统,技术功能各具特点.12 4.嵌入式操作系统相对分散,发展潜力巨大.13 5.物联网操作系统尚处起步发展阶段,呈现碎片化形态.14 (二)国产操作系统发展趋势.15三、服务器操作系统产业分析.17 (一)中国服务器操作系统市场竞争格局.17 1.主流厂商行业应用领域.17 2.主流厂商的市场占有情况.17 (二)主流厂商的技术路线和发展策略.18 1.主流厂商的技术特点.18 2.主流厂商的生态建设.19 3.主流厂商在我国的发展策略.20四、桌面操作系统产业分析.22 (一)中国桌面操作系统市场竞争格局.22 1.主流厂商的行业应用领域.22 2.主流厂商的市场占有情况.22 (二)主流厂商的技术路线和发展策略.23 1.主流厂商的技术特点.23 2.主流厂商的生态建设.24 3.主流厂商在我国的发展策略.25五、移动操作系统产业分析.27 (一)中国移动操作系统市场竞争格局.27 1.主流厂商的行业应用领域.27 2.主流厂商的市场占有情况.27 (二)主流厂商的技术路线和发展策略.28 1.主流厂商的技术特点.28 2.主流厂商的生态建设.29 3.主流厂商在我国的发展策略.31六、云操作系统产业分析.32 (一)中国云操作系统市场竞争格局.32 1.主流厂商的行业应用领域.32 2.主流厂商的市场占有情况.33 (二)主流厂商的技术路线和发展策略.33 1.主流厂商的技术特点.33 2.主流厂商的生态建设.34 3.主流厂商在我国的发展策略.35七、嵌入式操作系统产业分析.37 (一)中国嵌入式操作系统市场竞争格局.37 1.主流厂商的行业应用领域.37 2.主流厂商的市场占有情况.37 (二)主流厂商的技术路线和发展策略.38 1.主流厂商的技术特点.38 2.主流厂商的生态建设.39 3.主流厂商在我国的发展策略.40八、物联网操作系统产业分析.41 (一)中国物联网操作系统市场竞争格局.41 1.主流厂商的行业应用领域.41 2.主流厂商的市场占有情况.42 (二)主流厂商的技术路线和发展策略.44 1.主流厂商的技术特点.44 3.主流厂商在我国的发展战略.47九、国产操作系统发展面临的挑战和对策建议.48 (一)面临的挑战.48 1.操作系统领域主流厂商的市场优势地位难以撼动.48 2.基础理论和技术研究缺乏体系性、高强度、持续性投入.48 3.应用软件开发支持不足,生态建设相对滞后.50 4.缺乏灵魂人物、专业人才及稳定开发团队.51 5.国家支持国产操作系统发展政策比较分散.52 (二)发展机遇.52 1.中国市场规模应用潜力巨大.52 2.国际局势变化引发操作系统供应链安全担忧.53 3.国产操作系统发展具备基本条件.53 4.政府出台政策支持操作系统发展.55 5.国内厂商积极布局构建生态体系.56 (三)对策建议.57 1.加大原始技术创新与积累.57 2.加快制定行业标准统一技术要求.57 3.鼓励支持软件产品批量化应用.57 4.完善行业治理和优化价值评估.58 5.重视推进国产操作系统进课堂.58 6.构建多链条开源生态和纵深防御体系.59 7.发动产业资源优化营商环境.601软件产业体系中,软件根技术是处于整个产业链最底层的技术簇,就像植根于土壤中的大树根系,支撑起整个软件产业体系的茁壮成长。在加速数字化转型潮涌下,随着硬件的不断丰富和变化,激发了软件体系发展脉络的深度演化,促使软件生态更加繁杂,软件根技术正在呈现出多头并进、多点开花、多元交叉融合的势头。操作系统是软件技术体系中最核心、最关键的基础软件,支持着所有应用软件的正常运行。以自主操作系统为代表的基础软件是数字基础设施的核心组成部分,是技术创新和数智化发展的基石,正在成为我国数字经济发展的安全底座。操作系统多场景(服务器、云计算、边缘计算、嵌入式)底层同构是技术承载;跨场景、跨终端、云驱动将成为操作系统的新发展趋势,互联、互通、互操作成为共性需求,逐渐驱动着操作系统的功能越来越强大。开源和生态建设将成为国产操作系统发展的主流模式,我们提倡借鉴华为公司 openEuler、OpenHarmony 的探索和实践,共建技术、商业、生态、人才、社区、文化交融的开源生态体系。本文重点聚焦软件根技术操作系统,试图通过研究操作系统体系的深刻发展规律,提出国产操作系统发展之路,构建具备兼容当前软硬件,支持互联互通、互操作的操作系统基础架构体系,将其纳入国家基本建设项目范畴,是本白皮书的核心目标。前 言2我们倡导由政府牵引、市场主导和社会协同,共同建设国产操作系统基础构架体系,基于构架延伸应用,衍生产品,培育生态,并面向全世界输出共享,这样有助于建设完备的中国软件产业体系,也可以为全世界的数字化进程贡献中国力量。3一、操作系统概述回顾操作系统近半个世纪的发展历史,经历了从专用操作系统到通用操作系统的转变,如今已经成为复杂强大的计算机软件系统之一,推动了计算机应用的繁荣发展。(一)操作系统定义操作系统(Operating System,简称 OS)是连接硬件和数据库、中间件、应用软件的纽带,是承载各种信息设备和软件应用运行基础平台的重要基础性软件。操作系统位于底层硬件与应用软件之间,对下承接硬件,对上承载应用,是软硬件系统的核心与基础,是硬件与其它软件沟通的桥梁。IT 产业存在着“硬件软件服务”的研发和生产链条。操作系统是最贴近硬件的第一层软件,能够管理和控制其它软件。操作系统是硬件的扩充,为其他软件提供运行环境。因此,操作系统在软件技术体系中处于定海神针的重要位置。专栏 1:操作系统是现代科技的基石发展现代科技,除了诸如芯片这样的硬件基石,软体基石同样重要。而软体中最核心的技术,那就是操作系统。每一个硬件后面,总有软件代码在后面支撑。没有优秀的软件系统,再好的肉体也没有灵魂。操作系统的组成部分有:内核为资源(特别是内存、处理器和I/O 设备)提供了最低层次的抽象层。它包括(但不限于)任务管理、内存管理、文件系统、设备管理等组件。4专栏 2:操作系统五大功能操作系统具备五大功能:管理资源、提供用户界面、运行应用程序、支持内置实用程序、控制计算机硬件。操作系统的功能总是有针对性地满足具体需求。一些操作系统旨在为用户提供操作的便捷性,一些更注重性能,还有一些更注重系统的安全性。(二)操作系统分类计算机操作系统上面可以装载各种各样的应用软件,是重要的流量入口,作为最基本也是最为重要的基础性系统软件,按应用领域进行划分,操作系统可分为服务器、桌面、移动、云、嵌入式及物联网操作系统六种类型,各类操作系统均有其相对应的技术特点。专栏 3:各历史阶段操作系统发展 PC 时代由于 Windows 操作系统的广泛应用部署,微软于 20 世纪 90 年代成为全球市值最高的公司;苹果研制的 macOS 也支撑苹果一度成为全球最赚钱的科技公司。数据中心时代在 IBM、Intel 等企业的支持下,Linux 操作系统又逐步在服务器等场景占据主体地位。移动互联网时代苹果基于 NEXTSTEP 操作系统构筑的 iOS 支撑苹果成为全球市值最高的科技公司;Android 公司创立于 2003 年,谷歌在 2005 年收购 Android,通过持续不断的研发投入与快速迭代,如今已将 Android 操作系统打造成世界上发行量最大的移动智能操作系统。万物互联时代随着万物互联时代的到来,覆盖全场景的单一操作系统已经很难适配多样化终端设备不同硬件能力、不同应用场景、不同运算能力的需求。目前谷5歌、华为等各大企业纷纷在物联网操作系统方面重兵投入:谷歌从 2016 年开始投入基于微内核的 Fuchsia 操作系统,应用场景上希望适用于个人移动设备、IoT(Internet of Things 物联网)设备甚至无人驾驶汽车等不同运算能力和需求的场景。华 为 于 2019 发 布 了 面 向 万 物 互 联 的 全 场 景 分 布 式 操 作 系 统HarmonyOS,支持手机、平板、智能穿戴、智慧屏等多种终端设备运行,天生具备模块化解耦优势,可针对不同硬件能力的设备进行模块剪裁,从而实现弹性部署。1.服务器操作系统服务器操作系统通常指安装在大型服务器主机上并用于管理服务器硬件和软件资源以及向多个程序提供服务的操作系统。服务器操作系统可以实现对计算机硬件与软件的直接控制和管理协调。2.桌面操作系统桌面操作系统通常指安装在个人电脑上的图形界面操作系统软件。桌面操作系统基本上根据人在键盘和鼠标发出的命令进行工作,对人的动作和反应在时序上的要求并不很严格。从应用环境来看,桌面操作系统面向复杂多变的各类应用。从开发界面来看,桌面操作系统给开发人员提供一个“黑箱”,让开发人员通过一系列标准的系统接口调用来使用操作系统的功能。3.移动操作系统移动操作系统通常指安装在移动设备中的通用图形界面操作系统软件。移动操作系统内置了诸如用户界面和各种设置工具之类的实用程序,并且有很多机会可以直接了解用户。移动操作系统包括从桌面操作系统派生的操作系统以及从嵌入式 Linux 派生的操作系统。6专栏 4:主流的移动操作系统安卓(Google)基于 Linux 的嵌入式平台。自 2010 年以来,它已成为主流智能手机操作系统之一。iOS(苹果)从 Mac OS X 派生的移动操作系统。安装在 iPhone、iPad 等移动设备上。4.云操作系统云操作系统通常指以云计算、云存储技术作为支撑,构架于云集群的服务器、存储、网络等基础硬件资源和单机操作系统、中间件、数据库等基础软件之上的、管理海量的基础硬件、软件资源的云平台综合管理系统。云操作系统不同于传统操作系统仅针对整台单机的软硬件进行管理,而是通过管理整个云计算数据中心的软硬件设备,来提供一整套基于网络和软硬件的服务,以便更好的在云计算环境中快速搭建各种应用服务。专栏 5:云操作系统特点一是治众如治寡,能管理和驱动海量服务器、存储等基础硬件,将一个数据中心的硬件资源逻辑上整合成一台服务器;二是为云应用软件提供统一、标准的接口;三是管理海量的计算任务以及资源调配。云操作系统与普通电脑中运行的操作系统相比,就好像高效协作的团队与个人。个人在接受用户的任务后,只能一步一步地逐个完成任务涉及的众多事项。而高效协作的团队则是由管理员在接收到用户提出的任务后,将任务拆分为多个小任务,再把每个小任务分派给团队的不同成员;所有参与此任务的团队成员,在完成分派给自己的小任务后,将处理结果反馈给团队管理员,再由管理员进行汇聚整合后,交付给用户。75.嵌入式操作系统嵌入式操作系统通常指与硬件相结合,能够通过对硬件进行资源调度,实现硬件功能的系统软件。嵌入式操作系统是一种用途广泛的系统软件,通常包括与硬件相关的底层驱动软件、系统内核、设备驱动接口、通信协议、图形界面、标准化浏览器等。嵌入式操作系统负责嵌入式系统的全部软、硬件资源的分配、任务调度,控制、协调并发活动。嵌入式操作系统必须体现其所在系统的特征,能够通过装卸某些模块来达到系统所要求的功能。大部分的嵌入式系统都具有软实时性,可移植于多种处理器,并且基于优先级设计。总体而言,嵌入式操作系统具有多种优点,尤其适用于成本较低、计算资源不多、对实时性有要求的场景。专栏 6:嵌入式操作系统设备示例具有嵌入式操作系统的设备的一些示例包括:自动取款机、功能手机、电动汽车、工业控制系统(ICS)、基于 Arduino 的设备。Arduino 是一个开源平台,带有一个微控制器,可以处理简单的输入,例如温度或压力,并将它们转换为输出。这些设备有一个基本的嵌入式操作系统,其作用类似于引导加载程序和命令解释器。基于 Arduino 的设备的一个例子是遥控车。Arduino 从汽车控制器读取输入,并将输出信息和命令发送到其他组件,例如制动器。6.物联网操作系统物联网操作系统通常指面对由多种硬件组成的网络系统,能够协调、调度硬件系统的资源,并和构筑于硬件系统之上的软件相互联系,达到统一调度软硬件资源,完成硬件执行动作的系统软件。物联网操作系统能够在物联网设备上运行,提供物物相连能力,其核心是能够将各种物体连接到物联网并且为各种物体提供数据通8信的能力。物联网操作系统对“物体”的调度过程通过层层分发、层层下达,通过调度云、边、端,不同层级中不同设备的计算资源而实现。专栏 7:物联网操作系统特征物联网操作系统除具备传统操作系统的设备资源管理功能外,还具备下列功能:1.屏蔽物联网碎片化的特征,提供统一的编程接口;2.物联网生态环境培育;3.降低物联网应用开发的成本和时间;4.为物联网统一管理奠定基础。9二、国产操作系统发展形势分析操作系统自上世纪 50 年代诞生以来,到 90 年代以后,国内开始投入力量研发国产操作系统,经历了三十多年的发展史。到目前为止,国产操作系统经历了萌芽期(1989-1995)、破土期(1996-2009)、成长期(2010-2017)、壮大期(2018-至今)四个发展阶段。近年来,国产操作系统正在实现跨越式发展,特别是经过几次国外操作系统的停服事件后,国内加快了对国产操作系统的研发和创新进程,国产操作系统正在从“可用”向“好用”跃进。虽然市场上不同技术和开发版本的操作系统较多,但是真正具备核心生态的操作系统体系数量稀少。从全球来看,美国的谷歌和微软长期垄断着操作系统市场,另外,以苹果公司为代表的科技企业正在大力突破市场垄断,以搭载苹果公司产品专属的操作系统积极抢占全球市场份额。从国内来看,国产操作系统经过多年布局发展,取得了一些阶段性成果,但由于操作系统要求对前期的投入巨大,研发、维护、更新周期长,能形成一定生态规模的操作系统较少,能够打破已有市场的新型操作系统更少。主流操作系统厂商在在服务器、桌面、移动、云、嵌入式、物联网领域各自占据市场优势地位,国产操作系统厂商想打破现有格局,需要长时间积累突破,可以说挑战与机遇并存。(一)操作系统行业发展现状1.微软 Windows 在桌面和服务器领域占据统治地位目前,市场上不同技术和开发版本的操作系统较多,但是具备10核心生态的操作系统体系很少。美国微软公司凭借自身强大的应用生态与预装优势,通过“Windows-Intel架构” “软件付费”绑定模式,在桌面和服务器领域具备绝对垄断优势。自 20 世纪 90 年代以来,Wintel 联盟充分利用市场化手段,在全球范围内打下了坚实的客户使用基础,数以亿计的软件开发厂商都是基于 Wintel 的计算生态开发软件和测试程序。客户和软件开发厂商的使用反身性,也更加强了 Wintel 垄断者的优势。近 5 年以来,虽然 Windows 操作系统在国内市占率稍有下滑,但仍占据绝大部分市场份额,依然具备强大生命力,未来很长一段时间仍将引领桌面和服务器行业操作系统的迭代与进化。反观国产操作系统都是基于Linux开源,市场份额占比约5,生存相对艰难。Linux 操作系统被认为是后起之秀,国内厂商通过开源 Linux成功研发和推出多款服务器和桌面操作系统,获取了一部分市场份额,但是整体生态系统薄弱,很难撼动微软的绝对领先优势。专栏 8:Linux 操作系统特点多用户系统:在一个 Linux 主机上规划出不同等级用户,每个用户登录时工作环境可以不同,还允许不同用户在同一时间登录主机。模块化程序:Linux内核设计精巧,其独特的模块机制可根据用户需求,实时地将某些模块插入或从内核中移走。广泛的硬件支持:支持 x86、ARM、MIPS、ALPHA 和 Power PC 等多种体系结构和微处理器。目前已成功地移植到数十种硬件平台,几乎能运行在所有流行的处理器上。占用资源少:目前市场上任何一款个人计算机都可以达到使用 Linux 搭建一个服务百人以上的主机,可定制剪裁,移植到嵌入式平台,可选择多种图形用户界面。11用户组规划:在 Linux 机器上文件分为三类:文件拥有者、文件所属用户组、其他非拥有者与用户组者,对于项目或者其他项目开发者具有良好的保密性。户组、其他非拥有者与用户组者,对于项目或者其他项目开发者具有良好的保密性。专栏 9:Linux 在我国的发展策略Linux 是互联网的产物,它的开发模式、服务模式、收益模式、经营模式都不同于传统软件,其真正价值在于为用户提供解决方案,为用户提供支持服务。Linux 的核心问题是应用与服务,而不是发行版,只有不断推出丰富多彩的、满足用户需求的应用并提供多样化深入的服务才是真正将 Linux的丰硕成果带给广大的普通用户。一是行业应用逐渐扩展,满足差异化解决方案需求。Linux 行业应用市场逐步细化,在金融、电信、邮政、传媒等行业的应用不断增多。Linux 平台上部署解决方案时,系统稳定性、可靠性、高性能和安全性等问题为使用者树立了信心。并提供满足用户需求基础之上的安全性、高效性、可移植性,以及成本最低的解决方案。二是单一产品价格竞争向整体解决方案 TCO 竞争过渡。Linux 推向市场之初采取的是低价策略。针对用户需求的转变,Linux 产品提供商也逐渐由单一产品价格竞争向整体解决方案 TCO 竞争过渡。这个过程中,Linux厂商与相关软硬件厂商和 ISV 等建立很好的合作关系,提高了产品的兼容性和互操作性。三是服务在Linux收入结构中的比重逐渐增大。随着Linux应用逐渐深入,Linux 本土厂商和应用企业正逐步接受以服务来获取收入的销售方式,而国外厂商Novell和红帽的进入,更将它们在国外采用的成熟销售方式带入了中国。中国的Linux厂商越来越多的收入来自Linux技术服务,而不是Linux产品销售。2.谷歌 Android 和苹果 iOS 在移动领域形成双寡头垄断进入移动互联网时代,应用于智能移动设备上的移动操作系统12迅速得到发展。Android 和 iOS 经过十几年技术发展和生态建设,占据着移动操作系统市场绝大部分市场份额。谷歌依靠“Android-ARM” “免费流量 增值服务”模式,成为了移动操作系统领域的巨头,国内智能设备制造厂商大都使用安卓操作系统,为智能手机、智能电视、平板电脑、智能手表等数十亿设备提供平台支持,使得 Android 成为国内最受欢迎的移动操作系统。苹果依托其强大的创新能力,推出广受大众欢迎的智能手机、智能穿戴设备等科技产品,同时搭载自研的 iOS 操作系统,也成功占据了一定的市场份额。Android 和 iOS 两者的行业龙头地位稳固。专栏 10:英国启动对谷歌苹果反垄断调查2022 年 11 月 22 日,英国竞争和市场管理局(Competition and Markets Authority,CMA)发布消息称,将对谷歌和苹果在移动浏览器和云游戏市场的情况展开第二阶段调查,目前已经成立调查组。CMA 表示,这两家科技巨头在移动生态系统形成“双寡头垄断”,该机构需要进一步进行深入审查。这项针对移动浏览器和云游戏的调查基于今年 6 月发布的一份 356 页的市场研究报告。该报告称,苹果和谷歌在移动生态系统领域拥有强大而稳固的市场力量,因此有能力制定“游戏规则”,控制移动设备上的操作系统、应用商店和网络浏览器。若不加以干预,这两家公司可能保持甚至强化对行业的控制,进一步限制竞争和创新。国内华为公司推出的鸿蒙操作系统也逐渐进入发展正轨,随着鸿蒙操作系统的不断升级优化,将会有更多的智能设备厂商接入鸿蒙系统。未来,鸿蒙操作系统将会对 Android 和 iOS 产生挑战,国内移动操作系统市场竞争格局将发生变化。3.巨头围猎云操作系统,技术功能各具特点随着企业上云探索的逐渐深入,厂商也从一开始时的各自为政,13到采用开源的标准(CloudStack、OpenStack 等),再到如今,一些厂商在实践经验和不断摸索的基础上,自主开发通用的云操作系统平台,云操作系统经历了螺旋式上升的演进过程。目前,国内主要的云操作系统厂商大致可分成三大阵营:以微软、亚马逊、阿里云等为代表,提供互联网应用的厂商,他们依托自有产业资源,结合云计算技术,基于原有的操作系统向云端过渡,功能齐全,以互联网应用的形式对外输出“云-边-端-网”的云服务能力。以华为、浪潮等为代表,提供云服务器产品的厂商,他们的基本策略是通过生产云服务器,配置了自己开发的操作系统,实现产品一体化交付。以VMware、华云数据等为代表,提供标准化产品的厂商,他们基于用户场景化需求和云的特点,独立开发模块化、标准化的云操作系统产品,并以软件产品的形式独立交付。根据不同的产品定位,这些具有不同特色、以不同方式交付的云操作系统,有自己最适合或者说最匹配的业务应用场景。比如,互联网客户与传统行业客户在选择云操作系统时就有不同的侧重点,有的关注灵活性、成本,有的则看重成熟、稳定、可靠。客户在选择云操作系统时,只要选择适合自己的,并为未来的扩展预留空间就可以,所以造成了不同厂商云操作系统技术功能各具特色。4.嵌入式操作系统相对分散,发展潜力巨大嵌入式操作系统作为软硬件资源的控制中心,以尽量合理有效的方式解决多用户共享下的资源。经过多年发展积累,我国嵌入式操作系统产业链布局基本完善,国产嵌入式操作系统产品数量不断14增加。我国嵌入式操作系统厂商众多,还没有形成如同 Wintel 联盟式的垄断态势。近年来,随着计算机技术及集成电路技术的发展,嵌入式技术日渐普及,在通讯、网络、工控、医疗、电子等领域发挥着越来越重要的作用。嵌入式系统将成为当前最热门最有发展前途的 IT 应用领域之一。随着信息化、智能化、网络化的发展,嵌入式系统技术也将获得广阔的发展空间。同时,工业领域通常对电子信息系统有着天然的特殊要求,例如可靠性、专用化、安全性、低功耗、小型化等,这些需求都非常适合应用嵌入式技术来满足。因此,工业领域是自主可控嵌入式操作系统的重要应用方向。伴随着工业领域逐步实现自动化、信息化的发展趋势,嵌入式系统将迎来更加广阔的应用场景和市场空间。5.物联网操作系统尚处起步发展阶段,呈现碎片化形态进入万物互联时代,物联网操作系统尚处于发展早期阶段,呈现出碎片化状态。目前市场上存在着不同来源的物联网操作系统:有从原有嵌入式操作系统改进而来的,也有从通用系统裁剪而来的,还有面向物联网需求完全从零发展而来的。不同行业背景的厂商(操作系统大厂、硬件厂商、云计算服务厂商等)从自身业务需求出发进行研发。物联网操作系统是行业应用得以茁壮生长和长期有效生存的基础,只有具备了强大灵活的物联网操作系统,物联网这棵大树才能结出丰硕的果实。我们判断,尽管当前物联网操作系统市场占有率较为分散,但未来有可能出现几个垄断具体业务场景或生态的主导型物联网操作系统。15(二)国产操作系统发展趋势操作系统产业的规律是:当垄断已经形成,后来者就很难颠覆,只能等待下一次新的产业浪潮。按照市场发展规律,每过二十年左右,操作系统会出现一次跨越式发展机遇,这主要是因为计算环境发生了很大变化,导致操作系统会更新换代,并引导相应的应用场景呈现数量级增长,形成围绕操作系统的产业新生态。华为近三年相继推出的 openEuler 服务器领域操作系统和OpenHarmony 移动终端/物联网操作系统,使得华为迅速成为国内操作系统的领军企业之一,正在逐渐打破国外操作系统的现有市场垄断格局。当国内 IT 领先企业发展到一定阶段,使用国外操作系统可能会受到功能、性能和安全可靠等特定需求的限制,而这些企业已经有一定的实力进行操作系统研发方面的投入,通过改进或定制开源Linux 等操作系统来提升自身业务的发展需求。人工智能、机器学习、物联网、元宇宙、无人系统、工业机器人等新兴领域吸引了大量的资金投入。现有的操作系统有可能出现不能充分满足这些领域的深入发展需求的情况,反过来倒逼这些领域的新玩家也投入到面向这些领域的新型操作系统的研发中来。总体来看,由于我国在操作系统领域起步较晚,国内各领域操作系统市场长期被国外厂商以成熟稳固的产品线占据。Windows、Android、iOS 等主流操作系统占据绝大部分市场份额,这些巨头厂商通过几十年研发积累和产品试错,形成了一系列成熟稳固的标准化产品,同时通过长期市场布局,围猎了国内大部分用户,形成用户数量、产品标准化、软硬件生态等系列竞争优势。国内主力厂商16也开始后起发力,一些主流操作系统厂商都具备了内核之外代码的开发能力,造成受制于人局面的主要原因是产业链上下游没有建立良性的生态系统,随着生态布局的持续完善,一旦突破生态用户“临界点”,应用软件开发商也会因为用户基础而投入更多资源进行与操作系统的适配,从而形成生态良性循环,未来发展提升潜力巨大。中国软协预测,未来 5 年左右,国内操作系统市场将继续保持快速扩张态势,至少有 5-8 倍的增长空间,国产操作系统将面临新的发展机遇。17三、服务器操作系统产业分析(一)中国服务器操作系统市场竞争格局全球服务器操作系统主要分为 Windows Sever 和 Linux 两大流派。在中国服务器操作系统市场上,受益于技术环境的变化,以Linux 为代表的开源操作系统逐渐成为服务器操作系统市场受欢迎的主流产品,成为推动服务器操作系统技术发展的重要推动力。openEuler 的全面开源,引发了中国服务器操作系统发展的质变,推动了整个行业进入加速发展阶段,未来国内服务器操作系统市场竞争将迎来变局。1.主流厂商行业应用领域国内服务器操作系统市场主流厂商有微软、IBM 红帽、麒麟软件、统信软件、中科方德等。这些厂商的服务器操作系统主要应用在互联网、金融、运营商、政府、能源、交通、制造、医疗卫生、零售、物流及邮政等行业领域。近年来,国产操作系统在党政、金融、交通、能源、电信等领域应用日益广泛,并在核心业务领域渗透率不断提升。其中,银河麒麟、统信UOS为两大具有代表性的国产操作系统。现阶段,以麒麟、统信为核心的国产操作系统体系已经初步建立,党政关键领域的国产操作系统普及基本完成,金融、教育等行业开始试点推广,未来逐步向消费级市场拓展,市场增长潜力巨大。2.主流厂商的市场占有情况近年来,数字化改造浪潮持续加速。目前,已经有多家操作系统厂商开发基于 openEuler 的商用发行版,如统信、普华、麒麟、18中科创达等。此外,三大运营商中国电信、中国联通、中国移动也开发了基于 openEuler 的自用操作系统。openEuler 系产品市场装机量在 2022 年不断突破,取得了多个领域的增速第一:在政府行业,openEuler 系产品在 2022 年上半年市场占有率达39.2%,位居第一位;在运营商行业,市场占有率达 57.9%,位居第一;在金融行业,装机量市场占有率达 28.0%,位居第二;在能源行业,市场份额进一步提升,占有率达29.6%,位居第二。CentOS停服加速服务器操作系统国产化替代进程提供了机遇。麒麟软件基于 openEuler 社区版本所推出的麒麟 V10 操作系统,同时支持桌面端和服务器端,技术自主、生态丰富,在国产服务器操作系统市场上优势明显。专栏 11:openEuler 装机量跨越生态发展临界点华为公司副总裁、计算产品线总裁邓泰华在“2022 全连接大会”上表示,截至 2022 年 11 月,openEuler 欧拉操作系统的累计装机量达到 245 万套,跨越了生态发展临界点,在服务器操作系统的新增市场份额达到 22%,年底有望达到 25%。(二)主流厂商的技术路线和发展策略1.主流厂商的技术特点Windows Server 采用图形化操作界面,需要专业系统维护队伍(不定期的打补丁),易操作、易学习。利用 Windows 较好的一体化技术,将服务器端与桌面端无缝连接,能够充分调度服务器的软硬件资源。服务器端延续了 Windows 桌面操作系统的优点,并与以 Intel 芯片为主的计算资源充分统合,完全适配。19EulerOS 是基于开源技术的开放的企业级 Linux 操作系统软件,具备高安全性、高可扩展性、高性能等特点,能够满足客户IT 基础设施和云计算服务等多业务场景需求。作为面向企业级通用服务器架构平台的操作系统,华为 EulerOS 基于稳定系统内核,完美支持鲲鹏处理器和容器虚拟化技术,着力在系统的高可靠、高安全以及高保障方面储备了富有竞争力的技术特性,为企业用户提供了一个稳定安全的高端计算平台,并充分利用 Linux 的可伸缩、高性能和开放性的优势,从容面对快速的业务增长和未来的挑战。2.主流厂商的生态建设Windows Server 基于用户对微软的使用习惯,开发出更多的基于其服务器的应用软件,并与 Intel 绑定。微软在专业级应用软件及游戏方面推出不同层次的产品;在构建开发者生态方面,Windows 平台渗透率高,凝聚了大批的开发者。在硬件上,Intel 作为芯片 IDM 厂商,占据市场话语权,Wintel 通过捆绑销售,牢牢把握对产业下游生产商的控制权。EulerOS 通过开源社区形式与全球的开发者共同构建一个开放、多元和架构包容的软件生态体系,孵化支持多种处理器架构、覆盖数字设施全场景,推动企业数字基础设施软硬件、应用生态繁荣发展。EulerOS 通过开源社区的建设,将芯片厂商、整机厂商、操作系统厂商、应用软件厂商等多类伙伴集合到社区中,社区成员实现共建、共享、共治,全球资源逐渐向社区汇聚,从而推动了整个产业链条的发展。截至目前,EulerOS 社区伙伴已超 380 家,全国下载量超 50 万,用户数量超 60 万人,PR(Pull Request,优化请求拉取)合入超 5.5 万。20兼容性方面,openEuler 已完成与多个硬件厂商的兼容适配,通过了 CPU 架构(x86/ARM)、跨代 CPU、主板(USB/拓扑)、外设等的兼容性测试。3.主流厂商在我国的发展策略微软 Windows Server 系列产品与桌面系统有很多相同之处,在整个 IT 发展中起到举足轻重的作用,微软 Windows Server 在发展中不断的进行技术迭代和升级,满足市场需要和用户需求,而基于Windows 8 基础上开发出来的 Windows Server 2012 服务器版系统,引入了全新的开始界面,并且增强了存储、网络、虚拟化、云等技术的易用性,让管理员更容易地控制服务器。这使得微软 Windows Server 在中国服务器操作系统市场上占据了一席之地。当前,以 EulerOS 为代表的中国开源社区正在构建以自主技术为核心的产业生态,国产服务器操作系统已经具备产品有开发者社区、有知识产权,高安全、高可用、可定制、可重构的特性。华为携手 EulerOS 社区全体伙伴共同将欧拉开源操作系统贡献给开放原子开源基金会,推动了欧拉开源操作系统的加速发展。目前已经有多家操作系统厂商开发基于 openEuler 的商用发行版,如麒麟、统信、普华、中科创达等。此外,三大运营商中国电信、中国联通、中国移动也开发了基于 EulerOS 的自用操作系统。同时,随着数字经济建设的不断推进,EulerOS 着力建设数字基础设施的底座,通过不断与云计算、边缘计算等结合,提供对数字场景的支持。此外,国内一些企业纷纷打造了自己的开源社区,丰富产业链生态。其中,阿里、麒麟、统信均打造了自己的根社区。21专栏 12:openEuler 开源社区openEuler 是面向企业级的开源全国产化操作系统。openEuler 内核源于Linux,支持鲲鹏及其它多种处理器,能够充分释放计算芯片的潜能,是由全球开源贡献者构建的高效、稳定、安全的开源操作系统,适用于数据库、大数据、云计算、人工智能等应用场景。同时,openEuler 是一个面向全球的操作系统开源社区,通过社区合作,打造创新平台,构建支持多处理器架构、统一和开放的操作系统,推动软硬件应用生态繁荣发展。22四、桌面操作系统产业分析(一)中国桌面操作系统市场竞争格局桌面操作系统被认为是计算机时代的“灵魂”。与半导体产业链一样,国际跨国公司得益于先发优势筑起的护城河,长期主导着全球桌面操作系统市场。面对日益复杂的国际关系,实现操作系统自主研发,将有助于减少对国外硬件系统的依赖,打破软硬件技术壁垒。近几年,突破高端芯片等硬件技术已经得到国家大力支持,同样也需要推进软件操作系统的发展,这样才能把握自主权。1.主流厂商的行业应用领域目前,国内桌面操作系统市场主要有以微软和苹果公司为代表国外桌面操作系统厂商,以麒麟、统信、中科方德、中兴新支点、深度为代表的基于开源 Linux 的操作系统厂商。国外厂商方面,微软 Windows 和苹果 MacOS 主要用于企业、消费级市场 PC 领域。国内厂商方面,以麒麟 KylinOS、统信 UOS等为代表的国产操作系统主要应用于政府、教育、金融、医疗、电信、航天等关键信息领域,并逐渐向企业和消费级市场扩展迁移。专栏 13:银河麒麟操作系统成功应用于国家重大项目银河麒麟操作系统(KylinOS)是我国自主研发的操作系统,“天问一号”成功着陆火星使用的就是该系统。如今,麒麟已经在中国空间站、北斗等领域得到广泛应用,为国家重大项目贡献了“中国大脑”。2.主流厂商的市场占有情况中国在桌面操作系统领域的探索起步虽晚,也已走过了长23达三十余年的历程,但在国内只占据了很小的市场份额。以微软Windows 和苹果 MacOS 为代表的跨国公司仍处于绝对主导地位,虽然近 5 年在国内市占率逐步下滑,但仍占据超过 94市场份额(Windows 约占据 90%,MacOS 约占据 4%)。以开源 Linux 为主的国产桌面操作系统处于初期发展阶段,在市场占比尚不足 6,市场拓展方面还有待进一步提升。目前麒麟、统信初露锋芒,但尚未形成稳定清晰的市场竞争格局,传统厂商、巨头企业、初创公司等参与者均有机会。从当前国产化占比情况来看,国内操作系统市场增长空间较大。预计到 2025 年,国产桌面操作系统出货量有望超过 20,中国市场整体占有率突破 10,中国将成为全球最大的 Linux 桌面市场,具备发展独立生态的基础和引领 Linux 桌面系统发展的潜力。(二)主流厂商的技术路线和发展策略1.主流厂商的技术特点微软Windows桌面操作系统采用自研内核,内核功能强大丰富,内置的各类技术标准、应用程序接口保持持续更新,推动 PC 硬件迭代。系统采用直观高效的图形用户界面、多任务栏功能,即插即用,具备出色的多媒体功能。Windows 重视对新硬件、新技术的适配,鼓励硬件厂商对于新技术和新部件的积极采用及研发,形成了新硬件与 Windows 互利共生的关系。苹果 MacOS 是基于 XNU 混合内核的图形化操作系统,采用多平台兼容模式,自研源码闭源,部分组件开源,占用更少的内存,一般情况下在普通PC上无法安装,安全性高,可使用多种开发工具。24麒麟 KylinOS 采用国际主流标准,技术成熟。KylinOS 基于UNIX国际主流标准,同时继承了“银河”系列操作系统的核心技术,采用层次式结构,由 Mach 风格的基本内核层、BSD 风格的系统服务层、Windows 风格桌面环境紧耦合构成。支持多种微处理器和计算机体系结构,实现跨平台。与 Linux 在应用层二进制兼容,充分利用基于 Linux 的丰富应用成果。全中文支持,桌面环境友好。支持集群环境,支持多种应用服务和应用开发。统信 UOS 依托功能强大的自研桌面环境(DDE),为用户提供了界面精美、交互灵动、操作简洁而统一的操作体验。系统集成了三十多款自研的桌面应用,支持用户日常办公学习、影音娱乐、编程开发等各种场景下的业务需求。此外,提供成熟的软件生态平台和应用管理审核机制,为生态软件开发者提供友好便利的平台保障和发展助力。自带硬盘加密、开发者模式开关、安全启动、应用软件签名、安全中心、文件保险箱等多重安全机制,从硬件到软件全方位保障用户系统使用和数据安全。2.主流厂商的生态建设微软利用先发优势抢占市场,通过与软硬件厂商、自研应用的长期磨合,率先构建系统化的生态规模,形成庞大的用户群体。软硬件捆绑形成Wintel联盟,牢牢把握住对产业下游生产商的控制权。在马太效应的作用下,Windows 的软硬件生态越来越庞大,吸引更多的用户,促进产品和系统性能进一步提升,形成良性循环。苹果除了生产硬件,还自主开发软件,使得软件系统和硬件设备兼容性好,同时保持持续稳定的更新迭代,不断优化系统性能,与苹果其它产品线实现“连续互通”,为用户带来了无缝衔接的顺25畅体验,形成了独特的闭源生态。在市场和政策的推动下,国产操作系统逐渐形成以麒麟、统信为代表的两强格局,市场发展与生态构建形成聚拢趋势。麒麟发起成立中国首个桌面操作系统根社区开放麒麟(openkylin)开源社区,吸引产业链合力。推动规模化商用,打造丰富的应用生态。高度重视生态体系建设,与众多软硬件厂商、集成商建立长期合作伙伴关系,建设完整的自主创新生态链。以麒麟软件教育发展中心为组织平台,联合政产学研各方力量,探索中国特色的网信人才培养模式。通过CMMI5级评估,现有博士后工作站、省部级企业技术中心、省部级基础软件工程中心等,先后申请专利545 项,其中授权专利 203 项,登记软件著作权 544 项,主持和参与起草国家、行业、联盟技术标准 60 余项。统信软件发起成立“同心生态联盟”,以深度(deepin)社区为基础,建设立足中国、面向全球的桌面操作系统根社区,与近3000 家生态伙伴深度合作,推出“统信生态腾飞计划”,统信加快统信软件软硬件兼容适配认证,打造具有“百个标杆案例、千家合作伙伴、万家企业,十万开发者、百万应用”的中国操作系统最大的生态圈。加强与各个院校间的合作,开展职业学院,培养专业操作系统人才等。3.主流厂商在我国的发展策略微软 Windows 早期在中国市场推广时,一方面与政府和中国企业加强合作,改善微软品牌在中国大众市场的口碑,一方面放任盗版系统软件的存在。当占据了庞大的市场规模后,开始收紧加大对知识产权的保护力度,并利用黑蓝屏技术限制打击盗版行为,迫使26用户付费使用正版软件,巩固了其在中国 PC 市场地位。苹果产品的外观设计,硬件配置以及自研的 MacOS 稳定加流畅的系统体验成为苹果公司在中国市场取得成果的关键。苹果MacOS经过多次升级后,具有强大的管理功能和流畅的用户体验感,同时与苹果系产品如智能手机、平板、智能手表等联通,吸引了大批忠实用户。以麒麟软件和统信软件为代表的国产操作系统厂商主要是抢抓政策红利和国产化替代契机,在党政、金融、电信、能源等重点领域抢占市场份额,并逐渐向其它行业进行渗透,不断扩大市场规模。27五、移动操作系统产业分析(一)中国移动操作系统市场竞争格局随着经济的发展,全球进入移动互联网时代,带动了以智能手机为代表的移动设备应用的兴起,推动了移动操作系统的繁荣。谷歌 Android 和苹果 iOS 两者凭借成熟的技术先发优势和庞大的生态,几乎垄断着移动操作系统市场。2019 年以来,随着华为公司推出HarmonyOS,三年以来发展势头迅猛,正在逐步构建起丰富的全产业链生态,未来有望打破谷歌 Android 和苹果 iOS 的市场垄断地位,在移动操作系统市场占据一席之地。1.主流厂商的行业应用领域谷歌 Android 主要应用于智能手机、平板电脑、智能电视、智能手表等移动设备上,并逐渐向数码相机、游戏机、汽车、家用电器等行业领域进行渗透。苹果 iOS 主要用在自研的智能手机、平板电脑、智能手表等苹果系电子设备产品上。华为HarmonyOS是一款面向未来的操作系统,主要应用于手机、电脑、平板、电视、工业自动化控制、无人驾驶、车机设备、智能穿戴等多终端设备领域。2.主流厂商的市场占有情况国内移动操作系统市场主要被谷歌 Android 和苹果 iOS 控制。谷歌 Android 基于开源特性,在移动智能终端设备上拥有庞大的衍生应用市场。据统计,谷歌Android和苹果iOS之间的竞争正在加剧,谷歌 Android 操作系统的市场份额,已从 2018 年的 77%、下降到282022 年 11 月的 70%,苹果 iOS 操作系统的市场份额却从 19%增加到了 26%。移动操作系统在手机行业应用最多,目前排名前十的手机设备制造商中,大部分厂商都是搭载的谷歌 Android 操作系统。苹果iOS 主要搭载在苹果系产品上,以其优越的性能和良好的用户体验感,吸引了众多忠实的粉丝客户。目前搭载 HarmonyOS 的华为设备超过 3.2 亿,内置鸿蒙系统的智联产品的发货量也超过了 2.5 亿,两者合计,搭载鸿蒙系统的设备数量,累计已经超过了 5.7 亿,HarmonyOS 已成为发展速度最快的国产操作系统。华为正在积极布局鸿蒙生态的建设,完成相关产品与鸿蒙操作系统的适配工作,拓展面向智能设备、物联网等场景的中间件产品,未来具有较大的上升潜力。(二)主流厂商的技术路线和发展策略1.主流厂商的技术特点谷歌 Android 系统平台架构主要通过 Linux Kernel(内核)、Hardware Abstraction Layer(HAL 硬件抽象层)、Android Runtime、Framework 及 APP 系统应用等五大架构组成,使得系统可以正常、平稳运行。开源特性,最底层使用 Linux 内核,应用程序采用 APK文件格式。跨平台特性,任何 Android 应用几乎无需做任何处理就能运行于所有的 Android 设备。用户界面操作便捷性,用户可以通过点击、滑动、挤压等方式,来操控屏幕上的应用程序。拥有丰富的应用软件,吸引了众多开发者为其平台开发各式各样的应用软件,坚实的消费者基础让开发者有动力开发更多更好的应用软件。29苹果 iOS 系统的用户界面主要基于多点触控,属于封闭式操作系统,是基于 Darwin 开源的操作系统,且 Darwin 的内核是 XNU。iOS 系统属于完全封闭的操作系统,其系统有着非常严格的系统管理体系,比如 APP 上传的时候的格式要求一定要使用 ipa、pxl、deb 等格式,并且要满足官方的审查要求才可以在苹果应用程序商店进行上架,同时软件和硬件的整合度较高可以有效避免分化程度,提高稳定性。华为 HarmonyOS 采用分布式架构,具备分布式软总线、分布式数据管理和分布式调度三大核心能力。分布式架构首次用于终端操作系统,实现跨终端无缝协同体验。确定时延引擎和高性能 IPC技术实现系统天生流畅。基于微内核架构重塑终端设备可信安全。通过统一 IDE 支撑一次开发,多端部署,实现跨终端生态共享。2.主流厂商的生态建设Android 操作系统最初由 Andy Rubin 开发,主要支持手机。2007 年 11 月,Google 与 84 家硬件制造商、软件开发商及电信营运商组建开放手机联盟共同研发改良 Android 系统。随后 Google 以Apache 开源许可证的授权方式,发布了 Android 的源代码,吸引芯片厂商在 AOSP 源代码上叠加自己的功能,发布自己的版本并进行测试,终端厂商使用芯片厂商提供的 Android 代码,在此基础上加上终端厂商自己的特性。这就相当于拉拢芯片制造商及众多的手机厂商、开发者合作,共同推广 Android 这个开放平台。Android 逐渐扩展到平板电脑及其他领域上,如电视、数码相机、游戏机、智能手表等。苹果 iOS 统一软件系统和硬件设备,通过强有力的监控手段来30保证软硬件产品的品质,使产品的理念得以贯彻和延续。借助忠实的开发者推广自己的产品,通过自己产品构建的网络同时反哺创新和创意者,最终形成了良性的循环,构建成为了自己的生态系统。有微软的 Windows Mobile 系统、诺基亚的塞班系统的前车之鉴,华为 HarmonyOS 从诞生之初就积极布局构建万物互联生态。持续投入资金超过 500 亿元,成立 OpenHarmony 社区,吸引开发者,壮大鸿蒙软件生态。通过开源方式,大力发展生态伙伴。将基础能力代码贡献给开放原子开源基金会,壮大开源鸿蒙产业,并加速向丰富的行业应用场景拓展。加速构建 HarmonyOS 的生态环境。首先,华为与合作伙伴联手开发了更多创新鸿蒙生态产品,包括智能家居设备、智能办公设备等;其次,华为不断构筑 HarmonyOS 软件的基础能力,通过为开发者提供更好的鸿蒙生态开发环境和开发工具,使开发者可以实现一次开发、多端部署;第三,面向数字基础设施的开源操作系统欧拉也将和 HarmonyOS 实现能力共享、生态互通。目前已有超 5000 社区贡献者,16000 API,76 款通过兼容性测试的开发板/模组,23 个软件发行版,79 款商用设备。开源社区Gitee 指数位列第一,是当前码云平台上代码和社区最活跃的开源项目。鸿蒙的生态开发者超过 200 万 ,鸿蒙智联伙伴超 2200 ,HMS Core 开放 25030 个 API,海外 Top 3000 应用集成率达 80%。鸿蒙应用数量也取得了长足的进步,已有近 4 万款应用联合华为走向全球市场,标志着鸿蒙生态进入了快车道。31专栏 14:华为 HarmonyOS 生态布局据公开信息,鸿蒙 OS 生态目前已有 300 应用和服务伙伴、1000 硬件伙伴、50 万 开发者共同参与到鸿蒙生态建设当中。鸿蒙计划今年将搭载超过 3 亿部设备,其中有 2 亿部是华为自有设备,生态设备将超过 1 亿。场景拓展上鸿蒙 OS 将采用“一横一纵”的战略。其中,“一横”要从在家居领域扩展到消费者高频刚需的六大领域,目前累计拥有超过 1000 家硬件生态合作伙伴,包括美的、九阳、老板电器等;“一纵”则是做好全产业链适配,已积累超过 50 家模组合解决方案合作伙伴。3.主流厂商在我国的发展策略谷歌公司通过 Linux 基金会在中国大力推广,吸引国内中小企业进行 Android 的开发与应用。布局生态建设,吸引来自中国大陆和台湾地区的企业加入由谷歌公司主导成立的开放手机联盟(OHA)。与国内手机厂商合作,基于 Android 系统平台开发出的成功产品越来越多。苹果公司每年定期对操作系统进行升级,提升功能和用户体验感;借助持续升级换代的智能手机、平板、电脑产品,吸引了大批忠实粉丝用户。华为公司围绕智能家居、智慧办公、智慧出行、运动健康、影音娱乐五大场景,以分布式技术、AI、原子化服务、通信、影像、音视频、图形渲染、隐私和安全框架八大领先技术为“鸿蒙底座”,30000 API 为“鸿蒙砖块”,以 Ark Compller 编译器、Ark TS 开发语言、APP Gallery Connect 上架分发等全链路自研开发套件为“鸿蒙工具”,构建“鸿蒙世界”。在 HarmonyOS 的加持下,鸿蒙已经实现了手机、平板、PC 三屏协同,给用户带来超级终端体验,在手机与车机之间,更是能够做到应用无缝迁移。32六、云操作系统产业分析(一)中国云操作系统市场竞争格局全球云计算市场处于快速增长阶段,在全球云操作系统市场上,亚马逊、微软、阿里巴巴和谷歌一直是市场的领跑者,四家公司的市场份额合计达到云操作系统市场总规模的 75%左右。国内云操作系统市场集中度相对较高,主要厂商有阿里巴巴、华为、腾讯、亚马逊、微软等,呈现群雄并起局面。1.主流厂商的行业应用领域华为 FusionSphere 是华为公司面向多行业客户推出的云操作系统产品,集虚拟化平台 FusionCompute 和云管理 FusionManager 等软件于一身,整个系统专门为云设计和优化,提供强大的虚拟化功能和资源池管理、丰富的云基础服务组件和工具、开放的API接口等,可以帮助客户水平整合数据中心物理和虚拟资源,垂直优化业务平台,让企业的云计算建设和使用更加简捷。阿里 Apsara 提供的产品和服务涉及云计算基础服务、域名与建站、企业应用、安全防护、网络与存储、大数据、人工智能、物联网和开发运维等诸多方面,产品线丰富,涉及领域较广,主要市场在国内和东南亚地区。亚马逊 AWS 主要面向数百万的大型企业、政府机构和初创公司客户。目前平台上提供了上千种服务包含了从基础服务到管理到应用的全部服务类型。其中基础服务包括计算、储存、网络等管理服务包括管理工具、安全配置、监控运行等服务微软 Azure 主要用于政府、零售、医疗保健业、金融服务、制33造等领域。用户可通过微软全球的数据中心进行计算、存储、数据库分析、应用程序管理、机器学习等操作。2.主流厂商的市场占有情况受国内利好政策影响以及国内数字经济背景下企业转型升级的需求,国内云计算服务需求持续增长,近几年的年均增速超过30%,是全球增速最快的市场之一。阿里云占据先发优势地位,华为云、腾讯云、百度云发展势头强劲,四家科技厂商占据了大部分国内市场份额,以亚马逊、微软为代表的国外厂商也占据了一定的市场地位。(二)主流厂商的技术路线和发展策略1.主流厂商的技术特点华为 FusionSphere 专门为云设计和优化,提供强大的虚拟化功能和资源池管理、丰富的云基础服务组件和工具、开放的API接口等,全面支撑传统和新型的企业服务,极大地提升 IT 资产价值和提高IT 运营维护效率,降低运维成本。阿里 Apsara 全面兼容 x86、ARM、RISC-V 等多种芯片架构,实现“一云多芯”。它可以将遍布全球的百万级服务器连成一台超级计算机,以在线公共服务的方式为社会提供计算力。提供足够强大的计算力、提供通用普惠的计算能力。亚马逊 AWS 是一组服务,它们允许通过程序访问 Amazon 的计算基础设施。这些服务包括存储、计算、消息传递和数据集 AWS提供基于云的基础架构,并提供基于 SOAP 的 Web 应用程序接口,在这之上建立基于云的 Web2.0 服务,对最终用户来说,只需浏览34器就可以使用。微软 Azure 是构建在微软数据中心内提供云计算的一个应用程序平台,包含云操作系统、基于 Web 的关系数据库(SQL Azure)和基于.NET 的开发环境(与 Visual Studio 集成,让开发人员得以使用其集成开发环境来开发与部署要挂载在 Azure 上的应用程序)。基于 Azure 的云存储和 Web 应用程序接口建立的在线服务,对于最终用户来说是桌面软件的形态,使用的终端主要是PC、笔记本平台,仍旧要依赖微软的操作系统,软件的计算仍旧依赖终端的处理能力。因此微软倡导的云计算是“云 端”计算,终端是由操作系统加上桌面软件的方式。2.主流厂商的生态建设华为 FusionSphere 构建 OpenStack 产业生态。华为 FusionCloud支持私有云、公有云、混合云等多样化部署,旨在帮助客户构建基于开源的商业应用,助力企业 IT 云化转型。阿里云将云生态定为阿里云的核心战略。以“汇聚、链接、共赢、聚变”作为生态理念,分别在产品生态、行业生态、区域生态、云市场、教育生态等方面,构建客户共享、数据共享、技术服务、全球服务四大生态体系。亚马逊 AWS 坚持创新和构建最有活力的生态系统。亚马逊非常重视自行研发,在美国所有的科技公司中,亚马逊的研发支出一直是最高的。AWS 一直致力于通过构建最有活力的生态系统,与合作伙伴共同服务好各种类型的客户。AWS 通过全球性的 APN 合作伙伴网络计划,为合作伙伴提供业务、技术、营销以及进入市场的广泛支持,帮助合作伙伴在 AWS 上成功。AWS 与 APN 合作伙伴35形成合力,服务好各行各业的客户。微软云落实本地运营为合作伙伴打基础。授权世纪互联在中国运营和提供 Azure 服务;带领合作伙伴向云转型,让合作伙伴减少花在运营上的时间,集中精力实现差异化竞争优势;大力培养云计算人才,微软在继承和延伸已有开发、编程能力的基础上,积极进行基于云计算技术的教育和培训。3.主流厂商在我国的发展策略国内厂商方面华为公司利用其本身在软、硬件方面的强大优势,为企业提供了多套云解决方案,帮助客户实现数字化转型。随后,华为云通过“一云两翼双引擎”的云计算产业布局,围绕算力提升发力。另一方面,加入 OpenStack 基金会,与合作伙伴一起为 OpenStack 开发者和用户群提供更好的服务,极推动 OpenStack 从技术平台演进为企业平台,共同推动基于开源技术解决方案的商业落地。阿里推出生态共建策略,积极与企业合作,推广其 IaaS 产品,帮助这些企业完成数字化改造。这种提前布局、抢先出手的打法,不仅让阿里云在国内一骑绝尘,还让其顺势将业务做到了海外。随着竞争者的不断加入,阿里的云利润开始收窄。为了实现新的突破,阿里云从 2017 年就开始倡导向智能云的转移。在这个阶段,阿里将其在人工智能上的优势集成到了云端,开发出了 ET 大脑等 PaaS产品。国际厂商方面亚马逊 AWS 将全球的最佳实践,跟中国国情相结合,通过联合 AWS 的本地合作伙伴一起,去定义最适合这些行业的中国最佳36实践。帮助中国客户通过中国区域享受到全球领先的云科技和服务,更好地深耕本地业务;帮助海外的全球客户使用中国区域保持全球IT 架构和体验的一致性,高效快速植根中国市场,帮助中国客户通过亚马逊云科技全球基础设施和服务出海走向世界。微软开放了对 Linux 系统的支持,还积极地与红帽、甲骨文、SUSE 以及 Canonical 等厂商合作,推动 Azure 成为理想的 Linux 运行环境。在基本确立市场地位之后,微软开始在大数据分析、人工智能等领域积极发力,努力实现云产品的差异化。加之微软本身有强大的软件研发能力,依托自身强大软件生态系统包括服务器、桌面操作系统、Office 应用软件和数据库的整合优势,为包括客户在内的合作伙伴提供差异化的云服务。37七、嵌入式操作系统产业分析(一)中国嵌入式操作系统市场竞争格局与通用操作系统相比较,嵌入式操作系统在实时高效性、硬件的相关依赖性、软件固态化以及应用的专用性等方面具有突出的特点。经过多年发展与积累,我国嵌入式操作系统产业链布局基本完善,国产嵌入式操作系统产品数量不断增加。随着信息技术的快速发展,嵌入式操作系统已经广泛应用于通信、能源电力、航天航空、工业控制等行业,对实时性要求越来越高的智能家电、媒体广播和数字影像设备等领域,未来市场应用潜力巨大。1.主流厂商的行业应用领域嵌入式操作系统历史悠久、门类繁多、用途广泛,常见的嵌入式操作系统厂商包括美国风河、微软、霍尼韦尔、德国西门子,法国施耐德等。从全球市场格局看,嵌入式操作系统主要分为三类:第一类,传统的经典 RTOS。以美国风河公司 VxWorks 操作系统及其 Tornado 开发平台为代表。特别是在通信设备等实时性要求较高的系统中,几乎非 VxWorks 莫属。美国风河公司的 VxWorks和 Wind River Linux 嵌入式操作系统主要应用于航空航天与国防、汽车、能源、工业控制、医疗、电信等领域。第二类,嵌入式 Linux 操作系统。以嵌入式 Linux 为代表,占嵌入式操作系统的 50%以上份额。第三类,Windows CE 嵌入式操作系统。主要占据显示仪表等界面要求较高或要求快速开发的领域。2.主流厂商的市场占有情况38嵌入式操作系统在控制细分领域众多,没有绝对的市场主导者,就工控操作系统而言,美国风河公司开发的 VxWorks 现占市场主流,而在实时工业操作系统领域,国内制造巨头大多采用美国微软、德国西门子、日本发那科、瑞士ABB、美国罗克韦尔等自动化巨头的产品。专栏 15:风河领先全球嵌入式市场风河(Wind River)公司是全球领先的智能互连系统软件提供商。1981年至今,全球超过 10 亿台产品应用了风河公司的技术成果,风河公司已成为全球实时操作系统、嵌入式 Linux 及相关服务市场供应量最大的公司:在 RTOS 及相关服务的全球市场总营收中占比近 40%;在嵌入式 Linux 及相关服务的全球市场总营收中占比超 50%;在上述两个领域中,风河的市场份额是竞争对手的两倍以上。风河凭借其完整的产品阵容,在全球嵌入式市场拥有得天独厚的优势。以全面支持 VxWorks、Linux 的 Run-Time 平台为基础,再加上面向这些平台的开发工具、全系统模拟工具,风河公司建构了适用于不同行业应用的软件解决方案,同时还提供世界一流的全球性专业服务和技术支持。(二)主流厂商的技术路线和发展策略1.主流厂商的技术特点风河 VxWorks 可靠性好,经过大量应用实践验证,使用安全性高、稳定性好。实时性强,VxWorks 进程调度、进程间通信、中断处理等系统公用程序精练而有效,它们造成的延迟很短。可裁减性佳,VxWorks 由一个体积很小的内核及一些可以根据需要进行定制的系统模块组成。微软 Windows CE 内核模块化:支持进程、线程处理及内存管理等服务。内核系统接口模块允许应用软件访问操作系统提供的服务。文件系统模块支持 DOS 等格式的文件系统。图形窗口和事件39子系统模块控制图形和 Windows 相关的外貌。通信模块允许同其他的设备进行信息交换。西门子Nucleus RTOS是一种支持32位和64位嵌入式处理器的,成熟、可靠和全面优化的实时操作系统。Nucleus RTOS 为 Arm、RISC-V、MIPS 和 PowerPC 提供架构支持。Nucleus Ready Start 包提供完整开发环境,覆盖嵌入开发的各个方面。表 1:嵌入式操作系统的技术演进无操作系统的嵌入式算法监控式实时操作系统通用嵌入式实时操作系统云端链接的操作系统4-8 位单片机为主8-16 位嵌入式处理器为主32 位 RISC 微 处理器32 位及以上微处理器无操作系统支持的裸机以简单监控式操作系统为主代 表:Vxworks、Windows CE嵌入式系统和网络的连接汇编语言对系统进行直接控制处理器种类繁多,通用性差可运行在不同的微处理器上可运行在不同的微处理器上系统结构及功能单一,针对性强用户界面不够友好具有丰富 API 和嵌入式应用软件具有丰富API接口,以及云端能力2.主流厂商的生态建设风河 VxWorks 提供完整的产品阵容,配备了覆盖全球的专业服务与支持,在业界建构了广泛的合作伙伴生态系统。无论是开源的Linux、商业化的 RTOS,还是两种产品同时需要,无论是设计、开发还是部署,凭借全面的软件阵容,风河都会在每个业务环节提供全面的支持。这种灵活性允许合作公司利用最新的社区创新成果交付前沿产品,同时满足关键任务应用程序的功能安全性、信息安全性和可靠性要求。40微软 Windows CE 所有源代码全部由微软自行开发的嵌入式新型操作系统,不仅继承了传统的 Windows 图形界面,并且在Windows CE 平台上可以使用 Windows95/98 上的编程工具(如Visual Basic、Visual C 等)、使用同样的函数、使用同样的界面风格,使绝大多数的应用软件只需简单的修改和移植就可以在 Windows CE 平台上继续使用,操作简单,具有很好的适配性。西门子 Nucleus RTOS 的源代码是开源的,完全免费,可用于加快复杂多样的软件架构的实施。Nucleus RTOS 针对各种嵌入式应用,提供相应网络协议(如 TCP/IP,SNMP 等),以满足用户对通讯系统开发要求。可重入的文件系统、可重入的 C 函数库以及图形化界面等也给开发者提供了方便。针对不同的 CPU 类型,Nucleus还提供编译器、动态连接库、多任务调试器等相应的工具来配置用户的开发环境。3.主流厂商在我国的发展策略风河VxWorks客户可以免费得到VxWorks源代码,及所有网络、文件系统、无线、安全、图表、USB 等运行时代码,甚至包括所有平台。客户还可通过 VxWorks 系统平台,获取多时区实时帮助、具有多方面自助选项的在线支持网络以及可选的高级服务,帮助开发人员以最快的速度解决问题。西门子 Nucleus RTOS 以创新生态圈模式为产业升级提供端到端的数字化解决方案通过携手各方伙伴构建创新生态圈,实现以贯穿评估、咨询、集成实施与优化服务的端到端数字化解决方案和人工智能、边缘计算、5G 和工业云等前沿科技在工业制造、城市及基础设施、交通和物联网等领域的落地生根。41八、物联网操作系统产业分析(一)中国物联网操作系统市场竞争格局近几年来,全球物联网操作系统行业发展增速较快,尤其是在欧美及亚太地区,很多互联网公司进入该行业,从各国物联网市场出发,推动着物联网操作系统行业的发展。随着万物互联时代的到来,国内物联网操作系统市场规模也在迅速扩张。目前,市场上主要有十几种物联网操作系统,但都处在发展初期,产业链生态环境对此并未做出积极反映,同时,开源Linux 和 RTOS 仍然是市场主流,活跃在物联网市场。1.主流厂商的行业应用领域物联网是众多物联网设备的联网,以便开展不同数据的收集和共享服务,这使得围绕物联网硬件的联网、调度、管理及分析成为一个巨大的物联网操作系统市场。根据物联网市场情况将物联网操作系统分为物联网终端操作系统、物联网操作系统平台,各个物联网操作系统赛道内存在有不同厂商角逐。物联网终端操作系统,即面向物联网领域的实时轻量级操作系统,通过轻量级的硬件完成任务管理、内存管理、时间管理、通信机制、事件管理、定时器等操作系统基础组件,更好地支持低功耗、短报文、轻功能等场景,如传感器、路由器等。国外的主流厂商有美国风河、微软、ARM、英特尔等,国内主流厂商有华为、阿里巴巴、腾讯、海尔、翼辉、赛睿德、南瑞、航天信息、国网信通、新华三等。物联网操作系统平台,即物联网时代的基础设施,物联网操作系统平台是负责管理物联网中各种设备、网络与算法的系统软件,42其中设备包括各种传感器、摄像头、控制器等硬件设备,需要对例如 OPC-UA、Modbus、MQTT 等协议进行解析,通过多种网络传输手段如 TCP/IP、蜂窝网络、LoRA、Zigbee 等进行数据汇聚,然后进行算法应用的部署管理。国外的主流厂商有 IBM、微软、亚马逊、谷歌、霍尼韦尔等,国内的主流厂商有慧安股份等。2.主流厂商的市场占有情况目前物联网操作系统百家争鸣,全球还未形成垄断性质的产品,在全球各大厂商都意识到这个万亿级别市场的背景下,在物联 网 终 端 操 作 系 统,既 有 Andorid Things、RTX、Fuchsia、Free RTOS、VxWorks 等国外物联网终端操作系统,又有 LiteOS、AliOS Things、CT Wing、OneOS、联通雁飞等国内物联网终端操作系统新兴崛起。在物联网操作系统平台,有 IBM Waston IoT Platform、Azure IoT、Google IoT Core 等老牌国外 IT 厂商的新产品,又有慧安股份的慧安蜂巢物联网操作系统平台 IS-MEST 等国内优秀物联网操作系统平台。国内外各家产品都各有优劣。随着数字化转型的浪潮到来,物联网操作系统将成为未来风口,迎来强大的市场需求。在物联网终端操作系统厂商中,风河 VxWorks 可广泛支撑各种物联网设备,从消费者可穿戴设备到大型网络设备。华为 LiteOS面向物联网领域开发广泛应用于智能家居、穿戴式、工业领域等场景应用。阿里 AliOS Things 广泛应用在智能家居、智慧城市、新出行等领域。Tencent OStiny 支撑智慧城市、智能水表、智能家居、智能穿戴、车联网等多种行业。翼辉 sylixos 覆盖网络设备、国防安全、工业自动化、轨道交通、电力、医疗、航空航天等领域。赛睿德 RT-Thread 广泛应用于能源、车载、医疗、消费电子等多个行业。43在物联网操作系统平台厂商中,IBM Waston IoT Platform 对物联网中的设备获取价值,可应用于环境感知、消费、医疗、工业生产等领域。微软 Azure IoT 面向制造、能源、医疗保健业、零售、运输和物流等领域,建立管理、控制、定价、操作等功能。亚马逊AWS IoT 构建高效的物联网、设计良好的物联网,应用在制造、能源、电商、汽车等领域。谷歌 Google IoT Core 应用于汽车、制造、零售、机房、智慧工厂等领域。慧安股份 IS-MEST 提供规则引擎、可视化面板、设备连接、设备全生命周期管理、数据流转、协议桥等功能,应用于智慧城市、智慧军营、星基物联网、智慧农业、智慧园区、智慧能源、智慧工厂、智慧碳管理、智慧医疗等领域。表 2:现有物联网操作系统应用场景类别操作系统举例应用场景物联网终端操作系统uClinux工业控制、无人机、因特网设备(路由器、交换机、防火墙、负载均衡器等)、专用的控制系统(自动售卖机)VxWorks通信、军事、航空航天、工业制造机器人、医疗器械、汽车电子SylixOS航空航天、电力电网、轨道交通、机器人、新能源、医疗、工业自动化Andriod things应 用 于 除 手 机(Andriod)、电 视(AndriodTV)、车机(AndriodAuto)和穿戴式设备(AndriodWear)之外的物联网及嵌入式设备,适用于构建智能家居RT-Thread智能家电、网关、工业物联终端Alios things智能生活电器、智能穿戴设备、工业数据采集设备。44Huawei LiteOS智能家居、摄像头、智能水表、智能停车、智能照明Amazon Free-RTOS使用微控制器、RAM 和 ROM 资源较少的应用场景,如工业场景下的传感器、制动器、泵和自动化组件Fuchsia兼容手机、PC、智能家居等物联网场景物联网操作系统平台IS-MEST智慧园区、智慧安防、智慧能源、智慧军营、智慧煤矿、智慧管网、智慧加油站等场景IBM Waston IoT Platform环境感知、消费、医疗、工业生产等领域Microsoft Azure IoT制造、能源、电商、汽车等领域Google IoT Core汽车、制造、零售、机房、智慧工厂等领域(二)主流厂商的技术路线和发展策略1.主流厂商的技术特点物联网终端操作系统厂商:华为 LiteOS 是华为针对物联网领域推出的轻量级物联网操作系统,是华为物联网战略的重要组成部分,具备轻量级、低功耗、互联互通、组件丰富、快速开发等关键能力,基于物联网领域业务特征打造领域性技术栈,为开发者提供“一站式”完整软件平台,有效降低开发门槛、缩短开发周期,可广泛应用于可穿戴设备、智能家居、车联网、LPWA 等领域。阿里巴巴 AliOS Things 是面向 IoT 领域的轻量级物联网嵌入式45操作系统。致力于搭建云端一体化 IoT 基础设备。具备极致性能,极简开发、云端一体、丰富组件、安全防护等关键能力,并支持终端设备连接到阿里云 Link,可广泛应用在智能家居、智慧城市、新出行等领域。物联网操作系统平台厂商:IBM Waston IoT Platform 拥有一组成型的服务,它们是 IBM 通过 Maximo Asset Monitor、IoT、COS 等基础计算设施,提供包括计算、转发、数据集等。IBM 提供整套成型的服务,业务用户可以在自定义的仪表板中可视化其设备和资产当前和历史的趋势数据,只需要一个浏览器与云服务,就可以实现物联网操作系统的功能。微软 Azure IoT 提供一组托管和平台服务,用于连接和控制 IoT设备。Azure IoT支持大范围设备,包括工业设备、微控制器和传感器。IoT 设备与 IoT 和其他服务进行通信,后者处理设备数据来监视和管理设备。谷歌 IoT Core 是一项全代管式的操作系统服务,依靠多种连接能力,可连接管理分布在全球各地的数百万设备,从中提取数据。依靠Cloud Pub/Sub能力将分散的设备数据汇总到数据分析服务中,建立高速响应、安全、智能的 IoT 流水线。慧安蜂巢物联网操作系统平台 IS-MEST 是慧安股份为解决传统物联网体系架构中多协议设备连接、跨协议设备联动、多域数据流转、数据存储可视化等功能而自主研发的物联网操作系统,同时结合慧安蜂巢边缘操作系统进行边云协同管理,向用户提供设备管理、规则引擎、数据转发、数据可视化、数据管理、智能 AI 应用、设备联动、协议桥等多种功能。46表 3 物联网操作系统与通用计算系统对比特征通用型计算系统物联网操作系统形式和类型通用场景的计算机形式面向业务的物联网操作系统,形式多样、应用范围广泛。组成CPU、IO 总线与外设、软硬件独立既有面向终端设备的终端操作系统,也有管理物联网设备、网络、算法的物联网操作系统平台,软硬件相对独立。开发方式开发平台和运行平台都是通用计算机采用交叉开发技术,开发平台为通用计算机,运行平台包含嵌入式、通用计算机等。二次开发可重新编制通过 SDK 与 API 的形式为用户提供二次开发手段。2.主流厂商的生态建设IBM 延续其老牌 IT 企业对于市场和用户的严谨态度,通过不断丰富自身的功能及利用自己原有的生态关系,通过合理推广引流将原有生态伙伴的新需求导入到其物联网操作系统产品中,再不断迭代完善自身产品。微软 Azure IoT 作为微软打进物联网市场的一块利器,通过自有的云服务及原有的渠道打造自己的物联网生态。谷歌 IoT Core 通过建立谷歌 Cloud Platform 合作伙伴,将构建硬件、软件和创新解决方案,通过 Cloud IoT Core 将遍布全球的设备与 GCP 无缝连接。华为 LiteOS 通过生态伙伴计划,希望一起打造开放、共赢的物联网生态,快速获取商业成功,通过向合作伙伴提供技术、营销47和销售资源,帮助伙伴构建和发布产品和解决方案,不同伙伴等级有不同的权益和资格要求。阿里巴巴 AliOS things 深扎办公、智能家居、空气环境、智能厨房,通过自有渠道建立起相应的行业合作伙伴。慧安股份 IS-MEST 建立 ISCertify 互认证体系,基于国产基础架构之上建立起物理网感知层、网络层、网关层、边缘层、平台层、应用层的合作伙伴,互相开拓自身的渠道,基于纯自主可控的底层架构,以慧安蜂巢物联网操作系统平台为核心,与合作伙伴一同为用户提供国产化物联网解决方案。3.主流厂商在我国的发展战略目前,物联网操作系统整个市场处于初探阶段,各大厂商都在根据自身的既有资源扩充其对物联网操作系统的需求,进而推进自身产品在相关领域的推广,尚未形成统一的发展方向。各大厂商都处于以自有物联网操作系统为主,深扎某个行业的发展战略,只是在发展方向与细节上有所区别,像 IBM、微软、谷歌、阿里、华为、电信等老牌 IT 企业就根据自身原有市场和用户发展挖掘其新需求,也有像慧安股份等新兴物联网操作系统平台厂商深扎用户需求打磨自身基础产品,夯实物联网基础设施,通过集中力量完善自身产品核心能力,进而发展市场发现用户的发展战略。随着物联网市场的不断挖掘,相信各大主流厂商的发展战略会趋于同化并各有千秋。48九、国产操作系统发展面临的挑战和对策建议经过多年的发展,国产操作系统已经在诸多领域取得了长足的进步,无论在产品的功能性、稳定性、兼容性还是在单一产品的性能上都有了显著的提升。但 Windows、Android、iOS 等主流操作系统已形成较高的生态壁垒,如何发展和壮大国产操作系统产业还存在诸多问题亟待解决。(一)面临的挑战1.操作系统领域主流厂商的市场优势地位难以撼动windows 独霸服务器和桌面操作系统多年,早已成一枝独大之势。在服务器和桌面操作系统领域,微软 Windows 操作系统被公认是绝对的霸主,很多其他的科技巨头们难以研发出可以媲美Windows 的操作系统,在长达几十年的时间里,Windows 始终牢牢地稳定住了 PC 市场,Windows Server、Windows10 等都是爆款产品,受到了众多用户的亲睐。Android 在移动端占据优势地位。在移动操作系统领域,由于 Android 操作系统开源免费,很多上下游企业都围绕 Android 操作系统进行研发软硬件适配,建立了丰富的上下游产业生态链。国际巨头的挑战。亚马逊、微软等国际巨头垄断全球云操作系统市场,而且近年来开始在中国市场积极布局,跟国内厂商形成竞争态势,争夺市场份额。2.基础理论和技术研究缺乏体系性、高强度、持续性投入近年来,全球主要发达国家都纷纷制定相关计划,设立专门机构,49并拨出巨额款项,竞相开展软件工程研究。这些计划的核心是首先发展软件工程支撑环境,并以此为基础,向高度集成化、智能化的软件工程支撑环境发展。中国的软件工程核心技术缺乏,创新能力不足,与美国、日本,甚至印度等注重知识产权相比仍有追赶空间。长期技术积累不足。国产服务器操作系统和桌面操作系统开发主要是基于开源 Linux 发行版生长出自己的商业版。操作系统内在的原理、资源的调度方式、应用软件广泛的兼容性存在短板,核心技术积累不足。例如,嵌入式操作系统领域的核心元器件存在卡脖子现象,基于核心元器件的原始封装操作系统后续开发较为困难。国产软件工程化能力较弱。现代的操作系统功能复杂多样,导致系统软件特别庞大,由于工程化能力欠缺,使得操作系统的整体性,各种功能的一致性,资源调度的有效性,与微软、谷歌为典型代表的外国公司相比还存在着明显的差距。基础计算能力偏弱。操作系统和算力相结合是操作系统发展的主要技术路线,但我国计算能力较弱,国产芯片一直处于跟随状态,与国内操作系统适配的耦合程度落后于 Wintel 和 Android-ARM,为国产操作系统带来底层挑战。中国算力产业依然面临需求碎片化、国产基础软件生态和配套芯片不强、传输能力不足、无效算力增多、人才紧缺、难互通协同等诸多挑战。数据标准、通信协议被国外垄断。中国 95%以上的高端PLC 和工业网络协议被国外厂商垄断,工业数据采集能力薄弱。由于国外厂商设备数据不开放、接口不统一,造成设备的数据兼容性差、采集门槛高、采集难度大,制约了国产嵌入式操作系统的快速发展。缺乏持续高强度资金投入。操作系统研发需要持续投入大量50资金支持。微软公司在研发 Windows 操作系统新产品时,投入 4000多名工程师,历经 2 年,才公布了 Windows3.0,但 Windows3.0-3.2并没有形成市场收入,之后又高强度的投入,到 Windows95 才逐渐形成市场规模。据公布的最新报告显示,过去一年,亚马逊公司技术研发费用投资高达 226 亿美元,谷歌母公司 166 亿美元,英特尔公司131 亿美元。这些大型科技公司在研发资金投入方面都呈逐年增长趋势。国内操作系统整体发展起步晚、底子薄,缺乏调度算法等关键核心技术,操作系统从研发到商业化的较长时间内,无法取得任何收益,国内企业不愿意投入大量资金。这种大规模资金和高强度人力投入是国内操作系统厂商的短板。3.应用软件开发支持不足,生态建设相对滞后目前,国产操作系统占有的市场份额普遍都不高,缺少数量级的规模用户,导致基于国产操作系统的应用程序还较为匮乏,其他厂商围绕国产操作系统开发丰富的应用程序的意愿不强。国产操作系统生态建设相对较晚,与国外开源生态相比存在明显差距。应用软件生态不足,专业应用软件少,操作系统与软硬件适配度、耦合度低。微软 Windows 经过 40 年的发展,凭借强大的软硬件生态、Wintel 联盟以及不断地迭代更新,仅 Windows10 月活设备数超过 7 亿台,适配应用程序超过 3500 万个,软件版本超过 1.75 亿个,硬件/驱动组合 1600 万件。反观国产操作系统,目前专门为适用于国产操作系统而开发出的应用软件比较缺乏,适应性不强,生态基础薄弱,如工具软件、管理软件等应用软件生态尚没有建立。国产操作系统适配的软硬件数量与 Windows、Android、iOS 等主流操作系统相比存在数量级的悬殊差距,且生态呈碎片化。51国产操作系统集中度不高、过于分散。全球操作系统主要厂商微软、苹果、谷歌、亚马逊等少数几家企业。谷歌自 2008 年启动Android Market 以来,累计向 Android 应用开发者支出的金额有达 800亿美元(除了中国开发者),苹果公司自 2008 年 AppStore 推出至今,开发者已获得了逾 1550 亿美元的收入。对比国内,我国至少有十几家,特别是利用政策红利发展起来的诸多厂商占据的市场份额较小,使得技术、人才、资金、生态等社会资源难以形成积聚效应。操作系统企业成长的要素被割裂分散,难以与国外巨头竞争,形成了类似大树和小草式的竞争格局。例如,物联网操作系统属于新兴的细分操作系统赛道,市场对物联网操作系统认知不足,用户需求描述宽泛。国产操作系统市场分散,缺乏强大的核心企业引领技术和产品方向。由于国产操作系统基本是在 Linux 内核基础上二次开发,技术门槛相对较低,国内做操作系统的厂商数量多,从业人员相对较少,力量分散,规模都不大,技术路线也存在差异,造成了散、乱、多的特点,尚未形成有市场竞争力的大型企业。4.缺乏灵魂人物、专业人才及稳定开发团队领军人才缺乏。操作系统开发是一件复杂的软件工程问题,不仅需要有强大的开发团队,更需要有灵魂性人物主导。微软创始人比尔盖茨带领技术团队经过多年努力才最终开发出了Windows系统,这说明操作系统研发需要有绝对的核心人物牵头。专业人才不足。我国软件技术人员中70是从事程序开发、技术支持和服务的人员,软件产业发展所急需的系统分析师、架构设计师、高级工程师、项目经理等底层核心技术人才比较匮乏,无法满52足软件产业发展对高层次人才的需求。研发团队稳定性差。操作系统开发是一项系统性复杂工程,对研发团队的要求很高,保持研发团队的稳定性十分重要。团队稳定性影响着技术研发的连贯性、项目成果的前瞻性,国内操作系统研发公司则面临技术团队人员不足、流动性较大等问题,这些不利因素制约了国产操作系统的研发进程。5.国家支持国产操作系统发展政策比较分散近 20 年来,科技部、工信部等中央有关部委对操作系统国产化非常重视,国家相继出台了很多的支持政策,极大地推动了国产操作系统的发展进步,但也存在突出问题。没有充分发挥政府引导性作用。一方面,政府层面过度强调关键技术和重点项目研发的突破,对自主可控操作系统产业没有充分发挥政府引导作用,市场准入门槛较低,导致我国操作系统的发展现状是企业多、规模小、技术体系分散。另一方面,政府在国产操作系统采购时过度强调公开、公正、透明,使得国产操作系统的集采没有指向性,难以形成规模应用的拳头产品。政府对操作系统支持不够完善。政府对国产操作系统的支持方向存在一定的理解误区,政府出台的系列政策偏重对操作系统厂家研发端的支持,轻视了对适配硬件和客户应用开发端的支持,使得操作系统生态难以建立起来。(二)发展机遇1.中国市场规模应用潜力巨大根据最新数据显示,截止 2022 年 6 月,全球互联网用户数量达53到 50 亿人,中国网民规模 10.51 亿,互联网普及率达到 74.4%,成为全球互联网用户群体最多的国家。中国也是全球最大的 PC、手机终端市场,很容易形成国产操作系统的规模化应用,这将为推动国产操作系统发展提供强大内生动力。预测未来 3-5 年,如何抓住我国互联网规模应用的窗口期,将会是实现国产操作系统弯道超车的重要机遇。万物智能时代,众多厂商把视线转移到操作系统身上,尤其是物联网操作系统。作为重要底层软件技术之一,操作系统上承应用开发,下接海量的硬件终端,正在吸引国内外科技巨头布局物联网操作系统。而作为巨头们竞逐的下一个主战场,背后蕴藏的市场潜力难以估量。2.国际局势变化引发操作系统供应链安全担忧俄乌冲突发生以后,微软宣布退出俄罗斯市场,暂停相关商品销售及服务;SUSE 和RedHat 宣布不再为俄罗斯提供任何业务支持;Ubuntu 的开发方Canonical 公开表示将终止为俄罗斯企业提供服务。易地处之,如果微软、Ubuntu、RedHat 等停止对中国的服务与支持,国内企业将面临重大危机。中美关系日益严峻的当下,政府势必将更加鼓励打造原生自主安全可控的国产操作系统,掌握主动性,防止在这一领域被欧美国家“卡脖子”,以确保维护国家数字基础设施和信息安全。CentOS 停服推动了主要部委的国产化替代,国资央企也积极开展私有云建设。CentOS 停服背后是国外厂商商业模式的变化,尤其是在美国近期出台“不允许将安全漏洞共享到中国”的新规则后,国内企业对使用国外系统产生安全担忧。如何稳步推进国产操作系统的自主创新与市场推广成为了国产系统操作系统企业关注的焦点。3.国产操作系统发展具备基本条件我国整体计算能力显著提升。目前已建成全球最大规模光54纤和移动通信网络,算力产业规模快速增长。近五年平均增速超过30%,算力规模排名全球第二。同时,高端芯片、新型数据中心、超算等领域研发取得突破进展。新一代信息技术取得显着进步。云计算、5G 技术,通信技术的进步,使得桌面系统和服务器的切换连接更方便,网速更快,瘦客户机迎来发展新机遇。国产软件具备强劲的发展基础。经过多年努力发展,国内企业已经基本掌握了操作系统基本技术,软件工程正在被国内所重视,基本具备了开发操作系统的能力。国内服务器出货量大。中国软协预测,我国服务器操作系统市场到 2024 年至少有 6-8 倍以上的增长,仅仅服务器这个市场空间就会到百亿级人民币的规模,其中市场排名前三的厂商依次为浪潮、新华三、华为,这也是我国操作系统产业的新机遇。同时服务器操作系统更关键的是支撑了整个数字经济的底座,它会撬动万亿级的上游软件市场。操作系统迎来云时代发展契机。我国云操作系统主流厂商的技术实力与国外厂商处于并跑阶段,没有明显的技术差距。疫情之下,所有行业都开始转向进入“云时代”。预计十四五期间,我国数字经济将进入快速发展期,各行业数字化转型步伐加速,上云进程将持续推进成为新常态,对云操作系统的需求不断增加形成规模化应用,带动了云操作系统市场规模持续扩大。云操作系统需求增加,产生了多样化的场景需求,应用场景实践的增多将有助于我国云操作系统技术迭代,也为云操作系统市场的发展带来良机。国内云操作系统和国际巨头基本处于同一技术水平。国产云55操作系统具备自主核心技术,技术水平相对比较成熟,对比桌面和服务器操作系统,与国外云操作系统巨头处于同一起跑线,甚至在有些方面还处于技术优势地位。4.政府出台政策支持操作系统发展政府高度重视,利好政策频出。在国家政策顶层规划中,基础软件,尤其是操作系统在产业发展中的重要位置,相继出台了系列政策,支持国产操作系统做大做强。信息技术创新快速推进。近三年来,我国相继出台了多项政策,鼓励国内企业自主创新,尤其是信息技术创新体系的建立,让更多的国产操作系统有了更加强大的信心,在发展的过程中逐渐成熟和壮大。信创产业有望成为国产操作系统下一个巨头成长之地。制造业数字化转型逐步加快,促进嵌入式软件发展和市场壮大。随着单机装备智能化、智能装备群体化、人机交互语言化、复杂系统模块化转型趋势的逐步显现,基于国产软件企业的能力不断提升,面向于工业的软件产品和系统将成为软件企业转型和拓展的主要市场。嵌入式软件和操作系统的发展迎来了不可多的机遇。国内的制造体系不断扩大,为嵌入式操作系统提供了较好的硬件环境。国内拥有众多主要元器件生产厂商,需要鼓励软件厂商和硬件厂商合作,加大软硬结合一体化程度;通用性嵌入式软件要加大攻关力度和应用;我国是世界制造大国,应基于国产元器件,通过开源开放发展我国嵌入式操作系统。从嵌入式生产制造领域,鼓励基于嵌入式应用软件研发,带动操作系统普及应用,形成应用软件相对集中的趋势。国内智慧城市建设,推动多领域智能化进程。近年来,国家56对于智慧城市发展的政策支持不断加码。智慧城市要求能够充分运用信息和通信技术手段感测、分析、整合城市运行核心系统的各项关键信息,从而对于包括民生、环保、公共安全、城市服务、工商业活动在内的各种需求做出智能的响应,为人类创造更美好的城市生活,这为国产物联网操作系统发展提供了新的机遇。5.国内厂商积极布局构建生态体系开源成为国产操作系统实现逆袭的突破口。目前国内拥有约3500万开发者,成立了众多的开源社区,发布了数目众多的开源项目,开源进程全球最快。中国开源发展有着产业链优势,传统行业正在积极拥抱引入开源软件,开源与各个技术领域正在进行深度融合应用,构建安全可信的开源操作系统和由我国主导的根社区是国产操作系统发展的必然要求。2022 年,中国开源项目高速发展,技术与产业协同共进,中国开源操作系统正努力向国际先进水平靠近,尤其是运行在手机、嵌入式设备以及自动驾驶方向的操作系统研发,已形成新的产业热点。正在构建起丰富的开源生态体系。2020 年,由华为、阿里、百度等多家龙头科技企业联合发起中国首个开源基金会,开放原子开源基金会,遵循共建、共治、共享原则,系统性打造开源开放框架,搭建国际开源社区,提升行业协作效率,赋能千行百业。华为鸿蒙、欧拉加入开源项目,成立开源社区。麒麟、统信等国内厂商相继建立了开源社区,并积极参与国内其他开源社区建设,集聚了一大批上下游产业链企业资源,正在逐步做大操作系统产业软硬件生态链体系。软件接口开放,为物联网操作系统提供了技术基础。随着各大厂商对于物联网市场认知的提高,大家都意识到合作生态才能做大57做强物联网,所以整个物联网操作系统的生态正在逐步开放。(三)对策建议1.加大原始技术创新与积累操作系统以及主营操作系统的公司的创建,都是以10年为周期的,需要漫长的成长周期。当前国产操作系统软件需要根据未来新需求提供比国外品牌更有创新性的产品和解决方案,既完成国产替代,又实现新技术应用的升级。研发兼容技术,加强推广应用,让国产软件从能用好用常用转变;提升软件产品品质,加速迭代成熟,以广泛的产业应用提升自身核心技术,实现从追赶到并跑再到超越发展。2.加快制定行业标准统一技术要求第一,制定统一的接口标准。由国家主管部委单位牵头,统筹推进自主可控国产操作系统关键技术国家标准和行业标准研制,联合企业争取尽快制定操作系统的统一的技术架构路线、API 接口标准等国标,打造权威标准评测平台,做好标准的宣贯推广工作,加快推动国产操作系统创新发展。第二,搭建统一的国产计算适配优化平台。国产操作系统厂商应搭建统一的国产计算适配优化平台,完成从下层硬件到上层应用的适配工作,增强软硬件生态兼容能力。第三,建立统一标准技术体系。借鉴 Wintel、Android-ARM 联盟成功经验,通过政府引导、企业参与方式,共同制定操作系统行业标准,强化软硬件研发一体化能力。3.鼓励支持软件产品批量化应用支持软件产品首试首用,支持属于关键领域“补短板”、填补国58内空白、技术水平国内首创的软件产品实现首次应用;鼓励国有企业、事业单位在同等条件下,优先采用纳入国家和本市重点目录的软件产品,为基础软件、工业软件等领域关键核心技术提供早期应用场景和试用环境,促进关键核心技术突破、成果转化和产业化落地。首先,抢抓信创产业发展机遇。在党政、金融等领域扩大国产操作系统应用规模,形成规模效应,吸引更多的上下游厂商参与进来。其次,加强对国内外头部软件应用的适配与兼容工作。加大推进与国内外头部软件厂商的专业应用软件的适配兼容工作,将有助于国产操作系统在更大领域的推广与应用。第三,多点切入、重点示范。中国拥有全球最强大的工业制造体系、最庞大的互联网经济规模、最全面的网络通信技术,体量规模、工业数据、行业需求,建议在党政、金融、电力、能源等领域先行先试,打造标杆,示范推广。4.完善行业治理和优化价值评估加强软件知识产权保护的宣传,加强各个领域、各种形态、各种应用场景下的软件技术知识产权保护方法,措施研究以及法规制定,完善健全软件知识产权保护体系,并建立严格的实施机制,切实保护软件技术和应用创新。国家要鼓励原生操作系统创新,打造权威标准评测平台,建议国家各行业主管单位关注行业创新应用,给予行业评奖、标杆示范、人才奖励等多方面鼓励。5.重视推进国产操作系统进课堂发挥国家科研项目和评价体系的引导作用,鼓励更多的高校科研选题聚焦系统软件。深化产教融合、校企合作,加快高校科研到企业59产品化的成果转换。以促进学校、企业和社会的共同进步为目标,引入操作系统行业领军企业最优质资源,搭建“国产操作系统教学实践平台”,企业与院校建立全面友好的合作关系,打造校企实训平台,加强操作系统底层核心技术研发人才培养体系建设,做好操作系统教材和课程建设,打牢系统软件人才培养的基础。加强领军技术人才培养。国产操作系统厂商应积极培养高端 IT人才,通过与学校合作,搭建校企实践平台,提升技术人才的实践能力,并根据实训课程,更新教学教材内容,实现产学研链条化。6.构建多链条开源生态和纵深防御体系软件开源、硬件开放已成为不可逆的趋势,发展国产操作系统需要从传统的封闭开发模式转变为开源开发模式,聚集企业、高校和开发者的力量,协同推进操作系统技术的迭代创新。一是贯彻落实国家软件发展战略。加强开源体系建设,做好顶层设计,凝聚开源发展共识,广泛汇聚芯片、整机、操作系统、行业应用和服务商共同参与,形成一个协同创新技术生态,一方面加快操作系统与不同芯片架构和应用软件的适配,另一方面通过全栈优化、架构整合、软硬件协同来提升整体竞争力。二是打造中国特色开源根技术社区。更好地支持本土开发者的特色文化需求,打造开源根社区,把创新的力量汇聚到根社区,收敛技术,让更多的开发者、厂商做相应的技术支持、应用开发,促进行业繁荣发展。三是坚持生态开源,注重开发者交流与社区建设。加快社区项目建设,充分利用开源、参与开源、支持开源发展操作系统是当前最为60可行之路。学习国际经验,借鉴 Wintel、Android ARM 商业模式,建立一套公平合理的商业模式,给予开发者充分的利益,增加开发者适配的意愿。利用国内庞大的工程师数量红利,利用开源社区、开源组织等加强操作系统的软件迭代能力。四是打通国产操作系统上下游产业链。吸引软硬件厂商的参与,使国产操作系统与更多国产软件、硬件进行适配,形成良性循环生态。五是加强国际间开源合作。秉承“开放、分享、合作、共建”的开源精神,坚持国际合作与开放,共同打造全球化合作共赢的开源生态。7.发动产业资源优化营商环境第一,从政府层面精准发力,制定专项配套政策,打通国产操作系统上下游软硬件产业链条,鼓励建立完整的国产操作系统应用生态。第二,抓住国内信创产业发展机遇,加大政府部门、金融、能源等行业对国产操作系统的批量采购使用力度,加快国产化替代步伐,使国产操作系统不断在实战场景中不断迭代,提高产品行业竞争力,培育行业龙头企业。第三,鼓励和支持原生操作系统创新,国家主管部门要出台相关政策措施,开展行业卓越工程师评奖、推广标杆示范应用案例等行动,鼓励行业创新应用。第四,充分发挥行业协会商会的纽带作用,加强与行业企业沟通,联合政府、企业共同营造稳定、共享、透明的营商环境,提升营商环境。第五,积极发挥政府性融资担保和政府投资平台作用,发挥社会组织筹募资源能力,帮助企业破解项目融资问题。鼓励技术出海,将国产操作系统纳入中欧、一带一路等国家产业合作体系,借助国家的国际公共产品和国际合作平台,形成更大的开放格局。

    浏览量0人已浏览 发布时间2023-11-25 65页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 中国信通院:光计算技术与产业发展研究报告(2023年)(49页).pdf

    中国信息通信研究院技术与标准研究所 中国信息通信研究院泰尔系统实验室 2023年10月 光计算技术与产业发展研究报告光计算技术与产业发展研究报告 (20232023 年年)版权声明版权声明本报告版权属于中国信息通信研究院,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院”。违反上述声明者,本院将追究其相关法律责任。本报告版权属于中国信息通信研究院,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院”。违反上述声明者,本院将追究其相关法律责任。前前 言言 随着人工智能、大数据和云计算的快速发展,超高速和高能效计算的需求呈指数级增长。现有冯诺依曼架构下的传统电子信号处理器难以同时实现高算力和低能耗,而光计算可突破电子计算瓶颈,成为未来探索的重要方向。光计算,是采用光作为信息处理的基本载体,以实现信息处理或数据运算的新型计算体系。光计算能够发挥光的高带宽、低能耗、抗干扰、并行等优势,适合处理人工智能、信号处理、组合优化等复杂特定任务,是新型计算架构的重要发展方向。本报告的研究基于光计算的广义定义,从算力时代所面临的主要需求和挑战等出发,围绕经典光学与量子光学两大路线开展光计算技术与产业方面的发展现状与趋势研究。当前光计算仍处于发展的初级阶段,预计其发展可分三阶段逐步推进,当前需继续推进解决技术、产业、应用等三方面问题,建议我国从攻克关键技术难题、推动全产业链发展、开展新应用探索试点三方面寻求突破,推动实现高性能与低能耗的算力基础设施建设,助力我国数字经济持续高质量发展。光计算技术与产业发展处于起步阶段,对于关键技术、产业发展、应用场景等方面的研究和探讨还有待进一步深化,后续中国信息通信研究院还将进一步推动光计算领域研究并持续发布相关成果。目目 录录 一、光计算发展背景.1(一)研究背景.1(二)概念与分类.5(三)发展历程.8 二、光经典计算技术与产业发展态势.9(一)光电混合架构为主,专用光计算异军突起.9(二)三大趋势持续演进,体系化发展有望加速.13(三)产业链成熟度偏低,产业集群地域较集中.14(四)产学研持续一体化,三阶段推进市场应用.17(五)技术产业挑战仍存,国内外进度基本持平.18 三、光量子计算技术与产业发展态势.20(一)分层式架构为主流,两技术路线并行发展.20(二)遵循三步发展规划,芯片集成是发展方向.24(三)硬件软件持续发展,相关产业链仍需完善.26(四)多国积极布局规划,政策及资金支持加大.31(五)当前我国局部领先,未来发展仍面临挑战.33 四、总结与建议.36(一)光计算多领域应用前景广阔.36(二)光计算仍处发展的初级阶段.38(三)光计算预计将分三阶段推进.39(四)技术攻关协同产业应用发展.39 参考文献.41 图图 目目 录录 图 1 全球算力规模与算力增速.1 图 2 光计算与电计算的性能对比.3 图 3 光计算分类.6 图 4 光经典计算与光量子计算的系统结构对比.7 图 5 光计算发展历程.8 图 6 光经典计算技术框架.10 图 7 光电混合计算架构.11 图 8 光经典计算产业链.15 图 9 光经典计算产业视图.18 图 10 光量子计算技术框架.21 图 11 逻辑门光量子计算发展历程.22 图 12 相干伊辛机发展历程.22 图 13 逻辑门光量子计算原理示意图.23 图 14 相干伊辛机实装置示意图.24 图 15 逻辑门光量子计算发展阶段三步走.25 图 16 芯片集成光量子计算示意图.26 图 17 光量子计算产业视图.27 图 18 光量子计算软件示意图.30 表表 目目 录录 表 1 全球光经典计算企业及产品情况.16 表 2 全球光量子计算企业及产品情况.27 表 3 全球各国涉及光量子的项目规划不完全统计.31 光计算技术与产业发展研究报告(2023 年)1 一、一、光计算发展背景(一)研究背景(一)研究背景 全球算力规模不断扩大,下游应用市场算力需求增长强劲。据2023 年发布的中国算力发展指数白皮书,2022 年全球计算设备算力总规模达到 906 EFlops,增速达到 47%1(图 1)。伴随万物感知、万物互联以及万物智能时代的开启,据 IDC 预测数据,2025 年全球物联网设备数将超过 400 亿台,产生数据量接近 80 ZB,且超过一半的数据需要依赖终端或者边缘的计算能力进行处理。预估未来五年全球算力规模将以超过 50%的速度增长。OpenAI 数据指出,2012 年之前,人工智能的计算速度紧追摩尔定律,算力需求每两年翻一番;2012年以后,翻番时长则直接缩短为 34 个月,算力需求远超实际算力供给能力。来源:中国信息通信研究院中国算力发展指数白皮书(2023 年)图 1 全球算力规模与算力增速 算力升级面临绿色低碳发展问题。当前全球数字化转型正在加快,1 中国信息通信研究院中国算力发展指数白皮书(2023 年)光计算技术与产业发展研究报告(2023 年)2 未来相当长时间里这个大趋势不会改变。只要有数字化就需要算力支持,需要构建一个泛在的、低成本的、可靠的算力体系。但是算力基础设施的耗能较大,以数据中心为例,2020 年我国数据中心耗电量突破 900 亿千瓦时,碳排放量达 0.6 亿吨。据中国信息通信研究院测算,到 2030 年我国数据中心耗电量将超过 3800 亿千瓦时,如果不采用可再生能源,碳排放量将超过 2 亿吨,算力基础设施的绿色低碳亟待关注1。从长远来看,整个社会需要算力与连接构成的“数字底座”,也需要清洁能源与绿色技术构建的“绿色底座”,二者要协同发展。基于冯诺依曼架构的传统电子计算机的局限性日渐凸显。目前电子计算硬件采用的处理器的逻辑单元和存储单元是分立的冯 诺依曼结构,数据需要在处理器和存储器之间来回传输,频繁的潮汐性数据读写使得计算速率下降的同时增加了单次计算的功耗,带来的带宽瓶颈和功耗瓶颈严重限制了冯诺依曼架构的计算能效,即“内存墙”“功耗墙”问题。据曦智科技数据,在过去的 20 年中,硬件的算力提升了 9 万倍,但 DRAM 带宽及网络带宽只提升了 30 倍。据 Intel数据,在半导体工艺的 7nm 时代,数据搬运功耗达到 35pJ/bit,占总功耗比例 63.7%。此外,随着摩尔定律的放缓甚至失效,集成电路的晶体管数量正在逼近物理极限,当前电子微处理器的时钟速率仅为几个 GHz,已经不能满足超高速、低延迟的海量数据处理的需求。因此,为应对万物智能时代海量应用创新和重大技术革新对算力供给的百千倍递加需求,探索更多维度、更多要素的协同创新成为支撑绿色算 1 李洁,王月.算力基础设施的现状,趋势和对策建议J.信息通信技术与政策,2022(3):5.光计算技术与产业发展研究报告(2023 年)3 力升级的重要举措。光计算突破电子计算瓶颈,成为未来探索的重要方向之一。为突破电子芯片的一系列弊端,相关研究者们开始考虑从“电”向“光”的转化。如图 2,光子器件在进行计算时,相比电子器件具有以下优势:)光具有波长、波导模式、相位、振幅和偏振等多个物理维度资源,具有天然的并行计算能力,可以成倍地提高算力;)电信号在金属导线中传输必然伴随热量的产生,而光在计算时没有欧姆加热,因此其能耗远小于电子计算;)与电子器件相比,光子器件有更大的带宽,因此在宽带模拟信号的处理上远胜于电子器件;)电子器件具有电阻电容(RC)效应,因此会在计算中产生延时,而光学器件则基本没有延迟,具有更快的响应时间;)光子没有自相互作用,这意味着它们可以在没有相互干扰的情况下传输。这些优异的特性使得光计算极具发展前景。在特定场景中,利用光计算替代传统电子计算将是解决摩尔定律困境以及冯诺依曼架构瓶颈问题,即解决当前算力与功耗问题的极具潜力的途径之一。来源:Lightmatter HotChips 20201 图 2 光计算与电计算的性能对比 1 Lightmatter,Hotchips 会议报告Silicon Photonics for Artificial Intelligence Acceleration,2020.光计算技术与产业发展研究报告(2023 年)4 发达国家积极推动光计算研究与应用不断发展。美国方面,2019年美国国防部高级研究计划局(DARPA)启动“未来计算系统”项目,以研究具备深度学习能力、高算力和低功耗的集成光子芯片。2022 年4 月,国会宣布将拨款 2500 万美元,用于制造和测试光量子计算技术。欧洲方面,欧盟地平线 2020 研究和创新计划资助的项目之一PHOQUSING,正致力于开发基于集成光子技术的将经典过程和量子过程结合起来的混合计算系统。2022 年 9 月,德国航空航天中心启动 100 量子比特的光量子计算机研发项目。日本方面,日本电话电报公司正与东京理工大学合作资助一个为期五年的项目,研究相干伊辛机的实际应用。在如何为智能时代提供更强大的算力上,领先国家已在思考下一波的发展浪潮,光计算正是颇具潜力的选项之一。近年来我国相继出台一系列重大制度和政策,支撑光计算技术和产业发展。中共中央关于制定国民经济和社会发展第十四个五年规划和二三五年远景目标的建议 提出要系统布局新型基础设施建设、加快 5G、工业互联网、大数据中心等建设,推动算力产业生态日渐完善。科技部“十四五”重点专项申报指南中,信息光子技术、高性能计算、物态调控、光电混合 AI 加速计算芯片成为重要内容,包括光电混合 AI 加速计算芯片、量子计算、基于固态微腔光电子芯片、光学神经拟态计算系统和 PB 级超低功耗纳米光存储等技术的研发。中央网络安全和信息化委员会发布的“十四五”国家信息化规划,提出要加强集成电路、神经芯片、硅基光电子集成光量子芯片等关键前沿领域的战略研究布局。我国对光计算及相关光芯片的重视程度正在光计算技术与产业发展研究报告(2023 年)5 逐年提升。(二)概念与分类(二)概念与分类 光计算是采用光作为信息处理的基本载体,基于光学单元构建光学系统,通过必要的光学操作,从而实现信息处理或数据运算的新型计算体系1。从广义上来看,光计算是指基于光的波动性、粒子性等特性进行信息处理或数据运算的一类计算体系。从狭义上来看,光计算是指基于光的波动性进行信息处理或数据运算的一类计算体系。本报告的研究是基于光计算的广义定义。光计算按照物理实现的方式可分为基于经典光学的计算(以下简称光经典计算)和基于量子光学的计算(以下简称光量子计算)(图 3)。经典计算从原始计算、手工计算、机械计算、机电计算、电子计算逐步发展到光计算,光经典计算可利用光的波动特性如折射、衍射等规律来实现计算功能。量子计算有超导、半导体、离子阱、光学等多种技术方案,光量子计算是以光子作为量子比特进行计算,通过对光子进行量子操控及测量来完成计算。光具有波粒二象性,光经典计算基于光的波动性包括干涉、散射等,而光量子计算基于光的粒子性,包括量子态的叠加、纠缠等。光计算技术与产业发展研究报告(2023 年)6 来源:中国信息通信研究院 图 3 计算的发展和分类 光经典计算和光量子计算的计算原理不同,但系统结构基本类似(图 4),包括光发射部分、光处理部分、光探测部分等。1)光发射部分:光经典计算包括激光器和调制器,而光量子计算包括激光器和量子态制备装置。2)光处理部分:两种计算方式均可以分为逻辑门型和非逻辑门型两大类。光经典计算利用折射、散射、非线性效应等,基于马赫增德尔干涉仪(MZI)、微环等结构进行计算;光量子计算利用量子叠加、量子纠缠效应等,将经典光学器件进行量子应用。3)光接收部分:光量子计算需采用灵敏度更高的探测器,如雪崩二极管、超导纳米线探测器等,而光经典计算对探测器的灵敏度要求略低。光计算技术与产业发展研究报告(2023 年)7 来源:中国信息通信研究院 图 4 光经典计算与光量子计算的系统结构对比 光计算按照所处理的数据形态可分为通用的数字光计算和专用的模拟光计算。数字计算是对物理世界进行抽象和逻辑拆解,将一个任务切割成无数个标准化的小单元来完成。优点是通用性强、精度很高,缺点是占用大量底层硬件资源、容错能力很低。数字光计算利用光和光学器件组合形成经典的逻辑门,构建类似传统数字电子计算原理的计算系统,通过复杂的逻辑门组合操作实现计算。而模拟计算不需要抽象和拆解,只需要模仿和还原一个真实的物理结构,用相对较少的单元就可以完成任务,可以节省大量的硬件资源,但由于每个物理结构都是特定且专用的,因此计算的通用性差。相较于数字计算,模拟计算的精度更低,但容错能力更强。模拟光计算利用干涉、折射等物理特性,体现一种“传输即计算,结构即功能”的计算架构,典型例子之一是傅立叶运算,用传统计算机进行傅立叶变换非常消耗计算量,而光通过透镜的过程本身就是一次傅立叶变换的过程,计算的时间短、耗能少。鉴于光经典计算与光量子计算在计算原理和产业发展等方面存在较大不同,本研究报告将针对光经典计算和光量子计算这两大类分光计算技术与产业发展研究报告(2023 年)8 别展开技术与产业发展态势的分析讨论。(三)发展历程(三)发展历程 光计算的发展历程大致可分为三个阶段2:如图 5,第一个阶段为 20 世纪 40 年代到 80 年代,光计算概念提出,相关的科学研究开始萌芽;第二个阶段为 20 世纪 80 年代到 21 世纪初,光计算进入黄金发展期,基于各种形式的光计算层出不穷;21 世纪初至今,光计算发展进入第三阶段,从由于需求不足而研究热度稍降再到与新型应用领域结合的再次复苏,掀起研究热潮。光计算已经成为当前解决大规模复杂计算的重要解决方案。来源:中国信息通信研究院 图 5 光计算发展历程 在第一阶段,光计算的发展最早可以追溯到上世纪 40 年代。1946年,杜费将傅立叶变换引入光学中进而发展出的傅立叶光学是光学计算技术的起源。60 年代激光问世,开始了以激光为信息载体的信息处理研究。美国密西根大学创造性地利用光学傅里叶变换方法,借助于光计算技术与产业发展研究报告(2023 年)9 凸透镜完成了综合孔径雷达数据处理实验,奠定了并行光学模拟信息处理的基础。70 年代光学传输和非线性光学材料取得重大进展,同时也由于电子计算机的固有的某些缺陷随运算速度提高而明显地暴露出来,数字光计算逐渐引起科学家们的广泛注意。在第二阶段,80 年代光计算研究发展迅速,“光计算”这一术语被正式使用。随着世界上第一个光电传感器问世,越来越多的光计算器件得到研发。各国科学家提出了大量光计算技术,包括以模拟光计算代表的光学模式识别、逻辑光计算、光学神经网络、光互连、光学全息存储等。1990 年,美国 AT&T 贝尔实验室宣布研制成功了一台并行列阵运算的数字处理器。而人工智能技术的加速发展也为光计算注入了更多的发展动力。在第三阶段,自 21 世纪初,由于光计算所具备的超高的计算速率与当时各类应用中的计算需求普遍脱节,光计算的高速运算能力反而无法得到更多运用,因此光计算曾一度处于发展迟缓的状态,逐渐淡出人们的视野。但是随着基于硅基的摩尔定律逐渐面临失效,而与此同时,人工智能的大数据处理需求又日益增长,寻找新的计算平台迫在眉睫,光计算领域重新活跃起来。这一阶段中的光计算,因利用光的不同特性进行计算又被分为光经典计算和光量子计算两条路径并行发展前进。二、二、光经典计算技术与产业发展态势(一)光电混合架构为主,专用光计算异军突起(一)光电混合架构为主,专用光计算异军突起 光经典计算技术框架包括原理层、物理硬件层、软件算法层、功光计算技术与产业发展研究报告(2023 年)10 能层、应用层等。光计算仍处于发展演变过程中,其技术框架如图 6所示。当前无论是物理硬件还是软件算法都需进一步优化,应用方面也需进一步探索。来源:中国信息通信研究院 图 6 光经典计算技术框架1 光电混合架构的光计算是当前主流,其计算的实现依托于传统微电子单元与光计算单元两个部分3(图 7)。传统微电子单元:结构与普通电子计算机中的相应结构类似。一些不适用于光电计算的操作,如时域延迟、数据存储和非线性运算等,仍需要在微电子单元中实现,如计算与逻辑单元、控制单元、寄存器、缓存器等。光计算单元:光计算核心是光计算单元的关键,作为微电子处理器的性能突破和功能扩展,用来实现高速计算。该结构包含发射部分、处理部分和接收部分。发射部分包括激光器、调制器等,处理部分包括与光计算相关的MZI、微环等光器件,接收部分主要为光电探测器,光放大器可选。1 中国信息通信研究院 A2 课题光计算关键技术及产业发展研究,2021.光计算技术与产业发展研究报告(2023 年)11 光电混合计算结合光和电的优势,例如可将输入的数字信号转成模拟电信号驱动光芯片上的光调制器,利用光信号完成计算后,光信号再转成电信号进行非线性运算,之后返回计算结果,将现有电计算的灵活性与光学方法的带宽和速度相结合,并从某种程度上保留光学方法低能耗的特性。来源:中国信息通信研究院 图 7 光电混合计算架构 通用光计算主要基于逻辑门实现,发展较为缓慢。通用计算的设备是基于数字信号的,而数字信号处理技术的基本组成单元是各种逻辑门。各种光逻辑门的组合能够用来执行基本或复杂的计算功能,例如:二进制加法、减法、解码、编码,还用于构建二进制计数器,随机存取存储器单元和触发器。光逻辑门的实现主要基于半导体器件和光纤中的非线性效应4。常用的非线性器件有半导体光放大器、高非线性光纤、色散位移光纤、光子晶体光纤、周期性极化反转铌酸锂波导、硅基纳米线波导、硅基微环谐振腔等;常用的非线性效应包括交叉增益调制、四波混频、自相位调制、交叉相位调制、交叉偏振调制;光计算技术与产业发展研究报告(2023 年)12 相关的结构包括马赫曾德尔干涉仪、Sagnac 干涉环、太赫兹光非对称解复用器、非线性光环镜、超高速非线性干涉仪等。光逻辑门方案仍存在诸多问题,例如系统不够稳定、不易集成、系统成本高等,且光逻辑门所依赖的非线性材料和结构不可避免地为器件的设计和制造带来较大困难,大多数的光逻辑门研究尚处在实验室研究阶段,距离商用还有一段时间。受以上影响,当前通用光计算的发展较为缓慢。专用计算成为新的发展热点,应用聚焦人工智能与信号处理。人工智能方面,人工神经网络作为人工智能最重要的模型之一,因具有良好的泛化能力和鲁棒性而被广泛应用于各类场景之中。目前,光子神经网络技术的研究包含了前馈神经网络、循环神经网络以及脉冲神经网络这三种典型结构5。基于前馈神经网络进行的光计算研究主要集中在以下四个方面进行:光学线性加权总和、光学线性卷积、光学非线性激活函数和光学系统上的在线网络训练。基于蓄水池神经网络(一种典型的循环神经网络)的光计算研究主要集中在两个方向,一种是全光学类的蓄水池计算,另一种是光电类的蓄水池计算。脉冲神经网络的训练和物理实施方面还存在较多困难,暂未得到广泛应用。大多数关于脉冲神经网络的研究工作仍然集中在理论分析和简单结构的验证上,包括脉冲神经网络的训练算法和光学硬件实现。信号处理方面,全光通信技术在光域进行数字信号处理操作,因此它能有效地避免传统光-电-光交换方式中的电子速率瓶颈的限制。全光数字信号处理主要包括全光波长转换、全光信息转换、全光信号再生等光域数字信号处理技术等6。光信号处理呈现如下几个发展趋势:1)从二光计算技术与产业发展研究报告(2023 年)13 进制调制格式(OOK,DPSK)逐渐向先进高级调制格式(m-PSK,m-QAM)发展;2)从单信道操作逐渐向多信道(WDM,MDM)操作发展;3)从初级单一功能向复杂多功能发展;4)引入新的辅助材料(如石墨烯)从器件层面改善工作性能。(二)三大趋势持续演进,体系化发展有望加速(二)三大趋势持续演进,体系化发展有望加速 硅光有望成为实现集成光计算系统的主要材料平台。硅光因其CMOS 工艺兼容、集成度高等优势,有望成为集成光计算系统的主要平台。典型的硅基光计算案例包括 2x2 MZI 阵列提供矩阵矢量积实现矩阵运算、光波导延迟线实现蓄水池计算、多模干涉仪和相移阵列或等离子激元实现傅里叶变换、微环/亚波长超材料实现积分计算等。未来基于光电混合集成、异质集成等工艺,可实现不同功能单元的更高效集成,进一步提升系统的集成度。基于现有商用软件生态开发光计算工具。基于现有商用软件生态开发光计算的适用算法、工具等,一方面可加快开发速度和提高开发效率,避免重复“造车轮”的低效行为,另一方面由于用户对成熟商用软件具有较强的用户粘性,利用现有软件生态可提升用户认可度和接纳度。对于光计算而言,一般上层软件基于商用软件 Tensor Flow、PyTorch 等框架,模块内嵌特定算子通过 API 被大厂软件工具调用,构成大厂软件工具的光学算子库。光计算协同光互连构建光电混合计算新范式。计算系统主要有三个计算要素:数据处理、数据传输与数据存储,光芯片可用于加速前两项计算要素。在“光电混合计算新范式”中有一半的重点是解决数光计算技术与产业发展研究报告(2023 年)14 据互连问题。计算、控制和存储单元之间的大容量互连和硬件系统 I/O等,可通过光互连来实现有效通信。超大规模光电混合集成是实现大容量大带宽计算功能的底层技术。“光电混合晶圆级计算平台”解决方案可通过晶圆级片上光互连,实现任意互连拓扑、低延迟及低能耗。同时,为打破“内存墙”可设立远端资源池,并通过高效率的光互连,直接接入晶圆级计算平台内部的光网络,最终实现所有计算资源的最优配置7。(三)产业链成熟度偏低,产业集群地域较集中(三)产业链成熟度偏低,产业集群地域较集中 产业链仍处于发展起步阶段,成熟度偏低。光经典计算产业规模偏小,产品种类偏少且产量有限,大多为企业自行研发制造。就集成芯片类光计算而言,虽然它基于传统光电芯片技术与产业基础,但仍存在一定差异:传统芯片产业链各环节发展成熟,参与竞争的企业数量众多,技术成熟度也已满足大批量生产需求;光计算芯片涉及光电融合等问题,技术难度高,需由光计算企业全程把关,产业链相对封闭。当前光计算产品技术路线以光电融合的方式为主,芯片内部包含光芯片、电芯片及其他外围器件,组合封装为完整的光计算芯片产品。产业链上游由光芯片和电芯片两部分组成,从芯片制造材料、制造设备等原材料和设施,到芯片设计、芯片制造、和芯片封测等环节,都分别包含光和电两条子产业链。光芯片和电芯片分别制造完成后,加上外围器件再进行组合封装,成为完整的光计算芯片,实现光和电的协同工作。经过完整的生产流程,最终生产出的光计算芯片可以提供给产业链下游的企业客户,实现在各行业领域的算力应用(图 8)。光计算技术与产业发展研究报告(2023 年)15 来源:中国信息通信研究院 图 8 光经典计算产业链 光经典计算产业主要位于美国、欧洲、中国等。其中美国代表性企业包括:Lightmatter、Luminous Computing、Fathom Computing 等(表 1)。美企业技术多沿袭自高校,以上代表性初创企业技术都来源于麻省理工学院等。欧洲方面,英国的 Optalysys 沿袭剑桥大学研究成果,研发实力强劲;法国在光计算领域也出现了初创企业 Lighton。此外,我国企业也不断发力,曦智科技、光子算数等企业纷纷加入国际光计算产业竞争行列。企业研发进度呈现两种状态,部分公司出现业务转变或拓展。全球约有近 10 家较为典型的初创企业已经形成以光计算为核心的主营业务,主打产品为基于光芯片的光计算加速器,并配套开展软件、系统、原型机的研制与开发。当前企业研发进度呈现两种状态。一是光计算业务停滞,如 Fathom Computing 暂无商用消息,Lighton 从 2020年起专注于为生成式 AI 构建并商业化基础模型;二是光计算业务积极推动,如 Lightmatter、Optalysys、光子算数等积极推出光计算新产品,为传统电计算提供光学协处理加速。Lightmatter 的 AI 推理加速光计算技术与产业发展研究报告(2023 年)16 芯片 Envise,已开始应用于人工智能背景下的推理过程。Optalysys 的FT:X 2000 光学处理器主要的应用场景包括无人驾驶、医学图像分析以及安全系统等,而即将推出的全同态加密加速器芯片预计将有效解决全同态加密过程中的速度与功耗问题,应用于电子商务、政府数据管理、人工智能等领域。光子算数的计算加速卡可实现定制化任务计算加速,用于时间序列分析、机器学习推理等过程,已初步部署于企业业务机房。与此同时,部分公司业务出现由光计算向光互连转变或拓展趋势,如 Luminous Computing 的重点从光计算向芯片间光互连转变,Lightmatter、曦智科技由单纯光计算向光互连领域拓展。表 1 光经典计算企业及产品情况 国家国家 企业企业 产品类型产品类型 产品名称产品名称 商用情况商用情况 商用时间商用时间 美国 Lightmatter AI 推理加速芯片 Envise 已商用 2021 年 可编程光互连芯片 Passage 已商用 2022 年 深度学习软件工具套件 Idiom 已商用 2022 年 Fathom Computing 基于分立器件的光计算原型机/样品阶段/Luminous Computing 光学 AI 芯片/样品阶段/欧洲 Optalysys 光学处理器 FT:X 2000 已商用 2019 年 全同态加密加速器 Enable 研发阶段/LightOn 光学协处理器/集成于Jean Zay 超级计算2021 年 光计算技术与产业发展研究报告(2023 年)17 机 云平台 LightOn Cloud 已商用 2018 年 本地软件 LightOn Appliance 已商用 2018 年 来源:中国信息通信研究院(四)产学研持续一体化,三阶段推进市场应用(四)产学研持续一体化,三阶段推进市场应用 高校、初创企业、行业巨头协同推动产学研持续一体化。包括微软、IBM 和 NTT 等在内的国际知名公司和基于高校研究成果孵化的初创公司均投入大量资源,聚焦于推进该领域的发展,但侧重点有所不同。行业巨头主要从需求侧出发,研究方向聚焦于针对其主要业务领域中存在的特定计算需求,利用光计算系统实现加速和性能优化。如微软推出了用于纯模拟域迭代的光电混合计算系统 AIM,用于加速复杂金融交易问题的迭代计算;IBM 则基于 PCM 材料的集成光子器件实现了基于光域计算集成系统的流量分析和信号异常检测等。对于初创公司,如孵化于 MIT 的 Lightmatter 和孵化于巴黎高师的Lighton 等,则主要从技术层出发,通过构建相关光学系统,实现卷积、向量乘法、矩阵乘法等算子的光域加速,与 FPGA 或 ASIC 相结合,构建用于通用计算架构的光学协处理器。这些初创企业受到科技巨头、金融机构的高度重视,获得大量融资基金用于产品商业落地,如 2023 年 6 月,Lightmatter 宣布筹集了 1.54 亿美元的 C 轮融资,7月 Optalysys 宣布筹集了 2100 万英镑的 A 轮融资。总体来看,高校、初创企业、行业巨头多方协作,结合各环节力量,构建产学研一体的产业模式(图 9)。光计算技术与产业发展研究报告(2023 年)18 来源:中国信息通信研究院 图 9 光经典计算产业视图 预计未来光经典计算产业路线可分为三个阶段。第一阶段,当前至未来的 3 年内落地体现光计算优势的应用场景,如在人工智能、数据中心等场景中基于光计算实现推理和图形渲染等。第二阶段,光计算优势明确后将进入金融和能源电力市场,该市场需要更多芯片的协同,更大体量的矩阵乘法以及更成熟的软件体系。第三阶段,随着硬件和软件体系更加成熟,计划切入车载计算、移动互联网等既对算力有需求,同时也对功耗、可靠性、软件生态等有更高要求的大众市场中。(五)技术产业挑战仍存,国内外进度基本持平(五)技术产业挑战仍存,国内外进度基本持平 当前,光经典计算技术已成为当前研究热点,但该技术仍处于初级阶段,技术与产业发展等方面均存在诸多问题。从技术角度来看,硬件层面存在以下三方面问题。设计成熟度低:当前的设计思路大多基于光电分立式设计,且相关设计也大多集中于器件而非系统层面。集成难度大:光计算涉及异质集成、三维集成、光计算技术与产业发展研究报告(2023 年)19 光电混合集成等多种先进集成方式,当前发展尚不成熟。系统规模小:随着规模化的扩展,光电协同问题更加突出,当前光计算可实现的系统规模仍较小。算法层面存在以下三方面问题。适合特定算法:光芯片时钟主频高,适用于数据依赖性高,时间序列相关、语义信息深的算法。此外,当前主流的光计算为模拟计算,无法支持浮点数,即使对于定点数,当精度超过 8 比特时,模拟计算在能耗方面的优势会减小,因此适用于低比特模型计算,定位于专属处理单元的加速。光电融合问题:算法推理层面需要光电协同,目前并没有全光的端到端芯片处理,需要在电域进行指令控制。混合精度问题:混合精度计算需要开发新的工具链。从产业发展角度来看,存在至少以下三方面问题。路线尚未收敛:当前技术路线众多,任一技术路线实现产品化都需要巨大投入(资金、周期等)。财政资金/资本市场难以同时支持多条技术路线完成“研发-产品-市场”的产业化短期闭环。产品规划尚不明确:行业处于初期阶段,产品形态/目标市场尚不明确,未能牵引研发形成聚焦突破。产业配套服务尚不完善:从事光计算研发的机构多为初创公司或创业团队,具有流片量少、订单不稳定、个性化强等特殊性,产线缺乏向此类订单开放的动力,不利于产业创新生态的培育。全球范围内的研究与投资热情增长,我国与欧美基本并跑。随着各大高校以及微软和 IBM 等产业巨头在光计算领域成果的发布,光计算技术的认可度逐步提升。5 年时间里,全球范围内布局光计算的公司从零星几家,增加到目前的数十家。我国光计算研究热情较高,光计算技术与产业发展研究报告(2023 年)20 北京大学、华中科技大学等多家院所高校均涉足其中,相关学术交流也日益频繁,Deep Tech 科技创新周先进计算论坛、光电集成芯片立强论坛等均热烈讨论光计算相关主题。华为在 2019 年分析师大会上宣布投资光计算,8 月公开了一份“光计算芯片、系统及数据处理技术”的发明专利,后续与清华等高校开展光计算合作项目,进行探索性前沿研究。以曦智科技和光子算数为代表的初创公司,近三年初步应用落地,但纯商业客户较少,市场仍有待进一步开拓。三、三、光量子计算技术与产业发展态势(一)分层式架构为主流,两技术路线并行发展(一)分层式架构为主流,两技术路线并行发展 构建光量子计算系统,较为公认的技术方案是将复杂系统抽象为分层体系架构,并逐层攻破。其技术框架如图 10 所示,可大致分为基础的原理层、物理硬件层、中间层、算法软件层、功能实现层及面向客户端的应用层等。与其他技术路线的量子计算平台相比,光量子计算平台具有光量子比特相干时间长、平台易扩展等优点,同时也存在光子不易存储、难操控等缺点。光计算技术与产业发展研究报告(2023 年)21 来源:中国信息通信研究院 图 10 光量子计算技术框架 光量子计算根据逻辑门的有无,可分为逻辑门光量子计算和非逻辑门光量子计算。逻辑门光量子计算是当前主流方案,目标是构建通用光量子计算平台,发展历程如图 11 所示。非逻辑门光量子计算主要用于解决特定优化问题,是专用光量子平台,如相干伊辛机(Coherent Ising Machine,CIM),发展历程如图 12 所示。光计算技术与产业发展研究报告(2023 年)22 来源:中国信息通信研究院 图 11 逻辑门光量子计算发展历程 来源:中国信息通信研究院 图 12 相干伊辛机发展历程 逻辑门光量子计算以光子的偏振、路径等自由度作为量子比特,通过构建光量子逻辑门并形成光量子线路完成对量子态的幺正操作。光量子比特的逻辑操控可利用相移器、分束器、非线性光学克尔介质等实现空间调制、路径编码,并可进一步构成通用光量子逻辑门进行计算。图 13 是逻辑门光量子计算原理示意图,计算过程包括三个步骤:量子光源的制备输入(初态制备)、光量子线路对输入光源进行幺正操作(初态的幺正演化)、单光子探测器对输出光子进行测量(末光计算技术与产业发展研究报告(2023 年)23 态测量)。逻辑门光量子计算优越性首次验证是由我国中科大的“九章”实现,近期最具代表性的阶段性进展是加拿大 Xanadu 在 2022 年6 月推出的 Borealis,其完成了 216 个光子的高斯玻色采样实验8。来源:中国信息通信研究院 图 13 逻辑门光量子计算原理示意图 以CIM为代表的非逻辑门光量子计算平台不具备通用量子门集,CIM 是利用量子失协作为计算资源的耗散式量子计算机。图 14 是CIM 装置示意图,CIM 基于相互耦合的光学参量振荡器网络,通过以光纤中的激光脉冲相位(相位处于 0 态和态)作为量子比特进行计算,又被称之为光网络型量子计算机。CIM 适于形成超大规模的量子神经网络,可在常温、常压下工作,被用于解决组合优化类问题。CIM 起源于美国斯坦福大学,是日本量子计算机的主要研发路线,我国初创公司玻色量子也在从事 CIM 的研发。近年来,CIM 发展迅速,取得许多阶段性突破。2021 年 9 月,日本 NTT 基础研究实验室发布了具有 100,512 个简并光参量振荡器脉冲作为 Ising 自旋量子比特的CIM9。2022 年 11 月,中科院光电研究所及中科院半导体所等几个研究机构联合发布了支持 25600 个自旋量子比特的 CIM10。2023 年5 月,玻色量子发布了具有 100 量子比特的国内首台相干光量子计算机“天工量子大脑”。光计算技术与产业发展研究报告(2023 年)24 来源:中国信息通信研究院 图 14 相干伊辛机实装置示意图 现阶段,CIM 与逻辑门光量子计算平台相比,量子比特数占优,或在短期内更具应用前景。目前,逻辑门式光量子平台的比特数处于数百位水平,而 CIM 已实现数万个自旋量子比特,CIM 在量子比特数上的压倒性优势,或有望使 CIM 更早进入落地商用。(二)遵循三步发展规划,芯片集成是发展方向(二)遵循三步发展规划,芯片集成是发展方向 逻辑门光量子计算是构建通用光量子计算平台的主流技术方案,其发展可大致分为三个阶段,如来源:中国信息通信研究院 图 15所示。光量子计算的第一阶段主要任务是验证光量子计算的优越性,被用来解决诸如玻色采样这类单一性问题。含噪声中规模光量子计算包含数百个有噪声的光量子位元,适合解决分子模拟、组合优化、机器学习等特定问题。这一阶段的光量子位元因没有经过纠错,只能在有限的相干时间内执行不完美操作,在具体执行时,会与经典计算有机融合,形成互补混合型的架构来处理问题。通用容错型光量子计算机是发展的终极目标,将包含数百万个容错的光量子比特,可根据任务需求进行编程计算。光计算技术与产业发展研究报告(2023 年)25 来源:中国信息通信研究院 图 15 逻辑门光量子计算发展阶段三步走 逻辑门光量子计算根据平台搭建方式的不同,可分为分立式和集成式两种。分立式光量子计算平台通过使用分立的光学元件构建光量子线路,实现高斯玻色采样等单一目的计算,如“九章”平台。分立式平台相较于集成式平台更易于实现,但缺点是空间占用大、难于扩展,主要用于单一目的计算,不适合作为实现未来通用光量子计算的技术路线。集成式光量子计算相较于分立式平台,具备体积小、易扩展等优点,可用于解决玻色子采样、量子模拟、量子仿真等问题,是未来实现通用可编程光量子计算的主流技术路线。集成式平台通过将经典的集成光子技术和器件进行量子应用,利用单光子源作为量子信息载体输入,结合晶片尺度的制造工艺,在氮化硅、铌酸锂等材料上将各类光学元件进行集成,构建具备信息处理能力的光量子线路,实现芯片集成式光量子计算,如图 16 所示。光计算技术与产业发展研究报告(2023 年)26 来源:中国信息通信研究院 图 16 芯片集成光量子计算示意图 现阶段,逻辑门光量子计算的优越性已得到验证,短期内发展目标将集中在对含噪声中规模集成光量子计算的技术研究及应用方面。逻辑门光量子计算硬件平台依托传统的光芯片技术,发展迅速,未来有望完成大规模集成,其集成芯片化已成为必然趋势。2023 年 4 月,北京大学等单位联合发布超大规模集成硅基“光量子计算芯片”“博雅一号”,集成约 2500 个元器件,首次实现了片上多光子高维度量子纠缠态的制备与调控。(三)硬件软件持续发展,相关产业链仍需完善(三)硬件软件持续发展,相关产业链仍需完善 现阶段光量子计算仍处于实验室研发的初级阶段。核心参与者不多,科研与市场活跃度呈现增长趋势,未来将有更多企业/科研机构加入。光量子计算产业视图如图 17 所示,包括底层组件支撑系统、光量子处理器整机、软件开发及应用服务四个环节。从产业链来看,光量子计算硬件设备供应及软件开发商主要以国际公司为主,中国企业也具有一席之地。光计算技术与产业发展研究报告(2023 年)27 来源:中国信息通信研究院根据公开信息整理 图 17 光量子计算产业视图 光量子计算企业主要集中在欧美地区,我国近年来成立部分企业。光量子企业发展模式主要分两类,一类遵循软、硬件协同发展,如Xanadu、Quandela、图灵、玻色等;另一类是重点发展硬件处理器的设计封装,如 Photonic Inc、Wave Photonics 等(表 2)表 2 全球光量子计算企业及产品情况 国家国家 企业企业 成立时间成立时间 产品类型产品类型 产品名称产品名称 发布时间发布时间 美国 PsiQuantum 2016 年 百万量级的通用硅光量子计算机/加拿大 Xanadu 2016 年 可编程光子量子计算机 Borealis 2022 年 软件 Xanadu Quantum Cloud 2021 年 Strawberry Fields 2021 年 模拟器 Lightning 2022 年 Photonic Inc 2016 年 硅基光量子芯片设计制造/光计算技术与产业发展研究报告(2023 年)28 英国 Wave Photonics/集成光量子电路封装/ORCA Computing 2019 年 可扩展光量子计算机/TundraSystems Global 2014 年 光量子处理器系统/法国 Quandela 2017 年 光量子计算平台 MOSAIQ/软件 Perceval/光源设备 PROMETHEUS/荷兰 QuiX Quantum 2019 年 集成式光量子处理器 12-qumodes 2021 年 20-qumodes 2021 年 丹麦 Sparrow Quantum 2016 年 光量子计算技术组件 单光子芯片/来源:中国信息通信研究院 光量子计算关键硬件组件包括量子光源、单光子探测器以及光量子芯片,其中光量子芯片是核心,是各企业研发重点。近年来,多个光量子计算企业通过与芯片制造商合作或自建芯片试线研发光量子芯片。美国 PsiQ 与全球领先半导体制造商 GlobalFoundries 合作研发基于硅光集成光量子系统 Q1。加拿大 Xanadu 与 Imec 合作开发了基于超低损耗氮化硅波导的下一代量子比特。Xanadu与GlobalFoundries合作制造了 300 mm 硅光器件。我国成立了无锡光子芯片联合研究中心,用于研发高端光子芯片工艺技术。总体而言,光量子计算的芯片产业正以循序渐进的逐步发展。光量子软件正处于架构探索和迭代发展的起步阶段,根据功能不同可大致分为两类:光量子计算编译软件和光量子计算应用开发软件,光计算技术与产业发展研究报告(2023 年)29 如图 18 所示。光量子计算编译软件位于光量子计算硬件平台上层,既是光量子技术软件发展的助推器,亦是应用服务开发的支撑平台,自下而上包括光量子指令集、量子中间语言(QIR)和编程框架。光量子计算指令集是面向光量子处理器的特定量子指令集,通过一系列光量子处理器可以识别并执行的物理指令来控制光量子操作时序等底层信息。QIR 通过将高级编程语言转化为量子计算机可识别语言,实现二者之间的有效通信,是实现经典-量子混合算法的关键一环。同时,QIR 是量子硬件平台无关语言,它将量子指令或门集信息留给目标计算环境,以便后续量子指令的优化生成。目前,光量子指令集及量子中间语言尚处于发展初期,国内外光量子计算初创企业及相关科研结构正积极投入布局。光量子计算应用开发软件是面向量子模拟、量子金融、组合优化等各类应用场景研发的应用软件。服务商可通过向用户提供光量子软件开发工具包和光量子计算云平台进而为用户提供解决方案。量子软件开发工具包是用来开发量子算法的工具,可用于使用经典编程语言的量子模拟器;光量子计算云平台为用户提供访问量子计算机的途径,用户可通过量子云平台在真正的量子计算机上测试他们的代码。现阶段这类软件的研发及发布主要由国内外从事光量子计算研发的科研团队及企业主导。光计算技术与产业发展研究报告(2023 年)30 来源:中国信息通信研究院根据公开信息整理 图 18 光量子计算软件示意图 近年来,国内外企业均开始积极布局光量子计算软件。2018 年,全球首款专用光量子计算软件 FeynmanPAQS 由上海交大金贤敏教授团队自主研发成功并发布。FeynmanPAQS 作为光量子芯片设计辅助系统与光学模拟系统,被用来配合光量子计算机 TuringQ Gen1 形成软硬一体的用户体验。加拿大 Xanadu 推出了 Xanadu Quantum Cloud(XQC)云平台服务和 Strawberry Fields 应用程序库,使企业和研究人员可以使用 Xanadu 的光子量子计算机。量子计算软件公司 Quantum Computing Inc.(QCI)在 2022 年 5 月收购了光量子计算硬件公司QPhoton,加速光量子计算体系的可访问性。目前光量子计算软件仍处于初级发展阶段,相关产品仍在不断更新研发中。高质量光量子软件的存在既可以使用户能够更好的使用光量子硬件平台,同时也是促进光量子计算不断发展进步的一个重要因素。光计算技术与产业发展研究报告(2023 年)31 (四)多国积极布局规划,政策及资金支持加大(四)多国积极布局规划,政策及资金支持加大 近年来,光量子计算领域逐渐引起政、企、研、用等多方重视,全球多国纷纷通过制定项目规划,加大投融资等举措支持以光量子计算为代表的多条量子计算路线的科研及产业发展,如表 3 所示。表 3 全球各国涉及光量子的项目规划不完全统计 区域区域 国家国家/组织组织 项目规划项目规划 发布时间发布时间 欧洲 欧盟 战略研究和产业议程(量子旗舰)2022 年 英国 国家量子技术计划 2013 年“光量子集成电路封装(QPICPAC)项目”2022 年 国家量子战略 2023 年 德国“光量子项目”(企业合作类,5000 万欧元)2022 年 量子技术行动计划 2023 年 荷兰“光子集成电路项目”(总投入 11 亿欧元)北美 美国 量子互联路线图 2022 年 芯片和科学法案(其中 2500 万美元投给 PsiQ 和格芯)2022 年 加拿大 量子光子学传感与安全研发计划 2014 年 国家量子战略(4000 万加元投给光量子企业 Xanadu)2023 年 亚洲 日本 量子科学技术(光量子技术)的新推进方策 2017 年 光量子跃迁旗舰计划(Q-LEAP)2018 年“光量子计算机研发计划”(总投入 2000亿日元)2021 年 量子技术创新战略(最终报告)2020 年 量子未来社会展望 2022 年 韩国 量子科技发展战略 2023 年 新加坡“国家量子计算中心(NQCH)”和“国家量子无晶圆厂(NQFF)”2022 年 澳大利亚 澳大利亚 国家量子战略 2023 年 来源:中国信息通信研究院 光计算技术与产业发展研究报告(2023 年)32 欧洲在光子集成方面有丰富的经验,可以利用光子集成为量子技术创建全球量子供应链。在由欧盟资助的量子旗舰计划中,集成光量子已被公认为量子通信供应链的基础技术,研究重点是开发优化光量子材料、架构和器件,并集成到光量子电路中。英国方面,自 2013 年开始实施的英国国家量子技术计划建立了量子通信中心和量子计算与模拟中心,这两个中心都有关于集成光量子技术和光量子集成电路技术的工作计划。德国方面,2022 年由德国初创企业 Q.ANT 牵头,联合 14 家合作伙伴共同开展了光量子项目,旨在加快可在常温下运行的光量子计算芯片研发。荷兰方面,2022 年 4 月,荷兰政府通过国家基金并联合私营企业向光子集成电路产业投入 11 亿欧元,以加速光子芯片技术创新研究。北美通过政策支持、加大投资等方式支持集成光量子计算的技术研发和制造。美国方面,能源部于 2020 年确定光量子设备组件的优先发展机会,包括量子光源、光量子存储器、单光子探测器等。同时,由于光量子系统可以与国防量子传感器更好地结合,美国防部更为青睐光量子计算发展。美国政府在 2022 年向格芯(GlobalFoundries)及PsiQuantum 联合拨款 2500 万美元以支持光量子芯片开发。加拿大于2014 年提出的量子光子学传感与安全研发计划,重点推进科学研究和量子应用的发展。2023 年 1 月,加拿大宣布启动国家量子战略,其中 4000 万加元被投资给光量子企业 Xanadu。亚洲多国高度重视光量子技术产业发展。我国一直大力支持光量子技术的发展,自 2015 以来,我国科技部等主要的资助机构以及各光计算技术与产业发展研究报告(2023 年)33 地方机构,为集成光量子研发提供了约 5000 万元人民币。新加坡在大约 15 年前建立了量子技术中心,并提出了国家量子工程计划,为重点研究项目提供资金。研究目标包括基于波导和光纤的超大规模光子集成平台、硅量子光子学等方向。日本政府将光学和量子技术视为优先研发领域,并制定了长期国家战略 2020年量子技术创新战略,着眼于技术的产业化和创新。澳大利亚在传统光子学的研究及产业方面具有良好基础,光谱学、网络安全和量子计算领域初创公司的出现促进了光量子计算的发展。澳大利亚有几个专注于光子学和量子技术的大型卓越中心,各政府机构投入了大量资金。澳大利亚在在光量子领域的研究优势在于集成量子光子电路的制造,其相关研究人员数量正在稳步增长,澳大利亚完全有能力将这些技术推向市场,并培养新一代科学家和工程师。(五)当前我国局部领先,未来发展仍面临挑战(五)当前我国局部领先,未来发展仍面临挑战 光量子计算发展正处于初期阶段,技术研究、应用探索和产业生态保持平稳发展态势。技术研究方面,光量子计算硬件物理平台的比特数频频刷新纪录,相关物理器件持续研发跟进,光量子电路集成芯片化也在不断推进中。应用产业方面,关于光量子计算算法和应用的探索也在不断深入,在量子化学、生物医药等组合优化问题方面的探索可能率先诞生“杀手级”应用。量子计算软件系统研究取得较大进展,量子云计算应用和产业生态建设加速发展,科技巨头相互竞争态势更加明显。科研方面,我国率先实现光量子计算优越性验证,在全球范围内光计算技术与产业发展研究报告(2023 年)34 占有一席之地。2020 年 12 月,中科大潘建伟院士团队在“九章”平台上成功实现了高斯玻色采样实验,实现光量子计算优越性的首次论证。2021 年,该团队对九章进行扩展,从 76 个光子扩展到 113 个光子,再次验证了光量子计算的优越性。继我国之后第二个在光量子计算平台上实现量子计算优越性的团队是来自加拿大的 Xanadu。2022年 6 月,Xanadu 推出了可编程平台 Borealis,并在该平台上进行了高斯玻色采样实验,在36s内探测了216个光子序列。“九章”和Borealis各有优劣势,“九章”采用的是分立式光量子器件,Borealis 是集成芯片式平台。在可编程性及光子数方面,Borealis 优于“九章”;在净透射率和干涉仪深度方面,“九章”优于 Borealis。我国在光量子器件性能提升以及光量子芯片的研发方面保持良好发展态势,并在探测器领域保持国际领先优势。关于光子源的制备,我国研究团队处在领先地位,中科大潘建伟团队自 2013 年首创量子点脉冲共振激发技术后,一直引领高性能量子点单光子源的发展。纠缠光源方面,2023 年 6 月,中科大郭光灿院士团队基于自发四波混频过程实现了量子纠缠光源的低温集成,此成果为光量子器件的片上集成和低温条件下的应用奠定了基础11。在探测器方面,我国赋同量子的尤立星团队研发的超导纳米线单光子探测器(SNSPD)在国际上处领先水平,该团队于 2020 年 11 月推出的基于氮化铌材料的 SNSPD,其探测效率达 98%;2022 年 8 月,该团队在国际电工委员会(IEC)牵头制定的首个单光子探测器国际标准获批发布。在集成光量子芯片研制方面,芯片衬底材料的测试找寻、芯片互联结构的搭建等均在积光计算技术与产业发展研究报告(2023 年)35 极探索中,我国北京大学、浙江大学等多个团队致力于此。2023 年 4月,北京大学等团队合作研制了超大规模集成硅基“光量子计算芯片”“博雅一号”,实现了片上多光子高维度量子纠缠态的制备与调控12。国外光量子集成芯片研发团队较为有代表性的是 PsiQuantum和 Xanadu。此前,PsiQuantum 与 GlobalFoundries 合作生产了 300mm晶圆的硅基光量子芯片,并在芯片上集成了单光子源和光子探测模块。Xanadu 与 GlobalFoundries 于 2022 年 3 月建立合作,旨在研制含纠错能力的光量子芯片,首批全功能设备预计将于 2023 年底准备就绪。企业方面,近年来国内外多家光量子初创公司相继成立,其中以欧美企业居多,实力较强。国外的光量子企业主要分布在美国、加拿大以及欧洲等地,实力较为突出的当属加拿大的 Xanadu 和美国的PsiQuantum。Xanadu 已推出多款硬件、软件以及模拟器产品;PsiQuantum 自 2016 年创立之初就以建立 100 万量子比特的容错光量子计算机为目标,估值达 31.5 亿美元。我国的光量子科技公司有图灵量子、玻色量子两家,虽起步稍晚,但发展迅速,目前已有软、硬件产品推出(见表 2),彰显了一定的企业实力。综上所述可知,我国光量子计算基础科研及部分光量子器件发展与国际先进水平基本持平,产业发展略逊色于起步较早的美、加等国。光量子计算未来发展仍有许多棘手问题尚待解决。在硬件方面,最为典型的棘手问题当属容错光量子逻辑门的构建问题,眼下虽涌现出了一些较为认可的理论方案,如利用表面码构建逻辑比特,但距离实验实现尚需时日。实现容错可编程的通用光量子计算至少是十年以上的光计算技术与产业发展研究报告(2023 年)36 远期目标。此外,设计成熟度低、集成难度大、系统规模小等与光经典计算的共性技术问题也有待解决。在软件算法和应用探索方面,关于光量子计算的软件系统和适用范围的探索还处于起步阶段,相关软件数量有限,功能也较为局限单一,同时获得超越经典计算优势的光量子计算的实用案例尚未明确,故光量子计算的实际应用场景仍需进一步探索。产业方面,人才短缺问题明显。未来通用光量子计算机的实现,必然需要不同领域的人才通力合作,而目前的人才数量以及培养模式还不足以支撑产业的发展。未来,应加大人才培育力度,保证行业人才供给,促进光量子计算领域的持续快速发展。标准方面,光量子计算标准化工作尚处于起步阶段,主要在术语定义、光量子器件等方面开展规范性研究,目前国际标准组织 ISO/IEC JTC1、IEEE、ITU-T 和国内标准组织 TC578 主要开展术语定义类标准研究,IEC TC90 则从事光量子器件方面的标准研制。四、四、总结与建议(一)光计算多领域应用前景广阔(一)光计算多领域应用前景广阔 光计算速度的提升有望在一定程度上解决各个领域中对大数据处理的急切需求,在未来万物互联的智能社会中,光计算可以在人工智能、气象监测、金融投资、生物医药等诸多领域发挥重要作用。人工智能领域。神经网络计算中,90%左右的时间和能耗用于进行矩阵乘法运算,驱动经典计算机的深度学习算法需要使用嵌套循环进行乘法运算,而光学技术十分适合用于以完全并行的方式进行矩阵乘法运算。此外,使用光学的硬件以光速运行,延迟只受到光学系统光计算技术与产业发展研究报告(2023 年)37 的飞行时间的限制,而且能量耗散非常少,结合光的自然并行性和速度已经产生了强大的计算能力。未来随着硬件的发展以及人工智能技术的完善,这两个领域的交叉结合可能会在真正实用化应用方面产生突破,突破方向可能包括处理庞大的数据量、建立更优秀的模型、研究更准确的算法以及使用更多数据集等。气象监测领域。气象模型非常复杂,需要强大的算力设备,随着全球气候变化加剧,通过强化算力以提升气候监测水平,成为越来越多国家的共识。2022 年,法国量子计算公司 PASQAL 宣布与化学公司巴斯夫就天气预测等应用展开合作,目的为探索如何将量子计算用于预测天气。金融投资领域。随着多样化金融服务的普及,金融行业的经营模式、基础框架与产业模式也在经历重大变革,对于算力的要求也越来越高,目前已有多家光量子计算企业与研究机构以及金融机构均开始探索量子计算应用。但由于目前可使用的光量子系统规模较小,大部分基于已有成果是实验性的,何时应用能够落地尚需观察,光量子计算对于金融领域产生真正影响可能仍需时日。生物医药领域。光经典计算已可用于基因序列比对,Optalysys 光协同处理技术在基因测序方面具有很高的灵敏度,于 2017 年展示了其首款商用产品,该产品的数据处理能力相比于现有的电子计算能力有较大提升。传统药物研发流程过程极为缓慢且费用极高。光量子计算能够用于模拟候选药物与体内靶点之间的相互作用,其与人工智能的相互配合,利用人工智能的自动化使数据收集的成本更低且更可靠,光计算技术与产业发展研究报告(2023 年)38 有选择地评估药物特性,从而快速筛选大量药物。光计算对于生物医药领域的潜在影响主要体现在提高设计效率、提升现有材料性能、缩短上市时间以及节约研发成本等方面。目前这些方面已有一些初期研究结果,但依旧受限于系统硬件技术,目前的阶段性成果主要停留在实验验证阶段。未来随着技术的逐渐成熟,光计算在未来几十年的时间里可能对生物医药领域产生深远影响,长期潜力较大。(二)光计算仍处发展的初级阶段(二)光计算仍处发展的初级阶段 光经典计算与光量子计算均基于传统光器件技术与产业基础,具备一定的共用性,但当前发展尚不成熟,光计算在发挥巨大潜力的进程中,仍然面临着许多挑战:关键技术尚未完全成熟,诸多方案有待验证。当前光计算尚未经历大规模应用验证,需要底层硬件和软件算法等多方面技术共同推进。硬件层面包括设计成熟度低、集成难度大、系统规模小以及容错光量子逻辑门的构建等问题。软件算法层面包括适合特定算法、光电融合、混合精度以及软件系统尚不成熟等问题。学术界与产业界需持续推进研究,进行的诸多技术探索方案有待进一步验证。行业处于发展初期,产业化链条有待完善。当前光计算产业仍处起步阶段,市场与产品尚未定型,技术路线众多导致财政资金与资本市场难以同时支持多条技术路线产业化。产业配套服务尚不完善,从事光计算研发的机构多为初创公司或创业团队,产线向此类流片量少、订单不稳定、个性化强的订单开放动力不足。另外此赛道内公司与人才数量短缺,影响产业快速发展。光计算技术与产业发展研究报告(2023 年)39 计算领域渗透率不足,新应用场景有待挖掘。鉴于光计算技术与产业发展尚不成熟的现状,用户存在成本和可靠性等较多顾虑,还未开始大量部署。光计算目前主要应用于在数据中心、高性能计算中心等场景,但渗透率明显不足。同时,工业制造、安全生产、医疗、金融等行业的数据计算与处理的大量需求还需要进一步深耕,大量的新场景等待开发。(三)光计算预计将分三阶段推进(三)光计算预计将分三阶段推进 当前及未来算力需求远超实际算力供给能力,光计算采用光作为信息处理的基本载体,突破现有电子计算瓶颈,成为未来探索的重要方向。光经典计算方面,光电混合光计算是当前主流计算框架,“结构即功能”的专用模拟计算近年来成为发展热点。预计发展路线将按照三步走计划,从初步落地到拓展应用场景再到更为大众的市场中去。当前产业链整体成熟度偏低,产品种类偏少且产量有限,但全球范围内的研究与投资热情增长。光量子计算方面,分层式架构为主流,计算平台的发展路线预计将按照三步走计划,从光量子计算优越性验证到含噪声的中规模光量子计算,而通用容错型光量子计算机是光量子计算发展的终极目标。现阶段光量子计算仍处于实验室研发的初级阶段,核心参与者不多,科研与市场活跃度呈现增长趋势。(四)技术攻关协同产业应用发展(四)技术攻关协同产业应用发展 针对光计算面临的问题,本报告从技术、产业、应用三个方面给光计算技术与产业发展研究报告(2023 年)40 出我国光计算的发展建议。攻克关键技术难题,促进核心技术产业化。加强光计算关键技术研发和产业化方面的人员、设备、资金等方面的投入力度,聚集优势资源集中攻坚,促进光电芯片的仿真、设计、验证等 EDA 流程优化、芯片加工工艺以及三维集成封装等光经典计算与光量子计算共性技术发展,推动解决集成度低、集成难度大、系统规模小、容错性逻辑门构建等问题,促进核心技术产业化落地。推动全产业链建设,优化企业扶持政策。加强产学研结合,推动产业链的上下游联动。把光计算芯片纳入国家发展战略之中,推动半导体材料、光芯片器件等光经典计算与光量子计算共性产业支撑基础发展,进一步完善产业配套服务。充分发挥资本和地方投资对新型产业和技术的激励作用,设立专项基金支持产业发展,针对优秀企业给予优惠政策和奖励措施。开展新应用试点,助推商业化落地。推动扩大光计算在数据中心、高性能计算中心等场景的应用范围,深入挖掘新型商业落地模式,落地一批应用示范。探索其在消费、教育、智能制造等业务领域的拓展能力,形成企业可持续发展的良好商业模式。光计算技术与产业发展研究报告(2023 年)41 参考文献 1 李修建,贾辉,杨俊波等.光计算技术基础,2013.2 Pierre Ambs,Optical Computing:A 60-Year Adventure,Advances in Optical Technologies 2010,372652(2010).3 Zhiping Zhou,Pengfei Xu,Xiaowen Dong.Computing on Silicon Photonic Platform.Chinese Journal of Lasers 47,060001(2020).4 方中勤.全光逻辑门关键技术研究.北京邮电大学,2018.5 Wu J,Lin X,Guo Y,et al.Analog Optical Computing for Artificial Intelligence.Engineering 10,133-145(2022).6 龙运.基于硅基光子器件的光子信息处理.华中科技大学,2019.7 曦智科技.大规模光电集成赋能智能算力网络白皮书,2023.8 Madsen,L.S.,Laudenbach,F.,Askarani,M.F.et al.Quantum computational advantage with a programmable photonic processor.Nature 606,7581(2022).9 Toshimori Honjo et al.,100,000-spin coherent Ising machine.Sci.Adv.7,eabh0952(2021).10 Cen,Q.,Ding,H.,Hao,T.et al.Large-scale coherent Ising machine based on optoelectronic parametric oscillator.Light Sci Appl 11,333(2022).11 Lantian Feng,Yujie Cheng,Xiaozhuo Qi,et al.,Entanglement generation using cryogenic integrated four-wave mixing,Optica 10,702-707(2023).光计算技术与产业发展研究报告(2023 年)42 12 Bao,J.,Fu,Z.,Pramanik,T.et al.Very-large-scale integrated quantum graph photonics.Nat.Photon.17,573581(2023).中国信息通信研究院中国信息通信研究院 技术与标准研究所技术与标准研究所 地址:北京市海淀区花园北路地址:北京市海淀区花园北路 52 号号 邮编:邮编:100191 电话:电话: 传真:传真: 网址:网址:

    浏览量0人已浏览 发布时间2023-11-23 49页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 赛迪前瞻:应对量子计算挑战需积极推进后量子密码研发和迁移(2023)(12页).pdf

    -1-2023 年 4 月 24 日 第2023 年 4 月 24 日 第1818期 总第 806 期期 总第 806 期 应对量子计算挑战 需积极推进后量子密码研发和迁移 应对量子计算挑战 需积极推进后量子密码研发和迁移 量子计算是新一轮科技革命和产业变革的前沿领域。近年来,具备抵抗量子计算机攻击能力的后量子密码得到主要国家的高度重视,美国已发布多项后量子密码迁移的战略、政策和法规,其技术研发和产业化位于全球前列。基于此,赛迪研究院网络安全研究所建议,我国应高度重视量子计算可能带来的密码技术应用风险,以保障关键信息基础设施网络安全为目标,尽快在国家 -2-层面统筹开展为期 10-15 年的后量子密码研发和迁移计划。一、量子计算给密码技术应用体系带来巨大威胁 一、量子计算给密码技术应用体系带来巨大威胁 密码是网络安全的基石,主要包括非对称密码、对称密码、散列密码三类,其广泛应用于数据机密性和完整性保护以及身份认证和电子签名等领域。总体来看,量子计算对非对称密码算法威胁较大,并对关键信息基础设施安全构成威胁,例如银行、保险等金融信息系统,能源信息系统,工业控制系统,电子政务和国防信息系统等。同时,电子认证、区块链和数字货币等建立在非对称密码基础之上的大量应用和产业也将面临极大挑战。(一)量子计算将在未来(一)量子计算将在未来 10-20 年威胁到传统密码技术应用 年威胁到传统密码技术应用 一是在非对称密码方面,目前已有量子计算算法(如 Shor算法)将破解非对称密码的难度大幅降低。加拿大风险管理组织Global Risk Institutions 的调研显示,60%的主流科研人员和企业研发人员认为,在 20 年内量子计算机将可以在 24 小时内破解RSA-2048 算法。兰德公司的预测更为悲观,大约再过 10 年左右,主流非对称密码算法将会被量子计算机破解。二是在对称密码和散列密码方面,已有量子计算算法(如 Grover 算法)能够将其破-3-解难度减半,但可通过增加密钥长度和输出摘要长度的方法维持对称密码和散列密码的强度。(二)后量子密码研发和迁移是应对量子计算挑战的关键(二)后量子密码研发和迁移是应对量子计算挑战的关键 后量子密码主要包括四类,即基于格的密码、基于编码的密码、基于多变量方程式的密码、基于哈希的签名。此外,量子密钥分发也是应对量子计算威胁的手段之一,能够保障通信双方分享随机、安全的密钥,实现加密和解密功能。不过,量子密钥分发在实际应用过程中,需要通信双方建立专用的传统物理通信链路,并额外部署相关硬件设备。由于其基础设施建设成本较为高昂,目前看较难实现规模化和网络化应用。相较之下,后量子密码的实现主要基于软件技术,其成本较低且易于迁移和维护,能够提供完整的加密、身份认证和数字签名等解决方案,是应对量子计算威胁可行性更高的方案,得到了更多国家的重视和关注。(三)后量子密码迁移周期预计在(三)后量子密码迁移周期预计在 10 年以上,工业控制系统应对量子计算威胁更加紧迫 年以上,工业控制系统应对量子计算威胁更加紧迫 考虑到主要国家部署和使用非对称密码的周期为 20 年,且我国国密算法的大规模推广使用周期为 10 年,因此完成关键信-4-息基础设施等后量子密码迁移至少需要 10 年,这一过程涉及后量子密码算法的研发、标准制定、产品认证、小范围试点和大规模推广等。特别地,美国网络安全和基础设施局评估后提出,工业控制系统由于硬件更换周期长且地理分布较广,其后量子密码迁移面临的挑战将比其他领域更大,应对量子计算带来的网络安全威胁也更加紧迫。二、主要国家和企业推进后量子密码研发和迁移的举措 二、主要国家和企业推进后量子密码研发和迁移的举措 目前,美国在后量子密码研发和标准化方面积极汇聚全球力量,发布了后量子密码迁移战略和政策法规,在产业化发展方面处于全球领先地位。(一)战略和政策法规层面:明确后量子密码迁移路线图 美国出台专门的战略和政策法规,指导联邦机构向后量子密码迁移。(一)战略和政策法规层面:明确后量子密码迁移路线图 美国出台专门的战略和政策法规,指导联邦机构向后量子密码迁移。在战略方面,2022 年 5 月,拜登签署的总统令关于促进美国在量子计算领域的领导地位,同时降低易受攻击的密码系统风险的国家安全备忘录(简称备忘录)提出,到 2035年,要大幅降低量子计算对现有密码技术应用体系的安全威胁。2023 年 3 月,美国发布的2023 年国家网络安全战略提出,-5-政府应增加对后量子密码迁移的有关投资,广泛更换容易被量子计算破坏的硬件、软件和服务。在法律法规方面,2022 年 12 月,美国总统拜登签署了量子计算网络安全防范法,要求加快梳理联邦机构中易受量子计算攻击的 IT 系统,并向后量子密码迁移。在政策方面,2022 年 8 月,美国网络安全和基础设施安全局发布关键信息基础设施向后量子密码迁移的新见解,对美国55 类关键信息基础设施向后量子密码迁移的紧迫性进行了分析。2022 年 9 月,美国国家安全局发布商业性国家安全算法组件2.0,建议联邦机构加快部署使用后量子密码 CRYSTALS-Kyber和 CRYSS-Dilithium。表 1 美国推进后量子密码迁移的举措 表 1 美国推进后量子密码迁移的举措 举措举措 具体内容具体内容 1.提出后量子密码迁移目标 备忘录提出,到 2035 年,大幅降低量子计算对现有密码技术应用体系的安全威胁。2.梳理易受量子计算机攻击的的 IT 系统清单(简称“清单”)(1)量子计算网络安全防范法要求白宫管理和预算办公室、网络安全和基础设施安全局进行协作,在法案公布 180 天内制定 IT 系统向后量子密码迁移指南,以此明确各联邦机构易受量子计算机攻击的 IT系统清单、需优先迁移至后量子密码的 IT 系统特征、研究后量子密码迁移方案。(2)关键信息基础设施向后量子密码迁移的新见解提出,网络安全和基础设施安全局已对 55 类关键信息基础设施向后量子密码迁移的紧迫性进行了分析。同时提出,加快推进“提供互联网信息服务”、“提供网络身份管理和信任服务”、“提供网络安全保障”等类型关键信息基础设施向后量子密码迁移非常关键,是其他类型系统后量子密码迁移的基础。3.指导联邦机构 IT 系统向后量子密码迁移 量子计算网络安全防范法要求,在美国国家标准与技术研究院发布后量子密码标准一年后,白宫管理和预算办公室应发布指导意见,要求各联邦机构将“清单”中的系统迁移至后量子密码。-6-4.营造良好的后量子密码研发和迁移环境(1)备忘录提出加强对有关人才培养,将量子信息和相关网络安全知识列入各级学校教学课程。(2)备忘录提出加强量子信息和相关网络安全领域的国际合作。截至 2022 年底,美国已与法国、英国、芬兰、瑞典等国签署了量子信息科技合作的联合声明。(3)量子计算网络安全防范法备忘录均提出要做好联邦机构IT 系统后量子密码迁移过程中的成本开支预算。数据来源:赛迪网安所整理 数据来源:赛迪网安所整理 欧洲为前瞻研究量子密码迁移提供政策支持。欧洲为前瞻研究量子密码迁移提供政策支持。2022 年 10 月,欧洲网络安全局(ENISA)发布的后量子密码:集成研究提出,在短期内,应加快构建后量子密码迁移和量子密钥分发混合的解决方案。2021 年 1 月,法国发布的量子计算国家战略提出,在 5 年内投入 1.5 亿欧元用于后量子密码迁移研究。法国国家网络安全局于 2022 年 3 月发布关于后量子密码学迁移的科学和技术建议,建议国家尽快提出后量子密码发展的路线图。(二)技术和标准层面:筛选优秀后量子密码 美国国家标准与技术研究院(二)技术和标准层面:筛选优秀后量子密码 美国国家标准与技术研究院(NIST)推进后量子密码解决方案征集及标准制定。)推进后量子密码解决方案征集及标准制定。NIST 从 2016 年开始启动后量子密码标准协议全球征集项目,目前标准评估已进入第四轮,预计将于 2024年发布后量子密码标准,这将是美国政府推进后量子密码迁移的基础。NIST 认为,受限于对未来量子计算认识的不足,后量子密码的研究面临诸多挑战,例如,第四轮评估中的候选后量子密码-7-SIKE 已被比利时学者使用经典计算机破解。另外,NIST 还表示,目前其筛选的后量子密码尚不适用于传统密码与后量子密码混合使用的解决方案。欧盟通过资助一系列项目推进后量子密码研究。欧盟通过资助一系列项目推进后量子密码研究。2015 年,欧盟部署了后量子密码算法项目 PQCRYPTO 和 SAFCRYPT,荷兰、德国、比利时等国均参与了该项目。2022 年,欧盟启动了“向后量子密码转型”项目。欧盟“地平线 2020”以及“地平线 2021-2027”等研发框架对 PQCRYPTO、“向后量子密码转型”等项目进行了资助。同时,欧盟学者提交的 NIST 后量子密码候选方案最多,参与和主导了超过 20 个候选方案。(三)产业层面:推进后量子密码产业化发展(三)产业层面:推进后量子密码产业化发展 根据 Inside Quantum Technology 的测算,预计到 2029 年,后量子密码软件和芯片市场规模将达到 95 亿元。IBM、谷歌等企业正逐步推进后量子密码产业化发展,并在实践中验证后量子密码的有效性。例如,IBM 已将 NIST 前期征集的 CRYSTALS-Kyber和 CRYSS-Dilithium 算法应用在 Z16 大型机中,这两个密码是由IBM 联合一些大学研发。谷歌云在传统密码的基础上叠加使用了-8-后量子密码 NTRU-HRSS,强化云上数据安全。微软 2018 年发布PQCrypto-VPN 开源项目,测试 VPN 服务中后量子密码的性能。英国 PQShield 已将后量子密码应用于端到端信息通信加密服务。中国集成电路企业沐创于 2022 年 7 月研发出了全球首款抗量子攻击商用密码芯片。三、几点思考 三、几点思考 近年来,我国一些部门、协会和企业已在积极推进后量子密码研发和迁移,比之于美国进程相对较慢,考虑到量子计算发展迅速且传统密码技术应用体系被颠覆的风险越来越大,建议尽快在国家层面统筹推进后量子密码研发和迁移计划。(一)推进后量子密码研发和标准化(一)推进后量子密码研发和标准化 一是将后量子密码研发纳入国家级量子信息科技、网络安全等重大项目和研发计划,给予经费支持,鼓励和引导有关高校、科研院所和企业前瞻开展联合攻关研究。二是建设量子计算公共服务平台,为后量子密码有效性的验证营造良好环境,推动降低科研机构研发成本。三是加快将后量子密码纳入高校网络安全、密码、量子信息科学等相关课程,培养更多后量子密码研发人才。-9-四是推动有关行业协会、科研机构牵头面向全社会以竞赛等形式征集后量子密码备选方案,在各主体充分验证讨论的基础上逐步推进制定后量子密码标准,并推进后量子密码标准的国际化。五是强化国际合作交流,在美国对中国信息技术打压力度日渐加大的背景下,加快与“一带一路”沿线国家展开后量子密码联合研发攻关。(二)推进关键信息基础设施向后量子密码迁移(二)推进关键信息基础设施向后量子密码迁移 一是对金融、交通、能源、工业、教育、电子政务和国防等领域关键信息基础设施进行盘点,根据关键信息基础设施资产的重要性、易受攻击性、密码迁移难易性和成本等列出设施向后量子密码迁移的优先级。二是制定关键信息基础设施向后量子密码迁移的指南和时间表,尽可能减少后量子密码迁移的过渡期,并动态跟踪和评估迁移进程,解决后量子密码迁移中的困难。(三)推进后量子密码产业化发展(三)推进后量子密码产业化发展 一是遴选后量子密码解决方案优秀典型案例,并在各地区、各行业进行试点示范和推广应用。二是鼓励建设后量子密码有关开源社区和开源项目,汇聚更多技术创新和产业化应用力量。三-10-是为后量子密码相关企业上市融资创造良好条件,研究后量子密码设备采购的减税政策。四是鼓励建立后量子密码相关产业联盟,促进政产学研用等各类资源汇聚。本文作者:赛迪研究院 张博卿 联系方式: 电子邮件:zhangboqing

    浏览量0人已浏览 发布时间2023-11-22 12页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • Akamai:应用程序和 API SOTI 报告(31页).pdf

    钻过安全漏洞:第 9 卷,第 2 期 SOTI1互联网现状第 9 卷,第 2 期应用程序和 API 攻击呈上升趋势钻过安全漏洞:第 9 卷,第 2 期 SOTI1目录漏洞频现的一年Web 应用程序和 API 流量分析 数字化时代的应用程序和 API 攻击风险:对不同行业的攻击有何不同留意(安全)缺口:API 攻击研究引发对风险的关注结语和更多建议:填堵边缘缺口方法致谢名单24钻过安全漏洞:第 9 卷,第 2 期 SOTI钻过安全漏洞:第 9 卷,第 2 期 SOTI2漏洞频现的一年 Log4Shell 和 Spring4Shell 等重大漏洞的出现印证了 Web 应用程序和 API 所带来的严重风险,也体现出这些威胁面的重要影响。为了加强整体运营,企业依然在积极采用更多 Web 应用程序。平均而言,每家企业使用的应用程序数量已经达到了 1061 个,充分体现出这一攻击面在不断扩大。现有安全漏洞依然让攻击者有机可乘,层出不穷的新兴零日漏洞更是雪上加霜,促使企业比以往更需要加强应用程序安全性,以保护机密数据和安全边界。2022 年,应用程序和 API 攻击数量创下新高。2021 年末,Log4Shell 爆出后不久,企业就发现自己四面楚歌,还有其他多个重大漏洞威胁着他们的安全,其中包括:Atlassian Confluence漏洞(CVE-2022-26134)、ProxyNotShell 漏洞(CVE-202241040)和 Spring4Shell/SpringShell(CVE-2022-22965)等。API 漏洞利用攻击的数量不断增加,即将发布的新版开放式 Web 应用程序安全项目(OWASP)API 十大安全漏洞已将 API 漏洞纳入其中,这表示 API 安全风险已经引起了业界的极大关注。随着攻击频率的激增,攻击的复杂性也在提高,攻击者在不断“进化”,努力寻找更多新方法来利用这一不断扩大的攻击面。例如,攻击者团体使用 Web shell(例如 China Chopper)发动高度有针对性的攻击,比如 Hafnium团体就曾对美国的国防和教育机构发起过此类攻击。此外,服务器端模板注入(SSTI)和服务器端代码注入有可能导致远程代码执行(RCE)和数据渗漏,给业务带来严重威胁。近期的一个例子是在VMwareWorkspaceONEAccessandIdentityManager中发现的 RCE 漏洞(CVE-2022-22954)。在 API 威胁环境中,受损的对象级别授权是企业的主要顾虑,其原因是多方面的,包括这类漏洞的检测难度大、影响大(攻击可能造成攻击者获得敏感数据的访问权限)。考虑到多种非传统攻击媒介的使用量增加,企业有必要升级应用程序和 API 领域的防御机制。在本期互联网现状/安全性(SOTI)报告中,我们将继续研究我们在 Web 应用程序和 API 领域发现的各类攻击,探索它们对于企业的影响,以及各种漏洞在 API 环境中的定位。我们的目标是阐明 Web 应用程序和 API 攻击造成的危险,并提供一些针对性建议,帮助您保护网络,成功抵御此类攻击。钻过安全漏洞:第 9 卷,第 2 期 SOTI3 服务器端请求伪造(SSRF)攻击是一种新近出现的攻击媒介,给企业带来了重大威胁。2022 年,Akamai观察到,针对我们客户 Web 应用程序和 API 的 SSRF 攻击尝试达到平均每天 1,400 万次,这些攻击可能会导致攻击者入侵企业内部资源。开源软件中的漏洞(如 Log4Shell)以及允许远程代码执行(RCE)的 SSTI 技术日渐盛行。我们预计在未来几年中,这些攻击还会不断增长,建议企业采取相应的防护措施。2022 年,随着物联网(IoT)通信的蓬勃发展,以及从制造业设备中收集到的数据愈发惊人,这使得针对制造业发起的攻击数量中位数增加了 76%。针对此行业内运营技术(OT)实施的网络攻击频频得手,带来了供应链问题等现实影响。在医疗领域,医疗物联网(IoMT)的采用扩大了该垂直行业的攻击面,给攻击者创造了通过漏洞发起攻击的机会。2022 年,这个行业的攻击数量中位数增加了 82%。API 研究得出的见解包括:拟议的新版 OWASP API 十大安全漏洞强调了 Web 应用程序与 API 之间的攻击媒介差异。以 API 业务逻辑为导向的 API 攻击非常复杂,很难在个别请求层面上检测和抵御。需要提前建立相关认知,例如具体业务逻辑,以及每位用户可访问的资源。主要研究见解3钻过安全漏洞:第 9 卷,第 2 期 SOTI钻过安全漏洞:第 9 卷,第 2 期 SOTI4Web 应用程序和 API 流量分析Web 应用程序凭借易访问性、效率和可扩展性成为企业的一股中坚力量,帮助企业获得了更多收入。从网络犯罪分子的角度来看,他们总是“跟着钱走”,寻找一切机会去实现自己的最终目标。Akamai始终在监控和观察这些攻击的大规模增长和频率(图 1),在之前发布的威胁报告中,我们已经分享了相关信息。4Daily Web Application AttacksJanuaryDecember 2021 vs.JanuaryDecember 2022Fig.1:Year over year,web application attacks show an upward trend with several spikes in between,possibly indicating sporadic campaigns1 亿1.5 亿5000 万02022 年2021 年4 月3 月1 月2 月5 月6 月7 月8 月9 月10 月11 月12 月攻击数量1 月图 1:Web 应用程序攻击数量呈现年同比上升趋势,中间有数个高峰,可能表明零散的攻击活动每日 Web 应用程序攻击数量 2021 年 1 月至 12 月与 2022 年 1 月至 12 月的对比钻过安全漏洞:第 9 卷,第 2 期 SOTI钻过安全漏洞:第 9 卷,第 2 期 SOTI5攻击者不断优化攻击方法,相应地,Web 应用程序和 API 防御也必须不断加强检测能力,从而缓解攻击者不断“进化”的攻击手段带来的风险。2022 年,Akamai发布了全新的 AkamaiApp&APIProtector 产品,加强了攻击检测能力。攻击数量的激增也让我们确定了更多攻击流量,其增幅约为 250%。但这并不是Akamai第一次看到 Web 应用程序和 API 攻击的这种急剧增加。早在 Log4Shell 和 Spring4Shell 等重大漏洞兴起,并给全球各行各业(如科技公司等)造成大规模数据泄漏之前,Web 应用程序和 API 攻击就已经在急剧扩增。此外,这些漏洞加剧了企业面临的风险,进一步强调了确保应用程序安全的重要性。图 1 还展示了每日攻击流量的高峰和低谷。不过我们偶尔也会看到一些明显的高峰(图 2),这可能表明针对一家大型企业或多家Akamai客户发起的大规模攻击活动。2022 年 4 月,我们在一天的时间内看到了 1.35 亿次攻击;同年 7 月,我们在一天内观察到 1.36 亿次攻击。在我们遭遇的攻击中,还有 1.61 亿次攻击于 2022 年 10 月 8 日开始,于 2022 年 10 月 9 日达到高峰。这些攻击有可能是大爆炸式攻击活动,其中针对企业的攻击活动量可达到正常情况的 30 倍以上。Fig.2:We observed three significant spikes in 2022(April 2,July 28,and October 9),which could indicate big-bang cam-paigns against one or several companiesDaily Web Application AttacksJanuary 1,2022 December 31,20221 亿1.5 亿5000 万07 天平均值每日攻击数量2022 年 4 月2022 年 3 月2022 年 1 月2022 年 2 月2022 年 5 月2022 年 6 月2022 年 7 月2022 年 8 月2022 年 9 月2022 年 10 月2022 年 11 月2022 年 12 月2023 年 1 月攻击数量2022 年 4 月 2 日134,971,2632022 年 7 月 28 日 135,762,3822022 年 10 月 9 日 160,785,750图 2:2022 年,我们观察到三次明显的高峰(4 月 2 日、7 月 28 日和 10 月 9 日),这可能是针对一家或几家公司的大爆炸式攻击活动每日 Web 应用程序攻击数量 2022 年 1 月 1 日2022 年 12 月 31 日钻过安全漏洞:第 9 卷,第 2 期 SOTI6有两个重要因素促成了这种增长。首先,越来越多的企业依靠应用程序和 API 来改进客户体验、助推业务发展,这使得应用程序开发生命周期需要缩短在生产环境中创建和部署此类应用程序的周期,因而可能导致代码不够安全。在 EnterpriseStrategyGroup(ESG)调查中,有 48%的受访企业表示,由于时间限制,他们将存在漏洞的应用程序发布到了生产环境,将网络置于风险之中。其次,漏洞数量在增加,每 10 个漏洞中就有 1 个是在面向互联网的应用程序中发现的“高风险”或“重大”类别的漏洞。此外,2018 年至 2020 年期间,Log4Shell 等开源漏洞的数量增加了一倍。我们的金融服务业相关报告兵临城下:针对金融服务领域的攻击分析强调,在新漏洞披露后的 24 小时内,我们开始看到有关这些漏洞的利用尝试。由于这两大因素,API 和应用程序被攻击者利用的时机已经成熟。对于 Web 应用程序和 API 攻击量增长,推动作用最明显的攻击媒介是 LFI,攻击者主要将其用于侦察或扫描存在漏洞的目标。在某些情况下,实施 LFI 漏洞利用攻击可能暴露关于任何应用程序的信息,造成目录遍历攻击,攻击者可借此获得日志文件数据,从而侵入网络 中更深入的部分。(在下一部分中,我们将更深入地分析这一媒介及其他普遍存在的攻击 媒介。)考虑到这些攻击的速度和规模,企业不但要完成内部分段和补丁安装,还有必要具备在边缘拦截这些攻击的能力。由于应用程序为数众多,您还需要良好的资源清册。了解攻击面及其具有哪些对应的安全控制措施至关重要。如今有许多公司都在整理“软件材料清单”,目的就是准确分析任何零日漏洞的潜在影响。接下来,您还需要 Web 应用程序和 API 防护(WAAP)这样的工具,理想的工具应该能随着新攻击变体的出现实时更新对新威胁的应对 措施。最后,您需要制定相应流程来验证确实有效的防御措施,包括渗透测试和日志分析 在内。在有新攻击媒介初露端倪时,只要有可能影响到企业,您就应该仔细加以考察。通过了解这些新攻击媒介,您就可以为未来的攻击面做好充分准备。钻过安全漏洞:第 9 卷,第 2 期 SOTI72023 年需要留意的攻击媒介通过研究,我们探索了攻击者在攻击的位置、生成这些攻击的方式,以及他们选择执行的具体攻击。在有新攻击媒介初露端倪时,只要有可能影响到企业,您就应该仔细加以考察。了解新攻击媒介可以帮您做好准备,应对未来可能出现的攻击面,这也是企业保护自身网络的方法。如图 3 所示,LFI 攻击目前在大幅增加,年同比增幅达到 193%。也就是说,相较于 2021 年,攻击数量激增 2 倍之多,先前排名靠前的跨站点脚本攻击(XSS)和 SQL 注入(SQLi)这两种攻击媒介均已落于 LFI 攻击之后。LFI 攻击可能会给企业造成不利影响攻击者利用 LFI 在目标网络中获得立足点,或是通过 RCE 向 Web 服务器注入恶意代码,从而破坏其安全机制。在最糟糕的情况下,LFI 攻击可能将敏感信息暴露给攻击者。注意:LFI 攻击数量的增加意味着攻击者已经成功利用它发起过攻击,所以您应该优先开展测试,判断自己的系统中是否存在漏洞。在攻击者利用文件访问权限验证或处理的漏洞发起攻击时,就会发生 LFI 攻击。我们发现,基于 PHP 的网站普遍存在 LFI 漏洞,80%的网站在服务器端使用这种编程语言。我们连年看到大量攻击,这并不令人意外。相关数据泄露报告称,3 亿用户帐户外泄的事件可追溯到 LFI 攻击上。Fig.3:LFI remains the top attack vector as attackers look for ways to infiltrate their intended targets Top Web Attack VectorsJanuaryDecember 2021 vs.JanuaryDecember 20222021 年2022 年50 亿0100 亿150 亿200 亿LFIXSSSQLiPHPi恶意文件上传RFICMDiOGNLi2021 年与 2022 年的攻击数量总数对比图 3:在攻击者寻找入侵预定目标的方法时,LFI 依然是首选攻击媒介 主要 Web 攻击媒介 2021 年 1 月至 12 月与 2022 年 1 月至 12 月的对比钻过安全漏洞:第 9 卷,第 2 期 SOTI8无独有偶,XSS 让攻击者可以在攻击目标的网络中获得立足点,而非获得数据库访问权限。就在几年前,SQLi 还是 Web 应用程序和 API 攻击中的主导性攻击媒介,在 2021 年的 OWASP 名单中,它是三大 Web 应用程序攻击之一。SQLi 攻击一旦得手,攻击者往往能获得公司的机密信息访问权限,比如客户数据。企业需要警惕这些流行的攻击媒介可能造成的后果,以及攻击者对于这些媒介的利用方式。仔细审视新攻击媒介及其对企业的潜在影响至关重要。Akamai坚信企业应当使用诸如ZeroTrust分段之类的框架,以尽可能降低可成功获得访问权限的 LFI 攻击的影响,并将网络击杀链与 MITREATT&CK相结合,分析和衡量企业安全计划的成熟度。新兴攻击媒介体现出向 RCE 演进的形势随着漏洞利用攻击的频率持续增加,攻击者在不断“演进”攻击手段、技术和过程(TTP),以提高其影响力。在本部分中,我们将审视过去一年中遇到的一些不同以往、新近兴起并且高度危险的攻击技术。了解这些逐渐盛行的攻击对于准备未来安全防护措施意义非凡。我们希望帮助企业了解网络犯罪分子如何滥用以下这些攻击媒介,以便制定相应的抵御策略,为下一个达到 Log4Shell 级别或下一个主导性的攻击媒介做好准备。服务器端请求伪造(SSRF)服务器端模板注入(SSTI)服务器端代码注入8钻过安全漏洞:第 9 卷,第 2 期 SOTI钻过安全漏洞:第 9 卷,第 2 期 SOTI9Hafnium 滥用 SSRF,对成千上万的企业发起了攻击2021 年 3 月,CVE-2021-26855(CVSS 评分:9.1)披露,SSRF 获得高度关注,安全研究人员 Orange Tsai 称之为“ProxyLogon”。在Microsoft发布安全补丁解决MicrosoftExchange服务器中这一关键 SSRF 漏洞之前,网络犯罪团伙 Hafnium利用此漏洞发起了攻击,受影响的企业数量估计达到 6 万家。该攻击者团伙利用此漏洞对 Web 服务器运行命令,从而破坏其安全机制。由于 SSRF 的影响引起高度关注,此媒介后续被添加到 9 月发布的“2021 年 OWASP 十大安全漏洞”中,位列第十。攻击者通常利用 SSRF 漏洞来获取敏感信息或执行命令。如需进一步了解 SSRF 工作原理,请参阅这篇文章。对于MicrosoftExchange中的 SSRF 漏洞,近期的例子有:ProxyNotShell结合了 CVE-2022-41040(CVSS 评分:8.8)和 CVE-2021-41082(CVSS 评分:8.8)OWASSRFCVE-2022-41080(CVSS 评分:8.8)在过去两年间,Akamai观察到攻击尝试和获得授权的漏洞扫描流量(其目的是寻找MicrosoftExchange以外的软件中的 SSRF 漏洞)都在稳步增长。GitHub上的SSRFmap 等开源工具助长了此类扫描活动。我们还观察到,探测我们App&APIProtector客户的 Web 应用程序和 API 的 SSRF 尝试平均每天达到 1,400 万次,表明了这种攻击媒介的普遍程度在不断提升。这种增长以及 SSRF 利用给企业带来的潜在影响值得 关注。SOTI9钻过安全漏洞:第 9 卷,第 2 期 SOTI10SSTI:攻击者青睐的零日攻击技术Log4Shell 漏洞、AtlassianConfluence漏洞(CVE-2022-26134)和 Spring4Shell 漏洞(CVE-2022-22965)是近年来影响重大的三个漏洞,它们都影响到了各行各业和整个互联网上的成千上万家企业,而且它们都属于 SSTI。在系统通过不安全的方式将用户输入嵌入模板时,就会出现 SSTI 漏洞,并导致服务器上的 RCE。Akamai研究人员观察到,攻击者使用这些技术执行各种系统级命令和带外互动,从而探测并检查是否有可能实施数据渗漏。在一些个例中,攻击者利用这些漏洞实施了 RCE。但有些攻击者喜欢在各种高级持续威胁(APT)攻击活动中使用多个 Web shell,例如简单的反弹 shell、China Chopper 和Behinder。(我们将在后续有关 Web shell 的部分中进一步探讨这个话题。)这些恶意文件一旦上传,攻击者会择机利用简单的 GET 请求予以调用(图 4),如果恶意文件存放在可以运行cron作业的特定文件夹中,则可以在某个特定的实例中执行。图 5 展示了攻击负载在 POST 请求中的表现形式。SSTI 威胁看起来或许有些像简单的 RCE 漏洞,但确实需要密切留意。在互联网上存在公开可用的漏洞利用、攻击负载非常简单,这些特点提高了攻击者利用这种漏洞的可行性。我们估计,由于 SSTI 的潜在影响和损害,未来它仍将构成重大威胁。建议企业制定包含 Web 应用程序防火墙的安全策略,以防范此类漏洞利用。有必要指出,Log4Shell 和 Spring4Shell 都是在开源工具中发现的漏洞。开源技术的初衷是让人人都能轻松获得源代码,通过合作打造出色的工具、框架和软件,但它也可能成为漏洞利用的渠道。攻击者都在密切关注潜在安全漏洞,探索在攻击中加以利用或将其用作入图 4:GET 请求及负载(Spring4Shell)图 5:POST 请求及负载(Spring4Shell)钻过安全漏洞:第 9 卷,第 2 期 SOTI11侵攻击目标的敲门砖的可能性。因此,防御者或漏洞研究人员需要和时间赛跑,赶在攻击者实际将漏洞用于攻击之前开发出修补程序,创建概念验证漏洞。由于目前还没有更安全的流程,防御者需要认识到开源软件的这个方面,并采取修补以外的策略来防范零日漏洞。同样,正因如此,目前企业有开发“软件材料清单”、收紧第三方代码审核的趋势。服务器端代码注入导致 RCE服务器端代码注入又称为“服务器端包含攻击”,攻击者会利用 Web 应用程序或服务器,在 HTML 页面中注入并远程执行代码或脚本。这使得攻击者可以执行 shell 命令,并获得敏感信息(如用户名和密码)的访问权限。攻击者经常利用用户输入字段强行使用此类攻击。攻击要想得手,前提条件是 Web 服务器未经适当验证就允许服务器端代码注入。而这会导致攻击者访问和操纵文件系统,还有可能让攻击者通过 Web 服务器进程所有者将其登记为已获准。根据Akamai研究人员的观察,NodeJS中的服务器端代码注入激增,并且NodeJS的使用量近期一直呈上升趋势。攻击者可能会滥用这些漏洞,在存在漏洞的服务器上运行远程代码,这可能会导致反弹 shell 和任意文件读取等问题(图 6)。图 6:允许攻击者读取/etc/passwd 文件的漏洞利用攻击代码示例,该文件中包含 NodeJS 服务器上用户的敏感信息钻过安全漏洞:第 9 卷,第 2 期 SOTI12攻击者在 APT 攻击活动中利用 Web shellWeb shell 允许攻击者通过简单而有效的方式与 Web 服务器进行交互。与普通 shell 相比,使用 Web shell 的通信依赖于 Web 端口,因此隐蔽性更强,这让它成为对攻击者颇具吸引力的攻击手段。它们允许攻击者创建 Web 服务器后门,从而实现远程控制,危险程度极高。此外,它们还可以让攻击者横向移动以访问内部网络。较为盛行的 Web shell 有:China Chopper Web shell 和BehinderWebshell。China Chopper 由两部分组成。第一部分是客户端,这是一个可执行文件,用来与受到攻击的 Web 服务器内的实际 Web shell 通信。第二部分是 Web shell,它可能采用 PHP 文件的形式。它具有图形用户界面和许多命令和控制功能,如密码暴力破解攻击、文件管理和代码混淆。有消息称,此 Web shell 曾用于发起定向攻击。Behinder 具有类似的功能,而且额外增加了加密通信。由于这样的补充,再加上它属于内存 Web shell,这种 shell 更难发现。优秀的 WAAP/WAF 应该能够检测和抵御像 China Chopper 和Behinder这样的 Web shell。此外,它应该具有自动更新、在生产环境中测试和自动拦截的功能。安全控制措施还应提供分析,生成工件以便向领导层和审计师汇报 工作。HTTP 请求盗取 攻击者可通过多种方式利用请求盗取攻击,包括访问敏感数据、污染缓存的内容,甚至是执行大规模 XSS。由于安全研究人员 JamesKettle 的杰出工作,近年来 HTTP 请求盗取(HRS,也称为 HTTP 不同步攻击)再次成为安全研究热点。他在 2019 年黑帽会议上做了一次关于 HTTP 不同步攻击的演讲,公布了不同 HTTP 标准实现的漏洞,特别是代理服务器和内容交付网络(CDN)内的漏洞。这些实现对于代理服务器解析 Web 请求结构的方式有所不同,造成了新的请求盗取漏洞。如需进一步了解 HRS 的工作原理,请阅读 CAPEC 的这篇文章。钻过安全漏洞:第 9 卷,第 2 期 SOTI13RFC 指明,在处理请求时,Transfer-Encoding标头必须先于 Content-Length 标头。代理服务器实现的语义差异导致 HTTP 不同步攻击场景中出现这种攻击。了解有多少 CDN 处理转发到客户网站的流量非常重要;能为解析顺序的重要性提供背景。CDN 服务器还必须维护来自前端客户端的请求/响应数据与所返回数据之间的映射关系。在 HRS/不同步攻击中,由于系统返回了额外的响应内容,并且没能将这些响应内容正确映射到前端客户端的请求,这种映射会被破坏(图 7)。为了在平台层面上防范这种攻击,Akamai更新了 Global Host(Ghost)平台,以符合 RFC 2616 规范的合规标准,确保Transfer-Encoding标头优先。此外,WAAP/WAF 应遵守 RFC 7230 中与标头解析有关的规定,并应检测其是否符合如下条件:标头没有以“rn”结尾 标头不包含冒号“:”标头无名称使用符合行业标准的工具始终是最佳实践。后端前端图 7:不同步攻击的原理(来源:Portswigger)13钻过安全漏洞:第 9 卷,第 2 期 SOTI钻过安全漏洞:第 9 卷,第 2 期 SOTI14数字化时代的应用程序和 API 攻击风险:对不同行业的攻击有何不同 COVID-19 疫情促使各行各业加紧实施数字化转型,以此来适应要求业务连续性的时代。在 2020 年之前,已有几个行业实现了数字化,但一直到 COVID-19 疫情爆发期间,所有行业(不论规模大小)才不约而同地开始实施数字化。这些企业匆忙实施在线服务和流程,可能未考虑到数字策略的正确实施,因此出现了安全漏洞。这进一步扩大了企业的风险暴露面。一份报告显示,82%的 IT 高管指出,其企业在引入新技术时遭遇过一次或两次数据泄露。在本部分中,我们将研究关键行业和趋势,以及网络犯罪分子有可能如何将 Web 应用程序和 API 攻击用作入侵企业的途径。大多数行业遭受攻击的频率都出现增长,而商业、高科技和金融服务行业则首当其冲(图 8)。Fig.8:The top verticals impacted by web application and API attacks are commerce,high tech-nology,and financial servicesTop Web Attack VerticalsJanuaryDecember 2021 vs.JanuaryDecember 202210%0 0%高科技商业金融服务制造其他数字媒体视频媒体公共部门游戏社交媒体商业服务制药/医疗博彩非营利组织/教育机构其他2021 年与 2022 年的攻击数量总数对比2021 年2022 年图 8:商业、高科技和金融服务是受 Web 应用程序和 API 攻击影响最为严重的垂直行业Web 攻击数量排名靠前的垂直行业 2021 年 1 月至 12 月与 2022 年 1 月至 12 月的对比钻过安全漏洞:第 9 卷,第 2 期 SOTI15对于中位数数据集的研究固然存在自己的偏差,但提供了不同的视角(图 9)。它为我们勾勒出一幅不同的景象,让我们得以了解个别行业在攻击方面所经历的情况。例如,我们看到,2022 年针对制造业的攻击数量超过了高科技和金融服务业,这与我们之前在新一期的 SOTI 报告攻击快车道:深入了解恶意 DNS 流量及全球勒索软件报告中的发现相呼应。Fig.9:Median attacks demonstrate a different depictionon the range of attack frequency in verticalsTop Web Attack Verticals MedianJanuary 1,2022 December 31,2022 10 万020 万30 万高科技商业金融服务制造其他数字媒体视频媒体公共部门游戏社交媒体商业服务制药/医疗博彩非营利组织/教育机构攻击数量2021 年2022 年图 9:攻击数量中位数从不同的视角展示了各垂直行业中的攻击频率范围 Web 攻击数量排名靠前的垂直行业中位数 2022 年 1 月 1 日至 2022 年 12 月 31 日15钻过安全漏洞:第 9 卷,第 2 期 SOTI钻过安全漏洞:第 9 卷,第 2 期 SOTI16商业:LFI 在旅游和酒店业中的起起落落Akamai的旅游和酒店业子垂直行业数据表明,这些客户面向 Web 资产的应用程序和 API 遭遇过大量攻击。Akamai的数据反映了 2022 年 1 月 LFI 攻击量的激增(107%),是前一个月商业领域中更广泛趋势的延续,促使此类攻击远超之前的主要攻击媒介 SQLi(图 10)。在 2022 年全年,LFI 攻击活动水平持续居高不下。将 2022 年第三季度与 2021 年第三季度相比,LFI 攻击活动数量的增幅超过 300%。LFI 成为更多攻击者的首选攻击媒介,这种整体趋势或许体现出攻击者不再希望仅依靠 SQLi 实施数据渗漏攻击(在针对商业领域的 WAF 攻击中,此类攻击一度占到大约 79%的比例),而是改为使用 LFI 来滥用 Web 应用程序中的漏洞,暴露 Web 服务器上的敏感文件,这可能引发目录遍历攻击。LFI 也可用于攻击链,促成 XSS 或 RCE。如前所述,攻击者也许在借着因新冠疫情引发部署新应用程序和技术的急迫性,来搜索可利用的 LFI 漏洞和其他安全缺口。另一个促成因素或许是容器化环境的迅速扩增,这些环境可能在运行较旧的映像,更容易受到采用较旧方法的攻击,例如缓冲区溢出,从而增加 LFI 扫描请求。Fig.10:A view of top attack vectors in the commerce industry from 2019 to the present shows the the rise and fall of LFI,XSS,and SQLi Top 3 Daily Web Application Attack Vectors CommerceJanuary 1,2019 January 1,20235 亿7.5 亿10 亿2.5 亿0SQLiXSSLFI2020 年 1 月2019 年 1 月2021 年 1 月2022 年 1 月2023 年 1 月攻击数量图 10:从 2019 年到 2023 年初,针对商业领域的主要攻击媒介的视图,表明了 LFI、XSS 和 SQLi 攻击的起落情况单日 Web 应用程序攻击数量排名前三的攻击媒介商业 2019 年 1 月 1 日至 2023 年 1 月 1 日钻过安全漏洞:第 9 卷,第 2 期 SOTI1717金融服务业越来越多的金融机构实现数字化,积极采纳改变游戏规则的举措来扩大业务范畴,如开放银行服务、银行业务即服务和不断增长的嵌入式金融市场,API 已成为对于金融机构有着重大意义的强大工具。JuniperResearch表示,近年来,嵌入式金融解决方案在全球范围内得到了重视,到 2027 年可以稳稳产生高达 1830 亿美元的收入。一项针对中小型企业的全球调查表明,近 50%的中小型企业表示对嵌入式金融产品感兴趣,并已很少使用传统银行服务。嵌入式金融服务提供商可以获得高达 250 亿美元的收入。这个发展方向确实为银行和其他金融机构带来了增长机会,但同时也带来了风险。在我们 2022 年的最后一期 SOTI兵临城下:针对金融服务业的攻击分析中,我们发现针对金融服务的 Web 应用程序和 API 攻击数量激增 3.5 倍,表明了攻击者对该行业及其客户的兴趣持续增长。随着金融服务的攻击面不断扩大,我们建议安全领域从业者了解其风险暴露情况,并据此制定抵御策略。我们还建议缩小攻击面、加强环境感知,以降低应用程序和 API 攻击造成的风险。关于金融服务机构的更多安全建议,请阅读Akamai博客文章:近期研究给金融服务业带来的 7 个重要启示。17SOTI17钻过安全漏洞:第 9 卷,第 2 期 SOTI18制造业 尽管制造商要应对的 API 请求数量和规模通常比不上直接面向消费者的垂直行业(例如零售业),但攻击事件的影响可能会非常严重。2022 年的攻击数量中位数急剧上升令各大企业如鲠在喉。过去,工业控制系统是独立式硬件和软件系统,除了设备的个别部件或工厂本身之外,彼此间几乎没有联系。如今,不论是物联网连接数量,还是从生产设施的各类设备中收集的数据量都呈现激增之势,访问来自这些设备的数据的请求也不断增加。这些数据的用途包括供应商管理、库存管理、生产流程优化、销售和订单管理等。随着这些连接的出现,针对这些 OT 的漏洞发起网络威胁的 风险也在增加。利用 OT 数据的应用场景不断扩增,参与其访问、处理、分析和使用的非 OT 系统的数量随之增加。这形成了一种趋势,制造商正在整合其应对 IT/OT 综合威胁的策略和响应措施,以适应两个世界逐渐交融的现状。尤为值得关注的是利用勒索软件的攻击者,以及希望掌握相应能力,通过影响公共事业、管线、炼油厂、水厂、交通运输网和其他关键民用基础设施等基本服务的交付来扰乱社会的境外民族国家的威胁。如果说图 9 中针对制造商的 Web 攻击数量中位数激增带给我们什么启迪,那就是这个行业需要立即着手加强防御 措施。SOTI18钻过安全漏洞:第 9 卷,第 2 期 SOTI19医疗/制药业IoMT 的兴起是医疗行业的重要进步之一,它将医疗相关应用程序和设备连接起来,让医生与患者能通过网络实时获取信息。目前的一间病房中平均大约有 15 至 20 台联网医疗设备,包括智能病床、胰岛素泵和呼吸机。IoMT 技术确实给患者、医疗服务提供商和医生带来了新的机会和高效、无缝的体验,但同时也扩大了这个领域的攻击面。使用第三方应用程序和供应商会造成的安全漏洞,而攻击者可能利用这些第三方的漏洞发动攻击。许多医疗服务提供商都在使用大量传统系统、高度联合的系统,现在还在整合 IoMT 数据,因此,强大的分段技术和数据流监测变得非常重要。患者安全至关重要,不容有失。医疗机构一旦被入侵,可能会引发无数恶果,比如机密的患者信息和医疗记录丢失、运营和声誉蒙受重大损害等等。美国有数项医疗法规,包括拟议的2022 年医疗服务网络安全法,其中规定了医疗服务提供商在网络安全方面需要优先考虑的准则,并就如何保护医疗设备和电子病历提供了一些策略建议。领导层会向 CISO 提出的一个关键问题是:“我们公司的网络安全风险比其他公司如何?”关于行业趋势的这个部分提供了一些与此相关的必要数据,可以帮您有理有据地探讨贵公司与其他行业和同行相比较的排名。SOTI19钻过安全漏洞:第 9 卷,第 2 期 SOTI20留意(安全)缺口:API 攻击研究引发对风险的关注OWASP 将 API 攻击纳入候选名单(其十大攻击排名的草案),这是行业朝着专门关注 API 的方向迈出的重要一步,突破了以往侧重于应用程序的思路,强调了 API 威胁的独特性质(图 11)。提到 API 的性质,有必要指出一个基本要点:其保护颇具难度,针对 API 发起的攻击可能相当复杂。为了充分实施保护,您需要了解 API 的内部业务逻辑,因为每一家客户的 API 内部业务逻辑都可能有所不同,安全解决方案可能需要更高水准的计算产品。OWASP 强调了 API 安全中的几个关键思路,包括:不应信任第三方和内部服务;云环境、容器和Kubernetes应纳入 API 安全领域(就概括的层面而言),而且对于 URL 传递(SSRF)的高风险有所影响。本部分将探讨列入前五位的几种 API 攻击(对象、属性、身份验证和授权)。我们先来看一下 API 授权的复杂性质,以及识别和测试错误的 API 逻辑造成的漏洞时的难度。Fig.11:The proposed new Top 10 includes more API-specific attacks and emphasizes authorization issues(four of the top five attacks)20678910受损的对象级别授权受损的用户身份验证数据泄露过多缺乏资源和速率限制受损的功能级别授权批量分配安全配置错误注入不当的资产管理日志记录和监控不足受损的对象级别授权受损的身份验证受损的对象属性级别授权不受限制的资源消耗受损的功能级别授权服务器端请求伪造安全配置错误缺乏对自动威胁的防范资源清册管理不当API 的使用不安全图 11:新拟议的“十大安全漏洞”中包含更多与 API 相关的攻击,并着重强调了授权问题(在前五大攻击中占据四席)2019 2023钻过安全漏洞:第 9 卷,第 2 期 SOTI21受损的对象级别授权 在 OWASP API 十大安全漏洞中,受损的对象级别授权(BOLA)是排名第一位的 API 漏洞。容易遭受 BOLA 攻击的 API 让攻击者能操纵 API 请求内发送的对象 ID,从而在未经授权的情况下获得敏感数据的访问权限。例如,某个不具备特权的用户通过这种方式访问、更新或删除了另一位用户的数据,这就可以视为 BOLA 攻击(图 12)。BOLA 被视为高风险攻击。一旦攻击者成功利用了这种攻击手段,就能访问其他用户的信息,例如其存储的个人身份信息。不同于加密破解或自动化/程序化攻击(如分布式拒绝服务和撞库)等技术性更强的攻击不同,BOLA 攻击与应用程序逻辑的缺陷有关。在攻击中利用 BOLA 相对比较简单,但要检测它十分艰难。BOLA 请求与合法流量非常相似,很难从恶意请求中区分出这类请求。要检测 BOLA 攻击,防御者需要预先了解应用程序的业务逻辑和每个用户可访问的资源。检测逻辑必须区分资源和用户之间的一对一连接和一对多连接。事后 BOLA 攻击很难发现,因为其攻击量极低,不会表现出明显的行为异常迹象,比如注入或拒绝 服务。GET/account/BOLA 攻击GET/account/GET/account/AliceAlice 的帐户EveEve 的帐户图 12:正常请求对比 BOLA 攻击钻过安全漏洞:第 9 卷,第 2 期 SOTI22重点检测 JSON Web 令牌中受损的身份验证例如,API 身份验证可验证用户的身份,或确认帐户访问者是不是获得授权的用户。但如果 API 身份验证中存在漏洞,会发生什么情况?攻击者可以滥用它来劫持用户的帐户信息,将其数据置于风险之中。本部分将介绍受损的身份验证,这是 OWASP API 攻击名单中排名第二位的攻击。API 中的一种标准身份识别方法是JSONWeb令牌(JWT)。我们会深入探索Akamai的流量,并介绍一些常见应用场景和几个已知漏洞,帮您更好地了解其潜在风险。Akamai 流量调查 JWT通常带有签名,但这并不表示它们经过加密;签名只是用来验证内容未经篡改或修改。已知用于为JWT签名的算法有 HS256(使用 SHA256 的 HMAC)和 RS256(使用 SHA256 的 RSA)等。我们的数据流量表明,大多数(55%)的 API 请求采用 HS256 算法来为其相关 JWT进行签名和验证,RS256 的使用比例紧随其后(26%;图 13)。HS256 是一种对称算法,使用一个密钥来验证和生成签名。RS256 的非对称算法要求使用私钥和公钥。Fig.13:Most of Akamais customers use HS256 JWT authentication,followed by RS256JWT AlgorithmsRS25626.1%HS25654.8%HS5125.2%ES5120.8%ES2565.2%RS5127.9%图 13:大多数 Akamai 客户使用 HS256 JWT 身份验证,其次是 RS256JWT 算法钻过安全漏洞:第 9 卷,第 2 期 SOTI23对称算法的使用率要高于非对称算法,这有些令人意外,原因或许出于我们的客户对系统复杂性和计算方面的考量(图 14)。请注意,如果密钥足够长,那么使用适当的安全对称密钥是可以接受的做法(JWT已通过 TLS 加密)。这也能减少了客户方面的复杂性,因为用户仅需一个密钥。Fig.14:60%of API requests use a symmetric,rather than an asymmetric,algorithm Algorithms Symmetric vs.Asymmetric不对称40.0%对称60.0%图 14:60%的 API 请求使用对称算法,而不是非对称算法 算法对称与非对称的对比23钻过安全漏洞:第 9 卷,第 2 期 SOTI钻过安全漏洞:第 9 卷,第 2 期 SOTI24我们的数据表明,使用JWT对称加密的行业主要分为两类:一类是传统上在网络安全领域投资不多的行业,如制造业和公共机构;另一类是生成海量数据的行业,如视频媒体、博彩和其他数字媒体,因为其处理成本更低(图 15)。金融服务业可能有更加严格的安全规定,因此使用非对称加密的做法更为普遍。请注意,对于这两种类型的JWT加密,JWT本身均通过非对称 TLS 加密会话传输。Fig.15:Symmetric and asymmetric usage per industrySymmetric and Asymmetric by Vertical对称不对称高科技商业金融服务制造其他数字媒体视频媒体公共部门游戏社交媒体商业服务制药/医疗博彩非营利组织/教育机构图 15:各行业的对称算法与非对称算法的使用情况按垂直行业划分的对称算法与非对称算法使用情况24钻过安全漏洞:第 9 卷,第 2 期 SOTI钻过安全漏洞:第 9 卷,第 2 期 SOTI25JSON Web 令牌与 JSON Web 加密的比较JSONWeb加密(JWE)是JWT的加密版本,使用并不广泛。大多数公司都选择节省计算能力,并使用JWT(图 16)。JWE的一个应用场景是公司希望避免仿冒攻击发起者成功读取JWT。风险类型 为了填补安全缺口,避免可能被攻击者用作入侵点的安全漏洞,一个重要步骤就是在应用程序生命周期的早期阶段确定编码错误。但有一项调查显示,仅有 14%的开发人员在编码过程中会优先考虑应用程序安全。这种做法并不合理,在任何应用程序生命周期中,安全都应该作为一个需要积极关注的关键领域。在本部分中,我们将探讨几种可能被引入您的安全边界的 API 攻击。信任或者不验证用户的签名算法此类攻击会设法让系统信任用户的签名算法,从而在不执行验证的情况下使用JWT和数据令牌。这类似于将前门大敞四开,认定只有合法居民才会进入,甚至更糟糕,盲目信任陌生人会把门锁好并交还钥匙。虽然这种攻击很容易实施,但它可能产生不利后果,如访问特权提升。在某些情况下,如果通过JWT标头改变算法,还有可能导致帐户接管。Fig.16.The usage of JWE vs.JWT seen in the traffic on Akamai edgeJWT vs JWEJWE10.5%JWT89.5%图 16:在 Akamai 边缘流量中观察到的 JWE 与 JWT 的使用情况对比钻过安全漏洞:第 9 卷,第 2 期 SOTI26身份验证流风险在某些情况下,开发人员会为不同的 API 使用相同的私钥。但攻击者可以滥用这一点,利用用户 ID 和来自另一个应用程序的合法JWT接管帐户(图 17)。安全的算法众所周知,非对称算法的安全性高于对称算法,因为前者使用两个密钥,增加了对算法实施攻击的复杂性。最初,使用高熵长密钥的对称算法足够安全,但假以时日,它也会变得不再安全。云计算让攻击者能够通过几年前还无法想象的速度破解使用弱私钥的签名 令牌。避免在有效负载中存储敏感数据开发人员可能会无意中在JWT中存储信息,如内部开发数据、增量式 ID 或服务器字段。编码但未加密的JWT可能会导致潜在敏感数据泄露给攻击者。攻击者可以利用自身获得的 API 相关信息,对存在漏洞的 API 发起更复杂的攻击。注入攻击JWT中的密钥ID(kid)参数用于告诉服务器端应用程序,在验证过程中使用的是哪个密钥为JWT签名。但这个kid参数也有可能成为潜在注入攻击的根本原因,因为它用于查询服务器端数据库。根据Akamai的观察,像 SQL 和操作系统注入这样的攻击会在服务器端 运行。注册这两个应用程序使用应用程序 1 JWT 并接管帐户攻击者应用程序 1授权:JWT_X(用户 ID=1234)应用程序 2授权:JWT_Y(用户 ID=4321)应用程序 2 授权:JWT_X(用户 ID=1234)图 17:攻击者有可能使用其他应用程序的合法令牌来实现帐户接管钻过安全漏洞:第 9 卷,第 2 期 SOTI27保护企业免受 API 风险的侵扰编码中的一个简单错误可能成为攻击者在企业网络中发起攻击的立足点。应用程序与 API 中的缺口会形成漏洞,并让攻击者有机会找到方法来突破外围防御,在您的网络内传播并获取机密信息。同时,Web 应用程序和 API 仍然是企业必须设法防御的关键攻击面,而要想降低风险,及时修补安全漏洞就变得至关重要。像 App&APIProtector 这样的 Web 应用程序和 API 解决方案可以阻止请求或流量到达其目标应用程序,从而阻止攻击。务必将安全措施落实到位,例如及时更新 Web 应用程序防火墙规则。了解应用程序和 API 攻击的工作原理,包括 LFI、SQLi 和 XSS 以外渐成气候的攻击媒介,这样防御者就能掌握必要的知识,保护其企业免受 Log4Shell 这样的攻击侵扰。对于 API 特定风险,您可以参考以下一些建议:在使用令牌前使用预定义的算法验证令牌 为每个身份验证环境(以及不同的应用程序)分别使用不同的私钥 使用非对称算法(如果从计算资源角度来看是合理的),使用高熵长私钥 如果用到了kid参数,为其生成一个唯一标识符 避免在有效负载中透露敏感数据;此类数据应该保存在数据库中 记录并监控JWT违规行为,以便日后检查为了抵御 BOLA 攻击带来的风险,下面来介绍一些相关的最佳实践:对使用客户输入的 API 执行授权检查,以确定当前用户是否有权访问请求的资源 使用通用唯一标识符(UUID)作为资源 ID,而不是连续数字 ID 编写并运行测试以评估您的 API 端点是否存在 BOLA 漏洞在各个行业,Web 应用程序和 API 攻击的数量都在急剧增加,这表明随着企业进一步采纳“左移”的做法,开发更多的应用程序,每一家企业都不能免于这些攻击的影响只是或早或晚的问题。钻过安全漏洞:第 9 卷,第 2 期 SOTI28结语和更多建议:填堵边缘缺口 不要等到危机降临才来思考如何抵御不同类型的新漏洞或零日漏洞,无论是对协议、产品还是固件中存在的漏洞,企业都应未雨绸缪。尽管这些抵御措施需要的策略都略有不同,但是建立流程大有助益。我们建议企业尽快采用 Web 应用程序和 API 保护/Web 应用程序防火墙(WAAP/WAF)、内部分段/安全围栏和修补的做法,在边缘处抵御攻击媒介。下一个重大漏洞随时可能出现,您需要立即构建或验证自己的应对策略。本报告审视了流行的攻击媒介,如本地文件包含(LFI),以及新兴的攻击技术,如服务器端请求伪造(SSRF)、服务器端模板注入(SSTI)和服务器端代码注入。您应该检查自己的日志,观察这些技术的趋势,看看与本报告的分析是否相符。您也可以通过渗透测试和红队验证我们的检测和抵御控制措施的有效性。盘点行业趋势(数字化时代的应用程序和 API 攻击风险:对不同行业的攻击有何不同部分中探讨了相关内容),为贵公司合理排定检测和抵御控制措施的优先次序。行业趋势总能给我们展现耐人寻味的见解。网络犯罪分子根据入侵的费力程度、数据的价值或支付赎金的可能性来评估哪些目标能给他们带来最佳的投资回报,所以攻击趋势经常会发生变迁。但密切留意“邻居”遇到的情况非常重要,因为或早或晚,同样的情况会发生在您的身上。不如把握机会,从他们的事情中汲取经验。医疗业是值得关注的一个行业,医疗物联网(IoMT)带来的复杂性可以作为很好的案例,供我们探索管理新型数据源的方法。钻过安全漏洞:第 9 卷,第 2 期 SOTI29朝着 DevOps 和 API 的转型促使 OWASP 单独评估了 API 风险,并将其与人们更为熟知的 OWASP Web 漏洞进行比较;根据 API 攻击的活动情况以及这些比较的结果,OWASP 将其列入新版十大名单。在考虑如何确定优先级时,不妨先参照 OWASP 更新后的建议。JSONWeb令牌(JWT)可以重点检测“受损的身份验证”,这是一个绝佳的案例,可以展现您在多大程度上仍然需要进行安全代码开发,并且开发最佳实践和技术控制,以确保您的应用程序与风险偏好相匹配。在与客户交流时,客户不断告诉我们安全控制措施整合的价值,自动化对于适应攻击速度的必要性,以及监测能力对决策和性能评估的重要意义。我们希望这份报告中的数据能够带来深入见解,帮助您更新自己的程序并开发最佳实践。如需了解更多见解,敬请访问我们的安全研究中心,随时了解我们的最新研究资讯。方法Web 应用程序攻击数量此数据表示通过我们的 Web 应用程序防火墙观察到的流量的应用层警报数量。在针对受保护的网站或应用程序的请求中检测到恶意负载时,系统就会触发警报。警报并不表示攻击已经成功。虽然这些产品允许的定制程度极高,但我们在收集此处提供的数据时,所采用的方式并未考虑受保护资产的定制配置。这些数据提取自我们的一个内部工具,该工具用于分析在 AkamaiIntelligentEdgePlatform上检测到的安全事件。这是一个由 340,000 台服务器构成的庞大网络,覆盖全球 134 个国家/地区的 1,300 个网络中的 4,000 个地点。我们的安全团队使用这些数据(每月达到 PB 级)来研究攻击,标记恶意行为并将其他情报馈送到Akamai解决方案中。2022 年 5 月的一次重大攻击体量过大,因此部分可视化图表中未包含其数据。出于所有分析的目的,我们仍在数据集中保留了这次攻击的数据。钻过安全漏洞:第 9 卷,第 2 期 SOTI30Akamai 支持并保护网络生活。全球各大优秀公司纷纷选择 Akamai 来打造并提供安全的数字化体验,为数十亿人每天的生活、工作和娱乐提供助力。Akamai Connected Cloud 是一种大规模分布式边缘和云平台,可使应用程序和体验更靠近用户,帮助用户远离威胁。如需详细了解 Akamai 的云计算、安全和内容交付解决方案,请访问 和 年 4 月。|30致谢名单编辑与创作EliadKimhyLanceRhodesBadetteTribbey审稿和主题撰稿NoamAtiasSusanMcReynoldsRyanBarnettNitzanNamer CherylChiodiNeerajPradeepPaulDonnellyIdoSolomonTomEmmonsCarleyThornellDennisGerman SteveWinterfeldAlexMarks-BluthMaximZavodchik数据分析RobertLesterChelseaTuttle营销与发布GeorginaMoralesHampeShivangiSahu更多互联网现状/安全性互联网现状/安全性报告由Akamai精心呈献,获得了各界的广泛赞誉,您可以回顾往期报告,并关注即将发布的新报告。 访问此报告中的数据查看本报告中引用的图片和图表的高画质版本。这些图片可供免费使用和引用,但必须注明转载来源,并保留Akamai徽标。 Web 应用程序和 API 攻击推出的解决方案,请访问我们的“应用程序和 API 安全”页面。扫码关注获取最新CDN前沿资讯

    浏览量0人已浏览 发布时间2023-11-17 31页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 2023交换机行业产业现状、驱动因素、产业链及竞争格局分析报告(24页).pdf

    2023 年深度行业分析研究报告 行业研究报告 慧博智能投研 目录目录 一、行业概况.1 二、产业现状.5 三、驱动因素.7 四、产业链分析.9 五、竞争格局.12 六、相关上市公司.14 七、发展趋. 

    浏览量0人已浏览 发布时间2023-11-16 24页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 龙蜥社区&浪潮信息:2023年eBPF技术实践白皮书(64页).pdf

    编写说明编写说明 编写单位编写单位:浪潮电子信息产业股份有限公司、阿里云计算有限公司 参编组织参编组织:龙蜥社区 编写组成员编写组成员:苏志远、吴栋、方浩、王传国、梁媛、黄吉旺、毛文安、程书意、甄鹏.

    浏览量0人已浏览 发布时间2023-11-14 64页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 中移智库:2023先进感知技术白皮书(1.0版)(41页).pdf

    感知是通过各类感知设备获得目标信息的过程,为行业应用提供了支撑智能决策与控制的数据基础,是构建“万物智联”的核心要素。为不断满足各类应用对感知能力的需求,先进感知技术持续发展,技术方向涵盖传感前沿技术和传感融合技术两类。本白皮书立足于移动通信发展视角,基于物联网的应用需求和演进方向,选取传感前沿和传感融合的代表性技术,解读技术原理,梳理技术现状,分析技术挑战,探索技术趋势,希望能够为加快先进感知技术的研究突破和落地应用提供参考。本白皮书的版权归中国移动所有,未经授权,任何单位或个人不得复制或拷贝本建议之部分或全部内容。中国移动先进感知技术白皮书(1.0 版)目录1.1.概述概述.1 11.1 先进感知技术方向.11.2 传感前沿技术.21.3 传感融合技术.32.2.传感前沿技术传感前沿技术.4 42.1 新机理.42.1.1 量子传感.42.1.2 脑电传感.62.2 新材料.72.2.1 柔性传感.82.2.2 触觉传感.92.3 新工艺.112.3.1 片上光学传感.112.3.2 微流控生物传感.132.4 新结构.142.4.1 仿生视觉传感.152.4.2 堆栈式图像传感.162.5 新算法.182.5.1 光纤传感.182.5.2 超敏气味传感.203.3.传感融合技术传感融合技术.22223.1 通信融合.223.2 计算融合.243.3 智能融合.253.4 能量融合.274.4.总结与展望总结与展望.2828缩略语列表缩略语列表.2929参考文献参考文献.3 30 0参编单位及人员参编单位及人员.3 38 81感知是通过各类感知设备获得目标信息的过程1,包括对感知数据的采集、处理和感知结果的生成等。感知作为物联网的基石,为各类业务提供了支撑智能决策与控制的数据基础,是构建“万物智联”的核心要素。感知技术已经广泛应用于航天航空、工业制造、生物医学、智慧交通、智慧能源和环境检测等领域。随着行业信息化程度的不断加深和场景的不断细分,各类应用对感知技术提出了新的需求。第一,行业新场景需要进一步拓展感知范围、提高感知精度和增加感知目标。第二,传统传感器参数固定,精度、效率随着使用时间下滑,未来需要能够对自身进行动态优化。第三,垂直行业的智能化发展需要感知与通信、处理和控制等更多功能深度融合。第四,传统传感器的电源线和数据传输线对应用产生较大制约,导致布线成本高、施工难度高,未来需要实现传感器的无源化和无线化,实现传感器“剪辫子”。为满足各类应用对感知能力的需求,先进感知技术不断发展,通过技术创新提高了感知数据精度和感知效率,扩大了感知范围和感知规模,并不断实现网络化和智能化,进一步开拓了感知技术面向各应用领域的发展空间。近年来,随着数字孪生和元宇宙的不断发展,感知作为底层数据来源及技术支撑,其重要性日益凸显,在应用需求的不断驱动下,感知将与数字孪生和元宇宙相互促进,势必迎来爆发式技术突破及市场增长。1.1 先进感知技术方向先进感知技术方向先进感知技术方向涵盖传感前沿技术和传感融合技术两方面(如图 1)。传传感前沿技术感前沿技术是涉及传感原理、传感器件设计、传感器开发和应用的综合技术,融合了多学科、多技术和多领域的最新技术进展,涉及物理、化学、生物、能源、通信和数据处理等,是支撑传感器研发、制造和应用的核心。传感融合技术传感融合技术使原本独立的单一参数感知、通信、计算、智能和供能等基础能力紧密结合,有助于提升感知效率,扩大感知技术的应用范围。2图 1.先进感知技术方向1.2 传感前沿技术传感前沿技术随着信息通信技术的快速发展,传感前沿技术不断涌现,通过对机理机理、材料材料、工艺工艺、结构和算法结构和算法等五个方面的技术创新,实现更大范围和更高精度的信息获取。新机理方面,量子传感和脑电传感等是其中的典型代表,在航空航天、安新机理方面,量子传感和脑电传感等是其中的典型代表,在航空航天、安全监测和可穿戴器件等领域具有巨大的应用价值全监测和可穿戴器件等领域具有巨大的应用价值。量子传感通过量子效应提高感知精度,具有非破坏性、实时性、高灵敏性、稳定性和多功能等优势。脑电传感获取大脑活动产生的电信号,通过信号分析实现大脑与外部的信息交换,将在医疗、娱乐、军事和教育等行业发挥重要作用。新材料方面,新型柔性材料等作为传感器敏感材料,未来将助力更多业务新材料方面,新型柔性材料等作为传感器敏感材料,未来将助力更多业务场景拓展场景拓展。柔性传感利用柔性材料良好的柔韧性和延展性,制作可穿戴设备,在智能机器人和医疗养老等方面前景广阔。触觉传感以柔性材料为基础,结合器件物理学和柔性电子学的前沿进展,在传感精度和机械性能方面有较大提升。新工新工艺方面,艺方面,MEMSMEMS 是以微电子技术为基础的前沿研究领域,是传感器工艺是以微电子技术为基础的前沿研究领域,是传感器工艺的重要发展趋势的重要发展趋势。片上光学传感利用微纳加工工艺实现传感器的小型化、低功耗和低成本,是光学传感的重要发展方向。微流控生物传感基于细微加工技术,可在微米级流道内完成实验室所需全部分析流程,用于医疗领域可大幅降低病人取样的等待时间和痛苦程度,受到业界的广泛关注。新结构方面新结构方面,仿生结构和仿生结构和 3D 堆栈结构分别堆栈结构分别为为视觉视觉传感传感和图像传感和图像传感的的技术技术研研究和器件开发提供了新的思路究和器件开发提供了新的思路。仿生视觉传感通过模拟人眼球视网膜的结构和作3用原理,实现在不同光照情况下的高效信息采集,是未来视觉传感的重要方向。堆栈式图像传感通过结构的优化提高光线的接收和处理效率,从而降低噪声、提高图像质量并扩大动态范围。新算法方面新算法方面,基于原有的基于原有的基础基础设施设施,通过信号检测通过信号检测、分析分析和新算法的运用和新算法的运用,可以获得新的传感信息可以获得新的传感信息或进一步提高传感精度或进一步提高传感精度。光纤传感利用光纤通信技术中的分析测试算法对光的各类参数进行计算,能够获得对结构完整性和设备状态等的感知结果。超敏气味传感基于创新的模式识别算法实现性能优化,为环境监测和辅助医学诊断等应用带来新的机遇。1.3 传感融合技术传感融合技术为满足生活、生产和社会领域新场景和新业务的多元化需求,未来的感知系统还需要具备极致的通信能力、强大的计算能力、高度的智能化能力和无源的供能能力,通信融合通信融合、计算融合计算融合、智能融合和能量融合智能融合和能量融合等方面的技术已成为新一代移动信息网络的发展态势,也是未来 6G 物联网技术融合发展的重要方向2。通信融合方面,面向广域和局域,以及微域和短距的无线通信技术能够支通信融合方面,面向广域和局域,以及微域和短距的无线通信技术能够支持传感器实现感知和传输能力的有效提升,更好的满足差异化的场景需求。持传感器实现感知和传输能力的有效提升,更好的满足差异化的场景需求。广域和局域通信以蜂窝网络和无源物联网为代表,能够支持室外广域覆盖场景中的传感信息高效传输和通信感知一体化,降低通信功耗并实现对海量目标的感知。微域和短距通信的典型代表是太赫兹通信,太赫兹波既具有毫米波的波动性,又具有红外线光的粒子性,除用于通信外,还在基因检查等医学领域发挥重要的作用,实现通信与感知的深度融合。计算融合方面,数据压缩、感内计算和异构计算等新型计算技术的研究和计算融合方面,数据压缩、感内计算和异构计算等新型计算技术的研究和应用应用,可满足传感器对于高算力可满足传感器对于高算力、低时延和低功耗的要求低时延和低功耗的要求。数据压缩能够减少数据传输量,延长传感器网络生命周期,结合深度学习等 AI 技术可实现数据高效压缩处理。感内计算通过在传感器内部构建新型感知运算模块,从信息采集的源头实现智能化信息预处理,减少数据传输规模,简化后处理流程。异构计算利用端侧异构计算单元协同工作,实现联合计算,从而获得更好的性能和更低的功耗。智能融合方面,智能微系统、分布式计算和群智感知等通过传感与智能化智能融合方面,智能微系统、分布式计算和群智感知等通过传感与智能化的深度融合的深度融合,能够有效提升端到端综合感知能力能够有效提升端到端综合感知能力。智能微系统支持传感器在提高4功能密度的同时向能力集成化、通信无线化、供能无源化和应用智能化发展,未来将围绕自主灵巧执行和高效资源利用等方向不断演进。分布式计算使传感器能够具有良好的扩展性和容错性,未来在任务分配和调度算法方面将进一步优化。群智感知利用人群通用移动设备作为传感节点,具有节点开放化、可按需部署和按需调度等优势,能够满足城市级大范围细粒度的传感任务要求。能量融合方面,能量融合方面,能量采集与感知和能量管理等技术能够改善传统有源供电能量采集与感知和能量管理等技术能够改善传统有源供电(电池(电池/布线)的问题,实现传感器无源化。布线)的问题,实现传感器无源化。能量采集与感知一方面从环境中收集光能、风能、温差能、振动能或射频能等,将其转换为电能以确保传感器正常运行,研究重点是提升能量收集密度,提高能量转换效率。另一方面将供能源作为感知对象,真正实现数能融合。能量管理确保传感器长期稳定运行,研究重点包括采能高效管理、储能优化控制以及用能按需调整等。2.1 新机理新机理传感新机理是指基于物理、化学、生物的效应,采用新的检测机理,提高传感的灵敏度、准确度和响应速度等性能指标,以满足不断变化和发展的应用需求。新机理包括量子传感、脑电传感、声表面波传感、微波光子传感等方方面面。以量子传感为例,其利用量子力学探测并提取信息,突破传统传感技术的能力极限。量子传感技术应用范围广泛,可用于军事、交通及航空航天等重要领域。未来,新机理的不断发展将持续推动传感技术的升级,并带动传感新材料、新工艺、新结构和新算法的持续发展。2.1.1 量子传感量子传感当前,电子、光学和声学等传感技术的广泛应用为生产和生活提供了极大的便利。然而,传统传感技术的探测精度、设备尺寸和响应速度等重要指标均受制于经典物理学的基本原理,难以满足新一代半导体研发和航空航天等高精尖产业5的需求,而基于量子力学原理的量子传感技术则逐渐崭露头角。量子传感是一种量子传感是一种利用量子力学来探测并提取信息的技术手段,其利用量子物体、量子相干效应利用量子力学来探测并提取信息的技术手段,其利用量子物体、量子相干效应或量子纠缠测量特定的物理性质或量子纠缠测量特定的物理性质,从而提供超越经典极限的传感灵敏度和精度从而提供超越经典极限的传感灵敏度和精度。量子传感器一般是一个具有离散能级的单粒子或多粒子系统,此类系统受到各类场(例如电磁场或引力场)的作用时会发生干涉,即量子传感器在探测到外部场干扰时,能够将粒子系统的初始态转化为另一个量子态。量子传感有多种重要的探测手段,例如 Ramsey 测量3,Rabi 探测4,Bose-Einstein 凝聚5等。其中,Ramsey 测量最为重要且基础,它使用两个间隔时间的脉冲来操控和测量量子系统,主要用于原子钟、核磁共振、惯性导航和天体辐射频谱等高精度测量。以原子钟为例,对稳定的原子样本(如处于基态的铷或铯等)施加一个脉冲(多为微波脉冲),原子会进入自由演化态,再施加第二个脉冲令其回到初始态,通过分析演化过程的概率分布即可精确推算出原子的震荡频率,实现对时间的校准。噪声是降低量子传感灵敏度和稳定性的主要原因,包括量子投影噪声、退相干与弛豫现象导致的噪声等。投影噪声的诱因是量子力学的不确定性原理,即在测量导致的量子态坍缩过程中,即使是相同的初始态和演化过程也可能导致不同的结果。退相干与弛豫噪声同样是量子力学的基本现象,退相干表示量子传感系统在外部干扰下量子干涉效应的减弱,而弛豫则是量子系统向热平衡演化的过程,二者都意味着量子系统逐渐退化为经典系统。针对噪声问题,当前研究方向包括三个:一是改进冷却技术,即通过降低温度来弱化退相干和弛豫的影响;二是研究量子校准技术,利用量子干涉来改进相位测量的灵敏度6;三是研发具有更好量子态和更低噪声水平的新型量子材料。量子传感技术具有广阔的应用前景,量子陀螺仪7和加速计等传感器可用于提高导航系统的精确性,可在无人驾驶、航空航天和海洋导航等领域广泛应用(如图 2)。同时,量子传感技术也可用于测量生物分子的结构和相互作用,赋能医药研发或疾病检测。目前,受限于抗环境干扰和去相干效应8,以及集成到微纳尺度器件中存在的稳定性、耦合和量子比特相互影响等工艺难点,量子传感器尚无商用产品问世,仍停留在方案设计或原型验证阶段。例如,相关企业已经开展了量子陀螺仪的研发工作9,通过测量原子自旋进动频率的变化来计算当前的角6速度,感知精度有较大提升。同时,众多国内企业和科研机构也已相继开展研发,推动量子传感器持续快速发展。图 2.量子陀螺仪用于汽车的偏航速率传感器10未来,量子传感的研究将围绕重要物理参数的测量展开,如量子重力测量和惯性测量等。此外,基于量子纠缠的新一代远程通信可实现近乎零时延通信,量子密钥分发(QKD)可为通信双方创建高安全信息通道。量子传感也将与量子通信等技术进一步结合,促进人类向量子信息技术时代加速迈进,推动社会数智化转型。2.1.2 脑电传感脑电传感长期以来,为充分了解人类的思维和行为,科学家们致力于对大脑结构、功能和信号等进行研究。但由于大脑难以直接观察和测量,传统传感技术在直接获取大脑信号方面存在一定挑战。人脑的思维涉及到电生理活动和化学反应,可以采用高灵敏度和高分辨率的传感器进行捕捉和记录。脑电传感技术将传感器放置脑电传感技术将传感器放置于头部,获取大脑活动产生的微弱电信号。通过计算机对脑电传感的信号进行于头部,获取大脑活动产生的微弱电信号。通过计算机对脑电传感的信号进行解码,分析神经元传递的信息,可以了解人的认知、情绪和运动等脑内活动,解码,分析神经元传递的信息,可以了解人的认知、情绪和运动等脑内活动,并进一步实现大脑与外部设备的信息交换。并进一步实现大脑与外部设备的信息交换。脑电传感可以分为侵入式和非侵入式。侵入式脑电传感通过植入电极采集脑电信号,但存在创伤大和易出现并发症等问题11。近年来,研究人员不断探索通过微创手术的方式,将脑电传感器植入血管,附着在大脑血管壁上,从而一定程度上兼顾安全性和有效性。非侵入式脑电传感通过在头皮表面放置电极采集脑电信号,虽然采集的信号质量低,但具有无创和安全性高的优点,并朝着小型化、便携化、可穿戴化及简单易用化方向发展。7脑电传感涵盖硬件和软件。硬件的核心是脑电采集设备。常见的脑电采集设备有微纳电极、头戴式脑电帽电极和脑起搏器电极三类,由耐高温、耐化学蚀刻、具有生物兼容性的材料制成。柔性电极具有密度高、信号稳定和损伤小的优势,是现阶段脑信号传感电极的主攻方向12,未来电极还将趋于小型化、高通量和集成化。软件包括信号处理和 AI 算法等。信号处理通过信号去噪、信号特征提取和信号编解码等步骤,从大脑神经信号中提取有用信息。AI 算法通过建立大脑信号特征向量与大脑活动之间的关系实现特征分类,提高系统准确性13。由于大脑高度复杂,且大脑活动存在个体差异,因此软件层技术需要具备一定的适应性和可学习性,可根据不同个体的神经信号特征进行优化调整。迁移学习通过共享模型和参数,在多个个体上进行训练,可以使模型学习到更广泛的脑电活动特征,从而提高解码的泛化能力和适应性14。脑电传感最主要的应用领域是医疗,在疾病的诊断、治疗和康复方面具有极大价值,可减轻医疗人员压力,提高医疗效率。近年来,脑电传感也逐步向娱乐、军事、教育等领域拓展,可用于实现电影和游戏等方面的沉浸式和个性化人机交互,可用于研制提升作战能力的脑控武器,也可用于监测学生注意力和疲劳状态以帮助老师及时调整教学方法。受技术、伦理和安全因素的制约,各国对非侵入式脑电传感的研发投入远高于侵入式脑电传感,目前非侵入式脑电传感已经有可穿戴语音生成设备15、意念无人机16、脑控智能仿生手17等成熟的产品落地。侵入式脑电传感的应用仍集中于医疗领域,已有产品通过动物试验让猴子控制电脑光标18,后续将进行人体临床试验19。随着脑电传感技术的高速发展,以及物联网微域通信技术的革新,未来植入人脑的微型传感装置不但可对脑部信号进行高精度检测,提高多种类和复杂人脑活动的处理准确性,也能基于微域通信形成自组织网络,与外界实时互动,为脑机交互提供了新的发展机会和前景,将广泛应用于人体健康监测、虚拟现实和游戏控制等方面,实现更加良好的应用体验,为人类带来便利与福祉。2.2 新材料新材料传感新材料是指不同于传统金属材料以外的,可用于响应环境变化并传递电信号的新型材料,是传感技术未来的重要发展方向之一。目前,新型传感材料的8研究热点主要包括纳米材料、液态金属和金属氧化物材料等等。新材料通常具备有别于传统材料的特殊优势,如纳米材料具备更高灵敏度的结构和更低的单位重量,金属氧化物材料具备更好的延展性和柔韧性。在新材料中,具备柔性特征和触觉级别感知能力的材料能够提高传感器的灵敏度,解决传统材料难以部署在曲面、水下等特殊位置的缺陷,因而受到广泛关注。新材料将推动传感器在更多领域应用,为万物智联奠定重要基础。2.2.1 柔性传感柔性传感传统的高性能电子器件是由刚性半导体材料制成的,如硅和砷化镓等。刚性限制了电子器件与生物组织材料的兼容性20。柔性材料有更好的柔韧性和延展性,可根据测量条件的要求任意形变,因而由柔性材料制成的柔性传感器以其灵活便捷的特点,能够应用于更广泛的场景中,是当前的研究热点。柔性传感器是基于柔性传感器是基于柔性材料制成的传感器,具备了可弯曲和可变形的特点柔性材料制成的传感器,具备了可弯曲和可变形的特点 2121,能够更紧密的贴附,能够更紧密的贴附在待测物体上在待测物体上,极大地提高了复杂信号的测量准确性极大地提高了复杂信号的测量准确性 2222,且生物相容性更好且生物相容性更好 2323,能够在保证灵敏度和分辨率等性能的前提下,实现与刚性传感相同的功能。能够在保证灵敏度和分辨率等性能的前提下,实现与刚性传感相同的功能。柔性材料可用于制作传感器的基底和传感介质,并与传统硅基电子系统无缝连接,使传感器更好地贴附在物体表面并与生物组织交互。柔性材料按照使用方式可分为柔性导体、柔性半导体和柔性介质三类24。柔性导体主要包括液态金属、石墨烯和导电纳米油墨等,常用作柔性电子器件中的导线和电极等基底材料。柔性半导体主要用于制作柔性传感器,主要包括氧化锌和硫化锌等无机材料,三苯基胺和富勒烯等小分子有机材料,以及聚乙炔型和聚芳环型等高分子有机材料。柔性介质则是具备绝缘特性的柔性材料,主要包括聚合物基底和超薄玻璃基底等传统材料和使用花粉、花瓣或蚕丝等生物薄膜基底的新型材料,多用于制作贴附在物体表面的柔性基底。目前,柔性材料仍然面临生产成本高和制备工艺复杂等问题。采用液态金属和黑磷等本身具备较好电特性的材料,混合使用无机或有机材料或采用多层结构等方式能够有效提高柔性材料的性能,降低制备难度。除柔性材料外,制造技术也是保证柔性传感器能够得到大量生产和应用的关键,主要涉及减薄、柔性化结构设计和转印三方面25。目前制造技术的瓶颈主要集中在难以实现小体积芯片的减薄,以及高分辨率和大规模高效率的转印26。随9着纳米技术的发展,业界提出了使用纳米金刚石对半导体芯片和晶圆进行打磨和抛光的方法,在实验室初步实现了纳米级转印。目前,柔性传感技术主要应用在智慧医疗、智能穿戴等领域中,附着了柔性传感器的床单、鞋垫和手环等可用于监测人体脉搏节律,运动状态和睡眠质量等信息。柔性传感技术还有望应用于水产养殖领域,用于实时监测鱼类活动信息和水质数据,提高养殖智能化水平。然而,由于材料成本较高、制备工艺不成熟和集成方式受限等因素,柔性传感距离规模应用仍有差距。当前,国内外多家企业纷纷开展柔性传感技术研究并推出基于柔性温湿度传感、压力传感的产品和解决方案。随着更多企业的投入,柔性传感产业能够得到进一步扩展,更多的检测仪器设备能够实现柔性化。未来,柔性传感技术将进一步围绕提高灵敏度、分辨率和信号处理能力,以及与无线传输和供电模块的融合等方面展开研究。随着技术的发展,柔性传感器将能更加贴近生物体特征,支持实现具备高度感知能力的仿生机器人,成为数字孪生和元宇宙的重要基础。2.2.2 触觉传感触觉传感近年来,机器人已经广泛应用于生产和生活的各类场景中,如工业机器人和家庭服务机器人等。当操作易碎或柔软物体时,传统的计算机视觉很难获取对象的硬度、纹理和材质等属性,使机器人易因抓取力过大而对物体造成损伤甚至破坏,或因抓取力度过小导致滑落。因此,在精准操作的场景中,触觉传感逐渐成为机器人感知抓取对象的重要方法,极大的提高了机器人的灵活性和场景适应性。触觉传感可用于检测接触、压觉和滑觉等物理特征量,通过模拟人体皮肤提取触觉传感可用于检测接触、压觉和滑觉等物理特征量,通过模拟人体皮肤提取接触物的刚度、形状和大小信息,并转换成相应的电信号接触物的刚度、形状和大小信息,并转换成相应的电信号 2727(如图(如图 3 3)。)。10图 3.触觉传感器示例28触觉传感的原理和目标与压力传感相似,但要求更高,关键在于器件对于力度和力向的精确感知。力度上通常需要感知微牛顿或纳牛顿量级的力,力向上需要感知法向力和剪切力29。触觉传感器按照原理大致可分为压阻式、电容式和压电式30三种。压阻式触觉传感器利用力敏材料的形变导致其电阻变化的原理,通过在电极上覆盖力敏材料薄膜获得力的变化信息。电容式触觉传感器通常采用由两块极板和电极组成的“三明治”结构,当外力影响极板间距或重叠面积时,获得电容随外力线性变化的曲线。压电式触觉传感器依靠压电转换效应工作,即力敏材料受力产生形变时根据其不同位置积累的电荷判断力度和力向31。根据上述原理可知,力敏材料和结构工艺是决定触觉传感器性能的关键。力敏材料通常需要同时具备高电导率和较小的机械性能影响,而目前大部分碳基材料虽然成本低廉,但加工难度较高,且无法保证良品率。近年来,碳纳米管32、石墨烯、中空碳球33等碳基纳米材料因具有良好拉伸性、高灵敏度和明显方向导电性而逐渐成为研究热点。结构工艺方面,由于触觉传感器必须由具备弹性模量的材料制备,各元件间的弹性耦合难以避免,导致传感阵列对力的空间分布映射并不精确,难以对各方向的力进行有效区分,因此,大部分触觉传感器仍处于研究或原型阶段。触觉传感是伴随智能机器人概念而生的传感前沿技术,可用于智能机器人手臂和工业智能机械臂等对于易碎物品的操作等应用场景,或用于制作自动化微创手术工具、环境检测和水果的自动化筛检等方面。作为未来元宇宙、智能机器人和仿生皮肤的关键基础技术,已有多家国内外公司开展触觉传感技术布局,并发布多个原型产品,但距离实际应用仍然较远。11未来,触觉传感器不断向导电方向性更好的材料、更精细的工艺和更灵敏的结构发展,以实现传感器的小型化、高度集成化和柔性化。此外,与视觉等多元能力的融合以及仿生触觉传感器也是业界重点关注的方向,通过模仿鼹鼠胡须34或灵长类手指结构35等生物结构,触觉传感器正逐渐实现微牛顿或纳牛顿量级感知的目标,进一步拓宽其应用范围,使其在航空航天、工业制造、可穿戴设备和人机交互等领域具有更加广阔的应用前景。2.3 新工艺新工艺工艺是制作传感器件实体的重要步骤,工艺的发展可以使技术创新不止停留在想法层面,而是完成工程化实现,目前业界主要关注 MEMS 制造工艺的优化及演进。MEMS 制造工艺包含硅微机械加工、深反应离子刻蚀、光刻、分子沉积、表面微加工、激光微加工和微型封装等多种。各细分工艺均具有独特优势,如部分激光微加工支持将基电极直接打印在超薄凝胶膜上,从而实现柔性传感;表面微加工支持将传统的弹簧、阀门、开关、透镜和转轴等器件缩小为微米或纳米级,进一步增强片上系统的功能密度和器件微纳尺度下的物理特性,拓展传感器的应用领域。由 MEMS 制造工艺构建的传感器具有体积小、重量轻、功耗低、可靠性好、成本低廉和性能稳定等优点,具有良好的产业前景。2.3.1 片上光学传感片上光学传感在目标物检测领域,光学技术不存在电磁干扰和光信号间的自干扰36,具备可成像和可获取光谱信息等特性,因而具有高精度、快速、实时和非接触等优点。然而,传统的光学传感技术往往依赖于复杂的耦合光路和外部精密的检测设备,存在体积大、重量大、功耗高、成本高以及操作复杂等问题,难以满足便携式应用的需求。片上光学传感片上光学传感是是将透镜、光源、波导结构将透镜、光源、波导结构和和耦合阵列等光学器件集耦合阵列等光学器件集成在一颗芯片上,成在一颗芯片上,实现传感器的小型化、低功耗和低成本实现传感器的小型化、低功耗和低成本,并利用纳米光学技并利用纳米光学技术实现对象的高精度检测,是光学传感未来发展的重要方向。术实现对象的高精度检测,是光学传感未来发展的重要方向。片上光学传感可分为波导型和自由空间型两类器件技术架构。前者利用平面光波导作为面内光传输的控制单元,在平面内耦合光源、光探测器和光学传感单元形成单片集成的检测系统。后者利用可片上集成的自由空间光路,在垂直平面12方向耦合光源、光探测器和光学传感单元形成单片集成的检测系统。纳米光学技术和微纳加工工艺是实现片上光学传感的核心。纳米尺度的共振结构可以增强光与物质的相互作用,并提供在空间域和频域等多维度的光场调控能力,增强传感器的灵敏度和传感器光谱的品质因子。微纳加工工艺是实现纳米尺度结构的关键技术,目前已成为片上光学系统的研究热点。由微纳加工工艺完成的光学器件具备高灵敏度、高集成度和低噪声等优势。以高效的光学超声波传感器微腔光粒系统为例37,由于存在超声波吸收损耗等问题,其在空气环境中较难实现高灵敏度。业界使用光刻、氢氟酸腐蚀、氟化氙刻蚀以及二氧化碳激光回流等微纳加工工艺,获得了高机械品质因子和高光学品质因子的微芯圆环腔,减少来自衬底的机械运动的约束,使得微腔光粒系统的灵敏度不再受到空气-声源界面阻抗失配的影响。此外,针对纳米材料对波导表面粗糙度较为敏感的问题,业界提出了基于电感耦合等离子体刻蚀的方式,采用 CF4/Ar 混合气体进行表面光滑,实现刻蚀深度为 4微米并且保持侧壁光滑和理想的波导陡直度,能够减少波导损耗,提高灵敏度和检测范围38。当前,片上光学传感被应用于智慧工厂、智慧楼宇、危险气体检测、现场快检等领域,小型化的光学传感器不占用空间,具有成本低、功耗低、体积小、便于使用等特点,能够被集成在各类智能终端并部署在各种场景中。但是,受限于高质量光源集成、加工工艺成本以及难以与其他模块异质集成等问题,片上光学传感技术尚未实现在低成本的前提下,拥有与传统光学检测技术相近的光谱分辨率和提取效率等。当前,部分国外公司已经推出了无源化和小型化的光学传感设备,光谱仪等多种传统光学传感器业实现了芯片化。同时,片上光学传感在国内也得到了广泛关注和研究,但相关产品仍处于起步阶段,较国外先进产品仍有一定差距。未来,片上光学传感技术有望实现性能的进一步突破,达到与传统光学传感器相似的准确率、识别速度和光源质量,提高集成光学器件的大数据处理能力,进一步实现光学传感在更多领域中的应用推广,成为元宇宙和虚拟现实技术落地的重要基础。132.3.2 微流控生物传感微流控生物传感在医学领域,传统的生物样本检测往往存在样本和试剂消耗量高以及检测时间长等问题。近年来,随着 MEMS 和高分子材料技术的逐渐成熟,以及体外非侵入式检测和现场即时检测的兴起,微流控生物传感技术以其耗样量低、灵敏度高和分析速度快等优势受到了广泛的关注。微流控生物传感技术微流控生物传感技术,或称片上实验室或称片上实验室(LabLab onon a a ChipChip),可利用),可利用微细微细加工技术在玻璃或塑料基板上制作溶液流动的加工技术在玻璃或塑料基板上制作溶液流动的微小通道网络并集成在芯片中,从而将若干个实验室检测项目集中和缩小到一微小通道网络并集成在芯片中,从而将若干个实验室检测项目集中和缩小到一个几平方厘米大小的芯片上完成个几平方厘米大小的芯片上完成 3939(如图(如图 4 4)。)。图 4.微流控技术原理示意图40微流控芯片是微流控生物传感的核心,一般由多组微流道、微泵和微阀组成,利用诸如层流、扩散和表面张力等现象对待测样品进行操作和控制,包含对样品的输送、混合、反应和分离等过程41。首先,样品通过空气压力和压电驱动等外部推力,或毛细力等自然力输送进入微流道42。样品的流向及流速由微阀控制,之后,样品进入混合区,在充分混合反应后进入分离区,基于粒子惯性、大小和特异亲和力等特性实现待测物与非待测物的分离43。当前,微流控芯片的研究主要集中在流控、材料和生化特异性等方面。流控方面,当前微流道通常为微米级44,但对于单分子或单细胞样品,或 aLfL 体积量级的超微型样品的操作需要纳米级流道完成(10103nm)。然而,过小的尺寸会导致流体与流道壁面的相互作用增强,产生涡旋、表面黏附或堵塞等负面效应,加大了样品混合和分析的难度45。同时,微米级流道需针对不同生化分析设计不同的流控方法,极大地增加了设计难度。材料方面,传统硅材料、玻璃和石英材料存在与生化粒子兼容性较差、不易于光刻和蚀刻以及制作工艺复杂等问题。而14高分子聚合物材料易于加工成型,在绝缘性、耐高压性、热稳定性、生物兼容性和气体通透性等方面表现突出,以聚二甲基硅氧烷为代表的有机高分子聚合物46,以及水凝胶47和纸基48等新型材料逐渐成为业界研究的热点。生化特异性方面,探针分子对待测分子的结合力和筛选性决定了微流控生物传感的反应速率和分析精准度。因此,在微流控芯片设计过程中需要对探针分子进行选型或针对性表面装饰,或人工合成探针分子以进一步提升灵敏度和准确性。微流控生物传感主要应用于医疗和生物化学领域,当前已在怀孕检测和新型冠状病毒检测等即时诊断领域具有较为广泛的应用。同时,业内目前还聚焦于与蛋白质相关的多肽定量和磷酸分析、与细胞相关的糖链和外泌体特征分析、与血液相关的血糖和血离子分析,以及水质分析等应用领域。当前,微流控生物传感的大部分研究均已商业化或进入临床阶段,然而,受限于芯片大小、性能等因素,面向传染病、肿瘤和毒品等复杂样本的微流控生物传感技术仍停留在实验室研究阶段。针对此问题,业界提出多种基于智能手机辅助检测的方案,通过高分辨率摄像头识别活细胞或大分子,再通过软件进行定性或定量分析,实现如埃博拉病毒抗体检测和细胞损伤标志物检测等应用49。未来,微流控生物传感有望摆脱辅助识别设备,在癌症50和眼科疾病51等领域发挥出更大价值。此外,随着微流控技术与光学技术的结合,利用光流控技术开发小型化且高度集成的光学仪器开启了操纵光和流体的新篇章,在下一代集成光学器件、生化分析仪和环境监测等领域具有广阔的应用前景。2.4 新结构新结构传感结构是指传感器硬件之间的排列架构组合方式,结构设计与物理原理直接相关,对于新结构的研究主要集中在较为复杂的传感器类型。受人或动物的生理功能和结构的启发,视觉、嗅觉、听觉和触觉等仿生传感技术也备受关注,具有极大的发展前景。此外,以 CMOS 图像传感为例,其结构分为前照式、背照式和堆栈式三种。前照式结构光线利用率较低,背照式通过结构的改变,提高了光线利用率,从而提高传感器灵敏度。近年来,堆栈式结构不断发展,通过在垂直方向上堆叠多个层次的电路和感光器件,提高光线的接收和处理效率,从而实现更高的图像质量、更低的噪声和更好的动态范围。未来,传感结构的进步将持续15促进传感能力的提升,推动传感器技术和产业的全面发展。2.4.1 仿生视觉传感仿生视觉传感视觉传感是获取外部环境图像信息的重要手段,主要由图像传感器和其他光辅助设备组成。传统的视觉传感存在视觉适应性差和感知效率低等问题,难以适应各类新场景的要求。而仿生视觉传感由于在有效光强感知范围、感知频谱和自适应能力上有着更加出色的表现,成为视觉传感的重要发展方向。仿生视觉传感仿生视觉传感是通过模仿生物视网膜原理和结构来提升视觉传感器性能的新型传感技术。为是通过模仿生物视网膜原理和结构来提升视觉传感器性能的新型传感技术。为了适应自然界中多样化的复杂环境,各类生物进化出了赖以生存的视觉感官系了适应自然界中多样化的复杂环境,各类生物进化出了赖以生存的视觉感官系统,研究人员通过对生物体视觉系统的结构与工作原理的研究,仿照其实现方统,研究人员通过对生物体视觉系统的结构与工作原理的研究,仿照其实现方式形成仿生视觉传感。式形成仿生视觉传感。自然界中的光强分布范围通常超过 280dB,常用的硅基 CMOS 感光元件约 70dB的感光范围难以应对。早期的研究通过控制光学孔径、调节曝光时间及后期图像算法等方式来提升图像质量,但资源开销较大,造成运转效率大幅降低。人类视网膜虽然只有约 40dB 的感光范围,却能快速适应光线的强弱变化,在暗光环境下仍能保持优异的视觉性能,这是由于人眼的光接受细胞可以在不同光照环境下通过水平细胞控制视锥和视杆细胞的转换以及光色素的产生和消失。据此原理,研究人员利用二硫化钼光电晶体管模拟水平细胞和光接收细胞结构,研制了拥有像素级高局部且动态光敏能力的仿生视觉传感器,有效感知范围可达 199dB52。此外,人类的视锥细胞能够识别可见光波段中的长波(红光)、中波(绿光)和短波(蓝光),通过光强度的组合区分 150 多种颜色。但自然界一些昆虫的视觉范围可以拓展至紫外波段,即具有四色视觉(tetrachromacy)能力。受此启发,对使用 OPTs 的传感单元利用人工神经网络对红绿蓝噪声进行过滤,传感器阵列可以实现光照强度低至 31nWcm-2的紫外光检测,识别精度由 46%提升至 90%,同时具备较高灵敏度的图像感知和记忆能力53。除了生物结构外,仿生视觉传感还涉及对新材料的研究,具有热释电效应的材料是提升仿生视觉能力的重要方向之一。通过应用新型半导体材料如-InSe,光热效应和光电效应可以结合形成新的工作机制,使得器件级的恒定光刺激动态适应成为可能,实现类人眼的适应行为,包括宽光谱感知、相似的光敏恢复能力16和协同视觉功能54(如图 5)。图 5.人类视锥细胞对光线的感知适应示意图仿生视觉传感在车联网无人驾驶、机器人导航、工业自动化和智能监控等领域具有广阔的应用前景。现阶段的仿生视觉传感技术仍处于研究初期,多以借鉴视网膜的处理机制和实现原理为主,在实际应用中的光照适应速度和光学能力距离生物视觉水平仍有较大提升空间,因而尚未规模化商用。未来通过实现更大规模的阵列制备和异构集成等技术,仿生视觉传感有望实现与人类视觉系统类似的的高效人工视觉系统,并进一步结合深度学习与人工智能技术提升分辨率和采样速率,从软硬件两个层面共同推动视觉传感器通用化、小型化和低功耗,提升系统的环境感知能力,助力未来发展和生产效率的提高。2.4.2 堆栈式图像传感堆栈式图像传感图像传感器作为消费电子中应用最广泛的传感器之一,业界一直聚焦于缩小尺寸、提高像素量、色彩饱和度和处理速度等方面。传统 CMOS 图像传感器的光电二极管和逻辑电路一般分布在同一基片,且为了保证结构强度需要将基片集成在支撑衬底上,导致在制造工艺方面无法实现效果最优化,感光像素的面积也受到诸多限制。针对上述问题,基于堆栈式基于堆栈式 CMOSCMOS 结构的图像传感技术被提出结构的图像传感技术被提出,其其使用带有逻辑电路的芯片层替代了传统图像传感器所需的支撑衬底,在保证图使用带有逻辑电路的芯片层替代了传统图像传感器所需的支撑衬底,在保证图像传感器结构强度的同时为像素区域的制造去除了诸多限制像传感器结构强度的同时为像素区域的制造去除了诸多限制(如图如图 6 6)。17图 6.传统背照式图像传感和堆栈式图像传感对比示意图55初代堆栈式 CMOS 图像传感器采用硅通孔(TSV)技术实现感光像素与逻辑电路的连接56,后续陆续推出了通过 Cu-Cu 键合方式代替 TSV 进一步实现小型化并提升效率,以及通过直接集成 DRAM 层加强慢动作摄影能力等诸多创新方法。近年来,随着智能手机向多摄像头方向发展,厂商对于高像素图像传感的需求越来越强。通常情况下,提高像素密度能够带来更高的分辨率和更强大的长焦能力,但像素密度的增大也意味着单个像素单元尺寸的减小,使得像素单元中的放大晶体管尺寸受限,从而加大随机噪声信号,导致最终画质的下降。2021 年,双层晶体管像素堆栈式 CMOS 图像传感技术被提出57,将原本同处于像素层的光电二极管与像素晶体管进一步拆分,形成两层堆叠结构(如图 7),使得光电二极管和像素晶体管能够分别独立进行优化。分层处理允许在增加光电二极管数量的同时使用较大尺寸的放大晶体管,在维持高像素数的同时使饱和信号量提升至约 2倍,扩大动态范围并降低噪点,进一步提升图像在夜间或其他昏暗场景下的表现。图 7.传统像素结构和双层晶体管像素结构对比图58除结构上的不断优化外,随着堆叠工艺的演进,业界已经展开在堆栈式结构的基础上增加 AI 信号处理层的尝试。将图像处理器(ISP)、卷积神经网络(CNN)加速器、存储器和主处理器堆叠在图像传感器下方,像素阵列获取的信号可以直接在芯片内部进行处理,无需外置高性能处理器或存储器,从而大幅减少图像传18感器输出的数据量,提高处理速度。基于 AI 能力的加成,堆栈式图像传感未来将不再只能进行单纯的图像捕获,其处理电路将能够集成完整的智能图像处理算法和存储空间,带来诸如 3D 测距成像和增强现实等能力提升。图像传感器在包括智能手机、计算机、安防监控、汽车电子、消费、工业、国防与航空航天和医疗等下游领域均有广泛应用,其中智能手机行业占比最高。近年来智能手机主打的新技术如面部识别、心率检测和 HDR 拍摄等均依赖于图像传感器实现。然而,最新的堆栈式图像传感因其较高规格和成本,目前主要应用于高端手机和专业级相机中,仍未实现大范围普及。未来,随着技术和工艺的不断成熟,堆栈式图像传感将进一步得到广泛应用,替代传统图像传感在微纳加工等领域发挥其重要价值,推动图像传感器发展进入新纪元。2.5 新算法新算法随着物联网技术的不断发展,应用场景不断拓展,用户对于传感能力的要求越来越高,但传感器硬件的开发周期较长,难以快速满足市场需求。因此,各传感器厂商逐渐从单纯围绕硬件竞争,进入到围绕“算法 硬件”竞争的阶段。新算法可用于提高传感精度,或以原始数据为基础实现新的感知能力。以气味传感为例,基于深度学习算法,通过建立逐层抽象的网络,可实现复杂函数并形成数据的层次表达,能够在数据量较少的情况下学习代表信息特征的能力,获得更高的感知准确率。未来,新算法将在很大程度上弥补或提高传感器硬件的性能,使传感器向更精准的感知结果和更强大的感知能力演进。2.5.1 光纤传感光纤传感在大坝、铁路、电力电缆和石化管道等公里级连续监测场景中,针对温度和压力等参数的测量,传统点式布设传感器的方式存在部署难度大和监测数据不连续等问题。光纤既可作为传感介质又可作为被测信号的传输介质,现场无需额外缆线或供电,具备低成本、易部署和连续监测的特性,受到广泛关注。光纤传感光纤传感,又称为分布式光纤传感技术(又称为分布式光纤传感技术(DFOSDFOS),是由光纤通信演变而来,原用于检测光),是由光纤通信演变而来,原用于检测光纤的传输情况纤的传输情况,后逐渐成为一种对于光纤环境的感知技术后逐渐成为一种对于光纤环境的感知技术 5959(如图如图 8 8)。由于光由于光19在光纤中传播时在光纤中传播时,其振幅其振幅、相位相位、波长波长、偏振和传输时间等参数会受环境影响偏振和传输时间等参数会受环境影响,因此光纤可作为敏感元件来探测温度、振动、应力和声音等物理量因此光纤可作为敏感元件来探测温度、振动、应力和声音等物理量 6060。图 8.分布式光纤传感技术61光纤传感主要基于入射光波和光纤介质相互作用产生散射谱的原理进行环境分析。散射谱由瑞利散射、拉曼散射和布里渊散射组成,各种散射原理对不同物理量的敏感度不同62。瑞利散射是由入射光子和光纤中不均匀传输介子(如微小密度、折射率变化)发生弹性碰撞产生,其入射光和散射光的频率保持一致且光波能量更强,对振动和声音等能够对光纤产生微小形变的物理量有较好的响应。拉曼散射是由非弹性碰撞产生,在此过程中光子与传输介子交换能量,其散射光随光纤温度的变化而变化。布里渊散射是由于光纤中的声子与入射光光子间相互作用而产生的非弹性散射现象,其散射光与入射光之间产生频移的大小与温度和振动成正向线性关系,因此对温度和振动有较好的响应。但布里渊散射频移较小、带宽较窄,激光器具备平稳的频率和极窄脉冲宽度,导致系统成本增加。光纤传感器通常采用常见的单模或多模通信光纤实现感知功能,主要涉及如光时域反射(OTDR)、光频域反射(OFDR)、光时域分析(OTDA)和光频域分析(OFDA)等传统光纤通信技术中常用的分析测试方法对散射光的光强度、时间差、光程差和频率等参数进行检测分析。因此,与重视敏感单元的传统传感器不同,其研究方向主要是在上述测试方法的基础上通过光噪声抑制63、光脉冲编码64、时频域特征提取65、修正解调方程66或引入深度学习67等方式提高信号信噪比、优化空间分辨率、补偿光纤衰减、提高感知精度以及降低散射串扰等。光纤传感可利用已布设的光纤设备进行环境监测,在远距离连续感知方面形成了相应的解决方案并具备较强的技术优势,目前多用于长距离管网和线缆的盗挖、泄露、断点检测,以及大规模建筑的结构应力监测,在石化、冶金和燃气等20行业发挥了巨大的应用价值。同时,除了传统传感器企业外,多家通信企业也开始基于其通信光纤的布设基础开展光纤传感相关技术研发,进一步推动了光纤传感技术的发展。然而,目前光纤传感受算法精度和仪器设备成本等方面的限制,商用规模仍然较小,需待技术和产业的进一步发展和推动。未来,光纤传感技术将重点围绕两方面推进,一是将在单点位或分散式点位测量上进一步提高其传感精度,并针对短距离的部署场景进一步探索较高性价比的方案;二是现有光纤传感的探测能力依然受限于光纤轴向一维结构,未来将进一步实现扰动源的三维定位与信号的多分量探测,以支持光纤传感的进一步推广。2.5.2 超敏气味传感超敏气味传感气味传感器是一种能够检测和分析待测对象中气味和成分的传感器,可以感知和测量气体中的气味分子和挥发性有机化合物等。气味传感可以通过与气体发生化学反应或物理吸附来检测气味成分,还可以利用生物体(如细菌、酵母、酶等)的生物反应来检测气味成分,并将其转化为电信号或光信号输出。然而,单一的气味传感器只能识别特定气味,且识别灵敏度和准确度较低。为解决这些问题,一种由交叉敏感传感器阵列和模式识别算法组成的一种由交叉敏感传感器阵列和模式识别算法组成的超敏气味传感系统被提超敏气味传感系统被提出,该传感系统也称为出,该传感系统也称为电子鼻,电子鼻,实现了实现了对对多种气味的准确识别多种气味的准确识别。超敏气味传感系统主要由气体传感器阵列、信号采集与处理单元以及模式识别算法三部分组成68(如图 9)。气体传感阵列的敏感材料与目标气体发生化学反应,将化学信号转化为电信号。预处理单元对电信号进行噪声消除、信号放大、信号特征提取和数据归一化等处理。模式识别算法用于对处理后的数据进行分析。图 9.超敏气味传感系统示意图21近年来超敏气味传感的性能改进受到越来越多的关注,对于模式识别算法的创新是实现性能优化的重要方式。在识别相似度较低的混合气体或在短时间内需要快速识别(如爆炸物检测)时,使用 PCA、LDA、SVM 和 DT 等简单算法能在短时间内预测结果。但是对于环境温度、湿度干扰明显以及需要识别高度相似的混合气体的场景,上述方法难以实现复杂函数并产生对数据的层次化表达。基于神经网络的方法能够从复杂的噪声背景中提取待测气体的不变特性,学习代表信息的特征,提供可靠的识别精度。为实现高效的气味检测,一种基于图神经网络(GNN)的气味分析方法被提出69,通过建立分子结构与气味之间的映射关系,从而根据化学分子的结构描述气味。在该方法中,每种气味分子都被表示为一个图,其中每个原子由其价态、键数、氢的数量、杂化方式、电荷形式和原子序数等多个维度进行定义。与传统的指纹技术不同,GNN 可以优化不同化学结构的成分在特定气味中的权重,最后通过预测层对气味进行判断,输出对应的气味描述词。测试结果显示,该模型的气味感知水平与经过气味识别训练的人类相当。气味传感系统在各领域中均有广泛应用,包括环境监测、食品质量检测、工业安全、医疗诊断和机器人感知等,帮助监测和控制空气中的有害气体、检测食品中的异味或变质,以及辅助医学诊断等。围绕这些应用场景,国内外已有多家传感器公司开展气味传感技术研发,推出消费级数字嗅觉感知产品,但受限于感知精度和产品体积,商用规模仍然较小,还难以满足人们日益增长的气味感知服务需求。当前,超敏气味传感系统仍面临三方面挑战:一是缺乏数据采集和信号处理的标准化协议;二是不可避免的环境湿温度影响和未知气体的存在,容易造成传感响应信号的意外偏移;三是如何在资源有限的硬件上实现气体识别算法。未来,超敏气味传感系统将规范信号处理各步骤的输入和输出,探索可补偿环境变量的稳健算法,通过对识别算法的资源利用率优化或云端部署降低硬件需求,进而缩小系统的整体尺寸,为未来物联网应用中的可穿戴和紧凑型超敏气味传感系统带来机遇。22随着行业数字化进程的不断深化,各类应用对感知提出了更高的要求,除精度、灵敏度和稳定性等对于传感能力本身的要求外,还要求感知系统的通信方式通信方式无线化无线化、计算处理高效化计算处理高效化、智能服务泛在化和能量供给无源化智能服务泛在化和能量供给无源化。因此,传感将与通信、计算、智能和能量等深度融合,形成传感融合技术(如图 10),为生活、生产和社会领域的新场景和新业务持续赋能。图 10.传感融合技术示意图3.1 通信融合通信融合有线连接的传感器由于布设拉线成本高和施工难度高,其应用受到制约。无线通信技术可以满足“剪辫子”需求,便于传感器的灵活部署。此外,通过分析无线通信信号参数特征的变化可以推理感知目标的变化,实现通信感知一体化,达成通信与感知的能力互助和共慧双赢。通信融合技术重点涉及面向广域和局域,通信融合技术重点涉及面向广域和局域,以及微域和短距的无线通信技术。以及微域和短距的无线通信技术。在广域和局域方面在广域和局域方面,蜂窝网络具有广域连续覆盖的特征,能够为传感器提供远距离数据传输。同时,通过部署通信感知一体化基站,分析蜂窝信号在基站之间或基站与终端节点之间的变化,也可以实现在降水监测、智慧交通、无人机监测等场景中的感知功能(如图 11)。在局域方面,以 RFID 为代表的无源物联网基于反向散射原理,一方面能够实现局域范围内的数据传输,并通过环境能量采集,实现传感节点的免维护、易部署和无源化。另一方面,基于 RFID 也能实现对海量目标的感知。通过分析接收到的无源标签反向散射通信信号的强度和相位23等参数,可以在盘存的同时实现对目标位置的感知70,进而实现货物查找、出入检测和客流分析等功能。随着 RFID 技术的演进和蜂窝技术的引入71(如图 12),未来无源物联网将与蜂窝网络深度融合,进一步提升通信距离,基于新架构和新协议支持标识对象的全生命周期管理,真正实现“一码到底”。图 11.基于通感一体的气候环境监测应用72图 12.无源物联网技术演进路径微域和短距网络微域和短距网络是指通信距离仅有数厘米到数米范围内的网络,太赫兹频段具有大带宽和短波长的优点,可实现微域范围的超高速率数据传输。并实现高精度感知,提供新的通感一体网络。太赫兹辐射波长介于毫米波与红外线之间,具有穿透性强和定向性好等技术特性,不仅能探测到金属,还能识别非金属、胶体、粉末、陶瓷和液体等,可应用于国防、安全、天文和医疗等诸多领域。相比 X射线,太赫兹不会在人体产生有害的光致电离,因而能实现更安全的人体检测,可为重大疾病诊断和生物干预提供先进的感知手段。无线通信与感知能力的深度融合一方面能够解决传统传感器部署难、成本高等问题,实现的感知能力“即放即用”,另一方面基于通感一体化,使无线网络在进行高质量通信交互的同时,实现高精度和精细化的感知功能。未来,随着通24信协议和数据传输模式的进一步优化,在受限的能耗范围内延长传输距离、增加数据吞吐量并保障数据安全,以及协同多节点、多频段和多制式进行感知是通信融合的重要趋势。3.2 计算融合计算融合传感器通常会产生庞大的数据量,尤其是在实时监测和大规模部署的情况下,这将对网络传输效率和设备可靠性产生极大影响,同时对传感数据的计算提出了高算力、低时延和低功耗的要求。计算融合技术主要包括数据压缩计算融合技术主要包括数据压缩、感内计算和感内计算和异构计算等。异构计算等。数据压缩技术数据压缩技术可用于对部署密度大和覆盖区域重叠的海量传感器产生的冗余数据进行压缩处理73。压缩算法的难点在于压缩率和保真度的平衡,基于深度学习的数据压缩算法可以从海量数据中自动学习数据的特征表示,避免人为限制导致的信息损失,建模复杂的非线性关系,更好地适应数据的复杂结构和变化,有助于提高数据压缩的准确性和保真度74。感内计算(感内计算(in-sensorin-sensor computingcomputing)是一种新型的传感器计算范式,通过在传感器内部构建新型感知运算模块,使传感器成为相对独立的感知、存储和计算单元,从信息采集的源头实现智能化信息预处理,以减少数据传输规模,简化后处理流程,从而提高系统的综合性能指标75(如图 13)。目前感内计算多用于图像传感器,通过引入新型传感器件和像素电路等方式,在二维空间上进行像素级信息处理,能够利用器件和电路的物理效应,在模拟域内完成时空信息的处理,在像素层面实现冗余信息的过滤。由于当前在像素结构、功能定义和系统架构设计等方面的挑战,亟需新材料、新机制和新结构的尝试与探索,未来可以结合感内计算结构,引入高效的人工智能算法以适应新型器件,实现智能感内计算。图 13.感内计算结构7625异构计算异构计算在端侧处理传感数据时,利用 CPU、GPU、FPGA 和 ASIC 等不同的异构计算单元协同工作,进行联合计算组合。由于不同的计算单元适合处理不同的计算问题,例如 GPU 可用于高速并行计算,FPGA 可用于快速和定制化的数据处理,根据传感数据的特点和处理需求灵活地配置不同类型的处理单元,可将计算负载进行合理分配和协同处理,优化计算过程77。对于异构计算,软件和硬件之间的协同设计至关重要,需在硬件设计中考虑特定的软件需求,提供硬件加速功能,同时针对特定的硬件架构进行软件的优化设计,以达到更高水平的计算能力和效率。传感数据产生速度快、数据规模大且数据类型多样,需要高效的计算方法支撑数据的高速采集、存储、处理和分析,新型计算技术的研究和应用,将为传感网络的实时监测和大规模部署提供高效可靠的解决方案,真正实现泛在感知。3.3 智能融合智能融合智能化是传感器未来的重要发展方向,传感技术与智能技术的深度融合,将赋予传感器电子校准、数据过滤、自唤醒、自诊断和自修复等智慧能力,并基于端边云协同的方式,结合人工智能算法,进一步提升感知系统的稳定性、精度和工作效率。智能融合技术重点涉及智能微系统、分布式计算和群智感知。智能融合技术重点涉及智能微系统、分布式计算和群智感知。智能微系统智能微系统是微系统与智能科技深度交叉融合,形成的涵盖架构、微电子、MEMS、光电子、算法与软件等要素的技术78(如图 14)。智能微系统具备微型化、无线化和自供能等能力,能够满足海量设备快速部署需求。硬件层面能够实现不同功能模块进行超高密度的芯片级集成,实现超高灵敏度传感与探测,超高性能处理与计算,超高密度存储与传输,超高精度操作与执行,以及超高效率的能量管理与供给。软件层面采用神经网络和深度学习等 AI 算法把多种传感数据进行融合分析,从而提高感知能力和感知质量。硬软件协同层面通过闭环反馈和多传感信息融合等技术,实现了传感器自校准、自组织和自适应等智能化能力,促进了传感器向自主化和无人化发展。26图 14.一种典型智能微系统的架构示意图分布式计算分布式计算可用于传感器网络节点之间的数据处理和决策任务79,通过将计算任务分散到多个节点上进行并行处理,可减轻单点计算压力、实现资源共享、降低能耗并提高系统性能。分布式计算还具备较好的扩展性和容错性,可按需调整节点数量,消除由单点故障导致的系统可靠性降低等问题。在分布式计算中,有效地管理节点资源并实现负载均衡至关重要80。通过任务分配和调度算法,可在节点之间动态地协商和调整任务分布,并基于历史数据和趋势预测节点的负载情况,提前做好任务迁移和卸载,优化资源分配。群智感知(群智感知(CrowdCrowd SensingSensing)利用众包的方式采集感知数据,可利用人群通用移动设备作为传感节点,具有节点开放化、可按需部署和按需调度等优势,节点之间通过互联互通和协同作业可满足城市级大范围细粒度的传感任务要求。在群智感知相关技术中,复杂任务的分解与动态分配、感知节点的部署和选择、高质量感知数据的采集和冗余数据的优选等是技术研究的重点和难点,结合深度学习实现群智感知的知识获取和开放动态环境下的群智融合与增强,可提升大规模感知节点构建的效率,提升感知的韧性和执行效果。传感技术与智能的融合是感知技术的重要发展目标和发展趋势,未来,基于群智感知等新型感知范式的广泛应用,基于深度学习等 AI 算法的深度加持,感知系统能够更有效地捕捉和解释现实世界的各种信息,实现更准确的数据解析、更高效的数据处理、更强大的系统可靠性和更低的功耗,并进一步拓展“感知 思考 执行”的新应用模式,为业务布局带来新机遇。273.4 能量融合能量融合随着传感器在工业、能源和城市等领域的大规模应用,能量获取和管理成为了其面临的重要挑战之一。有限的电池寿命不仅限制了传感器在远距离无线传输场景的广泛应用,而且带来了高昂的维护成本,废弃后的电池还会给环境造成较大负担。供能的挑战驱动了无源自供能等新能源技术的研发,使传感器能够从自然环境中获取能量,而非依赖电池或其他电源。能量融合技术涉及能量采集与感能量融合技术涉及能量采集与感知和能量管理。知和能量管理。能量采集与感知方面能量采集与感知方面,自供能能够利用可再生能源通过某种能量的范式转变,实现设备自动从环境中取电,目标是延长设备的使用寿命81和替代电池或其他电源。可收集的环境能量包括光能、风能、温差能、振动能和射频能等等,环境能不但可为传感器提供电源,还能支持传感器实现对能量信息的获取。如振动既可为传感器供能,又可作为传感器的感知对象,实现对设备振动幅度的信息采集,用于设备状态监测。在环境能量中,光能是最常见且应用最广泛的能量之一,其原理主要是利用半导体材料(硅基光伏板和二硫化钼)的光电效应将光能直接转变为电能。射频能利用射频信号将能量从源节点分配到耗能节点,适用于超低功耗场景,其典型代表是 RFID。随着无线发射器数量的与日倍增,利用射频信号为传感器供能正成为趋势。能量管理方面能量管理方面,主要包括能量的采集管理、存储管理、分配管理和使用管理等。能量采集管理需要监测能量采集的情况,控制能量采集的时间和采集量,以避免能量的过度采集和浪费。能量存储管理需要监测超级电容、电池和机械储能器等能量存储器件的容量和使用情况,控制存储时间和存储量,避免能量的过度存储和浪费。能量分配管理需要监测传感器的能源需求和运行状态,根据业务的优先级和能源需求进行能量分配和控制,以减少能量浪费,为系统电路提供稳定的能源供给。能量优化管理需要监测能量的使用情况,分析能量的使用效率和优化潜力,采取相应的优化措施,以提高能量的利用效率。能量融合技术具有极大的应用价值,能够消除传统有源供电(电池/布线)所带来的电池寿命受限、部署成本高昂及后期维护困难等痛点。未来,能量融合技术将在多传感器集成和复合微能源采集方面持续优化,支持物联网传感器在仓28储管理、环境感知、电力线监测等场景的规模化应用,实现传感器全生命周期的长久续航。近年来,传感前沿技术围绕新机理新机理、新材料新材料、新工艺新工艺、新结构和新算法新结构和新算法五个方面不断创新和发展,传感融合技术围绕通信融合通信融合、计算融合计算融合、智能融合和能量智能融合和能量融合融合等方面加速演进和变革,形成形成“五新四融合五新四融合”的先进感知技术趋势的先进感知技术趋势,支持感知技术向着“感-通-算-智-能”一体融合的方向持续发展,进一步实现资源复用和数据融通。未来,感知技术将支撑传感器向着微型化微型化、集成化集成化、无线化无线化、柔性柔性化、智能化和无源化化、智能化和无源化演进,满足生活、生产和社会领域对感知能力的深度需求。微型化使得传感器可以部署在更复杂和微小的环境中,如生物体内等。集成化支持传感器从单一功能形态向具备传感、通信、计算、存储、执行和供能等多元化功能的智能终端发展,进一步提高功能密度。无线化有利于增强传感器的移动性,优化空间利用率,实现快速部署。柔性化支持传感器具有良好的柔韧性、延展性和弯折性等,使其能够根据应用场景的需求灵活使用。智能化将赋予传感器电子校准、数据过滤、自唤醒、自诊断和自修复等智慧能力,增强端侧智能,提升稳定性、精度和工作效率。无源化通过多源能量收集使得传感器摆脱电池供电的束缚,实现长寿命工作。本白皮书梳理并提出了“五新四融合五新四融合”的先进感知技术趋势,围绕传感前沿技术的新机理、新材料、新工艺、新结构和新算法等技术方向,以及传感融合技术的通信融合、计算融合、智能融合和能量融合等技术领域,选取代表性技术,解读技术原理,梳理技术现状,分析技术挑战,探索技术趋势,希望为加快先进感知技术的研究突破和产品落地提供参考。29缩略语英文全名中文解释3D3-Dimensional三维6GThe sixth generation mobile communication systems第六代移动通信系统AIArtificial Intelligence人工智能AMPAmplifier Transistor放大晶体管ASICApplication Specific Integrated Circuit专用集成电路CMOSComplementary Metal Oxide Semiconductor互补金属氧化物半导体CNNConvolutional Neural Network卷积神经网络CPUCentral Processing Unit中央处理器DFOSDistributed Fiber Optic Sensing分布式光纤传感DRAMDynamic Random Access Memory动态随机访问内存DTDecision Tree决策树FPGAField Programmable Gate Array现场可编程门阵列GNNGraph Neural Network图神经网络GPUGraphics Processing Unit图形处理器HDRHigh-Dynamic Range高动态范围ISPImage Signal Processor图像处理器LDALinear Discriminant Analysis线性判别分析MEMSMicro-Electro Mechanical System微型电子机械系统OFDAOptical Frequency Domain analysis光频域分析OFDROptical Frequency Domain Reflectometry光频域反射OPTsOrganic Phototransistors有机光电晶体管OTDAOptical Time Domain Analysis光时域分析OTDROptical Time Domain Reflectometry光时域反射PCAPrincipal Component Analysis主成分分析QKDQuantum Key Distribution量子密钥分发RFIDRadio Frequency Identification射频识别SVMSupport Vector Machine支持向量机TSVThrough Silicon Via硅通孔技术301 GB/T 33745-2017 物联网 术语2 中国移动通信研究院,6G 物联网未来应用场景及能力白皮书(2023)3 Ramsey,N.F.(1950).A molecular beam resonance method withseparated oscillating fields.Physical Review,78(6),695.4 Wang,H.,Xue,X.,Dong,D.,&Xiao,M.(2018).Optical Rabioscillations in a single molecule.Physical Review Letters,121(5),053001.5 Greiner,M.,et al.(2002).Quantum phase transition from a superfluidto a Mott insulator in a gas of ultracold atoms.Nature,415(6867),39-44.6 Giovannetti,V.,Lloyd,S.,&Maccone,L.(2004).Quantum-enhancedmeasurements:beating the standard quantum limit.7 Fang,J.,and J.Qin,Advances in Atomic Gyroscopes:A View fromInertial Navigation Applications,Sensors 2012,12(5),6331-6346.8 M.Renger,S.Pogorzalek,el.,Flow of quantum correlations in noisytwo-mode squeezed microwave states,Physical Review A,20229 Yang,Kuangjunyu;Xu,Jing;el.,“Trend Observation:StrategicDeployment and Research Hotspot in Field of International Quantum Sensingand Measurement”Bulletin of Chinese Academy of Sciences,2022,37(2):259-263.10 Denners view Quantum technology|Bosch Global(2023.9.5)11 J.T.Robinson et al.,Developing Next-Generation Brain SensingTechnologiesA Review,in IEEE Sensors Journal,vol.19,no.22,pp.10163-10175,15 Nov.15,201912 G.Shen,K.Gao,N.Zhao,Z.Wang,C.Jiang and J.Liu,A FullyFlexible Hydrogel Electrode for Daily EEG Monitoring,in IEEE SensorsJournal,vol.22,no.13,pp.12522-12529,1 July1,2022.3113 X.Gu et al.,EEG-Based Brain-Computer Interfaces(BCIs):A Surveyof Recent Studies on Signal Sensing Technologies and ComputationalIntelligenceApproachesandTheirApplications,inIEEE/ACMTransactions on Computational Biology and Bioinformatics,vol.18,no.5,pp.1645-1666,1 Sept.-Oct.2021.14 Vicente Q,Laura F,Eduardo I,et al.Brain-machine interface basedon transfer-learning for detecting the appearance of obstacles duringexoskeleton-assisted walking J.Frontiers in Neuroscience,2023,17.15 https:/ http:/ https:/ 让 猴 子“意 念 打 字”:脑 机 接 口 研 究 新 成 果 J.中 国 总 会 计师,2022,(12):188-189.19 曲忠芳,李正豪.马斯克公司首启人体试验脑机接口步入深水区N.中国经营报,2023-06-05.20 章浩伟,孙丽丽,刘颖.柔性传感技术在可穿戴医疗设备中的发展J.生物医学工程学进展,2020,(04):201-205.21 侯 星 宇,郭 传 飞.柔 性 压 力 传 感 器 的 原 理 及 应 用 J.物 理 学报,2020,(17):70-8522 吴靖,李晟,张景等.面向物联网的新型柔性传感器J.物联网学报,2023,(7):1-1423 李道亮,王帅星,王聪,柔性可穿戴传感技术在智慧渔业中的应用进展J.农业工程学报 2023,(13):1-13.24 于翠屏,刘元安,李杨柳,郭霞.柔性电子材料与器件的应用J.物联网学报,2019,(03):102-110.25 王宙恒,陈颖,郑坤炜,李海成,马寅佶,冯雪.柔性电子技术中的半导体材料性能调控概述J.物理学报,2021,(16):173-187.26 罗鸿羽,令狐昌鸿,宋吉舟.可延展柔性无机电子器件的转印力学研究综述J.中国科学:物理学 力学 天文学,2018,(09): LUO Y,LI Y,SHARMAP,et al.Learninghuman environmentinteractions using conformal tactile textilesJ.Nature Electronics,2021,4(3):193-20128 Yao,K.,Zhou,J.,Huang,Q.et al.Encoding of tactile informationin hand via skin-integrated wireless haptic interface.Nat Mach Intell4,893903(2022).29 Zhang,C.,Wu,M.,Li,M.et al.A nanonewton-scale biomimeticmechanosensor.Microsyst Nanoeng 9,87(2023).30 Man,J.,Zhang,J.,Chen,G.et al.A tactile and airflow motion sensorbased on flexible double-layer magnetic cilia.Microsyst Nanoeng 9,12(2023).31 CAO Y,TAN Y J,LI S,et al.Self-healing electronic skins for aquaticenvironmentsJ.Nature Electronics,2019,2:75-8232 ZHANG Z,Y ZHANG,X JIANG,et al.Simple and efficient pressure sensorbased on PDMS wrapped CNT arraysJ.Carbon,2019,15533 GU H,XU X,DONG M,et al.Carbon nanospheres induced high negativepermittivity in nanosilver-polydopamine metacompositesJ.Carbon,2019,147:550-558.34Liu,M.,Zhang,Y.,Wang,J.etal.Astar-nose-liketactile-olfactory bionic sensing array for robust object recognition innon-visual environments.Nat Commun 13,79(2022).35 Zhang,J.,Yao,H.,Mo,J.et al.Finger-inspired rigid-soft hybridtactile sensor with superior sensitivity at high frequency.Nat Commun 13,5076(2022).36 陈沁;南向红;梁文跃;郑麒麟;孙志伟;文龙.片上集成光学传感检测技术的研究进展(特邀)J.红外与激光工程,2022,(01):360-377.37 H.Yang,Z.-G.Hu,Y.Lei,X.Cao,M.Wang,J.Sun,Z.Zuo,C.Li,X.Xu,and B.-B.Li,“High-sensitivity air-coupled megahertz-frequencyultrasound detection using on-chip microcavities,”Phys.Rev.Appl.18,33034305(2022)38 Ma,Xiaoxia&Wu,Jieyun&Lianzhong,Jiang&Wang,Mengke&Deng,Guowei&Qu,Shiwei&Chen,Kai.(2021).On-chipintegrationofmetal-organic framework nanomaterial on SiO2waveguide for sensitive VOCsensing.Lab on a Chip.21.10.1039/D1LC00503K.39 Janasek,D.,Franzke,J.&Manz,A.Scaling and the design ofminiaturized chemical-analysis systems.Nature 442,374380(2006).40 Primiceri E,Chiriaco M S,Rinaldi R,et al.Cell chips as new toolsfor cell biologyresults,perspectives and opportunitiesJ.Lab on aChip,2013,13(19):3789-3802.41Whitesides,G.Theoriginsandthefutureofmicrofluidics.Nature 442,368373(2006).42 TACHIBANA H,SAITO M,TSUJI K,et al.Self-propelled continuous-flowPCR in capillary-driven microfluidic device:Microfluidic behavior andDNA amplification J.Sensor Actuat B-Chem,2015,206:303-310.43Abdelhamied,N.,Abdelrahman,F.,El-Shibiny,A.etal.Bacteriophage-basednano-biosensorsforthefastimpedimetricdetermination of pathogens in food samples.Sci Rep 13,3498(2023).44 Simon F.Berlanda,Maximilian Breitfeld,Claudius L.Dietsche,andPetra S.Dittrich Analytical Chemistry 2021 93(1),311-33145 Kazoe,Yutaka;Pihosh,Yuriy;Takahashi,Hitomi;Ohyama,Takeshi;Sano,Hiroki;Morikawa,Kyojiro;Mawatari,Kazuma;Kitamori,TakehikoLab on a Chip(2019),19(9), Luan Q,Becker JH,Macaraniag C,Massad MG,Zhou J,Shimamura T,Papautsky I.Non-small cell lung carcinoma spheroid models in agarosemicrowellsfordrugresponsestudies.LabChip.2022Jun14;22(12):2364-2375.47 Yu,Yue.(2016).Simple Spinning of Heterogeneous Hollow Microfiberson Chip.Advanced Materials.28.3448 LIN Y,GRITSENKO D,FENG S L,et al.Detection of heavy metal bypaper-based microfluidics J.Biosens Bioelectron,2016,83:256-266.49 Arshavsky-Graham,S.,Segal,E.(2020).Lab-on-a-Chip Devices forPoint-of-Care Medical Diagnostics.In:Bahnemann,J.,Grnberger,A.(eds)MicrofluidicsinBiotechnology.AdvancesinBiochemicalEngineering/Biotechnology,vol 179.Springer,Cham.50 Gong J,Gong Y,Zou T,Zeng Y,Yang C,Mo L,Kang J,Fan X,Xu H,Yang J.A controllable perfusion microfluidic chip for facilitating thedevelopment of retinal ganglion cells in human retinal organoids.Lab Chip.2023 Jul 27.51 Luo X,Yue W,Zhang S,et al.SARS-CoV-2 proteins monitored bylong-range surface plasmon field-enhanced Raman scattering with hybridbowtie nanoaperture arrays and nanocavities.Lab on aChip.2023Jan;23(2):388-399.52 Liao,F.,Zhou,Z.,Kim,B.J.et al.Bioinspired in-sensor visualadaptation for accurate perception.Nat Electron 5,8491(2022).53 Jiang,T.,Wang,Y.,Zheng,Y.et al.Tetrachromatic vision-inspiredneuromorphic sensors with ultraweak ultraviolet detection.Nat Commun 14,2281(2023).54 Liu,W.,Yang,X.,Wang,Z.et al.Self-powered and broadbandopto-sensor with bionic visual adaptation function based on multilayer-InSe flakes.Light Sci Appl 12,180(2023).55https:/ S.Sukegawa et al.,A 1/4-inch 8Mpixel back-illuminated stacked CMOSimage sensor,2013 IEEE International Solid-State Circuits ConferenceDigest of Technical Papers,San Francisco,CA,USA,2013,pp.484-485.57 K.Nakazawa et al.,3D Sequential Process Integration for CMOS ImageSensor,2021 IEEE International Electron Devices Meeting(IEDM),San35Francisco,CA,USA,2021,pp.30.4.1-30.4.458https:/ Barnoski M K,Jensen S M.Fiber waveguides:a novel technique forinvestigating attenuation characteristicsJ.Applied optics,1976,15(9):2112-2115.60 Lin,Y.,Wang,Y.,Qu,H.et al.Research on stress curve clusteringalgorithm of Fiber Bragg grating sensor.Sci Rep 13,11815(2023).61 魏涛涛.浅谈公路桥梁施工监控技术J.市场周刊理论版,2019.62 Kim,G.H.,Park,S.M.,Park,C.H.et al.Real-time quasi-distributedfiber optic sensor based on resonance frequency mapping.Sci Rep 9,3921(2019).63 Sun,X.,Yang,Z.,Hong,X.et al.Genetic-optimised aperiodic codefor distributed optical fibre sensors.Nat Commun 11,5774(2020).64 Zhou Y,Yan L,Liu C,et al.Hybrid aperiodic coding for SNRimprovementinaBOTDAfibersensorJ.OpticsExpress,2021,29(21):33926-33936.65 Wu H,Chen J,Liu X,et al.1-D CNN based intelligent recognitionof vibrations in pipeline monitoring with DASJ.Journal of LightwaveTechnology,2019,37(17): Li Jian;Zhang Qian;Xu Yang;Zhang Mingjiang;Zhang Jianzhong;QiaoLijun;Mehjabin Mohiuddin Promi;Wang Tao,High-accuracy distributedtemperaturemeasurementusingdifferencesensitive-temperaturecompensation for Raman-based optical fiber sensing,Optics Express,2019,27(25): Zhu K,Huan W U,Chao S,et al.Pattern recognition in distributedfiber-opticacousticsensorusingintensityandphasestackedconvolutional neural network with data augmentationJ.Optics Express,2021,29(3): X.Yang,M.Li,X.Ji,J.Chang,Z.Deng and G.Meng,RecognitionAlgorithms in E-Nose:A Review,in IEEE Sensors Journal,vol.23,no.18,pp.20460-20472,15 Sept.15,2023.69 Brian K.Lee et al.,A principal odor map unifies diverse tasks inolfactory perception.Science381,999-1006(2023).70 王楚豫,谢磊,赵彦超,张大庆,叶保留,陆桑璐.基于 RFID 的无源感知机制研究综述J.软件学报,2022,(01):297-323.71 中国移动无源物联网技术创新中心,面向万物互联网的无源物联网技术(2022)72 IMT-2030(6G)推进组,通信感知一体化技术研究报告(2022)73 J.Chen,F.Zhou,Z.Guo and J.Wan,Compressed Data CollectionMethod for Wireless Sensor Networks Based on Optimized DictionaryUpdating Learning,in IEEE Access,vol.8,pp.,2020.74 M.Sekine and S.Ikada,Adaptive Cooperative Distributed CompressedSensing for Edge Devices:A Multiagent Deep Reinforcement LearningApproach,2021 IEEE International Conference on Pervasive Computing andCommunications Workshops and other Affiliated Events(PerCom Workshops),Kassel,Germany,2021,pp.585-59175 周正,丛瑛瑛,冯玉林.面向智能图像传感系统的感内计算技术发展趋势分析J.信息通信技术与政策,2023,49(6):24-29.76 Cui,B.,Fan,Z.,Li,W.et al.Ferroelectric photosensor network:an advanced hardware solution to real-time machine vision.Nat Commun 13,1707(2022).77 I.AlQerm,J.Wang,J.Pan and Y.Liu,BEHAVE:Behavior-Aware,Intelligent and Fair Resource Management for Heterogeneous Edge-IoTSystems,in IEEE Transactions on Mobile Computing,vol.21,no.11,pp.3852-3865,1 Nov.2022.78 北京未来芯片技术高精尖创新中心,智能微系统技术白皮书(2020)79 D.Li,R.Yu,C.Song,S.Li,G.Jia and X.Zhou,Distributed37computing framework of intelligent sensor network for electric powerinternet of things,2020 IEEE 9th Joint International InformationTechnology and Artificial Intelligence Conference(ITAIC),Chongqing,China,2020,pp.68-71.80 H.S.V and A.NV,Efficient Load Balancing and Extended NetworkLifetime for Cluster Based Routing Wireless Sensor Networks Using FitnessFunctionAlgorithm,2021IEEEMysoreSubSectionInternationalConference(MysuruCon),Hassan,India,2021,pp.653-659.81 A.Kansal and M.B.Srivastava,An Environmental Energy HarvestingFramework for Sensor Networks,Proc.ACM Int.Symp.Low Power Electronicsand Design,pp.481-86,Aug.2003.38参编单位及人员参编单位及人员(排名不分先后)中国移动通信研究院:肖善鹏、牛亚文、马帅、李源、王曦泽、孙琳、李宜铮、钱泓宇、敬义天、贾千帆、范艺晶、石祚夫、孟一璐、王小莹、罗达、金奕丹中国仪器仪表学会:单惠敏、张梦雨、韩子昕电子科技大学:李建、文光俊、李钢重庆大学:李剑、曹铁军、曾礼强北京理工大学:张楠、王涛、赵云霞北京京仪北方仪器仪表有限公司:李屹、林新志、曲淮涛汉威科技集团研究院:武传伟、高胜国、刘建刚广东天物新材料科技有限公司:黄伟聪、冯嘉俊金卡智能集团(杭州)有限公司:肖静、马立波、郑水云

    浏览量0人已浏览 发布时间2023-11-09 41页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • ODCC:国产服务器操作系统发展报告(2023年)(58页).pdf

    1国产服务器操作系统发展报告(2023 年)ODCC-2023-01009编号 ODCC-2023-01009国产服务器操作系统发展报告(2023 年)开放数据中心委员会2023-11 发布I国产服务器操作系统发展报告(2023 年)ODCC-2023-01009版权声明版权声明ODCC(开放数据中心委员会)发布的各项成果,受著作权法保护,编制单位共同享有著作权。转载、摘编或利用其它方式使用 ODCC 成果中的文字或者观点的,应注明来源:“开放数据中心委员会 ODCC”。对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC 及有关单位将追究其法律责任,感谢各单位的配合与支持。II国产服务器操作系统发展报告(2023 年)ODCC-2023-01009编写组编写组项目经理:项目经理:吴美希中国信息通信研究院工作组长:工作组长:王峰中国电信股份有限公司研究院贡献专家:贡献专家:郭亮中国信息通信研究院贾明艳中国信息通信研究院邢碧枞中国信息通信研究院常金凤中国信息通信研究院阮迪中国信息通信研究院温小振中国信息通信研究院III国产服务器操作系统发展报告(2023 年)ODCC-2023-01009前前 言言全球产业数字化转型加速以及不同应用场景所需的不同算力类型带来对于算力和服务器操作系统的差异化需求逐渐强烈,全球服务器操作系统行业发展正在进入多样性时代。服务器操作系统是一种设计用于数据中心内服务器计算机上安装和使用的操作系统。它是针对企业级 IT 关键业务,适应虚拟化、云计算、大数据、人工智能、工业互联网时代对主机系统可靠性、安全性、高性能、扩展性和实时性的需求,可支撑构建大型数据中心服务器高可用集群、负载均衡集群、分布式集群文件系统、虚拟化应用和容器云平台等场景,可部署在物理服务器和虚拟化环境、公共云、专有云和混合云环境,承担管理、配置、稳定、安全等功能的操作系统。操作系统是信息技术产业之“魂”,在整体技术架构中处于“定海神针”的重要位置,属于最为核心的基础软件之一,在科技自立自强和推动信息产业发展中具有关键作用,是亟需提升突破的关键技术之一。在计算产业向云计算快速发展的时代背景下,服务器操作系统需要与云计算进行深度融合,促进以云计算为中心的产业竞争力。随着云的不断普及以及云原生的不断演化,云逐渐成为企业 IT 形态的主流,企业数字基础设施将基于云来重建,服务器操作系统的发展也将迈入新纪元。服务器操作系统作为上承应用软件,下接硬件基础设施的关键组件,对于信息产业发展的重要性不言而喻。随着智能终端不断涌现、服务器应用多样化、并发请求和负载量增加、云原生的微服务IV国产服务器操作系统发展报告(2023 年)ODCC-2023-01009架构、容器化部署等的发展,传统服务器操作系统面临新的挑战。在此背景下,开放数据中心委员会(ODCC)编制了国产服务器操作系统发展报告(2023 年),详细梳理了国产服务器操作系统产业现状、发展趋势及技术难点,并进一步提出发展建议和展望,从而促进国产服务器操作系统的创新发展和应用。由于时间仓促,水平所限,错误和不足之处在所难免,欢迎各位读者批评指正。如有意见或建议请联系编写组。V国产服务器操作系统发展报告(2023 年)ODCC-2023-01009目目 录录版权声明.I编写组.II前 言.III一、服务器操作系统发展概况.1(一)全球服务器操作系统行业洞察与发展分析.11 多样化算力需求推动服务器操作系统行业进入 2.0时代.12 全球服务器操作系统主流玩家及市场分析.23 服务器操作系统行业技术难点.34 云与 AI助力服务器操作系统迈向新纪元.5(二)国产服务器操作系统行业发展现状与分析.71 政策引领,推动国产服务器操作系统自主演进.72 市场边界扩张,服务器操作系统面向云时代进化.93 海外厂商优势明显,国产操作系统的选择比例逐年提升.114 头部效应显著,生态良性循环的打造成为关键.13二、国产服务器操作系统产业分析.14(一)国产服务器操作系统现状.141 CentOS 停服为本土服务器操作系统厂商带来的挑战与机遇.142 国产服务器操作系统产业现状.153 国产化替代迁移进行时.164 行业客户需求分析与适配.19(二)国产服务器操作系统发展待完善方向.21VI国产服务器操作系统发展报告(2023 年)ODCC- 服务器操作系统生态碎片化.212 核心技术存在依赖国外的问题.223 人才培养与底层生态建设不适配.234 服务器操作系统与新兴技术融合欠缺.23(三)国产服务器操作系统发展趋势.241 IT 企业积极拥抱开源软件.242 中国开源操作系统根社区诞生.243 主动拥抱云计算与人工智能.264 商业化合作优势互补.265 国产化替代逐步实现.27三、国产服务器操作系统开源社区运作与商业模式分析.29(一)开源生态对服务器操作系统发展至关重要.291 开源社区助益国产替代的技术突破和生态完善.292 开源社区助力产学研一体化进程加速.303 国内开源社区典型案例分析.31(二)助力关键行业商业化案例加速落地.361 国产典型开源社区与厂商协作模式探究.362 开源策略与商业化适配分析.383 龙蜥商业化适配典型案例分析.41四、国产服务器操作系统发展建议和展望.44(一)发展建议.441 开源生态需要政策支持和多路线发展.442 技术适配需要以用户需求为基础创新研发.443 国产化全栈路线需要在实践中不断革新.45VII国产服务器操作系统发展报告(2023 年)ODCC- 人才培养需要产学研多路线进行.455 国内市场拓宽、技术突破、行业落地需要联合创新.46(二)未来展望.461 开源服务器操作系统与产业数字化.462 开源服务器操作系统与云计算.473 开源服务器操作系统与人工智能.48致 谢.501国产服务器操作系统发展报告(2023 年)ODCC-2023-01009国产服务器操作系统发展报告(国产服务器操作系统发展报告(2023 年年)一、一、服务器操作系统发展概况服务器操作系统发展概况(一)(一)全球服务器操作系统行业洞察与发展分析全球服务器操作系统行业洞察与发展分析1多样化算力需求推动服务器操作系统行业进入多样化算力需求推动服务器操作系统行业进入 2.0 时代时代算力需求呈现爆发式增长且更加多样化趋势,多样性算力给基算力需求呈现爆发式增长且更加多样化趋势,多样性算力给基础软件产业带来变化与挑战。础软件产业带来变化与挑战。截至到 2022 年底,全球算力总规模达到 650EFLOPS,其中,通用算力规模为 498EFLOPS,智能算力规模为 142EFLOPS,超算算力规模为 10EFLOPS。通用算力具有在广泛范围内进行各种计算任务的能力,智能算力保障和助推人工智能发展,超算算力支撑科学计算研究。随着越来越多的新技术兴起,多样性算力逐渐成为行业新需求。服务器操作系统作为上承应用软件,下接硬件基础设施的关键组件,对于算力的重要性如同网络协议之于互联网时代。全球产业数字化转型加速以及不同应用场景所需的不同算力类型带来对于算力和服务器操作系统的差异化需求逐渐强烈,全球化服务器操作系统行业发展正在进入 2.0时代。2国产服务器操作系统发展报告(2023 年)ODCC-2023-01009(数据来源:中国信通院)图 1 2022全球算力规模情况(单位:EFLOPS)12全球服务器操作系统主流玩家及市场分析全球服务器操作系统主流玩家及市场分析目前全球服务器操作系统主流玩家的代表有 Windows、Unix、Linux,主要特点及主流 OS 如表 1。Linux 服务器操作系统天然支持云计算、虚拟化和容器化等技术,又因为其源代码开放,用户可免费得到多种应用程序,因此,在服务器领域得到了广泛应用,在安全性和稳定性方面得到了用户充分的肯定。Linux 服务器操作系统在全球市场上极具竞争优势,2022 年全球服务器操作系统市场份额占比中,Linux 占据全球 80.8%的市场份额,Windows 占据 19.1%,剩余以 Unix 为代表的操作系统仅占 0.1%的份额。1部分数据来源:中国算力白皮书(2022 年)3国产服务器操作系统发展报告(2023 年)ODCC-2023-01009表 1 主流操作系统特点对比操作系统操作系统类型类型主要特点主要特点主流的主流的 OSWindows界面图形化、硬性支持良好、众多的应用支持WINNT4.0 Server、Win2000/AdvancedServer,WindowsSERVER 2022Unix大型数据、网络的应用,安全、稳定、可管理HP-UX、Oracle Solaris、IBM AIXLinux开源的代码,免费;支持多用户、多进程,多线程多平合;良好界面、丰富网络功能Red Hat、Ubuntu、Debian(资料来源:公开信息整理)(数据来源:IDC,2023)图 2 2022 年全球服务器操作系统市场份额占比情况3服务器操作系统行业技术难点服务器操作系统行业技术难点并发请求和负载量增加,服务器操作系统稳定性下降。并发请求和负载量增加,服务器操作系统稳定性下降。随着云计算的快速发展,服务器操作系统需要具备较强弹性伸缩和负载均4国产服务器操作系统发展报告(2023 年)ODCC-2023-01009衡的能力,以适应动态变化的工作负载需求。同时,服务器操作系统接口稳定性直接影响服务器的可用性,操作系统需要保持对新接口的支持和适应能力。随着新技术的不断出现,不同版本的服务器操作系统之间可能存在接口差异,这对于现有的应用程序和系统集成来说可能带来迁移和兼容性问题。智能终端不断涌现,兼容性成为影响操作系统应用的关键因素。智能终端不断涌现,兼容性成为影响操作系统应用的关键因素。随着智能应用在各行各业逐步普及,服务器操作系统需要能够适配不同的硬件架构和设备,并提供相应的驱动程序支持。多元化的设备和平台有自己的特点和要求,应用程序为满足不同终端用户的需求需要跨平台开发,技术的快速变革也要求操作系统不断更新和升级以适应新的需求和技术,这些都对服务器操作系统的兼容性提出了更高的要求。服务器应用多样化,安全性和隔离性成服务器操作系统不可或服务器应用多样化,安全性和隔离性成服务器操作系统不可或缺的特性。缺的特性。操作系统需要提供可靠的安全和隔离机制,以防止恶意攻击和数据泄露。如在云计算环境下,多个租户共享同一台服务器。服务器操作系统需要提供严格的资源隔离机制,确保不同租户之间的应用程序和数据相互独立,包括增强身份认证、访问控制和加密通信等功能。云原生技术快速发展,云原生的微服务架构、容器化部署等特云原生技术快速发展,云原生的微服务架构、容器化部署等特性对传统服务器操作系统提出新的挑战。性对传统服务器操作系统提出新的挑战。据 Gartner 预测,到 2025年超过 95%的应用将会采用云原生技术,为了适应新技术发展,服5国产服务器操作系统发展报告(2023 年)ODCC-2023-01009务器操作系统需要提供更好的容器支持、更灵活的部署和编排能力。如何优化虚拟化和容器化性能、实现资源隔离和管理,以及简化配置和部署过程,都是需要解决的技术难题。4云与云与 AI 助力服务器操作系统迈向新纪元助力服务器操作系统迈向新纪元云平台不断集成各种形式的网络服务、存储服务、计算服务、人工智能服务、低代码服务、办公服务和业务流程服务等,正在重新定义信息产品的形态和信息服务的提供方式。在云计算的持续推动下,算力服务加速发展,并在架构、功能、模式等方面衍生出全新范式,服务器操作系统需要随着云计算的发展在弹性伸缩、虚拟化支持、容器化支持、强化安全性、自动化管理等方面做出优化,提升云计算环境下服务器操作系统的性能、可用性和管理效率。随着云的不断普及以及云原生的不断演化,云逐渐成为企业 IT 形态的主流,企业数字基础设施将基于云来重建,服务器操作系统的发展也将迈入新纪元。预计在算力等需求刺激下,未来全球云市场规模仍将保持稳定增长,操作系统 云的协同趋势越来越明显。目前国内外大型云平台如亚马逊、微软、谷歌、阿里云、腾讯和华为等都开发了自己的云服务器操作系统。6国产服务器操作系统发展报告(2023 年)ODCC-2023-01009(来源:Gartner,2023 年 4 月)图 3 全球云市场规模及增速(亿美元)AI 可以提高服务器的效率、安全性和性能,推动服务器操作系可以提高服务器的效率、安全性和性能,推动服务器操作系统实现更好的用户体验和业务价值。统实现更好的用户体验和业务价值。随着人工智能成为全球各国新的科技热点,人工智能基础设施建设也成为重要抓手与着力点,未来最主要的操作系统将是基于人工智能深度学习框架的操作系统。英特尔、ARM、飞腾、兆芯、海光、龙芯等国内外领先的芯片厂商正携手布局,共推 AI 的繁荣演进,如英特尔第四代至强可扩展处理器内置众多加速器,可提供优良的 AI 训练和推理性能。基于人工智能的软硬件优化正在帮助人工智能开发者实现其生产力目标,促进人工智能在服务器操作系统更快地得到普及应用并获得商业价值。7国产服务器操作系统发展报告(2023 年)ODCC-2023-01009(二)(二)国产服务器操作系统行业发展现状与分析国产服务器操作系统行业发展现状与分析1政策引领,推动国产服务器操作系统自主演进政策引领,推动国产服务器操作系统自主演进政策加大对科技领域引导扶持,推动国产服务器操作系统产业政策加大对科技领域引导扶持,推动国产服务器操作系统产业创新发展。创新发展。2022 年我国数字经济规模达 50.2 万亿元,总量稳居世界第二,同比名义增长 10.3%,占国内生产总值比重提升至 41.5%,数字经济的飞速发展以及新基建、东数西算等国家宏观举措带来了海量的服务器部署需求。服务器操作系统是“十四五”期间国家重点关注的要求实现自主研发和自主演进的基础软件之一。2020 年 8 月,国务院印发新时期促进集成电路产业和软件产业高质量发展的若于政策全力支持软件产业的创新发展。2021 年 11月,“十四五”软件和信息技术服务业发展规划提出加快培育云计算、大数据、人工智能等领域具有国际竞争力的软件技术和产品,并强调云计算方面要加速云操作系统迭代升级。2022 年 9 月,国务院国资委全面指导并要求国央企落实信息化系统的国产化改造。科技部、工业和信息化部、国家发展改革委等部委及多地地方政府在支持软件产业发展的政策中明确将操作系统研发及产业化作为重点发展方向。8国产服务器操作系统发展报告(2023 年)ODCC-2023-01009(数据来源:中国信通院)图 4 我国数字经济占 GDP 比重及增速2表 2 信息技术应用创新产业相关政策时间时间政策政策要点要点2022.01.10中国银保监会办公厅关于银行业保险业数字化转型的指导意见坚持关键技术自主可控原则,对业务经营发展有重大影响的关键平台、关键组件以及关键信息基础设施要形成自主研发能力,降低外部依赖、避免单一依赖。加强自主研发技术知识产权保护。2022.01.6“十四五”推进国家政务信息化规划支持构建以安全可靠为核心的应用创新生态,以工程建设促进信息技术创新应用。充分发挥国家数字经济创新试验区等试点示范地区优势,开展政府创新试验试点工作。以政策形式明确党政信创的要求与节奏。2021.12.24“十四五”国家信息化规划到 2025 年数字技术创新体系基本形成,集成电路、基础软件、装备材料、核心元器件等短板取得重大突破,并明确提出政务信息化建设促进网络信息技术自主创新。2021.11.30“十四五”软件和信息技术服务业发展规划聚力攻坚基础软件,完善桌面、服务器、移动终端、车载等操作系统产品适配及配套工具集,推动操作系统与数据库、中间件、办公套件、安全软件及各类应用的集.成、适配、优化。2数据来源:中国数字经济发展研究报告(2023 年)9国产服务器操作系统发展报告(2023 年)ODCC-.03.13中华人民共和国国民经济和社会发展第十四个五年规划和二 O 三五愿景目标纲要“十四五”规划纲要提出,要深入实施制造强国战略,实施产业基础再造工程,加快补齐基础零部件、基础软件、基础材料、基础工艺和产业基础等瓶颈短板实施重大技术装备公关工程,完善激励和风险补偿机制,推动首台(套)装备、首批次材料、首版次软件示范应用。2市场边界扩张,服务器操作系统市场边界扩张,服务器操作系统面向云时代面向云时代进化进化国外先发优势明显,中国服务器操作系统市场潜力巨大。国外先发优势明显,中国服务器操作系统市场潜力巨大。由于国外服务器操作系统发展相对较早,在技术、行业生态、市场培育、商业化合作方面具有领先优势。国内服务器操作系统行业虽起步较晚,但是在政策和国家战略带动下,目前发展速度较快。如今中国数字经济的持续发展拉动了服务器操作系统装机量的持续增长,根据物理服务器出货量核算,2022 年中国服务器操作系统行业装机量达到 401.2 万套,商业版行业装机量达到 189.6 万套。根据 IDC 等机构预测,2024 年全球服务器复合增长率为 23%。中国服务器市场增速更加迅猛,预计拥有 41%的增长,在 2024 年将达到全球服务器总额的 33%,增长速率和市场份额都将位居全球市场前列。然而,随着云时代的发展,服务器操作系统市场的边界不再局限于物理服务器,进一步扩张到了云端。阿里云服务器操作系统(Alibaba CloudLinux)历经十余年发展,于 2014 年完成阿里云数据中心 HostOS 的100%覆盖,在阿里自用操作系统场景实现 CentOS 全面替代,于2022 年底在阿里云 ECS 云服务器 GuestOS 装机量上超越 CentOS,成为云上装机量占比第一的服务器操作系统。Alinux 支撑阿里云达到全球第三、亚太第一的市场规模,并依托云计算产业发展得到广10国产服务器操作系统发展报告(2023 年)ODCC-2023-01009泛应用,在全球范围内累计服务超 30 万用户,产品部署规模累计超200万台物理机和 2200 万台虚拟机。(数据来源:IDC、中国信通院整理)图 5 2017-2025中国 X86 服务器出货量趋势预测图拥有自主演进的服务器操作系统体系有利于拥有自主演进的服务器操作系统体系有利于自主创新和技术进自主创新和技术进步,促进本土软件产业发展。步,促进本土软件产业发展。在现代经济中,信息技术已成为推动产业升级和转型的关键因素,操作系统处于整个上下游生态的枢纽位置,通过研发和推广自主演进的服务器操作系统,相关硬件制造、软件开发、技术支持等产业链上下游企业将得到协同发展,带动我国数字经济潜能的进一步释放。另外,在全球化竞争激烈的情况下,自主演进的操作系统可以作为技术出口的重要推手,进一步拓展国内企业在国外的市场份额。11国产服务器操作系统发展报告(2023 年)ODCC-2023-01009(资料来源:中国信通院整理)图 6 国内外操作系统发展历程比较(数据来源:沙利文研究)图 7 中国服务器操作系统行业及商业版装机量3海外厂商优势明显,国产操作系统的选择比例逐年提升海外厂商优势明显,国产操作系统的选择比例逐年提升服务器操作系统市场目前在国内还是海外厂商为主,但是各大服务器操作系统市场目前在国内还是海外厂商为主,但是各大行业选择国产服务器操作系统的比例逐年上升,未来国产服务器操行业选择国产服务器操作系统的比例逐年上升,未来国产服务器操12国产服务器操作系统发展报告(2023 年)ODCC-2023-01009作系统市场接受度有望持续上行。作系统市场接受度有望持续上行。2022 年,在我国所有的装机量中Linux 服务器操作系统市场占有率达到 79.6%,且保持不断增长,Windows 操作系统市场占有率为 19.9%,以 Unix 为代表的小众服务器市场为 0.5%。根据 Statcounter 数据,目前国产操作系统的市占率较低,市场份额仍不及 5%。从市场格局来看,我国操作系统市场依然以海外厂商为主,源自 Red Hat 的 CentOS 仍然是市场主流,但伴随着选择国产服务器操作系统的比例不断上升的趋势及CentOS 停服影响,国产服务器操作系统正在强势崛起。目前,操作系统在党政、金融、电信、互联网等行业的国产产品装机量也在逐步提升,以龙蜥操作系统为代表,其装机量已超过 500 万,服务各个行业用户超过 70 万。近年来国产操作系统性能水平稳步提升,现阶段已经能满足 75%左右场景需求,国产产品的竞争力越来越高。(数据来源:沙利文研究,华经产业研究院)图 8 2022 年中国服务器操作系统市场份额占比情况13国产服务器操作系统发展报告(2023 年)ODCC-头部效应显著,生态良性循环的打造成为关键头部效应显著,生态良性循环的打造成为关键市场竞争加剧,头部企业竞争优势更加凸显。市场竞争加剧,头部企业竞争优势更加凸显。当前操作系统头部厂商已经建立成熟的生态系统,包括开发者、应用程序、工具和解决方案,由于需要与已经存在的生态系统兼容,其他操作系统很难在竞争中获得优势。许多操作系统版本在漫长的市场考验下迅速淘汰,而少数厂商凭借扎实的技术积累和不断改进的产品设计,已具备良好的品牌辨识度和一定规模的稳固客户群体,马太效应逐步凸显优质龙头企业的市场主导地位将不断提升。以开源重塑生态良性循环,寻求国产操作系统高质量发展。以开源重塑生态良性循环,寻求国产操作系统高质量发展。头部企业投入更多人力物力借助开源赢得市场,这也侧面促进了国内软硬件企业的联合研发、互利互惠的合作,围绕用户需求打造落地好用的国产操作系统,一旦形成良好的生态系统,用户会因为应用软件的丰富而加入,应用软件开发商也因为用户基础而投入更多资源进行与操作系统的适配,从而形成良性循环,带动国产操作系统的高质量发展。14国产服务器操作系统发展报告(2023 年)ODCC-2023-01009二、二、国产服务器操作系统产业分析国产服务器操作系统产业分析(一)(一)国产服务器操作系统现状国产服务器操作系统现状1CentOS 停服为本土服务器操作系统厂商带来的挑战与机遇停服为本土服务器操作系统厂商带来的挑战与机遇CentOS 停服为本土服务器操作系统厂商带来机会的同时也加停服为本土服务器操作系统厂商带来机会的同时也加剧了服务器市场的竞争剧了服务器市场的竞争。2020 年,Red Hat 宣布未来将终止对CentOS 8 和 CentOS 7的服务支持,包括停止对后续漏洞的更新修复。因为 CentOS拥有成熟且庞大的生态系统,包括社区、开发者、软件包和工具等。加之,本土服务器操作系统厂商在短时间内很难建立一个与之完美匹配的生态系统。因此,CentOS 在国内较大的市场份额将会被其他操作系统厂商瓜分,导致市场竞争加剧。然而,CentOS 停服也为国产服务器操作系统厂商带来了些许机遇。由于过去 CentOS具有良好的生态系统以及上下游产业,因此其成为了大多数用户的首要选择,而 CentOS的停服意味着漏洞更新的停止,缺少安全保障的企业业务将无法进行,各企业面临不得不替换的现状,国产替代成为必然趋势,从而“迫使”国产操作系统发展。从 2019 年中国迎来第一个开源许可证开始,国产开源系统迎来了属于自己的春天。借此,像 OpenAnolis 龙蜥社区等国产开源根社区的诞生,代表着我国在操作系统领域迈出了坚实的一步,对国产操作系统的发展和应用起到推动作用。其次,由于 CentOS市场份额较大,停服给本土服务器操作系统厂商创造了推广机会。15国产服务器操作系统发展报告(2023 年)ODCC-国产服务器操作系统产业现状国产服务器操作系统产业现状国内已出现多个较为成熟的国产服务器操作系统,产业步入国内已出现多个较为成熟的国产服务器操作系统,产业步入 2.0时代,面向云计算、智能计算等方向进化。时代,面向云计算、智能计算等方向进化。近年来,在国家的科学布局以及产业界各方力量的不懈努力下,国内的服务器操作系统创新形式有了很大改观,形成了协同攻关、优势互补、融合发展的格局,推动产业链供应链现代化水平不断提升,并加速向价值链高端迁移。从产业层面来看,以阿里云、华为、麒麟软件、统信软件为代表的中国技术力量不断取得核心突破,以龙蜥社区、欧拉社区为代表的中国开源社区正在构建以自主技术为核心的产业生态,国产服务器操作系统已基本具备有开发者社区、有知识产权、高安全、高可用、可定制、可重构的特征。国内商业版服务器操作系统主要有统信软件、浪潮信息、中科方德、凝思软件、中兴新支点、中标麒麟、麒麟信安等,均基于国内操作系统开源社区进行商业产品开发。云计算向各类用户提供服务,满足不同用户的计算需求,服务器操作系统发挥自身提供计算运行环境的能力,满足复杂多样应用场景的各项需求。在多样性算力、智能计算快速发展的技术时代背景下,服务器操作系统产业现已步入 2.0 时代。当复杂的用户需求与不同场景的需求发生时,应提前具备对通用芯片及专用芯片的兼容能力。2.0 时代的服务器操作系统已开始全面围绕,如何充分释放计算能力的核心问题,面向以云计算、智能计算等技术方向进化。16国产服务器操作系统发展报告(2023 年)ODCC-2023-01009(来源:公开资料;中国信通院整理)图 9 2019-2024 年国产操作系统通用新增市场规模3国产化替代迁移进行时国产化替代迁移进行时国产服务器操作系统逐渐成为各行业替换首选,根据近期中国国产服务器操作系统逐渐成为各行业替换首选,根据近期中国信息通信研究院(简称信息通信研究院(简称“中国信通院中国信通院”)面向用户群体的调研显示,)面向用户群体的调研显示,龙蜥操作系统位列用户意愿迁移系统的首位。龙蜥操作系统位列用户意愿迁移系统的首位。目前服务器操作系统客群涉及互联网、政府、金融、电信、制造、科教、医疗等多个行业,国产化服务器操作系统在一定程度上得到了用户的认可和应用,服务器操作系统国产化替代市场潜力巨大3。3此调查主要调研服务器操作系统行业的发展趋势,结合政府、金融、电信等多个行业的使用实践,客观呈现现有服务器操作系统的应用、迁移情况以及未来发展趋势。17国产服务器操作系统发展报告(2023 年)ODCC-2023-01009图 10 国产化服务器调研客群行业分布在 CentOS停服背景下,大量服务器操作系统用户已经开启了国产替换的考量或计划,其中,有意愿且已进行试点和已制定计划的人数超过半数,占到了 72%。有意愿但尚未制定计划的人数占到了12%,仅有 8%的人数无迁移意愿,并且近半数调查人表示有意愿在一年内迁移至国产服务器操作系统。为此,龙蜥社区官网早在 2021年上线了 CentOS 停服解决方案专区,为受 CentOS 停服影响的用户提供迁移方案及长期稳定支持,有效应对了 CentOS停服带来的风险。18国产服务器操作系统发展报告(2023 年)ODCC-2023-01009图 11 用户迁移国产服务器操作系统意愿及进度分布图当前,市场成熟度已经跨越从尝试到大规模落地的鸿沟,并且国产化操作系统如何替代 CentOS,实现平滑迁移成为了选择的重要考虑因素。在调查中发现,用户意愿迁移至龙蜥操作系统的比例超过半数为 53%,在国产迁移服务器操作系统意愿中排名第一,意愿迁移至统信 UOS 的比例为 38%,意愿迁移至麒麟操作系统的比例为37%,意愿迁移至欧拉操作系统的比例为 36%。值得注意的是,用户在迁移意愿选择上往往会选择多个品牌操作系统,对用户来讲,在迁移过程中选择双品牌的服务器操作系统相对更加可靠。不同品牌的服务器操作系统拥有各自独立的技术支持和生态系统,选择多个品牌操作系统可以获得更多的技术支持资源,提高故障排查和问题解决的效率,也可以防止风险集中,降低对单一厂商的依赖性。19国产服务器操作系统发展报告(2023 年)ODCC-2023-01009图 12 用户意愿迁移国产服务器操作系统分布图4行业客户需求分析与适配行业客户需求分析与适配不同领域对服务器操作系统的看重点各有侧重,稳定、安全、不同领域对服务器操作系统的看重点各有侧重,稳定、安全、兼容性为最重要因素,其次服务商品牌也是重要考虑因素之一。兼容性为最重要因素,其次服务商品牌也是重要考虑因素之一。根据中国信通院调查数据显示,63%的用户关注服务器操作系统关注的稳定性,45%的用户关注服务器操作系统的安全,如以信息安全为主要侧重点的政务、金融等行业。47%用户考虑产品的兼容性,39%的用户选择高性能为首要关注因素,如电信、互联网等行业以性能和完整生态为主要侧重点,因此,以兼容性更好、产品性能和技术能力见长的龙蜥操作系统,在这些领域中均有较好的应用广度以及群众基础。在更加看重服务商品牌的领域,欧拉服务器操作系统因发展较早,品牌可信度较高,具有较好的应用占比。20国产服务器操作系统发展报告(2023 年)ODCC-2023-01009图 13 用户对服务器操作系统关注因素分布图图 14 用户迁移到国产服务器操作系统方式意愿图另外,根据用户应用或数据迁移到国产服务器操作系统方式意愿调查结果,如图 14 所示,有 40%的用户期望采取云服务商迁移服务,云迁移不仅可以降低企业对于自有数据中心的依赖和应用成本,企业还可以利用自动化工具完成便捷、安全地迁移操作。阿里云作为目前国内最大的云服务商,在云服务领域深耕多年,也是龙蜥社21国产服务器操作系统发展报告(2023 年)ODCC-2023-01009区理事长单位,而龙蜥操作系统早些年脱胎于阿里云,能力来源于阿里云 CentOS自主替代历程,拥有丰富的场景验证以及用户迁移案例实践,可提供成熟的操作系统迁移方案。(资料来源:阿里云)图 15 阿里云 CentOS自主替代历程(二)(二)国产服务器操作系统发展待完善方向国产服务器操作系统发展待完善方向1服务器操作系统生态碎片化服务器操作系统生态碎片化各公司自研发系统已获得较大进步,但不同领域操作系统形成各公司自研发系统已获得较大进步,但不同领域操作系统形成“软烟囱软烟囱”,系统生态呈碎片化。,系统生态呈碎片化。随着我国入局操作系统领域的公司逐年增多,服务器操作系统呈多样化,且均在各自领域有较为规模化的应用。但是,目前国内服务器操作系统主要来源于上游 Fedora、Debian 开源社区,发行版众多,导致同质化问题严重,再叠加上众多 CPU 厂商,造成操作系统厂商在研发投入、运维等方面出现大量的重复和碎片化的版本维护工作,因此,我国亟需开源根社区来整合产业上下游。构建中国主导的根社区,能够最大范围、最高效的盘活资源,将技术与商业、技术与人才等不同形态的资源进行打通,22国产服务器操作系统发展报告(2023 年)ODCC-2023-01009实现上游协同创新,下游差异化竞争发展的格局,打破同质化低水平的竞争循环。对此,我国以 OpenAnolis 为代表的开源社区正积极建设根社区,有望摆脱国外开源社区的依赖,打破“碎片化”发展。而阿里云、浪潮信息、统信软件、英特尔、中国移动等公司分别作为云服务、软件、电信等行业龙头,也积极参与开源社区的建设,基于社区操作系统发行了针对下游的衍生版。如统信软件在国内首推统信服务器操作系统 V20(免费使用授权),实现了服务器操作系统在中下游产业链的重塑,从根本上减少“软烟囱”的形成。2核心技术存在依赖国外的问题核心技术存在依赖国外的问题我国服务器操作系统发展迅速,但仍存在核心技术依赖国外的我国服务器操作系统发展迅速,但仍存在核心技术依赖国外的问题。问题。目前,国产操作系统发展迅速,已有众多自研服务器操作系统,部分系统已具有一定的市场规模,除了原有的社区版,商业版,还新增有商业公司下的免费使用授权版本(如统信服务器操作系统V20 免费使用授权模式),形成了上游开源社区、中游商业发行版和下游免费使用授权的全产业链模式。但是核心技术仍存在依赖国外开源社区的问题,如内核、驱动、虚拟化等技术,这些技术是操作系统的重要组成部分,涉及到大量的底层代码和特定的技术细节。因此,一旦发生社区停服或者地缘政治等因素影响,我国将出现核心版本无法获取,相关的功能、安全等组件无法更新使用等情况,甚至影响到我国服务器操作系统生态的构建。23国产服务器操作系统发展报告(2023 年)ODCC-人才培养与底层生态建设不适配人才培养与底层生态建设不适配人才培养与服务器操作系统底层生态建设之间的适配性不足限人才培养与服务器操作系统底层生态建设之间的适配性不足限制了我国服务器操作系统产业发展。制了我国服务器操作系统产业发展。随着我国服务器操作系统领域市场规模逐渐增加,人才需求逐渐扩大。但是当前的教育和培训体系在服务器操作系统底层生态方面存在滞后。传统教育体系更注重理论知识和基础技能,而在底层系统开发、驱动程序等领域的实际应用技能得不到充分培养。美国高度重视人才培养,学生开源开发者已占据全球 32%,众多高校纷纷联合知名开源组织共建教学平台、组织实践活动等。我国大多数学生并未系统接受过开源教育,仅部分高校开设开源通识课程。现有开源课程仅面向部分计其机及软件专业开设,难以建立系统化的开源知识体系。4服务器操作系统与新兴技术融合欠缺服务器操作系统与新兴技术融合欠缺云计算和人工智能等技术与操作系统产业实现融合,对于我国云计算和人工智能等技术与操作系统产业实现融合,对于我国服务器转型甚至未来产业转型升级具有支撑作用。服务器转型甚至未来产业转型升级具有支撑作用。随着云计算、人工智能等技术的兴起,云上海量的客户场景、创新的硬件架构和颠覆式的软件应用催生对操作系统更多需求和更快迭代速度,因此亚马逊 AWS 另辟蹊径,通过云计算在服务器操作系统领域成功换道超车了 Red Hat。在云上,操作系统稳定性指标比 CentOS 好一倍,阿里云十年前就认识到这一点,并进行了 CentOS替换实践,由此积累了深厚的技术基础,占据了通过云带动操作系统发展的先发优势。未来,共同推进人工智能、云计算等新兴技术在服务器操作系统中24国产服务器操作系统发展报告(2023 年)ODCC-2023-01009的应用和发展,使国内服务器操作系统可以更好地适应人工智能与云计算等新兴技术的发展趋势,并为用户提供更强大、高效、安全的服务,在市场竞争中保持竞争力将是两产业融合发展的最终目的。(三)(三)国产服务器操作系统发展趋势国产服务器操作系统发展趋势1IT 企业积极拥抱开源软件企业积极拥抱开源软件国内国内 IT 企业积极推动开源的发展,并从中获得技术创新和竞争企业积极推动开源的发展,并从中获得技术创新和竞争优势。优势。Red Hat2021 年发布的全球企业开源现状调查报告显示“最具创新能力的企业都在使用开源”。近日,阿里云公布 1 4 开源战略,在操作系统、云原生、数据库、大数据四大开源领域之外,公布大模型方向的开源新势力“AI 模型社区魔搭”;百度以拥抱、回馈、影响开源的态度,在 AI 和 web 方面对外开源,建设技术生态,在基础平台方面对内开源,加强技术协作,减少重复浪费;华为与Linux基金会合作,聚焦基础软件根技术,以开源软件为支点,构建开源黑土地和根社区。开源在全球主流技术领域迅速崛起,逐渐改变软件领域的竞争方式和市场格局,正成为数字技术创新的主流模式。2中国开源操作系统根社区诞生中国开源操作系统根社区诞生随着开源发展理念逐渐成熟,国内以随着开源发展理念逐渐成熟,国内以 OpenAnolis 为代表的中国为代表的中国开源根社区诞生,对于本土商业操作系统发展具有里程碑意义。开源根社区诞生,对于本土商业操作系统发展具有里程碑意义。从2019 年开始,国内企业阿里云、华为联合产业上下游分别成立开源25国产服务器操作系统发展报告(2023 年)ODCC-2023-01009社区 OpenAnolis、openEuler4,共同开发新的技术或项目。商业Linux服务器操作系统都基于上游开源社区,即商业操作系统的根社区,之前国产服务器操作系统都依赖国外上游操作系统社区 Debian、Fedora 等,OpenAnolis、openEuler 中国开源根社区的诞生填补了根社区生态的空白,在中国服务器操作系统发展史上具有生态里程碑意义。值得注意的是,中国开源社区形式上具备国外开源社区的治理架构,但在运营模式上又不断创新,与国外社区有很大差异。如在社区贡献上中国开源社区主要来源于项目的发起方,开源项目也更多的以商业利益为导向,我国的此模式更注重效率,可大大缩短项目从发起到商业化落地的时间,在社区内众多龙头企业和拥有开源情怀的个人开发者的带领下社区氛围也更具活力和创新力。(资料来源:OpenAnolis社区)图 16 OpenAnolis 根社区架构定义图4openEuler:欧拉社区26国产服务器操作系统发展报告(2023 年)ODCC-主动拥抱云计算与人工智能主动拥抱云计算与人工智能国产服务器操作系统正在拥抱全新变化,未来市场的竞争将以国产服务器操作系统正在拥抱全新变化,未来市场的竞争将以云计算云计算 AI 为中心的操作系统生态为主。为中心的操作系统生态为主。云计算为 AI 提供算力、数据和场景,AI 提升云计算的算力,云计算的出现使得许多公司和组织开始重视对开源软件的使用和开发,有效地推动了我国开源服务器操作系统的创新和发展。2022 年我国捐购的开源项目在云原生计算基金会(CNCF)占比超过 20%,阿里云等企业已储备一定自主技术,但目前,我国传统的服务器操作系统主要面向企业业务的处理和数据存储,相对封闭,难以满足新技术对操作系统灵活度和智能化要求,因此,服务器操作系统未来以 AI与云计算的结合将是大势所趋。坚定对未来云趋势的判断,结合用户当下对国产硬件生态和全 AI 场景的诉求,龙蜥社区当前的发展路线就是立足云计算场景,打造智算时代领先的操作系统产品和解决方案,进一步满足用户对高品质、高性能操作系统的需求。4商业化合作优势互补商业化合作优势互补服务器操作系统涉及上下游适配问题,商业合作有助于产品兼服务器操作系统涉及上下游适配问题,商业合作有助于产品兼容、优势互补,创造良好产业生态容、优势互补,创造良好产业生态。不同企业在服务器操作系统技术方面具备不同的专长和研发实力,通过商业化合作,可以将各方的技术优势进行整合,提升服务器操作系统的整体性能,还可以通过与国外企业进行合作,借鉴其先进经验和技术,提高产品质量和全球影响力。另外,商业化合作可以实现资源的整合与共享。另外,商业化合作可以实现资源的整合与共享。对于27国产服务器操作系统发展报告(2023 年)ODCC-2023-01009人才、研发设施、测试环境、市场推广等方面的资源,在联合起来后能够更加高效地利用,并降低研发成本。通过硬件厂商、软件开发者等各方进行合作,可以形成完善的解决方案和配套服务,满足用户多样化的需求,促进服务器操作系统产品生态圈的建设。5国产化替代逐步实现国产化替代逐步实现目前,中国厂商已掌握国产 CPU 支持、软硬件协同的虚拟化、网络化资源部署、服务器功能软件配套与优化等关键技术,研发并推出相关操作系统,且在系统兼容性、负载能力、可靠度和安全性均有大幅提高。另外,中国政府出台了一系列政策鼓励本土企业发展服务器操作系统。越来越多的中国企业已经意识到基础软件技术自主的重要性,正在以更加积极拥抱的态度面对服务器操作系统领域的国产化替代趋势,国内用户对于国产化替代的接受度将不断提高,并逐渐认可国内产品的质量和性能。龙蜥操作系统在开源之初充分考虑到对现有用户平滑迁移的支持,性能和稳定性经过历年“双 11”历练,能为云上典型用户场景带来 40%综合性能提升,50%故障率的降低,兼容 Linux 生态,提供平滑的 CentOS迁移方案,支持原地迁移,并且提供全栈国密能力。龙蜥操作系统还支持 X86_64、RISC-V、Arm64、LoongArch、SW等主流计算架构,完善适配英特尔、AMD、飞腾、海光、兆芯、鲲鹏、龙芯、兆芯、SW、平头哥等主流芯片,支持开源分布式关系数据库 OceanBase、安全容器 Kata Container、云原生关系型数据库28国产服务器操作系统发展报告(2023 年)ODCC-2023-01009PolarDB for PostgreSQL。迁移到龙蜥操作系统不仅十分顺滑,而且也意味着基础应用组件和工具链实现了双升级,打造更全、更新、更快,预留未来可扩展性的软硬件生态。(资料来源:OpenAnolis社区)图 17 龙蜥社区提供完整迁移替换方案29国产服务器操作系统发展报告(2023 年)ODCC-2023-01009三、三、国产服务器操作系统开源社区运作与商业模式分析国产服务器操作系统开源社区运作与商业模式分析(一)(一)开源生态对服务器操作系统发展至关重要开源生态对服务器操作系统发展至关重要1开源社区助益国产替代的技术突破和生态完善开源社区助益国产替代的技术突破和生态完善在技术方面,开源社区推动了多个国产操作系统的发展,国产在技术方面,开源社区推动了多个国产操作系统的发展,国产开源生态技术不断突破。开源生态技术不断突破。例如,国内基于 OpenAnolis 社区自主研发的龙蜥操作系统等,不仅成功孵化众多商业衍生版,也为中国企业和用户提供了更多选择。基于龙蜥操作系统,阿里云服务器操作系统 Alibaba Cloud Linux(简称 Alinux),不仅满足了国产化软件生态,同时对 CentOS软件生态也有很好的兼容性。受益于阿里云和阿里巴巴集团的海量应用场景打磨,Alinux 在云场景下拥有更强的弹性、稳定性和性能竞争力。与飞天操作系统的结合,使阿里云的弹性能力相比 CentOS 提升 60%。另外,Alinux 可提供全生命周期的维护和服务,相比 CentOS,宕机率下降 50%。而与阿里云实例深度结合优化,使 Alinux 在大数据、数据库、应用服务器等场景下性能提升 100%。在产业生态方面,开源社区促进国产服务器操作系统形成良好在产业生态方面,开源社区促进国产服务器操作系统形成良好生态。生态。国产开源生态不仅可以帮助国内厂商打造更加开放、友善的开源生态环境,进而推动操作系统技术与生态的进化,同时还可以疏通操作系统产业的上下游关系,保持产业链、供应链的稳定性和竞争力,建立独立可信的现代化产业体系。国内基于开源生态不断国内基于开源生态不断30国产服务器操作系统发展报告(2023 年)ODCC-2023-01009涌现出新的商业模式,企业合作交流,开源生态商业化不断完善。涌现出新的商业模式,企业合作交流,开源生态商业化不断完善。一类是基于 OpenAnolis、openEuler 等开源社区推出的社区版,基于国际社区版本原则,生命周期为 4-5 年;另一类是商业操作系统公司提供的付费商业版本,企业用户需要相应的经费支持,如统信服务器操作系统 V20为用户提供长达 13 年的生命周期维护。另外全产另外全产业链共享的开源社区有利于在硬件厂商、基础软件厂商、应用软件业链共享的开源社区有利于在硬件厂商、基础软件厂商、应用软件厂商、系统开发商、开发者、用户之间形成产业正循环,打造商业厂商、系统开发商、开发者、用户之间形成产业正循环,打造商业可闭环的良性生态系统。可闭环的良性生态系统。如浪潮信息以整机厂商身份加入龙蜥社区,通过共建浪潮信息龙蜥联合实验室加深与龙蜥社区的合作,打通技术创新和产业应用之间的通路,以行业实践反哺技术研发,形成从技术研发到产品落地的高效循环。2开源社区助力产学研一体化进程加速开源社区助力产学研一体化进程加速开源社区为人才提供展示自己才华的机会,提供丰富的资源和开源社区为人才提供展示自己才华的机会,提供丰富的资源和工具,而优秀人才的参与和贡献推动社区持续发展、改进和创新。工具,而优秀人才的参与和贡献推动社区持续发展、改进和创新。通过开源社区的治理与运营,包括逐步完成开发者与使用者的人才培养,可以形成一个基于开源社区的人才生态圈。如 Linux 社区吸引了全球各地的顶级人才参与开发,包括架构师、程序员和系统管理员等。优秀的人才为 Linux 社区提供了丰富的技术和创新,进而带动了社区平台的发展和完善,他们的参与和贡献使得 Linux 操作系统能够不断地提升和优化,成为世界上最成功的开源项目之一。31国产服务器操作系统发展报告(2023 年)ODCC-2023-01009目前,我国正以开源社区为基础推动服务器操作系统产学研一体化发展。中国科技大学与企业合作开展操作系统的研究与开发,共同培养操作系统领域的人才。清华大学开源软件镜像站(TUNA)由清华大学学生参与管理和维护,提供了丰富的开源软件镜像资源,为国内开发者提供了便利。北京师范大学软件学院学生组成开源社区,致力于促进学生参与开源项目的学习和贡献,并推动学院的开源教育,培养专业人才。2023 开放原子全球开源峰会上,OpenAnolis 社区联合阿里云、统信软件、浪潮信息 3 家理事单位发起“OpenAnolis 社区人才培养计划”,推出“OpenAnolis ”模式的人才认证体系和操作系统课程,服务龙蜥操作系统生态厂商、开发者群体和高校学生,为行业发展和人才培养助力。3国内开源社区典型案例分析国内开源社区典型案例分析(1)OpenAnolis 社区社区OpenAnolis 社区成立于 2020 年 9 月,定位面向国际的 Linux 服务器操作系统开源根社区及创新平台,理事单位有阿里云、统信软件、英特尔、浪潮信息等 24 家,由超过 600 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。一般开源社区是操作系统和芯片厂商的组成模式,OpenAnolis 社区中既有浪潮信息、统信软件、普华基础软件等操作系统厂商,也有英特尔、ARM、飞腾、兆芯、海光、龙芯、申威等国内外领先的芯片厂商,还有阿里云、中国联通、中国移动、中国32国产服务器操作系统发展报告(2023 年)ODCC-2023-01009电信等头部云计算厂商和运营商,完善的生态极大促进了社区内开源项目的创新和快速商业化落地。另外,OpenAnolis 社区治理上秉承“平等、开放、协作、创新”的原则,由合作伙伴共同参与到开源项目的决策和发展过程中,确保了社区决策的公平、公正及开源项目的长期发展。(资料来源:OpenAnolis社区)图 18 OpenAnolis 社区生态全景图社区短期目标是开发龙蜥操作系统作为 CentOS替代版,助力广大用户无缝迁移,长期使命是与生态合作伙伴联手,共同打造一个面向未来的操作系统,建立统一的开源操作系统生态。社区技术方33国产服务器操作系统发展报告(2023 年)ODCC-2023-01009向明确聚焦一云多芯、CentOS迁移、云原生、智能计算、安全可信、编程语言、软硬协同、运维与性能、社区基础设施等九大方向。产品用户广泛,生态较为完善,开发者平均增速达 110%,社区创新力和活跃度在国内首屈一指,成立近 60 个特别兴趣小组(SpecialInterest Group,SIG),拉取请求数(Pull Request,PR)月均 5000多次。基于分布在 Linux 内核、GCC、LLVM、OpenJDK 等社区的核心贡献开发者,龙蜥也拥有充分的国际开源社区话语权,围绕芯片、内核、编译器、安全、虚拟化及云原生等操作系统核心领域进行技术创新,推动建立技术标准。社区每两年发布一个社区版本,现已发布 LoongArch GA、Anolis OS 8.6、8.8等多个社区版本,与此同时,阿里云、统信软件、浪潮信息、凝思软件、普华基础软件、中兴通讯、中兴新支点等超过 12 家合作伙伴发布基于龙蜥操作系统的商业衍生版,服务超过70 多万用户。面对全球云 AI 的发展浪潮,基于首创的“分层分类”科学理论,社区生态伙伴协同打造了 Anolis OS 23,新增对智能计算的全面支持,构建 AI 容器镜像生态,提供主流的 AI 训练/推理镜像,并发布开箱即用的 modelscope/huggingfaceAI 大模型实践镜像,是首款全面拥抱智算的国产操作系统,龙蜥社区也与英伟达、英特尔、AMD 等 AI硬件厂商达成广泛合作。34国产服务器操作系统发展报告(2023 年)ODCC-2023-01009(资料来源:OpenAnolis社区)图 19 龙蜥操作系统生态架构图(2)openEuler 社区社区openEuler 开源社区由华为成立于 2019 年,2021 年 11 月华为正式将欧拉操作系统全量代码、品牌商标、社区基础设施等相关资产,捐赠给开放原子开源基金会,由开放原子开源基金会孵化及运营。openEuler 社区业务主要为探索和构建操作系统产业软件开源生态,促进面向数字基础设施的基础软件产业发展。openEuler 社区秉持“共建、共享、共治”的理念,社区治理以组织领导下的社区自治为原则,社区愿景是为世界提供面向数字基础设施的开源操作系统,以为世界提供开源软件为使命。2020 年 openEuler 社区发布长期支持版本 openEuler 20.03 LTS,同时发布基于 openEuler的商业发行版,35国产服务器操作系统发展报告(2023 年)ODCC-2023-01009欧拉操作系统可广泛部署于服务器、云计算、边缘计算、嵌入式等各种形态设备。(资料来源:openEuler社区)图 20 openEuler 社区生态(3)OpenCloudsOSOpenCloudOS 为无厂商标签的中立开源操作系统社区,由操作系统、云平台、软硬件二商与个人共同倡议发起,成立于 2021 年12 月,目前由开放源自基金会托管和监督,以标准开源社区模式运作,社区由参与单位共同治理。社区定位为“中立,全面开放,100%开源的 Linux国产发行版”,目前社区成员企业包括腾讯云、宝德、北京初心、北京红旗等。OpenCloudOS 社区致力于 Linux 国产发行版的自主及稳定可靠,完成基础软件从开源上游的开发版本到社区稳定的生产版本的转化,满足行业国产 CPU、GPU、数据库、36国产服务器操作系统发展报告(2023 年)ODCC-2023-01009中间件等基础设施的公共需求。其项目范围包括服务器操作系统、云原生系统、虚拟化、弹性计算、容器支持等。社区短期目标是解决 CentOS断供替代问题,长期目标是解决国产操作系统上游供应问题,保障行业应用的基础软件安全供应及可持续健康发展。2023 年,OpenCloudOS 发布全自研社区 9.0 版本,该版本由腾讯等十余家企业共同开发并长期维护。(资料来源:OpenCloudOS 社区)图 21 OpenCloudOS 社区发展路线(二)(二)助力关键行业商业化案例加速落地助力关键行业商业化案例加速落地1国产典型开源社区与厂商协作模式探究国产典型开源社区与厂商协作模式探究(1)社区开发模式)社区开发模式37国产服务器操作系统发展报告(2023 年)ODCC-2023-01009社区由社区组织或领导者发起并牵头运作,推动社区的发展和成长。这种模式下,开源软件项目由社区成员自主发起和维护,厂商以捐赠代码、提供技术支持或资金等方式支持社区的发展和维护。社区开发模式的优点是能够集中全球开发者的智慧和力量,形成强大的创新能力。如国内知名操作系统开源社区 deepin(中文名称:深度社区)由深度社区与国内外厂商和爱好者合作开发,其核心组件 DDE Linux 桌面环境,具有独特的设计和友好的用户界面,并集成许多实用工具和应用程序,成为龙蜥社区版本的主流桌面环境。(2)社区托管模式)社区托管模式社区托管模式是指厂商将自研的开源软件项目交给开源社区进行管理和维护。厂商在开源社区发布自己产品的源代码,并在社区中提供技术支持和指导。在这种模式下,厂商可以通过社区的力量吸引更多的开发者参与到项目中,共同推动项目的进展。同时,厂商也可以从社区的反馈和贡献中获得更多的改进和创新。阿里云的Dubbo项目、华为的 openEuler项目等都采用这种模式。(3)合作伙伴模式)合作伙伴模式在合作伙伴模式下,厂商与开源社区进行战略合作进行技术创新和新产品的开发,共同开发和维护开源软件项目。厂商利用社区的力量和资源来加速产品开发和创新,开源社区可获取厂商的资金支持和技术资源,促进产品的市场营销推广和用户扩展。如在38国产服务器操作系统发展报告(2023 年)ODCC-2023-01009OpenAnolis 社区中,统信软件是龙蜥操作系统商业衍生版的最大厂商,同时在社区贡献度中居第二位,联合其他操作系统厂商负责支持 X86、ARM、LoongArch 架构的内核开发、优化、加固等商业落地工作;英特尔作为全球最大的半导体芯片制造商为龙蜥操作系统提供先进的硬件优化技术,如 SGX、AMX、TDX、SIOV、Crypto-NI 等,助力 CentOS 到龙蜥操作系统的平滑迁移;阿里云等云厂商既是操作系统最大的用户,也理解云计算用户的真实需求,通过大规模的快速迭代和试错来缩短国产芯片和硬件的成熟路径。2开源策略与商业化适配分析开源策略与商业化适配分析随着开源商业模式的不断成熟,越来越多的厂商依托开源社区,不断推出国产服务器操作系统社区发行版及商业版,满足国产替代多样化需求。在此基础上,开源的参与方企业形成开源 服务的多种商业模式,加速开源项目的商业化落地,商业上的成功支撑开源社区不断壮大,从而产生更多的技术创新,就此开源社区与商业模式形成良性循环。模式一:打包和技术支持模式一:打包和技术支持开源软件的自由特性给项目进展、代码质量和产品稳定性带来了不确定因素,公司通常会提供打包、技术支持、培训或者按项目的咨询服务来收费。如 Red Hat 从 Linux 社区吸收最有才华的开发人员,打包好“黄金标准”的 package 用订阅形式卖给用户,凭借 Red39国产服务器操作系统发展报告(2023 年)ODCC-2023-01009Hat 订阅,客户不仅能够下载经过严格测试和认证的 Red Hat 企业软件,还可获得相关专业指导,确保产品的稳定性和安全性。模式二:模式二:Dual-License 双授权双授权“双授权”模式指代码具有传统的开源许可证(如 GPL)和另一套商业许可证。如 Oracle 根据 GPL 和商业许可证提供 MySQL 数据库服务器和 MySQL 客户端库,使用或分发 GPL 下的开源应用程序的开发人员可以使用 GPL 许可的 MySQL 软件,而不想将 MySQL软件与自己的 GPL 许可下的商业软件组合或分发的原始设备制造商(OEM)、独立软件开发商(ISV)和增值经销商(VAR)可以购买商业许可。模式三:模式三:Open Core模式模式Open Core 模式主要指提供软件产品的“核心”或功能限制版本作为免费和开源软件,同时提供“商业”版本或附加组件作为专有软件,即把一部分软件开源,另一部分增值的闭源收费。以统信服务器操作系统 V20 为例,该操作系统针对不同需求用户提供商业版和免费使用授权模式,商业版需商业付费,而免费使用授权模式可免费下载和使用,两个版本源代码和功能一致,但是商业版可提供 400 专线 L3 级服务支持体系,对 VIP客户提供安装指导、系统调优、现场支持,并且有原厂升级保障等增值服务。许多用户在实际使用中反40国产服务器操作系统发展报告(2023 年)ODCC-2023-01009馈在采用社区版服务器操作系统的同时,应该采购一部分商业版,不然会面临缺少运维服务的风险。表 3 统信服务器操作系统 V20 商业版和免费使用授权版服务对比类别类别UOS V20 商业版商业版UOS V20 免费使用授权免费使用授权商业责任商业付费,担负产品责任免费下载和使用,统信软件不担负产品责任服务区别提供 400 专线 L3 级服务支持体系,对VIP 客户提供安装指导、系统调优、现场支持等服务跟随商业版本获取补丁,用户自行安装安全补丁依据国际和国内信创标准,提供安全服务专区,针对系统漏洞提供漏洞修复和安全补丁,通过邮件订阅、400 客服和 VIP 专属模式主动推送自助服务,如需原厂支持服务,需购买订阅服务或商业版 license 授权授权方式商业版 license 授权,计入资产或订阅模式遵守用户许可协议拥有产品使用权升级保证有原厂升级保障需要升级购买订阅服务或商业版license 授权后,获得版本升级权益适用场景核心生产系统,关键应用服务,要求商业等级支持,产权需要预算紧缺,需要尽快完成 CentOS迁移替代的用户模式四:模式四:SaaS-软件即服务软件即服务公有云厂商将硬件和软件资源整合,软件运行到了资源池上,改变传统 IT 的利益分配模式。硬件和软件统一之后,通过规模效应降低边际成本,让用户得到了实惠,同时用户直接租用服务的模式让创业创新门槛大幅下降。从营收模型上看,客户会每个月、每年源源不断的贡献收入,容易获得高估值。对客户而言可以避免前期一次性购买软件和专用硬件的高额成本,部署快、随时享受升级服务,另外,运维责任转嫁到 SaaS 提供商身上,由供应商提供管理服务,对于客户来说便捷高效。41国产服务器操作系统发展报告(2023 年)ODCC-龙蜥商业化适配典型案例分析龙蜥商业化适配典型案例分析(1)与统信软件合作案例分析)与统信软件合作案例分析龙蜥社区与统信软件的合作一方面可以扩大其产品的用户群体,龙蜥社区与统信软件的合作一方面可以扩大其产品的用户群体,另一方面帮助产品不断迭代和升级。另一方面帮助产品不断迭代和升级。依托在操作系统研发、行业定制、国际化、迁移适配、交互设计等多方面的技术积淀,统信软件不仅全程参与了龙蜥社区 8.2 版的 RC1、RC2 和 GA 版的开发与发布,还采取了并行开发方式,在社区版发布 10 个工作日后即发行统信 UOS 基于社区 8.2 版本的商业版本。龙蜥助力统信软件完善产品的能力,为用户提供更加全面和丰富的服务,助力产品的商业化落地。统信软件通过重点参与龙蜥社区内核 SIG,安全 SIG,迁移工具 SIG,产品测试 SIG 等重点工作组,重点投入 Anolis V23 的社区版开发。同时,其商业发行版统信服务器操作系统 V20 也受到商业客户青睐,据第三方机构统计数据,2023 年统信 UOS在桌面端持续保持市占率第一,在服务器端增速行业第一。42国产服务器操作系统发展报告(2023 年)ODCC-2023-01009(资料来源:统信软件)图 22 统信软件服务器操作系统上下游产业链5(2)助力英特尔加速产品技术发展)助力英特尔加速产品技术发展龙蜥助力英特尔加速产品技术发展,低成本获得代码贡献和用龙蜥助力英特尔加速产品技术发展,低成本获得代码贡献和用户场景。户场景。Linux 内核作为全球最大的几个开源项目之一,其要处理的方方面面非常繁杂,对其内核的改进也是十分谨慎,很多最新的CPU 特性并不能第一时间抵达到客户的生产环境,对性能的极致发挥也需要经过多番论证和评估才能落地。然而,一些新的硬件特性和风险可控的实验特性需要及早抵达特定的用户群体,才能为更多的客户所服务。英特尔依托社区成立英特尔架构工作组,深刻理解用户需求,对每代的英特尔平台技术做比较深层次的优化。英特尔与 OpenAnolis 社区的合作为社区带来更完善的多架构支持,同时结合英特尔生态的经验和技术积累,可以助力更多基于英特尔技术的5资料来源:统信服务器操作系统 V20白皮书43国产服务器操作系统发展报告(2023 年)ODCC-2023-01009本土化创新孵化,尤其是在基础设施相关的软件应用领域。英特尔将代码贡献给 OpenAnolis 社区,从而让相应的代码和调校尽早接触到用户,OpenAnolis 所拥有的丰富的云上场景也可以帮助英特尔更好地优化硬件及代码。(3)统信软件与英特尔结合的案例分析)统信软件与英特尔结合的案例分析以 OpenAnolis 开源社区为平台,社区内合作伙伴间取长补短,合作也愈加紧密。统信软件与英特尔双方围绕“技术协同”、“生态协同”、“业务协同”三大核心,在技术攻关、产品研发、市场营销、生态建设等方面取得了卓越成果,在桌面端、服务器端、智能终端等方面进行了深度合作。随着国内对信息安全的重视度加深,很多关键民生领域都被要求尽量使用国产系统,对于英特尔来说,与统信软件的合作直接关系到在中国的市场份额,而依托英特尔的极高市占率,统信软件可以进一步适配英特尔处理器,将国产系统推广到教育等民用场景。2022 年 9 月,统信软件与英特尔宣布在北京成立联合实验室,为双方在超能云终端、超融合解决方案、教育产品联合定制、开源社区建设等方面继续提供强劲支撑。44国产服务器操作系统发展报告(2023 年)ODCC-2023-01009四、四、国产服务器操作系统发展建议和展望国产服务器操作系统发展建议和展望(一)(一)发展建议发展建议1开源生态需要政策支持和多路线发展开源生态需要政策支持和多路线发展加大服务器操作系统开源社区建设方面的政策引导,支持多路加大服务器操作系统开源社区建设方面的政策引导,支持多路线发展。线发展。政策支持可以更好的促进中国开源社区健康发展,通过制定开源政策,鼓励企业、研究机构、个人等参与开源社区,充分发挥开源基金会等专业组织牵头引领作用,夯实国内开源的基础建设。当前在市场、技术、生态上,自发形成了龙蜥开源社区和欧拉开源社区齐头并进的发展态势,各自拥有非常明确的商业生态模式,龙蜥开源社区的“继承 创新”路径与欧拉开源社区的“革命 重建”路径,二者互为补充,合力应对 CentOS停服冲击,紧跟技术浪潮的更新迭代,践行服务器操作系统开源生态的多路线发展方向。2技术适配需要以用户需求为基础创新研发技术适配需要以用户需求为基础创新研发加强与企业和行业用户的合作,开展合作项目。加强与企业和行业用户的合作,开展合作项目。通过深度合作,企业能够更好地了解用户对操作系统稳定性、兼容性、安全性等性能的不同侧重点,并基于需求进行系统的设计和开发。其次,通过与用户的沟通和调研,深入分析用户在服务器操作系统使用过程中痛点,及时作出相应的改进和调整。以典型的 CentOS用户迁移问题为例,重点需保证操作系统的兼容性,迁移新的操作系统应具有超45国产服务器操作系统发展报告(2023 年)ODCC-2023-01009强适配性,对 OS 底层变更不敏感的业务,可选择龙蜥操作系统、统信 UOS 等国产操作系统进行原地迁移。3国产化全栈路线需要在实践中不断革新国产化全栈路线需要在实践中不断革新加大投入操作系统开源社区版到商业稳定版本的建设,保障国加大投入操作系统开源社区版到商业稳定版本的建设,保障国产研发供应链的安全。产研发供应链的安全。操作系统作为重要基础设施,其核心技术仍依赖于上游社区基于开源模式的分工与合作,因此需要制定供应链可靠性标准,促进国产技术创新融入上游社区,提升软件自主演进的能力和全栈供应链安全。根据本土市场的需求进行定制化开发,通过实践对技术进行不根据本土市场的需求进行定制化开发,通过实践对技术进行不断改进和创新。断改进和创新。国际软件和技术往往存在一定的本土化障碍,国内企业根据本土市场的需求进行定制化开发,可以提供更加符合本土实际和用户习惯的软件和解决方案。如经历阿里巴巴全集团大量应用实践及多年“双十一”打磨的阿里云服务器操作系统,稳定性远优于 CentOS,而基于阿里云多年技术沉淀衍生的龙蜥操作系统在性能上也更加贴合我国用户的实际需求。4人才培养需要产学研多路线进行人才培养需要产学研多路线进行加强中国本土开源操作系统人才培养。加强中国本土开源操作系统人才培养。校企合作普及开源文化。倡导开源精神,鼓励学生参与开源、贡献开源,撰写开源技术图书,并在社区和高校推广。高校与企业联合培养。高校与企业联合培养。开展服务器操作系统相关的产学研项目,学、练、用、创结合,加快中国本土开源人才46国产服务器操作系统发展报告(2023 年)ODCC-2023-01009培养的规模化进程。加强职业技能培训和培养加强职业技能培训和培养。举办行业大赛,奖金激励优秀的个人开发者、开发团队,可开设相关课程或职业培训班,培养更多的专业人才。建立和完善人才评价体系。建立和完善人才评价体系。通过激励机制和评价标准的建立,能够吸引更多的人才从事服务器操作系统的研发工作,并对其进行认可和奖励,为人才提供更好的成长空间和发展机会。5国内市场拓宽、技术突破、行业落地需要联合创新国内市场拓宽、技术突破、行业落地需要联合创新在市场引领方面在市场引领方面,构建公平竞争的市场环境,鼓励各个服务器操作系统技术供应商加大在技术研发方面的投入,充分考虑云时代用户对服务器操作系统的诉求,进一步拓宽整个服务器操作系统的市场边界;在技术突破方面,在技术突破方面,面对物理服务器、云服务器等不断变化的硬件环境和应用场景,不断探索研发新的技术,如云计算、智能计算等,以满足用户对于高效、灵活和可扩展的服务器操作系统的需求;在行业落地层面,在行业落地层面,鼓励提供适应不同行业和场景的服务器操作系统解决方案,推动服务器操作系统商业版本快速落地。(二)(二)未来展望未来展望1开源服务器操作系统与产业数字化开源服务器操作系统与产业数字化基于开源开放加速数字化转型已成为行业共识,开源应用与行业数字化程度正相关。随着产业数字化的进程,应用场景的高速发展驱动计算架构从通用计算向更加专用的异构计算创新,需要操作47国产服务器操作系统发展报告(2023 年)ODCC-2023-01009系统高效协调不同硬件架构,实现软硬件协同创新。服务器操作系统需要具备更强的扩展性、灵活性以及支持更多的设备和协议,未来我国服务器操作系统必须在技术上进行创新与突破,加速研发顺应未来发展趋势和针对未来用户需求的新产品。在热门融资赛道,如云原生、人工智能、数据技术、物联网、元宇宙等领域,服务器操作系统将进一步与数字化应用相结合,形成稳定的商业化路径。面对云计算、工业控制、智能制造等新技术的普及应用,国产服务器操作系统将不断创新研发以保证长远可持续发展。2开源服务器操作系统与云计算开源服务器操作系统与云计算未来面向云时代的服务器操作系统将成为广大用户的最佳选择,未来面向云时代的服务器操作系统将成为广大用户的最佳选择,这要求服务器操作系统性能上需要实现公共云、混合云、物理机等这要求服务器操作系统性能上需要实现公共云、混合云、物理机等全覆盖。全覆盖。从信息系统计算平台创新的方向来看,云计算平台将成为未来最为主流的计算平台,如芯片厂商英特尔已计划 2023 年实现核心网络虚拟化,在核心网络中引入云功能,并借助云原生最大限度地提高 5G 速度。操作系统是连接应用和硬件的桥梁,在各行各业云计算的融合应用下,未来全面基于云、并面向云做设计研发的开源操作系统将成为主流。短期来看服务器操作系统厂商可能会面临客户整体系统的云化改造,操作系统需要支持云化或容器化部署,支持物理机、虚拟机、容器镜像等不同运行环境。长期来看开源服务器操作系统将持续推动云计算相关技术突破,包括弹性伸缩、虚拟化和容器化支持、自动化管理、安全和隐私保护等方面。龙蜥操48国产服务器操作系统发展报告(2023 年)ODCC-2023-01009作系统也是国内首个在操作系统层面提供全软件栈国密算法的 OS解决方案,并且对内核 SM4算法做了深度优化,性能提升近 800%,真正让中国国密算法从合规走向生产应用。同时,开源社区也是促进云计算技术发展的重要力量,在云计算中,每一层都有对应的开源技术,因此基于开源社区的联合创新,将成为不断优化和改进服务器操作系统性能最高效的途径之一。3开源服务器操作系统与人工智能开源服务器操作系统与人工智能在开源基础上,服务器操作系统与人工智能相互促进。针对即在开源基础上,服务器操作系统与人工智能相互促进。针对即将到来的智算时代,国内开源社区开始布局全面拥抱智算的国产操将到来的智算时代,国内开源社区开始布局全面拥抱智算的国产操作系统。作系统。如 OpenAnolis 社区针对 AI 生态场景做出中长期规划,并在 2023 年 7 月推出 Anolis OS 23,该版本已实现多种 AI 组件、深度学习框架、神经网络框架能力的提供,未来功能将得到进一步拓展。预计在未来操作系统领域结合 AI 技术还会带来更多惊喜,支撑新形态下的应用程序。除了研发兼容主流除了研发兼容主流 AI 框架,支持智算的操作系统,框架,支持智算的操作系统,通过开源促进人工智能的发展和应用已成为智算时代新的发展机遇。通过开源促进人工智能的发展和应用已成为智算时代新的发展机遇。在 AI 模型规模更加庞大、算法架构更为复杂的情况下,开源可以降低研发成本,提高研发效率。通过将已有研发成果汇集于开源代码库中,帮助更多开发者进行技术研发工作的开展,已是人工智能领域的惯例。未来在推荐算法、强化学习、机器人、人工智能等领域,将会有更多人工智能代码库开源,形成了垂直、活跃的交流社区,49国产服务器操作系统发展报告(2023 年)ODCC-2023-01009相应的在 AI 技术支持下,开源操作系统的创新研发也将会变的更高效。50国产服务器操作系统发展报告(2023 年)ODCC-2023-01009致 谢国产服务器操作系统发展报告(2023 年)对国内外服务器操作系统发展情况进行了大量调研和分析,衷心感谢以下业界人士在编写过程中给予的大力支持:马涛(阿里云计算有限公司)、杨继国(英特尔(中国)有限公司)、张磊(统信软件技术有限公司)、张东(浪潮电子信息产业股份有限公司)、刘澎(中国开源软件推进联盟)、陈渝(清华大学计算机科学与技术)、蒋涛(CSDN)、霍太稳(极客邦科技)、王兴宇(Linux中国)。特此致谢。

    浏览量0人已浏览 发布时间2023-11-05 58页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 2023算力租赁行业市场现状、供需格局、产业链情况及优质赛道分析报告(27页).pdf

    2023 年深度行业分析研究报告 1/26 行业研究报告 慧博智能投研 目录 目录 一、行业概况.1 二、市场现状.2 三、供需格局.7 四、AI 算力租赁商业价值.9 五、盈利模型.12 六、市场格. 

    浏览量0人已浏览 发布时间2023-11-03 27页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 中国移动研究院:算网一体及其网络技术问题探索(2023)(17页).pdf

    算网一体及其网络技术问题探索孙滔中国移动研究院2023.10目 录算力网络及算网一体01几个网络问题探索02智算DSN展望032常规内容页标题 微软雅黑 30号字算力网络迎接智算时代我国数据中心规模近五年年均增速达到近30%;截至2023年8月,我国在用标准机架超过760万架,算力总规模达197EFLOPS,位居全球第二(工信部 2023.10 世界5G大会)中国移动对外可用IDC机架47.8万架,累计投产算力服务器超80.4万台,算力规模达到9.4EFlops(半年报2023.8)2022年2月,“东数西算”工程正式全面启动,8个国家算力枢纽节点,规划10个国家数据中心集群算力网络从未来网络的技术名词成为产业发展的旗帜,3端侧算力20ms骨干时延圈枢纽算力省级/区域算力城市边缘算力枢纽算力5m省域时延圈1ms地市时延圈打造“1-5-20ms”三级算力时延圈连续两年财报公布算力规模中国移动呼和浩特智算中心,总能力将达到5.8EFLOPS,万片级AI加速芯片单位/EFLOPS2022年报2023半年报89.4建设亚洲最大单体智算中心哪些“东数”要“西算”?4是否存在一个量化的指标,来指导“东数西算”仍然是待研究的问题数据传输时延不敏感 短视频、电子游戏、网络即时通信等时延敏感应用,异地计算无法保障用户体验。数据交互不频繁西部东部 HPC天气预报等计算过程中不需要频繁交互的应用,可以异地计算。当前,大模型训练往往是同一数据中心内跨框跨机架训练,不会涉及跨数据中心联合训练大模型训练方式大模型训练通信需求 训练过程中的数据同步延迟可能导致整体训练流程停滞 模型规模扩大造成通信量剧烈增长,需提供充足的网络带宽例如,在100Gbps网络下,在16 GPU之间执行128MB AllReduce需要至少消耗5ms;数据量进一步增加,理论传输时间会等比例上升。中电联中国电力行业年度发展报告2023报告显示2022年全国电力传输线损率4.82%量化指标 东数西算协同调度,需要考虑多种因素,如业务需求、时延、成本、能效等。F=A1Delay A2Cost A3Energy .张量并行:将单个数学运算拆分到不同的 GPU 上运行 流水线并行:在不同 GPU 上运行模型的不同层 数据并行:在不同 GPU 上运行不同的 batch data1 Jaeyong Song,Jinkyu Yim,Jaewon Jung,Hongsun Jang,Hyung-Jin Kim,Youngsok Kim,Jinho Lee,2023,Optimus-CC:Efficient Large NLP Model Training with 3D Parallelism Aware Communication Compression,https:/arxiv.org/pdf/2301.09830.pdf端、边、云协同主要包括资源层面和服务层面的协同,不同协同模式在实际应用时均会面临挑战端边云协同是工程领域的难题5协同调度需要获取端、边、云的状态信息,跨域、跨主体信息获取难度大需找到开销和性能提升的平衡点,目标场景仍需明确协同带来了性能提升的同时也引入了额外的开销等,需进一步量化分析开销,寻求性能提升和开销的均衡点需仔细论证现有研究假设,如端侧、边侧资源不足需要协同或云侧提供服务无法满足时延需求等问题在现网中的实际情况,避免“为了协同而协同”,需继续明确协同场景服务协同需要改动已有服务支持服务分解,但服务改动驱动力不足对网络提出了新的需求,网络需增强服务能力同一个服务分散部署在端、边、云不同位置的服务流量特点不同,需提供差异化的网络服务协同拉长了服务提供环节,任一个环节的状态变化都需要网络灵活反应,对网、端、边、云的融合与协同提出新需求,保障服务一致性和稳定性;且有隐私性和安全性问题协同将单个服务分解为多个子服务分散部署,对服务提出新需求缺乏协同对服务性能提升的有效量化机制,服务侧改动现有机制的驱动力不足需均衡考虑协同各参与方的目标诉求,在提升性能的同时均衡各方诉求,以驱动服务协同端、边、云分属不同信息域,信息域内存在不同资源供给主体打破不同信息域的信息边界缺乏需求驱动,缺乏实际机制屏蔽差异性统一获取状态信息如即便在云计算信息域内,存在多家大中型云计算提供商,且信息不互通,难以实现跨资源供给主体的协同调度 算网一体算力网络技术发展的方向趋势:网络和计算需要一体化统筹考虑业务:网络和计算时延需求趋于同一数量级(10Gbps传输时延:20ms50ms网络复杂多样,无法完全无损链路层误码率不可避免大象流负载不均,存在拥塞丢包多流竞争,存在微突发丢包传统TCP协议在广域数据传输中吞吐受限,有效吞吐与链路时延、丢包率成反比TCP网络吞吐=1.22*MSSRTT*Sqrt(L)单流传输时,时延由1ms增加到10ms时,吞吐下降约10倍多流传输使得单流吞吐下降,且受主机CPU性能限制,同样存在吞吐瓶颈科学计算、影视制作,云间灾备等亟需广域超高吞吐传输RFC 3649:HighSpeed TCP for Large Congestion Windows1.如何设计匹配的协议?(2/2)9端网协同的广域高吞吐网络协议体系广域高通量网络云PE云PE 超算中心数据源(私有云/公有云)RoCE协议优化新型拥塞控制快速丢包恢复 智算中心 数据源(存储卡/磁盘)多路径传输贵州到北京数据快递测试贵州FAST北京国家天文台传输距离远:约2200km链路时延长:RTT约45ms链路带宽大:10Gbps网络类型复杂:云专网、传输网、城域网、DC网络长肥管道传统TCP协议单流435MbpsRoCE协议优化单流7.36GbpsRoCE协议优化是传统TCP协议吞吐的16倍数据传输测试结果端侧RoCE协议优化,消除端侧吞吐瓶颈新型拥塞控制算法,提升网络有效利用率丢包快速恢复算法,降低数据重传尾时延端到端多路径传输,实现带宽聚合与均衡4个关键技术,实现广域高效数据传输2.路由转发中如何结合算力信息?(1/3)10在路由系统中引入计算因子,实现网络和计算的联合调度优化算力路由AR/VR 时延需要低于20ms保障用户体验,包括:传感器采样延迟:1.5ms(客户端)显示刷新延迟:7.9毫秒(客户端)GPU的帧渲染计算延迟5.5ms(服务器)网络延迟(预算)=20-1.5-7.9-5.5=5.1ms(网络)观察1:计算延迟和网络延迟在同量级仅根据负载选择边缘站点1,总延迟22.4ms仅根据网络选择边缘站点2,总延迟23.4ms根据两者选择边缘站点3,总延迟19.4ms观察2:仅根据网络或计算资源状态,找不到最佳服务器实例结论:需要同时考虑网络和计算资源状态,将流量动态引导到适当的服务节点问题:在对网络和计算都有高要求的场景中,算网的协同调度仍存在待优化的空间IETF立项文稿:draft-ietf-cats-usecases-requirements1.当前缺乏将计算资源与网络状态相结合以决定最优路径和节点的方案。2.现有的解决方案通常为off-path,如DNS、ALTO或L4/L7负载均衡,查询地址/状态的时延随着协议层的升高而升高!技术路径分析L4 Scheduler L7 Scheduler Upper L7 Scheduler 重定向数据库查询L3 CATS随路调度结论:算力路由将具备更高的性能IETF文稿:draft-draft-yao-cats-gap-analysis2.路由转发中如何结合算力信息?(2/3)算力路由在路由系统引入计算信息,是对传统互联网设计理念的挑战在距离矢量上叠加算力向量,改变了传统选路方法,简单叠加将导致路由不收敛算力信息维度较多,需要定义面向路由的高可用性计算信息,兼顾报文封装成本以及可用性构建算力路由信息表(CA-RIB),考虑距离因子、算力因子以及权重,生成算网cost=w1*网络cost w2*算力cost技术方向:新型算网多因子算路算法提出分域通告、分类通告,约束算力信息更新的范围,减少算力信息的无效通告通过仿真建模量化分析算力信息通告信令开销的影响,得到通告信令开销与路由调度成功率的最优解 技术方向:简单高效的算力信息封装通告频率越高,算力信息越实时,但开销越大,如何找到通告信令开销与信息实时性的平衡点技术方向:自适应的算力通告挑战3:多维路由选址挑战2:算力感知和通告挑战1:算力建模和度量统一量纲,使用与网络和业务相同的度量维度信息,应用于路由调度,例如通过BGP Path Attribution扩展封装计算时延信息112.路由转发中如何结合算力信息?(3/3)12已经完成场景和需求立项,即将推动面向AI大模型的场景写入项目标准 基于CATS的分布式推理 基于CATS AI的内容获取阿里:draft-an-cats-usecase-aiAI-based Media Distribution and Traffic SteeringBBC:ai4me.surrey.ac.uk中国移动在IETF发起成立算力路由工作组(CATS,Computing-Aware Traffic Steering)推动CATS架构立项Ingress CATS-Router:CATS Traffic Classifier(C-TC):区分是否是CATS流量,决定服务节点CATS Path Selector (C-PS):选择网络转发路径Egress CATS-Router:CATS Network Metric Agent(C-NMA):收集和分发网络指标CATS Service Metric Agent(C-SMA):收集和分发服务和计算指标CATS-control center:CATS Computing information Base(C-CIB):维护细粒度的计算信息CATS Network Metric information Base(C-NIB):维护细粒度的网络信息CATS Path Calculation Unit(C-PCE):计算最合适的网络路径和选择服务节点CATS-SBI interface:CATS-control center与CATS-Router的接口https:/datatracker.ietf.org/wg/cats/document/数据中心多节点之间联合推理,基于CATS完成高效地计算和调度任务多边缘计算节点同时提供内容获取服务,基于CATS完成智能化的多媒体内容获取和调度123.如何高效的算?(1/2)13需求:大规模AI计算集群通信瓶颈问题显著手段:引入在网计算实现AI集群计算性能跃升单次聚合时延单次同步时延与传统软件实现特定集合通信操作相比,Infiniband 在网计算SHARP方案性能提升近5-9倍带宽资源占用高数据迁移成本大通信模式不匹配 千亿参数大模型基于MoE并行模式训练,单机单轮次Allreduce流量达数10GB,占用大量带宽资源【1】大模型约37%的运行时间消耗于访存算子【2】,计算节点间存在大量数据搬运进程间多对一、一对多及多对多的通信在计算节点间以单播实现,物理网络存在大量冗余信息考虑基于开放Ethernet设计在网计算架构,优化应用处理逻辑,为系统算效提升带来质变【2】Data Movement Is All You Need:A Case Study on Optimizing Transformers在网计算主要优势压缩流量缩短传输路径优化通信模式【1】DeepSpeed-MoE:Advancing Mixture-of-Experts Inference and Training to Power Next-Generation AI Scale3.如何高效的算?(2/2)14在网计算改变互联网数据传输模式,从“端到端”到“端网端”主机传统网络设备主机数据包转发消息处理在网计算设备数据包转发应用传输层网络层IB、TCP/IP链路层IB Link、Eth应用传输层网络层IB、TCP/IP链路层IB Link、Eth123MessagePacket操作管理内存管理拓扑管理链路状态计算原语4理念转型拓扑感知 在网计算4“端网端”可靠性1消息-报文语义映射2应用-IP一发多收机制3TCP、QUIC等传输层可靠性机制面向点到点设计,难以实现多对一通信可靠性机制进程message传输与网络packet转发需要映射匹配,将影响packet组合、buffer管理以及消息收发速率AI业务中集合通信的一发多收逻辑目前基于点到点IP通信实现,需要进一步与IP组播结合优化复杂网络拓扑结构下,拓扑感知算法需要与在网计算相结合,实现计算任务网内合理分配技术挑战https:/wiki.ietf.org/meeting/118/sidemeetings预告:中国移动将在11月9日,IETF 118次会议组织在网计算研讨会:Title:Collective Communication Optimization(CCO)联系人:目 录算力网络及算网一体01几个网络问题探索02智算DSN展望0315“算网一体”的架构如何设计?16面向核心问题提出架构设计:匹配的协议:需要支持长距离高吞吐传输,打造一体化极致互联的基础。优化的路由:需要支持算网信息的相互感知,打破系统的壁垒,打开互通的可能。高效的计算:需要支持计算任务特征属性的通信模式,制定一体化控制策略。极致互联混合控制联合感知算力信息网络信息前提支撑作用ISP1ISP2CSP4CSP3CSP2CSP1拓扑信息拥塞状态SLA指标CPU利用率异构算力算力规模集中式控制分布式控制任务分解与调配节点1节点2消费侧节点3节点4参考架构ISP:网络服务提供者;CSP:算力服务提供者智算领域定制网络展望数据中心高性能网络展现出智算时代“DSN”的潜质智算DSN的深化及广域发展,引领未来网络走向算网一体算网一体的架构及关键技术仍是Open Problem东数西算,主要处理计算远大于传输类的业务广域高吞吐的协议设计对算和传耗时可比的业务,进行路由和计算资源的联合优化算力路由算力路由、在网计算等关键技术都对传统互联网的设计理念发起了挑战,将引发网络的深刻变革17

    浏览量0人已浏览 发布时间2023-11-01 17页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 腾讯研究院:全真互联-3D在场(2023)(107页).pdf

    腾讯研究院腾讯研究院腾讯多媒体实验室腾讯多媒体实验室序言一序言一01序言一序言一序言一02序言二03序言三04序言四05特别感谢06一、3D互联网用户市场渗透情况07用户规模:广泛渗入生活与办公场景,过半网民曾经有3D体验08用户画像09用户发展的时间线:2020年是突破年轻一代用户关键节点103D场景落地11设备:传统的2D设备仍是主导1267.9v.6.3v.5.1U.1p.7a.7.1p.0s.9d.9a.2a.5.8%使用行为:一旦3D习惯养成即建立内容形式的依赖性13用户价值:从情绪价值(舒缓压力/情感)延展至功能价值(个人整合/认知)14二、3D技术体系和框架15161.1多媒体升维:平面视频围绕分辨率、帧率等指标提升体验171.1多媒体升维:媒体框架是多媒体的核心181.2多媒体升维:3DoF视频定义和媒体框架流程191.2视频拼接、映射算法、传输方案是3DoF视频技术核心20专栏:腾讯多媒体实验室211.3多媒体升维:6DoF视频定义和媒体框架一般流程221.3多媒体升维:采集和三维重建231.4多媒体升维:裸眼3D视频定义和媒体框架一般流程241.4采集、三维重建、渲染和光场显示是裸眼3D视频技术核心251.5多媒体升维:音频技术发展路径261.5多媒体升维:音频技术发展趋势271.5多媒体升维:音频技术发展趋势282.1APP升维:信息的载体从文字-图片-视频向模型不断演进292.1APP升维:渲染是APP升维的核心30312.1模型:三维空间有多种表征方式,隐式表达还在探索中2.1模型:场景文件32332.2APP升维:三维重建实现了对真实世界的还原,AI是未来发展的重要方向342.2APP升维:三维重建实现了对真实世界的还原,AI是未来发展的重要方向352.2APP升维:三维重建实现了对真实世界的还原,AI是未来发展的重要方向36专栏:腾讯多媒体实验室聚焦点云技术实现物体和空间三维重建(1/2)37专栏:腾讯多媒体实验室聚焦点云技术实现物体和空间三维重建(2/2)382.3 多种渲染方式共存,其中云渲染是未来发展重要方向39专栏:腾讯多媒体室业界领先的云游戏音视频引擎(1/3)40专栏:腾讯多媒体室业界领先的云游戏音视频引擎(2/3)41专栏:腾讯多媒体室业界领先的云游戏音视频引擎(3/3)423.交互升维关键技术:更强大和全面的空间感知和计算推动虚实融合43三、产品发展趋势44前端入口:微信小程序成为大多数选择,在2B2C场景优势明显45终端设备:2D硬件设备数量上仍占据主导,3D显示设备是体验最优解46信息载体:模型成为信息的重要载体,对网络和算力提出更高要求47渲染能力:硬件和现代API不断完善,渲染更加高效画面更真实48空间交互:空间计算技术不断完善,多模态交互成为趋势4950内容生成:AI将加速3D内容的生成,规则化建模在数字孪生中可降本增效基于技术自动化生产应用场景:B端聚焦提升效率和体验,其中2B2C场景是重点方向5152产业要素:产业链相对成熟,分工明确53生态合作:云服务厂商提供底层技术能力,推动产业融合发展四、应用案例和解决方案544.1、解决方案和工具平台55腾讯云渲染技术方案56腾讯数字孪生核心能力架构57腾讯一站式数智人平台58微信小程序渐进式高性能XR方案:XR-FRAME59雅基软件打造国产自主 3D 引擎 Cocos60蓝亚盒子打造国产自主可控的智能化3D引擎LayaAir61艾迪普科技推出国产化自研“3D引擎 工具 平台”62视 AR搭建空间计算平台EasyAR Mega634.2、视频升维应用案例64电竞:天美电竞KPL赛事VR直播65工业:裸眼3D 5G远程遥控挖掘机66文化娱乐:兰亭数字公司推出GoNow互动直播娱乐平台67文旅:西顾通过远程实景体验赋能文旅行业68影视动画:VeeR打造影视级精品VR内容、赋能IP6970文娱:WANOS全景声科技制作国内首部全景声有声书,打造多元沉浸感聆听体验4.3、应用升维案例71会议会展:2022腾讯全球数字生态大会-未来会场72智慧城市:深圳市CIM城市规划设计数字化平台73智能建造:重庆市智能建造平台74智慧园区:新加坡南京生态科技岛新纬壹产业园75智慧园区:瑞泰马钢“透明工厂”76交通:惠州市“畅通工程”城市交通实时孪生交管77交通:成都第二绕城高速数字孪生78文旅:云上南头古城79文旅:数字孪生助力故宫智慧管理80文旅:第六届世界智能大会线上虚拟会场81文旅:澳门文化局“时空穿梭,游历三巴”沉浸式数字体验展82文旅:南京文投集团线上南京大报恩寺83文旅:敦煌研究院联合腾讯集团公关部、腾讯游戏内容生态部共同推出“寻境敦煌-数字敦煌沉浸展”84文旅:易现携手新画幅打造胡里山炮台景区夜游项目85文旅:Multispace多元空间打造长征等红旅谷数字体验空间8687文保:中国国家版本馆与腾讯NExT Studios 33天联合打造数字员工“文涵”文保:“数字长城”创新塑造数字文保标杆案例,生动展现游戏技术正向价值88金融:数字金融生态空间89传媒:腾讯云智能数智人企业服务90汽车:一汽-大众线上云展厅91企业直播:保利威数字空间虚拟直播92教育-粤港澳大湾区海洋数字孪生93教育:tatame 提供全真解决方案94医疗:北理工、鹏城实验室与北京协和医院合作开展VR辅助诊断与干预研究95营销:腾讯时尚虚拟偶像星瞳,优质技术力与表现效果助力品牌营销推广升级96生动的表情捕捉高精度场景及动态特效流畅的单人/多人实时驱动虚实互动的自然融合DMX动态打光及Groom毛发解算营销:广州超次元重塑数字营销场景97营销:迈吉客科技构建企业级全域全时段全场景智能互动服务,助力内容体验升维98营销:有大科技公司为品牌打造一体化营销虚拟空间99营销:VSwork打造用户共营共建平台VSVR赋能企业营销100文化传媒:四川日报通过世优虫洞3D演播系统,开展世界杯赛事虚拟直播101附录:调研数据说明102103研究顾问104研究团队105我们坚守开放我们坚守开放、包容包容、前瞻的研究视野前瞻的研究视野,致力于成为现代科技与社会人文交叉汇聚的研究平台致力于成为现代科技与社会人文交叉汇聚的研究平台106

    浏览量0人已浏览 发布时间2023-10-25 107页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
514条  共26
前往
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部