《ODCC:2023年112G LPO光模块应用白皮书(46页).pdf》由会员分享,可在线阅读,更多相关《ODCC:2023年112G LPO光模块应用白皮书(46页).pdf(46页珍藏版)》请在三个皮匠报告上搜索。
1、1112G LPO 光模块应用白皮书ODCC-2023-03008编号 ODCC-G LPO 光模块应用白皮书开放数据中心委员会2023-09 发布1112G LPO 光模块应用白皮书ODCC-2023-03008版权声明版权声明ODCC(开放数据中心委员会)发布的各项成果,受著作权法保护,编制单位共同享有著作权。转载、摘编或利用其它方式使用 ODCC 成果中的文字或者观点的,应注明来源:“开放数据中心委员会 ODCC”。对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC 及有关单位将追究其法律责任,感谢各单位的配合与支持
2、。2112G LPO 光模块应用白皮书ODCC-2023-03008编写组编写组项目经理:项目经理:张少辉腾讯科技工作组长:工作组长:王超阿里云计算有限公司贡献专家:贡献专家:杨光腾讯科技孙敏腾讯科技张桢新华三技术有限公司孙安兵锐捷网络张桢新华三集团高万超光迅科技股份有限公司张涛光迅科技股份有限公司3112G LPO 光模块应用白皮书ODCC-2023-03008前前 言言数据中心网络设备升级到 112Gbps 每通道,传统可插拔光模块扩展到 16 通道的 OSFP-XD,光模块在整机功耗的占比越来越高,大大增加了云服务提供商的持续运营成本!针对此痛点,产业链提出了 LPO、CPO、NPO、O
3、BO 等多种先进技术期望降低整机功耗。LPO 已经经过实际验证,技术上具有可行性,和 CPO/NPO/OBO 最大的不同是保留了传统 re-timer 光模块的可插拔特性,且维护了产业链现有生态,通过去除 oDSP 实现低功耗、低册亨吧、低时延的特性,成为国内外头部科技公司的重点关注对象。ODCC 网络工作组 2022 年发布112G 高速互连白皮书。为物理层电链接提供了有力规范支撑。112G 线性互联 2.0 聚焦目前热门的 LPO(Linear-drive Pluggable Optics)进行研究,期望为目前LPO 应用所面临的各种挑战进行技术拆解和解决,和行业一起推动LPO 的商业部署
4、。4112G LPO 光模块应用白皮书ODCC-2023-03008目目 录录版权声明.1编写组.2前言.3一、背景介绍.6二、112G LPO 线性直驱可插拔模块技术.7(一)LPO 技术介绍.7(二)LPO 技术收益.8(三)LPO 接口类型.10(四)LPO 设计.10三、112G LPO 技术挑战.15(一)LPO 接口标准挑战.15(二)112G LPO 商用落地挑战.17四、卷积调优可行性分析.19(一)理想信道.19(二)信道补偿计算原理.20(三)信道补偿计算验证.22(四)总结.26五、LPO 光模块特性分析.26(一)LPO 具有线性特性.26(二)LPO 可以通过卷积进行
5、单次性能调优.28六、网络设备端口 SI 特性分析.30(一)端口 SI 设计挑战.305112G LPO 光模块应用白皮书ODCC-2023-03008(二)端口 SI 链路具有差异性.32(三)端口差异性影响 LPO 应用.33(四)端口 SI 差异性优化方案.34(五)端口 SI 设计建议.36七、利用卷积实现 LPO 系统在线调优.37(一)端口 SI 设计挑战.38(二)LPO 在线调优方案.39(三)收益说明.43八、LPO 在线调优的关键技术.43(一)设备 PHY 芯片均衡技术.44(二)LPO 模块的线性调校技术.44(三)带外通信机制/设备间协商机制.446112G LPO
6、 光模块应用白皮书ODCC- 112G12G LPOLPO 应用应用白皮书白皮书一、一、背景介绍背景介绍随着云服务的普及,以及 AI 人工智能、ML 机器学习和 HPC 高性能计算的大规模部署,推动云服务提供商不断进行网络带宽的升级,SERDES 速率升级到 112Gbps 每通道,传统可插拔光模块的带宽更是达到 1.6Tbps。近期生成式 AI 的火爆也推动大型科技企业加速大规模训练、推理网络基础设施部署,高速光模块迎来高速增长期。图 1 光模块、交换机速率演进数据中心网络设备升级到 112Gbps 每通道,传统可插拔光模块扩展到 16 通道的 OSFP-XD,光模块在
7、整机功耗的占比越来越高,大大增加了云服务提供商的持续运营成本!针对此痛点,产业链提出了 LPO、CPO、NPO、OBO 等多种先进技术期望降低整机功耗。LPO 已经经过实际验证,技术上具有可行性,和 CPO/NPO/OBO 最大的不同是保留了传统 re-timer 光模块的可插拔特性,且维护了产业链现有生态,通过去除 oDSP 实现低功耗、低册亨吧、低时延的特性,成为7112G LPO 光模块应用白皮书ODCC-2023-03008国内外头部科技公司的重点关注对象。本文将围绕 LPO 商用提出相应的解决方案,期望为 LPO 商用落地提供强有力的支撑。二、二、112G112G L LPOPO 线
8、性直驱可插拔模块技术线性直驱可插拔模块技术线性直驱可插拔光模块(Liner-drive pluggable Opcics,LPO)通过去除 oDSP 实现功耗、成本、时延三重收益,同时保留了可传统光模块可插拔的特性和产业链,技术上具有一定的可实现性,应用前景也非常可观。(一)(一)L LPOPO 技术介绍技术介绍目前业界主流的 PAM4 高速光模块基本都是采用传统的 re-timer 方案,在模块内部实现电信号再生、利用 oDSP 实现数字信号补偿技术如色散补偿技术、非线性补偿技术、去除噪声技术等,这种设计可以获取更好的系统性能,获取更低电误码率,为网络信号的传输提供了强大的支撑。传统的 re
9、-timer 方案虽然具有近乎完美的性能优势,但是随着端口带宽的不断升级,传统 re-timer 方案成本越来越高、功耗越来越高,为了应对这些挑战,业界提出了 LPO 线性直驱可插拔光模块技术。该在 2023 OFC 大会上大放异彩,受到行业尤其是国内外头部科技企业的重点关注。LPO 模块的设计框图如下,和传统的 re-timer 模块方案对比,主要是:1)去除 CDR/oDSP 等 re-timer 组件;2)使用性能更优、SI 补偿能力更强的的 DRV/TIA 电芯片;3)将部分补偿功能集成到8112G LPO 光模块应用白皮书ODCC-2023-03008网络设备 ASIC 芯片;4)原
10、来由 oDSP 实现的信号再生、数字信号补偿功能,变成通过网络设备 ASIC 芯片、DRV 和 TIA 进行分段补偿。图 2 LPO 应用框图综上所述,LPO 线性直驱可插拔光模块通过去除传统的 re-timer 芯片如 CDR、oDSP,实现低延迟、低成本和低功耗的特性。LPO 的低延迟特性非常在 ML 机器学习和 HPC 高性能计算这些对传输时延比较敏感的网络。(二)(二)LPOLPO 技术收益技术收益如上文所述,LPO 通过去除 re-timer 芯片实现低成本、低功耗、低时延的特性,驱动终端用户的最大动力主要是低成本和低功耗两大特性,前者可以降低终端用户的物料采购成本,后者可以降低终端
11、用户的持续运营成本。传统的 re-timer 方案可插拔光模块,如 oDSP 成本在单模模块占比大概在 25%左右,在多模模块中成本占比会更高。目前北美已经商用部署 800G 光模块,800G oDSP 芯片采购价格可能高达几十美9112G LPO 光模块应用白皮书ODCC-2023-03008金。LPO 方案通过去除 oDSP,即使高性能的 Driver 和 TIA 相比传统的 Driver 和 TIA 成本有上涨,但是业界普遍预计也可以获取相当的成本收益。图 3 LPO 成本收益随着交换芯片交换容量的提升,交换机的端口越来越多,传统re-timer 方案应用场景密度大、功耗高,使得交换机散
12、热设计挑战也越来越大。和传统 re-timer 方案相比,LPO 的功耗优势不仅体现在个体功耗下降,也体现在网络设备整体功耗下降,数据中心规模越大,收益越明显。图 4 LPO 功耗收益10112G LPO 光模块应用白皮书ODCC-2023-03008(三)(三)L LPOPO 接口类型接口类型LPO 作为一种热点技术,对模块本体的封装没有要求,不管是QSFP,还是 QSFP-DD,亦或是 OSFP、OSFP XD 等均可以实现 LPO 方案。软件接口协议亦遵循传统 DSP 可插拔光模块软件接口协议,保留最大的继承性和兼容性,降低模块侧和应用侧设备重复开发成本。表 1 接口行业标准规范参考表T
13、ypeMechanicalLow Speed&GeneralElectricalManagementInterfaceModuleConnectorCage(SinglePort)Cage(GangedPort)QSFP112QSFP112 MSA SpecificationCMIS 4.0QSFP-DD112QSFP-DD MSA SpecificationCMIS 4.0OSFP112OSFP MSA SpecificationCMIS 4.0SFP112SFP-DD MSA SpecificationCMIS 4.0SFP-DD112SFP-DD MSA SpecificationCMI
14、S 4.0DSFP/NGSFP112 TBDCMIS 4.0(四)(四)L LPOPO 设计设计全新的解决方案以现有产品族群的设计要求为牵引,在结合现有结构特点做升级演进,提升速率的同时,也保证了对管理接口和Pin 定义的延续。1 1L LPOPO 结构设计结构设计根据实际运用环境的不同,OSFP,QSFP-DD 产品又衍生出多种形态。多形态的设计均是基于对模块本身散热需求的考量,鉴于LPO 的功率较低,同时考虑到产品形态的归一化对产品和市场发展11112G LPO 光模块应用白皮书ODCC-2023-03008的健康促进,一般将 QSFP112、QSFP-DD Type1 和 OSFP Op
15、en Top作为 LPO 的首选型号(如下以 QSFP112G 为例)。表 2 QSFP112 尺寸参考接口类型接口类型接口形态接口形态接口规范接口规范QSFP112QSFP112Specification-Rev2.1.112112G LPO 光模块应用白皮书ODCC- 2L LPOPO 接口电路设计接口电路设计LPO 作为一种热点技术,对模块本体的封装没有要求,不管是QSFP,还是 QSFP-DD,亦或是 OSFP、OSFP XD 等均可以实现 LPO 方案。软硬件亦遵循传统 DSP 可插拔光模块的软硬件接口协议,保留最大的继承性和兼容性,降低模块侧和应用侧设备重复开
16、发成本。图 5 QSFP112 Pin 定义(例)图 6 example QSFP112 Host Board Schematic for Passive Copper Cables13112G LPO 光模块应用白皮书ODCC- 31 112G12G LPOLPO 管理界面标准管理界面标准LPO 作为一种热点技术,对模块本体的封装没有要求,不管是QSFP,还是 QSFP-DD,亦或是 OSFP、OSFP XD 等均可以实现 LPO 方案。软硬件亦遵循传统 DSP 可插拔光模块的软硬件接口协议,保留最大的继承性和兼容性,降低模块侧和应用侧设备重复开发成本。表 3 EEPR
17、OM Map 参考规范TypeManagement InterfaceQSFP112SFF-8636,SFF-8024 or CMIS 4.0or CMIS 5.0QSFP-DD112CMIS 4.0 or CMIS 5.0OSFP112CMIS 4.0 or CMIS 5.0SFP-DD/SFP112CMIS 4.0 or CMIS 5.0DSFP(NGSFP)CMIS 4.0 or CMIS 5.04 4Q QSFP112SFP112 EEPROMEEPROM M Ma ap p表 4 QSFP EEPROM MAP注:QSFP112G PAM4 特别标注位14112G LPO 光模块应用
18、白皮书ODCC-2023-03008表 5注:以 上 内 容 参 考 SFF-8636 Management Interface for CabledEnvironments Rev 2.9图 7 CMIS Module Memory Map表 6表 715112G LPO 光模块应用白皮书ODCC-2023-03008注:以上内容参考Common Management Interface Specification Rev 4.0三、三、112G112G LPOLPO 技术挑战技术挑战112G LPO 快速发展,截止目前已有较为丰富的验证数据说明其技术可行性,以及功耗、时延等预期收益可达成,
19、但要使该技术方案达到可商用产品化的状态,仍有不少挑战需要克服。(一)(一)L LPOPO 接口标准挑战接口标准挑战LPO 作为可插拔光模块短距解决方案的一种,主要应用场景在DCI,因此“互联互通”也是其必须支持的特性。要实现“互联互通”,则需要对其两个接口电接口、光接口进行一定规范。1 1L LPOPO 电接口标准挑战电接口标准挑战在 Egress 方向,由于 LPO 内部没有 CDR 或 DSP 对主机设备传输过来的电信号进行 3R 再生,光模块输入的电信号质量与输出光信号质量具有强相关性,因此 TP1A 电信号质量至关重要。16112G LPO 光模块应用白皮书ODCC-2023-0300
20、8在 Ingress 方向,虽然在设备端芯片 SERDES 有比较强的均衡和补偿能力,但基于系统误码要求对信号信噪比有一定要求,光模块的输出信号需要较大的幅度且具备一定的预加重能力目前对 LPO 电接口指标进行定义的,主要是 OIF 的 CEI-112G-Linear-PAM4。该协议从 LPO 技术研究早期,采用延续于 VSR 标准的VEO/VEC 指标,演进到目前采用与 TP2 接近的 TECQ 指标,以期对TP1/TP1A 电眼图质量进行约束。虽然 TECQ 指标相对于 VEO/VEC 来说更有利于判断电眼图质量,也更有利于与 TP2 光眼图指标实现关联,但目前为止 CEI-112G-L
21、inear-PAM4 协议仍是属于草稿状态,也就意味着对 LPO 电接口并未有一个正式的指标约束。因此对于设备厂家和 LPO 光模块厂家来说,在没有明确电接口标准前提下,如何实现多方兼容是一个难题。2 2L LPOPO 光接口标准挑战光接口标准挑战光接口标准方面,IEEE 802.3 系列协议是成熟通用的标准,Retime 类可插拔光模块均需符合该协议。LPO 系统作为短距应用的一个全新解决方案,如果可以做到符合 802.3 协议,则可以实现最大意义上的“互联互通”。从 LPO 目前系统测试的结果而言,采用硅光方案的 DR4 可符合IEEE 802.3 中与 DR 相关的指标定义。Vcsel
22、方案虽然在常温可以获得较好的 TDECQ 指标,但考虑高温及工程应用所需的裕量,满足SR 相关的指标定义会有较大的风险。因此对于 SR/Vcsel 方案而言,17112G LPO 光模块应用白皮书ODCC-2023-03008如何实现 TP2 眼图指标符合 802.3 协议,将是一个系统级的挑战,可考虑的措施包括但不限于:1、增强主芯片 TX 补偿算法能力;2、优化 Vcsel 芯片温度相关特性;3、温度相关动态补偿方案。(二)(二)1 112G12G LPOLPO 商用落地挑战商用落地挑战1 1网络设备端口一致性挑战网络设备端口一致性挑战在 传 统 的 网 络 设 备 中,主 芯片 SERD
23、ES 和 光 模 块 内 部 的SERDES/CDR 构成的电信号传输系统,发送 SERDES 只需做轻量级的信号均衡,链路损耗、反射、串扰等影响信号完整性的因素,完全由处理能力较强的接收 SERDES/CDR 进行吸收。所以,在这种系统下,网络设备的发送 SERDES 通常只需要少量的几套甚至是一套参数,就可以适配设备上所有的光模块端口。但在 LPO 系统中,光模块内部不存在电信号再生单元,TP1A 电信号质量与 TP2 光信号质量直接相关。LPO 系统要实现规模商用,以下几点需要重点关注:1)网络设备中不同光模块通道的信道特性差异很大,难以用少量的几套参数来覆盖上百个光模块通道,并且在没有
24、光模块参与的前提下,如何标定设备通道的补偿系数,需要投入大量的研究验证工作;2)设备内部无源链路中的反射特性一般都会超出发送 SERDES 的补偿能力,因此如何做好无源链路的信号完整性设计,有效控制反射信号影响,对提升 LPO 系统的性能裕量有很大作用;3)LPO 光模块使用的 DRV CTLE 具有一定的调节范围,如何利用 CTLE 可调的功能与 SERDES 补偿系数搭配,实现系统性能最佳,是一个值得研究的课题;18112G LPO 光模块应用白皮书ODCC-)OIF 对 linear 电接口的标准定义尚未基线,也在一定程度上影响了网络设备对发送 SERDES 的参数
25、标定策略和方法。需要根据设备的实际测试情况,推动 OIF linear 接口协议落地;5)LPO 光模块与设备接口插拔存在一定差异性,可能影响系统模块的性能。2 2模块间互联互通挑战模块间互联互通挑战LPO 光模块互联互通,存在以下的几种组合场景可能:组合组合TXTXRXRX同一设备同一设备不同设备不同设备1LPOLPOOK?2LPORetimed?3RetimedLPOOKOK在组合 1 中,同一厂家光模块在同一设备上对接,目前的验证结果是 OK 的。而不同设备之间,尤其是不同厂家的设备/ASIC 之间对接,目前还没有相关的验证数据。但在可预见的将来,随着投入LPO 生态的 ASIC 芯片厂
26、家增加,这方面验证结果会逐步充实,也意味着后续进入 LPO 系统领域的系统/芯片厂家,需要具备更好兼容性。组合 2 中,由于 LPO TP2 的指标未能确定是否完全符合 802.3标准,所以与现有 Retimed 光模块对接的能力存疑。虽然业界已有初步的验证结果,但始终覆盖的 Retimed 模块种类有限,未能给出绝对性结论。而组合 3,光模块 TP2 的光眼图及性能仅跟 CDR/DSP 芯片相关,因此也就不存在设备兼容性的问题。综上所述,LPO 光模块互联互通,其实还包括了网络设备以及ASIC 芯片间的互联互通,而可以对互联互通能力做出有效判断的,19112G LPO 光模块应用白皮书ODC
27、C-2023-03008目前来看还是需要依靠 IEEE 802.3 系列协议,这样有利于 LPO 系统的解耦设计和分析验证。四、四、卷积调优可行性分析卷积调优可行性分析(一)(一)理想信道理想信道理想信道被视为 LTI(Linear and Time-Invariant system),具有线性、时不变和叠加特性。线性特性:线性系统是指系统输出和输入位线性映射关系。输入为()?,输出为()?时不变特性:时不变系统是指输入信号延迟,则输出存在相同的延迟。输入为()?,输出为()?图 8 LTI 系统输入时域表征:=?,频域表征:=?20112G LPO 光模块应用白皮书ODCC-2023-030
28、08输出时域表征:=?,频域表征:Y =?输入拉普拉斯表征:=?冲击响应拉普拉斯表征:=?输出拉普拉斯表征:=是 =?的拉普拉斯变换,分别是输出对频域和时域表征,频域相乘等于时域卷积,所以在信道补偿时,可以在频域进行简化分析,在时域进行补偿计算。(二)(二)信道补偿计算原理信道补偿计算原理以 112Gbps 信道为例,其信道模型见 Figure 4,为原始发送信号,1 为预加重传输函数2,为信道传输函数,3 为均衡器传输函数,为最终接收信号,若1 2 3=1,则 =(),信号被完美恢复!图 9 信道系统模型首先,Keysight 高端示波器支持多达几十个 tap 的线性均衡器,所以可以利用示波
29、器强大的均衡算法,不断增加抽头系数,直到获21112G LPO 光模块应用白皮书ODCC-2023-03008取符合 OIF 或 IEEE 协议的信号,同时记录此时示波器均衡器传输函数3。图 10 利用示波器替代接收均衡器补偿信道示意图其次,将预加重传输函数1 和示波器均衡器传输3 相乘作为新的预加重传输函数1 写入发送端,则均衡器输出信号 前移到信道输出端,不仅符合 OIF 或 IEEE 电接口协议,还降低了发送端和不同接收端适配的性能风险,信道补偿精度仅取决于加重和均衡器抽头数。图 11 均衡器前移示意图最后,如何保证上述方法获取的信道补偿参数是最优的?我们假定3 是有无限抽头系数的均衡器
30、传输函数,且进行自动均衡调节,不 管 如 何 改 变 1,3 都 会 进 行 自 动 调 整 使 得1 2 3=1,所以只要信道传输函数2 不变,就可以一次把信道补偿到位,我们需要做的就是把3 和1 在时域进行卷积获取最优的 emphasis 系数!22112G LPO 光模块应用白皮书ODCC-2023-03008(三)(三)信道补偿计算验证信道补偿计算验证1 1纯电信道补偿计算验证纯电信道补偿计算验证在实验室搭建 Figure 7 测试环境进行验证,其中 EXFO 400GBert 是信号源,产生 56Gbps PAM4 差分电信号,功分器将信号一分为二,一路进 CDR 进行时钟恢复,为示
31、波器提供触发时钟,一路进示波器进行均衡调节和信号质量测试。图 12 实验室搭建测试环境第一步,设置 EXFO 400G Bert 输出差分信号幅度为 1000mVpp,bypass Bert 加重模块即 H_1(s)=1,示波器均衡器设置为 5tap 自动均衡,测试眼图和均衡系数见 Figure 8,均衡后的眼图质量明显优 于 均 衡 前 也 就 是 信 道 输 出 的 眼 图,均 衡 器 5tap 系 数 为0.001168,-0.051618,1.24567,-0.168354,-0.026866。23112G LPO 光模块应用白皮书ODCC-2023-03008图 13 bypass
32、加重模块测试结果第二步,将均衡器5tap系数0.001168,-0.051618,1.24567,-0.168354,-0.026866和Bert加重模块3tap系数0,1,0进行卷积,结果为0,0.001168,-0.051618,1.24567,-0.168354,-0.026866,0,因为Bert只支持3tap调节,所以卷积结果仅取其中主要的3tap-0.051618,1.24567,-0.168354即可。第三步需要将卷积结果进行归一化处理,不管是加重还是均衡,处理的原则是所有的tap值绝对值之和为1,且主幅度不超过1。归一化 后 的 3tap 系 数 为-0.051618,1.24
33、567,-0.168354/(abs(-0.051618)+abs(1.24567)+abs(0.168354)=-0.0345577,0.834,-0.113,作为Bert加重系数写入即可完成信道补偿。但是EXFO Bert并不支持main tap调节,仅支持pre/postcursor调节,pre/post cursor调节的是相对于main tap的百分比,故 还 需 要 做 一 次 转 换,转 换 后 的 pre/postcursor 为-0.0345577/0.834=-0.4143794,-0.113/0.834=-0.135,我们可以设置Bert pre/post cursor为
34、-0.04,-0.14,测试眼图和设置预加重24112G LPO 光模块应用白皮书ODCC-2023-03008系数见图Figure 9,可以看到信道输出眼图获得很大提升,基本比拟示波器均衡后的眼图。图 14 卷积补偿后的眼图和预加重系数此 时 我 们 再 来 看 下 示 波 器 均 衡 器 的 5tap 系 数 为0.002485,0.001385,1.015888,0.01862,-0.02162,基本是主tap接近1,其他pre/post cursor均接近0,也就是2()趋近于1,信号基本不需要均衡,做到了均衡器前移。图 15 卷积补偿后示波器 5tap 均衡系数我们可以将Bert输出
35、幅度设置为900mVpp进行验证,获得的效果是一样的。25112G LPO 光模块应用白皮书ODCC-2023-03008图 16 Bert 输出幅度降低到 900mVpp,卷积补偿前后对比2 2含光电器件信道补偿验证含光电器件信道补偿验证200G SR4 光模块信道模型见 Figure 12,()为 DSP DAC 输出原始信号,1()为 DSP emphasis 传输函数,2()为加重输出到VECSEL 激光器输出链路传输函数,()为输出光眼图信号,信道内各器件均为线性器件,支持 56Gbps PAM4 信号传输。图 17 200G SR4 光模块 TX 信道模型按本文方法卷积获得新的 e
36、mphasis 系数进行信道补偿,可以获得相似的效果,即只要链路是线性器件组成的线性信道,无论是否包含光电转换器件,都可以使用此方法进行信道补偿。26112G LPO 光模块应用白皮书ODCC-2023-03008图 18 含光电转换信道补偿效果(四)(四)总结总结从频域的角度进行分析,通过时域单次卷积计算,可以获得最优的通道补偿参数。这种方法不仅可以用在网络设备端口纯电链路SI 调优,也可以用在具有线性特性的光模块光电链路 SI 调优。五、五、L LPOPO 光模块特性分析光模块特性分析(一)(一)L LPOPO 具有线性特性具有线性特性LPO 光模块去除 ODSP 后,内部关键功能组件主要
37、包括光、电芯片等模拟器件,这些模拟器件为实现 PAM4 调制与传输,通常工作在线性区间且有明确的线性度要求。其中,模拟电芯片线性度以 THD描述,LPO 中使用的 DRV、TIA 都有非常良好的 THD 特性,确保信号无失真放大。27112G LPO 光模块应用白皮书ODCC-2023-03008图 19 LPO 模块构成框图LPO 中主流潜在使用的光芯片主要有 VCSEL、EML、MZ 三种,其电光响应曲线在选取合适工作点的条件下均满足线性调制的要求,如下所示。VCSELEMLSiP MZM图 20 LPO 典型光芯片线性度对于 LPO 光模块中使用的模拟电芯片,主要包括 DRV 和 TIA
38、,其 THD 典型测试结果如下所示,PAM4 应用下线性度满足要求。DRVTIA图 21 LPO 模拟电芯片线性度28112G LPO 光模块应用白皮书ODCC-2023-03008(二)(二)LPOLPO 可以通过卷积进行单次性能调优可以通过卷积进行单次性能调优1 1理论分析理论分析考虑到 LPO 光模块均有高度线性度,该系统在符合特定条件下,可看作为线性时不变(LTI)系统,该系统由网络设备主芯片SERDES、无源链路、LPO 光模块共同构成。如前述分析,该系统关键链路组件均具有线性特性,视为线性时不变(LTI)系统,可以按照第四章描述的卷积调优方法进行调优。利用仪表线性均衡器获取的 FF
39、E 均衡系数,通过卷积获取新的TX SERDES 的 TX EQ 系数,可以实现 LPO 光模块 TP2 光眼图的调优。TX SERDES 卷积获取的最优参数为:=图 22 LPO 光模块 TP2 测试系统利用网络设备 ASIC 芯片 RX SERDES 的自适应 FFE 均衡器均衡系数,通过卷积获取新的 TX SERDES 的 TX EQ 系数,可以实现 TXSERDES 和 RX SERDES 之间整个链路调优。29112G LPO 光模块应用白皮书ODCC-2023-03008TX SERDES 卷积获取的最优参数为:=图 23 LPO 传输链路系统2 2验证效果验证效果基于以上理论分析
40、和卷积调优可行性分析的结论,以 LPO 光模块 TP2 眼图调优为例进行实际验证,可以发现通过单次卷积即可获得最优的眼图和误码率。测试条件:LPO DR4,test bench passive loss=11dB,数据SSPRQ;调优前:TDECQ=3.85dB,ER=3.4dB,BER floor=1E-6图 24 调优前眼图30112G LPO 光模块应用白皮书ODCC-2023-03008调优后:TDECQ=2.34dB,ER=2.8dB,BER floor=1E-8图 25 调优后眼图从测试结果看,卷积调优方法可以很好的满足 LPO 系统的性能需求,是一种可落地的调测方案,为 LPO
41、最终的商业落地提供的有力支撑。六、六、网络设备端口网络设备端口 S SI I 特性分析特性分析(一)(一)端口端口 S SI I 设计挑战设计挑战1 1端口端口 I IL L 设计挑战设计挑战理论仿真的结果显示 via 的损耗可以控制在 0.3dB26.56GHz,但实际上受 stub 和等效 Dk 值的影响,via IL 不易控;跨板链路中,PCB 上的跨板 via IL 不易控;26.56GHz 的频点要求,工艺上,焊点/接触点的 IL 也不易控。当金手指接触点阻抗控制较好时,IL 在 1526.56GHz 一致性较好。以下面链路仿真结果为例,从下左图看,该链路阻抗控制较好,31112G
42、LPO 光模块应用白皮书ODCC-2023-03008无明显低点,对应下面右图的测试结果,链路 IL 一致性结果较好,链路 IL 变化平缓,没有明显的波动。图 26 阻抗管控加严端口链路 SI 仿真相对的,当金手指接触点阻抗控制较差时,IL 在 1526.56GHz出现很大的波动,一致性较差。图 27 常规阻抗管控端口链路 SI 仿真基于以上的分析看,整个端口 SI 链路的 IL 实际设计值存在一定的波动,在 LPO 应用的场景下,IL 的波动会影响链路的传输质量。2 2端口端口 R RL L 设计挑战设计挑战相比 IL 的设计挑战,端口 RL 的控制同样比较困难。为控制BGA via 之间的
43、高速串扰,需增加较多的 GND via 以及紧耦合设计,32112G LPO 光模块应用白皮书ODCC-2023-03008势必会导致阻抗较低,即使 antipad 挖大,阻抗的匹配难度也会增大,RL 的一致性控制难度增大。跨板链路中,跨板 conn 因正向力以及可靠性的限制,端子阻抗必然存在波动,也增加了 via RL 的一致性难度增大。若两种混压板材的 Dk 值相差较大,via 的阻抗匹配难度加大,RL 的一致性难度增大。不同走线层的 via 有不同的 antipad 设计,其实际加工后的等效 Dk 不可控,RL 的一致性难度增大;图 28 串扰设计和优化(二)(二)端口端口 S SI I
44、 链路具有差异性链路具有差异性112G 设备的光端口高速通道设计,可能会出现的设计形态:1)板内的 PCB 传输线;2)经过扣板连接器的 PCB 传输线;3)PCB 传输线+cable 线缆。33112G LPO 光模块应用白皮书ODCC-2023-03008图 29 高速通道设计形态端口 SI 差异性还括芯片散出,扣板连接器和 IO 连接器等位置的复杂设计,造成全通道的 SI 性能差异性。如 channel 的损耗范围可能分布在 4Db12dB 的范围,回损性能受各种过孔,扣板连接器或cable 连接器的影响,分布在-10dB-15dB 的范围,串扰性能也受到扣板连接器,BGA 焊球间距等因
45、素影响,分布在-45dB-70dB 的范围区间,PCB 传输线的阻抗控制精度由于加工能力和成本的限制,保持在+-8%水平。基于上述分析,光端口的高速 SI 性能具有较大的范围区间内波动的特点,无法实现完全的一致性。(三)(三)端口差异性影响端口差异性影响 L LPOPO 应用应用LPO 光模块关键配置如 Driver 驱动器和 TIA 的均衡保持不变,适配交换机不同的端口进行误码率测试,会发现 LPO 存在较大的误码率波动。在 MAC 板或交换板的不同 IL 端口测试,LPO 的误码率存在波动,具体表现为在高 IL 和低 IL 端口测试的 LPO 模块误码率比34112G LPO 光模块应用白
46、皮书ODCC-2023-03008在中 IL 的误码率要差一个量级左右,在端口板或 up/bottom 板端口测试的 LPO 模块误码率比在 MAC 板测试的 LPO 模块误码率要差两个量级左右。图 20 端口 SI 对 LPO 模块性能影响验证结果由以上分析可见,网络设备端口的 IL 影响 LPO 模块的传输误码率,RL 的影响更大!(四)(四)端口端口 S SI I 差异性优化方案差异性优化方案端口 SI 优化建议主要包括:1)提升板材损耗,如用 M8U 代替 M8N;2)用 cable 方案代替跨板方案,利用 cable 损耗优势代替pcb 走线损耗;3)叠层优化:介质厚度优化为 Cor
47、e 6mil/PP 6mil 后,损耗可提升约 5%至 0.68+/-0.04dB26.56GHz;35112G LPO 光模块应用白皮书ODCC-2023-03008图 31 叠层优化效果对比4)仿真 via 阻抗控制在+/-5ohm;RL 控制在 15dB 以下;5)若用混压,建议板材 Dk 控制在+/-0.5 范围内;如下图所示,绿色为 M8N+M7GN 混压板材,红色为 M8N+FR4 混压,可以看出用 M8N+M7GN 混压时,BGA 浅孔阻抗更易匹配,IL/RL 一致性变现更佳;图 32 M8N+M7GN 和 M8N+FR4 混压板材 SI 仿真对比M8N+M7GN 混压和 M8N
48、+FR4 混压的阻抗实测对比也会发现前者的阻抗一致性表现更佳。36112G LPO 光模块应用白皮书ODCC-2023-03008图 33 M8N+M7GN 和 M8N+FR4 混压板材 TDR 实测对比Bottom/up 板链路,跨板 conn 以及 neck 走线的阻抗不匹配,导致 IL/RL 一致性和 mac 板存在差异性,从下图中可以看到,Bottom/up 板链路在经过 conn 时,阻抗存在变化,链路阻抗不如MAC 板上链路平缓。图 34 MAC 板和端口板 TDR 实测对比(五)(五)端口端口 S SI I 设计建议设计建议LPO 应用场景下的高速 SI 设计,在 linear
49、标准基础上增加最低损耗的要求,同时将 channel 损耗与封装损耗合并计算,TX 通道总损耗控制在 912dB 的区间内,RX 链路只需要满足最大 12dB。图 35 LPO 链路电接口规范推荐37112G LPO 光模块应用白皮书ODCC-2023-03008直驱系统的传输线阻抗+-5%以内,连接器和过孔等阻抗突变位置限制为+-10%。图 36 LPO 链路 SI 阻抗设计规范推荐串扰设计指标,完整通道近端串扰-55dB,远端串扰-45dB。七、七、利用卷积实现利用卷积实现 L LPOPO 系统在线调优系统在线调优如前文分析,LPO 去除 oDSP,网络设备 SI 链路的电损伤会传递到 L
50、PO 模块,LPO 模块的光损伤也会传递到网络设备端口的 SI 链路,导致 LPO 模块和网络设备端口电链路存强耦合。经前文分析,网络设备端口存在 IL/RL 差异性,这种差异很难消除,只能管控在一定范围内。LPO 若要商用落地,必须克服 LPO 模块间互联互通、LPO 和网络设备端口兼容性问题。基于卷积调优的可行性分析,提出一种利用卷积进行 LPO 在线调优方案,单次计算实现 LPO 模块间、LPO和端口间的最佳匹配。38112G LPO 光模块应用白皮书ODCC-2023-03008(一)(一)端口端口 S SI I 设计挑战设计挑战1 1端口端口 I IL L 设计挑战设计挑战由第六章节
51、的分析可知,网络设备端口的 IL 和 RL 都会影响LPO 模块的传输误码率,都属于 SI 的链路损伤。实际受到 PCB 加工制程的影响,网络设备端口的 IL 和 RL 必然存在一定程度的波动,这种波动影响 LPO 模块的传输误码率性能。图 37 端口 SI 对 LPO 模块性能影响验证结果2 2L LPOPO 和端口深耦合和端口深耦合LPO 线性直驱光模块内部没有 re-timer 芯片实现电信号的再生,对网络设备端口 SI 链路质量更敏感,网络设备端口链路产生的噪声、畸变等都会传递和累积,进而影响光信号的质量,最终影响整个链路的传输误码率性能。同一端口适配不同厂家的 LPO 光模块,LPO
52、 模块的误码率性能存在差异,这种差异在 LPO 模块应用上更明显。模块类型模块厂家设备端口插损BER误码分布39112G LPO 光模块应用白皮书ODCC-G DR4A1008dB7E-836.8E-82B1008dB3E-917E-913 3L LPOPO 产测成本增加、拦截效果存疑产测成本增加、拦截效果存疑基于以上两点的分析,LPO 线性直驱光模块在交换机不同端口的误码率性能表现不一致,不同厂家的 LPO 光模块在同一交换机端口的误码率性能表现也不一致。设备厂商和模块厂商传统的产测拦截标准无法有效拦截 LPO 模块和网络设备的兼容性问题,一种方案是设备厂商在产线批
53、量增加光模块的适配拦截或是光模块厂商在产线增加交换机的适配拦截,即便有助于拦截兼容性问题,但是考虑到多厂家供应的现实情况,也会大大增加产测成本,而且拦截效果也有待检验。图 38 传统模块和 LPO 产测环境对比举例(二)(二)L LPOPO 在线调优方案在线调优方案按照本文分析的结论:在特定条件下,网络设备端口间的 LPO传输链路可被视作 LTI 线性时不变系统,只要网络设备 ASIC 芯片的TX SERDES 和 RX SERDES 具有无限阶的 FFE 均衡系数,就可以利用40112G LPO 光模块应用白皮书ODCC-2023-03008卷积进行单次计算,即可实现信号的近无失真传输。实际
54、调优的效果取决于系统的线性度和网络设备 ASIC 芯片的 TX/RX 均衡能力,故利用卷积实现 LPO 在线调优是一种尽力型的调优方案,并不能解决LPO 的非线性缺陷。1 1在线卷积、自动协商实现在线卷积、自动协商实现 L LPOPO 在线调优在线调优LPO 模块在线调优方案见下图,模块厂商将 LPO 光模块 Egress和 Ingress 方向均调校在最佳线性区,设备厂商设计实现端口IL/RL 符合协议规范且将不同端口的 IL/RL 一致性设定在一定的范围之内,则可以将本端网络设备 ASIC 芯片 TX SERDES 的 FFE 均衡系数和对端网络芯片 ASIC RX SERDES 自适应获
55、取的 FFE 均衡系数进行卷积,即可实现 LPO 系统的在线调优。图 39 LPO 模块在线调优方案LPO 网络设备可以通过模块在位信号触发在线卷积、自动协商实现 LPO 调优的方案。详细的链路分解参考下图,调优后的 TXSERDES FFE 均配置为:=41112G LPO 光模块应用白皮书ODCC-2023-03008图 40 利用卷积实现 LPO 在线调优细节在该调优方法中,LPO 的 TX/RX 可以为同一个模块,也可以是同一设备上不同端口的两个模块,也可以是分别位于不同设备上的两个模块。如果位于同一设备内的光模块,可以考虑通过板内通信接口来提升调节效率。如果是位于不同设备间的光模块,
56、则需要考虑采用带外的通信通道支持来保证调节效率或者开发类似 802.3 定义的 AN 协商机制进行 FFE 均衡参数传递。2 2离线卷积、在线配置实现离线卷积、在线配置实现 L LPOPO 在线调优在线调优离线卷积、在线配置实现 LPO 在线调优的方案如图 7-5,主要分两步:1)根据实际应用的组合,在研发阶段使用卷积获取最有的网络设备 ASIC 芯片 TX SERDES FFE 均衡系数,每个组合使用多个样本进行卷积,将同一组合多样本的多组 TX SERDES FFE 均衡系数平均值或者算法拟合出普适性最优的均衡系数,该均衡系数即为该组合的均衡系数。42112G LPO 光模块应用白皮书OD
57、CC-)网络设备上线后,通过网管扫描 LPO 系统两端的 LPO 模块 PN,识别出组合类型,然后下发该组合对应的 TX SERDES 均衡系数。图 41 离线卷积、在线配置实现 LPO 调优方案在线卷积系统框图参考图 7-6,根据实际的配置组合,利用仪表的线性均衡器,通过均衡系数卷积获得较优的 TX FFE 均衡配置:=。图 42 离线卷积系统框图相比 LPO 在线调优方案,该方案更容易实现,相比之下存在一定的不足:43112G LPO 光模块应用白皮书ODCC-)网络设备、端口、LPO 光模块存在多种应用组合,离线卷积调优工作量大;2)离线卷积系
58、统未覆盖网络设备 RX 电层链路,其精度比在线卷积、自动协商实现 LPO 在线调优的方案要差;3)因为是先卷积获取各种组合的 TX FFE 均衡系数,实际部署后,新增组合/PCN 需刷新现网 TX FFE 均衡配置表,运营管理难度相对较大。(三)(三)收益说明收益说明1)卷积计算替代传统的盲扫联调方式,效率更高、性能更优;2)在线卷积、自动协商可以实现一定的 LPO 系统性能自愈;3)基于网络设备 ASIC 芯片的 FFE 均衡能力,理论上可以解决组合差异(设备端口/LPO 模块)导致的 LPO 链路性能差异,提高 LPO光模块的适配兼容能力;4)基于网络设备 ASIC 芯片的 FFE 均衡能
59、力,理论上可以解决LPO 模块批次波动性(制程波动、来料波动)引起的现网 LPO 系统传输性能波动;5)继承传统可插拔光模块开放解耦的生态,设备厂商在遵循电接口标准的基础上管控端口 IL/RL 的一致性,模块厂商管控 LPO 模块线性度,终端用户负责应用调优。八、八、L LPOPO 在线调优的关键技术在线调优的关键技术44112G LPO 光模块应用白皮书ODCC-2023-03008利用卷积实现 LPO 传输链路的在线调优是符合理论分析的,且经过实际验证可行,真正落地商用,还需攻克该方案涉及的关键技术。(一)(一)设备设备 P PHYHY 芯片均衡技术芯片均衡技术如第四章卷积调优可行性分析,
60、假设网络设备 PHY 芯片具有无限的 FFE 均衡阶数,那么理论上通过精准配置这些 FFE 均衡系数,可以解决 LPO 光模块适配不同网络设备端口的性能差异性。实际上不同厂商的 PHY 芯片 FFE 均衡技术不同,能力不同。当前宣称支持LPO 应用的主流 ASIC 芯片具有很强的 RX FFE 均衡技术,其均衡阶数高达数十阶,但是 TX FFE 均衡却只有数阶,限制了通过时域卷积进行 LPO 在线调优的效果。(二)(二)LPOLPO 模块的线性调校技术模块的线性调校技术通过卷积实现 LPO 在线调优的基础上是 LPO 光模块具有一定的线性特性,在第五章已经进行过理论分析并获得结论即 LPO 具有一定的的线性特性。LPO 模块内部 Driver 驱动器和 TIA 都可以进行一定程度的 SI 链路补偿,如何配置这些参数,使得 LPO 模块工作在最佳线性区是通过卷积实现 LPO 调优的基础。(三)(三)带外通信机制带外通信机制/设备间协商机制设备间协商机制通过卷积实现 LPO 在线调优依赖网络设备 ASIC 芯片 FFE 均衡系数的反馈和传递,针对不同设备端口之间电 LPO 传输系统,则需要45112G LPO 光模块应用白皮书ODCC-2023-03008采用带外的通信通道支持来保证调节效率或者开发类似 802.3 定义的 AN 协商机制进行 FF 均衡 E 参数传递。