2021年特斯拉AIDay展示加入了BEV+Transformer+VideoNeuralNet的HydraNet 原图定位 (1)2021 年 AP 团队在感知模型加入了 BEV+Transformer+Video Neural Net,完善了感知模型的算法能力和预测能力。通过在特斯拉的感知模型 HydraNet 中加入BEV+Transformer,实现了 2 维图像向 3 维空间的映射(具体而言,BEV 鸟瞰图将图像通过 RegNet、BiFAN 提取特征后,把 8 个摄像头的图像组合成一个 3 维图像),其次将视频模块加入神经网络训练,即在加入了 BEV Layer 的 HydraNet 中加入了 Video Neural Net,融合了时序数据后的感知模型具有了短时记忆能力,能够在实际行车过程中进行大量预测。2021 年特斯拉 AI Day 上,AP 团队的成果显示,用大量汽车和视频片段即可在 RNN(循环神经网络)中构建类似高精地图的俯视图。