新的Range View3D检测思路:RangePerception


标题重写:范围感知:驯服lidar范围视图以实现高效准确的3d物体检测

请点击以下链接查看论文:https://openreview.net/pdf?id=9kFQEJSyCM

作者单位:上海人工智能实验室 复旦大学 重写后:单位:上海人工智能实验室 复旦大学

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

论文思路:

目前,基于 LiDAR 的 3D 检测方法主要使用鸟瞰图(BEV)或 range view(RV)作为基础。BEV 方法依赖于体素化和 3D 卷积,这导致了训练和推理过程的效率较低。相反,RV 方法由于其紧凑性和与 2D 卷积的兼容性而表现出更高的效率,但其性能仍然落后于 BEV 方法。为了消除性能差距,同时保持 RV 方法的效率,本研究提出了一种高效且准确的基于 RV 的 3D 目标检测框架,称为 RangePerception。通过细致的分析,本研究确定了阻碍现有 RV 方法性能的两个关键挑战:1)输出中使用的 3D 世界坐标与输入中使用的 2D range image 坐标之间存在自然域差距,这导致从 range images 中提取信息变得困难;2)原始 range image 存在视觉损坏问题,影响位于 range image 边缘的目标的检测精度。为了解决这些挑战,本文提出了两种新颖算法,名为 Range Aware Kernel(RAK)和 Vision Restoration Module(VRM),它们促进了 range image 表示和世界坐标 3D 检测结果的信息流。在 RAK 和 VRM 的帮助下,在 Waymo Open Dataset 上,RangePerception 的平均 L1/L2 AP 较之前最先进的 RV 方法 RangeDet 提高了 3.25/4.18。RangePerception 是首个基于 RV 的 3D 检测方法,与著名的基于 BEV 的方法 CenterPoint 相比,其平均 AP 稍高,且推理速度是 CenterPoint 的 1.3 倍

网络设计:

本文展示了一种高效且准确的基于 RV 的 3D 检测框架,称为 RangePerception。为了克服上述关键挑战,提出了两种名为 Range Aware Kernel (RAK) 和 Vision Restoration Module (VRM) 的新颖算法,并将其集成到 RangePerception 框架中,两者都促进了 range image 表示和世界坐标 3D 检测结果的信息流。在 RAK 和 VRM 的帮助下,本文的 RangePerception 在 WOD 上为 vehicle & pedestrian & cyclist 提供了 73.62、80.24 和 70.33 L1 3D AP,作为 range-view-based 3D 检测方法,实现了最先进的性能。本文的贡献如下。

RangePerception Framework. 本文介绍了一种新颖的高性能 3D 检测框架,名为 RangePerception。RangePerception 是第一个基于 RV 的 3D 检测器,在 WOD 上实现了 74.73/69.17 平均 L1/L2 AP,优于之前最先进的基于 RV 的检测器 RangeDet,后者的平均 L1/L2 AP 为 71.48/64.99,呈现 3.25/4.18 的改进。与广泛使用的基于 BEV 的方法 CenterPoint [6] 相比,RangePerception 还表现出了稍微优越的性能,后者的平均 L1/L2 AP 为 74.25/68.04。值得注意的是,RangePerception 的推理速度是 CenterPoint 的 1.3 倍,这证明其更适合自动驾驶车辆上的实时部署。

Range Aware Kernel. 作为 RangePerception 特征提取器的一部分, Range Aware Kernel (RAK) 是一种专为基于 RV 的网络量身定制的开创性算法。RAK 将 range image 空间分解为多个子空间,并通过从每个子空间中独立提取特征来克服空间错位问题(Spatial Misalignment issue)。实验结果表明,RAK 将平均 L1/L2 AP 提高了 5.75/5.99,而计算成本可以忽略不计。

Vision Restoration Module. 为了解决视觉损坏问题(Vision Corruption issue),本研究提出了 Vision Restoration Module(VRM)。VRM 通过恢复先前损坏的区域来扩展 backbone 网络的感受野。VRM 对于车辆检测特别有帮助,如实验部分所示。

图2:RangePerception 框架采用 range image I 作为输入,并生成密集预测。为了提高表示学习效果,该框架在 Range Backbone 之前依次集成了 VRM 和 RAK 模块。接着,采用专门设计的 Redundancy Pruner 消除深层特征中的冗余,从而减轻后续 Region Proposal Network 和后处理层的计算成本

图 1:(a-d) 顶部 LiDAR 信号的示例帧,分别以 RV 和 BEV 表示。(e) 空间错位现象(Spatial Misalignment phenomena)。(f) 视觉损坏现象(Vision Corruption phenomena)。

图 3:Range Aware Kernel 将 range image 空间分解为多个子空间,并通过从每个子空间提取独立的特征来克服空间错位问题(Spatial Misalignment issue)。

图 5:Vision Restoration Module。通过预先定义恢复角 δ,VRM 构建了一个方位角 θ ∈ [−δ, 2π + δ] 的扩展球面空间。因此, range image  I 两侧的视觉损坏问题都得到了解决,显着简化了从 I 边缘提取特征的过程。

实验结果:

总结:

本篇文章阐述了RangePerception,是一种基于RV的三维检测框架,能够有效地解决空间错位和视觉损坏的难题。通过引入RAK和VRM技术,RangePerception在WOD上展现了卓越的检测能力,同时也展示了其高效、准确的实际部署潜力

引用:

@inproceedings{bai2025rangeperception,title={RangePerception: Taming Li{DAR} Range View for Efficient and Accurate 3D Object Detection},author={Yeqi BAI and Ben Fei and Youquan Liu and Tao MA and Yuenan Hou and Botian Shi and Yikang LI},booktitle={Thirty-seventh Conference on Neural Information Processing Systems},year={2025},url={https://openreview.net/forum?id=9kFQEJSyCM}}

原文链接:https://mp.weixin.qq.com/s/EJCl5kLxhHaa7lh98g2I6w


# 算法  # 人工智能  # https  # issue  # 提出了  # 复旦大学  # 最先进  # 是一种  # 多个  # 两种  # 检测方法  # 重写  # 上海  # 的是 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: Guru知识管理平台:AI驱动的企业知识中心构建指南  深度解析Coldplay酷玩乐队《Viva la Vida》的音乐内涵  EdrawMind终极评测:AI赋能思维导图,提升效率与创造力  OpenAI ChatGPT Agent:AI自主任务的未来  GitHub Copilot CLI:终端中的 AI 编码助手  免费涨粉秘籍:Instagram快速提升技巧,告别粉丝流失  AI网站构建指南:Duda平台免费创建教程  百度输入法总是弹出ai 百度输入法ai自动弹出关闭  兔展AI排版如何批量生成多尺寸图_兔展AI排版多尺寸批量生成步骤【实操】  AI赋能!图形设计师必备的顶级AI工具  QRCODE.AI深度评测:AI驱动的二维码生成器优缺点分析  MagicAnimate怎么让图片动起来 字节跳动MagicAnimate配置及用法【教程】  3步教你用AI帮你把菜谱转换成详细的烹饪步骤视频脚本  夸克AI怎样搜索医疗健康_夸克AI医疗频道与症状自查【技巧】  Gemini怎样写描述型提示词_Gemini描述提示词编写【攻略】  去哪旅行ai抢票助手怎样提升抢票速度_去哪旅行ai抢票助手加速包与多通道使用【技巧】  历史影像解密:唇语专家如何还原一战士兵对话?  P&ID图全解析:工艺流程图解读与应用指南  ChatGPT怎样用提示词分步骤提问_ChatGPT分步提问技巧【方法】  LTX Studio:AI电影制作平台深度评测与应用指南  OpenAI Sora 2:AI视频生成新纪元  教你用AI进行角色扮演对话,练习你的沟通和谈判技巧  在线图像分割:可信模糊聚类算法详解与应用  AI数据分析报告生成工具有哪些_一键生成可视化报告的AI工具推荐  Canva AI终极指南:免费AI聊天机器人,设计、视频、网站全搞定!  怎么用ai做证件照换底色 AI一键抠图与背景色替换【方法】  教你用AI帮你进行论文选题,快速找到有研究价值的方向  AI Excel公式生成工具有哪些_一键生成函数公式的AI工具推荐  MetaGPT:AI驱动的软件开发团队,颠覆传统编码模式  软件工程师必备的AI工具:提升效率的六款利器  小米汽车OTA冬季大版本升级:新增和优化共计9项功能  智谱清言分析数据怎么用_智谱清言分析数据使用方法详细指南【教程】  HelloData.ai:AI驱动的多户型房地产市场分析平台  宝可梦朱紫:如何高效刷闪异色宝可梦,提升游戏体验  AI生成克里希纳短视频:一步步教程,快速爆款!  股票 vs. ETF:解锁股市财富密码,新手投资完全指南  Claude官网在线对话地址 Claude官方网站直接使用  豆包AI怎样生成PPT目录页_豆包AI目录自动生成与页码添加【指南】  Z170芯片组内存兼容性问题终极指南  2025 YouTube自动化终极指南:利用AI实现高效内容创作和多平台发布  解读 Karan Aujla:如何用音乐连接全球与故土?  AI问卷调查生成工具有哪些_一键生成调研表单的AI工具推荐  AI怎么修复模糊视频 视频画质增强AI软件Topaz Video使用【教程】  Notion AI整理笔记怎么用_Notion AI整理笔记使用方法详细指南【教程】  面试成功秘诀:如何巧妙回答常见面试问题  在线奇幻名称生成器:打造独一无二的角色名  AI内容检测与优化:免费工具助你提升内容质量  AI音乐创作:颠覆传统,开启音乐新纪元  AI赋能:五款颠覆性工具助你在线赚钱  AI赋能项目管理:5个实用技巧提升效率 

 2023-12-14

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.