标题重写:范围感知:驯服lidar范围视图以实现高效准确的3d物体检测
请点击以下链接查看论文:https://openreview.net/pdf?id=9kFQEJSyCM
作者单位:上海人工智能实验室 复旦大学 重写后:单位:上海人工智能实验室 复旦大学
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
目前,基于 LiDAR 的 3D 检测方法主要使用鸟瞰图(BEV)或 range view(RV)作为基础。BEV 方法依赖于体素化和 3D 卷积,这导致了训练和推理过程的效率较低。相反,RV 方法由于其紧凑性和与 2D 卷积的兼容性而表现出更高的效率,但其性能仍然落后于 BEV 方法。为了消除性能差距,同时保持 RV 方法的效率,本研究提出了一种高效且准确的基于 RV 的 3D 目标检测框架,称为 RangePerception。通过细致的分析,本研究确定了阻碍现有 RV 方法性能的两个关键挑战:1)输出中使用的 3D 世界坐标与输入中使用的 2D range image 坐标之间存在自然域差距,这导致从 range images 中提取信息变得困难;2)原始 range image 存在视觉损坏问题,影响位于 range image 边缘的目标的检测精度。为了解决这些挑战,本文提出了两种新颖算法,名为 Range Aware Kernel(RAK)和 Vision Restoration Module(VRM),它们促进了 range image 表示和世界坐标 3D 检测结果的信息流。在 RAK 和 VRM 的帮助下,在 Waymo Open Dataset 上,RangePerception 的平均 L1/L2 AP 较之前最先进的 RV 方法 RangeDet 提高了 3.25/4.18。RangePerception 是首个基于 RV 的 3D 检测方法,与著名的基于 BEV 的方法 CenterPoint 相比,其平均 AP 稍高,且推理速度是 CenterPoint 的 1.3 倍
本文展示了一种高效且准确的基于 RV 的 3D 检测框架,称为 RangePerception。为了克服上述关键挑战,提出了两种名为 Range Aware Kernel (RAK) 和 Vision Restoration Module (VRM) 的新颖算法,并将其集成到 RangePerception 框架中,两者都促进了 range image 表示和世界坐标 3D 检测结果的信息流。在 RAK 和 VRM 的帮助下,本文的 RangePerception 在 WOD 上为 vehicle & pedestrian & cyclist 提供了 73.62、80.24 和 70.33 L1 3D AP,作为 range-view-based 3D 检测方法,实现了最先进的性能。本文的贡献如下。
RangePerception Framework. 本文介绍了一种新颖的高性能 3D 检测框架,名为 RangePerception。RangePerception 是第一个基于 RV 的 3D 检测器,在 WOD 上实现了 74.73/69.17 平均 L1/L2 AP,优于之前最先进的基于 RV 的检测器 RangeDet,后者的平均 L1/L2 AP 为 71.48/64.99,呈现 3.25/4.18 的改进。与广泛使用的基于 BEV 的方法 CenterPoint [6] 相比,RangePerception 还表现出了稍微优越的性能,后者的平均 L1/L2 AP 为 74.25/68.04。值得注意的是,RangePerception 的推理速度是 CenterPoint 的 1.3 倍,这证明其更适合自动驾驶车辆上的实时部署。
Range Aware Kernel. 作为 RangePerc
eption 特征提取器的一部分, Range Aware Kernel (RAK) 是一种专为基于 RV 的网络量身定制的开创性算法。RAK 将 range image 空间分解为多个子空间,并通过从每个子空间中独立提取特征来克服空间错位问题(Spatial Misalignment issue)。实验结果表明,RAK 将平均 L1/L2 AP 提高了 5.75/5.99,而计算成本可以忽略不计。
Vision Restoration Module. 为了解决视觉损坏问题(Vision Corruption issue),本研究提出了 Vision Restoration Module(VRM)。VRM 通过恢复先前损坏的区域来扩展 backbone 网络的感受野。VRM 对于车辆检测特别有帮助,如实验部分所示。
图2:RangePerception 框架采用 range image I 作为输入,并生成密集预测。为了提高表示学习效果,该框架在 Range Backbone 之前依次集成了 VRM 和 RAK 模块。接着,采用专门设计的 Redundancy Pruner 消除深层特征中的冗余,从而减轻后续 Region Proposal Network 和后处理层的计算成本
图 1:(a-d) 顶部 LiDAR 信号的示例帧,分别以 RV 和 BEV 表示。(e) 空间错位现象(Spatial Misalignment phenomena)。(f) 视觉损坏现象(Vision Corruption phenomena)。
图 3:Range Aware Kernel 将 range image 空间分解为多个子空间,并通过从每个子空间提取独立的特征来克服空间错位问题(Spatial Misalignment issue)。
图 5:Vision Restoration Module。通过预先定义恢复角 δ,VRM 构建了一个方位角 θ ∈ [−δ, 2π + δ] 的扩展球面空间。因此, range image I 两侧的视觉损坏问题都得到了解决,显着简化了从 I 边缘提取特征的过程。
本篇文章阐述了RangePerception,是一种基于RV的三维检测框架,能够有效地解决空间错位和视觉损坏的难题。通过引入RAK和VRM技术,RangePerception在WOD上展现了卓越的检测能力,同时也展示了其高效、准确的实际部署潜力
@inproceedings{bai2025rangeperception,title={RangePerception: Taming Li{DAR} Range View for Efficient and Accurate 3D Object Detection},author={Yeqi BAI and Ben Fei and Youquan Liu and Tao MA and Yuenan Hou and Botian Shi and Yikang LI},booktitle={Thirty-seventh Conference on Neural Information Processing Systems},year={2025},url={https://openreview.net/forum?id=9kFQEJSyCM}}
原文链接:https://mp.weixin.qq.com/s/EJCl5kLxhHaa7lh98g2I6w
# 算法
# 人工智能
# https
# issue
# 提出了
# 复旦大学
# 最先进
# 是一种
# 多个
# 两种
# 检测方法
# 重写
# 上海
# 的是
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
网络优化91478 】
【
技术知识72672 】
【
云计算0 】
【
GEO优化84317 】
【
优选文章0 】
【
营销推广36048 】
【
网络运营41350 】
【
案例网站102563 】
【
AI智能45237 】
相关推荐:
Guru知识管理平台:AI驱动的企业知识中心构建指南
深度解析Coldplay酷玩乐队《Viva la Vida》的音乐内涵
EdrawMind终极评测:AI赋能思维导图,提升效率与创造力
OpenAI ChatGPT Agent:AI自主任务的未来
GitHub Copilot CLI:终端中的 AI 编码助手
免费涨粉秘籍:Instagram快速提升技巧,告别粉丝流失
AI网站构建指南:Duda平台免费创建教程
百度输入法总是弹出ai 百度输入法ai自动弹出关闭
兔展AI排版如何批量生成多尺寸图_兔展AI排版多尺寸批量生成步骤【实操】
AI赋能!图形设计师必备的顶级AI工具
QRCODE.AI深度评测:AI驱动的二维码生成器优缺点分析
MagicAnimate怎么让图片动起来 字节跳动MagicAnimate配置及用法【教程】
3步教你用AI帮你把菜谱转换成详细的烹饪步骤视频脚本
夸克AI怎样搜索医疗健康_夸克AI医疗频道与症状自查【技巧】
Gemini怎样写描述型提示词_Gemini描述提示词编写【攻略】
去哪旅行ai抢票助手怎样提升抢票速度_去哪旅行ai抢票助手加速包与多通道使用【技巧】
历史影像解密:唇语专家如何还原一战士兵对话?
P&ID图全解析:工艺流程图解读与应用指南
ChatGPT怎样用提示词分步骤提问_ChatGPT分步提问技巧【方法】
LTX Studio:AI电影制作平台深度评测与应用指南
OpenAI Sora 2:AI视频生成新纪元
教你用AI进行角色扮演对话,练习你的沟通和谈判技巧
在线图像分割:可信模糊聚类算法详解与应用
AI数据分析报告生成工具有哪些_一键生成可视化报告的AI工具推荐
Canva AI终极指南:免费AI聊天机器人,设计、视频、网站全搞定!
怎么用ai做证件照换底色 AI一键抠图与背景色替换【方法】
教你用AI帮你进行论文选题,快速找到有研究价值的方向
AI Excel公式生成工具有哪些_一键生成函数公式的AI工具推荐
MetaGPT:AI驱动的软件开发团队,颠覆传统编码模式
软件工程师必备的AI工具:提升效率的六款利器
小米汽车OTA冬季大版本升级:新增和优化共计9项功能
智谱清言分析数据怎么用_智谱清言分析数据使用方法详细指南【教程】
HelloData.ai:AI驱动的多户型房地产市场分析平台
宝可梦朱紫:如何高效刷闪异色宝可梦,提升游戏体验
AI生成克里希纳短视频:一步步教程,快速爆款!
股票 vs. ETF:解锁股市财富密码,新手投资完全指南
Claude官网在线对话地址 Claude官方网站直接使用
豆包AI怎样生成PPT目录页_豆包AI目录自动生成与页码添加【指南】
Z170芯片组内存兼容性问题终极指南
2025 YouTube自动化终极指南:利用AI实现高效内容创作和多平台发布
解读 Karan Aujla:如何用音乐连接全球与故土?
AI问卷调查生成工具有哪些_一键生成调研表单的AI工具推荐
AI怎么修复模糊视频 视频画质增强AI软件Topaz Video使用【教程】
Notion AI整理笔记怎么用_Notion AI整理笔记使用方法详细指南【教程】
面试成功秘诀:如何巧妙回答常见面试问题
在线奇幻名称生成器:打造独一无二的角色名
AI内容检测与优化:免费工具助你提升内容质量
AI音乐创作:颠覆传统,开启音乐新纪元
AI赋能:五款颠覆性工具助你在线赚钱
AI赋能项目管理:5个实用技巧提升效率
2023-12-14
南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。