瑜伽球上遛「狗」!入选英伟达十大项目之一的Eureka有了新突破


机器狗在瑜伽球上稳稳当当的行走,平衡力那是相当的好:

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

各种场景都能拿捏,不管是平坦的人行道、还是充满挑战的草坪都能 hold 住:

甚至是研究人员踢了一脚瑜伽球,机器狗也不会歪倒:

给气球放气机器狗也能保持平衡:

上述展示都是 1 倍速,没有经过加速处理。
  • 论文地址:https://eureka-research.github.io/dr-eureka/assets/dreureka-paper.pdf
  • 项目主页:https://github.com/eureka-research/DrEureka
  • 论文标题:DrEureka: Language Model Guided Sim-To-Real Transfer

这项研究由宾夕法尼亚大学、 NVIDIA 、得克萨斯大学奥斯汀分校的研究者联合打造,并且完全开源。他们提出了 DrEureka(域随机化 Eureka),这是一种利用 LLM 实现奖励设计和域随机化参数配置的新型算法,可同时实现模拟到现实的迁移。该研究展示了 DrEureka 算法能够解决新颖的机器人任务,例如四足机器人平衡和在瑜伽球上行走,而无需迭代手动设计。

DrEureka 是基于 Eureka 完成的,后者还被评为 2025 年英伟达十大项目之一。了解 Eureka 更多内容可参考《有了 GPT-4 之后,机器人把转笔、盘核桃都学会了》。

在论文摘要部分,研究者表示将在模拟中学习到的策略迁移到现实世界是一种大规模获取机器人技能的有前途的策略。然而,模拟到现实的方法通常依赖于任务奖励函数以及模拟物理参数的手动设计和调整,这使得该过程缓慢且耗费人力。本文研究了使用大型语言模型 (LLM) 来自动化和加速模拟到现实的设计。

论文作者之一、英伟达高级科学家 Jim Fan 也参与了这项研究。此前英伟达成立 AI 实验室,领队人就是 Jim Fan,专攻具身智能。Jim Fan 表示:

「我们训练了一只机器狗能在瑜伽球上保持平衡并行走,这完全是在模拟中进行的,然后零样本迁移到现实世界,无需微调,直接运行。

对机器狗来说,走瑜伽球任务尤其困难,因为我们无法准确模拟弹力球表面。然而,DrEureka 可以轻松搜索大量模拟真实配置,并让机器狗能够在各种地形上操控球,甚至横着走!

一般来讲,从模拟到现实的迁移是通过域随机化实现的,这是一个繁琐的过程,需要机器人专家盯着每个参数并手动调整。像 GPT-4 这样的前沿 LLM 拥有大量内置的物理直觉,包括摩擦、阻尼、刚度、重力等,借助 GPT-4,DrEureka 可以熟练地调整这些参数并很好地解释其推理。」

论文介绍

DrEureka 流程如下所示,其接受任务和安全指令以及环境源代码,并运行 Eureka 以生成正则化的奖励函数和策略。然后,它在不同的模拟条件下测试该策略以构建奖励感知物理先验,并将其提供给 LLM 以生成一组域随机化 (DR) 参数。最后,使用合成的奖励和 DR 参数训练策略以进行实际部署。
Eureka 奖励设计。奖励设计组件基于 Eureka,因为它简单且具有表现力,但本文引入了一些改进,以增强其在模拟到真实环境中的适用性。伪代码如下:
奖励感知物理先验(RAPP,reward aware physics prior)。安全奖励函数可以规范策略行为以固定环境选择,但本身不足以实现模拟到现实的迁移。因此本文引入了一种简单的 RAPP 机制来限制 LLM 的基本范围。
LLM 用于域随机化。给定每个 DR 参数的 RAPP 范围,DrEureka 的最后一步指示 LLM 在 RAPP 范围的限制内生成域随机化配置。具体过程参见图 3:
该研究使用 Unitree Go1 来实验,Go1 是一个小型四足机器人,四条腿有 12 个自由度。在四足运动任务中,本文还系统地评估了 DrEureka 策略在几个现实世界地形上的性能,发现它们仍然具有鲁棒性,并且优于使用人类设计的奖励和 DR 配置训练的策略。
了解更多内容,请参考原论文。


# 都能  # 几个  # 是一个  # 平衡力  # 都是  # 的人  # 得克萨斯  # 奥斯汀  # 宾夕法尼亚大学  # git  # 随机化  # gpt  # 自动化  # https  # eureka  # 算法  # github 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: AI时代设计师生存指南:职业发展、技能提升与未来趋势  AI助手高效获取谷歌评论:提升本地商家曝光率的终极指南  Depseek如何让提示词包含上下文_Depseek上下文补充提示词写法【步骤】  Bluecap:加拿大AI会议助手,提升混合办公效率  播客剪辑软件选择指南:新手到专业,总有一款适合你  DeepSeek辅助撰写专利申请 DeepSeek技术创新文档写作  AI人像摄影新纪元:Gemini AI助力照片编辑  AI婴儿播客视频制作终极指南:免费工具与步骤  开源AI Agent项目精选:赋能智能自动化  Gemini手机端怎么发图片_Gemini手机端发图方法【步骤】  Gemini 辅助进行博物馆数字化藏品分类建议  Decart Lucy 14B:颠覆AI视频生成领域的革命性模型  tofai官网正版入口 tofai网页版免费使用  AI广告全面解析:免费教程、JSON提示与营销策略  Thesis AI:一键生成高质量学术论文的秘密武器  Google Gemini 处理结构化 XML 数据转换教程  CareerCraft AI:提升大学生实习就业的智能平台  留学文书PS怎么写?教你用AI写出招生官眼前一亮的个人陈述  GoHighLevel AI Agent:终极指南,释放你的CRM潜力  Claude如何保存对话记录_Claude对话保存步骤【步骤】  使用 Claude 4 和 n8n 实现 AI 工作流自动化  AI电影制作:颠覆传统,引领未来*新纪元  豆包Ai官方网页版入口地址_豆包Ai官网在线使用入口  AI简历生成器:提升求职效率的智能工具  千问怎样生成年度业绩分析_千问业绩分析模型与数据解读【攻略】  Excel Copilot:AI驱动的强大新功能与实用案例解析  使用AI配乐:ElevenLabs Music音乐生成器终极指南  Midjourney怎样加风格词调质感_Midjourney风格词技巧【指南】  怎么用AI帮你为初创公司进行市场定位分析?  如何用AI一键生成手机壁纸?4K高清AI壁纸生成关键词【分享】  CodeRabbit CLI: AI 代码审查工具,提升编码效率与代码质量  百度输入法蓝色图标怎么关 百度输入法ai图标消除  AI驱动音频优化:提升音质的终极指南  AI项目管理软件如何利用自然语言处理?全面解析  2025年必备:顶级AI工具,赋能您的日常工作和业务流程  随机故事生成器:激发创意,轻松创作精彩故事  HelloData.ai:AI驱动的多户型房地产市场分析平台  Spin Rewriter AI:终极内容创作与SEO优化指南  AI 3D建模革命:免费生成高质量模型和纹理  通义千问网页版怎么切换账号_通义千问账号切换步骤【指南】  文心一言如何做本地生活探店文案 文心一言内容种草指南  旅游营销AI:ChatGPT邮件营销策略,提升旅游业务转化率  钉钉ai划词工具怎么使用划词查词_钉钉ai划词工具查词入口与释义查看【指南】  淋巴按摩终极指南:在家打造紧致透亮肌肤  通义万相IP形象设计怎么用_通义万相IP形象设计使用方法详细指南【教程】  Jasper AI的Recipes是什么 Jasper AI配方功能使用【详解】  DeepSeek写小说怎么用_DeepSeek写小说使用方法详细指南【教程】  AI驱动的合同审查:Adobe Acrobat AI助手提升效率与准确性  百度浏览器侧边栏ai怎么关 百度浏览器ai侧边栏隐藏  AI周报生成工具有哪些_一键生成工作总结的AI工具推荐 

 2024-05-05

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.