英伟达最新AI AgentEureka开源可完成转笔等复杂动作

站长网2023-10-21 14:47:030阅

要点:

英伟达的最新AI AgentEureka使用GPT-4生成奖励函数，教会机器人完成多项复杂任务，包括转笔、打开抽屉、抛球等，表现超越人类专家。

Eureka采用混合梯度架构，结合无梯度的情境学习和强化学习，通过上下文来实现人类水平的奖励算法设计，大幅提升机器人性能。

这项研究受到广泛关注，开源项目可在机器人领域应用，尤其在处理复杂任务和高维电机控制方面表现出色，甚至有时与人类策略负相关。

英伟达最新的AI AgentEureka搭载了强大的GPT-4模型，通过生成奖励函数的方式，使机器人能够完成多项复杂任务，其中包括一些看似简单但难以实现的动作，如转笔、打开抽屉、抛球等。这一成就令人瞩目，尤其是在转笔这项技能上，即便是靠人类逐帧制作动画，也难以达到如此高水准。研究结果显示，Eureka在超过80%的任务中都超越了人类专家，使机器人的平均性能提升了50%以上。

论文链接:

https://arxiv.org/abs/2310.12931

GitHub链接:

https://github.com/eureka-research/Eureka

Eureka的关键创新在于采用了一种混合梯度架构，结合了无梯度的情境学习和强化学习。这个系统使用GPT-4的零样本生成、代码编写以及上下文改进功能，对奖励执行策略进行优化。在外循环中，GPT-4细化奖励函数，而内循环则使用强化学习来训练机器人控制器。这种方法让机器人能够通过强化学习来掌握复杂的技能，而不需要特定的提示工程和奖励模版。

Eureka还支持一种新形式的上下文强化学习，它能够将人类操作员的反馈融入自然语言中，以引导和调整奖励功能。在对29种不同的开源RL环境进行基准测试时，Eureka在83%的测试中超越了人类，并实现了52%的改进。这些测试环境包括10种不同的机器人形态，如四足机器人、四旋翼机器人、双足机器人和机械手等。

最令人惊讶的是，Eureka在处理复杂、高维电机控制的任务上表现更佳，有时甚至与人类奖励的相关性负相关。这表明它的策略在某些情况下比人类策略更为有效，类似于AlphaGo在下棋策略上的表现。这项研究由英伟达、宾夕法尼亚大学、加州理工学院和德州大学奥斯汀分校的研究人员合作完成，其中近半数研究人员都是华人。这一成就为机器人学习和强化学习领域带来了革命性的突破，也引发了广泛的关注和期待。

英伟达最新AIAgentEureka开源可完成转笔等复杂动作

0000

评论列表

共(0)条

相关推荐

站长资讯
百度发布优质视频封面基础设计要点
封面是最直观能让用户感知视频内容好坏的方式，为此，百度搜索资源平台发布了优质视频封面基础设计要点，带大家了解一下好的封面所应该具备哪些条件。一、封面的清晰度1►画面高清封面切记不可模糊，无法辨别人物或仅能辨别大致主体的封面都是不合规的，我们需要保证整体的画面非常清晰，能清楚地看到画面主体。低质示例:封面模糊，看不清主体2►不可拉伸截断导致主体变形
站长网2023-05-12 20:24:36
0000
努比亚Z60 Ultra官宣搭载Neovision泰山影像系统
努比亚将于12月19日14:00发布新款旗舰手机Z60Ultra，这款手机被官方宣传为“移动影像新标杆”。据努比亚官方介绍，Z60Ultra将采用全新的Neovision泰山影像系统，其中包含三个主摄像头，每个镜头都配备了OIS光学防抖功能。这三个摄像头分别是18mm50MP大底大光圈广角、35mm50MP高定光学、以及85mm64MP潜望式旗舰长焦。
站长网站长资讯2023-12-11 14:11:22
0000
AI前哨 | 对话百度肖阳：谁是中国第一搜索引擎？
凤凰网科技讯《AI前哨》5月29日消息，前几天，“百度已不是中国第一大桌面搜索引擎”话题被顶上微博热搜。根据美国研究机构Statcounter的最新统计数据，今年4月微软必应搜索国内搜索市场份额创历史新高，而百度搜索市场份额降至27.01%，排名跌到第二。
站长网站长资讯2023-05-29 16:36:08
0000
站长资讯
戴尔携手AMD扩大生成式人工智能产品线，挑战Nvidia霸主地位
**划重点:**1.🔄**多元选择:**戴尔推出搭载八颗AMDInstinctMI300XAI加速器的PowerEdgeXE9680服务器，与Nvidia版本齐头并进，为客户提供更多人工智能工作负载选择。
站长网2023-12-26 11:46:09
0000
站长资讯
视频解析工具Video-ChatGPT上线可用文本描述视频内容
虽然像RunwayML这样的公司在将文本转换为视频方面取得了长足的进步，但VideoChatGPT却另辟蹊径，赋予语言模型分析视频的能力。Video-ChatGPT可以用文本描述视频的内容，例如，通过突出显示不寻常的元素来解释为什么剪辑可能很有趣。开发人员通过一段长颈鹿从跳水板上跳入水中的视频来演示这一点。Video-ChatGPT指出:“这并不常见，因为长颈鹿并不擅长杂技或潜水。”
站长网2023-05-29 16:25:08
0004