CMU 研究人员推出 WebArena:为实用代理提供真实可复现的网络环境
站长网2023-07-28 09:48:371阅
CMU 研究人员推出 WebArena:一个真实可复现的网络环境,用于评估实用代理的性能。他们提供了四个真实的网络应用程序,用于训练自主代理执行特定任务。为了模拟人类问题解决,WebArena 还嵌入了工具和知识资源作为独立的网站。WebArena 引入了一个基准测试,将高级逼真自然语言命令解释为具体的基于 Web 的交互。
项目地址:https://github.com/web-arena-x/webarena
研究人员使用自然语言命令评估了多个代理的性能,并发现目前的大型语言模型在处理复杂任务时存在问题。因此,他们认为这些模型缺乏主动探索和错误恢复的关键能力。整个研究工作已在 Paper, Project Page 和 Github 上公开。
产品特点:
- 提供逼真的 Web 环境,模拟真实世界网站的功能和数据
- 嵌入工具和知识资源,使智能体能够模拟人类问题解决能力
- 提供基准测试,测试高级逼真自然语言命令的解释和交互能力
- 提供已注释程序,验证任务功能的正确性
0001
评论列表
共(0)条相关推荐
比马斯克更疯狂,ChatGPT之父的25条经典语录
继ChatGpt后,OpenAI创始人山姆·阿尔特曼再度成为世界的焦点。据报道,阿尔特曼即将获得约1亿美元的融资。这笔资金将用于他使用眼部虹膜扫描技术创建的一种安全的全球加密货币“世界币”的计划。不少人都说他是个比马斯克更疯狂的天才。1985年出生的山姆·阿尔特曼,从小就展露天才属性。8岁学会编程,9岁时收到一台电脑作为生日礼包,使他在很小的时候就对信息技术和互联网产生了兴趣。0000Meta联手CMU打造通用机器人智能体——RoboAgent
Meta和CMU联合研究团队耗时两年,成功开发出了一款名为RoboAgent的通用机器人智能体。RoboAgent仅仅通过7500个轨迹的训练就实现了12种不同的复杂技能,包括烘焙、拾取物品、上茶、清洁厨房等任务,并能在100种未知场景中泛化应用。论文地址:https://robopen.github.io/media/roboagent.pdf站长网2023-08-21 21:53:430000摩根士丹利预测特斯拉人工智能革命将迎来爆炸性增长
划重点:🔍摩根士丹利的研究报告指出,人工智能正处于爆炸性增长的时刻。🔍特斯拉最近发布了其双足机器人“Optimus”的新升级,摩根士丹利的研究人员相信这将引发特斯拉的“寒武纪爆炸”,从而实现爆炸性增长。🔍摩根士丹利建议投资者购买特斯拉股票,认为该公司处于弱势之中。0000林俊杰认栽,第一波元宇宙炒房团“覆灭”
曾经热炒的元宇宙地产“哑火”了。元宇宙分析平台WeMeta数据显示,2021年11月,歌手林俊杰花12.3万美元在Decentraland购买的3块虚拟地产,目前价值已经跌到约1万美元,浮亏91%。林俊杰在微博上晒出“空钱包”的图片,自我调侃:“听说最近很多人想帮我理财?”站长网2023-04-19 15:45:350000“踩雷”IRL后,孙正义再赌一把生成式AI
近日,号称“西方微信”的社交平台IRL宣布倒闭,目前其应用程序已从iOS应用商店中删除,官网也只留下一个页面,上面写着公司倒闭的通知,旁边是章鱼哥在墓前哭泣,墓碑刻着一段文字:WeLovedDoingMoreTogetheronLRL.com。图源:IRL官网截图比起平台的关闭,一项关于IRL用户造假的消息更令人咋舌。站长网2023-07-05 19:41:440001