人工智能击败顶级电竞选手!DeepMind推AlphaStar Unplugged 通过离线学习掌握《星际争霸 II》玩法
文章概要:
游戏成为AI评估的试金石: 游戏一直是评估人工智能系统能力的重要场所,星际争霸II作为复杂的实时战略游戏,推动了AI在复杂性应用中的发展。
离线RL方法的革命性引入: AlphaStar Unplugged通过离线RL方法,在固定数据集上进行学习,首次打败顶级职业星际争霸选手,突破了在线RL在复杂游戏中的难题。
建立复杂环境RL基准: 通过AlphaStar Unplugged,构建了一个离线RL基准,使用固定数据集、新颖评估指标和基准代理,推动了大规模离线强化学习的研究,展示了连接模拟和实际应用之间的潜力。
DeepMind的研究人员近期推出了一项具有重大意义的成果:AlphaStar Unplugged。这一创新性研究通过实现离线强化学习,成功解决了星际争霸II这一实时策略游戏的巨大挑战,在人工智能领域迈出了重要一步。
长期以来,游戏一直是评估人工智能系统能力的重要试验场。随着人工智能技术的发展,研究人员开始寻找更复杂的游戏来评估与现实世界挑战相关的智能方面。星际争霸II,作为一款具有复杂性的实时战略游戏,成为了人工智能研究的巨大挑战,同时也促使AI技术在处理复杂问题上迈出更大的一步。
项目地址:https://github.com/deepmind/alphastar
与之前在其他游戏中取得的成就相比,这次的突破是基于离线强化学习(RL)的方法,这意味着AI代理在固定数据集上进行学习,而不需要与环境实时交互。星际争霸的复杂性使得在线RL方法难以应对,但这项研究成功地克服了这个挑战。通过AlphaStar程序,AI代理不仅击败了顶级职业选手,还在游戏玩法上达到了媲美人类的水平。
这一突破的核心在于建立了一个具有挑战性的离线RL基准。通过利用星际争霸II的海量人类玩家回放数据集,代理可以在不直接与游戏环境交互的情况下进行训练和评估。这一基准通过固定数据集和明确规则,引入了新颖的评估指标,为各种方法之间的公平比较提供了平台。研究团队还提供了一系列经过调整的基准代理,作为实验的起点。
通过AlphaStar Unplugged,研究人员不仅提供了这一突破性的方法,还认识到构建有效的星际争霸II代理所需的巨大努力。他们提供了经过精心调整的行为克隆代理,为论文中介绍的所有代理提供了基础。
总体而言,DeepMind的AlphaStar Unplugged引入了一个前所未有的离线RL基准,为解决复杂问题提供了新途径。通过利用星际争霸II这个复杂环境,这项研究为强化学习中的方法改进和性能度量设定了基准,同时也强调了离线RL在模拟与实际应用之间的潜力,为复杂环境下的代理训练提供了更安全、更实际的方法。这一成果将有望推动大规模离线强化学习研究取得更大进展。
奥特曼与OpenAI董事会展开回归谈判
据知情人士透露,OpenAI的董事会成员和临时首席执行官EmmettShear正在与被罢免的首席执行官SamAltman展开谈判,旨在让他重返这家人工智能初创企业主持大局。一位知情人士称,如果Altman回归,他仍将担任公司首席执行官。站长网2023-11-22 08:22:160000ChatGPT使用数据曝光 访问量和编程需求自5月开始持续下滑
近日,美国社交媒体分析公司SparkToro公布了一组关于ChatGPT使用情况的数据分析结果,发现ChatGPT的使用量和编程协助需求从5月份开始出现明显的下降趋势。站长网2023-09-14 21:40:310000支付宝生活号全面开放UGC入口
11月7日,据“支付宝开放平台”公众号消息,支付宝生活号全面开放UGC入口,支持用户在App首页第三Tab发布短视频内容。据悉,今年以来,支付宝生活号陆续上线了创作者中心、热点榜单等多个内容产品能力,还推出了多项内容激励政策。外界认为,支付宝正加快内容产品能力铺设和创作者生态建设。站长网2023-11-07 11:30:210001苹果首款折叠屏iPhone或2026年发布
在3月7日这一天,美国专利商标局对外公示了苹果一项备受瞩目的专利申请,该申请详细描绘了苹果未来折叠屏产品的设计蓝图,涵盖了iPhone、混合平板电脑笔记本电脑等多款创新产品。针对此项专利申请,苹果高层在接受AlphaBiz的采访时给出了回应。他们表示:“经过深思熟虑,公司决定推迟至2026年发布首款折叠屏iPhone,这一时间节点相较于我们内部的预期有所延后。”站长网2024-03-08 18:05:210000OpenDream开源 支持非破坏性的编辑
最近,一款名为OpenDream的新技术在GitHub中引起了大量的关注。OpenDream的核心优势在于,它为稳定扩散工作流带来了多种新的特性。项目地址:https://github.com/varunshenoy/opendream?utm_source=talkingdev.uwl.me站长网2023-08-17 10:29:440000