首页 > 地球物理学 > 桔灯勘探  > 正文 

DeepMind新计划:训练AI玩一款比下棋更难的牌类游戏

桔灯勘探 20分钟前

如果你曾经玩过卡牌游戏 Hanabi,那么你就会明白这款游戏与其他游戏相比的特殊之处。这是一款需要协作的游戏,而且尤其特殊的是,在这款游戏里,你可以看到所有其他人的牌,却唯独看不到自己的牌。

为了在这一游戏中获胜,每个玩家需要给其他玩家相应的提示,以便每个玩家能够按照特定顺序排列自己所有的牌,而且必须要在有限的出牌轮次中。这一过程实际上是一系列对于战略、推理和合作的强大考验和训练。也正是因为这一原因,Google Brain 和 DeepMind 公司的研究人员都把这一游戏认作是值得人工智能下一步去挑战的完美游戏。

DeepMind新计划:训练AI玩一款比下棋更难的牌类游戏

在最近的一篇新论文中,这两家公司的研究人员们指出,Hanabi 和到目前为止人工智能已经学习训练过的如国际象棋,围棋和扑克等其他游戏不同,Hanabi 这一游戏需要玩家掌握的还有心理学原理和更高层次的推理。这里说到的心理学原理是指需要理解其他人的心理状态 – 尤其是要理解其他玩家很有可能与自己的心理状态非常不同。理解人的心理是实际上是人类自身其整个群体得以在这个世界上有效运作所需的一项基础技能,它也是一项我们在很小的时候通常就已经掌握的技能。

在 Hanabi 这一游戏中,玩家可以获得的信息十分有限,仅仅是其他玩家提供给自己的有限的提示以及这一提示中所包含的其他隐形信息。因此,为了赢得这一游戏,人工智能必须学会从其他玩家的行动中获取隐含信息——对于人工智能来说,这是之前从来没有遇到过的挑战。

此外,人工智能还必须学习如何在自己提示和行动中为其他的玩家提供最大可能的信息量,来帮助其他玩家成功。研究人员认为,如果人工智能能够在这种不完善的信息环境赢得游戏,人工智能也将可以与人类进行更加有效的合作。

上面所说的这些都是人工智能研究界正在面临的新挑战,为了解决这些问题,需要新的算法进步,来将人工智能的几个子领域的工作彼此互相联系起来,包括强化学习、博弈论等,也将需要进行有关协作环境中多个人工智能之间如何进行“沟通”的研究学习。

为了证实人工智能可以协同工作的这一假设,谷歌团队测试了当前最先进的所有强化学习算法,结果发现,现有的算法的表现并不理想。现在,他们新发布了一个开源的 Hanabi 环境,来促进人工智能研究界的进一步工作和进展。

“作为一名研究人员,我对人工智能如何可以学会彼此沟通和合作,甚至最终与人类进行交流这一课题非常感兴趣,”该论文的共同作者之一 Jakob Foerster 说。“而 Hanabi 这一游戏可以为这一重大挑战提供了十分合适的独特的机会。”

桔灯勘探

关注科学、技术以及产业。

+关注
粉丝 5
浏览量 115

0评价

卧卧

你的校园头条都在这里

立即打开