Science

植物&动物 | 生态&环境 | 大脑&行为 | 健康 | 技术 | 科学&政策 | 进化 | 古生物学 | 细胞 | 分子 | 基因&蛋白 | 遗传&发育 | 生物化学 | 生物物理 | 免疫 | 人物&事件 | 微生物学 |
当前位置: Science » 技术 » Science:AI在德州扑克游戏中打赢人类高手

Science:AI在德州扑克游戏中打赢人类高手

摘要 : 2017年3月2日,国际顶尖学术期刊《Science》杂志上在线发表了加拿大阿尔伯塔大学计算机系Matej Moravík研究员的一篇研究论文,论文报告了研究人员开发的一个人工智能(AI)系统在终极、无限德州扑克中比赛战胜了人类。

2017年3月2日,国际顶尖学术期刊《Science》杂志上在线发表了加拿大阿尔伯塔大学计算机系Matej Moravík研究员的一篇研究论文,论文报告了研究人员开发的一个人工智能(AI)系统在终极、无限德州扑克中比赛战胜了人类。而在几星期前,另一AI系统则在德州扑克单挑中战胜了人类。

近年来,人工智能获得数次突破,在诸如国际象棋和围棋等游戏中战胜人类。不过,这些游戏的一个共同特点是,棋手可能有完整信息。但扑克不同,让这种游戏难得多的原因是每个玩家对可能的玩法有着不对称的信息。

Matej Moravík研发了一个被称为DeepStack的AI系统,它在每3000次无限德州扑克比赛后,具有统计意义地打败了11名职业扑克选手中的10名(它也打败了第11名选手,但结果不具有统计学显著意义)。

研究人员表示,在游戏的每个时间点,DeepStack会重新计算游戏策略,而不是将可能玩法计算到最后。它对允许进行的玩法深度和类型做了限制。这将可能的决策点从超过10160个减少至大约107个,DeepStack的电脑芯片能在5秒钟内完成决策。

这种AI系统将有助于解决涉及信息不对称的现实世界问题,例如捍卫战略资源和做出重要的医疗建议等。

原文链接:

DeepStack: Expert-level artificial intelligence in heads-up no-limit poker

原文摘要:

Artificial intelligence has seen several breakthroughs in recent years, with games often serving as milestones. A common feature of these games is that players have perfect information. Poker is the quintessential game of imperfect information, and a longstanding challenge problem in artificial intelligence. We introduce DeepStack, an algorithm for imperfect information settings. It combines recursive reasoning to handle information asymmetry, decomposition to focus computation on the relevant decision, and a form of intuition that is automatically learned from self-play using deep learning. In a study involving 44,000 hands of poker, DeepStack defeated with statistical significance professional poker players in heads-up no-limit Texas hold’em. The approach is theoretically sound and is shown to produce more difficult to exploit strategies than prior approaches.

来源: Science 浏览次数:0

我们欢迎生命科学领域研究成果、行业信息、翻译原创、实验技术、采访约稿。-->投稿

RSS订阅 | 生物帮 | 粤ICP备11050685号-3 ©2011-2014 生物帮 Science  All rights reserved.