找回密碼
 立即注册
『海燕策略研究論壇』溫馨提醒您 距离 2026 美 加 墨 世 界 杯 还有
000
:
00
:
00
:
00
吉祥坊吉祥坊KGameKGame
查看: 118|回復: 9

颤抖吧,人类连德州扑克都玩不过电脑了

[複製鏈接]
發表於 2021-6-16 08:28 | 顯示全部樓層 |閱讀模式

註冊論壇會員,發現更多精彩

您需要 登錄 才可以下載或查看,沒有賬號?立即注册

×
这是来自果壳网上的一个文章 , 我现在就去和那个人工智能打打看。原文地址你们自己搜原文 ---------------------------半个多世纪以来,各类游戏一直是人工智能(Artificial Intelligence, AI)发展创新的温床,而人工智能技术也不负众望地取得了各种突破——著名的深蓝(Deep Blue)在国际象棋比赛中击败了卡斯帕罗夫,IBM开发的超级计算机沃森(Watson)也在《危险边缘》(Jeopardy!)节目中战胜了该节目的两名总冠军詹宁斯和鲁特尔。然而,能击败人类的顶尖选手并不代表能将游戏破解。而现在,来自加拿大阿尔伯塔大学理学院计算机-扑克研究小组的研究者们首次破解了双人限注德州扑克(heads-up limit Texas hold'em poker)的决胜法门。所谓游戏的破解,是指当游戏双方都以最优策略进行博弈时,能够在任一阶段准确预测博弈结果——胜、负或平局。游戏的破解分为几个不同的层次,比如井字棋就属于已被“强解决”的游戏,在任何阶段,我们都知道玩家的最优策略。而这一次,阿尔伯塔大学的迈克尔·鲍林(Michael Bowling)教授和同事对双人德州扑克进行了“弱解决”——他们能得知在起始情况下,怎么样能保证必不败。“40年多来,扑克类游戏一直是人工智能领域的挑战课题,直到今天为止,双人德州扑克问题才得到破解。”鲍林说。以他为第一作者发表的论文今天发表在《科学》杂志上。以正常人玩牌的速度,一个人类跟鲍林的程序单挑限注式德州扑克,就算花一辈子也无法得到统计学上显著的胜利。图片来源:Science德州扑克(Texas Hold'em Poker)是目前扑克游戏中最受欢迎的一种。游戏使用52张牌,没有大小王。每位牌手得到2张牌面朝下的“底牌”,荷官则陆续发出5张牌面朝上的“公共牌”。在限注式德州扑克的两人局中,先手玩家可以根据场上局面选择投注或者盖牌认输,而后手可以选择跟注、加注或者盖牌。如果最后一轮喊注后仍胜负未分,游戏将进入“斗牌”阶段:每名牌手从自己的底牌加上桌面的公共牌共7张牌中,选出最大的5张牌组合决定胜负。由于在德州扑克中,玩家们无法获取已发生事件的全部信息,诸如对手的底牌,因此这个游戏属于“不完美信息”(Imperfect Information)类游戏。虽然德州扑克的缺失信息比西洋跳棋少,但是这种不完美信息的特质使得双人德州扑克成为难度远远更高的人工智能挑战项目。研究者表示,要破解这样的游戏,势必需要更大的计算机记忆和计算能力。然而更重要的是算法。鲍林和同事开发了一个叫CFR+的算法,这种算法是CFR算法(counterfactual regret minimization,虚拟遗憾最小化)的一个变体,从使遗憾最小化的角度学习最优的博弈策略。鲍林表示:“我们工作的主要突破是基础算法的改良。这意味着,在任意形式的大规模模型里,基于博弈论的推理将变得更加容易。”这个算法的表现怎么样?鲍林解释说:“想象一下一个人每小时玩200局扑克,每天玩12小时,70年从未有一天间断。进一步假设他时刻考虑最差的情形,争取最大程度的胜利,采取针对性的策略,并永远不出现一次失误。”他们的程序每秒进行24万亿局,连续操作两个月,结果提示他们基本破解了这个游戏。现在,网友们可以在阿尔伯塔大学的网页上与这个叫Cepheus(仙王座)的程序交手。虽然听起来很好玩,博弈论其实一直被寄望于处理一些严肃的问题——在安全领域,博弈论的应用已掀起热潮,例如机场检查点的设置、飞机起落的次序和警卫的巡逻中都有博弈论的身影。在真实世界中,我们往往需要在信息不足或不确定时做出决定,有了更好的博弈论算法,我们才能更好地解决未来的实际问题,正如鲍林试图解决德州扑克问题一样。(编辑:Calo)
海燕策略論壇,迴歸福利不斷
發表於 2021-6-16 08:41 | 顯示全部樓層
这其实是一系列进展中的一个里程碑。对于有限注,HU这样比较有定式的德州扑克来说,AI已经比人有优势。但这主要是因为这种游戏本身有比较简单的平衡策略,无法被攻击。换做多人,或者无限注,AI就不具备优势了
海燕策略論壇,迴歸福利不斷
發表於 2021-6-16 08:52 | 顯示全部樓層
http://www.sciencemag.org/content/347/6218/145
海燕策略論壇,迴歸福利不斷
發表於 2021-6-16 09:18 | 顯示全部樓層
学术性不好置评,不过自然/科学是倾向 话题性 论文,这也许是得以刊载的原因之一
海燕策略論壇,迴歸福利不斷
發表於 2021-6-16 09:25 | 顯示全部樓層
这个属于标题党了。对于计算机来说,有限单挑跟普通的德州牌局难度上根本不是一个量级的。
海燕策略論壇,迴歸福利不斷
發表於 2021-6-16 09:52 | 顯示全部樓層
science早已经被wow党攻陷了,扑克党来抢地盘居然从算法入手,真是太小儿科了。怎么也得和云计算沾亲带故才好意思说是主流科研啊....
海燕策略論壇,迴歸福利不斷
發表於 2021-6-16 09:59 | 顯示全部樓層
我看过一个量化的比较,有限注的HU是10的13次方无限注的多人是10的161次方
海燕策略論壇,迴歸福利不斷
 樓主| 發表於 2021-6-16 10:12 | 顯示全部樓層
鱼丸粗面 发表于 2015-4-30 16:00我看过一个量化的比较,有限注的HU是10的13次方无限注的多人是10的161次方 ...可是这个所谓无限注,在现实中还是有限的,普通的200-300bb最多没人打超过500bb的吧只要计算量能在100bb里面解决问题, 还是很可怕的, 毕竟很多玩家都是打100bb
海燕策略論壇,迴歸福利不斷
發表於 2021-6-16 10:40 | 顯示全部樓層
星辰德鲁伊 发表于 2015-4-30 16:57可是这个所谓无限注,在现实中还是有限的,普通的200-300bb有限还是无限指的是下注的额度而不是指你的buying
海燕策略論壇,迴歸福利不斷
發表於 2021-6-16 10:53 | 顯示全部樓層
人怎么打得过电脑?电脑-记忆力--ABC 扑克的分析能力- bankroll manngement- 不会Tilt- 没有tells-不会饿, 不用上厕所人就Bluff 强点
海燕策略論壇,迴歸福利不斷
您需要登錄後才可以回帖 登錄 | 立即注册

本版積分規則

關閉

福利推荐上一條 /3 下一條

📢 重要聲明

服務條款

本討論區是以即時上載留言的方式運作,論壇對所有留言的真實性、完整性及立場等,不負任何法律責任。 而一切留言之言論只代表留言者個人意見,並非本網站之立場,用戶不應信賴內容,並應自行判斷内容之真實性。 於有關情形下,用戶應尋求專業意見(如涉及醫療、法律或投資/博彩等問題)。 由於本討論區受到「即時上載留言」運作方式所規限,故不能完全監察所有留言,若讀者發現有留言出現問題,請聯絡我們。 論壇有權刪除任何留言及拒絕任何人士上載留言,同時亦有不刪除留言的權利。 切勿撰寫粗言穢語、誹謗、渲染色情暴力或人身攻擊的言論,敬請自律。嚴禁直接以名稱公開批評任何機構或人士,或指名道姓地公開批評任何人仕、機構、公司。 嚴禁干擾或破壞本服務或與本服務相連線之伺服器和網路,破壞正常的對話流程、造成螢幕快速移動,或使本服務其他使用者無法打字,或對其他使用者參加即時交流的能力產生負面影響。 本網站保留一切法律權利。

廣告合作

你於本服務或經由本服務與廣告商進行通訊或商業往來,或參與促銷活動,包含相關商品或服務之付款及交付,以及前開交易其他任何相關條款、條件、保證或陳述,完全為你與前開廣告商之間之行為。 前開任何交易或前開廣告商出現於本服務所生之任何性質的損失或損害,你同意論壇不予負責。

📄 請點擊查看免責權聲明及重要事項

文章及附件由海燕策略研究論壇會員製作,以共享創意署名-非商業性-禁止衍生3.0通用版授權條款釋出。
授權條款所屬的司法管轄領域(通用版),上文連接是一份普通人可以理解的法律文本(許可協議全文)的概要。
© 海燕策略研究論壇 All Rights Reserved.

Archiver|手機版|小黑屋|*海燕策略研究論壇*

GMT+8, 2026-2-11 04:57 , Processed in 0.063341 second(s), 19 queries .

*海燕策略研究論壇*

© 2006-2026 All Rights Reserved.