找回密碼
 立即注册
『海燕策略研究論壇』溫馨提醒您 距离 2026 美 加 墨 世 界 杯 还有
000
:
00
:
00
:
00
吉祥坊吉祥坊KGameKGame
查看: 90|回復: 9

人机大战:人类选手回天乏术

[複製鏈接]
發表於 2021-4-19 22:50 | 顯示全部樓層 |閱讀模式

註冊論壇會員,發現更多精彩

您需要 登錄 才可以下載或查看,沒有賬號?立即注册

×

214448lmwbrywokr4lbz2n.jpg

214448lmwbrywokr4lbz2n.jpg

本周一的比赛打完后,2017人机大战赛程也已经过半,这天,四位人类选手为自己挖了一个“天坑”。打完6.4万手牌后(共12万手),Jason Les、Dong Kim、Jimmy Chou和David McAulay现在水下近80万,共8000个大盲注。上周,人类选手有过反败为胜的迹象,当时一天就打回了三分之二的亏损,可惜之后又遭遇了滑铁卢。“机器人每天都在变得更强,”Chou说:“它就像是我们人类更难对付的版本。刚开始几天,我们有很大的希望,可每当我们发现一个它的弱点,它就会迅速从我们身上学习,然后第二天这些缺点就不见了。“Libratus是计算机科学专家Tuomas Sandholm和他的学生Noam Brown一起发明的,他们师徒俩最近几年推出过多款成功的扑克机器人。人类选手表示,Libratus河牌的处理能力比其它扑克机器人要强很多。它经常在河牌超底池全押诈唬或拿价值,非常具有迷惑性。每天比赛结束后,Libratus都会在匹兹堡超级计算机Center’s Bridges的帮助下进一步提高策略,特别是打到河牌的情况下。更多有关德州扑克新闻的精彩内容请关注扑克新闻,加入扑克新闻有惊喜。
海燕策略論壇,迴歸福利不斷
發表於 2021-4-19 22:53 | 顯示全部樓層
最强大脑里,人类也输给机器人。
海燕策略論壇,迴歸福利不斷
發表於 2021-4-19 23:25 | 顯示全部樓層
你确定这是德州不是围棋?棋类的计算是静态的,计算范围永远只能在固定的棋盘内,这样只要随着科技的进步,到电脑的计算力能穷举出棋盘内所有的变化那一天,电脑最终就能战胜人类。而德州是动态的,电脑只能从前面玩牌的数据计算出最优的决策,没有人类的创造思维。要是有新的数据样本加入,就相当于棋盘发生了变化,原来最优的决策不再是最优,而谁也无法预知棋盘接下来又会变成什么样。所以我认为电脑适应了那几个高手的套路,能稳定的战胜他们以后,这时候换几个菜鸟上去玩,电脑马上就会被干翻。而等到电脑再稳定干翻了菜鸟的时候,因为统计的样本又发生了变化,再让那几个高手回去玩,又能开始赢电脑了。可能这就是那个软件没有接受全网公测的原因吧。
海燕策略論壇,迴歸福利不斷
發表於 2021-4-19 23:42 | 顯示全部樓層
输神 发表于 2017-1-30 15:25你确定这是德州不是围棋?棋类的计算是静态的,计算范围永远只能在固定的棋盘内,这样只要随着科技的进步 ...虽然计算机没有穷举围棋的所有变化,alphaGO/Master也已经击败了人类。换人就能击败AI是很荒唐的。计算机只需要打好自己的牌(不管对手倾向如何),人类就束守无策了。
海燕策略論壇,迴歸福利不斷
發表於 2021-4-20 00:01 | 顯示全部樓層
每次看到这个战绩图就很蛋疼,因为它是反直觉的。总成绩是左边人类,右边AI,下面4行是分别的成绩。那详细成绩显然直觉应该是左边四行是四个人类,右边四行是四个AI,每一行是一个对决就像这样:人类总成绩:(xxxx)AI总成绩:xxxx人类1:aAI:-a人类2:bAI: -b人类3:cAI:-c人类4:dAI:-d没想到丫给分了四个象限。你非得分四个象限也行,至少这四个象限的颜色稍微区分开一点,至少的至少你把边框弄粗一点间距弄大一点,丫不,用非常统一的大红色,且基本无边框分割。
海燕策略論壇,迴歸福利不斷
發表於 2021-4-20 00:14 | 顯示全部樓層
Howard 发表于 2017-1-30 23:07每次看到这个战绩图就很蛋疼,因为它是反直觉的。总成绩是左边人类,右边AI,下面4行是分别的成绩。那详 ...额 同感 开始我都没看懂
海燕策略論壇,迴歸福利不斷
發表於 2021-4-20 00:24 | 顯示全部樓層
输神 发表于 2017-1-30 15:25你确定这是德州不是围棋?棋类的计算是静态的,计算范围永远只能在固定的棋盘内,这样只要随着科技的进步 ...比赛开始之前电脑就已经经过大量数据锻炼了吧 这样电脑就可以区分出高手和菜鸟 有针对性的应对
海燕策略論壇,迴歸福利不斷
發表於 2021-4-20 00:44 | 顯示全部樓層
gulugulubing 发表于 2017-1-31 00:38比赛开始之前电脑就已经经过大量数据锻炼了吧 这样电脑就可以区分出高手和菜鸟 有针对性的应对 ...要我猜的话,就是电脑初始策略是GTO,然后根据对局历史加入exploitive play。德州扑克的搜索状态太少了,比围棋少多了,能赢人类一点不稀奇。
海燕策略論壇,迴歸福利不斷
發表於 2021-4-20 00:58 | 顯示全部樓層
Jimihandrix 发表于 2017-1-30 22:45虽然计算机没有穷举围棋的所有变化,alphaGO/Master也已经击败了人类。换人就能击败AI是很荒唐的。计算 ...你说的很正确,因为人类分析以往数据去平衡GTO的能力永远不及电脑,一定会有弱点,在实战中必须长期游戏的前提下,电脑最终战胜人类。但是你混淆了一点,就是alphaGO和这个德州扑克AI击败人类的方式完全不相同。因为围棋是有常量的,就是那固定19X19的棋盘,是一定有一个计算的终点。哪怕是alphaGO通过现有的棋局库穷举精简了分支,但战胜人类最终靠的还是强大的静态计算能力,等到围棋完全被破解的那一天,alphaGO穷举精简了分支的做法反而是不完美会有漏洞的。而德州扑克没有常量,如果有那也只能是底池赔率和出牌概率,学完了基础知识,静态的计算就直接就到了终点。剩下的计算,比如通过范围和其它对手的数据找GTO,这个穷举也是没有极限的,哪怕你给所有对手都分类了,你也永远无法涵盖人与人不同的特点,这完全是一个动态,不能做到像围棋一样以穷举出所有变化作为目的进行计算。说的简单一点就跟猜剪刀石头布一样,这个德州扑克AI就和那个网上号称无敌的Veteran猜拳AI是一模一样的。为什么我说只要换人就可以击败电脑,因为GTO无法改变上一次胜负的结果,也永远只能根据以往的数据做出决策。所以只要保证永远都是对电脑AI进行第一次的squeeze剥削,等电脑在吸取了教训找到应对策略想squeeze剥削平衡回来的时候,突然换了一个人,以前的经验不适用了,这样又相当于第一次了,不断重复这种“第一次”从概念上来讲就可以打败电脑。而为什么我说的是换人,而不是让一个人变换风格,那是因为从心理学的角度深层面的习惯人自己无法发觉,会随着跟电脑长时间游戏被电脑给统计进去,自己却浑然不知,除非人格分裂了能完全变成两人。更进一步来讲,就算电脑把世界上每个人都统计了,可以单独战胜每一个人,但是这时候用快速的轮换的方式,同时保证换上的人是随机决定的,电脑不知道换了的人是谁,人却知道电脑的数据(就算不知道也不一定输,但可能会出现你瞎蒙出了一个剪刀,刚好前面那几位也出的是剪刀电脑早就准备好石头了,导致这一次未能squeeze剥削成功还蚀把米),电脑照样还是会被干翻。前提是人别犯基础知识的低级错误,比如把赔率胜率和出牌算错,剩下什么时候该squeeze,就跟你觉得什么时候出剪刀石头布一样。我数学很烂,只能用上面比较冗长的说法了,希望你能明白。
海燕策略論壇,迴歸福利不斷
發表於 2021-4-20 01:28 | 顯示全部樓層
我只问一句这种 Heads up有赌场的抽水没有 ,按照 pot 抽 。我不觉得 有抽水的时候 机器人能盈利。而且 这种 人类可以带shortstack 比如 15bb 上桌吗?要是可以 ,我不觉得在 有抽水 ,短码下 机器能把人类干翻 ,大不了一起输house take rake, house always win.
海燕策略論壇,迴歸福利不斷
您需要登錄後才可以回帖 登錄 | 立即注册

本版積分規則

關閉

福利推荐上一條 /3 下一條

📢 重要聲明

服務條款

本討論區是以即時上載留言的方式運作,論壇對所有留言的真實性、完整性及立場等,不負任何法律責任。 而一切留言之言論只代表留言者個人意見,並非本網站之立場,用戶不應信賴內容,並應自行判斷内容之真實性。 於有關情形下,用戶應尋求專業意見(如涉及醫療、法律或投資/博彩等問題)。 由於本討論區受到「即時上載留言」運作方式所規限,故不能完全監察所有留言,若讀者發現有留言出現問題,請聯絡我們。 論壇有權刪除任何留言及拒絕任何人士上載留言,同時亦有不刪除留言的權利。 切勿撰寫粗言穢語、誹謗、渲染色情暴力或人身攻擊的言論,敬請自律。嚴禁直接以名稱公開批評任何機構或人士,或指名道姓地公開批評任何人仕、機構、公司。 嚴禁干擾或破壞本服務或與本服務相連線之伺服器和網路,破壞正常的對話流程、造成螢幕快速移動,或使本服務其他使用者無法打字,或對其他使用者參加即時交流的能力產生負面影響。 本網站保留一切法律權利。

廣告合作

你於本服務或經由本服務與廣告商進行通訊或商業往來,或參與促銷活動,包含相關商品或服務之付款及交付,以及前開交易其他任何相關條款、條件、保證或陳述,完全為你與前開廣告商之間之行為。 前開任何交易或前開廣告商出現於本服務所生之任何性質的損失或損害,你同意論壇不予負責。

📄 請點擊查看免責權聲明及重要事項

文章及附件由海燕策略研究論壇會員製作,以共享創意署名-非商業性-禁止衍生3.0通用版授權條款釋出。
授權條款所屬的司法管轄領域(通用版),上文連接是一份普通人可以理解的法律文本(許可協議全文)的概要。
© 海燕策略研究論壇 All Rights Reserved.

Archiver|手機版|小黑屋|*海燕策略研究論壇*

GMT+8, 2026-2-11 11:24 , Processed in 0.078740 second(s), 22 queries .

*海燕策略研究論壇*

© 2006-2026 All Rights Reserved.