找回密碼
 立即注册
『海燕策略研究論壇』溫馨提醒您 距离 2026 美 加 墨 世 界 杯 还有
000
:
00
:
00
:
00
吉祥坊吉祥坊KGameKGame
查看: 114|回復: 9

回看贴发现 第一次发的要写一个德州辅助ai 已经是2023年

[複製鏈接]
發表於 2020-9-12 17:20 | 顯示全部樓層 |閱讀模式

註冊論壇會員,發現更多精彩

您需要 登錄 才可以下載或查看,沒有賬號?立即注册

×
说一下 最近的进展吧,一直写的断断续续。原因归咎于: 如果是纯手工撸代码,很难让ai理解整个游戏的进程以及翻牌转牌河牌对于牌面的变化。而solver算法,刚好弥补了这个问题,因为在不断的互博中,已经把翻牌转牌和牌的价值都量化出来了。所以只能把目前是solver 解算的代码加起来,来解决这个问题。但是解算的速度比较慢,这是一个难点。目前暂时是实现了:多个 客户端实时获取游戏数据,读取玩家记录在h2n的范围,拼凑成解算数据,发送给B服务端,B服务端把解算数据分发给空闲的解算端,进行运算,因为多桌的关系,所以配置了多个解算服务器,如果是一个解算服务器同时解算两个,那么速度就会下降至少一半,所以只能租用多个服务器进行解算。相当于 多个客户端,对应多个解算服务器,由服务端进行分配。归功于 现在的比较牛逼大模型ai 写这些功能基本没用过脑子。接下来的思路就是几点 第一点就是 在初始解算的时候 粗略计算,这点在其他比较成熟的ai上面大致都是采用这种方式翻牌粗解算: 底池8 STR 和后手96 STR的情况下(这里是以PKW的 100个STR 200个bb) ,服务器 Bet 50Raise 也是50的尺度 仅保留一个bet尺度和一个Raise ,剥削程序1%的情况下 计算速度可以快到几秒内,电脑如果够好的话 估计能更快.。这点的灵感来一些ai系统他们 会进行分段式的计算。(这块已经实现了)当转牌的牌发出来之后,把翻牌面 双方的 范围牌weights 带入转牌进行计算 加上多个 25,50,75,100 , 计算都是1秒左右就能解算完 转牌河牌的结果。(这块今天写完)接下去的思路 就是既然gto相当于把行动进行了量化,读取h2n的数据,对玩家进行偏移, 诚实玩家的bet 把ev低于一定正值的进行弃牌(只保留坚果听牌,赔率不合适的就弃牌),喜欢诈唬的玩家把ev大于一定负值 保留进行跟注,把所有的偷鸡牌都进行放弃,等等一系列的设置。这是目前的的思路跟方向。已经完成了95% ,快完成了,聊聊大家思路 加提提意见。
海燕策略論壇,迴歸福利不斷
發表於 2020-9-12 17:40 | 顯示全部樓層
这种非对称信息博弈 可比围棋要复杂的多哦你要alphago公司deepmind来做 我绝得有限德州可能可以无限深码多人不可能的啦gto只是一个基于纳什均衡的理解 它不是一个剥削策略别浪费时间了哦 兄弟
海燕策略論壇,迴歸福利不斷
 樓主| 發表於 2020-9-12 17:53 | 顯示全部樓層
rui369369 发表于 2025-5-19 08:49这种非对称信息博弈 可比围棋要复杂的多哦你要alphago公司deepmind来做 我绝得有限德州可能可以无限深码 ...gto是相当于量化了过程,gto不是一个剥削策略,但是他会告诉你一手牌应该怎么打,首先要让软件学会如何打,然后再根据h2n的数据,对量化之后的ev进行偏移。就比一个新手学习扑克,他要知道每个行动转牌和河牌 对自己的利弊,而gto的算法从互相博弈中刚好把这个量化了。gto 解算之所以比较慢原因就在于 筹码深度会让创建的树几何增大,好比spr 5:1 单bet50的情况下创建的树,可能有几百个。但是如果是10:1 就是几万个,这只是单个bet 50%的情况下如果在多几个下注的选项,那么这个数量大的吓人,收敛时间自然也是很长。目前很多ai已经可以战胜人类了,大部分情况下还是都是100bb左右的游戏。
海燕策略論壇,迴歸福利不斷
發表於 2020-9-12 18:17 | 顯示全部樓層
gto 最大的贡献是为那些打的很agressive的玩家 打红线的情况下去bluff 提拱了很强的理论基楚gto理解环境是所有的对手都是gto玩家但现实的玩家池是个完全偏离的玩家池 你完全按它的量化去行为 很多时候就会太-ev而且会action会非常多单挑会好很多吧你会在哪里测试啊 但特别是像你如果 比喻rush多开 服务器会不会炸啊
海燕策略論壇,迴歸福利不斷
發表於 2020-9-12 18:26 | 顯示全部樓層
还是人脑优秀吧 耗能又低 又可以多线程做战还能根据环境 改变策略
海燕策略論壇,迴歸福利不斷
發表於 2020-9-12 18:50 | 顯示全部樓層
大兄弟别gto了 这个东西骗钱的东西 搞不成的你就用做alphago的思路来做啊先用海量的人类的人类牌普教它再做个比喻多少手数 百手bb 的价值选择 策略树然后再深度学习的的神经网络 不停学习那做成了你就是下个 王兴兴
海燕策略論壇,迴歸福利不斷
發表於 2020-9-12 18:58 | 顯示全部樓層
deepmind 后面2019年有搞一个alphastar用来打星际的也蛮成功的 腾讯也以它的思路做过一个星际跟poker基本上本质一样你可以去参考去研究下
海燕策略論壇,迴歸福利不斷
發表於 2020-9-12 19:19 | 顯示全部樓層
为什么是用实时计算,而不是像gtowizard那样,搞个手牌数据库呢?
海燕策略論壇,迴歸福利不斷
 樓主| 發表於 2020-9-12 19:41 | 顯示全部樓層
youngsdikode 发表于 2025-5-20 18:42为什么是用实时计算,而不是像gtowizard那样,搞个手牌数据库呢?手牌数据库,解算数据存储量太大了,解算出来的一个正常的bet 25,50,57,100是spr 10稍微精简的 都是5个G打底的数据量,而这个仅仅是一个牌面固定一个范围对抗一个范围精简后的等效牌面就是1755个,这就是1755*5G= 将近10个T,这仅仅是一个范围比如枪口open btn call的一个精简解算,而他gtow 他的更新精细远远不止5个g。加载到内存进行解析也是一个问题,5个g的数据 加到到内存里面,估计也得小几秒。翻牌前的范围对抗的范围就很多了,各个位置互相对抗就能衍生出来很多的范围对抗。他们应该是有一套存储读取算法,但是存储空间还是的这么大,一般个人还是很吃力的。最早之前考虑过,实现起来比较难度很大,需要大量的存储空间以及比较牛逼的读取算法,现实中很多玩家都是偏移反派前的范围都是有很大的区别,这样就显得不够灵活。
海燕策略論壇,迴歸福利不斷
發表於 2020-9-12 19:55 | 顯示全部樓層
很细致,确实很深入研究,不过实时运算的话挺耗时的。如果开发出来打算用在什么平台
海燕策略論壇,迴歸福利不斷
您需要登錄後才可以回帖 登錄 | 立即注册

本版積分規則

關閉

福利推荐上一條 /3 下一條

📢 重要聲明

服務條款

本討論區是以即時上載留言的方式運作,論壇對所有留言的真實性、完整性及立場等,不負任何法律責任。 而一切留言之言論只代表留言者個人意見,並非本網站之立場,用戶不應信賴內容,並應自行判斷内容之真實性。 於有關情形下,用戶應尋求專業意見(如涉及醫療、法律或投資/博彩等問題)。 由於本討論區受到「即時上載留言」運作方式所規限,故不能完全監察所有留言,若讀者發現有留言出現問題,請聯絡我們。 論壇有權刪除任何留言及拒絕任何人士上載留言,同時亦有不刪除留言的權利。 切勿撰寫粗言穢語、誹謗、渲染色情暴力或人身攻擊的言論,敬請自律。嚴禁直接以名稱公開批評任何機構或人士,或指名道姓地公開批評任何人仕、機構、公司。 嚴禁干擾或破壞本服務或與本服務相連線之伺服器和網路,破壞正常的對話流程、造成螢幕快速移動,或使本服務其他使用者無法打字,或對其他使用者參加即時交流的能力產生負面影響。 本網站保留一切法律權利。

廣告合作

你於本服務或經由本服務與廣告商進行通訊或商業往來,或參與促銷活動,包含相關商品或服務之付款及交付,以及前開交易其他任何相關條款、條件、保證或陳述,完全為你與前開廣告商之間之行為。 前開任何交易或前開廣告商出現於本服務所生之任何性質的損失或損害,你同意論壇不予負責。

📄 請點擊查看免責權聲明及重要事項

文章及附件由海燕策略研究論壇會員製作,以共享創意署名-非商業性-禁止衍生3.0通用版授權條款釋出。
授權條款所屬的司法管轄領域(通用版),上文連接是一份普通人可以理解的法律文本(許可協議全文)的概要。
© 海燕策略研究論壇 All Rights Reserved.

Archiver|手機版|小黑屋|*海燕策略研究論壇*

GMT+8, 2026-2-12 00:35 , Processed in 0.072958 second(s), 19 queries .

*海燕策略研究論壇*

© 2006-2026 All Rights Reserved.