老陈 發表於 2021-8-21 21:41

GTO应用之2:全进bluff

我们在《GTO应用之1: Bluff》帖子里论述了河牌圈满池下注的bluff和value的关系,并给出了它们之间的比例。本贴我们进一步论述河牌甲乙二人单挑时下注量与bluff频度之间的关系。锅里筹码:p甲value 频度:v甲bluff 频度:r下注量:b乙跟注频度:cp和b的计量单位为筹码数。v、r和c是纯数字。甲在河牌下注时,可能有4种情况:(1)value,乙跟注。EV1=vc(p+b)(2)value,乙弃牌。EV2=v(1-c)p(3)bluff,乙弃牌。EV3=r(1-c)p(4)bluff,乙跟注。EV4=-rcb把4种情况EV相加得到综合EV。EV=EV1+EV2+EV3+EV4=vc(p+b)+v(1-c)p+r(1-c)p-rcb=cpv+bcv+pv-cpv+pr-cpr-bcr=pv+pr+c(pv+bv-pv-pr-br)=pv+pr+c(bv-pr-br)当bv=pr+br时EV与乙跟注频度无关。即r/v=b/(p+b)这时的EV=pv+pr如果甲河牌都选择过牌,那么EV=pv。可见甲采用bluff策略EV增加pr。p是定数,增加的EV取决于r。也就是说r越大EV就越大。甲拿到好牌下价值注的频度v是不可改变的。根据r/v=b/(p+b),只有增大b,才能增大r。由此得出下注量越大越好,也就是说河牌全进是最优策略。下面看乙策略:EV=cpv+bcv+pv-cpv+pr-cpr-bcr=cpv+bcv+pv-cpv+r(p-cp-bc)当p=cp+bc时EV与甲bluff频度无关。c=p/(p+b)我们在《GTO应用之1: Bluff》帖子里论述过:GTO中的纳什均衡说的就是如果对弈双方都知道对手的策略,双方就都有一个最佳策略,任何一方率先改变自己的策略都不会给自己带来好处。如果甲增加bluff频度,即:r/v>b/(p+b)那么乙100%跟注,甲的EV下降。如果甲降低bluff频度,即:r/v<b/(p+b)那么乙永不跟注,甲的EV下降。如果乙增加跟注频度,即:c>p/(p+b)那么甲永不bluff,甲的EV增加。如果乙减少跟注频度,即:c<p/(p+b)那么甲增加bluff频度,甲的EV增加。

keybattle 發表於 2021-8-21 22:08

我来总结:就是value bet下注越大越好,value bet size越大可以加入更多的bluff,更多的bluff可以提高我们的ev.

990122851 發表於 2021-8-21 22:27

那么布拉夫呢多大合适呢?多少次呢?我觉得自已次数太多了,所以现在变紧弱了。

990122851 發表於 2021-8-21 22:32

价值注太大会赶走人了。

990122851 發表於 2021-8-21 22:57

这应是无法做得很好的地方,陈师付可否通俗讲下。

BBlifego 發表於 2021-8-21 23:06

总觉得哪里不对,按照r/v=b/(p+b),河牌all in,假如我all in尺度b无限大,那么r=0,即没有任何bluff频率。这个河牌全进最优策略的前提是频度不改变,但频度和下注尺度有关系

老陈 發表於 2021-8-21 23:26

数字化:(1)半锅下注:甲bluff和value比例:1:3乙跟注:2/3甲EV增加值:1/3 potsize(2)满锅下注:甲bluff和value比例:1:2乙跟注频度:1/2甲EV增加值:1/2 potsize(3)2锅下注:甲bluff和value比例:2:3乙跟注频度:1/3甲EV增加值:2/3 potsize(4)3锅下注:甲bluff和value比例:3/4乙跟注频度:1/4甲EV增加值:3/4 potsize(5)2/3锅下注:甲bluff和value比例:2:5乙跟注频度:3/5甲EV增加值:2/5 potsize

傻傻的鱼 發表於 2021-8-21 23:54

keybattle 发表于 2017-4-5 22:43我来总结:就是value bet下注越大越好,value bet size越大可以加入更多的bluff,更多的bluff可以提高我 ...如果value bet 尺寸总是2/3,bluff 尺寸也是2/3,理想的value:bluff ratio是3:1,villain弃牌的成本很小,因为hero很少诈唬。 而如果采用allin的尺寸,显然可以压缩对方的跟注频率,从而使得我们可以把ratio 成为1:1,对方跟注的成本增大,从而实现EV最大化。是这个意思吗?

老陈 發表於 2021-8-22 00:06

BBlifego 发表于 2017-4-5 09:24总觉得哪里不对,按照r/v=b/(p+b),河牌all in,假如我all in尺度b无限大,那么r=0,即没有任何bluff频率。 ...可能你计算有误。当b特别大时,b/(p+b)接近1。

老陈 發表於 2021-8-22 00:23

990122851 发表于 2017-4-5 09:17价值注太大会赶走人了。把对手赶走没有关系,你bluff不是同样赶走对手吗?value和bluff的关系是相互掩护。你bluff频度高了,对手就会怀疑,就会适当的跟注,这样你的value才会有人跟。如果你设想value对手就跟,bluff对手就扔,那就太一厢情愿了。
頁: [1]
查看完整版本: GTO应用之2:全进bluff