
阅读 0 讨论 0
从博弈论角度分析诈唬:特殊情况中的预期回报
德学院官方2020.05.06 发布
诈唬是扑克游戏中的重要组成部分,每一个优秀的玩家都应该牢记它。从不诈唬或者太频繁地诈唬,对一个扑克玩家来说都是巨大的错误。如何找到适当的平衡点?什么时候诈唬才是理想的选择?什么时候,以什么样的频率对某些玩家诈唬才能打出有收益的扑克呢? 这篇文章会涉及到诈唬的数学背景,并利用博弈论阐述一些可能的策略。 这篇文章的主要内容 • 数学背景 • 最佳策略 • 纳什均衡点 前面两点我们在前几天的文章中已经讨论过...今天,我们要说的是第三点: 一些特殊情况中的预期回报 下面是两张展示特殊情况中的预期回报的图表。第一张图表显示当你的听型牌失败时的预期回报,用给定的例子计算: 你的对手的预期回报是你的预期回报的负数,加上已经在底池中的$100。(他会得到你在下注轮的净损失,加上 现有的底池。当然如果你赢下底池的话,你的净损失是– $100,而他不会得到任何东西。来看看最简单的情况:当你的预期回报是0时,你的筹码量不会发生变化。因此你不会赢下底池,赢得底池的是你的对手。因为 我们已经玩到了河牌圈,所以这不是一个零和博弈。) 当你知道什么时候诈唬,什么时候价值下注,而对手却不知道时,对他来说(也可能对你),下面的这个图表 会更有用。这张表显示的是,综合你的获胜牌和失败牌之后的你的预期回报。在类似的情况中,你有20%的时候会领先,80%的时候会落后。因此你的平均预期 回报是 qEw + (1 – q)El. (这个结果的负值加上底池现有的$100是你的对手的预期回报Eop。) 结论 当你面对一个优秀的对手时,最好的选择就是利用纳什均衡点为你提供的策略:xopt。在这种情况你的对手会用 yopt的策略打牌。如果他没有,他就犯了错误(也说明他不是一个优秀的玩家),你可以利用他的错误找到最佳的打法。如果他经常跟注,就少诈唬他,如果他 很少跟注,就多诈唬他。如果你能猜测他的跟注频率,就可以根据预期回报最大化的原则,计算自己应该诈唬的频率。 附录 计算yopt的值 如果y = yopt,你的预期回报不会改变,无论x是多少。让我们先让x = 0,这时你什么牌也赢不了,公式是: El, x=0 = 0. 现在让x = 1. El的公式变为 El, x=1 = (1 – yopt)P – yoptB. 因为x=0和x=1时的预期回报是一样的,所以 (1 – yopt)P – yoptB = 0, 所以 (1 – yopt)P = yoptB, P – yoptP = yoptB, P = yopt(P + B), 最后 yopt = P/(P + B). 从对手的角度来看 现在让我们以对手的视角看看这个问题。首先我们要列出他的预期回报Eop。因为他不知道你是领先还是落后,所以他的预期回报还受q的影响,因此公式有一点复杂: Eop = – qyB + q(1 – y)0 + (1 – q)[xy(P + B) + x(1 – y)0 + (1 – x)P]. 第一项表示你有能取胜的牌,你下注,他跟注,并损失了这个跟注。第二项表示你持有能获胜的一手牌,但是他弃 牌,没有赢到或损失任何东西。剩下的部分表示他领先时的情况。方括号中的第一部分表示你诈唬,他跟注,他赢得底池和你的下注的情况。中间部分表示当你诈 唬,他弃牌时的情况,没有盈利和损失,最后一部分表示当你弃牌时,他赢得底池的情况(可能是他在你之后过牌,赢得摊牌,也可能是他下注,迫使你弃牌). 省略其中为0的部分,我们得到 Eop = (1 – q)[xy(P + B) + (1 – x)P] – qyB. 如果你的对手知道你从不诈唬(x = 0),那他的最佳打法是什么?他永远不会跟注,在上面的公式中如果用0代替x,我们得到 Eop x=0 = (1 – q)P– qyB. 为了使结果最大化,我们必须让y = 0 (永远不跟注)。 另一方面,如果你的对手知道你总是诈唬(x = 1),那他最好的回应就不那么明显了。如果x = 1,我们得到 Eop x=1 = (1 – q)y(P + B) – qyB = y[(1 – q)(P + B) – qB]. 如果 (1 – q)(P + B) – qB > 0, y = 1 (总是跟注)会最大化对手的预期回报。 如果 (1 – q)(P + B) – qB < 0, 他就应该使用 y = 0 (永远不跟注)的策略。 (1 – q)(P + B) – qB < 0 意味着 (1 – q)(P + B) < qB, P + B – qP – qB < qB, P + B < q(P + 2B), 最后 q > (P + B)/(P + 2B). 在我们的例子中,P = B = $100,如果q > 2/3,你的对手应该永不跟注(即使他知道你总是下注;因此在这种情况中你总是应该诈唬), 当q < 2/3时,他应该总是跟注(如果他知道你总是诈唬)。记住,这个q的值也仅取决于底池大小和下注大小。 计算xopt的值 如果x = xopt,你的对手的预期回报不会改变,无论y是多少。和之前一样,先让y = 0。Eop的公式为 Eop y=0 = (1 – q)(1 – xopt)P. 现在让y = 1。我们得到 Eop y=1 = (1 – q)[ xopt (P + B) + (1 – xopt)P] – qB. 因为y=0和y=1时的Eop是一样,我们得到 (1 – q)(1 – xopt)P = (1 – q)[ xopt (P + B) + (1 – xopt)P] – qB, 因此 qB = (1 – q) xopt (P + B) (两边都有(1 – q)(1 – xopt)P,因此可以消掉),所以最终我们得到 xopt = qB/[(1 – q)(P + B)]. 当我们讨论可能性时,我们通常用 0.2代替20%,用0.5代替50%等等。一件不可能的事件发生的可能性是0 (0%),一件确定的事发生的可能性是1 (100%)。剩下的其他事件发生的可能性在0和1之间。 - 0
- 0
- 0
- 0
免费赛火热展开!!500倍超高回报全新『十二生肖系列赛』
德学院官方2020.02.21 发布
亿濠扑克是GGPOKER同属的专业赛事平台,是全球最受欢迎的线上扑克平台,知名牌手Bryn Kenney、Daniel Negreanu(丹牛)皆为签约明星牌手。除了创新与经典玩法并进,平台也支援多开桌、股份买卖、扑克记录等智能系统,让广大扑克玩家在游戏中感受最纯正的扑克体验。 亿濠扑克回馈所有会员,除了锦标赛之外,整个二月,周一到周五,天天三场!规划了『短牌、奥马哈、经典德扑』免费赛! 意味着周一到周五广大牌友都可以享受免费打扑克的乐趣!赶紧把握机会,马上注册体验吧! 优质赛事门票福利放送 除了免费赛之外,本周加入亿濠扑克的玩家,只要透过下方二维码新注册的用户,有机会获得,保底奖励3000全新的「中国十二生肖系列赛-鼠」门票一张!,每日限量!赶紧把握机会,马上注册体验吧! 周保底总奖励200万~全新『十二生肖系列赛』 全新『十二生肖系列赛』是亿濠扑克专为国人订制的系列赛,运用中国十二生肖规划不同的赛制,部分赛事保底提升了近10倍,最低10元即可报名,每日除了30万保底之外,周日场的主赛报名不变,保底提高到25.8万。 常规赛:9人桌无限注德州扑克常规赛 赏金赛:淘汰一名玩家,获得悬赏金 快速赛:涨盲时间较快的快速赛 豪客赛:破万保底高报酬的豪客赛 真功夫:无法重购一条命真功夫赛制 生肖主赛:每晚八点,周一到周六奖励18.8万,周日25.8万,报名388。 详细十二生肖系列赛赛程表~ 生肖之王周日主赛~融入明星牌手 每周日晚上八点的『生肖之王主赛』除了奖励提升到25.8万之外,还邀请了亿濠扑克合作的明星牌手一同入场,展开趣味十足的『名人猎杀赛』,只要388入场,除了争夺25.8万保底奖励之外,猎杀名人还可额外获得『GG大师赛150刀门票』,每周日都吸引许多玩家参赛!现在你可以直接报名,同时享有泡沫保护! 签约明星牌手Daniel Negreanu(丹牛)推荐 体验专业、有趣、安全的国际平台就到亿濠扑克 关于亿濠扑克 亿濠扑克是GGPOKER同属的专业赛事平台,知名牌手Bryn Kenney、Daniel Negreanu(丹牛)皆为签约明星牌手。亿濠扑克在GGS系列赛推出史上最高保底3.5亿奖励打响知名度!除了多种锦标赛之外,也结合全国线下重点赛事。独特的3D咪牌与手牌结合宾果,为喜爱德州扑克的玩家带来更多有趣的玩法~体验专业、有趣、安全的国际平台就到亿濠扑克。 - 0
- 0
- 0
- 0
宅在家中以牌会友!首选500倍超高回报『亿濠生肖系列赛』
德学院官方2020.02.10 发布
由于本次肺炎形式较为严峻,导致大家无法出门娱乐,待在家中首选打线上比赛,避开人群安全第一!抗”疫”期间,亿濠扑克为大家规划了多种精采赛事与福利活动,让各位伙伴享受电竞乐趣之外,既能消磨时间又能获得额外奖励。疫情在前,转换心情,当做给自己一个特殊的假期,照顾玩家亿濠最优质,打德州就来亿濠扑克! 共同抗”疫”期间,亿濠扑克推出全新『中国十二生肖』系列赛,每日保底30万起,部分赛事保底提升近10倍,最低报名只要10元赛事。 每日保底316,500 周日奖励提升386,500 额外奖励『苹果11 PRO MAX』 每周总奖励228万 元宵免费赛~亿濠扑克牌手与你共同抗”疫” 元宵赛事一箩筐,共同欢庆元宵,于2020年2月8日16:00「元宵免费赛」正式开赛,仅只有一天,请各位玩家把握机会。同场加码「猎杀汤圆」,知名牌手将化身为汤圆,当天参加比赛并猎杀知名牌手,即可获得「生肖之王388门票」乙张。汤圆将随机出现在你身边,猎杀他们拿大奖呗!元宵娱乐首选!现在只要注册亿濠扑克就可获得门票 人人有奖! 一块推推乐,百万门票轻松拿 即日起,用您最幸运的1元硬币来推一推,高额赛事门票绝对是+EV的好玩赛事,轻松报名结果立刻显见,门票立刻到,简单快又有效率,赶紧登录游戏中一起来推一推。 扫描二维码加入会员,现在大家都可以体验各种德州扑克带来的魅力! 关于亿濠扑克 亿濠扑克是GGPOKER同属的专业赛事平台,知名牌手Bryn Kenney、DanielNegreanu(丹牛)皆为签约明星牌手。亿濠扑克在GGS系列赛推出史上最高保底3.5亿奖励打响知名度!除了多种锦标赛之外,也结合全国线下重点赛事。独特的3D咪牌与手牌结合宾果,为喜爱德州扑克的玩家带来更多有趣的玩法~体验专业、有趣、安全的国际平台就到亿濠扑克。 - 0
- 0
- 0
- 0
从博弈论的角度分析诈唬(2):特殊情况中的期望回报
德学院官方2019.07.22 发布
今天,我们要说的是第三点: 一些特殊情况下的期望回报 下面两张表显示了特殊情况中的期望回报。 第一张图表示的是听牌失败时的期望回报,用上一篇文章的例子来计算: 对手的期望回报是你的期望回报的负数,再加上已经在底池中的$100。 他会得到你在下注轮的净损失+现有底池。当然如果你赢下底池的话,你的净损失是– $100,他没有回报。 来看看最简单的情况:当你的期望回报是0时,你的筹码量不会发生变化,因此你不会赢下底池,底池会被对手赢走。由于我们已经玩到河牌圈,所以这不是一个零和博弈。 如果你知道什么时候诈唬,什么时候价值下注,而对手却不知道,对他来说(也可能是对你),下面的这个图表会更有用。 这张表显示的是综合获胜和失败之后,你的期望回报。我们假设过,你有20%的时候领先,80%的时候落后,因此你的平均期望回报是 qEw + (1 – q)El。(这个结果的负值+底池现有的$100=对手的期望回报Eop。) 结论 当你面对优秀的对手时,最好的选择就是利用纳什均衡点为你提供的策略:xopt。在这种情况对手会用 yopt的策略打牌。如果他没有使用,他就在犯错(也说明他不是一个优秀的玩家),你就可以利用他的错误找到最佳的打法。 如果他经常跟注,你就少诈唬,如果他很少跟注,你就多诈唬。如果你能猜到他的跟注频率,就可以根据期望回报最大化的原则,计算自己应该诈唬的频率。 附录 ◆◆yopt是怎样计算的◆◆ 如果y = yopt,无论x是多少,你的期望回报都不会改变。让我们先假设x = 0,这时你什么牌也赢不了,公式是: El = 0 现在假设x = 1,El的公式变为 El = (1 – yopt)P – yoptB 因为x=0和x=1时的期望回报一样,所以 (1 – yopt)P – yoptB = 0, 所以 (1 – yopt)P = yoptB, P – yoptP = yoptB, P = yopt(P + B), 最后 yopt = P/(P + B) ◆◆从对手的角度来看◆◆ 现在我们从对手的视角看看这个问题。 首先我们要列出他的期望回报Eop。由于他不知道你的牌是领先还是落后,所以他的期望回报还会受到q的影响,所以这个公式会复杂一点: Eop = – qyB + q(1 – y)0 + (1 – q)[xy(P + B) + x(1 – y)0 + (1 – x)P] – qyB 表示你有优胜牌,你下注,他跟注,并且输了。 q(1 – y)0表示你有优胜牌,但是他弃牌,没有输赢。 (1 – q)[xy(P + B) + x(1 – y)0 + (1 – x)P]是他领先时的情况。 方括号中xy(P + B)表示你诈唬,他跟注,他赢得底池和你的下注。 x(1 – y)0 表示你诈唬,他弃牌,没有盈利和损失。 (1 – x)P表示你弃牌,他赢下底池的情况(包括他过牌赢下摊牌和他下注你弃牌两种情况) 省略其中为0的部分,我们得到 Eop = (1 – q)[xy(P + B) + (1 – x)P] – qyB 如果对手知道你从不诈唬(x = 0),那他的最佳打法是什么?他永远不会跟注,在上面的公式中如果用0代替x,我们得到 Eop x=0 = (1 – q)P– qyB 为了使结果最大化,我们必须让y = 0 (永远不跟注)。 反过来,如果对手知道你总是诈唬(x = 1),那他就很难找到最佳应对方式了。如果x = 1,我们得到 Eop x=1 = (1 – q)y(P + B) – qyB = y[(1 – q)(P + B) – qB] 如果 (1 – q)(P + B) – qB > 0, y = 1 (总是跟注)会让对手的期望回报最大化。 如果 (1 – q)(P + B) – qB < 0, 他就应该使用 y = 0 (永远不跟注)的策略。 (1 – q)(P + B) – qB < 0 意味着 (1 – q)(P + B) < qB, P + B – qP – qB < qB, P + B < q(P + 2B), 最后 q > (P + B)/(P + 2B) 在我们的例子中,P = B = $100,如果q > 2/3,对手应该永不跟注(即使他知道你总是下注;因此在这种情况中你总是应该诈唬), 当q < 2/3时,他应该总是跟注(如果他知道你总是诈唬)。记住,这个q的值也仅取决于底池大小和下注大小。 ◆◆xopt是怎么计算的?◆◆ 如果x = xopt,那么无论y是多少,对手的期望回报都不会改变。和之前一样,先假设y = 0。Eop的公式为 Eop = (1 – q)(1 – xopt)P 现在假设y = 1,我们得到 Eop = (1 – q)[ xopt (P + B) + (1 – xopt)P] – qB 因为y=0和y=1时的Eop一样,我们得到 (1 – q)(1 – xopt)P = (1 – q)[ xopt (P + B) + (1 – xopt)P] – qB, 因此 qB = (1 – q) xopt (P + B) (两边都有(1 – q)(1 – xopt)P,因此可以消掉),所以最终我们得到 xopt = qB/[(1 – q)(P + B)] 当我们讨论频率时,我们通常用 0.2代替20%,用0.5代替50%等等。一件不可能的事件发生的可能性是0 (0%),一件确定的事发生的可能性是1 (100%)。剩下的其他事件发生的可能性在0和1之间。 - 0
- 0
- 0
- 0

加载中...