21点游戏的完整数学模型:从概率树到期望值全解析
21点(Blackjack)是少数几个可以用严格数学方式完整建模的赌场游戏。它的核心是一个有限状态的马尔可夫决策过程(Markov Decision Process),通过动态规划与巨量枚举可以计算出每一手牌的精确期望值(Expected Value, EV)。下面逐层拆解其数学框架。
一、游戏的基本状态空间
每一手牌的状态由三个变量唯一确定:
玩家的当前点数(Player’s Total)
- 硬牌(Hard):4 ~ 21
- 软牌(Soft):软12 ~ 软21(含A可当1或11)
- 已爆牌(Bust):>21
- Blackjack(天然21)
庄家的明牌(Dealer’s Upcard):2 ~ 10, J, Q, K, A
可行动选项(Actions)
- Hit(要牌)
- Stand(停牌)
- Double Down(加倍)
- Split(分牌,仅当点数相同)
- Surrender(投降,部分规则)
- Insurance(保险,当庄家明牌为A时)
总状态数(不考虑分牌)大约为:
- 玩家硬牌 18种(4 ~ 21)× 10种明牌 = 180
- 玩家软牌 10种(软12 ~ 软21)× 10 = 100
- 可分牌对 10种 × 10 = 100
- 特殊状态(已爆、Blackjack)
→ 总计约500 ~ 600个独立决策点
二、期望值的递归计算(动态规划核心)
21点的数学模型采用逆向归纳法(Backward Induction)从终端状态向前递推。
终端状态的即时回报(已知)
- 玩家爆牌 → EV = –1
- 玩家Blackjack且庄家非Blackjack → EV = +1.5
- 双方Blackjack → EV = 0(Push)
- 双方同点数且≤21 → EV = 0
- 玩家点数 > 庄家点数 → EV = +1
- 玩家点数 < 庄家点数 → EV = –1
庄家最终点数的分布(关键子程序)
对任意庄家明牌U,计算其最终点数分布P(dealer final = k | upcard = U)。
这是通过模拟庄家固定补牌规则(Hit ≤16, Stand ≥17)并枚举剩余牌堆得到的概率表。
示例:庄家明牌6的最终点数分布(8副牌,典型值)
| 庄家最终点数 | 概率 |
| 爆牌 | 42.08% |
| 17 | 13.52% |
| 18 | 13.48% |
| 19 | 13.44% |
| 20 | 13.40% |
| 21 | 4.08% |
单一步骤期望值计算公式
对于任意状态(玩家点数P, 庄家明牌U, 可行动A),要牌(Hit)的期望值:
EV_Hit(P,U) = Σ [概率抽到牌X] ×
┌───────────────────────────────────────┐
│ 如果 P+X >21 → –1 │
│ 如果 P+X ≤21 且可继续行动 → EV_best(P+X,U) │
│ 如果 P+X ≤21 且必须停牌 → EV_final(P+X,U)│
└───────────────────────────────────────┘
其中EV_best是该状态下所有行动中的最大值。
最终得到每一状态的最优策略与精确EV
通过迭代约10 ~ 20轮(因为最深补牌层数有限),即可收敛得到全表。
三、基本策略表的数学来源
著名的“基本策略图表”正是上述动态规划的输出结果。例如经典结论:
四、总期望值与庄家优势的精确计算
在无限副牌(Infinite Deck)近似下,或通过6 ~ 8副牌的组合数学枚举,可得到:
标准拉斯维加斯规则(8副牌,3:2 Blackjack,DOA,DAS,no RSA,Late Surrender)的精确值:
| 项目 | 期望值(每单位下注) |
| 初始发牌阶段EV | –0.00578 |
| 玩家最优策略总EV | –0.00432 |
| 庄家优势(House Edge) | 0.432% |
这意味着:严格执行基本策略的玩家,每下注100万元,理论长期亏损仅约4,320元。
五、算牌如何改变状态转移概率
算牌的核心是破坏“固定牌堆分布”假设。当True Count每上升+1:
- 剩余10与A比例上升 ≈ 0.5%
- 玩家Blackjack概率上升
- 庄家爆牌概率显著下降(因为少小牌)
- 玩家硬牌站牌策略价值剧增
经验证,True Count +1 时,玩家优势约增加 0.45% ~ 0.50%,从而实现优势逆转。
总结:21点的数学模型全景
- 状态空间:~ 600个决策点
- 核心算法:逆向动态规划 + 庄家点数分布子程序
- 输出:最优策略表 + 每状态精确EV
- 庄家原始优势:0.43% ~ 0.65%(规则而定)
- 通过策略与算牌,可将玩家优势推至 +2% 以上
21点之所以被誉为“唯一可长期战胜赌场的游戏”,正是因为它的数学模型足够透明、足够精确,让人类智慧得以对抗概率之神。
当你坐在牌桌前,真正与你对弈的不是庄家,而是这套冷酷而美丽的数学结构。
理解它,你就握住了21点真正的底牌。
