必胜策略,围棋之道

巡山小妖精
577次浏览
2021年01月18日 14:47
最佳经验
本文由作者推荐

行尸走肉电视剧-爱祖国爱家乡手抄报

2021年1月18日发(作者:饶漱石)
必胜策略,围棋之道








在职业围棋圈,一部分棋手自称“求道派”。“道”者,
终极真理是也。与“棋道” 如影随形,“围棋上帝”、“围棋之神”
也是棋手和棋迷常挂在嘴边的两个概念。在上一章节我们讲到,围棋之多变如恒河沙数,非人力所能及。思及此,棋迷
朋友可能会诘问,围棋的终极真理是否存 在,“围棋上帝”到
底会怎样下棋。笔者将在本文解答这两个问题。
(本文部分
内容参 考了笔者的其它回答)

1
、小学生的游戏


围棋,终究 还是个游戏。欲知围棋之
道,我们可以先从研究一个简单的游戏入手。抢三十,一个
酒桌上的小 游戏,
也是一道小学奥数题。
它的规则是这样的:


甲和乙从1
开始轮流报数,每次可以报
1

2

3
个数 。比
如甲报
1,2
;乙报
3,4,5
,甲报
6
,乙 报
7,8.
报出“30”这个数
字的玩家获胜。


抢三 十的诀窍,说来也不难,只需用到
一点逆向思维。如果甲想抢到
30
,一定不能以29
收尾,否
则乙下回合可以直接抢到
30
。同理,甲也不能以
28

27
收尾,不然乙也能直接抢到
30.
不过,若是甲以
26
收尾,
则乙在下一回合必然抢不到
30. 不仅如此,
乙下一回合必然

27,28,29
三者之一收尾。
这样一来,
轮到甲的时候,
甲必
然能抢到
30.
因此,甲抢到26
就可以保证获胜。同理,想
要抢到
26
,甲必须抢到
22< br>、
18

14

10

6

2.
我们以下
图示意:


以红色的
30
为最 终目标,
橙色的
26

22
等数
是兵家必争之地,而白色的
27

28

29
等数,只能过站,
不可以停留。
甲玩家只需一路占领
2

6

10

14

18

22

26
这一串等差数列,即可将胜利 收入囊中。

小结一下。抢
三十这个游戏,先手方(即先报数的甲玩家)有必胜策略,
而且可以用数学语言精确地描述:先手方先报
1,2
;之后,
若后手方报n
个数(
n=1,2

3

,则先手方立即回以
4-n

数。
最终,
先手方总能抢到
30.


在博弈论

Game Theory

中,
数学家把像22

26
这些游戏中的“兵家必争之地”,
称作
必胜局面(< br>Winning Position

。换句话说,抢到必胜局面的
一方,即可 稳操胜券。相应的,像
27,28,29
这样的节点,在
此停留就会失败,被称为必败 局面


Losing Position

.


这个策略说来容易,
却隐藏着许多变化。
举个例子。
甲报
1,2

乙报
3,4
;这是一个回合。每一个回合,甲都会占领一个新
的必胜节点。七个回合结束以后,甲才能抢到
30.
每一个回
合中,乙可以报一个 、两个或三个数,各有三种选择。根据
乘法原理,六个回合中,乙共有
3*3*3*3*3*3 *3=3^7=2187
种策略的组合。只不过,乙的变化再多,也逃不出甲的手掌
心。


那么,如果甲和乙抢的不是三十,而是每次可以报
1-299
个数字, 报出
1,000,000
者为胜呢?依样画葫芦,我
们仍可以为先手方找到必胜策略: 先手方只需先报
100
。然
后,若后手方报
n
个数(
n=1 ,2,...,299

,先手方立即回以
300-n
个数。先手方总能抢到
100,400,700,1000,...999700,1000000
这一串数,
即“必胜节
点”,从而获胜。


我们来看这一套必胜策略包含的变化。< br>后手方每次有
299
种选择,先手方每次也只有一种回应。
3330
个 回合之后,先手方就能获胜。因此,总变化数是
299^3330
。数字虽大,终究有限。因此 ,这个无聊的游戏,
就算是上帝来和笔者玩,只要笔者拿到先手,就输不出去。
这就是抢三十这 类游戏的“终极真理”了。

2
、完全信息游戏与策梅洛定理

< br>抢三十这一类游戏,我
们能够运筹帷幄、立于不败之地的关键是,我们知道对手所
有可能 的选择,
我们了解游戏中所有的信息。
像这样的游戏,
我们称之为完全信息游戏

(Perfect Information Game)
【反
例:斗地主不是 完全信息游戏,因为看不到对手的牌】
。另
一方面,抢三十也是一个有限游戏(
Fin ite Game

,即它总
是在有限个回合内完成。对于所有的完全信息有限游戏, 我
们都可以画出它们的游戏树


Game Tree

。 就像图论中的
树一样,一个完整的游戏树包含有一个起始节点,代表游戏
中某一个局面,接着下 一层的子节点是原来父节点局面下一
步的各种可能性,以此类推。游戏树逐层扩展,直到游戏结
束。


上图是抢三十游戏树的一部分。
19
这个节点只与
20

21

22
这三个节点连接,意味着若甲报出
19< br>,则乙只
能报到
20

21

22.
其它节点间的连接关系同理。



三十游戏相对简单,在于它只有 一个终局局面,或者说游戏
树的末端节点,
也就是
30

我们很容易 从这唯一的最终节点
逆推出必胜策略。但是对于拥有不止一个终局局面的游戏,
推理最优策略就 不那么容易。这时,就轮到游戏树出场亮相
了。接下来,我们再介绍一个游戏为例。


井字棋

(Tic-Tac-Toe)
,又称
XO
棋,是一 种简单的棋。对局双方轮
流在
3x3
的棋盘上落子,在横、竖或对角线方向上连成三个
的一方获胜。
如下图,
是从空枰开始的井字棋游戏树。



果能完整地画出一个游戏的游戏树,那么我们就像掌握了抢
三十的秘笈一样,只需按图索骥。 比如说,对于井字棋游戏
的一个残局,下图的游戏树给出了双方所有的应对可能性。


此残局的初始局面,由画“X”一方先行。
X
方有三种选择,而
每一种选择下 ,
O
方也有两种应对。标有蓝色分数的棋局是
终局节点,
+1
表示< br>X
方获胜,
-1
表示
O
方获胜,
0
表示平< br>局。很明显,
X
方不能选择棋盘右边的两个点,否则
O
方可
以 一击绝杀。因此,
X
方只能走在棋盘左边。这样一来,即
使
O
方选择 正确,
X
方也能保证平局。
游戏树第二层和第三
层的部分节点标有黑色数字。 这些节点并非终局,但我们可
以简单推理出双方都走对情况下的棋局结果,
标上
+1< br>,
-1

0
。同理,我们可以逐层往上标记,直到残局的初始局面,< br>也就是游戏树的起始节点。图中,起始节点的值是
0
,因此
我们得到结论,此残 局若双方应对无误,结果是平局;
X

应走在棋盘左中的一点。
井字棋完整游 戏树,
来自
Wikipedia
更进一步,如果我们画出井字棋的完整游戏树(如上 图)

我们就可以用同样的方法,逆推出游戏树中每一个节点最终
会走向何种结果,最 终推出双方的最优策略,以及在最优策
略下谁胜谁负。事实上,如果从空枰开局,双方不犯错的情
况下,井字棋会以平局收场。

所有的二人完全信息有限游
戏,如果没有运气成分( 例如飞行棋掷骰子)
,在理论上我
们都可以用同样的方法,画出游戏树,从结果逆推到开局。< br>数学家恩斯特·策梅洛(
Ernst Zermelo
)将这个结果总结为
策梅洛定理(
Zermelo's Theorem

,表述如下:


若二人
完全信息有限游 戏不涉及随机成分,则要么先行方有必胜策
略,
要么后行方有必胜策略,
要么双方均拥 有必不败策略
(即
若双方都不犯错,游戏将会是平局)



策梅洛定理的严
格证明,其实和前文井字棋部分所述类似。在确定游戏树之
后,
从所 有终局局面出发,
可以推断出任意局面的胜负性
(即
此局面何方有必胜策略,或者双方 均有不败策略)
,直至初
始局面。在数学上,这种推理的方法,被称为反向数学归纳


Backward Induction




策梅洛定理适用于大部分为
人熟知的棋类游戏,比如国际象棋、五子棋、黑白棋、西洋
跳棋等 ,但不适用于涉及运气成分的飞行棋,也不适用于多
方混战的中国跳棋。
3
、围棋,有 限游戏?



读到这里,
性急的读者可能已经脱口而出,
“那么,
围棋当然也适用策梅
洛定理,
一定存在某一方的必胜策略嘛”。
且慢 。
围棋确实符
合“二人”、“完全信息”、“无随机因素”这三个特点,但“有限”
这 个性质,我们暂时还得打个问号。

有记载的职业棋局,
最长手数记录是
41 4
手(林修平
VS
陈禧一)
,超过了围棋
盘交叉点的总数
3 61
个。但这并不是一局围棋长度的上限。
能够无限进行下去的棋局,其实在职业比赛中已经出 现过多
次。
比如下图,
古力和李世乭在
2012
年三星杯
3 2
强双败淘
汰赛首轮的一局。

由于棋盘右方罕见的四劫循环,本局被
判“无胜负”,双方重赛。注意,本局的结果是“无胜负”,而不
是和棋(平局)
。“无胜负 ”隐含的意思是,这盘棋可以无限进
行下去。在规则没有禁止的情况下,黑白双方将反复提四个
劫,循环往复。

对应到围棋的游戏树中,多劫循环是一种
循环
(loop)
结构。

比如,
在上图中,
节点
1-2-5
和节点
2-3-4-5< br>分别构成循环。
循环使得策梅洛定理中的反向归纳法失效,不适用于有循环
的游戏。好在 ,现行中国围棋规则在原则上禁止多劫循环,
也包括长生等其他特殊的循环棋型。中国围棋竞赛规则
2002
年版)第一章

总则第
6

禁止全局同形着子后不
得使对方重复面临曾出现过的局面。
本条规则有时简称“禁全
同(
SuperKo
)”或“禁同形”。在部分比赛中,禁全同规则并
未得到严格执 行。本章节剩余的部分,我们仍基于严格的禁
全同规则来讨论。在严格禁同的情况下,循环不复存在。即

行尸走肉电视剧-爱祖国爱家乡手抄报


行尸走肉电视剧-爱祖国爱家乡手抄报


行尸走肉电视剧-爱祖国爱家乡手抄报


行尸走肉电视剧-爱祖国爱家乡手抄报


行尸走肉电视剧-爱祖国爱家乡手抄报


行尸走肉电视剧-爱祖国爱家乡手抄报


行尸走肉电视剧-爱祖国爱家乡手抄报


行尸走肉电视剧-爱祖国爱家乡手抄报