人工智能下象棋，走一步，能看几步？

作者：158文章网日期：2023-05-16 00:17:46

返回目录：范文示例

今天小编给各位分享如何下象棋的知识，文中也会对其通过人工智能下象棋，走一步，能看几步？｜漫画和象棋能历害的人能看到几步等多篇文章进行知识讲解，如果文章内容对您有帮助，别忘了关注本站，现在进入正文！

内容导航：
人工智能下象棋，走一步，能看几步？｜漫画

象棋能历害的人能看到几步

特级象棋大师可以看几步棋？

下棋不是有句话叫走一步看三步”吗，那么如何走一步看别人的三步？不要复制

一、人工智能下象棋，走一步，能看几步？｜漫画

图文原创：谭婧

谭婧老师爱下象棋，就是谁也赢不了。

去公园下了一盘棋，第一步我就走了一个当头炮，剩下的都是大爷们帮我走的。

结果，我输了。

经过他们的总结研究，我第一步走错了。

2022年，象棋AI下棋机器人，问世了。

我和它对弈了一盘，结果，我赢了。

很有自知之明的我，严重怀疑设计者增加了噪音，降低了棋力。让我赢得很舒服。

但我没有证据。

怎么说呢，我就喜欢高情商的AI象棋机器人。

低情商的机器人只会冷漠地碾压我：“下不过我，就别废话。”

仿佛不仅嫌弃我棋臭，还嫌弃我话多。

而高情商的AI象棋机器人，大为不同。

它伸出胳膊，温柔地摆出“请”的姿势，它居然有机械臂。

情商和机械臂都不是重点，聊聊它的智商从何而来。

AI象棋机器人是人工智能技术中深度学习与强化学习的成果，击杀四方。

任何人工智能都离不开数学基础原理，在此，首先得感谢尊敬的贝尔曼（Bellman）教授。

以他名字命名的贝尔曼方程，在绝大多数强化学习的成果中都会用到，比如象棋AI下棋机器人的远方表哥，自动驾驶。

它们是亲戚，“血缘关系”是“最优决策”。

强化学习是要在多种决策中评价，找出好的决策。

强化学习在象棋中，就是在多种走法中找到最好的走法。

围观数学公式的人少，围观下象棋的人多。

我们抛开公式，用决策树表示每一步的输赢，非常直观。

一盘三十步的象棋比赛，会是一颗很大的决策树，有很多枝叶。

计算机下象棋的棋力，早就超越了绝大多数的人。然而，至今没有任何一款计算机软件达到全知全能的“棋神”状态，连AI也不行。

那在下象棋这件事情上，AI这几年在忙活啥？

那要从几十年前讲起了。

1980到1990年代，深蓝计算机是大公司的，小霸王游戏机是大家的。

假如一个人类象棋高手下一步棋，能看未来八步棋。就好比一下能想到决策树上的第八层。

传统象棋软件说，这我也行。

话是没有吹牛，传统象棋软件确实可以做到。

可是，再往前多算几步，所耗时间和计算存储可能都要翻倍。或者说，情况急转直下。

在旧式象棋软件的时代，得想办法减少计算量。所以，有了阿法贝塔剪枝。

这虽然有“偷懒”的嫌疑，但我也没有证据。

阿法贝塔剪枝的方法，相当于提前知道哪些搜索是没有意义的，排除错误答案，用巧思“偷懒”，相当于省略做题过程。

旧思路在象棋上还能支撑，用在围棋上力有不逮。

（因为围棋是19×19的一个矩阵，每步可选择的走法要比象棋多一个数量级。）

从旧式象棋软件时代，人们就为棋力算分。这是一个起源很早的好办法。

那么得分是怎么来呢？

用一个数学函数把有利赢棋的因素都考虑进去。

以至于，中国象棋协会也有象棋大师用此来构思好棋。

有了分数，僵化的下象棋，就是“哪步得分高，就走哪步”。

然而，象棋是一个非常讲究全局观的游戏。

追求最终取胜，不追求每一步占尽优势。

比如，战术性丢车保帅。

深度学习模型在象棋面前暴露了“缺点”，它算出当下局面的胜率，但是，并不能估算出后续局面的胜率。

所以，需要一个重要的动作来加持：搜索。

从决策树上理解，就是考虑的越多越好。

如今，能搜索到决策树里非常深的层数，这就意味着，招数更多，棋路更多，对胜利的把握就越大。

谈到如何处理搜索量大，就谈到了蒙特卡洛树搜索是学霸特供技能，对大多数人来说，都很难。

甚至可以这样说，就是题目很困难，算不出来，只好求助于概率，求助于实验。

一顿猛如虎的严谨分析算不出来。来吧，学霸直接撸起袖子做实验。

蒙特卡洛方法的做法虽然看起来比较随意，但却有着坚实的理论基础：大数定律。

在计算机眼里，棋子挪动一步，都算一个新的棋局，所以棋局数量何其之多。

一个厮杀正酣的棋局，往后走，可能衍生出10000种棋局。

借助蒙特卡洛树搜索这一方法，看未来几步怎么走。或者说，当AI象棋机器人，有了强化学习，就有了“大局观”。

我们马上进入学霸区特供：《AI象棋机器人所用的蒙特卡洛树搜索》。

这就是深度强化学习，模型收敛的目标是，把胜率估计越准越好。经过多轮训练，胜率会越来越准。

胜率是AI象棋机器人的KPI，每下一步都估算胜率。每一步，尽量把胜率提高。

常识是，高手胜率高，低手胜率低。

问题来了，高到多少，低到多少。每一步的胜率很难准确估算，只能估大致范围。

而且，把胜率提高的前提是，得把胜率算准确。

在如此模糊的情况下，数据里会有误差。因为有误差，所以AI象棋机器人只能知道“棋神”的方向是什么，它想方设法逼近这个方向。

象棋AI机器人的棋力水平的训练方法是，AI，加上蒙特卡洛树搜索，然后再教导AI本身。

这个过程类似总结经验，这样使得它的棋力飙升。

可以说，AI象棋机器人强大之处得益于蒙特卡洛树搜索。

超越人类是很早以前的本事了，现在追求棋力丝滑上升，情商在线。

让棋力水平菜，还有棋瘾的人，也能玩得开心（请不要在我下象棋的时候安装监控）。

好了，

这回就聊到这吧。

看在象棋AI下棋机器人输给我的份上，我不妨透露两个消息。

第一，有一版的AI象棋机器人初级棋力就打败了全公司的挑战者。

大胜之际，算法设计工程师们哀嚎遍野：“大事不妙”。

第二，我下赢AI象棋机器人那一局的时候，旁边有三个AI工程师帮忙出主意。

（哦，第二点是在凡尔赛科技新媒体的日常）

最后隆重介绍一下我们的全文审核专家：

最后，再介绍一下主编自己吧，

我是谭婧，科技和科普题材作者。

为了在时代中发现故事，

我围追科技大神，堵截科技公司。

偶尔写小说，画漫画。

生命短暂，不走捷径。

原创不易，多谢转发

还想看我的文章，就关注“亲爱的数据”。

一、象棋能历害的人能看到几步

十六步左右，绝大多数局面是正招.

大师临时出招，也很难算这么远，出正招.

研究过后，才能算准十六步远的棋.

二、特级象棋大师可以看几步棋？

可以看几十步

三、下棋不是有句话叫走一步看三步”吗，那么如何走一步看别人的三步？不要复制

这个三并不是说单纯的三步，而是代表了之后的一步或者几步，这里的一步包括自己走的一步和对方的应对、下棋高手者往往能从大局出发，不争一子之得失，着眼于长远，走一步看三步，甚至更多，有战略布局造势，有策略设圈埋伏。

而低手者只能从局部出发，走一步看一步，无长远之眼光，为争一子之得失，往往陷于对手之圈套，损城失地，直至输棋。

扩展资料：

博弈分类：

从博弈的研究范式来划分，可分为传统博弈论和演化博弈论；从博弈的具体应用来划分，可分为静态博弈和动态博弈。静态博弈是指在博弈中，两个参与人同时选择或两人不同时选择，但后行动者并不知道先行动者采取什么样的具体行动。

对双方来说，都容易形成混沌的行为重组，由于规则的严密与精细，任何人因时间问题、资金问题、心理问题等等，致使在多次均衡后直到不明不白地造成大输，参与静态博弈和动态博弈的大部分都是这种人。

动态博弈是指在博弈中，两个参与人有行动的先后顺序，且后行动者能够观察到先行动者所选择的行动。

根据参与者能否形成约束性的协议，以便集体行动，博弈可分为合作性博弈和非合作性博弈。纳什等博弈论专家研究的更多的是非合作性博弈。

关于如何下象棋的问题，通过《特级象棋大师可以看几步棋？》、《下棋不是有句话叫走一步看三步”吗，那么如何走一步看别人的三步？不要复制》等文章的解答希望已经帮助到您了！如您想了解更多关于如何下象棋的相关信息，请到本站进行查找！

本文标签：如何下象棋(3)