158文章网欢迎您
您的位置:158文章网 > 范文示例 > 人工智能下象棋,走一步,能看几步?|漫画

人工智能下象棋,走一步,能看几步?|漫画

作者:158文章网日期:

返回目录:范文示例

今天小编给各位分享如何下象棋的知识,文中也会对其通过人工智能下象棋,走一步,能看几步?|漫画和象棋能历害的人能看到几步等多篇文章进行知识讲解,如果文章内容对您有帮助,别忘了关注本站,现在进入正文!

内容导航:
  • 人工智能下象棋,走一步,能看几步?|漫画
  • 象棋能历害的人能看到几步
  • 特级象棋大师可以看几步棋?
  • 下棋不是有句话叫走一步看三步”吗,那么如何走一步看别人的三步?不要复制
  • 一、人工智能下象棋,走一步,能看几步?|漫画

    图文原创:谭婧

    谭婧老师爱下象棋,就是谁也赢不了。

    去公园下了一盘棋 ,第一步我就走了一个当头炮 ,剩下的都是大爷们帮我走的。

    结果,我输了。

    经过他们的总结研究,我第一步走错了 。

    2022年,象棋AI下棋机器人,问世了。

    我和它对弈了一盘,结果,我赢了。

    很有自知之明的我,严重怀疑设计者增加了噪音,降低了棋力。让我赢得很舒服。

    但我没有证据。

    怎么说呢,我就喜欢高情商的AI象棋机器人。

    低情商的机器人只会冷漠地碾压我:“下不过我,就别废话。”

    仿佛不仅嫌弃我棋臭,还嫌弃我话多。

    而高情商的AI象棋机器人,大为不同。

    它伸出胳膊,温柔地摆出“请”的姿势,它居然有机械臂。

    情商和机械臂都不是重点,聊聊它的智商从何而来。

    AI象棋机器人是人工智能技术中深度学习与强化学习的成果,击杀四方。

    任何人工智能都离不开数学基础原理,在此,首先得感谢尊敬的贝尔曼(Bellman)教授。

    以他名字命名的贝尔曼方程,在绝大多数强化学习的成果中都会用到,比如象棋AI下棋机器人的远方表哥,自动驾驶。

    它们是亲戚,“血缘关系”是“最优决策”。

    强化学习是要在多种决策中评价,找出好的决策。

    强化学习在象棋中,就是在多种走法中找到最好的走法。

    围观数学公式的人少,围观下象棋的人多。

    我们抛开公式,用决策树表示每一步的输赢,非常直观。

    一盘三十步的象棋比赛,会是一颗很大的决策树,有很多枝叶。

    计算机下象棋的棋力,早就超越了绝大多数的人。然而,至今没有任何一款计算机软件达到全知全能的“棋神”状态,连AI也不行。

    那在下象棋这件事情上,AI这几年在忙活啥?

    那要从几十年前讲起了。

    1980到1990年代,深蓝计算机是大公司的,小霸王游戏机是大家的。

    假如一个人类象棋高手下一步棋,能看未来八步棋。就好比一下能想到决策树上的第八层。

    传统象棋软件说,这我也行。

    话是没有吹牛,传统象棋软件确实可以做到。

    可是,再往前多算几步,所耗时间和计算存储可能都要翻倍。或者说,情况急转直下。

    在旧式象棋软件的时代,得想办法减少计算量。所以,有了阿法贝塔剪枝。

    这虽然有“偷懒”的嫌疑,但我也没有证据。

    阿法贝塔剪枝的方法,相当于提前知道哪些搜索是没有意义的,排除错误答案,用巧思“偷懒”,相当于省略做题过程。

    旧思路在象棋上还能支撑,用在围棋上力有不逮。

    (因为围棋是19×19的一个矩阵,每步可选择的走法要比象棋多一个数量级。)

    从旧式象棋软件时代,人们就为棋力算分。这是一个起源很早的好办法。

    那么得分是怎么来呢?

    用一个数学函数把有利赢棋的因素都考虑进去。

    以至于,中国象棋协会也有象棋大师用此来构思好棋。

    有了分数,僵化的下象棋,就是“哪步得分高,就走哪步”。

    然而,象棋是一个非常讲究全局观的游戏。

    追求最终取胜,不追求每一步占尽优势。

    比如,战术性丢车保帅。

    深度学习模型在象棋面前暴露了“缺点”,它算出当下局面的胜率,但是,并不能估算出后续局面的胜率。

    所以,需要一个重要的动作来加持:搜索

    从决策树上理解,就是考虑的越多越好。

    如今,能搜索到决策树里非常深的层数,这就意味着,招数更多,棋路更多,对胜利的把握就越大。

    谈到如何处理搜索量大,就谈到了蒙特卡洛树搜索是学霸特供技能,对大多数人来说,都很难。

    甚至可以这样说,就是题目很困难,算不出来,只好求助于概率,求助于实验。

    一顿猛如虎的严谨分析算不出来。来吧,学霸直接撸起袖子做实验。

    蒙特卡洛方法的做法虽然看起来比较随意,但却有着坚实的理论基础:大数定律。

    在计算机眼里,棋子挪动一步,都算一个新的棋局,所以棋局数量何其之多。

    一个厮杀正酣的棋局,往后走,可能衍生出10000种棋局。

    借助蒙特卡洛树搜索这一方法,看未来几步怎么走。或者说,当AI象棋机器人,有了强化学习,就有了“大局观”。

    我们马上进入学霸区特供:《AI象棋机器人所用的蒙特卡洛树搜索》。

    这就是深度强化学习,模型收敛的目标是,把胜率估计越准越好。经过多轮训练,胜率会越来越准。

    胜率是AI象棋机器人的KPI,每下一步都估算胜率。每一步,尽量把胜率提高。

    常识是,高手胜率高,低手胜率低。

    问题来了,高到多少,低到多少。每一步的胜率很难准确估算,只能估大致范围。

    而且,把胜率提高的前提是,得把胜率算准确。

    在如此模糊的情况下,数据里会有误差。因为有误差,所以AI象棋机器人只能知道“棋神”的方向是什么,它想方设法逼近这个方向。

    象棋AI机器人的棋力水平的训练方法是,AI,加上蒙特卡洛树搜索,然后再教导AI本身。

    这个过程类似总结经验,这样使得它的棋力飙升。

    可以说,AI象棋机器人强大之处得益于蒙特卡洛树搜索。

    超越人类是很早以前的本事了,现在追求棋力丝滑上升,情商在线。

    让棋力水平菜,还有棋瘾的人,也能玩得开心(请不要在我下象棋的时候安装监控)。

    好了,

    这回就聊到这吧。

    看在象棋AI下棋机器人输给我的份上,我不妨透露两个消息。

    第一,有一版的AI象棋机器人初级棋力就打败了全公司的挑战者。

    大胜之际,算法设计工程师们哀嚎遍野:“大事不妙”。

    第二,我下赢AI象棋机器人那一局的时候,旁边有三个AI工程师帮忙出主意。

    (哦,第二点是在凡尔赛科技新媒体的日常)

    最后隆重介绍一下我们的全文审核专家:

    最后,再介绍一下主编自己吧,

    我是谭婧,科技和科普题材作者。

    为了在时代中发现故事,

    我围追科技大神,堵截科技公司。

    偶尔写小说,画漫画。

    生命短暂,不走捷径。

    原创不易,多谢转发

    还想看我的文章,就关注“亲爱的数据”。

    一、象棋能历害的人能看到几步

    十六步左右,绝大多数局面是正招.

    大师临时出招,也很难算这么远,出正招.

    研究过后,才能算准十六步远的棋.

    二、特级象棋大师可以看几步棋?

    可以看几十步

    三、下棋不是有句话叫走一步看三步”吗,那么如何走一步看别人的三步?不要复制

    这个三并不是说单纯的三步,而是代表了之后的一步或者几步,这里的一步包括自己走的一步和对方的应对、下棋高手者往往能从大局出发,不争一子之得失,着眼于长远,走一步看三步,甚至更多,有战略布局造势,有策略设圈埋伏。

    而低手者只能从局部出发,走一步看一步,无长远之眼光,为争一子之得失,往往陷于对手之圈套,损城失地,直至输棋。

    扩展资料:

    博弈分类:

    从博弈的研究范式来划分,可分为传统博弈论和演化博弈论;从博弈的具体应用来划分,可分为静态博弈和动态博弈。静态博弈是指在博弈中,两个参与人同时选择或两人不同时选择,但后行动者并不知道先行动者采取什么样的具体行动。

    对双方来说,都容易形成混沌的行为重组,由于规则的严密与精细,任何人因时间问题、资金问题、心理问题等等,致使在多次均衡后直到不明不白地造成大输,参与静态博弈和动态博弈的大部分都是这种人。

    动态博弈是指在博弈中,两个参与人有行动的先后顺序,且后行动者能够观察到先行动者所选择的行动。

    根据参与者能否形成约束性的协议,以便集体行动,博弈可分为合作性博弈和非合作性博弈。纳什等博弈论专家研究的更多的是非合作性博弈。

    关于如何下象棋的问题,通过《特级象棋大师可以看几步棋?》、《下棋不是有句话叫走一步看三步”吗,那么如何走一步看别人的三步?不要复制》等文章的解答希望已经帮助到您了!如您想了解更多关于如何下象棋的相关信息,请到本站进行查找!

    本文标签:如何下象棋(3)

    相关阅读

    • 了解这4种方法,快速提高孩子学棋效率

    • 158文章网范文示例
    • 今天小编给各位分享如何下象棋的知识,文中也会对其通过了解这4种方法,快速提高孩子学棋效率和孩子如何学好围棋等多篇文章进行知识讲解,如果文章内容对您有帮助,别忘了关注
    关键词不能为空

    范文示例_作文写作_作文欣赏_故事分享_158文章网