象棋有“阿尔法狗”吗?:修订间差异
跳到导航
跳到搜索
(创建页面,内容为“多年前的阿尔法狗、阿尔法零(AlphaGo AlphaZero)用的是另外一种搜索算法,用来配合大神经网络架构。 这种引擎通常主要使用显卡(GPU)或者TPU。 而象棋强引擎的搜索算法都只需要CPU,不需要显卡。 显卡引擎的网络足够大,所以评估更加准确。和nnue不同,显卡引擎的网络不止评估网络,还包含了策略网络,策略网络负责决定搜索着法,类似于人类看到…”) |
无编辑摘要 |
||
(未显示2个用户的3个中间版本) | |||
第1行: | 第1行: | ||
<small>[[棋软知识|返回“棋软知识”]]</small> | |||
<br> | |||
<br> | |||
没有,但有相同算法的px0,官网[http://px0.org px0.org](QQ群号578342679) | |||
多年前的阿尔法狗、阿尔法零(AlphaGo AlphaZero)用的是另外一种搜索算法,用来配合大神经网络架构。 | 多年前的阿尔法狗、阿尔法零(AlphaGo AlphaZero)用的是另外一种搜索算法,用来配合大神经网络架构。 | ||
这种引擎通常主要使用显卡(GPU)或者TPU。 | 这种引擎通常主要使用显卡(GPU)或者TPU。 | ||
第12行: | 第18行: | ||
对显卡引擎来说,从随机落子开始迭代训练,其上限高于用其他引擎或者人类数据训练的。AlphaGoZero便是如此,其棋力远高于与李世石对弈的AlphaGoLee(从人类数据开始迭代训练)。 | 对显卡引擎来说,从随机落子开始迭代训练,其上限高于用其他引擎或者人类数据训练的。AlphaGoZero便是如此,其棋力远高于与李世石对弈的AlphaGoLee(从人类数据开始迭代训练)。 | ||
需要注意的是,阿尔法猫使用的算法和AlphaGo不同,属于ab剪枝,仅仅是名字相似。 |
2024年3月31日 (日) 23:03的最新版本
返回“棋软知识”
没有,但有相同算法的px0,官网px0.org(QQ群号578342679)
多年前的阿尔法狗、阿尔法零(AlphaGo AlphaZero)用的是另外一种搜索算法,用来配合大神经网络架构。
这种引擎通常主要使用显卡(GPU)或者TPU。
而象棋强引擎的搜索算法都只需要CPU,不需要显卡。
显卡引擎的网络足够大,所以评估更加准确。和nnue不同,显卡引擎的网络不止评估网络,还包含了策略网络,策略网络负责决定搜索着法,类似于人类看到一个局面,想要进行计算,就必须先选择一个着法进行计算,如果这种“直觉”够准,可以节省大量的时间。
但这种大架构让显卡引擎更依赖显卡和mcts搜索(实际上棋类显卡引擎已经不是狭义上的MC蒙特卡洛了)。
目前,显卡引擎在象棋和国际象棋上,仍未超越CPU引擎。
阿尔法系列并未开源,围棋的katago leela、国际象棋的lc0都是根据其论文复现的,而象棋有克隆lc0的px0、ggz。
现在的顶尖围棋、国象、日将引擎棋力已经远超当年的阿尔法零。
对显卡引擎来说,从随机落子开始迭代训练,其上限高于用其他引擎或者人类数据训练的。AlphaGoZero便是如此,其棋力远高于与李世石对弈的AlphaGoLee(从人类数据开始迭代训练)。
需要注意的是,阿尔法猫使用的算法和AlphaGo不同,属于ab剪枝,仅仅是名字相似。