象棋有“阿尔法狗”吗?:修订间差异

来自皮卡鱼 Wiki
跳到导航 跳到搜索
(创建页面,内容为“多年前的阿尔法狗、阿尔法零(AlphaGo AlphaZero)用的是另外一种搜索算法,用来配合大神经网络架构。 这种引擎通常主要使用显卡(GPU)或者TPU。 而象棋强引擎的搜索算法都只需要CPU,不需要显卡。 显卡引擎的网络足够大,所以评估更加准确。和nnue不同,显卡引擎的网络不止评估网络,还包含了策略网络,策略网络负责决定搜索着法,类似于人类看到…”)
 
无编辑摘要
第1行: 第1行:
有相同算法的px0,官网[http://px0.org px0.org]
多年前的阿尔法狗、阿尔法零(AlphaGo AlphaZero)用的是另外一种搜索算法,用来配合大神经网络架构。
多年前的阿尔法狗、阿尔法零(AlphaGo AlphaZero)用的是另外一种搜索算法,用来配合大神经网络架构。
这种引擎通常主要使用显卡(GPU)或者TPU。
这种引擎通常主要使用显卡(GPU)或者TPU。

2023年11月23日 (四) 03:13的版本

有相同算法的px0,官网px0.org

多年前的阿尔法狗、阿尔法零(AlphaGo AlphaZero)用的是另外一种搜索算法,用来配合大神经网络架构。 这种引擎通常主要使用显卡(GPU)或者TPU。 而象棋强引擎的搜索算法都只需要CPU,不需要显卡。


显卡引擎的网络足够大,所以评估更加准确。和nnue不同,显卡引擎的网络不止评估网络,还包含了策略网络,策略网络负责决定搜索着法,类似于人类看到一个局面,想要进行计算,就必须先选择一个着法进行计算,如果这种“直觉”够准,可以节省大量的时间。 但这种大架构让显卡引擎更依赖显卡和mcts搜索(实际上棋类显卡引擎已经不是狭义上的MC蒙特卡洛了)。 目前,显卡引擎在象棋和国际象棋上,仍未超越CPU引擎。 阿尔法系列并未开源,围棋的katago leela、国际象棋的lc0都是根据其论文复现的,而象棋有克隆lc0的px0、ggz。

现在的顶尖围棋、国象、日将引擎棋力已经远超当年的阿尔法零。

对显卡引擎来说,从随机落子开始迭代训练,其上限高于用其他引擎或者人类数据训练的。AlphaGoZero便是如此,其棋力远高于与李世石对弈的AlphaGoLee(从人类数据开始迭代训练)。