各个引擎的打分为什么不一样?甚至相同引擎不同版本也不一样?:修订间差异

来自皮卡鱼 Wiki
跳到导航 跳到搜索
无编辑摘要
无编辑摘要
第1行: 第1行:
现在引擎打分没有标准,没有谁规定xx等于固定多少分,所以不同引擎不同版本的分数不能互相比较。分数只能和同版本同引擎的分数内部比较。
现在引擎打分没有标准,没有谁规定什么局面就等于固定多少分,所以不同引擎不同版本的分数不能互相比较。分数只能和同版本同引擎的分数内部比较。


所以不同版本不同引擎的分数不一样很正常。
所以不同版本不同引擎的分数不一样很正常。
第9行: 第9行:


'''比如50%取胜概率代表100分,2024年的皮卡鱼就是以此为标准。注意这是取胜概率,基本代表50%胜,50%和棋。'''
'''比如50%取胜概率代表100分,2024年的皮卡鱼就是以此为标准。注意这是取胜概率,基本代表50%胜,50%和棋。'''
[[文件:E3ddae9c-5747-49f1-a1e7-ea6016b6c0ce.png|缩略图|获胜概率和胜率分数的对应曲线图]]


本意上,引擎的非绝杀分都不代表必胜,这些分数只是“评估”,引擎认为当前局面谁优,类似于人类认为这局面谁好走、大优、胜势,只不过引擎会细分成分数。
本意上,引擎的非绝杀分都不代表必胜,这些分数只是“评估”,引擎认为当前局面谁优,类似于人类认为这局面谁好走、大优、胜势,只不过引擎会细分成分数。

2024年3月12日 (二) 04:16的版本

现在引擎打分没有标准,没有谁规定什么局面就等于固定多少分,所以不同引擎不同版本的分数不能互相比较。分数只能和同版本同引擎的分数内部比较。

所以不同版本不同引擎的分数不一样很正常。

引擎的分数如何,和所谓“敏感度”“虚高”没有丝毫关系。如果把皮卡鱼的分数乘以10变成一个“新引擎”,你会认为新引擎会对分数更敏感或者分数虚高吗?显然两个引擎相同,只是外在表现看起来不同而已。


但有一种统一的标准是:根据测试数据做出一个胜率模型,把引擎输出的分数转换成胜率。

比如50%取胜概率代表100分,2024年的皮卡鱼就是以此为标准。注意这是取胜概率,基本代表50%胜,50%和棋。

获胜概率和胜率分数的对应曲线图


本意上,引擎的非绝杀分都不代表必胜,这些分数只是“评估”,引擎认为当前局面谁优,类似于人类认为这局面谁好走、大优、胜势,只不过引擎会细分成分数。