ELO:修订间差异

来自皮卡鱼 Wiki
跳到导航 跳到搜索
无编辑摘要
New讨论 | 贡献
无编辑摘要
 
(未显示同一用户的1个中间版本)
第2行: 第2行:
<br>
<br>
<br>
<br>
ELO适合给多个引擎(棋手)排名,并给出分数更直观地看出差距,因为ELO使用广泛,所以即使是一对一的引擎测试也会显示ELO和误差范围。
ELO评分系统是一个广泛应用于多个竞技领域(如棋类游戏)的排名方法,它可以用来为多个参赛者(例如棋手或引擎)进行排名并量化它们之间的实力差异。ELO系统根据参赛者间的胜率来调整分数,使得分数能够直观地反映出他们的实力差距。ELO评分的核心计算公式是1/(1+10^(n/400)),其中n代表两个参赛者之间的ELO分数差。


正常ELO和胜率的计算公式是 1/(1+10^(n/400)) ,其中n是双方的ELO差。
在多个引擎排名中,其中两个引擎遇上,如果引擎A的ELO评分比引擎B高71分,那么根据ELO公式,我们可以计算出A对B的胜率大约为60%(和棋视为半胜半负)。实际比赛结果如果显示A的胜率不足60%,则A的ELO分会下调,B的ELO分相应上升,以更准确地反映两者的实力差异。多个引擎的Elo通常使用Bayeselo、Ordo等工具计算。


在多个引擎排名中,其中两个引擎遇上,如果A引擎比B引擎高71ELO,那么可以认为A对B的胜率为1/(1+10^(-71/400)≈0.60,也就是60%胜率(和棋算半胜半负),然后根据结果看有没有60%胜率,如果没有,就扣A的ELO,加B的ELO。
而在一对一的引擎测试中,ELO就完全可由胜率计算。
而在一对一的引擎测试中,ELO就完全可由胜率计算。


非一对一的情况下,不同的ELO系统可能因为计算方式不同,系统内的引擎(棋手)不同,比赛方法不同等等因素,导致不同ELO系统间的ELO分数不能互相比较,可以参考强弱关系,但不能直接比较分数。


非一对一的情况下,不同的ELO系统可能因为计算方式不同,系统内的引擎(棋手)不同,比赛方法不同等等因素,导致不同ELO系统间的ELO分数不能互相比较,可以参考强弱关系,但不能直接比较分数。
不同引擎的Elo数据以及排名,可以参考皮卡鱼论坛发布的天梯图。

2024年8月24日 (六) 01:19的最新版本

返回“棋软知识”

ELO评分系统是一个广泛应用于多个竞技领域(如棋类游戏)的排名方法,它可以用来为多个参赛者(例如棋手或引擎)进行排名并量化它们之间的实力差异。ELO系统根据参赛者间的胜率来调整分数,使得分数能够直观地反映出他们的实力差距。ELO评分的核心计算公式是1/(1+10^(n/400)),其中n代表两个参赛者之间的ELO分数差。

在多个引擎排名中,其中两个引擎遇上,如果引擎A的ELO评分比引擎B高71分,那么根据ELO公式,我们可以计算出A对B的胜率大约为60%(和棋视为半胜半负)。实际比赛结果如果显示A的胜率不足60%,则A的ELO分会下调,B的ELO分相应上升,以更准确地反映两者的实力差异。多个引擎的Elo通常使用Bayeselo、Ordo等工具计算。

而在一对一的引擎测试中,ELO就完全可由胜率计算。

非一对一的情况下,不同的ELO系统可能因为计算方式不同,系统内的引擎(棋手)不同,比赛方法不同等等因素,导致不同ELO系统间的ELO分数不能互相比较,可以参考强弱关系,但不能直接比较分数。

不同引擎的Elo数据以及排名,可以参考皮卡鱼论坛发布的天梯图。