如何科学地测试引擎?:修订间差异

来自皮卡鱼 Wiki
跳到导航 跳到搜索
(创建页面,内容为“最科学的引擎测试要让引擎处于相同的机器下,用一个测试工具,双方测试条件一致,用数量足够多的多样化开局局面,纯引擎计算出招,每个局面进行两局分先测试,最好不要开后台思考,并尽量排除可能的棋规分歧干扰。 测试数量要足够多,例如几千局,最好使用统计学工具比如sprt。测试中最好不要有可能影响引擎线程的行为。 测试的作用是放…”)
 
无编辑摘要
第1行: 第1行:
最科学的引擎测试要让引擎处于相同的机器下,用一个测试工具,双方测试条件一致,用数量足够多的多样化开局局面,纯引擎计算出招,每个局面进行两局分先测试,最好不要开后台思考,并尽量排除可能的棋规分歧干扰。
科学的引擎测试 要让引擎处于相同的机器下,用一个测试工具、双方测试条件和设置一致、用数量足够多的多样化开局局面、并确保是纯引擎计算出招,每个局面进行分先测试,最好不要开后台思考,并尽量排除可能的后台程序干扰、和引擎之间的棋规分歧干扰、界面和引擎之间的棋规分歧干扰。
测试数量要足够多,例如几千局,最好使用统计学工具比如sprt。测试中最好不要有可能影响引擎线程的行为。
 
并且测试数量要足够多,例如几千局,最好使用统计学工具。
 
 
测试的作用是放大引擎之间的棋力差异,所以如果引擎棋力接近,一般采用优势局面分先测试,优势局面分先更能放大棋力的差异。
测试的作用是放大引擎之间的棋力差异,所以如果引擎棋力接近,一般采用优势局面分先测试,优势局面分先更能放大棋力的差异。

2024年2月24日 (六) 00:10的版本

科学的引擎测试 要让引擎处于相同的机器下,用一个测试工具、双方测试条件和设置一致、用数量足够多的多样化开局局面、并确保是纯引擎计算出招,每个局面进行分先测试,最好不要开后台思考,并尽量排除可能的后台程序干扰、和引擎之间的棋规分歧干扰、界面和引擎之间的棋规分歧干扰。

并且测试数量要足够多,例如几千局,最好使用统计学工具。


测试的作用是放大引擎之间的棋力差异,所以如果引擎棋力接近,一般采用优势局面分先测试,优势局面分先更能放大棋力的差异。