|
DeltaDou
简述: 利用MCTS算法, 宣称在斗地主中达到接近人类水平. 但是這個人類水平的具體定義是有些模糊的, 從後續的工作回看,目前的鬥地主AI與人類高手的水平仍然存在明顯的差距。
论文地址: https://www.ijcai.org/proceedings/2019/0176.pdf
开源地址: 无
DouZero
简述: 利用MC方法+self play学习, 并超过DeltaDou. 但是從實際的評估結果來看,DouZero的水平大概也就是一個玩過幾年鬥地主的普通人的水平,距離鬥地主高手還有比較明顯的差距。
论文地址: https://arxiv.org/abs/2106.06135
开源地址: https://github.com/kwai/DouZero
DouZero Resnet
简述: 根据开源版本DouZero改进, 主要是将网络结构替换为Resnet, 经过测试在强度上超过DouZero. 同時這個版本的還支持了利用評分叫牌和接入歡樂鬥地主進行打牌。
论文地址: 无
开源地址: https://github.com/Vincentzyx/DouZero_For_HLDDZ_FullAuto
PerfectDou
简述: 在训练时加入全局信息, 以及更多斗地主相关的特征, 使用PPO算法训练, 宣称超过DouZero. 但是因爲沒有開源, 所以實際水平未知。
论文地址: https://arxiv.org/abs/2203.16406
开源地址: 无
DouZero+
简述: 在DouZero的基础上增加了对手建模和教练引导, 宣称效果上比DouZero有一定提升. 但是训练轮数较少, 不确定最终效果是否有提升.
论文地址: https://arxiv.org/abs/2204.02558
开源地址: https://github.com/submit-paper/Doudizhu
AP-MCTS
简述: 基于mcts的ai, 和DouZero是同期工作, 经过初步的测试强度不如DouZero,而且因爲使用MCTS所以運行速度非常慢.
论文地址: https://www.ijcai.org/proceedings/2021/0470.pdf
开源地址: https://github.com/1310183534/DouDiZhu |
|