查看: 108|回复: 1

斗地主AI的现状

[复制链接]

1

主题

2

帖子

3

积分

新手上路

Rank: 1

积分
3
发表于 2022-9-20 11:46:54 | 显示全部楼层 |阅读模式
DeltaDou
简述: 利用MCTS算法, 宣称在斗地主中达到接近人类水平. 但是這個人類水平的具體定義是有些模糊的, 從後續的工作回看,目前的鬥地主AI與人類高手的水平仍然存在明顯的差距。
论文地址: https://www.ijcai.org/proceedings/2019/0176.pdf
开源地址: 无

DouZero
简述: 利用MC方法+self play学习, 并超过DeltaDou. 但是從實際的評估結果來看,DouZero的水平大概也就是一個玩過幾年鬥地主的普通人的水平,距離鬥地主高手還有比較明顯的差距。
论文地址: https://arxiv.org/abs/2106.06135
开源地址: https://github.com/kwai/DouZero

DouZero Resnet
简述: 根据开源版本DouZero改进, 主要是将网络结构替换为Resnet, 经过测试在强度上超过DouZero. 同時這個版本的還支持了利用評分叫牌和接入歡樂鬥地主進行打牌。
论文地址: 无
开源地址: https://github.com/Vincentzyx/DouZero_For_HLDDZ_FullAuto

PerfectDou
简述: 在训练时加入全局信息, 以及更多斗地主相关的特征, 使用PPO算法训练, 宣称超过DouZero. 但是因爲沒有開源, 所以實際水平未知。
论文地址: https://arxiv.org/abs/2203.16406
开源地址: 无

DouZero+
简述: 在DouZero的基础上增加了对手建模和教练引导, 宣称效果上比DouZero有一定提升. 但是训练轮数较少, 不确定最终效果是否有提升.
论文地址: https://arxiv.org/abs/2204.02558
开源地址: https://github.com/submit-paper/Doudizhu

AP-MCTS
简述: 基于mcts的ai, 和DouZero是同期工作, 经过初步的测试强度不如DouZero,而且因爲使用MCTS所以運行速度非常慢.
论文地址: https://www.ijcai.org/proceedings/2021/0470.pdf
开源地址: https://github.com/1310183534/DouDiZhu
回复

使用道具 举报

0

主题

5

帖子

8

积分

新手上路

Rank: 1

积分
8
发表于 2025-2-2 09:25:02 | 显示全部楼层
我也是坐沙发的
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|小棋牌

GMT+8, 2025-3-15 08:29 , Processed in 0.085922 second(s), 22 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表