大家好,我是Hastur,正在使用强化学习训练游戏王AI,获得了一些初步成果,代码开源在https://github.com/sbl1996/ygo-agent ,知乎介绍https://zhuanlan.zhihu.com/p/686107181。
训练的基本方法是两个AI相互打,越快胜利,奖励越高。没有用人类选手数据。AI能够获取到的信息和我们玩的时候差不多(甚至更少),比如只能看到对方场上、墓地、除外的卡,也看不到场上里侧表示的卡。现在支持灵摆之外的大部分卡片,用于训练的卡组包括:黑羽、白龙、烙印、电子龙、黄金国、英雄、极龙、自然神碑、白板斧王、纯影依、罪宝蛇眼、闪刀姬、蛇眼炎王、天威相剑、肃声。
我发现AI能够掌握基本的combo,第一回合做场有点差,但是后续解场斩杀还行。另外AI现在有一些设计上的缺陷,比如不知道自己的怪兽被无效了,所以有的时候会犯蠢。如果有YGOPro或者YGOMobile,可以看我随机生成的32盘录像。软件最好更新到最新,否则有一定概率出错。有看了的可以评论一下感觉AI大概什么水平。
录像链接:https://pan.baidu.com/s/16GgacaRs_26h79e5RZls1Q?pwd=1234 33
我现在想训练AI玩更多卡组,所以向大家征集用于训练的卡组。大家可以以YDK的方式提供给我。特别注意现在不支持灵摆,不支持剑指。卡组中的卡效果如果有提到其他卡名,而该卡名的卡不在卡组内,请将该卡放在side中。

咱想看的有趣的东西不就来了么(