一盘棋都没下过,AI只听人类评论比赛,就学会了国际象棋

?

来自凹形寺庙的栗子

报价生产|公共号码QbitAI655.jpg AI想学习国际象棋,是否有必要下棋?

不必要。

伦敦大学的朋友们开发了一种新的国际象棋AI,只有通过观察人类对游戏的评论才能学会下棋。

人工智能的名称是SentiMATE,它是通过评论员/评论者的演讲中的情绪来判断游戏的质量。657.jpg团队发现,仅凭这些情绪,AI就学会了国际象棋的基本规则,以及一些关键策略,并击败了前任的DeepChess算法。

关键是它不需要大量的训练数据。

那么,这个AI最终经历了什么?

不同的学习方法

故事始于大多数国际象棋AI的运作。

目前的国际象棋算法基本上有两个关键部分:

第一个是搜索算法,用于搜索所有可能的后续步骤,设置树,树中有许多节点。

第二种是评估算法,该算法分析进入树上节点的优点。662.jpg△例如,这是一棵树

SentiMATE,第二部分,由一个方法取代:

分析游戏评论中句子的情绪,判断每个游戏的质量,并培养新的评价功能。

情绪评估

评论文本被国际象棋论坛粉碎。

为了分析评论员的情绪,该团队使用了两个分类器。

第一个分类器,从评论文本中,挑选出描述手的质量的评论,把它扔掉。

评论作为测试集。

这允许我们从原始数据集中筛选出有用的评论。

第二个分类器从过滤后的句子中分析情绪。664.jpg这部分是关键和复杂的。由于有些句子,很难判断情绪是积极的还是消极的:

例如,“保护一块”可以看作是一种避免负面后果的行动,或者它可能表明当前的状态是危险的。

另一个例子是,“攻击”这个词贬低了普通的情绪分析人工智能,很容易被归类为负面情绪。“攻击女王”通常是一个好动作。

这样,对情绪的上下文理解是很重要的。数据集中的样本大多是短文本,没有太多的上下文可供参考。

团队选择了Flair使用的架构。Flair是Zalando Research开发的一个NLP库。

665.jpg研究人员认为,对于非常短的文本,LSTM(长期和短期记忆)加上适当的单词嵌入方法将有助于学习国际象棋上下文中的措辞规则。

因此,基于word2vec嵌入,增加了一些上下文字符串嵌入(上下文字符串嵌入),提高了分类的准确性。

通过这种方式,在一个小型训练集中对一些情绪模糊的文本进行分类是有益的(该团队仅标记2090对感情的评价,正面和负面)。

情绪分类完成后,最重要的一步是:

每项举措的质量评估

团队使用的评估方法与之前的AI非常不同。

前辈使用的数据主要是固定板的状态,并且没有关于每个移动的信息。培训过程效率相对较低,需要大量数据才能更好地推广。

这里,掉落前后的板(左左)与刚刚分析的情感一起进入神经网络(右下图)。这样,过去遗忘的数据就完成了,培训效率也会提高。666.jpg△中间部分是质量评估网络

(质量评估网络的架构基于Sabatelli等人在2017年提出的方法。)

该团队表示,与Go一样,AlphaZero必须经历数百万次迭代迭代并使用数千个GPU才能开始;

件,因此提高评估算法的效率很重要。

那结果是什么?

赢得DeepChess

首先,看看两个分类器的效果。

第一个分类器,找到描述移动质量的注释:667.jpg团队尝试了三个网络,发现双向LSTM表现最佳,识别有用评论的准确率为93.4%,超过正常LSTM和正常RNN。

然后,在性能最好的双向LSTM上,尝试了不同的字嵌入方法:668.jpg结果发现,结合BERT和GloVe嵌入是最佳表现,识别有用评论的准确率达到97.2%。

第一步非常有效。这是第二个评估情绪积极消极因素的分类器:

评论进行了测试。

结果,识别积极情绪的准确率为91.42%,平衡准确率为90.83%。

超越CNN-RNN架构,超越双向LSTM。

顺便说一下,这个分类器中表现最好的单词嵌入来自BERT。

这里,第二步也取得了有效的成果。669.jpg那么,SentiMATE最终学会下棋吗?仍然必须是一个真正的刀游戏:

首先,对于100场随机比赛,胜率为81%。

然后,与2017年出生的DeepChess(诞生的实施)进行比赛。

由于计算限制,SentiMATE无法期待(前瞻)评估游戏质量的许多步骤,因此将自己和对手的搜索深度设置为1意味着只需向前迈出一步。

在这种情况下,SentiMATE以黑白两种方式击败了对手。670.jpg麻省理工学院技术评论报告说AI已经掌握了许多关键策略,例如分叉和铸造。

研究人员还注意到人工智能喜欢King Pawn开放,这是一个非常积极和积极的操作,可以迅速打开局面。

Chebby特别大师Bobby Fischer也说:实践证明这是最好的开始方式。

尽管SentiMATE只能用于计算前进一步,但它仍然证明NLP可以训练有效的评估函数,并且可以使用少量样本来实现。

通过这种方式,它为未来的国际象棋AI培训提供了一种清新,低碳的理念,具有重要意义。671.jpg Paper Portal:

参考报告:

- 结束 - 阅读原文