自然语言生成的认知状态统计模型

为了使机器人能够在各种环境下使用,它们需要能够与人类进行无缝交流。近年来,研究人员已经开发了越来越先进的计算模型,可以让机器人处理人类的语言和制定适当的反应。

机器应该掌握的人类语言的一个重要方面是句子中代词的使用。根据一种被称为“给予度层次”的语言学理论,人们选择使用什么代词是基于他们对对象在他们的听者心中的“认知状态”的隐含假设。例如,如果说话者认为他们的目标对象在当前对话中处于“焦点”(这是一种认知状态),他们可能会选择使用代词“it”。

科罗拉多矿业学院MIRRORLab的研究人员最近在arXiv上发表的一篇论文中提出了两种认知状态模型。第一个模型是直接由GH文献提供信息的理论基于规则的有限状态机模型,而第二个模型是统计概率模型(认知状态过滤器),它预测不确定性下对象的认知状态。

“我的顾问汤姆•威廉姆斯博士和他的同事已经开始研究使用的概念认知状态帮助机器自然语言理解(NLU),在一个侦听器来识别目标对象给他们的认知状态/引用形式的信息,“Poulomi朋友,其中一个研究人员进行的这项研究,对TechXplore说。“我们最近这篇论文的主要想法/目标是基于赋予层次(GH)的语言理论为自然语言生成(NLG)创建一个认知状态过滤的计算模型,更具体地说,是为了提高机器使用代词(例如,it, this, that等)。”

Pal和她的同事提出的第一个模型是一个有限状态机(FSM)模型,它根据GH文献的规则生成对象的认知状态。本文提出的第二个模型是一个认知状态过滤器(CSF),它可以自动从文本数据中学习这些规则。然后,研究人员根据亚马逊土耳其机器人在线平台收集的数据训练和评估了他们的CSF模型。

在CSF模型的实验设计中,研究者使用了OFAI多模态任务描述语料库银标准英译的一个子集,该语料库是人与人、人与机器人多模态交互的集合。他们发现,CSF比FSM模型更好地处理不确定性,因为它不遵循预先建立的规则,而是直接从分析的数据中获得规则。

Pal说:“我们的结果表明,在预测物体认知状态方面,CSF模型比FSM理论模型稍微好一点。”“因此,与基于规则的理论模型相比,CSF模型在尝试评估一个对象的认知状态时(尤其是在数据很大的时候)可能更可取,因为它可以自动从数据中学习规则。”

帕尔和她的同事设计的CSF模型可以通过提高机器人在对话中使用代词的能力,最终帮助增强人类和机器人之间的自然语言交互。未来,这些发现可能会启发其他团队开发机器人应用的类似模型,以及根植于其他研究领域的类似技术,如计算语言学或认知心理学。

Pal说:“我们相信,发展一个像CSF这样的计算模型,将有助于促进自然语言生成和理解的认知途径。”“我的进一步研究计划包括开发和实施一个基于gh的回指生成模型,该模型在为NLG选择不同的参考形式时利用CSF模型来解释对象的认知状态。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢