句子大全

句子大全 > 好句子

迈向创造性语言生成:汉语幽默自动生成的探索之一

好句子 2014-03-14 10:51:12
相关推荐

幽默生成是计算创造性任务之一能够赋予计算机一定的个性化与创造性而且可以提升用户体验此文以笑话的生成进行汉语幽默生成的探索性研究首先提出一个符合当前自然语言生成技术的笑话生成任务给定笑话的主体部分生成相应的笑点句然后尝试了基于经典编码器-解码器框架的方法与基于生成对抗网络的方法来完成该任务为了克服编码器-解码器框架中对幽默特点没有建模的局限此文在生成对抗网络方法中融入了歧义性不一致性语音相似性普遍性等笑话属性特征来评价指导笑话的生成实验结果表明在生成对抗网络方法中融入笑话属性特征后系统输出构成笑话的比例提升了6个百分点尽管从总体来看系统自动生成的笑点句构成笑话的比例还偏低但此文通过对幽默生成问题的研究探索带动了对创造性语言生成问题的洞察与理解标志着我们向创造性语言生成的探索迈进了一步

1 引言

随着人工智能与计算创造技术的发展人们不仅期望计算机能以人工智能的方式完成任务还期望计算机能像人一样进行写作绘画等方面的创造性活动目前计算创造性任务主要集中在音乐视觉语言文字等方面的创作其中语言文字创作包括隐喻生成故事创作菜谱生成诗歌创作及幽默生成等

幽默是人类特有的复杂认知行为不仅体现了人类的创造性思维而且在人际交往中扮演着重要角色如化解冲突使问题更容易解决增加个人魅力与独特性等如果计算机具备了人类的幽默感就具有了一定的创造性与个性化特点同时也使得计算机在完成复杂任务时能够提升用户体验如已有研究表明幽默在虚拟招待员这样的人机交互系统中引入笑话使得总体对话量增加了50%因此幽默的生成值得我们关注

幽默包括语言型幽默与非语言型幽默前者指通过语言文字表现的幽默如笑话双关语等是日常生活中最常见的幽默后者指通过语言之外的方式如动作表情等表现的幽默此文主要进行语言型幽默的生成研究

幽默生成的研究相对较少而且大多关注特定形式以词语选择为中心任务的幽默生成有少数研究者探索开放形式的幽默生成如Ren等尝试使用神经网络方法生成笑话中的每一个词但高质量笑话生成的比例较低只有12.1%这在一定程度上反映出完整的幽默生成是一个比较困难的问题

笑话是幽默的一种主要形式一般由主体与笑点两部分构成其中主体部分是笑话的基础包含读者的结果预期笑点部分是笑话中使人发笑的句子或词语一般是笑话的结尾

此文提出一个汉语笑话的笑点句生成任务给定一个笑话的主体部分要求系统生成对应的笑点句来达成幽默此文将笑点句的生成看作一个序列到序列的自然语言生成问题并尝试了两种基于深度学习的方法第1种方法基于经典的编码器-解码器框架编码器与解码器均采用LSTM模型该方法能够依据给定的上下文实现笑点句的生成但这种方法使用最大似然估计作为目标函数偏向于生成通用或者训练集中频繁出现的句子作为回复而且没有对幽默自身特点进行建模刻画为了缓解这些局限此文又尝试了第2种方法基于生成对抗网络的方法构建生成器该模型包含生成器G与判别器D两个构件生成器G用来生成笑点句判别器D用来评价G的生成结果其输出被看作是生成器G的期望奖励函数与此同时此文还将笑话的属性特点融入到期望奖励函数显式地对幽默质量进行评价弥补了原有模型对幽默特点刻画不足的缺陷

2 相关研究

语言学中的幽默包含两大类言语性幽默与指称性幽默其中言语性幽默主要借助谐音多义等语言形式或语言特征产生的幽默这类幽默在翻译过程中经常因为难以保留引起幽默感的语言特征而失去幽默感指称性幽默主要是通过语言产生的意义来实现幽默效果翻译后幽默感仍得以保留

人们在亚里士多德时代就开始从社会情绪和认知等不同角度研究幽默的产生机制迄今为止主流的3种理论有优越论释放论与不一致论优越论从社会的角度理解幽默认为幽默的产生是由于感知者突然意识到的超过别人的优越感释放论从情绪的角度进行幽默理解认为人们之所以意识到是幽默并发笑是因为人通过后天教育和社会影响所形成的情绪和心理压抑在幽默世界里得到了释放不一致论认为读者对故事的预期与故事结局存在不一致是幽默产生的关键这种观点后来被形式化为幽默的语义脚本理论与言语幽默的通用理论不一致论被研究者广泛认可基于不一致论的幽默生成研究主要通过制造上下文的不一致来达成幽默效果

幽默的生成属于自然语言生成与计算幽默研究领域计算幽默是人工智能领域中一个较新的研究分支主要研究利用计算机对幽默建模的技术与方法具体包括幽默识别与幽默生成两类研究与幽默识别相比幽默生成的研究相对较少

目前大部分幽默生成面向特定类型特定形式的幽默进行其核心任务是选择词语填充到固定结构的槽中例如JAPE使用少量的模式生成了双关语式的幽默HAHAcronym对现有的缩写生成新的幽默解释Petrovic等从名词-属性相似度属性奇异度属性歧义度名词差异度4个方面提出4个假设使用无监督方法发现可笑的三元组并进行模板填充来生成I like x like I like y,z形式的幽默Aggarwal等生成海地语三行诗形式的笑话Valitutti等尝试利用满足某种约束的单词替换生成幽默文本Ozbal等利用WordNet与ConceptNet生成了创造性的幽默新词。

阅读剩余内容
网友评论
相关内容
拓展阅读
最近更新