短文本蕴含识别的研究

[复制链接]
查看: 74|回复: 0

2万

主题

3万

帖子

7万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
76453
发表于 昨天 17:52 | 显示全部楼层 |阅读模式
目:


雅宝题库答案
****此区域为收费内容****    需支付 1 知识币后可查看,1币=0.01元查看答案


雅宝题库解析:
随着Internet的飞速发展,以电子文档形式存在的文本信息飞速增长。这些数据往往纷繁复杂、重复冗余,既相互关联,又相互矛盾。面对如此浩瀚如海的信息,人们在享受丰富网络资源的同时,也遇到各种困扰。如何有效的组织和管理这些信息,如何快速准确地实现信息定位,如何去除冗余信息等等。这些题目的产生,使得文本的语义研究变的越来越重要。文本蕴含识别正是在这样的背景下提出,它旨在促进文本的语义研究,提高机器对于自然语言的理解能力,跨越具体应用实现统一语义分析,更好地利用自然语言处理技术帮助具体应用解决本领域题目。文本蕴含识别建立在自然语言理解的基础上,通过语义推理识别文本蕴含关系,然而自然语言的特点即自然语言具有丰富的表述多样性和歧义性,造成了自然语言表述与概念世界的映射具有多重性,这为文本蕴含识别提出了巨大的挑战。同时,文本蕴含关系可以通过不同层面体现,这进一步加大了文本蕴含识别的难度。在识别文本蕴含关系时,如果能充分发掘文本和假设的语义和语法结构信息,将有助于提高识别的准确率。本文分别从词、短语和句子三个方面对文本蕴含识别进行了研究,针对如何从上述三个方面提高文本蕴含识别准确率提出了合理的解决方法。基于词特征的文本蕴含识别研究中,本文从表形相似性和词间语义联系两个角度分别分析了其对文本蕴含识别的影响,并分别提出了基于词形匹配和词序相似性的文本蕴含识别模型以及基于词间语义联系的文本蕴含识别模型。在基于词形匹配和词序相似性的文本蕴含识别模型中,本文引入了字符串核方法计算词序相似性特征,并通过实验证明了其有效性。基于词间语义联系的文本蕴含识别模型中,本文将文本蕴含识别题目转化为语义空间的包含题目,并提出了新的蕴含度量机制。实验结果表明,上述识别模型均有效可行,准确率均显著高于随机测试水平。基于短语特征的文本蕴含识别研究中,本文模拟人类认识复杂概念方式首先提出了基于属性集相似性的短语相似性度量方法。该方法充分发掘短语的语法结构和语义信息,将短语表示为属性集集合,通过属性集相似性度量短语相似性。在此基础上,本文将短语看作粗粒度的概念,并基于概念空间包含思想提出了基于短语相似性的文本蕴含识别模型。实验结果表明,提出的短语相似性度量方法有效,同时提出的基于短语相似性的文本蕴含识别模型可行有效,具有良好的识别能力。基于句子特征的文本蕴含识别研究中,本文对文本和假设分别进行依存句法分析,将其从线性序列转化为一棵结构化的树。分析了依存三元组的理想匹配和潜在匹配情况,并针对上述两种情况给出了其相似度度量方式,在此基础上提出了依存树相似性度量方法,最后从句法结构相似性角度综合文本蕴含识别方向性特点提出了文本蕴含识别模型。实验结果表明,提出的基于依存树相似性的文本蕴含识别模型有效,并优于现有的一些识别模型。通过分析上述基于词特征、短语特征和句子特征识别模型的优缺点,本文提出了基于多特征融合的文本蕴含识别模型。该模型从不同侧面抽取特征反映文本蕴含关系,不同特征各有侧重,互为补充,结合机器学习方法,更好地实现文本蕴含关系识别。实验结果表明,该模型的准确率在RTE1-3挑战中均显著高于参赛系统的平均水平。本文的实验均建立在标准数据集或者是被广泛采用的数据集上。实验从多个角度分析了文本蕴含识别模型的性能,结果表明提出的文本蕴含识别模型具有良好的文本蕴含识别能力,优于现有的一些文本蕴含识别模型。





上一篇:两种典型航空铝合金结构材料腐蚀损伤行为研究
下一篇:自动油门执行机构自动测试系统的设计与实现
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图