基于开放百科的概念关系抽取技术研究与实现

[复制链接]
查看: 351|回复: 0

23万

主题

23万

帖子

32万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
329468
发表于 2022-4-10 19:10:17 | 显示全部楼层 |阅读模式
目:


雅宝题库答案
****此区域为收费内容****    需支付 1 知识币后可查看,1币=0.01元查看答案


雅宝题库解析:
概念是对客观实体的抽象描述,概念间相互关联衍生出缤纷复杂的语义关系,构成自然语言世界的基础。为适应语义推理和智能化服务的需求,语义Web为代表的下一代信息互联网络,试图在任何微小数据间构建连接,而概念关系正是构建语义网络的基础。此外,概念关系抽取在信息检索、自动问答、机器翻译等领域也都有着广泛应用。    基于模式匹配的关系抽取需要预先定义模式规则,基于知识的关系抽取需要大量的基础知识为背景,而基于监督的关系抽取则依赖大量的人工标注语料。以上传统概念关系抽取方法在领域适用范围和自动化程度上存在缺陷,而开放概念关系抽取充分利用自然语言处理技术和统计学模型,一定程度上摆脱了对人力的依赖,并且消除了适用范围的限制。    本文以开放百科为数据源,以开放信息抽取的方式抽取概念关系。开放百科以维基百科、百度百科为代表,信息结构和质量良好,包含比较完整的目录系统、信息表格、条目定义及丰富的超链接。同Internet相比,开放百科虽然信息较少,但覆盖常用语义,且噪音率低,结构更为清晰。本文在以下三方面展开概念关系抽取技术的研究任务:    (1)在解释语义模型基础上提出RFA算法,即基于表现语义分析的概念相关度计算方法。本算法从表现语义特征的角度融合解释与被解释语义,并结合词频统计和中文语用对特征权重计算方法进行了优化。实验表明,RFA算法在准确性上不低于ESA算法,但克服了ESA算法不能表征、计算“无出度概念词条”的缺陷,且更适合应用于概念关系发现。    (2)基于语义空间的稀疏性和主权重特征在概念相关度量化中相对优势,本文提出主权迭代搜索概念关系发现算法。通过带阈值监督的滑动窗口动态调控搜索迭代数,利用构建特征向量双向索引优化搜索效率,进而使算法时间效率接近布尔搜索法,而相对全局枚举法的召回率亦超过95%。    (3)基于语义共现模型的概念关系标签抽取算法。该算法在已得到的概念关系对基础上,通过带偏移量的倒排搜索快速获取概念对共现语段,利用浅层句法分析和加权词窗过滤算法得到候选关系标签,利用语义聚类分析进一步选取得到概念关系标签。    最后,本文详细设计并实现了概念关系抽取及检索展示系统“百科关系立方体”。用户可通过该系统检索查看超过三百万的概念词条数据和超过两亿条概念关系信息。





上一篇:气液喷注器数值仿真和试验研究
下一篇:软件块完整性检测及恢复机制研究与实现
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图