多媒体信息标注和检索关键技术及应用

[复制链接]
查看: 287|回复: 0

2万

主题

3万

帖子

7万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
76393
发表于 2024-2-14 19:58:25 | 显示全部楼层 |阅读模式
目:


雅宝题库答案
****此区域为收费内容****    需支付 1 知识币后可查看,1币=0.01元查看答案


雅宝题库解析:
随着数字拍摄设备、压缩技术、存储设备及计算机网络的发展,多媒体数据数量飞速增长。同时,图像和视频分享网站的快速发展极大的促进了人们之间的信息交流,也使多媒体信息的传播变得更加迅速,其数量呈现出爆炸式的增长。浩如烟海的多媒体信息使得用户难以找到其真正需要的信息,因此,对多媒体信息进行有效组织和快速搜索的需求日渐迫切。这使得多媒体内容分析,语义标注以及检索成为当前多媒体研究领域的重点。本文探索和研究多媒体信息标注和检索技术的题目和难点,并研究利用多媒体数据智能分析和检索技术进行实际应用的题目。研究工作主要从三个方面进行: 1)研究多媒体信息的自动语义标注,即多媒体内容的分析和理解; 2)研究如何方便用户查询多媒体信息、如何针对用户的查询意图进行有效的多媒体信息检索及排序; 3)研究如何把多媒体的智能分析和检索技术用到实际应用中。具体的研究任务可以归纳为以下几个方面:1、基于互联网在线资源的多媒体语义理解的研究。由于万维网上的多媒体信息(图像、视频)共享网站富含多媒体信息,且这些信息都包含丰富的、上传者标注的关键词,因此,本文研究如何利用万维网作为一个知识库来理解无语义信息的多媒体数据。利用该知识库的辅助以及视频内容分析技术,理解待分析的、无语义标注信息的视频。本文提出的自动视频标注方法包括以下步骤:首先,从互联网上收集大规模的视频库。其次,基于相似视频检测技术从视频库中检索到与待标注视频相似的一组视频或者视频片段。然后,从相似视频的文本信息中得到若干候选文本标注词。最后,应用标注改善算法选择最好的若干标注词。2、多模态查询形式和多模态视频检索的研究。由于多媒体信息检索系统的检索最终结果是提交给用户的,而且检索结果的好坏由用户来评价,因此,如何让用户参与检索是多媒体信息检索的重要研究方向。当用户输入文本查询的时候,我们的系统能够在一种容易使用的下拉方式下提供有代表性的图像样例,从而可以帮助用户更精确更有效的表达他们检索意图。对于原始查询是很好的补偿。在重新形成更好的查询和分析新的查询以后,多模态查询(即文本、图像)被输入到独立的检索模型,即基于文本的检索模型、基于概念的检索模型和基于视觉样例的检索模型。然后,应用多模态融合方法来集成检索结果。本文提出的这种新颖的多模态查询建议方法能够利用多模态分析处理方法来提高最终检索结果与用户需求的相关性,从而提高检索质量。3、基于排序学习的图像检索。本文提出了一个基于排序学习(learning to rank)算法的图像检索排序模型JLR(Joint Visual and Text information for Learning to Ranking),综合利用图像的相关文本和视觉特征在一个单步骤的统一学习排序模型中进行排序,从而避免重排序(reranking)等多步骤算法的错误传播的可能性。同时由于直接使用低层视觉特征建立排序模型,所以无需花费大量的计算代价来训练高层语义概念分类器。4、利用多媒体智能分析及检索技术进行实际应用的研究。在多媒体智能应用方面,我们提出了在线图像广告系统。传统的在线广告方式是基于整个网页的内容来显示相关的广告。随着多媒体数据以极高的速度增长,同时多媒体数据的视觉内容比一般文本具有更高的吸引力, 多媒体数据可以成为在线广告的媒介。本文提出了一个针对图像的上下文广告系统ImageSense,能够自动的给图像配上一个相关的广告,并且把广告插入到每个图像的不显著区域。该系统支持用户计算机上的图像,媒体共享网站里面的图像,图像搜索引擎返回的图像以及网页里面的图像,形成从节点到根(图片、网页、网站)的不同等级的广告投放。在ImageSense系统中,选择广告不但基于文本相关性,而且基于视觉相关性,因此广告的相关性既与网页相关,也与图像内容本身相关。广告插入位置基于图像显著区域检测以及人脸和文字检测,从而不会覆盖图像的重要信息,尽量避免用户产生厌恶感。





上一篇:基于业务服务管理的金融组织IP运维管理研究
下一篇:某航天单位仓储管理系统
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图