|
题目:
雅宝题库答案:
****此区域为收费内容**** 需支付 1 知识币后可查看,1币=0.01元查看答案
雅宝题库解析:
为了实现自然和谐的人机交互(human-computer interaction,HCI),需要使计算机具有情感识别和情感表达能力。语音是人机交互中非常重要的一种方式。目前的语音合成技术在自然度上已经达到了很高的水平,但还不能像人类一样自由的表达情感。本文的研究目标是通过统计语音的情感特征表现,完成从中性语音到高兴、悲伤、愤怒、惊讶四种情感语音的转换。 本文对情感语音采用离散分类表示方法,以北航情感语音数据库(BHUDES)中的语音样本为基础,统计出中性、高兴、惊讶、愤怒和悲伤几种情感语音的特征规律。在清音段和浊音段的划分上,采用预测能量残差和一阶反射系数相结合的方法,并对计算结果重新进行校验,更正误判帧,提高整体判别率。由于语音的基频曲线中包含丰富的情感信息,本研究从情感语音转换的角度出发,建立情感语音基频曲线数学模型。考虑到情感语音转换和语音合成的区别,本文去除了原有基频模型中与语音合成相关的参数,并更换了模型的数学表示方法。通过对原始基频曲线的三要素进行独立修改后可以得到目标基频曲线。 从语音信号产生的机理出发,建立激励类特征修改模块和声道特征修改模块,实现情感语音的转换。对于基频、时长和能量等激励类特征的修改,首先对中性语音进行基音标注,然后根据目标基频曲线对完成基音标注的中性语音进行基音同步叠加分析和处理,从而更改语音的韵律;考虑到呼吸声等修饰音对情感的影响,本文将修饰音的生成和基音同步叠加有效的结合在了一起;对于声道特征的修改本文采用LPC分析法求出声道传递函数,然后通过改变声道传递函数的极点对声道特征作出相应的修改。 转换后得到的情感语音,采用MOS方法进行评价。评价结果表明,转换后的情感语音能够包含相应的情感信息。 |
上一篇:部署在云上的测试服务研究下一篇:航空宽带通信系统数据链路层关键技术研究及实现
|