西班牙语元音自动识别研究

[复制链接]
查看: 220|回复: 0

2万

主题

3万

帖子

7万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
72280
发表于 2022-9-3 16:48:30 | 显示全部楼层 |阅读模式
目:


雅宝题库答案
****此区域为收费内容****    需支付 1 知识币后可查看,1币=0.01元查看答案


雅宝题库解析:
人在说话时肺就像一个语音产生系统的电源。声门提供了带有一定音调频率(F0)的输入。由咽、嘴以及鼻腔构成的声道像乐器一样产生声音。不同形状的声道会产生不同的声音。口腔对形成不同形状的声道起主要作用。为了发出鼻音,鼻腔也包括在声道内,与口腔并联在一起。如今语音分析及语音特征的研究,如共振峰和音调的研究,在语音分析中越来越重要。当你发出一个元音或浊辅音时,声带会周期性地振动以产生声门流。声门流由声门脉冲组成,声门脉冲的周期就是音调周期。音调周期的倒数是音调,即我们熟知的基频。对声门流来说,声道就像一个随时间变化的过滤器。声道的特征包括频率响应,它由咽和舌头的位置决定。声道频率响应的峰值频率即共振峰,也叫共振频率。在信号处理中,语音信号是时变激励与时变滤波器的卷积,其中时变激励即声门流,时变滤波器是声道。为了了解共振峰和音调是如何随时间演变的,研究者们研究了共振峰的轨迹和音调曲线,并认定音调和共振峰是语音信号最重要的特征。下面的研究成果支持 在语音识别系统中研究共振峰的重要性,动态时间规整算法(DTW)能找到两个时间序列之间的最佳对准,通常用于确定时间序列的相似性、分类及寻找两个时间序列之间的一致区域。由于DTW含有时间的二次方及其空间的复杂性,使其只适用于小的时间序列数据集。本课题的目标是引入GPDTW,使用一种图形划分技术,使图像破裂成成相等的部分。对于小幅图像,已有有效准确的算法,但对于大幅图像,目前的解决办法远远没有达到最优。可以使用一种方法找到小幅图像的最优解决方法;我们将通过和另一种已存在的DTW近似算法Sakoe-Chuba对比,分析GPDTW的准确性。得到的结果将显示这种方法比已有方法在准确性上有很大的进步。该课题需实现以下功能:GPDTW匹配:给出测试信号及模板,应能找到最佳匹配路径及相应的匹配代价,识别出信号并打印出最佳匹配代价。本文介绍了一种基于特定人的孤立元音识别系统。虽然每个元音用的是线性预测编码,分类阶段是通过GPDTW方法完成的,这就允许各个语音样本的时间间隔彼此独立。得到的结果表明采用这种技术能达到90%的正确分类率。





上一篇:基于非结构化点云三维人脸识别研究
下一篇:基于知识系统的电路板级故障诊断技术研究
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图