期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

2篇

专业分类

2篇

出版年

2022年	1篇
2019年	1篇

排序方式： 共有2条查询结果，搜索用时 0 毫秒

融合辅助目标学习和卷积循环网络的非侵入式语音质量评价算法

下载免费PDF全文

唐闺臣梁瑞宇孔凡留谢跃鞠梦洁《声学学报》2022,47(5):692-702

语音质量的客观评价可以代替昂贵的人工评分,但是目前客观指标的计算通常需要纯净的参考语音,这在许多实际声学系统中很难获得。为此提出了一种融合辅助目标学习和卷积循环网络（CRN）的非侵入式语音质量评价算法。为降低算法的复杂度,算法采用基于仿人耳听觉特性滤波器的Bark频率倒谱系数（BFCCs）作为CRN的输入。算法首先构建一个卷积神经网络（CNN）从BFCCs中提取帧级特征。然后,构建双向的长短记忆网络,在帧级特征中建模长期的时间依赖性和序列特征。最后,利用自注意力机制自适应地从帧级特征中筛选出有用信息,将其整合至话语层面的特征中,并将这些话语级特征映射为客观得分。为改善质量评测的有效性,算法采用多任务训练策略,引入语音激活检测（VAD）作为辅助学习目标。基于开源数据库的实验显示,与其他非侵入式算法相比,提出的算法和平均主观意见分（MOS）具有更好的相关性。而且,算法参数规模较小且对ITU-T P.808发布的带有主观MOS的失真语音数据库具有良好的泛化能力,接近语音质量感知评估（PESQ）指标的精度。相似文献

融合改进梅尔谱特征和深信念网络的语音测谎算法 总被引：3，自引：0，他引：3

下载免费PDF全文

谢跃梁瑞宇包永强赵力王诗佳《声学学报》2019,44(2):214-220

为实现非接触式谎言检测,特提出了以语谱特征为线索,结合深度学习的谎言检测方法。为提取谎言中微颤抖所引起的语谱局部能量变化,算法先对梅尔频谱进行了Hu矩处理,然后进行离散余弦变换去除相关性。该特征利用了Hu矩的正交不变性和平移不变性,能较好的体现出语谱中局部能量的集中方式。然后将所提取的特征作为改进深信念网络输入进行谎言识别。为提高受限玻尔兹曼机的并行回火训练算法中相邻温度链之间的交换率,训练算法先对Markov链的状态能量进行等能量的划分,使得每个能量环内的状态具有相似的能量,然后再进行交换以提高交换率从而优化整个网络的训练。在Columbia-SRI-Colorado数据库上的实验表明,谎言识别率达到了71.47%,比梅尔倒谱系数特征的识别率提高了3%,比传统的BayesNet分类算法提高了7%。相似文献