共查询到18条相似文献,搜索用时 69 毫秒
1.
针对目前有监督语音增强忽略了纯净语音、噪声与带噪语音之间的幅度谱相似性对增强效果影响等问题,提出了一种联合精确比值掩蔽(ARM)与深度神经网络(DNN)的语音增强方法。该方法利用纯净语音与带噪语音、噪声与带噪语音的幅度谱归一化互相关系数,设计了一种基于时频域理想比值掩蔽的精确比值掩蔽作为目标掩蔽;然后以纯净语音和噪声幅度谱为训练目标的DNN为基线,通过该DNN的输出来估计目标掩蔽,并对基线DNN和目标掩蔽进行联合优化,增强语音由目标掩蔽从带噪语音中估计得到;此外,考虑到纯净语音与噪声的区分性信息,采用一种区分性训练函数代替均方误差(MSE)函数作为基线DNN的目标函数,以使网络输出更加准确。实验表明,区分性训练函数提升了基线DNN以及整个联合优化网络的增强效果;在匹配噪声和不匹配噪声下,相比于其它常见DNN方法,本文方法取得了更高的平均客观语音质量评估(PESQ)和短时客观可懂度(STOI),增强后的语音保留了更多语音成分,同时对噪声的抑制效果更加明显。 相似文献
2.
噪声估计的准确性直接影响语音增强算法的好坏,为提升当前语音增强算法的噪声抑制效果,有效求解无约束优化问题,提出一种联合深度神经网络(DNN)和凸优化的时频掩蔽优化算法进行单通道语音增强。首先,提取带噪语音的能量谱作为DNN的输入特征;接着,将噪声与带噪语音的频带内互相关系数(ICC Factor)作为DNN的训练目标;然后,利用DNN模型得到的互相关系数构造凸优化的目标函数;最后,联合DNN和凸优化,利用新混合共轭梯度法迭代处理初始掩蔽,通过新的掩蔽合成增强语音。仿真实验表明,在不同背景噪声的低信噪比下,相比改进前,新的掩蔽使增强语音获得了更好的对数谱距离(LSD)、主观语音质量(PESQ)、短时客观可懂度(STOI)和分段信噪比(segSNR)指标,提升了语音的整体质量并且可以有效抑制噪声。 相似文献
3.
针对深度神经网络训练过程中残差随着其传播深度越来越小而使底层网络无法得到有效训练的问题,通过分析传统sigmoid激活函数应用于深度神经网络的局限性,提出双参数sigmoid激活函数。一个参数保证激活函数的输入集中坐标原点两侧,避免了激活函数进入饱和区,一个参数抑制残差衰减的速度,双参数结合有效的增强了深度神经网络的训练。结合DBN对MNIST数据集进行数字分类实验,实验表明双参数 sigmoid激活函数能够直接应用于无预训练深度神经网络,而且提高了sigmoid激活函数在有预训练深度神经网络中的训练效果。 相似文献
4.
通过分析不同区分性训练目标函数之间的关系,以MMI(Maximum Mutual Information)作为分离度量,把不同的区分性训练目标函数统一为基于广义边距的区分性训练准则.并在该广义边距准则下,通过对其权重函数进行讨论,得到两种区分性训练目标函数:利用组合增进因子和候选词路径中误识词个数,加权候选路径,得到SBMMI(Soft Boosted MMI)目标函数;利用基于单个候选词的后验概率定义每一训练语句的错误识别率,采用幂指数的形式对单个候选词动态加权,得到VWMMI(Variable Weighting MMI)目标函数。实验结果表明,与软边距估计准则和增进的最大互信息方法相比,SBMMI方法准确率分别提高了0.89%和0.56%,VWMMI方法能在SBMMI方法基础上提高0.68%. 相似文献
5.
针对干扰或噪声环境下水声目标信号难以获取的问题,该文提出研究基于深度神经网络的自适应水声被动信号波形恢复方法。在单阵元情况下,该方法提取对数功率谱特征作为输入,采用深度神经网络回归模型自适应学习目标信号的自身特征,输出降噪后的对数功率谱特征并还原时域波形。在多阵元情况下,提出阵列深度神经网络降噪方法,将部分或全部阵元特征拼接为长向量作为输入,从而利用空域信息。为全面利用阵列丰富的时频域信息,该文提出一种两阶段特征融合深度神经网络,在第一阶段将阵列分为若干个子阵,将每个子阵分别用阵列深度神经网络进行处理,在第二阶段将第一阶段的各子阵处理结果与阵列接收信号同时输入一个深度神经网络进行融合学习。实验表明,所提出的单阵元和两阶段融合深度神经网络取得了显著优于常规波束形成的恢复结果,能够准确估计目标信号波形和功率并显著提高输出信噪比。 相似文献
6.
提出一种区分性方法,将声调信息加入大词汇量连续语音识别系统中。该方法根据最小音子错误准则,区分性地圳练模型相关的概率权重。利用这些权重对传统基于传统谱特征的隐马尔可夫模型概率以及声调模型概率进行加权,通过调整模型之间的作用程度提高系统识别率。推导了利用扩展Baum-welch算法的权重更新公式。对不同模型权重组合策略进行了评估,并利用权重之间的平滑方法来克服权重训练过拟合的问题。分别通过大词汇连续语音的带调音节输出和汉字输出两种识别任务来验证区分性模型权重训练的性能。实验结果表明在两种识别任务上,区分性的模型权重较使用全局模型权重分别获得9.5%以及4.7%的相对误识率降低。这表明了区分性模型权重对提高声调集成性能的有效性。 相似文献
7.
单扫描时空编码磁共振成像是一种新型超快速磁共振成像技术,它对磁场不均匀和化学位移伪影有较强的抵抗性,但是其固有的空间分辨率较低,因此通常需要进行超分辨率重建,以在不增加采样点数的情况下提高时空编码磁共振图像的空间分辨率.然而,现有的重建方法存在迭代求解时间长、重建结果有混叠伪影残留等问题.为此,本文提出了一种基于深度神经网络的单扫描时空编码磁共振成像超分辨率重建方法.该方法采用模拟样本训练深度神经网络,再利用训练好的网络模型对实际采样信号进行重建.数值模拟、水模和活体鼠脑的实验结果表明,该方法能快速重建出无残留混叠伪影、纹理信息清楚的超分辨率时空编码磁共振图像.适当增加训练样本数量以及在训练样本中加入适当的随机噪声水平,有助于改善重建效果. 相似文献
8.
9.
快速磁共振成像是磁共振研究领域重要的课题之一.随着大数据和深度学习的兴起,神经网络成为快速磁共振技术的重要方法.然而网络性能表现和网络参数量之间较难取得平衡,且对于多通道数据重建的并行成像问题,相关研究较少.本文构建了一种深度递归级联卷积神经网络结构,用于处理并行成像问题.这种网络结构在减少网络参数量的同时,能够尽可能地提高网络的表达能力,提高网络重建的精确度.实验结果表明,相较于传统并行成像方法,通过训练好的神经网络对欠采样磁共振数据进行重建,可以得到更准确的重建结果,且重建时间大大缩短. 相似文献
10.
分子的相互作用在分子动力学模拟过程中起着关键的作用. 受限于计算资源,大分子的长时间尺度的相互作用能无法通过量化计算实现. 本文采用一种深度学习框架-深度张量神经网络来预测三个有机分子相关体系中量化精度的相互作用能. 其中,分子的几何结构和原子类型作为网络的输入用于预测相互作用能. 通过分层生成的数据集合实现了网络中隐层参数的优化和训练. 相互作用能的预测结果显示,深度张量神经网络可以在较短的时间内,在1 kcal/mol的平均绝对误差的范围内准确预测分子间的相互作用能. 这一过程提高了计算效率,并为计算相互作用能提供了可靠的计算框架. 相似文献
11.
For the difficulty of separation between singing and accompaniment in the musical signals,an improved music separation method of based on discriminative training depth neural network(DNN) was proposed.Firstly,based on the DNN model,considering the reconstruction errors and discrimination information between singing and accompaniment,an improved objective function was presented to discriminate the training;Then,an additional layer was added to DNN model,introducing the time-frequency masking to optimize the estimated accompaniment of the song,and the corresponding time-domain signal was obtained by inverse Fourier transform;Finally,the influence of different parameters on the separation performance was verified,and compared it with the existing music separation methods.The experimental results showed that the improved objective function and the introduction of time-frequency masking significantly improved the separation performance of the DNN,and the separation performance was improved about 4 dB compared with other existing music separation methods,thus verifying that the proposed method was an effective music separation algorithm. 相似文献
12.
13.
Interference is a common problem in wireless communication, navigation and radar systems. A wide variety of interferences are used to degrade the communication quality especially in electronic warfare environment. In modern military communication systems, interference classification is an important module for its ability to obtain prior interference information before adopting related anti-interference method. This paper proposes a deep learning based interference classification method, which applies one-dimension convolutional neural networks to automatically extract interference features for classification. Computer simulations show better classification performance and lower computational complexity. Meanwhile, this proposed method is implied on software defined radios (SDR) hardware, more than 99% correct classification probability can be achieved with limited samples of the received signal, which verifies the robustness of this proposed method. 相似文献
14.
针对常规波束形成主瓣宽且目标分辨能力低的问题,提出一种基于深度卷积神经网络的波达方向估计方法。算法使用常规波束形成计算二维空间功率谱,将预处理后的空间功率谱图输入深度卷积神经网络。该文利用神经网络学习解卷积映射关系,输出主瓣宽度更窄的空间功率谱图,从而实现高分辨率二维波达方向估计。该算法对阵列结构没有限制,适用于立体阵。仿真结果表明该文方法在不同目标个数、快拍数及信噪比参数下均能准确估计目标方向。该文方法目标分辨能力优于常规波束形成方法。在低快拍情况下,目标方向估计误差低于自适应波束形成方法。 相似文献
15.
说话人识别技术是一项重要的生物特征识别技术。近年来,使用深度神经网络提取发声特征的说话人识别算法取得了突出成果。时延神经网络作为其中的典型代表之一已被证明具有出色的特征提取能力。为进一步提升识别准确率并节约计算资源,通过对现有的说话人识别算法进行研究,提出一种带有注意力机制的密集连接时延神经网络用于说话人识别。密集连接的网络结构在增强不同网络层之间的信息复用的同时能有效控制模型体积。通道注意力机制和帧注意力机制帮助网络聚焦于更关键的细节特征,使得通过统计池化提取出的说话人特征更具有代表性。实验结果表明,在VoxCeleb1测试数据集上取得了1.40%的等错误率(EER)和0.15的最小检测代价标准(DCF),证明了在说话人识别任务上的有效性。 相似文献
16.
17.
18.
In this paper, a spectrum access problem is proposed to improve the spectrum access rates of secondary vehicles in Cognitive Vehicular Networks, where the channel capacity mathematic model is established under the conditions of spectrum sensing errors rates and the dynamic occupancy spectrum rates. Meanwhile, an improved Q-learning method is proposed to conform the dynamic communication under the different conditions of the reward functions. In this function, a Deep Q Network method with a modified reward function (IDQN) is proposed to deal with the situation of multi-vehicle in multi-channel. In order to verify the effectiveness of the IDQN method, the Myopic method, the improved Q-learning method, and the traditional DQN method are compared on Python. The simulation results shown that the proposed IDQN method not only outperforms the compared methods in terms of channel utilization and channel capacity but also improves the ability that the vehicle adapts to the dynamic communication environment. 相似文献