排序方式: 共有15条查询结果,搜索用时 0 毫秒
1.
简述web服务的关键技术以及其发展的过程,并对一些关键技术进行阐述,web服务是有自己独特的体系,拥有自己的一套架构,并且在这套架构上,web服务拥有自己的核心技术,当单个的web服务难以满足需求的时候,这时候web服务组合就出现了,它能够很好的解决单个web所不能解决的问题,这个很好的满足了现代社会的需求,最后提出web服务技术的未来,其中重点是说明web服务的核心技术。随着网络的兴起,web服务技术被广泛应用于大数据的海洋抓取,比如代购网站中,就需要用到数据的海洋抓取和存储。 相似文献
2.
近年来大量全卷积网络、U-Net等编解码网络结构应用于语音增强,它们具有计算复杂度低、模型参数少等优势。然而,与长短时记忆模型等方法相比,这些编解码结构仍存在不能充分利用先后时间之间和高低频率之间的关联信息等缺点,尤其对于长序列数据的输入,编解码结构存在信息丢失的问题。为保持计算效率的同时考虑更充分的时频关联信息建模,本文提出一种融合注意力机制的U-Net网络的骨导语音增强方法(Att-U-Net),通过在跳跃连接中引入注意力机制,生成一个权重矩阵,将编码层中的全局信息根据权重融入对应的解码层中,使网络在编解码过程中能够关注输入数据中与增强目标相关程度高的重要信息,同时抑制不相关的信息。在骨导语音数据集上的实验表明,融合注意力机制的U-Net网络能在保持模型轻量化的同时有效提升骨导语音的增强效果,增强后的语音在各项客观评价指标上均优于基线模型。通过对编解码网络中间层的可视化分析发现,在解码过程中注意力机制有效地保留了有声段的信息,滤除了骨导语音由于骨导传声特性带来的中频共振,从而使得增强后的骨导语音具有较好的听觉效果。 相似文献
3.
4.
截幅失真会影响语音编码质量,特别在低速率语音编码条件下,截幅语音不再符合人发声模型,编码语音质量严重下降。为了研究截幅失真对低速率语音编码的影响,从截幅语音编码参数提取和截幅语音编码质量两个方面进行了分析。采用偏离度衡量低速率语音编码参数提取的准确性,编码参数包括LPC、基音周期和清浊音。在不同截幅程度下,分析了各种参数错误分布、错误类型和错误原因。采用客观感知语音质量评估PESQ打分评估截幅语音编码质量。针对常用截幅修复方法在截幅程度较大时修复性能下降严重的现象,提出采用两种改进型截幅修复方法对截幅语音进行修复。实验结果表明,改进的截幅修复方法能有效提高截幅程度较大时的低速语音编码质量。 相似文献
5.
一致迭代硬阈值(CIHT)算法在处理音频截幅失真中具有较好的性能。但是,在截幅程度较大时音频截幅修复的性能会下降。因此,该文提出一种基于自适应门限的改进算法。该算法自动估计音频信号截幅程度,根据估计的截幅程度信息,自适应调整算法中的截幅程度因子。与近年来提出的CIHT算法和一致字典学习算法(CDL)相比,该文所提算法能更好地重建音频信号,特别在音频信号截幅失真严重的情况。该算法的运算复杂度与CIHT相近,与CDL相比,拥有更快的运行速度,有利于实时实现。
相似文献6.
本文合成了钛酸铋/银/氯化银(Bi4 Ti3O12/Ag/AgC1,BTO/Ag/AgCl)复合纳米纤维,并研究了其可见光催化性能.通过静电纺丝技术和高温煅烧制备了BTO纳米纤维,采用沉淀-光照还原法在BTO纳米纤维表面负载了Ag/AgC1纳米颗粒获得BTO/Ag/AgC1复合纤维.结果 表明,BTO和Ag/AgC1均具有良好的结晶性能,BTO/Ag/AgC1比单纯的BTO纳米纤维具有更强的可见光吸收.光催化测试表明,由于Ag/AgC1对可见光吸收的增加,以及与BTO间形成的半导体异质结,BTO/Ag/AgC1复合纳米纤维对染料RhB的光催化降解效率均高于纯的BTO纳米纤维,经100 min光照后可由29;提高到80;. 相似文献
7.
近年来,基于神经网络的方法大量应用于骨导语音增强中。然而,由于骨导数据集样本较少,骨导语音高频部分缺失,不同说话人高频部分失真程度不同,神经网络难以有效学习骨导语音的频谱特征。因此,现有骨导语音增强模型对于未知说话人骨导语音数据集增强效果不佳、鲁棒性不强。为充分利用骨导语音的时频信息,引导模型关注骨导语音的低频部分特征,提出一种基于时频注意力机制和U-Net的骨导语音增强方法。该方法将时频注意力机制引入U-Net结构中,首先根据骨导语音时间、频率方向特征信息的重要程度自动为其分配权重,而后以加权后的骨导语音谱作为输入,对应的气导语音谱作为目标进入U-Net结构训练,最后利用训练完成的增强模型重构骨导语音全频带的语音。仿真实验与可视化分析结果表明,对比基线U-Net结构与其他注意力机制,该方法对于未知说话人骨导语音数据集能够取得更高的PESQ和STOI客观评价指标,增强语音更加清晰。 相似文献
8.
知识蒸馏能有效地将教师网络的表征能力迁移到学生网络,无须改变网络结构即可提升网络的性能.因此,在性能优异的目标分割主干网HRNet(High-Resolution Net)中构建自蒸馏学习模型具有重要意义.针对HRNet并行结构中深层与浅层信息充分融合导致直接蒸馏难以实现的挑战,本文提出一种基于多尺度池化金字塔的结构化自蒸馏学习模型:在HRNet分支结构中引入多尺度池化金字塔表示模块,提升网络的知识表示和学习能力;构造“自上而下”和“一致性”两种蒸馏模式;融合交叉熵损失、KL(Kullback-Leibler)散度损失和结构化相似性损失进行自蒸馏学习.在四个包含显著性目标和伪装目标的分割数据集上的实验表明:本文模型在不增加资源开销的前提下,有效提升了网络的目标分割性能. 相似文献
9.
针对传统的神经网络未能对时频域的相关性充分利用的问题,提出了一种利用深度全卷积编解码神经网络的单通道语音增强方法。在编码端,通过卷积层的卷积操作对带噪语音的时频表示逐级提取特征,在得到目标语音高级特征表示的同时逐层抑制背景噪声。解码端和编码端在结构上对称,在解码端,对编码端获得的高级特征表示进行反卷积、上采样操作,逐层恢复目标语音。跳跃连接可以很好地解决极深网络中训练时存在的梯度弥散问题,本文在编解码端的对应层之间引入跳跃连接,将编码端特征图信息传递到对应的解码端,有利于更好地恢复目标语音的细节特征。 对特征融合和特征拼接两种跳跃连接方式、基于L1和 L2两种训练损失函数对语音增强性能的影响进行了研究,通过实验验证所提方法的有效性。 相似文献
10.
提出了一种融合梅尔谱增强与特征解耦的噪声鲁棒语音转换模型,即MENR-VC模型。该模型采用3个编码器提取语音内容、基频和说话人身份矢量特征,并引入互信息作为相关性度量指标,通过最小化互信息进行矢量特征解耦,实现对说话人身份的转换。为了改善含噪语音的频谱质量,模型使用深度复数循环卷积网络对含噪梅尔谱进行增强,并将其作为说话人编码器的输入;同时,在训练过程中,引入梅尔谱增强损失函数对模型整体损失函数进行了改进。仿真实验结果表明,与同类最优的噪声鲁棒语音转换方法相比,所提模型得到的转换语音在语音自然度和说话人相似度的平均意见得分方面,分别提高了0.12和0.07。解决了语音转换模型在使用含噪语音进行训练时,会导致深度神经网络训练过程难以收敛,转换语音质量大幅下降的问题。 相似文献