排序方式: 共有39条查询结果,搜索用时 15 毫秒
21.
提出了一种面向多样化声学场景自适应设计声学编码器的方法 (SAE)。该方法通过学习不同声学场景下语音中包含的声学特征的差异,适应性地为端到端语音识别任务设计出合适的声学编码器。通过引入神经网络结构搜索技术,提高了编码器设计的有效性,从而改善了下游识别任务的性能。在Aishell-1、HKUST和SWBD三个常用的中英文数据集上的实验表明,通过所提场景自适应设计方法得到的声学编码器相比已有的声学编码器可以获得平均5%以上的错误率改善。所提方法是一种深入分析特定场景下语音特征、针对性设计高性能声学编码器的有效方法。 相似文献
22.
本文在AT牵引供电方式下对scott接线变压器进行建模与仿真研究,提出Scott变压器正常运行与端口处故障的等效模型,并将scott变压器与自耦变压器相结合,形成AT供电方式的牵引供电系统模型,利用PSCAD软件进行仿真。通过本文的建模仿真,为AT牵引供电系统的建模与牵引网的建模奠定基础。 相似文献
23.
提出了波达方向初始化空间混合概率模型的语音增强算法。通过声源定位估计出声源波达方向,再根据此计算相对传递函数,进而构造空间协方差矩阵来初始化空间混合概率模型。论证了相对传递函数在作为模型参数中语音协方差矩阵的主特征向量时,空间混合概率模型对应的概率分布可达到最大值,进而使期望最大化算法在迭代时更易收敛,以得到期望的掩蔽值。实验先后在自建仿真数据集和CHiME-4的两通道数据集中进行验证,结果表明,将波达方向信息引入到语音增强后语音识别系统的词错误率可以比未引入波达方向的词错误率最多降低3.79%,信号失真比最多提升2.00 dB,验证了在结合波达方向后的空间混合概率模型进行语音增强时性能有所提升。 相似文献
24.
在旋转床(RPB)中,用氮气-系统,通过氧解吸过程对两种不同形状填料的传质过程进行实验研究,实测体积传质系数与转子转速、液体流率及气体流率的关系,进而揭示出旋转床内两种填料的传质特性。对这两种不同形状的填料表面传质特性进行比较,找出传质效果较好的填料。文中还进一步对填料比表面积对体积传质系数的影响进行了探讨,证实了液体在转子填料层中的连续微粒化所得到的大量液滴表面是旋转床传质强化的重要因素。基于对旋转床传质的实验结果,提出了平均体积传质系数的回归关系式。 相似文献
25.
利用反相Pickering乳液聚合法制备了聚α-甲基丙烯酸/二氧化硅复合微胶囊。以改性纳米二氧化硅为稳定剂,以液体石蜡作为油相,以α-甲基丙烯酸的水溶液作为水相,经超声乳化,可得到水/油型的Pickering乳液。再经过聚合,即可得到复合微胶囊。微胶囊的平均粒径约为10μm,胶囊壁由二氧化硅颗粒层和聚合物层两部分组成,壁厚约为1μm。以罗丹明B为缓释试剂研究了微胶囊的可控缓释性能,研究结果表明复合微胶囊具有良好的pH敏感性,在碱性体系中罗丹明B的释放量为15.0%,在酸性体系中罗丹明B释放量提高至98.4%。 相似文献
26.
常见的多说话人语音合成有参数自适应及添加说话人标签两种方法。参数自适应方法获得的模型仅支持合成经过自适应的说话人的语音,模型不够鲁棒。传统的添加说话人标签的方法需要有监督地获得语音的说话人信息,并没有从语音信号本身无监督地学习说话人标签。为解决这些问题,提出了一种基于变分自编码器的自回归多说话人语音合成方法。方法首先利用变分自编码器无监督地学习说话人的信息并将其隐式编码为说话人标签,之后与文本的语言学特征送入到一个自回归声学参数预测网络中。此外,为了抑制多说话人语音数据引起的基频预测过拟合问题,声学参数网络采用了基频多任务学习的方法。预实验表明,自回归结构的加入降低了频谱误差1.018 dB,基频多任务学习降低了基频均方根误差6.861 Hz。在后续的多说话人对比实验中,提出的方法在3个多说话人实验的平均主观意见分(MOS)打分上分别达到3.71,3.55,3.15,拼音错误率分别为6.71%,7.54%,9.87%,提升了多说话人语音合成的音质。 相似文献
27.
发音错误检测与诊断(MDD)任务的专家标注数据稀缺。从添加发音模型更高效地利用有限数据建模发音规律,辅助基于音素识别的MDD的思路出发,提出一种同时融合声学和文本信息,在理论上更完备地建模发音错误产生过程的声学发音模型。基于发音错误产生过程不同部分的声学关联性,该模型通过与音素识别模型共享声学编码器网络参数,以多任务学习方式联合优化,实现辅助建模。并且,提出声学置信度掩蔽--预测训练方式进一步强化两个任务的联系,提高辅助建模效率。实验表明,声学发音模型能够有效建模发音错误规律;利用其辅助音素识别模型建模后,MDD系统在发音错误检测、诊断和音素识别上分别有4.9%,9.5%和14.0%的提升;声学置信度掩蔽--预测训练方法提高了辅助建模效率,掩蔽参数或联合优化参数选择也会影响辅助建模效果。 相似文献
28.
在多语种语音合成任务中, 由于单人多语种数据稀缺, 让一个音色同时支持多种语言合成变得非常困难。不同于已有方法仅在声学模型中解耦音色和发音, 提出一种融合跨说话人韵律迁移的端到端多语种语音合成方法, 采用两级层级条件变分自编码器直接建模从文本到波形的生成过程, 并解耦了音色、发音和韵律等信息。该方法通过迁移目标语种已有说话人的韵律风格来改善跨语种合成的韵律。实验表明, 所提模型在跨语种语音生成上获得了3.91和4.01的自然度和相似度平均意见得分, 相比基线跨语种合成字错误率降低到5.85%。韵律迁移以及消融实验也进一步证明了该方法的有效性。
相似文献29.
液相还原法制备纳米铜粉 总被引:6,自引:0,他引:6
本文研究了以CuSO4为原料、以KBH4为还原剂,在液相中还原制备纳米铜粉的实验方法。主要讨论了KBH4与CuSO4的反应过程,以及络合剂EDTA、分散剂PVP、表面修饰剂SMA对反应过程和产物的影响。最终两条反应路线都得到了分散性好的铜粉,平均粒径分别为28.4 nm和40 nm。 相似文献
30.
纳米改性氢氧化铝(CG-ATH)表面处理工艺对纳米 CG-ATH/PA6复合材料力学性能的影响 总被引:2,自引:0,他引:2
用偶联剂对纳米改性氢氧化铝(CG-ATH)进行了表面处理,制备出纳米CG-ATH/PA6复合材料。研究了偶联剂用量、偶联剂种类及CG-ATH的改性温度对复合材料力学性能的影响。结果表明:填充表面处理后的CG-ATH,可以大幅提高复合材料的力学性能;填充用A1偶联剂表面处理,偶联剂质量分数为1.0%,改性温度为75~80℃条件下处理的CG-ATH,得到的复合材料的力学性能最好;表面处理明显提高了CG-ATH在PA6中的分散性。 相似文献