排序方式: 共有30条查询结果,搜索用时 0 毫秒
1.
本文对Maya的数学节点的使用方法作简要介绍,并以两则实例展示如伺运用数学节点进行高效的动画设置. 相似文献
2.
本文对Adobe公司最新的动画及网页制作软件Flash CS4的动画新特性作了简要介绍和演示,总结了部分工具的使用特点和规律,为Flash新老用户熟悉Flash CS4提供了有益的参考. 相似文献
3.
4.
提出了基于点过程模型(PPM)的连续语音关键词检测方法。该方法首先利用时态模式(TRAP)特征和多层感知器(MLP)计算每个音素的帧级后验概率,在此基础上,将语音可看作多个相互独立的事件(音素),利用泊松过程对事件建立点过程模型,最后通过计算似然比达到关键词检测目的。实验结果表明,对8kHz采样语音,关键词平均召回率和准确率分别可达69.5%和82%以上。 相似文献
5.
提出一种基于层级狄利克雷过程隐马尔科夫模型(HDPHMM)符号化器的无监督语音查询样例检测(QbE-STD)方法。该方法首先应用一个双状态层隐马尔科夫模型,其中顶层状态用于表示所发现的声学单元,底层状态用于建模顶层状态的发射概率,通过对顶层状态假设一个层级狄利克雷过程先验,获得非参贝叶斯模型HDPHMM。使用无标注语音数据对该模型进行训练,然后对测试语音和查询样例输出后验概率特征矢量,使用非负矩阵分解算法对后验概率进行优化得到新的特征,然后在此基础上,应用修正分段动态时间规整算法进行检索,构成QbE-STD系统。实验结果表明,相比于基于高斯混合模型符号化器的基线系统,本文所提出的方法性能更优,检索精度得到显著提升。 相似文献
6.
提出了一种基于音素后验概率和层次凝聚聚类算法的音素边界检测方法。该方法首先利用改进的TRAP结构提取语音信号的帧级音素后验概率;然后,运用层次凝聚聚类算法将提取的音素后验概率进行聚类分析;最后根据其全部的最小损失函数值获取阈值,并通过此阈值决定聚类数目和音素边界。实验证明:该方法具有较好的检测性能,且相对于梅尔倒谱参数(MFCC),音素后验概率更为适合音素边界的检测。 相似文献
7.
8.
为改善低信噪比环境下语音的质量,论文提出了一种改进相位估计的语音增强算法。算法首先根据语音和噪声频谱的统计模型的对称性得到用先验信噪比倒数形式表示的噪声频谱估计值,然后通过分析低信噪比条件下(0dB)相位估计对于幅度估计的重要性,利用噪声频谱估计值估计每一个频点的相位修正值,并给出了一种优化的先验信噪比估计算法,得到一种新的语音增强算法。由仿真实验给出的客观测试和非正式听音测试表明:该算法处理后取得了较好的效果,在抑制低信噪比语音增强所产生的音乐噪声的前提下,相比未改进相位估计的算法处理后的信号,语音失真度更小,语音质量有明显提高。 相似文献
9.
当前基于预训练说话人编码器的语音克隆方法可以为训练过程中见到的说话人合成较高音色相似性的语音,但对于训练中未看到的说话人,语音克隆的语音在音色上仍然与真实说话人音色存在明显差别。针对此问题,本文提出了一种基于音色一致的说话人特征提取方法,该方法使用当前先进的说话人识别模型TitaNet作为说话人编码器的基本架构,并依据说话人音色在语音片段中保持不变的先验知识,引入一种音色一致性约束损失用于说话人编码器训练,以此提取更精确的说话人音色特征,增加说话人表征的鲁棒性和泛化性,最后将提取的特征应用端到端的语音合成模型VITS进行语音克隆。实验结果表明,本文提出的方法在2个公开的语音数据集上取得了相比基线系统更好的性能表现,提高了对未见说话人克隆语音的音色相似度。 相似文献
10.