期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

柳宗铭王丽李军锋张鹏远《声学学报》2023,48(1):264-273

发音错误检测与诊断(MDD)任务的专家标注数据稀缺。从添加发音模型更高效地利用有限数据建模发音规律,辅助基于音素识别的MDD的思路出发,提出一种同时融合声学和文本信息,在理论上更完备地建模发音错误产生过程的声学发音模型。基于发音错误产生过程不同部分的声学关联性,该模型通过与音素识别模型共享声学编码器网络参数,以多任务学习方式联合优化,实现辅助建模。并且,提出声学置信度掩蔽-预测训练方式进一步强化两个任务的联系,提高辅助建模效率。实验表明,声学发音模型能够有效建模发音错误规律;利用其辅助音素识别模型建模后,MDD系统在发音错误检测、诊断和音素识别上分别有4.9%,9.5%和14.0%的提升;声学置信度掩蔽-预测训练方法提高了辅助建模效率,掩蔽参数或联合优化参数选择也会影响辅助建模效果。相似文献

2.

连续音素的改进深信度网络的识别算法*

下载免费PDF全文

阴法明赵焱赵力《应用声学》2019,38(1):39-44

为提高连续语音识别中的音素识别率,提出一种基于改进并行回火训练的受限波尔兹曼机的音素识别算法。首先,利用经过等能量划分后的改进并行回火算法来训练受限玻尔兹曼机,接着将受限玻尔兹曼机堆叠组成一个深信度网络,从而作为深度神经网络预训练的基础模型,然后通过softmax层输出,得到用于音素状态后验概率检测的深度神经网络。接着,利用少量的标签数据,根据反向传播算法对网络权重进行微调。最后,将所得后验概率作为隐马尔科夫的发射概率,然后利用Viterbi解码器实现音素识别。在TIMIT语料库上的实验表明,识别率相比于传统的对比散度类算法提高了约4.5%,在不增加计算量的情况下比原始并行回火算法提高约1%。相似文献

3.

一种基于音素模型感知度的发音质量评价方法 总被引：1，自引：1，他引：0

张茹韩纪庆《声学学报》2013,38(2):201-207

为了提高发音质量判别精度,提出了一种基于音素模型感知度的发音质量评价方法。它采用不同语音样本集合下样本声学特征的对数后验概率期望差作为音素模型对变异发音的感知度,并以此为基础,生成各音素对应的识别模型候选集。实验表明,所提出的方法使语音识别网络候选音素模型集合尺寸减少约95%;在非母语语音数据库上,该方法评分与人工专家打分相关性为0.828,基于该方法得到的声韵母错误检出率为70.8%,声调错误检出率为42.5%,均优于其它方法。相似文献

4.

一种深空背景空间小目标条痕检测算法

《光学学报》2010,(2)

针对深空慢速运动目标(目标在焦面的运动速度小于1 pixel/frame)提出了一种最大似然条痕检测算法,能够在较低信噪比情况下实现有效的慢速目标检测。算法将目标脉冲形状信息引入信号模型中,是最大值投影算法的改进形式。建立基于高斯噪声分布的图像信号模型,在此基础上推导了最大似然条痕检测算法模型;分析该算法的实时性及其理论探测性能;采用蒙特卡罗仿真方法比较最大似然条痕检测算法与最大值投影检测算法的检测性能。仿真结果表明,输入信噪比为3.5时,最大似然条痕检测算法的探测概率为95%,其相同探测概率条件下所需信噪比比最大值投影算法降低了2.5(即最大值投影算法要达到95%的检测概率,所需信噪比为6)。算法实时性分析表明,最大似然条痕检测算法的实时处理能力为31.25 Mb/s。相似文献

5.

基于发音特征的汉语普通话语音声学建模 总被引：3，自引：0，他引：3

张晴晴潘接林颜永红《声学学报》2010,35(2):254-260

将表征汉语普通话语音特点的发音特征引入汉语普通话语音识别的声学建模中,根据普通话发音特点,确定了用于区别普通话元音、辅音以及声调信息的9种发音特征,并以此为目标值训练神经网络得到语音信号属于各类发音特征的后验概率,将此概率作为语音识别的输入特征建立声学模型。在汉语普通话非特定人大词表自然口语对话识别系统中进行了实验验证,并与基于频谱特征的声学模型进行了比较,在相同解码速度下,由此方法建立的声学模型汉字错误率相对下降6.8%;将发音特征和频谱特征进行了融合实验,融合以后的识别系统相对基于频谱特征系统的汉字错误率相对下降10.1%。上述结果表明,基于发音特征的声学模型更加有效的实现了对语音特性的表征,通过利用发音特征和频谱特征的互补性,能够进一步实现对语音识别性能的提高。相似文献

6.

辅助判决式最大似然式相干光接收机的冷启动(英文)

翟薇薇陈健沈建华余长源《光子学报》2014,(Z1)

在辅助判决式最大似然式相干接收机启动策略基础上,提出了另一种冷启动方案:利用M次幂算法获得启动序列,再过渡至辅助判决最大似然性相位估计.仿真结果验证了该方案的可行性.进一步优化表明:当M次幂算法与辅助判决最大似然性算法参数均取最优值时,冷启动方案性能达到最佳.与传统启动方案相比,这种冷启动方案能够应用于多接收机系统中,且更加适用于未来突发模式相干光传输系统中. 相似文献

7.

基于小波概率估计的图像融合方法研究 总被引：6，自引：4，他引：2

刘卫光周利华《光子学报》2004,33(1):101-104

在研究了已有的图像融合方法后,提出基于小波变换和最大似然概率估计(MLE)相综合的融合方法,利用概率估计融合模型,首先对不同的传感器图像进行小波分解,然后对相应的子带求解仿射变换参数,根据Bayes规则进行最大后验概率似然估计,得到估计子带系数,最后通过小波反变换得到融合图像.在仿射变换的假设条件下定义融合规则,更适合传感器图像具有局部相反对比度的情况,采用此方法对航空可见光图像和红外图像进行融合实验,其结果与采用其它方法进行了对比,表明该方法的有效性. 相似文献

8.

采用归一化补偿变换的与文本无关的说话人识别 总被引：10，自引：0，他引：10

包永强赵力邹采荣《声学学报》2006,31(1):55-60

在噪声环境下,特别是当说话人识别最常用的模型——高斯混合模型(GMM)失配的情况下,需要对其输出帧似然概率的统计特性进行补偿。文章根据说话人识别的声学特性,提出了一种非线性变换方法——归一化补偿变换。理论分析和实验结果表明:与常用的最大似然(ML)变换相比,该变换能够提高系统识别率,最大可达3．7％,同时可降低误识率,最大可达45．1％。结果说明归一化补偿变换方法基本克服了在与文本无关说话人识别系统中,当说话人的个性特征不断变化、语音与噪声不能很好地分离或者降噪算法对语音有损伤、模型不能很好地匹配时,需要对模型输出的似然概率(得分)进行补偿的局限。这也说明对模型输出的似然概率进行处理是降低噪声和干扰的影响、提高说话人识别率的有效方法。相似文献

9.

低复杂度的光空时网格编码

《光学学报》2016,(8)

根据光通信的特点,提出一种基于脉冲位置调制(PPM)的低复杂度光空时网格码。该方案在发射端利用延迟分集思想,建立了信号在时间和空间上的关联性。在接收端采用反馈干扰抵消算法(FICA),并对消除干扰后的信号进行最大似然判决来完成译码。该方案以牺牲发射分集的性能来换取译码复杂度的降低,从而降低了对系统计算能力的要求。以天线数为2和3为例,分析了该算法与Viterbi译码算法的计算复杂度。仿真结果表明,当分集增益相同时,相对于采用Viterbi译码算法的系统,所提方案的译码复杂度分别降低了93.75%和95.84%,而其误码性能的恶化仅为3dB和4.77dB。相似文献

10.

采用非局部主成分分析的极大似然估计图像去噪

何建新吴锡周激流《光子学报》2011,(12):1827-1832

本文提出一种采用非局部主成分分析的极大似然估计去噪方法.首先采用非局部主成分分析算法来计算像素邻域间的灰度值和纹理结构相似性,然后通过极大似然估计方法估计最优复原图像.本方法使用非局部主成分分析克服现有局部性去噪方法模糊边界等缺陷,引入极大似然估计方法来改进现有非局部均值的简单加权均值去噪处理,从而提高对图像细节信息的... 相似文献

11.

一种改进的时变转移概率AIMM跟踪算法

叶瑾许枫杨娟钟一宸《应用声学》2020,39(2):253-258

针对矢量线阵跟踪目标低频线谱提取问题,提出了一种矢量线阵低频线谱提取方法,其中利用拉平后线谱的均方差乘一比例因子设为门限的方法,可以有效提取线谱成分;并且研究了利用互谱中高信噪比线谱测向剔除干扰线谱方法,准确提取出目标特征线谱,可较有效解决矢量线阵左右舷目标低频线谱特征相互干扰问题。上述矢量线阵低频线谱提取方法,得到了海试数据的初步验证。相似文献

12.

一种快速稀疏贝叶斯学习的水声目标方位估计方法研究

王彪朱志慧戴跃伟《声学学报》2016,41(1):81-86

针对以具有时序结构的稀疏贝叶斯学习(Temporally multiple sparse Bayesian learning,TMSBL)为重构算法的水声目标DOA (Direction-of-arrival)估计方法存在运算速度慢的问题,结合块稀疏贝叶斯学习(Block-spare Bayesian learning,BSBL)理论框架下DOA估计模型与特点,采用MacKay提出的定点方法(Fixed-point method)对TMSBL算法中的核心超参量进行求解,提出一种快速的水声目标方位估计稀疏贝叶斯学习的方法,该方法具有运算速度快,重构概率高的特点,并通过实验仿真从运算时间、失败率和均方根误差等方面与TMSBL算法进行比较,验证了该方法的可行性与有效性。相似文献

13.

Integrating induced probability into decoding for large vocabulary continuous speech recognition

《声学学报：英文版》2012,(3):338-352

This paper integrates location information of frames into conventional acoustic model(AM)and language model(LM)likelihoods,in order to distinguish potential path candidates more precisely at decoding stage.This paper proposes an induced probability,which represents location information of frames within the whole acoustic space.By integrating the induced probability,the decoder is directed to search within the most promising regions of acoustic space.Promising paths are enhanced and unlikely paths are weakened.Experiments conducted on Chinese Putonghua show that the character error rate is reduced by 10.95%relatively without increasing decoding complexity significantly.Finally,pruning analysis shows that integrating location information of frames into traditional decoding framework is helpful for improving system performance. 相似文献

14.

融合引导概率的语音识别解码算法研究

下载免费PDF全文

杨占磊刘文举晁浩《声学学报》2012,37(2):209-217

语音帧在声学特征空间中的位置信息可以辅助解码器对潜在路径进行筛选。传统的语音识别系统缺乏利用这种位置信息。针对这种不足,本文提出一种引导概率模型,用于描述语音帧属于声学特征空间不同局部的概率,并将其用于识别。使用引导概率后,解码器更强调对声学特征空间中最有希望的局部进行搜索,保留并扩展通过此局部空间的路径,同时弱化不经过此局部空间的路径。实验结果显示,融合引导概率的解码算法在不显著增加解码复杂度的情形下,使汉字相对错误率下降10.95%。结果分析表明,融合了语音帧声学位置信息的解码方法能够更有效地鉴别潜在路径,从而降低误识率。相似文献

15.

一种基于支持向量机的海底声学参数快速统计反演方法 总被引：1，自引：0，他引：1

高伟王宁《声学学报》2010,35(3):343-352

匹配场统计反演海底声参数的根本目的是求解未知参数的后验概率分布(PPD)。针对现有各种求解参数PPD的数值方法如穷举搜索、Markov Chain Monte Carlo采样、最近邻域插值近似算法普遍存在计算速度慢、时间长、难以满足实际应用的问题,本文提出了一种基于支持向量机的快速求解参数PPD的新算法。该算法利用了支持向量机强大的小样本学习能力,通过训练学习拟合未知海底声参数和后验概率之间存在的函数关系,从而在求解参数PPD时简化了利用声场传播模型计算后验概率的复杂过程,减少了计算时间。数值仿真算例和海上实验数据的处理结果验证了该算法在低维匹配场统计反演海底声参数问题中的有效性。相似文献

16.

Acceleration target detection based on LFM radar 总被引：1，自引：0，他引：1

Cun Suo Pang Hui Ling Hou Yan Han 《Optik》2014

In radar systems, the echo signal caused by an accelerated target can be similarly considered as linear frequency modulation (LFM) signal. In high signal-to-noise ratio (SNR), discrete polynomial-phase transform (DPT) algorithm can be used to detect the echo signal, as it has low computation complexity and high real-time performance. However, in low SNR, the DPT algorithm has a large mean square error of the rate of frequency modulation and a low detection probability. In order to detect LFM signal in low SNR, this paper proposes a detection method, segment discrete polynomial-phase transform (SDPT), which means, at first, dividing the whole echo pulses into several segments with same duration in time domain, and then, using coherent accumulation method of DFT to segments, at last, processing this signal with DPT in intra-segment. In the case of a large number of segments, the SDPT can improve the output SNR. In addition, in a certain SNR, to the target signal with big sampling interval, large acceleration and less segments, this paper proposes an algorithm to detect the LFM signal generated from the combination of an improved DPT (IDPT) and fractional Fourier transform (FRFT). The output SNR of this algorithm is connected with the length of time delay. In the simulation, when the length of the time delay is 0.2 N, the output SNR is 2.5 dB more than that which results from directly using DPT. Finally, the detection performance and algorithm complexity of the proposed algorithm were analyzed, and the simulated and measured data verify the effectiveness of the algorithm. 相似文献

17.

基于油液光谱分析和粒子滤波的发动机剩余寿命预测研究 总被引：1，自引：0，他引：1

孙磊贾云献蔡丽影林国语赵劲松《光谱学与光谱分析》2013,33(9):2478-2482

油液光谱分析是机械磨损状态监测、故障诊断与故障预测的重要技术,基于光谱数据的机械状态剩余寿命预测有利于实现机械系统的最优维修决策。由于机械设备越来越复杂,其健康状态的退化过程很难用线性模型来表示,而粒子滤波(particle filter, PF)对非线性非高斯系统的处理能力,与经典Kalman滤波相比具有明显的优势,文章将PF预测方法运用于光谱分析,提出了基于PF和油液光谱分析技术的设备剩余寿命预测方法。在预测模型中实现了根据设备后验分布的估计值预测其先验分布概率,建立了基于PF的多步向前长期预测模型。最后,对某发动机实际的光谱分析数据进行了预测和分析,并与传统Kalman滤波方法的预测结果进行了比较,结果充分表明了本方法的有效性和优越性。相似文献

18.

基于Polar码的水声通信信源信道联合译码方法

下载免费PDF全文

胡承昊台玉朋汪俊胡治国王海斌《应用声学》2022,41(1):60-69

水声信道时延扩展较长,频域选择性衰落严重,导致水声通信提升可靠性困难.同时,水声通信实际发送的信源中通常存在残留冗余,传统方法难以利用这部分冗余,从而导致一定的带宽浪费.针对该问题,提出了一种基于Polar码的水声通信信源信道联合译码方法.该方法根据Polar码的译码结构,以信源状态转移关系为基础构建信源信道联合译码网... 相似文献

19.

一种基于后验概率差值的拒识算法

下载免费PDF全文

李莹莹王成友蔡宣平《应用声学》2004,23(5):32-35

本文提出了一种孤立词语音识别系统中基于后验概率差值的拒识算法。研究了作为拒识特征时，输入词的后验概率和后验概率差值之间的区别，并将多层感知人工神经网络用于拒识特征的学习。相比现存的几种拒识算法，本算法几乎不需要额外的计算和存储量。当识别率为98．2％时，拒识率达到了95．4％。相似文献

20.

时间反转滤波器组多载波水声通信方法 总被引：5，自引：0，他引：5

下载免费PDF全文

王彪方涛戴跃伟《声学学报》2020,45(1):38-44

针对水声滤波器组多载波(Filter Bank MultiCarrier,FBMC)传统均衡方法效率低、复杂度高等问题,提出了单阵元无源时间反转镜(Passive Time Reversal Mirror,PTRM)和虚拟时间反转镜(Virtual Time Reversal Mirror,VTRM)的均衡算法,该算法利用时间聚焦原理可以降低水声信道带来的符号间干扰(Inter Symbol Interference,ISI),并且不需要在FBMC符号中插入导频,进一步提高了通信速率.通过仿真和外场实验验证了水声FBMC系统采用单阵元PTRM和VTRM的有效性,结果表明,这两种均衡方法能够有效减少ISI,提高系统可靠性能。相似文献