期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

阴法明赵焱赵力《应用声学》2019,38(1):39-44

为提高连续语音识别中的音素识别率,提出一种基于改进并行回火训练的受限波尔兹曼机的音素识别算法。首先,利用经过等能量划分后的改进并行回火算法来训练受限玻尔兹曼机,接着将受限玻尔兹曼机堆叠组成一个深信度网络,从而作为深度神经网络预训练的基础模型,然后通过softmax层输出,得到用于音素状态后验概率检测的深度神经网络。接着,利用少量的标签数据,根据反向传播算法对网络权重进行微调。最后,将所得后验概率作为隐马尔科夫的发射概率,然后利用Viterbi解码器实现音素识别。在TIMIT语料库上的实验表明,识别率相比于传统的对比散度类算法提高了约4.5%,在不增加计算量的情况下比原始并行回火算法提高约1%。相似文献

2.

声学发音模型辅助建模的发音错误检测与诊断

下载免费PDF全文

柳宗铭王丽李军锋张鹏远《声学学报》2023,48(1):264-273

发音错误检测与诊断(MDD)任务的专家标注数据稀缺。从添加发音模型更高效地利用有限数据建模发音规律,辅助基于音素识别的MDD的思路出发,提出一种同时融合声学和文本信息,在理论上更完备地建模发音错误产生过程的声学发音模型。基于发音错误产生过程不同部分的声学关联性,该模型通过与音素识别模型共享声学编码器网络参数,以多任务学习方式联合优化,实现辅助建模。并且,提出声学置信度掩蔽-预测训练方式进一步强化两个任务的联系,提高辅助建模效率。实验表明,声学发音模型能够有效建模发音错误规律;利用其辅助音素识别模型建模后,MDD系统在发音错误检测、诊断和音素识别上分别有4.9%,9.5%和14.0%的提升;声学置信度掩蔽-预测训练方法提高了辅助建模效率,掩蔽参数或联合优化参数选择也会影响辅助建模效果。相似文献

3.

基于紫外‐可见透射光谱技术和极限学习机的早期鸡胚雌雄识别 总被引：1，自引：0，他引：1

祝志慧洪琪吴林峰王巧华马美湖《光谱学与光谱分析》2019,39(9):2780-2787

为了对鸡种蛋胚胎进行雌雄识别,探究利用紫外-可见-近红外透射光谱进行鸡胚雌雄识别的可行性,搭建了鸡种蛋透射光谱检测系统,采用横向和竖向大头朝上2种放置方式获取210枚鸡种蛋孵化0~15 d的光谱,光谱范围为360~1 000 nm。构建极限学习机（ELM）鸡胚雌雄识别模型,通过比较不同放置方式和孵化天数下模型的识别准确率,发现竖向放置且孵化第7 d的识别效果最好;将竖向放置孵化第7 d的光谱初步分为紫外（360~380 nm）、可见光（380~780 nm）、近红外（780~1 000 nm）、紫外-可见光（360~780 nm）和全波段（360~1 000 nm）5个不同的波段范围来分析,预测集准确率分别为82.86%,77.14%,75.71%,84.29%和81.43%,筛选出360~780 nm的紫外-可见光波段为有效波段;在紫外-可见光（360~780 nm）波段,采用多元散射校正（MSC）去噪,并用竞争性自适应重加权采样算法（CARS）和连续投影算法（SPA）筛选特征波长降维,建立不经筛选特征波长、CARS筛选特征波长和SPA筛选特征波长的3种ELM模型。其中不经筛选特征波长的ELM模型识别效果最好,但输入变量最多,隐含层神经元为680且激活函数为sig时,预测集准确率为84.29%。SPA筛选特征波长的ELM模型识别效果次之,输入变量有9个,隐含层神经元为840且激活函数为hardlim时,预测集准确率为81.43%。CARS筛选特征波长的ELM模型识别效果最差,输入变量有27个,隐含层神经元为100且激活函数为sig时,预测集准确率为78.57%;用遗传算法（GA）优化ELM模型的权值变量和隐含层阈值,不经筛选特征波长建立的GA-ELM模型,预测集准确率为87.14%,SPA筛选特征波长建立的GA-ELM模型,预测集准确率为87.14%,CARS筛选特征波长建立的GA-ELM模型,预测集准确率为81.43%。紫外-可见光波段不经筛选特征波长的GA-ELM模型识别效果和经SPA筛选特征波长的GA-ELM模型相同,表明SPA筛选的特征波长变量能够有效反映360~780 nm波段的信息,SPA使用的变量数仅占紫外-可见光波段的2.14%,因此,雌雄识别最佳模型为紫外-可见光波段经SPA筛选特征波长的GA-ELM模型,预测集准确率为87.14%,其中,雌性识别率为88.57%,雄性识别率为85.71%,单个样本平均判别时间0.080 ms。结果表明紫外-可见透射光谱技术和ELM模型为孵化早期鸡胚蛋雌雄识别提供了一种可行方法。相似文献

4.

电子器件散热风扇气动噪声管道声学模态截止控制技术

下载免费PDF全文

孙宗翰田杰张效溥欧阳华《应用声学》2020,39(2):199-206

深度学习输入特征的选择直接影响其分类性能,为了进一步提高基于深度学习的鸟类物种识别模型的分类性能,该文提出一种多特征融合识别方法。该方法首先通过短时傅里叶变换、梅尔倒谱变换和线性调频小波变换分别计算得到鸣声信号的3种语图样本集,然后分别利用3种语图样本集训练3个基于VGG16迁移的单一特征模型,将3个模型的输出进行自适应加权求和实现融合,并修正了加权交叉熵函数以克服样本不平衡的问题,最后对语图进行分类实现鸟类物种的识别。以ICML4B鸣声库的35种鸟类为研究对象,对比了4种模型的平均识别准确率(MAP),结果表明特征融合模型较单一特征模型的MAP最大提高了0.307;选择输入语图的持续时间分别为100 ms、300 ms以及500 ms,对比不同持续时间下4种模型的测试MAP值,结果表明持续时间为300 ms时4种模型的MAP值均为最高;对比了不同信噪比下4种模型的识别效果,多特征融合模型的识别准确率随着信噪比的下降降低最少。说明在选择合适的语图持续时间后,该文提出的特征融合模型能得到更高的识别准确率,具有一定的抗噪能力,且训练参数少,更适合于少样本鸟类的识别。相似文献

5.

利用语音学知识和神经网络识别非特定人的复合元音

下载免费PDF全文

蔡德和《应用声学》1996,15(1):39-45

本文主要研究：以音素为识别基元，运用语音学知识，对非特定人的普通话复合元音进行识别。其特点是音素识别由神经网络（ＮＮ）完成，为了便于利用语音知识ＮＮ输入层的刺激采用语音的功率谱，用单元音训练的ＮＮ识另非特定人的普通话复合元音，识别率是５４％。而运用语音学知识后，其识别率提高到９０％。相似文献

6.

基于THz光谱和多信息融合的小麦品质无损检测研究 总被引：1，自引：0，他引：1

葛宏义蒋玉英张元廉飞宇《光谱学与光谱分析》2017,37(11):3338-3342

为进一步提高不同品质小麦分类模型的检测精度,提出采用太赫兹时域光谱技术(THz-TDS),融合小麦样品的吸收光谱和折射率光谱信息,对其品质进行检测识别。以正常小麦、发芽小麦、霉变小麦和虫蚀小麦样品为研究对象,获取样品THz波段光学参数,在特征层选用AdaBoost(AdaBoost)分类器和支持向量机(SVM)方法,建立了小麦品质多项光学指标的分类融合模型。并将融合模型的识别结果进行比较,结果表明融合模型对小麦样品的识别率达到95%。最后,为了验证融合模型的有效性,将其与单光谱分析回归模型进行了对比,表明融合模型比单光谱模型在小麦样品的识别率上有了较大的提高,且SVM融合模型的识别率最高,是一种最优的多源信息融合方法。相似文献

7.

高光谱技术融合图像信息的牛肉品种识别方法研究

王彩霞王松磊贺晓光董欢《光谱学与光谱分析》2020,(3):911-916

高光谱图像包含了大量的光谱信息和图像信息,采用高光谱成像技术对牛肉品种进行识别。获取可见-近红外(400~1000 nm)光谱范围内的安格斯牛、利木赞牛、秦川牛、西门塔尔牛、荷斯坦奶牛五个品种共252个牛肉样本的高光谱图像。在ENVI软件中对高光谱图像进行阈值分割并构建掩膜图像,获取样本的感兴趣区域(ROI),并结合伪彩色图对牛肉样本的反射率指数进行可视化表达;采用Kennard-Stone(KS)法对样本集进行划分以提高模型的预测性能;对原始光谱采用卷积平滑(SG)、区域归一化(Area normalize)、基线校正(Baseline)、一阶导数(FD)、标准正态变量变换(SNV)及多元散射校正(MSC)等6种方法进行预处理;采用竞争性自适应重加权算法(CARS)提取特征波长。然后利用颜色矩对不同牛肉样本的颜色特征进行提取;对原始光谱图像进行主成分分析,结合灰度共生矩阵(GLCM)算法,提取主要纹理特征。最后结合偏最小二乘判别(PLS-DA)算法建立牛肉样本基于特征波长、颜色特征以及纹理特征的识别模型。KS法将牛肉样本划分为校正集190个,预测集62个;将未经预处理的光谱数据与经过6种不用预处理的光谱数据进行建模分析,结果发现经FD法处理后的光谱数据所建模型的识别率最高;结合CARS法对经FD法预处理后的光谱数据进行特征波长提取,共提取出22个波长;利用颜色矩和GLCM算法分别提取出每个牛肉样本的9个颜色特征、48个纹理特征。将特征波长数据与颜色、纹理特征信息进行融合建模,结果表明,基于特征光谱+纹理特征的模型识别效果最佳,其校正集与预测集识别率分别为98.42%和93.55%,均高于特征光谱数据模型识别率,说明融合纹理特征后使样本分类信息的表达更加全面;融合颜色特征后模型的校正集识别率均有所增加,但预测集识别率稍逊,颜色特征虽携带了部分有效信息,但这些信息与牛肉样本的相关性不大。因此,寻找与牛肉样本相关性更大的颜色特征是提高模型识别率的重要途径之一。该研究结果为牛肉品种的快速无损识别提供了一定的参考。相似文献

8.

深浅层特征及模型融合的说话人识别 总被引：4，自引：0，他引：4

下载免费PDF全文

仲伟峰方祥范存航温正棋陶建华《声学学报》2018,43(2):263-272

为了进一步提高说话人识别系统的性能,提出基于深、浅层特征融合及基于I-Vector的模型融合的说话人识别。基于深、浅层特征融合的方法充分考虑不同层级特征之间的互补性,通过深、浅层特征的融合,更加全面地描述说话人信息;基于I-Vector模型融合的方法融合不同说话人识别系统提取的I-Vector特征后进行距离计算,在系统的整体结构上综合了不同说话人识别系统的优势。通过利用CASIA南北方言语料库进行测试,以等错误率为衡量指标,相比基线系统,基于深、浅层特征融合的说话人识别其等错误率相对下降了54.8%,基于I-Vector的模型融合的方法其等错误率相对下降了69.5%。实验结果表明,深、浅层特征及模型融合的方法是有效的。相似文献

9.

利用近红外及中红外融合技术对小麦产地和烘干程度的同时鉴别 总被引：1，自引：0，他引：1

邹小波封韬郑开逸石吉勇黄晓玮孙悦《光谱学与光谱分析》2019,39(5):1445-1450

小麦是制作馒头的主要原料之一,小麦中水、蛋白质、淀粉会因产地以及烘干程度的差异而不同,进而影响到加工成馒头的品质。所以实现对小麦产地和烘干程度的快速鉴别就显得尤为重要。感官评定是鉴别小麦产地和烘干程度常用的方法,对比感官评定,光谱分析可以识别样品中的分子结构等信息。基于此,尝试利用近红外和中红外光谱融合技术实现对不同产地和不同烘干程度的小麦同时鉴别。首先选取了两个不同产地的小麦,再利用微波干燥法对两个不同产地的小麦做烘干预处理,使烘干的小麦水含量为12%±0.5%,原麦水含量为18%±0.5%。分别标记为原麦A,烘干A,原麦B,烘干B,再将小麦研磨成粉末,过100目筛网筛选后,置于自封袋中备用。随后分别采集四种小麦样品的近红外和中红外光谱信息,在Matlab 7.10的环境下使用标准正态变量变换(standard normal variable transformation, SNVT)对采集到的原始光谱数据进行预处理,利用主成分分析对预处理后的数据进行降维处理,再结合线性判别分析（linear discriminant analysis,LDA）和支持向量机（support vector machine, SVM）分别建立小麦近红外、中红外光谱数据识别模型。另外利用联合区间偏最小二乘法（synergy interval partial least square, SiPLS）筛选出利用标准正态变量变换(SNVT)预处理后的小麦近红外和中红外光谱数据特征光谱区间,将筛选出的近红外和中红外光谱数据特征光谱区间融合后再结合线性判别分析（LDA）和支持向量机（SVM）建立小麦融合光谱信息的识别模型。然后比较同种光谱数据下利用线性判别分析（LDA）和支持向量机（SVM）建立的小麦识别模型识别率、比较同种建模方法下近红外和中红外光谱数据建立小麦识别模型识别率、比较同种建模方法下光谱数据融合和单一光谱数据建立小麦识别模型识别率。结果表明,同种光谱分析方法,利用SVM建立的四种小麦识别模型识别率高于利用LDA建立的小麦识别模型识别率。同种建模方法,近红外光谱数据建立的小麦识别模型识别率优于中红外光谱数据建立的小麦识别模型识别率。而在同种建模方法下,利用SiPLS筛选出近红外和中红外光谱数据的特征光谱区间数据融合后建立小麦识别模型识别率最高,光谱数据融合后结合LDA建立的小麦识别模型校正集识别率为98.75%,预测集识别率为97.50%;而将此选择的变量结合SVM建立的小麦识别模型的校正集和预测集识别率都达到100.0%。对比利用单一光谱数据建立的小麦识别模型识别率,光谱数据融合之后建立的小麦识别模型识别率得到显著提高,该研究从纵向和横向上全面地比较了光谱数据建立的小麦模型识别率,结果可为更准确地运用光谱融合技术建立小麦产地以及烘干程度识别模型提供参考。相似文献

10.

基于多视角融合的夜间无人车三维目标检测

下载免费PDF全文

王宇岚孙韶媛刘致驿卜德飞《应用光学》2020,41(2):296-301

为了提高无人车在夜间情况下对周围环境的物体识别能力,提出一种基于多视角通道融合网络的无人车夜间三维目标检测方法。引入多传感器融合的思想,在红外图像的基础上加入激光雷达点云进行目标检测。通过对激光雷达点云进行编码变换成鸟瞰图形式和前视图形式,与红外图像组成多视角通道,各通道信息之间融合互补,从而提高夜间无人车对周围物体的识别能力。该网络将红外图像与激光雷达点云作为网络的输入,网络通过特征提取层、候选区域层和通道融合层准确地回归检测出目标的位置以及所属的类别。实验结果表明,该方法能够提高无人车在夜间的物体识别能力,在实验室的测试数据中准确率达到90%,速度0.43 s/帧,达到了实际应用要求。相似文献

11.

使用深度学习的多通道水下目标识别

下载免费PDF全文

李琛黄兆琼徐及郭新毅宫在晓颜永红《声学学报》2020,45(4):506-514

为解决低信噪比条件下水下目标识别率低的问题,提出一种适用于多通道水听器阵列的深度学习水下目标识别方法。首先是采用子通道特征级联的方法利用多通道信息;在特征提取方面,采用对信号的不同频率区间进行加权的特征提取器,并对提取的特征进行正则规整;最后采用深度神经网络(Deep Neural Network,DNN)实现目标识别。实验首先在仿真条件下对所提出方法的有效性进行验证,结果表明在-15 dB信噪比条件下的五目标识别任务中,使用多通道级联特征的深度神经网络的识别正确率达到96.7%,显著高于基于支持向量机(Support Vector Machine,SVM)的方法。在后续的湖上试验中,深度神经网络的平均正确率达到96.0%,进一步验证了所提出方法的有效性。相似文献

12.

基于子带信号瞬时频率的特征提取及其在车型分类中的应用*

下载免费PDF全文

陈建新尹雪飞陈克安《应用声学》2020,39(1):97-103

车型识别是智能交通系统的关键技术之一,具有重要应用价值。针对车辆噪声信号的复杂性,提出了一种基于相位信息和能量信息融合的车型分类方法。通过耳蜗滤波器组将车辆噪声信号分解成窄带信号,为了避免相位卷绕问题,利用傅里叶变换性质结合相位一阶导数估计窄带信号的瞬时频率并提取瞬时频率特征。该特征能够有效地完成车型分类,通过将瞬时频率特征和对数能量联合,进一步提高了分类准确率。相似文献

13.

基于颜色模型和稀疏表示的图像型火焰探测

马宗方程咏梅潘泉王慧琴《光子学报》2014,40(8):1220-1224

常用的图像型火焰探测算法是提取火焰在图像上表现出的单个特征信息或其有效组合作为识别的依据,需要大量的训练样本进行学习与参量优化,且识别率对特征选择的要求也很高.本文从火焰的整体特征考虑,提出了基于颜色模型和稀疏表示模型相结合的图像型火灾探测方法.首先在HIS空间建立颜色模型对火灾图像进行预处理提取出疑似区域,建立稀疏表示模型,并利用主成分分析方法构造火焰和疑似火焰物体的特征字典,最后利用l1-minimization计算测试样本与训练样本的最小逼近残差实现火焰和干扰物体的分类识别.实验结果表明,该方法提高了火灾图像的分类准确度和识别速度,同时具有较高的准确率. 相似文献

14.

基于聚类技术的三维舰船模型特征库研究

下载免费PDF全文

于吉红白晓明郭宁《应用光学》2012,33(2):260-264

存贮目标所有的视点图像,建立完备的特征库,或者提取能够抵抗视点变化的不变特征,是三维目标识别的常用方法。这两种方案都存在不足:要么特征库规模庞大,识别过程计算量大,识别效率低;要么难以找到鲁棒的识别特征。结合两种方案研究了基于聚类技术建立三维舰船模型特征库的方法。利用仿射传播聚类方法无需事先指定聚类中心的优点,将其应用于两型舰船模型的视点空间聚类。通过提取视点图像的Hu矩特征,进行了仿真实验,给出了聚类结果的有效性分析。相似文献

15.

一种光谱识别的新方法

郭平覃冬梅胡占义杜为民《光谱学与光谱分析》2003,23(4):811-815

提出了一种对光谱信号识别的新方法。针对光谱信号的特征 ,我们设计了基于径向基函数神经网络组成的统计混合模型 ,并构造了识别系统的代价函数。通过优化系统的代价函数 ,导出了类EM算法去估计混合模型的参数 ,从而构建对光谱特征识别的识别器。利用实际的拉曼光谱 ,对本文所提出的估计模型参数的算法与建立的光谱识别器进行了检验。我们还讨论了利用特征波长与相应的光谱强度 ,以及利用主分量分析组成输入特征矢量 ,及其这些输入特征矢量对光谱识别器应用的效果。实验结果表明 ,所提出的算法可以有效地估计模型参数 ,其建立的光谱识别模型具有较高的识别准确率。所提出的对光谱信号识别的方法通用性强 ,因此具有较为广阔的应用前景。相似文献

16.

模型与特征混合补偿法及其在耳语说话人识别中的应用

下载免费PDF全文

顾晓江赵鹤鸣吕岗《声学学报》2012,37(2):198-203

为了提高信道差异下短时耳语说话人的识别率,提出了一种在模型域和特征域进行混合补偿的方法。该方法首先在模型训练阶段以联合因子分析法为基础,通过估计训练语音的说话人空间和信道空间,提取出说话人因子,消除信道因子,其次在测试阶段,将测试语音的信道因子映射到特征空间,实施特征补偿,从而在模型和特征两方面去除信道信息,提高识别率。实验结果显示,在三种不同的信道训练环境下,混合补偿法都取得了相似的识别率,且新方法对短时耳语音的测试效果要优于联合因子分析法。相似文献

17.

Whispered speaker identification based on feature and model hybrid compensation

GU Xiaojiang ZHAO Heming LU|¨ Gang 《声学学报：英文版》2012,(4):499-508

In order to increase short time whispered speaker recognition rate in variable channel conditions,the hybrid compensation in model and feature domains was proposed.This method is based on joint factor analysis in training model stage.It extracts speaker factor and eliminates channel factor by estimating training speech speaker and channel spaces.Then in the test stage,the test speech channel factor is projected into feature space to engage in feature compensation,so it can remove channel information both in model and feature domains in order to improve recognition rate.The experiment result shows that the hybrid compensation can obtain the similar recognition rate in the three different training channel conditions and this method is more effective than joint factor analysis in the test of short whispered speech. 相似文献

18.

基于小波核偏最小二乘回归方法的混沌系统建模研究 总被引：1，自引：0，他引：1

下载免费PDF全文

Li Jun 董海鹰《物理学报》2008,57(8):4756-4765

基于核学习的强大非线性映射能力,结合用于回归建模的线性偏最小二乘(PLS)算法,提出一种小波核偏最小二乘(WKPLS)回归方法. 该方法基于支持向量机使用的经典核函数技巧,将输入映射到高维非线性的特征空间,在特征空间中,构造线性的PLS回归模型. PLS方法利用输入与输出变量之间的协方差信息提取潜在特征,而可允许的小波核函数具有近似正交以及适用于信号局部分析的特性. 因此,结合它们优点的WKPLS方法显示了更好的非线性建模性能. 将WKPLS方法应用在非线性混沌动力系统建模上,并与基于高斯核的核偏最小二乘 关键词：小波核偏最小二乘回归混沌系统建模相似文献

19.

一种光谱与纹理特征加权的高分辨率遥感纹理分割算法 总被引：1，自引：0，他引：1

王雷光刘国英梅天灿秦前清《光学学报》2009,29(11)

高分辨率遥感影像呈现极其丰富的光谱和结构信息,传统的基于光谱的遥感影像分割方法往往使得分割区域过于细碎且分割精度不高.尝试将纹理信息引入到特征空间以期解决该问题.本文算法中,特征空间由光谱和纹理两类构成,并采用加权最小距离分类器.光谱信息通过对原始影像的变带宽均值漂移滤波获得,纹理信息由对原始影像逐波段采用多尺度伽博(Gabor)滤波器组滤波获得;依据训练样区中各特征维的方差确定该地物类别分类时特征维的权重,并通过训练样区的特征加权平均获得各地物类别的聚类中心;最后,将像素点归为到加权聚类中心距离最小的类别.实验结果表明,提出的均值漂移带宽确定方法是有效的,加权融合算法较基于光谱的分割方法在分割精度上有一定程度的提高. 相似文献

20.

基于EMD-AWPP和HOSA-SVM算法的分布式光纤振动入侵信号的特征提取与识别

张燕君刘文哲付兴虎毕卫红《光谱学与光谱分析》2016,36(2):577-582

针对传统的信号处理方法无法有效区分不同振动入侵信号,提出一种基于EMD-AWPP和HOSA-SVM算法的振动信息特征提取与识别方法,用于解决分布式光纤振动入侵检测系统的高精度信号识别问题。处理不同振动类型时,该方法首先利用基于经验模态分解的自适应小波包处理算法,不仅对信号的低频部分进行了分解,而且对高频部分即信号的细节部分也进行了更好的时频局部化处理,改善了信号特征提取精度,减少传感信号异常值的影响; 其次采用高阶谱分析中的双谱和双相干谱,精确提取包含不同振动入侵信号类型的特征矢量; 最后在BPNN参比模型的基础上,用粒子群算法优化SVM的识别参数,使识别模型具有更强的自适应和自学习能力,克服了神经网络易陷入局部最优的不足之处,实现不同振动入侵信号的特征矢量识别。分析结果表明,针对不同类型的入侵源识别,该方法可以有效剔除随机噪声的影响,提取传感信息的特征矢量,降低异常值的影响,算法的预测类别与输出类别几乎一致,振动识别的精确率达到95%以上,识别效果明显强于BPNN网络的检测算法,提高了信息分析的准确性。相似文献