首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
非特定人四声识别   总被引:5,自引:0,他引:5  
关存太  陈永彬 《声学学报》1993,18(5):379-385
本文提出一个性能可靠的非特定人汉语普通话四声识别方法.该方法采用中心削波的无偏自相关法作基音周期检测,通过对基音周期进行数据选取、误差修正、平滑、拟合等处理过程,获取两维的判决矢量供四声判决.普通话单音节发音的四声识别率达98%以上。  相似文献   

2.
提出在参数的提取过程中用不同的感知规整因子对不同人的参数归一化,从而实现在非特定人语音识别中对不同人的归一化处理。感知规整因子是基于声门上和声门下之间耦合作用产生声门下共鸣频率来估算的,与采用声道第三共振峰作为基准频率的方法比较,它能较多的滤除语义信息的影响,更好地体现说话人的个性特征。本文提取抗噪性能优于Mel倒谱参数的感知最小方差无失真参数作为识别特征,语音模型用经典的隐马尔可夫模型(HMM)。实验证明,本文方法与传统的语音识别参数和用声道第三共振峰进行谱规整的方法相比,在干净语音中单词错误识别率分别下降了4%和3%,在噪声环境下分别下降了9%和5%,有效地改善了非特定人语音识别系统的性能。  相似文献   

3.
杜兴氏肌营养不良(DMD)是一种严重的儿童腿部神经肌肉罕见病。传统的诊断和检测方案一般为有创手段,会带给患儿极大的痛苦。基于受试者的磁共振图像(MRI),采用计算机辅助检测手段探索了有效的无创检测方法。实验分别选用sym4和db4两种小波基函数,对患儿组和健康对照组的MRI进行三种尺度的小波分解,从所得的分解图像中提取12个纹理特征参数,并利用人工神经网络(ANN)算法对图像参数进行分类识别。结果显示:在受试者的两类MRI加权图像(T1和T2)中,T1图像能更好地区分患儿与健康儿童;利用db4函数对图像进行小波分解,其效果略优于sym4函数,且在三种小波分解尺度中,以二层分解最优;利用ANN算法对图像进行分类识别,其灵敏度、特异度和准确率分别高达98.5%、97.3%和97.9%。该处理方法有望为临床提供客观有效的辅助诊断手段,可作为DMD疾病无创检测的尝试探索。  相似文献   

4.
搭建实验平台,把26个字母的图像传入光纤,并在输出端采集散斑图.把散斑图展开到HSV色彩空间中,单使用V分量进行分类能达到不错的分类准确率,且能缩减训练时长.在预处理后,分别使用具有不同层数卷积结构的神经网络、卷积神经网络和支持向量机(CNN+SVM)算法、SVM算法对散斑图进行分类.测试结果发现,使用4420张散斑图...  相似文献   

5.
针对传统子空间方法对分布式源定位依赖模型假设以及子空间有效维度难以选择的问题, 提出了一种利用卷积神经网络的非相干分布式源定位方法。该方法把卷积神经网络作为一个强鲁棒性空间功率密度分布特征提取器, 实现从协方差矩阵到方向角功率密度分布的映射。根据得到的空间谱分布, 可进一步实现分布式源的参数估计。此外, 文中结合迁移学习技术解决实际信号源分布与训练模型不匹配的问题, 提升了模型的泛化性能。仿真实验表明该方法对不同信号分布模型具有稳健性, 参数估计性能优于传统子空间方法。传声器阵列实测数据表明该方法的中心角和角度扩展的估计误差在1°以内。  相似文献   

6.
采用一种全新的高精度时频分析方法:Hilbert-Huang变换,分别对正常嗓音和病态嗓音信号进行时频分析。实验结果表明,当嗓音发生病变时,其Hilbert谱和边际谱将有明显改变。在此结果的指导下,本文提出一种适合识别病态嗓音的特征参数:EMD-MFCC参数,并使用径向基神经网络对正常嗓音和病态嗓音信号进行识别。实验结果初步表明:由HHT方法和神经网络结合可以有效区分出病态嗓音。  相似文献   

7.
为快速高效地进行云检测和云相态识别,提出了基于BP神经网络的云检测和云相态识别方法,并针对中分辨率成像光谱仪(MODIS)的相关数据建立了BP神经网络。利用该算法对MODIS图像进行了云检测和云相态识别,并把识别结果与MOD06数据进行了对比,对比结果表明,该算法对冰云、水云以及混合云的识别准确率分别达到了100%、100%以及99.94%。该算法快速、准确,消除了未确定态,具有很强的自主学习能力。  相似文献   

8.
基于分维特征和反向传播神经网络的自然纹理识别   总被引:4,自引:0,他引:4  
刘泓  莫玉龙 《光学学报》1999,19(10):406-1410
提出一种利用分维特征, 即自然纹理的自相似性进行纹理识别的研究。利用原始图像、高灰度图像、低灰度图像、四个方向(0°, 45°, 90°, 135°)的梯度图像及二阶多分维共八个分维数作为特征值; 分维的计算采用改进的盒子计数法(MBCM); 最后利用反向传播(BP)神经网络进行纹理的分类识别。实验结果与其它技术进行了比较, 并提出利用维纳滤波进一步改进分类性能。  相似文献   

9.
《光学技术》2015,(2):138-143
为了实现机器人自动焊接过程中快速、精确地提取焊缝特征信息,提出了一种基于小波变换和概率神经网络的焊接接头类型识别方法。先采用小波变换对由激光视觉传感器采集的焊接接头图像进行降噪和增强,对重构后的图像进行二值化,然后提取图像的特征信息,组成图像特征向量,最后构建概率神经网络分类器并进行测试。结合视觉传感器中激光器与摄像机的位置关系,最终识别出4种焊接接头。实验结果表明,所提出的方法特征提取简单,识别率高,并具有较好的实时性。  相似文献   

10.
陈立伟  张晔 《应用声学》2006,25(2):90-95
研究了一种非齐次隐马尔可夫模型(Inhomogeneous Hidden Markov Model),然后将自组织特征映射神经网络与这种非齐次隐马尔可夫模型相结合,训练出抗噪声的HMM模型,并应用该混合模型进行语音识别。实验结果表明,该模型适合于对噪声背景下的语音进行识别。该模型具有更好的抗噪鲁棒性,在信噪比较低的情况下(5dB-10dB),识别率可以提高5%左右。  相似文献   

11.
通过对目标特征的分析比较,选取不变矩作为识别特征.为了达到很好的识别效果,对不变矩做了优化处理.采用LVQ神经网络技术建立了识别模型,提高了识别速度.运用有限的样本对目标识别技术进行了测试,结果表明采用此技术后的识别成功率较高,平均约为98%,识别速度快,每幅二值目标图像的识别时间约为16 ms.  相似文献   

12.
该文提出一种基于卷积神经网络直接对阵列超声检测原始信号进行缺陷类型识别的方法,该方法无需对超声回波原始信号进行特征提取.文章研究对比了不同卷积神经网络及其优化的识别性能.首先采用超声相控阵系统对不同试块上的平底孔、球底孔、通孔三种缺陷进行超声检测,然后利用LeNet5、VGG16和ResNet三种卷积神经网络对一维和二...  相似文献   

13.
基于神经网络的钞票真假识别研究   总被引:2,自引:1,他引:2  
利用神经网络与光电检测的技术研制了钞票真假识别系统.介绍了系统的结构组成、工作原理、软件系统、神经网络的优化设计、实验及测试结果.经实践验证,其识别结果稳定可靠,可应用于金融智能防伪点钞机与ATM机中.  相似文献   

14.
徐善明 《应用声学》1991,10(5):49-49
智能机器人必须具有一种能觉察外部世界的方法。近年来,人们已相继开发了一些诸如利用光波、X射线、电磁波来识别物体的方法,然而,迄今还未有明确地选择并找到一种十分完美的机器人观察装置。 本文提出一种机器人超声波眼睛新系统。利用超声波观察至少有如下三方面的优点:第一,在光波难以观察的场合,如烟雾、黑暗或水下等能见度差的情况下,超声波便可大显身手;第二,利用超声波可检出被测物的相位信息,藉此,就能直接计算出该物体的三维结构,从而为再现被测物体的超声全息图奠定了基础;第三,与采用其它方法的机器人眼睛系统相比,超声波系统最为廉价和简单。  相似文献   

15.
杨洋  汪毓铎 《应用声学》2018,37(6):940-946
为了解决传统卷积神经网络识别连续语音数据时识别性能较差的问题,提出一种改进的卷积神经网络算法。该方法引入Fisher准则以及L2正则化约束,在反向传播调整参数阶段,既保证参数误差的最小化,又确保分类以后的样本类间分布较分散,类内分布较集中,同时保证网络权值具有合适的数量级以有效缓解过拟合问题;采用一种更符合生物神经元激活特性的新型log激活函数进行卷积神经网络的优化,进一步提高语音识别的正确率。在语音识别库TIMIT以及THCHS30上的实验结果表明,相较于传统卷积神经网络算法,本文提出的改进算法能较好的提高语音识别率,且泛化能力更强。  相似文献   

16.
提出了一种渐进式训练方案来重新配置马赫-曾德尔干涉仪(MZI)前馈光学神经网络(ONN)的相移,从而对抗MZI的相位误差和分束器误差,提高识别准确率。为了验证所提方案,利用Neuroptica Python仿真平台搭建了3层MZI-ONN结构,并在考虑到MZI相位误差和分束器误差的情况下,利用Iris和MNIST数据集验证了所提方案的有效性。仿真结果表明:在Iris数据集下,对于3层4×4 MZI-ONN结构,所提方案的识别准确率能够提升64.15百分点;在MNIST数据集下,对于4×4、6×6、8×8和16×16规模的MZI-ONN,所提方案的识别准确率能够提升2.00~37.00百分点。所提方案极大地提高了MZI-ONN的抗误差性能,有助于未来大规模、高准确率MZI-ONN的实现。  相似文献   

17.
提出了一种基于机器视觉技术的血袋编号字符识别方法,建立了字符在线识别硬件与软件系统。运用经典标定算法确定摄像机内外参数。对扫描的原始图像进行了灰度化、增强、滤波、反相等预处理及字符的倾斜校正、图像行字切分、归一化操作。分析表明:行字切分大于临界阈值T时,确定是文字像素一部分。预测结果与实测数据对比表明采用神经网络对转印字符进行识别可有效提高检测一次性血袋出厂编号的效率。相关技术及研制系统已应用于长春市某医疗制品企业,取得较好识别效果及应用效果。  相似文献   

18.
李靖  孙昊 《物理学报》2021,(6):53-59
高能物理中喷注识别任务是从背景中识别出感兴趣的特定信号,这些信号对于在大型强子对撞机上发现新的粒子,或者新的过程都有着非常重要的意义.量能器中产生的能量沉积可以看做是对喷注的一种拍照,分析这样产生的数据在机器学习领域中属于一个典型的视觉识别任务.基于喷注图片,本文探索了利用卷积神经网络(convolutional neural networks,CNNs)识别量子色动力学背景下的Z玻色子喷注,并与传统的增强决策树(boosted decision trees,BDTs)方法进行了对比.在本文利用的输入前提下,三种相关的性能参数表明,CNN比BDT带来了约1.5倍的效果提升.除此之外,通过最优与最差的喷注图与混淆矩阵,说明了CNN通过训练学习到的内容与整体识别能力.  相似文献   

19.
矿井水害对煤矿安全生产存在巨大威胁,所以快速识别矿井突水水源,对煤矿水灾预警及灾后救援工作开展都有重大意义。激光诱导荧光(LIF)技术具有快速、高效、灵敏度高等特点,克服了传统水化学方法识别时间长的缺点。循环神经网络(RNN)在解决长序列训练过程中产生的梯度消失、梯度爆炸等问题上存在明显不足,而特殊变体RNN即长短期记忆(LSTM)神经网络很好地弥补了RNN的短板及缺陷。提出了将LIF技术与LSTM算法相结合,应用在矿井突水水源快速识别中。实验样本采自淮南矿区,以砂岩水和老空水为原始样本,并将砂岩水和老空水按照不同比例混合配置成5种混合水样,共7种待测水样进行实验。首先采用最大最小值归一化(MinMaxScaler)、平滑滤波(SG)以及标准正态变量变换(SNV)三种预处理方法对原始光谱数据进行预处理,减少原始光谱数据存在的噪声和干扰信息。之后为防止数据量过大,维度过高,将包括原始光谱数据在内的四组数据再进行LDA降维至3维。最后分别搭建LSTM识别模型,从测试集预测准确率、训练集准确率变化趋势以及训练集损失函数变化趋势三个方面进行比较,选择最优模型。其中SG+LDA+LSTM和Original+LDA+LSTM在测试集预测准确率上都能达到100%,MinMaxScaler+LDA+LSTM测试集预测准确率在98.57%,SNV+LDA+LSTM准确率最低,只有87.14%;在训练集准确率变化趋势表现上,SG+LDA+LSTM能够保持良好的学习,很快达到100%,Original+LDA+LSTM和MinMaxScaler+LDA+LSTM也能达到100%的准确率,但在前几次训练过程中会有准确率下降的情况出现,SNV+LDA+LSTM训练集准确率在训练次数内并未达到100%;SG+LDA+LSTM损失函数变化趋势也具有很好的收敛性和稳定性,Original+LDA+LSTM,MinMaxScaler+LDA+LSTM以及SNV+LDA+LSTM在损失函数变化趋势上表现并不出色。结果表明,4组模型中,SG+LDA+LSTM模型是最适合应用于矿井突水识别,该方法补充了矿井突水水源识别工作的内容,为矿井突水识别提供了新的思路。  相似文献   

20.
张应平  丁剑平 《光学学报》2000,20(7):25-930
提出一种用非相干光系统识别彩色图像的方法,将脸色图像分解成三个单色像处理,设计一可实现的仅相位光学传递函数,对其进行带能优化,人而提高信噪比并使相关峰锐化,通过一对滤波器来合成该光学传递函数,获得了采色图像相关识别的实验结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号