期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

周强张晓俊顾济华赵鹤鸣朱俊杰陶智《声学学报》2014,39(1):111-118

提出了一种嗓音多频带非线性分析的声带病变识别方法,以提高声带病变嗓音的识别率。首先采用Gammatone听觉滤波器组对嗓音信号进行滤波,求取每个频带下的最大李雅普诺夫指数;对映射到核空间的数据采用高斯最大似然度准则优化核函数,然后采用优化核主成分分析算法实现特征抽取。识别实验表明,多频带最大李雅普诺夫指数的识别率比传统的MFCC和最大李雅普诺夫指数分别有6.52%和8.45%的提高,且采用优化核主成分分析算法比传统核主成分分析算法有更好的抽取效果.将多频带非线性分析和优化核主成分分析算法结合,识别率提升至97.82%。相似文献

2.

特征级联在车辆检测中的应用与研究

郭克友王艺伟郭晓丽《应用声学》2016,24(9):80-82

对现有的采用机器学习算法检测车辆进行研究,分析其存在的不足;表现在特征或者算法单一,对光照等条件变化鲁棒性不够;针对这些问题,提出一种融合LBP特征与HOG特征,并结合Adaboost与SVM的车辆检测算法;借鉴级联的思想,首先采用AdaBoost对训练样本提取LBP特征进行训练,得到的分类器用于初步筛选并将其分类结果作为下一层分类器的输入;然后采用SVM算法对训练样本提取HOG特征进行训练,得到的分类器用于二次筛选上一层分类器的分类结果;实验结果证明Adaboost-SVM相结合的办法检测结果精度高,准确率和召回率均达到95%以上,FPPW与FPPI的值均在5%左右;同时由于算法采用的特征对光照条件具有较强的鲁棒性,因此光照条件的变化对算法的识别结果影响较低;实时性方面,每帧图像的处理时间为75 ms,满足实时性要求。 相似文献

3.

基于Gabor小波变换的ICA火灾图像纹理识别算法

余路卜乐平颜礼彬 《应用声学》2015,23(1):262-265

针对火灾图像纹理识别问题,提出了基于Gabor小波变换的ICA火灾图像纹理识别算法,并根据火灾图像纹理识别特点进行了优化。首先用不同尺度和方向的Gabor滤波器对待识别图像滤波,得到其特征图像,然后将特征图像转化成特征向量作为ICA的输入,得到基矢量子空间,再将测试图像经过Gabor滤波器的特征向量投影到ICA子空间中得到系数向量作为目标识别特征,最后用支持向量机进行识别。通过与Gabor滤波器法和ICA方法的对比实验,表明该算法可以在火灾纹理图像的识别率上比传统方法提高5%以上,为火灾图像识别提供了一种新思路。相似文献

4.

一种高效的基于平行边缘的道路识别算法

《光学学报》2015,(7)

为了提高智能车辆道路识别的准确性和效率,设计了一种基于平行边缘特征的道路检测算法。提出了基于边缘连接的道路区域快速粗分割方法;对边缘点局部直线的检测和方向进行编码,利用竖直线实现了极大可能道路区域的估计;基于方向一致性判别准则,实现了极大可能道路区域内平行边缘的识别算法;提出了三个道路识别准则,综合运用平行边缘、道路的区域位置信息,实现了道路特征的准确识别。实验结果表明,本文算法能够快速并准确的提取典型的直线和弯曲道路模型中的道路区域,比以往算法在速度和准确性上都有较大的提升。相似文献

5.

应用声信号特征识别车辆车型及车速范围*

下载免费PDF全文

赵佳美户文成蒋从双曾宇姚琨《应用声学》2021,40(3):468-473

国内外现有研究工作主要针对车型进行识别,该文在此基础上对车速范围的分类识别进行了研究。文中将主成分分析方法和BP神经网络算法结合(PCA-BP)对车型与车速进行识别分析,对比了与BP神经网络算法识别速度的差异。结果表明应用PCA-BP方法的识别效果整体较好,且在识别过程中可以节省计算时长的50%～70%左右,大大提高了识别速度。在未来的车辆识别系统实现中,可以在保证良好识别效果的前提下,提高软硬件平台的传输效率,节省识别计算时间。相似文献

6.

基于HOG纹理的全天时十字路口车尾检测算法

余典刘操郑宏《光学与光电技术》2014,12(3):18-23

HOG纹理因其良好的鲁棒性,在纹理描述中被广泛使用。提出了一种将HOG纹理应用于十字路口全天候车尾检测的算法。即分别采集了白天和夜间该场景下的车尾作为正样本、非车辆和车辆的一部分作为负样本,经预处理后,提取较低维数的HOG纹理送入支持向量机进行训练,得到白天和夜间的识别模型,在检测中根据一定的条件进行切换。对多段视频进行测试证明,该种算法对不同时段的交通场景都具有较高的稳定的车尾识别率,且优于单模型的识别效果。相似文献

7.

视频车辆监控系统图像滤波算法的研究

下载免费PDF全文

张全法费光彦王庆峰任朝栋《应用光学》2012,33(1):85-89

视频车辆监控系统中图像噪声对背景学习、车辆识别等具有很大影响,已有滤波算法又难以满足系统对滤波效果和速度的综合要求。通过对比不滤波、采用中值滤波或均值滤波时的车辆识别效果和速度,选用均值滤波作为进一步的研究对象。在适当减少计算量的基础上,通过改进数据访问方法和计算方法进一步提高了算法速度,并用Visual C++ 6.0实现了该算法。实验表明,新算法的速度比盒滤波提高了55 %。相似文献

8.

基于OTSU分割和HOG特征的行人检测与跟踪方法

徐守坤王斌石林瞿诗齐《应用声学》2016,24(10)

传统的HOG算法针对整幅图像进行行人特征提取,大量的非人窗口计算必然降低检测的准确率和效率。为此,提出一种基于OTSU分割和HOG特征的行人检测与跟踪方法。利用OTSU算法以最佳阈值分割图像,在分割区域的基础上进行Canny边缘检测,通过边缘的对称性计算确定行人候选区,继而采用经PCA方法降维后的HOG特征和隐马尔可夫模型对行人候选区进行检测验证。最后,以确定的行人区域为跟踪窗口,利用CamShift算法跟踪行人。多组实验结果证明,本文方法的行人检测效率和精度均有所提高,跟踪性能稳定、可靠。相似文献

9.

基于子带信号瞬时频率的特征提取及其在车型分类中的应用*

陈建新尹雪飞陈克安《应用声学》2020,39(1):97-103

车型识别是智能交通系统的关键技术之一,具有重要应用价值。针对车辆噪声信号的复杂性,提出了一种基于相位信息和能量信息融合的车型分类方法。通过耳蜗滤波器组将车辆噪声信号分解成窄带信号,为了避免相位卷绕问题,利用傅里叶变换性质结合相位一阶导数估计窄带信号的瞬时频率并提取瞬时频率特征。该特征能够有效地完成车型分类,通过将瞬时频率特征和对数能量联合,进一步提高了分类准确率。相似文献

10.

配电柜线号特征提取和识别方法研究

徐顺《应用声学》2017,25(4)

配电柜是动车组电气设备的关键设备之一,基于视觉的自动化检测方式可以解决传统的人工检测的低效、主观性强的问题,是工业检测的一个重要的检测方向,由于动车配电柜在光照和空间等方面的恶劣情况,线号数字呈现灰度、尺寸、角度等差异,极不利于线号的识别。本文以线号正确分割提取为前提,提取分割的数字区域的HOG特征和LBP特征,并利用SVM和ANN两种分类器配合两种特征进行对比试验,因为HOG特征在图像几何和光学的形变会表现出优异的不改变的特性,且SVM分类器克服了后者局部极小的困扰,最终选用SVM分类器配合HOG特征进行配电柜线号识别。相似文献

11.

A temporal hand gesture recognition system based on hog and motion trajectory

Jing Lin Yingchun Ding 《Optik》2013,124(24):6795-6798

A real-time, rapid and robust gesture recognition system is usually hindered by difficulty of hand localization and complexity of hand gesture modeling, especially under complex background. For eliminating these obstacles, in this paper, we propose a method using histograms of oriented gradients features (HOG) and motion trajectory information for temporal hand gesture recognition in natural environment. We firstly localize hand in video stream based on hand detection by HOG and support vector machine algorithm (SVM). After hand localization, the motion trajectory information of consecutive hand gesture is extracted and a database of standard gestures is built. Finally, the Mahalanobis distance between input gesture and database is computed for recognition. As the experimental results shown, our method exhibits a good performance in real-time test. 相似文献

12.

Combining Sparse and Dense Features to Improve Multi-Modal Registration for Brain DTI Images

Simona Moldovanu Lenuta Pan&#x; Topora&#x; Anjan Biswas Luminita Moraru 《Entropy (Basel, Switzerland)》2020,22(11)

A new solution to overcome the constraints of multimodality medical intra-subject image registration is proposed, using the mutual information (MI) of image histogram-oriented gradients as a new matching criterion. We present a rigid, multi-modal image registration algorithm based on linear transformation and oriented gradients for the alignment of T2-weighted (T2w) images (as a fixed reference) and diffusion tensor imaging (DTI) (b-values of 500 and 1250 s/mm²) as floating images of three patients to compensate for the motion during the acquisition process. Diffusion MRI is very sensitive to motion, especially when the intensity and duration of the gradient pulses (characterized by the b-value) increases. The proposed method relies on the whole brain surface and addresses the variability of anatomical features into an image stack. The sparse features refer to corners detected using the Harris corner detector operator, while dense features use all image pixels through the image histogram of oriented gradients (HOG) as a measure of the degree of statistical dependence between a pair of registered images. HOG as a dense feature is focused on the structure and extracts the oriented gradient image in the x and y directions. MI is used as an objective function for the optimization process. The entropy functions and joint entropy function are determined using the HOGs data. To determine the best image transformation, the fiducial registration error (FRE) measure is used. We compare the results against the MI-based intensities results computed using a statistical intensity relationship between corresponding pixels in source and target images. Our approach, which is devoted to the whole brain, shows improved registration accuracy, robustness, and computational cost compared with the registration algorithms, which use anatomical features or regions of interest areas with specific neuroanatomy. Despite the supplementary HOG computation task, the computation time is comparable for MI-based intensities and MI-based HOG methods. 相似文献

13.

融合声纹信息的能量谱图在鸟类识别中的研究

杨春勇祁宏达彭焱秋尹滨侯金舒振宇陈少平《应用声学》2020,39(3):453-463

常用的梅尔倒谱系数结合高斯混合模型(MFCC+GMM)方法的鸟鸣声识别技术难适应噪声环境,模型难以收敛,且计算复杂度高。该文提出一种融合声纹信息的能量谱图的鸟类识别方法(VPS-BR),该方法利用鸟类鸣声在能量谱图上所表现的多维差异性,定量识别鸣声声纹特征。通过对分贝能量进行颜色映射得到能量谱图,提取其视觉特征所表达的声学特征,分析归纳得到鸟类特有鸣声模式。在特征提取步骤中,选用识别速度快的局部二值模式、识别鲁棒性高的方向梯度直方图两个参数表征鸟鸣声谱图的边缘声纹;在识别步骤中,用局部二值模式和方向梯度直方图两种特征分别与支持向量机、K最近邻和随机森林3种分类器算法进行两两组合构建识别模型测试。对15种原始带噪鸟类鸣声数据集进行交叉验证,VPS-BR模型的平均识别率比MFCC+GMM组合模型高出11.3%,方向梯度直方图特征与K最近邻分类器的组合模型识别率达90.5%,表现出较好的抗噪性能和识别性能。最后针对样本数据集缺乏问题,使用生成对抗网络进行图像增强,进一步将识别率提升1.48%。相似文献

14.

基于可变形部件模型HOG特征的人形目标检测

下载免费PDF全文

宋瑨王世峰《应用光学》2016,37(3):380-384

使用单幅图像进行特定目标的检测是机器视觉领域的重要任务之一。利用机器学习的方法,使用LSVM分类器进行人形目标的检测。该方法提取图像的HOG（梯度方向直方图）特征和其对应的可变形部件来描述目标的外形特征,能够较好地解决目标由于运动而产生外形变化的问题。对常见公共区域场景进行数据采集并随机抽取了200张图像,使用所述方法对其中共1 100个人形目标进行检测,正确率识别率为78.3%。结果表明该方法具有一定的可行性和稳定性,能够较好检测出单幅图像中的人形目标并加以标注。但对于某种程度有所遮蔽的人形目标则会产生漏检的现象。相似文献

15.

一种改进的DNN-HMM的语音识别方法* 总被引：2，自引：1，他引：1

下载免费PDF全文

李云红梁思程贾凯莉张秋铭宋鹏何琛王刚毅李禹萱《应用声学》2019,38(3):371-377

针对深度神经网络与隐马尔可夫模型(DNN-HMM)结合的声学模型在语音识别过程中建模能力有限等问题,提出了一种改进的DNN-HMM模型语音识别算法。首先根据深度置信网络(DBN)结合深度玻尔兹曼机(DBM),建立深度神经网络声学模型,然后提取梅尔频率倒谱系数(MFCC)和对数域的Mel滤波器组系数(Fbank)作为声学特征参数,通过TIMIT语音数据集进行实验。实验结果表明:结合了DBM的DNN-HMM模型相比DNN-HMM模型更具优势,其中,使用MFCC声学特征在词错误率与句错误率方面分别下降了1.26%和0.20%。此外,使用默认滤波器组的Fbank特征在词错误率与句错误率方面分别下降了0.48%和0.82%,并且适量增加滤波器组可以降低错误率。总之,研究取得句错误率与词错误率分别降低到21.06%和3.12%的好成绩。相似文献

16.

基于指纹识别与LIN总线的汽车车门系统设计

凌滨索健文许景涛 《应用声学》2016,24(3):193-195

为了改善传统汽车防盗系统安全性低的问题,提出了一种新型的汽车门门锁控制方法,基于LIN总线网络对车身控制和改进的指纹识别技术来实现。使用L9638作为LIN总线收发器,以ST792F150JDV1QC作为主控节点微控制器,实现LIN网络的通信功能和对网关的控制。针对提高车门指纹识别率问题,提出了Gabor滤波器指纹识别方法,使用八通道的Gabor滤波器对预处理的指纹图像进行滤波,提取指纹图像的指纹特征,使用欧氏距离方法对提取的指纹特征进行匹配。匹配结果经过LIN从节点控制器串行口接收,传递至总线,主节点控制器做出反应,实现门锁的开关。最终对系统实物进行搭建,进行实验测量系统的可行性。相似文献

17.

基于DSP的电动汽车锂电池荷电状态估算的研究与实现

刘胜永李源赵振森于跃黄俊华《应用声学》2015,23(10):83-83

锂电池荷电状态(SOC)的准确估算是电动汽车能源管理的关键技术。为了提高锂电池SOC的估算精度,将无迹卡尔曼滤波(UKF)应用于锂电池SOC估算,以减小拓展卡尔曼滤波(EKF)简单线性化带来的误差。搭建电池检测系统的硬件平台,以TMS320F28335型数字信号处理器(DSP)为主控芯片(MCU),实现电压、电流、温度的检测及UKF算法,并设计了相关的电池测试实验。实验结果表明,UKF可以实时估算锂电池SOC,估算误差在4%以内,高于传统的拓展卡尔曼滤波(EKF)。相似文献