首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
场景识别是一种用计算机实现人的视觉功能的技术,它的研究目标是使计算机能够对图像或视频进行处理,自动识别和理解图像和视频中的场景信息。由于场景识别技术拥有广泛的应用前景,因此得到了许多关注。随着大数据时代的来临和深度学习的发展,使用深度学习方法解决场景识别问题已经成为场景识别领域未来的发展方向。文章首先概述介绍了场景识别技术的主要研究内容和发展情况,之后阐述了在图像场景识别中深度学习方法的应用情况,然后介绍了一些在图像场景识别中深度学习方法应用的具体的典型案例,同时给出了这几种方法具体的对比与分析。最后给出了文章的结论,总结了当前图像场景识别中使用深度学习方法的发展情况,并且对未来的发展方向给出了一些展望和建议。  相似文献   

2.
通过分析声带的生理结构和喉疾病对声带振动模式的影响,从物理上将喉疾病根据其起因归纳为主要影响声带本体层振动和主要影响声带覆盖层振动的两大类;并认为频域相对信噪比是区分病态噪音和正常嗓音的有效参数,协同监视病态嗓音的频率微扰商和振幅微扰商参数的异常可基本识别上述两类疾病。  相似文献   

3.
为了识别采集图像中的平面场景以及建筑物,利用摄像机参数,对平面场景及建筑物成像过程进行了几何分析。首先,根据相机参数以及相机飞行状态分析平面场景成像畸变;然后,对平面场景上的建筑物形状的成像进行几何分析;最后,将相机上采集到的平面场景及建筑物的图像像素数与真实平面场景及建筑物的尺寸建立联系。实验结果表明:已知相机参数及飞行状态的情况下,可以对平面场景及建筑物形状信息进行推导,从而完成目标识别与跟踪。本方法适合在典型建筑物、孤立建筑物、建筑群中具有明显形状特征等情况下对立体目标进行自动捕获与跟踪。  相似文献   

4.
为了识别采集图像中的平面场景以及建筑物,利用摄像机参数,对平面场景及建筑物成像过程进行了几何分析。首先,根据相机参数以及相机飞行状态分析平面场景成像畸变;然后,对平面场景上的建筑物形状的成像进行几何分析;最后,将相机上采集到的平面场景及建筑物的图像像素数与真实平面场景及建筑物的尺寸建立联系。实验结果表明:已知相机参数及飞行状态的情况下,可以对平面场景及建筑物形状信息进行推导,从而完成目标识别与跟踪。本方法适合在典型建筑物、孤立建筑物、建筑群中具有明显形状特征等情况下对立体目标进行自动捕获与跟踪。  相似文献   

5.
王猛  张鹏远 《声学学报》2022,47(6):717-726
为解决短时音频场景识别任务中识别性能差的问题,提出一种融合多尺度特征的音频场景识别方法。首先将双声道音频中左右声道的和差作为输入,并使用长时帧长进行分帧处理,以保证提取出的帧级特征中包含足够多的音频信息。然后将特征逐帧输入到融合多尺度特征的一维卷积神经网络中,以充分利用网络中不同尺度的浅层、中层和深层嵌入特征。最后综合所有帧级软标签得到短时音频的场景分类结果。实验结果表明,该方法在国际声学场景和事件检测与分类挑战赛(DCASE) 2021短时音频场景数据集上的准确率为79.02%,实现了该数据集上目前为止的最优性能。  相似文献   

6.
光谱图像技术结合SAM算法识别自然场景下的成熟柑橘   总被引:1,自引:0,他引:1  
为了实现采摘机器人在复杂的自然场景下正确识别树上果实,来完成果实采摘,研究了不同环境下柑橘的识别方法.针对复杂的自然环境的影响及传统方法的局限性,在可见光和近红外区域择选5个特征波长滤波片,采集得到5幅滤波后的图像,并利用光谱角分类算法完成柑橘识别.试验结果表明,在光照角度、光照强度等不同条件下,柑橘的识别准确度达到96%.研究表明,滤波片光谱图像技术结合光谱角分类算法可以有效地识别自然场景下的成熟柑橘.  相似文献   

7.
吉书鹏 《光学技术》2004,30(6):646-651
根据某型号多传感器光电成像设备实际应用的特点,提出了一种基于小波多分辨率分析(MRA)的多算子自适应目标识别跟踪算法,可实现昼夜型光电设备对陆地/海面全动态场景不确定目标的识别跟踪。建立了一种基于帧内、帧间置信度评价的双阈值自适应跟踪预测策略和相似目标辩识准则,有效地提高了目标跟踪的稳定性和鲁棒性。地面仿真及空中实际飞行实验结果表明:该算法能够很好地实现在各种复杂场景条件下的动态场景目标的稳定跟踪。  相似文献   

8.
为了实现采摘机器人在复杂的自然场景下正确识别树上果实,来完成果实采摘,研究了不同环境下柑橘的识别方法.针对复杂的自然环境的影响及传统方法的局限性,在可见光和近红外区域择选5个特征波长滤波片,采集得到5幅滤波后的图像,并利用光谱角分类算法完成柑橘识别.试验结果表明,在光照角度、光照强度等不同条件下,柑橘的识别准确度达到96%.研究表明,滤波片光谱图像技术结合光谱角分类算法可以有效地识别自然场景下的成熟柑橘.  相似文献   

9.
刘育坤  郑霖  黎塔  张鹏远 《声学学报》2023,(6):1260-1268
提出了一种面向多样化声学场景自适应设计声学编码器的方法 (SAE)。该方法通过学习不同声学场景下语音中包含的声学特征的差异,适应性地为端到端语音识别任务设计出合适的声学编码器。通过引入神经网络结构搜索技术,提高了编码器设计的有效性,从而改善了下游识别任务的性能。在Aishell-1、HKUST和SWBD三个常用的中英文数据集上的实验表明,通过所提场景自适应设计方法得到的声学编码器相比已有的声学编码器可以获得平均5%以上的错误率改善。所提方法是一种深入分析特定场景下语音特征、针对性设计高性能声学编码器的有效方法。  相似文献   

10.
针对果实在未完全成熟前就需采摘以满足市场销售需求的实际情况,以及采摘机器人作业环境的复杂性,研究了自然场景下不同成熟度柑橘的识别方法。通过R与G分量间比值变换得到具有独特信息的比值图像,并在Munsell HSV颜色空间上,利用共轭激励法融合H和S分量图像,针对其与上述比值图像的弱相关性与强正交性,用其构建掩膜,来去除比值图像的背景,实现柑橘识别。实验结果表明此方法对柑橘识别精度达到92%,可以自适应地识别自然场景下不同成熟度的柑橘,且识别精度高,鲁棒性强。  相似文献   

11.
In automated plants, particularly in the petrochemical, energy, and chemical industries, the combined management of all of the incidents that can produce a catastrophic accident is required. In order to do this, an alarm management methodology can be formulated as a discrete event sequence recognition problem, in which time patterns are used to identify the safe condition of the process, especially in the start-up and shutdown stages. In this paper, a new layer of protection (a Super-Alarm), based on the diagnostic stage to industrial processes is presented. The alarms and actions of the standard operating procedures are considered to be discrete events involved in sequences; the diagnostic stage corresponds to the recognition of the situation when these sequences occur. This provides operators with pertinent information about the normal or abnormal situations induced by the flow of the alarms. Chronicles Based Alarm Management (CBAM) is the methodology used in this document to build the chronicles that will permit us to generate the Super-Alarms; in addition, a case study of the petrochemical sector using CBAM is presented in order to build one chronicle that represents the scenario of an abnormal start-up of an oil transport system. Finally, the scenario’s validation for this case is performed, showing the way in which, a Super-Alarm is generated.  相似文献   

12.
Complex human activities in natural videos are often composed of several atomic-level actions organized hierarchically. We should not only consider the appearance variability of these action units, but also model the spatiotemporal relationships between them when recognizing such high-level complex activities. In this paper, we focus on the problem of recognition of complex human activities in an example-based video retrieval framework and propose a new method based on hierarchical feature-graph matching. A video depicting an activity is represented as a high-level feature graph (HLFG), and each node of the HLFG is a mid-level feature graph (MLFG) constructed on a local collection of spatiotemporal interest points. MLFG, the first level of our two-level graph structure, describes the local feature contents and spatiotemporal arrangements of interest points. HLFG, the second level, describes the appearance variability and spatiotemporal arrangements of atomic-level actions in a way. Final recognition is accomplished by matching the HLFGs of the query and test videos, and matching two HLFGs involves matching the MLFGs between them. We use an efficient spectral method to solve these two graph-matching problems. Our method does not require any preprocessing and gives reasonable results with even a small number of query examples. We evaluate our approach with one publicly available complex human activity dataset and achieve results comparable to other systems that have studied this problem.  相似文献   

13.
By means of star products and high precision numerical calculation, an abnormal phenomenon is found in period-p-tupling bifurcation processes in one-dimensional trimodal maps. A route of transition to chaos, presented by a right-associative non-normal star product, breaks the Feigenbaum's metric universality, namely, the conventional Feigenbaum's successive rates exhibit a strong divergence. To overcome the divergence, an approximate scheme of accelerating convergence is proposed; and the Feigenbaum scenario is included as a special case in the new bifurcation scenario. It will provide access to understanding non-normal star products and their corresponding renormalization.  相似文献   

14.
天光作为一种主要的噪声,叠加在目标天体光谱之中,降低了光谱的信噪比。经过减天光处理后,若光谱中仍含有大量强度高的天光残差将不利于对目标光谱的后续分析。自动识别减天光异常恒星光谱的研究较少,目前只能通过人工检测的方法去寻找减天光异常的光谱,效率较低。首先对影响减天光结果的因素进行分析,找出减天光异常光谱的特征,然后提出一种简单有效的方法能够自动识别LAMOST巡天经过Pipeline处理之后仍然存在减天光异常的恒星光谱并检测其位置。该方法先对光谱进行归一化处理,然后通过检测天光线附近是否有一定强度的类似发射线或吸收线的残留来判定该天光线位置是否出现减天光异常,最后得出光谱中所有的减天光异常的天光位置。通过对LAMOST光谱数据的实验表明,这种方法可以有效识别出减天光异常的光谱和发现不同残留强度的天光线异常位置,并且该方法简单易懂,识别效率高,可以应用于大量的减天光异常光谱的识别与检测问题。  相似文献   

15.
为了实现低信噪比下公共场所异常声音声学特征提取,提出经验小波滤波器组用于提取异常声音声学特征。首先,根据等效矩形带宽的人耳听觉特性,得到各滤波器的中心频率,计算出经验小波滤波器组的边界。然后,将边界代入经验小波细节函数和尺度函数中,形成经验小波滤波器组。最后,用经验小波滤波器组分解低信噪比下公共场所异常声音,经分解的各模态归一化对数能量作为异常声音声学特征,用于分类识别。相关实验表明,提出的经验小波滤波器组与典型的语音信号处理及时频信号处理方法相比,在低信噪比(0 dB)的商店、银行、办公室、自动取款机环境下,对异常声音的平均识别率提高了4.75%~37.92%,验证了提出方法的有效性。   相似文献   

16.
为了提高人体异常行为识别的准确率,采用了一种将多特征结合的异常行为识别算法,主要包括对步行、快跑、慢跑、拳击、双手挥舞、鼓掌六种异常行为进行识别。首先从视频流中提取出人体轮廓,然后从所得的轮廓中提取Hu矩特征与纹理特征。最后通过模板匹配的方法,采用马氏距离度量所需识别的当前行为特征向量与标准模板行为的特征向量之间的相似性,并通过设置相应的阈值判定该行为所属类别。实验证明,该方法比提取单一特征的方法识别率高,且具有一定的实用价值。  相似文献   

17.
曾宇  户文成 《应用声学》2020,39(3):409-416
针对公共场所异常声的感知和识别问题,提出一种基于贝叶斯优化卷积神经网络的识别方法。提取声信号的Gammatone倒谱系数、倍频程功率谱、短时能量和谱质心,组合成声信号的特征图。构建卷积神经网络作为分类器,利用递增的卷积核设置和池化操作处理不同尺度的特征。基于贝叶斯优化算法优化卷积神经网络的模型参数,对包括火苗噼啪声、婴儿啼哭声、烟花燃放声、玻璃破碎声和警报声的5种公共场所异常声进行识别。该方法的识别结果与基于不同的特征提取和分类器方案得到的识别结果进行比较,结果表明该方法的识别效果优于其他特征提取和分类器方案的识别效果。最后分析了该方法在不同信噪比噪声干扰下的识别结果,验证了该方法的有效性。  相似文献   

18.
针对目前本体构建与重构过程中数据处理效率低的问题,运用支持向量机分类及K-均值聚类的方法对本体构建数据进行处理,从文本数据中抽取关注的特定的信息,运用基于二叉树的多分类支持向量机以及支持向量机与K-均值融合的多样本聚类,总结基于分类与聚类的本体构建过程,并以离散型和连续型两种数据样本验证了方法的可行性。实验结果表明,基于数据挖掘的本体构建与重构技术具有良好的应用效果。  相似文献   

19.
In contrast to the Copenhagen interpretation we consider quantum mechanics as universally valid and query whether classical physics is really intuitive and plausible. We discuss these problems within the quantum logic approach to quantum mechanics where the classical ontology is relaxed by reducing metaphysical hypotheses. On the basis of this weak ontology a formal logic of quantum physics can be established which is given by an orthomodular lattice. By means of the Solèr condition and Piron's result one obtains the classical Hilbert spaces. However, this approach is not fully convincing. There is no plausible justification of Solèr's law and the quantum ontology is partly too weak and partly too strong. We propose to replace this ontology by an ontology of unsharp properties and conclude that quantum mechanics is more intuitive than classical mechanics and that classical mechanics is not the macroscopic limit of quantum mechanics.  相似文献   

20.
应用变分模态分解及能量熵的扬声器异常声分类   总被引:1,自引:0,他引:1       下载免费PDF全文
周静雷  颜婷 《声学学报》2021,46(2):263-270
为更准确地实现扬声器异常声分类以及促进其分类的自动化,提出一种基于变分模态分解(Variational Mode Decom-position,VMD)能量熵和遗传算法优化的支持向量机(Genetic Algorithm-Support Vector Machines,GA-SVM)的扬声器异常声分类方法.首先对测得的...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号