期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

南方陈国钊朱艺璇殷健源《光学技术》2023,(6):756-762

为了提升行人重识别算法的检索准确率,提出了基于软掩膜前景分割和多信息融合重排序的行人重识别算法。通过基于U-Net的软掩膜前景分割算法去除图像背景信息,同时减缓图像分割边界的突变,以保留图像中行人的关键信息;通过基于孪生深度网络的多信息融合重排序算法融合行人图像的多种信息,提升检索结果质量。实验结果表明,提出的两种方法是对行人重识别算法流程的有效补充,可作为提升准确率的有效方法应用于多数现有行人重识别算法中。相似文献

2.

联合多级深度特征表示和有序加权距离融合的视频行人再识别方法

孙锐黄启恒陆伟明高隽《光学学报》2019,39(9):271-285

针对目前视频行人再识别中存在视角、光线变化,背景干扰与遮挡,行人外观与行为相似,以及相同行人在不同模态特征下距离的差异性而导致的匹配不正确问题,提出一种联合多级深度特征表示和有序加权距离融合的视频行人再识别方法。在行人特征表示阶段,提出了行人多级深度特征表示网络,该网络不仅能学习视频序列中行人的时空特征,还能获取行人的全局外观特征和局部外观特征。在有序加权距离融合阶段,将行人的特征表示输入到距离测度学习中,分别计算行人在三类特征下的独立距离,并将距离排序后,根据距离的排名优化距离权值,最后融合三类距离得到最终距离,从而准确匹配行人。通过在公共数据集中的实验表明,所提方法不仅能够提高视频行人再识别的识别率,还具有丰富和完整的行人特征表示能力。相似文献

3.

基于可见光-红外模态下双向特征生成的行人重识别方法

王晓红李超奇卢辉《光学技术》2022,(3):372-378

为了提高可见光-红外跨模态行人重识别的检测准确度,提出一种基于可见光-红外模态双向特征生成的双流网络模型,相对现有算法,使用双向特征生成方法进行跨模态行人特征迁移,显著提高了跨模态特征表达,同时利用双流网络提取具有判别性双模态特征,并通过设计的粗细粒度损失融合的策略,提高了跨模态行人检索的准确度。实验结果表明,与最新方法相比,文章提出的方法提高了跨模态行人重识别的平均准确度,在RegDB数据集上取得92.91%,在SYSU-MM01数据集取得66.17%。相似文献

4.

数据驱动的空间目标图像信息感知技术

杨小姗潘雪峰苏少杰贾鹏《光学学报》2021,41(3):171-183

从空间目标的观测图像中自动感知其类别及工作状态对军事国防及空间探测等具有重要意义.为实现对空间目标图像信息的自动化精确感知,提出了一种数据驱动的空间目标图像信息感知技术.所提技术以深度卷积神经网络为基础,利用海量的模拟数据和少量的真实数据训练神经网络,训练后的神经网络能够直接从空间目标图像中感知空间目标的载荷及工作状态... 相似文献

5.

基于深度残差网络的脱机手写汉字识别研究

张帆张良刘星张宇《应用声学》2017,25(12):259-262

摘要: 手写汉字识别是模式识别与机器学习的重要研究方向和应用领域。近年来,随着深度学习理论方法的完善、新技术的层出不穷,深度神经网络在图像识别分类、图像生成等典型应用中取得了突破性的进展,其中,深度残差网络作为最新的研究成果,已成功应用于手写数字识别、图片识别分类等多个领域。本文将研究深度残差网络在脱机孤立手写汉字识别中的应用方法,通过改进残差学习模块的单元结构,优化深度残差网络性能,同时通过对训练集的预处理,从数据层面实现训练生成模型性能的提升,最后设计实验,验证深度残差网络、End-to-End模式在脱机手写汉字识别中的可行性,分析、总结存在的问题及今后的研究方向。相似文献

6.

融合底层和中层字典特征的行人重识别

下载免费PDF全文

王丽《中国光学》2016,9(5):540-546

针对当前行人重识别方法采用单一底层特征识别率较低的问题,提出一种融合底层和中层特征的识别方法,由粗到精对人体目标进行匹配识别。首先提取目标的颜色直方图和纹理直方图进行粗分类;然后将人体目标分为头部、躯干和腿部3个部分。忽略包含信息量较少的头部,对躯干和腿部,提出一种中层图像块字典提取方法,并对照该字典生成中层特征,进行精确分类。底层特征结合中层特征使算法既具有较好的区分度,又具有良好的泛化能力。实验结果表明本文算法在VIPeR数据库上的n AUC比已有方法提高6.3%,对遮挡和背景粘连的鲁棒性更好。相似文献

7.

基于三维卷积神经网络的立体匹配算法

王玉锋王宏伟于光杨明权袁昱纬全吉成《光学学报》2019,39(11):219-226

相似文献

8.

基于特征重聚焦网络的多尺度近岸舰船检测

刘荻张焱赵琰石志广张景华张宇《光学学报》2021,41(22):129-141

针对监控视频中的多尺度近岸舰船检测问题,提出了一种基于特征重聚焦网络的舰船目标检测算法,设计了由多维特征聚合模块(MFAM)与注意力特征重构模块(AFRM)组成的特征重聚焦策略.其中,MFAM基于输入的特征金字塔构建特征聚合块,进一步融合多尺度舰船不同层次特征的语义信息.AFRM基于多分支空洞卷积以及通道与空间注意力机... 相似文献

9.

一种面向遮挡行人检测的改进YOLOv3算法

《光学学报》2022,42(14):152-161

相似文献

10.

基于注意力卷积神经网络的动态手势识别研究北大核心CSCD

施丽红《光学技术》2020,(6):750-756

针对复杂环境下动态手势识别准确率低的问题,提出了一种基于长短期记忆网络和卷积神经网络的动态手势识别算法。采用长短期记忆网络学习每个滤波器的权重,预测人体外形相关的滤波器组;采用卷积神经网络提取目标手势的轨迹图,创建彩色的轨迹图像;将轨迹图像送入注意力卷积神经网络训练,利用神经网络识别出复杂环境下的手势。实验结果表明,该算法能够准确地检测与跟踪手势的动态变化,并且实现了较好的手势识别准确性。相似文献

11.

基于深度学习的船舶辐射噪声识别研究 总被引：2，自引：1，他引：2

下载免费PDF全文

朱可卿田杰黄海宁张扬帆《应用声学》2018,37(2):238-245

为了改善船舶辐射噪声识别系统的性能,进一步提高船舶辐射噪声识别的正确率,该文提出采用一种基于深度学习的船舶辐射噪声识别方法。该方法首先提取了船舶辐射噪声的频谱、梅尔倒谱系数等特征,将提取特征后的图像样本分别用于训练卷积神经网络和深度置信网络,再对船舶辐射噪声进行识别。通过文中所给实例,将深度学习和支持向量机两种识别方法的性能进行比较,得出深度学习方法可以有效地提高船舶辐射噪声识别正确率的初步结论。相似文献

12.

结合改进DRSE-GCNN的电力调度语声识别模型*

下载免费PDF全文

苌文涵张云翔顾彬相增辉陈轩李霁轩《应用声学》2024,43(6):1243-1249

针对现有电力调度中语声识别方法存在的字识别错误率高和耗时长等问题,在分析语声识别技术的基础上,提出了一种改进的深度学习方法用于电力调度语声识别。将改进的深度残差收缩网络和改进的门控卷积神经网络相结合,通过改进的深度残差收缩网络提取有效特征,在通过堆叠改进的门控卷积神经网络来获取有效上下文信息。通过试验对所提方法的性能进行分析,验证其优越性。结果表明,所提方法与常规识别方法相比,在模型参数、字识别错误率和平均识别时间上均具有一定的优势,模型参数量为6.48 M,字识别错误率为2.87%,平均识别时间为0.187 s。该研究为电力调度语言识别方法的发展提供了一定的参考。相似文献

13.

基于重引力搜索和深度学习的图像表情识别研究北大核心CSCD

杨芳郭宏刚《光学技术》2020,(5):626-633

传统表情识别技术采用单一类型的特征表示方法,由于每个特征类型对不同数据集的表示效果存在差异,导致传统技术对不同数据集的表情识别效果也存在较大的差异。设计一种多类型混合特征的选择方案,用以提高不同数据集的表情识别准确率。将面部不同区域、不同类型的特征集作为基础特征集,利用重引力搜索算法从基础特征集中选择优化的特征子集。将优化的特征子集输入深度信念网络进行训练和半监督学习,采用训练的网络模型对表情进行识别。实验结果表明,在不同数据集条件下,采用该方法均能够保持较高的识别准确率。相似文献

14.

基于候选深度信息的水泥熟料三维重建方法

《光学学报》2010,30(8)

提出了一种用于水泥熟料的在线厚度检测的基于候选深度的三维重建方法。采用一字线激光器从正上方向水泥熟料层投射激光线,使用双目摄像机从斜上方获取图像并进行二值化处理。在世界坐标系范围中光条所在的垂直面上建立深度候选点,通过确定候选点在视差图像上对应点直线与光条相交的交点,实现被测物体表面的精确测量。实验证明本方法具有较高的测量精度和计算速度,能够满足运输中水泥熟料在线三维重建的要求。相似文献

15.

基于注意力机制的遮挡行人检测算法

《光学学报》2021,41(15):149-157

相似文献

16.

基于双向循环神经网络的汉语语音识别*

下载免费PDF全文

李鹏杨元维杜李慧高贤君周意蒋梦月张净波《应用声学》2020,39(3):464-471

当前基于深度神经网络模型中,虽然其隐含层可设置多层,对复杂问题适应能力强,但每层之间的节点连接是相互独立的,这种结构特性导致了在语音序列中无法利用上下文相关信息来提高识别效果,而传统的循环神经网络虽然做出了改进,但是只能对上文信息进行利用。针对以上问题,该文采用可以同时利用语音序列中上下文相关信息的双向循环神经网络模型与深度神经网络模型相结合,并应用于语音识别。构建具有5层隐含层的模型,其中第3层为双向循环神经网络结构,其他层采用深度神经网络结构。实验结果表明:加入了双向循环神经网络结构的模型与其他模型相比,较好地提高了识别正确率;噪声对双向循环神经网络汉语识别有重要影响,尤其是训练集和测试集附加噪声类型不同时,单一的含噪声语音的训练模型无法适应不同噪声类型的语音识别;调整神经网络模型中隐含层神经元数量后,识别正确率并不是一直随着隐含层中神经元数量的增加而增加,神经元数量数目增加到一定程度后正确率出现了降低的趋势。相似文献

17.

基于深度学习的简化多信道并行光性能监测

李梦岩吴锦涛杨静宇张力夫谭勇邱天李岳彬邓鹤鸣罗风光杨柳《光学学报》2023,(7):139-149

提出了一种基于信号光谱和多任务深度神经网络（MT-DNN）的多信道并行光性能监测（OPM）方案,采集多信道光谱图进行预处理来设计幅度直方图（Ahs）,可实现波分复用（WDM）系统多信道调制格式识别（MFI）和光信噪比（OSNR）监测。在建立的3信道WDM相干光通信系统中,对由PDM-4QAM/16QAM/64QAM组合的10种调制格式的3信道信号实现了MFI准确率为100%、OSNR监测的平均绝对误差（MAE）为0.16 dB的精准监测。为进一步研究所提OPM方案的性能以应对复杂的传输环境,提出了迁移学习辅助的多任务深度神经网络（TL-MT-DNN）用于多信道MFI和OSNR并行监测。结果表明,所提方案可移植性较好,还可节省大量样本和训练周期,其MFI准确率仍可达100%,3信道OSNR监测的MAE分别为0.24 dB、0.20 dB和0.19 dB。相似文献

18.

基于神经网络的字符在线视觉识别研究

张国福岳晓峰《光学技术》2018,(1):75-81

提出了一种基于机器视觉技术的血袋编号字符识别方法,建立了字符在线识别硬件与软件系统。运用经典标定算法确定摄像机内外参数。对扫描的原始图像进行了灰度化、增强、滤波、反相等预处理及字符的倾斜校正、图像行字切分、归一化操作。分析表明:行字切分大于临界阈值T时,确定是文字像素一部分。预测结果与实测数据对比表明采用神经网络对转印字符进行识别可有效提高检测一次性血袋出厂编号的效率。相关技术及研制系统已应用于长春市某医疗制品企业,取得较好识别效果及应用效果。相似文献

19.

基于改进Xception实现涡旋光束轨道角动量识别

陈永豪刘晓云蒋金洋高思宇刘颖柴腾飞姜月秋《光子学报》2024,(4):80-90

当光束在海洋中传输时,湍流的存在会严重影响光束的质量,导致接收端光场产生扭曲和退化现象。为解决该问题,提出一种基于改进深度可分离网络（IXception）的方法,用于实现通过海洋湍流传输的涡旋光束轨道角动量模态识别。采用分步相位屏的思想,基于功率谱反演法仿真涡旋光束在海洋中的传输过程,并建立入射光场发生的退化、扭曲的散斑场数据集,用数据集来训练IXception识别散斑场中涡旋光束的轨道角动量。IXception延用Xception架构思想,结合了残差结构和倒置残差结构,能够提取高度空间深度特征,减少网络结构参数的冗余,增强泛化能力。研究结果表明,IXception在20 m和80 m湍流中对扭曲光场轨道角动量的识别率达到了99.20%与97.9%。随着传输距离的增加,IXception的识别率会略有降低,但与Xception模型相比,IXception识别性能更好。相似文献

20.

基于轮廓点掩模细化的单阶段实例分割网络

张绪义曹家乐《光学学报》2020,(21):113-121

针对现有的实例分割方法PolarMask中分割结果边缘信息模糊的问题,通过对轮廓点角度偏置和距离的预测,基于轮廓点细化的单阶段实例分割网络准确提取出实例轮廓。同时,为了进一步提升实例分割的性能,利用语义分割子网络对实例边缘进行了进一步细化。实验结果表明,所提方法在大规模实例分割数据集MS COCO的测试集上的分割精度为32.5%,比现有的实例分割方法(PolarMask)提高了2.1个百分点,证明了所提方法的有效性。相似文献