共查询到20条相似文献,搜索用时 218 毫秒
1.
2.
针对目前视频行人再识别中存在视角、光线变化,背景干扰与遮挡,行人外观与行为相似,以及相同行人在不同模态特征下距离的差异性而导致的匹配不正确问题,提出一种联合多级深度特征表示和有序加权距离融合的视频行人再识别方法。在行人特征表示阶段,提出了行人多级深度特征表示网络,该网络不仅能学习视频序列中行人的时空特征,还能获取行人的全局外观特征和局部外观特征。在有序加权距离融合阶段,将行人的特征表示输入到距离测度学习中,分别计算行人在三类特征下的独立距离,并将距离排序后,根据距离的排名优化距离权值,最后融合三类距离得到最终距离,从而准确匹配行人。通过在公共数据集中的实验表明,所提方法不仅能够提高视频行人再识别的识别率,还具有丰富和完整的行人特征表示能力。 相似文献
3.
4.
5.
摘 要: 手写汉字识别是模式识别与机器学习的重要研究方向和应用领域。近年来,随着深度学习理论方法的完善、新技术的层出不穷,深度神经网络在图像识别分类、图像生成等典型应用中取得了突破性的进展,其中,深度残差网络作为最新的研究成果,已成功应用于手写数字识别、图片识别分类等多个领域。本文将研究深度残差网络在脱机孤立手写汉字识别中的应用方法,通过改进残差学习模块的单元结构,优化深度残差网络性能,同时通过对训练集的预处理,从数据层面实现训练生成模型性能的提升,最后设计实验,验证深度残差网络、End-to-End模式在脱机手写汉字识别中的可行性,分析、总结存在的问题及今后的研究方向。 相似文献
6.
针对当前行人重识别方法采用单一底层特征识别率较低的问题,提出一种融合底层和中层特征的识别方法,由粗到精对人体目标进行匹配识别。首先提取目标的颜色直方图和纹理直方图进行粗分类;然后将人体目标分为头部、躯干和腿部3个部分。忽略包含信息量较少的头部,对躯干和腿部,提出一种中层图像块字典提取方法,并对照该字典生成中层特征,进行精确分类。底层特征结合中层特征使算法既具有较好的区分度,又具有良好的泛化能力。实验结果表明本文算法在VIPeR数据库上的n AUC比已有方法提高6.3%,对遮挡和背景粘连的鲁棒性更好。 相似文献
8.
9.
10.
针对复杂环境下动态手势识别准确率低的问题,提出了一种基于长短期记忆网络和卷积神经网络的动态手势识别算法。采用长短期记忆网络学习每个滤波器的权重,预测人体外形相关的滤波器组;采用卷积神经网络提取目标手势的轨迹图,创建彩色的轨迹图像;将轨迹图像送入注意力卷积神经网络训练,利用神经网络识别出复杂环境下的手势。实验结果表明,该算法能够准确地检测与跟踪手势的动态变化,并且实现了较好的手势识别准确性。 相似文献
11.
12.
针对现有电力调度中语声识别方法存在的字识别错误率高和耗时长等问题,在分析语声识别技术的基础上,提出了一种改进的深度学习方法用于电力调度语声识别。将改进的深度残差收缩网络和改进的门控卷积神经网络相结合,通过改进的深度残差收缩网络提取有效特征,在通过堆叠改进的门控卷积神经网络来获取有效上下文信息。通过试验对所提方法的性能进行分析,验证其优越性。结果表明,所提方法与常规识别方法相比,在模型参数、字识别错误率和平均识别时间上均具有一定的优势,模型参数量为6.48 M,字识别错误率为2.87%,平均识别时间为0.187 s。该研究为电力调度语言识别方法的发展提供了一定的参考。 相似文献
13.
传统表情识别技术采用单一类型的特征表示方法,由于每个特征类型对不同数据集的表示效果存在差异,导致传统技术对不同数据集的表情识别效果也存在较大的差异。设计一种多类型混合特征的选择方案,用以提高不同数据集的表情识别准确率。将面部不同区域、不同类型的特征集作为基础特征集,利用重引力搜索算法从基础特征集中选择优化的特征子集。将优化的特征子集输入深度信念网络进行训练和半监督学习,采用训练的网络模型对表情进行识别。实验结果表明,在不同数据集条件下,采用该方法均能够保持较高的识别准确率。 相似文献
14.
15.
16.
当前基于深度神经网络模型中,虽然其隐含层可设置多层,对复杂问题适应能力强,但每层之间的节点连接是相互独立的,这种结构特性导致了在语音序列中无法利用上下文相关信息来提高识别效果,而传统的循环神经网络虽然做出了改进,但是只能对上文信息进行利用。针对以上问题,该文采用可以同时利用语音序列中上下文相关信息的双向循环神经网络模型与深度神经网络模型相结合,并应用于语音识别。构建具有5层隐含层的模型,其中第3层为双向循环神经网络结构,其他层采用深度神经网络结构。实验结果表明:加入了双向循环神经网络结构的模型与其他模型相比,较好地提高了识别正确率;噪声对双向循环神经网络汉语识别有重要影响,尤其是训练集和测试集附加噪声类型不同时,单一的含噪声语音的训练模型无法适应不同噪声类型的语音识别;调整神经网络模型中隐含层神经元数量后,识别正确率并不是一直随着隐含层中神经元数量的增加而增加,神经元数量数目增加到一定程度后正确率出现了降低的趋势。 相似文献
17.
提出了一种基于信号光谱和多任务深度神经网络(MT-DNN)的多信道并行光性能监测(OPM)方案,采集多信道光谱图进行预处理来设计幅度直方图(Ahs),可实现波分复用(WDM)系统多信道调制格式识别(MFI)和光信噪比(OSNR)监测。在建立的3信道WDM相干光通信系统中,对由PDM-4QAM/16QAM/64QAM组合的10种调制格式的3信道信号实现了MFI准确率为100%、OSNR监测的平均绝对误差(MAE)为0.16 dB的精准监测。为进一步研究所提OPM方案的性能以应对复杂的传输环境,提出了迁移学习辅助的多任务深度神经网络(TL-MT-DNN)用于多信道MFI和OSNR并行监测。结果表明,所提方案可移植性较好,还可节省大量样本和训练周期,其MFI准确率仍可达100%,3信道OSNR监测的MAE分别为0.24 dB、0.20 dB和0.19 dB。 相似文献
18.
提出了一种基于机器视觉技术的血袋编号字符识别方法,建立了字符在线识别硬件与软件系统。运用经典标定算法确定摄像机内外参数。对扫描的原始图像进行了灰度化、增强、滤波、反相等预处理及字符的倾斜校正、图像行字切分、归一化操作。分析表明:行字切分大于临界阈值T时,确定是文字像素一部分。预测结果与实测数据对比表明采用神经网络对转印字符进行识别可有效提高检测一次性血袋出厂编号的效率。相关技术及研制系统已应用于长春市某医疗制品企业,取得较好识别效果及应用效果。 相似文献
19.
当光束在海洋中传输时,湍流的存在会严重影响光束的质量,导致接收端光场产生扭曲和退化现象。为解决该问题,提出一种基于改进深度可分离网络(IXception)的方法,用于实现通过海洋湍流传输的涡旋光束轨道角动量模态识别。采用分步相位屏的思想,基于功率谱反演法仿真涡旋光束在海洋中的传输过程,并建立入射光场发生的退化、扭曲的散斑场数据集,用数据集来训练IXception识别散斑场中涡旋光束的轨道角动量。IXception延用Xception架构思想,结合了残差结构和倒置残差结构,能够提取高度空间深度特征,减少网络结构参数的冗余,增强泛化能力。研究结果表明,IXception在20 m和80 m湍流中对扭曲光场轨道角动量的识别率达到了99.20%与97.9%。随着传输距离的增加,IXception的识别率会略有降低,但与Xception模型相比,IXception识别性能更好。 相似文献
20.
针对现有的实例分割方法PolarMask中分割结果边缘信息模糊的问题,通过对轮廓点角度偏置和距离的预测,基于轮廓点细化的单阶段实例分割网络准确提取出实例轮廓。同时,为了进一步提升实例分割的性能,利用语义分割子网络对实例边缘进行了进一步细化。实验结果表明,所提方法在大规模实例分割数据集MS COCO的测试集上的分割精度为32.5%,比现有的实例分割方法(PolarMask)提高了2.1个百分点,证明了所提方法的有效性。 相似文献