首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
为了准确识别自然成熟的香梨果实,使得采摘机能对水果目标进行精确的定位,提出了使用目标检测深度学习网络模型的方法.该模型基于Mask R-CNN,首先通过在Kaggle数据集以及网上爬取并筛选出的9 600张水果图片对Resnet网络进行初步训练,然后在预训练过的Resnet网络基础上加入掩模分支和分类分支训练自然环境下成熟香梨的数据集,最终获得准确识别香梨目标的网络模型.实验结果表明,在同等目标未添加噪声的情况下,在使用水果图片数据集预训练的基础上,图片的平均分割精度为98.02%,这与使用COCO数据集进行预训练相比(精度为93.72%),平均分割精度增加了4.30%.此外,该模型对于被遮挡水果也有着不错的识别效果,在未添加噪声的情况下,被遮挡水果的平均分割精度为95.28%,这与未被遮挡水果的分割精度相比,误差仅增加了2.74%.所以,此模型对于香梨的识别和分割具有很好的鲁棒性.  相似文献   

2.
针对目前电能质量扰动识别时特征提取不充分,造成识别精度不高的问题,引入了降噪自编码算法。降噪自编码算法起源于自动编码算法,两者都属于深度学习算法。其中,自动编码算法已经被应用于电能质量扰动识别,并取得了一定的成果。但是,自动编码算法对含噪声干扰的电能质量扰动信号的识别精度还不是很理想。本文采用降噪自编码算法,将克服这一问题。首先对无噪声的扰动信号用噪声进行"破坏",然后用带噪声信号去重构原始信号,得到扰动信号波形的固有特征,最后通过BP神经网络分类器对整个网络进行微调,得到最后用于分类的特征样本。该方法降低了传统特征提取算法对特征选取不当,造成分类识别精度不理想的风险,并在一定程度上提高了含噪声的电能质量扰动信号的识别精度。仿真结果表明,该方法在识别含噪声的电能质量扰动信号上有很大的优势。  相似文献   

3.
本文主要讨论将N-gram模型与编辑距离算法运用于印刷体维吾尔文识别后处理.由于印刷体维吾尔文识别系统的识别错误有一定规律性,所以研究中对识别错误进行了比较、分析、分类、并在编辑距离算法中加入识别错误的权值,以提高识别的正确率.最后,通过实验证明本算法能有效提高识别的正确率.  相似文献   

4.
为解决蔬菜识别领域缺少带标签样本的问题,提出了一种基于迁移学习的图像识别方法.首先,将原始数据集利用数据增强扩大样本数据量后引入到大规模数据集上的预训练模型.针对迁移过程中高层特征的领域特定性导致的网络泛化性能差,通过加入两层自适应层参数初始化后重新训练得到基本模型;对该基本模型再利用参数冻结的迁移方式进一步调优参数,得到用于蔬菜图像识别的最终网络模型.实验表明,基于CaffeNet和ResNet10两个小型网络的迁移策略可以较好地处理小样本的蔬菜图像识别,训练得到的模型准确率分别为94.97%、96.69%.与其他迁移算法及传统的神经网络方法相比,该算法具有更高的识别性以及更强的鲁棒性.  相似文献   

5.
声调集成是汉语语音识别的一个重要任务.在语音识别的二次解码过程中,使用区分性训练的权重因子进行声调模型集成已被证明是一个有效的方法,而且使用上下文相关的得分加权进行模型组合也得到了应用.上下文相关模型组合方法的一个不足是将会带来大量的训练参数,从而导致权重训练受到过拟合的影响.针对该问题,提出利用声学决策树对上下文相关...  相似文献   

6.
针对口语对话系统领域分类任务中传统领域分类方法如SVM需要进行大量人工标注的问题,将LDA(Latent Dirichlet Allocation)模型应用于口语对话系统领域分类;针对口语对话内容少、长度短、数据稀疏等问题,在LDA模型基础上提出了基于词嵌入文本扩充的口语对话系统领域分类方法.该方法主要特点是:1)使用词嵌入方法word2vec对类似于短文本的语音识别后的口语对话文本进行语义扩充,将短文本转化为长文本,使主题模型LDA更加有效地估计口语对话文本的隐含主题;2)采用无监督的概率生成模型LDA对扩充后的口语对话文本进行建模以及领域分类,从而降低人工标注成本.实验结果表明,与直接使用LDA模型进行口语对话系统领域分类方法对比,适当扩充长度的word2vec文本扩充方法在口语对话系统领域分类中的平均准确率、平均召回率和平均F1值分别提高了26.1%、25.5%、27.2%,且该方法具有一定的鲁棒性..  相似文献   

7.
在发音错误检错系统中,将传统语音识别系统中的最大似然估计准则和最小音素错误准则应用于声学模型训练通常不能获得F1值指标意义下的最佳性能.本文在对最大似然准则以及最小音素错误准则参数更新公式进行分析的基础上,提出了最大化F1值函数的区分性训练准则,并利用构造弱意义辅助函数的方法对声学模型参数进行优化.通过比较,发现最大化F1值函数的区分性训练准则能够有效地增大训练和测试数据检错的F1值,同时训练数据和测试数据上的精确度、召回率都有明显改进.  相似文献   

8.
一种稳健的可恢复双重数字水印技术   总被引:2,自引:0,他引:2  
采用自恢复技术和虚拟水印技术等新的技术方法对传统双重数字水印技术的性能进行加强和改进,有效地提高了水印技术的各项性能.文中的自恢复技术利用了双重数字水印所特有的属性,在双重水印中建立函数关系,将两个水印结合在一起,可以在水印受到攻击后对其进行恢复,这很大程度上提高了水印技术的稳健性.虚拟水印是可以在实际只嵌入一重水印的信息量的前提下,实现传统的双重水印技术,改善双重水印技术的不可见性.实验结果表明这一算法对JPEG压缩、添噪、滤波以及多种几何攻击都有很好的稳健性,自恢复实验结果则显示该算法可比同类算法的整体稳健性提高20%.  相似文献   

9.
BP神经网络技术在移动通信客户信用分析中的应用   总被引:4,自引:0,他引:4  
提出了一种移动通信客户信用预测评估的方法.该方法基于移动通信客户行为属性的统计分析,以其作为客户信用预测评估的依据,建立BP神经网络的训练和识别的模型.通过随机选择2003年8月全网数据(403206个客户)中3%作为样本进行训练,确定了网络模型参数,与已有的信用评估方法相比,该方法的泛化性能高,适用于大规模的客户信用评估,所得到的客户特征属性对移动通信客户信用研究提供了理论和实践的依据。  相似文献   

10.
针对传统DCNN(Deep Convolutional Neural Networks)模型中Softmax分类层存在的过早饱和及模型参数采用随机初始化训练时间长、识别准确率低的问题,提出一种将噪声注入Softmax并结合迁移学习的图像分类方法.首先,根据对Softmax饱和问题探究,对比注入的噪声参数选取对识别率的影响来找到最佳情况,从而产生更为宽泛的梯度并起到延迟饱和的作用;然后,利用公开预训练模型参数来代替随机初始化参数,并比较冻结不同卷积层对模型的影响;最后,在MNIST和CIFAR-10图像分类数据集上实验,证明所提方法具有良好的识别效果.  相似文献   

11.
针对新词识别过程中出现大量噪声词和伪新词的问题,提出一种基于生存法则模型的稳定新词识别方法.该方法借鉴自然法则和遗忘定律,分析候选词串在时序分布中的词频变化,通过词串在语言环境中表现的综合竞争力淘汰突发性特征的噪声词以及词义不稳定的伪新词,识别网络短文本中出现的稳定新词.该方法可以保证网络新词的新颖性和稳定性,可为舆情本体新概念的抽取提供基础支持,有助于提高舆情本体概念抽取的准确率和查全率.  相似文献   

12.
由于矿产地质信息的复杂性和不确定性,难以建立精确的数学模型来确定矿产资源的分布状况.非线性分析建模技术,如人工神经网络(Artificial Neural Network,ANN)、支持向量机(Support Vector Machine,SVM)等,给矿产预测工作提供了新的途径.这类方法在处理数据时可以避免数据分析和建模的困难,即不须理解各种成矿因子与矿床(点)之间的相互关系,只须选择已知的矿床(点)和非矿产(点),进行"黑箱"学习.虽然经过合理的训练,这类方法能够得到较高的预测精度,但由于其分类过程的非线性特性,难以获得容易理解的分类规则,提供成矿因子的知识.本文采用基于SVM的迭代特征消去(Recursive Feature Elimination,RFE)技术(SVM-RFE),即在SVM模型的训练过程中,采用RFE特征选择方法,从所有输入的成矿因子中选择出对矿床(点)能正确预测的重要因子,以提供对输入模型的成矿因子的客观评价.通过对滇东南地区金矿预测的实践表明,采用SVM-RFE技术从原始10类成矿因子中自动选择6类进行预测的精度从68.42%提高到94.74%,并且得到该区域进行矿产预测的成矿因子重要性依次是:Au异常、As异常、侵入岩、下三叠统与中三叠统之间的平行不整合面、上二叠统与三叠系的平行不整合面、断裂交汇点密度、石炭系和下二叠统间的平行不整合面、中上泥盆统和石炭系间的平行不整合面、Sb异常和Hg异常,从中选取前6类成矿因子进行SVM训练得到的预测精度最高.这一结论可为在该区域进行矿产预测的资料选取,以及对成矿因子的理解提供支持.  相似文献   

13.
一幅真实的图像中噪声特性是一致的,而由多幅图像内容拼接而成的合成图像噪声特性是不一致的.本文利用这一特点,提出了一种基于K均值奇异值分解(K-SVD)字典学习的合成图像盲检测方法.该方法首先通过K-SVD算法对合成图像进行训练得到其稀疏表示字典,然后利用学习得到的字典对背景噪声进行去除,最后根据去噪前后图像对应子块的相关系数异同实现篡改区域的检测与定位.实验结果表明,该方法对于鉴别含有不同背景噪声的合成图像具有显著效果,同时,算法对JPEG压缩、重采样和模糊等后处理操作都具有较好的鲁棒性.  相似文献   

14.
当对含噪语音进行说话人辨认时,系统的识别性能会明显变差,本文提出采用对倒谱参数非线性加权的方法,改善系统的噪声鲁棒性.通过对多种加权窗的正识率比较,发现对LPC倒谱低阶参数加权提升,对美尔倒谱高阶参数的加权提升,均提高了系统的识别性能.  相似文献   

15.
根据表情与人脸表情特征关系,提出采用隐马尔可夫模型进行人脸表情识别;又鉴于人脸图像二维特性,提出了更具健壮性、更易处理二维数据的扩展型隐马尔可夫模型.该模型相比伪二维隐马尔可夫模型,简化了复杂度.为提高模型的识别效率,根据敏感度不一,提出多重感兴趣区域替代单一的感兴趣区域.为提高表情子库内样本的聚合度及库间样本离散度,提出相应的改进方案.首先通过人脸检测,实现表情样本采集;然后采用二维离散余弦实现图像频域转化,并结合低频数据生成特征向量;最后采用扩展型隐马尔可夫模型进行表情建模,实现表情训练与识别.实验表明:采用扩展型隐马尔可夫模型可有效识别表情,尤其是优化后的设计方案.  相似文献   

16.
针对传统入侵检测方法在高维海量数据且类别分布不均衡的环境下检测性能较差的问题,提出一种流量异常检测方法SSAE-IWELM-AdaBoost,该方法基于堆叠稀疏自编码网络(stacked spare auto encoder,SSAE)并融合改进加权极限学习机(weighted extreme learning machine,WELM)。该方法首先使用堆叠稀疏自编码网络直接从原始流量数据中自动学习并提取特征,获取原始数据的低维抽象表示,然后以WELM作为集成算法(AdaBoost)的基础分类器,利用修改的训练样本权值分配规则和基分类器权值更新公式迭代训练基分类器,通过加权投票表决的方法得到最优强分类器完成网络攻击流量的识别。在UNSW-NB15数据集上进行仿真实验,实验结果表明,SSAE-IWELM-AdaBoost算法可以提高整体的检测精度以及小样本攻击的检测率,缩短分类器的训练时间,能较好地满足大规模网络环境下原始流量数据实时检测,对不均衡流量数据识别也具有较好的表现。  相似文献   

17.
文本情绪原因识别是情感分析中一个新的研究方向,旨在从文本中自动检测出导致某一情绪产生的原因。针对循环神经网络在长文中出现的长期依赖问题,本文提出了一种基于注意力机制和双向长短时记忆(attention model and bi-directional long short-term memory,AM-BiLSTM)神经网络模型的情绪原因识别方法。该方法采用字符向量表示文本语义信息,使用BiLSTM模型提取文本特征,该过程结合了人工提取的子句特征,在训练模型时,引入了注意力机制来优化模型性能,使用softmax对子句进行分类。实验结果表明本文方法对情绪原因的识别是有效的。  相似文献   

18.
手写体数字识别是模式识别的重要问题,反向传播模型(Back—Propagation)是一种性能较好的人工神经网络模型。本文采用与联想相结合的BP模型,对BP模型加以改进,并引入选举判决算法,既节省了训练时间,又提高了系统性能和识别率,并在ST—286H上用Turbo C2.0初步建立起一个带神经网  相似文献   

19.
针对传统中值滤波算法降噪性能不佳以及易造成图像细节模糊的问题,提出了一种自适应模糊中值滤波算法。 滤波过程分为噪声检测和噪声去除2个阶段。噪声检测阶段:采用极值法检测噪声,将图像的像素点分为两类,即疑似噪声点和信号点。 通过疑似像素点和与其相邻的已处理的像素点的平均绝对灰度差值定义模糊隶属度函数,利用该函数对疑似噪声点是否为噪声进行模糊分类。 噪声去除阶段:信号点保持原值输出,对于疑似噪声点的3种分类结果,采用模糊加权的中值滤波器进行统一处理。 实验结果表明,较于多种传统滤波方法,该算法能更有效地去除椒盐噪声,保护图像细节。  相似文献   

20.
针对传统中值滤波算法降噪性能不佳以及易造成图像细节模糊的问题,提出了一种自适应模糊中值滤波算法。 滤波过程分为噪声检测和噪声去除2个阶段。噪声检测阶段:采用极值法检测噪声,将图像的像素点分为两类,即疑似噪声点和信号点。 通过疑似像素点和与其相邻的已处理的像素点的平均绝对灰度差值定义模糊隶属度函数,利用该函数对疑似噪声点是否为噪声进行模糊分类。 噪声去除阶段:信号点保持原值输出,对于疑似噪声点的3种分类结果,采用模糊加权的中值滤波器进行统一处理。 实验结果表明,较于多种传统滤波方法,该算法能更有效地去除椒盐噪声,保护图像细节。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号