首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对传统分类器在不平衡数据集上性能降低的问题,提出一种基于FCM的簇内欠采样算法(Fuzzy C-means clustering Based Under Sampling In Clusters, FCMUSIC)。使用模糊c-均值聚类算法(Fuzzy C-Means clustering, FCM)将多数类样本划分成若干簇,在每个簇内以类别不平衡比率(imbalanced ratio, IR)的倒数作为采样倍率,得到新的多数类样本并与少数类样本合并,形成新的平衡样本集,结合KNN和Random Forest分类器进行分类。分析在5组不平衡数据集上的分类结果,当使用KNN分类器时,改进后的算法的F1值平均提高了6.65%,G-mean值平均提高了7.75%;使用Random Forest分类器时,F1值平均提高了5.31%,G-mean值平均提高了6.07%。表明FCMUSIC算法能够有效地提升传统分类器对不平衡数据集的分类性能。  相似文献   

2.
交通标志的有效分割是交通标志识别系统中的关键问题.针对禁令标志颜色特征,结合人类视觉系统的颜色感知特点,首先以颜色分量R(红)、G(绿)、B(蓝)作为输入特征量构造颜色特征粗分类器,再通过计算粗分类结果的特征量与红色特征类标准样本中心的矢量余弦,得到颜色相似度特征灰度图,用改进的Otsu方法实现标志的最终分割,最后给出了通过训练粗分类器优化分割结果的方法.实验结果表明,本文的分割方法可在不同气候条件下,有效地提高交通标志分割效率,具有较好的鲁棒性.  相似文献   

3.
为了进一步提高图像拼接篡改检测的准确率,本文通过对图像拼接技术进行分析,提出一种基于纹理描述的图像拼接篡改检测方法.该方法将局部二值模式(LBP)和共生矩阵两种现有技术相结合,在残差图像的基础上利用改进的LBP技术对图像纹理进行描述,然后借助两类共生矩阵获取不同的图像特征,通过对这些特征向量的组合来提高检测精度.提取特征后利用支持向量机(SVM)或集成分类器进行分类预测.实验结果表明,所提出的方法在IEEE IFS-TC图像取证竞赛库和中国科学院彩色图像库分别达到了0.911和0.938的最高检测准确率.  相似文献   

4.
针对传统机器学习方法对植物叶片图像分类识别率不高的问题,探讨了基于深度稀疏自编码网络(Deep Sparse Autoencoder Network,DSAN)的植物叶片分类研究。自动编码器通过编码和解码重构输入数据,对植物叶片进行分层特征学习,在自动编码器上添加稀疏限制,对隐含层神经元进行压缩,从而学习到更高层的隐含特征用于分类,解决了因选取的特征表达不足导致网络模型分类性能不佳的问题。实验采用公开的植物叶片图像数据库MalayaKew(MK)作为研究对象,该数据集包含44类植物。将预处理之后的叶片图像直接作为输入数据,通过DSAN学习到叶片的高层特征,结合Softmax分类器用于分类。实验结果表明,该算法能够有效提高植物叶片图像的分类精度,在植物分类领域具有一定的应用价值。  相似文献   

5.
传统的Haar-like特征算法在特征提取过程中仅对图像全局进行特征提取,忽略了目标敏感区域,易受非目标区域的干扰,导致识别率降低.本文对传统的Haar-like特征提取算法进行了改进,将图像分成三个区域,运用的矩形框模板分别从这三个区域中提取像素值,将其中两个区域的像素值减去两倍的另外一个区域的像素值作为特征值.采用高斯随机测量矩阵对高维度的特征值进行压缩,运用Adaboost分类器训练方法,利用构造好的分类器对压缩后形成的特征空间进行分类识别.实验结果表明,本文的方法不仅减少了分类器所需的训练时间,而且识别性能也优于Haar-like特征、颜色纹理融合等传统算法.  相似文献   

6.
7.
针对传统入侵检测方法在高维海量数据且类别分布不均衡的环境下检测性能较差的问题,提出一种流量异常检测方法SSAE-IWELM-AdaBoost,该方法基于堆叠稀疏自编码网络(stacked spare auto encoder,SSAE)并融合改进加权极限学习机(weighted extreme learning machine,WELM)。该方法首先使用堆叠稀疏自编码网络直接从原始流量数据中自动学习并提取特征,获取原始数据的低维抽象表示,然后以WELM作为集成算法(AdaBoost)的基础分类器,利用修改的训练样本权值分配规则和基分类器权值更新公式迭代训练基分类器,通过加权投票表决的方法得到最优强分类器完成网络攻击流量的识别。在UNSW-NB15数据集上进行仿真实验,实验结果表明,SSAE-IWELM-AdaBoost算法可以提高整体的检测精度以及小样本攻击的检测率,缩短分类器的训练时间,能较好地满足大规模网络环境下原始流量数据实时检测,对不均衡流量数据识别也具有较好的表现。  相似文献   

8.
制药工业的一个主要趋势是整合传统意义上被认为早期阶段药物发现的分子描述.为了更好的将药物和非药物分类,本文提出了基于深度信念网络(DBN)的分类模型.首先,对分子特征进行预处理以保证有价值的信息得到保留,其次,该模型将DBN和反向传播(BP)分类器结合去对药物/非药物进行检测和分类.DBN由几个受限玻尔兹曼机(RBM)层组成,当特征向量转移到下一层时这些RBM层尽可能多的保留具有重要的影响的信息.BP层训练的最后一个RBM层生成特征分类.结果表明,该方法是提取高层次特征的药物和非药物分类任务中一种成功的方法,分类精度高达85.3%,高于传统的支持向量机和神经网络方法.同时,预处理对分子特征的提取更为有效,从而在一定程度上提高了分类的准确性.  相似文献   

9.
提出了一种基于遗传算法与多层感知神经网络的调制识别方法,运用改进遗传算法优化的多层感知神经网络分类器对各种调制信号的特征矢量进行分类识别.利用遗传算法的高效全局特性,克服了传统BP算法易于陷入局部最优解的缺点,同时在遗传算法基础上增加梯度下降算子,加快了收敛速度,使得分类器的识别率、收敛速度和鲁棒性得到明显改善,仿真实验的结果证明了此方法的有效性和可行性.  相似文献   

10.
本文用内梅罗(Nemeron)污染指数法及综合污染指数法对水磨河的水质进行了评价,并用聚类分析法对污染因子进行了分析。  相似文献   

11.
为了从生物特征和统计角度来提高识别的性能,提出了一种基于血流图和Fisher线性鉴别(FLD)相结合的人脸识别方法,该方法首先利用血流模型把红外温谱图转换成血流图,能够利用人体的生物特征增加样本之间的类间距,并减少样本之间类内距,然后从统计特性出发,对血流图进行能最大化类  相似文献   

12.
微博作为一个拥有大量用户的社交平台,其较大的影响力与开放性吸引了攻击者的目光。攻击者会利用异常账户进行网络犯罪,对异常账户的检测是维护社交网络安全的重要途径之一。基于攻击者的常规行为以及正常用户的行为特征,提出了一种微博中被劫持账户的检测方法。该方法使用6个特征对用户行为进行分析,使用异常得分刻画用户行为的异常程度,使用传统机器学习分类器检测被劫持账户。为验证本文方法的有效性,采用了由复旦大学提供的公开微博数据集进行实验,结果表明,采用决策树分类器时,本文方法对被劫持账户的检测精确率高达97. 5%。  相似文献   

13.
针对目前电能质量混合扰动识别精度不高的问题,引入了受限玻尔兹曼机(RBM)算法。RBM是深度学习的一种新颖算法,在语音识别、机器视觉和图像恢复等领域已取得了很好的应用成果,但在电能质量复合扰动识别上尚未涉及。区别于传统算法提取特征的方式,深度网络通过提取波形的固有抽象特征,克服了人工特征选择的缺陷以及传统神经网络训练时收敛速度慢、容易限于局部最优的缺点。复合扰动信号经过深度网络自动获得特征参数,再经过分类器进行分类识别。实验验证该算法在电能质量复合扰动识别上可以达到很高的性能,优于传统的识别方法。 更多还原  相似文献   

14.
针对人工检测番茄品质效率低、主观性强等问题,设计了基于机器视觉技术的适应于番茄外部品质检测的多方法融合的图像采集及图像处理系统.首先,采用颜色直方图获取番茄的颜色特征;其次,通过边界跟踪算法得到番茄的半径序列点,经过傅里叶变换与反变换处理,计算出番茄的不规则度,从而对其形状特征进行描述,同时,将格林公式变形求得番茄形心坐标,并利用圆形度计算其最大横径,以获取番茄的大小特征;最后,用基于线性判别函数和决策树的模式分类器对番茄的大小、颜色和形状特征综合进行分级处理.实验结果表明,系统分级结果基本稳定,分级精度达到92%.  相似文献   

15.
利用自动化静态顶空-气相色谱-质谱联用技术对江西三大产烟区(赣州、抚州、吉安)共120个烤烟样品进行了检测,匹配并定量了54个挥发性化合物。采用遗传算法(GA,Genetic algorithm)选择其中18种代表性化合物,并利用主成分分析法(PCA,Principal component analysis)对这120个烤烟样品进行产地分类,发现这种模式识别(Pattern recognition)方法可将烤烟样品基本分为3类:A类主体为赣州样品(兴国、宁都除外);B类主体为抚州样品(外加兴国、宁都,宜黄、崇仁除外);C类主体为吉安样品(外加宜黄、崇仁)。随后,我们将样品按照2:1的比例分为验证集和预报集,用有监督模式识别方法径向基函数-神经网络(Radial basis function-neural network,RBF-NN)对样品产地进行预报,正确率达到92.5%。据此,我们建立了用于江西烤烟样品的产地鉴别模型,该模型可用于研究不同产地间挥发性化合物含量的分布规律,为划分不同产地烤烟香型风格提供依据,实现对烟叶的质量控制。  相似文献   

16.
基于同一家族恶意软件在行为上的相似性特征,提出了一种基于行为的Android恶意软件家族聚类方法.该方法构建了软件行为刻画特征集合,通过定制ROM的方式来构建行为捕获机制并采集恶意软件的行为日志,基于行为日志提炼恶意软件特征集,使用DBSCAN(density-based spatial clustering of applications with noise)聚类算法进行家族聚类.通过对大量已经人工分类的恶意软件进行评估,实验结果表明,在最优情况下,本方法在聚类准确率上达到了91.3%,在测试样本识别预测上正确率达到了82.3%.  相似文献   

17.
提出了一个改进Mask RCNN目标检测算法用以对养殖梭子蟹进行视觉特征测量. 通过在养殖区域采集梭子蟹图像, 用上位机识别梭子蟹旋转角度以及甲长和甲宽方向, 对输出的Mask进行模板修补, 提高模板内区域的置信度. 通过图像-实景对应关系换算梭子蟹的真实尺寸, 并估算其投影面积、甲宽与甲长, 结果准确率高于85%. 同时, 对视觉算法得到的梭子蟹尺寸特征与其体质量进行拟合, 引入k-means聚类, 实现双模型支持向量回归机(SVR)预测结构. 通过差分进化算法对SVR适应度函数进行寻优, 设计了随迭代次数、寻优效果同步变化的缩放因子, 以及适者更易生存策略的交叉概率因子, 以验证改进算法的寻优能力. 测试时, 对新传入的数据首先进行归一化处理, 然后判断所归属的聚类中心, 再传至相应的SVR模型进行预测. 测试结果相对误差小于18%.  相似文献   

18.
针对现有Web使用记录挖掘方法发现的知识和规则存在不精确或不完全的问题,提出了一种改进的基于粗糙近似的Web事务聚类算法.该算法首先对原有算法得到的每个类,用关系矩阵找出在这个类中不满足传递性的对象,然后在该对象的集合(类)上用关系矩阵找出在这个类中不满足传递性的对象,再对每个类进行分割,使其满足关系R的传递性,克服了现有算法不满足关系的传递性和在某些情况下得到的结果不准确的缺点.  相似文献   

19.
采用分子印迹技术, 以3,4-二氯苯乙酸(DCP)作为模板分子合成了MWCNTs@DMMIPs材料, 克服了脂联素(ADPN)质量浓度低, 不易形成氢键等缺点, 增强了材料的吸附能力. 实验对血类中常见的ADPN用GC-MS方法进行检测, 检测限为0.32μg?mL-1, 回收率为83.2%~101.2%. 材料适用于血类中常见的ADPN检测.  相似文献   

20.
乳腺癌是当前最常见的恶性肿瘤之一,其电子病历数据可用于挖掘隐含规律,对治疗与预后分析有重要意义。通过与乳腺科医生合作,选择合适的预测模型和可视化方法,搭建了一个基于电子病历的乳腺癌群组和治疗方案可视分析系统。首先,对具有高维属性的病人进行降维和聚类处理,形成病人群组,并采用南丁格尔图、词云和时间轴可视化方法,直观展示病人群组间特征的差异;然后,用支持向量机(support vector machine,SVM)模型预测治疗方案,用平行坐标、矩阵热力图和分类图分别展示属性相关性、训练后的特征权重和预测结果;最后,用真实案例验证了系统在群组分析、治疗方案及病人属性关联分析中的有效性,从而较好地帮助医生选择合适的治疗方案。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号