首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 912 毫秒
1.
针对传统恶意软件采用图像分类方法准确率不高、抗混淆能力弱、模型训练收敛慢的缺点,本文对恶意软件图像表示方法进行改进,将恶意软件、字节Bigram、Lst文件转化成3种灰度图像,将3种灰度图像组合成三通道彩色图像进行分类,并将图像分类效果好的EfficientNet模型用于恶意软件图像分类.结合迁移学习领域中的微调技术将...  相似文献   

2.
支持向量机在小样本识别中的应用   总被引:18,自引:0,他引:18  
针对癌症细胞诊断过程中样本采集困难,数目偏少的实际情况,在癌症的早期诊断中引入了一种新的模式识别方法——支持向量机.该方法基于统计学习理论的原理,较好地解决了小样本的学习分类问题,通过对具有不同性状的癌前增生细胞进行分类识别验证,支持向量机取得了较传统分类方法更好的识别效果。  相似文献   

3.
基于同一家族恶意软件在行为上的相似性特征,提出了一种基于行为的Android恶意软件家族聚类方法.该方法构建了软件行为刻画特征集合,通过定制ROM的方式来构建行为捕获机制并采集恶意软件的行为日志,基于行为日志提炼恶意软件特征集,使用DBSCAN(density-based spatial clustering of applications with noise)聚类算法进行家族聚类.通过对大量已经人工分类的恶意软件进行评估,实验结果表明,在最优情况下,本方法在聚类准确率上达到了91.3%,在测试样本识别预测上正确率达到了82.3%.  相似文献   

4.
随着攻击检测及缓解等安全防护能力的增强,高结构化的文件(如PDF、HTML等)成为当前漏洞利用的主要目标。由于高结构化的文件具有结构复杂、格式多样、自定义规则灵活等特点,恶意样本的模式与规则难以抽取,导致传统基于模式和规则的检测方法难以应对高结构化恶意样本的检测问题。边界值填充、恶意代码嵌入等操作使得恶意样本字节流分布有所改变,依据样本字节流分布差异,本文提出了一种基于深度学习的高结构化恶意样本的检测方法(JLMethod)。该方法使用卷积神经网络对样本文件的字节流特征进行分类,能有效检测出恶意样本。在文档型PDF文件实验中以4. 1‰的漏报率、99. 59%准确率和在非文档型HTML恶意样本(WebShell)检测实验中以8. 5‰的漏报率、98. 89%准确率,验证了本文方法在高结构化恶意样本检测方面的可行性。  相似文献   

5.
Random Forest作为一种常见的机器学习算法,不仅具备较高的分类回归性能,而且快速高效.传统的Random Forest算法并未在决策树的生成和选择上做深入研究,在本文中笔者提出一种降序去冗的寻优方式对机器学习中监督学习算法Random Forest进行改进,在保证准确率的同时减少随机森林的冗余度,并应用于Android系统的恶意软件检测.经过五折交叉验证法验证,改进的Random Forest算法能够在较低的冗余度下保证较高的准确率,同时改进的算法准确率在与同条件下的原算法的准确率以及OOB模型下的准确率相差在1%以内,在与单模型分类算法KNN和集成式学习算法Adaboost M1的对比试验中改进的Random Forest算法要优于以上两者.  相似文献   

6.
基于SVM土壤重金属污染评价的训练数据集构建   总被引:1,自引:0,他引:1  
支持向量机(support vector machine,SVM)用于土壤重金属污染评价时,其训练数据集的构建对模型准确性影响重大。本文对依据土壤环境质量国家标准生成数据集的方法(国标法)进行改进,提出实际测量数据集生成方法(实测法),并在实测法样本中添加国标法样本扩大训练数据集,进一步提高模型分类准确率。结果表明:对同一组实测样本进行分类,国标法模型准确率(53. 33%)低于实测法模型准确率(75. 56%);扩大后的数据集训练所得模型与实测法模型相比,分类60个实测样本时,准确率由88. 33%提高至98. 33%,分类45个实测样本时,准确率由75. 56%提高至82. 22%。  相似文献   

7.
任何可执行文件都必须满足一定的结构特征.本文以Windows平台下的PE文件为研究对象,从PE头、节头、节代码出发,给出了17个结构特征;针对给定正常软件和各类恶意软件,获得了这些属性取值分布特征;采用多类数据挖掘分类技术获得了正常软件与恶意软件的判定规则.实验结果表明,C5.0的分类算法检测准确性最好,达到94.16%.这些规则可以为软件可信性度量提供依据.  相似文献   

8.
针对传统DCNN(Deep Convolutional Neural Networks)模型中Softmax分类层存在的过早饱和及模型参数采用随机初始化训练时间长、识别准确率低的问题,提出一种将噪声注入Softmax并结合迁移学习的图像分类方法.首先,根据对Softmax饱和问题探究,对比注入的噪声参数选取对识别率的影响来找到最佳情况,从而产生更为宽泛的梯度并起到延迟饱和的作用;然后,利用公开预训练模型参数来代替随机初始化参数,并比较冻结不同卷积层对模型的影响;最后,在MNIST和CIFAR-10图像分类数据集上实验,证明所提方法具有良好的识别效果.  相似文献   

9.
提出了一种在低能电子衍射( L EED)结构分析中自动搜寻最佳模型的优化方法——遗传算法和张量 L EED相结合的联合方法. 这种新方法的特点是能在全部参数变化范围内自动搜寻,避免了陷入“局域”优化模型的困难中. 本文给出了这一方法的应用实例 ,并且展望了这种方法在表面结构研究中的应用前景.  相似文献   

10.
支持向量机方法(SVM)是基于统计学理论的一种较为新颖的学习方法,应用该方法解决小样本条件下的非线性问题既有坚实的理论基础,也十分有效.基于2013~2014年金华站的地面自动站资料、探空气象资料以及大气污染物浓度数据,采用SVM分类方法建立2个金华SVM霾识别预报模型,即初始模型和订正模型,并对其8种核函数最优模型进行对比试验.结果表明:(1)初始模型的正样本分类Ts评分在0.45以上,均高于订正模型,故初始模型分类结果较为理想,可以给实际霾日识别预报提供参考;(2)初始模型的分类结果优于订正模型,且前者的漏报次数明显少于后者,究其原因可以发现14:00气象条件和大气污染物条件对当日是否为霾日的判断非常重要,即14:00前后是灰霾出现比较频繁的时段.  相似文献   

11.
优化算法确定土壤水分特征曲线的分析   总被引:2,自引:0,他引:2  
通过探讨直接法测定土壤水分曲线的诸多不便,引入Van-Genuchten(1980)模型,对其进行对数简化,以沙性土壤为样本,通过对Van-Genuchten模型中的参数n、β进行线性回归分析,确定出了土壤性质的关键性参数,并把计算与实测的土壤水分特征曲线进行了对比.结果表明,该模型的计算值与实测值吻合的非常好,说明通过优化法确定非饱和土壤水分特征曲线是可行的.  相似文献   

12.
通过对数变换给出了求两参数Birnbaum-Saunders(BS)疲劳寿命分布BS(α,β)在全样本场合下参数的对数矩估计,并通过大量Monte-Carlo模拟比较了各种点估计方法的精度.基于对数变换通过一阶泰勒展开,将两参数BS疲劳寿命分布BS(α,β)近似看作两参数对数正态分布,由此得到了2个参数α,β的近似区间估计,通过Monte-Carlo模拟发现,所给出的近似方法比原有方法更精确.最后通过若干实例说明了方法的可行性.  相似文献   

13.
为解决蔬菜识别领域缺少带标签样本的问题,提出了一种基于迁移学习的图像识别方法.首先,将原始数据集利用数据增强扩大样本数据量后引入到大规模数据集上的预训练模型.针对迁移过程中高层特征的领域特定性导致的网络泛化性能差,通过加入两层自适应层参数初始化后重新训练得到基本模型;对该基本模型再利用参数冻结的迁移方式进一步调优参数,得到用于蔬菜图像识别的最终网络模型.实验表明,基于CaffeNet和ResNet10两个小型网络的迁移策略可以较好地处理小样本的蔬菜图像识别,训练得到的模型准确率分别为94.97%、96.69%.与其他迁移算法及传统的神经网络方法相比,该算法具有更高的识别性以及更强的鲁棒性.  相似文献   

14.
为了有效地结合标签信息与非负矩阵分解技术,提升现有的非负矩阵分解算法划分数据的性能,提出一种用于分类问题的基于二阶段迭代的非负矩阵分解模型(2-stage iterative nonnegative matrix factorization model,2-STGINMF),在阶段1,基于训练样本之间的关系和标签信息,用非负矩阵分解技术学习训练样本的置信度分布矩阵。在阶段2,根据训练样本的置信度分布矩阵,基于训练样本和测试样本之间的关系以及测试样本内部的关系,学习测试样本关于不同类别的置信度分布矩阵。此外,提出了一种迭代式训练机制解决标签稀疏性的问题。实验结果表明,与当前的一些机器学习方法和矩阵分解方法相比,本文提出的2-STGINMF模型在不同类型的数据分类问题上都达到了最优的性能且在训练样本较少时也能获得较好的分类结果。  相似文献   

15.
针对传统深度学习模型在预测空气质量指数(air quality index,AQI)时,难以从时间角度建模、网络超参数选取困难等问题,提出一种基于长短期记忆(long short-term memory,LSTM)网络和烟花算法(fireworks algorithm,FWA)的AQI预测模型LSTM-FWA。首先,以武汉市历史空气质量和气象监测数据为研究对象,利用LSTM网络中隐含层节点之间相互连接的结构特点,对空气质量的时间变化特征进行建模;接下来,考虑到种群多样性和并发性,将烟花算法应用到超参数组合优化问题中;最后,对模型输入分别进行时间、空间、时空角度的优化,实验结果表明基于时空优化的LSTM-FWA模型预测性能提升最为明显。将LSTM-FWA与其他预测模型进行比较,并全面分析不同模型在各种优化策略下的性能。实验结果显示,本文提出的时空优化LSTM-FWA模型对于AQI预测具有最优的性能。  相似文献   

16.
提出一种针对多样本的在线支持向量回归(SVR)算法,以解决目前SVR在线训练算法每次只能处理1个样本的问题.算法以拉格朗日乘数法和库恩一塔克(KKT)条件为基础,逐步改变样本的系数,并在每次迭代中保持原来的样本满足KKT奈件,最终使所有训练样本满足KKT条件.实验表明,该方法可有效更新SVR模型,且计算效率相比于基于单样本的在线回归算法有较大的优势.  相似文献   

17.
针对支持向量机解决多分类问题时二分类向多分类扩展过程中的效率降低和数据集倾斜问题,提出了一种基于三元矩阵和层次分析的多分类模型的构造方法,优化支持向量机的多分类效果和效率,弥补1vs1、ECOC等主流算法的不足。该模型通过建立一种简单有效的获取样本集线性可分性构造分类器,从而减少支持向量机在处理多分类时的运算复杂程度。采用了UCI标准数据库中的Iris,Breast Tissue和Statlog等数据集对模型进行训练测试,测试结果表明所提出模型是有效的,尤其在大量数据下多分类的有效性。 更多还原  相似文献   

18.
针对持续恶化的Android安全形势,从恶意软件检测的角度,首先总结了Android恶意软件在安装、触发和恶意负载方面的特征和发展趋势;以此为基础,结合Android平台特性和移动智能终端环境限制,系统化论述了现有Android恶意软件分析与判定技术,指出了权限分析、动态分析和静态分析的实现方法及其优缺点;介绍了基于特征值和基于启发式的恶意软件判定方法.最后,根据已有Android恶意软件检测研究的不足,提出了未来的研究方向和发展趋势.  相似文献   

19.
隐写分析盲检测存在着检测模型的检测准确性和通用性难以兼顾的问题.本文提出一种用于隐写分析的快速支持向量分类算法FC-SS2LM(fast classification for small sphere with two large margins),通过构造最小超球体和双边最大间隔隐写分析模型,使检测模型既能准确构造分类边界又能考虑不同隐写样本的分布特点,达到了兼顾检测准确性和通用性的目的.在BOSSBase标准图像库上对提出的隐写分析盲检测模型进行验证,实验结果表明,该方法在一定程度上克服了传统隐写分析模型通用性差的缺点,同时提高了实际应用中训练数据样本不平衡情况下的检测准确率.即使在实际应用中训练集样本过大、支持向量较多的情况下,采用该方法计算也可以减小算法复杂度,提高泛化能力和分类速度.  相似文献   

20.
鉴于平衡样本设计在抽样调查中有广泛的应用背景, 因此利用组合设计理论, 讨论了带循环自同构的不含邻点的平衡样本设计, 建立了有向CBSEC 存在的充要条件.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号