首页 | 本学科首页   官方微博 | 高级检索  
    检索          
共有20条相似文献,以下是第1-20项 搜索用时 388 毫秒

1.  基于支持向量机的围岩定性智能分级研究  
   牛文林  李天斌  熊国斌  张广洋《力学学报》,2011年第19卷第1期
   本文将数据挖掘的新方法支持向量机应用于隧道围岩分级。支持向量机是一种基于统计学习理论的新的学习算法,比神经网络算法能更好地解决小样本问题。选用岩层厚度、岩体结构、嵌合程度、风化程度、地下水特征、节理发育程度、榔头敲击声和地应力等8个定性指标作为评判因子,用泥巴山隧道采集的实际数据作为样本对不同核函数的支持向量机进行训练,并得到评判因子与围岩级别的映射关系,从而可以对未知的围岩样本进行级别判别。判别结果表明: 采用多项式核的支持向量机对围岩级别进行判别有较高的准确率,是一种值得推广和应用的围岩智能分级方法。    

2.  稀疏交叉熵粗糙集DDRBM-DNNS高校科研能力评估  
   《数学的实践与认识》,2016年第23期
   针对高校科研水平深度学习网络训练评价中存在评价特征同质化现象,造成评估结果精度不高的问题,提出稀疏交叉熵粗糙集双向受限制深度玻尔兹曼机(DDRBM-DNNS)高校科研能力评估方法.首先,考虑采用受限制玻尔兹曼机(RBM)和稀疏交叉熵惩罚参数对深度学习网络进行改进,实现深度学习网络特征训练同质化现象的削弱;同时,针对输入数据的预处理问题,考虑基于粗糙集的前置预处理方式实现,在维持数据输入信息完整前提下,实现输入样本数据的有效归约,进而实现样本处理量的简化,有利于深度学习网络收敛过程的提速;最后,利用所提算法对高校科研水平进行评价,实验数据显示,所提评价模型具备更高的评估精度和更快运算效率.    

3.  基于BP神经网络与多分类支持向量机的水质识别与分类  
   《南昌大学学报(理科版)》,2016年第6期
   介绍BP神经网络与多分类支持向量机等分类模型的基本原理,并基于这两种方法对水质识别与分类的准确度进行实例比较研究,随机抽取了南昌市内2010—2013年水域水质的300组数据为样本,选取了pH,氨氮,Cl-,SO2-3,总硬度,硝酸盐氮为评价的主要特征。通过把训练后的模型在测试集中进行的检验对得到的模型进行评估,表明了BP神经网络和多分类支持向量机均可以较好地解决水质识别与分类过程中存在的复杂性,多变量,非线性等问题,相比较而言多分类支持向量机有较强的鲁棒性,预测结果更为精确稳定,将其应用到水质评价中具有一定的可行性。    

4.  基于可见-近红外光谱的茄子叶绿素荧光参数F_v/F_m预测方法  
   《光谱学与光谱分析》,2020年第9期
   叶绿素荧光参数F_v/F_m是探究逆境胁迫对植物光合作用影响的重要指标,已有研究表明植被指数与F_v/F_m线性相关,但直接将植被指数与F_v/F_m拟合存在精度不足的问题。为实现对该参数的准确预测,本文以茄子为研究对象,提出一种基于可见-近红外光谱的F_v/F_m预测方法。试验获取不同生长状态茄子叶片的可见-近红外光谱数据和荧光参数,使用蒙特卡洛采样法(MCS)去除明显异常样本,采取3种光谱预处理方法及5种特征波长选择算法进行光谱数据处理,并建立偏最小二乘回归(PLSR)模型进行方法评估。基于提取出的最优特征波长组合,分析误差反传(BP)神经网络、径向基函数(RBF)神经网络、极限学习机(ELM)及回归型支持向量机(SVR)共4种机器学习算法对F_v/F_m预测模型精度的影响,从而确定基于最优方法组合的叶绿素荧光参数F_v/F_m预测方法。结果表明:茄子叶片光谱反射率随F_v/F_m的增加呈明显下降趋势,表明利用光谱信息反演F_v/F_m的可行性。基于393组试验样本,使用多元散射校正(MSC)、标准正态变量变换(SNV)进行光谱预处理,以竞争性自适应重加权采样法结合连续投影法(CARS+SPA)进行特征波长筛选的效果最优。其中, MSC-CARS-SPA-PLSR和SNV-CARS-SPA-PLSR的测试集决定系数分别为0.896 1和0.881 2,均方根误差为0.011 8和0.012 6,两者精度皆高于全光谱数据对应的PLSR模型;同时,两方法提出的特征波长个数均为12个,仅占全光谱波长个数(1 358)的0.88%。该结果表明以上两种方法有效提取出了对模型预测有利的少量波长。基于上述波长建立机器学习模型,发现SVR建模效果最优。以SNV-CARS-SPA-SVR的预测精度最高,其测试集决定系数为0.911 7,均方根误差为0.010 8。综上, SNV-CARS-SPA-SVR建模方法提高了模型精度,有效降低了模型复杂度,为基于可见-近红外光谱的F_v/F_m准确预测提供了实现方法。该方法可应用于作物生长状态的快速、无损检测,为农情预警提供有效手段。    

5.  基于高维拉曼光谱数据的变压器油纸绝缘老化评估方法研究  
   《光谱学与光谱分析》,2021年第5期
   采用激光拉曼光谱技术对变压器油纸绝缘老化状态检测是一种有效的方法。随着样本量的扩充,亟待处理的数据集维度逐渐增大,研究适用于高维拉曼光谱数据的变压器油纸绝缘老化评估方法具有重要的意义。设计与现场变压器内部绝缘结构相似的油纸绝缘环境,进行加速热老化实验并定期采样,获取到10类老化程度依次递增的油样本,采用激光拉曼光谱技术对样本进行检测。选用复合稀疏导数建模法对样本原始拉曼光谱数据预处理,可以一步完成去噪与基线校正;引入差异特征选取方法筛选不同老化程度下光谱中变化显著的特征,计算同一拉曼频移下不同老化程度的特征点数据集方差,选择差异较大的数据序列所对应的拉曼特征变量,设定方差阈值为0.5进行特征选择,每个样本都从1 023个光谱特征点抽取出304个特征点进行后续分析;针对变压器油纸绝缘老化拉曼光谱高维样本数据集,引入多种不同类型的算法对其处理。分别运用K-means聚类算法、Fisher算法与随机森林算法对获取到的样本预处理后的数据建立模型,引入评估准确度、提升度以及Kappa系数对各算法建立的模型判别效果进行评估。结果表明:有监督学习的Fisher算法与随机森林算法效果较好,相对于无监督学习的K-means聚类算法,模型判别能力分别提升了1.166 6和1.95,论证了有监督学习模型在变压器油纸绝缘老化的评估中具有判别优势;从模型判别准确度和Kappa系数来看,强分类器随机森林算法建立的判别模型均高于Fisher判别模型,其准确度提升了10%,且Kappa系数上升了0.111 5,论证了随机森林算法作为由多个单一分类器组成的强分类器,相对单一分类器来说,在变压器油纸绝缘老化的评估中模型的泛化能力较好,且模型较为稳定可靠。通过对三种不同类型的算法对比,确定了在变压器油纸绝缘老化评估中,有监督学习强分类器随机森林算法的判别优势,为变压器油纸绝缘老化的有效评估打下了基础。    

6.  基于数据挖掘的本体构建与重构技术研究  
   段妍羽  巩青歌  彭圳生《应用声学》,2017年第25卷第8期
   针对目前本体构建与重构过程中数据处理效率低的问题,运用支持向量机分类及K-均值聚类的方法对本体构建数据进行处理,从文本数据中抽取关注的特定的信息,运用基于二叉树的多分类支持向量机以及支持向量机与K-均值融合的多样本聚类,总结基于分类与聚类的本体构建过程,并以离散型和连续型两种数据样本验证了方法的可行性。实验结果表明,基于数据挖掘的本体构建与重构技术具有良好的应用效果。    

7.  基于有序分割的支持向量机多分类方法  
   单斌  秦永元  杨颖涛  王蓉  唐大林《应用声学》,2014年第22卷第11期
   针对模拟电路多故障分类中存在拒识区域,分类效果不理想的问题,提出基于有序分割最佳偏二叉树结构的模拟电路故障诊断方法;首先分析多分类中分割次序对结果的影响,通过样本类中心欧式距离对故障分割进行排序,以此构造偏二叉树结构;然后对采样数据进行主成份分析降维压缩,最后采用支持向量机作为分类器,对故障数据进行分类;该方法可以使样本类间距离最大,提高了支持向量机模拟电路故障分类的效率和准确度;故障诊断结果表明文章提出的诊断方法在精度提高的情况下,所需训练时间和支持向量数目大大减少,更具稀疏性。    

8.  一种基于样本生成的人脸识别方法  
   刘艳丽  朱达荣  张德祥  刘方《光学技术》,2014年第40卷第4期
   人脸识别问题的特点包括样本的特征维数高和每个类别所包含的样本较少。设计有效的特征提取方法是解决人脸识别问题的关键要素之一。提出了在采用降采样获得特征的同时利用新的降采样方法多次对原图片进行降采样,生成多幅训练样本,进而缓解人脸识别中的小样本问题。实验结果证明所提出的方法能有效地提高分类器的精度。    

9.  基于互信息的含水岩石近红外光谱特征选择  
   《光谱学与光谱分析》,2021年第7期
   传统的相关分析方法无法准确刻画含水岩石的近红外光谱与其含水量之间的非线性关系。针对这个问题,首先进行了莫高窟崖壁砾岩水分运移的室内试验,分别采集了砾岩样品3个不同位置从初始干燥状态到饱和状态的全过程,共计51条近红外光谱信息;然后采用多点平滑与基线校正相结合(NPS+B-corr)的方法对原始近红外光谱进行预处理,根据强吸收谱段1 450和1 950 nm处的光谱曲线特征提取峰高,半高宽,峰面积,左肩宽度,右肩宽度,左右肩比共6个初始特征变量建立初始特征集,同时对所提取的光谱特征变量进行归一化处理,根据处理之后的结果绘制各光谱特征参数与含水量变化的曲线,确定含水量级别;接着,进行初始特征集各光谱特征变量间相关性筛选,以便去掉冗余特征,将初始特征集简化为,即由峰高(Height),左肩宽度(LHW),右肩宽度(RHW)三个特征变量构成特征集;最后利用互信息作为相关程度的度量标准,分别采用BIF(best individual feature)法和MIC(maximal information coefficient)法,研究了光谱特征变量与含水量级别之间依赖关系的强弱程度,结果表明:(1)砾岩的近红外光谱在波长1 450和1 930 nm附近有明显的吸收峰,且吸收峰随着含水量的变化表现出较强的关联变化,说明岩石近红外光谱反射率与岩石含水量有着明显的相关性;(2)初选光谱特征变量与岩石含水量的动态规律曲线呈S形,含水量可划分为干燥、吸水、饱和状态三个级别;(3)两种信息法选取的近红外光谱特征不完全一致,基于BIF法,波长1 450 nm处特征变量与岩石含水量级别之间的相关性从高到低排序为右肩宽度,峰高,左肩宽度;1 900 nm处为峰高,右肩宽度,左肩宽度。基于MIC法,1 450和1 900 nm处的特征变量与岩石含水量级别之间的相关性从高到低排序均为左肩宽度,峰高,右肩宽度。(4)利用决策树评估MIC和BIF法的有效性,MIC法比BIF法对含水量级别的识别精度更高。    

10.  中小企业税务稽查投影寻踪建模与实证分析  
   楼文高  楼际通  宋雷娟  王浪庆《经济数学》,2015年第4期
   从上海市某区386家中小企业申报的15项税收指标数据中筛选出对判定企业纳税情况具有重要影响的10个评价指标,并将全部386个样本分成性质相似的建模样本和测试样本(其中测试样本个数占45%),建立了基于投影寻踪分类(PPC)技术的税务稽查评价模型.与多元线性回归(MLR)、判别分析(MDA)、Logistic和支持向量机(SVM)模型相比,PPC模型的识别错误率最低,建模样本和测试样本的平均分类错误率低于6%,改进型PPC模型包含的评价指标少,两类错误率很接近,非常适用于实际企业的税务稽查评估研究和实践.对339家待判断企业纳税情况的判定结果研究表明,建立的改进型PPC模型具有很好的泛化能力和鲁棒性.    

11.  基于卷积神经网络的恒星光谱自动分类方法  
   石超君  邱波  周亚同  段福庆《光谱学与光谱分析》,2019年第4期
   恒星光谱自动分类是研究恒星光谱的基础内容,快速、准确自动识别、分类恒星光谱可提高搜寻特殊天体速度,对天文学研究有重大意义。目前我国大型巡天项目LAMOST每年发布数百万条光谱数据,对海量恒星光谱进行快速、准确自动识别与分类研究已成为天文学大数据分析与处理领域的研究热点之一。针对恒星光谱自动分类问题,提出一种基于卷积神经网络(CNN)的K和F型恒星光谱分类方法,并与支持向量机(SVM)、误差反向传播算法(BP)对比,采用交叉验证方法验证分类器性能。与传统方法相比CNN具有权值共享,减少模型学习参数;可直接对训练数据自动进行特征提取等优点。实验采用Tensorflow深度学习框架, Python3.5编程环境。K和F恒星光谱数据集采用国家天文台提供的LAMOST DR3数据。截取每条光谱波长范围为3 500~7 500#x00C5;部分,对光谱均匀采样生成数据集样本,采用min-max归一化方法对数据集样本进行归一化处理。CNN结构包括:输入层,卷积层C1,池化层S1,卷积层C2,池化层S2,卷积层C3,池化层S3,全连接层,输出层。输入层为一批K和F型恒星光谱相同的3 700个波长点处流量值。C1层设有10个大小为1×3步长为1的卷积核。S1层采用最大池化方法,采样窗口大小为1×2,无重叠采样,生成10张特征图,与C1层特征图数量相同,大小为C1层特征图的二分之一。C2层设有20个大小为1×2步长为1的卷积核,输出20张特征图。S2层对C2层20张特征图下采样输出20张特征图。C3层设有30个大小为1×3步长为1的卷积核,输出30张特征图。S3层对C3层30张特征图下采样输出30张特征图。全连接层神经元个数设置为50,每个神经元都与S3层的所有神经元连接。输出层神经元个数设置为2,输出分类结果。卷积层激活函数采用ReLU函数,输出层激活函数采用softmax函数。对比算法SVM类型为C-SVC,核函数采用径向基函数, BP算法设有3个隐藏层,每个隐藏层设有20, 40和20个神经元。数据集分为训练数据和测试数据,将训练数据的40%, 60%, 80%和100%作为5个训练集,测试数据作为测试集。分别将5个训练集放入模型中训练,共迭代8 000次,每次训练好的模型用测试集进行验证。对比实验采用100%的训练数据作为训练集,测试数据作为测试集。采用精确率、召回率、 F-score、准确率四个评价指标评价模型性能,对实验结果进行详细分析。分析结果表明CNN算法可对K和F型恒星光谱快速自动分类和筛选,训练集数据量越大,模型泛化能力越强,分类准确率越高。对比实验结果表明采用CNN算法对K和F型恒星光谱自动分类较传统机器学习SVM和BP算法自动分类准确率更高。    

12.  基于自归一化神经网络的脉冲星候选体选择  
   《物理学报》,2020年第6期
   脉冲星候选体选择是脉冲星搜寻任务中的重要步骤.为了提高脉冲星候选体选择的准确率,提出了一种基于自归一化神经网络的候选体选择方法.该方法采用自归一化神经网络、遗传算法、合成少数类过采样这三种技术提升对脉冲星候选体的筛选能力.利用自归一化神经网络的自归一化性质克服了深层神经网络训练中梯度消失和爆炸的问题,大大加快了训练速度.为了消除样本数据的冗余性,利用遗传算法对脉冲星候选体的样本特征进行选择,得到了最优特征子集.针对数据中真实脉冲星样本数极少带来的严重类不平衡性,采用合成少数类过采样技术生成脉冲星候选体样本,降低了类不平衡率.以分类精度为评价指标,在3个脉冲星候选体数据集上的实验结果表明,本文提出的方法能有效提升脉冲星候选体选择的性能.    

13.  基于改进支持向量机的水声目标-杂波不平衡分类研究  
   关鑫  李然威  胡鹏  冯金鹿  何荣钦《应用声学》,2021年第40卷第5期
   针对水声目标-杂波数据集在有限样本下的类不平衡特性,导致代价敏感支持向量机难以逼近贝叶斯最优决策的问题,本文提出了一种基于能量统计(Energy statistics)方法的支持向量机(En-SVM)。该算法通过度量原始数据空间与有限样本空间特征函数之间的加权平方距离,量化少数类样本不完全采样过程中的信息损失,来补偿再生核希尔伯特空间中机器学习算法所需的少数类分类信息,增加少数类样本对决策的影响力。实验结果表明,En-SVM能够在保持高检测概率的同时获得较低虚警概率,即通过分类可以排除大量的杂波,性能优于标准支持向量机和代价敏感支持向量机,能够有效处理水声不平衡数据的分类问题,实现主动声呐信号处理中的杂波抑制。    

14.  基于高光谱成像的牧草粗蛋白含量检测研究  
   高睿  李泽东  马铮  孔庆明  Muhammad Rizwan  苏中滨《光谱学与光谱分析》,2019年第10期
   粗蛋白(CP)是评价牧草营养价值和品质参数的关键指标。快速、准确地对牧草中粗蛋白含量进行评估在畜牧业生产研究中具有重要意义。为确定牧草粗蛋白含量的高光谱特征波段及最优检测模型,研究分别于2017年5月至9月间在黑龙江省杜尔伯特自治区的人工牧草场(羊草)内每月随机选取35个样本, 5个月共采集175个样本。采样时在样本点处放置1 m×1 m的样方,将样方内所有牧草全部齐地面收割采集后称重并冷藏保存。将样本带回实验室后,立即进行牧草叶片高光谱图像采集,同时采用凯氏定氮法对采集的牧草样本进行粗蛋白化学值测定,以此建立牧草粗蛋白含量高光谱数据集。研究首先通过Savitzky-Golay卷积平滑(SG)、多元散射校正(MSC)、变量标准化(SNV)、一阶导数(1-Der)和直接正交信号校正(DOSC)方法5种预处理方法对高光谱数据进行处理后分别建立偏最小二乘回归(PLSR)检测模型,从中确定最优预处理方法。利用最优预处理结果,分别采用连续投影算法(SPA)和随机蛙跳算法(RF)进行牧草粗蛋白含量的特征波段选择,并利用选择结果分别进一步建立PLSR模型,以此确定适合粗蛋白含量的特征波段选择方法,确定最优高光谱检测模型。结果表明,在五种高光谱预处理方法中,基于SNV方法预处理后所建立的高光谱PLSR模型表现最优(R~2-P=0.929, RMSE-P=6.344mg·g~(-1), RPD=4.204)。利用连续投影算法筛选的粗蛋白含量特征波长为30个,分布于530~700和940~1 000 nm范围内。经随机蛙跳算法确定的粗蛋白含量特征波段为6个,分别为826.544, 827.285, 828.766, 971.012, 972.494和973.235 nm。因此,该研究中牧草粗蛋白含量最优高光谱检测模型为SNV-RF-PLSR(R~2-P=0.933, RMSE-P=6.034 mg·g~(-1), RPD=4.322),模型精度较高。该研究结果为牧草粗蛋白含量的高光谱检测提供了最优模型和理论基础,同时为指导草业生产开拓了新的技术思路。    

15.  基于EEMD和球SVM的高速列车转向架故障估计   
   翟冰  金炜东  秦娜《应用声学》,2014年第22卷第8期
   基于监测数据评估高速列车空气弹簧、抗蛇行减振器和横向减振器关键部件的运行状态,针对故障状态下车体构架横向加速度的非平稳信号,提出IMF能量矩与改进的多类超球支持向量机相结合对车体运行状态估计,改进的的超球支持向量机对球外与球内重叠区域的样本用不同的决策,具有更好的分类效果;实验数据仿真分析表明,在速度变化下列车故障识别率稳定在87%以上,证明所用方法能够提取到故障状态下的典型特征,改进的支持向量分类器并能很好的估计出高速列车的故障状态。    

16.  基于贝叶斯统计方法的两总体基因表达数据分类  被引次数:1
   孟宪花  于彬  王翼飞《应用数学与计算数学学报》,2005年第19卷第2期
   在疾病的诊断过程中,对疾病的精确分类是提高诊断准确率和疾病治愈率至 关重要的一个环节,DNA芯片技术的出现使得我们从微观的层次获得与疾病分类及诊断 密切相关的基因功能信息.但是DNA芯片技术得到的基因的表达模式数据具有多变量小 样本特点,使得分类过程极不稳定,因此我们首先筛选出表达模式发生显著性变化的基因 作为特征基因集合以减少变量个数,然后再根据此特征基因集合建立分类器对样本进行分 类.本文运用似然比检验筛选出特征基因,然后基于贝叶斯方法建立了统计分类模型,并 应用马尔科夫链蒙特卡罗(MCMC)抽样方法计算样本归类后验概率.最后我们将此模型 应用到两组真实的DNA芯片数据上,并将样本成功分类.    

17.  基于模糊分类的多维定性数据的统计分析  
   刘洪  王莉  夏立显《数理统计与管理》,2005年第24卷第3期
   在多维定性数据处理的问题中,不仅要研究变量之间的关系、样本之间的关系,还需研究样本与变量之间的关系,从而对潜在样本群子结构水平及其类型特征进行分析。本文采用对偶标度统计方法利用设计矩阵变换将原始多维定性数据进行类型特征分析,并在此基础上建立了基于模糊分类的直方图,表现出了潜在样本群的特征及其子结构之间的差异与联系。文章以分析儿童主体品质发展规律为例,说明此方法的有效性。    

18.  知识型员工工作压力与工作投入:心理资本的中介效应  
   《数学的实践与认识》,2017年第17期
   研究选取国内11家公司592名知识型员工数据为样本,运用问卷调查和多层回归分析方法对知识型员工的工作压力、工作投入与心理资本之间的关系进行研究.分析结果显示工作压力与工作投入之间呈现先增长后降低的关系,当工作压力处于中等水平时,知识型员工的工作投入最高;知识型员工工作压力通过心理资本的部分中介作用对工作投入起着积极的促进作用,同时能减弱工作压力对工作投入的影响.    

19.  利用少量样本集成吸毒人员预测模型的方法  
   王灿《数学的实践与认识》,2019年第15期
   为了从"潜在"吸毒人员中准确的锁定嫌疑个体,首先甄选样本并利用改进的特征缩放方法得到组合升维的基本样本集,然后对正样本进行过采样、负样本进行样本分片,修正了正、负样本集的不均衡性,最后利用神经网络集成预测吸毒人员的模型,由正负样本集进行训练和验证,提出了基于查准率、准确率、召回率的"三率判断法"的评估模型并进行模拟验证,给出了相关政策建议.    

20.  基于改进自助扩容算法的弹药贮存可靠度评估  
   《数学的实践与认识》,2018年第21期
   针对弹药试验数据样本量少时无法直接采用经典统计学方法的问题,介绍了弹药贮存可靠度评估的传统方法和现有自助扩容方法,并针对其不足提出了改进自助扩容算法,增加了自助样本量信息、保证了抽样样本与原始样本特征的一致性、降低了异常值的影响,并对所提算法利用Matlab软件仿真验证.结果表明,所提算法能有效进行贮存可靠度评估,具有显著优越性.该结论可用于弹药小样本数据贮存可靠度评估,为弹药贮存管理提供理论支撑.    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号