首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
快速且准确识别矿井涌水水源对于防范煤矿水灾事故有着重大的研究意义。利用激光诱导荧光(LIF)光谱融合智能分类算法进行矿井涌水水源识别打破了传统水化学方法耗时过长等不足,具有灵敏度高、响应速度快等特点;然而目前这些已使用的算法仅能依靠分类准确率定性判别不同矿井涌水水样的种类。把随机森林(RF)算法和竞争性自适应重加权(CARS)算法相结合,基于激光诱导荧光的水样荧光光谱数据建立偏最小二乘回归(PLSR)模型来预测不同矿井涌水的含量,实现水样的定量评估。首先,采集300组以老空水为基础混入不同含量砂岩水的矿井涌水样本,将采集到的水样按4∶1比例随机划分成校正集和预测集,校正集共240组用于建立回归模型,预测集共60组用于预测不同水样,搭建激光诱导荧光涌水光谱系统完成光谱数据的获取并生成荧光光谱图。然后分别通过S-G卷积平滑法和Lowess平滑法对原始荧光光谱进行去噪处理,发现处理后的荧光光谱较原始光谱更为分散,适合光谱分析,对比了两种去噪方法的预测精度,选择Lowess平滑法作为最终去噪方法。接着采用RF算法约简去噪后属性重要度较低的光谱属性,依据最优回归模型的性能选择约简出的223个属性再用于CARS算法的二次属性精简,根据CARS算法采样过程中交叉验证均方根误差值最小原则选择出的77个属性光谱数据建立PLSR模型。最后与全光谱、其他变量选择方法、不同回归模型相比, RF-CARS算法属性精简效果最好,较全光谱建模,属性由2 048个减少到77个,模型预测集判定系数R■由0.991 4增长到0.996 7,预测均方根误差RMSEP由0.029 4减少到0.018 3,预测精度得到提升,其余评估指标也相对较好。实验结果表明, RF-CARS结合激光诱导荧光光谱可快速、精准预测矿井涌水,精简出的光谱属性用来建立回归模型,为实现矿井涌水含量的实时定量评估提供了一定的理论保障。  相似文献   

2.
郝学良  朱小冬  叶飞 《应用声学》2016,24(5):184-185, 290
针对当前软件可维护性评估主观性强,可操作性弱等问题,提出了定量描述维护性的维护时间统计概率描述方法,引入隐马尔可夫链(HMC)模型对维护性状态变迁过程进行描述,以可度量的维护性内部属性影响因素集量化值为观测序列,以维护时间统计概率为状态序列,构造了反映可维护性状态转移的HMC模型。收集配置管理库中软件模块历史维护时间从而确定完成维护任务频率来估计软件维护性初始状态,利用复杂网络特性计算软件维护性影响因素集的量化值,理论上即可评估出当前软件所处的维护性状态,最后运用实例对模型进行了训练与评估。结果表明,利用模型评估出的概率与实际维护任务统计出的可维护性概率基本一致,说明该方法可行且可重复,具有一定实践意义和研究前景。  相似文献   

3.
光谱分析是化学计量学的一个重要应用方向,并已被广泛应用到各个领域,其中光谱变量选择又是光谱分析的重要环节。研究不同的变量选择方法客观地识别有用的信息变量和消除无关或干扰变量十分关键。提出了一种新的变量选择方法,命名选择比率的竞争性群体分析法(SRCMPA)。该算法采用选择比率,自适应加权采样和模型群体分析的思想,并结合了变量排列和指数递减函数方法。关键波长定义为多元线性回归模型中得分值较大的波长,将线性模型PLS下的选择比率的得分值作为评价各波长重要性的指标,然后,根据每个波长的重要性, SRCMPA依次从蒙特卡罗采样中选择N个波长子集,以迭代和竞争的方式运行。在每一次采样运行中,以固定比率的样品以建立校准的PLS模型并计算每个变量的选择比率值,基于排序选择比率的得分值和作为权重的归一化的SR(选择比率)得分值,采用指数递减函数的强制选择和自适应加权采样竞争选择的两步过程来选择关键变量。最后,应用交叉验证(CV)方法来选择具有最低交叉验证均方根(RMSECV)的子集作为最优子集。该算法已在小麦蛋白数据集和啤酒数据集上进行了测试,并使用三种高效算法作对比。通过对实验结果来评估算法优越性,该算法能够找到数据集的关键波长变量的最佳组合,并能用于解释感兴趣的化学特性,通过建模后的评价结果也是最佳的。该算法在啤酒光谱数据集的运行结果,相较于啤酒数据集的全光谱PLS模型,变量个数由567个减少到42个左右。并且模型的RMSECV由0.622下降到0.115, RMSEP由0.823减少到了0.263左右,预测精度分别提高了81.5%和68.1%。Q2_CV和Q2_test也分别由0.940, 0.852提高到了0.994和0.995。在小麦蛋白数据集的运行结果,相较于于小麦蛋白光谱数据集的全光谱PLS模型,变量个数由175个减少到18个左右。并且模型的RMSECV由0.607下降到0.292, RMSEP由0.519减少到了0.234左右,预测精度分别提高了51.9%和54.9%。Q2_CV和Q2_test也分别由0.748, 0.774提高到了0.931和0.839。  相似文献   

4.
一种多模型融合的近红外波长选择算法   总被引:2,自引:0,他引:2  
针对近红外光谱数据的特点,在分析了单模型波长选择方法的基础上,提出了一种多模型融合的变量选择方法。它融合多个模型的回归系数,以提高波长选择的准确性和稳定性。并用3个业界标准的近红外光谱数据集对提出的方法进行了验证,同时与UVE-PLS和GA-PLS算法进行了比较。实验结果表明,经该方法选择变量后,提高了模型的预测能力,降低了复杂度,达到甚至优于UVE-PLS和GA-PLS,而且具有算法简单、效率高的优点,具有广泛的实用价值。  相似文献   

5.
为了实现库尔勒香梨依据可溶性固体含量(SSC)分级定等和按质论价,推动采后处理向标准化、产业化方向健康发展,利用高光谱成像技术研究出了一种快速、有效、无损检测库尔勒香梨SSC的方法。以表面无损伤的157个库尔勒香梨作为研究样本,应用高光谱成像采集系统获取400~1 000 nm波长范围内高光谱图像并用ENVI5.3软件提取感兴趣区域(ROI),获得高光谱数据。采用Kennard-Stone(KS)样本集划分方法将全部样本按照2∶1的比例划分为校正集(105)和预测集(52)。对比标准变量变换(SNV)、多元散射校正(MSC)、一阶导数(FD)和二阶导数(SD)等数据预处理方法对建模精度的影响,最终选用SNV方法对光谱曲线进行平滑去噪。该研究提出竞争性自适应重加权算法与平均影响值算法的组合算法(CARS-MIV)选择特征波长。在竞争性自适应重加权算法(CARS)方法中,建模样本由蒙特卡罗算法随机选择生成,变量回归系数会随之发生变化,因而回归系数的绝对值不能全面反映变量重要性,从而影响模型检测精度。为降低这种影响,应用平均影响值(MIV)算法对选出的自变量进行二次筛选,筛选出相关性较大的变量用以建模分析,并与CARS、连续投影算法(SPA)、蒙特卡罗无信息变量消除算法(MCUVE)等经典特征波长选择算法进行比较。最后分别以全波长(FS)光谱信息和四种特征波长选择方法得出的光谱信息作为输入矢量,应用支持向量回归(SVR)建立库尔勒香梨可溶性固体含量定量预测数学模型,以校正集相关系数(Rc)、校正集均方根误差(RMSEC)、预测集相关系数(Rp)和预测集均方根误差(RMSEP)四个参数来评估模型的预测精度。比较分析发现,CARS-MIV-SVR模型效果最佳,校正集相关系数(Rc)为0.985 94,预测集相关系数(Rp)达到0.946 31,校正集和预测集均方根误差分别为0.185 85和0.403 33。结果证明:CARS-MIV特征波长选择方法能够有效增强库尔勒香梨光谱数据特征波长选择的稳定性和精确性,提高模型的预测精度。利用高光谱技术结合CARS-MIV-SVR模型能够满足库尔勒香梨可溶性固体含量测定需求,实现库尔勒香梨的分级定等和按质论价。  相似文献   

6.
校正样本选择以及奇异样本剔除对于近红外光谱定量和定性建模非常重要。现有的识别奇异样本的方法一般都基于数据重心估计,需要一个经验的判断阈值,在很大程度上限制了其识别准确性和实用性。针对现有方法奇异样本识别准确率低的问题,改进了一种现有度量尺度-杠杆值,构造出一种新的基于强影响度的奇异样本识别算法。这种度量尺度在一定程度上减少了对数据重心的依赖,使正常样本更加聚集,拉开了奇异样本与正常样本的距离;同时,为了避免人工根据经验设定阈值的不合理性,引入统计学领域中跳跃度的概念,提出了一种自动阈值设定方法判别奇异样本。为了验证该算法的有效性,利用马氏距离、杠杆值-光谱残差法与该算法分别对200个代表性校正集样本中的异常样品进行剔除,然后通过偏最小二乘法(PLS)对剩余的校正集样本(以烟碱为指标)定量建模,并对60个代表性测试集样本进行预测,以交互验证均方根误差(RMSECV)、相关系数(r)和预测均方根误差(RMSEP)为评价指标比较各算法的优劣。实验对比结果表明,基于强影响度的奇异样本识别算法较现有方法明显提高了奇异样本识别的准确率,具有较低的RMSECV(0.104),RMSEP(0.112)以及较高的R(0.983),提高了模型的稳定性和预测能力。  相似文献   

7.
高光谱图像具有数百个连续、狭窄的光谱带,光谱范围跨越可见光到红外光,可提供地物的精细光谱属性,对于地物材质和属性的识别分类具有重要应用价值。针对感兴趣目标选择有限的光谱波段进行传输和处理,对于提升高光谱数据处理时效性、以及设计面向特定应用的实用化光谱仪都具有重要意义。而如何结合目标特征选择最优波段成为在提升处理效率的同时保证目标识别或分类精度的必然要求。因此如何从数以百计维度的高光谱图像中选择出具有较好分类识别能力的波段子集是急需解决的问题。提出基于改进粒子群优化算法的高光谱波段选择方法,该方法区别于传统的粒子群优化算法,引入 “概率突跳特性”,并设定新解的淘汰机制,将“停滞”的新解进行淘汰,提高了算法的全局寻优性能。然后基于目标光谱特征采用了最优波段选择的优化目标函数,通过改进的粒子群优化算法求解目标函数,并将选定的波段子集反馈到支持向量机(SVM)中执行分类应用。采用两个标准的高光谱数据集(Indian Pines, Salinas)对选择出的波段子集进行分类测试,结果表明该方法相较于现有方法具有较高的分类精度,在几种方法中,传统的粒子群算法筛选出的波段效果最差;该算法筛选出的波段的分类精度最好,两个数据集的分类精度分别可以达到98.141 4%和99.084 8%。  相似文献   

8.
基于簇相似度的网络社团结构探测算法   总被引:2,自引:0,他引:2       下载免费PDF全文
袁超  柴毅 《物理学报》2012,61(21):541-549
社团结构对复杂系统的结构特性和动力学特性有重要影响.提出了一个度量社团相似度的模型,称为簇相似度.该模型能够度量两个社团的相似度大小,为研究社团间的作用机制提供帮助.而且基于该模型,设计了一个社团划分算法.算法采用层次聚类的思想,每次合并两个相似度最大的社团,并通过一个评价函数选择最优社团划分.数值实验以及与CNM,GN,EigenMod等主流算法做比较,表明本算法的精度和效率都比较高,尤其对于边密度较高的网络,性能非常理想.  相似文献   

9.
周莉  王伟华  张敬 《应用声学》2017,25(12):215-218
为了降低大数据访问对人们生活的影响,减少因数据访问带来的一系列问题,更好地保护用户的隐私,需要对匿名大数据访问进行控制。当前算法是利用Purpose建立匿名大数据访问模型,在原来的K-匿名算法基础上为Purpose匿名数据访问模型构建算法,该算法对公开信息隐私安全涉及较少,对分布式数据隐私的安全保障效果不理想。为此,提出一种基于数值分析的匿名大数据访问最优控制算法。该算法利用MapReduce编程框架对匿名大数据用户的公钥和私钥进行初始化,将计算代理权授权,用户把需要保存的数据以及授权传送给第三方,也就是代理方签名,实现匿名大数据的审计。根据属性群对匿名大数据访问进行控制,系统管理员构建一棵二叉树,通过对称加密算法与属性群路径密钥,加密的群密钥,产生报头消息,根据上述所获结果,管理员对属性群密钥进行生成、更新和分发。实验结果证明,所提算法计算开销、存储开销以及通信开销较低,匿名大数据访问控制的效率高,具有较强的可实践性,为该领域的研究发展提供了支撑。  相似文献   

10.
DS算法在近红外光谱多元校正模型传递中的应用   总被引:7,自引:1,他引:6  
模型传递问题是近红外光谱分析技术中一个关键的共性基础技术问题。模型传递通过在同一型号的两台仪器之间寻求一种变换关系,使得在一台仪器上建立起的模型能够应用于另外一台仪器样品光谱响应的预测。文章将直接校正(direct standardization,DS)算法应用于化学计量学多元校正中的模型传递,并研究了模型转换集样品的选择方法。在两台AOTF近红外光谱仪上进行了模型传递实验,首先采用Kennard/Stone算法选择转换集样品,然后采用DS方法进行模型传递。实验结果表明采用DS算法取得了较好的模型传递效果。DS算法不仅可以应用于不同仪器之间的光谱分析模型传递,而且该方法对于同一仪器的长时间漂移或者由于部件的更换、测量环境的改变等引入的光谱差异校正也是适用的。  相似文献   

11.
大豆品种快速准确的鉴别,对于鉴定种子品质、净化种业市场以及保障粮食安全具有重要意义。为解决传统农作物品种鉴别方法中存在精度差和效率低等问题,采用拉曼光谱结合特征波长提取方法建立偏最小二乘(PLS)鉴别模型,对黑龙江省4个高蛋白大豆品种(黑农88、黑农98、绥农71以及绥农76)进行快速鉴别。随机蛙跳(RF)算法是一种通过迭代计算变量被选概率,以确定变量重要性的新型特征波长选择算法,可以有效剔除全光谱数据中的冗余信息。该方法存在初始变量集随机性、所需迭代次数大、阈值选取不确定的问题,因此提出一种基于最小绝对收敛与选择算子(LASSO)回归的改进随机蛙跳(MRF)算法。采用LASSO算法提取与属性变量最相关的特征波长点作为RF初始变量集F0,消除初始变量的随机性,在此基础上开始迭代计算,可以减少无用迭代次数,提高模型的预测精确度。RF算法通过设定阈值的方法选择变量,因此提取的特征波长往往具有不确定性。改进如下:首先去除被选概率为0的变量,对于排序后变量以10个波长点为间隔,每次增加1个间隔建立特征波长与大豆品种属性的偏最小二乘回归模型,当交叉验证均方根误差(RMSEC...  相似文献   

12.
针对高维空间下获取最优特征子集异常复杂和模型识别准确率较低的问题,提出了基于特征分层选择和融合度相结合的近红外光谱多类识别度量算法。首先引入跳跃度,构造了一种特征分层方法,将所有特征依据对样本的重要性程度划分不同的特征子集,从而避免了从原始特征数据逐个剔除无关特征构建特征子集的繁琐过程;同时又改进了样本的融合度,将其代替K最近邻分类器(KNN)中依据概率进行类别判断的方式,提高了分类器的识别精度,较好地解决了多类识别准确率较低的问题。为验证该算法的有效性,选取五类具有代表性382个烟叶样品为实验对象,构建了烟叶产地识别度量模型,并选取64个样本进行了模型测试,以预测均方根误差(RMSEP)、交互验证均方差(RMSECV)和相关系数(r)作为模型稳健性的评价指标,以产地识别准确率作为算法优劣评价标准。仿真实验结果表明,利用该算法构建的模型具有较低的RMSEP(0.117),RMSECV(0.106)和较高的r(0.973),平均识别准确率达到98.44%,性能明显优于其他算法,该算法对于高维光谱数据具有良好的识别性能。  相似文献   

13.
为了提高传统模拟电路故障诊断算法的故障诊断精确度和故障诊断效率,设计了一种基于多种群量子粒子群聚类的模拟电路故障诊断算法。首先,采用多种群量子粒子群算法实现特征参数优化,将最优粒子中的非0维度作为选择的最优特征属性,得到最优特征选择集,然后采用马氏距离作为数据样本相似度的度量方式,设计了基于马氏距离的聚类方法实现对模拟电路的故障进行有效诊断,该诊断方法能在线样本不断增加的情况,自适应地增加聚类的个数即故障诊断的类别数,且无需训练参数。仿真实验表明,文中方法能有效实现模拟电路的故障诊断,尤其是能满足在线故障诊断需求,与其它方法相比,具有故障诊断精度和效率高的优点。  相似文献   

14.
针对近红外光谱波长选择问题,在团队进步算法(TPA)的基础上,提出一种改进团队进步算法(iTPA)的波长变量选择方法,将分子光谱的波段按照与其相应的理化值建模得到的评价值函数大小降序排列,顺序分为精英组、普通组和垃圾回收组。当新生波段选择学习行为时,若其产生于普通组,则需要向精英组样板的方向调节;若其产生于精英组,则需要改进其更新方向,向垃圾回收组样板的反方向调节。垃圾回收组成员的评价值不像精英组和普通组随着更新的过程一直上升,而是一直处于极低的状态,为产生于精英组的新生波段在学习时提供一个准确的更新方向,从而提升算法的全局寻优能力。通过不断的迭代更新,逐步提升整体评价值,最终选取评价值最高的波段作为筛选波段。该算法对玉米的淀粉和蛋白质含量数据集进行了实验测试,并与TPA、遗传算法(GA)、主成分分析(PCA)以及全谱方法进行了对比。实验结果表明,所提算法能够找出全谱范围内波长的最优组合,并且可以解释各含量的化学特性。玉米淀粉数据集运行的效果相比于全光谱,变量个数从700个减少到17.55个左右(50次试验求平均),模型的RMSEC从0.335 7降到0.260 9,校正集预测精度提升了22.3%,模型的RMSEP从0.391 4下降到0.334 4左右,预测集预测精度提升了14.6%;在玉米蛋白质数据集运行的效果相比于全光谱,变量个数从700个减少到19.6个左右(50次试验求平均),模型的RMSEC从0.147 4降到0.101 9,校正集预测精度提升了30.1%,模型的RMSEP从0.178 9下降到0.117 7,预测集预测精度提升了34.2%。  相似文献   

15.
针对近红外光谱高维、高冗余、非线性和小样本等特点导致光谱相似性度量时出现的“维度灾难”,提出一种基于核映射和rank-order距离的局部保持投影(KRLPP)算法。首先将光谱数据经过核变换映射到更高维空间,有效保证了流形结构的非线性特征。然后改进局部保持投影(LPP)算法对数据进行降维操作,将rank-order距离替代传统的欧氏距离或测地线距离,通过共享邻近点的信息,得到更加准确的局部邻域关系。最后在低维空间通过距离的计算实现光谱的度量。该方法不仅有效解决了高维空间存在的“距离失效”问题,同时还提高了相似性度量结果的精度。为了验证KRLPP算法的有效性,首先根据降维前后数据集信息残差的变化确定了最佳参数近邻点的个数k和降维后的维数d。其次,从光谱降维投影效果和模型分类效果两个角度与PCA,LPP和INLPP算法进行了对比,结果表明KRLPP算法对于烟叶的部位有较好的区分能力,降维效果以及对于不同部位的正确识别率明显优于PCA,LPP和INLPP。最后,从某品牌卷烟叶组配方中选取了5个代表性烟叶作为目标烟叶,分别采用PCA,LPP和KRLPP方法从300个用于配方维护的烟叶样品中为每个目标烟叶寻找相似烟叶,并从化学成分和感官评价两方面对替换前后的烟叶及叶组配方进行了评价分析。其中LPP和KRLPP用于降维的参数选择保持一致,PCA选择前6个主成分。结果表明,由KRLPP选出的替换烟叶与替换配方在总糖、还原糖、总烟碱、总氮等化学成分以及香气、烟气、口感等感官指标上较PCA、LPP方法差异最小,相似性度量准确度最高。该方法可应用于配方产品替换原料的查找,辅助企业实现产品质量的维护。  相似文献   

16.
基于紫外光谱的水产养殖水质总氮含量快速检测研究   总被引:1,自引:0,他引:1  
应用紫外(Ultraviolet,UV)光谱技术对水产养殖水质总氮含量进行快速检测。为了消除各种系统误差与偶然误差对模型预测性能造成的影响,将88个水样的总氮浓度实测值数据和光谱吸光度数据作为原始数据,将模型建立分为样本集划分、数据预处理、特征波段提取、模型选择与LV数量选择5个阶段,以求达到最优预测效果,其中前4个阶段分别使用多种方法进行比较。结果证明每个阶段都是必不可少的,只有通过对比其优劣才能找到最适合总氮含量测定的建模过程及方法。首先用浓度梯度(CG)法对原始数据进行相同的样本集划分处理,然后在此基础上分别建立主成分回归(PCR)、逐步回归(SR)和偏最小二乘回归(PLSR)三种模型,选择预测效果最好的PLSR作为本文的预测模型。PLSR的建模效果会在很大程度上受到潜在变量(LVs)数量的影响,通常选取模型预测均方根误差RMSEP值最小时所对应的LV个数为最优LV个数。其次,选用CG法、随机抽样(RS)法、 Kennard Stone(KS)法和SPXY法4种样本集划分算法对样本进行处理,并对所建立的PLSR模型预测效果进行比较,最终选择SPXY算法作为最优样本划分算法。然后在对样本集进行SPXY法划分的基础上,运用多种预处理算法对光谱吸光度数据进行预处理,包括小波变换(WT)、一阶导数法(Der1st)与二阶导数法(Der2nd)三种单一算法和小波变换与两种导数法的组合预处理算法WT-Der1st和WT-Der2nd。然后在预处理的基础上分别使用连续投影变换(SPA)和逐步回归(SR)两种特征波段提取方法,对比可知, SPA特征提取方法比SR的提取效率高且建模效果好。SPA算法既可以大大地简化模型,又可以在一定程度上提升模型的预测精度。基于WT-Der1st-SPA提取的特征波段为218 nm,与总氮特征波段区间相一致,由此说明该方法比较科学。综合上述建立的10个PLSR模型,考虑到预测精度与模型复杂度2个因素,最终选择基于WT-Der1st-SPA建立的PLSR模型作为最优模型,该模型预测决定系数r~2为0.996,预测均方根误差RMSEP为0.042 mg·L~(-1)。由此可见,所建立的模型预测效果非常好,可以快速准确地测定水体的总氮含量,为实现光谱技术在水产养殖其他水质监测指标的在线检测以及快速测定提供了经验。  相似文献   

17.
利用光谱技术实现农产品、食品品质无损检测的实质是建立样本光谱信息与样本品质参数之间的机器学习模型。为了获得具有良好泛化性能的机器学习模型,通常需要大量的标记样本,然而,获取样本的光谱信息相对容易,但标注样本品质参数的过程往往涉及到大量的时间和经济成本,并且具有破坏性。主动学习是一种减少训练集有标记样本数量的方法,通过选择最有价值的样本进行标记,而不是随机选择。因此,主动学习能够控制向训练集添加哪些样本,模型不再是被动地接受用于建模的样本。在分类任务中已经提出较多关于主动学习的算法,但回归任务中的研究却相对较少,且现有的用于回归任务的主动学习算法大多是有监督的,即需要少量有标记样本训练初始模型。本文提出了一种基于无监督主动学习方法的训练样本选择策略。该方法首先通过层次凝聚聚类对无标记(标准值)光谱数据集进行多样性划分,获得不同的聚类簇;然后通过局部线性重建算法在每个聚类簇中选择最具代表性的样本构成训练样本集,最后基于训练集构建模型。利用两个年份三个品种苹果的近红外光谱数据,构建了其可溶性固形物含量和硬度的偏最小二乘预测模型,用于验证所提出方法的有效性。实验结果表明:所提出的方法要优于已有的样本选择策略,可以有效地提高模型精度,减少在模型训练中的破坏性理化实验。同时,与随机采样(RS)、Kennard-Stone算法(KS)、光谱-理化值共生距离算法(SPXY)这三种光谱领域常用的样本选择算法相比,该研究所提出的方法表现出了最佳的性能, 基于所提出的无监督主动学习算法选取200个样本作为训练集所建立的可溶性固形物含量预测模型的预测均方根误差相对于其他三种算法降低了2.0%~13.2%,硬度预测模型的预测均方根误差相对降低了1.2%~15.7%。  相似文献   

18.
针对近红外光谱应用,提出了一种基于高斯过程(GP)模型的波长选择算法,即联合区间高斯过程(synergy interval gaussian process,siGP)算法。首先将全光谱区域划分为一系列无重复且间距相等的区间,再选取最优的若干个区间联合建立GP模型,由于GP模型具有非线性处理能力,因此该方法可以减少非线性的影响。以红曲菌固态发酵过程中过程参数水分含量和pH值的检测为例,新算法对水分含量、pH值的预测集相关系数(rp)分别为0.956 4和0.977 3,预测均方根误差(RMSEP)分别为0.012 7和0.161 0,参与建模的数据点由全谱的1 500个分别减少到225个、375个,在对独立样本的预测上,表现出较好的精度。与传统联合区间偏最小二乘(siPLS)波长选择算法对比,siGP算法预测效果更好:对水分含量和pH值,rp在GP模型预测时提高了3.37%和3.51%,RMSEP在GP模型预测时提高了29.4%和34.8%。表明siGP结合GP模型能够有效选择波长区间以及提高近红外模型的准确性,对进一步实现近红外光谱技术在线检测具有参考价值。  相似文献   

19.
胡庆成  张勇  许信辉  邢春晓  陈池  陈信欢 《物理学报》2015,64(19):190101-190101
复杂网络中影响力最大化建模与分析是社会网络分析的关键问题之一, 其研究在理论和现实应用中都有重大的意义. 在给定s值的前提下, 如何寻找发现s个最大影响范围的节点集, 这是个组合优化问题, Kempe等已经证明该问题是NP-hard问题. 目前已有的随机算法时间复杂度低, 但是结果最差; 其他贪心算法时间复杂度很高, 不能适用于大型社会网络中, 并且这些典型贪心算法必须以了解网络的全局信息为前提, 而获取整个庞大复杂且不断发展变化的社会网络结构是很难以做到的. 我们提出了一种新的影响力最大化算法模型RMDN, 及改进的模型算法RMDN++, 模型只需要知道随机选择的节点以及其邻居节点信息, 从而巧妙地回避了其他典型贪心算法中必须事先掌握整个网络全局信息的问题, 算法的时间复杂度仅为O(s log(n)); 然后, 我们利用IC模型和LT模型在4种不同的真实复杂网络数据集的实验显示, RMDN, RMDN++算法有着和现有典型算法相近的影响力传播效果, 且有时还略优, 同时在运行时间上则有显著的提高; 我们从理论上推导证明了方法的可行性. 本文所提出的模型算法适用性更广, 可操作性更强, 为这项具有挑战性研究提供了新的思路和方法.  相似文献   

20.
无论是近红外还是红外光谱,多元校正模型的传递问题都尚未解决。为了实现模型和光谱的传递,提出了一种改进的PDS算法——SA-PDS算法,论方法通过PDS算法进行模型传递,使用光谱间的夹角大小作为判定准则来选择传递参数,使得模型传递过程不受到样品性质参考值的影响,也不再依赖于模型,并且可以双向传递。该方法分别通过在近红外数据和中红外数据中应用来证明模型传递的可行性,实验收集烟叶样本测得其近红外光谱,沥青样本测得其中红外光谱,将烟叶总糖会计师和沥青蜡含量作为模型预测对象。使用光谱夹角作为PDS参数选择标准与使用预测标准偏差作为判定准则相比,实验表明:对于近红外光谱的从机向主机的传递,其验证集预测精密度RMSEP从5.257 4降低至1.337 1,优于RMSEP(1.350 3)方法,预测偏差也同样被改善。对于中红外光谱从机向主机的传递,新方法验证集预测精密度RMSEP从0.525 1降低至0.186 9,优于RMSEP(0.219)方法。主机向从机的传递也取得了满意的传递结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号