首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 546 毫秒
1.
Count data appears in many research fields and exhibits certain features that make modeling difficult. Most popular approaches to modeling count data can be classified into observation and parameter-driven models. In this paper, we review two models from these classes: the log-linear multivariate conditional intensity model (also referred to as an integer-valued generalized autoregressive conditional heteroskedastic model) and the non-linear state-space model for count data. We compare these models in terms of forecasting performance on simulated data and two real datasets. In simulations, we consider the case of model misspecification. We find that both models have advantages in different situations, and we discuss the pros and cons of inference for both models in detail.  相似文献   

2.
鉴于我国运载火箭测试数据判读工作现状,研究测试数据的预测算法,有助于预判故障趋势,提前采取措施。分析了运载火箭测试数据,提出测试数据依时间序列的分类方法;针对类周期型数据,设计了相应的特征提取算法,得出数据特征时间序列;应用滚动自回归预测算法,并将历史实际值与预测值的加权值作为当前时刻的建模数据,实现了类周期数据特征的趋势预测。该方法有助于改进运载火箭类周期型数据判读方法。  相似文献   

3.
4.
牛奶蛋白质的分析和监测是奶制品行业中不可或缺的环节利用可见光/近红外反射光谱(350~2 500 nm)进行纯牛奶中真蛋白质含量的快速定量反演。分别通过ASD地物光谱仪和CEM真蛋白质测定仪采集牛奶样本的反射光谱数据以及蛋白质含量数据,对比分析不同的光谱预处理方法和波段筛选方法,得到特征波段,最后利用主成分回归(PCR)和最小二乘支持向量机(LS-SVM)模型建立牛奶反射光谱和蛋白质含量之间的定量校正模型,并对其预测能力进行比较,从而确定最优的牛奶中真蛋白质含量反演模型。实验结果证明:(1)比较不同光谱预处理方法,发现多元散射校正与二阶微分联合使用效果较好;(2)相对于全光谱建模,适当的特征变量优选有助于提高建模精度,缩短建模时间;(3)PCR的验证集决定系数R2P为0.952 2,验证集均方根误差RMSEP为0.048 7,而LS-SVM的R2P为0.958 0,RMSEP为0.048 2,其预测精度要优于PCR。研究表明,可见光/近红外高光谱反射率数据可以为牛奶真蛋白质含量的检测提供一种快速、无损的新方法。  相似文献   

5.
Modeling and analysis of time series are important in applications including economics, engineering, environmental science and social science. Selecting the best time series model with accurate parameters in forecasting is a challenging objective for scientists and academic researchers. Hybrid models combining neural networks and traditional Autoregressive Moving Average (ARMA) models are being used to improve the accuracy of modeling and forecasting time series. Most of the existing time series models are selected by information-theoretic approaches, such as AIC, BIC, and HQ. This paper revisits a model selection technique based on Minimum Message Length (MML) and investigates its use in hybrid time series analysis. MML is a Bayesian information-theoretic approach and has been used in selecting the best ARMA model. We utilize the long short-term memory (LSTM) approach to construct a hybrid ARMA-LSTM model and show that MML performs better than AIC, BIC, and HQ in selecting the model—both in the traditional ARMA models (without LSTM) and with hybrid ARMA-LSTM models. These results held on simulated data and both real-world datasets that we considered.We also develop a simple MML ARIMA model.  相似文献   

6.
胡列娜  程海英  陈峰 《应用声学》2017,25(5):176-179
大数据背景下,传统数据通信调度方法研究由于预测要素引入面窄、预测算法逻辑同意性差,导致数据调度出现数据调度断层现象;针对上述问题,提出大数据背景下数据通信调度3+1集成法设计;采用3+1集成法,通过CPU信号强度波动算法、处理器数据节点动态数检测技术、电频信号转换算法与快速执行代码,解决传统的数据通信调度过程中的数据响应慢、数据调度断层的问题;通过仿真实验证明,提出的大数据背景下数据通信调度3+1集成法具有数据调度速度快、资源开销小、调度数据准确度高的特点。  相似文献   

7.
司红伟  钟国韵 《应用声学》2015,23(7):2475-2477, 2481
为了克服大数据在采用串行加密方式时具有的加密效率低的问题,设计了一种基于双混沌系统的大数据环境的并行加密算法。首先,在对经典的Map-Reduce分布式并行计算框架进行研究的基础上,设计了大数据环境的并行加密模型。然后,设计了改进的Logistic映射和Tent映射构成双混沌系统,在此基础上,设计了Map函数、Sort函数和Reduce函数实现并行加密,在Map函数中通过Logistic映射和Tent映射的不断迭代计算加密密钥或解密密钥,实现明文到密文或密文到明文的转换,在Sort 函数对由Map函数输出的键值对进行排序并剔除重复的数据块,在Reduce函数中对加密后的密文数据块或解密后的明文数据块进一步合并构成输出数据,并生成Logistic映射和Tent映射的迭代次数初始值并保存在历史数据信息中。仿真实验表明:文中设计的基于双混沌系统的Map-Reduce并行加密模型能高效地进行数据加密或解密,能提高数据安全性和加密效率,具有较强的可行性。  相似文献   

8.
针对日益增长的民用航空巨量数据,借助大数据存储和分析技术,构建民用航空运行大数据分析平台,可更有效支撑快速响应、航材管理、健康管理等各项民机运行业务。结合目前国内外民用航空领域大数据技术的应用现状,梳理民机运行的业务模式及数据类别,设计并构建民用航空大数据分析平台的整体架构。根据目前民用航空运行业务需求,对民用航空大数据平台的硬件平台的管理节点、数据节点的计算能力等功能性能进行设计,并对民用航空大数据平台的轻量级计算、离线数据计算、实时在线数据处理分析等计算需求进行研究,针对不同的计算方式,提供具体解决途径。最后对民机运行大数据分析平台的业务应用集成及接口技术进行研究。分析表明研究成果有助于提高我国民机运行效率,为民用飞机运行大数据平台提供支撑。  相似文献   

9.
高炉煤气发生量的准确预测对钢铁企业能源优化调度具有重要意义。针对钢铁企业中基于机理模型的高炉煤气发生量难以准确预测问题,建立了基于小波分析的最小二乘支持向量机(LSSVM)和自回归差分滑动平均(ARIMA)相结合的高炉煤气预测模型。预测前利用小波去噪对原始数据进行消噪处理,并对处理后的数据进行小波变换得到趋势序列和波动序列,然后对各部分序列分别建模和预测,最后将各部分预测结果叠加;仿真结果表明,组合预测模型减小了预测误差,提高了预测精度。与其他模型相比,组合预测模型更适合高炉煤气预测。  相似文献   

10.
土壤有机质(SOM)含量是衡量土壤质量高低的重要指标,可以用高光谱快速测定。在以往研究中,估算模型多以特征波段与线性经验模型为基础进行构建,较少考虑波段间信息冗余和共线性,预测效果不很理想并难以进行推广。为最大化消除波段信息噪声,提高模型预测精度,选取莱州湾南岸滨海平原为研究区,系统采集了111个土壤样本和实测高光谱数据(325~1 075 nm),并测试了土壤样本的有机质含量作为因变量;通过主成分分析(PCA)将实测光谱信息降维为6个主成分,并提取水分、植被光谱特征指数(DI),以此作为自变量;最后建立多元逐步线性回归(MLR)和BP神经网络(BPN)预测模型,分析不同模型对土壤有机质预测的效果。结果表明:①经过主成分的波段信息分析判别提取出6个主成分,可以表征叶绿素残留物、盐分、腐殖酸、物化矿渣和微地貌的光谱特征。②基于6个主成分作为自变量所建立的BPN模型预测精度优于MLR模型,他们的R2分别为0.704和0.643。将水分和植被光谱特征指数作为自变量增加到预测模型后,MLR和BPN的预测精度分别提高了6.1%和5.2%,R2达到0.712和0.764;③将光谱主成分和光谱特征指数作为自变量的BPN模型进行土壤有机质预测可得到精度较高的预测结果,在土壤有机质的预测与制图中具有一定的应用潜力。  相似文献   

11.
恒星光谱分类是天文技术与方法领域一直关注的热点问题之一。随着观测设备持续运行和不断改进,人类获得的光谱数量与日俱增。这些海量光谱为人工处理带来了极大挑战。鉴于此,研究人员开始关注数据挖掘算法,并尝试对这些光谱进行数据挖掘。近年来,神经网络、自组织映射、关联规则等数据挖掘方法广泛应用于恒星光谱分类。在这些方法中,支持向量机(SVM)以其强大的学习能力和高效的分类性能而备受推崇。SVM的基本思想是试图在两类样本之间找到一个最优分类面将两类分开。SVM在求解时,通过将其最优化问题转化为具有(QP)形式的凸问题,进而得到全局最优解。尽管该方法在实际应用中表现优良,但为了进一步提高其分类能力,有的学者提出双支持向量机(TSVM)。该方法通过构造两个非平行的分类面将两类分开,每一类靠近某个分类面,而远离另一个分类面。TSVM的计算效率较之传统SVM提高近4倍,因此,自TSVM提出后便受到研究人员的持续关注,并出现若干改进算法。在恒星光谱分类中,一般分类算法都是根据历史观测光谱来建立分类模型,其中最关键的是对光谱进行人工标注,这项工作极为繁琐,且容易犯错。如何利用已标记的光谱以及部分无标签的光谱来建立分类模型显得尤为重要。因此,提出带无标签数据的双支持向量机(TSVMUD)用以实现对恒星光谱智能分类的目的。该方法首先将光谱分为训练数据集和测试数据集两部分;然后,在训练集上进行学习,得到分类依据;最后利用分类依据对测试集上的光谱进行验证。继承了双支持向量机的优势,更重要的是,在训练集上学习分类模型过程中,不仅考虑有标记的训练样本,也考虑部分未标记的样本。一方面提高了学习效率,另一方面得到更优的分类模型。在SDSS DR8恒星光谱数据集上的比较实验表明,与支持向量机SVM、双支持向量机TSVM以及K近邻(KNN)等传统分类方法相比,带无标签数据的双支持向量机TSVMUD具有更优的分类能力。然而,该方法亦存在一定的局限性,其中一大难题是其无法处理海量光谱数据。该工作将借鉴海量数据随机采样思想,利用大数据处理技术,来对所提方法在大数据环境下的适应性展开进一步研究。  相似文献   

12.
对网络计算机模型下海量大数据进行安全稳定的存储,可以提高网络计算机的使用价值,增加其使用周期。但目前的海量大数据存储方法在存储过程中,无法做到对其进行灵活高效的存储,存在大数据存储分布密度较低,存储开销较大等问题。为此,以网络计算机模型体系结构为基础,提出了一种基于ARM的海量大数据存储系统设计方法。该设计方法先利用ARM芯片对网络计算机模型下海量大数据存储系统进行硬件构造,将网络海量大数据中的可利用与不可利用数据进行分类处理,采用VISA结构根据数据分类结果对大数据存储系统软件部分进行设计,依据大数据调度模型和存储相似度特征对大数据存储的时间,质量等方面进行计算,利用计算结果对大数据传输的阈值以及分布密度进行记录,最后根据循环分段的计算方式进行冗余大数据特性压缩,并对海量大数据的常规数据和冗余数据进行存储。实验仿真证明,所提方法提高了海量大数据存储的兼容性,增强了大数据存储的精确性和灵活性。  相似文献   

13.
张学清  梁军 《物理学报》2013,62(5):50505-050505
针对风电功率时间序列的混沌特性,提出了一种基于集成经验模态分解(ensemble empirical mode decomposition, EEMD)-近似熵和回声状态网络(echo state network, ESN) 的风电功率混沌时间序列组合预测模型.首先为降低对风电功率局部分析的计算规模以及提高预测的准确性, 利用EEMD-近似熵将风电功率时间序列分解为一系列复杂度差异明显的风电子序列; 然后对各子序列分别建立ESN、经过高频分量正则化改进的EEMD-ESN模型和最小二乘支持向量机预测模型; 最后以某一风电场实际采集的数据为算例,仿真结果表明EEMD-ESN模型在训练速度和预测精度上优于最小二乘支持向量机模型,为实现风电功率短期预测的在线工程应用提供了新的有益参考. 关键词: 混沌时间序列 风电预测 集成经验模态分解 近似熵  相似文献   

14.
潘萌  张春粦  张杰 《计算物理》2007,24(1):65-70
在大亚湾核电站周围大气流场分布模拟计算中,引入了一种简化的同化技术,用以解决观测数据在时间、空间上分布不均匀导致的流场预报误差.测试并分析了该同化技术对计算模式和初始场的影响,结果表明该同化方法对模式误差和初始场误差的抑制是显著的.  相似文献   

15.
现代航空武器装备综合化和信息化程度越来越高,飞行试验测试数据的种类增多,测试数据量剧增,飞行试验进入了大数据时代。试飞大数据的来临,对试验数据的获取、记录、传输和处理等传统技术及模式产生了强大的冲击,也提出了严峻的挑战。本文在简要介绍大数据概念及国外研究应用现状的基础上,通过总结分析飞行试验数据的新特征、新需求,提出了“试飞大数据”的概念,得出飞行试验数据是典型大数据的结论;按照试飞测试流程和大数据技术范畴,重点分析了试飞大数据技术中的数据获取、交换、记录、传输、监控、处理、存储等关键技术,最后,对试飞大数据技术的应用前景进行了展望。  相似文献   

16.
快速准确监测农田土壤全氮含量,可显著提高土壤肥力诊断与评价工作的效率。传统测定土壤全氮的方法存在耗时费力、成本高、环境污染等缺点,而基于光谱学原理的土壤全氮定量方法克服了传统测量的劣势。中红外(MIR)光谱相较于可见光-近红外(VNIR)光谱而言,具有更多的波段数和信息量,如何利用中红外光谱监测土壤全氮含量是具有重要应用前景的研究课题。为了探索中红外光谱对土壤全氮监测的可行性,以新疆南疆地区采集的246个农田土样为研究对象,以室内测定的全氮含量和中红外光谱反射率数据为数据源,分析了不同全氮含量土样的中红外光谱特征差异,以主成分分析法(PCA)和连续投影算法(SPA)对光谱数据进行降维,然后采用偏最小二乘回归(PLSR)、支持向量机(SVM)、随机森林(RF)和反向传播神经网络(BPNN)四种建模方法分别构建基于全波段和降维数据的土壤全氮含量定量反演模型。研究结果表明:(1)土壤在中红外波段光谱反射率随全氮含量的增加而增加,在3 620, 2 520, 1 620和1 420 cm-1附近存在明显的吸收谷;将中红外光谱数据进行最大值归一化处理后,可明显提高土壤光谱反...  相似文献   

17.
在比较不同探月任务取得的月表三维影像数据的基础上,选择中国嫦娥一号全月分幅数字高程模型(DEM)数据作为构建月表地形模型的数据源,并利用ArcGIS、Cass和AutoCAD等软件的功能及其之间的连接关系,研究了基于月球探测数据构建月表三维模型的技术和方法。以月表撞击坑Lichtenberg为例,建立了撞击坑的三维地形模型,并对其精度和影响精度的因素进行了分析。分析结果表明,对于500m分辨率的原始数据,模型误差较小,产生误差的原因主要包括生成等高线的密度、采点间距等因素。  相似文献   

18.
Although commercial motion-capture systems have been widely used in various applications, the complex setup limits their application scenarios for ordinary consumers. To overcome the drawbacks of wearability, human posture reconstruction based on a few wearable sensors have been actively studied in recent years. In this paper, we propose a deep-learning-based sparse inertial sensor human posture reconstruction method. This method uses bidirectional recurrent neural network (Bi-RNN) to build an a priori model from a large motion dataset to build human motion, thereby the low-dimensional motion measurements are mapped to whole-body posture. To improve the motion reconstruction performance for specific application scenarios, two fundamental problems in the model construction are investigated: training data selection and sparse sensor placement. The problem of deep-learning training data selection is to select independent and identically distributed (IID) data for a certain scenario from the accumulated imbalanced motion dataset with sufficient information. We formulate the data selection into an optimization problem to obtain continuous and IID data segments, which comply with a small reference dataset collected from the target scenario. A two-step heuristic algorithm is proposed to solve the data selection problem. On the other hand, the optimal sensor placement problem is studied to exploit most information from partial observation of human movement. A method for evaluating the motion information amount of any group of wearable inertial sensors based on mutual information is proposed, and a greedy searching method is adopted to obtain the approximate optimal sensor placement of a given sensor number, so that the maximum motion information and minimum redundancy is achieved. Finally, the human posture reconstruction performance is evaluated with different training data and sensor placement selection methods, and experimental results show that the proposed method takes advantages in both posture reconstruction accuracy and model training time. In the 6 sensors configuration, the posture reconstruction errors of our model for walking, running, and playing basketball are 7.25°, 8.84°, and 14.13°, respectively.  相似文献   

19.
基于云计算的大数据自动分类处理系统设计   总被引:1,自引:0,他引:1  
罗弦  查志勇  徐焕  刘芬  詹伟 《应用声学》2017,25(10):278-280, 288
随着现代网络技术不断进步,系统数据量也在逐渐增多。传统的大数据自动分类处理系统已经无法满足现阶段用户需求,其软件与硬件的设计都比较单一,存在能源消耗大、分类速度慢、处理时间长、内存占用率高等问题,为此,提出基于云计算的大数据自动分类处理系统的设计。首先设计系统硬件结构,主要包括数据采集器、数据处理器以及数据自动存储模块,并详细的介绍了各硬件结构;然后利用时域特征提取数据的算法对频域特征数据进行提取,从而实现数据自动分类处理系统的软件设计;最后对两种系统性能进行对比实验。实验结果证明,基于云计算的大数据自动分类处理系统的资源不仅占用率低,内存消耗小,而且数据库内存较大。该系统不但可以提高数据自动分类精准度,还能加快数据分类速度,从而使系统拥有更好的分类性能。  相似文献   

20.
In order to improve the accuracy of manipulator operation, it is necessary to install a tactile sensor on the manipulator to obtain tactile information and accurately classify a target. However, with the increase in the uncertainty and complexity of tactile sensing data characteristics, and the continuous development of tactile sensors, typical machine-learning algorithms often cannot solve the problem of target classification of pure tactile data. Here, we propose a new model by combining a convolutional neural network and a residual network, named ResNet10-v1. We optimized the convolutional kernel, hyperparameters, and loss function of the model, and further improved the accuracy of target classification through the K-means clustering method. We verified the feasibility and effectiveness of the proposed method through a large number of experiments. We expect to further improve the generalization ability of this method and provide an important reference for the research in the field of tactile perception classification.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号