首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
微生物组学大数据在生态环境、人类健康和疾病研究方面都起到了重要作用。通过数学、统计等数据挖掘方法,从高维复杂数据中提取有用信息,是微生物组学大数据建模和分析的关键问题。本文分析了微生物组学大数据的特点,对当前数据分析和计算研究中存在的热点和难点进行了探讨分析,并综述了当前微生物组学大数据模式挖掘、网络重建与分析的研究概况。  相似文献   

2.
微生物组学大数据在生态环境、人类健康和疾病研究方面都起到了重要作用。通过数学、统计等数据挖掘方法,从高维复杂数据中提取有用信息,是微生物组学大数据建模和分析的关键问题。本文分析了微生物组学大数据的特点,对当前数据分析和计算研究中存在的热点和难点进行了探讨分析,并综述了当前微生物组学大数据模式挖掘、网络重建与分析的研究概况。  相似文献   

3.
本文探讨飞机座舱复合因素环境人体工程学研究中有关的多元统计学方法的应用.实验采用正交区组设计,运用主成分分析法,正交多项式逐步回归方法,AIC 准则,C_p 准则,回归诊断等方法将大量的实验数据提炼成数学模型,并从数学的角度证明其稳定性、可靠性,均达到工程设计应用要求.  相似文献   

4.
口腔健康被世界卫生组织(WHO)列为人体健康10大标准之一,口腔中微生物及其代谢产物已被证明与人体多种系统性疾病相关.随着口腔影像学、宏基因组学、宏转录组学和蛋白质组学等信息技术的快速发展,使得从基于大数据的健康系统论开展口腔疾病和健康研究变得可行,各种医学伦理问题也相应而生.鉴于我国健康大数据研究现状,文章针对口腔影像学大数据研究,提出知情同意,健全法律法规,分级伦理审查的建议,其核心是明晰数据所有权,以保护患者权益为核心,同时引导和规范临床科研的创新与探索,提高伦理委员会工作效率.  相似文献   

5.
成分数据具有非常复杂的数学性质,很多传统的统计分析方法对其是失效的,因此,在研究中必须采用特殊处理和专门技术.着重讨论了成分数据相关系数的计算方法,由于普通数据的相关系数计算方法只适用于两组单变量数据,而传统的典型相关分析又鉴于成分数据的特殊性质而不能直接使用,故结合logratio变换和典型相关分析技术,提出了一种针对成分数据的相关系数计算方法,成功地解决了这一问题.  相似文献   

6.
缺失数据处理是数据挖掘领域中进行数据预处理的一个重要环节,由于成分数据特殊的几何性质,传统的缺失值填补方法不能直接用于这种类型的数据.因此,对成分数据而言,缺失值的填补具有十分重要的意义.为了解决这个问题,本文利用了成分数据和欧氏数据之间的关系,提出了一种基于随机森林的成分数据缺失值迭代填补法,该方法的实施和评估采用模拟和真实的数据集.实验结果表明:新的填补方法可广泛应用于多种类型的数据集且具有较高准确性.  相似文献   

7.
基于EM算法和Laplace逼近, 本文给出了研究ZI (即含0较多的)纵向计数数据模型的影响分析方法. 为了识别含0较多的分组计数数据中的强影响点, 本文将ZI纵向数据模型中取值为0的数据赋予一定的权重; 而把随机效应看作缺失数据; 在此基础上引入EM算法, 从而应用完全数据对数似然函数的条件期望以及相应的$Q$距离函数进行影响分析; 并进一步应用Laplace逼近方法简化EM算法中的积分计算. 在此基础上, 基于数据删除模型和局部影响分析方法导出了适用于ZI纵向计数数据模型的诊断统计量. 本文也通过实际计数数据的例子验证了诊断统计量的有效性.  相似文献   

8.
多元成分数据的对数衬度偏最小二乘通径分析模型   总被引:2,自引:1,他引:1  
本文研究多元成分数据的路径关联关系的建模问题,提出多元成分数据的对数衬度PLS通径分析模型.将中心化对数比变换与PLS通径分析方法相结合建立模型,其主要优势在于:①PLS通径分析模型对数据没有严格的分布假设要求,特别适于成分数据这类分布复杂的数据建模;②成分数据中心化对数比变换后的变量完全多重相关,PLS方法能够有效解决这一问题;③PLS通径分析模型特别适于多元成分数据这类具有层次关系的数据结构的建模,通过结构模型揭示多元成分数据之间的整体性路径关联关系,通过测量模型揭示成分数据与其成分分量之间的构成关系.更重要的是,本文的方法研究遵循成分数据所特有的代数基本理论,推导出模型的成分数据对数衬度隐变量的表达形式,从理论上证明了该建模方法的科学合理性.最后,将本方法用于北京市三次产业的投资结构、GDP结构、就业结构的路径关联关系的分析中,通过实证研究验证模型的可行性和应用价值.  相似文献   

9.
考察人体口腔异味现象,利用恒化器建模方法,改进了人体口腔系统中微生物种群关系的模型,利用Lyapunov稳定性理论分析了系统的平衡点及其稳定性.进而得到结论,口腔异味作为疾病,需要专业医治才能治愈.数值模拟结果证实了理论分析的正确性.  相似文献   

10.
Poisson回归模型广泛应用于分析计数型数据 ,Dean&Lawless(1989)和Dean(1992 )讨论了非重复测量得到的计数型数据的偏大离差存在性的检验问题 .本文分别利用随机系数模型和对数非线性模型讨论了基于重复测量得到的计数型数据的偏大离差的检验问题 ,得到了检验的score统计量 .  相似文献   

11.
基于主成分分析的成分数据缺失值插补法   总被引:1,自引:0,他引:1  
本文针对成分数据的特殊几何结构,提出了两种新方法对成分数据缺失值进行插补.一种是用单形空间的均值进行插补,主要是用Aitchison足巨离找到含缺失值样本的k个近邻样本,再结合单形空间中的加法运算与数乘运算,用单形空间上的均值对成分数据的缺失值进行插补;另一种是用主成分回归方法进行插补,先将用第一种方法进行初始插补的成分数据经过等距对数比变换变成普通数据,再用主成分回归进行第二次插补.实例分析和实验模拟结果表明:与k近邻插补法、迭代的最小二乘插补法相比较,本文提出的主成分插补法更优.  相似文献   

12.
针对时间序列数据的高维特性,在进行理论分析的基础上,利用主成分分析法提出了一种单变量时间序列数据降维的新方法,进而提出了基于主成分分析的单变量时间序列聚类方法。其主要思想是在线性空间中的同一组基下,用系数之间的相似性来刻画对应时间序列之间相似性,在理论分析过程中,首先对单变量时间序列数据集进行主成分分析,其次分析了单变量时间序列数据集、样本协方差矩阵的特征向量与主成分之间的关系,并证明了由主成分构成的向量组线性无关。为了进一步验证理论分析结果的正确性和所提算法的有效性,分别利用仿真数据和真实的股票数据进行了数值实验。  相似文献   

13.
随着计算机储存能力和在线观测技术的提高,当今数据越来越多的以曲线和图像的形式存在.曲线和图像数据两个最显著的特征是高维和相邻数据间高度相关.这些特征使得传统的多元统计分析方法不再适合,而函数型数据在处理曲线和图像数据中具有无可比拟的优势.近年来各种各样的函数型数据分析方法得以发展,其中包括数据的对齐、主成分分析、回归、分类、聚类等.本文主要介绍函数型数据回归分析研究的起源、发展及最新进展.具体地,本文首先介绍函数型数据的概念;其次介绍函数型主成分分析方法;再次着重介绍函数型回归模型的估计、变量选择和检验方法;最后将简要探讨函数型数据未来的可能发展方向.  相似文献   

14.
路径分析是一种探索和验证系统内部各个因素之间因果关系的多元统计方法.本文针对现实中大量存在的成分数据变量,提出成分数据路径分析模型,给出模型的方程表达形式和图形表达形式.在成分数据多元线性回归的基础上,提出模型的参数估计方法,并利用Bootstrap分析技术,给出路径系数显著性检验办法.在某公司官方网站的用户满意度与推荐意愿影响因素应用研究中,成分数据路径分析建模结果表明,满意度主要受到易用性的影响,而推荐意愿主要受到有用性的影响.这一结论为网站原型设计与营销推广提供了新的启示.  相似文献   

15.
分析了函数型数据主成分分析的原理。在此基础上,提出了一种函数型数据的聚类分析方法,以及在低维空间对原始高维数据进行直观表达的方法。给出了函数型数据的距离定义,并分析了这种距离的定义与欧氏距离的关系。提出函数型数据聚类分析的新方法:1)通过变换把离散数据转化为函数数据;2)进行函数型主成分分析;3)利用提取的前几个主成分构成低维空间,在该低维空间中,采用普通的聚类方法进行聚类分析。采用人体肢体多普勒超声血管造影的数据对所提出的方法的合理性进行验证。结果表明该方法可以有效地对函数型数据进行分类,分类结果与专家临床结论相符,因而有助于临床上对样本做客观判断。该方法不依赖专家的经验判断,且计算过程简便,易于计算机实现及临床应用。  相似文献   

16.
人体逆向运动学问题是人体运动合成、人体运动捕获和理解的基本问题.由于人体关节链式系统的复杂性,人体逆向运动学方程往往存在多解或无解的情形.传统的方法通常采用解析或数值迭代方法求解逆向运动学问题,在给定足够多约束的情形下能够得到比较好的解,但无法处理少量约束下生成自然的人体姿态问题.近年来,从大规模数据集中学习统计模型参数的思想被广泛运用,求解人体逆向运动学的机器学习方法中经典工作|混合Gauss逆向运动求解模型(Gaussian mixture model-inverse kinematics,GMM-IK)就提出利用混合Gauss模型建模人体姿态数据分布,并采用期望最大化方法求解参数.随着深度学习技术的发展,本文提出一种自编码神经网络与数值迭代融合的方法,在给定少量约束的情形下依然能够得到自然的人体姿态,相较于GMM-IK方法,本文所提出的方法通过神经网络自动学习姿态分布,省去了模型的假设和特征的设计,且量化实验显示本文方法的关节坐标和角度重建误差相较于GMM-IK模型平均减少了25%和39%.在应用方面,本文方法可处理光学运动捕获数据,也可用于图像视频的人体姿态估计等领域.  相似文献   

17.
针对利用网络搜索数据合成各类指数时难以消除共线性、难以合理确定各指标权重等问题,基于数据降维的思想构建了以主成分分析法为核心的指数合成方法,并以利用网络搜索数据合成消费者物价指数为例,将提出的方法与当前主流的逐步回归法做出比较研究.研究结果表明,基于主成分分析法的数据合成方法可以得到稳定性和拟合度更高的指数.  相似文献   

18.
为了拟合纵向数据和其他相关数据,本文提出了变系数混合效应模型(VCMM).该模型运用变系数线性部分来表示协变量对响应变量的影响,而用随机效应来描述纵向数据组内的相关性, 因此,该模型允许协变量和响应变量之间存在十分灵活的泛函关系.文中运用光滑样条来估计均值部分的系数函数,而用限制最大似然的方法同时估计出光滑参数和方差成分,我们还得到了所提估计的计算方法.大量的模拟研究表明对于具有各种协方差结构的变系数混合效应模型,运用本文所提出的方法都能够十分有效地估计出模型中的系数函数和方差成分.  相似文献   

19.
在科学研究中,经常利用观测到的数据研究复杂系统的主要成分与观测变量的关系,这实际上是科学的最基础问题之一,称为"主成分分析".对"主成分分析"的优良性研究文章众多,但是由于东西方认知世界的哲学思想不同,所以历史上东西方对"主成分分析"的计算和论证方法有着相当大的差异.利用对称设计对数据进行分类,通过对东西方主成分分析的计算方法进行比较,说明东方象数学的主成分分析的计算方法具有再现性,而西方主成分分析的计算方法不具有再现性.从再现性的观点来看,东方象数学的主成分分析的计算方法科学性更强.  相似文献   

20.
为避免在多指标综合评判方法中人为因素带来的偏差,文章结合主成分分析法对原始实验数据进行分析.通过阐述主成分分析的基本原理以及其实现过程,结合统计学软件SPSS 20.0,对主成分分析的操作过程进行论述.以长焰煤自燃标志性气体为例进行分析,当累计贡献率达到95.852%时,提取出两个主成分.结合数据以及现场实践分析,主成分分析法可以简化各因子数据之间繁琐的问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号