首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 58 毫秒
1.
DNA序列分类的数学模型   总被引:1,自引:0,他引:1  
本文从三个不同的角度分别论述了如何对 DNA序列进行分类的问题 ,依据这三个角度分别建立了三类模型 .首先 ,从生物学背景和几何对称观点出发 ,建立了 DNA序列的三维空间曲线的表达形式 .建立了初步数学模型 -积分模型 ,并且通过模型函数计算得到了 1到 2 0号 DNA序列的分类结果 ,发现与题目所给分类结果相同 ,然后我们又对后 2 0个 DNA序列进行了分类 .然后 ,从人工神经网络的角度出发 ,得到了第二类数学模型 -人工神经网络模型 .并且选择了三种适用于模式分类的基本网络 ,即感知机模型 ,多层感知机 ( BP网络 )模型以及 LVQ矢量量化学习器 ,同时就本问题提出了对 BP网络的改进 (改进型多层感知机 ) ,最后采用多种训练方案 ,均得到了较理想的分类结果 .同时也发现了通过人工神经网络的方法得到的分类结果与积分模型得到的分类结果是相同的 (前四十个 ) .最后 ,我们对碱基赋予几何意义 :A.C.G.T分别表示右 .下 .左 .上 .用 DNA序列控制平面上点的移动 ,每个序列得到一个游动曲线 ,提取游动方向趋势作为特征 ,建立起了模型函数 ,同时也得到了后二十个 DNA序列的分类结果 ,而且发现结果与上述两个模型所得到的分类结果几乎相同 (其中有一个不同 ,在本模型中表示为不可分的 ) .此模型保留的信息量更多 ,而且  相似文献   

2.
DNA序列的分类模型   总被引:5,自引:0,他引:5  
本文针对 DNA序列分类这个实际问题 ,提出了相应的数学模型 .为了很好的体现 DNA序列的局部性和全局性的特征 ,我们给出了衡量分类方法优劣的标准 ,即在满足一定限制条件的情况下 ,是否能充分反映序列的各方面特性 .依据我们提出的判别标准 ,单一标准的分类是无法满足要求的 .我们的方法是侧重点不同的三种方法的综合集成 .这三种方法分别体现了序列中元素出现的概率 ,序列中元素出现的周期性 ,序列所带有的信息含量 .利用这个方法 ,完成了对未知类型的人工序列及自然序列的分类工作 .最后 ,对分类模型的优缺点进行了分析 ,并就模型的推广作了讨论  相似文献   

3.
关于DNA序列分类问题的模型   总被引:3,自引:1,他引:3  
本文提出了一种将人工神经元网络用于 DNA分类的方法 .作者首先应用概率统计的方法对 2 0个已知类别的人工 DNA序列进行特征提取 ,形成 DNA序列的特征向量 ,并将之作为样本输入 BP神经网络进行学习 .作者应用了 MATLAB软件包中的 Neural Network Toolbox(神经网络工具箱 )中的反向传播 ( Backpropagation BP)算法来训练神经网络 .在本文中 ,作者构造了两个三层 BP神经网络 ,将提取的 DNA特征向量集作为样本分别输入这两个网络进行学习 .通过训练后 ,将 2 0个未分类的人工序列样本和 1 82个自然序列样本提取特征形成特征向量并输入两个网络进行分类 .结果表明 :本文中提出的分类方法能够以很高的正确率和精度对 DNA序列进行分类 ,将人工神经元网络用于 DNA序列分类是完全可行的  相似文献   

4.
统计DNA序列中64种包含3个碱基字符串的频率,基于生物学知识,以此作为区分不同类别DNA序列的特征.对此频率数据使用主成分分析和Fisher判别两种方法进行数据降维操作,根据降维后的数据建立距离判别模型,用训练样本回判,检验模型判别效果,最后对未知类别序列进行判别归类,比较分类结果.  相似文献   

5.
DNA分类模型   总被引:1,自引:0,他引:1  
本模型充分利用了所给数据的特点 ,运用统计、最优化等数学方法 ,从已知样本序列中提炼出能较好代表两类特征的关键字符串 ,据此提出量化的分类标准 ,能较好的对任给 DNA序列进行分类 .首先 ,从已知样本序列中用广度优先法选出所有重复出现的字符串 ,并计算其标准化频率及分散度 .然后 ,利用样本数据结合最小二乘法确定两类字符串各自的优先级函数 ,并且逐步优化其参数使之达到稳定 ,提高了可信度 .最后 ,根据优先级函数找出关键词 ,然后确定权数 ,用层次分析法对未知样本进行分类 ,并定出显著水平 ,从而得到了一个比较通用的分类方法 .经过检验 ,此方法对 2 1— 4 0号待测样本进行了很好的分类 ,对后面的1 82个 DNA序列进行同样的操作 ,也有较好的效果  相似文献   

6.
统计DNA序列中64种包含3个碱基字符串的频率,基于生物学知识,以此作为区分不同类别DNA序列的特征.对此频率数据使用主成分分析和Fisher判别两种方法进行数据降维操作,根据降维后的数据建立距离判别模型,用训练样本回判,检验模型判别效果,最后对未知类别序列进行判别归类,比较分类结果.  相似文献   

7.
DNA序列比对数目的算法研究   总被引:1,自引:0,他引:1  
徐琛梅  刘晓杰 《大学数学》2008,24(1):100-103
生物序列比对是生物信息学中非常重要的内容.文[1]中作者用差分方程理论给出了求两DNA序列间比对数目的一个计算公式,然而解法较为繁琐.本文将借助于组合数学中母函数这一计数工具给出另一简单、优美的算法,并在此基础上剔除非生物比对,得到进一步的计算公式,这一结果缩小了需要考查的比对范围.  相似文献   

8.
DNA序列的特征数值及相似性分析   总被引:1,自引:0,他引:1  
利用2维图表示DNA序列,计算与该图对应的距离矩阵,求出距离矩阵的不变量—距离矩阵主对角线以外的次对角线之和的平均值,进而得到了DNA序列的一种特征数值,利用这种新的特征数值,对DNA序列进行相似性比较,得到了与现有的资料符合很好的结果.  相似文献   

9.
DNA序列中的结构与简化模型   总被引:3,自引:0,他引:3  
本文简述 2 0 0 0年全国大学生数学建模竞赛 A题的科学研究背景 ,以及题目的立意和设计 .进而对解答 A题的大学生们的出色方法进行介绍与评述  相似文献   

10.
对基于谱分析的DNA序列识别中相关问题建立了数学模型,并进行了计算及结果分析.提出了一种基于频数二次型的功率谱快速算法和基于帕斯瓦尔定理的信噪比快速算法,建立了基于模糊逻辑的自适应阈值模型,提出了基于重复序列的边界搜索算法,最后利用谱分析对基因突变中的伪鞍部进行了识别.  相似文献   

11.
在文献中,DNA序列曾被描述为一维游动和三维游动.对前者,一个游动对应于多个DNA序列;对后者,游动和DNA序列一一对应.我们发现在三维游动(xn,yn,zn)中,由xn,yn和zn中任意有序的两个给出的二维游动已经与DNA序列一一对应,且余下的一维游动由该二维游动完全决定.因此,二维游动似乎是描述DNA序列最合适的模型.4个碱基A,C,G和T共有4 !=24个排序.每一个排序都给出DNA序列用二维游动的一种描述.两个游动(x'n,y'n)和(x"n,y"n)被看作是等价的,如果(x'n,y'n)=(εx"n,δy"n)或(εy"n,δx"n),这里ε=±1,且δ=±1.于是这24个类型的游动被分成三个等价类;它们的代表分别是(xn,yn),(yn,zn),和(xn,zn),这里(xn,yn,zn)正好是张和张的三维游动.  相似文献   

12.
基于结构矩阵的DNA序列的相似性模型   总被引:1,自引:0,他引:1  
通过一维映射把DNA序列转化为时间序列,即把数字1,2,3,4分别分配给组成DNA序列的核苷酸A,T,G,C,用时间序列的结构矩阵来描述DNA序列的结构特征,并根据结构矩阵的一些性质定义了结构矩阵的相似性度量,进而利用结构矩阵之间的相似性度量构建了比较DNA序列的相似性模型,以9个不同物种的β-球蛋白基因的第一个外显子(表1)为例验证了该模型的适用性.并得到了较好得结果.  相似文献   

13.
DNA or protein sequences are usually modeled as probabilistic phenomena. The simplest model is created on the assumption that the nucleotides at the various sites are independently distributed. Usually the type of nucleotide at some site depends on the type at another site and therefore the DNA sequence is modeled as a Markov chain of random variables taking on the values A, G, C and T corresponding to the four nucleotides. First order or higher order Markov models provide better fit to a DNA sequence. Based on this remark, the aim of this paper is to present and study a family of test statistics for testing order Markov dependence in DNA sequences. This new family includes as a particular case the classical likelihood ratio test. A simulation study is presented in order to find test statistics, in this family, with a better behaviour than the likelihood ratio test.  相似文献   

14.
Turyn‐type sequences, , are quadruples of ‐sequences , with lengths , respectively, where the sum of the nonperiodic autocorrelation functions of and twice that of is a δ‐function (i.e., vanishes everywhere except at 0). Turyn‐type sequences are known to exist for all even n not larger than 36. We introduce a definition of equivalence to construct a canonical form for in general. By using this canonical form, we enumerate the equivalence classes of for . We also construct the first example of Turyn‐type sequences .  相似文献   

15.
A. Cherrabi 《代数通讯》2013,41(1):184-188
In this article, we give a comparison between the behavior of R-regular sequences under passage to quotient and to localization and that of R-quasi-regular sequences. On the other hand, we use these results to construct two examples of R-quasi-regular sequences which are not R-regular.  相似文献   

16.
A basic sequence of unit norm vectors in a Banach space doesnot in general have a bounded basic associated sequence of functionals.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号