关键词不能为空

当前您在: 主页 > 数学 >

数学建模_DNA序列分类模型论文终稿

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2020-09-18 02:51
tags:高中数学论文

高中数学矢量计算-高中数学必修二视频教学苗金利

2020年9月18日发(作者:瞿同祖)



DNA序列分类模型













DNA序列分类模型



毕业设计(论文)原创性声明和使用授权说明

原创性声明
本人郑重承诺 :所呈交的毕业设计(论文),是我个人在指导教
师的指导下进行的研究工作及取得的成果。尽我所知, 除文中特别加
以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研
究成果,也不 包含我为获得 及其它教育机构的学位或学历
而使用过的材料。对本研究提供过帮助 和做出过贡献的个人或集体,
均已在文中作了明确的说明并表示了谢意。
作 者 签 名: 日 期:
指导教师签名: 日 期:

使用授权说明

本人完全了解 大学关于收集、保存、使用 毕业设计(论
文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电
子版本;学校 有权保存毕业设计(论文)的印刷本和电子版,并提供
目录检索与阅览服务;学校可以采用影印、缩印、 数字化或其它复制
手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分
或全部内 容。
作者签名: 日 期:



学位论文原创性声明
本人郑重声明:所呈交的论文是本人在导师的 指导下独立进行研
究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文
不包含任 何其他个人或集体已经发表或撰写的成果作品。对本文的研
究做出重要贡献的个人和集体,均已在文中以 明确方式标明。本人完
全意识到本声明的法律后果由本人承担。

作者签名: 日期: 年 月 日

学位论文版权使用授权书
本学位论文作者 完全了解学校有关保留、使用学位论文的规定,
同意学校保留并向国家有关部门或机构送交论文的复印件 和电子版,
允许论文被查阅和借阅。本人授权 大学可以将本学位
论文的全部 或部分内容编入有关数据库进行检索,可以采用影印、缩
印或扫描等复制手段保存和汇编本学位论文。
涉密论文按学校规定处理。

作者签名: 日期: 年 月 日
导师签名: 日期: 年 月 日



注 意 事 项
1.设计(论文)的内容包括:
1)封面(按教务处制定的标准封面格式制作)
2)原创性声明
3)中文摘要(300字左右)、关键词
4)外文摘要、关键词
5)目次页(附件不统一编入)
6)论文主体部分:引言(或绪论)、正文、结论
7)参考文献
8)致谢
9)附录(对论文支持必要时)
2.论文字数要 求:理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),
文科类论文正文字数不少 于1.2万字。
3.附件包括:任务书、开题报告、外文译文、译文原文(复印件)。
4.文字、图表要求:
1)文字通顺,语言流畅,书写字迹工整,打印字体及大小符合要求, 无错别字,不准
请他人代写
2)工程设计类题目的图纸,要求部分用尺规绘制,部分用计算机 绘制,所有图纸应符
合国家技术标准规范。图表整洁,布局合理,文字注释必须使用工程字书写,不准用 徒
手画
3)毕业论文须用A4单面打印,论文50页以上的双面打印
4)图表应绘制于无格子的页面上
5)软件工程类课题应有程序清单,并提供电子文档
5.装订顺序
1)设计(论文)
2)附件:按照任务书、开题报告、外文译文、译文原文(复印件)次序装订
3)其它



摘要
本文分析了已知类别的人工DNA序列的特征,建立了聚类分 析延拓模型和
马尔可夫模型,分别对未知类别的人工DNA序列和自然序列进行分类,根据分
类 效果选出了较优模型。
首先对数据进行预处理,得到人工DNA序列的单个碱基丰度和不同碱基丰度
之比等特征量,进而分析A、B两类的差异,得到合适的特征判定条件对未知类
别的DNA序列 进行分类。计算人工DNA序列的特征量,给出各序列的统计数据。
其次用聚类分析延拓模型进行分 类。用A、B两类具有明显差异的特征作为
样品特征变量,得到欧式空间中表征编号1-20人工DNA 序列的特征向量,计算
两两之间的Lance和Williams距离进行相似性度量,逐步选择相似性 较大的归为
一类,同时不断更新类内的标准比较特征向量,对聚类方法进行延拓,最终得到
类内 差异小、类间差异大的A、B两类,建立了聚类分析延拓模型。再对选取的
特征变量进行改进,提高模型 的分类效果。最后,借助均值、方差和相关系数等
参数对改进模型的分类效果进行分析。
再次用马尔可夫模型进行分类。将DNA序列看成是马尔可夫链,求出编号
1-10和11-20人工D NA序列在已知当前碱基种类的条件下,下一个碱基出现任
一种的概率,结果存入概率转移矩阵1和2, 再利用矩阵1和2分别求出编号1-20
中任一条DNA序列出现的概率,选择较大的一个作为该DNA 序列的分类,建立
马尔可夫模型。再进行与聚类分析延拓模型类似的改进和检验工作,然后对编号
21-40人工DNA序列和182条自然序列进行分类,得到最终结果。
最后,用层次分 析法综合评价模型一与模型二,选择聚类分析延拓模型作为
最终模型,其分类结果作为最终结果,具体如 下:
编号21-40人工DNA序列中属于A类的样品编号为:22,23,25,27,29,
3 0,34,35,36,37,39;属于B类的样品编号为:21,24,26,28,31,32,
33,38,40。
182条自然序列中,属于B类的样品编号为:7,10,12,22, 23,24,26,
28,30,34,43,48,50,54,57,65,75,76,80,8 4,85,86,92,98,
103,107,110,114,116,119,121,122, 123,127,128,129,130,131,
137,138,140,142,143,14 4,146,151,156,159,161,162,163,166,
168,170,173, 174,175,179,180,181,182;其余为A类。




关键词
DNA序列分类 聚类分析延拓法 Lance和Williams距离 马尔可夫

一、问题重述



1.1题目背景
(1)2000年6月,人类基因组计划中DNA全序列草图完成,预计2001年可
以完成精确的全 序列图,此后人类将拥有一本记录着自身生老病死及遗传进化的
全部信息的“天书”。
(2)这本 “天书”是由4个字符A,T,C,G按一定顺序排成的无间隔的长
约30亿的序 列,除了这4个字符表示4种碱基以外,人们对它包含的“内容”
知之甚少。因此,破译这部世界上最巨 量信息的“天书”是二十一世纪最重要的
任务之一。
(3)为解读这部“天书”,首先要研究 DNA全序列具有什么结构,以及由这
4个字符排成的看似随机的序列中隐藏着什么规律,这也是生物信 息学最重要的
课题。
1.2题目信息
(1)DNA序列分为编码区与非编码区。编 码区是用于编码蛋白质的序列片段,
即由这4个字符组成的64种不同的3字符串,其中大多数用于编码 构成蛋白质
的20种氨基酸。
(2)在不用于编码蛋白质的序列片段中,A和T的含量特别多 些,于是以某
些碱基特别丰富作为特征去研究DNA序列的结构也取得了一些结果。
(3)利用统计的方法还发现序列的某些片段之间具有相关性。
这些发现说明DNA序列中存 在着局部的和全局性的结构,充分发掘序列的结
构对理解DNA全序列有十分重要的意义。目前在这项研 究中最普通的思想是省略
序列的某些细节,突出特征,然后将其表示成适当的数学对象。

1.3题目要求

(1)有20个已知类别的人工制造的DNA序列(见附件1),其中序列标号1
—10 为A 类,11-20为B类。从中提取特征,构造分类方法,并用这些已知类
别的序列,衡量所选分类方法是 否足够好。
(2)用(1)中的分类方法对另外20个未标明类别的人工序列(见附件1,
标 号21—40)进行分类,根据分类效果对方法不断完善,将得到的最终结果用
序号(按从小到大的顺序 )标明它们的类别(A类或B类,无法分类的不写入)。
要求详细描述所选的分类方法,给 出计算程序。若论文中部分地使用了现成
的分类方法,应将方法名称准确注明。
(3)已知 182个自然DNA序列(见附件2),它们都较长。同样用以上所选
的分类方法对它们进行分类,并根 据分类效果对方法不断完善,像(2)中一样
给出最终的分类结果。

二、 名词解释
1.编码区与非编码区:编码区是指DNA上编码蛋白质的序列片段,而非编码区不
用于编码蛋白质。
2.聚类分析:由已知数据,计算各个观察个体或变量之间亲疏关系的统计量。再< br>根据某种准则(最短距离法、最长距离法、中间距离法、重心法等),使同一


< br>类内的差别较小,而类与类之间的差别较大,最终将观察个体或变量分为若干
类的分类方法。其中 ,对样品所作的分类为Q-型聚类,对变量所作的分类为R-
型聚类。
3.相似性度量:对数 值型数据而言,两个个体的相似度是指它们在欧氏空间中互
相邻近的程度;而对分类型数据而言,两个个 体的相似度与它们取值相同的属
性的个数有关。
4.样品:每个观察个体即每条DNA序列为一个样品。
5.样品变量:每个样品所具有的不同特征用不同的变量来表示,变量数等于特征
数。
6.碱基丰度:每条DNA序列中碱基A、G、C或T出现的频率。
三、 问题分析
DNA序列分类问题要求在对DNA序列的一些规律和结构有所了解的基础上,
从20个已知类别的人 工制造的DNA序列中提取特征,构造分类方法,并用所选
择的分类方法对其余未知类别的20个人工制 造的DNA序列以及182个自然DNA
序列进行分类。
3.1建模目标的分析
D NA序列分类是一个复杂的统计分析问题,数据量大,影响因素多,无法直
接从20条已知类别的人工制 造的DNA序列中提取出所有的有效特征,因此有必
要对这20条DNA序列进行预处理。
观 察并分析数据预处理结果,归纳总结出A类和B类的有效特征,将其表示
成适当的数学对象,并选择适当 的分类方法,建立普遍意义下数学模型,再用得
到的模型对其余未知类别的20个人工制造的DNA序列 以及182个自然DNA序列
进行分类。
由题意,建立的数学模型应该保证分类结果具有以下特点:
(1)类别间差异尽量大;
(2)类别内差异尽量小;
(3)样品能够尽可能的落入A、B范围,且只能落入其中的一个。
3.2建模及求解方向
1.分析已知类别的DNA序列1-20的结构,提取出相应的特征。
主要的特征有:碱基的 丰度、碱基或碱基序列的重复出现情况、碱基或碱基
序列之间的相邻情况、不同碱基的丰度之比(如碱基 A与碱基T的丰度之比)等。
2. 根据提取出的特征,选用合适的分类方法。
对数据进行预处理后,尝试以下方法建立模型:
(1)根据聚类分析法,建立模型一。
由题意,DNA序列分类属于对样品所做的分类,为Q-型聚类。首先引入样品
变量,例如可选 择碱基T的丰度、碱基G的丰度、碱基T与碱基G的丰度之比、
碱基A与碱基T的丰度之比等。由已知数 据,计算出每条已知类别的人工制造的
DNA序列的各个样品变量值,存入向量中。
根据相似 性度量原理,计算20个样品两两之间的Lance和Williams距离,
选择相距最远的两个样品 (假设为样品3和样品16)分别作为A类和B类,再
分别以样品3和样品16为标准点,通过分别计算 样品3和样品16与其余18个
样品之间的Lance和Williams距离,找出与其相距最近的一 个样品(假设为样
品1和样品18)归为一类。此时,新的标准点变为样品1与样品3的中点、样



品16与样品18的中点。然后再以新的标准点为基准,分别找出与其相距最近的< br>一个样品归为一类。逐步进行下去,直至20个样品被明显分成A、B两类。
(2)根据马尔可夫法,建立模型二。
以单个碱基为单位,分别统计编号1-10和编号11 -20人工制造的已知类别
的DNA序列中4种碱基出现的次数,再以相邻的两个碱基为单位(共16种 组合
情况),分别统计编号1-10和编号11-20的DNA序列中16种碱基对出现的次数。
为满足大样本需求,将A类和B类中的10条DNA序列组合起来看作两个大样品,
单个碱基或碱基对 出现(不包括上一条链的末尾碱基与下一条链的初始碱基组合
的情况)的次数为10条序列之和。 由条件概率的思想,分别求出A类和B类大样品中在已知当前碱基种类(可
以为A、G、C、T中任 何一个)的条件下,下一个碱基分别为A、G、C、T的概率,
存入两个矩阵1和2中。对于任何一条给 定的DNA序列,可将其看作一个已经发
生的事件,说明该事件发生的概率比较大。用矩阵1和矩阵2分 别求出这一事件
发生(即形成当前DNA序列)的概率,若用矩阵1算出该编号的DNA序列出现的概率较大,则该编号的DNA序列属于A类,否则属于B类。
3.模型的初步检验与改进。 用编号1-20已知类别的序列,分别衡量模型一与模型二中所选方法是否足
够好,不断改进,尽可 能使1-20号DNA序列在所选分类方法下,所得结果与已
知分类完全一致。改进时,对于聚类分析法 ,可以尝试改变样品变量的个数或者
改变样品变量的组合方式;对于马尔可夫法,可以尝试引进中间变量 ,运用隐马
尔可夫法求解。
4.模型的进一步检验与完善。
(1)用以上的得到的 两种分类方法对编号20-40未知类别的人工序列、182
个自然序列进行分类。
(2)通 过计算样品方差、均值等比较两种分类方法得到的分类结果与建模目
标——类别间差异尽量大、类别内差 异尽量小、样品能够尽可能的落入A、B范
围,且只能落入其中的一个——的接近程度。
(3)选择更接近建模目标的一种分类方法作为最终的分类方法,其分类结果
即为最终结果。
四、基本假设
1.假设所给的DNA序列片段中没有断句和标点符号。
2.假设具有特殊碱基的DNA序列中,特殊碱基可以剔除,其影响可以忽略。
3.较长的182个自然序列与已知类别的20个样本序列具有共同的特征。
4.假设给定的DNA序列均是从全序列中随机截取出来的,无法确定序列的起始位,
无法从序列中辨认出氨基酸,所以,在对DNA 序列分类时,从碱基层次上进行
分类, 而不是从氨基酸层次上分类。
五、定义与符号说明
n
i
:各个样品中碱基
i
出现的数量,i为A、T、C或G

N
i
:第i个样品的总碱基数目
F
i
:各个样品中碱基
i
的丰度,i为A、T、C或G



x
i
:各个样品的第i个特征变量
f
ij
:各个样品中碱基i和碱基j的比值,i,j为A、T、C或G
Y
i
:第i个样品的特征向量
d
ij
:向量
Y< br>i
和向量
Y
j
间的Lance和Williams距离
p
:特征向量的分量个数,即向量的维数
k
:特征向量的第k个分量
n
:样品的个数
x
ik
:特征向量i的第k个分量
d< br>max
:不同向量代表的
d
min
:不同向量代表的
p
维空间中任意两点间Lance和Williams距离的最大值
p
维空间中任意两点间Lance和Williams距离的最小值
y
i
:聚类分析中i类的标准向量,i为A或B
六、数据预处理

1.A类和B类样品单个碱基丰度的计算
用maTlab编写程序(见附件3),分别求出2 0条已知类别的人工制造的DNA
序列中,4种碱基的丰度,绘出散点图如下:

图6.1.1 单个碱基丰度比较图
分析上图可得, A类和B类DNA序列中碱基T和碱基G的丰度有明显差异,
而碱基A和碱基C的丰度则比较接近。



2. A类和B类样品不同碱基丰度之比的计算

用mat lab编写程序(见附件4),分别求出20条已知类别的人工制造的DNA
序列中,不同碱基的丰度之 比,包括
f
TA

f
CA

f
GA

f
CT

f
GT

f
GC

绘出散点
图如下:

图6.1.2 不同碱基丰度之比的比较图

分析上图可得, A类和B类DNA序列中,碱基T与碱基A的丰度之比、碱
基G与 碱基A的丰度之比、碱基C与碱基T的丰度之比、碱基G与碱基T的丰度
之比有明显差异,而碱基C与碱 基A的丰度之比、碱基G与碱基C的丰度之比则
比较接近。
3.将编号1-40人工制造的D NA序列的中,碱基T的丰度、碱基G的丰度、碱基
T与碱基A的丰度之比、碱基G与碱基A的丰度之比 、碱基C与碱基T的丰度之
比、碱基G与碱基T的丰度之比,用表格的形式加以表达(见附件5,表1) 。
4.统计所有DNA序列中碱基A、T、C、G的比例,发现在未知类别的人工制造的
DN A序列以及自然序列中并非只存在A、T、C、G四种碱基,还存在n、s、w、y
等特殊碱基,这可能 和生物自身需要完成的特定功能有关,具体列表如下:

表2 特殊的DNA序列及特殊碱基种类
DNA序列 特殊碱基 DNA序列 特殊碱基



人工—37号 s 自然—131 n
自然—71 n 自然—147 n
自然—101 n、s 自然—169 n
自然—105 r、s、w、y
由上表可知,编号1-20的人工制造的DNA序列中并未出现特殊碱基 ,所以
在提取特征时不需要考虑特殊碱基的影响,同样,在处理编号21-40的人工制造
的D NA序列以及182条自然序列时,也不必考虑特殊碱基的影响,使用数据时,
可将特殊碱基直接剔除。
七、模型的建立与求解

7.1模型一:聚类分析延拓模型
要使DNA序列 的分类能够尽量科学合理,集中要解决的问题是让分类后的
样品满足:同类样品间的差异性尽可能小,不 同类样品间的差异性尽可能大。
为达到上述目的,引入聚类分析模型对不同的DNA序列进行分类。
7.1.1模型一的建立
聚类分析方法根据分类对象的不同可以分为两类:1.对样品所作的分类,
即Q- 型聚类,2.对变量所作的分类,即R- 型聚类。此问题将给出的不同DNA序列
看成是不同的样品,选用Q-型聚类进行具体求解。
(1)样品特征变量的引入
为了刻画不同样品的性质,需要对样品引入统一的特征作为样品特 征变量,
特征变量的确定来源于聚类分析前对数据进行预处理得到的分析结果。
1)样品中A,C,T,G的碱基丰度
样品i中A碱基丰度的计算:

F
A
?n
A
N
i
(1)
其他碱基丰度的计算方法同上。
绘出编号1-20的人工制造的已知类别的DNA序列 中4种碱基丰度的离散统
计图(图6.1.1)。
观察该散点图,进行数据分析可得:DNA 序列中碱基A和碱基C在分类A和
B中的区分不大,均大致在相同的频率区间内波动,故不选用碱基A和 碱基C的
丰度作为特征区分;而DNA序列中碱基T和碱基G在分类A和B中的区分较大,
A类 和B类相应的碱基丰度分别集中在不同的频率区间范围内,故选用碱基T和
碱基G的丰度作为特征区分。
将T的碱基丰度作为样品的第1个特征变量,记为
x
1

将G的碱基丰度作为样品的第2个特征变量,记为
x
2

2)样品不同碱基间的比例
样品i中碱基T和碱基A的比值计算:
f
GT
?n
G
n
T

(2)
其他碱基比例的计算方法同上。
绘出编号1-20的人工制造的已知类别的DNA序列中不同碱基的丰度之比的



离散统计图(图6.1.2)。
观察该散点图,进行数据分析可得:DNA序列中碱基T和碱 基A的丰度之比
以及碱基G和碱基T的丰度之比在分类A和B中的区分较大,A类和B类相应
的 碱基丰度之比分别集中在不同的频率区间范围内,故选用碱基T和碱基A的丰
度之比以及碱基G和碱基T 的丰度之比作为特征区分。
将碱基T和碱基A的比值作为样品的第3个特征变量,记为
x
3

将碱基G和碱基T的比值作为样品的第4个特征变量,记为
x
4

(2)样品特征数据的向量转化
把上述得到的4种特征变量分别作为一个向量的四个分量,用 该向量作为样
品特征向量来描述不同样品。
由附件5表1,编号1-40样品的
x< br>1

x
2

x
3

x
4< br>的值分别为表中的第1、2、
3、6列。
于是得到编号1-20的样品的20个特征向量如下:
Y
1
?(0.1351, 0.3964, 0.4545, 2.9333)

Y
2
?(0.1532, 0.4144, 0.5667, 2.7059)

Y
3
?(0.0631, 0.4505, 0.2333, 7.1429)

Y
4
?(0.2883, 0.1802, 0.6809, 0.6250)

Y
5
?(0.1081, 0.4234, 0.4615, 3.9167)

Y
6
?(0.1261, 0.3964, 0.3590, 3.1429)

Y
7
?(0.1892, 0.3604, 0.5385, 1.9048)

Y
8
?(0.1892, 0.3694, 0.6774, 1.9524)

Y
9
?(0.1532, 0.4324, 0.7391, 2.8235)

Y
10
?(0.1364, 0.4091, 0.7500, 3.0000)


Y
11
?(0.5000, 0.1000, 1.4103, 0.2000)

Y
12
?(0.5000, 0.1455, 1.5278, 0.2909)


Y
13
?(0.5182, 0.1273, 2.0357, 0.2456)

Y
14
?(0.5000, 0.1182, 1.6667, 0.2364)

Y
15
?(0.6455, 0.0636, 2.2188, 0.0986)

Y
16
?(0.4636, 0.0909, 1.2750, 0.1961)


Y
17
?(0.2636, 0.1364, 0.7436, 0.5172)

Y
18
?(0.5000, 0.0909, 1.7188, 0.1818)


Y
19
?(0.5636, 0.0727, 2.5833, 0.1290)

Y
20
?(0.5636, 0.0636, 2.8182, 0.1129)

(3)不同样品的相似性度量(分析编号1-20的样品)
因为20个已知类别的DNA序列的样品变量均属于数值型数据,所以两个个
体的相似度是指它 们在欧氏空间中互相邻近的程度。据此,引用距离测度来描述
不同样品的相似性。距离测度小的两个样品 ,相似性较高;反之,距离测度大的
两个样品,相似性较低。
为了排除不同变量之间的相互影 响,以及减弱较大数据出现时对结果的不良
影响,即减弱较大值(包括异常值)的敏感度。选用Lanc e和Williams距离来描
述距离测度,进而衡量不同样品间的相似性。此外,Lance和Wil liams距离还与



样品变量的单位无关,使结果无量纲化。
向量
Y
i
和向量
Y
j
间的Lance和Williams距离为 :
d
ij
?
?
(3)
p
|x
ik?x
jk
|
k?1
(x
ik
?x
jk
)


用公式(3)计算所有向量所代表的
p
维空间中所有样品点之间的两两距离。
2
由排列组合知识,所有向量(n个)进行两两组合的个数为:
C
n
,分别 计算
出每个组合的Lance和Williams距离。
2
本次聚类中选用的向量个 数为n=20,一共有
C
20
?190
种组合,用matlab编
程 (见附件6 )求解出所有组合的Lance和Williams距离,并对数据进行比较
得出
d
max
?3.3671


(4)根据距离测度进行分类
1)样品数据分成两类
由上述得到的
d
max
,查找
d< br>max
所对应的向量组合,假定该向量组合是向量
Y
i
和向量
Y
j
,则将第i个样品和第j个样品分为A,B两类,可以令i样品为A类,
令j样品 为B类。分别将
Y
i

Y
j
作为A,B两类的标准向量y
A

y
B
对剩余样品进
行分类。
2)剩余样品分类
样品i和样品j分完类后,还剩余(n-2)个样品未进行分类,将这(n -2)个
样品数据分别和A类的标准向量
y
A
进行组合,计算出每个组合的L ance和
Williams距离,将所得的距离进行比较,得出最小的
d
min,查找
d
min
所对应的向
量,假定该向量是
Y
a,则将该向量和样品i分为一类,同属于A类。用同样的方
法把这(n-2)个样品数据分别和B类 的标准向量
y
B
进行组合,得出最小的
d
min

假定该组合所对应的向量是
Y
b
,则将该向量和样品j分为一类,同属于B类。 此时得到A组为
Y
a

Y
i
。B组为
Y
b

Y
j

A,B两类标准的重新计算:将此时A,B组中的所 有向量分别求出平均值得
到A,B类的新的标准向量。
A类的标准向量:

y
A
?(Y
a
?Y
i
)2
(4)



B类的标准向量:

y
B
?(Y
b
?Y
j
)

2
(5)
3)上述步骤后 还剩余(n-4)个样品未进行分类,依照2)剩余样品分类给
出的方法不断重复进行计算,对所有的剩 余样品均实现分类。
7.1.2模型一的求解
按照上述方法首先计算得到这些样品中向量< br>Y
3
和向量
Y
20
间的Lance和
William s距离最大,则将第3个样品和第20个样品分为A,B两类。令第3个样
品为A类,第20个样品为B 类。按照7.1.1中的步骤依次进行分类,用matlab
编程(见附件7)求解得到分类结果如下:
A类的样品编号为:1,2,3,5,6,7,8,9,10,17;
B类的样品编号为:4,11,12,13,14,15,16,18,19,20。
7.1.3模型一的检验与改进
(1)模型一的改进与可行性分析
由以上分类结果 可知,用聚类分析延拓法对编号1-20人工制造的DNA序列
进行分类的结果与已知分类结果并非完全 一致。在此分类方法下,第4条DNA
序列不再属于A类,而属于B类;第17条DNA序列不再属于B 类,而属于A
类。因此,有必要对模型进行改进。
可以改变样品变量的组合方式,选择碱基T 的丰度、碱基T与碱基A的丰度
之比、碱基C与碱基T的丰度之比、碱基G与碱基T的丰度之比作为四个 样品变
量,分别设为
x
1

x
2

x3

x
4

由附件5表1,编号1-40样品的
x< br>1

x
2

x
3

x
4< br>的值分别为表中的第1、3、
5、6列。
得到编号1-20的样品的20个特征向量如下:
Y
1
?(0.1351, 0.4545, 1.2667, 2.9333)

Y
2
?(0.1532, 0.5667, 1.0588, 2.7059)

Y
3
?(0.0631, 0.2333, 3.4286, 7.1429)

Y
4
?(0.2883, 0.6809, 0.3750,0.6250)

.
.
.
Y
17
?(0.2636, 0.7436, 0.9310,0.5172)

Y
18
?(0.5000,1.7188, 0.2364, 0.1818)

Y
19
?(0.5636, 2.5833, 0.2581, 0.1290)

Y
20
?(0.5636, 2.8182, 0.3065, 0.1129)


用公式(3)计算20个向量所代表的4维空间 中所有样品点两两之间的Lance
和Williams距离,并按照7.1.1中的距离测度法对编号 1-20人工制造的DNA序
列进行分类得到的分类结果如下

A类的样品编号为:1,2,3,4,5,6,7,8,9,10;
B类的样品编号为:11,12,13,14,15,16,17,18,19,20。
由以上分类结果可知,改变样品变量的组合方式,选择碱基T的丰度、碱基


< br>T与碱基A的丰度之比、碱基C与碱基T的丰度之比、碱基G与碱基T的丰度之
比作为四个样品变 量后,用聚类分析延拓法对编号1-20人工制造的DNA序列进
行分类的结果与已知分类结果完全一致 。
所以,该分类方法可行。
(2)模型一的进一步检验与实践
1)用模型一中改进后的聚类分析延拓法,对编号21-40人工制造的DNA
序列进行分类,对附件7 中的程序稍作修改,求解得到分类结果如下:
A类的样品编号为:22,23,25,27,29,30,34,35,36,37,39;
B类的样品编号为:21,24,26,28,31,32,33,38,40。
2)用模型 一中改进后的聚类分析延拓法,对182个自然DNA序列进行分
类,同样对附件7中的程序稍作修改, 求解得到分类结果如下:
B类的样品编号为:7,10,12,22,23,24,26,28,30 ,34,43,48,
50,54,57,65,75,76,80,84,85,86,92,98, 103,107,110,114,
116,119,121,122,123,127,128,12 9,130,131,137,138,140,142,
143,144,146,151,156, 159,161,162,163,166,168,170,173,174,
175,179,18 0,181,182;
其余的自然DNA序列为A类。
7.1.4模型一改进后分类效果的评价
(1)求出A类中10条DNA序列4个样品变量( 碱基T的丰度、碱基T与碱基
A的丰度之比、碱基C与碱基T的丰度之比、碱基G与碱基T的丰度之比) 的平
均值,作为A类的标准点a;求出B类中10条DNA序列4个样品变量的平均值,
作为B 类的标准点b:
a=(0.1393,0.5311,1.5172,3.2803);b=(0.5 020,1.8300,0.2618,0.2131)。
(2)计算A类中10个样品点与标准点a 之间的Lance和Williams距离,并求出
距离的平均值和标准差:平均值
a
1
?0.7224

标准差
?
a1
?0.5298
;计算B类中
10个样品点与标准点a之间的Lance和Williams距离,并求出距离的平均值 和
标准差:平均值
a
2
?2.6923

标准差
?
a2
?0.4646

(3)计算A类中10个样品点与标准点b之间的L ance和Williams距离,并求出
距离的平均值和标准差:平均值
b
1
?2.5116

标准差
?
b1
?0.5193
;计算B 类中
10个样品点与标准点b之间的Lance和Williams距离,并求出距离的平均值和
标准差:平均值
b
2
?0.7227

标准差
?
b2
?0.5323

(4)对以上数据进行分析。
若分类方法合理,那 么不同类别之间的差别应尽可能大,即
a
1

a
2
的差别、
b
1

b
2
的差别应尽可能大;同类之间的差别应尽可能小 ,即
?
a1

?
a2

?
b1

?
b2
应尽可能小。

此外,定义相关系数:
r
X
?
?
X1
?
?
X2
|X
1
?X
2
|




X为a时,表示选择 标准点a进行评价时的相关系数,
r
a
?
?
a1
?
?
a2
|a
1
?a
2
|
?0.5048

X为b时,表示选择标准点b进行评价时的相关系数,
r
b
?
?b1
?
?
b2
|b
1
?b
2
|

?0.5879

由均值和标准差的含义,为使A类与B类之间的差别尽可能大, 那么相关系
数r应该尽可能小,由以上结果

r
a

rb
的大小均为0.5左右,可知该分类方法合
理,且能够达到较好的分类效果。
7.2模型二:马尔可夫模型
7.2.1模型的建立与求解
(1)DNA序列的马尔可夫链转换
把DNA的一个样品序列看成是一个系统,组成该DNA 序列的不同位置的碱
基看成是这个系统中的相应的不同状态。DNA的长度为N,则该系统有N个状态,分别记为
S
1,
S
2
,...,S
N
,每 个状态对应一个碱基。这样给定的一条长度为N的
DNA序列转化成有N个状态组成的系统,即为
S
1,
S
2
,...,S
N
。随着时间的推移,系
统从某一状态转移到另一状态,设
q
t
为时间t的状态(
q
t?S
j
),系统在t时间
的状态
q
t?1
只与其在时间 t-1的状态相关(
q
t?1
?S
i
),其概率为
P(q< br>t
|q
t?1
)
。这样
将该系统转换成一个离散的一阶马尔可 夫链。
(2)不同碱基的组合情况
将4个碱基进行两两组合,用表格的形式进行考虑。
表3 两个碱基的组合情况

碱基A
碱基T
碱基C
碱基G
碱基A
AA
TA
CA
GA
碱基T
AT
TT
CT
GT
碱基C
AC
TC
CC
GC
碱基G
AG
TG
CG
GG
两个碱基组合排列一共有16种情况。(
P
?
AT
?
表示在前一状态为碱基A的
情况下后一状态出现碱基T的概率,其他字母表示意义和上述同)
(3)中间状态发生的概率
中间状态:系统中除第一个状态和最后一个状态外均称为中间状态。
以A类情况下AT的情况为例进行计算:
给定的A类样品为编号1-10的DNA序列,将这10条DNA序列组合作为一个
大样品。
n
AT
表示一条DNA链中碱基A后出现
n
A
表示在该样品 中出现碱基A的个数,
碱基T的情况组合起来看成一个新的碱基(AT),该样品中碱基(AT)的个数 。



P
?
AT
?
的概率:
P
?
AT
?
?P(T|A)?n
AT
n
A
(6)
根据上述的计算公式,算出A类其余15种组合的概率。
B类的计算情况和A类的情况相同。
根据A类,B类给出的DNA序列具体进行计算,得到以下表格:
表4 A类不同中间状态发生的概率表

碱基A
碱基T
碱基C
碱基G

碱基A
P(AA)=0.3662
P(TA)=

0.2456
P(CA)= 0.2359
P(GA)=0.2601
碱基T
P(AT)=

0.1911
P(TT)= 0.3275
P(CT)= 0.1385
P(GT)= 0.0644
碱基C
P(AC)=

0.1911
P(TC)= 0.1696
P(CC)= 0.0974
P(GC)= 0.2029
碱基G
P(AG)=

0.2516
P(TG)= 0.2573
P(CG)= 0.5282
P(GG)= 0.4726
表5 B类不同中间状态发生的概率表

碱基A 碱基T
碱基A
P(AA)=0.3707 P(AT)=

0.4081
碱基T
P(TA)= 0.2701 P(TT)= 0.5931
碱基C
P(CA)= 0.2182 P(CT)= 0.4727
碱基G
P(GA)=0.3063 P(GT)= 0.3964
(4)待判定分类DNA序列的概率计算
碱基C
P(AC)=

0.1184
P(TC)= 0.0858
P(CC)= 0.1636
P(GC)= 0.0811
碱基G
P(AG)=

0.1028
P(TG)= 0.0511
P(CG)= 0.1455
P(GG)= 0.2162
给定一条长度为N的DNA,将其转换为系统状态序列
S
1,
S
2
,...,S
N
,每一个系
统状态对应 同一位置DNA序列给出的一个碱基,计算该DNA序列产生的概率。
该DNA序列系统产生的概率计算公式:

P(S
1
,S
2
,S
3
,...,S
n
)=P(S
1
)P(S< br>2
|S
1
)P(S
3
|S
2
)...P(S
n
|S
n?1
)
(7)
第一个状态的出现概率均设为1,即
P(S
1
)=1

分别根据A类,B类给出的中间状态出现的概率,得到该DNA序列产生概
率。
(5)DNA分类的判定
将上面得到的两个DNA序列产生概率经行比较,如果通过A类中间 状态的
概率计算值远远大于B类中间状态的概率计算值,则将该状态归为A类;同样,
若通过B 类中间状态的概率计算值远远大于A类中间状态的概率计算值,则将该
状态归为B类。
(6)实际数据的代入计算
对已知类别的20个样品依照上述方法进行分类。
表6 编号为1-10个样本产生概率统计表

样品样品
1 2
A类数
0.100.14
据计算
e-60
e-59
B类数据
0.140.13
计算
e-76 e-75
所属类别
A A
样品
3
0.14
e-56
0.86
e-80
A
样品
4
0.21
e-65
0.89
e-65
B
样品
5
0.14
e-59
0.60
e-80
A
样品
6
0.35
e-56
0.12
e-73
A
样品
7
0.63
e-59
0.22
e-71
A
样品
8
0.31
e-61
0.24
e-74
A
样品
9
0.74
e-61
0.74
e-82
A
样品
10
0.79
e-62
0.52
e-82
A



表7 编号为11-20个样本产生概率统计表
样品样品样品样品样品样品样品样品样品样品
11 12 13 14 15 16 17 18 19 20
A类
0.250.440.280.640.280.270.510.2 80.200.71
数据e-63
e-64 e-65 e-67 e-60 e-65 e-71 e-65 e-68 e-70
计算
B类
0.200.890.970 .970.260.610.290.110.190.12
数据
e-49 e-51 e-54 e-55 e-41 e-54 e-68 e-52 e-53 e-54
计算
B B B B B B B B B
所属
B
类别
根据上面的 判断结果,只有4号样品的类别出现了偏差,说明马尔可夫模型
进行判定具有一定的合理性。可以进一步 推广,对其他的DNA序列进行判别
7.2.2分类结果统计
用matlab编写 程序(见附件8)对编号21-40人工DNA序列以及182个自
然序列进行分类,结果如下。
(1)编号21-40人工DNA序列分类结果:
A类
:22,23,25,26, 27,29,30,32,33,34,35,36,37,39;
B类
: 21,24,28,31,38,40。
(2)182个自然序列分类结果:

A类
:1,2,3,4,5,6,8,9,10,11,12,13,14,15,16,17,18,19 ,20,
21,22,24,25,26,27,28,29,31,32,33,34,35,36, 37,38,39,40,41,
42,44,45,46,47,48,49,50,51,52,5 3,54,55,56,57,58,59,60,61,
62,63,64,66,67,68,69 ,70,71,72,73,74,77,78,79,80,81,82,83,
84,86,87, 88,89,90,91,93,94,95,96,97,98,99,100,101,102,104,< br>105,106,108,109,111,112,113,115,116,117,118,120 ,121,123,124,
125,126,127,129,130,132,133,134,1 35,136,137,139,140,141,142,
143,145,146,147,148 ,149,150,152,153,154,155,157,158,160,164,
165,1 67,168,169,171,172,173,174,175,176,177,178,179,180 ,181

B类
:7,23,30,43,65,75,76,85,92,103 ,107,110,114,119,122,128,
131,138,144,151,156,1 59,161,162,163,166,170,182
总计,182个自然序列分入A类的个数: 154个;182个自然序列分入B类
的个数:28个
7.2.3模型的评价
对模型的分类效果进行评价,评价标准:同类样品间的差异性较小,不同类
样品间的差异性较大,则这样 的分类效果较好;反之同类样品间的差异性较大,
而不同类样品间的差异性较小,这样的分类效果就不够 理想。
(1)检验样本的数据处理
选取前20号DNA样品作为检验样本。依照上述马尔可 夫模型的分类结果,A
类为:1,2,3,5,6,7,8,9,10。B类为:4,11,12,13 ,14,15,16,17,18,19,20。
将每一个样品的最大产生概率(每个样品有两个生成 概率,分别用A类和B
类的相应数据进行求解,其中较大的一个即为该样品的最大产生概率)作为该样< br>品的特征变量。
由于最大产生概率的数量级很小,为了后期数据处理的方便和准确性,将各



样品最大产生概率通过分别取对数的方法进行数据处理。
A类样品对应的计算结果为:-61 .0000,-59.8539,-56.8539,-59.8539,
-56.4559,-59. 2007,-61.5086,-61.1308,-62.1024
B类样品对应的计算结果为:- 65.0506,-49.6990,-51.0506,-54.0132,
-55.0132,-4 1.5850,-54.2147,-68.5376,-52.9586,-53.7212,-54.920 8。
(2)同类样品间的差异性判定
对上面的数据,按照类为单位分别计算相应的平均值, 得到A类的平均值为:
?
A
??60.3638
,B类的平均值为:
?
B
??53.5714

_
1
n
2
用 公式
S?
分别求A类和B类的无偏方差。(为方差,
S
?
i

(
?
?
?
)
?
i
n?1
i?1
2
_
__
2
第i个最大概率取对数的值,
?
为平均 概率取对数的值,
?
为标准差)
这样进一步得到A类和B类的标准差分别为
?
A
?2.6464

?
B
?6.6158
,该< br>标准差的值较小说明同类样品间的差异性较小。
(3)不同类样品间的差异性判定
将 A类的9个样品分别用A类的中间状态概率和B类的中间状态概率进行计
算得到两组平均值:
?
A1
? -60.3638

?
A2
? -66.2 520
。(
?
A1
表示A类的9个样
品用A类的中间状态概率得到平 均值,
?
A2
表示A类的9个样品用B类的中间状
态概率得到平均值) 同理将B类的11个样品分别用A类的中间状态概率和B类的中间状态概率
进行计算得到两组平均值 :
?
B1
? -76.2691

?
B2
? -5 3.5714
。(
?
B1
表示B类的11
___
_
___
?
B2
表示B类的11个样品用B类的中个样品用A类的中间状态概率得到平均 值,
间状态概率得到平均值)
A类样品的两个标准差:
S
2
A1
_
1
n
?(
?
i
?
?
A1
)
?
n?1
i?1
,
?
A1
= 2.6464

_
1
n
?
A2
= 3.1973
,
?(
?
?
?
)
?
iA2
n?1
i?1
2
2
_
S
A2
2
(
S
A1
表示A类样品通过A类的中间状态概率计算得到的方差,
?
A 1
表示A类样品
通过A类的中间状态概率计算得到的标准差,
S
A2
表示A类样品通过B类的中间
状态概率计算得到的方差,
?
A2
表示A类样品 通过B类的中间状态概率计算得到
的标准差)



A类样品中分别用A类的中间状态概率和B类的中间状态概率进行计算,所
得结果的差异性:

r
A
?
?
A1
?
?
A2
|
?
A1
?
?
A2
|
__
=0.327 3

r
A
表示A类样品中两种中间状态概率
计算结果的相关系数)
把B类的11个样品用上述的方法做同样的处理,得到B类样品中两种中间
状态概率计算结果的 相关系数:
r
B
?
?
B1
?
?
B2|
?
B1
?
?
B2
|
__
=0.88 09

上述相关系数间接刻画了两类别间的差异性大小,值越小,则说明不同类样
品间 的差异性越大;反之,值越大,则说明不同类样品间的差异性越小。
选取两个系数中的较差值
r
B
作为最后的相关性系数(依照最差值选取原则,
若最差值也能取得较好的结果,则 得到整个结果的合理性),该值较小,从而得
到不同类样品间的差异性较大。
依照上述给定的判断标准,得到马尔可夫模型的分类效果较好的结论。
7.3模型一与模型二选择的层次分析模型
本文给出了两种不同的模型对DNA序列进行了分 类,现用层次分析法综合
对两者进行比较,选出其中更优的一个模型。
该层次分析中,目标层 为选取两个模型中更优的一个;准则层为模型好坏的
评价标准,确定为两点:1.模型分类情况和给定前 20个样品的分类情况的相似
程度,2.模型自身的分类效果(同类样品间的差异性较小,不同类样品间 的差异
性较大,则自身的分类效果较好);方案层为聚类分析延拓模型和马尔科夫模型。
根据上述的层次,给出层次分析的结构图:

图7.3.1 层次分析法的结构图
1)构造准则层对于目标层的成对比较矩阵:



?
1a
?
A?
??

?
1a1
?
其中,a是表示模型与给定分类相似程度与模型自身分类效果重要性之比。
求得权向量为:
T
?
a1
?

W?
?
,
?1?a1?a
?
?
?
参数确定:a取3,表示模型与给定分类相似程度比 自身分类效果稍微重要。
2) 构造方案层对准则层各因素的成对比较矩阵并求出权向量相对于指标层模型
与给定分类相似程度:
b
1
??
1

B
1
?
??

1b1
?
1
?
其中,b1表示聚类分析延拓模型与马尔科夫模型对于指标层模型与给定分
类相似程度。

求得权向量为:

T
?
b
?
1< br>W
1
?
?
1
,

?
1?b
1
1?b
1
?
?
?
参数确定:由于聚类分析延拓模型与模 型给定人工序列的分类结果完全吻
合,而马尔科夫模型有一条链出现偏差,取b1=5;
求得相对于指标层模型自身分类效果矩阵:
?
1
B
2
?< br>?
?
1b
2
b
2
?
?

1
?
其中,b2表示聚类分析延拓模型与马尔科夫模型对于指标层模型自身分类
效果;
求得权向量为:

T
?
b
?
1
W
2
?
?
2
,

?
1?b
2
1 ?b
2
?
?
?
参数确定:由于聚类分析延拓模型和马尔科夫模型相比 ,模型自身分类效果
较佳,取b2=3;
由此求得方案最终的权重矩阵为:
T?
a
bb
1a111
?
)
?
?
1??
2
,???

W
(1
?

?
1?a1?b
1
1?a1 ?b
2
1?a1?b
1
1?a1?b
2
?
?
?
代入数据解得:
T

W
(1)
(0.8125 ,0.1875)
.
?



由结果可得聚类分析延拓模型明显优于马尔科夫模型,所以采用聚 类分析延
拓模型作为最终的DNA序列分类模型。
八、模型的评价与改进方向
8.1模型的优点
(1)对整个问题的解决,基于聚类分析法和马尔可夫法分别建立了模型一 和模
型二,从中选择较优的模型,避免单一模型解决问题,引起较大误差。
(2) 建立模型一时,对传统的聚类分析法进行改进,建立了聚类分析延拓模型。
(3)进行模型二的求解时,将结果存入矩阵,简化了运算,增加了效率。
(4)在进行模型一和模型二的选择时,采用层次分析法,综合考虑评判分类效
果的多个因素。
8.2模型的缺点
(1)在用马尔可夫模型进行分类时,编号1-20人工DNA序列的分类 结果没有达
到与已知分类结果完全一致。
(2)在进行模型一和模型二的最终选择时,综合考虑的因素还有欠缺。
8.3模型的改进方向
(1)对编号1-20人工DNA序列特征的分析还有改进之处,例如 可以考虑以三联
子密码子为单位、以相邻四个碱基为单位,分析A类和B类的差异。
(2)在 模型二中,采用马尔可夫法对后20条人工DNA序列和自然DNA序列进行
分类时,效果不是很理想, 可以考虑引进中间变量,采用隐马尔可夫法,对
模型进行改进。
九、参考文献
[1]徐全智、杨晋浩,数学建模(第二版),北京:高等教育出版社,2008.6
[2]姜启源、谢金星、叶俊,数学模型(第三版),北京:高等教育出版社,2003.8
[3]梁之舜、邓集贤、杨维权等,概率论与数理统计,中山大学数学系,1987.5
[4]彭放、杨瑞琰、罗文强等,数学建模方法,北京:科学出版社,2007.5
[5]刘祖洞,遗传学(第二版),北京:高等教育出版社,1991
[6]刘秉权,隐马尔可夫模型,2006.11
[7]吕金翅、马小龙、曹芳,DNA 序列分类的数学模型,数学的实践与认识,第
31卷第1期,2001.1
[8]樊龙江,序列分析与联配,生物信息学札记
[9]李银山、杨春燕、张伟,DNA 序列分类的神经网络方法,计算机仿真,第20
卷第2期,2003.2
[10]孟大志,DNA 序列中的结构与简化模型,数学的实践与认识,第31卷第1 期,
2001 .1
[11]电子科技大学应用数学学院,数学实验讲义,2009.9
十、附件清单
附件1:人工制造的DNA序列
附件2:自然DNA序列
附件3:A类和B类样品单个碱基丰度的计算和散点图的绘制程序
附件4:A类和B类样品不同碱基丰度之比的计算和散点图的绘制程序
附件5:编号1-40样品的不同特征变量值统计表



附件6:求解编号1-20样品两两之间Lance和Williams距离的程序
附件7:用聚类分析延拓法求解分类结果的程序
附件8:用马尔可夫法对编号21-40人工DNA序列以及182个自然序列进行分类
的程序









































附件1:人工制造的DNA序列
见文本文档

附件2:自然DNA序列
见文本文档

附件3:A类和B类样品单个碱基丰度的计算和散点图的绘制程序
clear L
fid = fopen('','r');
i=1;
while 1 %该循环将TxT文件的数据存入 L中
Tline = fgeTl(fid);
if ~ischar(Tline), break, end
if sTrcmp(Tline,'')
conTinue
end
if sTrcmp(Tline(2),'.')
L{sTr2num(Tline(1))}=Tline(3:end);
elseif sTrcmp(Tline(3),'.')
L{sTr2num(Tline(1:2))}=Tline(4:end);
end
end
fclose(fid);P=[]; % 每条序列4种碱基的频率
for i=1:size(L,2) %统计每种碱基个数特征
Tline=L{i};
P(i,1)=lengTh(find(Tline(:)=='a'));
P(i,2)=lengTh(find(Tline(:)=='T'));
P(i,3)=lengTh(find(Tline(:)=='c'));
P(i,4)=lengTh(find(Tline(:)=='g'));
P(i,:)=P(i,:).sum(P(i,:));
end
ave_a=mean(P(1:10,:));
sig_a=sTd(P(1:10,:));
ave_b=mean(P(11:20,:));
sig_b=sTd(P(11:20,:));
a_lei=[ave_a-3*sig_a;ave_a+3*sig_a];
b_lei=[ave_b-3*sig_b;ave_b+3*sig_b];
subploT(2,2,1)
ploT(1:10,P(1:10,1),'*',11:20,P(11:20,1),'.')
hold on
ploT(1:20,a_lei(1,1)*ones(1,20),'b ',1:20,a_lei(2,1)*ones(20,1),'b',1:
20,b_lei(1, 1)*ones(1,20),'g',1:20,b_lei(2,1)*ones(20,1),'g')
xlabel('碱基a')
subploT(2,2,2)



ploT(1:10,P(1:10,2),'*',11:20,P(11:20,2),'.')
hold on
ploT(1:20,a_lei(1,2)*ones(1,20),'b ',1:20,a_lei(2,2)*ones(20,1),'b',1:
20,b_lei(1, 2)*ones(1,20),'g',1:20,b_lei(2,2)*ones(20,1),'g')
xlabel('碱基T')
subploT(2,2,3)
ploT(1:10,P(1:10,3),'*',11:20,P(11:20,3),'.')
hold on
ploT(1:20,a_lei(1,3)*ones(1,20),'b ',1:20,a_lei(2,3)*ones(20,1),'b',1:
20,b_lei(1, 3)*ones(1,20),'g',1:20,b_lei(2,3)*ones(20,1),'g')
xlabel('碱基c')
subploT(2,2,4)
ploT(1:10,P(1:10,4),'*',11:20,P(11:20,4),'.')
hold on
ploT(1:20,a_lei(1,4)*ones(1,20),'b ',1:20,a_lei(2,4)*ones(20,1),'b',1:
20,b_lei(1, 4)*ones(1,20),'g',1:20,b_lei(2,4)*ones(20,1),'g')
xlabel('碱基g')
%max_ab=max([a_lei(:,[2 4]);b_lei(:,[2 4])]);
%min_ab=min([a_lei(:,[2 4]);b_lei(:,[2 4])]);
%[row col]=find(P(:,[2 4])>ones(size(P(:,[2 4]),1),1)*max_ab |
P(:,[2 4])a1=find((P(:,2)>ones(size(P(:,2),1),1)*a_lei(1 ,2)) &
(P(:,2)a2=find((P(:,4)>ones(size(P(:,4),1),1)*a_lei(1, 4)) &
(P(:,4)vec_a=inTersecT(a1,a2);
b1=find((P(:,2)>on es(size(P(:,2),1),1)*b_lei(1,2)) &
(P(:,2)b2=find((P(:,2)>ones(size(P(:,2),1),1)*b_lei(1, 2)) &
(P(:,2)vec_b=inTersecT(b1,b2)
inTersecT(vec_a,vec_b)

附件4:A类和B类样品不同碱基丰度之比的计算和散点图的绘制程序
funcTion bili
global P
global Q
Q=[];
for i=1:3
for j=i+1:4
Temp=P(:,j).P(:,i);
Q=[Q Temp];
end
end



for j=1:6
subploT(3,2,j)
i1=1:10;i2=11:20;
ploT(i1,Q(i1,j),'*r',i2,Q(i2,j),'+b')
legend('A类','B类')
xlabel(sprinTf('%d%',j))
ylabel('f(T)f(A)')
end

附件5:编号1-40样品的不同特征变量值统计表

表1 1-40号样品特征变量值统计表

碱基T碱基G碱基C
编号
碱基T碱基G与碱基与碱基与碱基
的丰度

的丰度

A的丰A的丰T的丰
度之比

度之比 度之比
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
0.1351 0 .3964 0 .4545 1 .3333
0.1532 0 .4144 0 .5667 1 .5333
0.0631 0 .4505 0.2333 1 .6667
0.2883 0 .1802 0 .6809 0 .4255
0.1081 0 .4234 0 .4615 1 .8077
0.1261 0 .3964 0 .3590 1 .1282
0.1892 0 .3604 0 .5385 1 .0256
0.1892 0 .3694 0 .6774 1 .3226
0.1532 0.4324
0.1364 0 .4091
0.7391 2.0870
0.7500 2.2500
1.2667
1.0588
3.4286
0.3750
2.1667
1.0000
0.5238
0.8571
1.3529
2.0000
0.0909
0.0545
0.1930
0.1636
0
0.1765
0.9310
0.2364
0.2581
0.3065
0.5366
1.0870
1.3684
0.4681
1.0435
0.5455
0.8750
0.3269
碱基G
与碱基
T的丰
度之比

2.9333
2.7059
7.1429
0.6250
3.9167
3.1429
1.9048
1.9524
2.8235
3.0000
0.2000
0.2909
0.2456
0.2364
0.0986
0.1961
0.5172
0.1818
0.1290
0.1129
0.4634
1.1304
2.0526
0.4681
1.3913
0.4773
1.4583
0.3462
0.5000 0 .1000 1 .4103 0 .2821
0.5000 0 .1455 1 .5278 0 .4444
0.5182 0 .1273 2 .0357 0 .5000
0.5000 0 .1182 1 .6667 0 .3939
0.6455 0 .0636 2 .2188 0 .2188
0.4636 0 .0909 1 .2750 0 .2500
0.2636 0 .1364 0 .7436 0 .3846
0.5000 0 .0909 1 .7188 0 .3125
0.5636 0 .0727 2 .5833 0 .3333
0.5636 0 .0636 2 .8182 0 .3182
0.3628 0 .1681 1 .3226 0 .6129
0.2212 0 .2500 0 .7667 0 .8667
0.1863 0 .3824 1 .0556 2 .1667
0.4087 0 .1913 1 .9583 0 .9167
0.2190 0 .3048 0 .8846 1 .2308
0.3860 0 .1842 1 .7600 0 .8400
0.2308 0 .3365 1 .0000 1 .4583
0.4444 0 .1538 1 .7333 0 .6000



29
30
31
32
33
34
35
36
37
38
39
40

0.1881 0 .4455 1 .2667 3 .0000
0.2523 0 .2150 0 .8710 0 .7419
0.3571 0 .2232 1 .4815 0 .9259
0.3303 0 .2661 1 .8947 1 .5263
0.3333 0 .2072 1 .2333 0 .7667
0.1667 0 .3627 0 .7083 1 .5417
0.2039 0 .3398 0 .8400 1 .4000
0.2095 0 .2571 0 .9167 1 .1250
0.2039 0 .3301 0 .9545 1 .5455
0.4359 0 .1709 1 .9615 0 .7692
0.2358 0 .2075 0 .8621 0 .7586
0.4310 0 .1724 2 .1739 0 .8696
1.1579
0.9630
0.5000
0.6944
0.5676
1.4118
1.0476
1.4545
1.2381
0.3922
1.2000
0.4600
2.3684
0.8519
0.6250
0.8056
0.6216
2.1765
1.6667
1.2273
1.6190
0.3922
0.8800
0.4000
附件6:求解编号1-20样品两两之间Lance和Williams距离的程序
function julei_analyse
global P
global Q
i=1:40;
vec=[P(i,[2 4 ]),Q(i,[1 5 ])];
Len=zeros(20);
for i=1:20
for j=1:20
temp=sum(abs (vec(i,:)-vec(j,:)).(vec(i,:)+vec(j,:)));
Len(i,j)=temp;
end
end
[II1 II2]=find(Len==max(max(Len)));
c_type=[];d_type=[];c=[];d=[];
c_type=[c_type II1(1)];d_type=[d_type II1(2)];
kik=[];kik=setdiff(1:20,[II1(1) , II1(2)]);
while ~isempty(kik) %A,B类内部之间的聚类分析
c=mean(vec(c_type,:));
d=mean(vec(d_type,:));
min_c=100000;min_d=100000;
for i=kik
tom=sum(abs(vec(i,:)-c).(vec(i,:)+c));
if tom<=min_c;
min_c=tom;
j=i;
end
end
c_type=[c_type j];kik=setdiff(kik,j);
for i=kik
tom=sum(abs(vec(i,:)-d).(vec(i,:)+d));



if tom<=min_d;
min_d=tom;
j=i;
end
end
d_type=[d_type j];kik=setdiff(kik,j);
end
c %B类数据向量平均值
d %A类数据向量平均值
for i=21:40
cic= sum(abs(vec(i,:)-c).(vec(i,:)+c));
did=sum(abs(vec(i,:)-d).(vec(i,:)+d));
if cic>did
d_type=[d_type i];
else
c_type=[c_type i];
end
end
c_type=sort(c_type);
d_type=sort(d_type);

a_mid=mean(vec(d_type,:))%人工序列四十组的均值
b_mid=mean(vec(c_type,:))
vec1=[P(:,[2 4]) Q(:,[1 5 ])];
Len(II1(1) , II1(2))

附件7:用聚类分析延拓法求解分类结果的程序
clear L
fid = fopen('','r');
while 1 %该循环将txt文件的数据存入 L中
tline = fgetl(fid);
if ~ischar(tline), break, end
if strcmp(tline,'')
continue
end
if length(tline)>4
if strcmp(tline(2),':')
i=str2num(tline(1));
L{i}=tline(4:end);
elseif strcmp(tline(3),':')
i=str2num(tline(1:2));
L{i}=tline(5:end);
elseif strcmp(tline(4),':')
i=str2num(tline(1:3));



L{i}=tline(6:end);
end
end
if strcmp(tline(1),'a') | strcmp(tline(1),'t') | strcmp(tline(1),'c') | strcmp(tline(1),'g')
L{i}=strcat(L{i},tline);
end
end
fclose(fid);
%统计每种碱基的频率
P1=[];
for i=1:size(L,2) %统计每种碱基个数特征
tline=L{i};
P1(i,1)=length(find(tline(:)=='a'));
P1(i,2)=length(find(tline(:)=='t'));
P1(i,3)=length(find(tline(:)=='c'));
P1(i,4)=length(find(tline(:)=='g'));
P1(i,:)=P1(i,:).sum(P1(i,:));
end

Q1=[];%表示两两碱基之间的频率比
for i=1:2 %数据处理顺序主要考虑与人工处理相一致
for j=i+1:4
temp=P1(:,j).P1(:,i);
Q1=[Q1 temp];
end
end
temp=P1(:,3).P1(:,4);
Q1=[Q1 temp];
%以下计算自然序列与人工序列的平均值之间的距离,以进行筛选分类
aa=[ 0.1393 0.5311 1.5172 3.2803];
bb=[ 0.5020 1.8300 0.2618 0.2131];
vec=[P1(:,[2 ]),Q1(:,[1 4 5 ])];a_type=[];b_type=[];
for i=1:182
aia= sum(abs(vec(i,:)-aa).(vec(i,:)+aa));
bib=sum(abs(vec(i,:)-bb).(vec(i,:)+bb));
if aia a_type=[a_type i];
else
b_type=[b_type i];
end
end
b_type=sort(b_type)
a_type=sort(a_type)



附件8:用马尔可夫法对编号21-40人工DNA序列以及182个自然序列进行分
类的程序
(1)
对编号21-40人工DNA序列进行分类的程序
function marl_jianyan
clear L
N=20;
fid = fopen('','r');
i=1;
while 1 %该循环将txt文件的数据存
入 L中
tline = fgetl(fid);
if ~ischar(tline), break, end
if strcmp(tline,'')
continue
end
if strcmp(tline(2),'.')
L{str2num(tline(1))}=tline(3:end);
elseif strcmp(tline(3),'.')
L{str2num(tline(1:2))}=tline(4:end);
end
end
fclose(fid);a_trans=zeros(4);b_trans=zeros(4); % 每条序列4种碱基的频率
for i=1:10
tline=L{i};
ka=find(tline(:)=='a');
kt=find(tline(:)=='t');
kc=find(tline(:)=='c');
kg=find(tline(:)=='g');
temp=[];temp(ka)=1 ;temp(kt)=2;temp(kc)=3;temp(kg)=4;
for j=1:length(temp)-1
a_trans(temp(j),temp(j+1))= a_trans(temp(j),temp(j+1))+1;
end
end
a_trans=a_trans.(sum(a_trans')'*ones(1,4)); %A类马尔科夫概率转移矩阵
for i=11:20
tline=L{i};
ka=find(tline(:)=='a');
kt=find(tline(:)=='t');
kc=find(tline(:)=='c');
kg=find(tline(:)=='g');
temp=[];temp(ka)=1 ;temp(kt)=2;temp(kc)=3;temp(kg)=4;
for j=1:length(temp)-1
b_trans(temp(j),temp(j+1))= b_trans(temp(j),temp(j+1))+1;
end



end
b_trans=b_trans.(sum(b_trans')'*ones(1,4)); %B类马尔科夫概率转移矩阵
a_trans;
b_trans;

a_type=[];b_type=[];PA=[];PB=[];ee_a=[] ;ee_b=[];
%A、B类内部检验
for i=1:N
tline=L{i};
rubi=find(tline=='n'|tli ne=='s'|tline=='r'|tline=='w'|tline=='y');
异常碱基序列
if ~isempty(rubi)
kk=setdiff(1:length(tline),rubi);
tline=tline(kk);
end

ka=find(tline(:)=='a');
kt=find(tline(:)=='t');
kc=find(tline(:)=='c');
kg=find(tline(:)=='g');
temp=[];temp(ka)=1 ;temp(kt)=2;temp(kc)=3;temp(kg)=4;
pa=1;pb=1;zhishu_a=0;zhishu_b=0; %将指数和系数分离
for j=1:length(temp)-1
pa=pa*a_trans(temp(j),temp(j+1));
pb=pb*b_trans(temp(j),temp(j+1));
if pa<0.1& pa>0.01
pa=pa*10;
zhishu_a=zhishu_a+1;
elseif pa<0.01 &pa>1e-3
pa=pa*100;
zhishu_a=zhishu_a+2;
end
if pb<0.1 & pb>.01
pb=pb*10;
zhishu_b=zhishu_b+1;
elseif pb<.01
pb=pb*100;
zhishu_b=zhishu_b+2;
end

pa=round(pa*100)100;%保留两位有效数字
pb=round(pb*100)100;
end
ee_a=[ee_a zhishu_a]; %记录数据
%剔除



ee_b=[ee_b zhishu_b];
PA=[PA pa];
PB=[PB pb];
end
ee_ab=ee_a-ee_b;
det_ab=PA- PB.*10.^(ee_ab);

%b_type =find(ee_a-ee_b>10);
%a_type =find(ee_b- ee_a>10);
aa=find(det_ab>0);
bb=find(det_ab<0);
log_a12=[];log_b12=[]; %以下为取对数的数据检验
for i=1:N
log_a12=[log_a12,log10(PA(i))-ee_a(i)];
log_b12=[log_b12,log10(PB(i))-ee_b(i)];
end
i1=[1:3,5:10];i2=[4,11:20];
mean_a1=mean(log_a12(i1))
sig_a1=std(log_a12(i1))
mean_a2=mean(log_a12(i2))
sig_a2=std(log_a12(i2))
r_a=(sig_a1+sig_a2)abs(mean_a1-mean_a2)


mean_b1=mean(log_b12(i1))
sig_b1=std(log_b12(i1))
mean_b2=mean(log_b12(i2))
sig_b2=std(log_b12(i2))
r_b=(sig_b1+sig_b2)abs(mean_b1-mean_b2)

%A_num=PA.*10.^(ee_a)
%B_num=PB.*10.^(ee_b)
%PA
%PB
%ee_a
%ee_b
log_a12
log_b12
better_r_a=(sig_a1+sig_b1)abs(mean_a1-mean_b1)
better_r_b=(sig_a2+sig_b2)abs(mean_a2-mean_b2)
(2)
对182个自然序列进行分类的程序
clear L
fid = fopen('','r');
while 1 %该循环将txt文件的数据存入 L中



tline = fgetl(fid);
if ~ischar(tline), break, end
if strcmp(tline,'')
continue
end
if length(tline)>4
if strcmp(tline(2),':')
i=str2num(tline(1));
L{i}=tline(4:end);
elseif strcmp(tline(3),':')
i=str2num(tline(1:2));
L{i}=tline(5:end);
elseif strcmp(tline(4),':')
i=str2num(tline(1:3));
L{i}=tline(6:end);
end
end
if strcmp(tline(1),'a') | strcmp(tline(1),'t') | strcmp(tline(1),'c') | strcmp(tline(1),'g')
L{i}=strcat(L{i},tline);
end
end
fclose(fid);
a_trans =[ 0.3662 0.1911 0.1911 0.2516
0.2456 0.3275 0.1696 0.2573
0.2359 0.1385 0.0974 0.5282
0.2601 0.0644 0.2029 0.4726];
b_trans=[ 0.3707 0.4081 0.1184 0.1028
0.2701 0.5931 0.0858 0.0511
0.2182 0.4727 0.1636 0.1455
0.3063 0.3964 0.0811 0.2162];
a_type=[];b_type=[];PA=[];PB=[]; ee_a=[];ee_b=[]; rubi=[]; rubirubi=[]; %A、B类内部检验
for i=1:182
tline=L{i};
rubi= find(tline=='n'|tline=='s'|tline=='r'|tline=='w'|t line=='y'); %剔除异常碱基序列
if ~isempty(rubi)
kk=setdiff(1:length(tline),rubi);
tline=tline(kk);
end
ka=find(tline(:)=='a');
kt=find(tline(:)=='t');
kc=find(tline(:)=='c');
kg=find(tline(:)=='g');
temp=[];temp(k a)=1;temp(kt)=2;temp(kc)=3;temp(kg)=4;



pa=1;pb=1;zhishu_a=0;zhishu_b=0; %将指数和系数分离
for j=1:length(temp)-1
pa=pa*a_trans(temp(j),temp(j+1));
pb=pb*b_trans(temp(j),temp(j+1));
if pa<0.1& pa>0.01
pa=pa*10;
zhishu_a=zhishu_a+1;
elseif pa<0.01 &pa>1e-3
pa=pa*100;
zhishu_a=zhishu_a+2;
end
if pb<0.1 & pb>.01
pb=pb*10;
zhishu_b=zhishu_b+1;
elseif pb<.01
pb=pb*100;
zhishu_b=zhishu_b+2;
end

pa=round(pa*100)100;%保留两位有效数字
pb=round(pb*100)100;
end
ee_a=[ee_a zhishu_a]; %记录数据
ee_b=[ee_b zhishu_b];
PA=[PA pa];
PB=[PB pb];
end
ee_ab=ee_a-ee_b;
det_ab=PA- PB.*10.^(ee_ab);
%b_type =find(ee_a- ee_b>10);
%a_type =find(ee_b-ee_a>10);
aa=find(det_ab>0)
bb=find(det_ab<0)
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
基于C8051F单片机直流电动机反馈控制系统的设计与研究
基于单片机的嵌入式Web服务器的研究
MOTOROLA单片机MC68HC(8)05 PV8A内嵌EEPROM的工艺和制程方法及对良率的影响
研究
基于模糊控制的电阻钎焊单片机温度控制系统的研制
基于MCS-51系列单片机的通用控制模块的研究
)调节器 基于单片机实现的供暖系统最佳启停自校正(STR
单片机控制的二级倒立摆系统的研究
基于增强型51系列单片机的TCPIP
基于单片机的蓄电池自动监测系统
协议栈的实现
基于32位嵌入式单片机系统的图像采集与处理技术的研究
基于单片机的作物营养诊断专家系统的研究
基于单片机的交流伺服电机运动控制系统研究与开发
基于单片机的泵管内壁硬度测试仪的研制
基于单片机的自动找平控制系统研究

基于C8051F040单片机的嵌入式系统开发
基于单片机的液压动力系统状态监测仪开发
模糊Smith智能控制方法的研究及其单片机

实现
一种基于单片机的轴快流CO〈,2〉激光器的手持控制面板的研制
基于双单片机冲床数控系统的研究
基于CYGNAL单片机的在线间歇式浊度仪的研制
基于单片机的喷油泵试验台控制器的研制
基于单片机的软起动器的研究和设计

机床短循环走丝方式研究 基于单片机控制的高速快走丝电火花线切割
基于单片机的机电产品 控制系统开发
基于PIC单片机的智能手机充电器

基于单片机的实时内核设计及其应用研究
基于单片机
基于单片机
的远程抄表系 统的设计与研究
的烟气二氧化硫浓度检测仪的研制
基于微型光谱仪的单片机系统
单片机系统软件构件开发的技术研究
基于单片机的液体点滴速度自动检测仪的研制
基于单片机系统的多功能温度测量仪的研制

基于PIC单片机的电能采集终端的设计和应用
基于单片机的光纤光栅解调仪的研制
气压式线性摩擦焊机单片机控制系统的研制
基于单片机的数字磁通门传感器
基于单片机的旋转变压器-数字转换器的研究
基于单片机的光纤Bragg光栅解调系 统的研究
单片机控制的便携式多功能乳腺治疗仪的研制
基于C8051F020单片机的多生理 信号检测仪



基于单片机的电机运动控制系统设计



42. Pico专用单片机核的可测性设计研究
43. 基于MCS-51单片机的热量计
44. 基于双单片机的智能遥测微型气象站
45. MCS-51单片机构建机器人的实践研究
46. 基于单片机的轮轨力检测
47. 基于单片机的GPS定位仪的研究与实现
48. 基于单片机的电液伺服控制系统
49. 用于单片机系统的MMC卡文件系统研制
50. 基于单片机的时控和计数系统性能优化的研究
51. 基于单片机和CPLD的粗光栅位移测量系统研究
52. 单片机控制的后备式方波UPS
53. 提升高职学生单片机应用能力的探究
54. 基于单片机控制的自动低频减载装置研究
55. 基于单片机控制的水下焊接电源的研究

56. 基于单片机的多通道数据采集系统
57. 基于uPSD3234单片机的氚表面污染测量仪的研制
58. 基于单片机的红外测油仪的研究


59. 96系列单片机仿真器研究与设计
60. 基于单片机的单晶金刚石刀具刃磨设备的数控改造
61. 基于单片机的温度智能控制系统的设计与实现




62. 基于MSP430单片机的电梯门机控制器的研制
63. 基于单片机的气体测漏仪的研究
CANUSB协议转换器 64. 基于三菱M16C6N系列单片机的
65. 基于单片机和DSP的变压器油色谱在线监测技术研究
66. 基于单片机的膛壁温度报警系统设计
67. 基于AVR单片机的低压无功补偿控制器的设计
68. 基于单片机船舶电力推进电机监测系统
69. 基于单片机网络的振动信号的采集系统


70. 基于单片机的大容量数据存储技术的应用研究
71. 基于单片机的叠图机研究与教学方法实践

72. 基于单片机嵌入式Web服务器技术的研究及实现
73. 基于AT89S52单片机的通用数据采集系统
74. 基于单片机的多道脉冲幅度分析仪研究

75. 机器人旋转电弧传感角焊缝跟踪单片机控制系统
76. 基于单片机的控制系统在PLC虚拟教学实验中的应用研究
77. 基于单片机系统的网络通信研究与应用
78. 基于PIC16F877单片机的莫尔斯码自动译码系统设计与研究
79. 基于单片机的模糊控制器在工业电阻炉上的应用研究
80. 基于双单片机冲床数控系统的研究与开发
81. 基于Cygnal单片机的μCOS-Ⅱ的研究
82. 基于单片机的一体化智能差示扫描量热仪系统研究
83. 基于TCPIP协议的单片机与Internet互联的研究与实现
84. 变频调速液压电梯单片机控制器的研究
85. 基于单片机γ- 免疫计数器自动换样功能的研究与实现
86. 基于单片机的倒立摆控制系统设计与实现
87. 单片机嵌入式以太网防盗报警系统
88. 基于51单片机的嵌入式Internet系统的设计与实现
89. 单片机监测系统在挤压机上的应用
90. MSP430单片机在智能水表系统上的研究与应用
91. 基于单片机的嵌入式系统中TCPIP协议栈的实现与应用
92. 单片机在高楼恒压供水系统中的应用
93. 基于ATmega16单片机的流量控制器的开发
94. 基于MSP430单片机
95. 基于MSP430单片机
的远程抄表系统 及智能网络水表的设计
具有数据存储与回放功能的嵌入式电子血压计的设计
96. 基于单片机的氨分解率检测系统的研究与开发
97. 锅炉的单片机控制系统
98. 基于单片机控制的电磁振动式播种控制系统的设计
99. 基于单片机技术的WDR-01型聚氨酯导热系数测试仪的研制
100. 一种RISC结构8位单片机的设计与实现
101. 基于单片机的公寓用电智能管理系统设计
102. 基于单片机的温度测控系统在温室大棚中的设计与实现
103. 基于MSP430单片机的数字化超声电源的研制
104. 基于ADμC841单片机的防爆软起动综合控制器的研究
105. 基于单片机控制的井下低爆综合保护系统的设计
106. 基于单片机的空调器故障诊断系统的设计研究

107. 单片机实现的寻呼机编码器
108. 单片机实现的鲁棒MRACS及其在液压系统中的应用研究
109. 自适应控制的单片机实现方法及基上隅角瓦斯积聚处理中的应用研究
110. 基于单片机的锅炉智能控制器的设计与研究
111. 超精密机床床身隔振的单片机主动控制
112. PIC单片机在空调中的应用
113. 单片机控制力矩加载控制系统的研究
项目论证,项目可行性研究报告,可行性研究报告,项目推广,项目研究报告,项目设计,项目建议书,
项目可研报告,本文档支持完整下载,支持任意编辑!选择我们,选择成功!
项目论证,项目 可行性研究报告,可行性研究报告,项目推广,项目研究报告,项目设计,项目建议书,
项目可研报告, 本文档支持完整下载,支持任意编辑!选择我们,选择成功!
单片机论文,毕业设计,毕业论文,单片 机设计,硕士论文,研究生论文,单片机研究论文,单片机设计
论文,优秀毕业论文,毕业论文设计,毕 业过关论文,毕业设计,毕业设计说明,毕业论文,单片机论文,
基于单片机论文,毕业论文终稿,毕业 论文初稿,本文档支持完整下载,支持任意编辑!本文档全网独一
无二,放心使用,下载这篇文档,定会 成功!

高中数学必修一考题及答案-2016高中数学竞赛合肥市获奖


高中数学教资2019上半年答案-2018年辽宁高中数学教材版本


高中数学高考选修哪几门-高中数学排列的思维导图


高中数学概率在什么的前提下-高中数学难度较大的知识


松江高中数学一对一-高中数学无生试讲15分钟视频


高中数学要几年 百度文库-高中数学在线辅导作业答疑


高中数学解题步骤软件-高中数学 新东方


高中数学公式关于圆的-高中数学无生试讲面试题目



本文更新与2020-09-18 02:51,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/402324.html

数学建模_DNA序列分类模型论文终稿的相关文章

  • 爱心与尊严的高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊严高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊重的作文题库

    1.作文关爱与尊重议论文 如果说没有爱就没有教育的话,那么离开了尊重同样也谈不上教育。 因为每一位孩子都渴望得到他人的尊重,尤其是教师的尊重。可是在现实生活中,不时会有

    小学作文
  • 爱心责任100字作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任心的作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文