基于伪氨基酸成分蛋白质序列分类探讨

更新时间:2024-02-26 作者:用户投稿原创标记本站原创
摘要:理解大量生物学数据所包含的生物学已后基因组极其的课题,生物信息学的作用将。面对海量的蛋白质序列数据,引入智能算法对其处理,这对研究蛋白质结构和功能具有。蛋白质结构和功能具有的复杂性。常用实验的方法对有些蛋白质(如很难结晶或巨分子蛋白)很难其三维结构,且实验方法成本高,耗时间。计算机模拟,智能算法对蛋白质结构和功能预测,近年来受到研究者们越来越多的关注。了一种新的蛋白质序列可视化方法,并在标准数据集上与其他方法了比较并验证了其性。的创新之处如下:(1)一种蛋白质序列新的可视化方法——距离矩阵图。蛋白质序列的氨基酸的疏水性(hydrophobicity)值、亲水性(hydrophipcity)值、侧链分子量(side-chain mass)值作为此氨基酸的空间坐标,空间坐标计算序列中各个氨基酸之间的距离,将距离矩阵视作一种纹理图像,即将每一个矩阵元素对应为一个图像像素,每个元素值被映像为对应像素的灰度值,蛋白质距离矩阵图,此图能反映蛋白质序列的特征。(2)构造出一种新的伪氨基酸成分。将距离矩阵图的几何矩作为伪氨基酸成分,此伪氨基酸成分能很好的反映蛋白质序列特征。(3)基于所的蛋白质距离矩阵图设计了多个蛋白质序列分类预测器(HPVs(人类瘤病毒)风险类型、蛋白质二级结构类型预测、GPCR类型预测),这些预测器与现有预测器相比,预测成功率都有提高。(4)基于氨基酸数字编码模型,氨基酸成分法的不足,构造出一种十进制数字编码模型,对核受体(Nuclear receptor)分类,其结果高于氨基酸成分法。关键词:生物信息学论文蛋白质分类论文距离矩阵图论文特征提取论文伪氨基酸成分论文数字编码模型论文
摘要3-4
Abstract4-8
1 绪论8-15
1.1 引言8-9
1.2 研究背景9-11
1.3 基于蛋白质序列分类的国内外研究进展11-13
1.4 论文的工作内容及创新点13-15
2 蛋白质序列的特征提取和分类算法15-24
2.1 引言15
2.2 蛋白质序列特征提取算法15-21
2.2.1 基于氨基酸序列的特征提取算法16-17
2.2.2 基于氨基酸物理化学性质的特征提取算法17-18
2.2.3 基于数据库信息的特征提取算法18-19
2.2.4 基于元胞自动机图的特征提取19-21
2.2.5 蛋白质序列特征提取算法中存在的问题21
2.3 蛋白质分类算法21-23
2.3.1 基于统计的分类方法21-23
2.3.2 基于机器学习的分类算法23
2.4 小结23-24
3 基于距离矩阵灰度图的蛋白质二级结构类型预测24-35
3.1 引言24-25
3.2 可视化方法25-27
3.3 几何矩及其特征值27-28
3.4 预测方法及结果28-30
3.5 变形的距离矩阵可视化方法30-31
3.6 几何矩及分类器设计31-34
3.7 小结34-35
4 基于新的距离矩阵图的HPV 风险类型预测35-43
4.1 引言35-39
4.2 分类器设计与预测结果39-42
4.3 小结42-43
5 基于新距离矩阵的GPCR 功能类型预测43-50
5.1 引言43-44
5.2 数据与可视化方法44-46
5.2.1 数据44-46
5.3 几何矩及分类器设计46-48
5.4 预测结果与讨论48
5.5 小结48-50
6 基于十进制百分比的核受体子家族分类预测50-56
6.1 引言50-51
6.2 基于氨基酸二进制数字编码模型的核受体预测方法与结果51-55
6.3 小结55-56
7 与展望56-58
7.1 56-57
7.2 展望57-58
致谢58-59
参考文献59-64
攻读硕士学位期间参加的项目和所发表的论文64
WWw.808so.com 808论文查重

点赞:5308 浏览:15749