出版时间:2010-8 出版社:科学出版社 作者:(英)Durbin,R 等编著 页数:312
Tag标签:无
前言
1992年在Snowbird举行的一次神经网络会议上,Darid Haussler及其加州大学圣克鲁斯分校(UCSC)的同事们(其中也包括本书作者之一Anders Krogh)描述了使用概率论模型对蛋白质序列进行多序列联配建模的初步结果,他们称这种模型为隐马模型(HMM)。随后他们的技术报告复本被广泛地传播,其中一些流传到剑桥大学的MR(分子生物学实验室。在那里,Richard Durbin和Graeme Mitchison刚刚将自己的研究兴趣从神经建模转移到计算基因组序列分析上来,Sean Eddy当时是该实验室的一名博士后,其研究背景是实验分子遗传学,他对计算分析非常感兴趣。不久以后Anders Krogkt也到剑桥大学工作了一年。 我们都快速地接受了概率论建模的思想,并且相信HMM及其随机文法对应物是优美的数学对象,十分适合获取埋藏在生物序列中的信息。圣克鲁斯小组和剑桥小组很快独立地开发了各自免费的HMM序列分析软件包,并且各自独立地将HMM方法推广到用于RNA二级结构分析的随机上下文无关文法上。与此同时,在加州理工学院喷气推进实验室(JPL/caltech),由Pierre Baldi领导的另一个研究小组也受Snowbird会议成果的启发,进行着基于HMM方法的研究。
内容概要
本书在结构上大致可以分为四个部分,每个部分所覆盖的问题分别是:二序列联配、多序列联配、系统发育树和RNA结构。具体分为:二序列联配、Markov链与隐马模型、使用HMM的二序列联配、用于序列家族的列型HMM、多序列联配方法、构造系统发育树和系统发育的概率论方法。本书介绍的列型чMM、多序列联配方法、构造系统发育树和系统发育的概率论方法。本书介绍的一些方法将不同的生物信息来源整合到一般的、清晰且可操作的序列分析概率论模型中,有助于研究者深入了解生物序列分析的基础。 本书可供生物信息学、分子生物学、数学、计算机科学以及物理学专业的研究生或高年级本科生及这些领域的老师和研究人员参考。
作者简介
英)Durbin,R,1987年获得博士学位,研究方向为蠕虫神经系统的发育与组织。英国Sat3ger中心生物信息部负责人,先后参与线虫基因组和人类基因组项目、WormBase线虫模式生物数据库、ACEDB基因组数据库、Pfam蛋白质结构域数据库以及Ensembl脊椎动物基因组注释。
书籍目录
译者名单中文版序一中文版序二译者的话前言第1章 绪论 1.1 序列的相似性、同源性及联配 1.2 本书概述 1.3 概率与概率论模型 1.4 补充读物第2章 二序列联配 2.1 引言 2.2 计分模型 2.3 联配算法 2.4 更复杂模型的动态规划 2.5 启发式联配算法 2.6 线性空间联配 2.7 分值的显著性 2.8 从联配数据推导计分参数 2.9 补充读物第3章 Markov链与隐马模型(HMM) 3.1 Markov链 3.2 隐马模型 3.3 HMM的参数估计 3.4 HMM的模型结构 3.5 更复杂的Markov链 3.6 HMM算法的数值稳定性 3.7 补充读物第4章 采用HMM的二序列联配 4.1 索引 4.2 X和Y的对所有路径求和的全概率 4.3 次优联配 4.4 Xi联配上Yi的后验概率 4.5 用于搜索的成对HMM与FSA之对比 4.6 补充读物第5章 用于序列家族的列型ItMM 5.1 无空位计分矩阵 5.2 添加插入与删除状态以获得列型HMM 5.3 从多序列联配中导出列型HMM 5.4 基于列型HMM的搜索 5.5 用于非全局联配的列型HMM变体 5.6 对概率估计的深入说明 5.7 最优模型的构建 5.8 训练序列的加权 5.9 补充读物第6章 多序列联配方法 6.1 多序列联配的含义 6.2 为多序列联配计分 6.3 多维动态规划 6.4 渐进联配方法 6.5 由列型HMM训练的多序列联配 6.6 补充读物第7章 构造系统发育树 7.1 生命之树 7.2 树的背景知识 7.3 用成对距离建树 7.4 简约法 7.5 树的评估:自举法 7.6 联配与系统发育的同时处理 7.7 补充读物 7.8 附录:邻接法定理的证明第8章 系统发育的概率论方法 8.1 引言 8.2 进化的概率论模型 8.3 计算无空位联配的似然 8.4 用似然做推断 8.5 更现实的进化模型 8.6 概率论方法与非概率论方法的比较 8.7 补充读物第9章 转换文法 9.1 转换文法 9.2 正则文法 9.3 上下文无关文法 9.4 上下文有关文法 9.5 随机文法 9.6 用于序列建模的随机上下文无关文法 9.7 补充读物第10章 RNA结构分析 10.1 RNA 10.2 RNA二级结构预测 10.3 协方差模型:基于SCFG的RNA列型 10.4 补充读物第11章 概率论背景 11.1 概率分布 11.2 熵 11.3 推断 11.4 抽样 11.5 从计数估计概率 11.6 EM算法参考文献部分术语汉英对照部分术语英汉对照索引
章节摘录
当巴比伦人绘制星空图时,天文学诞生了。虽然我们的子孙一定不会认同生物学始于当前的基因组计划,但是也许他们会清楚地认识到,生物学知识的快速积累正是始于我们这个时代。如何发掘这些知识的科学意义是一件极具挑战性的工作,需要进一步理解细胞和有机体的生物学。但其中的部分挑战只在于对极其丰富的生物学序列数据进行组织、分类和解析。这不仅仅是一件抽象的字符串分析工作,因为隐藏存碱基或氨基酸序列背后的是整个分子生物学的复杂性。本书介绍的一些方法将不同的生物信息来源整合到一般的、清晰且可操作的序列分析概率论模型中,原则上有能力把握部分的上述复杂性。
图书封面
图书标签Tags
无
评论、评分、阅读与下载