系统生物学的理论、方法和应用

2010年02月10日

系统生物学的理论、方法和应用

系统生物学是一门典型的交叉学科,需要生命科学、信息科学、数学和计算机科学等多学科的交叉研究;而目前国内还没有一本书能涵盖所有这些学科的内容。本书提供了进入系统生物学领域所必需的基础知识和学科概貌,内容体系连贯完整、深入浅出,非常适合作为课程教材和研究参考书。
全书分为3个部分。第1部分介绍系统生物学的主要基础:细胞生物学、数学和实验技术。第2部分介绍当前的计算建模和数据挖掘策略,包括代谢、信号转导、细胞周期、基因表达等各种细胞进程及其相互作用的各种细节;介绍了建模中的一些概念,并讨论了如何用不同的模型来解决一些常见的问题,如怎样解读数据、在特定条件下该应用哪种模型。第3部分对目前互联网上可获得的帮助和资源进行了概述性介绍,同时介绍了作者自己常用的一些建模工具;并对信息交换绝对必要的、从而也是构成系统生物学不可或缺的支柱数据库进行了概述。

什么是生物数学?

2010年02月10日

生物数学(Mathematical biology或biomathematics)是一个跨学科的领域,其主要目标是利用数学的技巧和工具为自然界,特别是生物学中的过程建模并进行分析。生物数学在生物学的理论和实践中都有广泛的应用。

重要性
很久以前,数学即被应用于生物学的研究中。然而直到最近,这一领域才引起人们足够的重视,其原因包括:

由于基因学的发展,生物学家采集到的大量数据必须通过解析方法加以处理。
数学理论,特别是混沌理论的发展,使人们对复杂性系统的认识更加深刻,从而提供了研究生物学中非线性动力过程的工具和方法。
计算机科学的发展使大规模计算和模拟成为可能。
基于人类与动物研究中的复杂性,人们对In silico的兴趣与日俱增。
[编辑] 研究领域
下面是一些生物数学界的热门研究领域,这些研究项目大多由一所或多所大学主持。这些项目所研究对象的共同特点是极其复杂并具有非线性的动力特征。一种观点认为,此类多种因素交互的问题只能通过数学或计算机模拟的方式来理解。由于此类研究涉及多个学科,一般都是由数学家、物理学家、生物学家、医生、动物学家和化学家等共同完成的。

[编辑] 人口动力学
人口动力学曾经是生物数学的主要课题。Lottak-Volterra方程早在19世纪就被广泛地研究。在过去30年中,由于John Maynard Smith首先引进了进化博弈理论,人口动力学得到了长足的发展。利用该方法,进化生物学的概念可以由确定的数学形式所描述。

与人口动力学密切相关的另一领域是数学流行病学,其主要研究内容为传染病在易感人群中的传播。目前已经有多个病毒传播模型在公共健康政策的决策中产生了重要影响。

[编辑] 细胞模型和分子生物学
由于分子生物学的发展,近年来该领域的研究硕果累累。

神经元模型和致癌物[1]
生物组织培养动力学[2]
酶化学和酶动力学。[3]
癌症模型与模拟[4]
交互细胞动力学[5]
疤痕组织形成模型[6]
细胞内部动力学模型[7]
[编辑] 生理系统模型
动脉疾病模型[8]
多尺度心脏模型[9]
[编辑] 数学方法
一般来说,在生物数学中,一个生物学的模型往往被抽象转化成为一个方程或方程组。在不严格的意义下,往往将“模型”和“方程组”视为同一含义。该方程或方程组的解,可以描述一个生物系统随时间的演进或在平衡点附近的性态。

生物数学中有多种类型的方程和性态,它们一般与模型或方程是独立的。在建模的过程中,往往进行一些假设,从而使得问题更容易用抽象语言描述。

下面是一些常用的数学工具和假设:

[编辑] 确定过程(动力系统)
动力系统用来描述一个从给定的初态到某个终态的映射。由给定的初态出发,随着时间的变化,一个动力系统始终产生相同的轨线,并且不同的轨线彼此不相交。

常微分方程(连续时间域,连续相空间,没有空间域的微分)。可以参考数值常微分方程。
偏微分方程(连续时间域,连续相空间,有空间域的微分)。可以参考数值偏微分方程。
差分方程(离散时间域,连续相空间)。
[编辑] 不确定过程(随机动力系统)
随即动力系统用来描述一个从给定的初态到某个终态随机的映射,将相空间视为一个随机变量及相应的随机分布。

非马尔可夫过程。
跳跃。
连续马尔可夫过程。
[编辑] 空间域模型
这方面的经典工作可以参考Alan Turing1952年发表于《器官学》([[en:morphogenesis|morphogenesis)的文章〈器官学的化学基础〉。

创伤康复实验中的波传递。[10]
细胞群形态[11]
器官的机械化学理论[12]
生物模式的形成[13]
由样本生成的空间分布[14]

生物信息学需要的软件工具有哪些?

2010年02月10日

BLAST(基本局域联配搜寻工具)和FASTA是目前使用得最为频繁的两套数据库搜索程序。它们的功能相近,都是把用户提交的一个核酸序列或蛋白质序列拿去与指定的数据库中的全部序列作比较。一般认为,BLAST运行速度快,对蛋白质序列的搜寻更为有效。FASTA运行较慢,对核酸序列更为敏感。也有基于网页交互的软件如STING,用于结构生物信息学的分析。

生物信息学在药物研发方面的应用有哪些?

2010年02月10日

生物信息学可用于药物靶标基因的发现和验证。有许多数据库可用来获得在不同组织在正常/疾病状态下基因表达的差异,通过搜索这些数据库,可以得到候选基因作为药物靶标,特异性地针对某一种疾病。另外,还可根据蛋白质功能区和三维结构的预测来对药物靶标进行鉴定,以便早期了解所研究蛋白的属性,预测它是否适用于药物作用。

什么是生物系统模拟?

2010年02月10日

系统生物学通过对细胞子系统的计算机模拟,分析这些细胞过程间的复杂联系,并将分析结果可视化。例如,人工生命就通过计算机模拟简单的生物形式,以帮助人类了解进化过程。

什么是调控分析?

2010年02月10日

调控是指当细胞受到外信号刺激之后其内发生的一些列反应过程的总和。生物信息学技术被用于分析调控的各个步骤。例如,基因表达的数据可用于分析基因调控。对于一个单细胞生物体,我们可以用生物芯片技术观察受到不同外界刺激、处于细胞周期不同状态的细胞,并将采集到的数据利用聚类算法分析,以寻找表达相似的基因或样本。该结果可用于多种深入的分析。

什么是基因表达分析?

2010年02月10日

多种生物学技术可以用于测量基因的表达,如DNA微阵列,表达序列标签(expressed sequence tag),基因表达连续分析(serial analysis of gene expression),大规模平行信号测序(massively parallel signature sequencing),多元原位杂交法(multiplexed in-situ hybridization)等。上列所有方法均严重依赖于环境并会产生大量高噪声的数据。生物信息学致力于发展一套统计学工具以从中提取有用的信息。

什么是比较基因组学?

2010年02月10日

比较基因组学的核心课题是识别和建立不同生物体的基因或其他基因组特征的联系。这些跨基因组的联系使得我们能够跟踪基因组的进化过程。基因组进化由多个不同层次的事件完成。在最低的层次,单个核苷酸上发生了点变异。在较高的层次,大的染色体片段经历了复制、横向迁移、逆转、调换、删除和插入等过程。在最高的层次上,整个基因组会经历杂交、倍交、内共生等变异,并迅速产生新的物种。

什么是蛋白质表达分析?

2010年02月10日

通过蛋白质微阵列技术或高通量质谱分析对生物标本进行测量所获得的数据中,包含有大量生物标本内蛋白质的信息。生物信息学被广泛的应用于这些数据的分析。对于前者,生物信息学所面临的问题与RNA微阵列数据分析中遇到的问题相似;对于后者,生物信息学将所获得的大量质谱数据与通过已知蛋白质数据库预测的数据进行比较,并使用复杂的统计学方法进一步分析。

什么是蛋白质结构预测?

2010年02月10日

蛋白质结构预测是生物信息学的重要应用。蛋白质的氨基酸序列(也称为一级结构)可以容易的由它的基因编码序列获得。在绝大多数情况下,在蛋白质的原生环境中,其结构由它的氨基酸序列唯一的决定。蛋白质的结构对于理解蛋白质的功能十分重要。这些结构信息通常被称为二级、三级、四级结构。目前尚没有普遍可行方案实现这些结构的准确预测;大多数方案为启发式的。

同源性是生物信息学中的一个重要概念。在基因组的研究中,同源性被用以分析基因的功能:若两基因同源,则它们的功能可能相近;在蛋白质结构的研究中,同源性被用于寻找在形成蛋白质结构和蛋白质反应中起关键作用的蛋白质片断。在一种被称为同源建模的技术中,这些信息可与已知结构的蛋白质相比较,从而预测未知结构的蛋白质。目前为止,这是唯一可靠的预测蛋白质结构的方法。

人类血色素和豆类血色素间的相似性是以上方法的一个实例。两种血色素有相同的功能,均能够在各自的生物体内运输氧气。尽管它们的氨基酸序列大不相同,它们的蛋白质结构几乎一样。