登陆注册
19084100000082

第82章 生物信息学(3)

在核酸控制下的蛋白质生物合成过程有其保守的一面,比如一种氨基酸残基可有不止一种三联体的密码。但自然界各种条件经常会有或多或少的变化,势必会影响到DNA的突变从而引起蛋白质序列中某些氨基酸被取代、丢失或插入。这样新一代的蛋白质与其母蛋白质相比既有与其相同的一面,通常称之为同源性(homology),即它们具有共同的祖先;又有不同的一面,通常称之为分化(divergence)。一般地,将与母蛋白相同的区域叫保守区,不同的区域叫可变区。

而且生物学界普遍认为保守区一般代表该类蛋白质的功能区域,也是两个蛋白质同源性的基础。所以如何寻找两个不同生物大分子的保守区是生物大分子序列分析的核心。在许多分子生物学实验研究工作中,经常会发现新的生物大分子,接下来生物学工作者所关心的是它的生物学性质包括功能、结构等是否与已经发现的生物大分子相同、相似或不同,据此推断它的结构、功能、进化等生物学性质。这就是通常所说的同源性分析,它可以说是现阶段整个生物信息学的主要基础之一。典型的例子就是癌症与细胞无节制繁殖之间的关系:人们将与癌症有关的基因同与细胞生长相关的蛋白质序列进行比较,发现二者之间有很强的相关性,据此可以推断癌症与细胞生长是有关的。因此,进行生物大分子的序列分析是一项非常有意义的工作,主要表现为:

①保守位点和活性位点分析。对一组序列进行同源性分析,在各个序列中都保守的位点就是可能的活性位点,据此设计实验,以最终确定其中的活性位点。

②在序列分析基础上建立蛋白质之间的进化关系。许多蛋白质之间的关系不是完全无关的。某个蛋白质可能是另一个的突变体,或者它们来源于一个共同的祖先,这类蛋白质称为同源蛋白质,建立它们之间的进化关系是非常必要的。

③在序列分析基础上进行蛋白质二级结构预测。现在许多蛋白质结构预测方法如PSIPRED,STRIPLEX 等先是利用多重序列分析得到位置专一化的得分矩阵(Position Specific Score Matrix,PSSM),然后再作预测。

④应用序列分析预测蛋白质三维构象(或天然构象)。在蛋白质天然构象预测的三大类方法即比较模型法(Comparative Modeling),折叠识别法(Folding Recognition)及从头预测法中,前两种均以序列分析法为基础进行预测。而且其精度较高,所得到的模型现已被用于药物设计等相关领域。

⑤应用序列分析法还可预测蛋白质的折叠模式。

总之,序列分析在生物信息学中的地位是举足轻重的。现在生物信息学之所以受到人们的重视,主要的贡献之一便是序列分析。生物大分子序列分析按分子来分有DNA、RNA和蛋白质。但一般而言,DNA 序列所获取的有用信息与蛋白质序列相比要少得多。

其主要原因是DNA 序列的非编码区分化得很快,以致很难检测到其同源性。对分化超过200万年的DNA 序列,就很难找到其同源性。相反,蛋白质则相对比较稳定,对10亿年前分化的蛋白质也能检测其同源性。因此,相比较而言,对蛋白质进行同源序列分析更具有实际意义。

序列比对法主要是基于动态规划法比较两个蛋白质序列之间的相似性。它是生物序列同源性和相似性确定的基本方法。最早提出的是Needlemen‐Wunsch 方法,尔后Smith‐Waterman 对此作了改进,建立了局部比对方法。序列比对方法可以说是整个生物信息学的基本方法。由于Smith‐Waterman 在配对序列比对方法中是一种比较常用的方法,它涉及比对方法中的一些常用的基本概念,而且现在常用的启发式比对法如FASTA及BLAST 法均建立在它的基础上,因此我们这里重点介绍Smith‐Waterman 算法及相关的基本比对概念。

(1)比对,全局比对和局部比对的基本概念

比对(alignment)有的文献中也称之为联配、对比。但从目前国内所发表的文献,以“比对”相对比较流行。在计算机科学中则称之为不精确匹配(inexact matching)。所谓比对,就是将两个序列的末端、中间和始端插入空格,使得这两个序列中第一个序列的每个字符(或空格)与第二个序列的每个字符(或空格)相匹配。

在序列比对模式中,每两个字符的比对和字符与空格的比对都有一个对应的分数(或称之为权重)。在比对中,一个字符对应于一个空格分别称之为插入(insert)和删除(delete)。显然,有插入就有删除。因此在英文文献中将它们合并在一起称之为“indel”,我们这里将它翻译为“插删”。对不同字符的插删其得分是相同的。通过比对,我们可以得到两个序列之间的比对得分。这个得分代表了这两个序列之间的生物学相似性。

全局比对(global alignment)是将在两个序列中插入空格(包括序列的首末两端)使得它们的长度完全一致,然后将两个序列中的一个放在另一个上面使得一个序列中的每个字符(包括空格)与另一个序列的字符(或空格)相匹配。全局比对的特点是将两个序列所有字符都考虑进去。

以上介绍的是几种比对的定义。虽然不同的比对算法不一,但它们都是建立在数学中的动态规划算法基础上。另一个共同点是它们都需要一个得分矩阵。接下来我们首先介绍蛋白质序列比对中常用的得分矩阵,然后将上述几种比对方式对应的动态规划算法作详细的介绍。由于这里侧重于这个方法在生物学中的应用,因此对相应的基本概念仅作简单说明,对相应的数学证明则不作介绍。我们所关心的是:在拿到两个序列后,如何用局部或全局比对方法计算出这两个序列的相似性。如果读者能将该算法应用某种计算机语言(BASIC,C,PERL 等语言)编成相应的算法程序,就比较完美了。事实上,有关比对的算法免费软件网上可以找到,如果读者仅仅是要比较两个序列,则可直接从网上下载或直接在某个相关的网页上进行比对,则能在较短时间内得到比对的结果。如果读者想改进这个方法,提高精度或速度,则对算法的计算过程要比较清楚。

(2)蛋白质序列比对中常用的得分矩阵

因为DNA 序列的分化速度比较快而相应的比对所获取的信息要少得多,所以生物序列分析中一般以蛋白质序列分析、比对占多数,因而,这里仅介绍与蛋白质有关的常用得分矩阵。

现在常用的得分矩阵主要有两类,一类是PAM(全称是Percent Accepted Mutation,我们将它译成“可接受突变百分比”),最早由Dayoff 于1968年建立,以后作了改进,形成PAM 得分矩阵系列。一个PAM(X)的矩阵构建如下:首先选一组关系非常密切的蛋白质(closely related proteins),这组蛋白质在进化上的分化总量为X,然后计算每个氨基酸残基被其他氨基酸残基所取代的频率,就得到相应的PAM(X)矩阵,PAM250是PAM 系列中最有代表性的得分矩阵。

同类推荐
  • 培养学生心灵成长的经典故事——敞开心扉拥抱生活

    培养学生心灵成长的经典故事——敞开心扉拥抱生活

    在这套丛书里,我们针对青少年的心理特点,专门选择了一些特殊的故事,分别对他们在这一时期将会遭遇的情感问题、生活问题、学习问题、交友问题以及各种心理健康问题,从心理学的角度进行剖析和讲解,并提出了解决问题的方法和措施,以供同学们参考借鉴。
  • 《财务管理》作业集

    《财务管理》作业集

    本作业集以《财务管理》(刘敬芳主编,立信会计出版社出版)教材为依据,参考现行会计资格考试的财务管理内容而编写。目的是为了帮助学生全面、准确地理解和掌握教材的内容,同时,也可以作为有志于参加会计资格考试(中级资格考试)的学生的练习辅导材料
  • 新课标课外快乐阅读丛书——快乐心灵的神童故事

    新课标课外快乐阅读丛书——快乐心灵的神童故事

    为了全面提高广大中小学生的知识基础,培养阅读的兴趣和爱好,这套课外读物主要包括有关成长、生命、神童、亲情、爱心、感恩、母爱、父爱、心态、美德、人格、幽默、思维、习惯、励志、真情、名人、英雄、语文、数学、名著、唐诗、地理、历史、美术、音乐、文学、电影、谜语、哲学、哲理、信仰、智慧、文明、发现、科幻、推理、侦探、战争、探险、惊险、财富、时尚、神话、民间、公主、医学、天文、寓言、建筑、名胜、海洋、奥秘、奇趣、植物、动物的故事,既有一般的故事,也有知识故事,这样,把阅读故事与掌握知识结合起来,就能扩大阅读的深度和范围,这正是设计本套新课标课外读物的最大特色。
  • 世上只有三道高考作文题

    世上只有三道高考作文题

    一本送给高中生的绝佳礼物!史上最牛的高考作文猜题法。讲高考作文的书浩如烟海,但没有谁想到从文化人类学的角度,我们能将所有高考作文题归纳为三道题。
  • 掰开地壳看到底

    掰开地壳看到底

    本书介绍了神奇有趣的龟山、浑然天成的镜子岩、巧夺天工的奇石、能烧开水的沸石、会唱歌的响石、名不虚传的变位石等内容。
热门推荐
  • 校园恐怖事件之女生寝室

    校园恐怖事件之女生寝室

    404寝室不断地传出恐怖的传闻...有人说404寝室的人都死了,也有人说是失踪了、还有人说是疯狂,就连当年参与过这些事的警察也不能幸免的接二连三的出事。最后一场大火把这栋楼给烧了。有人说是从404寝室烧出来的,但谁知道呢?或许是校方担心还会再出事吧又或者是别的,总之这栋楼就再也没用过了。一直到招新生寝室楼不够用了,就把这栋楼给翻新了让新生住...到底还会不会发生当年的事呢?(鉴于我还是新手写的不好勿喷哦,望请读者们多多指教了)
  • 蛮婚强爱

    蛮婚强爱

    他是红三代,富二代,部队重点培养的年轻军官,向来高高在上,卑睨众生。她也是红三代,但父母在一次任务中双亡,15岁的她被寄养在了他家。他被她撞到在看A片,他蛮横的要与她体验。21岁那年,她怀孕,他欲娶她,她却莫明失踪。他开始疯狂的找她,并且发下誓,此生不负。
  • 这个地方那么多年

    这个地方那么多年

    这个地方,那么多年,主要讲述本人自出生以来,在农村的成长经历与感情纠葛,从一个人见人夸的好学生,沦落到被自己就读的初中学校劝退,满怀幻想走向社会这所大学以及打工求职的一些趣事,经历过,似乎应该留下点什么。
  • 相爱不如偶遇

    相爱不如偶遇

    当婚姻遇到小三儿,是分手呢还是坚守?她对丈夫的出轨痛不欲生,就在她决定离婚时,却发现自己怀孕了。可是,孩子并不能维系他们的脆弱的婚姻,当婚姻已经走到了无法维系的地步,丈夫却想吃着碗里的看着锅里的。心里容不下一丝玷污的她毅然将丈夫告上法庭,昔日夫妻不得不对薄公堂。生活并非都是不如意的,离婚后的她终于遇上一个帅气的外科大夫,两人相见恨晚。可是,就在这时,前夫突然插进来成为了新的第三者。于是,上演了一场旷日持久而惊心动魄的追爱大戏。有一种爱情叫作放手;有一种背叛叫作身不由己;有一种决绝叫作永不回头。
  • 倾压腹黑殿下:妖艳毒妃

    倾压腹黑殿下:妖艳毒妃

    一介堂堂暗杀皇后竟然命丧天泉穿越古代,并且手戴家传怪戒,好吧,就算这样也别是废材吧!废材也就罢了为何还是丑八怪!既然如此那就来一场逆袭吧!看堂堂现代暗杀皇后如何大闹古代,一条通往强者之路正在铺起…底图:抱歉麻烦你们了我找不到好的底图#(泪)
  • 笑看八部天龙

    笑看八部天龙

    天龙的世界是个奇迹的世界,在这个世界中蕴含着无数的秘密需要我们去发觉,这里有武功,有门派,有江湖,有朝廷,还有打怪升级!总之,一样的天龙世界,不一样的人生乐趣!下面,就让我来为你打开天龙世界的大门吧!
  • 雨落长安

    雨落长安

    在上古时代,有这样一个古老的传说:相传在几千年前女娲补天的年代,为了维护世界的和平,女娲用天石挡住了从天上飞流而下的天水,让天下苍生又恢复了平静。女娲补天剩下的天石日积月累,形成了法力高强的上古神器------寒冰剑。只因统领妖魔二界的魔君得知此事,心生邪念,在得到了寒冰剑时日日修炼,不慎走火入魔,魔君毁灭后,寒冰剑变成了五块碎片,散落人间,不知去向。多年以后,天下发生动乱,天灵山掌门要求弟子重新找回寒冰剑的碎片。因此,天灵山大弟子云少卿、文景轩、苏樱雪、楚霏儿等人,踏上了寻剑的旅程···
  • 血色星空

    血色星空

    浩瀚宇宙,星辰林立。北斗七星盘踞正中,组成星辰联盟,统领群星。万万年的发展,人类开始不满足于自我,不断膨胀,遂滋生欲族。欲族士大,联合灵族和一些远古兽族对整个星辰展开制控。一位地球的绝世强者,渡劫失败,意外地来到群星。是偶然?是必然?北斗七星七公六曜,独缺一曜。能否迎回幼儿时期就被无辜抛弃的第七曜。欲族联合灵族势大,对七界六道,漫天星辰展开制控。面对着兄弟、红颜一个又一个倒在自己的怀中,他唯有举起屠刀,杀身成仁,铸就一代传奇!
  • 谁的流年浮了尘

    谁的流年浮了尘

    各自站在对方的对岸,两点连不成一线。既然不能连成线,那就重合为一点。薄曦以为,他们都是彼此人生的过客,可谁知——“薄小姐,你也喜欢在这里用餐啊。”“你好,我的舞伴。”……就连和前男友见面时,他也要掺合进来。薄曦心中有千万匹草泥马奔腾而过,“卧槽,你是不是跟屁虫啊。”顾离笙:……
  • 绝世女佣兵:笑看天下

    绝世女佣兵:笑看天下

    凌薇雪倩,东云国凌薇世家直系血脉,与上面六位哥哥同样鼎鼎有名,却是因为“废物七公子”这个响亮的称号。因为有着废物的著称,所以走到哪里都受到众人的唾弃,却偏偏让东云国有名的七殿下一眼就挑中,从此成为七王府最高地位的护卫。他用自己的实力在这片大陆上站稳脚步,从此要风得风,要雨得雨。只是到最后当所有人知道原来那个惊世天下的人是‘她’后全是唏嘘不已。东方倾城说:爱上一个人不需要多久,只要一眼便定终生。