蛋白质家族:修订间差异

删除的内容 添加的内容
无编辑摘要
第16行:
== 蛋白质的结构域和模体 ==
{{See also|结构域|结构模体|蛋白质结构}}
蛋白质家族的概念是在还很少知道蛋白质结构或序列的时候被构想的。 那时,在结构上理解的主要是小的和单一结构域的蛋白,例如[[肌红蛋白]],[[血红蛋白]]和[[细胞色素c]]。 从那时起,发现许多蛋白质包含多个独立的结构和功能单元或'''[[结构域]]'''(protein domain)。 由于演化[[洗牌|改组]],一个蛋白质中的不同结构域已经有独立的演化。 近年来,这导致了对蛋白质结构域家族的关注。 许多在线资源致力于标识和分类此类这样的结构域(请参阅本文结尾处的链接列表)。
 
每种蛋白质的区域具有不同的功能限制(对于蛋白质的结构和功能至关重要的特征)。 例如,酶的[[活性位点]]需要某些氨基酸残基在三个维度上精确定向。 另一方面,蛋白质与蛋白质的结合界面可能由较大的表面组成,并限制了氨基酸残基的[[疏水性]]或极性。 蛋白质的功能限制区比无限制区(如表面环)进化得更慢,当比较蛋白质家族的序列时,会形成可辨别的保守序列区(请参阅[[多重序列比對]])。 尽管使用了许多其他术语(块,签名,指纹等),但这些块通常被称为'''模体'''(motif)。 同样,许多在线资源都致力于识别和分类蛋白质模体(请参阅文章结尾处的列表)。
第23行:
根据目前的共识,蛋白质家族以两种方式产生。 首先,将亲本物种分离为两个遗传分离的后代物种可以使基因/蛋白质独立地积累这两个谱系中的变异([[突变]])。 这产生了直系同源蛋白家族,通常具有保守的序列基序。 其次,基因重复可以产生基因的第二个拷贝(称为旁系同源物)。 因为原本的基因仍然能够执行其功能,所以复制的基因可以自由发散并可以获取新功能(通过随机突变)。某些基因/蛋白质家族,特别是在[[真核生物]]中,在进化过程中会经历极端的扩张和收缩,有时会与全[[同源多倍体|基因组复制相]]一致。 蛋白质家族的这种扩张和收缩是[[基因组进化]]的显着特征之一,但是其重要性和后果目前尚不清楚。
[[File:RAStree.png|thumb|800x548px|centre|RAS超家族的系统发育树。 树是使用FigTree(免费的在线软件)创建的。]]
 
== 蛋白质家族的用途和重要性 ==
随着已经被测序蛋白质总数的增加以及对[[蛋白质组学]]分析的兴趣不断扩大,人们正在努力将蛋白质组织成家族并描述其组成结构域和模体。 可靠地鉴定蛋白质家族对于[[系统发生学|系统发生]]分析,功能注释以及在给定的系统发育分支中探索蛋白质功能的多样性至关重要。{{le|酶功能倡议|Enzyme Function Initiative}}(Enzyme Function Initiative,缩写:EFI)正在使用蛋白质家族和超家族作为开发基于序列/结构的策略的基础,以用于未知功能酶的大规模功能分配<ref name="pmid21999478">{{cite journal | vauthors = Gerlt JA, Allen KN, Almo SC, Armstrong RN, Babbitt PC, Cronan JE, Dunaway-Mariano D, Imker HJ, Jacobson MP, Minor W, Poulter CD, Raushel FM, Sali A, Shoichet BK, Sweedler JV | title = The Enzyme Function Initiative | journal = Biochemistry | volume = 50 | issue = 46 | pages = 9950–62 | date = November 2011 | pmid = 21999478 | pmc = 3238057 | doi = 10.1021/bi201312u }}</ref>。
 
用于大规模建立蛋白质家族的算法手段是基于相似性的概念。 在大多数情况下,我们可以访问的唯一相似性是序列相似性。
 
== 蛋白质家族资源 ==