Это не официальный сайт wikipedia.org 01.01.2023

Эволюционная дистанция — Википедия

Эволюционная дистанция

Эволюционная дистанция — величина, характеризующая генетические различия между двумя организмами. Находится путём сравнения нуклеотидных последовательностей гомологичных генов. Мерой генетических различий считается процент несовпадений нуклеотидов в соответствующих позициях гена[1].

Методы определенияПравить

Попарная дистанцияПравить

Простейшей величиной, характеризующей эволюционную дистанцию является доля несовпадающих нуклеотидов при попарном сравнении соответствующих позиций в гене. Эта величина называется «попарной дистанцией» (обычно обозначается символом p).

Например, при сравнении следующих двух участков гена

CAGACAGTCA
CACACTGCCA

на 10 нуклеотидов приходится три несовпадающих, p = 0,3.

Попарная дистанция недостаточно адекватно описывает эволюционные различия между организмами:

  • Так как для двух абсолютно произвольных последовательностей нуклеотидов вероятность их случайного совпадения в соответствующих позициях равна 25 %, то попарное расстояние между двумя совершенно чужеродными участками ДНК в среднем равно p = 0,75, тогда как по смыслу должно быть p = 1.
  • Попарное расстояние не учитывает разную вероятность различных замен нуклеотидов.
  • Попарное расстояние не учитывает возможность многократных мутаций в одной позиции.

Недостатки попарной дистанции устраняются использованием более сложных формул определения дистанции:

  • Метод Джукса-Кантора
  • Метод Тадзимы-Неи
  • Метод Кимуры
  • Метод Тамуры
  • Метод Тамуры-Неи

и другие методы.

Метод Джукса-КантораПравить

Метод Джукса-Кантора[2] (англ. Jukes-Cantor Method) представляет собой простейшую попытку исключить из рассмотрения случайные совпадения нуклеотидов, вероятность которых составляет 25 %. Это однопараметрический метод, который в качестве параметра использует долю несовпадающих нуклеотидов (то есть попарную дистанцию p). Дистанция рассчитывается по следующей формуле

d J C = 3 4 ln ( 1 4 p 3 ) .  

Метод предполагает, что все четыре нуклеотида (А, Ц, Т, Г) присутствуют в ДНК в одинаковых пропорциях, а вероятность замены одного нуклеотида на другой одинакова для любой пары нуклеотидов.

Как видно из формулы при p > 0,75 выражение не имеет смысла (отрицательное выражение под знаком логарифма). Это является недостатком метода, так как ситуации с p > 0,75 (более 75 % различающихся нуклеотидов) принципиально не исключены.

Формула была предложена в 1965 году, на заре исследований в области молекулярной биологии преподавателем химического факультета Калифорнийского университета Томасом Джуксом  (англ.) (рус. и студентом того же факультета Чарлзом Кантором  (англ.) (рус.. В середине 1960-х годов биохимические технологии достигли того уровня, когда стала возможной расшифровка отдельных фрагментов ДНК и аминокислотных последовательностей белков. Это позволило путём сравнения нуклеотидных последовательностей проследить эволюционную близость различных организмов и пути эволюции отдельных видов. Джукс и Кантор входили в число пионеров в деле формализации этого метода, а Кантор стал автором одной из первых компьютерных программ для анализа нуклеотидных последовательностей[3].

В качестве примера применения формулы можно привести фрагменты генов, кодирующих α- и β-гемоглобин человека. Считается, что около 400 млн лет назад оба гена произошли от одного предкового гена[3].

ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-гемоглобин)
TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-гемоглобин)

Сравнение фрагмента обнаруживает 12 различий на 30 нуклеотидов (p = 0,4). Однако простой подсчёт расхождений не учитывает вероятность того, что в некоторых позициях произошли многократные мутации, в том числе приведшие к восстановлению исходного нуклеотида. Формула Джукса-Кантора даёт дистанцию

d J C = 3 4 ln 0 , 467 = 0 , 572.  

Таким образом, из формулы следует, что с учётом кратных замен в рассматриваемом фрагменте ДНК произошло 0,572·30=17 мутаций.

Метод КимурыПравить

Мотоо Кимура предложил метод вычисления дистанции, который получил название «двухпараметрическая дистанция Кимуры» (англ. Kimura 2-parameter distance, K2P). Модель Кимуры предполагает, что различные варианты замены нуклеотидов неравновероятны и рассматривает два типа замен:

  • Транзиция — замена нуклеотида без смены его типа, например, замена пуринового основания на пуриновое (А ↔ Г) или пиримидинового на пиримидиновое (Ц ↔ Т).
  • Трансверсия — смена типа основания с пуринового на пиримидиновый или наоборот (А или Г ↔ Ц или Т).

Дистанция в модели Кимуры определяется по формуле

d K 2 P = 1 2 ln ( 1 2 P Q ) 1 4 ln ( 1 2 Q ) ,  

где P — доля транзиций, Q — доля трансверсий.

Рассматривая в качестве примера эволюционную дистанцию между фрагментами генов α- и β-гемоглобина, получим:

ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-гемоглобин)
TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-гемоглобин)
Q PPQ   P QQ   QPQ     Q     Q
P = 2 15 ;     Q = 4 15 ;  
d K 2 P = 3 4 ln 7 15 = 0 , 572.  

Метод Тадзимы — НеяПравить

В модели Тадзимы — Нея дистанция определяется следующими соотношениями[4]:

d = b ln ( 1 p b ) ,  

где

b = 1 2 ( 1 i = 1 4 g i 2 + p 2 c ) ;  
c = i = 1 3 j = i + 1 4 x i j 2 2 g i g j ;  
xij — относительные частоты пар нуклеотидов;
gi — относительные частоты нуклеотидов.

В качестве примера вычислим дистанцию между фрагментами генов, кодирующих α- и β-гемоглобин человека.

ACCAACGTCAAGGCCGCCTGGGGTAAGGTT (α-гемоглобин)
TCTGCCGTTACTGCCCTGTGGGGGAAGGTG (β-гемоглобин)
Нуклео-
тид
xij gi
A T C
A 10/60 = 0,167
T 1/30 = 0,0333 13/60 = 0,217
C 2/30 = 0,0667 3/30 = 0,100 15/60 = 0,250
G 1/30 = 0,0333 3/30 = 0,100 2/30 = 0,0667 22/60 = 0,367
c = 0 , 0333 2 0 , 167 0 , 217 + 0 , 0667 2 0 , 167 0 , 250 + 0 , 0333 2 0 , 167 0 , 367  
  + 0 , 1 2 0 , 217 0 , 250 + 0 , 1 2 0 , 217 0 , 367 + 0 , 0333 2 0 , 250 0 , 367 = 0 , 257 ;  
b = 0 , 5 ( 1 0 , 167 2 0 , 217 2 0 , 250 2 0 , 367 2 + 0 , 4 2 / 0 , 257 ) = 0 , 622.  
d = 0 , 622 ln ( 1 0 , 4 0 , 622 ) = 0 , 641.  

В некоторых источниках дистанцией Тадзимы-Нея называется расчёт по более простой формуле

d = b ln ( 1 p b ) ,  

где

b = 1 i = 1 4 g i 2 .  

Для случая, когда все нуклеотиды встречаются с одинаковой частотой (gi = 0,25), эта формула совпадает с формулой Джукса-Кантора (b = 0,75).

Расчёты по этим формулам дают для того же примера

  b = 1 0 , 167 2 0 , 217 2 0 , 250 2 0 , 367 2 = 0 , 728.  
d = 0 , 728 ln ( 1 0 , 4 0 , 728 ) = 0 , 580.  

ПримечанияПравить

  1. Словарь терминов, используемых в молекулярной эволюции, популяционной генетике и молекулярной биологии Архивная копия от 28 января 2007 на Wayback Machine. На сайте СНК кафедры общей химии БГМУ.
  2. T. H. Jukes, C. R. Cantor (1969) Evolution of protein molecules. In H. N. Munro, ed., Mammalian Protein Metabolism, pp. 21-132, Academic Press, New York.
  3. 1 2 Thomas H. Jukes (April 30, 1990) How Many Nudeotide Substitutions Actually Took Place? Current Contests: 33(18), p. 21.
  4. Sudhir Kumar, Koichiro Tamura, and Masatoshi Nei. 4.1 Nucleotide Substitutions (англ.). MEGA: Molecular Evolutionary Genetics Analysis. Version 1.01. MEGA, Molecular Evolutionary Genetics Analysis[en] (1993). Дата обращения: 18 февраля 2015.

См. такжеПравить

СсылкиПравить

  • Kimura, M. The Neutral Theory of Molecular Evolution. — Cambridge University Press, Cambridge, 1983. — ISBN 0-521-23109-4..
  • Ohta, T. Slightly deleterious mutant substitutions in evolution (англ.) // Nature : journal. — 1973. — Vol. 246, no. 5428. — P. 96—98. — doi:10.1038/246096a0. — PMID 4585855.
  • Provine W.B. Rise of the null selection hypothesis. In Cain A.J. and Provine W.B. 1991. Genes and ecology in history. In Berry R.J. et al. (eds) Genes in ecology: the 33rd Symposium of the British Ecological Society. Blackwell, Oxford, p15-23.