Оценка количества древней ДНК и ее отделение от современной

Стандартным методом оценки наличия и количества древней ДНК является

оценка количества поврежденных временем нуклеотидов. Для этого была

использована программа MapDamage 2.0. MapDamage 2.0 что показало

количество древней ДНК в 30.1%, но так как MapDamage подразумевает, что мы

используем близкий референс, а мы точно не знаем насколько оба образца

близки к геному современного человека, и мы использовали экзомную библиотеку,

этот метод сам по себе не являлся достаточным. Другим хорошим методом

оценки древней ДНК является количество коротких фрагментов.

Фильтрация предполагаемой древней ДНК происходила в три этапа. На первом

этапе были убрана все парные риды, которые невозможно пересечь и собрать в

один непарный рид с перехлестом. Такие риды говорили о том, что исходный

фрагмент, который был секвенирован был длинней 300 п.н. и с большой

вероятностью являлся современной ДНК. Так после этого шага осталось 86.9% и

91.8% соответственно. После этого одиночные фрагменты собранные с

перехлестом были отобраны так, чтобы их длина была короче 150 п.н., так как

именно такая длина ожидалась нами для древней ДНК. После этого шага

осталось 8.6% и 38.5% соответственно для образцов M и W. Нужно обратить

внимание, что несмотря на разницу в процентах, абсолютное количество ридов

между образцами M и W очень схожее: 9.8M и 8.8M, что можно объяснить тем, что

содержание именно древней ДНК в обоих образцах схожее.

Параметр Образец M

Параметр Образец М

Образец W 

Количество ридов

113.3М

22.8М
Процент коротких фрагментов < 300bp  

86.9%

91.8%
Процент коротких фрагментов < 150bp (количество)  

8.6% (9 846 035)

38.5% (8 813220)  
Процент фрагментов выровненных на геном человека (количество)  

2.03% (2 345084)

9.65% (2 264551)  
Процент фрагментов выровненных на геном человек от коротких <150 bp  

23.8%

 

25.6%
       

(WaWita)

Получение ДНК сходной с референсным геномом человека

Полученная предполагаемая древняя ДНК была картированы на референсный

геном человека с помощью стандартного пайплайна поиска геномных вариантов с

использованием BWA, samtools и Wcftools.

При этом только 23.8% от образца M и 25.6% было успешно замаплено на

референсный геном современного человека. При этом для обоих образцов 75%

отсеквенированных ридов не удалось замапить на геном человека. Что может

быть объяснено как контаминациями так и тем, что эти образцы находятся

достаточно далеко от генома современного человека. При это стоит держать в

голове то, что мы секвенировали экзомную библиотеку и этим свели

контаминацию бактериальной ДНК к минимуму.

Начальный разведывательной анализ незамапленных ридов показал, что часть из

них принадлежит повторяющейся ДНК специфичной для копытных животных, это

можно объяснить тем, что жир лам использовался при мумификации.

Для более подробного анализа требуется в районе трех недель вычислений, так

как существующие решения сделаны только для вирусных и бактериальных

геномов, а нам нужно сравнить с существующими всеми геномами, включая

геномы растений, чтобы понять какие виды были отсеквенированы.

Характеристика найденных вариантов

Картированные риды были использованы для поиска вариантов отличающих M и

W образцы от современного генома человека, а также для оценки контаминацией

ридам c Y хромосомы человека.

Первый вопрос на который нужно было ответить, на какие именно хромосомы

картировались отсеквенированные риды.

Так как мы знаем что образцы Марии выделалась из костей и мышц, а Вавиты

только из костей, мы ожидали разницу в количестве мтДНК. Но особенной

разницы не было.

Количество картированных ридов на Y – еще одна проверка на контаминацию

современным человеком. Интересно, что оно оказалось одинаковым в обоих

образцах.

Статистики по найденным вариантам приведены ниже:

Параметры             M W
Количество найденных вариантов 79 957            48 941
Количество вариантов на Y  534 541
Количество достоверных вариантов (больше 20 ридов и качество более 30) 16 969     6 181    
Варианты с известым rsid (есть в базе данных снипов)   5701 3089

Общие достоверные варианты 92

Общие варианты с rsid 49

После этого стало возможным ответить родственники ли M и W? Ответ –

нет. Между M и W найдено только 49 совпадающих варианта и 3040

отличающихся для вариантов с известным rsid. Более того, возможно это разные

виды или подвиды человека или неизвестного существа.

Интересно то, что варианты с Y хромосомы идентичны для обоих образцов, что

говорит о контаминации одним и тем же человеком, и что в древней ДНК Y хромосомы скорей все же нет.

Оценка схожести с существующими отсеквенированными геномами


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: