Стандартным методом оценки наличия и количества древней ДНК является
оценка количества поврежденных временем нуклеотидов. Для этого была
использована программа MapDamage 2.0. MapDamage 2.0 что показало
количество древней ДНК в 30.1%, но так как MapDamage подразумевает, что мы
используем близкий референс, а мы точно не знаем насколько оба образца
близки к геному современного человека, и мы использовали экзомную библиотеку,
этот метод сам по себе не являлся достаточным. Другим хорошим методом
оценки древней ДНК является количество коротких фрагментов.
Фильтрация предполагаемой древней ДНК происходила в три этапа. На первом
этапе были убрана все парные риды, которые невозможно пересечь и собрать в
один непарный рид с перехлестом. Такие риды говорили о том, что исходный
фрагмент, который был секвенирован был длинней 300 п.н. и с большой
вероятностью являлся современной ДНК. Так после этого шага осталось 86.9% и
91.8% соответственно. После этого одиночные фрагменты собранные с
перехлестом были отобраны так, чтобы их длина была короче 150 п.н., так как
|
|
именно такая длина ожидалась нами для древней ДНК. После этого шага
осталось 8.6% и 38.5% соответственно для образцов M и W. Нужно обратить
внимание, что несмотря на разницу в процентах, абсолютное количество ридов
между образцами M и W очень схожее: 9.8M и 8.8M, что можно объяснить тем, что
содержание именно древней ДНК в обоих образцах схожее.
Параметр Образец M
Параметр | Образец М | Образец W | |
Количество ридов | 113.3М | 22.8М | |
Процент коротких фрагментов < 300bp | 86.9% | 91.8% | |
Процент коротких фрагментов < 150bp (количество) | 8.6% (9 846 035) | 38.5% (8 813220) | |
Процент фрагментов выровненных на геном человека (количество) | 2.03% (2 345084) | 9.65% (2 264551) | |
Процент фрагментов выровненных на геном человек от коротких <150 bp | 23.8%
| 25.6% | |
(WaWita)
Получение ДНК сходной с референсным геномом человека
Полученная предполагаемая древняя ДНК была картированы на референсный
геном человека с помощью стандартного пайплайна поиска геномных вариантов с
использованием BWA, samtools и Wcftools.
При этом только 23.8% от образца M и 25.6% было успешно замаплено на
референсный геном современного человека. При этом для обоих образцов 75%
отсеквенированных ридов не удалось замапить на геном человека. Что может
быть объяснено как контаминациями так и тем, что эти образцы находятся
достаточно далеко от генома современного человека. При это стоит держать в
голове то, что мы секвенировали экзомную библиотеку и этим свели
контаминацию бактериальной ДНК к минимуму.
Начальный разведывательной анализ незамапленных ридов показал, что часть из
|
|
них принадлежит повторяющейся ДНК специфичной для копытных животных, это
можно объяснить тем, что жир лам использовался при мумификации.
Для более подробного анализа требуется в районе трех недель вычислений, так
как существующие решения сделаны только для вирусных и бактериальных
геномов, а нам нужно сравнить с существующими всеми геномами, включая
геномы растений, чтобы понять какие виды были отсеквенированы.
Характеристика найденных вариантов
Картированные риды были использованы для поиска вариантов отличающих M и
W образцы от современного генома человека, а также для оценки контаминацией
ридам c Y хромосомы человека.
Первый вопрос на который нужно было ответить, на какие именно хромосомы
картировались отсеквенированные риды.
Так как мы знаем что образцы Марии выделалась из костей и мышц, а Вавиты
только из костей, мы ожидали разницу в количестве мтДНК. Но особенной
разницы не было.
Количество картированных ридов на Y – еще одна проверка на контаминацию
современным человеком. Интересно, что оно оказалось одинаковым в обоих
образцах.
Статистики по найденным вариантам приведены ниже:
Параметры | M | W |
Количество найденных вариантов | 79 957 | 48 941 |
Количество вариантов на Y | 534 | 541 |
Количество достоверных вариантов (больше 20 ридов и качество более 30) | 16 969 | 6 181 |
Варианты с известым rsid (есть в базе данных снипов) | 5701 | 3089 |
Общие достоверные варианты 92
Общие варианты с rsid 49
После этого стало возможным ответить родственники ли M и W? Ответ –
нет. Между M и W найдено только 49 совпадающих варианта и 3040
отличающихся для вариантов с известным rsid. Более того, возможно это разные
виды или подвиды человека или неизвестного существа.
Интересно то, что варианты с Y хромосомы идентичны для обоих образцов, что
говорит о контаминации одним и тем же человеком, и что в древней ДНК Y хромосомы скорей все же нет.
Оценка схожести с существующими отсеквенированными геномами