Когда исследователи начали изучать гены различных белков в клетках эукариот, обнаружилось, что взаимодействие генов и белков в этих организмах более сложное, чем взаимодействие генов и белков прокариот. Первые примеры такого взаимодействия были получены в 1977 году в лабораториях Филипа Шарпа и Пьера Шамбона. Вместе со своими коллегами они гибридизировали мРНК различных генов с теми ДНК, с которых были сняты эти информационные копии. У бактерий последовательность мРНК идентична последовательности кодирующей цепи ДНК (за исключением того, что место тимина занимает урацил), поэтому структура гибридных молекул была достаточно проста.
Рис. 9.5. Общие принципы синтеза белка. Информационная (матричная) РНК входит в рибосому так, чтобы первые два ее основания могли соединиться с двумя молекулами ами-ноацил-тРНК. К этому участку подходят две аминоацил-тРНК, кодоны, которых комплементарны кодонам мРНК. Затем первая аминокислота соединяется со второй пептидной связью, первая тРНК отсоединяется, и дипептид остается прикрепленным ко второй тРНК. Вместе с тем мРНК сдвигается на следующий «шаг» в рибосоме, после чего к ее третьему кодону может присоединиться третья тРНК. Между второй и третьей аминокислотой образуется пептидная связь, и весь процесс повторяется (обычно несколько сотен раз) до кодона мРНК, означающего остановку, после чего сформированный белок отсоединяется
Но когда под электронным микроскопом были сделаны снимки гибридных молекул генов эукариот, то в них обнаружился ряд петель. Это значит, что мРНК и ДНК имеют не совсем идентичную последовательность, и петли были как раз теми местами, в которых они не могли соединяться. Когда последовательность мРНК сравнили с последовательностью ДНК, стало понятно, что кодирующая последовательность генов в некоторых местах прерывается некодирующей последовательностью, то есть некоторые нуклеотиды не кодируют синтез белка. Впоследствии выяснилось, что это типичная картина для ДНК эукариот. Кодирующая последовательность гена называется эк-зоном, а некодирующая последовательность — ин-троном. Некоторые гены имеют в своей структуре несколько интронов. Часто обнаруживают и такие гены, в которых больше интронов, чем экзонов.
В общем случае при транскрипции генов эукариот образуются большие молекулы РНК, содержащие как экзоны, так и интроны. После этого особые комплексы ферментов (сплайсингсомы) вырезают из транскрипта все интроны и соединяют экзоны в одну мРНК, кодирующую производство белка. Далее эта РНК транслируется как обычно.
Причины, по которым природа придерживается такой структуры, до сих пор не ясны, но ее можно объяснить как с эволюционной точки зрения, так и с точки зрения развития организма. Если говорить об эволюции, то такая структура ценна тем, что позволяет экспериментировать с генами и создавать новые гены. Кроссинговер может происходить внутри интронов, и в таком случае ошибки будут несущественными, а при рекомбинации могут образоваться новые экзоны и как следствие новые белки. Часто бывает так, что отдельный экзон кодирует отдельную область, или домен, белка, то есть отдельную часть белка с особыми функциями. Поэтому включение в ген нового экзона приведет к созданию белка с новыми областями и, возможно, с новыми функциями. Такое изменение генетической структуры может служить источником эволюции.
С точки зрения развития организма структура интрон-экзон ценна тем, что позволяет одноц нуклеотидной последовательности кодировать синтез более одного белка. Сейчас известны случаи, когда интроны в разных тканях режутся по-разному, и в результате синтезируются разные белки с разными функциями. Поэтому такая структура предоставляет возможность осуществить рост новых типов клеток с минимальным изменением информации.
Хромосомы эукариот содержат не только избыточную ДНК в виде интронов, но и повторяющуюся ДНК, которая не кодирует белки или стабильные молекулы РНК. Например, около 10% ДНК мыши приходится на ДНК с высоким содержанием повторяющихся элементов, то есть эти участки содержат короткие последовательности, длиной не более 10 нуклеотидных пар, повторяющихся миллионы раз. Еще 20% приходится на ДНК с умеренным содержанием повторяющихся элементов, то есть эти участки содержат последовательности из нескольких сотен нуклеотидов, повторяющиеся тысячи раз. Таким образом, очень большая часть хромосом эукариот состоит из ДНК, которая может подвергаться мутациям и рекомбинациям без выраженного эффекта. (О повторяющейся ДНК в геноме человека говорится в гл. 12.)