Генетический код

После того, как в 1944 г. была установлена генетическая функция ДНК, связанная с хранением наследственных свойств организма, биохимикам стало ясно, что каждый ген представляет собой часть молекулы ДНК, которая состоит из определённой последовательности нуклеотидных остатков, соединённых фосфодиэфирными связями. Сопоставление генетических карт мутаций генов, определяющих полипептидные последовательности белков, показало, что мутации, вызывающие аминокислотные изменения в конце полипептидной цепи, размещаются на генетической карте хромосомы дальше от её начала, чем аналогичные мутации, изменяющие аминокислотные остатки в начале полипептидной цепи.

Следуя логике указанных экспериментов, биохимики сформулировали очень важную закономерность, что полинуклеотидные последовательности генов и полиаминокислотные последовательности белков колинеарны, а именно полинуклеотидная последовательность гена определяет полиаминокислотную последовательность соответствующего полипептида.

Однако на примере изучения нуклеотидного состава ДНК и аминокислотного состава белков фагов и бактерий было определено, что в ДНК содержится значительно больше нуклеотидов, чем аминокислотных остатков в составе всех белков, синтезируемых клетками указанных организмов. Отсюда возникло предположение, что каждый аминокислотный остаток полипептидной цепи белка кодируется не одним нуклеотидом. Тем более было известно, что в составе ДНК имеются только четыре вида нуклеотидов, а протеиногенных аминокислот – 18, и если учитывать ещё два амида, участвующих в построении белковых молекул, то получится 20 протеиногенных аминокислот.

И если даже предположить, что каждый аминокислотный остаток белка кодируется последовательностью из двух нуклеотидов в структуре гена, то получится только 16 комбинаций нуклеотидов из четырёх по два, что тоже недостаточно для кодирования 20 аминокислотных остатков. Только комбинации нуклеотидных последовательностей из четырёх по три обеспечивают кодирование указанного количества протеиногенных аминокислот. Всего их образуется 64, поэтому возникает вопрос все ли комбинации, включающие последовательности из трёх нуклеотидов, используются для кодирования аминокислотных остатков в составе белков.

Ответ на этот вопрос был получен в 1961 г. М. Ниренбергом и Г. Маттэи, которые изучали роль различных РНК в качестве матриц для синтеза белков. Они проводили опыты с использованием системы синтеза белков in vitro. Эта система включала неочищенный экстракт растворимых веществ из клеток кишечной палочки (E. сoli), содержащий молекулы тРНК и ферменты, катализирующие связывание аминокислот с тРНК. В этот экстракт добавляли рибосомы, выделенные из клеток кишечной палочки, все протеиногенные аминокислоты, а также систему, генерирующую синтез АТФ.

И когда в такую систему синтеза белков ввели в качестве матрицы, кодирующей структуру полипептида, синтетический полинуклеотид, построенный из остатков уридиловой кислоты, соединённых фосфодиэфирными связями (поли-У), то в качестве продукта синтеза был обнаружен полипептид, построенный из повторяющихся остатков фенилаланина, хотя в системе синтеза белков содержались все протеиногенные аминокислоты. Если же в качестве матрицы для синтеза белков использовали полинуклеотид из повторяющихся остатков цитидиловой кислоты (поли-Ц), то продуктом синтеза являлся полипептид, построенный из повторяющихся остатков пролина. При использовании в качестве матрицы в системе синтеза белков полинуклеотида поли-А образовывался полипептид, состоящий из остатков лизина.

Если следовать концепции кодирования аминокислотных остатков в белках последовательностью из трёх нуклеотидов, то из результатов опытов М. Ниренберга и Г. Маттэи следовало, что остаток аминокислоты фенилаланина в полипептидных цепях белков кодируется в mРНК последовательностью из трёх нуклеотидов УУУ, остаток пролина – ГГГ, остаток лизина – ААА. Указанные последовательности из трёх нуклеотидов в полипептидных цепях mРНК, кодирующие определённые аминокислотные остатки в структуре белков, было предложено называть триплетами, или кодонами.

В дальнейшем Х.Г.Корана синтезировал искусственные полинуклеотиды с известной и регулярно чередующейся последовательностью нуклеотидов. В ходе изучения аминокислотного состава полипептидов, синтезирующихся при использовании указанных искусственных полинуклеотидов в качестве матриц в системе синтеза белков in vitro, были выяснены все другие триплеты, кодирующие аминокислотные остатки в структуре белков.

На основе полученных данных составлена таблица, содержащая 64 кодона триплетного генетического кода (табл. 14). В ней указаны триплеты, кодирующие аминокислотные остатки (всего их 61) и три терминирующих кодона (УАА, УАГ, УГА), которые не кодируют аминокислотные остатки у большинства организмов, а используются в качестве сигналов, прекращающих синтез на рибосомах полипептидных цепей. Последовательности нуклеотидов в кодонах записываются по такому же принципу, как и любая последовательность нуклеотидов в полипептидных цепях, крайним слева записывается нуклеотид на 5'-конце, а крайним справа – нуклеотид на 3'-конце.

Большинство аминокислотных остатков кодируются не одним кодоном: остатки серина, глицина и лейцина – 6 кодонами; валина, пролина, треонина, аланина и аргинина – 4; изолейцина – 3 кодонами; другие аминокислотные остатки – 2 кодонами. И только остатки метионина и триптодана кодируются единичными кодонами. Выявленная неоднозначность в кодировании аминокислотных остатков получила название вырожденности генетического кода. Благодаря вырожденности генетического кода разные организмы могут синтезировать сходные по структуре белки, необходимые для выполнения одной и той же биологической функции. При этом выявлено, что у каждого типа организмов обычно для кодирования определённой аминокислоты используются из имеющегося набора кодонов не все, а только определённые один-два кодона. Явление вырожден-ности кода может служить также защитой от мутаций, связанных с модификацией или заменой отдельных нуклеотидов в структуре ДНК, в результате чего многие такие отклонения в нуклеотидном составе ДНК не приводят к изменению аминокислотного состава белков.

14. Кодоны генетического кода*

Нуклеотид На 5'-конце Нуклеотид в средней частикодона А Т(У) Г Ц Нуклеотид На 3'-конце
  A ААА Lys ATA Ile AГА Arg АЦА Thr AAT Asn ATT Ile АГТ Ser АЦТ Thr ААГ Lys АТГ Met АГГ Arg АЦГ Thr ААЦ Asn АТЦ Ile АГЦ Ser АЦЦ Thr A Т(У) Г Ц
  Т(У) ТАА Терм. ТТА Leu ТГА Терм. ТЦА Ser ТАТ Tyr ТТТ Phe ТГТ Cys ТЦТ Ser ТАГ Терм. ТТГ Leu ТГГ Trp ТЦГ Ser ТАЦ Tyr ТТЦ Phe ТГЦ Cys ТЦЦ Ser A Т(У) Г Ц
  Г ГАА Glu ГТА Val ГГА Gly ГЦА Ala ГАТ Asp ГТТ Val ГГТ Gly ГЦТ Ala ГАГ Glu ГТГ Val ГГГ Gly ГЦГ Ala ГАЦ Asp ГТЦ Val ГГЦ Gly ГЦЦ Ala A Т(У) Г Ц
  Ц ЦАА Gln ЦТА Leu ЦГА Arg ЦЦА Pro ЦАТ His ЦТТ Leu ЦГТ Arg ЦЦТ Pro ЦАГ Gln ЦТГ Leu ЦГГ Arg ЦЦГ Pro ЦАЦ His ЦТЦ Leu ЦГЦ Arg ЦЦЦ Pro А Т(У) Г Ц

* Справа от кодона указано сокращённое обозначение аминокислоты, которую кодирует данный кодон; Т(У) – в кодонах ДНК содержатся остатки дезокситимидиловой кислоты (Т), а в кодонах РНК – уридиловой кислоты (У); Терм. – терминирующий кодон.

Важное свойство генетического кода, характерное для большинства организмов, его неперекрываемость. Это означает, что последовательности кодонов, входящие в структуру разных генов, занимают определённые участки в молекуле ДНК, которые в структуре хромосом не перекрываются, а последовательно располагаются вдоль цепи ДНК. В составе каждого гена кодоны также не перекрываются, они последовательно следуют один за другим в цепи ДНК, образующей данный участок.

Однако в геномах некоторых фагов найдены участки ДНК, в которых локализованы перекрывающиеся гены. Благодаря наличию перекрывающихся генов у таких генотипов оказывается возможным кодирование значительно большей генетической информации, чем это позволяют линейные размеры ДНК, ограниченные числом содержащихся в ней нуклеотидов.

В многочисленных опытах с использованием различных систем синтеза белков in vitro было показано, что генетический код универсален для всех организмов. Если, например, в систему синтеза белка, выделенную из клеток микроорганизмов, добавлять mРНК животных, человека или растений, то в этой системе будут синтезироваться белки указанных высших организмов. Универсальность генетического кода послужила основой для развития нового научного направления – генной инженерии.

В основу генетической инженерии положены биохимические методы, позволяющие выделение определённых участков ДНК, содержащих отдельные гены, из клеток одного организма и перенос их в клетки другого организма, где они включаются в ДНК хромосом и становятся источниками генетической информации для синтеза соответствующих белков, которые улучшают свойства данного организма или могут быть использованы в качестве биокатализаторов для производства пищевых продуктов и медицинских препаратов в биотехнологической промышленности.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: