Полная версия

Главная arrow Экология arrow Ключ к генетическому коду в структуре объединенных молекул воды

  • Увеличить шрифт
  • Уменьшить шрифт


<<   СОДЕРЖАНИЕ   >>

ГЕНЕТИЧЕСКИМ КОД И ЕГО ОСОБЕННОСТИ

Генетический код — свойственная живым организмам единая система «записи» наследственной информации в молекулах нуклеиновых кислот в виде последовательности нуклеотидов. За синтез белка отвечает конкретный ген.

Идея о том, что информация, необходимая для синтеза белка, закодирована в генах, впервые была высказана американским астрофизиком Г. А. Гамовым, который родился в России. Он первым сформулировал проблему и предложил схему генетического кода в 1954 г. Узнав от Крика и Уотсона, что речь идет о 20-ти аминокислотах, Гамов сформулировал задачу следующим образом: как с помощью четырех видов нуклеотидов зашифровать 20 видов аминокислот. На первых порах Гамов подверг эту проблему чисто комбинаторному анализу, выделив вопросы, касавшиеся комбинаторного строения кода. На вопрос о кодовом числе ответ дали простые комбинаторные соотношения: число видов нуклеотидов равнялось четырем (А, Г, Т, Ц) и из четырех видов можно составить всего 16 различных пар: АА, АГ, АТ, АЦ, ГА, ГГ, ГТ, ГЦ, ТА, ТГ, ТТ, ТЦ, ЦА,

ЦГ, ЦТ, ЦЦ. Этого было недостаточно для кодирования 20-ти аминокислот. Значит, в кодон должны были входить, по крайней мере, три нуклеотида. Соображения экономии подсказали Гамову, что если трех нуклеотидов достаточно, то больше природа вряд ли потребует, а потому код должен быть триплетным - по три нуклеотида на одну аминокислоту. Присоединяя к каждой из выписанных 16-ти комбинаций, по очереди 4 нуклеотида получаем 64 комбинации, а это больше числа аминокислот. Теперь надо было делать выбор между двумя предположениями: либо код вырожден, либо код определяется не упорядоченной тройкой нуклеотидов, а как-то иначе. Руководствуясь тем же соображением экономии, Гамов решил, что на каждую аминокислоту Природа отпустила лишь один кодон, т.е. что код должен быть невырожденным. Так как число амиинокислот 20, то надо было придумать 20 различных комбинаций определяемых тройками. Комбинаторные рассмотрения показали, что число 20 можно получить так: брать либо тройки, но не учитывать в них порядок нуклеотидов, а интересоваться лишь их состоянием. Эта идея была реализована Гамовым в виде ромбовидного кода. Однако код Гамова не выдержал проверки экспериментом. Чисто комбинаторные попытки разгадать тайну генетического кода оказались безуспешными [93]. Гамов и его коллеги постепенно пришли к выводу, что единицей кодирования является триплет, т.е. кодон, состоящий из трёх нуклеотидов. Трёх нуклеотидов в кодоне, т.е. в совокупности нуклеотидов, кодирующих одну аминокислоту, более чем достаточно. Порядок соответствия триплетов нуклеотидов и аминокислот образуют генетиеский код. Наследственная информация хранится в молекулах ДНК в форме последовательности четырёх видов простых атомных групп, известных как «основания» (аденин, гуанин, тимин, цитозин). Гамов заинтересовался вопросом, как эта информация переводится в последовательность двадцати аминокислот, которые образуют молекулы протеина. Он пришел к выводу, что можно получить двадцать из четырёх подсчётом числа всех возможных триплетов, образующихся из четырёх различных сущностей. Возьмём, говорит Гамов, колоду игральных карт, в которой мы обращаем внимание только на масть карты. Сколько триплетов одного и того же вида можно получить? Четыре конечно: трое червей, трое бубен, трое пик и трое треф. Сколько триплетов с двумя картами одной и той же масти и одной другой? Пусть мы имеем четыре выбора для третьей карты. Поэтому мы имеем 4x3=12 возможностей. В дополнение мы имеем четыре триплета со всеми тремя различными картами. Итак,

4+12+4=20, а это и есть точное число аминокислот, которые мы хотели получить» [94]. Гамов очень непринуждённо использовал карточную

терминологию: «Возьмём, например, колоду игральных карт...» или «Допустим, мы играем в «упрощённый покер» [Оатоу, 1958]. Действительно, имеем четыре масти - две чёрные с ножками (пурины) и две красные без ножек (пиримидины). Если, например, продолжить идею Гамова и аденин обозначить как 4 (пики), гуанин как 4» (трефы), тимин как ? (бубны) и цитозин как V (червы), то последовательность, состоящая из аминокислот будет выглядеть так, как это представлено на рисунке 6.1.

4*44» П4 4*44 4*4 ?44 Г44 444 4?4 444

Глу Лей Вал Сер Арг Лей Тир Ала Тир

Рис. 6.1.

Природа как бы играет с теоретиком в «упрощённый покер», игра азартная, а выигрыш - крупнейшее открытие XX века. Ратнер В.А. отмечает, что случай с картами способствовал постановке проблемы, так как теория вероятностей возникла из практики карточных игр и рулетки [94]. Карты - одно из ранних изобретений - которые обладали прозрачной космогонической символикой. 52 карты соответствуют числу недель в году, 13 карт каждой масти символизируют 13 лунных месяцев, а 4 масти - это элементы мироздания, причем красные масти связаны с теплыми временами года и силами света, а черные - с холодными временами года и соответственно силами тьмы. Карты представляют собой комбинаторную семиотическую систему, обозначающую отдельные принципы, планы и элементы мироздания в их полноте и закономерной взаимосвязи а также их борьбу и воздействие друг на друга. Поэтому неудивительно, что Г.А. Гамов в своих рассуждениях использовал карты [73].

К 1964 году была установлена большая часть соответствий триплет - аминокислота, а результатом этой работы и является генетический код.

Ф.Крик и его сотрудники высказали гипотезу о неперекрывающемся коде. В соответствии с их кодом каждый триплет из нуклеотидных пар в двухцепочечной ДНК должен был определять одну аминокислоту, а каждая пара оснований -участвовать в детерминировании только одной аминокислоты. Такой код имел свои недостатки. Было непонятно, каким образом считывающий механизм узнает, какой из триплетов следует « считывать». Г.Стент и Р.Кэлиндар [95] рас-смотривают, как пример, последовательность нуклеотидов:..., АТТ, ГЦА, ТЦГ, ТГГ,..., показанную на рис. 6.2.

— А —Т —Т — г —Ц — А — Т—Ц—Г— Т—Г —Г —

- Иле-Ле й-Цис-Ала-Гис-Иле-Сер-Арг-Вал-Три-

Два основных типа кода, связывающих нуклеотидную последовательность в ДНК с аминокислотной последовательностью в полипептидах

Рис. 6.2. Два основных типа кода, связывающих нуклеотидную последовательность в ДНК с аминокислотной последовательностью в полипептидах. В обоих случаях одна аминокислота кодируется тремя последовательными нуклеотидами.

На рис.6.2.:А. Перекрывающийся код, в котором каждый нуклеотид принимает участие в детерминировании трех аминокислот. Кодовое отношение, или отношение числа нуклеотидов в участке ДНК к числу аминокислот в полипептидной цепи, кодируемой этим сегментом, равно 1:1.

Б. Неперекрывающийся код, в котором каждый нуклеотид принимает участие в детерминировании одной аминокислоты. В этом случае кодовое отношение равно 3:1.(Stent G.S., Molecular Biology of Bacterial Viruses, W.H. Freeman and Company, San Francisco, 1963.)[95].

На рис.6.2 ATT представляет одну аминокислоту, ГЦА - другую и так далее. Каким образом можно правильно прочесть эту последовательность, если удалить запятые? Для решения этого вопроса в такой код были введены дополнительные ограничения: каждый триплет, подобный ATT, ГЦА, ТЦГ, ТГГ, может узнаваться автоматически как слово с помощью словаря смысловых слов. Эти смысловые слова должны быть расположены так, чтобы при неправильном считывании частей любых двух соседних смысловых триплетов смыслового слова не получилось. Только смысловые слова нуклеотидных триплетов соответствуют амиинокислотам в словаре; все другие триплеты - те, которые могут быть образованы при неправильном считывании соседних смысловых триплетов, - не кодируют вообще никакой аминокислоты и, следовательно, являются бессмысленными (nonsense). Например, если ATT и ГЦА являются смысловыми словами в словаре, то ТТГ, ТГЦ, которые могут быть неправильно считаны с фрагмента АТТГЦА, должны быть обязательно бессмысленными словами. Следовательно, можно составить код без запятых, который обеспечивает правильное считывание информации без какой-либо необходимости в существовании пускового механизма считывания в начале полинуклеотидной цепи или в запятых между соседними смысловыми триплетами. Такой код без запятых не только формально возможен, но в любом таком коде не более чем 20 из 64 возможных триплетов могут быть смысловыми и, по крайней мере, 44 из оставшихся триплетов неизбежно будут бессмысленными. В результате в таком типе кода без запятых не будет синонимов, а будет только одно кодовое слово на аминокислоту. Эта гипотеза прекрасно объясняла явный избыток возможных триплетов над числом аминокислотных типов. Ограниченная природа словаря позволяет автоматически узнавать начало и конец каждого кодового слова, и это исключает необходимость в запятых или промежуточных знаках [95].

Философ Гухман В.Б. отмечает, что часть из 44-х кодонов может быть законсервирована природой для последующих ступеней эволюции, когда нынешние формы жизни под напором резко изменившейся среды обитания частично видоизменятся на основе видоизмененного генетического кода.

Если считать генетический код перекрывающимся, то при замене одного азотистого основания в белковом тексте должны измениться, по крайней мере, две аминокислоты:

АТГЦ Т^Ц -? АЦГЦ

Неперекрывающийся генетический код предполагает смысловую дискретность кодовых групп, в результате чего замена одного основания может привести к изменению только одной аминокислоты в белковой цепи: АТГ ЦАТ (при замене Т на Г) -? АГГ ЦАТ.

Такое предположение подтверждается экспериментальными исследованиями, в результате которых было показано, что в белке может измениться всего лишь одна аминокислота (например, при серповидноклеточной анемии).

Окончательный результат работы по расшифровке кода представлен в виде таблицы, названной генетическим кодом - рисунок 6.3.

Первое основание каждого триплета указано в таблице слева, второе-вверху, третье-справа. Аминокислоты обозначены сокращениями по три нуклеотида (А -аденин, У - урацил, Г - гуанин, Ц - цитозин). АУГ и ГУ Г играют роль

инициирующих кодонов - «Начало». УАА, УАГ и У ГА - это «стоп» кодоны.

2-

е

1- е

У

Ц

А

Г

3-е

УУУ

Фен

УЦУ

Сер

УАУ

Тир

УГУ

Цис

У

У

УУЦ

Фен

УЦЦ

Сер

УАЦ

Тир

УГЦ

Цис

ц

УУА

Лей

УЦА

Сер

УАА«Стоп»

УГА«Стоп»

А

УУГ

Лей

УЦГ

Сер

УАГ«Стоп»

УГГ

Три

Г

ЦУУ

Лей

ццу

Про

ЦАУ

Гис

ЦГУ

Арг

У

ц

ЦУЦ

Лей

ццц

Про

ЦАЦ

Гис

ЦГЦ

Арг

ц

ЦУА

Лей

ЦЦА

Про

ЦАА

Глн

ЦГА

Арг

А

ЦУГ

Лей

ццг

Про

ЦАГ

Глн

ЦГГ

Арг

Г

АУУ

Иле

АЦУ

Тре

ААУ

Асн

АГУ

Сер

У

А

АУЦ

Иле

АЦЦ

Тре

ААЦ

Асн

АГЦ

Сер

ц

АУА

Иле

АЦА

Тре

ААА

Лиз

АГА

Арг

А

АУГ Мет «Нач»

АЦГ

Тре

ААГ

Лиз

АГГ

Арг

Г

ГУУ

Вал

ГЦУ

Ала

ГАУ

Асп

ГГУ

Гли

У

Г

ГУЦ

Вал

гцц

Ала

ГАЦ

Асп

ГГЦ

Гли

ц

ГУА

Вал

ГЦА

Ала

ГАА

Глу

ГГА

Гли

А

ГУГ Вал «Нач»

ГЦГ

Ала

ГАГ

Глу

ГГГ

Гли

Г

Рис.6.3. Генетический код

Принцип построения этой таблицы, значение которой для биологии можно сравнить со значением Периодической системы химических элементов Д.И. Менделеева, был предложен Ф. Криком.

Генетический код обладает следующими особенностями:

  • 1. Код содержит много синонимов, т.е. почти каждая аминокислота представлена более чем одним кодоном.
  • 2. Код имеет определенную структуру. Так, кодоны - синонимы почти всегда находятся в одном и том же квадрате, т.е. отличаются друг от друга по последнему из трех нуклеотидов. (Исключения из этого правила составляют кодоны аргинина, серина и лейцина, имеющие по шесть кодонов, которые не могут уместиться в одном квадрате, соответствующем всем четырем кодонам). Как видно из таблицы генетического кода, более частое использование пролина, аргинина, аланина и глицина для построения белков соответствует более высокому содержанию [Г] + [Ц], тогда как в белках бактерий с более низким содержанием [Г] + [Ц] следует ожидать более высокой частоты встречаемости фенилаланина, метионина, аспарагина, тирозина, изолейцина и лизина. Исседование суммарного аминокислотного состава белков у разных видов бактерий подтвердило, что различное содержание [Г] + [Ц] в их ДНК может быть частично объяснено подобными различиями в первичной структуре белков.
  • 3. Код содержит три пошеше-кодона («бессмысленных» кодона): УАГ, УАА, и УГА, обозначенных «Стоп»; ни один из них не соответствует ка-кой либо аминокислоте. Они служат сигналами терминации полипептидных цепей.

Главная задача - полностью расшифровать этот код, в том числе объяснить происхождение числа 20 аминокислот, имея в наличии 64 триплета. Имеется и ряд вопросов, на которые сейчас практически никто не может ответить:

  • • Почему существует именно этот набор аминокислот, а не иной?
  • • Зачем в белках присутствуют два типа аминокислот - полярные, способные к образовавнию водородных связей, и неполярные?
  • • Почему аминокислоты имеют такие размеры, а не иные?
  • • Случайно или закономерно появление диалектов (михондрийной версии)? [96]. Генетический код не случаен, однако остаётся неясным вопрос, как он возник? Можно перечислить и массу других факторов, но и этих достаточно, чтобы сделать заключение о загадочности генетичекого кода.

Генетический код - это молекулярная система, с помощью которой информация из ДНК переводится в белковую.

Геном — это совокупность генов, содержащихся в гаплоидном (одинарном) наборе хромосом данного организма. В геноме заложена информация наследственного аппарата человека, устроенного в виде генетического текста. Геном человека включает десятки тысяч генов. По одним источникам, геном человека состоит примерно из 40 000 генов [97], по другим — в геноме человека насчитывается от 60 000 до 80000 генов [98]. Если смысловой кодон мутирует в другой смысловой кодон, соответствующий другой аминокислоте, то получается переосмысленный кодон, или кодон с измененным смыслом [99]. Ранее отмечалось, что одна и та же аминокислота может быть закодирована несколькими трехбуквенными «словами-кодонами». Поэтому генетический код оказывается в каком-то смысле избыточным, или, как говорят генетики, «вырожденным». Каждая из таких аминокислот кодируется одним, двумя, тремя, четырьмя или шестью триплетами. Все кодоны непрерывны и не разделены межкодовыми знаками, «запятыми». Теперь уже ясна и роль вырожденности кода. Из-за различных внешних воздействий в цепочке нуклеотидов возможны сбои. Благодаря вырожденное™ кода далеко не все сбои приводят к изменению синтезированных аминокислот, к мутациям, которые могут оказаться гибельными для организма, иными словами вырожденное™ генетического кода повышает его помехоустойчивость. Кроме того, код не перекрывающийся, т.е. считывание происходит кодон за кодоном. Все кодоны однозначны, т.е. каждый кодирует единственную аминокислоту, поэтому и генетический код в направлении кодон-аминокислота также однозначен. Два кодона, кодирующие одну и ту же аминокислоту, являются синонимическими.

Проведем более детальный анализ формирования триплетов с использованием комбинаторики. Выделим три группы триплетов, когда:

  • 1 .Все три основания одинаковые (4 группы триплетов): ААА, ГГГ, ТТТ, ЦЦЦ;
  • 2. Все три основания разные (4 группы триплетов):

ЦАТ, ТЦА, ГЦТ, ЦТГ, ТГА, ГАТ, ЦАГ, АГЦ,

АТЦ, АЦТ, ТГЦ,ТЦГ, АТГ, АГТ, ГЦА, ГАЦ,

ТАЦ, ЦТ А ГТЦ, ЦГТ, ТАГ, ГТА, ГЦА, АЦГ.

3. Два из трёх оснований одинаковые (12 групп триплетов):

ТТЦ, ТТА, ТТТ, ЦЦТ, ЦЦА, ЦЦГ, ААТ, ААЦ, ААГ, ГГТ, ГГЦ, ТГА,

ЦТТ, ATT, ТТТ, ТЦЦ, АСС, ГЦЦ, ТА А, ЦАЦ, ГАА, ТГГ, ЦТГ, АГГ

ТЦТ, ТАТ, ТТТ, ЦТЦ, ЦАЦ, ЦГЦ, АТА, АЦА, АГА, ГТГ, ГЦГ, ГАГ.

Из простой комбинаторики видно, что все триплеты, разделяясь на три семейства, дают 20 групп (это число сочетаний с повторениями любых четырех оснований по три). Каждая группа соответствует одной аминокислоте. Возможно это ответ на вопрос, почему аминокислот только 20.

При считывании триплетов в один шаг меняется только одно основание. Два основания неизменны. Таким образом, при трёх кодирующих основаниях (для каждой аминокислоты) на одном шаге считывания повторяются два основания, а одно изменяется. На следующем шаге изменяется еще одно основание. Полная смена оснований наступит только после третьего шага и, в этом случае вся комбинация триплета не будет иметь влияния от предыдущих сочетаний. Такое плавное перемещение одного триплета в другой приводит к ограничению возможности быстрого использования всех перестановок в триплете [100]. Для возможного использования всех 64-х вариантов триплетов потребуется 64x3=192 единичных шага считывания триплетов ДНК. В целях понимания пути природного кодирования аминокислот в ДНК А.В. Никитин применяет принцип симметрии в поиске нужных сочетаний триплетов. Для этого он выделяет все варианты симметричных кодов следующим образом: 1. Phe - UUU. 2. Pro - ССС. 3.Lys - AAA. 4.Gly - GGG. 5. Ile - AUA. 6.Arg - AGA. 7. Thr - АСА. 8. Tyr - UAU. 9. Cys-UGU. lO.Ser- UCU. 11. Glu-GAG. 12. Val-GUG. 13.Ala-GCG. 14. His-CAC. 15. Leu - CUC. 16.Glu - CAA. 17. Asn - AAC. 18.Trp- UGG. 19. Ter - UAA. 20.Asp-GAC. 21. Met-AUG. 22. Ter-UAG. 23. Ter-UGA.

Пятнадцать аминокислот получили симметричные коды. После этого Природа, видимо, использует при формировании кодонов два повторяющихся основания в триплете (CAA, AAC, UGG, UAA). И далее используются кодоны с разными основаниями. Видимо до конца и сразу были использованы только полные симметрии, а остальные были добавлены из неиспользованного резерва. Таким образом, оказались использованными все 64 варианта триплетов. Это позволило, как рассуждает А.В. Никитин, оставить рибосоме поэлементный шаг считывания, но была реализована и возможность триплетного считывания в независимом режиме. И потому на том этапе триплет - это максимально возможная форма единицы информации системы. Разряд на оси симметрии, разяд слева и разряд справа. Три разных единицы учета... даже для шагового чтения... это много. В системе кодирования информации ДНК и РНК применено 4 возможных логических состояния, триплетное считывание. Сложность для клетки -предельная. Вырожденность кода триплета - вынужденная мера, напрямую связанная с первоначальным способом считывания кода. Так уж получилось в ходе эволюции [100].

В 1961 г. американский биохимик М. Ниренберг провел основополагающие исследования по расшифровке генетического кода. Ему удалось «прочесть» первое слово в ДНК-овом тексте. Это была тройка букв: ААА, т.е. три аденина, стоящие друг за другом [101]. Нахождение соответствия между кодонами и аминокислотами - крупнейшее достижение молекулярной биологии, биохимии и биофизики.

Давно известно, что последовательность ДНК кодируется методом чередования видов молекул, которые обозначаются А, Т, Г и Ц. Каждая из этих букв, в свою очередь, может быть кодирована двумя двоичными битами - 00, 10, 01, 11. В том случае, когда эти два бита умножаются на 6 миллиардов (а именно такова длина генетического кода), потом делится на 8 (1байт равен 8 битам), то в итоге получается 1,5 гигабайтам [102].

Присвоив пиримидинам наличие признака, т.е. «1», а пуринам его отсутствие, т.е. «0», комплементарным на основе трех водородных связей - признак «1» и

соответственно комплементарным на основе двух водородных связей - «О», примем следующие соответствия нуклеотидов бинарным числам:

А = 00; Т = 10; Г = 01; Ц= И.

Строчная последовательность этих четырех букв на нитях нуклеиновых кислот содержит генетическую информацию для синтеза белков. Обычно говорят, энциклопедия жизни написана четырьмя буквами. Считают, что данный набор четырех букв является алфавитом генетического кода.

Генетический код можно связать с кодом Грея. Код Грея удобен тем, что он каждому натуральному числу, начиная с нуля, ставит в соответствие свою кодовую комбинацию — булев вектор — константу, число компонент, в котором выбирается в зависимости от количества кодируемых чисел, например:

  • 1. 0000
  • 2. 0 0 0 1
  • 3. 00 10
  • 4. 0 0 11
  • 5. 0 1 0 0 и т.д.

Выпишем все триплеты и соответствующие им значения (табл. 6. 1).

Таблица 6.1

Запись соответствий триплет-аминокислота в порядке _ возрастания двоичного кода__

Номер,

триплеты

Двоичный

код

Название

аминокисл

оты

Краткое

обозначен

ие

Буквенное

обозначен

ие

аминокисл

от

Рус.

Лат.

1 ААА

00 00 00

Лизин

Лиз

Ьуэ

К

2 ААГ

00 00 01

Лизин

Лиз

Ьуэ

К

3 ААТ

00 00 10

Аспарагин

Асн

Абп

N

4 ААЦ

00 00 11

Аспарагин

Аси

Аэп

N

5 АГА

00 01 00

Аргинин

Ар г

Я

6 АГГ

00 01 01

Аргинин

Ар г

Я

7 АГТ

00 01 10

Серин

Сер

Бег

Б

8 АГЦ

00 01 11

Серин

Сер

8ег

Б

9 АТА

00 10 00

Изолейцин

Иле

Не

I

10 АТГ

00 10 01

Метионин

Мет

Ме1

М

11 АТТ

00 10 10

Изолейцин

Иле

Ие

I

12 АТЦ

00 10 11

Изолейцин

Иле

Не

I

13 АЦА

00 11 00

Треонин

Тре

ТЬг

т

14 АЦГ

00 11 01

Треонин

Тре

ТЬг

т

15 АЦТ

00 11 10

Треонин

Тре

ТЬг

т

Номер,

триплеты

Двоичный

код

Название

аминокисл

оты

Краткое

обозначен

ие

Буквенное

обозначен

ие

аминокисл

от

Рус.

Лат.

16 АЦЦ

00 11 11

Треонин

Тре

Thr

Т

17 ГА А

01 00 00

Глутаминов ая кислота

Глу

Glu

Е

18 ГАГ

01 00 01

Глутаминов ая кислота

Глу

Glu

Е

19ГАТ

01 00 10

Аспарагино вая кислота

Асп

Asp

В

20 ГАЦ

01 00 11

Аспарагино вая кислота

Асп

Asp

В

21 ГГ А

01 01 00

Глицин

Гли

Gly

в

22 ГГГ

01 01 01

Глицин

Гли

Gly

в

23 ГГТ

01 01 10

Глицин

Гли

Gly

в

24 ГГЦ

01 01 11

Глицин

Гли

Gly

в

25 ГТА

01 10 00

Валин

Вал

Val

V

26 ГТГ

01 1001

Валин

Вал

Val

V

27 ГТТ

01 10 10

Валин

Вал

Val

V

28 ГТЦ

01 10 11

Валин

Вал

Val

V

29 ГЦА

01 11 00

Аланин

Ала

Ala

А

ЗОГЦГ

01 11 01

Аланин

Ала

Ala

А

31 ГЦТ

01 11 10

Аланин

Ала

Ala

А

32ГЦЦ

01 11 11

Аланин

Ала

Ala

А

33 ТАА

10 00 00

Стоп

Терм |Тепн

34 ТАГ

10 00 01

Стоп

Терм |Term

35ТАТ

10 00 10

Тирозин

Тир

Tyr

У

36ТАЦ

10 00 11

Тирозин

Тир

Tyr

У

37ТГА

10 01 00

Стоп

Терм

Term

38ТГГ

1001 01

Триптофан

Три

Trp

XV

39ТГТ

1001 10

Цистин

Цис

Cys

С

40 ТГЦ

1001 11

Цистин

Цис

Cys

С

41 ТТА

10 10 00

Лейцин

Лей

Leu

Е

42 ТТГ

10 1001

Лейцин

Лей

Leu

В

43 ТТТ

10 10 10

Фенилала

нин

Фел

Phe

Г

Номер,

триплеты

Двоичный

код

Название

аминокисл

оты

Краткое

обозначен

ие

Буквенное

обозначен

ие

аминокисл

от

Рус.

Лат.

44 ТТЦ

10 10 11

Фенилала

нин

Фел

Рйе

45 ТЦА

10 И 00

Серин

Сер

8ег

46 ТЦГ

10 11 01

Серин

Сер

8ег

47 ТЦТ

10 11 10

Серин

Сер

8ег

Б

48 ТЦЦ

10 11 11

Серин

Сер

8ег

8

49 ЦАА

11 00 00

Глутамин

Глун

01п

0

50ЦАГ

11 0001

Глутамин

Глун

01п

51 ЦАТ

11 00 10

Г истидин

Тис

Ни

н

52 ЦАЦ

11 00 11

Г истидин

Тис

Ню

н

53 ЦГА

11 01 00

Аргинин

Ар г

Ах%

я

54 ЦГГ

11 01 01

Аргинин

Ар г

я

55 ЦГТ

11 01 10

Аргинин

Ар г

я

56ЦГЦ

11 01 11

Аргинин

Ар г

Ах%

я

57ЦТА

11 1000

Лейцин

Лей

Ьеи

ь

58ЦТГ

11 1001

Лейцин

Лей

Ьеи

ь

59 ЦТТ

11 10 10

Лейцин

Лей

Ьеи

ь

60 ЦТЦ

11 10 11

Лейцин

Лей

Ьеи

ь

61 ЦЦА

11 11 00

Пролин

Про

Рго

р

62 ЦЦГ

11 11 01

Пролин

Про

Рго

р

63 ЦЦТ

11 11 10

Пролин

Про

Рго

р

64 ЦЦЦ

111111

Пролин

Про

Рго

р

Таблица 6.1по существу, представляет собой кодонно-аминокислотный словарь. Установление кода выдвинуло новые проблемы. Имеет ли генетический словарь физический, молекулярный смысл или корреляция между кодонами и аминокислотами совершенно случайна? Что можно сказать об эволюции кода в этой связи? Какие факторы влияют на чтение кода, на процессы транскрипции и трансляции? Что и как искажает код? Каковы физико-химические причины мутаций?

Код есть программа трансляции. Чрезвычайно важно понять условия реалии-зации этой программы. Генетически кодируется только первичная структура белка. Однако биологические функции определяются его пространственным строением. Первичная структура и пространственное строение однозначно связаны между собой. Тем самым, генетически закодирорваны пространственное

строение и биологическая функции белка. В то же время естественный отбор идет не по первичной, а по пространственной структуре - по биологическому поведению. Из таблицы 6.1. видно, что аминокислоты имеют одинаковые буквы в первом и во втором положении, а третьи буквы меняются. Например, аминокислота лизин кодируется первым основанием А, вторым основанием А и третьим основанием А или Г. Аналогично триплеты кодирующие аминокислоту аспарагин имеют в первом положении букву А, во втором положении — А, а в третьем положении — буквы Т или Ц. Из таблицы также видно, что вырожден-ность неравномерна. В дальнейшем, говоря о последовательностях, мы чаще всего будем подразумевать множества двоичных слов, т.к. в конечном итоге компьютер может обрабатывать элементы только такого множества.

Генетики утверждают, что полное число генетических кодов или их разнообразие оценивается числом Ю1000. Выбор кода за весь временной интервал существования Вселенной, а он, по мнению ученых, составляет 13,5 миллиардов лет, был осуществлён каким-то невероятно «необычным» способом, ибо полный перебор пред став ляяется невозможным. В связи с этим должны существовать какие-то другие версии поиска генетического кода [103].

Но однозначно то, что генетическому коду суждено жить вечно.

По Опарину генетический код рассматривается как итог функционирования клетки. Такая трактовка вызвала возрастающую волну критики и обострила противоречия ранее сложившиеся внутри модели Опарина-Хойдена между обоими её создателями. Если Опарин принимал за точку отсчёта биохимической эволюции целостные эволюционные системы, которые он назвал коацерватами (от лат. «коацерватус-наполненный, собранный, сгущённый, сгусток), то Холлдейн брал за основу большие молекулы, способные к самокопированию. С открытием роли нукоеиновых кислот и ферментов чаша весов стала постепенно склоняться на сторону Дж.Холдейна, который брал за исходную точку отсчёта самовоспроизведение и развитие способности к развитию, репродукции живой материи. Пред организмы, согласно Холдейну, можно представить по аналогии с вирусами типа табачной мозаики, которые содержат структуры ДНК и ферменты, необходимые для самокопирования. По мере выявления генетических основ микроэволюции представления о сущности жизни и гипотезы о её происхождении стали связываться с первичной ролью ДНК и РНК и подчиненной ролью белковых молекул. Однако исследования нобелевского лауреата 1967 г. М.Эйгена и его единомышленника Р. Дикерсона показали невозможность самовоспроизведения предбиологических кислот, состоящих исключительно из нуклеиновых кислот или из белков, а только на основе взаимодействия между ними. Это взаимодействие составляет суть концепции гиперцикла М.Эйгена, обоснованной в его работе «Самоорганизация материи в ходе химической эволюции», 1971 г. Согласно теории Эйгена, предпосылки биологической эволюции коренятся во внутреннем устройстве макромолекул, которые возникли на самой ранней стадии эволюции в «первичном бульоне». Макромолекулы представляют собой открытые системы, постоянно обменивающиеся энергией и веществом с окружающей средой. Около 3-4 миллиардов лет назад это среда представляла собой водный раствор, из которого можно было черпать энергию (полученную от солнечных лучей, электрических зарядов и т.д.). Этот обмен явился предшественником и первоисточником организованного обмена веществ. Макромолекулы обладают достаточной стабильностью, необходимой для хранения информации и формирования в зависимости от обстоятельств самых разных структур (в водной среде). Отсюда возникает способность к самовоспроизведению в виде образована

ния инструкций для синтеза аналогичных структур по матричному принципу, т.е существующие молекулы водной среды служат эталоном для синтеза однотипных с ними макромолекул, но с измененными (инновациями), отражающими воздействия внешней среды. Ограниченность материально-энергетических ресурсов для самовоспроизведения приводит к конкуренции и отбору наиболее конкурентноспособных форм. Такие формы размножаются, а менее конкурентноспособные быстро распадаются. Так начинается биологический отбор. Сделав ставку на самоорганизацию, Эйган выступил в качестве одного из идейных предшественников синергетики, широкое распространение которой началось в 70-е годы и продолжается до сих пор. В ходе этой экспансии синергетика сделалась одной из наиболее активных мобилизационных структур (парадигм) современной эволюции знания.

Суть концепции Холдейна заключалась в представлении о первичности особых макромолекулярных структур, способных к самоорганизации и поэтому получивших название «голых генов». Это означало, что нуклеотидная система при своём зарождении была «голой», нуклеиновые кислоты возникали раньше белков, но процесс самоорганизации начинался лишь по мере образования нуклеиновопротеиновых полипептидов с участием ферментов. Эти концепции в совокупности определили сущность подхода, который получил название генобиоза, связанного и информационно-генетической трактовкой зарождения жизни. Особенно укрепились позиции сторонников генобиоза, когда генетические исследования показали, что образование хиральности, т.е. свойства оптической активности и асимметрии, присущего всему живому, происходит одновременно в тесной связи с генетическим кодированием.

К началу 80-х годов XX в. в ряде экспериментов была продемонстрирована возможность воспроизведения РНК без участия ферментов. Специалисты сразу же заговорили о первичности РНК по отношению к ДНК и белкам. Но не могли объяснить, откуда в этот период на Земле мог взяться такой редкий элемент, как фосфор, без достаточных количеств которого отсутствовало бы «сырьё» для природного «производства» нуклеиновой кислоты. Всё это, по мнению критиков, очень похоже на экспериментальное обоснование не биохимической эволюции, а самопроизвольного самозарождения живого из неживого. В 1981 г. под руководством М.Эйгена были проведены успешные эксперименты по синтезу РНК в водном растворе мономеров с добавлением фермента полимеразы. Экспериментаторы надеялись получить ДНК, но получили РНК, что полностью перевернуло представление с роли нуклеиновых кислот в биохимической эволюции. На основании этох экспериментов Эйген стремился подкрепить свою концепцию гиперциклов, представляющую собой определенный компромисс между генобиозом и голобиозом. Эта концепция отстаивала одновременное возникновение генетических структур и ферментов, генетического кодирования и обмена веществ. Однако большинство ученых скептически отнеслись и продолжают относиться к подобной «коэволюции» генов и белков. Оснований для этого скептицизма вполне достаточно, они заключаются в принципиальной структурной и функциональной несовместимости белков и нуклеиновых кислот. Химическое поведение нуклеиновых кислот значительно проще по сравнению с белками, оно, как и соединения неживой природы, определяется структурой локальных участков цепи. Именно вследствие своей механичности нуклеиновые кислоты и смогли стать основой генетического кодирования и передачи информации, так сказать, информационной технологии или жизни. И, тем не менее, сущность разногласий стронников генобиоза и голобиоза как раз и была связана с тем, что белки не могли образовываться без инструкций, содержащихся в структурах нуклеиновых кислот, а нуклеиновые кислоты без катализации ферментами белками. В этой связке обнаружился замкнутый круг, и наука остается в тупике.

 
<<   СОДЕРЖАНИЕ   >>