Сколько мусора содержит наша ДНК?

Геном рыбы фугу примерно в восемь раз меньше, чем геном человека, и в 330 раз меньше, чем геном двоякодышащей рыбы протоптер. Какие «призраки» живут на «кладбищах геномов», и сколько мусора в нашей с вами ДНК?
Сколько мусора содержит наша ДНК?

Известный молекулярный биолог Дэвид Пенни из Центра молекулярной экологии и эволюции Аллена Вилсона в новозеландском Университете Массей как-то сказал: «Я бы весьма гордился работой в группе, которая разработала геном кишечной палочки. Однако я бы никогда не признался, что участвовал в проектировании генома человека. Ни в одном университете этот проект не смогли бы настолько испортить». Тема о количестве мусора в нашей ДНК — одна из самых «горячих» тем в научном сообществе. Вокруг этого вопроса среди ученых разгораются настоящие словесные баталии.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Немного молекулярной генетики

Напомним, что в основе передачи наследственной информации лежит двухцепочечная молекула ДНК. Она представляет собой полимер из четырех типов мономеров (нуклеотидов): аденина (A), тимина (T), цитозина (С) и гуанина (G) — и уложена в хромосомы. У человека 23 пары расположенных в ядре хромосом (22 пары неполовых и одна пара половых). Они и составляют основу нашего генома (еще 37 генов содержат кольцевые ДНК митохондрий). Если бы мы взяли одну клетку человека, сшили весь диплоидный (парный) набор хромосом вместе и вытянули в нить, то получили бы молекулу длиной в два метра, состоящую из шести миллиардов пар оснований (нуклеотидов). Три миллиарда от папы и три — от мамы.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Геномы и гены
Геномы и гены
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Наиболее изученный тип функциональных последовательностей ДНК — гены, кодирующие белки. С таких генов считывается молекула РНК, которая затем играет роль матрицы для синтеза белков и определяет их аминокислотную последовательность. Кодирующая часть молекулы РНК может быть разделена на тройки нуклеотидов (кодоны), которые либо соответствуют некоторой аминокислоте, либо определяют место окончания синтеза белка (стоп-кодоны). Правило соответствия кодонов аминокислотам называется генетическим кодом. Например, кодон GCC кодирует аминокислоту аланин.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Померимся генами?

Когда-то думали, что у столь сложного организма, как человек, должно быть очень много генов. Когда проект «Геном человека» подходил к завершению, ученые даже устроили тотализатор: сколько генов будет обнаружено? Каково же было их удивление, когда оказалось, что количество генов у человека и маленького круглого червя Caenorhabditis elegans примерно одинаковое. У червяка около 20 000 генов, а у нас — 20−25 тысяч. Для «венца творения» факт довольно обидный, особенно если учесть, что существует много организмов как с бОльшим по размеру геномом (геном двоякодышащей рыбы протоптер, Protopterus aethiopicus, в 40 раз больше человеческого), так и с бОльшим количеством генов (у риса — 32−50 тысяч генов).

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Но на самом деле у человека менее 2% генома кодируют какие-либо белки. Для чего же нужны остальные 98%? Может, там скрывается секрет нашей сложности? Оказалось, что существуют важные некодирующие участки ДНК. Например, это участки промоторов — последовательностей нуклеотидов, на которые садится фермент РНК-полимераза и откуда начинается синтез молекулы РНК. Это участки связывания транскрипционных факторов — белков, регулирующих работу генов. Это теломеры, защищающие концы хромосом, и центромеры, необходимые для правильного расхождения хромосом по разным полюсам клеток при делении. Известны некоторые регуляторные молекулы РНК (например, микроРНК, препятствующие синтезу белков соответствующих генов на матричной РНК — копии гена-исходника), а также молекулы РНК, входящие в состав важных ферментативных комплексов — например, рибосом, которые собирают из отдельных аминокислот белки, передвигаясь по матричной РНК. Есть и другие примеры важных некодирующих участков ДНК.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Тем не менее бОльшая часть нашего генома напоминает пустыню: повторяющиеся последовательности, останки «мертвых» вирусов, которые когда-то давно встраивались в геномы наших предков; так называемые эгоистичные мобильные элементы — последовательности ДНК, способные перескакивать из одного участка генома в другой; различные псевдогены — нуклеотидные последовательности, утратившие способность кодировать белки в результате мутаций, но все еще сохранившие некоторые признаки генов. Это далеко не полный список «призраков», обитающих на «кладбище генома».

Вдвое умнее мух

Идея тотализатора по поводу числа человеческих генов пришла в голову доктору Эвану Бирни в баре при лаборатории в Колд-Спринг-Харбор незадолго до завершения проекта «Геном человека». По мере приближения к финалу, с 2000 по 2002 год, ставки выросли с 1 доллара до 20. В результате банк разделили «на троих»: Пол Дир из Британского совета по медицинским исследованиям, который еще в 2000 году поставил на дату своего рождения — 27.04.1962 — 27 462, Ли Роуэн из Института системной биологии в Сиэтле — в 2001 году она поставила на число 25 947, и Оливер Джейлон из французской компании Genoscope (26 500). Когда главного победителя — доктора Дира — спросили, как ему удалось еще три года назад, когда все думали, что генов у человека не меньше 50 000, угадать число с такой точностью, он ответил: «Дело было в баре, глубокой ночью. Наблюдая за поведением пьющих людей, я подумал, что оно мало отличается от поведения мух-дрозофил, у которых 13500 генов, а потому мне показалось, что удвоенного числа мушиных генов людям вполне достаточно».

Минимальная мышь

Существует точка зрения, что бОльшая часть генома человека нефункциональна. В 2004 году журнал Nature опубликовал статью, описывавшую мышей, из генома которых были вырезаны значительные фрагменты некодирующей ДНК размером в 0,8 и даже 1,5 млн нуклеотидов. Было показано, что эти мыши не отличаются от обычных строением тела, развитием, продолжительностью жизни или способностью оставлять потомство. Разумеется, какие-то отличия могли остаться незамеченными, но в целом это был серьезный аргумент в пользу существования «мусорной ДНК», от которой можно избавиться без особых последствий. Конечно, было бы интересно вырезать не пару миллионов нуклеотидов, а миллиард, оставив только предсказанные последовательности генов и известные функциональные элементы. Удастся ли вывести подобную «минимальную мышь», и сможет ли она нормально существовать? Может ли человек обойтись геномом длиной лишь в полметра?

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Возможно, когда-нибудь мы об этом узнаем. Тем временем еще один важный аргумент в пользу существования мусорной ДНК — наличие достаточно близких организмов с очень разными размерами геномов. Геном рыбы фугу примерно в восемь раз меньше, чем геном человека (хотя генов в нем примерно столько же), и в 330 раз меньше, чем геном уже упомянутой рыбы протоптер. Если бы каждый нуклеотид в геноме был функционален, то непонятно, зачем луку геном в пять раз больший, чем у нас?

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

На колоссальные различия в размерах геномов сходных организмов обратил внимание эволюционный биолог Сусуму Оно. Считается, что именно Оно ввел термин «мусорная ДНК» (junk DNA). Еще в 1972 году, задолго до того, как был прочитан геном человека, Оно высказал правдоподобные представления как о количестве генов в геноме человека, так и о количестве «мусора» в нем. В своей статье «Столько мусорной ДНК в нашем геноме» он отмечает, что в геноме человека должно быть около 30000 генов. Это число, на тот момент совсем не очевидное, оказалось удивительно близко к реальному, которое узнали десятки лет спустя. Кроме того, Оно приводит оценку функциональной доли генома (6%), объявляя более 90% генома человека мусором.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Находка или мусор?

Вызов представлению о существовании мусорной ДНК бросил проект ENCODE — The Encyclopedia of DNA Elements, «Энциклопедия элементов ДНК» (первые его результаты опубликованы в журнале Nature в 2012 году). Получив многочисленные экспериментальные данные о том, какие части генома человека взаимодействуют с различными белками, участвуют в транскрипции — синтезе РНК-копий генов для последующей трансляции (синтеза белка из аминокислот на матрице информационной РНК) — или других биохимических процессах, авторы пришли к выводу, что более 80% генома человека так или иначе функциональны. Разумеется, данный тезис вызвал бурное обсуждение в научном сообществе.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Одна из наиболее ироничных статей, опубликованная Дэном Грауром, специалистом по молекулярной эволюционной биоинформатике, профессором Хьюстонского университета, и его коллегами в 2013 году в журнале Genome biology and evolution, называется так: «О бессмертии телевизоров: "функция" в геноме человека по лишенному эволюции Евангелию от ENCODE». Ее авторы отмечают, что отдельные члены консорциума ENCODE расходятся в том, какая часть генома функциональна. Так, один из них вскоре уточнил в журнале Genomicron, что речь идет не о 80% функциональных последовательностей в геноме, а о 40%, а другой (в статье в Scientific American) и вовсе снизил показатель до 20%, но при этом продолжал настаивать, что термин «мусорная ДНК» нужно устранить из лексикона.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

По мнению авторов статьи «О бессмертии телевизоров», члены консорциума ENCODE слишком вольно интерпретируют термин «функция». Например, существуют белки, которые называют гистонами. Они могут связывать молекулу ДНК и помогают ей компактно укладываться. Гистоны могут подвергаться определенным химическим модификациям. Согласно ENCODE, предположительная функция одной из таких модификаций гистонов — «предпочтение находиться в 5'-конце генов» (5'-конец — это конец гена, от которого движутся ферменты ДНК- и РНК-полимеразы при копировании ДНК или при транскрипции). «Примерно так же можно сказать, что функция Белого дома — занимать площадь земли по адресу 1600, Пенсильвания-авеню, Вашингтон, округ Колумбия», — отмечают оппоненты.

Каша ехала на мотоцикле

Иногда в СМИ можно услышать некорректную фразу «генетический код мутировал». Но мутации происходят не в коде, а в молекуле ДНК (в геноме). В результате меняются нуклеотидные последовательности. Это можно сравнить с заменой буквы в слове. Например, фраза «Маша ехала на мотоцикле» превращается во фразу «Саша ехала на мотоцикле», если одна буква М «мутировала» в букву С. Изменение генетического кода намного серьезней — это как изменение алфавита. Представим, что во всем тексте буква М внезапно превратилась в букву К. Теперь у нас «Каша ехала на котоцикле». Понятно, что такие изменения приводят к значительным последствиям и поэтому в природе происходят крайне редко. Но происходят! Например, у некоторых инфузорий один из стоп-кодонов может кодировать аминокислоту глутамин. Но это скорее исключение, чем правило. У большинства организмов один и тот же генетический код: например, у человека, у червяка или огурца. А вот геномы у этих организмов различаются очень сильно. Тот же алфавит, но другой текст.

Возникает проблема и с приписыванием функции участкам ДНК. Предположим, что к определенному участку ДНК способен прикрепляться важный для функционирования клетки белок, и поэтому ENCODE приписывает этому участку «функцию». Например, некоторый транскрипционный фактор — белок, инициирующий синтез информационной (матричной) РНК — связывается со следующей последовательностью нуклеотидов: TATAAA. Рассмотрим две идентичные последовательности TATAAA в разных частях генома. После того как транскрипционный фактор связывается с первой последовательностью, начинается синтез молекулы РНК, служащей матрицей для синтеза другого важного белка. Мутации (замены любого из нуклеотидов) в этой последовательности приведут к тому, что РНК будет считываться плохо, белок не будет синтезирован, и это, скорее всего, негативно скажется на выживании организма. Поэтому правильная последовательность TATAAA будет поддерживаться в данном месте генома с помощью естественного отбора, и в этом случае уместно говорить о наличии у нее функции.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Другая последовательность TATAAA возникла в геноме по случайным причинам. Поскольку она идентична первой, с ней тоже связывается транскрипционный фактор. Но никакого гена рядом нет, поэтому связывание ни к чему не приводит. Если в этом участке возникнет мутация, ничего не изменится, организм не пострадает. В данном случае говорить о функции второго участка TATAAA нет смысла. Впрочем, может оказаться, что наличие в геноме большого количества последовательностей TATAAA вдали от генов нужно просто для того, чтобы связывать транскрипционный фактор и уменьшать его эффективную концентрацию. В таком случае отбор будет регулировать число таких последовательностей в геноме.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Чтобы доказать, что некоторый участок ДНК функционален, недостаточно показать, что в этом участке происходит некий биологический процесс (например, связывание ДНК). Члены консорциума ENCODE пишут, что функцией обладают участки ДНК, которые вовлечены в транскрипцию. «Но почему нужно акцентировать внимание на том, что 74,7% генома транскрибируется, в то время как можно сказать, что 100% генома принимает участие в воспроизводимом биохимическом процессе — репликации!», — снова шутит Граур.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Хорошим критерием функциональности участка ДНК является то, что мутации в нем достаточно вредны и значительные изменения этого участка не наблюдаются из поколения в поколение. Как определить такие участки? Здесь на помощь и приходит биоинформатика, современная наука на стыке биологии и математики об анализе последовательностей генов и белков. Мы можем взять геномы человека и мыши и найти в них все похожие участки ДНК. Окажется, что у этих двух видов какие-то участки последовательностей нуклеотидов очень похожи. Например, гены, необходимые для синтеза рибосомальных белков, довольно консервативны, то есть мутации в них достаточно вредны, чтобы носители новых мутаций вымирали, не оставляя потомства. Про такие гены говорят, что они находятся под отрицательным отбором, очищающим от вредных мутаций. Другие участки геномов будут иметь значительные расхождения между видами, что указывает на то, что мутации в этих участках, скорее всего, безвредны, а значит, их функциональная роль невелика или не определяется конкретной последовательностью нуклеотидов. В ряде работ оценили долю участков ДНК человека, находящихся под давлением отрицательного отбора. Оказалось, что к ним относятся только около 6,5−10% генома, причем некодирующие участки, в отличие от кодирующих, гораздо меньше подвержены отрицательному отбору. Получается, что с точки зрения эволюционных критериев функциональны менее 10% генома человека. Обратите внимание, как близок к этой оценке был Оно в 1972 году!

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Мусорная крепость

Но неужели остальные 90% генома человека — мусор, от которого лучше избавиться? Не совсем так. Есть соображения, что большой размер генома может быть полезен сам по себе. У бактерий репликация генома служит серьезным ограничивающим фактором, требующим значительных затрат энергии. Поэтому их геномы, как правило, маленькие, а от всего лишнего они избавляются. У крупных организмов, как правило, репликация ДНК делящихся клеток вносит не столь большой вклад в общее количество энергозатрат организма на фоне расходов на работу мозга, мышц, органов выделения, поддержания температуры тела и т. д. В то же время большой геном может быть важным источником генетического разнообразия, увеличивая шансы на появление новых функциональных участков из нефункциональных за счет мутаций, потенциально полезных в процессе эволюции. Мобильные элементы могут переносить регуляторные элементы, создавая генетическое разнообразие в регуляции работы генов. То есть организмы с крупными геномами теоретически могут быстрее адаптироваться к условиям среды, расплачиваясь сравнительно небольшими дополнительными затратами на репликацию более крупного генома. Подобный эффект мы не обнаружим у отдельного организма, но он может играть важную роль на уровне популяции.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Наличие крупного генома может также уменьшать вероятность того, что какой-нибудь вирус встроится в функциональный ген (что может привести к поломке гена и в ряде случаев к раку). Иными словами, не исключено, что естественный отбор может действовать не только на поддержание конкретных последовательностей в геноме, но на сохранение определенных размеров генома, нуклеотидного состава в некоторых его участках и т. д.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Впрочем, хотя идея, что только 80% или даже 20% генома человека функциональны — спорна, это вовсе не значит, что критике подлежит весь проект ENCODE. В его рамках получено огромное количество данных о том, как разные белки связываются с ДНК, информации о регуляции генов и т. д. Эти данные представляют большой интерес для специалистов. Но едва ли в ближайшее время удастся избавиться от «мусора» в геноме — как от концепции, так и от самих ненужных последовательностей.

Автор — научный сотрудник сектора молекулярной эволюции ИППИ РАН

Автор благодарит Евгению Дуеву и Юрия Панчина за помощь в написании статьи. Редакция выражает благодарность сайту «Биомолекула».