Введение
Транспозоны (ТЕ — transposable elements) — это мобильные генетические элементы, обнаруживаемые у всех живых организмов. Они способствуют регуляции экспрессии генов при развитии и адаптации, а также служат основными источниками генетических вариаций в эволюции геномов. Например, большинство примат-специфических последовательностей, регулирующих генную экспрессию, произошли от ТЕ [1]. ТЕ составляют значительную долю большинства геномов многоклеточных эукариот: 15—47% у насекомых, 35—69% у млекопитающих и до 90% у растений [2]. У прокариот ТЕ обеспечивают возможность в ходе эволюции некоторым генам базового набора переходить в категорию вспомогательных, а вспомогательным — в базовые [3]. Кроме того, мобильные элементы бактерий при своих перемещениях инактивируют гены хозяев или изменяют их регуляцию, а также индуцируют все виды хромосомных перестроек и обеспечивают перенос генов между разными особями [4].
ТЕ образуют 2 класса: 1 — ретротранспозоны, 2 — ДНК-транспозоны. Ретро-ТЕ делятся на несущие длинные концевые повторы LTR (ретровирусы: Ty1/Copia, Ty3/Gypsy, Bel/Pao, Dirs) и не содержащие LTR (nonLTR) ретротранспозоны: LINE и SINE [5]. Ретро-ТЕ перемещается в новый локус, оставляя исходную копию на прежнем месте. Идентичность образуемых копий способствует гомологичной рекомбинации между ТЕ, которая индуцирует внутригеномные хромосомные перестройки (делеции, транслокации, инверсии, сегментарные дупликации) и внутригенные мутации (при внедрении в ген), что рассматривается в качестве двигателя эволюции [6]. ДНК-ТЕ перемещаются путем вырезания исходной копии. Хотя для некоторых ДНК-ТЕ прокариот, например Tn1, IS1, IS2 и IS4, показано, что их транспозиции могут быть не сопряжены с исключением из мест исходной локализации в плазмидах или хромосоме («репликативные» транспозиции) [4].
Среди ДНК-ТЕ выделяют 2 подкласса: элементы вырезания/вставки и хелитроны (элементы катящегося кольца) [2]. Элементы вырезания/вставки перемещаются при помощи транспозазы (фермента класса рекомбиназ), новое место интеграции обычно находится вблизи старого [7]. Они содержат инвертированные концевые повторы (TIR — terminal inverted repeat), фланкированные дупликациями сайта-мишени (TSD — target site duplication) различной длины и состава. Последние чувствительны к транспозазам, в зависимости от ферментативных свойств которых ДНК-ТЕ относят к разным суперсемействам. Так, для Tc1/Mariner характерны 5’-TA-3’ TSD, для piggiBack — 5’-TTAA-3’, для hobo-Ac-Tam3 — TSD длиной 8 п.н., для PIF/Harbinger — 3 п.н., для Mutator/MuDR — 9 — 12 п.н. Выявлена также новая группа ДНК-ТЕ Spy, представители которой не создают TSD при инсерции. Вместо этого Spy транспозируют точно между нуклеотидами хозяев 5’-AAA и TTT-3’ без дупликации или модификации целевых сайтов AAATTT [2]. Кроме того, выделяют неавтономные ДНК-ТЕ. К ним относятся миниатюрные инвертированные повторы (MITE), некоторые из которых содержат коровые повторы, имеющие тенденцию располагаться в тандемных массивах — в ряде случаев эти массивы приводят к появлению сателлитных ДНК в пери- и центромерных областях хромосом [8]. Для определения сайтов интеграции ТЕ разработаны и внедрены системы алгоритмов RelocaTE, RetroSeq, TEMP, TIF, ITIS (Identification of Transposon Insertion Sites) [9].
В геномах прокариот ТЕ составляют значительно меньшую долю, так как наибольшее значение в их эволюции имеет горизонтальный перенос (ГП) генов при помощи плазмид, интегронов и бактериофагов. У прокариот обнаруживаются как ДНК-ТЕ, так и ретро-ТЕ. Последние у бактерий образуют 17 основных групп: интроны группы II, ретроны, DGR (diversity-generating retroelements); Abi-подобные, ассоциированные с CRISPR-Cas и подобные группе II ретро-ТЕ, а также 11 других групп ретроэлементов с неизвестными функциями. Из них свойствами защиты от чужеродных элементов обладают DGR, Abi (abortive bacteriophage infection) и CRISPR (clustered regularly interspaced, short palindromic repeats) [10]. Несмотря на эффективность данных защитных систем, ГП у прокариот является основным источником эволюционной изменчивости. Для эукариот большее значение в преобразовании геномов приобрели ТЕ, составляя значительную долю их геномов; вирусы же, наиболее вероятно, являются продуктами эволюции ТЕ при обретении ими способности к ГП. Разно-образие и распространенность вирусов у эукариот говорит о значении ТЕ в их происхождении. В дальнейшем из-за выраженной мутабельности вирусы утрачивают признаки эволюционной связи со своими предшественниками.
Взаимопревращения вирусов и транспозонов в эволюции
Распределение и состав ТЕ и вирусов специфичны для разных доменов живого, что позволяет предположить их взаимопревращения в эволюции, при которых ТЕ служат источниками вирусов. Так, у прокариот большую долю составляют ДНК-содержащие вирусы, и наиболее распространенными ТЕ также являются ДНК-транспозоны. Для эукариот, в геномах которых преобладают ретро-ТЕ, характерно превалирование РНК-содержащих вирусов. ТЕ могут быть автономными и неавтономными — последние размножаются при помощи белковых продуктов первых. Те же свойства характерны и для вирусов — существуют сателлитные вирусы (вирофаги), репродуцирующиеся при помощи факторов более крупных вирусов [11].
Предполагается, что экзогенные ретровирусы образовались из Ty3/Gypsy LTR-содержащих ретро-ТЕ — их последовательности выявляются в геномах большинства живых организмов [12]. В отношении происхождения других вирусов нет точных данных, доказывающих их происхождение. Логика возникновения вирусов в эволюции для передачи информации адаптирующих свойств приводит к выводу об их происхождении от ТЕ вследствие высокой мутабельности. РНК-вирусы могли возникнуть из ретро-ТЕ, а ДНК-вирусы — от ДНК-ТЕ. При этом ферменты, используемые для интеграции в геном хозяина, могли приобрести иные свойства, необходимые для автономной репродукции под влиянием ряда мутаций. Вследствие этого произошедшие от ТЕ экзогенные вирусы утратили свойства интеграции в геном хозяина одновременно с приобретением вирулентности и передачи другим клеткам и организмам. Благодаря мутациям многие вирусы окончательно утратили признаки ТЕ. В настоящее время обнаруживаются промежуточные эволюционные ниши, демонстрирующие механизмы возникновении вирусов от ТЕ: горизонтальный перенос ТЕ [13] и передача одомашненных ретро-ТЕ (произошедших от Ty3/gypsy) в капсидах из эндогенных белков Arc (сходных с ретровирусными Gag) между нейронами [14]. Дальнейшие мутации данных промежуточных форм могут вызвать образование экзогенных вирусов, не содержащих в своем составе последовательностей ТЕ, что является логическим завершением череды их изменений с образованием новых таксонов вирусов, характеризующихся высоким разнообразием.
Возникновение вирусов у эукариот является побочным продуктом эволюционных преобразований геномов при помощи ТЕ. В пользу данного предположения свидетельствует способность к интеграции в геном хозяина вирусов, не содержащих в своем составе генов, кодирующих необходимые для инсерции ферменты. Например, при гепатите В возможна интеграция всего вирусного генома [15], при аденовирусных и герпес-вирусных инфекциях обычно интегрирует часть генома, при инфекции онковирусами может интегрировать как полный геном, так и его часть [16]. Тропизм вирусов к определенным тканям и интеграции в геномы их клеток также является подтверждением их происхождения от ТЕ, так как последние характеризуются активацией в специфических тканях, аранжируя генные сети для выполнения клетками тканеспецифических функций [17—19]. Кроме того, гены и последовательности ТЕ обладают высоким потенциалом при их мутациях образовывать гены функциональных РНК и их белковых продуктов, что важно для эволюции вирусов. Подтверждением данного потенциала служит обнаружение того, что ТЕ являются важнейшими источниками генов некодирующих РНК (нкРНК) [20, 21], регуляторных последовательностей [22] и белок-кодирующих генов (БКГ) их хозяев [22—24].
Как вирусы, так и ТЕ обладают повышенной мутабельностью. Последовательности ERV (эндогенных ретровирусов) подвержены дезорганизации путем образования мутаций со сдвигом рамки считывания, стоп-кодонов и делеций, которые поражают их способность к репликации и транспозиции [25]. В связи с повышенной мутабельностью многие ТЕ утрачивают первоначальные свойства, в том числе способность к транспозициям, и кооптируются хозяевами для образования новых адаптационных признаков. Например, при помощи ТЕ-специфичных доменов выявлено множество происходящих от ТЕ генов, некоторые из которых образуют тандемные кластеры генных семей [24]. БКГ ERV также предоставляют генетический материал, кооптируемый хозяевами. Например, гены Syncytin у млекопитающих — лучшее представление доказанного одомашнивания генного продукта ERV для клеточных функций. Гены Syncytin кооптированы от генов envelope ERV независимо у различных линий млекопитающих, выполняя физиологическую функцию в плаценте [26]. Получены многочисленные данные о происхождении эукариотических генов путем одомашнивания ТЕ, которые описаны в крупных обзорах [22, 23]. Кроме одомашнивания, ТЕ, внедренные в интроны, могут быть использованы для появления новых доменов существующих БКГ путем экзонизации. Например, в генах TMPO и ZNF451, характерных для всех позвоночных, домены LAP2α сплайсинговых изоформ произошли от ORF1 ретротранспозона DIRS1-like. Данная сплайсинговая изоформа TMPO(LAP2α) используется для новой важной клеточной функции белка [27]. Экзонизация связана со способностью продуктов трансляции ТЕ образовывать ДНК-связывающие домены и другие пространственные структуры, позволяющие белку обретать новые функции. Помимо интронных ТЕ, широко распространенным явлением является использование инсерций для альтернативных 3’-UTR [22].
В литературе описаны случаи взаимопревращения вирусов и Т.Е. Доказано проникновение ERV летучей мыши Myotis lucifugus в геномы более 100 видов млекопитающих. При этом одни и те же виды ретровирусов множество раз переходят от инфекционного патогена к геномному паразиту (ретро-ТЕ), испытывая различную динамику инвазии у разных хозяев [28]. Из LTR-содержащих ретро-ТЕ эволюционировали вирусы растений семейства Caulimoviridae. Так как эти вирусы сходны с ретровирусами, их объединяют в группу параретровирусов, которые имеют кольцевую двухцепочечную ДНК и реплицируются в растениях посредством промежуточных РНК. Существуют виды данного семейства, которые могут интегрировать в геном хозяина и обозначаются как эндогенные параретровирусы (EPRV) [29]. Кроме того, непосредственно в геномах вирусов обнаружены ТЕ, которые, как предполагается, выполняют функцию, сходную с РНК-интерференцией. Так, в составе вирусов четырех семейств: Astroviridae, Caliciviridae, Picornaviridae, Coronaviridae обнаружен мобильный элемент s2m. Впервые данный консервативный ТЕ длиной 43 пары нуклеотидов был обнаружен в 1997 г. на 3’-конце вирусов семейства Astroviridae [30]. Кроме того, подобно ТЕ, многие вирусы также кодируют гены микро-РНК, которые играют важную роль в вирусной инфекции и их репликации [31], что также говорит в пользу происхождения вирусов от Т.Е. Обнаружены также вирофаги, которые по генетической гомологии представляют эволюционное звено между двуцепочечными ДНК-содержащими вирусами и эукариотическими ДНК-ТЕ Maverick/Polinton [32]. Например, вирофаги RVP (rumen virophages) кодируют типичный крупный белок вирофагов, АТФазу и протеазу в сочетании с типичной для полинтонов ДНК-полимеразой. Геномы RVP представляют собой гибрид вирофагов и полинтонов, в виде линейной молекулы с терминальными инвертированными повторами, которая способна образовывать инфекционные вирионы [33].
Показательным примером взаимопревращений ТЕ и вирусов являются представители семейства Polinton. Полинтоны населяют геномы протистов, грибов и животных, включая амеб, Phakopsora pachyrhizi, гидр, морских анемон, нематод, плодовых мушек, жуков, морских ежей, асцидий, рыб, ящериц, лягушек и кур. Аналогично известным ТЕ полинтоны существуют в виде автономных и неавтономных элементов. Предполагается, что они эволюционировали от линейных плазмид, которые приобрели ретровирусную интегразу около 1 млрд лет назад [34]. Согласно результатам филогенетических анализов было показано, что полинтоны в эволюции распространялись в основном вертикально [35], хотя получены данные об их горизонтальном переносе [36]. Семейство Polinton особенно обильно распространено в геномах некоторых протистов. Данные самосинтезирующиеся ТЕ кодируют собственную ДНК-полимеразу (DNAP), ретровирусоподобную интегразу, белки капсидов, упаковывающую ДНК АТФазу и протеиназу созревания капсидов. Следовательно, полинтоны являются альтернативой между транспозонным и вирусным образом жизни. Сравнительный геномный анализ полинтонов, вирофагов, полинтон-подобных (PLV — Polinton-like viruses) и других вирусов с двухцепочечной ДНК показал, что полинтоны могли быть предками широкого спектра эукариотических вирусов, в том числе аденовирусов и мегавирусов [37]. Кроме того, у эукариот были обнаружены вирусоподобные частицы, образованные из упакованных при помощи белков оболочки РНК-содержащего вируса FHV (flock house virus) молекул РНК хозяина (мРНК, рРНК, нкРНК и ТЕ). Упаковка этих РНК хозяина дает возможность горизонтального переноса между генов эукариотическими геномами, в которых содержится вирусный патоген [38].
Полинтоны кодируют два белка капсида, что позволяет им вести двойной образ жизни в виде ТЕ и вирусов [39]. Показаны также эволюционные взаимосвязи полинтонов с бактериальными тективирусами и линейными митохондриальными плазмидами [40]. Кроме того, недавно были выявлены вирусы PLV, которые сходны с полинтонами и вирофагами по размеру генома и консервативным морфогенетическим модулям, за исключением того, что PLV не содержат интегразу ретровирусного типа [33]. Это говорит о роли ТЕ в происхождении вирусов, которые в ходе эволюции меняют свои свойства благодаря отбору новых адаптивных признаков, возникших в результате мутаций. Например, некоторые PLV содержат общую для бактерий и бактериофагов тирозиновую рекомбиназу—интегразу, а определенные PLV интегрируют в геномы водорослей, проявляя двойственный характер существования в виде ТЕ и вирусов [33]. Подобным дуализмом обладают также некоторые ДНК-ТЕ, например, Tlr-элементы, обнаруженные в геноме зародышевой линии ресничных инфузорий Tetrahymena thermophila [41].
Определенные ERV способны формировать вирусоподобные частицы с инфекционной активностью. Филогенетический анализ показал, что экзогенные ретровирусы возникли из LTR-содержащих ретро-ТЕ в результате приобретения гена env, белковый продукт которого позволил сформировать вирусную частицу, обладающую инфекционной способностью [42]. Структурное сходство вируса гепатита В с ретровирусами, а также его способность интегрировать в геном хозяина также позволяют предположить его происхождение от ТЕ [43]. О происхождении вирусов от ТЕ говорит характер распространения ТЕ подобно межвидовым пандемиям при Г.П. Выявлено, что 15—46 млн лет назад произошли зародышевые инфильтрации семейства ДНК-ТЕ SPIN, породившие один из самых крупных всплесков активности ДНК-ТЕ (почти 100 000 копий SPIN на гаплоидный геном). Консенсусные последовательности SPIN идентичны на 96% по всей их длине (2,9 т.п.н.) в геномах мышиных грызунов (крысы/мыши), бушбеби, маленькой коричневой летучей мыши, тенрека, опоссума и не относящихся к млекопитающим четвероногих (ящерицы анолис и африканской когтистой лягушки) [44]. ТЕ также служат важнейшими источниками для изменения регуляторной системы генных сетей. ERV депонируют обширный резервуар предфункциональных латентных цис-регуляторных элементов (промоторов, сайтов связывания с транскрипционными факторами), которые рекрутируются в эволюции в состав нормальной регуляторной сети соседних генов хозяев [26]. От видоспецифических ТЕ происходят многие промоторы и сигналы полиаденилирования. Способность Т.Е. к саморегуляции (образование белковых продуктов, взаимодействующих со специфическими последовательностями ДНК, источниками которых являются сами ТЕ) [22], также служит одним из доказательств происхождения вирусов от ТЕ как предпосылка к автономному существованию и обретению новых функций в ходе эволюции. В данном отношении можно провести аналогию с геномами эукариот, в ходе эволюции которых выработались стратегии возникновения новых функциональных РНК и продуктов их трансляции для возникновения БКГ хозяев.
Стратегия транспозоны — некодирующие РНК — пептиды
ТЕ являются обильными источниками жестко регулируемых биохимически активных некодирующих элементов, таких как некодирующие РНК (нкРНК) и сайты связывания с транскрипционными факторами. Многочисленные недавние исследования подтвердили идею о том, что ТЕ у всех представителей живого кооптируются для регуляции генов их хозяев, а волны инвазий ТЕ в организмы катализировали эволюцию сетей регулирования генов [45]. ТЕ служат важнейшими источниками микро-РНК [20] и обнаруживаются более чем в 83% функциональных доменов длинных нкРНК (днРНК) [21]. ДнРНК проявляют множество функций либо самостоятельно в качестве рибозимов или рибопереключателей, либо в составе РНП (рибонуклеопротеинов). ДнРНК могут взаимодействовать с ДНК-связывающими белками, РНК-полимеразой и гистон-модифицирующими комплексами, оказывая влияние на регуляцию транскрипции генома [46]. Подобно функциям в составе продуктов трансляции БКГ, последовательности ТЕ в доменах днРНК используются для образования сайтов распознавания белков и нуклеиновых кислот. Большинство экзонов днРНК организованы из последовательностей ТЕ — вследствие этого зрелые молекулы днРНК содержат комбинации повторов, создающие структуры, подобные доменам белков. Филогенетический анализ показал, что в ходе эволюции отдельные семейства ТЕ закономерно обогащают (в основном ERV) или покидают (nonLTR ретроэлементы) гены днРНК. Помимо экзонов, ТЕ организуют структуры промоторов, сайтов сплайсинга и сайтов полиаденилирования днРНК. Согласно исследованиям Johnson и соавт., ТЕ являются основой для формирования модульной организации молекул днРНК в виде дискретных доменов, комбинация которых определяет функцию днРНК. Это обусловлено способностью фрагментов ТЕ образовывать ДНК-, РНК- и белок-связывающие домены. Предполагается использование картирования ТЕ для прогнозирования функции днРНК, а также для объяснения эволюции регуляторных сетей днРНК [21]. Помимо выполнения специфических функций на уровне РНК молекул, нкРНК способны транслироваться в пептиды [47—50], которые проходят эволюционный отбор на функциональную пригодность для адаптации и могут стать источником возникновения новых БКГ [51—53]. Ряд недавних исследований показал, что lncРНК могут содержать открытые рамки считывания (ORF — open reading frames), связываться с рибосомами и транслироваться. Выявлено несколько сотен образуемых при этом функциональных коротких пептидов у рыбы данио и человека [54], у мыши [55] и у арабидопсиса [56]. Более того, многие днРНК обладают сходной структурой с мРНК: они транскрибируются РНК-полимеразой II, кэпируются и полиаденилируются, накапливаясь в цитоплазме [57] — теми же свойствами обладают и при-микроРНК растений. Благодаря наличию коротких ORF, процессингу с получением 5’-кэпированных и 3’-полиаденилированных хвостов [58], при-микроРНК растений также способны транслироваться с образованием функциональных пептидов [59]. Подобные стратегии могли быть выработаны у вирусов, что объясняет их грандиозное разнообразие и распространенность вследствие высокой мутабельности с возникновением новых кодирующих последовательностей из генов ТЕ-происхождения.
В 2006 г. М. Levine и соавт. [60] выявили образование новых БКГ у дрозофилы за счет отбора возможных вариантов экспрессии днРНК. Исследователи использовали геномы Drosophila melanogaster и родственных видов для проведения полногеномного поиска новых генов D. melanogaster, которые возникли из некодирующей ДНК. В результате были описаны 5 таких генов, преимущественно экспрессируемых в семенниках. В 2008 г. J. Cai и соавт. [61] обнаружили новый БКГ у Saccharomyces cerevisiae, который был сформирован из некодирующей последовательности ДНК. В 2012 г. C. Xie и соавт. описали 24 спе-цифических для гоминоидов БКГ, образованных de novo из генов днРНК [62]. Дальнейшие исследования показали, что возникновение новых белков из днРНК распространено у эукариот и играет важную роль в эволюции. Например, в 2014 г. J. Ruiz-Orera и соавт. [51] при исследовании Mus musculus, Homo sapiens, Danio rerio, D. melanogaster, A. thaliana, S. cerevisiae обнаружили, что большая часть днРНК, экспрессируемых в клетках шести разных видов, связана с рибосомами. Исследователи протестировали гипотезу, что днРНК могут выступать в качестве источника для синтеза новых пептидов. Более того, оказалось, что днРНК проявляли сходный потенциал кодирования с эволюционно молодыми белок-кодирующими последовательностями, свидетельствуя о том, что они играют важную роль в de novo-эволюции белков [51]. Недавние полногеномные исследования позволили выявить сотни функциональных микропептидов, которые могут быть образованы при трансляции днРНК [54, 63]. Так, идентифицирован микропептид миорегулин (MLN), который формируется при трансляции специфической для скелетной мускулатуры РНК, аннотированной как днРНК. Данная днРНК у человека содержит ORF длиной 138 нуклеотидов и состоит из 3 экзонов общей длиной 16,5 кб. Микропептид MLN состоит из 46 аминокислотных остатков и формирует одну трансмембранную альфа-спираль, которая взаимодействует с кальциевой АТФазой саркоплазматического ретикулума (SERCA — sarcoplasmic reticulum Ca2+ ATPase) на мембране саркоплазматической сети и регулирует перемещение ионов кальция [48]. Кроме того, выявлен микропептид, состоящий из 34 аминокислотных остатков, названный DWORF (dwarf open reading frame), который локализуется на мембране саркоплазматической сети, где усиливает активность SERCA. Транскрипт гена Dworf, микропептид DWORF, аннотирован как днРНК NONMMUG026737 у мыши и как днРНК LOC10050737 у человека. В геноме мыши ген Dworf транскрибируется из локуса длиной 2,8 кб на хромосоме 3 с образованием двух транскрипционных изоформ длиной 300 нуклеотидов. У человека днРНК LOC100507537 образует только одну изоформу и транскрибируется из участка длиной 4,5 кб на хромосоме 3 [50]. У млекопитающих пептиды, образуемые путем трансляции днРНК, оказывают регуляторное воздействие на экспрессию генов-мишеней [49]. У растений также выявлен ряд пептидов, формируемых при трансляции днРНК: ENOD40, IPS1, LDMAR, COOLAIR, OLDAIR [47]. Помимо днРНК, при-микроРНК также способны транслироваться в функциональные пептиды [49], в то время как ТЕ являются важными источниками возникновения генов микроРНК [20]. Таким образом, система «ТЕ—нкРНК—белки» служит универсальной стратегией для эволюционных преобразований геномов эукариот и может быть использована также вирусами, произошедшими от Т.Е. Данный принцип отбора функциональных РНК в качестве источника белка может объяснить не только происхождение вирусов и их эволюцию, но и само возникновение жизни, когда в течение миллионов лет из мобильных элементов отбирались молекулы функциональных РНК, продукты трансляции которых способствовали саморегуляции и возникновению новых функций. Наиболее оптимальные комбинации взаимодействий РНК и белков, способствующие оптимальной адаптации, сохранялись в эволюции.
Горизонтальный перенос транспозонов
Еще в 1984 г. Р.Б. Хесин [4] в книге «Непостоянство генома» писал, что значительная доля наследственной изменчивости вызывается перемещающимися элементами (transposable elements). Согласно Р.Б. Хесину, открытие и изучение разнообразных ТЕ заставит по-новому взглянуть на ряд положений эволюционной теории. Он предположил, что параллельная изменчивость может объясняться влиянием элементов со сходной сайт-специфической интеграцией, а некоторые случаи конвергенции основаны на переносе одинаковых генов между разными организмами. Более того, передачей генов между далекими видами автор объяснял некоторые качественные скачки в историческом развитии, особенно перестройки метаболизма [4]. Горизонтальный перенос, распространенный у прокариот (в ГП вовлечено 81% их генов [64]), служит также важным источником геномного разнообразия эукариот. ГП транспозонов логически должен присутствовать у эукариот в связи с обилием ТЕ в их геномах и присущей мобильностью Т.Е. По результатам филогенетических анализов был обнаружен ГП ДНК-ТЕ среди позвоночных и беспозвоночных в период 45—15 млн лет назад. События горизонтального переноса ТЕ описаны у различных представителей четвероногих, а также кровососущих насекомых (Rhodnius prolixus) в качестве вектора. В 2013 г. C. Gilbert и cоавт. обнаружили у тасманийского дьявола ГП ТЕ семейства OposCharlie1 (OC1), который проник в общего предка семейства Dasyuridae около 17 млн лет назад [65]. Впервые Г.П. был продемонстрирован в 1990 г. S. Daniels и соавт. на дрозофиле [66]. В дальнейшем в ряде работ обнаружено, что практически все основные типы ТЕ способны к ГП у большого количества эукариот [67]. ГП ТЕ в новые геномы рассматривается как важная сила управления геномными вариациями и биологическими инновациями. Кроме того, ГП играет важную роль в персистенции ТЕ в геномах эукариот. В исследованиях H. Zhang и соавт. [67] были показаны примеры повторных ГП трех семейств ТЕ Chapaev у большого количества видов животных, включая млекопитающих, рептилий, челюстных рыб, миног и насекомых. Множественные сопоставления ТЕ Chapaev этих видов выявили чрезвычайно высокие уровни идентичности последовательностей (79—99%), что несовместимо с вертикальной эволюцией с учетом разделяющей этих хозяев глубокой дивергенции во времени. Прерывистое распределение среди видов и отсутствие очищающего отбора, действующего на эти ТЕ, указывает на то, что они независимо и горизонтально переносятся между видами [67]. Распространенность Г.П. у эукариот позволяет предположить данное явление в качестве промежуточного эволюционного звена в возникновении вирусов. Вирусная межвидовая трансмиссия представляет собой серьезную угрозу для человека и животных. Большинство вирусных заболеваний человека являются зоонозными [28]. Межвидовая трансмиссия при горизонтальном переносе ТЕ и вирусов является их общим свойством и свидетельствует в пользу предположения происхождения вирусов от ТЕ.
Гены RAG1 и RAG2 образуют рекомбиназный комплекс, необходимый для V (D)J-рекомбинации, которая генерирует разнообразие иммуноглобулинов и рецепторов Т-клеток [68]. V (D)-рекомбинация является вариацией основного принципа транспозиции и опосредована потомками транспозазы. Структура инвертированных повторов и правосторонняя/левосторонняя асимметрия рекомбинационных сигнальных последовательностей (RSS) напоминает концевые повторы инсерционных последовательностей (IS) прокариот [69], поэтому вначале ген RAG1 относили к семейству генов интеграз (INT) бактерий, а ген RAG2 считался гомологом гена IHF, регулирующего работу интегразы [70]. Но в дальнейших исследованиях у фиолетового морского ежа (Strongylocentrotus purpuratus) были выявлены гены SpRag1L и SpRag2L, гомологичные по последовательностям и по геномной организации генам RAG1 и RAG2 позвоночных [71]. Сходная с RAG-транспозазой активность по разрезанию и сборке была выявлена in vitro у транспозазы Transib насекомого Helicoverpa zea, что говорит об их филогенетическом родстве и происхождении от общего предка [72]. Общепризнано, что наличие RAG в геномах челюстных позвоночных и других линий является результатом горизонтального переноса ТЕ. У всех челюстных позвоночных гены RAG расположены в непосредственной близости от гена NWC, промотор которого проявляет двунаправленную активность, что способствовало сохранению RAG-ТЕ в геноме хозяина. Это обусловлено тем, что ген NWC эволюционно консервативен и располагается вверх по течению от гена RAG2, конвергентно транскрибируясь вместе с ним. Ген NWC играет важную роль в онтогенезе многоклеточных, на что указывает наличие его ортологов у ряда видов беспозвоночных, таких как морской еж (Strongylocentrotus purpuratus), морской анемон (Nematostella vectensis), морская звезда (Asterina pectininera), морская мидия (Mytilus edulis), морская улитка (Lottia gigantean), каменистый коралл (Acropora millepora) и плаcтинчатый Trichoplax adhaerens. В связи с важной ролью гена NWC и его эволюционной консервативностью удачная инсерция генов RAG в непосредственной близости способствовала их сохранению в процессе отбора и использованию для нужд хозяев [68]. В геноме дикого арахиса выявлен ретро-ТЕ AdLINE3, который оказался членом кластера RTE, первоначально идентифицированный у нематод. RTE-элементы обнаружены у 82 видов растений — от покрытосеменных до водорослей. У цветковых растений RTE получены от семейства An-RTE, проявляющих значительную идентичность последовательностей ДНК с ретро-ТЕ 42 видов животных из 4 фил. Филогенетический анализ животных и растений показал горизонтальный перенос An-RTE от древней тли или предковых членистоногих в покрытосеменные растения. Примечательно, что некоторые An-RTE были завербованы в качестве кодирующих последовательностей функциональных генов, участвующих в метаболических или других биохимических процессах у растений [73]. В связи с накоплением данных о большом количестве новых случаев ГП транспозонов у эукариот создана первая база данных ГП, сфокусированная на горизонтальном переносе ТЕ между эукариотами — HTT-DB (Horizontal Transposon Transfer DataBase — http://lpa.saogabriel.unipampa.edu.br:8080/httdatabase/) [13].
В экспериментальных условиях для анализа промоторной активности 5’-концевых последовательностей, способных управлять транскрипцией репортерного гена даже у филогенетически отдаленно связанных организмов, были использованы ДНК-ТЕ суперсемейства Tc1-ma-riner — Bari1 и Bari3. При помощи этих транспозонов изучена мимикрия горизонтального переноса у широкого диапазона хозяев (мухи, человек, дрожжи и бактерии). На основании полученных данных было предложено, что семейство ТЕ Bari развили «размытые промоторы», которые способствовали их распространению среди всевозможных живых организмах за счет ГП [64]. Фактически Г.П. ТЕ может рассматриваться как решающий процесс в поддержании и распространении ТЕ в геномах всех эукариот. Значительное количество ГП транспозонов было зарегистрировано у дрозофилы, так как она представляет собой выдающуюся модель эволюционной генетики, а большое количество геномных данных делает ее особенно подходящей для разработки и применения надежных статистических подходов к обнаружению ГП Т.Е. Были получены достоверные сведения о ГП ТЕ также в широком диапазоне других эукариотических видов у беспозвоночных, позвоночных, растений и их паразитов. Поскольку Т.Е. составляют значительную часть ядерного генома многоклеточных эукариот и служат важным источником генетических вариаций в эволюции, ГП ТЕ следует рассматривать как ключевой источник изменчивости эукариотического генома [74].
Взаимодействие транспозонов и вирусов
Вирусы могут выступать в качестве переносчиков Т.Е. Обнаружение Т.Е. Chapaev у представителей Bracovirus показало, что эти вирусы могут выступать в качестве возможного вектора для горизонтального распространения ТЕ Chapaev [67]. ТЕ продолжают регистрировать в составе вирусов, но их вклад в эволюцию вирусного генома остается в значительной степени неисследованным. В составе гигантского вируса Pandoravirus salinus выявлено семейство MITE (miniature inverted-repeat transposable element), названное Submariner. Найдены ДНК-ТЕ, связанные с Submariner в геноме Acanthamoeba castellanii, являющейся хозяином пандоравируса и содержащей остатки кодирующей последовательности для транспозазы Tc1/mariner. Это говорит о широком распространении Submariner MITE, которые могут перемещаться в хозяине пандоравируса — амебе. Из 30 MITE в составе пандоравируса 10 локализованы внутри кодирующих областей предсказанных генов, а другие — вблизи генов, что указывает на роль данных ТЕ в обес-печении вирусов генетической новизной [75].
LTR-содержащие ретро-ТЕ участвуют в противовирусной защите геномов хозяев, вызывая рестрикцию экзогенных ретровирусов. Данное свойство можно использовать для лечения вирусных инфекций, в частности приобретенного иммунодефицита. Значительная часть геномов позвоночных состоит из ERV. Некоторые из генных продуктов, кодируемых ERV и другими ретроТЕ, могут выполнять защитные функции для хозяина против вирусных инфекций. В частности, было показано, что продукты генов env действуют как факторы рестрикции против родственных экзогенных ретровирусов у кур, овец, мышей и кошек. Предполагается наличие подобных механизмов и в геномах других организмов, в том числе человека [26].
Помимо защиты от экзогенных вирусов, ТЕ могут способствовать интеграции вирусных последовательностей в геномы хозяев, что часто приводит к хронизации болезни [15, 16]. Данное свойство говорит об эволюционном родстве и возможном происхождении вирусов от Т.Е. Например, в отношении вируса гепатита В филогенетическая взаимосвязь с ретровирусами доказана [43]. Кроме того, вирусы могут способствовать активации ТЕ, что еще раз говорит об их филогенетическом родстве и наличии общих свойств и последовательностей. Показано, что инфекция цитомегаловирусом человека (HCMV) индуцирует транскрипционную активность HERV в определенных типах клеток [76].
Промоторы ТЕ часто проявляют активность, регулируемую в пространстве и времени, которая зависит от типа клеток или от влияния информации внешней среды, такой как стресс или инфекция. В то же время экспрессия многих ТЕ ограничена различными стадиями гаметогенеза и раннего эмбриогенеза у растений и животных. Некоторые Т.Е. проявляют также жестко регулируемую активность в соматических тканях самых разных организмов. При этом ТЕ обладают способностями к неслучайной интеграции в геномах — многие ТЕ разработали механизмы интеграции в геномные области, которые максимизируют вероятность их распространения [45]. Использование Т.Е. для интеграции вирусов в геном г?