ВИЧ-1 — вирус иммунодефицита человека 1-го типа
ГД — генетическая дистанция
МСМ — мужчины, практикующие секс с мужчинами
ПИН — потребители инъекционных наркотиков
IDU-A; от англ. injecting drug users — ПИН
Изучение распространенности генетических вариантов и оценка генетического разнообразия вируса иммунодефицита человека 1-го типа (ВИЧ-1) — важнейшая задача молекулярной эпидемиологии. Развитие технологии полимеразной цепной реакции и методов анализа нуклеотидных последовательностей (секвенирования) генома вируса позволяет проводить такого рода исследования на базе множества медицинских и научных центров.
Ряд работ детально характеризуют особенности генетической структуры и разнообразие циркулирующих в России вариантов вируса, в том числе доминирующего варианта подтипа A1 (IDU-A; от англ. injecting drug users — потребители инъекционных наркотиков — ПИН) и обнаруженного в последние годы CRF63_02A1 [1—5]. Однако данные исследования проводились независимо друг от друга и описывали эпидемиологическую ситуацию на территории отдельных регионов страны. При этом существует необходимость одновременного анализа образцов из всех российских регионов для характеристики эпидемиологии ВИЧ-инфекции в стране в целом.
В данной статье представлен результат молекулярно-эпидемиологического анализа обширной базы нуклеотидных последовательностей гена pol образцов ВИЧ-1, выделенных в разных регионах страны от позитивных по ВИЧ лиц с различными датами установления диагноза.
Материалы и методы
Проводили анализ нуклеотидных последовательностей области гена pol (положения 2264—3255 относительно HXB-2, GeneBank K03455), кодирующей протеазу (5—99-я аминокислота) и обратную транскриптазу (38—286-я аминокислота) ВИЧ-1, а также сопутствующих эпидемиологических данных. Эпидемиологические данные включали информацию о половой принадлежности пациента, предположительном регионе инфицирования, дате установления диагноза, пути инфицирования и схеме терапии. В дальнейшем оценка степени генетического разнообразия ВИЧ-1 проводилась среди образцов от нелеченых пациентов.
Источником нуклеотидных последовательностей и эпидемиологических данных служила Российская база данных устойчивости ВИЧ к антиретровирусным препаратам (www.hivresist.ru), в качестве источника дополнительных и референсных последовательностей применяли базу данных Лос-Аламос (www.hiv.lanl.gov).
Выравнивание последовательностей осуществляли с помощью программы MEGA 6.0 (http://www.megasoftware.net/). Повторяющиеся нуклеотидные последовательности выявляли путем оценки генетической дистанции (ГД) между последовательностями, в случае обнаружения идентичной пары более свежий образец исключали из дальнейшего анализа. Генотипирование образцов и филогенетический анализ проводили с помощью он-лайн приложений COMET HIV-½ и HCV v.0.2, REGA HIV-1 Subtyping Tool v.3.0, PhyML v.3.0. (www.hiv.lanl.gov). Оптимизацию филогенетических деревьев выполняли в программе FigTree v.1.3.1 (http://tree.bio.ed.ac.uk/). Определение генетической близости и рекомбинационный анализ осуществляли с помощью HIVBlast Tool и RIP (www.hiv.lanl.gov).
Степень внутригруппового нуклеотидного (генетического) разнообразия оценивали путем расчета матрицы ГД с применением модели нуклеотидных замен Тамура-Нея (TrN) и игнорировании всех сайтов, включающих инделы (gap).
Статистический анализ выполняли с применением пакета прикладных программ Statistica v.6.0 («StatSoft», США). Достоверность различий между сравниваемыми показателями оценивали с использованием теста Краскела—Уоллиса ANOVA. Категориальные переменные обобщали в виде частот и сравнивали с использованием критерия χ2. Достоверными считали различия при р<0,05.
Результаты
Характеристика обследованной популяции. Проанализированы нуклеотидные последовательности генома и эпидемиологические данные 1697 образцов ВИЧ-1, выделенных от пациентов с датой установления диагноза с 1987 по 2015 г.: 1572 образца представлены в Российской базе данных устойчивости ВИЧ к антиретровирусным препаратам, 125 загружены из базы данных Лос-Аламос.
Распределение образцов по регионам предположительного инфицирования (федеральным округам — ФО России) оказалось следующим: Центральный (n=419), Дальневосточный (n=151), Приволжский (n=342), Северо-Западный (n=73), Северо-Кавказский (n=19), Сибирский (n=467), Уральский (n=30), Южный (n=94). Еще для 102 (6,01%) образцов отсутствовала информация о регионе инфицирования. Для 77 (4,54%) пациентов отсутствовала информация о половой принадлежности, 884 (52,09%) образца получены от мужчин, 736 (43,37%) от женщин.
Путь передачи вируса известен лишь для 968 (57,04%) пациентов, среди них соотношение уязвимых групп следующее: потребители инъекционных наркотиков (ПИН) 448 (46,28%), инфицированные гетеросексуальным путем 438 (45,25%), инфицированные вертикальным путем (от матери к ребенку) 64 (6,61%). На остальные пути передачи приходилось 1,86% (18 пациентов).
Получен 741 образец от нелечившихся пациентов (наивных пациентов), 606 образцов — от пациентов с получавших лечение, для 350 образцов эта информация неизвестна.
Генотипирование. Генотипирование исследованных образцов показало, что 1376 (81,09%) образцов ВИЧ- 1относится к ВИЧ-1 подтипа A1. Тем не менее отмечено постепенное увеличение доли других генетических вариантов среди случаев ВИЧ-инфекции к 2015 г. (см. рисунок, а). Так, если в 2000—2001 (n=206) гг. подтип A1 выявлен в 91,75% образцов, то в 2007—2008 гг. (n=319) — 86,84%, а в 2014—2015 гг. (n=163) — 70,55% (p<0,001).
Наиболее часто выявляемым не-A вирусом оказался вирус подтипа B, обнаруженный в 134 (7,90%) образцах. Основными источниками образцов вируса подтипа В являлись Центральный (n=43) и Дальневосточный (n=43) Ф.О. Еще 119 (7,01%) образцов относились к рекомбинантам между вирусами подтипов A1 и G, 23 (1,35%) образца генотипированы как AB-рекомбинанты. Наконец, 45 (2,65%) образцов относились к другим генетическим вариантам: 22 (1,30%) к подтипу G, 18 (1,06%) подтипу C, 2 (0,12%) к CRF01_AE. Выявлено по одному образцу вирусов подтипа D, CRF06_cpx и CRF11_cpx. Распределение генетических вариантов оказалось неравномерным в разных регионах страны. Так, несмотря на тотальное доминирование во всех регионах вируса подтипа A1, в Сибирском Ф.О. чаще определялись случаи инфекции вирусами из группы AG-рекомбинантов, а в Дальневосточном Ф.О. — вирусом подтипа B (см. рисунок, б).
Анализ вирусов подтипа A1. Филогенетический анализ (см. рисунок, в) позволил установить, что 1370 (99,56%) из 1376 образцов подтипа A1, исследованных в работе, относились к генетическому варианту IDU-A [1, 2]. Лишь 4 образца кластеризовались совместно с референсной последовательностью AB287376 вируса подтипа А1, типичного для Руанды, где этот вариант вируса является одним из доминирующих.
Среди вирусов варианта IDU-A 585 (42,70%) образцов получены от пациентов с неизвестным путем заражения, 365 (26,64%) от пациентов, заразившихся вследствие гетеросексуальных контактов, 356 (25,99%) — от пациентов группы ПИН. На долю вертикального пути передачи приходилось 55 (4,01%) образцов, на долю остальных путей передачи — 9 (0,66%) образцов, из которых 5 получены от мужчин, практикующих секс с мужчинами (МСМ).
Для оценки изменения степени генетических различий варианта IDU-A от момента начала эпидемии по настоящее время рассчитана ГД между образцами, полученными от пациентов с разной датой установления диагноза.
Исследовали образцы в двух наиболее многочисленных группах: от ПИН и пациентов, инфицированных при гетеросексуальных контактах. Для исключения влияния специфической терапии на генетическое разнообразие ВИЧ-1 анализу подвергали лишь последовательности генома вирусов, полученные от «наивных» пациентов. Обнаружено, что показатель среднего внутригруппового нуклеотидного разнообразия (±стандартная ошибка) среди вариантов вируса, циркулирующих в популяции ПИН, увеличивается со временем: с 0,50±0,04·10–2 замен на сайт для образцов от 42 пациентов с датой диагноза 1996—2001 гг. и 0,89±0,05·10–2 замен на сайт с датой диагноза 2002—2009 гг. (50 пациентов), до 2,06±0,07·10–2 замен на сайт с датой диагноза 2010—2015 (51 пациент) (p<0,001).
Количество образцов от пациентов, инфицированных гетеросексуальным путем, в изучаемых временных группах неодинаковое, поэтому данные образцы разделены на 2 группы: с датой диагноза до 2008 г. и с датой диагноза в 2008—2015 гг. Показатель внутригруппового нуклеотидного разнообразия (± стандартная ошибка) также увеличился со временем: с 0,64±0,03·10–2 замен на сайт в группе до 2008 г. (n=98) до 0,99±0,04·10–2 замен на сайт в группе 2008—2015 (n=125) (p<0,001).
Анализ вирусов не-A-подтипов. По данным филогении, из 134 образцов ВИЧ-1 подтипа B 52 образца (42 из которых собраны в Дальневосточном ФО) относились к генетическому варианту подтипа B (IDU-B), циркуляция которого ранее отмечалась в среде ПИН в восточноевропейских странах, в том числе в Николаевской области Украины [6]. Остальные 82 образца генетически близки к штамму K03455 (референсвариант ВИЧ-1 HXB-2) вируса подтипа B, циркулирующего в странах Западной Европы [1, 6].
Филогенетический анализ позволил выявить 16 образцов, относящихся к рекомбинантной форме CRF02_AG, циркулирующей как в странах Средней Азии, так и в Сибири [7—9]. Ранее описываемый российскими авторами рекомбинант CRF63_02A1 [3, 4] обнаружен в 95 образцах, из которых 86 выделены в Новосибирске, Алтайском крае и в других регионах Сибирского Ф.О., при этом частота выявления CRF63_02A1 в Сибири увеличивалась со временем. Если в группе пациентов с диагнозом, установленным до 2002 г. (n=81), он выявлялся всего в 3,70% случаев, а у пациентов с инфекцией, выявленной в 2002—2009 гг. (n=207), — в 10,63%, то на долю CRF63_02A1 в группе пациентов с датой диагноза 2010—2015 гг. (n=179) приходилось уже 34,08% (p<0,001). В других регионах страны этот вариант не получил такого активного распространения: лишь на территории Дальневосточного Ф.О. выделены 9 образцов этого варианта. Еще 3 образца, интерпретированные с применением он-лайн-ресурсов как AG-рекомбинанты, образовывали на филогенетическом древе внешние ветви относительно образцов CRF02_AG и CRF63_02A1, что не позволяло достоверно установить их принадлежность к одному из двух генетических вариантов. Примечательно, что выявлено лишь 2 образца AG-рекомбинанта, кластеризовавшихся независимо от описанных совместно с референсной последовательностью AF377954 вируса, циркулирующего в Камеруне — регионе, где CRF02_AG представлен наиболее широко.
Генотипированы как AB-рекомбинанты 23 образца, однако только 16 из них достоверно относились к типичному для России и стран СНГ рекомбинанту CRF03_AB [6, 10]. Остальные 7 образцов относились к новым, не описанным ранее рекомбинантным формам.
При филогенетическом анализе 22 образцов подтипа G формировались 2 четких кластера (см. рисунок, г): первый (формирующийся в 85% независимых построений) включал 12 образцов, выделенных от пациентов с диагнозом ВИЧ-инфекция, установленным в 1988—1989 гг. в Северо-Западном, Южном и Северо-Кавказском ФО, что указывает на принадлежность данных образцов к Ростово-Элистинской внутрибольничной вспышке 1988—1989 гг. Еще 9 из 10 образцов (7 из которых выделены в соседнем Приволжском ФО) от пациентов с диагнозом, установленным после 2000 г., в 90 построениях из 100 кластеризовались совместно и отдельно от первого кластера.
Наконец, 18 образцов относились к подтипу C. Полученные 15 образцов из Дальневосточного Ф.О. (ранее опубликованный анализ [1] указывает на их близость к вирусам, циркулирующим в Африке) в нашем исследовании также кластеризовались совместно с типичным африканским вариантом ВИЧ-1подтипа С — AB485643. В то же время 2 образца из Москвы и Самары кластеризовались с вирусами подтипа C из Китая и Индии (референс-штаммы KC898996 и AB023804 соответственно).
Анализ редких для России генетических вариантов и уникальных рекомбинантных форм. Детальный анализ упомянутых выше 7 рекомбинантов вируса A1 и B подтипа позволил выявить 4 новых рекомбинантных варианта вируса, имеющих разные точки рекомбинации: 3 содержали сегменты вирусов подтипа B и варианта IDU-A, а еще один оказался рекомбинантом между вирусом подтипа B и вариантом FN995656 — уникальным рекомбинантом A1/B, выявленным в Белоруссии в 2010 г. [10].
Обнаружен один образец, оказавшийся рекомбинантом вируса CRF02_AG, циркулирующего в Средней Азии, и варианта IDU-A, и два образца нового рекомбинанта, чей геном содержал сегменты, идентичные варианту IDU-A и изолята AF377954 — камерунского варианта CRF02_AG.
Кроме того, обнаружено два не связанных эпидемиологически образца CRF01_AE, циркуляция которого характерна для стран Юго-Восточной Азии [6]. Еще 3 образца по данным он-лайн-генотипирования с применением приложений COMET и Rega и филогении достоверно принадлежали к редким для России генетическим вариантам: один образец из Смоленска относился к подтипу D (на 87%), а 2 образца (из Санкт-Петербурга и Красноярска) в 99 построениях из 100 образовывали общие кластеры с вариантами CRF06_cpx и CRF11_cpx соответственно.
Обсуждение
До середины 90-х годов XX века на территории бывшего СССР выявляли 7 генетических подтипов вируса (A, B, C, D, F, G, H) и 3 рекомбинатные формы (CRF01_AE, CRF02_AG и gagDenvG) [11—13], причем разные генетические варианты циркулировали в определенных уязвимых группах. Так, вирус подтипа B чаще выявляли в среде МСМ [6]. Кроме того, в конце 1988 г. в Элисте Ростовской области возникла внутрибольничная вспышка инфекции, включающая более 250 человек и вызванная африканским вирусом подтипа G. Первоисточником вируса стал мужчина, инфицированный в Конго [14, 15].
В 90-х годах XX века произошло проникновение с территории Украины варианта вируса подтипа A1 в среду ПИН, что привело к катастрофическому увеличению новых случаев ВИЧ-инфекции и доминированию этого варианта на основной территории страны. Этот генетический вариант получил название IDU-A (от англ. injecting drug users — потребители инъекционных наркотиков) [6]. В данной работе обнаружено, что более 80% исследованных образцов ВИЧ-1 относились к этому генетическому варианту.
В данном исследовании получено подтверждение увеличения гетерогенности вирусной популяции, выражающееся как в виде увеличения доли не-А-подтипов и рекомбинантных форм, так и нарастания генетического разнообразия внутри варианта IDU-A в группах ПИН и лиц, инфицированных гетеросексуальным путем. Наиболее вероятно, что такие результаты связаны с ростом эпидемии в стране и увеличением пораженности населения ВИЧ-инфекцией [16].
Распределение генетических вариантов ВИЧ-1 в разных регионах имеет свои особенности. Так, ранее опубликованные [3, 4, 9] и подтвержденные нами данные о распространении вируса CRF63_02A1 в Сибири в будущем могут привести к экспансии этого варианта в другие регионы страны. В то же время увеличение распространенности CRF63_02A1 нуждается в дополнительном подтверждении, например путем генотипирования вируса у недавно инфицированных лиц на территории этого региона.
Ранее опубликованные [1] и приведенные в настоящем исследовании данные о циркуляции на Дальнем Востоке варианта IDU-B подтипа B достаточно необычны. Этот вариант, выявленный в 1994 г. в среде ПИН в южных регионах Украины, как ранее считалось, не оказывал серьезного влияния на эпидемию ВИЧ-инфекции в России. Появление IDU-B на Дальнем Востоке страны, очевидно, является прямым следствием трудовой миграции из Украины [1].
Наши результаты позволяют выдвинуть предположение об изменении с течением времени вируса подтипа G, вызвавшего «Ростово-Элистинскую» вспышку 1988—1989 гг. [14, 15] и до сих пор циркулирующего в Южном Ф.О. В то же время совместная кластеризация образцов от всех пациентов с диагнозом, поставленным после 2000 г., может свидетельствовать о возможности существования общего источника инфекции для данных пациентов. Тем не менее данная гипотеза нуждается в дальнейшей проверке с исследованием увеличенной выборки образцов подтипа G.
Важным следствием циркуляции на территории страны нескольких генетических вариантов является рекомбинация вирусов. Факты образования новых уникальных рекомбинантных форм ранее отмечены в России [12], Белоруссии [10] и Киргизии [7]. В связи с этим отдельного внимания заслуживают выявленные нами новые AG- и AB-рекомбинанты. Примечательно, что один из AB-рекомбинантов, обнаруженный в 2014 г. в Северо-Западном ФО, являлся рекомбинантом подтипа B и нового AB-рекомбинанта (FN995656), выявленного в Белоруссии [10].
Нуклеотидные последовательности гена pol обнаруженных уникальных рекомбинантных форм опубликованы в GeneBank под номерами KX648291-KX648299.
Исследование частично выполнено с привлечением средств гранта Российского научного фонда (проект № 15−15−00050).
Авторы заявляют об отсутствии конфликта интересов.