Генотип и фенотип являются фундаментальными понятиями генетики. В широком смысле этого термина генотип представляет собой совокупность элементов генома, которая определяет наблюдаемый у носителя данной совокупности признак, или фенотип. Проблема установления связи между генотипом и фенотипом не теряет своей актуальности в течение последнего столетия. Еще в 1932 г. А. Стертевант [1], ученик Т. Моргана и один из основоположников генетики, сформулировал свой взгляд на проблему «генотип—фенотип» такими словами: «Одна из центральных проблем биологии — это проблема дифференциации: как яйцо превращается в сложный многоклеточный организм? Это, конечно, традиционная главная проблема эмбриологии; но это также проявляется в генетике в форме вопроса: «Как гены производят свои эффекты?» [1].
За последние десятилетия в связи с поступательным развитием технологий исследования генома удалось значительно продвинуться в понимании связи генотип—фенотип для многих распространенных заболеваний, в том числе психических, в развитии которых значимую роль играют генетические факторы. Оказалось, что эта связь гораздо сложнее, чем предполагает упрощенный (редукционистский) подход, который заключается в том, что изменения в структурной последовательности ДНК конкретных генов прямым образом влияют на признак (заболевание). Этот подход до сих пор воспринимается клиницистами как определяющий в оценке риска болезни. Однако в формирование фенотипа может вносить вклад множество генов, причем многие из них могут быть общими для нескольких фенотипов. Связь генотип—фенотип может быть опосредована и эпигенетическими эффектами, т.е. факторами, которые влияют на активность (экспрессию) гена без изменения его нуклеотидной последовательности. Эти эффекты могут иметь различное происхождение — от наиболее изученного к настоящему времени метилирования определенных сайтов в геноме до только развивающихся представлений о роли удаленных регуляторных элементов генома в происхождении ряда заболеваний [2]. Важно отметить, что проблема влияния генотипа на фенотип в психиатрической генетике не может быть полностью решена, пока остается открытым вопрос о том, какие молекулярные механизмы лежат в основе этого влияния. В настоящее время значительные усилия мирового научного сообщества сосредоточены на поиске генов, которые связаны с заболеванием причинно-следственной связью, — каузальных генов [3, 4]. Для их поиска используют подходы и методы, связанные с транскрипцией генов (транскриптомные и эпигеномные, в частности метиломные, исследования), обнаружением нейрональных энхансеров на основании анализа пространственной организации хроматина и др. Поскольку эти методы сами по себе не могут выявить каузальные гены, для окончательного заключения необходима функциональная проверка, в частности с помощью современных методов геномного редактирования. Так как для процессов регуляции транскрипции характерна высокая тканеспецифичность, важной проблемой является учет этого фактора при биоинформатическом анализе полногеномных данных, а также при выборе адекватных моделей для функциональных исследований. В этом отношении перспективным направлением является получение клеточных культур индуцированных плюрипотентных клеток (ИПСК), которые можно дифференцировать в нейроны для изучения методами оценки экспрессии генов и геномного редактирования [5, 6], а также использование других моделей, например клеточной модели первичных нейрональных стволовых клеток на основе биоптатов обонятельного эпителия [7, 8].
Цель обзора — рассмотрение различных подходов к установлению связи генотип—фенотип применительно к шизофрении с учетом специфических для нее опосредующих факторов. В отличие от широкого понятия генотип, приведенного выше, мы будем рассматривать конкретные изменения в геноме или эпигеноме, описанные на сегодняшний день, которые связаны с шизофренией, на основании результатов опубликованных исследований.
Шизофрения относится к заболеваниям, этиология и патогенез которых до сих пор остаются невыясненными. Известно, что в развитии этого заболевания ключевую роль играют генетические факторы. По данным семейных и близнецовых исследований, наследуемость шизофрении достигает 80% [9]. Это сопоставимо с наследуемостью для биполярного аффективного расстройства (БАР), расстройств аутистического спектра (РАС), синдрома дефицита внимания с гиперактивностью (СДВГ), но гораздо выше, чем, например, для депрессии или нервной анорексии [10]. В то же время по сравнению с перечисленными заболеваниями шизофрению отличает наиболее высокая наследуемость, определенная по суммарному вкладу полиморфных вариантов, или полиморфизмов [10].
Связь генотип—фенотип в рамках классического подхода
Можно привести немного примеров, которые подтверждают, что изменение в нуклеотидной последовательности какого-либо гена или участка генома связано со значительным риском развития шизофрении.
Хромосомные мутации. Убедительные данные получены для синдрома Ди Джорджи (велокардиофациальный синдром) — редкого заболевания, вызванного делецией (выпадением) участка ДНК на хромосоме 22. Известно, что у 41% пациентов с этим синдромом по достижении взрослого возраста развиваются психотические расстройства или шизофрения [11]. Еще один пример — ген DICS (от англ. disrupted in schizophrenia), обнаруженный первоначально в большой шотландской семье, в которой психические расстройства, в том числе шизофрения, сочетались с хромосомной транслокацией с точкой разрыва в участке 1q42.2 [12]. Из мутаций, обнаруженных в родословных, можно привести мутацию в гене белка, содержащего РНК-связывающий мотив 12 (RBM12), результатом которой являлся укороченный продукт гена [13]. В исландской родословной все носители этой мутации (всего 10 человек) имели диагноз психотического расстройства (шизофрения, шизоаффективный психоз, БАР с психотическими симптомами).
Вариации числа копий. С высоким риском шизофрении оказались связаны и редкие изменения в структуре генома, которые получили название «вариации числа копий», или CNVs (от англ. copy number variations). CNVs — достаточно протяженные фрагменты генома, включающие в себя дупликации или делеции отдельных участков. Исследования последних лет показали, что некоторые CNVs ассоциированы с шизофренией, т.е. чаще встречаются у больных по сравнению со здоровыми людьми. К настоящему времени описано 8 участков в геноме, для которых ассоциация обнаружена при высоком уровне значимости, еще 9 участков рассматриваются как предположительно связанные с шизофренией [14]. С высоким риском развития шизофрении связаны CNVs, расположенные на хромосомных участках 1q21.1, 15q11, 15q13, 16p11, 22q11. Нужно отметить, что в большинстве случаев эти мутации образуются de novo, т.е. не передаются от родителей ребенку [15].
Мутации, связанные с нарушением функции гена. CNVs могут встраиваться в нуклеотидную последовательность гена или выпадать из нее, вызывая, таким образом, разрыв, что ведет за собой нарушение функции гена — такие участки получили название LOF (от англ. lost of function). Количество ассоциированных с шизофренией мутаций типа LOF пока невелико. Они обнаружены в генах субъединицы метилтрансферазы гистонов (SETD1A) и субъединицы типа II α-потенциал-зависимых натриевых каналов (SCN2A) [16, 17]. Недавно описана мутация, выявленная при исследовании большого количества (>2500) трио родители—пробанд, собранных в разных популяциях европеоидов [18]. Она представляет собой миссенс-мутацию, т.е. однонуклеотидную замену, в результате которой происходит переключение одного кодона на другой, и соответственно образование новой аминокислоты, в гене транспортера гамма-аминомасляной кислоты.
Однако описанные выше мутации встречаются в геноме крайне редко (единицы носителей на 1 тыс. обследованных), поэтому их влияние на фенотип представляется сугубо специфичным. Связь их с патогенетическими механизмами шизофрении до сих пор остается неясной. В решении проблемы могло бы помочь выявление какого-либо особого фенотипа, отличающего носителей мутаций от пациентов, у которых она не выявлена. Была предпринята попытка оценить фенотипические отличия больных шизофренией с de novo CNVs мутациями от больных, у которых мутации не были обнаружены [19]. По данным этого исследования, на появление мутаций мог оказать влияние более поздний возраст родителей, также в целом эти больные отличались худшим функциональным исходом болезни. Другим подходом для выявления причинно-следственной связи между мутацией и фенотипом являются модели с использованием лабораторных животных. Влияние манипуляций с генетическим материалом, содержащим мутацию (выключение функции гена, изменение его экспрессии), на фенотипические проявления (появление поведенческих отклонений, снижение когнитивных функций) является первым шагом в этом направлении. Также перспективным подходом представляется получение ИПСК из биологического материала пациента — носителя мутации, с последующей их дифференциацией в нейрональные культуры, анализом экспрессии генов в дифференцированных нейронах и функциональной проверкой с помощью геномного редактирования.
Полигенные (аддитивные) эффекты генов
В отличие от редких мутаций, которые могут объяснить только небольшую часть случаев развития шизофрении, значительная часть генетической наследуемости шизофрении, по-видимому, обусловлена вкладом большого количества генов. В пользу полигенной природы шизофрении свидетельствуют исследования с использованием анализа ассоциаций, который предусматривает сравнение частоты полиморфизмов генов в группах больных и здоровых людей. Полиморфизмы, ассоциированные с шизофренией, пытаются обнаружить в так называемых генах-кандидатах, т.е. генах, которые принимают участие в биохимических путях, имеющих отношение к патогенезу шизофрении. К настоящему времени обнаружено несколько десятков таких генов, в их числе гены моноаминоэргических систем, нейротрофических факторов, иммуно-воспалительной системы и т.д. [20]. К недостаткам такого рода исследований относят низкую статистическую мощность за счет небольших выборок и невозможности одновременного исследования большого количества полиморфизмов. Более эффективным с этой точки зрения является подход, получивший название «полногеномный анализ ассоциаций» (GWAS, от англ. genome-wide association studies). Он основан на использовании технологии биочипов, что позволяет выявлять сотни тысяч полиморфизмов. А проблема формирования выборок необходимого размера (десятки-сотни тысяч людей) решается путем объединения усилий многих научных коллективов, работающих в области генетики шизофрении, в международные консорциумы. В настоящее время наиболее продуктивным научным объединением является Psychiatric Genomics Consortium (PGC). Полученные в результате его работы данные и разработанные подходы к их анализу позволили по-новому взглянуть на связь между генотипом и фенотипом при шизофрении. В этом аспекте интерес представляют не столько новые локусы, ассоциированные с заболеванием, сколько подход, предлагающий интегративную оценку всех вариантов риска. Для этого определяют связь всех определенных полиморфизмов с заболеванием на основании силы ассоциации (значение вероятности (p)), полученной с помощью GWAS. Значение p зависит от размера выборки и частоты вариантов (аллелей) в полиморфном локусе, его выбор проводят эмпирически, для шизофрении, как правило, используют интервал 0,01—0,05. В результате получают количественную переменную, которая складывается из количества аллелей риска в геноме индивидуума, взвешенных на размер эффекта (отношение шансов). Оригинальное наименование этой переменной — polygenic risk score [21], в русском переводе может быть использован термин «показатель полигенного риска» (ППР). ППР оказался эффективным предиктором, позволяющим с точки зрения генетической предрасположенности провести разделяющую линию между патологией и нормой. Особо следует отметить его значимость для оценки риска развития шизофрении. Так, H. So и P. Sham [22] сравнили предиктивную способность ППР для 10 соматических и психических заболеваний и получили лучший результат для шизофрении (площадь под ROC-кривой, которая отражает качество классификации, составила 0,82). По данным наиболее масштабных анализов, проведенных в рамках PGC, при разделении выборки на децили по величине ППР отношение шансов при сравнении группы с наиболее низким ППР с группой с наиболее высоким ППР составило 20 для выборки 37 000 человек [23] и 44 для выборки 69 000 человек [24]. Эти величины сопоставимы с размером эффекта, рассчитанным для редких мутаций. Высокая эффективность ППР была продемонстрирована и в исследовании отдельных популяций. E. Agerbo и соавт. [25] показали, что в выборке из датской популяции люди, входящие в верхний дециль по ППР для шизофрении, имеют примерно в 3 раза больший риск заболеть, чем люди с семейной историей болезни, которая традиционно рассматривается в качестве наиболее весомого фактора риска шизофрении. Предиктивная способность ППР показана и в недавнем проспективном исследовании [26]. При 2-летнем наблюдении за индивидуумами с высоким риском развития психоза оказалось, что в группе людей, у которых имела место манифестация заболевания, ППР был выше. В ретроспективном исследовании пациентов с первичным диагнозом депрессии, поставленным 20 лет назад, ППР шизофрении был наиболее высоким в группе пациентов, у которых впоследствии отмечалось развитие психотических расстройств [27].
Значимость ППР заключается также в том, что с его помощью оказалось возможным оценить полигенную общность (генетические корреляции) между различными фенотипами [28]. Проведенный анализ позволил обнаружить генетические корреляции с большинством распространенных психических расстройств, включая БАР, большое депрессивное расстройство (БДР), РАС, СДВГ, тревожные расстройства, обсессивно-компульсивные расстройства, синдром Туретта, анорексию [29]. Нужно отметить, что наиболее сильные корреляции имели место при сравнении шизофрении с БАР и БДР, с остальными расстройствами они были гораздо слабее. Единственным расстройством, для которого не выявлено генетических корреляций с шизофренией, оказалось посттравматическое стрессовое расстройство. Включение в анализ ряда нейродегенеративных и неврологических заболеваний (болезнь Альцгеймера, болезнь Паркинсона, эпилепсия, ишемический инсульт, мигрень, рассеянный склероз) продемонстрировало отсутствие генетических корреляций с шизофренией, при этом слабые корреляции при сравнении психических и неврологических заболеваний выявлены между мигренью и БДР и мигренью и СДВГ.
Представленные данные показывают, что ППР для шизофрении действительно обладают специфичностью, если сравнивать их с другими патологиями центральной нервной системы. В то же время имеют место общие (плейотропные) эффекты генотипа на фенотип при сравнении шизофрении с близкими по клинической картине психическими расстройствами. Феномен плейотропии косвенно указывает на то, что для формирования фенотипа шизофрении необходим учет влияния как распространенных полиморфизмов (полигенный риск), так и других факторов, в том числе эпигенетических и стохастических [30].
Влияние эпигенетических факторов
Изучение связи генотип—фенотип в значительной степени осложняет необходимость учета эпигенетических факторов. Как отмечалось выше, к ним относят разного рода изменения в геноме, которые влияют на экспрессию генов путем химических модификаций, но при этом не затрагивают первичную структуру ДНК. Совокупность эпигенетических изменений (меток) формирует эпигеном, регулирующая роль которого реализуется через различные механизмы и на различных уровнях организации ДНК (метилирование ДНК, модификация гистонов, модификация структуры хроматина, включая его доступность и топологию).
В настоящее время не вызывает сомнения факт, что связь между генетическими предпосылками и шизофренией в значительной мере опосредована эпигенетическими факторами. Наибольшее внимание в этом аспекте уделялось метилированию ДНК, которое относится к наиболее стабильным и хорошо охарактеризованным эпигенетическим модификациям. Как правило, метилирование имеет место в участках генома, обогащенных цитозином (C) и гуанином (G), которые получили название CpG сайты. Изменение уровня метилирования при шизофрении отмечено как для отдельных генов-кандидатов, так при полногеномных исследованиях сайтов метилирования [31—33].
Большой интерес исследователей вызывают так называемые некодируюшие участки генома. По данным GWAS, при шизофрении однонуклеотидные полиморфизмы в генах, потенциально повреждающие структуру кодируемых белков за счет изменений в их аминокислотной последовательности, обнаружены только в 2—7% от ассоциированных с заболеванием локусов риска [24, 34]. Биоинформатический анализ показал, что большая часть полиморфизмов, ассоциированных с шизофренией, расположена не в кодирующей, а в регуляторной части генома [35]. Эти участки содержат регуляторные элементы (различные типы некодирующих микроРНК (ncRNAs), инсуляторы, промоторы, энхансеры, связывающие сайты для транскрипционных факторов), контролирующие экспрессию гена, при этом они не всегда регулируют ген, ближайший к ним в последовательности генома, а могут находиться на большом расстоянии от сайтов инициации транскрипции [36]. Таким образом, ассоциированные с шизофренией полиморфизмы могут влиять на фенотип не через структуру белков, а через уровень экспрессии генов, в частности за счет регуляции процесса транскрипции. Транскрипция, или копирование информации с ДНК на РНК, является ключевым процессом, контролирующим экспрессию гена. Эффективность процесса зависит от точности его регуляции, поскольку за счет этого не только поддерживается нормальное функционирование клетки, но и обеспечивается соответствующий адаптивный ответ на внешние воздействия и сигналы. Поэтому неудивительно, что 10% (примерно 3000) от всех аннотированных генов в геноме человека кодируют транскрипционные факторы [37]. Нарушение процесса транскрипции на ранних этапах развития головного мозга может играть важную роль в развитии шизофрении. В связи с этим изучение регионов, содержащих элементы, регулирующие транскрипцию, является в настоящее время одним из приоритетов в установлении генетических механизмов этого заболевания. Нужно отметить, что эпигенетические изменения часто проявляют себя только в определенных тканях. Соответственно для шизофрении это могут быть определенные клеточные популяции головного мозга. При сопоставлении данных геномного и транскриптомного анализов генетические факторы, определяющие предрасположенность к шизофрении, оказались расположены вблизи генов, специфически активных в нескольких типах клеток мозга: в пирамидальных нейронах коры и медианных шипиковых нейронах стриатума [38].
Модулирующий эффект средовых факторов на геном и эпигеном
Средовые факторы риска шизофрении, хотя их роль в развитии заболевания не является столь весомой по сравнению с генетическими причинами, представлены различными воздействиями на организм. В недавнем метаанализе выделено 170 факторов, наиболее важными из которых оказались социально-демографические (миграционные) и социально-экономические (семейные), а также действующие на ранних (пери- и постнатальные осложнения) и более поздних (стрессы, инфекции) стадиях развития [39]. В соответствии с современными представлениями средовые факторы увеличивают риск развития шизофрении у людей с определенной генетической уязвимостью. Например, при наличии в анамнезе детской психологической травмы риск заболевания возрастал у носителей определенного варианта гена нейротрофического фактора головного мозга, а употребление марихуаны влияло на риск в зависимости от варианта гена катехол-О-метилтрансферазы [40]. Средовые факторы могут также модулировать развитие шизофрении на уровне регуляции экспрессии генов (метилирование ДНК). Первые результаты в этом направлении получены при изучении первого психотического эпизода, развитие которого во многом зависит от стрессовых воздействий, действующих как на ранних, так и на поздних стадиях развития мозга [41]. Также сообщается и о более сложных взаимодействиях между генетическими, эпигеномными и средовыми факторами, в частности с помощью биоинформатического анализа показано, что генетические варианты риска шизофрении, определенные по результатам GWAS, действуют посредством влияния на регуляторные элементы в специфических подтипах иммунных клеток, модулируя ответ этих клеток на инфекции и другие средовые воздействия [42].
Таким образом, приведенные в настоящем обзоре данные указывают на то, что понятие «фенотип» применительно к шизофрении не сводится лишь к причинно-следственному отражению изменений в структуре определенного гена, а является продуктом совокупного воздействия средовых факторов и эпигенетических изменений, влияющих на экспрессию генов с учетом тканеспецифичности и степени стимуляции клеток. Из этого следует, что актуальным для текущего периода молекулярно-генетических исследований шизофрении является переход к более углубленному исследованию связи генотип—фенотип, в частности к построению интегративных моделей, полученных на основе полногеномных и эпигеномных данных, функционального биоинформатического анализа, а также модельных исследований с использованием ИПСК.
Авторы заявляют об отсутствии конфликта интересов.