На данный момент опухоли мозга являются одними из самых критических заболеваний в мире ввиду сложности их лечения. Особенно опасны нейроонкологические заболевания в детском возрасте вследствие ограничений применения стандартных видов лечения, таких как радио- и химиотерапия, а также наличия возможных вторичных эффектов после стандартной терапии, негативно влияющих на дальнейшее развитие мозга [1].
Существует большое количество видов опухолей мозга, имеющих различия по своей локализации, скорости роста и другим свойствам. Более того, некоторые классы опухолей мозга также могут различаться внутри, распределяясь на подгруппы, и на данный момент наиболее актуальным стандартом является классификация опухолей центральной нервной системы от World Health Organization [2]. Ввиду большого количества и серьезных различий между видами опухолей мозга важный фактор для выбора оптимального лечения — четкое определение класса опухоли и выявление соматических изменений, ведущих к развитию опухоли. Стандартным методом в этой области является гистология, однако тут существует ряд технических сложностей и в том числе вариабельность в интерпретации результатов вследствие многообразности системы мозга. Более того, обычно в опухолях мозга у детей трудно выявить какие-либо четкие причины онкогенеза при некоторых классах таких опухолей, как, например, эпендимома, до сих пор не определено наличие каких-либо ключевых мутаций, ведущих к развитию опухоли [3].
Для решения этих неординарных задач в настоящее время одним из самых перспективных ресурсов становится молекулярная биология. Большой шаг вперед в этой области был сделан после появления технологий секвенирования — систем, обеспечивающих получение и прочтение молекулярной информации из опухолевых клеток в больших объемах [4]. Эти системы позволяют выявить соматические изменения генома, ведущие к развитию опухоли, и построить транскриптомную или эпигеномную структуру опухоли, позволяющую четко ее классифицировать. Набранная из секвенирования информация выводит лечение опухоли на уровень персонализированной медицины с максимальной точностью диагностики и оптимальным выбором метода лечения.
Получение молекулярной информации, касающейся опухолей, при использовании секвенирования
Секвенирование за последние 10 лет стало стандартной процедурой в молекулярной биологии для изучения генома (полной последовательности ДНК из всех хромосом клетки) и транскриптома (совокупности активных РНК, синтезируемых клеткой). Первые попытки считывать последовательность ДНК были сделаны с помощью применения методов секвенирования по Сэнгеру, однако для этого надо изначально знать четкую локализацию нарушения в геноме для выбора праймеров, чтобы определить необходимую последовательность. Новые системы позволили полностью автоматизировать это процесс. На данный момент наиболее распространена методика секвенирования нового поколения (Next Generation Sequencing, NGS или High Throughput Sequencing, HTS), позволяющая параллельно считывать до 1 млн фрагментов ДНК. Стандартные шаги процедуры секвенирования включают:
1) фильтрацию материала, например, выделение определенных фрагментов ДНК или конвертация РНК в ДНК;
2) фрагментацию — разделение последовательностей ДНК на определенные размеры для возможности их прочтения и добавление адаптеров для фиксации, а также амплификацию созданных фрагментов для усиления сигнала;
3) считывание последовательностей фрагментов и сохранение в виде цифровых записей;
4) анализ полученных данных для выявления соматических изменений ДНК и других возможных факторов развития опухоли.
Для применения секвенирования минимальный лимит входных тканей опухоли варьирует от 50 до 200 нг [5]. Важно также отметить, что стандартное секвенирование требует высокого качества исходной ДНК. Поэтому были разработаны процедуры, позволяющие длительное время не только сохранять опухолевую ткань, но и извлекать из нее достаточное количество качественной ДНК. Например, выделение ДНК из образцов, фиксированных в формалине и залитых парафином (Formalin-fixed paraffin-embedded), гарантирует успешное применение секвенирования с минимальной потерей качества после долгого хранения [6].
Наиболее широко используемые системы для секвенирования на данный момент производятся компанией Illumina. Такие платформы, как NextSeq500 или MiSeq500, полностью автоматизируют процедуру и на выходе выдают считанные фрагменты генома (прочтения, или риды), позволяющие выявить нуклеотидную последовательность вырезанного сегмента ДНК. Типичный размер рида составляет от 50 до 150 нуклеотидов. Для улучшения покрытия также применяются парные риды, когда фрагмент последовательности считывается с двух сторон. Типичный размер фрагмента может быть от 300 до 1000 нуклеотидов. Широкие фрагменты ДНК для парных ридов особенно полезны для выявления комплексных структурных изменений генома.
Важным этапом после получения данных секвенирования является их анализ. Особенно критично наличие вычислительных ресурсов, хранилища данных и автоматизации процедуры анализа, так как объем полученных данных может превышать сотни миллионов ридов. Ввиду того что геном человека уже известен (последняя версия GRCh38/hg38, ncbi.nlm.nih.gov/assembly/GCF_000001405.26), изначально риды выравниваются на последовательность этого генома, чтобы определить их локацию. Следует отметить, что каждый этап секвенирования может вносить технические ошибки и в результате последовательность рида может отличаться от изначально считанной последовательности ДНК. Начальный контроль качества позволяет выявить некорректные сегменты ридов и исключить их из дальнейшего анализа. Также важно учитывать, что для повышения точности полученного результата требуется иметь высокий уровень покрытия каждой позиции генома и это может потребовать увеличения количества ридов. Например, чтобы повысить точность выявления мутации для генома человека, необходимо минимальное покрытие до 40X ридов в каждой позиции, а в идеале до 100X [7]. Сложность полного покрытия также заключается в том, что малый размер рида даже с учетом парных фрагментов может вести к неточности определения локации в геноме из-за наличия повторов. Ряд специальных программ был разработан, чтобы скорректировать и оптимизировать выравнивание ридов на геном и избежать различных ошибок; некоторые из этих методов уже стали стандартными [8]. Однако полученные данные выравнивания ридов на геном также следует изучить детально для выявления возможных технических ошибок, например, низкое покрытие определенных участков генома или поврежденная фрагментация. Этот контроль качества также стал стандартным блоком анализа данных секвенирования с набором эффективных существующих программ [9], позволяющих выявлять возможные проблемы (рис. 1).
Рис. 1. Пример контроля качества данных полного геномного ДНК-секвенирования на образце рецидива эпендимомы.
Анализ уровня покрытия генома по хромосомам (а) и гистограмма его распределения (б). Визуализация осуществлена с помощью инструмента контроля качества выравнивания ридов Qualimap.
Полученные результаты выравнивания ридов на геном могут быть использованы для решения сложных задач, каждая из которых обладает своей спецификой. Далее в статье описываются типичные стратегии анализа данных ДНК и РНК в нейроонкологии.
ДНК-секвенирование
Секвенирование ДНК является важным этапом в онкологии, поскольку позволяет выявлять мутации, инверсии, вставки, удаления и сложные транслокации генома, ведущие к развитию опухоли. Наиболее оптимальный метод для решения данной задачи — полное секвенирование генома, осуществляющее покрытие всех его участков. Однако такая процедура может требовать довольно высоких финансовых расходов ввиду необходимости полного покрытия. Альтернативой может служить полное экзомное секвенирование участков генома, покрывающих только функциональные сегменты гена. Экзомы составляют лишь 2% генома, тем самым значительно уменьшают количество требуемых ридов для покрытия. Более того, экзомы могут также быть отфильтрованы на ряд генов, важных для изучения опухолей, при нацеленном секвенировании, еще более уменьшив требуемые ресурсы. Тем не менее принципиально учитывать, что такая фильтрация может привести к потере важной информации, так как из-за транслокаций могут быть соматически активны участки генома, непокрытые в выбранном методе секвенирования, например регионы между генами или хвосты хромосом.
ДНК-секвенирование применяется в основном в онкологии для определения мутаций — изменений генома, которые могут вести к развитию опухоли, как, например, хорошо изученные K27M- или G34R-мутации гена H3F3A в глиобластомах [10]. Такие мутации можно выявить при сравнении последовательностей ридов, полученных из опухоли с последовательностью нормального генома (рис. 2). Существует ряд широко используемых программных инструментов, позволяющих выполнить эту процедуру [11]. Кроме того, при помощи такого секвенирования также можно выявлять и более сложные изменения генома: вставки, удаления, дупликации и транслокации. Типичным примером такого соматического эффекта является делеция критического сегмента гена CDKN2A в глиобластомах [12] или сложная система транслокаций — хромотрипсис в медуллобластомах и эпендимомах [13]. Как и для поиска мутаций, выявление таких соматических изменений осуществляется при использовании опубликованных и адаптированных методов [14].
Важно принимать во внимание, что в опухолях мозга могут отсутствовать какие-либо прямые изменения генома, особенно учитывая, насколько мало мутаций возникает в раннем возрасте. Несмотря на это, дополнительный эффект может быть выявлен при помощи проверки изменений копий генома. Так, некоторые онкогены могут сильно активироваться через амплификацию, как, например, транскрипционные факторы MYC и MYCN в группах 3 и 4 медуллобластомы [15]. Геномное/экзомное секвенирование также позволяет при анализе данных выявить такие эффекты. Как и с мутациями, существует ряд стабилизованных методов для достижения этой цели [16].
После выявления мутаций, вставок/удалений и транслокаций из данных секвенирования генома или экзома необходимо определить те изменения, которые могут давать серьезные эффекты дестабилизации нормальных клеток. Обширные библиотеки доступных данных можно использовать, чтобы аннотировать их, например, проверить локацию мутации в геноме и уточнить, какой участок гена затронут и может ли он привести к функциональному изменению белка, есть ли подтверждение этой мутации как известного соматического изменения по существующим исследованиям злокачественных опухолей и др. Созданные для этой цели широко используемые ресурсы хорошо описаны и находятся в открытом доступе для применения [17].
Важно отметить, что найденные с помощью секвенирования мутации могут не давать никакого эффекта, связанного с развитием опухоли, но являются обычными возможными изменениями в геноме. Для четкого выявления значимости мутации требуется специальный контроль в виде нормального материала ДНК пациента, опухоль которого изучается (например, кровь). Нормальный материал также секвенируется, при этом мутации и транслокации опухоли сравниваются с результатами, полученными в контроле для выявления соматических изменений. Тем не менее требуется учитывать, что генетически заложенные так называемые наследственные мутации тоже могут играть важную роль. Некоторые виды опухолей мозга, например медуллобластома, имеют ассоциацию с синдромом Ли—Фраумени, обусловленным мутацией в гене TP53 [18]. Дополнительная проверка выявленных в опухолях мутаций при существующем контроле специфичных генов позволит изучить эти эффекты.
Для финальной проверки результатов также обычно имеет смысл визуализировать результат. На данный момент существует ряд инструментов, которые помогают отобразить выбранный участок генома (например, ключевой поврежденный ген, как показано на рис. 2) с полной интеграцией данных секвенирования — покрытия, найденных мутаций и так далее. Визуализация позволяет выявить, насколько корректным является результат, а также изучить дополнительные детали. Есть как широкодоступные инструменты свободного доступа (пример, Integrative Genomics Viewer [19]), так и программы от коммерческих компаний с полной поддержкой, но требующих дополнительной оплаты (пример, CLC Genome Browser).
Рис. 2. Соматическая мутация, ведущая к изменению белка (G34R) в гене H3F3A, обнаруженная при анализе данных полного геномного секвенирования из образца глиомы.
Визуализация осуществлена с помощью инструмента Integrative Genomics Viewer.
РНК-секвенирование
Применение РНК-секвенирования на материалах опухоли сходно с процедурой для ДНК по своим техническим деталям и отличается только по первому этапу: извлеченные из опухоли РНК конвертируются в ДНК, а также фильтруются для исключения избыточных генов (например, рибосомных). Полученные риды выравниваются на геном, интегрируя уже существующие и широко применяемые программы [20], и далее используются для оценки экспрессии генов после подсчета количества ридов, покрывающих их. Важно учитывать, что для контроля генов требуется использовать последнюю детальную аннотацию генома человека (например, Gencode 38, gencodegenes.org/human), а также, как и для геномного секвенирования, осуществлять дополнительный контроль качества выравнивания ридов, специфичный для РНК (например, выявление пропорции покрытых генов).
Полученная матрица экспрессии генов позволяет четко выявить наиболее активные или, наоборот, потерянные маркеры — ключевые гены, участвующие в развитии опухоли. Например, амплификацию MYC/MYCN в группах 3—4 медуллобластомы также можно определить в данных РНК-секвенирования, используя их высокую экспрессию по сравнению с другими генами опухоли. Более того, полный материал экспрессии генов образца опухоли можно сравнить с различными доступными или опубликованными материалами других опухолей при кластеризации, чтобы подтвердить гистологическую классификацию опухоли или выявить возможные различия. Не менее важно, что выявление генов, активных в опухоли, позволит понять их коммуникацию и определить ключевые онтологические группы. Это может являться решающим фактором для выбора новейшего метода лечения, такого как контроль иммунной системы или деактивация определенного соматического гена через редактирование генома.
Однако наиболее значительной причиной применения РНК-секвенирования на материалах опухолей является возможность обнаружения генов слияния (fusion genes), или химер. Такие гены могу возникнуть при транслокации генома, приводящей к слиянию фрагмента одного гена с другим, т.е. к формированию нового гена с уникальными соматическими функциями. Хорошо известным примером такого гена является химера ZFTA-RELA в агрессивных эпендимомах (рис. 3), которая была доказана как основная причина развития опухоли [21]. Для выявления таких генов слияния были разработаны эффективные биоинформатические методы, уже широко используемые для уточнения классификации опухоли [22]. Тем не менее выявленные гены слияния могут потребовать дополнительной экспериментальной проверки. Наиболее удобным методом для этой цели может служить полимеразная цепная реакция (ПЦР) или секвенирование по Сэнгеру.
Рис. 3. Слияние генов ZFTA и RELA, выявленное в эпендимоме в результате использования РНК-секвенирования.
Визуализация осуществлена как завершающий этап анализа данных с помощью инструмента для поиска химерных генов Arriba.
Важно отметить, что РНК-секвенирование также может быть скомбинировано с данными ДНК-секвенирования, полученными из материала той же самой опухоли. Это особенно полезно для подтверждения активной мутации в экспрессирующем гене в случае ее пропорционального различия в аллелях по данным, полученным из ДНК (например, на рис. 1 — G37R-мутация выражена только в одной аллели). Другой вариант комбинации — это выявление эффекта найденной в геноме транслокации, которая может вести к появлению гена слияния, как было указано выше. Дополнительно визуализация ДНК- и РНК-результатов тоже может быть скомбинирована для улучшения интерпретации с помощью существующих и ранее отмеченных инструментов [19].
Заключение
В данный момент в онкологии секвенирование нового поколения как инструмент диагностики активно применяется в клинической практике. Однако всегда следует учитывать, что, несмотря на возможность выявления мутаций, структурных изменений генома и других важных соматических факторов, изучение материала опухоли требует полной комбинации всех доступных ресурсов, при этом важным шагом является корректная интеграция материалов секвенирования в полную систему диагностики опухолей на медицинском уровне.
В будущем секвенирование может стать стандартным дополнительным методом, позволяющим улучшить прогноз и выбрать наилучшую стратегию лечения пациента, что является важнейшим требованием в педиатрической нейроонкологии.
Работа поддержана Грантом Минобрнауки РФ (номер соглашения 075-15-2021-1343).