Одна из актуальных проблем современной судебной биологии — поиск возможных путей увеличения эффективности молекулярно-генетического идентификационного анализа. Повышение информативности анализируемых молекулярно-генетических маркеров способно существенно увеличить уровень доказательного значения получаемых результатов. Это особенно важно, если исследованию подвергается биологический материал смешанного происхождения (его индивидуальные компоненты оказываются неразличимы для используемой аналитической панели маркеров [1]) или он низкого качества (анализ возможен лишь по ограниченному числу ДНК-маркеров), а также в случаях установления отдаленного родства, чтобы иметь возможность уменьшить число генетических маркеров, необходимое для получения доказательного результата.
Возможным способом решения этой задачи является разработка в дополнение к существующим новых типов молекулярно-генетических маркеров и аналитических систем. Этот путь радикальный, но он относится к сфере фундаментальной науки. В области прикладной науки перспективным представляется альтернативный подход, а именно реализация новых, более информативных методов анализа в отношении уже известных молекулярно-генетических маркеров.
Обратимся, например, к традиционному, ставшему стандартным подходу к генотипированию локусов коротких тандемных повторов хромосомной ДНК (так называемые STR-маркеры — от англ. short tandem repeat). Одной из базовых техник здесь выступает электрофоретический анализ полиморфизма длины амплифицированных фрагментов (ПДАФ) ДНК [2]. Известно, что большинству областей человеческого генома свойственен другой вид полиморфизма, а именно полиморфизм последовательности амплифицированных фрагментов (ППАФ) ДНК.
В условиях реальной экспертной практики использование технологии, позволяющей детектировать ППАФ, несет много осложнений и требует углубленных дополнительных исследований для правильной интерпретации полученных данных. На сегодня наиболее востребованным в повседневной экспертной работе остается генотипирование STR-маркеров хромосомной ДНК.
Методики электрофоретического разделения STR-фрагментов ДНК не позволяют получать информацию о полиморфизме нуклеотидной последовательности ДНК, так как они нацелены исключительно на установление длины анализируемых ампликонов. Это в определенной мере ограничивает доказательные возможности молекулярно-генетических идентификационных экспертиз.
В этом плане альтернативные методики генотипирования, например детектирующие наряду с полиморфизмом длины еще и полиморфизм нуклеотидной последовательности исследуемых STR-локусов, могли бы выступить в качестве более совершенной аналитической системы, которая позволила бы различить в аллельных вариантах этих локусов существование новых самостоятельных форм. Как следствие, одинаковые STR-аллели, не разделимые в «канонической» электрофоретической системе анализа, в новой «системе координат» могут оказаться разными как раз по признаку полиморфизма нуклеотидной последовательности их ДНК.
В свою очередь это означает потенциальное увеличение дискриминирующего потенциала аналитической системы в целом: благодаря более высокой дискриминирующей способности, реализующейся при анализе профиля амплифицированных фрагментов ДНК в случаях, когда они демонстрируют различия в нуклеотидной последовательности, у эксперта появляется возможность сформулировать более доказательный вывод относительно происхождения биологических следов от конкретных фигурантов.
Важный вопрос заключается в том, насколько ценным является данное предположение в практическом аспекте.
Хорошо известен факт наличия в тандемно организованных STR-локусах точковых нуклеотидных замен или так называемых SNP (от англ. single nucleotide polymorphism). Исследования, касающиеся характера и уровня индивидуальных различий аллельных вариантов по этому признаку, т. е. затрагивающие собственно степень выраженности полиморфизма нуклеотидной последовательности в STR-локусах хромосомной ДНК человека, были развернуты лишь относительно недавно [3, 4]. Между тем, как ранее показано в наших работах [4—6, 8], именно здесь заключается ресурс для увеличения дискриминирующего потенциала STR-маркеров.
Цель работы — поисковое исследование феномена полиморфизма нуклеотидной последовательности в аллелях STR-локусов хромосомной ДНК человека.
Методической основой работы стал комплексный анализ ПДАФ [2] и ППАФ ДНК [9] с помощью масс-спектрометрической аналитической платформы PLEX-ID («Abbott Molecular», США) [10].
Объектами исследования послужили 310 неродственных индивидуумов, представляющих русскоязычное население Российской Федерации. Индивидуальные образцы биологического материала (образцы крови) получали в рамках выполнения молекулярно-генетических идентификационных экспертных исследований и использовали в деперсонализированной (обезличенной) учетной форме. Препараты ДНК выделялись с помощью набора реагентов PrepFiler Forensic DNA Extraction Kit («Applied Biosystems», США), согласно инструкции производителя. Эффективность матричной активности ДНК в препаратах измеряли с помощью полимеразной цепной реакции (ПЦР) с использованием системы количественной энзиматической амплификации ДНК Quantifiler Human DNA Quantification Kit («Applied Biosystems», США).
Для полученных 310 препаратов выполнили в качестве предварительного контрольного исследования традиционное ПДАФ-типирование полиморфных STR-локусов хромосомной ДНК. Анализ ПДАФ амплифицированных фрагментов аутосомных STR-локусов геномной ДНК проводили с использованием аналитической панели AmpFlSTR Identifiler Plus PCR Amplification Kit («Applied Biosystems», США), в состав которой входят следующие генетические маркеры: D8S1179, D21S11, D7S820, CSF1PO, D3S1358, THO1, D13S317, D16S539, D2S1338, D5S818, FGA, D19S433, vWA, TPOX, D18S51.
Продукты ПЦР фракционировали электрофоретически с использованием системы капиллярного электрофореза ABI PRISM 3130 («Applied Biosystems», США).
В дальнейшем для этих же 310 препаратов выполнили анализ полиморфизма последовательности STR-локусов хромосомной ДНК в «двумерном» формате ПДАФ/ППАФ с использованием аналитической панели PLEX-ID STR CODIS loci 120 Tests («Abbott Molecular», США), в состав которой входят следующие генетические маркеры: D5S818, vWA, D3S1358, D13S317, D21S11, D8S1179, D7S820, D16S539, D18S51, FGA, CSF1PO, THO1, TPOX.
Продукты ПЦР фракционировали масс-спектрометрически с использованием автоматизированного комплекса PLEX-ID Instrument («Abbott Molecular», США) [3—8, 10].
Результаты и обсуждение
Получили два массива экспериментальных данных: 310 мультиплексных генотипов в формате ПДАФ, установленных с помощью применения капиллярного электрофореза, и 310 мультиплексных генотипов в формате ПДАФ/ППАФ, установленных с помощью масс-спектрометрического анализа. В этих генотипах наборы анализируемых локусов (в данном случае наборы STR-маркеров) имели 13 общих (одноименных) маркеров: D5S818, vWA, D3S1358, D13S317, D21S11, D8S1179, D7S820, D16S539, D18S51, FGA, CSF1PO, THO1, TPOX.
На аналитическом этапе работы провели сравнительный анализ двух полученных массивов данных на предмет взаимного соответствия представленных в них индивидуальных мультиплексных генотипов, установленных в двух разных форматах: в «моноформате» ПДАФ и в «двумерном» формате ПДАФ/ППАФ.
На уровне ПДАФ-типирования, т. е. на уровне традиционного анализа полиморфизма длины аллельных вариантов STR-локусов хромосомной ДНК, все 310 пар мультиплексных профилей ДНК продемонстрировали полное совпадение.
Этот результат был ожидаемым. Различия предполагалось увидеть на другом уровне, а именно на уровне ППАФ-составляющей генотипирования, т. е. при попарном сравнении одноименных мультиплексных генотипов, установленных с помощью капиллярного электрофореза (ПДАФ-генотипы), и генотипов, установленных с помощью масс-спектрометрического анализа (ПДАФ/ППАФ-генотипы, полученные в результате комплексного анализа полиморфизма длины и полиморфизма последовательности амплифицированных фрагментов аллельных вариантов STR-локусов хромосомной ДНК).
Масс-спектрометрический анализ позволяет выявить так называемые масс-варианты амплифицированных фрагментов ДНК, представляющие собой аллельные состояния STR-локусов, различающиеся не количеством тандемных повторов (как «канонические» STR-аллели), а своей нуклеотидной последовательностью [5—8]. Эти различия проявляются в виде точковых нуклеотидных замен (SNP). Способность детектировать SNP в тех случаях, когда они наличествуют в одноименных STR-аллелях, позволяет дифференцировать одинаковые STR-генотипы1.
В настоящей работе аллельные масс-варианты STR-локусов хромосомной ДНК, т. е. STR-аллели, содержащие SNP, были обнаружены в 10 из 13 исследованных STR-локусов: D5S818, vWA, D3S1358, D13S317, D21S11, D8S1179, D7S820, D16S539, D18S51, FGA (табл. 1).
В этих 10 STR-локусах количество новых аллельных вариантов, обнаруженных в исследованной выборке, составило от 2 до 15. Наглядной оценкой увеличения аллельного разнообразия может служить количественный прирост или доля новых аллелей (в данном случае аллелей, содержащих SNP) среди всех выявленных аллелей конкретного локуса как канонических ПДАФ-аллелей, так и ПДАФ/ППАФ-аллелей, содержащих SNP. В исследованной популяционной выборке для 10 STR-локусов, продемонстрировавших наличие аллельных SNP-вариантов, этот показатель находится в диапазоне от 10 до 68,18%. Диаграмма, отражающая количественный прирост числа аллелей за счет выявления новых ПДАФ/ППАФ-аллельных вариантов, представлена на рис 1.
Подобное расширение аллельного спектра анализируемых STR-локусов, без сомнения, можно рассматривать как предпосылку ожидаемого повышения их информативности как индивидуализирующих маркеров. Эта предпосылка не безусловная. В какой степени она может реализоваться, определили дальнейшие эксперименты, направленные на то, чтобы оценить, как именно выявленный полиморфизм последовательности (ППАФ) влияет на показатели информативности традиционных индивидуализирующих систем ПДАФ-типа.
Определили частоту встречаемости всех аллельных вариантов, детектируемых в комплексной («двумерной») системе координат ПДАФ/ППАФ, и изучили их частотное и долевое распределение (рис. 2).
Наблюдаемая картина оказалась различной для разных локусов, но можно выделить два основных типа (см. рис. 2):
1. SNP-содержащие аллели характеризуются частотой встречаемости, сопоставимой с частотой встречаемости «канонического» варианта (примером могут служить локусы D3S1358, D8S1179, D13S317, D5S818);
2. SNP-содержащие аллели характеризуются заметно более низкой частотой встречаемости, чем «канонический» вариант (являются минорными — примером могут служить локусы FGA, D16S539, D18S51 и в определенной мере vWA).
Ко 2-му типу примыкает еще и такой подтип:
SNP-содержащие варианты являются доминирующими, т. е. характеризуются заметно более высокой частотой встречаемости, чем «канонический» аллель. Отдельный редкий случай: обнаружено всего 5 таких аллелей в 4 локусах, их значение чисто казуистическое (см. табл. 1).
Примечательно, что в контексте повышения информативности значимым может считаться только 1-й тип частотного распределения. Причина в том, что в случае расширения аллельного спектра только за счет появления редких аллелей (2-й тип) существенного повышения информативности генетического маркера не происходит ввиду малой вероятности встретить этот редкий аллельный вариант у реального фигуранта экспертного исследования (подробнее см. далее)2.
Основным количественным критерием повышения информативности генетического маркера выступает прирост такого параметра, как дискриминирующий потенциал. Дискриминирующим потенциалом, или Pd (от англ. power of discrimination) [11—14], мультивариантного генетического признака-маркера называется вероятность такого события, что два случайным образом выбранных из популяции индивидуума не окажутся одинаковыми по этому признаку. Pd зависит не только от количества определяемых вариантов признака, но и от доли каждого варианта в общем аллельном пуле.
Выявили повышение Pd для всех 10 STR-локусов, в которых были обнаружены аллельные SNP-варианты. В целом увеличение Pd составило от 0,02 до 9,7%. Для 7 локусов отметили существенное повышение значения Pd — более чем на 1%. Эти результаты приведены на рис. 3 и в табл. 2.
Другим количественным параметром информативности генетических маркеров является потенциал исключения отцовства, или Pe (от англ. power of exclusion) [15, 16]. Эта величина в экспертизе оспариваемого отцовства характеризует исключающую способность маркера в отношении заведомо ложного отца. По существу, Pe — это доля генотипов исследуемого локуса, которые при их случайном выборе из популяции окажутся неподходящими на роль отцовских генотипов для данного ребенка.
Pe находится в прямой зависимости от такого показателя, как гетерозиготность признака в популяции. Очевидно, что появление новых аллельных вариантов увеличивает долю гетерозигот и, как следствие, повышает Pe. Увеличение Pe (рассчитанное исходя из значений ожидаемой гетерозиготности) установлено для всех 10 STR-локусов, в которых обнаружили аллельные SNP-варианты. Значимое увеличение Pe (минимум на 1%) отметили для тех же 7 маркеров, что и в случае Pd (рис. 4, см. табл. 2).
Обобщая полученные результаты, можно сделать следующие выводы.
Аллельный полиморфизм последовательности ДНК свойственен не всем STR-локусам. Нуклеотидные последовательности аллелей некоторых локусов хромосомной ДНК могут оказаться консервативными; аллельные варианты таких «канонических» STR-локусов не содержат SNP и различаются только числом идентичных тетрануклеотидных повторов. Анализ полиморфизма последовательности применительно к таким локусам не приводит к повышению эффективности их использования в качестве индивидуализирующих маркеров.
Сам по себе факт наличия SNP-содержащих аллельных вариантов не обязательно приводит к значимому повышению аналитических возможностей STR-маркера. Этот эффект зависит от доли таких вариантов в общем аллельном пуле и от типа их частотного распределения: доля должна быть существенной, а частота встречаемости сопоставима с «каноническим» вариантом (см. ранее).
Чтобы убедиться в этом, вернемся к данным табл. 2 (для наглядности эти же данные представлены в виде диаграммы на рис. 5). Здесь показан прирост общего количества аллелей для каждого из локусов, в которых выявлены SNP-варианты электрофоретически идентичных аллелей и обусловленное этим увеличение основных параметров информативности Pd и Pe. Видно, что расширение аллельного спектра действительно во всех случаях приводит к приросту таких ключевых параметров, как дискриминирующий потенциал (Pd) и потенциал исключения (Pe), которые позволяют количественно оценить способность системы правильно решить идентификационную задачу. Степень этого прироста, хотя и положительно коррелирует с приростом числа аллелей, не находится с ней в прямой пропорциональной зависимости. Для примера сравним показатели локусов vWA и D3S1358. Количество SNP-содержащих аллелей и их доля в общем аллельном пуле больше у vWA, но значения Pd и Pe выше у D3S1358.
В целом проведенные в настоящей работе исследования показали, что полиморфизм нуклеотидной последовательности ДНК может рассматриваться как значимый источник увеличения дискриминирующего потенциала STR-маркеров.
Так, для более чем половины исследованных STR-локусов хромосомной ДНК (а именно для 7 из 13, что составляет 54%) выявлен существенный прирост ключевых параметров информативности, обусловленный расширением их аллельного спектра за счет новообнаруженных SNP-содержащих вариантов, детектируемых путем анализа ППАФ (в нашем исследовании это следующие 7 маркеров: аутосомные локусы D5S818, vWA, D3S1358, D13S317, D21S11, D8S1179 и D7S820). Результатом этого локального прироста стало заметное общее повышение информативности и соответственно эффективности экспертного применения исследуемой 13-локусной мультиплексной панели: в 15 раз (15Pe) для установления (верификации) родства на уровне родители-дети и порядка 300 раз (~300Pd) для прямой идентификации.
Кроме того, отметим, что в случае использования технологии PLEX-ID, описанной в настоящей статье, генотипирование не требует дополнительных затрат времени и исследуемого биоматериала по сравнению с традиционным электрофоретическим анализом.
Таким образом, применение анализа полиморфизма нуклеотидной последовательности ДНК для генотипирования маркеров ПДАФ-типа хромосомной ДНК в принципе может обеспечить заметное повышение эффективности их использования в качестве индивидуализирующих маркеров при выполнении молекулярно-генетических экспертиз.
Конфликт интересов отсутствует.
1Масс-варианты — это различающиеся между собой по нуклеотидной последовательности разновидности одинаковых вариантов ПДАФ. Таким образом, ППАФ в данном случае выступает как, условно говоря, полиморфизм «2-го порядка», увеличивающий генотипическое разнообразие полиморфных по размеру амплифицированных фрагментов, т. е. ПДАФ, который в этом случае можно считать полиморфизмом «1-го порядка».
2Это ни в какой мере не противоречит частным случаям, возникающим в экспертной практике, когда доказательность результата генотипирования существенно возрастает при выявлении в объектах исследования редких аллелей.