Введение
Большое число публикаций по клиническим исследованиям с малыми размерами выборок или с противоречивыми результатами усложняют процесс принятия своевременных врачебных решений. Для объединения и обобщения результатов отдельных клинических исследований в настоящее время за рубежом активно используется статистический метод — метаанализ. С применением метаанализа становится доступен достаточно большой объем исследуемых клинических случаев, который позволяет проверить с высокой статистической мощностью различные гипотезы о наличии или отсутствии эффекта. Для статистического решения задачи метаанализа могут быть использованы различные компьютерные программы, как проприетарные, так и относящиеся к категории свободного программного обеспечения.
Целью настоящего исследования является описание основ метаанализа с особенностями оценки моделей с фиксированными и случайными эффектами и демонстрация решения задачи по созданию одного из наиболее часто используемых средств визуализации результатов метаанализа — лесовидного графика (англ. forest plot).
Материал и методы
В качестве материалов исследования были использованы результаты радомизированных контролируемых испытаний, опубликованные M. Pynnonen и соавт. [1]. Для демонстрации статистического инструментария метаанализа была использована программная среда R-языка, которая в настоящее время считается наиболее мощным и гибким инструментом для проведения статистического анализа медицинских данных и визуализации его результатов [2].
Для графического представления результатов метаанализа используются комплексные диаграммы, включающие нескольких колонок с исходными данными, поясняющей информацией и лесовидным (или лесообразным) графиком (англ. forest plot) с расположенным в его основании ромбом — обобщенной оценкой исследуемого эффекта. Большинство метаанализов объединяют данные из рандомизированных контролируемых испытаний (РКИ), в которых клинические эффекты сравниваются между экспериментальной и контрольной группами. Мера эффекта для бинарных или двоичных переменных может быть представлена в виде трех основных показателей: отношения шансов (odds ratio — OR), относительного риска (relative risk — RR, также называемого отношением риска, risk ratio — RR), разности рисков (risk difference — RD) [3]. Эффекты для переменных, выраженных в количественной или непрерывной шкале, представляются в виде размера эффекта Es (англ. effect size), основанного на разности средних значений в двух сравниваемых группах: «взвешенной средней разности» (англ. weighted mean difference — WMD), стандартизованной разности d Коэна (Cohen's d), Δ Гласса (Glass' Δ) и других.
Над графиком отображается поясняющая информация: «Review» — обзор, включающий название или исследуемый вопрос систематического обзора и метаанализа; «Comparison» — сравнение результатов вмешательства с контрольной группой; «Outcome» — интересующий исход клинического воздействия.
В первой колонке диаграммы («Study» — клиническое исследование) перечисляются включенные в метаанализ исследования (рис. 1). Часто сначала указывают первого автора исследования, затем год. Во второй колонке указывают исходные данные группы, к которой применяют клиническое воздействие, в третьей колонке — исходные данные контрольной группы.
В 4-й колонке в виде лесовидного графика отображают результаты исследования.
В середине лесовидного графика отображается вертикальная «линия без эффекта», которая проходит через значение 1 горизонтальной шкалы меры эффекта в случае, когда эффект измеряется для двоичной переменной исхода (например, отношение шансов (англ. odds ratio — OR) или относительный риск (англ. relative risk — RR)), или через 0 в случае переменной исхода, выраженной непрерывной переменной (например, WMD). В том случае, если нет разницы в эффекте между вмешательством и контролем, OR и RR=1 или WDM=0.
Прямоугольники, или боксы (англ. box), закрашенные черным цветом, расположены относительно горизонтальной шкалы эффекта в соответствии с его значением для каждого исследования. Размер прямоугольника зависит от вклада исследования в обобщенный эффект. Горизонтальные линии (усы) боксов изображают длину доверительных интервалов (англ. confidence interval — CI). Чем длиннее линии, тем шире доверительный интервал (ДИ), тем менее точна оценка эффекта в исследовании. Если доверительный интервал больше, чем позволяет место на графике, линия кончается стрелкой.
Переменная «Вес» (англ. weight, %) в 5-й колонке указывает на вес или влияние исследования на общие результаты метаанализа всех включенных исследований. Чем больше вес, тем больше размер прямоугольника и тем больше исследование оказывает влияние на общие результаты. Влияние исследования на общие результаты определяется размером выборки исследования и точностью результатов исследования, представленной в ДИ. В целом чем больше размер выборки и чем у́же ДИ, тем больше вес исследования.
В 6-й колонке приведены численные результаты оценки эффекта для каждого исследования (например, OR или RR и 95% CI), которые идентичны данным лесовидного графика.
Ромб в последней строке графика иллюстрирует обобщенный эффект исследуемого клинического воздействия. В средней части ромба находится значение оценки обобщенного эффекта (например, OR, RR или WMD), а шириной ромба изображается ширина доверительного интервала. Численные значения эффекта приведены в 6-й колонке.
Если ромб не пересекает «линию без эффекта», рассчитанную разницу между данными исследуемой и контрольной групп можно рассматривать как статистически значимую. В этом случае ДИ не включает в себя 1 для OR или RR и не включает 0 для WMD. Статистическая значимость общего результата выражается также р-значением. Результат считается статистически значимым, если р<0,05.
В нижней части графика, на левой стороне, указывается значение I2-статистики (в диапазоне между 0 и 100%), показывающей, насколько результаты отдельных исследований, включенных в метаанализ, изменчивы и сопоставимы. С помощью этой статистики можно выбрать между двумя моделями метаанализа: моделью с фиксированными эффектами и моделью со случайными эффектами. Если I2≤25%, исследования считаются однородными и в целом может быть использована модель фиксированных эффектов. Если I2≥75%, то неоднородность очень высока и для метаанализа следует использовать модель со случайными эффектами.
Модель с фиксированными эффектами основывается только на включенных в метаанализ исследованиях, в то время как модель случайных эффектов предполагает, что могут быть опубликованы и другие исследования, не учтенные сейчас или упущенные из виду при поиске литературы, которые должны быть учтены в будущем. Выбор правильной модели для анализа особенно важен, если исходы дихотомичны, так как в этом случае модели фиксированных и случайных эффектов дают разные результаты. В случае непрерывных переменных, отражающих эффект клинического воздействия, результаты по моделям фиксированных или случайных эффектов часто идентичны.
Результаты и обсуждение
В качестве иллюстрации возможности эффективного использования программной среды R для проведения метаанализа были использованы результаты радомизированных контролируемых испытаний разных методов тонзиллэктомии, уже опубликованных M. Pynnonen и соавт. [1]. В этом обзоре были собраны данные о клинических исследованиях из разных источников: ENT Trials Register; Central Register of Controlled Trials; PubMed; Ovid Embase; CINAHL; Web of Science; ClinicalTrials.gov; ICTRP. Кроме того, были использованы дополнительные источники, как опубликованные, так и неопубликованные данные, полученные от авторов уже известных РКИ.
В описании результатов обзора указывается, что тонзиллэктомия является очень распространенной операцией, которая нередко сопровождается различными послеоперационными осложнениями: болью в течение 2 нед после операции, кровотечением в разные сроки после операции — «первичное кровотечение» в течение 24 ч после операции, «вторичное кровотечение» через более чем 24 ч после операции. Коблация (англ. сoblation) — это метод, в котором хирург использует электрический наконечник, который «сжигает» ткани при низких температурах. В настоящее время метод коблации является популярным методом, потому что он якобы вызывает меньше боли, чем другие хирургические методы. Однако преимущество коблации перед другими методами тонзиллэктомии не доказано. Цель систематического обзора этих авторов — сравнить влияние коблационной тонзиллэктомии при хроническом тонзиллите или гипертрофии миндалин с влиянием других хирургических методов, как горячих (hot, с помощью лазерной технологии), так и холодных (cold, режущим способом с помощью традиционных хирургических инструментов), на возникновение различных осложнений и состояний, а также стоимость лечения.
Для проведения метаанализа использовалась программная среда языка R и специальный программный пакет со статистическим инструментарием для проведения метаанализа — metafor (https://cran.r-project.org/web/packages/metafor/metafor.pdf). Простой лесовидный график можно получить, используя функцию «forest» из пакета metafor. Однако полученный таким образом график не содержит все принятые и необходимые элементы диаграммы метаанализа, о которых мы писали в начале статьи. Программная среда R позволяет очень гибко отображать результаты статистических исследований, предоставляя пользователю по факту неограниченные возможности для визуализации результатов исследования.
Программный код R-языка для построения лесовидного графика и представления на нем основных статистик метаанализа приведен в работе [2]. Диаграмма метаанализа клинических исследований встречаемости вторичных кровотечений (англ. secondary bleeding — SB) при коблации в сравнении с «холодными» (cold) и «горячими» (hot) методами тонзиллэктомии (ТЭ) представлена на рис. 2. Интерпретируя полученные модельные результаты, можно сказать о том, что риск вторичного кровотечения при использовании техники коблации в 1,33 раза больше, чем риск вторичного кровотечения при использовании других методов тонзиллэктомии. Однако нулевая гипотеза об отсутствии эффекта не может быть явно отвергнута (z (в отчете «zval») = 1,4995, p (в отчете «pval»=0,1337) >0,05). В отчете для оценки неоднородности используется статистика Q Кокрейна (Cochran’s Q), которая (Q=16,3362, df=25, p=0,9044) не предполагает неоднородности среди истинных значений эффектов.
Таким образом, представленные возможности программной среды R для решения задачи визуализации результатов метаанализа и получения различных статистических показателей обеспечивают все стандартные и при необходимости дополнительные потребности в расчетах при метаанализе. Перечень получаемых статистик может быть расширен за счет применения других программных пакетов среды R или написания собственных программных алгоритмов для решения конкретных научных задач.
Заключение
Как показывает практика, обобщение имеющихся результатов клинических исследований, в том числе в оториноларингологии, на основе методов метаанализа в нашей стране еще не получило широкого распространения. Еще меньше проводится клинических исследований с расчетом на использование их результатов в последующих систематических обзорах и метаанализах. Знание метода метаанализа заставляет медицинского исследователя готовить результаты своих исследований так, чтобы они могли стать составной частью метаанализа и в будущем принести существенную пользу, даже если сейчас она неочевидна. Проведение метаанализа не ограничивается построением лесовидного графика и расчетом отдельных статистик, но именно они дают в краткой, визуально сжатой форме представление о клиническом эффекте и его доказательности. Программная среда R вместе со специальными программными пакетами позволяет обеспечить систематический обзор клинических исследований, их метаанализ и визуализировать его результаты в требуемом виде. Учитывая, что эта программная среда является свободным программным обеспечением и не требует лицензионных отчислений при установке и использовании, ее можно рекомендовать для применения в научных исследованиях подобного рода.
Авторы заявляют об отсутствии конфликта интересов.