Опыт, накопленный российскими нейрохирургами за прошедшие годы, представляет уникальную базу для проведения ретроспективного анализа данных. Такой анализ необходим для сравнительной оценки эффективности и безопасности различных типов хирургических вмешательств, объективизации результатов, полученных на больших разнородных когортах пациентов (в том числе из разных центров), и планирования последующих проспективных исследований. Однако значительная гетерогенность исходных данных, связанная с существованием систематической ошибки отбора, может быть существенной преградой для непосредственного сравнения результатов вмешательств и влиять на выводы. В связи с этим требуется правильная методология ретроспективного анализа и, как следствие, подбора корректных статистических методов обработки данных.
Дизайн большинства клинических исследований основан на сравнении различных методов воздействия и выявлении взаимосвязи между используемыми подходами и исходами заболеваний [1]. В качестве воздействия могут рассматриваться не только различные схемы лечения, но и влияние параметров окружающей среды, принадлежность к той или иной социальной группе или группе риска. Как правило, основной целью исследований в медицине является оценка наличия и выраженности взаимосвязи между изучаемыми факторами воздействия и наблюдаемыми исходами. Требование сопоставимости выбранных для анализа групп является основополагающим, что приводит к необходимости контроля эквивалентности групп по ключевым факторам. Этого можно добиться либо путем рандомизации (рандомизированные контролируемые исследования, РКИ), либо используя метод сопоставления показателей соответствия (Propensity Score Matching, PSM) и его аналоги [2], устраняющие систематическую ошибку отбора (selection bias). Обычно рассматриваются всего две группы — группа контроля и основная группа, поэтому в дальнейшем мы будем описывать дизайн исследования, включающий две анализируемые группы.
РКИ, с точки зрения доказательной медицины, являются «золотым стандартом» для устранения систематической ошибки отбора при оценке безопасности и эффективности лечения. Проведение корректной рандомизации обеспечивает эквивалентное распределение известных и неизвестных факторов, влияющих на исходы. Это является основополагающим условием для анализа исходов в группах сравнения. В иных случаях ряд причин делают проведение РКИ либо невозможным, либо крайне трудоемким. К таким причинам можно отнести слишком большой размер выборки, ограниченность бюджета и/или времени, невозможность организации процедуры рандомизации в силу этических соображений или существенных отличий процедур вмешательств и т. п. [3].
Использование PSM для анализа данных
Если проведение РКИ невозможно в силу каких-либо причин, применяются другие типы дизайна исследования, как правило, ретроспективных и охватывающих большие группы пациентов на протяжении длительного периода наблюдений. В этом случае проведение анализа без устранения систематической ошибки отбора в группах сравнения может привести к существенным искажениям или к неверной интерпретации полученного результата. Именно поэтому редакторы авторитетных изданий стараются избегать публикаций ретроспективных исследований, потенциально содержащих систематическую ошибку отбора.
PSM является эффективным методом, позволяющим добиться эквивалентности распределения по выбранным ключевым характеристикам групп сравнения. В ключевые характеристики групп входят наиболее значимые показатели (клинические и демографические). В результате применения PSM существенно снижается систематическая ошибка отбора и получаются достаточно эквивалентные группы сравнения [4]. Это позволяет провести анализ ретроспективно собранных данных на высоком уровне и получить результаты с высоким уровнем доказательности.
Алгоритм применения PSM включает на 2 шага: устранение ошибки отбора, позволяющее достигнуть выравнивания групп по исходным показателям, и непосредственно сравнительный анализ выровненных данных.
Основы PSM были заложены еще в середине прошлого столетия [1, 5], детальная проработка и формирование методики произошли в 1970—1990 гг. [6—8]. Развитие вычислительной техники в конце прошлого столетия привело к появлению программных продуктов, реализующих данный подход, и сделало доступным использование PSM для широкого круга исследователей [9]. Тем не менее технические аспекты применения PSM могут вызвать у врачей-исследователей затруднения, которые разрешимы при участии в анализе данных специалиста-биостатистика.
Метод PSM основан на использовании величины Propensity Score (PS) — условной вероятности попадания каждого объекта исследования в группу вмешательства. Для построения PS должны быть определены клинически значимые факторы. Поскольку PS является условной вероятностью, значения ее величины расположены в пределах от 0 до 1. Наиболее часто для построения PS применяется модель многофакторной логистической регрессии.
По рассчитанным значениям PS возможно подобрать подгруппы сравнения таким образом, чтобы условная вероятность была сбалансирована между группами вмешательства и контроля. Для этого и используются различные вариации метода PSM [10] — stratification/subclassifications, inverse probability of treatment weighting (IPTW) и covariate adjustment. Выбор наиболее эффективного метода устранения систематической ошибки отбора становится объектом отдельного исследования. Ни один из известных методов не является достаточно универсальным и применимым ко всем ситуациям. Например, метод PSM, в противоположность методу regression аdjust-ment, обладает рядом преимуществ: простотой анализа качества полученных моделей, более полно следует идеологии РКИ, разделяя фазы выбора подгрупп и фазу анализа, и другими преимуществами, более подробно представленными в работе P. Austin [11].
После построения подгрупп сравнения с помощью метода PSM минимизируется систематическая ошибка отбора, поэтому метод PSM рассматривают как подобие рандомизации для ретроспективно собранных данных. Однако принципиальное его отличие состоит в том, что рандомизация устраняет системную ошибку отбора по всем факторам как учтенным, так и неучтенным, в то время как метод PSM устраняет системную ошибку отбора только для факторов, которые были учтены и измерены.
На текущий момент количество научных исследований, использующих PSM как инструмент при анализе и интерпретации клинических ретроспективно собранных данных, стабильно растет [12] и представляет, по данным базы SCOPUS, около 3000 публикаций за 2016 г. (рис. 1). При этом за период 2007—2017 гг. доля статей с участием российских авторов [13, 14], опубликованных в международных базах данных, составляет всего 0,15% из более чем 15 000 исследований.
Среди них число публикаций по проблеме нейрохирургии невелико [15—30]. Мы видим устойчивый интерес исследователей в области нейрохирургии к использованию PSM. Например, в 2017 г. журнал Spine опубликовал исследование, проводившееся с использованием PSM [31]. Мы ожидаем, что применение анализа ретроспективно собранных данных станет неотъемлемой частью подготовки и планирования исследований [8]. С учетом возрастающих этических требований и накопления значительного объема таких данных актуальность, востребованность и эффективность использования их анализа будут только возрастать. Неудивительно, что разработка и применение PSM и его аналогов являются одной из активно развивающихся областей медицины.
Одним из примеров применения метода может служить статья V. Ferraris и соавт. [17], в которой авторы исследовали влияние состава хирургической бригады на результаты операций высокой степени сложности при хирургической патологии в разных областях: общей хирургии, нейрохирургии, сосудистой хирургии, кардиоторакальной хирургии. Поскольку литературные данные, касающиеся роли обучающегося профессии врача (врача-стажера) в операции, крайне противоречивы, авторы решили проанализировать данные, полученные при лечении 266 411 пациентов.
Огромный массив данных был статистически обработан с использованием метода PSM, что позволило минимизировать систематическую ошибку отбора, характерную для ретроспективного исследования. Несмотря на первоначальное предположение о негативном влиянии ассистента в составе операционной бригады на исходы лечения, сделанное на основе предварительных анализов, применение метода PSM и выравнивание групп сравнения позволило получить принципиально иные выводы (рис. 2).
В частности, обобщение данных по интраоперационной и общей смертности, а также смертности в результате послеоперационных осложнений в сосудистой хирургии показало, что в случае анализа данных для групп без устранения ошибки систематического отбора был бы сделан вывод о существенном вреде участия врача-стажера (статистически значимые более высокие показатели операционной смертности и общей смертности). При применении метода PSM интерпретация данных значимо изменилась: было установлено, что присутствие врача-стажера положительно влияет на результаты хирургического вмешательства (меньшая смертность от послеоперационных осложнений) и не оказывает статистически значимого влияния на интраоперационную и общую смертность.
Представленный пример демонстрирует, как устранение различий в показателях при выборе исходных групп влияет на интерпретацию результатов.
Примером того, как минимизация системной ошибки отбора с помощью метода PSM может кардинально изменить результаты обсервационного исследования, служит статья К. Miyata и соавт. (Япония) [20]. Целью работы являлась оценка влияния на неврологические исходы и смертность процедуры терапевтической модуляции температуры (Therapeutic temperature modulation, TTM) (рис. 3).
Данные получены по результатам лечения 687 пациентов с травмами головного мозга. Предварительный анализ, выполненный до устранения системной ошибки отбора, показал, что применение процедуры TTM было статистически значимо ассоциировано с меньшим риском плохого неврологического исхода (Poor neurological outcome) и смерти. Однако после выравнивания групп по возрасту, тяжести травмы, времени и условиям оказания медицинской помощи было установлено, что применение процедуры имеет негативное влияние на исходы, хотя и статистически незначимое.
A. Seicean и соавт. [23] исследовали результаты хирургического лечения интракраниальных аневризм у пациентов при наличии и отсутствии выраженной анемии, требующей трансфузии. Авторы проанализировали 668 случаев лечения пациентов, которым в период с 2006 по 2012 г. выполнялось открытое хирургическое вмешательство. Был использован метод PSM в силу существенных различий групп по предоперационным параметрам, таким как возраст, характеристики аневризм, сопутствующие заболевания и факторы риска неблагоприятных исходов и осложнений.
При анализе ближайших результатов хирургического вмешательства показательным является изменение частоты серьезных осложнений (major complications) до и после применения PSM. В группах без анемии и с анемией разница по частоте развития осложнений изменилась с 20 (25% против 45% до PSM) до 10% (34% против 44% после PSM).
Данные по частоте осложнений в исследуемых группах часто используются для оценки размера группы, необходимой для проведения последующих рандомизированных контролируемых исследований. Если в приведенном примере ориентироваться на разницу в 20% между группами, то планируемый размер выборки окажется как минимум в 3 раза меньше, чем это необходимо для получения статистически обоснованных результатов (рис. 4).
В качестве примеров мы рассмотрели ряд работ [20, 23, 24] за 2015—2016 гг. На основе данных, представленных в этих работах, мы показали, какое значение имеет PSM для анализа данных планирования и проведения последующих исследований.
Заключение
Представленный метод PSM оказывает существенное влияние на качественную интерпретацию ретроспективно собранных данных и проектирование последующих исследований. Использование метода устранения систематической ошибки отбора позволяет точнее оценить размер групп сравнения при планировании исследований, избежать ошибочной интерпретации результатов и искажения результатов при сопоставлении вмешательств и процедур. Использование метода PSM при анализе ретроспективно собранных данных, накопленных российскими нейрохирургическими центрами, позволит проверить ряд гипотез с дальнейшим планированием и проведением РКИ по результатам анализа.
Исследование частично поддержано грантами Российского фонда фундаментальных исследований 17−01−00683 А, 17−41−540759 р_а.
Авторы заявляют об отсутствии конфликта интересов.
*e-mail: Andrei.v.moskalev@gmail.com
Комментарий
Одна из самых важных и нетривиальных задач клинических исследований в области нейрохирургии — адекватный отбор пациентов для анализа зависимости результатов хирургических воздействий от исследуемых факторов. В силу этических и медицинских ограничений когорты пациентов, для которых собираются данные в рутинной клинической практике (используются в наблюдательных исследованиях), оказываются несопоставимыми по многим факторам, влияющим на изучаемые исходы. Формирование основной группы и группы сравнения на основе естественного накопления клинических данных приводит к систематическим ошибкам, в том числе к так называемой «ошибке отбора» (selectionbias), в результате которой эти группы оказываются несопоставимыми по базовым характеристикам, влияющим на исход. Из-за этой ошибки выводы о влиянии изучаемого фактора на клинический исход могут оказаться некорректными. Например, лучшие результаты при использовании минимально инвазивных доступов в нейрохирургии могут быть связаны с меньшей степенью тяжести пациентов, оперируемых с помощью этих доступов, а не только с «минимальной инвазивностью» хирургии.
Для адекватной оценки влияния какого-либо фактора на результаты лечения необходимо рассматривать это влияние в группах, максимально эквивалентных по всем явным и скрытым характеристикам, но отличающихся по сравниваемому фактору. В проспективных исследованиях сбалансированность характеристик в группах достигается рандомизацией. Для ретроспективно проводимых исследований существует класс методов, позволяющих уменьшить ошибку отбора. Настоящая статья посвящена одному из таких методов — PropensityScoreMatching (PSM).
Авторы достигают цель — продемонстрировать значение метода PSM для исследований в нейрохирургии. Статья привлекает внимание специалистов предметной области к существованию математических технологий, позволяющих уменьшить ошибку отбора и существенно увеличить «уровень достоверности доказательств» в результатах исследования. Применение таких методов может быть одним из немногих инструментов обеспечения высокого качества работы с позиций доказательной медицины именно в нейрохирургических исследованиях, для которых рандомизация зачастую не применима по медицинским и этическим причинам.
Ретроспективный анализ информации — наиболее часто используемый подход в нейрохирургических исследованиях. Он кажется наиболее простым в силу естественного накопления клинических данных и отсутствия необходимости продумывать специальный протокол для их сбора. Однако ретроспективно проводимый анализ оказывается гораздо более сложной задачей в силу недостаточного контроля качества данных и необходимости бороться с систематическими ошибками. Из материала, представленного авторами, вытекает чрезвычайно важный вывод о необходимости компетентного ретроспективного анализа данных, который должен выполняться с привлечением специалистов — биостатистиков, понимающих методологию клинических исследований, методы управления клиническими данными и контроля систематических ошибок. Это является одним из краеугольных принципов обеспечения высокого качества исследований с позиций доказательной медицины.
Г.В. Данилов (Москва)