Сравнение моделей прогнозирования спонтанных преждевременных родов
Журнал: Медицинские технологии. Оценка и выбор. 2024;46(4): 10‑19
Прочитано: 1264 раза
Как цитировать:
Преждевременные (в сроки от 22 до 37 недель беременности) роды (ПР) являются важной акушерской проблемой. В настоящее время именно ПР служат основной причиной неонатальной заболеваемости и смертности [1]. Частота ПР в разных странах варьирует — от 4% в Исландии до 17% в Бангладеш [2]. В Российской Федерации их частота по разным оценкам составляет от 6,9 до 7,3% [2, 3].
Для формирования групп риска по развитию ПР и целевого применения мер вторичной профилактики необходима разработка методик прогнозирования. В то же время многочисленные исследования по изучению этиологии ПР демонстрируют участие многих факторов, что может затруднять точное прогнозирование ПР [4, 5]. К потенциальным детерминантам ПР относят: социально-демографические факторы (возраст, этническая принадлежность, образование, семейный статус, экономическое положение женщины) [6, 7], факторы акушерского анамнеза (порядковый номер беременности и родов, интервал между родами, ПР в анамнезе, наличие спонтанных прерываний беременности или искусственных абортов) [7], наличие одного или нескольких экстрагенитальных заболеваний (хронические инфекции мочевой системы, артериальная гипертензия, сахарный диабет) [7, 8], поведенческие факторы (курение, употребление алкоголя) [9], а также осложнения настоящей беременности (многоплодная беременность, многоводие, угроза прерывания, в том числе кровотечение в ранних ее сроках) [7, 10, 11].
Имеются также указания на прогностическую значимость ряда биохимических (интеркейкины ИЛ-6 и ИЛ-8, фибронектин плода, плацентарный альфа макроглобулин-1) [12, 13] и анатомических (маточно-цервикальный угол, длина шейки матки) факторов [14, 15] для оценки риска ПР. В то же время большинство данных параметров не принято оценивать рутинно в клинической практике, и, следовательно, возможность их использования в прогностических моделях на популяционном уровне ограничена.
В течение многих лет для прогнозирования бинарных исходов, к которым относят и ПР, исследователи преимущественно использовали логистическую регрессию (ЛР), но в последние годы все более популярными становятся технологии машинного обучения. В отличие от регрессионного анализа, подходы, основанные на машинном обучении, не требуют соблюдения большинства допущений традиционных статистических методов и могут применяться для обработки сложных взаимодействий между прогностическими факторами [16]. Так, в обзоре А.А. Ившина и соавт. представлен анализ ряда исследований, проведенных с целью разработки механизма прогнозирования с помощью алгоритмов машинного обучения, таких как искусственные нейронные сети, деревья классификации (ДК), случайный лес и другие. При этом показатели точности прогноза у описанных методов с использованием выборок от 546 до 16 млн наблюдений варьировали от 0,8 до 1,0, а показатели чувствительности — от 60 до 96% [17].
Важная проблема, ограничивающая разработку моделей на основе машинного обучения и других технологий интеллектуального анализа данных — необходимость формирования больших выборок с однородными, стандартизованными по методике сбора, данными для обучения моделей. Регистр родов Архангельской области (РРАО), содержащий собранные и закодированные по единой методике данные о более чем 90 тыс. исходов беременности со сроком гестации 22 недели и более в регионе за 2012—2018 гг., является мощным инструментом для разработки методов прогнозирования неблагоприятных исходов беременности и оценки их прогностической значимости.
Цель исследования — провести сравнительную оценку прогностических моделей спонтанных преждевременных родов, разработанных с помощью логистической регрессии и деревьев классификации.
Проведено ретроспективное когортное исследование, основанное на данных РРАО за 2012—2018 гг. РРАО — это электронная база данных, содержащая детальную информацию обо всех исходах беременностей со сроком 22 недели и более в Архангельской области. Сбор данных для РРАО осуществлялся медицинскими организациями родовспоможения согласно разработанной анкете, содержащей информацию о социально-демографических данных родителей, факторах образа жизни, акушерском анамнезе, особенностях и осложнениях течения настоящей беременности и родов, результатах пренатального скрининга, состоянии новорожденного. Источниками данных для заполнения регистрационной карты РРАО служила первичная медицинская документация, а именно обменная карта, история родов, история развития новорожденного [18].
За рассматриваемый период в РРАО зарегистрировано 92 584 исхода беременностей в сроке 22 недели и больше. Для проведения анализа исключены оперативные (n=21 041) и индуцированные (n=7 368) роды, наблюдения с неизвестным типом родоразрешения (n=430), а также наблюдения, для которых в базе РРАО отсутствовали изучаемые переменные (n=13 164). Таким образом, в итоговый анализ включен 50 581 случай родов (рис. 1). В качестве зависимой переменной исхода для формирования прогностических моделей использован факт спонтанных родов в сроке ранее 37 полных недель гестации.
Рис. 1. Блок-схема отбора наблюдений из регистра для включения в исследование.
Порядок организации и формирования РРАО определен распоряжением Министерства здравоохранения Архангельской области №25-рд от 23.01.2017, протокол ведения и регистрационная карта одобрены комитетом по этике ФГБОУ ВО СГМУ (г. Архангельск) Минздрава России (протокол №1 от 14.02.2017). Проведение данного исследования одобрено комитетом по этике ФГБОУ ВО СГМУ (г. Архангельск) Минздрава России (протокол №1/09-22 от 28.09.2022).
Разработаны 6 моделей прогнозирования (по 3 модели для ЛР и ДК), которые условно разделены на три временных периода для прогнозирования: (1) при планировании беременности, (2) при первой антенатальной явке, (3) в сроке 20—22 недели гестации.
В первую модель включены социально-демографические факторы (семейное положение, образование и возраст матери), факторы акушерского анамнеза (интергенетический интервал, мертворождения, искусственное прерывание беременности, как по желанию женщины, так и по медицинским показаниям, спонтанные аборты, преждевременные или оперативные роды, наличие рубца на матке по причинам, не связанным с оперативным родоразрешением), а также факторы, связанные с состоянием здоровья женщины (наличие хронических инфекций половых органов, почек и/или мочевыводящих путей, бронхиальная астма, артериальная гипертензия, эпилепсия, сахарный диабет до настоящей беременности, а также индекс массы тела при первой антенатальной явке).
Во вторую модель в дополнение к указанным выше факторам включены поведенческие факторы (поздняя (позже 12-й недели беременности) первая антенатальная явка, курение во время беременности, признаки злоупотребления алкоголем во время беременности), а также прием мультивитаминов и фолиевой кислоты во время беременности.
Третья модель дополнена особенностями течения настоящей беременности (наличие признаков патологии у плода или женщины, выявленной при ультразвуковом исследовании (УЗИ), многоплодная беременность, кровотечение в сроке до 13 недель гестации (O20.8-O20.9), гестационный диабет, анемия во время беременности, угроза прерывания беременности (O20.0), острые респираторные вирусные заболевания во время настоящей беременности, отеки беременных, генитальная инфекция, инфекция почек и мочевыделительной системы во время беременности, чрезмерная прибавка массы тела (O26.0), инфекции, передаваемые половым путем во время беременности (O98.1-O98.3) (ИППП), наличие истмико-цервикальной недостаточности (O34.3).
Статистическая обработка и создание моделей для прогнозирования проведены в программе STATA 17.0 с использованием метода бинарной ЛР и построением ДК. При построении моделей с помощью ЛР в качестве зависимой включена бинарная переменная, кодировавшая факт спонтанных ПР, в качестве независимых переменных — потенциальные предикторы, организованные в три модели в зависимости от периода беременности. Включаемые в каждую из моделей независимые переменные проверены на наличие мультиколлинеарности: фактор инфляции дисперсии для всех включенных в модель переменных не превышал 3, что свидетельствовало об отсутствии выраженной мультиколлинеарности, требующей коррекции. В связи с этим построение корреляционной матрицы для исключения коррелирующих между собой предикторов не проводилось. Результаты регрессионного анализа представлены в виде отношений шансов (ОШ) с 95% доверительными интервалами (ДИ), скорректированными на все включенные в модель переменные.
Построение ДК в настоящем исследовании реализовано методом CART (classification and regression tree) через плагин для программы STATA «CRTREES: Stata module to compute Classification and Regression Trees algorithms» [19], который позволяет строить ДК, деревья регрессии [20] и случайный лес [21]. При построении и тестировании ДК базу исследования разделяли на две выборки: обучающая выборка (от 25 343 до 25 365 наблюдений) и тестовая выборка (от 25 216 до 25 238 наблюдений). Результаты ДК представлены в виде структуры деревьев с указанием вероятностей развития ПР у групп женщин с наличием факторов — потенциальных предикторов, отобранных в финальную модель, с 95% ДИ.
Для оценки прогностической значимости созданных моделей использована оценка площади под Receiver Operating Characteristic (ROC)-кривой [22], чувствительность (способность корректно идентифицировать ПР) и специфичность модели. За последнюю принимали способность модели корректно идентифицировать женщин, у которых беременность завершилась родами в срок более 37 полных недель гестации.
В сформированной из РРАО выборке исходов беременностей наблюдалось 2167 спонтанных ПР, частота которых составила 4,28 на 100 родов (95% ДИ: 4,11—4,47). Результаты прогнозирования ПР методом ЛР на этапе планирования беременности представлены в таблице. Наиболее значимыми факторами, увеличивающими вероятность развития ПР, были отягощенный акушерский анамнез (мертворождения, спонтанные прерывания беременности, медицинские аборты в анамнезе), социальные факторы (отличный от официального брака семейный статус), здоровье женщины (ожирение II и III степени, сахарный диабет 1-го или 2-го типа, эпилепсия). В то же время повторнородящие с интергенетическим интервалом более 2 лет имели более низкий риск ПР.
Прогнозирование спонтанных преждевременных родов с помощью логистической регрессии
| Переменная | При планировании беременности | При первой антенатальной явке | В сроке 20—22 недели беременности | ||||||
| Ск.ОШ | 95% ДИ | p | Ск.ОШ | 95% ДИ | p | Ск.ОШ | 95% ДИ | p | |
| Семейное положение матери | |||||||||
| не замужем | 1,55 | 1,36—1,76 | <0,0001 | 1,44 | 1,26—1,64 | <0,0001 | 1,49 | 1,30—1,71 | <0,0001 |
| замужем | Реф. | Реф. | Реф. | ||||||
| сожительство | 1,34 | 1,19—1,50 | <0,0001 | 1,26 | 1,12—1,42 | <0,0001 | 1,27 | 1,13—1,44 | <0,0001 |
| другое | 3,18 | 0,93—10,92 | 0,066 | 3,03 | 0,88—10,42 | 0,079 | 3,11 | 0,93—10,82 | 0,074 |
| Образование матери | |||||||||
| нет | Реф. | Реф. | Реф. | ||||||
| среднее | 0,76 | 0,40—1,44 | 0,406 | 0,72 | 0,38—1,38 | 0,320 | 0,67 | 0,35—1,29 | 0,231 |
| среднее специальное | 0,67 | 0,36—1,25 | 0,208 | 0,72 | 0,38—1,38 | 0,319 | 0,70 | 0,37—1,32 | 0,275 |
| высшее | 0,57 | 0,30—1,08 | 0,086 | 0,66 | 0,36—1,25 | 0,204 | 0,61 | 0,32—1,15 | 0,129 |
| Возраст матери, лет | |||||||||
| до 19 | 1,17 | 0,90—1,54 | 0,245 | 1,16 | 0,89—1,52 | 0,273 | 1,20 | 0,91—1,58 | 0,199 |
| 19—35 | Реф. | Реф. | Реф. | ||||||
| старше 35 | 1,02 | 0,75—1,38 | 0,911 | 1,03 | 0,74—1,37 | 0,941 | 0,99 | 0,72—1,35 | 0,953 |
| Интергенетический интервал | |||||||||
| первородящая | Реф. | Реф. | Реф. | ||||||
| не более 2 лет | 1,02 | 0,88—1,19 | 0,763 | 0,96 | 0,82—1,13 | 0,626 | 1,00 | 0,85—1,18 | 0,977 |
| более 2 лет | 0,83 | 0,75—0,92 | <0,0001 | 0,82 | 0,74—0,91 | <0,0001 | 0,82 | 0,74—0,91 | <0,0001 |
| Мертворождения в анамнезе | 1,44 | 1,02—2,03 | 0,037 | 1,44 | 1,02—2,04 | 0,037 | 1,44 | 1,01—2,05 | 0,042 |
| Искусственное прерывание беременности в сроке до 13 недель | 1,20 | 1,09—1,32 | <0,0001 | 1,19 | 1,08—1,30 | <0,0001 | 1,15 | 1,05—1,27 | 0,004 |
| Искусственное прерывание беременности в сроке 13 недель и позже | 1,25 | 0,69—2,25 | 0,456 | 1,22 | 0,68—2,18 | 0,510 | 1,28 | 0,70—2,33 | 0,418 |
| Искусственное прерывание беременности по медицинским показаниям в анамнезе | 1,22 | 0,66—2,23 | 0,531 | 1,25 | 0,68—2,28 | 0,473 | 0,99 | 0,53—1,87 | 0,985 |
| Спонтанные аборты в сроке 13—22 недели гестации в анамнезе | 1,62 | 1,22—2,16 | 0,001 | 1,55 | 1,16—2,07 | 0,003 | 1,42 | 1,05—1,91 | 0,021 |
| Спонтанные аборты в сроке менее 12 недель гестации в анамнезе | 1,27 | 1,13—1,43 | <0,0001 | 1,27 | 1,13—1,44 | <0,0001 | 1,23 | 1,09—1,38 | 0,001 |
| Преждевременные роды в сроке 22—29 недель в анамнезе | 2,61 | 1,76—3,87 | <0,0001 | 2,57 | 1,73—3,81 | <0,0001 | 2,20 | 1,45—3,32 | <0,0001 |
| Преждевременные роды в сроке 30—36 недель в анамнезе | 3,76 | 3,17—4,46 | <0,0001 | 3,62 | 3,05—4,30 | <0,0001 | 3,70 | 3,10—4,42 | <0,0001 |
| Оперативные роды в анамнезе | 2,06 | 1,49—2,85 | <0,0001 | 2,02 | 1,47—2,80 | <0,0001 | 2,02 | 1,45—2,82 | <0,0001 |
| Рубец на матке по причинам, не связанным с оперативным родоразрешением | 3,00 | 0,67—13,35 | 0,148 | 2,68 | 0,59—12,08 | 0,200 | 2,71 | 0,60—12,30 | 0,197 |
| Хроническая инфекция половых органов | 1,07 | 0,94—1,20 | 0,304 | 1,06 | 0,94—1,20 | 0,318 | 1,07 | 0,94—1,21 | 0,311 |
| Хроническая инфекция почек и/или мочевыводящих путей | 1,02 | 0,91—1,14 | 0,770 | 1,01 | 0,90—1,14 | 0,867 | 1,02 | 0,90—1,15 | 0,751 |
| Бронхиальная астма до беременности | 0,64 | 0,40—1,03 | 0,064 | 0,64 | 0,40—1,03 | 0,120 | 0,65 | 0,41—1,06 | 0,082 |
| Гипертоническая болезнь до беременности | 1,27 | 0,96—1,67 | 0,087 | 1,24 | 0,94—1,64 | 0,120 | 1,29 | 0,98—1,71 | 0,070 |
| Эпилепсия до настоящей беременности | 1,93 | 1,12—3,32 | 0,017 | 1,88 | 1,09—3,25 | 0,023 | 2,09 | 1,21—3,60 | 0,008 |
| Прогнозирование спонтанных преждевременных родов с помощью логистической регрессии (Окончание). | |||||||||
| Переменная | При планировании беременности | При первой антенатальной явке | В сроке 20—22 недели беременности | ||||||
| Ск.ОШ | 95% ДИ | p | Ск.ОШ | 95% ДИ | p | Ск.ОШ | 95% ДИ | p | |
| Сахарный диабет 1-го типа до беременности | 5,95 | 3,18—11,16 | <0,0001 | 5,83 | 3,12—10,91 | <0,0001 | 6,07 | 3,19—11,56 | <0,0001 |
| Сахарный диабет 2-го типа до беременности | 2,50 | 0,93—6,73 | 0,068 | 2,45 | 0,91—6,60 | 0,076 | 2,73 | 1,00—7,47 | 0,051 |
| Индекс массы тела матери | |||||||||
| недостаточная масса тела | 1,17 | 0,99—1,38 | 0,061 | 1,18 | 1,01—1,40 | 0,046 | 1,13 | 0,96—1,35 | 0,134 |
| нормальная масса тела | Реф. | Реф. | Реф. | ||||||
| избыточная масса тела | 1,05 | 0,94—1,17 | 0,408 | 1,04 | 0,93—1,16 | 0,524 | 1,06 | 0,95—1,20 | 0,285 |
| ожирение I степени | 1,07 | 0,89—1,28 | 0,462 | 1,06 | 0,88—1,27 | 0,513 | 1,15 | 0,96—1,38 | 0,137 |
| ожирение II степени | 1,98 | 1,51—2,59 | <0,0001 | 1,97 | 1,51—2,58 | <0,0001 | 2,11 | 1,60—2,78 | <0,0001 |
| ожирение III степени | 2,20 | 1,30—3,73 | 0,003 | 2,14 | 1,26—3,63 | 0,005 | 2,32 | 1,35—3,97 | 0,002 |
| Прием мультивитаминов во время беременности | — | — | — | 0,88 | 0,79—0,99 | 0,015 | 0,88 | 0,79—0,97 | 0,014 |
| Прием фолиевой кислоты во время беременности | — | — | — | 0,98 | 0,88—1,09 | 0,734 | 0,93 | 0,84—1,03 | 0,161 |
| Курение во время беременности | — | — | — | 1,33 | 1,19—1,49 | <0,0001 | 1,31 | 1,16—1,47 | <0,0001 |
| Срок беременности (недель) на момент постановки на учет позже 12 недель | — | — | — | 1,17 | 1,04—1,33 | 0,012 | 1,23 | 1,08—1,40 | <0,0001 |
| Признаки злоупотребления алкоголем во время беременности | — | — | — | 4,01 | 2,63—6,11 | <0,0001 | 4,36 | 2,84—6,67 | <0,0001 |
| Наличие признаков патологии плода или матери при УЗИ | — | — | — | — | — | — | 1,86 | 1,63—2,19 | <0,0001 |
| Многоплодная беременность | — | — | — | — | — | — | 26,38 | 20,74—33,53 | <0,0001 |
| Кровотечение в сроке до 13 недель гестации | — | — | — | — | — | — | 1,60 | 1,10—2,32 | 0,014 |
| Гестационный диабет | — | — | — | — | — | — | 1,23 | 1,00—1,53 | 0,055 |
| Анемия | — | — | — | — | — | — | 0,73 | 0,67—0,80 | <0,0001 |
| Угроза прерывания беременности | — | — | — | — | — | — | 1,66 | 1,52—1,83 | <0,0001 |
| Острые респираторные вирусные заболевания во время настоящей беременности | — | — | — | — | — | — | 0,98 | 0,85—1,12 | 0,802 |
| Отеки беременных | — | — | — | — | — | — | 0,77 | 0,68—0,88 | <0,0001 |
| Инфекция почек и мочевыделительной системы во время беременности | — | — | — | — | — | — | 1,05 | 0,92—1,19 | 0,488 |
| Генитальная инфекция во время беременности | — | — | — | — | — | — | 0,96 | 0,87—1,07 | 0,438 |
| Чрезмерная прибавка массы тела | — | — | — | — | — | — | 0,57 | 0,45—0,72 | <0,0001 |
| ИППП во время беременности | — | — | — | — | — | — | 0,96 | 0,59—1,58 | 0,878 |
| Истмико-цервикальная недостаточность | — | — | — | — | — | — | 4,93 | 2,90—8,35 | <0,0001 |
Примечание. Реф. — референсная категория; Ск.ОШ — скорректированное отношение шансов; ДИ — доверительный интервал; ИППП — инфекции, передаваемые половым путем; УЗИ — ультразвуковое исследование.
Площадь под ROC-кривой для данной модели составила 0,623 (0,610—0,636), точка отсечения с максимальной прогностической результативностью 0,041, или 4,1%, позволяла достичь чувствительности 54% и специфичности 65%.
При использовании того же набора переменных для прогнозирования с помощью ДК (рис. 2) в финальную модель алгоритмом отобраны только 4 фактора, позволяющие максимально результативно классифицировать исходы беременности в зависимости от срока гестации. Максимальная вероятность развития ПР, равная 0,368 (95% ДИ: 0,162—0,575), была у женщин, имевших в анамнезе ПР в сроке до 30 недель беременности и не состоявших в зарегистрированном браке. Прогностическая значимость указанной модели была ниже, чем для ЛР. Площадь под ROC-кривой составила 0,561 (95% ДИ: 0,552—0,571), чувствительность и специфичность в предполагаемой точке отсечения (0,048) были 24 и 87% соответственно.
Рис. 2. Модель прогнозирования спонтанных преждевременных родов на этапе планирования беременности с помощью деревьев классификации.
После добавления в модель факторов, которые могут быть оценены при первой антенатальной явке (см. таблицу), помимо факторов, указанных выше, значимое влияние на риск развития ПР оказывали: поздняя первая антенатальная явка, курение и признаки злоупотребления алкоголем во время беременности. Прием мультивитаминов, напротив, снижал риск развития ПР на 12%. Прогностическая значимость дополненной модели, созданной с помощью метода ЛР, изменилась незначительно: площадь под ROC-кривой составила 0,633 (95% ДИ: 0,621—0,646). При сохранении точки отсечения неизменной чувствительность модели составила 55%, специфичность — 66%.
При использовании ДК (рис. 3) в финальную модель с помощью алгоритма отобраны следующие факторы: ПР в сроке 30—36 недель в анамнезе, признаки злоупотребления алкоголем во время беременности, курение во время беременности, наличие сахарного диабета 1-го типа. Максимальная вероятность развития ПР, равная 0,261, прогнозировалась для беременных с наличием сахарного диабета 1-го типа. Прогностическая значимость модели с помощью ДК уступала таковой, основанной на результатах ЛР. Площадь под ROC-кривой составила 0,573 (95% ДИ: 0,563—0,583). При точке отсечения, равной 0,048, чувствительность модели составила 30%, специфичность — 84%.
Рис. 3. Модель прогнозирования спонтанных преждевременных родов при первой антенатальной явке с помощью деревьев классификации.
Третий вариант моделей предполагал включение факторов, связанных с настоящей беременностью. По результатам регрессионного анализа (см. таблицу) в дополнение к факторам, значимым в предыдущих моделях, более высокий риск ПР установлен у беременных, имевших многоплодную беременность, патологические изменения, выявленные при УЗИ плода, истмико-цервикальную недостаточность, кровотечения в сроке до 13 недель беременности и признаки угрозы прерывания беременности. Прогностическая значимость модели значительно выросла: площадь под ROC-кривой составила 0,703 (95% ДИ: 0,691—0,715). Эмпирически подобранная точка отсечения снизилась до 0,039, при этом чувствительность модели в точке отсечения выросла до 63%, а специфичность — до 67%.
Прогнозирование ПР в сроке 20—22 недели с помощью ДК (рис. 4) позволило выделить четыре значимых фактора, которые включены в финальную модель: многоплодная беременность, ПР в сроке 30—36 недель в анамнезе, угроза прерывания настоящей беременности, признаки злоупотребления алкоголем во время беременности. Максимальная вероятность ПР прогнозировалась для женщин с многоплодной беременностью — 0,529 (95% ДИ: 0,445—0,612). Среди женщин с одноплодной беременностью максимальная вероятность ПР прогнозировалась при наличии признаков злоупотребления алкоголем — 0,300 (95% ДИ: 0,161—0,438). По сравнению с предыдущими, построенными по алгоритму ДК, данная модель имела максимальную площадь под ROC-кривой — 0,620 (95% ДИ: 0,608—0,632) и баланс чувствительности и специфичности (52 и 69% соответственно).
Рис. 4. Модель прогнозирования спонтанных преждевременных родов в сроке 20—22 недели с помощью деревьев классификации.
Таким образом, максимальная результативность получена для прогностической модели, основанной на ЛР и включающей социально-демографические факторы, факторы акушерского анамнеза, поведенческие факторы, информацию о здоровье женщины до беременности и особенности течения настоящей беременности.
В проведенном исследовании использованы популяционные данные для прогнозирования спонтанных ПР у женщин с помощью ЛР и одного из методов машинного обучения на разных этапах: планирования беременности, при первой антенатальной явке, во втором триместре беременности. Из числа изученных предикторов наибольшую значимость для прогнозирования на этапе планирования беременности имели факторы, связанные с исходами предыдущих беременностей (ПР в анамнезе, искусственное прерывание беременности, оперативное родоразрешение и т.п.), а также ряд экстрагенитальных заболеваний (сахарный диабет, эпилепсия), что сопоставимо с результатами подобных исследований, использовавших только социально-демографические характеристики и состояние здоровья матери [23]. В целом 22 предиктора позволили достичь площади под ROC-кривой более 60% при использовании ЛР [23]. В то же время при использовании ДК результативность моделей на этом этапе была крайне низкой. Ранее проведенные исследования также демонстрировали недостаточную прогностическую ценность моделей при использовании только факторов анамнеза и социально-демографических характеристик. Так, в исследовании R.A. Belaghi и соавт. при использовании сравнимых характеристик-предикторов авторам удалось достичь чувствительности 50,2 и 64,5% [11], что сравнимо с полученными нами результатами. При этом результативность модели, построенной с помощью ДК, была ниже, чем для ЛР [11]. Исследование A. Koivu и соавт. с использованием набора данных, состоящего из 15 976 537 исходов беременности и 26 потенциальных предикторов, позволило получить площадь под ROC-кривой 0,620—0,640 для модели на основе ЛР и 0,63—0,67 для моделей на основе ансамбля ДК [24].
Дополнение модели поведенческими факторами риска, в числе которых была и поздняя первая антенатальная явка, не позволило увеличить прогностическую значимость модели, построенной с помощью ЛР. В то же время мы определили, что высокой прогностической значимостью обладает ряд поведенческих факторов, достаточно распространенных в изучаемой популяции [25], что свидетельствует об имеющемся потенциале снижения частоты ПР за счет модификации управляемых факторов риска. Использование разработанных моделей совместно с имеющимися балльными шкалами может повысить точность стратификации риска на этапе первой антенатальной явки.
Ожидаемо, что модель, включавшая в дополнение к предыдущим факторам особенности течения настоящей беременности, обладала максимальной прогностической значимостью, что в целом соответствует результатам ранее проведенных исследований [11, 23, 24]. Учитывая то, что изученная нами выборка не ограничивалась только одноплодными беременностями, в число предикторов включена многоплодная беременность, которая была наиболее значимым фактором с ОШ=26,38 (95% ДИ: 20,74—33,53). Полученные нами числовые показатели результативности для всех моделей были ниже по сравнению с аналогичным исследованием [11] по прогнозированию ПР среди одноплодных беременностей (площадь под ROC-кривой 0,703 по сравнению с 0,795 для ЛР и 0,620 по сравнению с 0,755 для ДК соответственно). Вероятной причиной может служить больший набор предикторов в исследовании, проведенном в Канаде, включавший, помимо прочего, ряд биохимических и анатомических показателей (неконъюгированный эстриол, плазменный протеин альфа и другие) и дополнительные характеристики беременности (пол плода). Более того, ограничение исследования [11] только одноплодными беременностями, с одной стороны, сокращало набор значимых предикторов, с другой — делало выборку более однородной и, следовательно, влияние остальных предикторов могло оказаться выше.
Использование ДК не позволило обнаружить больше переменных, связанных со спонтанными ПР, по сравнению с ЛР в нашем наборе данных. Интересно, что во всех прогностических моделях, подготовленных с помощью ДК в разные сроки беременности, суммарно фигурирует всего 8 потенциальных предикторов, из которых 1 относится к группе социально-демографических детерминант (семейный статус), 2 — к акушерскому анамнезу (ПР в разные сроки гестации в анамнезе), 1 — к группе экстрагенитальной патологии (сахарный диабет 1-го типа в анамнезе), 2 являются основными поведенческими факторами (курение и признаки злоупотребления алкоголем), и еще 2 характеризуют особенности течения настоящей беременности (многоплодная беременность и угроза прерывания). Это в целом согласуется как с результатами регрессионного анализа, в котором указанные факторы имели наибольшее влияние, так и с результатами анализа распространенности данных предикторов.
Данное исследование — первый опыт прогнозирования ПР в Российской Федерации, основанного на данных, рутинно собираемых в клинической практике, с использованием популяционного регистра родов. В качестве основных ограничений исследования можно выделить неполный набор предикторов, в первую очередь связанный с характеристиками экстрагенитальной патологии и степенью ее компенсации, а также отсутствие данных о результатах выполненных лабораторных исследований. Расширение набора переменных может повысить прогностическую значимость моделей. Использованная база исследования (РРАО) содержала значительную долю наблюдений с отсутствующими данными. Нами не проводились дополнительные процедуры по восстановлению недостающих значений (множественная импутация, заполнение средними значениями и т.п.), что привело к исключению из анализа значительного числа исходов беременностей и могло снизить статистическую мощность исследования. В то же время мы считаем, что вероятность возникновения ошибки отбора, связанной с этим, не является высокой, и это не могло повлиять на полученные результаты. По причине значительного числа отсутствующих данных и высокой вероятности информационных ошибок мы не включали в анализ ряд факторов (например, курение до беременности), что могло снизить прогностическую значимость, но только в отношении первой модели.
Мы продемонстрировали, что бинарная логистическая регрессия имела более высокую прогностическую результативность по сравнению с деревьями классификации для прогнозирования спонтанных преждевременных родов. Максимальная прогностическая значимость достигнута при включении в модель как факторов анамнеза, образа жизни и здоровья беременной, так и факторов, связанных с особенностями течения настоящей беременности. Это делает возможным использование указанного метода как альтернативы шкалам риска при условии дополнения прогностических моделей лабораторными данными и результатами инструментальных исследований.
Участие авторов:
Концепция и дизайн исследования — Постоев В.А., Гржибовский А.М., Меньшикова Л.И.
Сбор и обработка материала — Постоев В.А., Усынина А.А., Гржибовский А.М.
Статистическая обработка — Постоев В.А.
Написание текста — Постоев В.А., Усынина А.А.
Редактирование — Гржибовский А.М., Меньшикова Л.И., Сон И.М.
Авторы заявляют об отсутствии конфликта интересов.
Литература / References:
Подтверждение e-mail
На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.
Подтверждение e-mail
Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.