Постоев В.А.

ФГБОУ ВО «Северный государственный медицинский университет» Минздрава России

Усынина А.А.

ФГБОУ ВО «Северный государственный медицинский университет» Минздрава России

Гржибовский А.М.

ФГБОУ ВО «Северный государственный медицинский университет» Минздрава России

Меньшикова Л.И.

ФГБОУ ВО «Северный государственный медицинский университет» Минздрава России;
ФГБОУ ДПО «Российская медицинская академия непрерывного профессионального образования» Минздрава России

Сон И.М.

ФГБОУ ДПО «Российская медицинская академия непрерывного профессионального образования» Минздрава России

Сравнение моделей прогнозирования спонтанных преждевременных родов

Авторы:

Постоев В.А., Усынина А.А., Гржибовский А.М., Меньшикова Л.И., Сон И.М.

Подробнее об авторах

Прочитано: 1264 раза


Как цитировать:

Постоев В.А., Усынина А.А., Гржибовский А.М., Меньшикова Л.И., Сон И.М. Сравнение моделей прогнозирования спонтанных преждевременных родов. Медицинские технологии. Оценка и выбор. 2024;46(4):10‑19.
Postoev VA, Usynina AA, Grjibovski AM, Menshikova LI, Son IM. Comparison of models for prediction of spontaneous preterm birth. Medical Technologies. Assessment and Choice. 2024;46(4):10‑19. (In Russ.)
https://doi.org/10.17116/medtech20244604110

Рекомендуем статьи по данной теме:
Рак же­луд­ка: за­бо­ле­ва­емость, фак­то­ры рис­ка, скри­нинг. Про­фи­лак­ти­чес­кая ме­ди­ци­на. 2024;(12):135-139
Осо­бен­нос­ти пер­вич­ных и пов­тор­ных ише­ми­чес­ких ин­суль­тов у муж­чин в воз­рас­те 18—50 лет. Жур­нал нев­ро­ло­гии и пси­хи­ат­рии им. С.С. Кор­са­ко­ва. Спец­вы­пус­ки. 2024;(12-2):65-74

Введение

Преждевременные (в сроки от 22 до 37 недель беременности) роды (ПР) являются важной акушерской проблемой. В настоящее время именно ПР служат основной причиной неонатальной заболеваемости и смертности [1]. Частота ПР в разных странах варьирует — от 4% в Исландии до 17% в Бангладеш [2]. В Российской Федерации их частота по разным оценкам составляет от 6,9 до 7,3% [2, 3].

Для формирования групп риска по развитию ПР и целевого применения мер вторичной профилактики необходима разработка методик прогнозирования. В то же время многочисленные исследования по изучению этиологии ПР демонстрируют участие многих факторов, что может затруднять точное прогнозирование ПР [4, 5]. К потенциальным детерминантам ПР относят: социально-демографические факторы (возраст, этническая принадлежность, образование, семейный статус, экономическое положение женщины) [6, 7], факторы акушерского анамнеза (порядковый номер беременности и родов, интервал между родами, ПР в анамнезе, наличие спонтанных прерываний беременности или искусственных абортов) [7], наличие одного или нескольких экстрагенитальных заболеваний (хронические инфекции мочевой системы, артериальная гипертензия, сахарный диабет) [7, 8], поведенческие факторы (курение, употребление алкоголя) [9], а также осложнения настоящей беременности (многоплодная беременность, многоводие, угроза прерывания, в том числе кровотечение в ранних ее сроках) [7, 10, 11].

Имеются также указания на прогностическую значимость ряда биохимических (интеркейкины ИЛ-6 и ИЛ-8, фибронектин плода, плацентарный альфа макроглобулин-1) [12, 13] и анатомических (маточно-цервикальный угол, длина шейки матки) факторов [14, 15] для оценки риска ПР. В то же время большинство данных параметров не принято оценивать рутинно в клинической практике, и, следовательно, возможность их использования в прогностических моделях на популяционном уровне ограничена.

В течение многих лет для прогнозирования бинарных исходов, к которым относят и ПР, исследователи преимущественно использовали логистическую регрессию (ЛР), но в последние годы все более популярными становятся технологии машинного обучения. В отличие от регрессионного анализа, подходы, основанные на машинном обучении, не требуют соблюдения большинства допущений традиционных статистических методов и могут применяться для обработки сложных взаимодействий между прогностическими факторами [16]. Так, в обзоре А.А. Ившина и соавт. представлен анализ ряда исследований, проведенных с целью разработки механизма прогнозирования с помощью алгоритмов машинного обучения, таких как искусственные нейронные сети, деревья классификации (ДК), случайный лес и другие. При этом показатели точности прогноза у описанных методов с использованием выборок от 546 до 16 млн наблюдений варьировали от 0,8 до 1,0, а показатели чувствительности — от 60 до 96% [17].

Важная проблема, ограничивающая разработку моделей на основе машинного обучения и других технологий интеллектуального анализа данных — необходимость формирования больших выборок с однородными, стандартизованными по методике сбора, данными для обучения моделей. Регистр родов Архангельской области (РРАО), содержащий собранные и закодированные по единой методике данные о более чем 90 тыс. исходов беременности со сроком гестации 22 недели и более в регионе за 2012—2018 гг., является мощным инструментом для разработки методов прогнозирования неблагоприятных исходов беременности и оценки их прогностической значимости.

Цель исследования — провести сравнительную оценку прогностических моделей спонтанных преждевременных родов, разработанных с помощью логистической регрессии и деревьев классификации.

Материал и методы

Дизайн исследования и источники данных

Проведено ретроспективное когортное исследование, основанное на данных РРАО за 2012—2018 гг. РРАО — это электронная база данных, содержащая детальную информацию обо всех исходах беременностей со сроком 22 недели и более в Архангельской области. Сбор данных для РРАО осуществлялся медицинскими организациями родовспоможения согласно разработанной анкете, содержащей информацию о социально-демографических данных родителей, факторах образа жизни, акушерском анамнезе, особенностях и осложнениях течения настоящей беременности и родов, результатах пренатального скрининга, состоянии новорожденного. Источниками данных для заполнения регистрационной карты РРАО служила первичная медицинская документация, а именно обменная карта, история родов, история развития новорожденного [18].

За рассматриваемый период в РРАО зарегистрировано 92 584 исхода беременностей в сроке 22 недели и больше. Для проведения анализа исключены оперативные (n=21 041) и индуцированные (n=7 368) роды, наблюдения с неизвестным типом родоразрешения (n=430), а также наблюдения, для которых в базе РРАО отсутствовали изучаемые переменные (n=13 164). Таким образом, в итоговый анализ включен 50 581 случай родов (рис. 1). В качестве зависимой переменной исхода для формирования прогностических моделей использован факт спонтанных родов в сроке ранее 37 полных недель гестации.

Рис. 1. Блок-схема отбора наблюдений из регистра для включения в исследование.

Порядок организации и формирования РРАО определен распоряжением Министерства здравоохранения Архангельской области №25-рд от 23.01.2017, протокол ведения и регистрационная карта одобрены комитетом по этике ФГБОУ ВО СГМУ (г. Архангельск) Минздрава России (протокол №1 от 14.02.2017). Проведение данного исследования одобрено комитетом по этике ФГБОУ ВО СГМУ (г. Архангельск) Минздрава России (протокол №1/09-22 от 28.09.2022).

Отбор предикторов

Разработаны 6 моделей прогнозирования (по 3 модели для ЛР и ДК), которые условно разделены на три временных периода для прогнозирования: (1) при планировании беременности, (2) при первой антенатальной явке, (3) в сроке 20—22 недели гестации.

В первую модель включены социально-демографические факторы (семейное положение, образование и возраст матери), факторы акушерского анамнеза (интергенетический интервал, мертворождения, искусственное прерывание беременности, как по желанию женщины, так и по медицинским показаниям, спонтанные аборты, преждевременные или оперативные роды, наличие рубца на матке по причинам, не связанным с оперативным родоразрешением), а также факторы, связанные с состоянием здоровья женщины (наличие хронических инфекций половых органов, почек и/или мочевыводящих путей, бронхиальная астма, артериальная гипертензия, эпилепсия, сахарный диабет до настоящей беременности, а также индекс массы тела при первой антенатальной явке).

Во вторую модель в дополнение к указанным выше факторам включены поведенческие факторы (поздняя (позже 12-й недели беременности) первая антенатальная явка, курение во время беременности, признаки злоупотребления алкоголем во время беременности), а также прием мультивитаминов и фолиевой кислоты во время беременности.

Третья модель дополнена особенностями течения настоящей беременности (наличие признаков патологии у плода или женщины, выявленной при ультразвуковом исследовании (УЗИ), многоплодная беременность, кровотечение в сроке до 13 недель гестации (O20.8-O20.9), гестационный диабет, анемия во время беременности, угроза прерывания беременности (O20.0), острые респираторные вирусные заболевания во время настоящей беременности, отеки беременных, генитальная инфекция, инфекция почек и мочевыделительной системы во время беременности, чрезмерная прибавка массы тела (O26.0), инфекции, передаваемые половым путем во время беременности (O98.1-O98.3) (ИППП), наличие истмико-цервикальной недостаточности (O34.3).

Статистические методы

Статистическая обработка и создание моделей для прогнозирования проведены в программе STATA 17.0 с использованием метода бинарной ЛР и построением ДК. При построении моделей с помощью ЛР в качестве зависимой включена бинарная переменная, кодировавшая факт спонтанных ПР, в качестве независимых переменных — потенциальные предикторы, организованные в три модели в зависимости от периода беременности. Включаемые в каждую из моделей независимые переменные проверены на наличие мультиколлинеарности: фактор инфляции дисперсии для всех включенных в модель переменных не превышал 3, что свидетельствовало об отсутствии выраженной мультиколлинеарности, требующей коррекции. В связи с этим построение корреляционной матрицы для исключения коррелирующих между собой предикторов не проводилось. Результаты регрессионного анализа представлены в виде отношений шансов (ОШ) с 95% доверительными интервалами (ДИ), скорректированными на все включенные в модель переменные.

Построение ДК в настоящем исследовании реализовано методом CART (classification and regression tree) через плагин для программы STATA «CRTREES: Stata module to compute Classification and Regression Trees algorithms» [19], который позволяет строить ДК, деревья регрессии [20] и случайный лес [21]. При построении и тестировании ДК базу исследования разделяли на две выборки: обучающая выборка (от 25 343 до 25 365 наблюдений) и тестовая выборка (от 25 216 до 25 238 наблюдений). Результаты ДК представлены в виде структуры деревьев с указанием вероятностей развития ПР у групп женщин с наличием факторов — потенциальных предикторов, отобранных в финальную модель, с 95% ДИ.

Для оценки прогностической значимости созданных моделей использована оценка площади под Receiver Operating Characteristic (ROC)-кривой [22], чувствительность (способность корректно идентифицировать ПР) и специфичность модели. За последнюю принимали способность модели корректно идентифицировать женщин, у которых беременность завершилась родами в срок более 37 полных недель гестации.

Результаты

В сформированной из РРАО выборке исходов беременностей наблюдалось 2167 спонтанных ПР, частота которых составила 4,28 на 100 родов (95% ДИ: 4,11—4,47). Результаты прогнозирования ПР методом ЛР на этапе планирования беременности представлены в таблице. Наиболее значимыми факторами, увеличивающими вероятность развития ПР, были отягощенный акушерский анамнез (мертворождения, спонтанные прерывания беременности, медицинские аборты в анамнезе), социальные факторы (отличный от официального брака семейный статус), здоровье женщины (ожирение II и III степени, сахарный диабет 1-го или 2-го типа, эпилепсия). В то же время повторнородящие с интергенетическим интервалом более 2 лет имели более низкий риск ПР.

Прогнозирование спонтанных преждевременных родов с помощью логистической регрессии

Переменная

При планировании беременности

При первой антенатальной явке

В сроке 20—22 недели беременности

Ск.ОШ

95% ДИ

p

Ск.ОШ

95% ДИ

p

Ск.ОШ

95% ДИ

p

Семейное положение матери

не замужем

1,55

1,36—1,76

<0,0001

1,44

1,26—1,64

<0,0001

1,49

1,30—1,71

<0,0001

замужем

Реф.

Реф.

Реф.

сожительство

1,34

1,19—1,50

<0,0001

1,26

1,12—1,42

<0,0001

1,27

1,13—1,44

<0,0001

другое

3,18

0,93—10,92

0,066

3,03

0,88—10,42

0,079

3,11

0,93—10,82

0,074

Образование матери

нет

Реф.

Реф.

Реф.

среднее

0,76

0,40—1,44

0,406

0,72

0,38—1,38

0,320

0,67

0,35—1,29

0,231

среднее специальное

0,67

0,36—1,25

0,208

0,72

0,38—1,38

0,319

0,70

0,37—1,32

0,275

высшее

0,57

0,30—1,08

0,086

0,66

0,36—1,25

0,204

0,61

0,32—1,15

0,129

Возраст матери, лет

до 19

1,17

0,90—1,54

0,245

1,16

0,89—1,52

0,273

1,20

0,91—1,58

0,199

19—35

Реф.

Реф.

Реф.

старше 35

1,02

0,75—1,38

0,911

1,03

0,74—1,37

0,941

0,99

0,72—1,35

0,953

Интергенетический интервал

первородящая

Реф.

Реф.

Реф.

не более 2 лет

1,02

0,88—1,19

0,763

0,96

0,82—1,13

0,626

1,00

0,85—1,18

0,977

более 2 лет

0,83

0,75—0,92

<0,0001

0,82

0,74—0,91

<0,0001

0,82

0,74—0,91

<0,0001

Мертворождения в анамнезе

1,44

1,02—2,03

0,037

1,44

1,02—2,04

0,037

1,44

1,01—2,05

0,042

Искусственное прерывание беременности в сроке до 13 недель

1,20

1,09—1,32

<0,0001

1,19

1,08—1,30

<0,0001

1,15

1,05—1,27

0,004

Искусственное прерывание беременности в сроке 13 недель и позже

1,25

0,69—2,25

0,456

1,22

0,68—2,18

0,510

1,28

0,70—2,33

0,418

Искусственное прерывание беременности по медицинским показаниям в анамнезе

1,22

0,66—2,23

0,531

1,25

0,68—2,28

0,473

0,99

0,53—1,87

0,985

Спонтанные аборты в сроке 13—22 недели гестации в анамнезе

1,62

1,22—2,16

0,001

1,55

1,16—2,07

0,003

1,42

1,05—1,91

0,021

Спонтанные аборты в сроке менее 12 недель гестации в анамнезе

1,27

1,13—1,43

<0,0001

1,27

1,13—1,44

<0,0001

1,23

1,09—1,38

0,001

Преждевременные роды в сроке 22—29 недель в анамнезе

2,61

1,76—3,87

<0,0001

2,57

1,73—3,81

<0,0001

2,20

1,45—3,32

<0,0001

Преждевременные роды в сроке 30—36 недель в анамнезе

3,76

3,17—4,46

<0,0001

3,62

3,05—4,30

<0,0001

3,70

3,10—4,42

<0,0001

Оперативные роды в анамнезе

2,06

1,49—2,85

<0,0001

2,02

1,47—2,80

<0,0001

2,02

1,45—2,82

<0,0001

Рубец на матке по причинам, не связанным с оперативным родоразрешением

3,00

0,67—13,35

0,148

2,68

0,59—12,08

0,200

2,71

0,60—12,30

0,197

Хроническая инфекция половых органов

1,07

0,94—1,20

0,304

1,06

0,94—1,20

0,318

1,07

0,94—1,21

0,311

Хроническая инфекция почек и/или мочевыводящих путей

1,02

0,91—1,14

0,770

1,01

0,90—1,14

0,867

1,02

0,90—1,15

0,751

Бронхиальная астма до беременности

0,64

0,40—1,03

0,064

0,64

0,40—1,03

0,120

0,65

0,41—1,06

0,082

Гипертоническая болезнь до беременности

1,27

0,96—1,67

0,087

1,24

0,94—1,64

0,120

1,29

0,98—1,71

0,070

Эпилепсия до настоящей беременности

1,93

1,12—3,32

0,017

1,88

1,09—3,25

0,023

2,09

1,21—3,60

0,008

Прогнозирование спонтанных преждевременных родов с помощью логистической регрессии (Окончание).

Переменная

При планировании беременности

При первой антенатальной явке

В сроке 20—22 недели беременности

Ск.ОШ

95% ДИ

p

Ск.ОШ

95% ДИ

p

Ск.ОШ

95% ДИ

p

Сахарный диабет 1-го типа до беременности

5,95

3,18—11,16

<0,0001

5,83

3,12—10,91

<0,0001

6,07

3,19—11,56

<0,0001

Сахарный диабет 2-го типа до беременности

2,50

0,93—6,73

0,068

2,45

0,91—6,60

0,076

2,73

1,00—7,47

0,051

Индекс массы тела матери

недостаточная масса тела

1,17

0,99—1,38

0,061

1,18

1,01—1,40

0,046

1,13

0,96—1,35

0,134

нормальная масса тела

Реф.

Реф.

Реф.

избыточная масса тела

1,05

0,94—1,17

0,408

1,04

0,93—1,16

0,524

1,06

0,95—1,20

0,285

ожирение I степени

1,07

0,89—1,28

0,462

1,06

0,88—1,27

0,513

1,15

0,96—1,38

0,137

ожирение II степени

1,98

1,51—2,59

<0,0001

1,97

1,51—2,58

<0,0001

2,11

1,60—2,78

<0,0001

ожирение III степени

2,20

1,30—3,73

0,003

2,14

1,26—3,63

0,005

2,32

1,35—3,97

0,002

Прием мультивитаминов во время беременности

0,88

0,79—0,99

0,015

0,88

0,79—0,97

0,014

Прием фолиевой кислоты во время беременности

0,98

0,88—1,09

0,734

0,93

0,84—1,03

0,161

Курение во время беременности

1,33

1,19—1,49

<0,0001

1,31

1,16—1,47

<0,0001

Срок беременности (недель) на момент постановки на учет позже 12 недель

1,17

1,04—1,33

0,012

1,23

1,08—1,40

<0,0001

Признаки злоупотребления алкоголем во время беременности

4,01

2,63—6,11

<0,0001

4,36

2,84—6,67

<0,0001

Наличие признаков патологии плода или матери при УЗИ

1,86

1,63—2,19

<0,0001

Многоплодная беременность

26,38

20,74—33,53

<0,0001

Кровотечение в сроке до 13 недель гестации

1,60

1,10—2,32

0,014

Гестационный диабет

1,23

1,00—1,53

0,055

Анемия

0,73

0,67—0,80

<0,0001

Угроза прерывания беременности

1,66

1,52—1,83

<0,0001

Острые респираторные вирусные заболевания во время настоящей беременности

0,98

0,85—1,12

0,802

Отеки беременных

0,77

0,68—0,88

<0,0001

Инфекция почек и мочевыделительной системы во время беременности

1,05

0,92—1,19

0,488

Генитальная инфекция во время беременности

0,96

0,87—1,07

0,438

Чрезмерная прибавка массы тела

0,57

0,45—0,72

<0,0001

ИППП во время беременности

0,96

0,59—1,58

0,878

Истмико-цервикальная недостаточность

4,93

2,90—8,35

<0,0001

Примечание. Реф. — референсная категория; Ск.ОШ — скорректированное отношение шансов; ДИ — доверительный интервал; ИППП — инфекции, передаваемые половым путем; УЗИ — ультразвуковое исследование.

Площадь под ROC-кривой для данной модели составила 0,623 (0,610—0,636), точка отсечения с максимальной прогностической результативностью 0,041, или 4,1%, позволяла достичь чувствительности 54% и специфичности 65%.

При использовании того же набора переменных для прогнозирования с помощью ДК (рис. 2) в финальную модель алгоритмом отобраны только 4 фактора, позволяющие максимально результативно классифицировать исходы беременности в зависимости от срока гестации. Максимальная вероятность развития ПР, равная 0,368 (95% ДИ: 0,162—0,575), была у женщин, имевших в анамнезе ПР в сроке до 30 недель беременности и не состоявших в зарегистрированном браке. Прогностическая значимость указанной модели была ниже, чем для ЛР. Площадь под ROC-кривой составила 0,561 (95% ДИ: 0,552—0,571), чувствительность и специфичность в предполагаемой точке отсечения (0,048) были 24 и 87% соответственно.

Рис. 2. Модель прогнозирования спонтанных преждевременных родов на этапе планирования беременности с помощью деревьев классификации.

После добавления в модель факторов, которые могут быть оценены при первой антенатальной явке (см. таблицу), помимо факторов, указанных выше, значимое влияние на риск развития ПР оказывали: поздняя первая антенатальная явка, курение и признаки злоупотребления алкоголем во время беременности. Прием мультивитаминов, напротив, снижал риск развития ПР на 12%. Прогностическая значимость дополненной модели, созданной с помощью метода ЛР, изменилась незначительно: площадь под ROC-кривой составила 0,633 (95% ДИ: 0,621—0,646). При сохранении точки отсечения неизменной чувствительность модели составила 55%, специфичность — 66%.

При использовании ДК (рис. 3) в финальную модель с помощью алгоритма отобраны следующие факторы: ПР в сроке 30—36 недель в анамнезе, признаки злоупотребления алкоголем во время беременности, курение во время беременности, наличие сахарного диабета 1-го типа. Максимальная вероятность развития ПР, равная 0,261, прогнозировалась для беременных с наличием сахарного диабета 1-го типа. Прогностическая значимость модели с помощью ДК уступала таковой, основанной на результатах ЛР. Площадь под ROC-кривой составила 0,573 (95% ДИ: 0,563—0,583). При точке отсечения, равной 0,048, чувствительность модели составила 30%, специфичность — 84%.

Рис. 3. Модель прогнозирования спонтанных преждевременных родов при первой антенатальной явке с помощью деревьев классификации.

Третий вариант моделей предполагал включение факторов, связанных с настоящей беременностью. По результатам регрессионного анализа (см. таблицу) в дополнение к факторам, значимым в предыдущих моделях, более высокий риск ПР установлен у беременных, имевших многоплодную беременность, патологические изменения, выявленные при УЗИ плода, истмико-цервикальную недостаточность, кровотечения в сроке до 13 недель беременности и признаки угрозы прерывания беременности. Прогностическая значимость модели значительно выросла: площадь под ROC-кривой составила 0,703 (95% ДИ: 0,691—0,715). Эмпирически подобранная точка отсечения снизилась до 0,039, при этом чувствительность модели в точке отсечения выросла до 63%, а специфичность — до 67%.

Прогнозирование ПР в сроке 20—22 недели с помощью ДК (рис. 4) позволило выделить четыре значимых фактора, которые включены в финальную модель: многоплодная беременность, ПР в сроке 30—36 недель в анамнезе, угроза прерывания настоящей беременности, признаки злоупотребления алкоголем во время беременности. Максимальная вероятность ПР прогнозировалась для женщин с многоплодной беременностью — 0,529 (95% ДИ: 0,445—0,612). Среди женщин с одноплодной беременностью максимальная вероятность ПР прогнозировалась при наличии признаков злоупотребления алкоголем — 0,300 (95% ДИ: 0,161—0,438). По сравнению с предыдущими, построенными по алгоритму ДК, данная модель имела максимальную площадь под ROC-кривой — 0,620 (95% ДИ: 0,608—0,632) и баланс чувствительности и специфичности (52 и 69% соответственно).

Рис. 4. Модель прогнозирования спонтанных преждевременных родов в сроке 20—22 недели с помощью деревьев классификации.

Таким образом, максимальная результативность получена для прогностической модели, основанной на ЛР и включающей социально-демографические факторы, факторы акушерского анамнеза, поведенческие факторы, информацию о здоровье женщины до беременности и особенности течения настоящей беременности.

Обсуждение

В проведенном исследовании использованы популяционные данные для прогнозирования спонтанных ПР у женщин с помощью ЛР и одного из методов машинного обучения на разных этапах: планирования беременности, при первой антенатальной явке, во втором триместре беременности. Из числа изученных предикторов наибольшую значимость для прогнозирования на этапе планирования беременности имели факторы, связанные с исходами предыдущих беременностей (ПР в анамнезе, искусственное прерывание беременности, оперативное родоразрешение и т.п.), а также ряд экстрагенитальных заболеваний (сахарный диабет, эпилепсия), что сопоставимо с результатами подобных исследований, использовавших только социально-демографические характеристики и состояние здоровья матери [23]. В целом 22 предиктора позволили достичь площади под ROC-кривой более 60% при использовании ЛР [23]. В то же время при использовании ДК результативность моделей на этом этапе была крайне низкой. Ранее проведенные исследования также демонстрировали недостаточную прогностическую ценность моделей при использовании только факторов анамнеза и социально-демографических характеристик. Так, в исследовании R.A. Belaghi и соавт. при использовании сравнимых характеристик-предикторов авторам удалось достичь чувствительности 50,2 и 64,5% [11], что сравнимо с полученными нами результатами. При этом результативность модели, построенной с помощью ДК, была ниже, чем для ЛР [11]. Исследование A. Koivu и соавт. с использованием набора данных, состоящего из 15 976 537 исходов беременности и 26 потенциальных предикторов, позволило получить площадь под ROC-кривой 0,620—0,640 для модели на основе ЛР и 0,63—0,67 для моделей на основе ансамбля ДК [24].

Дополнение модели поведенческими факторами риска, в числе которых была и поздняя первая антенатальная явка, не позволило увеличить прогностическую значимость модели, построенной с помощью ЛР. В то же время мы определили, что высокой прогностической значимостью обладает ряд поведенческих факторов, достаточно распространенных в изучаемой популяции [25], что свидетельствует об имеющемся потенциале снижения частоты ПР за счет модификации управляемых факторов риска. Использование разработанных моделей совместно с имеющимися балльными шкалами может повысить точность стратификации риска на этапе первой антенатальной явки.

Ожидаемо, что модель, включавшая в дополнение к предыдущим факторам особенности течения настоящей беременности, обладала максимальной прогностической значимостью, что в целом соответствует результатам ранее проведенных исследований [11, 23, 24]. Учитывая то, что изученная нами выборка не ограничивалась только одноплодными беременностями, в число предикторов включена многоплодная беременность, которая была наиболее значимым фактором с ОШ=26,38 (95% ДИ: 20,74—33,53). Полученные нами числовые показатели результативности для всех моделей были ниже по сравнению с аналогичным исследованием [11] по прогнозированию ПР среди одноплодных беременностей (площадь под ROC-кривой 0,703 по сравнению с 0,795 для ЛР и 0,620 по сравнению с 0,755 для ДК соответственно). Вероятной причиной может служить больший набор предикторов в исследовании, проведенном в Канаде, включавший, помимо прочего, ряд биохимических и анатомических показателей (неконъюгированный эстриол, плазменный протеин альфа и другие) и дополнительные характеристики беременности (пол плода). Более того, ограничение исследования [11] только одноплодными беременностями, с одной стороны, сокращало набор значимых предикторов, с другой — делало выборку более однородной и, следовательно, влияние остальных предикторов могло оказаться выше.

Использование ДК не позволило обнаружить больше переменных, связанных со спонтанными ПР, по сравнению с ЛР в нашем наборе данных. Интересно, что во всех прогностических моделях, подготовленных с помощью ДК в разные сроки беременности, суммарно фигурирует всего 8 потенциальных предикторов, из которых 1 относится к группе социально-демографических детерминант (семейный статус), 2 — к акушерскому анамнезу (ПР в разные сроки гестации в анамнезе), 1 — к группе экстрагенитальной патологии (сахарный диабет 1-го типа в анамнезе), 2 являются основными поведенческими факторами (курение и признаки злоупотребления алкоголем), и еще 2 характеризуют особенности течения настоящей беременности (многоплодная беременность и угроза прерывания). Это в целом согласуется как с результатами регрессионного анализа, в котором указанные факторы имели наибольшее влияние, так и с результатами анализа распространенности данных предикторов.

Ограничения исследования

Данное исследование — первый опыт прогнозирования ПР в Российской Федерации, основанного на данных, рутинно собираемых в клинической практике, с использованием популяционного регистра родов. В качестве основных ограничений исследования можно выделить неполный набор предикторов, в первую очередь связанный с характеристиками экстрагенитальной патологии и степенью ее компенсации, а также отсутствие данных о результатах выполненных лабораторных исследований. Расширение набора переменных может повысить прогностическую значимость моделей. Использованная база исследования (РРАО) содержала значительную долю наблюдений с отсутствующими данными. Нами не проводились дополнительные процедуры по восстановлению недостающих значений (множественная импутация, заполнение средними значениями и т.п.), что привело к исключению из анализа значительного числа исходов беременностей и могло снизить статистическую мощность исследования. В то же время мы считаем, что вероятность возникновения ошибки отбора, связанной с этим, не является высокой, и это не могло повлиять на полученные результаты. По причине значительного числа отсутствующих данных и высокой вероятности информационных ошибок мы не включали в анализ ряд факторов (например, курение до беременности), что могло снизить прогностическую значимость, но только в отношении первой модели.

Заключение

Мы продемонстрировали, что бинарная логистическая регрессия имела более высокую прогностическую результативность по сравнению с деревьями классификации для прогнозирования спонтанных преждевременных родов. Максимальная прогностическая значимость достигнута при включении в модель как факторов анамнеза, образа жизни и здоровья беременной, так и факторов, связанных с особенностями течения настоящей беременности. Это делает возможным использование указанного метода как альтернативы шкалам риска при условии дополнения прогностических моделей лабораторными данными и результатами инструментальных исследований.

Участие авторов:

Концепция и дизайн исследования — Постоев В.А., Гржибовский А.М., Меньшикова Л.И.

Сбор и обработка материала — Постоев В.А., Усынина А.А., Гржибовский А.М.

Статистическая обработка — Постоев В.А.

Написание текста — Постоев В.А., Усынина А.А.

Редактирование — Гржибовский А.М., Меньшикова Л.И., Сон И.М.

Авторы заявляют об отсутствии конфликта интересов.

Литература / References:

  1. Perin J, Mulick A, Yeung D, Villavicencio F, Lopez G, Strong KL, et al. Global, regional, and national causes of under-5 mortality in 2000—19: an updated systematic analysis with implications for the Sustainable Development Goals. The Lancet Child and Adolescent Health. 2022;6(2):106-115.  https://doi.org/10.1016/S2352-4642(21)00311-4
  2. Ohuma EO, Moller A-B, Bradley E, Chakwera S, Hussain-Alkhateeb L, Lewin A, et al. National, regional, and global estimates of preterm birth in 2020, with trends from 2010: a systematic analysis. The Lancet. 2023;402(10409):1261-1271. https://doi.org/10.1016/S0140-6736(23)00878-4
  3. Usynina AA, Postoev VA, Grjibovski AM, Krettek A, Nieboer E, Odland JØ, Anda EE. Maternal Risk Factors for Preterm Birth in Murmansk County, Russia: A Registry-Based Study. Paediatric and Perinatal Epidemiology. 2016;30(5):462-472.  https://doi.org/10.1111/ppe.12304
  4. Boelig RC, Berghella V. What’s new in preterm birth prediction and prevention? Journal of Perinatal Medicine. 2018;46(5):455-456.  https://doi.org/10.1515/jpm-2018-0160
  5. Suff N, Story L, Shennan A. The prediction of preterm delivery: What is new? Seminars in Fetal and Neonatal Medicine. 2019;24(1):27-32.  https://doi.org/10.1016/j.siny.2018.09.006
  6. Frick AP. Advanced maternal age and adverse pregnancy outcomes. Best Practice and Research in Clinical Obstetrics and Gynaecology. 2021;70:92-100.  https://doi.org/10.1016/j.bpobgyn.2020.07.005
  7. Celik E, To M, Gajewska K, Smith GCS, Nicolaides KH; Fetal Medicine Foundation Second Trimester Screening Group. Cervical length and obstetric history predict spontaneous preterm birth: development and validation of a model to provide individualized risk assessment. Ultrasound in Obstetrics and Gynecology. 2008;31(5):549-554.  https://doi.org/10.1002/uog.5333
  8. Malaza N, Masete M, Adam S, Dias S, Nyawo T, Pheiffer C. A Systematic Review to Compare Adverse Pregnancy Outcomes in Women with Pregestational Diabetes and Gestational Diabetes. International Journal of Environmental Research and Public Health. 2022;19(17):10846. https://doi.org/10.3390/ijerph191710846
  9. Ye C-X, Chen S-B, Wang T-T, Zhang S-M, Qin J-B, Chen L-Z. Risk factors for preterm birth: a prospective cohort study. Zhongguo dang dai er ke za zhi=Chinese Journal of Contemporary Pediatrics. 2021;23(12):1242-1249. https://doi.org/10.7499/j.issn.1008-8830.2108015
  10. Frey HA, Klebanoff MA. The epidemiology, etiology, and costs of preterm birth. Seminars in Fetal and Neonatal Medicine. 2016;21(2):68-73.  https://doi.org/10.1016/j.siny.2015.12.011
  11. Arabi Belaghi R, Beyene J, McDonald SD. Prediction of preterm birth in nulliparous women using logistic regression and machine learning. PLoS One. 2021;16(6):e0252025. https://doi.org/10.1371/journal.pone.0252025
  12. Son M, Miller ES. Predicting preterm birth: Cervical length and fetal fibronectin. Seminars in Perinatology. 2017;41(8):445-451.  https://doi.org/10.1053/j.semperi.2017.08.002
  13. Jung EY, Park JW, Ryu A, Lee SY, Cho S-H, Park KH. Prediction of impending preterm delivery based on sonographic cervical length and different cytokine levels in cervicovaginal fluid in preterm labor. The Journal of Obstetrics and Gynaecology Research. 2016;42(2):158-165.  https://doi.org/10.1111/jog.12882
  14. Oskovi Kaplan ZA, Ozgu-Erdinc AS. Prediction of Preterm Birth: Maternal Characteristics, Ultrasound Markers, and Biomarkers: An Updated Overview. Journal of Pregnancy. 2018;2018: 8367571. https://doi.org/10.1155/2018/8367571
  15. Ville Y, Rozenberg P. Predictors of preterm birth. Best Practice and Research Clinical Obstetrics and Gynaecology. 2018;52:23-32.  https://doi.org/10.1016/j.bpobgyn.2018.05.002
  16. Наркевич А.Н., Виноградов К.А., Гржибовский А.М. Интеллектуальные методы анализа данных в биомедицинских исследованиях: деревья классификации. Экология человека. 2021;28(3):54-64.  https://doi.org/10.33396/1728-0869-2021-3-54-64
  17. Ившин А.А., Болдина Ю.С., Гусев А.В. Роль искусственного интеллекта в прогнозировании преждевременных родов. Проблемы репродукции. 2021;27(5):121-129.  https://doi.org/10.17116/repro202127051121
  18. Усынина А.А., Постоев В.А., Пастбина И.М., Одланд Й.О., Гржибовский А.М. Опыт использования популяционного регистра родов для анализа факторов риска младенческой смертности на Арктическом севере России. Экология человека. 2020;27(3):54-59.  https://doi.org/10.33396/1728-0869-2020-3-54-59
  19. Mora RV. CRTREES: Stata module to compute Classification and Regression Trees algorithms. 2019. Accessed September, 16 2024. https://EconPapers.repec.org/RePEc:boc:bocode:s458573
  20. Breiman L, ed. Classification and Regression Trees. 1. CRC Press repr. Boca Raton, Fla.: Chapman & Hall/CRC; 1998.
  21. Ignatenko V, Surkov A, Koltcov S. Random forests with parametric entropy-based information gains for classification and regression problems. PeerJ. Computer Science. 2024;10:e1775. https://doi.org/10.7717/peerj-cs.1775
  22. Pepe MS. The statistical evaluation of medical tests for classification and prediction. Oxford; New York: Oxford University Press; 2003.
  23. Damaso EL, Rolnik DL, Cavalli RDC, Quintana SM, Duarte G, Da Silva Costa F, Marcolin A. Prediction of Preterm Birth by Maternal Characteristics and Medical History in the Brazilian Population. Journal of Pregnancy. 2019;2019: 4395217. https://doi.org/10.1155/2019/4395217
  24. Koivu A, Sairanen M. Predicting risk of stillbirth and preterm pregnancies with machine learning. Health Information Science and Systems. 2020;8(1):14.  https://doi.org/10.1007/s13755-020-00105-9
  25. Постоев В.А., Усынина А.А., Меньшикова Л.И., Гржибовский А.М. Оценка возможности использования данных электронного здравоохранения для мониторинга распространенности факторов риска и прогнозирования неблагоприятных исходов беременности на региональном уровне. Современные проблемы здравоохранения и медицинской статистики. 2023; (3):1184-1201. https://doi.org/10.24412/2312-2935-2023-3-1184-1201

Подтверждение e-mail

На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.

Подтверждение e-mail

Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.