Сайт издательства «Медиа Сфера»
содержит материалы, предназначенные исключительно для работников здравоохранения. Закрывая это сообщение, Вы подтверждаете, что являетесь дипломированным медицинским работником или студентом медицинского образовательного учреждения.

Мишкин И.А.

ФГБУ «Национальный медицинский исследовательский центр терапии и профилактической медицины» Минздрава России;
ГУЗ Тульской области «Киреевская центральная районная больница»

Концевая А.В.

ФГБУ «Национальный медицинский исследовательский центр терапии и профилактической медицины» Минздрава России

Гусев А.В.

ФГБУ «Центральный научно-исследовательский институт организации и информатизации здравоохранения» Минздрава России;
ООО «К-СКАЙ»

Сахаров А.А.

ПАО «Группа Ренессанс Страхование»

Драпкина О.М.

ФГБУ «Национальный медицинский исследовательский центр терапии и профилактической медицины» Минздрава России;
ФГБОУ ВО «Московский государственный медико-стоматологический университет им. А.И. Евдокимова» Минздрава России

Разработка и тестирование новых методических подходов прогнозирования сердечно-сосудистых событий у здоровых людей с использованием технологии машинного обучения на базе международного исследования «Интерэпид»

Авторы:

Мишкин И.А., Концевая А.В., Гусев А.В., Сахаров А.А., Драпкина О.М.

Подробнее об авторах

Просмотров: 738

Загрузок: 44


Как цитировать:

Мишкин И.А., Концевая А.В., Гусев А.В., Сахаров А.А., Драпкина О.М. Разработка и тестирование новых методических подходов прогнозирования сердечно-сосудистых событий у здоровых людей с использованием технологии машинного обучения на базе международного исследования «Интерэпид». Профилактическая медицина. 2024;27(3):72‑79.
Mishkin IA, Kontsevaya AV, Gusev AV, Saharov AA, Drapkina OM. Development and testing of new methodical approaches for predicting cardiovascular events in healthy people using machine learning technology based on the «INTEREPID» international research. Russian Journal of Preventive Medicine. 2024;27(3):72‑79. (In Russ.)
https://doi.org/10.17116/profmed20242703172

Рекомендуем статьи по данной теме:
Оцен­ка рис­ка сер­деч­но-со­су­дис­тых ос­лож­не­ний в не­ор­га­ни­зо­ван­ной по­пу­ля­ции муж­чин и жен­щин тру­дос­по­соб­но­го воз­рас­та во Вла­ди­мир­ской об­лас­ти. Про­фи­лак­ти­чес­кая ме­ди­ци­на. 2023;(12):46-51
Хро­ни­чес­кие не­ин­фек­ци­он­ные за­бо­ле­ва­ния и упот­реб­ле­ние ал­ко­го­ля в ре­ги­онах Рос­сий­ской Фе­де­ра­ции. Часть 1. За­бо­ле­ва­емость и смер­тность от сер­деч­но-со­су­дис­тых за­бо­ле­ва­ний. Про­фи­лак­ти­чес­кая ме­ди­ци­на. 2024;(1):50-56
Циф­ро­вое здра­во­ох­ра­не­ние Рос­сий­ской Фе­де­ра­ции: ос­нов­ные по­ня­тия для прак­ти­ку­ющих вра­чей. Про­фи­лак­ти­чес­кая ме­ди­ци­на. 2024;(1):97-105
Срав­не­ние прог­нос­ти­чес­ких воз­мож­нос­тей тра­ди­ци­он­ных ме­то­дов оцен­ки сер­деч­но-со­су­дис­то­го рис­ка с ис­поль­зо­ва­ни­ем шкал SCORE и FRAMINGHAM, тех­но­ло­гий ма­шин­но­го обу­че­ния «ИНТЕРЭПИД». Про­фи­лак­ти­чес­кая ме­ди­ци­на. 2024;(2):96-102
Неин­ва­зив­ная ди­аг­нос­ти­ка гли­ом го­лов­но­го моз­га по гис­то­ло­ги­чес­ко­му ти­пу с по­мощью ней­ро­ра­ди­оми­ки в стан­дар­ти­зи­ро­ван­ных зо­нах ин­те­ре­са: на пу­ти к циф­ро­вой би­оп­сии. Жур­нал «Воп­ро­сы ней­ро­хи­рур­гии» име­ни Н.Н. Бур­ден­ко. 2023;(6):59-66
Пер­спек­ти­вы ис­поль­зо­ва­ния ро­бот-ас­сис­ти­ро­ван­ных тех­но­ло­гий в эс­те­ти­чес­кой плас­ти­чес­кой хи­рур­гии. Плас­ти­чес­кая хи­рур­гия и эс­те­ти­чес­кая ме­ди­ци­на. 2023;(4-2):24-34
Под­хо­ды к рас­че­ту пот­реб­нос­ти в ис­сле­до­ва­ни­ях на маг­нит­но-ре­зо­нан­сном то­мог­ра­фе в мно­гоп­ро­филь­ном ста­ци­она­ре. Ме­ди­цин­ские тех­но­ло­гии. Оцен­ка и вы­бор. 2023;(4):19-25
Прог­нос­ти­чес­кая мо­дель для до­пол­ни­тель­ной ин­тра­опе­ра­ци­он­ной ус­та­нов­ки плев­раль­но­го дре­на­жа при то­ра­кос­ко­пи­чес­кой ло­бэк­то­мии. Хи­рур­гия. Жур­нал им. Н.И. Пи­ро­го­ва. 2023;(12):14-25
Ис­поль­зо­ва­ние ис­кусствен­ной ней­рон­ной се­ти при внут­ри­со­су­дис­тых ме­то­дах ис­сле­до­ва­ния. Кар­ди­оло­гия и сер­деч­но-со­су­дис­тая хи­рур­гия. 2024;(1):77-81
Пер­вый опыт ис­поль­зо­ва­ния тех­но­ло­гии ис­кусствен­но­го ин­тел­лек­та в сис­те­ме CAD EYE при ко­ло­нос­ко­пии у де­тей. (Се­рия кли­ни­чес­ких слу­ча­ев). До­ка­за­тель­ная гас­тро­эн­те­ро­ло­гия. 2024;(1):94-100

Введение

В 2023 г. сердечно-сосудистые заболевания (ССЗ) остаются основной причиной смерти в развитых странах мира [1]. По прогнозам Всемирной организации здравоохранения, тенденция общемирового старения населения планеты и увеличение средней продолжительности жизни приведет к росту числа этих заболеваний [2]. В Российской Федерации заболеваемость ССЗ на 2021 г. оценивалась в 3050 случаев на 100 тыс. человек [3]. Число умерших от ССЗ-патологии в течение года составило 933 986 человек [4].

Ключевым вектором развития современной медицины является профилактика [5]. Реализация этой концепции поможет уменьшить число случаев преждевременной смерти, снизить распространенность ССЗ среди лиц трудоспособного возраста, что в результате приведет к увеличению средней продолжительности жизни граждан. Данная цель соответствует утвержденному национальному проекту «Здравоохранение», согласно которому к 2025 г. необходимо добиться повышения средней продолжительности жизни до 76 лет, а к 2030 г. — до 80 лет [6].

На сегодняшний день основной концепцией профилактики ССЗ является оценка сердечно-сосудистого риска (ССР) [7]. Для стран европейского региона, включая Россию, разработаны шкалы оценки относительного и абсолютного ССР. Чаще всего используются шкала SCORE и внедряемая в последнее время шкала SCORE2 [8]. Механизм работы данных шкал базируется на показателях традиционных факторов риска (ФР), таких как уровень общего холестерина плазмы крови (ОХС), значений систолического артериального давления (сАД), возраста, пола, статуса курения. Математические алгоритмы этих шкал основаны на модели пропорциональных рисков (Cox-регрессии) [9, 10].

В связи с этим данные шкалы имеют некоторые недостатки:

— необходимость адаптации под конкретную популяцию;

— устарелость данных исследований, на которых базируются шкалы;

— линейность алгоритмов статистической обработки данных;

— невозможность обработки большого количества данных об изменениях в организме пациента в реальном времени;

— использование ограниченного набора ФР и необходимость ручного вычисления значений риска при использовании бумажных версий шкал;

— неадекватность оценки риска у пациентов различного возраста;

— неточность детерминации пациентов по уровню сердечно-сосудистого риска;

— невысокие показатели ROC-анализа.

В связи с развитием информационных технологий активно исследуется тема применения технологий искусственного интеллекта (ИИ) в сфере здравоохранения [11]. Использование более мощных вычислительных моделей позволяет включить в анализ большее число предикторов, а нелинейные методы анализа биологической информации позволяют находить скрытые взаимосвязи между ФР [12].

В медицине в качестве инструмента прогноза ИИ решает задачу классификации. В отличие от традиционных шкал алгоритмы ИИ не программируются в привычном понимании, а обучаются на наборе данных. На выходе мы получаем процент вероятности (от 0 до 100) принадлежности анализируемого объекта к той или иной категории.

Анализ табличных данных наиболее часто производится с помощью таких алгоритмов ИИ, как градиентный бустинг, деревья решений, случайный лес, метод опорных векторов, байесовский классификатор и т.д. Перечисленные методы хорошо справляются с обработкой табличных значений, поскольку в меньшей степени склонны к переобучению на небольших выборках [13—15].

Цель исследования — разработать и выполнить тестирование новых методических подходов прогнозирования сердечно-сосудистых событий у здоровых людей с использованием технологий искусственного интеллекта.

Материал и методы

Работа выполнена на основании данных международного исследования «Интерэпид», проведенного в 2011—2016 гг. с включением жителей поселков Стройкерамика и Смышляевка Волжского района Самарской области Российской Федерации, жителей города Кант Ысык-Атинского района и пгт Орловка Кеминского района Чуйской области Кыргызской Республики. Материалами для работы послужили Карта профилактического обследования и Форма проспективного наблюдения пациента исследования «Интерэпид». Всего выборка содержала информацию об 1050 участниках из когорты Самары (мужчины, n=447 (42,6%), средний возраст 50 лет; женщины, n=603 (57,4%), средний возраст 49,3 года) и 1341 участнике из когорты Кыргызской Республики (мужчины, n=575 (42,9%), средний возраст 40 лет; женщины, n=766 (57,1%), средний возраст 40,9 года), находившихся под медицинским наблюдением в течение 4 лет. Суммарно обе когорты насчитывали 2 391 наблюдение.

Обе когорты разделены на 2 группы: 1-я группа — пациенты, перенесшие сердечно-сосудистые события, включая фатальные исходы, от следующих заболеваний: случаи развития ишемической болезни сердца (ИБС) (МКБ 10: I20—I25) и случаи развития острого нарушения мозгового кровообращения (ОНМК) (МКБ 10: I60—I64), за период наблюдения n=253 (24,1%) для Самары и n=280 (20,9%) для Кыргызской Республики; 2-я группа: пациенты без сердечно-сосудистых событий за период наблюдения, n=797 (75,9%) для Самары и n=1061 (79,1%) для Кыргызской Республики. Фатальные и нефатальные события, вызванные не БСК, а также неизвестные исходы в процессе наблюдения в исследование не включались. Конечная точка для первых групп обозначена «1» — наступление события, для вторых групп — «0» — событие не наступило.

Для построения модели прогноза мы планировали использовать 5 наиболее подходящих алгоритмов классификации на среде программирования Python версия: 3.11.1.:

— RandomForestClassifier из пакета sklearn.ensemble — реализация алгоритма случайного леса;

— GradientBoostingClassifier из пакета sklearn.ensemble — реализация алгоритма градиентного бустинга;

— ExtraTreesClassifier из пакета sklearn.ensemble — реализация алгоритма дополнительных деревьев;

— XGBClassifier из пакета xgboost — реализация алгоритма градиентного бустинга;

— LGBMClassifier из пакета lightgbm — реализация алгоритма градиентного бустинга.

Принято решение использовать данные алгоритмы, поскольку gradient boosting и random forest наряду с глубоким обучением искусственных нейронных сетей (ИНС) входили в тройку наиболее часто используемых алгоритмов для создания прогнозов на основе табличных данных, а также имели наиболее высокую долю результатов с AUC выше 90% в проведенном нами систематическом обзоре [14]. При этом нами принято решение не использовать ИНС, поскольку на небольшом количестве записей (n=1050 и n=1341) велик риск переобучения (overfitting).

В качестве предикторов мы использовали независимые переменные (всего 191), касающиеся анамнеза, особенностей образа жизни, данных лабораторных и инструментальных исследований (рис. 1).

Рис. 1. Схема процесса исследования и архитектура модели прогноза.

ИБС — ишемическая болезнь сердца; АД — артериальное давление; ИМ — инфаркт миокарда; ОНМК — острое нарушение мозгового кровообращения.

Перед анализом данных мы подвергли датасет очистке. В первую очередь исключили переменные с количеством пропущенных значений ≥50% — 36 (18,8%) переменных. Такая операция произведена с целью минимизации возникновения потенциальной ошибки при обучении, поскольку при использовании переменных со столь высокой долей пропущенных значений модель может продемонстрировать неадекватные значения на выходе. В данном случае мы не использовали восстановление пропущенных значений, поскольку при отсутствии большей части данных (более 50%) восстановленные значения будут иррелевантны и также приведут к снижению качества прогностических моделей.

Среди некоторых переменных встречаются аномальные значения. Проведя анализ, мы нашли 0,06% девиаций. Поскольку величина оказалась небольшой, данные значения удалены.

Затем мы произвели операцию восстановления среди переменных с количеством пропущенных значений <50% — 155 (81,2%) переменных.

В качестве алгоритма восстановления пропущенных значений выбран способ IterativeImputer, включенный в пакет sklearn.impute языка программирования Python. Этот метод восстанавливает пропущенные данные, представляя каждый пропущенный признак как функцию других признаков с использованием алгоритма Round-robin.

Такой метод восстановления пропущенных значений выбран в связи с особенностями датасета и, в частности, специфики пропущенных значений-признаков, поскольку поле, пропущенное в одной строке, не обязательно коррелирует со значением поля другой строки, сходной по другим параметрам.

Благодаря использованию данного алгоритма нам удалось восстановить до 46% пропущенных значений.

Для тестирования модели мы использовали алгоритм GridSearchCV из пакета sklearn.model_selection, который реализует метод кросс-валидации (CV) на 5 фолдах (5`-fold cross-validation).

Для оценки эффективности моделей прогноза мы использовали показатели ROC-анализа (ROC — Receiver Operating Characteristic (рабочая характеристика приемника). Результатом этого анализа служит метрика CV-AUC — Area Under the Curve (площадь под кривой), которая позволяет оценить качество классификации. Этот показатель высчитывался на cross-validation выборке.

Статистическая обработка данных проведена с использованием прикладных программ Microsoft Excel 2021 и IBM SPSS Statistics 26.

Результаты

Как видно из табл. 1, в Самарской когорте наилучшее качество дискриминации показал ExtraTreesClassifier, наихудший результат продемонстрировал алгоритм LGBMClassifier. Более высокие показатели CV-AUC деревьев решений по сравнению с градиентным бустингом в данной ситуации можно объяснить тем, что бустинг базируется на высоком смещении (high bias) и низкой дисперсии (low variance). Деревья решений, напротив, некоррелированы и базируются на низком смещении и высокой дисперсии. Они решают задачу снижения ошибки за счет уменьшения дисперсии, но не за счет уменьшения смещения. Таким образом, ссылаясь на специфику данной выборки (датасета), мы получили представленные результаты.

Таблица 1. Показатели ROC-анализа пяти алгоритмов для Самарской и Кыргызской когорт

Алгоритм

AUC

Стандартная ошибка

p

Асимптотический 95% ДИ

нижняя граница

верхняя граница

Самарская когорта:

RandomForestClassifier

0,596

0,022

0,000

0,553

0,638

GradientBoostingClassifier

0,595

0,021

0,000

0,554

0,636

ExtraTreesClassifier*

0,603

0,021

0,000

0,561

0,645

XGBClassifier

0,596

0,022

0,000

0,553

0,639

LGBMClassifier

0,59

0,021

0,000

0,55

0,631

Кыргызская когорта:

RandomForestClassifier

0,798

0,015

0,000

0,77

0,827

GradientBoostingClassifier*

0,806

0,014

0,000

0,777

0,834

ExtraTreesClassifier

0,797

0,015

0,000

0,769

0,826

XGBClassifier

0,804

0,014

0,000

0,775

0,832

LGBMClassifier

0,8

0,015

0,000

0,772

0,829

Примечание. Здесь и в табл. 2: * — наилучший алгоритм; ДИ — доверительный интервал.

Для Кыргызской когорты наилучший показатель пришелся на GradientBoostingClassifier, наихудший — на ExtraTreesClassifier.

Низкие результаты дискриминации, полученные на данных Самарской когорты, можно объяснить тем, что классы в данном датасете были имбалансны с большим количеством пропущенных значений. Для устранения этой ошибки мы использовали функцию upsampling для генерации искусственно созданных переменных на базе имеющихся. В таком случае нам удалось добиться роста показателя CV-AUC от 0,85 у LGBMClassifier до 0,97 у ExtraTreesClassifier. Однако нами принято решение не включать этот эксперимент в итоговый результат, поскольку вывод будет формироваться на основе использования исключительно искусственно сгенерированных данных, то есть такой вывод не будет являться репрезентативным.

В силу отсутствия статистически значимых различий во влиянии национальной принадлежности на зависимую переменную решено объединить исследуемые когорты в один датасет для получения наиболее репрезентативных результатов прогноза. Как видно из табл. 2, наиболее эффективным оказался алгоритм GradientBoostingClassifier. Наихудший результат продемонстрировал ExtraTreesClassifier.

Таблица 2. Показатели ROC-анализа пяти алгоритмов для всей когорты «Интерэпид»

Алгоритм

AUC

Стандартная ошибка

p

Асимптотический 95% ДИ

нижняя граница

верхняя граница

RandomForestClassifier

0,737

0,012

0,000

0,714

0,76

GradientBoostingClassifier*

0,75

0,012

0,000

0,728

0,773

ExtraTreesClassifier

0,731

0,012

0,000

0,708

0,753

XGBClassifier

0,742

0,012

0,000

0,719

0,766

LGBMClassifier

0,738

0,012

0,000

0,714

0,761

Для оценки наличия мультиколлинеарности датасета мы рассчитали VIF (variance inflation factor) с помощью statsmodels.stats.outliers_influence import variance_inflation_factor. VIF >10 наблюдался у 103 (66%) переменных. При итеративном исключении предикторов с данным значением средний CV-AUC снизился до 0,62. Данный факт говорит о необходимости наличия более качественных искомых данных для проведения дальнейших исследований.

Для наилучшего алгоритма мы провели ранжирование ФР по степени их влияния на результат с помощью двух методов permutation importance и feature importance. Как видно на рис. 2, наиболее значимым показателем был возраст независимо от метода анализа. На втором и третьем местах оказались уровень С-реактивного белка и факт потребления животного жира, при этом такие традиционные ФР, как пол и статус курения, не попали в первые 30 факторов, а показатель сАД оказался на 24-м месте. Следует отметить, что 80% ФР совпадали в двух методах анализа и различались только степенью их влияния на результат.

Рис. 2. Ранжирование первых 10 переменных по их вкладу в прогноз модели GradientBoostingClassifier с помощью permutation и feature importances.

ОХС — общий холестерин плазмы крови; ФЖЕЛ — форсированная жизненная емкость легких; ЛПВП — липопротеины высокой плотности. Темно-серым цветом выделены общие предикторы для двух методов оценки.

Данные показатели повышают актуальность дальнейшего изучения влияния новых ФР и их вклада в развитие ССЗ.

Обсуждение

В аналогичных работах отечественных ученых продемонстрированы разные результаты. В работе А.О. Мырзаматовой и соавт. проведена оценка прогностической значимости ФР в развитии летальных исходов от ССЗ за 7-летний период наблюдения [15]. Анализ проведен с помощью величины относительного риска (RR) на основе данных исследования «Интерэпид». В Самарской когорте ФР по значимости распределились следующим образом: у мужчин — курение, артериальная гипертензия (АГ), избыточное потребление соли; у женщин — АГ, низкая физическая активность, избыточное потребление соли (p<0,05). В когорте Кыргызской Республики: у мужчин — курение, АГ, избыточное потребление животного жира; у женщин — ожирение, АГ, низкая физическая активность.

Ранее на основании данных того же исследования А.В. Концевой и соавт. в течение 3,9 года наблюдения также достоверно удалось оценить прогностическое значение некоторых факторов в отношении их влияния на риск развития неблагоприятных сердечно-сосудистых исходов. Таковыми являлись курение у мужчин в обеих когортах и избыточное потребление животного жира в Кыргызской когорте [16]. Из результатов исследований, полученных на той же базе данных, следует, что общим ФР для двух методов анализа стал факт избыточного потребления животного жира. Комбинации других наиболее значимых ФР различаются.

Н.Г. Плехова и соавт. использовали ИНС прямого распространения из 5 слоев в качестве инструмента прогноза развития ССЗ у здоровых людей. Исследователи получили показатель AUC 0,97, что на 21% выше нашего наилучшего показателя. Авторы использовали 23 предиктора. Выборка содержала записи о 467 участниках исследования, жителях Владивостока. Работа проведена в рамках многоцентровой наблюдательной Российской программы «Эпидемиология сердечно-сосудистых заболеваний (ESSE-RF)» в Приморском крае. Средний возраст участников составил 44,5 года. Можно предположить, что такие высокие результаты прогноза объясняются переобучением ИНС на малом объеме выборки [17].

А.В. Гусев и соавт. также использовали ИНС прямого распространения из 5 слоев. Временной лаг прогноза ССЗ составлял 10 лет. В модель введены следующие независимые переменные: возраст, пол, индекс массы тела, показатели АД, наличие или отсутствие сахарного диабета и т.д. Выборка насчитывала записи о 2236 собственных наблюдениях. Средний возраст — 62,5 года. Итоговый алгоритм протестирован на 25% от исходной выборки, AUC составил 0,84 [11], что в среднем соответствует полученным нами результатам.

А.Д. Соболева и О.Ю. Сабинин в своем исследовании для прогноза ССЗ применили технологию Oracle Data Mining с включением аналогичных предикторов. В работе использовали три датасета: 10 тыс. записей Фрамингемского исследования сердца, 303 записи Heart Disease и набор данных хакатона AgeHack — 100 тыс. записей (искусственно созданных). Показатели ROC-анализа варьировали от 0,73 до 0,87 [18].

В ранее проведенной нами работе мы уже использовали такие методы ИИ, как случайный лес и градиентный бустинг. В качестве ФР мы включали 8 предикторов. Выборка содержала записи о 800 участниках. Показатели AUC составили 0,82—0,97 [19].

Результаты зарубежных работ также разнятся по результатам эффективности.

J.O.R. Kim и соавт. в своем исследовании использовали 10 видов машинного обучения (extreme GB, GB, RF и т.д.). В качестве предикторов выбраны общепринятые ФР. Число участников 4699 из National Health Insurance Corporation (NHIC), пациенты старше 45 лет. Наиболее эффективными алгоритмами стали экстремальный градиентный бустинг и просто градиентный бустинг. AUC — 0,79—0,82 [20]. Использование аналогичных алгоритмов в нашей работе также продемонстрировало схожие результаты.

A. Ward и соавт. использовали 4 алгоритма ИИ в прогнозе атеросклеротических заболеваний. Число участников — 262 923 (Northern California), число предикторов — 1175:559 по приему лекарств, 146 лабораторных показателей, 279 классов диагностики CCS, 156 — данные семейного анамнеза, 7 — социально-экономические характеристики и т.д. Тестирование модели проводилось методом кросс-валидации на пяти фолдах. Показатель AUC составил 0,85 [21].

A. Jamthikar и соавт. использовали метод опорных векторов для прогноза 10-летнего ССР. Исходная выборка содержала данные 202 записей из Ohashi Medical Center, Toho University, Япония. Методом тестирования также выбрана кросс-валидация на 10 фолдах. AUC — 0,88 [22].

J.A. Quesada и соавт. в своем исследовании использовали 16 методов машинного обучения для оценки ССР. Когорта участников насчитывала 38 527 человек из Spanish ESCARVAL RISK clinical practice cohort. Валидация проводилась на 30% от исходной выборки. Величина AUC составила 0,70. Наилучшие результаты продемонстрировали квадратичный дискриминантный анализ, ИНС прямого распространения и наивный байесовский классификатор. Эти результаты также подтверждают лучшую эффективность использования нелинейных методов анализа данных [23].

R. Poplin и соавт. применили методы глубокого обучения для прогноза ССЗ в течение 5 лет. В отличие от других исследователей в качестве датасета для обучения авторы использовали изображения сетчатки глаза — 284 335 из UK Biobank и EyePACS. Валидация проведена на независимых выборках. Показатели ROC-анализа варьировали от 0,66 до 0,73 [24], что несколько ниже по сравнению с нашими результатами и результатами аналогичных исследований на табличных данных.

R. Nakanishi и соавт. использовали алгоритм LogitBoost для прогноза 10-летней смертности от ИБС и других ССЗ. Выборка насчитывала 66 636 участников. Тестирование проводилось методом кросс-валидации на 10 фолдах. AUC — 0,82—0,86 [25]. Несмотря на значительный объем выборки, результаты работы классификатора сопоставимы со средними среди всех исследований, включая наше.

E. Eisenberg и соавт. также использовали метод глубокого обучения. Число человек в выборке — 2068 из EISNER trial. Средний возраст участников составил 62,5 года. AUC — 0,76 [26]. F. Commandeur и соавт. применили экстремальный градиентный бустинг для прогноза долгосрочного риска развития инфаркта миокарда и сердечно-сосудистой смерти. В анализ включено 22 предиктора. Когорта содержала 1912 участников из EISNER. Метод тестирования — кросс-валидация на 10 фолдах. AUC — 0,82 [27]. A. Jamthikar и соавт. использовали метод случайного леса для оценки ССР. В модель включено 47 ФР. Объем выборки был небольшим — 202 человека из Toho University, Япония. Тестирование также проведено с помощью кросс-валидации на 10 фолдах. Показатель AUC составил 0,80 [22].

Заключение

В результате исследования нам удалось сконструировать алгоритм прогноза наступления сердечно-сосудистых событий с относительно хорошим качеством дискриминации. По результатам аналогичных работ среднее значение показателей AUC составило 0,81, что лишь на немного выше нашего наилучшего показателя. Таким образом, полученные нами результаты свидетельствуют о корректности применения разработанного алгоритма на российской популяции. Для улучшения качества детерминации необходимо увеличивать объем выборки, повышать качество данных и тщательно подбирать некоррелирующие предикторы.

Нам удалось выделить наиболее весомые факторы риска развития сердечно-сосудистых заболеваний, которые ранее не учитывались в построении прогнозов. Таким образом, дальнейшие исследования и разработки в сфере использования искусственного интеллекта в медицине помогут повысить качество ранней диагностики и улучшить профилактику развития сердечно-сосудистых заболеваний.

Участие авторов: концепция и дизайн исследования — И.А. Мишкин, А.В. Концевая, А.В. Гусев, А.А. Сахаров, О.М. Драпкина; сбор и обработка материала — И.А. Мишкин, А.В. Концевая, А.В. Гусев, А.А. Сахаров; статистический анализ данных — И.А. Мишкин, А.В. Гусев, А.А. Сахаров; написание текста — И.А. Мишкин, А.В. Концевая, А.В. Гусев, А.А. Сахаров, О.М. Драпкина; редактирование — А.В. Концевая, А.В. Гусев.

Авторы заявляют об отсутствии конфликта интересов.

Подтверждение e-mail

На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.

Подтверждение e-mail



Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.