Разработка и тестирование новых методических подходов прогнозирования сердечно-сосудистых событий у здоровых людей с использованием технологии машинного обучения на базе международного исследования «Интерэпид»

Читать метаданные

В 2023 г. сердечно-сосудистые заболевания оставались основной причиной смерти во всем мире. С целью снижения бремени этой патологии ключевым вектором развития современной медицины является профилактика. На сегодняшний день основными инструментами мониторинга являются шкалы оценки абсолютного и относительного сердечно-сосудистого риска. Однако в связи с развитием информационных технологий все больше исследователей рассматривают использование технологий искусственного интеллекта для прогноза болезней сердца.

ЦЕЛЬ ИССЛЕДОВАНИЯ

Разработать и выполнить тестирование новых методических подходов прогнозирования сердечно-сосудистых событий у здоровых людей с использованием технологий искусственного интеллекта.

МАТЕРИАЛ И МЕТОДЫ

Работа выполнена на основе данных международного исследования «Интерэпид». Состав выборки: 2392 участников, прошедших наблюдение в течение 4 лет, из них 1022 (42,7%) мужчины, 1369 (57,2%) женщин. В анализ включен 191 предиктор. Для создания моделей прогноза мы использовали 5 алгоритмов классификации на среде программирования Python: RandomForestClassifier, GradientBoostingClassifier, ExtraTreesClassifier, XGBClassifier, LGBMClassifier. Для оценки эффективности моделей прогноза использовали ROC-анализ.

РЕЗУЛЬТАТЫ

Наиболее эффективным алгоритмом оказался GradientBoostingClassifier с AUC-0,76. Наихудший результат продемонстрировал ExtraTreesClassifier с AUC-0,68. Наиболее значимыми факторами риска стали возраст, уровень С-реактивного белка в крови и факт потребления животного жира.

ЗАКЛЮЧЕНИЕ

В результате исследования нам удалось получить алгоритм прогноза с относительно хорошим качеством дискриминации. Для совершенствования данной разработки необходимо проведение дальнейших исследований на больших объемах данных.

Ключевые слова:

сердечно-сосудистый риск

искусственный интеллект

машинное обучение

прогноз сердечно-сосудистых заболеваний

болезни системы кровообращения

Авторы:

Мишкин И.А.

ФГБУ «Национальный медицинский исследовательский центр терапии и профилактической медицины» Минздрава России;
ГУЗ Тульской области «Киреевская центральная районная больница»

ORCID: 0000-0003-4850-0648

Концевая А.В.

ФГБУ «Национальный медицинский исследовательский центр терапии и профилактической медицины» Минздрава России

SPIN РИНЦ: 6787-2500
Scopus AuthorID: 55672262900
ORCID: 0000-0003-2062-1536

Гусев А.В.

ФГБУ «Центральный научно-исследовательский институт организации и информатизации здравоохранения» Минздрава России;
ООО «К-СКАЙ»

SPIN РИНЦ: 168742
Scopus AuthorID: 57222273391
ResearcherID: AAD-2073-2019
ORCID: 0000-0002-7380-8460

Сахаров А.А.

ПАО «Группа Ренессанс Страхование»

Драпкина О.М.

ФГБУ «Национальный медицинский исследовательский центр терапии и профилактической медицины» Минздрава России;
ФГБОУ ВО «Московский государственный медико-стоматологический университет им. А.И. Евдокимова» Минздрава России

SPIN РИНЦ: 4456-1297
Scopus AuthorID: 57208852308
ResearcherID: G-8443-2016
ORCID: 0000-0002-4453-8430

Дата поступления:

13.07.2023

Дата принятия в печать:

21.09.2023

Список литературы:

WHO. About Cardiovascular Diseases. Accessed January 07, 2024. https://www.who.int/home/cms-decommissioning
Roth GA, Forouzanfar MH, Moran AE, et al. Demographic and epidemiologic drivers of global cardiovascular mortality. The New England Journal of Medicine. 2015;372(14):1333-1341. https://doi.org/10.1056/NEJMoa1406656
Заболеваемость населения по основным классам болезней в 2000—2021 гг. Данные Минздрава России, расчет Росстата. Ссылка активна на 07.01.24. https://rosstat.gov.ru/storage/mediabank/zdr2-1.xls
Умершие по основным классам причин смерти. Росстат. Ссылка активна на 07.01.24. https://rosstat.gov.ru/free_doc/new_site/population/demo/dem4_bd.htm
Гусев А.В., Кузнецова Т.Ю., Корсаков И.Н. Искусственный интеллект в оценке рисков развития сердечно-сосудистых заболеваний. Журнал телемедицины и электронного здравоохранения. 2018;3(8):85-90.
Указ Президента Российской Федерации от 07.05.2018 г. №204 «О национальных целях и стратегических задачах развития Российской Федерации на период до 2024 года». Ссылка активна на 07.01.24. https://www.kremlin.ru/acts/bank/43027
Организация проведения профилактического медицинского осмотра и диспансеризации определенных групп взрослого населения. Методические рекомендации по практической реализации приказа Минздрава России от 13 марта 2019 г. №124н «Об утверждении порядка проведения профилактического медицинского осмотра и диспансеризации определенных групп взрослого населения». М. 2019. Ссылка активна на 07.01.24. https://www.garant.ru/products/ipo/prime/doc/72936994/?ysclid=lrki1cvfcr815460192
Белялов Ф.И. Прогнозирование и шкалы в медицине. 3-е изд., перераб. и доп. М.: МЕДпресс-информ; 2020.
Conroy RM, Pyörälä K, Fitzgerald AP, et al. Estimation of ten-year risk of fatal cardiovascular disease in Europe: the SCORE project. European Heart Journal. 2003;24(11):987-1003. https://doi.org/10.1016/s0195-668x(03)00114-3
SCORE2 working group and ESC Cardiovascular risk collaboration. SCORE2 risk prediction algorithms: new models to estimate 10-year risk of cardiovascular disease in Europe. European Heart Journal. 2021;42(25): 2439-2454. https://doi.org/10.1093/eurheartj/ehab309
Гусев А.В., Гаврилов Д.В., Корсаков И.Н. и др. Перспективы использования методов машинного обучения для предсказания сердечно-сосудистых заболеваний. Врач и информационные технологии. 2019; (3):41-47.
Zhang Y, Guo SL, Han LN, Li TL. Application and Exploration of Big Data Mining in Clinical Medicine. Chinese Medical Journal. 2016;129(6): 731-738. https://doi.org/10.4103/0366-6999.178019
Brink H. Real-world Machine Learning. Shelter Island, NY: Manning Publications Co.; 2017.
Мишкин И.А., Концевая А.В., Гусев А.В., Драпкина О.М. Прогнозирование сердечно-сосудистых событий с помощью моделей пропорциональных рисков и моделей машинного обучения: систематический обзор. Современные проблемы здравоохранения и медицинской статистики. 2023;(2):804-829.
Мырзаматова А.О., Концевая А.В., Полупанов А.Г. и др. Результаты 7-летнего проспективного наблюдения в исследовании ИНТЕРЭПИД: факторы, влияющие на общую и сердечно-сосудистую смертность сельских жителей России и Кыргызской Республики. Российский кардиологический журнал. 2022;27(5):38-48. https://doi.org/10.15829/1560-4071-2022-4999
Концевая А.В., Мырзаматова А.О., Халматов А.Н. и др. Результаты 4-летнего проспективного наблюдения в исследовании Интерэпид: факторы, влияющие на заболеваемость и смертность популяции в сельских регионах России и Кыргызской Республики. Кардиоваскулярная терапия и профилактика. 2018;17(2):49-56. https://doi.org/10.15829/1728-8800-2018-2-49-56
Плехова Н.Г., Невзорова В.А., Черненко И.Н. и др. Прогнозирование исходов и рисков сердечно-сосудистых заболеваний с применением машинного обучения. Современные достижения химико-биологических наук в профилактической и клинической медицине: Сборник научных трудов Всероссийской научно-практической конференции с международным участием, Санкт-Петербург, 03 декабря 2020 года. Под ред. Силина А.В., Гайковой Л.Б. СПб.: Северо-Западный государственный медицинский университет им. И.И. Мечникова; 2020;305-309.
Соболева А.Д., Сабинин О.Ю. Метод композиции алгоритмов машинного обучения на основе Oracle data mining для прогнозирования сердечно-сосудистых заболеваний. Машинное обучение в исследованиях медико-биологических и социально-экономических данных: Сборник научных трудов. Под ред. Найденовой К.А., Швецова К.В., Яковлева А.В., Пархоменко В.А. СПб.: Федеральное государственное автономное образовательное учреждение высшего образования «Санкт-Петербургский политехнический университет Петра Великого»; 2020;123-162. https://doi.org/10.18720/SPBPU/2/id20-63
Мишкин И.А., Сахаров А.А. Изучение использования алгоритмов машинного обучения в оценке риска развития сердечно-сосудистых заболеваний. Инновации. Наука. Образование. 2020;17:187-202.
Kim JOR, Jeong YS, Kim JH, et al. Machine Learning-Based Cardiovascular Disease Prediction Model: A Cohort Study on the Korean National Health Insurance Service Health Screening Database. Diagnostics. 2021; 11(6):943. https://doi.org/10.3390/diagnostics11060943
Ward A, Sarraju A, Chung S, et al. Machine learning and atherosclerotic cardiovascular disease risk prediction in a multi-ethnic population. NPJ Digital Medicine. 2020;3:125. https://doi.org/10.1038/s41746-020-00331-1
Jamthikar A, Gupta D, Khanna NN, et al. A low-cost machine learning-based cardiovascular/stroke risk assessment system: integration of conventional factors with image phenotypes. Cardiovascular Diagnosis and Therapy. 2019;9(5):420-430. https://doi.org/10.21037/cdt.2019.09.03
Quesada JA, Lopez-Pineda A, Gil-Guillén VF, et al. Machine learning to predict cardiovascular risk. International Journal of Clinical Practice. 2019; 73(10):e13389. https://doi.org/10.1111/ijcp.13389
Poplin R, Varadarajan AV, Blumer K, et al. Prediction of cardiovascular risk factors from retinal fundus photographs via deep learning. Nature Biomedical Engineering. 2018;2(3):158-164. https://doi.org/10.1038/s41551-018-0195-0
Nakanishi R, Slomka PJ, Rios R, et al. Machine Learning Adds to Clinical and CAC Assessments in Predicting 10-Year CHD and CVD Deaths. JACC. Cardiovascular Imaging. 2021;14(3):615-625. https://doi.org/10.1016/j.jcmg.2020.08.024
Eisenberg E, McElhinney PA, Commandeur F, et al. Deep Learning-Based Quantification of Epicardial Adipose Tissue Volume and Attenuation Predicts Major Adverse Cardiovascular Events in Asymptomatic Subjects. Circulation. Cardiovascular Imaging. 2020;13(2):e009829. https://doi.org/10.1161/CIRCIMAGING.119.009829
Commandeur F, Slomka PJ, Goeller M, et al. Machine learning to predict the long-term risk of myocardial infarction and cardiac death based on clinical risk, coronary calcium, and epicardial adipose tissue: a prospective study. Cardiovascular Research. 2020;116(14):2216-2225. https://doi.org/10.1093/cvr/cvz321

Закрыть метаданные

Введение

В 2023 г. сердечно-сосудистые заболевания (ССЗ) остаются основной причиной смерти в развитых странах мира [1]. По прогнозам Всемирной организации здравоохранения, тенденция общемирового старения населения планеты и увеличение средней продолжительности жизни приведет к росту числа этих заболеваний [2]. В Российской Федерации заболеваемость ССЗ на 2021 г. оценивалась в 3050 случаев на 100 тыс. человек [3]. Число умерших от ССЗ-патологии в течение года составило 933 986 человек [4].

Ключевым вектором развития современной медицины является профилактика [5]. Реализация этой концепции поможет уменьшить число случаев преждевременной смерти, снизить распространенность ССЗ среди лиц трудоспособного возраста, что в результате приведет к увеличению средней продолжительности жизни граждан. Данная цель соответствует утвержденному национальному проекту «Здравоохранение», согласно которому к 2025 г. необходимо добиться повышения средней продолжительности жизни до 76 лет, а к 2030 г. — до 80 лет [6].

На сегодняшний день основной концепцией профилактики ССЗ является оценка сердечно-сосудистого риска (ССР) [7]. Для стран европейского региона, включая Россию, разработаны шкалы оценки относительного и абсолютного ССР. Чаще всего используются шкала SCORE и внедряемая в последнее время шкала SCORE2 [8]. Механизм работы данных шкал базируется на показателях традиционных факторов риска (ФР), таких как уровень общего холестерина плазмы крови (ОХС), значений систолического артериального давления (сАД), возраста, пола, статуса курения. Математические алгоритмы этих шкал основаны на модели пропорциональных рисков (Cox-регрессии) [9, 10].

В связи с этим данные шкалы имеют некоторые недостатки:

— необходимость адаптации под конкретную популяцию;

— устарелость данных исследований, на которых базируются шкалы;

— линейность алгоритмов статистической обработки данных;

— невозможность обработки большого количества данных об изменениях в организме пациента в реальном времени;

— использование ограниченного набора ФР и необходимость ручного вычисления значений риска при использовании бумажных версий шкал;

— неадекватность оценки риска у пациентов различного возраста;

— неточность детерминации пациентов по уровню сердечно-сосудистого риска;

— невысокие показатели ROC-анализа.

В связи с развитием информационных технологий активно исследуется тема применения технологий искусственного интеллекта (ИИ) в сфере здравоохранения [11]. Использование более мощных вычислительных моделей позволяет включить в анализ большее число предикторов, а нелинейные методы анализа биологической информации позволяют находить скрытые взаимосвязи между ФР [12].

В медицине в качестве инструмента прогноза ИИ решает задачу классификации. В отличие от традиционных шкал алгоритмы ИИ не программируются в привычном понимании, а обучаются на наборе данных. На выходе мы получаем процент вероятности (от 0 до 100) принадлежности анализируемого объекта к той или иной категории.

Анализ табличных данных наиболее часто производится с помощью таких алгоритмов ИИ, как градиентный бустинг, деревья решений, случайный лес, метод опорных векторов, байесовский классификатор и т.д. Перечисленные методы хорошо справляются с обработкой табличных значений, поскольку в меньшей степени склонны к переобучению на небольших выборках [13—15].

Цель исследования — разработать и выполнить тестирование новых методических подходов прогнозирования сердечно-сосудистых событий у здоровых людей с использованием технологий искусственного интеллекта.

Материал и методы

Работа выполнена на основании данных международного исследования «Интерэпид», проведенного в 2011—2016 гг. с включением жителей поселков Стройкерамика и Смышляевка Волжского района Самарской области Российской Федерации, жителей города Кант Ысык-Атинского района и пгт Орловка Кеминского района Чуйской области Кыргызской Республики. Материалами для работы послужили Карта профилактического обследования и Форма проспективного наблюдения пациента исследования «Интерэпид». Всего выборка содержала информацию об 1050 участниках из когорты Самары (мужчины, n=447 (42,6%), средний возраст 50 лет; женщины, n=603 (57,4%), средний возраст 49,3 года) и 1341 участнике из когорты Кыргызской Республики (мужчины, n=575 (42,9%), средний возраст 40 лет; женщины, n=766 (57,1%), средний возраст 40,9 года), находившихся под медицинским наблюдением в течение 4 лет. Суммарно обе когорты насчитывали 2 391 наблюдение.

Обе когорты разделены на 2 группы: 1-я группа — пациенты, перенесшие сердечно-сосудистые события, включая фатальные исходы, от следующих заболеваний: случаи развития ишемической болезни сердца (ИБС) (МКБ 10: I20—I25) и случаи развития острого нарушения мозгового кровообращения (ОНМК) (МКБ 10: I60—I64), за период наблюдения n=253 (24,1%) для Самары и n=280 (20,9%) для Кыргызской Республики; 2-я группа: пациенты без сердечно-сосудистых событий за период наблюдения, n=797 (75,9%) для Самары и n=1061 (79,1%) для Кыргызской Республики. Фатальные и нефатальные события, вызванные не БСК, а также неизвестные исходы в процессе наблюдения в исследование не включались. Конечная точка для первых групп обозначена «1» — наступление события, для вторых групп — «0» — событие не наступило.

Для построения модели прогноза мы планировали использовать 5 наиболее подходящих алгоритмов классификации на среде программирования Python версия: 3.11.1.:

— RandomForestClassifier из пакета sklearn.ensemble — реализация алгоритма случайного леса;

— GradientBoostingClassifier из пакета sklearn.ensemble — реализация алгоритма градиентного бустинга;

— ExtraTreesClassifier из пакета sklearn.ensemble — реализация алгоритма дополнительных деревьев;

— XGBClassifier из пакета xgboost — реализация алгоритма градиентного бустинга;

— LGBMClassifier из пакета lightgbm — реализация алгоритма градиентного бустинга.

Принято решение использовать данные алгоритмы, поскольку gradient boosting и random forest наряду с глубоким обучением искусственных нейронных сетей (ИНС) входили в тройку наиболее часто используемых алгоритмов для создания прогнозов на основе табличных данных, а также имели наиболее высокую долю результатов с AUC выше 90% в проведенном нами систематическом обзоре [14]. При этом нами принято решение не использовать ИНС, поскольку на небольшом количестве записей (n=1050 и n=1341) велик риск переобучения (overfitting).

В качестве предикторов мы использовали независимые переменные (всего 191), касающиеся анамнеза, особенностей образа жизни, данных лабораторных и инструментальных исследований (рис. 1).

Рис. 1. Схема процесса исследования и архитектура модели прогноза.

ИБС — ишемическая болезнь сердца; АД — артериальное давление; ИМ — инфаркт миокарда; ОНМК — острое нарушение мозгового кровообращения.

Перед анализом данных мы подвергли датасет очистке. В первую очередь исключили переменные с количеством пропущенных значений ≥50% — 36 (18,8%) переменных. Такая операция произведена с целью минимизации возникновения потенциальной ошибки при обучении, поскольку при использовании переменных со столь высокой долей пропущенных значений модель может продемонстрировать неадекватные значения на выходе. В данном случае мы не использовали восстановление пропущенных значений, поскольку при отсутствии большей части данных (более 50%) восстановленные значения будут иррелевантны и также приведут к снижению качества прогностических моделей.

Среди некоторых переменных встречаются аномальные значения. Проведя анализ, мы нашли 0,06% девиаций. Поскольку величина оказалась небольшой, данные значения удалены.

Затем мы произвели операцию восстановления среди переменных с количеством пропущенных значений <50% — 155 (81,2%) переменных.

В качестве алгоритма восстановления пропущенных значений выбран способ IterativeImputer, включенный в пакет sklearn.impute языка программирования Python. Этот метод восстанавливает пропущенные данные, представляя каждый пропущенный признак как функцию других признаков с использованием алгоритма Round-robin.

Такой метод восстановления пропущенных значений выбран в связи с особенностями датасета и, в частности, специфики пропущенных значений-признаков, поскольку поле, пропущенное в одной строке, не обязательно коррелирует со значением поля другой строки, сходной по другим параметрам.

Благодаря использованию данного алгоритма нам удалось восстановить до 46% пропущенных значений.

Для тестирования модели мы использовали алгоритм GridSearchCV из пакета sklearn.model_selection, который реализует метод кросс-валидации (CV) на 5 фолдах (5`-fold cross-validation).

Для оценки эффективности моделей прогноза мы использовали показатели ROC-анализа (ROC — Receiver Operating Characteristic (рабочая характеристика приемника). Результатом этого анализа служит метрика CV-AUC — Area Under the Curve (площадь под кривой), которая позволяет оценить качество классификации. Этот показатель высчитывался на cross-validation выборке.

Статистическая обработка данных проведена с использованием прикладных программ Microsoft Excel 2021 и IBM SPSS Statistics 26.

Результаты

Как видно из табл. 1, в Самарской когорте наилучшее качество дискриминации показал ExtraTreesClassifier, наихудший результат продемонстрировал алгоритм LGBMClassifier. Более высокие показатели CV-AUC деревьев решений по сравнению с градиентным бустингом в данной ситуации можно объяснить тем, что бустинг базируется на высоком смещении (high bias) и низкой дисперсии (low variance). Деревья решений, напротив, некоррелированы и базируются на низком смещении и высокой дисперсии. Они решают задачу снижения ошибки за счет уменьшения дисперсии, но не за счет уменьшения смещения. Таким образом, ссылаясь на специфику данной выборки (датасета), мы получили представленные результаты.

Таблица 1. Показатели ROC-анализа пяти алгоритмов для Самарской и Кыргызской когорт

Алгоритм	AUC	Стандартная ошибка	p	Асимптотический 95% ДИ
Алгоритм	AUC	Стандартная ошибка	p	нижняя граница	верхняя граница
Самарская когорта:
RandomForestClassifier	0,596	0,022	0,000	0,553	0,638
GradientBoostingClassifier	0,595	0,021	0,000	0,554	0,636
ExtraTreesClassifier*	0,603	0,021	0,000	0,561	0,645
XGBClassifier	0,596	0,022	0,000	0,553	0,639
LGBMClassifier	0,59	0,021	0,000	0,55	0,631
Кыргызская когорта:
RandomForestClassifier	0,798	0,015	0,000	0,77	0,827
GradientBoostingClassifier*	0,806	0,014	0,000	0,777	0,834
ExtraTreesClassifier	0,797	0,015	0,000	0,769	0,826
XGBClassifier	0,804	0,014	0,000	0,775	0,832
LGBMClassifier	0,8	0,015	0,000	0,772	0,829

Примечание. Здесь и в табл. 2: * — наилучший алгоритм; ДИ — доверительный интервал.

Для Кыргызской когорты наилучший показатель пришелся на GradientBoostingClassifier, наихудший — на ExtraTreesClassifier.

Низкие результаты дискриминации, полученные на данных Самарской когорты, можно объяснить тем, что классы в данном датасете были имбалансны с большим количеством пропущенных значений. Для устранения этой ошибки мы использовали функцию upsampling для генерации искусственно созданных переменных на базе имеющихся. В таком случае нам удалось добиться роста показателя CV-AUC от 0,85 у LGBMClassifier до 0,97 у ExtraTreesClassifier. Однако нами принято решение не включать этот эксперимент в итоговый результат, поскольку вывод будет формироваться на основе использования исключительно искусственно сгенерированных данных, то есть такой вывод не будет являться репрезентативным.

В силу отсутствия статистически значимых различий во влиянии национальной принадлежности на зависимую переменную решено объединить исследуемые когорты в один датасет для получения наиболее репрезентативных результатов прогноза. Как видно из табл. 2, наиболее эффективным оказался алгоритм GradientBoostingClassifier. Наихудший результат продемонстрировал ExtraTreesClassifier.

Таблица 2. Показатели ROC-анализа пяти алгоритмов для всей когорты «Интерэпид»

Алгоритм	AUC	Стандартная ошибка	p	Асимптотический 95% ДИ
Алгоритм	AUC	Стандартная ошибка	p	нижняя граница	верхняя граница
RandomForestClassifier	0,737	0,012	0,000	0,714	0,76
GradientBoostingClassifier*	0,75	0,012	0,000	0,728	0,773
ExtraTreesClassifier	0,731	0,012	0,000	0,708	0,753
XGBClassifier	0,742	0,012	0,000	0,719	0,766
LGBMClassifier	0,738	0,012	0,000	0,714	0,761

Для оценки наличия мультиколлинеарности датасета мы рассчитали VIF (variance inflation factor) с помощью statsmodels.stats.outliers_influence import variance_inflation_factor. VIF >10 наблюдался у 103 (66%) переменных. При итеративном исключении предикторов с данным значением средний CV-AUC снизился до 0,62. Данный факт говорит о необходимости наличия более качественных искомых данных для проведения дальнейших исследований.

Для наилучшего алгоритма мы провели ранжирование ФР по степени их влияния на результат с помощью двух методов permutation importance и feature importance. Как видно на рис. 2, наиболее значимым показателем был возраст независимо от метода анализа. На втором и третьем местах оказались уровень С-реактивного белка и факт потребления животного жира, при этом такие традиционные ФР, как пол и статус курения, не попали в первые 30 факторов, а показатель сАД оказался на 24-м месте. Следует отметить, что 80% ФР совпадали в двух методах анализа и различались только степенью их влияния на результат.

Рис. 2. Ранжирование первых 10 переменных по их вкладу в прогноз модели GradientBoostingClassifier с помощью permutation и feature importances.

ОХС — общий холестерин плазмы крови; ФЖЕЛ — форсированная жизненная емкость легких; ЛПВП — липопротеины высокой плотности. Темно-серым цветом выделены общие предикторы для двух методов оценки.

Данные показатели повышают актуальность дальнейшего изучения влияния новых ФР и их вклада в развитие ССЗ.

Обсуждение

В аналогичных работах отечественных ученых продемонстрированы разные результаты. В работе А.О. Мырзаматовой и соавт. проведена оценка прогностической значимости ФР в развитии летальных исходов от ССЗ за 7-летний период наблюдения [15]. Анализ проведен с помощью величины относительного риска (RR) на основе данных исследования «Интерэпид». В Самарской когорте ФР по значимости распределились следующим образом: у мужчин — курение, артериальная гипертензия (АГ), избыточное потребление соли; у женщин — АГ, низкая физическая активность, избыточное потребление соли (p<0,05). В когорте Кыргызской Республики: у мужчин — курение, АГ, избыточное потребление животного жира; у женщин — ожирение, АГ, низкая физическая активность.

Ранее на основании данных того же исследования А.В. Концевой и соавт. в течение 3,9 года наблюдения также достоверно удалось оценить прогностическое значение некоторых факторов в отношении их влияния на риск развития неблагоприятных сердечно-сосудистых исходов. Таковыми являлись курение у мужчин в обеих когортах и избыточное потребление животного жира в Кыргызской когорте [16]. Из результатов исследований, полученных на той же базе данных, следует, что общим ФР для двух методов анализа стал факт избыточного потребления животного жира. Комбинации других наиболее значимых ФР различаются.

Н.Г. Плехова и соавт. использовали ИНС прямого распространения из 5 слоев в качестве инструмента прогноза развития ССЗ у здоровых людей. Исследователи получили показатель AUC 0,97, что на 21% выше нашего наилучшего показателя. Авторы использовали 23 предиктора. Выборка содержала записи о 467 участниках исследования, жителях Владивостока. Работа проведена в рамках многоцентровой наблюдательной Российской программы «Эпидемиология сердечно-сосудистых заболеваний (ESSE-RF)» в Приморском крае. Средний возраст участников составил 44,5 года. Можно предположить, что такие высокие результаты прогноза объясняются переобучением ИНС на малом объеме выборки [17].

А.В. Гусев и соавт. также использовали ИНС прямого распространения из 5 слоев. Временной лаг прогноза ССЗ составлял 10 лет. В модель введены следующие независимые переменные: возраст, пол, индекс массы тела, показатели АД, наличие или отсутствие сахарного диабета и т.д. Выборка насчитывала записи о 2236 собственных наблюдениях. Средний возраст — 62,5 года. Итоговый алгоритм протестирован на 25% от исходной выборки, AUC составил 0,84 [11], что в среднем соответствует полученным нами результатам.

А.Д. Соболева и О.Ю. Сабинин в своем исследовании для прогноза ССЗ применили технологию Oracle Data Mining с включением аналогичных предикторов. В работе использовали три датасета: 10 тыс. записей Фрамингемского исследования сердца, 303 записи Heart Disease и набор данных хакатона AgeHack — 100 тыс. записей (искусственно созданных). Показатели ROC-анализа варьировали от 0,73 до 0,87 [18].

В ранее проведенной нами работе мы уже использовали такие методы ИИ, как случайный лес и градиентный бустинг. В качестве ФР мы включали 8 предикторов. Выборка содержала записи о 800 участниках. Показатели AUC составили 0,82—0,97 [19].

Результаты зарубежных работ также разнятся по результатам эффективности.

J.O.R. Kim и соавт. в своем исследовании использовали 10 видов машинного обучения (extreme GB, GB, RF и т.д.). В качестве предикторов выбраны общепринятые ФР. Число участников 4699 из National Health Insurance Corporation (NHIC), пациенты старше 45 лет. Наиболее эффективными алгоритмами стали экстремальный градиентный бустинг и просто градиентный бустинг. AUC — 0,79—0,82 [20]. Использование аналогичных алгоритмов в нашей работе также продемонстрировало схожие результаты.

A. Ward и соавт. использовали 4 алгоритма ИИ в прогнозе атеросклеротических заболеваний. Число участников — 262 923 (Northern California), число предикторов — 1175:559 по приему лекарств, 146 лабораторных показателей, 279 классов диагностики CCS, 156 — данные семейного анамнеза, 7 — социально-экономические характеристики и т.д. Тестирование модели проводилось методом кросс-валидации на пяти фолдах. Показатель AUC составил 0,85 [21].

A. Jamthikar и соавт. использовали метод опорных векторов для прогноза 10-летнего ССР. Исходная выборка содержала данные 202 записей из Ohashi Medical Center, Toho University, Япония. Методом тестирования также выбрана кросс-валидация на 10 фолдах. AUC — 0,88 [22].

J.A. Quesada и соавт. в своем исследовании использовали 16 методов машинного обучения для оценки ССР. Когорта участников насчитывала 38 527 человек из Spanish ESCARVAL RISK clinical practice cohort. Валидация проводилась на 30% от исходной выборки. Величина AUC составила 0,70. Наилучшие результаты продемонстрировали квадратичный дискриминантный анализ, ИНС прямого распространения и наивный байесовский классификатор. Эти результаты также подтверждают лучшую эффективность использования нелинейных методов анализа данных [23].

R. Poplin и соавт. применили методы глубокого обучения для прогноза ССЗ в течение 5 лет. В отличие от других исследователей в качестве датасета для обучения авторы использовали изображения сетчатки глаза — 284 335 из UK Biobank и EyePACS. Валидация проведена на независимых выборках. Показатели ROC-анализа варьировали от 0,66 до 0,73 [24], что несколько ниже по сравнению с нашими результатами и результатами аналогичных исследований на табличных данных.

R. Nakanishi и соавт. использовали алгоритм LogitBoost для прогноза 10-летней смертности от ИБС и других ССЗ. Выборка насчитывала 66 636 участников. Тестирование проводилось методом кросс-валидации на 10 фолдах. AUC — 0,82—0,86 [25]. Несмотря на значительный объем выборки, результаты работы классификатора сопоставимы со средними среди всех исследований, включая наше.

E. Eisenberg и соавт. также использовали метод глубокого обучения. Число человек в выборке — 2068 из EISNER trial. Средний возраст участников составил 62,5 года. AUC — 0,76 [26]. F. Commandeur и соавт. применили экстремальный градиентный бустинг для прогноза долгосрочного риска развития инфаркта миокарда и сердечно-сосудистой смерти. В анализ включено 22 предиктора. Когорта содержала 1912 участников из EISNER. Метод тестирования — кросс-валидация на 10 фолдах. AUC — 0,82 [27]. A. Jamthikar и соавт. использовали метод случайного леса для оценки ССР. В модель включено 47 ФР. Объем выборки был небольшим — 202 человека из Toho University, Япония. Тестирование также проведено с помощью кросс-валидации на 10 фолдах. Показатель AUC составил 0,80 [22].

Заключение

В результате исследования нам удалось сконструировать алгоритм прогноза наступления сердечно-сосудистых событий с относительно хорошим качеством дискриминации. По результатам аналогичных работ среднее значение показателей AUC составило 0,81, что лишь на немного выше нашего наилучшего показателя. Таким образом, полученные нами результаты свидетельствуют о корректности применения разработанного алгоритма на российской популяции. Для улучшения качества детерминации необходимо увеличивать объем выборки, повышать качество данных и тщательно подбирать некоррелирующие предикторы.

Нам удалось выделить наиболее весомые факторы риска развития сердечно-сосудистых заболеваний, которые ранее не учитывались в построении прогнозов. Таким образом, дальнейшие исследования и разработки в сфере использования искусственного интеллекта в медицине помогут повысить качество ранней диагностики и улучшить профилактику развития сердечно-сосудистых заболеваний.

Участие авторов: концепция и дизайн исследования — И.А. Мишкин, А.В. Концевая, А.В. Гусев, А.А. Сахаров, О.М. Драпкина; сбор и обработка материала — И.А. Мишкин, А.В. Концевая, А.В. Гусев, А.А. Сахаров; статистический анализ данных — И.А. Мишкин, А.В. Гусев, А.А. Сахаров; написание текста — И.А. Мишкин, А.В. Концевая, А.В. Гусев, А.А. Сахаров, О.М. Драпкина; редактирование — А.В. Концевая, А.В. Гусев.

Авторы заявляют об отсутствии конфликта интересов.