Введение
Рак молочной железы является самым распространенным онкологическим заболеванием у женщин и главной причиной летальности женщин от онкологических заболеваний [1, 2]. Одним из основных методов снижения смертности является выявление злокачественных новообразований молочной железы на ранних стадиях. В связи с этим во многих странах мира реализуются программы скрининга с помощью маммографии [3, 4].
В рамках приказа Минздрава России от 13.03.19 №124н [5] и в соответствии с методическими рекомендациями Минздрава России и Департамента здравоохранения Москвы [6, 7] с целью повышения точности выявления злокачественных новообразований молочной железы необходимо применять двойное чтение при анализе и интерпретации результатов маммографических исследований. Двойное чтение эффективно и увеличивает количество выявленных случаев рака молочной железы на ранних этапах, однако повышается рабочая нагрузка на врачей-рентгенологов [8].
Для оптимизации проведения двойного чтения применяются методы автоматического анализа маммографических изображений с помощью CAD-систем и алгоритмов компьютерного зрения [9]. Однако, по результатам крупного исследования, проведенного в США, CAD-системы не позволили улучшить чувствительность и специфичность выявления злокачественных новообразований молочной железы при сравнении с двойным чтением врачами-рентгенологами [10]. В исследовании С.П. Морозова и соавт. продемонстрировано, что применение алгоритма искусственного интеллекта (ИИ) позволяет сократить длительность описания маммографических исследований на 15—50% [11].
Алгоритмы компьютерного зрения все чаще применяются в лучевой диагностике, в том числе в маммографии [12—15]. Популяризация среди женщин скрининга рака молочной железы с помощью маммографии и ежегодный рост количества маммографических исследований приводят к повышению нагрузки на систему здравоохранения. В условиях кадрового дефицита требуется поиск новых решений и технологий, позволяющих оптимизировать ресурсы и рабочую нагрузку на врачей-рентгенологов.
Цель исследования — оценить влияние применения алгоритма ИИ на длительность проведения двойного чтения скрининговых маммографических исследований в медицинских организациях, оказывающих первичную медико-санитарную помощь.
Материал и методы
Ретроспективное исследование проведено на базе Московского референс-центра лучевой диагностики (ГБУЗ «НПКЦ ДиТ ДЗМ», telemedai.ru) в рамках Московского эксперимента по использованию инновационных технологий в области компьютерного зрения для анализа медицинских изображений и дальнейшего применения в системе здравоохранения города Москвы (mosmed.ai) (далее — Эксперимент) [16].
В исследовании приняли участие 12 врачей-рентгенологов, специализирующихся на описании маммографических исследований. Просмотр маммограмм и подготовка описаний исследований проведены в Едином радиологическом информационном сервисе Единой медицинской информационно-аналитической системы города Москвы (ЕРИС ЕМИАС) [17].
Исследовались два сценария двойного чтения маммограмм. В I сценарии двойное чтение проводилось врачами-рентгенологами, во II — первое чтение проводилось алгоритмом компьютерного зрения, основанном на технологии ИИ, а второе — врачом-рентгенологом. Для I сценария анализировались данные из ЕРИС ЕМИАС за период февраль—март 2021 г., для II — июнь—август 2023 г.
Для хронометражного исследования проведена оценка длительности подготовки протоколов маммографических исследований. В ЕРИС ЕМИАС фиксируются дата и время следующих событий: проведение маммографического исследования, начало работы врача-рентгенолога с диагностическим исследованием, визирование протокола исследования; отправка исследования алгоритму ИИ, получение результатов работы от алгоритма ИИ.
В обоих сценариях для определения длительности проведения двойного чтения использовалась арифметическая разница между временем визирования последнего протокола и временем загрузки маммографического исследования в ЕРИС ЕМИАС.
Критерии включения. Для обоих сценариев: профилактические маммографические исследования женщин, проведенные в медицинских организациях Департамента здравоохранения города Москвы, оказывающих первичную медико-санитарную помощь, возраст от 35 до 95 лет. Для II сценария: профилактические маммографические исследования, проанализированные алгоритмом ИИ.
Критерии исключения. Для обоих сценариев: профилактические маммографические исследования, длительность описания которых составляла менее 10 с или превышала 1 ч. Исследования, длительность двойного чтения которых составила более 7 сут.
Программное обеспечение на основе технологий ИИ. Для автоматического анализа маммографических изображений использовано отечественное программное обеспечение. Программное обеспечение анализировало диагностические изображения и указывало вероятность наличия признаков злокачественных новообразований молочной железы, классифицировало находки по шкале BI-RADS, маркировало подозрительные участки на изображениях. При оценке точности работы программного обеспечения, проведенной экспертами ГБУЗ «НПКЦ ДиТ ДЗМ» на размеченном наборе данных, получены следующие результаты: площадь под ROC-кривой (AUC) составила 0,90 (0,83—0,95), чувствительность — 0,74 (0,62—0,86), специфичность — 0,94 (0,87—1,0), точность — 0,84 (0,77—0,91) [18]. Пример работы программного обеспечения представлен на рисунке.
Примеры результатов работы сервиса.
а — маммограмма левой молочной железы в краниокаудальной проекции с оконтуренным участком асимметрии плотности; б — маммограмма левой молочной железы в косой медиолатеральной проекции с оконтуренными образованием и кальцинатом.
Методы статистического анализа. Для расчета необходимого объема выборки использовался метод В.И. Паниотто. Поскольку объем генеральной совокупности был более 100 000 исследований, минимальный объем выборки составил 398 исследований. Обработка полученных данных выполнена с использованием методов описательной статистики с указанием следующих характеристик: количество непропущенных значений (N), минимум (Min), максимум (Max), медиана (Med), среднее арифметическое значение (Mean), стандартное отклонение (SD), первый и третий квартили (Q1, Q3). Для анализа данных на нормальность распределения использовался тест Колмагорова—Смирнова. Учитывая отклонение от нормального распределения хронометражных данных, межгрупповое сравнение выполнено с помощью U-критерия Манна—Уитни с уровнем статистической значимости 0,05. Статистическая обработка данных проведена с помощью CHRONO-ANALYTICS FOR RADIOLOGY V1 (RU 2023662432) [19].
Результаты
Для сценария I (чтение двумя врачами-рентгенологами) случайным образом включено 480 маммографических исследований, для сценария II (ИИ и врач-рентгенолог) — 510. Средний возраст женщин в сценарии I составил 59,6±11,2 года (min 35 лет, max 89 лет), в сценарии II — 60,2±10,6 года (min 35 лет, max 92 года). Распределение исследований по классификациям BI-RADS и типам плотности молочных желез ACR представлено в табл. 1 и 2.
Таблица 1. Распределение исследований по категориям BI-RADS
Категория BI-RADS | Сценарий I, n (%) | Сценарий II, n (%) |
BI-RADS 1 | 87 (18,13) | 81 (15,88) |
BI-RADS 2 | 352 (73,33) | 396 (77,65) |
BI-RADS 3 | 29 (6,04) | 27 (5,29) |
BI-RADS 4 | 11 (2,29) | 5 (0,98) |
BI-RADS 5 | 1 (0,21) | 1 (0,20) |
p (U-test) | 0,914 |
Таблица 2. Распределение исследований по типам плотности молочных желез (ACR)
Тип плотности | Сценарий I, n (%) | Сценарий II, n (%) |
A | 61 (12,7) | 57 (11,2) |
B | 317 (66,0) | 342 (67,1) |
C | 76 (15,8) | 81 (15,9) |
D | 26 (5,4) | 30 (5,9) |
p (U-test) | 0,574 |
В сценарии I при первичном чтении средняя длительность подготовки протокола исследования составила 0:10:02 (здесь и далее время в формате ЧЧ:ММ:СС), при втором чтении — 0:04:44 (табл. 3). В среднем первое описание проведено через 10:43:28 после проведения маммографического исследования. Следует отметить, что средняя длительность ожидания между первым и вторым описанием составила 23:18:05. Таким образом, средняя длительность проведения двойного чтения маммографических исследований, в котором приняли участие 2 врача-рентгенолога, составила 34:12:18 (табл. 4).
Таблица 3. Описательная статистика данных о длительности подготовки протоколов маммографических исследований для обоих сценариев двойного чтения (с)
Параметр | Сценарий I | Сценарий II | ||
рентгенолог №1 | рентгенолог №2 | ИИ | рентгенолог | |
N, иссл. | 480 | 480 | 510 | 510 |
Min, с | 11 | 12 | 41 | 12 |
Max, с | 3291 | 5523 | 2806 | 2505 |
Mean, с | 602 | 284 | 132 | 250 |
SD, с | 506 | 416 | 227 | 341 |
Med, с | 444 | 160 | 104 | 156 |
Q1, с | 268 | 54 | 67 | 77 |
Q3, с | 785 | 382 | 127 | 261 |
p (U-test) | <0,0001 | <0,0001 |
Таблица 4. Описательная статистика данных о длительности проведения двойного чтения для обоих сценариев (с)
Параметр | Сценарий I (врач + врач) | Сценарий II (ИИ + врач) |
N, иссл. | 480 | 510 |
Min, с | 537 | 172 |
Max, с | 604 778 | 433 214 |
Mean, с | 123 139 | 41 338 |
SD, с | 141 720 | 69 094 |
Med, с | 73 234 | 6 802 |
Q1, с | 20 490 | 884 |
Q3, с | 182 442 | 66 134 |
p (U-test) | <0,0001 |
В сценарии II средняя длительность автоматического анализа маммографических исследований с помощью алгоритма ИИ составила 0:02:12. Средняя длительность доступности результата ИИ после проведения маммографического исследования составила 0:05:44. Причем большая часть этого времени затрачивалась на передачу и получение диагностических изображений алгоритмом ИИ по сети Интернет, а не на анализ изображений. Средняя длительность подготовки протокола врачом-рентгенологом в сценарии II составила 0:04:10 (см. табл. 3). Таким образом, средняя длительность проведения двойного чтения с применением технологии ИИ составила 11:28:58 (см. табл. 4).
Средняя продолжительность проведения двойного чтения маммографических исследований при использовании технологий ИИ была меньше на 66,4%, различия оказались статистически значимы (p<0,0001).
При анализе протоколов врачей и результатов работы алгоритма ИИ в 371 (72,9%) случае выявлено согласие врачей-рентгенологов с заключениями алгоритма ИИ.
Обсуждение
Результаты проведенного исследования продемонстрировали, что применение алгоритма ИИ как инструмента первого чтения снижает длительность проведения двойного чтения маммографических исследований. Следует отметить, что исследование проводилось в условиях работы референс-центра лучевой диагностики, где отсутствует проблема кадрового дефицита врачей-рентгенологов. Несмотря на это, длительность двойного чтения 2 врачами-рентгенологами составила более 34 ч. Таким образом, применение ИИ при реализации двойного чтения профилактических исследований может снизить рабочую нагрузку на врачей-рентгенологов, оптимизировать рабочие процессы в отделении лучевой диагностики и ускорить подготовку результатов маммографических исследований.
Обращает на себя внимание сокращение длительности подготовки протокола маммографического исследования врачом при использовании ИИ с 0:10:02 до 0:04:10 (p<0,0001). Однако требуется дополнительное изучение данного результата. При сравнении длительности подготовки протоколов маммографических исследований между врачом-рентгенологом №2 (сценарий I) и врачом-рентгенологом (сценарий II) статистическая значимость не выявлена (p=0,68). В нашем предыдущем исследовании продемонстрировано, что применение ИИ при двойном чтении флюорограмм увеличивало длительность подготовки протокола диагностического исследования на 22,1% [13]. Это можно объяснить тем, что врач изучает результаты работы алгоритма ИИ (дополнительные изображения и заключение, созданные алгоритмом). Однако в исследовании С.П. Морозова и соавт. продемонстрировано, что применение алгоритма ИИ позволяет сократить длительность подготовки протокола на 55,3% при интерпретации результатов КТ органов грудной клетки у пациентов с подозрением на COVID-19 [14]. По нашим наблюдениям, применение алгоритмов ИИ способствует сокращению длительности подготовки протокола для исследований, в которых необходимо проводить измерения анатомических структур и патологических образований, например объем внутримозгового кровоизлияния, диаметры магистральных сосудов, размеры и объем образований.
В ряде исследований также показано, что применение алгоритма ИИ сокращает длительность двойного чтения маммографических исследований на 17,0—70,0% [20—23]. В исследовании A. Lauritzen и соавт. проводилась оценка не только длительности проведения двойного чтения, но и влияния алгоритма ИИ на чувствительность и специфичность выявления злокачественных новообразований молочной железы. Помимо сокращения длительности двойного чтения, применение алгоритма ИИ позволило незначительно повысить специфичность — с 98,1% при двойном чтении врачами до 98,6% при использовании алгоритма ИИ. Однако применение ИИ незначительно снизило чувствительность — с 70,8 до 69,7% [23]. В исследовании S. McKinney и соавт. показано снижение нагрузки на 88,0%. Таким образом, автоматизация двойных описаний маммографии статистически значимо повысила производительность скрининга, оптимизировав загруженность врачей [24].
Влияние алгоритмов ИИ на точность, чувствительность и специфичность выявления злокачественных новообразований молочной железы должно быть изучено в дальнейшем. В исследовании S. McKinney и соавт. также показано, что применение ИИ позволяет уменьшить количество ложноположительных и ложноотрицательных случаев выявления злокачественных новообразований молочной железы на 5,7 и 9,4% соответственно [24].
В ряде исследований показано, что применение алгоритмов ИИ может сократить количество ложноположительных случаев подозрения на злокачественные новообразования молочной железы, излишних интервенционных вмешательств и финансовые издержки системы здравоохранения [10, 25].
По нашему мнению, применение двух разных алгоритмов ИИ, обладающих высокой чувствительностью для определения отсутствия патологических изменений на маммограммах, может значительно сократить и оптимизировать нагрузку на врачей-рентгенологов при проведении скрининга, при этом сфокусировать внимание врачей на маммографических исследованиях, при которых выявлены патологические изменения.
Ограничения исследования. Настоящее исследование имеет ряд ограничений. Функциональные особенности ЕРИС ЕМИАС предполагают последовательное описание исследований, в обоих сценариях врачам были доступны результаты первого чтения. В ходе исследования не оценивалось влияние алгоритма ИИ на чувствительность и специфичность выявления злокачественных новообразований молочной железы врачом-рентгенологом. В ходе исследования в сценарии I не оценивалась степень согласия между 2 врачами-рентгенологами.
Заключение
Применение алгоритма ИИ позволило сократить длительность проведения двойного чтения маммографических исследований при скрининге злокачественных новообразований молочной железы на 66,4% и оптимизировать рабочий процесс врачей-рентгенологов.
Данная публикация подготовлена авторским коллективом в рамках НИР «Научные методологии устойчивого развития технологий искусственного интеллекта в медицинской диагностике» (№ЕГИСУ: №123031500004-5) в соответствии с Приказом от 21.12.22 г. №1196 «Об утверждении государственных заданий, финансовое обеспечение которых осуществляется за счет средств бюджета города Москвы государственным бюджетным (автономным) учреждениям, подведомственным Департаменту здравоохранения города Москвы, на 2023 год и плановый период 2024 и 2025 годов» Департамента здравоохранения города Москвы.
Участие авторов: концепция и дизайн исследования — А.В. Владзимирский, Н.Д. Кудрявцев; сбор и обработка материала — Д.Д. Кожихина, И.В. Гоначарова, К.М. Арзамасов; статистическая обработка — Н.Д. Кудрявцев; написание текста — Н.Д. Кудрявцев, И.В. Гончарова; редактирование — И.М. Шулькин, А.В. Владзимирский, Д.Е. Шарова
Авторы заявляют об отсутствии конфликта интересов.