Введение
Лабораторная диагностика генерирует огромное множество цифровых данных, внося существенный вклад в формирование цифрового профиля пациента. Вместе с этим для лаборатории важно быть не только поставщиком данных, но и учиться использовать весь арсенал возможностей машинной обработки информации. Технологии искусственного интеллекта (ИИ) открывают широкие перспективы в такой обработке и анализе, в том числе позволяя осуществить цифровую трансформацию лечебно-диагностического процесса с целью повышения результативности и эффективности.
Цель статьи — предоставить начальные сведения об ИИ и рассмотреть возможные области его применения в лабораторной медицине.
Искусственный интеллект. Определение и связанные понятия
«Искусственный интеллект — комплекс технологических решений, позволяющий имитировать когнитивные функции человека (включая самообучение и поиск решений без заранее заданного алгоритма) и получать при выполнении конкретных задач результаты, сопоставимые, как минимум, с результатами интеллектуальной деятельности человека» [1].
Технологии ИИ развиваются с 50-х годов прошлого века и в настоящее время включают сразу несколько крупных направлений: обработку естественного языка, распознавание и синтез речи, компьютерное зрение, экспертные системы, прогнозную аналитику и другие. В последние два десятилетия достигнуты большие успехи в разработке и внедрении ИИ в повседневную жизнь общества. Так, например, в таком технологическом решении, как беспилотный транспорт, ИИ является обязательным элементом.
Фундаментальное понятие ИИ — машинное обучение (МО), представляет собой класс методов ИИ, суть которых состоит в создании алгоритма, способного обучаться, анализировать входные данные и давать на выходе ответ на поставленный вопрос без программирования человеком. Результатом МО является модель, которая может принимать на вход неограниченное количество информации и выдавать результат ее анализа, как правило, в виде вероятности ответа на конкретный вопрос. Например, можно создать модель МО, которая будет анализировать цифровую КТ или рентгенограмму на предмет вероятности наличия онкологического заболевания. Еще один пример — модель для анализа обезличенной электронной медицинской карты конкретного пациента на предмет оценки необходимости госпитализации или вероятности летального исхода по различным заболеваниям.
При создании моделей методами МО анализируется большое множество данных пациентов (например, демография, лабораторные результаты и др.). В процессе МО компьютерные программы самостоятельно подбирают параметры этой модели, чтобы добиться максимально верного предсказания результата на основе заданных данных. Именно поэтому от качества используемых для обучения данных зависит качество модели. По меткому выражению Этема Алпайдина, «Теперь данные начали управлять операциями, — уже не программисты, а сами данные определяют, что делать дальше» [2]. По сути, компьютерная программа сама учится находить правильный ответ, перебирая огромное количество возможных параметров и вариантов взаимосвязей в данных, которые ей были предоставлены для анализа, — это и является упрощенным объяснением термина «машинное обучение».
После разработки модели обязательно проводится ее тестирование с использованием нового набора данных с целью оценки качества модели: сравниваются результаты, предсказываемые моделью, с истинными результатами, размеченными в тестовом наборе данных. Рассчитываются специфичность и чувствительность. Для оценки качества модели, как правило, строится ROC-кривая операционных характеристик для определения площади под кривой (AUC): по оси X откладываются значения [1- специфичность], по оси Y — чувствительности. Чем больше площадь под кривой, тем выше качество работы модели. Могут определяться другие показатели качества модели. Набор данных часто заранее случайным образом разделяют на обучающий и тестовый. Когда требуется выбрать наилучшую из параллельно обученных моделей, заранее также выделяют часть данных для валидации моделей.
Существует много задач, которые можно решить с помощью МО. Применительно к медицине они укрупненно объединяются в два наиболее популярных типа:
1) Классификация — предсказание категории объекта из множества классов, заданных аналитиком заранее, например, предиабет или диабет. Близко к классификации стоит задача кластеризации. Отличие заключается в том, что при кластеризации классы не задаются заранее, а определяются в процессе МО.
В процессе решения задач классификации/кластеризации, появляется также крайне полезная возможность выявлять аномалии, когда объекты резко отклоняются друг от друга. Такое свойство используется, например, программами анализа изображений на основе ИИ для обнаружения патологических мест в гистологических препаратах.
2) Регрессия — предсказание произвольного численного значения, например, продолжительности ремиссии после удаления опухоли. Задача регрессии по сути своей достаточно близка к задаче классификации.
Для каждой из перечисленных выше задач разработаны методы МО, использующие различные математические решения, например, линейная и нелинейная регрессия, нейронные сети, деревья решений, метод случайного леса, метод опорных векторов и многие другие. У каждого из методов есть свои достоинства и недостатки. Например, достоинства сверточных нейронных сетей заключаются в способности выявлять локальные зависимости в данных и в более быстрой обучаемости. Однако как любые нейросети они имеют внутри «черный ящик», не позволяя прояснить логику принятия решений, что может приводить к некоторым ограничениям применения в медицине. В то же время деревья решений дают возможность проследить логику принятия решения, в связи с чем востребованы в такой ответственной области, как медицина. Деревья решений хорошо подходят для работы со смешанными данными (числовыми или категориальными), но требуют больших вычислительных мощностей при обучении.
Для нивелирования недостатков того или иного метода используют комбинации моделей — ансамблевые модели. Например, при одиночном дереве решений высок риск ошибок по причине «черно-белых» суждений — однозначных ответов «да» или «нет» на вопрос. На практике, как правило, применяют метод случайного леса — ансамбля деревьев решений. В случайном лесе сочетается множество деревьев с некоторыми полезными модификациями и за счет комбинации одиночных деревьев достигается более точный результат. Для знакомства с методами МО рекомендуем ресурс для начинающих с доступным изложением и наглядными примерами [3, 4].
Машинное обучение с учителем/без учителя/ с подкреплением
МО может быть контролируемым — с учителем, и неконтролируемым — без учителя. Выбор подходящего типа МО определяется, как правило, ответами на три ключевых вопроса: с какими данными вы работаете? Какие ожидаются выводы? Где они будут применяться? При наличии простых входных данных, когда аналитик может провести разметку данных, то есть выделить в них характеристики — признаки, а также соотнести их с определенным результатом (выходом), применяется, как правило, МО с учителем. Например, когда известны уровни липидного профиля, имеются электрокардиограммы и другие результаты обследования, а также доступна информация о наличии или отсутствии у обследованных лиц ишемической болезни сердца. Этот тип МО более распространен, так как считается, что с учителем машина обучится быстрее и точнее.
При исследовании массива сложных данных, обладающих в том числе неизвестными признаками, когда искомый результат заранее неизвестен, но предполагается открыть что-то новое, полезным оказывается обучение без учителя. При обучении без учителя нет выходных данных, программа использует только входные данные, в которых в ходе обучения ожидается выявление закономерностей (паттернов). Так, например, решается задача кластеризации. Кластеризация — это группирование данных по не заданным заранее классам. Программа сама ищет объекты, обладающие схожими признаками, и объединяет их в кластеры [3].
Модели кластеризации могут быть полезны для повышения специфичности диагностики за счет анализа комплекса данных, например, при использовании онкомаркеров, применение которых пока не имеет требуемого баланса специфичности и чувствительности, что вынуждает врача принимать во внимание другие факторы. Благодаря кластеризации возможно выявление скрытых, ранее неизвестных закономерностей между составляющими комплексного обследования пациента, в том числе, например, новыми биомаркерами и подозреваемой патологией. Далее, используя выявленные при кластеризации значимые для изучаемой патологии признаки, можно построить уже модели классификации. Например, разработать программу, которая на основе анализа уровней биомаркеров, выявленных вновь и ранее известных, результатов УЗИ/томографии, возраста и других значимых признаков, классифицирует обследуемых лиц на пациентов с клинически значимым раком, с клинически незначимым раком простаты, доброкачественной аденомой и здоровых мужчин.
Когда нет ни входных, ни выходных данных, но есть окружающая среда, с которой можно взаимодействовать, используется обучение с подкреплением. Программа выполняет некие действия и отслеживает реакции среды, обучаясь через поощрение направлению к цели и стремясь достичь ее наилучшими действиями, кратчайшим способом (например, выиграть у человека в шахматы). При обучении с подкреплением стоит задача минимизировать ошибки, а не рассчитать все ходы, машина не запоминает каждое движение, а пытается обобщить ситуации для выхода из них с максимальной выгодой [5]. Модель получает оценку — поощрение часто в конце при достижении цели, в связи с чем такой тип обучения еще называют обучением с критиком, который только дает обратную связь: хорошо или плохо выполнено действие. Генерация данных происходит во время обучения, алгоритмы обучения с подкреплением лишены системных ошибок, вносимых качеством данных или учителем, и, в частности, применяются для управления беспилотными средствами.
Технологии ИИ для производственной деятельности лабораторий
Перечислим ситуации, связанные с автоматизацией операционных или управленческих действий, схожих с другими производствами, которые уже могут иметь готовые решения: оптимизация кодировки услуг и выставления счетов, мониторинг загруженности оборудования/персонала с предсказанием будущих потребностей и штатного расписания, управление запасами реагентов и расходных материалов, машинное считывание бланков направлений и выдачи результата, распознавание голосовых заключений.
Применения технологий ИИ в научно-исследовательской области
Успешное развитие персонализированной медицины невозможно без технологий на основе ИИ для обработки нарастающего объема данных, получаемых при секвенировании, масс-спектрометрии и с помощью других методов геномики, транскриптомики, протеомики, метаболомики. Разработанный компанией IBM продукт Watson for Genomics (WFG) способен менее, чем за 3 минуты, проанализировать перечень мутаций у пациента, ранее выявленных секвенированием экзонов с анализом информационным конвейером UNCseq. Так, WFG формирует отчет с информацией об одобренных методах лечения, препаратах, доступных клинических испытаниях. В ходе испытаний продукта у 323 из 1018 (31,7%) пациентов он выявил дополнительные геномные события, имеющие потенциальное значение, то есть, когда существуют таргетные противоопухолевые препараты или подходящие клинические исследования. В список WFG вошли 8 мутаций генов, которых не было в списке совета клиники по молекулярной онкологии [6].
Следующие примеры связаны с использованием МО для поиска новых биомаркеров. Авторы исследования [7] показали, что модель из трех факторов риска (возраст, пол, индекс массы тела) и двух биомаркеров, выявленных после скрининга баз данных, — повышенного уровня мозгового натрийуретического пептида (BNP) и фактора роста фибробластов-23 (FGF-23) в сыворотке крови, способна идентифицировать пациентов с фибрилляцией предсердий. В работе [8] с помощью МО и анализа состава липидов в сыворотке крови лиц с наследственной ИБС и контрольной группы из популяции подтверждено, что церамиды являются независимыми биомаркерами сердечно-сосудистых заболеваний (ССЗ). Другие исследования по поиску новых биомаркеров с использованием технологий ИИ можно найти в обзоре [9].
В период пандемии COVID-19 компания WellAI разработала на основе нейронных сетей систему поиска публикаций по теме COVID-19, которая выдает список концепций с ранжированными вероятностями, что позволяет фокусироваться на интересующих понятиях, исследованиях взаимосвязей между понятиями и кластерами понятий. Другой открытый ресурс SciSight обладает двумя способностями: 1) изучать ассоциации между биомедицинскими аспектами, автоматически извлекаемыми из статей (например, гены, препараты, заболевания, исходы); 2) объединять текстовую и сетевую информацию для поиска, визуализации групп исследователей и их связей, чтобы узнать, какие группы работают над какими направлениями [10].
Инструменты ИИ для управления назначениями
Авторы обзора [11] связывают большие надежды с программами на основе ИИ в качестве следующего логичного и перспективного шага решения проблемы излишних и недостаточных лабораторных исследований. В связи с этим представляет интерес программа рекомендаций, разработанная в Тайване, при обучении которой использовали данные 1 463 837 назначений для 530 050 уникальных пациентов. В течение 2013 г. им назначалось выполнение хотя бы одного лабораторного теста. Трехслойная модель глубокого обучения продемонстрировала высокую эффективность предсказания рекомендуемых лабораторных исследований: AUC 0,92—0,96 для 114 тестов, 0,96—1 для 106 лабораторных тестов и 0,76—0,92 для 96 тестов. Четыре признака — возраст, пол, заболевание и история приема лекарств пациентов — были определяющими для точности прогноза. Однако в исследовании не учитывались временные аспекты при назначении лабораторных исследований, возможное влияние процедур [12].
Концептуальное исследование применимости МО для пересмотра ценности отдельных лабораторных тестов на примере оценки уровня ферритина проводилось в работе [13]. С этой целью использовались две модели: регрессии, то есть предсказания значения ферритина, и классификации на две категории по предсказанному уровню ферритина — в границах референтного интервала или ниже его нижнего предела. Для обучения моделей использовались данные 3590 пациентов, для тестирования обученных моделей — 1358 пациентов. В перечень анализируемых признаков включили значения 21-го параметра анализа крови с дифференцировкой лейкоцитов, уровня аланинаминостранферазы (АЛТ), аспартатаминотрансферазы (АСТ), щелочной фосфатазы, глюкозы, общего билирубина, общего белка, альбумина, креатинина, мочевины, железа, общей железосвязывающей способности (ОЖС), ферритина, витамина B12, кальция, калия, натрия, хлора, бикарбоната; всего до 40 входных признаков, включая пол, возраст. Демографические данные пациента и результаты лабораторных тестов позволили классифицировать предсказываемые моделью значения уровня ферритина: модель оказалась способна отличить нормальный уровень предсказанного ферритина, то есть входящий в диапазон референтного интервала ферритина, от низких значений, выходящих за пределы нижней границы референтного интервала, площадь под кривой достигала 0,97. Как в случае регрессии, так и при классификации наиболее информативными признаками были уровень ОЖС, среднее значение и средняя концентрация гемоглобина в эритроците. Авторы считают, что системы на основе МО превосходят в точности и скорости разработки алгоритмов экспертные системы, программируемые на основе правил, составляя основу для нового типа систем поддержки принятия клинических решений с интеграцией, интерпретацией и повышением диагностической ценности комплекса лабораторных исследований [13].
С помощью МО авторы работы [14] подтвердили правильность предложений секции клинической практики Ассоциации клинической биохимии Великобритании в исследовании BALLETS о сокращении списка рутинных тестов для скрининговой оценки функции печени у амбулаторных пациентов. Модели решающих деревьев и опорных векторов обучили набором результатов рутинных биохимических тестов для более, чем 20 тыс. пациентов. Показано, что нахождение значений гамма-глутатионпероксидазы (ГГТ) в пределах референтного интервала или превышение его верхнего предела могут быть предсказаны результатами АЛТ и щелочной фосфатазы, что позволяет исключить ГГТ из рутинного скрининга функции печени. Точность предсказания составила 90% для метода деревьев и 82,6% для метода опорных векторов. Определение АСТ не требовалось, особенно в случаях с сильно повышенными уровнями ГГТ.
Новые аналитические и диагностические решения на основе ИИ
В клинических лабораториях программы на основе МО могут выполнять аналитическую роль, прежде всего в лабораторных исследованиях, использующих анализ изображений. Заметим, что уже более 20 лет для автоматической микроскопии мочи применяются анализаторы IRIS, идентифицирующие объекты с помощью анализа микрофотографий нейронными сетями, обученными на библиотеке фотографий элементов мочи. В настоящее время нашли применение решения, заменяющие и дополняющие ручную микроскопию для создания автоматизированного цифрового морфологического анализа клеток крови. Например, системы от компаний Cella Vision, West Medica предварительно классифицируют клетки крови по подтипам на основе ряда морфологических характеристик. В 2017 г. компания Roche выпустила гематологический анализатор Cobas m511 с технологией подсчета Bloodhound®, основанной также на анализе изображений элементов крови.
Широкому внедрению упомянутых цифровых систем препятствует необходимость относительно высоких инвестиций. Данного недостатка лишена разработка для автоматизации микроскопии мазков крови отечественного стартапа Celly.AI, приложение доступно в AppStore https://docs.celly.ai/ [15]. Качество подсчета лейкоцитарной формулы не уступает специалистам. Более подробно сравнение традиционного подсчета лейкоцитарной формулы и с помощью устройства Celly.AI описано в кратком сообщении в этом номере.
Серьезные прорывы с помощью технологий ИИ достигнуты в автоматизации работы с гистологическими препаратами. В 2018 г. вышла статья с результатами слепого рандомизированного исследования по сравнению с диагностическими заключениями на основе системы визуализации целых слайдов WSI (Whole slide imaging) Philips IntelliSite Pathology Solution (PIPS) и обычной микроскопии. Показано, что WSI не уступает обычной микроскопии для первичной диагностики препаратов, включая биопсийный материал и резецированные ткани, вне зависимости от вида окрашивания, для широкого спектра систем органов и типов образцов [16]. В 2017 г. Управление по контролю за продуктами и лекарствами США (FDA) разрешило продажу PIPS. Следующим шагом стало внедрение в практику европейских клиник Galen Prostate — программы на основе ИИ для анализа цифровых слайдов для выявления рака простаты от израильского стартапа Ibex Medical Analytics, объявившего в феврале 2021 г. о получении одобрения европейского регулятора. В 2020 г. лаборатория CorePlus Servicios Clínicos Patológicos в Каролине (Пуэрто-Рико, США) сообщила об итогах тестирования решения Galen Prostate на 1301 препарате ткани простаты, оцифрованных с помощью сканеров 3DHISTECH. Результаты продемонстрировали высокую точность в обнаружении рака: специфичность 96,9%, чувствительность 96,5% [17], что позволило FDA присвоить продукту особый статус, ускоряющий его внедрение в практику.
Благодаря МО лаборатория также получает новые возможности контроля качества выполняемых аналитических исследований посредством математического мониторинга результатов пациентов (дельта-чек) на предмет обнаружения ошибок идентификации пробы [18], выявления проблем в качестве образца, работе систем и реагентов, других технологических сбоев.
Системы поддержки принятия врачебных решений
В области интерпретации технологии ИИ открывают возможности для эффективного использования лабораторных данных в виде когнитивных систем и систем поддержки принятия врачебных решений (СППВР), так как врачу сложно оценить все сведения о пациенте и соотнести их с последними научными данными. Одним из первых крупных мировых проектов применения технологий ИИ для создания СППВР является система IBM Watson. В этом решении использованы МО и методы обработки естественного языка (NLP) для анализа данных, понимания и выведения закономерностей из огромных объемов разрозненных данных. Несмотря на большие инвестиции и широкую известность, проект воспринимался в научном мире как неудачный, из-за чего в 2021 г. компания IBM объявила о продаже проекта. На пути к пока недосягаемой цели создания идеального цифрового доктора компания выпускала узкие продукты, в частности Watson for Oncology (WFO), который, анализируя информацию об онкологическом пациенте с включением генетических исследований, выдавал возможные варианты лечения и противопоказания. По данным метаанализа 9 исследований [19], включивших 2463 пациента, общий коэффициент соответствия между решениями междисциплинарных команд врачей и WFO составил 81,52% и зависел от стадии рака, региона.
Сеченовским Университетом запатентованы способы скринингового определения вероятности наличия у представителей европеоидной популяции колоректального рака [20], рака легкого [21], рака молочной железы (РМЖ) [22], рака мочевого пузыря [23]. Повышение точности скрининга в изобретении достигалось за счет анализа уровня 10—12 биомаркеров в сыворотке крови как минимум одной из трех обученных классификационных моделей — случайного леса и/или линейного дискриминантного анализа и/или методом опорных векторов. В общий перечень онкомаркеров включены аполипопротеин A2 (ApoA2); бета-2 микроглобулин; фрагмент цитокератина 19 (CYFRA 21-1); D-димер; белок 4 эпидидимиса человека (НЕ4); высокочувствительный С-реактивный белок; транстиретин (TTR); раковый эмбриональный антиген (СЕА); растворимая форма молекулы адгезии сосудистого эндотелия 1 типа (sVCAM 1); аполипопротеин A1 (ApoA1); CA19.9; CA125; CA 15-3; фактор роста эндотелия сосудов (VEGFR 1). Маркеры обладали разной чувствительностью и специфичностью для выявления каждого вида рака при отдельном применении, для примера перечислены выше в порядке снижения точности прогноза для колоректального рака. Использование комплекса биомаркеров позволило повысить точность (AUC 0,9—1,0). Однако обучение проводилось на маленькой выборке с преобладанием доли здоровых лиц — 203 человека (для РМЖ 104) против 59—102 онкобольных в зависимости от вида нозологии. При этом у пациентов чаще выявляли более поздние формы рака. Авторы изобретения планируют увеличить выборку, включив в число обследуемых больше пациентов с ранними стадиями рака, а также изучить эффективность дифференциации с помощью моделей рака от ряда доброкачественных опухолей [24].
В кардиологии, широко использующей для диагностики и лечения пациентов лабораторные показатели, достигнут прогресс в машинном анализе электрокардиограмм, эхокардиограмм. В связи с этим активно разрабатываются программы на основе МО для оценки риска ССЗ, необходимости экстренной госпитализации и выживаемости, обладающие преимуществом по сравнению с традиционными подходами и шкалами [9]. Модель AutoPrognosis, обученная на данных 423 604 участников биобанка Великобритании, не имевших в начале наблюдения ССЗ, улучшила предсказание риска (AUC 0,774) по сравнению с Фрамингемской шкалой (AUC 0,724). Из 4801 случая ССЗ, зарегистрированных за 5 лет наблюдения, AutoPrognosis смог предсказать на 368 случаев больше по сравнению с Фрамингемской шкалой [25]. В российском исследовании точность прогноза ССЗ двухслойной нейронной сетью, обученной на данных 2216 пациентов, также превзошла Фрамингемскую шкалу (AUC 0,84 v AUV 0,59) [26]. С помощью данных 6814 участников Мультиэтнического исследования атеросклероза MESA, наблюдавшихся 12 лет и не имевших ССЗ на старте, проведено обучение модели случайного леса. Показано эффективное прогнозирование сердечно-сосудистого риска для 6 исходов, включая смерть, инсульт, сердечную недостаточность и фибрилляцию предсердий. Уровни растворимых рецепторов тканевого фактора некроза-α и интерлейкин-2 (IL-2) и NT-proBNP были важны для всех исходов, указывая на существующую недооцененность этих биомаркеров. Из изначальных 735 переменных в число топ 20 предикторов из лабораторных аналитов также вошли сердечный тропонин-Т, интерлейкин-6, гомоцистеин, фибриноген, D-димер, комплекс плазмин-антиплазмин, фактор VIII, креатинин, уровень глюкозы натощак [27].
Доступен пул публикаций по МО в диагностике и прогнозной аналитике других заболеваний [28—33]. Приведем примеры по актуальным клиническим направлениям, начиная с нейродегенеративных заболеваний. В работе [29] изучали предсказание конверсии в краткосрочной перспективе легкого когнитивного расстройства (ЛКР) в болезнь Альцгеймера (БА). Тестировали четыре группы: 38 пациентов с болезнью Альцгеймера (БА), 46 с ЛКР с конверсией в БА в ближайшие 2 года (ЛКРк) и 36 с ЛКР, остающихся стабильными (ЛКРс), 38 здоровых. Модель с комбинацией данных из 4 источников — позитронно-эмиссионной томографии с фтордезоксиглюкозой, структурной магнитно-резонансной томографии, уровня белков спинномозговой жидкости и генотипа аполипопротеина-E продемонстрировала AUC от 95,24 до 98,33 при разграничении здоровых от ЛКРс и от ЛКРк; БА от ЛКРк и ЛКРс; ЛКРс от ЛКРк и БА от здоровых.
Для прогнозирования септического шока разработан показатель раннего предупреждения TREWScore, идентифицирующий в режиме реального времени пациентов высокого риска до начала шока: AUC 0,83 против AUC 0,73 для модифицированной шкалы раннего предупреждения MEWS, использовавшейся в клинике. При специфичности 0,67 чувствительность составила 0,85 и TREWScore выявлял пациентов в среднем за 28,2 ч до развития шока. TREWScore обнаружил на 58,6% больше пациентов с развившимся позднее септическим шоком, до развития какой-либо связанной с сепсисом дисфункции органов по сравнению с рутинным подходом [30]. Согласно метаанализу [31] точность моделей для диагностики сепсиса (AUC) варьировала от 0,68—0,99 в отделении интенсивной терапии до 0,96—0,98 в стационаре, наибольший вклад в эффективность вносили температура, лабораторные показатели и тип модели.
Для прогнозирования гематологических заболеваний авторы работы [32], используя данные за 2005—2015 гг. о 8233 случаях с результатами 371 341 лабораторного анализа крови в гематологическом отделении медицинского центра Университета Любляны, построили модели Smart Blood Analytics Haematology (SBA-HEM). Модель SBA-HEM181, учитывающая все доступные параметры анализа крови, и специалисты по гематологии достигли точности 0,60 без достоверного отличия (p>0,05). Однако при рассмотрении пяти наиболее вероятных диагнозов, предложенных SBA-HEM181 и специалистами по гематологии, точность SBA-HEM181 и специалистов по гематологии повысилась до 0,90 и 0,77, соответственно, со значимым отличием (p<0,05).
По данным обзора [33] модели опорных векторов и случайного леса достигли хороших прогностических результатов для рассеянного склероза, ревматоидного артрита, аутоиммунных воспалительных заболеваний кишечника в простых сценариях — классификации заболевания и контроля. Предполагается расширить возможности, интегрируя разные типы данных.
ИИ и диагностика по месту лечения (Point of Care testing — POCT)
В настоящее время стремительно развивается область применения технологий ИИ в POCT, что обусловлено появлением новых биосенсоров, компактных и носимых устройств мониторинга, разработкой мобильных приложений для пациентов. В частности, доля медицинских изделий на основе технологий ИИ, зарегистрированных до 2021 г. и предназначенных для использования пациентами, составила 15% в США и 18% в странах Европы, 7 из них связаны с лабораторной диагностикой [34].
Три компании Healthy.io, Inui Health и Scanwell имеют одобренные регуляторами разработки для выполнения анализа мочи на дому с помощью колориметрического анализа мочевых полосок камерой смартфона. В решении от Healthy.io анализ проводится пациентом самостоятельно (не медсестрой) с помощью пошаговых инструкций мобильного приложения. Пациент немедленно получает результаты полуколичественного измерения в моче белка, глюкозы, нитритов и крови [35].
Система непрерывного мониторинга глюкозы Guardian Connect от Medtronic разработана для пациентов с ежедневными инъекциями инсулина. Пользователи системы могут видеть на своем мобильном устройстве текущие уровни глюкозы и динамику, получать предупреждения о высоких и низких показателях глюкозы, включая прогнозы гипо- или гипергликемии за 10—60 минут до события, а также быть на связи с медработниками для оптимизации терапии [36].
Заключение
Проведенные исследования свидетельствуют о более высокой скорости и точности программ на основе МО при выполнении анализа разнообразных медицинских данных по сравнению с традиционными способами. Это открывает дорогу ускорению научных исследований, идентификации новых биомаркеров, взаимосвязей и патологических механизмов. Результаты исследований указывают на большой потенциал ИИ, который предстоит раскрыть в ближайшее время в персонализированной медицине для улучшения и ускорения диагностики, принятия наилучших клинических решений и оптимального использования ограниченных ресурсов в здравоохранении. Рассмотренные в обзоре исследования часто носили ретроспективный характер и формат in silico, т.е. компьютерного симулирования эксперимента. В связи с этим предстоит большая работа по проведению масштабных проспективных исследований и клинической валидации моделей. Вместе с тем в мире с 2015 г. на рынок выпущено множество медицинских изделий на основе ИИ: в США свыше 220, в Европе свыше 240, в России — 12 программных продуктов (с 2020 г.) [34]. Трансляцию технологий ИИ в практику ускоряет пандемия COVID-19.
Эти обстоятельства накладывают ответственность на лаборатории в части повышения компетенции, развития аналитических навыков для сотрудничества с IT-специалистами. Качество любой программы на основе МО определяется качеством данных. Роль лаборатории заключается в стандартизации и экспертной оценке производимых данных, участии в разработке протоколов и процессе разметки данных для МО, инициативной постановке задач.
Авторы заявляют об отсутствии конфликта интересов.