Искусственный интеллект (ИИ) является технологией моделирования человеческого интеллекта в компьютерных системах. ИИ-системы предназначены для копирования человеческого мышления и действий, включая обучение и решение узкоспециализированных задач. В контексте анализа изображений в патологической анатомии термин «искусственный интеллект» в настоящее время является почти синонимом термина «глубокое машинное обучение с помощью искусственных нейронных сетей». Этот набор методов, который изначально был разработан в немедицинских областях, позволил добиться значительных успехов в анализе сложных визуальных данных. В настоящий момент основной проблемой вычислительной патологической анатомии является внедрение этих методов в программные конвейеры и определение подходящих клинических случаев, при которых эти решения могут быть применены [1]. Цель настоящего обзора — описание ключевых диагностических и консультативных программных решений, выполненных с использованием слабого и сильного ИИ, рассмотрение способов их валидации и перспектив применения.
Искусственный интеллект: цели применения, классификация и свойства
Цель ИИ — решать задачи, которые обычно требуют применения человеческого интеллекта, такие как визуальное восприятие, принятие решений и речевая коммуникация, проблемы патологической анатомии не выходят за рамки компетенций ИИ [1].
ИИ как таковой можно разделить на два типа:
1. Слабый ИИ, классифицирующий данные на основе предварительно обученных статистических моделей (инструмент для решения конкретных задач патологической анатомии).
2. Сильный ИИ, способный самостоятельно обучаться и функционировать, используя машинное обучение на основе любых доступных нормализованных (что немаловажно) данных, а не предложенных исследователем (полноценный цифровой ассистент патологоанатома).
Влияние ИИ на роль патологоанатома
Влияние ИИ на роль патологоанатома — еще один важный аспект, который следует учитывать в развитии интеллектуальной обработки изображений. Хотя большинство авторов считают, что патологоанатомы вряд ли будут полностью заменены ИИ, они согласны с тем, что роль патологоанатома претерпит существенные изменения, но и точность принимаемых решений возрастет [2]. В краткосрочной перспективе роль патологоанатома останется практически неизменной, учитывая, что ИИ в анализе изображений все еще находится на ранних стадиях развития. Некоторые авторы утверждают, что патоморфологи станут в еще большей степени незаменимыми, поскольку их опыт будет иметь решающее значение для разработки алгоритмов и собственно обучения ИИ (с учителем) [3]. Специалисты будут играть ключевую роль в оценке качества и адекватности образцов отобранных тканей для ИИ при исследовании конкретных областей препарата как значимых [4]. С другой стороны, патологоанатомы вместе с рентгенологами, возможно, перейдут в будущем в статус IT-специалистов, управляющих наборами метаданных, клиническим контекстом информации, извлеченной с помощью ИИ, а не получающих информацию исключительно из самих изображений вручную [5].
В ряд задач настоящего обзора входит рассмотрение ключевых технологий и достижений цифровой патологической анатомии в области развития ИИ-инструментов патологоанатома. В области компьютерной патологической анатомии ИИ продемонстрировал большой потенциал в повышении качества и доступности диагностических решений патологоанатомов [6, 7]. В логике данного обзора определения слабого и сильного ИИ приведены в целях разграничения применения нейронных сетей и перспективных систем сильного ИИ с признаками общего интеллекта.
Ключевая технология анализа изображений — сверточные нейронные сети
Сверточные нейронные сети (СНС) играют ведущую роль в конвейерах обработки изображений, используемых в цифровой патологической анатомии [8]. Первым шагом, который проходит цифровое изображение образца, является тесселяция («замощение», термин из компьютерной графики) целых изображений срезов (WSI — whole slide image, англ.). После данной процедуры модели ИИ могут анализировать фрагменты изображений, чтобы извлечь закономерности и связать их с целью исследования [8]. Распространенный подход заключается в обучении модели ИИ решению контролируемой задачи классификации, в которой «плитки» помечаются (аннотируются), а модель прогнозирует метку на основе данных изображения. СНС являются наиболее часто используемой сетевой архитектурой для анализа изображений. У них есть специализированные сверточные слои, которые идентифицируют шаблоны и текстуры, а их выходные данные называются функциями. Исследователи часто используют трансферное обучение, когда предварительно обученная модель применяется к новому набору данных, что экономит время и ресурсы. Трансформаторы зрения — это новый класс сетей, который перспективен за пределами медицины, но СНС по-прежнему хорошо справляются с задачами вычислительной патологии [9].
Слабый искусственный интеллект в практике патологоанатома, стандартизация документации ИИ-инструментов
Поскольку общедоступные наборы данных для машинного обучения размещены онлайн, исследователи, не имеющие авторских наборов, могут обучать собственные модели, а имеют возможность и использовать один и тот же набор данных в качестве стандартного теста в совместных многоцентровых исследованиях, сравнивая производительность каждого алгоритма ИИ [10]. В таблице представлены ключевые ИИ-технологии и наборы данных для обучения слабого ИИ, способные диагностировать опухоли и составлять прогноз по данным диагностики.
Ключевые работы, в которых представлены технологии ИИ-диагностики, базирующиеся на слабом искусственном интеллекте
Специализация ИИ | Источники |
Диагностика: | |
рака мочевого пузыря | [11—13] |
рака молочной железы | [14—16] |
колоректального рака | [17—19] |
опухолей центральной нервной системы | [20—22] |
рака шейки матки | [23—25] |
опухолей мягких тканей (мышц) | [26] |
рака щитовидной железы | [27, 28] |
рака кожи | [29] |
рака простаты | [30] |
опухолей гематопоэтической системы | [31, 32] |
Диагностика и прогноз: | |
рака легких | [33—36] |
рака желудка | [37—39] |
Диагностика и классификация опухолей лимфоидной ткани | [40—45] |
Определение метастатического поражения лимфатических узлов | [46—49] |
Такая широта спектра распознаваемых и классифицируемых объектов была немыслима даже 5 лет назад, но следует отметить, что ни одна из приведенных разработок не претендует на роль универсального классификатора. Машинное обучение часто использует методы статистики, которые существенно отличаются от традиционных. Эти инновационные подходы предлагают гибкость и мощные модели прогнозирования [50]. Однако несмотря на ограниченное понимание того, как эти методы создают модели классификации изображений и их фрагментов, и неполное раскрытие лежащих в их основе данных, они часто все равно приводят к важным выводам, пусть и основанным на методологически несовершенных исследованиях. В целях решения этой проблемы сетевая организация специалистов по применению ИИ «Equator Network» разработала согласованные рекомендации по составлению отчетов о моделях прогнозирования [50]. Эти руководящие принципы способствуют стандартизации отчетности, позволяя правильно интерпретировать выводы в соответствующем контексте и прозрачно раскрывать методологические сильные и слабые стороны ИИ-инструментов. Кроме того, сеть Equator создала рекомендации TRIPOD (прозрачная отчетность многовариантной модели прогнозирования для индивидуального диагноза и прогноза) и STARD (стандарты отчетности по исследованиям диагностической точности). Без стандартизации разнообразных программных решений повсеместное внедрение их в клиническую практику видится проблематичным [50].
Сильный искусственный интеллект и перспективы его применения в клинической патологической анатомии
При обработке естественного языка применяются модели статистические, вычислительные и искусственного интеллекта для анализа больших объемов текста. Большие языковые модели (LLM — large language models, англ.), такие как генеративный предварительно обученный преобразователь (GPT — generative pretrained transformer, англ.), являются важными инструментами, также использующими нейронные сети. LLM обучаются с использованием огромных объемов текстовых данных из Интернета или текстовых баз, что позволяет им преуспеть в решении таких задач, как перевод, обобщение текста и ведение диалога. LLM — это искусственные нейронные сети, которые могут содержать от миллиарда до триллиона «весов» и (предварительно) обучаться с использованием самоконтролируемого и полуконтролируемого обучения [1].
Особая архитектура искусственных нейронных «сетей-трансформеров» способствовала более быстрому их обучению [51]. LLM демонстрируют впечатляющие способности к рассуждению и решению задач, могут отвечать на вопросы и участвовать в беседе с неопытными пользователями. Такие модели, как ChatGPT и LIMA, несмотря на текущие дебаты вокруг них, потенциально могут внести большой вклад в патологическую анатомию [51]. В здравоохранении языковые модели применяются в качестве виртуальных помощников в телемедицине, медицинском образовании, исследованиях, клинических испытаниях. Они способны помочь в обучении специалистов, диагностике, навигации по информации, сравнении изображений и обзоре литературы. Также предпринимаются усилия по разработке моделей субтитров к изображениям на основе глубокого машинного обучения, которые включают текстовые описания цитопатологии. Эта модель может учиться на текстовых подписях, созданных экспертами, для интерпретации изображений и создания последовательных текстовых интерпретаций [51].
Тестирование клинических знаний ИИ-помощников врача, контроль качества работы моделей
Большие языковые модели (LLM) продемонстрировали замечательные возможности, но доведение их до соответствия требованиям, предъявляемым к изделиям, применяемым в клинической практике, является сложной задачей, сходная проблема присуща и слабым ИИ [1]. Оценка клинических знаний языковых моделей обычно опирается на автоматизированные оценки с использованием ограниченных критериев [52]. Для оценки знаний ИИ используется тест MultiMedQA, который объединяет шесть существующих наборов данных для ответов на медицинские вопросы, охватывающие всю традиционную медицину, исследования, потребительские запросы, и новый набор данных под названием «HealthSearchQA», состоящий из медицинских вопросов, найденных в Интернете. Для оценки ответов модели предлагается структура оценки, которая учитывает различные аспекты, такие как фактология, понимание, рассуждение, потенциальный вред и предвзятость. В исследовании оценивали производительность Pathways Language Model1 (PaLM), LLM с 540 млрд параметров, а также ее настраиваемого варианта, используя MultiMedQA [52]. Flan-PaLM достигает высочайшей точности для всех наборов данных с множественным выбором в рамках MultiMedQA, точность новой модели составила 67,6% (превышен предыдущий уровень более чем на 17%) [53, 54]. Однако человеческая оценка выявляет значительные пробелы в эффективности модели, обученной в том числе на корпусе патолого-анатомических текстов [53, 54]. По мере того, как достижения в области больших языковых моделей и мультимодальных методов (работают с несколькими видами информации: текстовой, графической, аудио, проприорецептивной и др.) продолжают будоражить воображение общественности, развитие мультимодальных больших языковых моделей общего назначения (MLLM) резко ускорилось, однако область патологической анатомии в этом отношении в значительной степени осталась неосвоенной.
PathAsst: ИИ-патологоанатом
В целях сокращения отставания патологической анатомии в вопросе внедрения сильных ИИ разработан PathAsst, который представляет собой генеративный помощник на базе ИИ [55]. Для разработки PathAsst было собрано более 142 тыс. высококачественных пар изображений и текстов из различных надежных источников, включая PubMed, полные учебники по общей и частной патологии, авторитетные экспертные веб-сайты и частные данные [55]. Используя расширенные возможности ChatGPT/GPT-4, авторы сгенерировали более 180 тыс. образцов [55]. Кроме того, разрабатываются дополнительные данные, служащие инструкциями, специально предназначенными для коммуникации с моделями, специфичными для патологической анатомии, которые позволяют PathAsst эффективно взаимодействовать с этими моделями на основе входного изображения и намерений пользователя и расширять диагностические возможности PathAsst [55]. Впоследствии PathAsst будет обучаться на основе языковой модели Vicuna-13B в координации с видеокодером CLIP. Результаты внедрения PathAsst в будущем продемонстрируют огромный потенциал использования модели генеративного типа на базе сильного ИИ для улучшения процессов диагностики и лечения. Доступен исходный код тщательно подобранного набора данных, а также комплексного набора инструментов, предназначенного для помощи исследователям в обширном сборе и предварительной обработке их собственных наборов данных [55].
ChatGPT как помощник патологоанатома
ChatGPT, разработанный OpenAI, поможет улучшить результативность патолого-анатомических бюро и отделений/лабораторий больниц за счет автоматизации ответов на запросы клиницистов. Очевидно, что чат-бот как инструмент не будет полезен самому патологоанатому. На данном этапе процедуры трансляции информационной технологии применения ИИ-чат-ботов в клиническую практику необходимы дополнительные исследования, чтобы количественно определить точность формулировок чат-ботов, обоснованность и этические последствия применения предложенных ими ответов. Текущий статус и понимание ChatGPT в области диагностики в патологической анатомии подробно рассмотрены и объективно недостаточны: не подвергается сомнению лишь способность ChatGPT быстро собирать огромные объемы текстовых данных и другой информации [56, 57].
Можно сделать следующие выводы о применении ИИ-ассистентов в патологической анатомии:
1. Чат-боты способны эффективно обобщать большие объемы данных по конкретным темам.
2. Требуется тщательная проверка и валидация интеграции ChatGPT и других чат-ботов в клинической медицине.
3. Патологическая анатомия — это область, в которой недостаточно исследований по применению технологии чат-ботов.
4. Будущие версии ChatGPT могут быть улучшены за счет расширенного доступа к надежным и более разнообразным специализированным медицинским данным.
5. Технология потенциально может улучшить гистопатологические диагнозы за счет интеграции когнитивной оценки с клиническими, фундаментальными и микроскопическими данными, а также вспомогательными исследованиями и комбинированием технологий слабого и сильного ИИ.
Патологическая анатомия потенциально может претерпеть значительную трансформацию благодаря использованию ИИ, однако существует несколько серьезных препятствий на пути интеграции технологии в практику. Точность алгоритма ИИ сильно коррелирует с объемом используемых данных. В исследовании, проведенном G. Campanella и соавт. [58], ошибка валидации уменьшилась примерно в 10 раз, когда количество проанализированных случаев было увеличено в 100 раз, фактически лишь часть гистопатологических образцов может быть доступна в цифровом формате, пригодном для компьютерного анализа. Кроме того, процесс цифровизации коллекций препаратов требует значительных первоначальных инвестиций. Ожидается, что доля информации в цифровом формате значительно увеличится в среднесрочной перспективе, вероятно, в течение следующего десятилетия, но всесторонняя оценка и точное описание этих данных экспертами-патологами по-прежнему не произойдут. Ключевой недостаток (часто называемый проблемой «мусор на входе — мусор на выходе») имеет серьезные последствия для качества данных и решений, принятых машиной на их основании, что существенно влияет на точность моделей ИИ. Российская Федерация нуждается в разработке собственного руководства по цифровой патологической анатомии и повсеместного внедрения цифровых методов в патолого-анатомических бюро и отделениях/лабораториях лечебных учреждений. В настоящее время главным препятствием для использования методов на основе ИИ является почти полное отсутствие проспективных рандомизированных многоцентровых исследований таких продуктов и приборной базы в регионах (как для разработки/применения систем, так и для накопления данных). Требуются усилия для проведения таких исследований и определения адаптированных к реальности отечественного здравоохранения решений ИИ, которые улучшат результаты диагностики и повысят эффективность лечения пациентов.
В сообществе компьютерных патологов также есть мнение, что ИИ окажет значительное влияние на область в ближайшее десятилетие, особенно, в отношении повышения точности диагностики [58, 59]. Ожидается, что к 2030 г. несколько алгоритмов будут широко использоваться, в том числе те, которые полностью заменят патологоанатомов при выполнении конкретных задач. Тем не менее по-прежнему отсутствует консенсус относительно ожидаемого влияния ИИ на время диагностики и эффективность, диагностические алгоритмы патологоанатома и удовлетворенность пациентов, а также нет единого мнения касательно нормативных, правовых и этических аспектов, связанных с интеграцией ИИ. Результаты опроса патологоанатомов подчеркивают необходимость проспективных клинических испытаний, изучающих влияние алгоритмов клинических рекомендаций, включающих ИИ, на ключевые показатели эффективности, а также критическую важность решения текущих нормативно-правовых проблем внедрения и применения ИИ.
Авторы заявляют об отсутствии конфликта интересов.