Обращение к читателю. Зачем нужна доказательная медицина?
Длительный опыт работы в диссертационных советах, в редакционных коллегиях отечественных и зарубежных медицинских изданий, систематическое участие в международных съездах и конференциях позволяют утверждать, что на сегодняшний день у отечественных коллег существуют значительные резервы для понимания и использования принципов и положений, составляющих понятие доказательная медицина. На наш взгляд, главная причина в том, что отстает, в первую очередь, подготовка профессионального сообщества всех уровней к изучению, освоению и, в конечном итоге, восприятие принципов доказательной медицины в качестве полезного набора рабочих инструментов и их свободного использования в повседневной практике.
Причины появления интереса к доказательности в медицине, особенно в нашей стране, кроются в появлении новых требований и в смещении ориентиров оценки деятельности практически любого работника медицинской отрасли. Медицина была и остается научной областью деятельности. Из деклараций это переходит в повседневную жизнь. Отсюда появление повышенного интереса к публикационной активности и связанной с этим понятием потребности изменить собственный подход к планированию и выполнению в первую очередь регулярной исследовательской работы, включая диссертационные работы, клинические исследования и все, что можно отнести к научной деятельности в любом разделе медицины, причем во всех звеньях лечебно-профилактической работы.
Почему в общем виде этим следует интересоваться и почему нужно популяризировать доказательную медицину? Практика руководства отраслью, внезапное появление требований к исполнителям без подготовки мнения профессионального сообщества приводит к неправильным реакциям и замедлению внедрения новшества, поскольку врачи не видят очевидных выгод для себя и расценивают новшества как очередную нагрузку, которая не помогает им, а отвлекает от выполнения основных и понятных обязанностей. Активное или пассивное сопротивление контрпродуктивно. Оценка самого явления как очередной бюрократической причуды только замедляет прогресс. А описанная реакция закономерна в основном по одной простой и давно известной причине — появление новшества, даже самого полезного, никто не готовит. Сначала появляется распоряжение, затем чаще всего командно-нажимным способом заставляют выполнять его и наказывают за несвоевременное и ненадлежащее исполнение.
Публикаций, посвященных доказательной медицине немало, однако ощущается дефицит именно практически направленных руководств и установок, представлено незначительное количество докладов.
Данная публикация открывает собой систематический цикл, который планируется регулярно публиковать в нашем журнале. Мы надеемся, что вместе с последующими циклами публикаций на сходные актуальные темы он окажет практическую помощь коллегам.
История доказательной медицины, основные вехи
В мировой статистике клинических исследований, по данным Управления по санитарному надзору за качеством пищевых продуктов и медикаментов США (Food and Drug Administration, FDA), наша страна занимает устойчивое второе место по абсолютному количеству участников (6875) и по процентному отношению к мировым цифрам участников клинических исследований (5,22%) [1]. Такая статистика, с одной стороны, радует, а с другой стороны, выдвигает требование к повышению общего уровня овладения предметом не только в относительно немногочисленных передовых крупных учреждениях, но и в целом по стране. В принципе упорядочение любой медицинской, особенно врачебной, деятельности имеет в основе доказательность, начиная с доказывания самому себе правильности выбора диагностических, лечебных или профилактических мероприятий в каждодневной практической работе с конкретными пациентами. Это не открытие, пытливость и стремление к прогрессу отличали врачебное сословие со дня его появления. Особенность современного момента состоит в невиданном ранее повышении темпов жизни вообще и сокращении сроков принятия решений в частности, нарастании потоков информации, повсеместном диктате финансов и финансирующих и в спорном по целесообразности, но императивном внесении приемов производственного и торгового менеджмента в отрасль. Все это по современным определениям — вызовы. И противостоять им можно только одним продуктивным способом — осваивая новые технологии, в первую очередь те, которые помогают врачу эффективно, а значит с пользой для пациента и без постоянного стресса и ущерба для себя радостно и с энтузиазмом работать. Освоение принципов доказательной медицины не является панацеей от всех проблем, но опыт отечественных и зарубежных коллег, которые их используют, говорит о том, что это весьма полезный и необходимый навык, реально повышающий квалификацию и самооценку любого коллеги. Хотя в основе самого понятия и совершенствования лежал и лежит исключительно практический замысел.
Терминология — основа успешного освоения любой новой информации, а в случае доказательной медицины это особенно важно. Единая или единообразная, по крайней мере, терминология — необходимый элемент. Наличие значительного, то есть больше двух, количества терминов, обозначающих одно и то же (субъект или явление) приводит к негативному эффекту — практик просто отвергает саму систему, их использующую. Для того чтобы разобраться, что же представляет собой доказательная медицина, следует дать этому термину определение.
Доказательная медицина — это точное и осмысленное использование лучших результатов клинических исследований для принятия решений в оказании помощи конкретному пациенту [2].
Истоки доказательной медицины можно найти и в древней Греции, и в Библии: Книга Давида, Глава 1:1-16. Когда дети Израиля были пленниками в Вавилоне, они должны были есть вавилонскую пищу. Дети Израиля спросили, могут ли они вместо этого придерживаться вегетарианской диеты. Сравнение детей Израиля с вавилонской молодежью показало, что вегетарианская диета была более здоровой [3].
Первое опубликованное контролируемое исследование проведено в 1747 г. Джеймсом Линдом (James Lind) (рис. 1). Будучи корабельным врачом, Дж. Линд столкнулся с распространенным заболеванием среди мореплавателей того времени — цингой. Разделив моряков на шесть групп по 2 человека, он назначил им разное лечение. Первая группа получала кварту сидра ежедневно, другая — двадцать пять капель купороса, третья — шесть ложек уксуса в день, четвертая — половину пинты морской воды, пятая — два апельсина и лимон, шестая — пряную пасту или напиток из ячменной воды. Лечение пятой группы закончилось через шесть дней, когда кончились фрукты, но к этому времени моряки почти полностью выздоровели [3].
Рис. 1. Основные вехи развития доказательной медицины.
Еще один из основоположников экспериментального метода в медицине — Пьер-Шарль Александр Луи (Pierre-Charles Alexandre Louis) (1787—1872), — французский врач, сравнивший эффективность различных видов кровопускания. В его исследовании присутствовали группы сравнения и даже элементы количественного анализа. Подобных исследований было значительно больше, но публикационная активность в те времена была весьма низкой, и об этих исследованиях знало очень небольшое количество людей.
В России в этот период также проводились клинические исследования, например, в 1829—1830 гг. в Санкт-Петербурге М.Е. Дином, который, выявляя лечебную эффективность гомеопатических средств, применял плацебо и слепой метод. В результате доказана несостоятельность гомеопатической концепции и такой вид лечения даже был запрещен в России [3].
Сам термин «доказательная медицина» или evidence-based medicine (EBM) в научных публикациях впервые появился в 1992 г. Гордон Гайят (Gordon Guyatt) использовал этот термин в своей статье для описания нового подхода к обучению медицинской практике, чуть ранее в 1990 г. он упоминал его в своих лекциях в Университете Макмастера (McMaster University, Торонто, Канада) [4].
Однако сама концепция медицины, основанная не на экспертном мнении, а на доказательствах, появилась еще в 1960 г. Все больше врачей и ученых обращали внимание медицинского сообщества на недостатки распространенного в то время способа принятия клинических решений, что подтверждалось, например, «талидомидной трагедией», получившей огромную огласку в средствах массовой информации. В США под влиянием этого трагического события сенатор Эстес Кефовер в 1959 г. начал проводить в Конгрессе слушания об опасениях по поводу практик фармацевтической промышленности, таких как предполагаемая высокая стоимость и неопределенная эффективность многих лекарств, продвигаемых производителями. Только в 1962 г. внесены поправки в закон, по которому все заявки на новые лекарственные препараты должны были продемонстрировать «существенные доказательства» эффективности лекарственного средства, и это помимо демонстрации безопасности, что ознаменовало начало процесса утверждения Управления по санитарному надзору за качеством пищевых продуктов и медикаментов (Food and Drug Administration, FDA) в его современной форме [5].
В начале 60-х годов XX века Сюзанна Флетчер (Suzanne Fletcher) и Роберт Флетчер (Robert Fletcher) активно поддерживали концепцию принятия клинических решений на основе доказательств. Результатом их работы стал учебник «Клиническая эпидемиология: основы» (Clinical Epidemiology: The Essentials), опубликованный в 1982 г. и описывающий научные основы клинической помощи [6].
Элван Файнштейн (Alvan Feinstein), эпидемиолог, математик и ревматолог в серии публикаций в журнале Annals of Internal Medicine (1967 г.) уделил большое внимание роли клинических рассуждений и выявленных предубеждений (bias), а также ввел термин клиническая эпидемиология. Свои принципы он подтвердил на практике. Работая в Нью-Йорке ревматологом, Э. Файнштейн доказал, что установление диагноза ревматическая лихорадка и отличия доброкачественных шумов от патологических основаны больше на клиническом авторитете, а не научных критериях. Позже Э. Файнштейн создал классификацию болезни, что помогло более эффективно лечить пациентов [6].
В 1967 г. под руководством декана университета Джона Эванса (John Evans) и профессора Фрейзера Мастарда (Fraser Mustard) клиническая эпидемиология стала официальным курсом обучения в медицинской школе Университета Макмастера. Возглавил новый курс 32-летний Дэвид Сакетт (David Sackett), который позже многими будет признан одним из основоположников доказательной медицины. На курсе преподавались способы внедрения эпидемиологических и биометрических методов для изучения диагностического и терапевтического процесса с целью улучшения состояния здоровья пациента. В 1981 г., после нескольких лет работы курса клинической эпидемиологии, Д. Сакетт и его коллеги решили поделиться своими разработками и опубликовали серию статей в журнале Canadian Medical Association Journal о «критической оценке» («critical appraisal») — правилах чтения научной литературы [7]. В 1985 г. авторы начали работу над «библией» доказательной медицины — книгой «Клиническая эпидемиология: научная основа для клинической медицины» (Clinical Epidemiology: a Basic Science for Clinical Medicine) [8].
Позже директором курса стал уже известный нам Гордон Гайятт, который вместе со своими коллегами продолжил работу, начатую его предшественниками. Гайятт и его коллеги начали сотрудничать с американскими учеными, сформировав международную рабочую группу по доказательной медицине в 1992 г. В период с 1993 по 2000 г. рабочая группа из Университета Макмастера опубликовала в JAMA методы для широкой аудитории врачей в серии из 25 статей, которые позже были объединены в «Руководство по использованию медицинской литературы» («Users’ Guides to the Medical Literature») [9].
Рассказ о зарождении доказательной медицины будет неполным без упоминания Арчибальда Лемана Кокрана (Archibald Leman Cochrane) — шотланского врача и эпидемиолога. На протяжении всей своей карьеры он боролся с субъективностью (bias) в медицине и являлся ярым сторонником проведения рандомизированных контролируемых исследований (РКИ). Ярким примером его идеологии является тот факт, что даже находясь в тюрьме во время Второй мировой войны, А.Л. Кокрейн провел свое первое испытание на других военнопленных, сравнивая влияние дрожжевого экстракта на гиповитаминоз. Его сострадание к испытуемым, которые были его товарищами и сокамерниками, повлияло на его будущую работу. Позже А.Л. Кокрейн организовал крупное исследование, пытаясь определить влияние туберкулеза и пыли на развитие прогрессирующего легочного фиброза — исследование Rhondda Fach (1948 г.). Некоторые из наиболее ценных уроков, которые он извлек из исследования Rhondda Fach, включали ценность эпидемиологических исследований и угрозу предвзятости (bias) исследования. Позже Арчибальд Кокрейн организовал первое рандомизированное исследование роли аспирина в профилактике сердечно-сосудистых заболеваний. В 1972 г. он выполнил один из первых систематических обзоров. На основании своего опыта в 1972 г. А.Л. Кокрейн опубликовал книгу «Действенность и эффективность: случайные размышления о медицинской службе» («Effectiveness and Efficiency: Random Reflections on Health Services»), в которой обосновывал целесообразность использования РКИ для улучшения качества медицинской помощи. Эта книга также является одной из важнейших для становления доказательной медицины. Дело Арчи Кокрейна продолжили Том Чалмерс, Ян Чалмерс и Мюррей Энкин, организовавшие в 1992 г. «Кокрановское сотрудничество» (Cochrane Collaboration) в Оксфорде при поддержке Национальной службы здравоохранения Великобритании (NHS) [6, 10].
Том Чалмерс расширил работу А.Л. Кокрейна. Он утверждал, что РКИ являются основой иерархии доказательств, кульминацией которой становятся объединенные данные нескольких испытаний. Он добавил, что при обобщении доказательств необходимо учитывать предвзятость публикации, то есть тот факт, что исследования с положительными результатами с большей вероятностью будут опубликованы, чем исследования с отрицательными результатами. Ему приписывают введение метаанализа. Акушер Ян Чалмерс, работая в лагерях палестинских беженцев в 60-х годах XX века, на собственном опыте убедился в опасности подчинения медицинским догмам и в том, что поиск достоверной информации имеет жизненно важное значение. Ян Чалмерс объединился с акушером Мюрреем Энкиным для создания обширной базы данных опубликованных, неопубликованных, текущих и запланированных исследований и метаанализов [6].
Объединив усилия, трое ученых по аналогии Оксфордской базы данных перинатальных исследований в 1993 г. создали сообщество, целью которого является формирование систематических обзоров эффективности различных медицинских вмешательств, важных и полезных для принятия врачебных решений. Назвали сообщество в честь одного из отцов доказательной медицины — Арчибальда Кокрейна, а эмблемой стало схематическое изображение результатов одного из первых систематических обзоров об эффективности короткого курса кортикостероидов, который назначали беременным с высоким риском преждевременных родов; тогда удалось доказать, что таким образом риск смерти новорожденных можно снизить на 30—50% [10].
Процесс совершенствования всех элементов системы доказательной медицины ведется непрерывно, особенно интенсивно с конца 90-х годов прошлого века и по сей день в разных странах мира. Лидирующие позиции в развитии доказательной медицины занял созданный в Университете Оксфорда Центр доказательной медицины (Centre for Evidence-Based Medicine, CEBM). CEBM является частью Департамента первичной медицинской помощи в отделении Оксфордского университета в Наффилде, позиционирует себя как некоммерческая организация, занимающаяся практикой, обучением и распространением высококачественной доказательной медицины для улучшения здравоохранения в повседневной клинической практике. Исследовательский отдел Центра издает руководства по доказательной медицине. В настоящее время изданы два руководства — в 2009 и 2011 г. Это и выдвинуло этот центр на первые позиции в мире по разработке проблем доказательной медицины [11].
Основные термины доказательной медицины
Для лучшего понимания доказательной медицины необходимо разбираться в основных терминах, которые разъяснены ниже.
Зависимая и независимая переменная
Математические инструменты, используемые для количественного контроля любого научного эксперимента, называются зависимыми и независимыми переменными. Для приближения к рассматриваемым проблемам целесообразно адаптировать точные, но общие определения к рассматриваемым типам исследований.
Зависимые переменные — это получаемые в завершенном исследовании результаты.
Независимые переменные — это те новые условия и параметры в количественном выражении, которые вносятся в ходе экспериментального исследования (изменение доз, способов операции, параметров обследования и т.д.).
В общем виде в экспериментальном исследовании для более точного определения величины зависимой переменной, то есть для максимального приближения результатов исследования к истинному положению вещей, исследователи стремятся применять оптимальные сочетания независимых переменных, то есть строить исследование рационально и адекватно поставленным целям.
Независимые переменные — это переменные, значениями которых можно управлять, а зависимые переменные — это переменные, которые можно только измерять или регистрировать.
Зависимая переменная, или переменная ответа, зависит от независимой переменной. Любое изменение в независимой переменной влияет на зависимую переменную. В действительности зависимые переменные — это те значения, которые фактически измеряются исследователем без предположений и сомнений. И это как бы данность.
Разберем на примере, чем же отличаются зависимая и независимая переменные. В эксперименте исследователь изучает влияние дозы препарата А на уровень ферментов печени, в данном случае концентрация препарата А — это независимая переменная, а уровень ферментов печени — зависимая. Или, например, мы хотим узнать, какая из операций, А или Б, имеет меньше осложнений в виде послеоперационного кровотечения, в данном случае тип операции — независимая переменная, а частота развития осложнений — зависимая.
В большинстве научных исследований делается попытка показать связь между двумя переменными — зависимой и независимой, то есть как одна переменная (независимая переменная) влияет на другую (зависимую переменную). Если исследователь может утверждать, что независимая переменная вызывает зависимую переменную, то он сделал самое сильное утверждение в исследовании:
H0=H1 исследование.
Когда есть большая вероятность того, что другие переменные могут повлиять на результат, исследование имеет низкую внутреннюю достоверность. Хорошие исследования всегда разрабатываются таким образом, чтобы минимизировать вероятность того, что любые переменные, кроме независимой переменной, влияли на зависимую переменную.
Независимая переменная — все то, что применено нами в процессе работы с пациентом или тест-системой. Зависимые переменные — это те результаты, которые получены в ходе работы. Все результаты медицинских и прикладных медико-биологических исследований конкретны.
Экспериментальное и обсервационное исследование
Достаточно давно в науке, и не только биомедицинской, осуществлено разделение на экспериментальные и обсервационные исследования. Их основное отличие состоит в том, что в экспериментальных исследованиях исследователь контролирует большинство переменных, то есть вмешивается в ход исследования. В обсервационном исследовании исследователь только наблюдает и не изменяет ни одну из переменных (табл. 1, 2).
Таблица 1. Сравнение экспериментального и обсервационного исследований
Параметры различий | Экспериментальное исследование | Обсервационное исследование |
Примеры | Рандомизированное контролируемое исследование. Экспериментальное исследование с использованием лабораторных животных | Когортное. Кейс-контроль. Перекрестное. Серия случаев. Отдельные случаи. Мнение эксперта |
На чем базируется формирование групп | Группы формирует исследователь | На «естественных условиях»: привычки, генетика, социальные условия, окружающая среда и прочее |
В каких разделах медицины применяется | «Золотой стандарт» для исследования эффектов лечения и профилактики | Влияние медицинских и немедицинских факторов на здоровье человека. Исследования в области этиологии и патогенеза, диагностики и прогноза исхода заболевания |
Таблица 2. Достоинства и недостатки экспериментального и обсервационного методов исследований
Оценка | Экспериментальные исследования | Обсервационные исследования |
«ЗА» | Высокая доказательность. Рандомизация и скрытность. Позволяет установить причину явления | Может потребоваться меньше ресурсов и времени. Меньше этических проблем при выполнении. Хорошо при исследовании редких случаев |
«ПРОТИВ» | Может требовать для выполнения больше ресурсов и/или времени. Для многих задач требует этических разрешений. Трудно для выполнения, если заболевание или воздействие редко встречается | Ниже доказательность, поскольку трудно выявить истинную причину явления. Нет рандомизации и скрытности |
Экспериментальный метод является «золотым стандартом» для исследований всех аспектов лечения и профилактики. Наиболее распространенными и точными видами таких исследований являются РКИ, а также контролируемые экспериментальные исследования с использованием лабораторных животных, культур клеток и тканей.
Казалось бы, проблема выбора метода решена, раз имеется «золотой стандарт». Однако не все вопросы, которые ставятся перед исследователями в области медицины, могут быть решены с помощью только экспериментальных методов. Для решения вопросов важности и влияния различных медицинских воздействий и факторов окружающей среды на возникновение и течение заболеваний и здоровье человека более точным и осуществимым является применение обсервационного метода. Влияющие факторы включают этиологию и патогенез, профилактику, диагностику и прогноз.
Контролируемое и неконтролируемое исследование
Контролируемое (иногда используется синоним «сравнительное») клиническое испытание — это испытание, в котором исследуемый препарат, эффективность и безопасность которого еще не полностью изучены, сравнивается с препаратом, эффективность и безопасность которого хорошо известны (сравнительный препарат). Это может быть плацебо, стандартная терапия или вообще отсутствие лечения.
Контролируемое исследование (Controlled study) — всякое исследование, в котором контролируются (и по возможности минимизируются или исключаются) потенциальные источники систематических ошибок. Пример контролируемого исследования — сравнение эффективности лечения язвенной болезни желудка омепразолом и фамотидином.
В неконтролируемом (несравнительном) исследовании группа контроля или сравнения (группа испытуемых, принимающих препарат сравнения) не используется. В более широком смысле под контролируемым исследованием имеется в виду всякое исследование, в котором контролируются (по возможности минимизируются или исключаются) потенциальные источники систематических ошибок (то есть оно проводится в строгом соответствии с протоколом, мониторируется и т.д.).
Неконтролируемые испытания часто используются на ранних этапах исследований лекарственных средств, фазах I и II, для определения фармакокинетических свойств или изучения диапазонов переносимых доз. Они также используются для изучения побочных эффектов, переносимости, взаимодействия или эффективности лекарств. Поскольку они могут вызвать определенную систематическую ошибку, результаты неконтролируемых испытаний считаются менее достоверными, чем результаты контролируемых испытаний. Результаты обычно сравнивают с результатами, полученными в предыдущих исследованиях или опубликованными другими исследователями.
Примером неконтролируемого исследования может служить изучение влияния препарата А на сократимость желудка у пациентов с гастростазом. В данном случае сравнивают пациентов до и после лечения, группы сравнения нет.
Искажения или систематические ошибки (bias)
Искажения в исследованиях эффективности лечения — это влияния и факторы, способные привести к выводам о результатах лечения, которые систематически отличаются от истины.
В классификации Всемирной организации здравоохранения (ВОЗ) различают два вида искажений.
Первый вид искажений можно обозначить как ошибку отбора (selection bias). Ошибка отбора или искажение отбора — это выбор образца исследования из общей популяции, который не является случайным. Это приводит к формированию группы участников исследования, не являющейся репрезентативной для всей популяции, и к результатам, которые не могут быть обобщены для популяции (низкая внешняя достоверность). Типичным примером являются исследования с добровольным участием испытуемых (смещение самоотбора). В этом случае те, кто решит стать волонтером, скорее всего будут отличаться от тех, кто решит не участвовать.
Второй вид искажений обозначается как обсервационная (или информационная) ошибка (observation or information bias). Систематическая ошибка происходит, когда ключевая информация измеряется, собирается или интерпретируется неточно, т.е. информация собирается по-разному в каждой из двух групп, что приводит к ошибке в заключении ассоциации.
В зависимости от источника происхождения различают несколько вариантов обсервационных ошибок — ошибка воспроизведения (recall bias) возникает, когда участники не помнят точно предыдущие события и переживания или опускают детали: на точность и объем воспоминаний могут влиять последующие события и опыт. Ошибка воспроизведения является проблемой в таких исследованиях, как случай—контроль и ретроспективные когортные исследования, в которых пациенты оценивают свое состояние.
Например, в начале 2000-х годов широкую огласку вызвало утверждение о том, что вакцина против кори, эпидемического паротита и краснухи связана с аутизмом у детей и, возможно, вызывает его, однако оказалось, что заявление основывалось на полностью сфабрикованных результатах исследования. Позже исследователи обнаружили, что родители детей с аутизмом, которым установлен диагноз после такой публикации, как правило, вспоминали о начале аутизма вскоре после прививки чаще, чем родители аналогичных детей, которым установлен диагноз до публикации исследования [12].
Ошибка наблюдателя или исследователя (observer bias, experimenter bias, research bias) возникает в связи с систематическими различиями в методике сбора, регистрации и интерпретации исследователями информации, полученной у отдельных участников исследования независимо от дизайна исследований. Одним из известных примеров предвзятости наблюдателя является исследование Сирила Берта (Cyril Burt), психолога, наиболее известного своей работой о наследуемости IQ. Он считал, что дети из семей с низким социально-экономическим статусом чаще имели более низкий интеллект, чем дети с более высоким социально-экономическим статусом (R. Fancher, 1985). Его «научный» подход к тестированию интеллекта был революционным и «доказал», что дети из рабочего класса в целом имеют более низкий интеллект. Это привело в Англии в 60-х годах прошлого века к созданию двухуровневой образовательной системы, которая отправляла детей среднего и высшего классов в элитные школы, а детей рабочего класса — в менее престижные школы. Позже исследование С. Берта опровергнуто, и сделан вывод, что он фальсифицировал данные. Сейчас известно, что интеллект не передается по наследству [13].
Источником систематической ошибки в когортных исследованиях может послужить фактор потери обследуемых (loss to follow-up) в ходе динамического наблюдения, особенно если процент таких потерь существенно различается в зависимости от отношения обследуемых к изучаемому воздействию и его эффекту.
Достоверность
Достоверность, она же валидность, подразделяется на внешнюю и внутреннюю.
Внутренняя достоверность (internal validity) имеет отношение к экспериментальным исследованиям, с помощью которых оценивают влияние определенной терапии или хирургических вмешательств на конечный результат. Внутренняя достоверность в основном относится к исследованиям, с помощью которых пытаются установить причинно-следственную связь. Они не имеют отношения к наблюдательным и описательным исследованиям.
Внутренняя достоверность определяет, действительно ли изменение независимой переменной вызвало изменение зависимой переменной или на нее повлияли какие-либо другие факторы. Если наблюдаемые изменения вызваны или искажены посторонними факторами, то трудно сделать достоверное заключение о наличии причинно-следственной связи между независимыми и зависимыми переменными. Внутренняя достоверность является минимальным требованием к эксперименту, которое должно соблюдаться для получения достоверных выводов. Без соблюдения этого требования результаты эксперимента нельзя считать надежными. Контроль посторонних факторов, в свою очередь, — непременное условие признания внутренней достоверности эксперимента. Примером высокой внутренней достоверности можно считать эксперимент, в котором двум группам пациентов давали препараты A и B для лечения болезни C, группы отличались только по одному параметру — получаемому препарату, по остальным параметрам группы были полностью идентичны (масса тела, пол, возраст, характер питания, уровень физической активности и прочее), то есть исследователь полностью исключил любые другие факторы, которые могли бы повлиять на результат исследования.
Внутренняя достоверность — это способ оценить, насколько правильно подобран метод исследования.
Внешняя достоверность помогает ответить на вопрос: можно ли применить исследование к «реальному миру»? Если ваше исследование применимо к другим ситуациям, то внешняя валидность высока. Если исследование не может быть воспроизведено в других ситуациях, значит внешняя валидность низкая.
Оценка причинно-следственной связи — критерии Брэдфорда Хилла
В медицине иногда сложно отделить причину заболевания от механизма развития. С инфекционными заболеваниями все достаточно просто: имеется патоген, при заражении которым развивается заболевание. Однако с онкологическими заболеваниями все сложнее: некоторые канцерогены могут вызвать мутацию в гене, однако этого недостаточно, чтобы развилось онкологическое заболевание, для этого необходимо наличие генетической предрасположенности или нарушения в работе иммунной системы для запуска процесса канцерогенеза. Подобная многофакторность и вероятностная природа большинства взаимосвязей между вредным воздействием и развитием заболевания подразумевает, что выделение роли какого-то одного фактора довольно проблематично. Поскольку большинство взаимосвязей между вредным воздействием и развитием заболевания имеет вероятностный и многофакторный характер, эпидемиологи разработали руководящие принципы для выявления взаимосвязей, являющихся, по-видимому, причинно-следственными. Эти принципы первоначально были предложены сэром Остином Брэдфордом Хиллом (Sir Austin Bradford Hill) (1897—1991), английским эпидемиологом и статистиком (рис. 2). Он ввел представление о рандомизированном клиническом исследовании и вместе с Ричардом Доллом (Richard Doll) первыми продемонстрировали связь между курением сигарет и раком легких.
Рис. 2. Брэдфорд Хилл.
Выделяют 6 критериев Брэдфорда Хилла:
1) сила взаимосвязи; связь проявлений должна быть выраженной.
2) дозозависимый эффект — связь между причиной и следствием по отношению к лекарственному воздействию должна быть зависящей от дозы.
3) специфичность — устранение причины должно снизить или устранить проявление эффекта (следствия).
4) отсутствие временного несоответствия — причина должна предшествовать следствию.
5) биологическое правдоподобие — связь проявлений должна быть правдоподобной (то есть биологически значимой).
6) постоянство результатов — результаты разных исследований не должны противоречить друг другу.
Разберем примеры каждого из критериев. Классический пример первого критерия — исследования Персиваля Потта (Percivall Pott) о заболеваемости раком мошонки у трубочистов. В данном случае относительный риск (relative risk, RR) составляет почти 200, то есть трубочисты подвергались в 200 раз большему риску заболевания раком мошонки по сравнению с работниками других профессий. Чем дольше человек работал трубочистом, тем выше была вероятность развития рака мошонки — это применение второго критерия Хилла. Иллюстрацией третьего критерия является снижение риска развития рака кишечника при прекращении курения. Пример четвертого критерия Хилла — работа с химическим веществом винилхлоридом повышает риск развития ангиосаркомы печени в 100 раз, при этом вначале имеется контакт с химическим веществом и только затем развивается заболевание. Пример пятого критерия — развитие гепатотоксичности при применении того или иного химиотерапевтического препарата. Повышение уровней ферментов печени при химиотерапии объясняется участием печени во многих процессах метаболизма, более того, печень является первым органом на пути препаратов, поступающих в организм энтерально. Примером шестого критерия является ряд исследований как in vitro на клеточных культурах, так и на животных моделях, а также ретроспективные исследования, показывающие, что бензол и другие ароматические органические растворители могут приводить к развитию острого миелоидного лейкоза [14].
Пирамида, или Как использовать доказательную медицину
Одним из важных аспектов доказательной медицины является система оценки качества доказательств. Наверняка Вам встречалась диаграмма в виде пирамиды, отражающая иерархию доказательств в медицине.
Пирамида разделена на уровни, каждый возрастающий уровень представляет тип дизайна исследования, каждый последующий уровень имеет более высокое качество и надежность доказательств (рис. 3). Другими словами, по мере того, как мы поднимаемся по уровням пирамиды, мы более уверены в том, что результаты исследования менее подвержены статистическим ошибкам и более достоверны. В основании пирамиды лежат мнения экспертов и клинические случаи, на верхушке пирамиды — систематические обзоры и метаанализы.
Рис. 3. Пирамида доказательности.
Несмотря на простоту понимания пирамиды, она подвергалась критике, так как порой качество доказательств, полученных из метаанализов, было ниже, чем в хорошо контролируемом РКИ. Поэтому в начале 2000-х годов рабочая группа Система градации качества анализа, разработки и оценки рекомендаций (Grade of Recommendation, Assessment, Development and Evaluation, GRADE) разработала структуру, в которой достоверность доказательств основывалась на многочисленных факторах, а не только на дизайне исследования. GRADE используется для разработки клинических рекомендаций (табл. 3).
Таблица 3. Характеристика системы GRADE [9]
Качество доказательств | Дизайн исследования | Определение | Сила доказательств (рекомендаций) | Объяснение |
Высокое | Качественные метаанализы и систематические обзоры РКИ | Маловероятно, что проведение дополнительных исследований изменит уверенность в имеющемся подходе | Сильная | Большое количество высококачественных исследований доказали эффективность подхода/метода |
Среднее | Систематические обзоры и метаанализы когортных исследований и исследований случай—контроль | Появление результатов новых исследований имеет важное значение и, вероятнее всего, изменит существующий подход | Слабая (условная) | Неясно соотношение между риском и пользой от метода/подхода |
Низкое | Исследования случай—контроль, когортные исследования | Появление результатов новых исследований имеют важное значение и изменят существующий подход | Результаты исследований сильно варьируют, нельзя исключить влияние систематических ошибок | |
Очень низкое | Серии случаев, клинические случаи, мнения экспертов | Недостаточно данных | Неясно, является ли метод/подход рациональным |
Разберем на примере, как врач может применять принципы доказательной медицины. Для этого последовательно рассмотрим каждый из элементов доказательной медицины:
1. Формулировка клинического вопроса.
2. Поиск наилучших доступных доказательств.
3. Оценка достоверности доказательств (включая внутреннюю и внешнюю).
4. Применение доказательств на практике в сочетании с клиническим опытом и предпочтениями пациентов.
Для формулировки клинического вопроса предложена и активно используется система PICO или PICOT (аббревиатура составлена из первых букв составных частей системы):
— P (Patient) — обозначение предмета исследования, в нашем случае это пациент;
— I (Intervention) наименование воздействия;
— C (Comparison) по сравнению с каким воздействием или плацебо получены преимущества;
— O (Outcome) — результат, на который ориентированы врач и пациент;
— T (Time) — период, в течение которого получены данные.
Ценность PICOT заключается в возможности использовать ее в качестве своеобразного листа самоконтроля, который стандартизует и повышает уровень исследования на этапах планирования, выполнения и публикации результатов. Разберем на примере применение системы PICO(T). Допустим, к Вам пришел пожилой пациент с гипертонической болезнью умеренного риска, у Вас может возникнуть вопрос: снижает ли риск смертности у данной группы пациентов применение гипотензивных препаратов?
Для того чтобы правильно сформулировать вопрос по системе PICO(T), у нас есть все компоненты:
— P — пожилые пациенты (старше 65 лет);
— I — гипотензивная терапия;
— C — отсутствие гипотензивной терапии;
— O — смертность.
Вопрос в этом случае можно сформулировать следующим образом: снижает ли гипотензивная терапия смертность у пожилых пациентов с гипертонической болезнью умеренного риска?
Еще один пример для закрепления: увеличивается ли риск развития ишемического инсульта у пациентов с алкогольной зависимостью?
— P — группа людей без ишемического инсульта в анамнезе;
— I — злоупотребление алкоголем;
— C — пациенты, не страдающие алкогольной зависимостью;
— O — частота развития ишемического инсульта.
Самым эффективным для освоения данной методики является практическое применение полученных навыков, поэтому вспомните интересный клинический случай из своей практики и попробуйте самостоятельно составить клинический вопрос, основываясь на системе PICOT.
После формулировки клинического вопроса можно приступить к поиску информации. Самыми популярными базами данных для поиска информации являются MEDLINE (PubMed), EMBASE, Кокрановская библиотека, Google академия, также набирает популярность медицинский ресурс UpToDate, в России популярным является российский информационно-аналитический портал eLIBRARY.RU.
После поиска информации, основываясь на иерархии доказательств, необходимо оценить их достоверность, например, используя систему GRADE или другие системы для оценки определенного дизайна исследования, которые мы обсудим в последующих публикациях на данную тематику.
После оценки качества информации в исследовании, основываясь также на собственном клиническом опыте и предпочтении пациента, мы как клиницисты можем применить доказательство на практике. В этом и заключается реализация принципов доказательной медицины.
Заключение
С ростом темпа проведения различных клинических исследований практикующему врачу непросто быть в курсе последних методов лечения и диагностики и разобраться в их качестве. На помощь ему приходят принципы доказательной медицины, которые помогут разобраться в основных нюансах, выбрать из большого количества исследований только высокачественные и внедрить их в практическую деятельность. Мы, в свою очередь, надеемся, что серия статей по доказательной медицине поможет Вам разобраться в этой непростой, но важной теме.
Авторы заявляют об отсутствии конфликта интересов.