Уважаемая редакция! В номере 2 тома 18 журнала «Флебология» были опубликованы результаты двух рандомизированных контролируемых исследований «ДЕМО» и «ГОЛИАФ», выполненных одной группой авторов на базе единого учреждения и имеющих сходные методологические проблемы, которые вводят читателя в заблуждение и балансируют на грани фальсификации данных.
В исследовании «ДЕМО» авторы изучили влияние периоперационного использования дженерической формы микронизированной очищенной флавоноидной фракции на динамику вено-специфических симптомов при выполнении эндовенозной лазерной облитерации магистральной вены в сочетании с минифлебэктомией или склеротерапией [1]. В исследовании «ГОЛИАФ» изучалась эффективность применения гольфов универсального размера в отношении влияния на те же вено-специфические симптомы [2]. Работы были выполнены по сходному дизайну и оценивали изменение среднего значения суммы выраженности всех симптомов. В соответствии с широко известным консенсусом «SYM Vein Consensus» было оценено 11 симптомов, включая боль (ноющая, тупая, мозжащая); ощущение пульсации (пульсирующей боли); ощущение стеснения, сдавления; тяжесть; быструю утомляемость ног; ощущение отека; судороги; кожный зуд; «беспокойство» в ногах; ощущение покалывания; ощущение жара (или жжения) [3]. При этом авторы утверждают, что каждый из симптомов был оценен по 100-мм визуальной аналоговой шкале (ВАШ). Таким образом, сумма симптомов должна варьировать от 0 до 1100 мм, т.е. быть оцененной по 1100-мм ВАШ. В то же время при расчете объема выборок обоих исследований были заложены минимально значимые различия в 10 мм, что составляет около 1% от максимальной выраженности суммы симптомов и не может служить критерием эффективности, т.к. интервал воспроизводимости 100-мм ВАШ составляет не менее 9 мм, т.е. 9% [4]. На основании этого можно сделать вывод, что при исходном планировании исследований была допущена серьезная методологическая ошибка, не позволяющая однозначно интерпретировать их результаты. Но этим фактом критические замечания к работам не ограничиваются.
В результатах исследования «ДЕМО» указано, что медиана суммы значений ВАШ для 11 симптомов в основной группе составляла 28,9 мм до лечения и снижалась до 4,0 мм после лечения с медианой разницы в 24,0 мм. Это соответствует 2,6, 0,4 и 2,2% для 1100-мм шкалы и не может считаться клинически значимым. Если авторами были действительно получены такие цифры, то включенные пациенты фактически не имели субъективных симптомов хронических заболеваний вен. Более того, различия динамики симптомов в основной и контрольной группе (24,0 мм – 19,6 мм = 4,4 мм) не соответствуют заявленной разнице в 10 мм, что не позволяет однозначно отвергнуть нулевую гипотезу даже при наличии статистически значимых различий, которые без должного обоснования были оценены с помощью непараметрических тестов. Отсюда возникает вопрос: было ли доказано отличное от нормального распределение данных и почему оно возникло при достаточно большом объеме выборки?
Аналогичная ситуация наблюдается в исследовании «ГОЛИАФ»: сумма значений ВАШ для 11 симптомов в основной группе составляет 13,2 мм до лечения, 3,3 мм после лечения с медианой разницы в 9,6 мм, что соответствует 1,2, 0,3 и 0,9% для 1100-мм ВАШ. Более того, различия между основной и контрольной группой (9,6 мм – 0,2 мм = 9,4 мм) не достигают заявленных 10 мм, что не позволяет однозначно отвергнуть нулевую гипотезу.
Но даже эти методологические проблемы не являются самыми критичными. Если взглянуть на медианы интенсивности индивидуальных симптомов, то возникают сомнения в их достоверности. Например, в контрольной группе исследования «ДЕМО» медиана боли до лечения составляет 3,1 мм. Напоминаю, что медиана – это целое значение, лежащее в середине вариационного ряда. А это значит, что какой-то пациент смог отметить, а специалист смог зарегистрировать значение 3,1 мм на 100-мм шкале. Любой исследователь, хоть раз державший в руках бумажную форму ВАШ, вероятнее всего, разделит мое мнение, что это практически невозможно. Между тем подобные десятичные доли миллиметров приведены для 17 из 44 значений интенсивности симптомов до и после лечения в исследовании «ДЕМО» и для 27 из 44 значений в исследовании «ГОЛИАФ». Таким образом, приведенный факт является явным методологическим нарушением и попыткой ввести читателя в заблуждение, балансирующими на гране фальсификации данных.
В связи с вышеуказанным и во избежание репутационных потерь журнала «Флебология» я призываю уважаемую редакцию отозвать обе статьи из печати и провести независимую проверку первичного материала обоих исследований.
Автор заявляет об отсутствии конфликта интересов.