10 травня, 2019
Клиническая полезность диагностических руководств МКБ‑11 в отношении расстройств с тяжелым бременем болезни
Всемирная организация здравоохранения (ВОЗ) выпустила в свет новую Международную классификацию болезней (МКБ). МКБ‑11 будет представлена для принятия государствами-членами на сессии Всемирной ассамблеи здравоохранения в мае 2019 г. Данный выпуск носит ознакомительный характер и позволит странам подготовиться к использованию классификационной системы по всем направлениям. Ключевым принципом пересмотра было упрощение структуры кодов и электронного инструментария: теперь специалисты здравоохранения смогут более легким и исчерпывающим образом регистрировать различные болезни. В статье G.M. Reed et al., опубликованной в журнале World Psychiatry (2018; 17 (3): 306‑315, в переводе Пальчиковой Е.И.), освещается полезность диагностических рекомендаций МКБ‑11 в клинической практике в отношении психических, поведенческих и нейроонтогенетических расстройств. В целом оценка врачами оказалась весьма положительной. Полученные результаты внушают оптимизм в отношении предполагаемого восприятия клиницистами всего мира полезности МКБ‑11.
Важным направлением для департамента ВОЗ по вопросам психического здоровья и химических аддикций в разработке главы МКБ‑11 по психическим, поведенческим и нейроонтогенетическим расстройствам было улучшение ее клинической полезности [2‑5].
С целью разработки классификации психических расстройств для МКБ ВОЗ определила, что показатель клинической полезности классификационной конструкции, категории или систем зависит от [2]:
- ее коммуникативной функции (например, между врачами, пациентами, их семьями, организаторами здравоохранения);
- ее показателей внедрения в клиническую практику, в том числе по критерию соответствия (т.е. точности описания), простоте использования и времени, необходимом для ее использования (т.е. практическая применимость);
- ее полезности при выборе методов лечения и принятии решений о ведении пациентов.
Данное определение отчасти основано на предложении M. First и соавт. [6, 7].
В полевое исследование МКБ‑10 были включены аналогичные критерии, в соответствии с которыми врачи оценивали классификацию: критерий соответствия, уверенность в выбранном диагнозе, простоту его постановки и адекватность диагностических рекомендаций для изучаемых случаев [8, 9].
В недавнем исследовании было значительно расширено понятие клинической полезности [10]. В него включили ее оценку применительно к конкретным компонентам диагностического руководства, а также конкретным его функциям (например, администрирование, установление диагноза, выбор метода лечения, взаимодействие, обучение).
Кроме того, департамент ВОЗ по вопросам психического здоровья и химических зависимостей провел крупную программную работу на местах, посвященную клинической полезности МКБ‑11 [3]. Эта программа исследований расширяет концепцию клинической полезности, включающую точность и воспроизводимость диагнозов, поскольку те, которые не являются точными и надежными, вряд ли будут полезны.
Таким образом, в понятии «клиническая полезность» есть как субъективная, так и объективная составляющие, и они в некоторой степени перекрываются и с надежностью, и с достоверностью [2]. Клиническая полезность – это не просто вопрос предпочтений врачей. Тем не менее субъективная составляющая важна, поскольку клиницисты, которые не считают, что классификационная система предоставляет полезную и ценную информацию, вряд ли будут старательно ее применять, что приведет к снижению качества данных об обращениях по поводу здоровья, связанных с диагностикой.
Наконец, с целью повышения клинической полезности Департамент ВОЗ по вопросам психического здоровья и химических зависимостей сделал ряд существенных изменений в Клинических описаниях и рекомендациях по диагностике (CDDG) психических, поведенческих и нейроонтогенетических расстройств в МКБ‑11 по сравнению с рекомендациями МКБ‑10 [11]. CDDG – это версия МКБ, предназначенная для использования специалистами в области психического здоровья в клинических условиях. Многие изменения были направлены на достижение согласованности и единства диагностической информации по различным категориям, что считалось недостатком CDDG МКБ‑10 [4]. Чтобы клиническое суждение было направлено в верное русло, были разработаны рекомендации по диагностике, сводящие к минимуму использование произвольных или псевдоточных подсчетов симптомов и пороговых значений, если они не имеют достаточной доказательной базы. Новое распределение по группам и категориям в МКБ‑11 также должно быть более логичным и согласованным с представлениями клиницистов о психических расстройствах [12, 13].
Данные, представленные в этом документе, были собраны в рамках полевого исследования МКБ‑11 по определению достоверности диагностики психических расстройств с тяжелым бременем болезни, проведенного в 13 странах по всему миру. Основные результаты опубликованы в журнале World Psychiatry (2018), согласно которым надежность диагностических рекомендаций МКБ‑11 получила оценку от умеренной до почти идеальной (0,45 до 0,88) [15] и, как правило, превосходила таковую МКБ‑10 [8]. В настоящем документе основное внимание уделяется оценке клинической полезности диагностических рекомендаций с использованием шкалы, которая частично основана на понятии клинической полезности из полевого испытания МКБ‑10, но в которой более полноценно реализовано определение клинической полезности ВОЗ.
Методы
Дизайн исследования и методы
Для оценки клинической полезности и надежности предложенных диагностических рекомендаций МКБ‑11 были использованы два протокола исследования. В Протоколе 1 исследовались полезность и достоверность рекомендаций по шизофрении, основным психотическим расстройствам и расстройствам настроения, в то время как по Протоколу 2 – расстройства настроения, тревожные, фобические расстройства и расстройства, связанные со стрессом.
Взрослые (≥18 лет) пациенты, обратившиеся за помощью в исследовательский центр и обнаруживавшие какие-либо психотические симптомы, могли участвовать в Протоколе 1, тогда как другие совершеннолетние лица с непсихотическими расстройствами настроения, тревожно-фобической симптоматикой без психотических включений, проходившие лечение в учреждении – участнике исследования, – в Протоколе 2. Потенциальные участники, удовлетворявшие данным критериям, исключались в том случае, если они не могли полноценно выполнять диагностическую оценку (например, по причинам языкового барьера или когнитивных нарушений).
Эти относительно нежесткие критерии отчасти объясняются желанием создать максимально естественные условия, при которых МКБ‑11 будет внедряться в психиатрических учреждениях.
Протоколы исследования были внедрены в 28 учреждениях в 13 странах [14]. Для диагностической оценки всегда использовался местный язык. Клинические рекомендации МКБ‑11, учебные материалы и все материалы для исследования были разработаны на английском языке, а затем переведены на четыре других языка: китайский, японский, русский и испанский. В Тунисе из всех материалов только клинические рекомендации перевели на французский язык. В других странах, где английский не был местным языком (например, Бразилия, Италия), использовались англоязычные рекомендации и учебные материалы, а интервью проводились на местном языке, что позволяло создать натуралистичные условия применения МКБ‑11 в будущем. Сведения о процессе набора и обучения клиницистов, внедрении исследования, сборе данных и соблюдении этических норм были опубликованы ранее [14].
После подписания информированного согласия пациентов опрашивали два клинициста, с которыми у них ранее не было какого-либо контакта. Один из врачей исполнял роль основного интервьюера, а второй был наблюдателем. В конце интервью наблюдателю было позволено задать дополнительные вопросы. Основываясь на собеседовании, клиницисты по отдельности формулировали диагноз, состоявший максимум из трех отдельных диагностических единиц. Диагнозы были неиерархическими (т.е. не обозначался основной и второстепенные) и могли быть из любой диагностической категории психических, поведенческих и нейроонтогенетических расстройств в МКБ‑11. Участвовавшие клиницисты могли также устанавливать непсихиатрические диагнозы или не ставить диагноз вообще.
После формулирования диагноза клиницистам было предложено 12 подробных вопросов о клинической полезности диагностических рекомендаций применительно к обследуемому пациенту. К ним относились: основные вопросы клинической полезности (простота использования, критерий соответствия, ясность, понятность), вопросы о характеристиках реализации клинических рекомендаций (уровень детализированности, выполнимость требований оценки, необходимое время), вопросы о применении конкретных разделов (границах между патологией и нормой, дифференциальной диагностике) и об эффективности рекомендаций в определенных целях (выбор лечения, оценка прогноза расстройства, коммуникация с другими специалистами, психообразование пациентов и их родственников).
Клиницисты предоставили оценки клинической полезности для конкретных диагностических категорий, входивших в Протоколы 1 и 2, т.е. для шизофрении и других расстройств психотического уровня, расстройств настроения (включая депрессивные и биполярные), тревожных, фобических и связанных со стрессом расстройств. Если конкретному пациенту было поставлено более одного диагноза из этих категорий, то клиническая полезность оценивалась для каждого из них.
Участники
В общей сложности в осуществлении исследования в качестве оценивавших клиницистов поучаствовали 339 врачей из 28 медицинских учреждений в 13 странах. Средний возраст составил 37,2±8,3 года, и он был сопоставим в разных странах. Среди врачей незначительно преобладали мужчины (56,6%). Подавляющее большинство клиницистов в исследовании являлись психиатрами (93,2%), но был также и небольшой процент психологов (3,8%), медсестер (1,5%) и других специалистов из сферы здравоохранения (1,5%). Опыт работы врача составил в среднем 7,6±7,5 года стажа с момента окончания обучения (включая аспирантуру).
В исследовании по Протоколу 1 (n=1,041) или Протоколу 2 (n=765) участвовало 1806 пациентов. Средний возраст составил 39,9±13,7 года и был сопоставим в разных странах. Общая выборка больных имела равное распределение по полу.
Большинство пациентов (54,9%) были холосты; 33,1% – женаты / сожительствовали с партнером, 9,8% – разведены или проживали раздельно, а 2,2% были вдовцами. Более половины (55,9%) больных в общей выборке являлись безработными и только 22,3% трудились полный рабочий день. Несколько превалировали пациенты стационарного звена (55,0%), остальные были в основном амбулаторными (44,4%). Небольшая часть пациентов (0,6%) проходили лечение в других условиях, например в дневном стационаре.
Сбор и обработка данных
Клиницисты вводили данные собеседования в электронную систему полевого исследования (EFSS), защищенную виртуальную базу данных, разработанную с использованием программного обеспечения Qualtrics™ (Provo, UT, США), доступную на всех пяти языках обучения. Данные исследовательских центров хранились и управлялись централизованно Центром координации данных (DCC) в Колумбийском университете.
Качество данных контролировалось путем постоянного мониторинга процедур сбора данных местной исследовательской группой каждого учреждения и с помощью запрограммированных функций в Qualtrics™, таких как «принудительный ответ» и проверка валидности данных. Это обеспечивало стандартизированный, однородный сбор данных во всех учреждениях. Исследовательские группы сохраняли заметки обо всех ошибках ввода данных, которые были обнаружены во время процесса, и эта информация была передана в DCC для исправления.
Анализ данных
В целом 339 врачей провели 3608 оценок клинической полезности. Поскольку на каждого пациента приходилось по два клинициста, число оценок было вдвое больше, чем число больных (n=1806). Однако в четырех случаях для пациентов была доступна только одна оценка клинической полезности.
Врачи оценивали все 12 показателей клинической полезности. Чтобы продемонстрировать общий рейтинг положительных ответов, ответы «часто» и «очень часто» объединили, где это было уместно. Была подсчитана разница оценок клинической полезности по странам и сопоставлена клиническая полезность пяти наиболее часто используемых диагнозов.
Для анализа достоверности коэффициенты каппа были рассчитаны с использованием 95% бутстрэп-доверительных интервалов c 1000-кратным ресамплингом (увеличением случаев) для каждой страны. Коэффициенты надежности рассчитывались только для наиболее распространенных диагнозов в рамках исследования (n≥130), чтобы максимизировать вероятность наличия достаточного их количества внутри страны для оценки каппа. Для этих же диагнозов была рассчитана клиническая полезность.
Результаты
Оценки клинической полезности в разных странах были в целом положительными, хотя с некоторыми различиями между пунктами. По трем основным вопросам о простоте использования, соответствии, четкости и понятности подавляющее большинство участников (от 82,5 до 83,9%) дало оценки «часто» или «очень часто», что указывало на высокую клиническую полезность. Что касается характеристик применения, большинство врачей указали, что рекомендации не навязывали критерии, которые трудно применить на практике (84,7%), и при этом они в достаточной степени детализированы (90,4%), а диагностика занимала примерно столько же или меньше времени по сравнению с обычной, используемой на практике (86,1%).
Дополнительные разделы, такие как разграничение нормы и патологии, дифференциальная диагностика, также были оценены очень высоко. Так, 76,5 и 77,5% клиницистов указали, что эти разделы были полезными «часто» и «очень часто» соответственно.
При оценке клинической полезности рекомендаций для конкретных целей 78,0% участников указали, что «часто» и «очень часто» они были полезны для общения с коллегами или другими специалистами. Наиболее низкие значения наблюдались для потенциальной полезности при выборе лечения (73,5%) и оценки прогноза (68,5%).
Помимо этого, оценивали показатели клинической полезности рекомендаций по странам. Наиболее очевидная разница по этим трем параметрам заключается в том, что оценки оказались значительно ниже в Японии (от 47,9 до 49,7% ответили «часто» или «очень часто») и несколько ниже в Тунисе (от 69,0 до 70,4% соответственно) по сравнению с другими странами (от 81,5 до 97,9%).
Если бы разница в показателях клинической полезности была непосредственно связана с пригодностью рекомендаций, можно было бы ожидать, что клиническая полезность изменялась бы равномерно по странам. Показатели достоверности или общая согласованность совпадают – они представлены межклассовой каппой с 95% бутстрэп-доверительными интервалами по пяти наиболее распространенным диагнозам среди выборки: шизофрения, шизоаффективное расстройство, биполярное расстройство I типа, депрессивный эпизод и рекуррентное депрессивное расстройство. Несмотря на очевидную разницу в достоверности по странам, нет четкой связи между более низкими оценками клинической полезности японскими и тунисскими участниками и достоверностью их диагностических назначений. И наоборот, более низкие коэффициенты достоверности (например, для Российской Федерации) не коррелировали с низкой оценкой клинической полезности.
По всем трем основным клиническим критериям полезности для диагностики депрессивные расстройства имеют несколько более низкие оценки, чем шизофрения, шизоаффективные и биполярное расстройства. Более низкие показатели достоверности для депрессивного эпизода и рекуррентного депрессивного расстройства, по-видимому, связаны с более низкими значениями клинической полезности. Рекомендации для шизоаффективного расстройства имеют очень высокие показатели полезности, несмотря на то что их параметры достоверности тоже довольно низки.
Обсуждение
В целом в данном исследовании показатели клинической полезности диагностических рекомендаций МКБ‑11 оказались весьма положительными. Вероятно, отчасти это связано с вниманием, уделенным значениям клинической полезности при разработке диагностических рекомендаций [4], а также с тем, что они уже были протестированы в международных многоязычных онлайн-исследованиях в рамках Глобальной клинической практики (GCP; https://gcp.network) и затем усовершенствованы [16, 17].
Диагностическое руководство было признано простым в использовании, точно отвечающим симптоматике пациентов (т.е. обладающим высоко оцениваемым критерием соответствия), понятным, обеспечивающим необходимый уровень детализации, при этом не требующим больше времени при диагностике по сравнению с обычной практикой. Также было выявлено, что руководство содержит полезную информацию по различению патологии и нормы и дифференциальной диагностике расстройств. Клиницисты оценили полезность рекомендаций несколько ниже относительно выбора лечения и оценки прогноза, чем для коммуникации с другими специалистами в области здравоохранения; тем не менее итоговые оценки, в целом, остались положительными.
Как было упомянуто выше, два основных показателя клинической полезности были позаимствованы из полевого исследования МКБ‑10 [8, 9]. В нем 82,5% клиницистов по всему миру оценили рекомендации МКБ‑10 как хорошие или очень хорошие по критерию соответствия, а 85,0% отметили, что они умеренно или очень просты в использовании [18]. Эти показатели почти идентичны с полученными в ходе данного исследования, но разница в масштабе, вероятно, свидетельствует о том, что текущие результаты можно рассматривать как более позитивные.
Следует отметить, что клиницисты, участвовавшие в исследовании, могли быть склонны к заведомо позитивной оценке рекомендаций, поскольку в полевом исследовании ВОЗ новой МКБ были задействованы те же учреждения, поэтому вероятны положительная предвзятость и элемент социальной желательности их ответов. Возможно, что врачи, которые не принимали участие в исследовании, воспримут рекомендации МКБ‑11 с меньшим энтузиазмом, когда их попросят внедрить те в свою практику. Однако это было бы справедливо в отношении любой другой оценки клинической полезности классификаций, будь то МКБ‑10 [8, 9, 18] или DSM‑5 [19], поэтому не влияет на общую интерпретацию результатов.
Структура результатов оценки клинической полезности рекомендаций для конкретных целей (например, выбора лечения, прогноза, общения с другими специалистами) полностью соответствует структуре полученных данных другого исследования, касавшегося текущего использования клиницистами МКБ‑10, DSM‑IV и DSM‑5 [10]. Ожидается, что оценки клинической полезности в плане выбора лечения и прогноза могут быть не такими высокими по сравнению с показателями использования МКБ‑11 для других целей, так как многие методы лечения не являются специфическими для конкретной нозологии [20], а также поскольку диагностические рекомендации МКБ‑11 не представляют собой руководство по терапии.
Обнадеживает тот факт, что, несмотря на схожесть структуры результатов оценки клинической полезности рекомендаций МКБ‑11, показатели полезности при выборе лечения, оценке прогноза и в плане психообразования пациентов и их семей были значительно выше, чем в аналогичных исследованиях МКБ‑10, DSM‑IV или DSM‑5 [10]. Тем не менее это, безусловно, ограничивает возможности классификационных систем (МКБ‑11, МКБ‑10 и DSM‑5), которые не предназначены для выбора лечения или оценки прогноза по основным диагностическим категориям [20, 21]. Дальнейшая деятельность по созданию более тесной связи между диагностикой и лечением была бы целесообразным шагом с точки зрения улучшения здравоохранения, но при этом стоило бы учитывать множество других факторов (например, функциональность, доступность и приемлемость лечения).
Если взглянуть на рейтинги клинической полезности по странам, то становится ясно, что оценка одинаково положительна в самых разных странах: Бразилии, Канаде, Китае, Индии, Италии, Ливане, Мексике, Нигерии, России, Испании и Южно-Африканской Республике. Вероятно, это связано с тем, что в разработке рекомендаций принимали участие все регионы ВОЗ, и значительное число экспертов из стран с низким и средним уровнем дохода были включены во все рабочие группы МКБ‑11, а также благодаря предварительной международной многоязычной апробации по стандартам надлежащей клинической практики.
Не может не радовать, что проведение оценки клинической полезности на разных языках, по-видимому, не повлияло на предполагаемую полезность диагностических рекомендаций. Существенно ниже рекомендации были оценены японскими коллегами и несколько ниже – участниками из Туниса, хотя в целом рейтинги остались положительными. Вполне возможно, что эти различия для Японии могут быть отчасти связаны с культурной тенденцией не давать чрезмерно положительных или отрицательных оценок [22] и для обеих стран – с человеческим фактором (предпочтениями) конкретных клиницистов. На оценку тунисских коллег, вероятно, повлияло отсутствие перевода на французский язык всех учебных материалов. Однако возможно, что предлагаемые диагностические рекомендации в меньшей степени соответствуют представлениям о психических расстройствах у японских и тунисских пациентов по сравнению с таковыми из других стран. Для того чтобы лучше понять причины гетерогенности оценок полезности клинических рекомендаций в разных странах, необходимы дальнейшие исследования. Важно отметить, что разница в оценке клинической полезности, по странам или по диагнозам, не коррелирует с показателями достоверности. В частности, более низкие оценки японских клиницистов, похоже, не повлияли на их способность последовательно применять рекомендации. Аналогичным образом, более низкие оценки надежности не приводили к, соответственно, более низким показателям клинической полезности. Этот вывод подчеркивает важность учета многочисленных характеристик системы классификации при определении ее эффективности. Ни оценка клинической полезности, ни оценка надежности не дают понимания всей картины.
Эта статья подтверждает ранние выводы о том, что дифференциально-диагностическая достоверность при использовании клиницистами предлагаемых рекомендаций варьирует от умеренной до почти идеальной (0,45 до 0,88) [15] для психических расстройств, составляющих наибольшую долю глобального бремени болезней и используемых услуг здравоохранения среди взрослых пациентов, находящихся на лечении в 28 учреждениях 13 стран [14]. В целом показатель достоверности был выше по сравнению с результатами по рекомендациям МКБ‑10.
Модель МКБ‑11 [2] по версии ВОЗ не рассматривает клиническую полезность как показатель, оцениваемый исключительно субъективно. Вместо этого предлагается динамическая конструкция, которая напрямую связана с фактическим опытом использования диагностического руководства. Таким образом, адекватная степень достоверности или согласованности применения во всем мире также свидетельствует о клинической полезности новых диагностических рекомендаций МКБ‑11.
Выводы
В раздел психических, поведенческих и нейроонтогенетических расстройств МКБ 11-го пересмотра были внесены существенные изменения в их концепции, которые могут, помимо надежности и достоверности, повлиять также на их клиническую полезность. Это исследование является частью программы ВОЗ по проведению полевых исследований, посвященных клинической полезности главы МКБ‑10 «Психические и поведенческие расстройства» [3].
В условиях клинической практики МКБ функционирует отчасти как способ взаимодействия между случаями обращения за медицинской помощью и медицинскими информационными системами [13], и если врачи сочтут диагностические руководства недостаточно полезными, то вряд ли станут применять их систематически и добросовестно. Это, в свою очередь, отрицательно повлияет на достоверность диагностических данных, используемых для разработки стратегий здравоохранения, принятия решений и распределение ресурсов здравоохранения, качество которых изменится соответствующим образом.
Следовательно, проведение полевых исследований, в которых специалистам предлагается оценить клиническую полезность диагностических рекомендаций МКБ‑11, имеют очень важные последствия. По этой причине исследование проводилось с привлечением широкого круга служб охраны психического здоровья вторичного и третичного уровня в разных странах с различными языками, культурными особенностями и уровнями ресурсов.
Подводя итог, следует отметить, что результаты полевого исследования дают значительные основания для положительной оценки клинической полезности клинических рекомендаций МКБ‑11 специалистами по всему миру.
Тематичний номер «Неврологія, Психіатрія, Психотерапія» № 1 (48) березень 2019 р.