<<
>>

Психометрические свойства опросника оценки качества жизни

К психометрическим свойствам опросников оценки КЖ относят следующие:

■ надежность,

■ валидность,

■ чувствительность к изменениям.

2.4.1. Надежность

Надежность опросника (reliability) — это способность опросника давать постоянные и точные измерения [44,129,142, 154, 155, 156].

Выделяют два вида надежности.

■ Внутреннее постоянство (internal consistency reliability).

■ Воспроизводимость (reproducibility).

Внутреннее постоянство опросника может быть оценено

несколькими способами [44, 68]:

■ коэффициент Кронбаха а, я надежность Split-half,

■ надежность Inter-rater,

■ коэффициенты межклассовых корреляций.

Из всех перечисленных способов оценки внутреннего постоянства опросника наиболее распространенным является вычисление коэффициента Кронбаха а.

Воспроизводимость оценивают методом тест-ретест (test- retest). Воспроизводимость характеризует временную стабильность (постоянство во времени), то есть степень корреляции между баллами при повторных оценках.

Определение надежности методом тест-ретест заключается в установлении взаимосвязи между баллами, полученными при опросе одного и того же респондента (или группы) дважды (или чаще) через определенный интервал времени при отсутствии изменений в состоянии респондентов. При использовании метода тест-ретест на надежность опросника могут повлиять различные факторы, возникающие как в период времени между опросами, так и во время самих опросов (например: различные условия заполнения опросников при первом и повторных опросах; влияние самого опроса; специфические факторы, связанные с состоянием респондента; продолжительность периода между опросами и т.д.). Например, значения могут существенно измениться, если больной первый раз заполнил опросник при выраженной симптоматике, и при повторном визите к врачу, когда на фоне назначенного лечения симптоматика была купирована.
В данном случае при оценке воспроизводимости будет получен низкий коэффициент корреляции, но так как не учтены факторы, влияющие на состояние респондента, это не означает, что опросник недостаточно надежен.

Для опросников оценки КЖ коэффициент Кронбаха а уровень надежности считают удовлетворительным, если его значение для групповых исследований больше или равно 0,70.

При оценке на индивидуальном уровне рекомендован более высокий показатель, равный 0,90 или выше.

2.4.2. Валидность

Валидность опросника (validity) — способность опросника достоверно измерять ту основную характеристику, которая в нем заложена. Существует несколько вариантов валидности, однако исследование каждого из них направлено на решение одной и той же задачи — оценки достоверности показателей шкал опросника [44, 129, 142, 154, 155, 156]. Существуют следующие виды валидности: я внешняя, я содержательная,

я критериальная (текущая и прогностическая), я конструктивная (конвергентная и дискриминантная).

Оценка внешней валидности позволяет определить, охватывают ли вопросы опросника весь круг проблем, беспокоящих больных.

Содержательная валидность — это оценка «всесторонности» опросника, т.е. показатель того, насколько опросник (и каждый из его компонентов, шкал и пунктов) охватывает все аспекты того, что он должен измерить. Другими словами, соответствует ли содержание оцениваемой переменной характеристики тому названию, которое ей дано? Каждый пункт опросника по своей смысловой нагрузке должен соответствовать, по крайней мере, одному из заложенных в нем содержательных компонентов. Если это не так, то данный пункт (вопрос) не отвечает всем задачам шкалы, которую он формирует, или перечень задач, которые могла бы решить данная шкала, не является всесторонним. Каждая шкала опросника формируется из ряда вопросов, и их количество также должно отражать ценность данной шкалы в отношении к той характеристике, которую она измеряет [44, 154, 200].

Содержательную валидность оценивают тремя способами: я анализ общепринятых подходов к изучению данной проблемы здоровья на основании литературных данных,

■ экспертная оценка содержания опросника специалистами,

■ оценка содержания опросника больными [154, 200].

Третий вид валидности — критериальная валидность. Существует два варианта критериальной валидности: текущая и прогностическая.

Текущая валидность изучается путем оценки корреляций шкал изучаемого опросника со шкалами других опросников, которые оценивают ту же самую характеристику. Сравнение проводится с так называемым «золотым стандартом» (шкалой или опросником, имеющим уже доказанные высокие психометрические свойства для конкретной группы больных). Текущая валидность определяет «заменяемость» шкалы, т.е. насколько возможна замена данной шкалой другой шкалы (аналогичной шкалы другого опросника), при этом определяют их корреляцию. Респондента опрашивают с помощью обеих шкал в одно и то же время. Как правило, оценку текущей валидности проводят при создании нового опросника, который является наиболее простым и наименее дорогостоящим и мог бы стать альтернативой уже существующему опроснику [44, 156].

Прогностическая валидность определяет, предсказывает ли настоящая оценка будущие изменения. В данном случае критериальные свойства остаются недоказанными до наступления определенной временной точки в будущем. Например, оценка прогностической валидности опросника SF-36 показала, что опросник может прогнозировать такие изменения, как потерю трудоспособности в течение одного года, использование медицинских ресурсов, депрессию, 5-летнюю выживаемость [203].

И, наконец, еще один вид валидности — конструктивная валидность. Оценка конструктивной валидности — это исследование того, насколько структура опросника позволяет достоверно измерить то, что он должен измерить. При оценке конструктивной валидности строятся определенные гипотезы, в основе которых лежат различные факторы (например, психологические, социальные факторы или клинические показатели). В процессе исследования эти теоретические пред

положения подтверждают или опровергают. Если гипотеза не подтверждается, то могут возникнуть трудности валидации опросника или проблемы теоретического обоснования исследования [44, 154, 201].

Конструктивная валидность может быть конвергентной (convergent validity) или дискриминантной (discriminant validity), и при обоих вариантах она предполагает оценку взаимосвязи изучаемой шкалы с определенными характеристиками.

При оценке конвергентной валидности результаты двух способов измерения одной характеристики должны коррелировать между собой. Дискриминантная валидность подразумевает, что результаты измерения различных характеристик не связаны между собой [52, 155].

Рассмотрим методы оценки конструктивной валидности. Одним из методов является факторный анализ. Этот метод обеспечивает экспериментальную проверку предполагаемой структуры опросника. Факторный анализ должен выявлять отдельные факторы в пределах структуры опросника. В процессе проведения факторного анализа определяют то, как пункты опросника распределяются по отношению к своим шкалам. Кроме того, факторный анализ должен показывать, что пункты шкалы относятся к своему фактору и тесно с ним коррелируют, при этом слабо коррелируя с другими факторами. Например, опросник SF-36 имеет двухкомпонентную структуру (физический и ментальный компонент), при этом пункты таких шкал, как физическое функционирование и боль, высоко коррелируют с физическим компонентом здоровья и имеют слабые корреляции с ментальным компонентом [203].

Другой метод — метод «известных групп». Респондентов распределяют на группы в зависимости от наличия или отсутствия у них какого-либо фактора. Высказывается наиболее вероятное предположение в отношении распределения у них данного фактора и проводится анализ взаимосвязей показателей в зависимости от изучаемого фактора. Наиболее наглядным и простым примером является изучение показателей КЖ в зависимости от возраста: в многочисленных популяционных исследованиях с использованием общих опросников высказывались предположения о достоверных от- линиях показателей физического здоровья в различных возрастных группах. Во всех случаях эти предположения были подтверждены: респонденты старших возрастных групп имели показатели КЖ хуже, чем респонденты молодого возраста [201, 202, 203].

Еще одним способом оценки конструктивной валидности является оценка корреляций с внешними критериями (шкалами другого опросника, симптомами, клиническими или лабораторными показателями и т.д.).

Например, шкала физического функционирования (Physical Functioning) опросника SF-36 должна иметь высокую корреляцию с подобной шкалой опросника NHP (Physical Activity Scale). При этом подтверждается конвергентная валидность. Та же шкала (Physical Functioning, SF-36) должна иметь низкую корреляцию со шкалой Emotional Reactions опросника NHP. Это сравнение является примером дискриминантной валидности [44, 203].

Оценка корреляций возможна и с симптомами (их характером, выраженностью) или с клиническими или лабораторными показателями. Например, можно ожидать, что количество болезненных суставов у больных РА тесно связано с физическим функционированием, а выраженность депрессии — с психологическим. Определение степени корреляции и оценка конвергентной или дискриминантной валидности приводит к подтверждению или опровержению гипотезы.

Среди всех перечисленных видов валидности наиболее часто на практике оценивают содержательную и конструктивную валидности, так как очень часто отсутствие «золотого стандарта» не позволяет оценить критериальную валидность.

2.4.3. Чувствительность

Чувствительность опросника (sensitivity to change) — это сенситивность опросника к изменениям, т.е. способность опросника давать достоверные изменения баллов КЖ в соответствии с изменениями в состоянии респондента (например, в процессе лечения больного). В англоязычной литературе также используют термин респонсивность, т.е. способность опросника «отвечать» на изменения (responsiveness).

При определении чувствительности важны следующие понятия [44, 154, 155, 156, 200]:

■ величина эффекта (Effect Size) — разница показателей, разделенная на стандартное отклонение показателей всей выборки больных;

■ стандартная процедура обработки баллов (Standard Response Mean) — разница показателей, разделенная на стандартное отклонение разницы показателей;

■ метод парных сравнений — разница показателей, разделенная на стандартную ошибку разницы показателей;

■ индекс Gyatt — разница показателей, разделенная на стандарное отклонение разницы показателей больных, находящихся в стабильном состоянии.

Термин «чувствительность» предполагает чувствительность опросника к клиническим изменениям. Например, ожидаемое время действия метотрексата составляет 12 недель, при этом в исследовании КЖ у больных РА, впервые получающих метотрексат, ожидается, что опросник должен давать статистически значимое улучшение баллов КЖ через 12 недель лечения.

В каких случаях следует оценивать психометрические свойства опросников оценки КЖ?

1. При создании нового опросника (но только после правильного выбора вопросов) необходимо провести:

■ оценку надежности опросника:

■ определение внутреннего постоянства,

■ определение воспроизводимости;

■ оценку валидности опросника:

■ оценку внешней валидности,

■ оценку содержательной валидности,

■ оценку конструктивной валидности опросника с подтверждением его факторной структуры,

■ оценку дискриминантной и конвергентной валидности методами «известных групп» и путем оценки корреляционных взаимосвязей,

■ оценку критериальной валидности опросника (сравнить опросник с «золотым стандартом» при его наличии);

■ оценку чувствительности опросника на достаточной выборке.

2. При использовании зарубежного опросника обязательна проверка психометрических свойств, но только после проведения культурной и языковой адаптации и оценки приемлемости опросника.

3. При применении опросника в новой популяции. Например, если общий опросник используется для оценки КЖ в одной группе больных, то прежде чем использовать его в другой группе (с другой патологией), необходимо проверить его надежность (достаточно оценить внутреннее постоянство), конструктивную валидность и чувствительность.

<< | >>
Источник: НовикА. А., Ионова Т. И.. Руководство по исследованию качества жизни в медицине. 2-е издание / Под.ред. акад. РАМН Ю.Л.Шевченко,— М.:ЗАО «ОЛМА Медиа Групп»2007. 2007

Еще по теме Психометрические свойства опросника оценки качества жизни:

  1. Качество данных и психометрические свойства опросника
  2. Валидация опросника оценки качества жизни
  3. Языковая и культурная адаптация опросника оценки качества жизни
  4. Инструменты оценки качества жизни в пульмонологии
  5. Инструменты оценки качества жизни в кардиологии
  6. Инструменты оценки качества жизни в онкологии
  7. Инструменты для оценки качества жизни в паллиативной медицине
  8. Возможности метода оценки качества жизни в ревматологии
  9. Возможности метода оценки качества жизни у детей
  10. Оценка качества жизни в паллиативной медицине
  11. Методологические аспекты исследования качества жизни в ревматологии
  12. Особенности методологии исследования качества жизни у детей
  13. Показатели качества жизни населения Санкт-Петербурга
  14. КАЧЕСТВО ЖИЗНИ
  15. Индивидуальный мониторинг показателей качества жизни
  16. Влияние лечения на параметры качества жизни
  17. Концепция исследования качества жизни в педиатрии
  18. « Определение понятия «качество жизни»
  19. Качество жизни как критерий ремиссии и выздоровления