<<
>>

Статистический анализ в исследовании качества жизни

При исследовании КЖ используют методы статистического анализа, применяющиеся в биомедицинских исследованиях. Однако имеются особенности, связанные со следующими факторами.

1. Многокомпонентность парадигмы КЖ.

2. Многомерность данных КЖ.

3. Лонгитюдность исследования КЖ.

4. Наличие количественных и качественных данных.

5. Наличие пропущенных данных.

6, Необходимость шкалирования данных опросника КЖ. Преодоление сложностей статистической обработки данных о КЖ возможно при строгом соблюдении правил и требований, общепринятых в статистике.

2.6.1. Понятие случайного и произвольного выбора. Рандомизация. Статистические критерии

Практически все статистические процедуры основаны на том, что данные из генеральной совокупности выбраны в случайном порядке. Случайный выбор — это выбор, когда любая единица генеральной совокупности имеет одинаковую вероятность попасть в выборку. Произвольный выбор — выбор, произвольно осуществляемый исследователем.

Рандомизация

Рандомизация — статистическая процедура формирования групп исследования, преднамеренно вводящая элемент случайности в процесс их составления.

Рандомизация является одним из механизмов предотвращения предвзятости в проведении и оценке результатов клинического исследования. По требованию стандартов GCP, любое качественное клиническое исследование должно быть рандомизированным. Случайное попадание в группу происходит в момент получения пациентом, удовлетворяющим критериям включения в исследование, его рандомизационного номера, согласно случайным образом сгенерированной рандомизационной схеме. Двойной слепой контроль — принадлежность объекта исследования к опытной либо контрольной группе, неизвестна как в ходе эксперимента, так и в ходе первичной обработки данных.

Техника рандомизации заключается в следующем.

Объекты исследования нумеруют и делят на контрольную и экспериментальную группу в соответствии с разделенной пополам таблицей случайных чисел. Номер, находящийся в одной половине таблицы идет в экспериментальную группу, в другой половине — в контрольную. Генерацию и применение таблицы случайных чисел, а также случайный выбор производят с помощью стандартных программных пакетов.

Переменные и связи между ними

Цель всякого исследования или научного анализа состоит в описании явлений и нахождении связей (зависимостей) между характеристиками этих явлений (переменными). Переменные — это категории, которые можно измерять, контролировать или изменять в исследованиях.

Независимые переменные — это переменные, значениями которых можно управлять, а зависимые переменные — это переменные, которые можно только измерять или регистрировать.

Описательная статистика

Основной задачей описательной статистики является характеристика исходных данных. Для описания исходных данных используются следующие параметры [19]:

■ размер выборки,

■ сумма,

■ средняя,

■ медиана,

■ мода,

■ дисперсия,

■ стандартное отклонение,

■ стандартная ошибка средней,

■ процентили,

■ коэффициент вариации.

Размер выборки (Sample size)

Размер выборки представляет собой число значащих элементов выборки. В расчет размера выборки не входят пропущенные по разным причинам данные. Представление размера выборки является обязательным при подготовке итоговых таблиц по любому исследованию.

Сумма

Сумму иногда вычисляют в качестве вспомогательного и информативного параметра. Она представляет собой арифметическую сумму всех элементов выборки.

Средняя

Средняя — одна из основных характеристик вариационного ряда экспериментальных данных. Средняя арифметическая (х) представляет собой отношение суммы всех элементов выборки к размеру выборки.

где X — значение члена выборки, N — размер выборки.

Также существуют средняя гармоническая, средняя квадратическая, средняя кубическая. Эти характеристики применяются значительно реже.

Медиана

Медиана — однин из видов средних. Медиана рассчитывается следующим образом: все элементы выборки выстраивают в порядке возрастания, и число, которое находится посередине ряда и делит его пополам, является медианой. В случае, когда количество элементов выборки четное, медиана представляет собой среднюю арифметическую из двух элементов, ближайших к середине ряда. Применение медианы целесообразно в тех случаях, когда ничего неизвестно о характере распределения данных или когда расчет средней арифметической невозможен.

Мода

Мода представляет собой значение, наиболее часто встречающееся в данной выборке. Моду используют в тех же случаях, что и медиану при обработке полуколичественных данных. Применение моды требует наличия не менее 30 наблюдений в выборке. Некоторые данные могут иметь 2 моды — бимодальное распределение.

Дисперсия

Дисперсия (52) — количественная характеристика разброса значений в группе относительно среднего. Для характеристики разброса не имеет значения, в какую сторону оно отклоняется — в большую или меньшую. Другим словами, отрицательные и положительные отклонения от среднего должны вносить одинаковый вклад в характеристику разброса. Поскольку квадраты равных по абсолютному значению чисел равны, то для этого выражения дисперсии используют квадрат отклонения от среднего. Данный показатель и носит название дисперсия.

Формула для расчета дисперсии:

у,1(Х-Х)г

Как видно из формулы, дисперсия измеряется в единицах, равных квадрату измеряемой величины, что не всегда удобно. Часто вместо дисперсии используют стандартное отклонение, которое представляет собой квадратный корень из дисперсии и измеряется в тех же единицах, что и измеряемая величина.

Стандартное отклонение

Стандартное отклонение (S.D.) — более удобная характеристика дисперсии.

Представляет собой квадратный корень из дисперсии. Стандартное отклонение — важный параметр, характеризующий выборку. Стандартное отклонение в выборке из генеральной совокупности обозначается буквой S и выражается формулой:

Стандартное отклонение генеральной совокупности:

Стандартное отклонение выборки:

Видоизменение формулы стандартного отклонения для выборки происходит потому, что в выборке, в отличие от генеральной совокупности, разброс не бывает таким большим, как во всей совокупности, поэтому деление на N-1, а не на N позволяет компенсировать возникающее занижение оценки стандартного отклонения. Статистические пакеты используют именно данную формулу для подсчета стандартного отклонения.

Стандартная ошибка

Стандартная ошибка средней (S.E.) представляет собой еще одну меру разброса. В отличие от стандартного отклонения, стандартная ошибка характеризует не выборку, а среднюю этой выборки. Рассчитывается стандартная ошибка путем деления стандартного отклонения выборки на квадратный корень из количества значащих элементов данной выборки. Стандартная ошибка

средней показывает, с какой точностью среднее в выборке характеризует значение среднего по всей генеральной совокупности. Чем больше выборка, тем точнее ее средняя характеризует среднюю по всей генеральной совокупности и тем меньше стандартная ошибка средней. Примерно в 95% случаев истинное среднее значение по генеральной совокупности лежит в пределах m ±2 стандартные ошибки от среднего в выборке.

Формула для расчета стандартной ошибки средней:

где S — стандартное отклонение в выборке, п — размер выборки.

Процентили или квантили

Процентили — простейшие характеристики изменчивости. Очень часто используют следующие параметры: минимум или 0% процентиль представляет собой минимальное значение в выборке, медиана или 50% процентиль (см. Медиана), максимум или 100% процентиль — максимальное значение в выборке. В MS Excel существует функции MIN и MAX, MEDIAN и специальная функция QUARTILE. Кроме этих характеристик применяются 25% и 75% процентили. Данные параметры могут указывать на тип распределения данных в выборке. Min — 0%, Q1 — 25%, Median — 50%, Q3 — 75%, Max — 100%. Если распределение выборки сходно с нормальным распределением, то процентили соотносятся со стандартным отклонением, как представлено в таблице 14.

Таблица 14

Соотношение процентили и стандартного отклонения Процентили______________________ Отклонение от среднего

2,5 Х-28
16 Х-8
50 X
84 Х+8
97,5 Х+28

В случае применения непараметрических критериев более информативным является указание не средней величины и стандартного отклонения, а медианы и двух квартилей 25 и 75%.

Коэффициент вариации

Коэффициент вариации (CV) — еще одна мера характеристики дисперсии в группе. Представляет собой стандартное отклонение, выраженное как процент от средней.

Формула для расчета коэффициента вариации:

CV==XlOO%

где S — стандартное отклонение в выборке, х — средняя в выборке.

Доверительный интервал

Доверительный интервал для среднего представляет собой интервал значений вокруг оценки, где с данным уровнем достоверности находится «истинное» (неизвестное) среднее популяции. Например, если среднее выборки равно 23, а нижняя и верхняя границы доверительного интервала с уровнем Р=0,95 равны 19 и 27 соответственно, то можно заключить, что с вероятностью 95% интервал с границами 19 и 27 накрывает среднее популяции.

Если установить больший уровень доверия, то интервал станет шире. В этой связи возрастает вероятность, с которой он «накрывает» неизвестное среднее популяции, и наоборот. Ширина доверительного интервала зависит от объема или размера выборки, а также от разброса (изменчивости) данных.

Увеличение размера выборки делает оценку среднего более надежной. Увеличение разброса наблюдаемых значений уменьшает надежность оценки.

Вычисление доверительных интервалов основывается на предположении нормальности наблюдаемых величин. Если это предположение не выполнено, то оценка может оказаться плохой, особенно для малых выборок. При увеличении объема выборки, скажем, до 100 или более, качество оценки улучшается и без предположения нормальности выборки [155].

Параметрическая и непараметрическая статистика

Параметрическая статистика — совокупность статистических методов, применяемых в том случае, когда известны параметры распределения исследуемой варьирующей величины.

Непараметрическая статистика используется в случае, когда неизвестны параметры распределения исследуемой величины (отсюда и термин «непараметрическая статистика») или переменные измерены в качественной шкале. Непараметрическая статистика также применяется, если объемы данных недостаточны для применения параметрических методов. Непараметрические методы не основываются на таких оценках параметров распределения как, например, среднее или стандартное отклонение, описывающих распределение интересующей выборки. Эти методы иногда называются свободными от параметров или свободными от распределения. Они характеризуются более низкой точностью, чем параметрические.

Форма распределения. Нормальность

Важным способом описания варьирующей переменной является форма ее распределения, которая показывает, с какой частотой значения переменной попадают в определенные интервалы. Эти интервалы, называемые интервалами группировки, выбираются исследователем.

Функция F(x), связывающая значения х. переменной случайной величины X с их вероятностями р., называется законом распределения или функцией распределения.

Данные имеют нормальное распределение при действии большого количества факторов, влияние ни одного из которых нельзя считать определяющим.

Оценка нормальности распределения

Наиболее простой способ оценки нормальности распределения — вычисление средствами программного пакета показателей асимметрии и эксцесса. Если асимметрия (показывающая отклонение распределения от симметричного) существенно отличается от 0, то распределение несимметрично, в то время как нормальное распределение абсолютно симметрично. У симметричного распределения асимметрия равна 0. Асимметрия распределения с длинным правым хвостом положительна. Если распределение имеет длинный левый хвост, то его асимметрия отрицательна.

Если эксцесс (показывающий «остроту пика» распределения) существенно отличен от 0, то распределение имеет или более закругленный пик, чем нормальное, или, напротив, имеет более острый пик (возможно, имеется несколько пиков). Обычно если эксцесс положителен, то пик заострен, если отрицательный, то пик закруглен. Эксцесс нормального распределения равен 0.

Более точную информацию о форме распределения можно получить с помощью критериев нормальности (например, критерия Колмогорова-Смирнова или W критерия Шапиро-Уилка). Однако наиболее наглядной является визуальная проверка с помощью построения гистограммы (графика, показывающего частоту попаданий значений переменной в отдельные интервалы).

Гистограмма позволяет визуально оценить нормальность эмпирического распределения. При построении гистограммы в большинстве статистических пакетов, на полученный график также накладывается кривая нормального распределения. Гистограмма позволяет качественно оценить различные характеристики распределения. Например, на ней можно увидеть, что распределение бимодально (имеет 2 пика). Это может быть вызвано, например, тем, что выборка неоднородна, возможно, извлечена из двух разных популяций, каждая из которых соответствует близкому к нормальному распределению.

Проверка нулевой или альтернативной гипотез

Нулевая гипотеза — специальный статистический термин, указывающий на то, что используется статистический тест. Например, если исследовали две случайные выборки пациентов, у которых измеряли показатели КЖ, нулевую гипотезу можно сформулировать следующим образом: разность между средними значениями показателей КЖ в группах не отличается от нуля.

Н0: S=S2>

где S1 и S2 — средние групп.

Альтернативная гипотеза представляет собой утверждение, противоположное нулевой гипотезе. От вида альтернативной гипотезы зависит тип статистического критерия.

Альтернативные гипотезы имеют вид:

Н,: S^Sj, односторонний тест;

Н2: S^Sj, односторонний тест;

Н3: 8,082, двусторонний тест.

Наиболее распространен двусторонний тест, проверяющий альтернативную гипотезу о неравенстве групп. Двусторонний тест является более строгим и особенно часто используется при исследовании фармакологических веществ с неизвестной активностью.

Расчет минимального размера выборки

Основной целью данных расчетов является определение минимально необходимого количества пациентов в каждой исследуемой группе. Это подразумевает наличие такого количества пациентов, которого, с одной стороны, будет достаточно для того, чтобы однозначно ответить на вопросы, поставленные в исследовании, а с другой стороны, достаточно малого, чтобы избежать лишних затрат по проведению исследования.

В зависимости от метода определения минимального размера выборки необходим ряд других исходных показателей: стандартное отклонение в группах, стандартное отклонение разницы между двумя группами или пропорции исследуемого показателя для каждой группы.

Необходимо отметить, что исследователь должен иметь характеристики вариабельности исследуемых показателей КЖ. Эти данные можно получить следующим образом:

■ пилотные исследования, которые предназначены для выяснения границ ожидаемого эффекта;

■ данные литературы;

■ специальные таблицы для аналогичных типов исследований.

В качестве примера приведем формулу для определения минимального размера выборки при сравнении двух независимых средних:

N_2S2(a + P)2 А2

где 8 — стандартное отклонение в исследуемых группах, А — разность между средними значениями групп, a Za и ZP — верхние квантили стандартного нормального распределения. Формула рассчитывает минимально необходимый размер выборки в случае сравнения двух независимых пар средних. Оптимальным критерием для сравнения в этом случае является непарный тест Стьюдента.

Указанный алгоритм может быть использован для определения размера выборки при использовании в качестве критерия сравнения теста Манн-Уитни. Известно, что мощность этого критерия при тех же самых условиях, что и при использовании непарного критерия Стьюдента, составляет самое меньшее 0,85 от мощности критерия Стьюдента. Это значит, что, получив размер выборки при всех фиксированных параметрах для использования критерия Стьюдента и умножив его на 1,15, можно получить такой размер выборки, при котором мощность критерия Манн-Уитни будет не меньше, чем при использовании критерия Стьюдента.

2.6.2. Особенности статистического анализа при исследовании качества жизни

Особенность переменных

Особенность переменных в исследовании КЖ заключается в том, что в большинстве вариантов скоринга первоначальные качественные или дискретные в узком диапазоне данные с помощью процедур стандартизации (чаще всего методом линейной трансформации) и последующего шкалирования превращаются в количественные.

Количественные данные — это показатели, допускающие непосредственное измерение величины эффекта. Количественные данные делятся на непрерывные данные, которые могут принимать любое значение на непрерывной шкале (масса тела, уровень глюкозы в крови) и на дискретные данные, которые могут принимать лишь определенные значения из диапазона измерений. К дискретным данным относятся показатели шкал КЖ, полученные в результате объединения ответов на вопросы в шкалы и последующего преобразования специальной процедурой.

Качественные показатели — это показатели, не поддающиеся непосредственному измерению (диагноз, пол; такие ответы на вопросы, как «да» и «нет»). Качественные показатели подразделяют на дихотомические, которые могут быть отнесены только к двум противоположным категориям («да», «нет») и многозначные качественные переменные, которые могут иметь число градаций больше двух. К последним относятся варианты ответов на вопросы, используемые в инструментах оценки КЖ.

Сложность статистической обработки материалов опросников заключается в необходимости определения типов показателей и выборе статистических критериев для каждого из них. Так, например, в большинстве процедур определения валидности опросника приходится иметь дело с качественными или дискретными данными, а при получении средних величин по шкалам и их сравнении используются методы для количественных показателей.

2.6.3. Шкалирование данных опросника

Шкалирование, или перекодировка данных опросника — приведение с помощью специальной функции или алгоритма значений переменных в диапазон, удовлетворяющий определенным требованиям. В соответствии с правилами процедуры необработанные данные переводят в баллы КЖ по шкалам опросника, причем в форме, упрощающей в дальнейшем их статистический анализ.

Кроме этого, процесс шкалирования проводится по защищенным авторским правом процедурам, которые предоставляются непосредственно авторами опросника. Нередко при этом используют оригинальное программное обеспечение. Однако, основной задачей шкалирования все же является преобразование данных к формату, который должен обеспечивать их распределение близкое к нормальному, что позволяет применять более точные статистические критерии — параметрические.

Шкалирование опросников с пропущенными данными является распространенным случаем в исследовании КЖ. Для решения этой проблемы разработаны специальные методы обработки неполных данных.

2.6.4. Анализ лонгитюдных исследований качества жизни

Многие исследования КЖ являются лонгитюдными, т.е. оценка КЖ проводится несколько раз через определенные промежутки времени. Корректный анализ данных в таких статистических методах как ANOVA возможен, если во всех точках исследования имеется одинаковое количество данных. В случае исследования КЖ — это опросники и клинические карты. Однако одинаковое количество больных во всех точках обследования встречается исключительно редко. Для обработки данных лонгитюдного исследования существуют различные методы анализа пропущенных данных.

2.6.5. Анализ пропущенных данных

При составлении дизайна исследования, когда предполагается получение пропущенных данных, необходимо ответить на следующие вопросы:

■ Случаен или не случаен пропуск данных?

■ Что будет при игнорировании пропущенных данных?

■ Какое количество пропущенных данных допустимо в исследовании?

■ Какой наилучший метод оценки пропущенных данных?

■ Какой способ восполнения пропущенных данных выбрать?

Существует два основных типа отсутствующих данных: отсутствующие вопросы в опроснике (в том числе и целые шкалы) и отсутствующие опросники.

Способы обработки пропущенных ответов на вопросы

Можно перечислить несколько подходов к решению проблемы пропущенных ответов на вопросы. Среди них целесообразно обратить внимание на следующие:

■ Исключение шкалы, в которой имеется хотя бы один пропуск ответа на вопрос.

■ Простое заполнение средними значениями по шкале.

■ Измененная формула пересчета с учетом количества вопросов, на которые имеется ответ.

■ Заполнение, основанное на «иерархии» шкал, т.е. на основе присутствующих ответов из других, более важных для понимания признака шкал, логически определяется возможный вариант ответа.

Следует отметить, что для большинства современных стандартизированных опросников имеются формулы шкалирования, предусматривающие обработку данных опросника при наличии не менее 50% заполненных ответов на вопросы.

Способы обработки отсутствующих данных, образующих целые шкалы

В литературе описано несколько подходов к обработке пропущенных данных [69, 77, 80, 155]. Одним из таких подходов является метод «заполнения», базирующийся на статистическом анализе отсутствующих данных. Он может быть выполнен несколькими способами.

1. Внесение на место пропущенных данных результатов предыдущих исследований (Last value carried forward).

2. Внесение пропущенных данных с помощью построения марковских цепей. Для построения цепи Маркова для какого-либо процесса в общем случае необходимо иметь конечный результат этого процесса, представлять фоновое состояние этого процесса, а также иметь представление о большей части переходных состояний системы и прямых и обратных связях системы. Построив «марковскую цепь», возможно с заданной степенью вероятности определить состояние системы (в данном случае — предсказать результаты по шкале) на отсутствующем в лонгитюдном исследовании временном отрезке. Предполагается использование генератора случайных чисел средствами программного пакета SAS. Возможны два подхода:

■ заполнение промежутка отсутствующих данных другими данными в определенном диапазоне, выбираемыми случайным образом из результатов «соседних» исследований (Hot deck imputation).

■ заполнение промежутка отсутствующих данных не случайно выбранными значениями, а постоянной величиной (Cold deck imputation).

Доказательство правомочности применения двух вышеуказанных методов строится на определении «ближайшего окружения» данных вокруг известных величин и статистического доказательства отсутствия достоверных различий между известными в близких исследованиях результатами по заполнению шкалы и восполненными обработкой пропущенных данных шкальными показателями.

3. Простое заполнение средними результатами по шкале (Mean imputation).

4. Построение множественной регрессии и вычисление пропущенного результата по уравнению регрессионной кривой. Подобную работу необходимо выполнять для каждого наблюдения. Данный подход без написания программного обеспечения представляет собой трудоемкую процедуру.

Следует отметить, что данные исследований КЖ многомерны, что создает дополнительные трудности в большинстве методик обработки пропущенных данных. Применение методов многомерной статистики требует высокой математической подготовки исследователя, а интерпретация их результатов довольно сложна и всегда сопровождается рядом разногласий и разночтений.

Практически любой способ обработки пропущенных данных обладает как общими недостатками, так и недочетами, присущими каждой из частных статистических технологий. В любом случае теряется информация о «крайних», выпадающих из общего усредненного фона значениях, если они существовали на месте пропущенных. Статистический способ, на основе любого из методов многомерной статистики имеет значительные трудности в интерпретации результатов. Кроме того, обработка ряда отсутствующих данных либо отнимает значительно больше времени, чем сбор данных и их обработка, либо требует написания оригинального программного обеспечения для автоматизации процесса. Таким образом, исследователь всегда находится перед трудноразрешимой дилеммой — нельзя нарушать права пациента на отказ от ответа, но нельзя и уповать на обработку пропущенных значений как на панацею. Матрица данных, обработанная самым сложным методом анализа пропущенных значений, всегда содержит в себе опасность смещения окончательного результата или, как было указано выше, неоправданного усреднения итоговых величин.

<< | >>
Источник: НовикА. А., Ионова Т. И.. Руководство по исследованию качества жизни в медицине. 2-е издание / Под.ред. акад. РАМН Ю.Л.Шевченко,— М.:ЗАО «ОЛМА Медиа Групп»2007. 2007

Еще по теме Статистический анализ в исследовании качества жизни:

  1. Статистически значимые отличия показателей качества жизни
  2. Исследование качества жизни в педиатрии
  3. Исследование качества жизни в кардиологии
  4. Исследование качества жизни трансплантологии
  5. Исследование качества жизни в ревматологии
  6. Исследование качества жизни в пульмонологии
  7. Концепция исследования качества жизни в педиатрии
  8. Исследование качества жизни в онкологии
  9. Основы методологии исследования качества жизни
  10. Особенности методологии исследования качества жизни у детей
  11. Основные направления исследования качества жизни в медицине
  12. Возможности метода исследования качества жизни в онкологии
  13. Возможности метода исследования качества жизни в кардиологии
  14. Методологические аспекты исследования качества жизни в ревматологии
  15. Методология исследования качества жизни при проведении миелотрансплантации
  16. Исследование качества жизни: клинические исследования, клиническая практика
  17. Возможности метода исследования качества жизни при трансплантации костного мозга и стволовых кроветворных клеток
  18. Новик А. А., Ионова Т. И.. Исследование качества жизни в педиатрии (2-е изд., перераб. и доп.) / Под ред. академика РАМН Ю. Л. Шевченко. — М.: РАЕН,2013. — 136 с.: ил., 2013