<<
>>

ЧЕМ ОПРЕДЕЛЯЕТСЯ ЧУВСТВИТЕЛЬНОСТЬ?

Естественно, мы заинтересованы в том, чтобы по возможности уменьшить вероятность ошибки II рода, то есть повысить чувствительность критерия. Для этого нужно знать, от чего она зависит.

В принципе, эта задача похожа на ту, что решалась применительно к ошибкам I рода, но за одним важным исключением. Чтобы оценить чувствительность критерия, нужно задать величину различий, которую он должен выявлять. Эта величина определяется задачами исследования. В примере с диуретиком чувствительность была невелика — 55%. Но, может быть, исследователь просто не считал нужным выявлять прирост диуреза с 1200 до 1400 мл/сут, то есть всего на 17%?

С увеличением разброса данных повышается вероятность ошибок обоих типов. Как мы вскоре увидим, величину различий и разброс данных удобнее учитывать совместно, рассчитав отношение величины различий к стандартному отклонению.

Чувствительность диагностической пробы можно повысить, снизив ее специфичность — аналогичное соотношение существует между уровнем значимости и чувствительностью критерия. Чем выше уровень значимости (то есть чем меньше а), тем ниже чувствительность.

Как мы уже говорили, важнейший фактор, который влияет на вероятность ошибок как I, так и II рода, — это объем выборок. С ростом объема выборок вероятность ошибок уменьшается. Практически это очень важно, поскольку прямо связано с планированием эксперимента.

Прежде чем перейти к подробному рассмотрению факторов, влияющих на чувствительность критерия, перечислим их еще раз.

• Уровень значимости а. Чем меньше а, тем ниже чувствительность.

• Отношение величины различий к стандартному отклонению. Чем больше это отношение, тем чувствительнее критерий.

• Объем выборок. Чем больше объем, тем выше чувствительность критерия.

• Уровень значимости

Чтобы получить наглядное представление о связи чувствительности критерия с уровнем значимости, вернемся к рис.

6.3. Выбирая уровень значимости а, мы тем самым задаем критическое значение t. Это значение мы выбираем так, чтобы доля превосходящих его значений — при условии, что препарат не оказывает эффекта, — была равна а (рис. 6.3А). Чувствительность критерия есть доля тех значений критерия, которые превосходят критическое при условии, что лечение дает эффект (рис. 6.3Б). Как видно из рисунка, если изменить критическое значение, изменится и эта доля.

Б

Рис. 6.4. Выбирая уровень значимости а, мы тем самым определяем критический уровень t. Чем меньше а, тем выше критический уровень и тем ниже чувствительность. А. Уровень значимости а = 0,05, критическое значение t = 2,101, чувствительность 55%. Б. Теперь уровень значимости а = 0,01, критическое значение t выросло до 2,878 и чувствительность снизилась до 45%.

Рассмотрим подробнее, как это происходит. На рис. 6.4А изо- бизображено распределение значений критерия Стьюдента. Отличие от рис. 6.3 состоит в том, что теперь это распределение, полученное для всех 1027 возможных пар выборок. Верхний график — это распределение значений t для случая, когда препарат не обладает диуретическим действием. Предположим, мы выбрали уровень значимости 0,05, то есть приняли а = 0,05. В этом случае критическое значение равно 2,101, то есть мы отвергаем нулевую гипотезу и признаем различия статистически значимыми при t > +2,101 или t < -2, 101. Соответствующие области на графике заштрихованы, а критическое значение изображено вертикальной пунктирной линией, спускающейся к нижнему графику, на котором изображено распределение t для случая, когда препарат обладает диуретическим действием, а именно увеличивает суточный диурез на 200 мл.

По форме, нижний график такой же, как верхний, но сдвинут на 200 мл вправо. Доля значений t, превышающих критическое значение 2,101 (заштрихованная область), составляет 0,55. Итак, чувствительность критерия в данном случае 55%; а вероятность ошибки второго рода в = 1 - 0,55 = 0,45, то есть 45%.

А теперь взглянем на рис. 6.4Б. На нем изображены те же самые распределения значений t. Отличие в выбранном уровне значимости — а = 0,01. Критическое значение t повысилось до 2,878, пунктирная линия сместилась вправо и отсекает от нижнего графика только 45%. Таким образом, при переходе от 5% к 1% уровню значимости чувствительность снизилась с 55 до 45%. Соответственно, вероятность ошибки II рода повысилась до 1 - 0,45 = 0,55.

Итак, снижая а, мы снижаем риск отвергнуть верную нулевую гипотезу, то есть найти различия (эффект) там, где их нет. Но тем самым мы снижаем и чувствительность — вероятность выявить имеющиеся на самом деле различия.

Величина различий

Рассматривая влияние уровня значимости, мы принимали величину различий постоянной: наш препарат увеличивал суточный диурез с 1200 до 1400 мл, то есть на 200 мл. Теперь примем

постоянным уровень значимости а = 0,05 и посмотрим, как чувствительность критерия зависит от величины различий. Понятно, что большие различия выявить легче, чем маленькие. Рассмотрим следующие примеры. На рис. 6.5А изображено распределение значений t для случая, когда исследуемый препарат не обладает диуретическим действием. Заштрихованы 5% наибольших по абсолютной величине значений t, расположенных левее - 2,101 или правее +2,101. На рис. 6.5Б изображено распределение значений t для случая, когда препарат увеличивает суточный

Увеличение суточного диуреза, мл

диурез в среднем на 200 мл (эту ситуацию мы уже рассматривали). Выше правого критического значения лежит 55% возможных значений t: чувствительность равна 0,55. Далее, на рис. 6.5В представлено распределение значений t для случая, когда препарат увеличивает диурез в среднем на 100 мл. Теперь только 17% значений t превышает 2,101. Тем самым, чувствительность критерия равна лишь 0,17. Иными словами, эффект будет обнаружен менее чем в одном из каждых пяти сравнений контрольной и экспериментальной групп. Наконец, рис. 6.5Г представляет случай увеличения диуреза на 400 мл. В критическую область попало 99% значений t. Чувствительность критерия равна 0,99: различия будут выявлены почти наверняка.

Повторяя этот мысленный эксперимент, можно определить чувствительность критерия для всех возможных значений эффекта, от нулевого до «бесконечного». Нанеся результаты на график, мы получим рис. 6.6, где чувствительность критерия показана как функция от величины различий. По этому графику можно определить, какой будет чувствительность при той или иной величине эффекта. Пользоваться графиком пока что не очень удобно, ведь он годится только для этих численности групп, стандартного отклонения и уровня значимости. Вскоре мы построим другой график, более подходящий для планирования исследования, но сначала нужно подробнее разобраться с ролью разброса значений и численности групп.

Разброс значений

Чувствительность критерия возрастает с ростом наблюдаемых различий; с ростом разброса значений чувствительность, напротив, снижается.

Напомним, что критерий Стьюдента t определяется следующим образом:

где Х1 и Х2 — средние, s — объединенная оценка стандартного

отклонения а, п1 и п2 — объемы выборок. Заметьте, что Х1 и

Х2 — это оценки двух (различных) средних — р и р2. Для простоты допустим, что объемы обеих выборок равны, то есть n1 = n2. Тогда вычисленное значение t есть оценка величиныP1-P2 P -Р

Обозначим 5 (греческая буква «дельта») величину эффекта, то есть разность средних: 5 = р - р2, тогда

Таким образом, t зависит от отношения величины эффекта к стандартному отклонению.

Рассмотрим несколько примеров. Стандартное отклонение в исследуемой нами совокупности составляет 200 мл (см. рис. 6.1). В таком случае увеличение суточного диуреза на 200 или 400 мл равно соответственно одному или двум стандартным отклонениям. Это очень заметные изменения. Если бы стандартное отклонение равнялось 50 мл, то те же самые изменения диуреза были бы еще более значительными, составляя соответственно 4 и 8 стандартных отклонений. Наоборот, если бы стандартное отклонение равнялось, например, 500 мл, то изменение диуреза в 200 мл составило бы 0,4 стандартного отклонения. Обнаружить такой эффект было бы непросто да и вряд ли вообще стоило бы.

Итак, на чувствительность критерия влияет не абсолютная величина эффекта, а ее отношение к стандартному отклонению. Обозначим его ф (греческая «фи»); это отношение ф = 5/а называется параметром нецентральности.

Объем выборки

Мы узнали о двух факторах, которые влияют на чувствительность критерия: уровень значимости а и параметр нецентральности ф. Чем больше а и чем больше ф, тем больше чувстви

тельность. К сожалению, влиять на ф мы не можем вовсе, а что касается а, то его увеличение повышает риск отвергнуть верную нулевую гипотезу, то есть найти различия там, где их нет. Однако есть еще один фактор, который мы можем, в определенных пределах, менять по своему усмотрению, не жертвуя уровнем значимости. Речь идет об объеме выборок (численности групп). С увеличением объема выборки чувствительность критерия увеличивается.

Существуют две причины, в силу которых увеличение объема выборки увеличивает чувствительность критерия. Во-первых, увеличение объема выборки увеличивает число степеней свободы, что, в свою очередь, уменьшает критическое значение. Во-вторых, как видно из только что полученной формулы

значение t растет с ростом объема выборки n (это справедливо и для многих других критериев).

На рис 6.7А воспроизведены распределения с рис. 6.4А. Верхний график соответствует случаю, когда препарат не обладает диуретическим действием, нижний — когда препарат увеличивает суточный диурез на 200 мл. Численность каждой из групп составляет 10 человек. На рис 6.7Б приведены аналогичные распределения. Отличие в том, что теперь в каждую группу входило не 10, а 20 человек. Раз объем каждой из групп равен 20, число степеней свободы равно V = 2(20 - 1) = 38. Из таблицы 4.1 находим, что критическое значение t при 5% уровне значимости равно 2,024 (в случае выборок объемом 10 оно равнялось 2,101). С другой стороны, увеличение объема выборок привело к увеличению значений критерия. В результате уже не 55, а 87% значений t превышают критическое значение. Итак, увеличение численности групп с 10 до 20 человек привело к повышению чувствительности с 0,55 до 0,87.

Перебирая все возможные объемы выборок, можно построить график чувствительности критерия как функции от численности групп (рис. 6.8). С увеличением объема чувствительность

Препарат увеличивает суточный диуоез на 200 мл

(

Рис. 6.7. Увеличение объема выборки повышает чувствительность по двум причинам. Во-первых, увеличивается число степеней свободы, и критическое значение t уменьшается. Во-вторых, при той же величине различий получаются более высокие значения t.

растет. Сначала она растет ускоренно, затем, начиная с некоторого объема выборки, рост замедляется.

Расчет чувствительности — важнейшая составная часть планирования медицинских исследований. Теперь, познакомившись с наиболее важным фактором, определяющим чувствительность, мы готовы решить эту задачу.

Как определить чувствительность критерия?

На рис. 6.9 чувствительность критерия Стьюдента представлена как функция от параметра нецентральности ф = 5/с при уровне значимости а = 0,05. Четыре кривые соответствуют четырем объемам выборок.

Подразумевается, что выборки имеют равный объем. Что делать, если это не так? Если вы обратились к рис. 6.9 при планировании исследования (что весьма разумно), то нужно учесть следующее. При заданной общей численности обследованных именно равная численность групп обеспечивает максимальную чувствительность. Значит, равную численность групп и следует запланировать. Если же вы решили рассчитать чувствительность после проведения исследования, когда, не найдя статис- тически-значимых различий, вы хотите определить, в какой степени это можно считать доказательством отсутствия эффекта, — тогда следует принять численность обеих групп равной меньшей из них. Такой расчет даст несколько заниженную оценку чувствительности, но убережет вас от излишнего оптимизма.

Применим кривые с рис. 6.9 к примеру с диуретиком (см. рис. 6.1). Мы хотим вычислить чувствительность критерия Стьюдента при уровне значимости а = 0,05. Стандартное отклонение равно 200 мл. Какова вероятность выявить увеличение суточного диуреза на 200 мл?

8 200 ,

ф= = = 1.

а 200

Численность контрольной и экспериментальной групп равна десяти. Выбираем на рис. 6.9 соответствующую кривую и находим, что чувствительность критерия равна 0,55.

До сих пор мы говорили о чувствительности критерия Стью-

Объем выборок

дента. Можно рассчитать чувствительность и других критериев. Определяется она теми же самыми факторами, но ход вычислений будет несколько иным.

Галотан и морфин при операциях на открытом сердце

В гл. 4 мы сравнили сердечный индекс при галотановой и морфиновой анестезии (см. табл. 4.2) и не нашли статистически значимых различий. (Напомним, что сердечный индекс — это отношение минутного объема сердца к площади поверхности тела.) Однако группы были малы — 9 и 16 человек. Средняя величина сердечного индекса в группе галотана равнялась 2,08 л/мин/м2; в группе морфина 1,75 л/мин/м2, то есть на 16% меньше. Даже если бы различия были статистически значимыми, вряд ли столь небольшая разница представляла бы какой-либо практический интерес.

Поэтому поставим вопрос так: какова была вероятность выявить разницу в 25%? Объединенная оценка дисперсии s2 = 0,89, значит, стандартное отклонение равно 0,94 л/мин/м2. Двадцать пять процентов от 2,08 л/мин/м2 — это 0,52 л/мин/м2.

Тем самым,

_5 _ 0,52 о ~ 0,94

Поскольку численности групп не совпадают, для оценки чувствительности выберем меньшую из них — 9. Из рис. 6.9 следует, что в таком случае чувствительность критерия — 0,16.

Шансы выявить даже 25% различия были весьма малы. Подведем итоги.

• Чувствительность критерия есть вероятность отвергнуть ложную гипотезу об отсутствии различий.

• На чувствительность критерия влияет уровень значимости: чем меньше а, тем ниже чувствительность.

• Чем больше величина эффекта, тем больше чувствительность.

• Чем больше объем выборки, тем больше чувствительность.

• Для разных критериев чувствительность вычисляется по-разному.

Рис. 6.9. Чувствительность критерия Стьюдента в зависимости от параметра нецентральное™ ф при уровне значимости а = 0,05 для разных объемов выборок п. Параметр нецентральности — это отношение величины различий к стандартному отклонению в совокупности: ф = 5/о. Пунктирные линии показывают, как пользоваться графиками. Если, например, величина различий 5 = 200 мл, стандартное отклонение о = 200 мл, то ф = 1. Для объема выборок п = 10 чувствительность составляет 0,55. При ф = 0,55 и п = 9 чувствительность — всего лишь 0,16.

<< | >>
Источник: С. Гланц. Медико-биологическая статистика. Пер. с англ. — М., Практика1998. 1998

Еще по теме ЧЕМ ОПРЕДЕЛЯЕТСЯ ЧУВСТВИТЕЛЬНОСТЬ?:

  1. О чем должны учить родители
  2. Чем различаются препараты ААС
  3. ЧЕМ ОТЛИЧАЮТСЯ ИНФЕКЦИОННЫЕ БОЛЬНЫЕ ОТ ВСЕХ ДРУГИХ
  4. Чем еще можно возбудить иммунную систему?
  5. ЧУВСТВИТЕЛЬНОСТЬ кожи
  6. ЧУВСТВИТЕЛЬНОСТЬ ДИСПЕРСИОННОГО АНАЛИЗА
  7. ОТСЕКИ, ОПРЕДЕЛЯЮЩИЕ СПЕЦИФИКУ РАСПРЕДЕЛЕНИЯ ЛЕКАРСТВА В ОРГАНИЗМЕ
  8. ЧУВСТВИТЕЛЬНОСТЬ ТАБЛИЦ СОПРЯЖЕННОСТИ[30]
  9. ЗАЧЕМ ВЫЧИСЛЯТЬ ЧУВСТВИТЕЛЬНОСТЬ?
  10. Учет чувствительности пациента
  11. ЧУВСТВИТЕЛЬНОСТЬ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ
  12. Что значит «незначимо»: чувствительность критерия
  13. СТРУКТУРА МЕЖКЛЕТОЧНОГО КОНТАКТА, ОПРЕДЕЛЯЮЩЕГО ПАРАЦЕЛЛЮЛЯРНЫЙ ТРАНСПОРТ ВЕЩЕСТВ