<<
>>

ТАБЛИЦЫ СОПРЯЖЕННОСТИ: КРИТЕРИЙ х2

Рассмотренный выше метод хорошо работает, если качественный признак, который нас интересует, принимает два значения (тромбоз есть — нет, марсианин зеленый — розовый). Более того, поскольку метод является прямым аналогом критерия Стьюдента, число сравниваемых выборок также должно быть равно двум.

Понятно, что и число значений признака и число выборок может оказаться большим двух. Для анализа таких случаев нужен иной метод аналогичный дисперсионному анализу. С виду этот метод, который мы сейчас изложим, сильно отличается от критерия z, но на самом деле между ними много общего.

Чтоб не ходить далеко за примером начнем с только что разобранной задачи о тромбозе шунтов. Теперь мы будем рассматривать не долю, а число больных с тромбозом. Занесем результаты испытания в таблицу (табл. 5.1). Для каждой из групп укажем число больных с тромбозом и без тромбоза. У нас два признака: препарат (аспирин—плацебо) и тромбоз (есть—нет); в таблице указаны все их возможные сочетания, поэтому такая таблица называется таблицей сопряженности. В данном случае размер таблицы 2x2.

Посмотрим на клетки расположенные, на диагонали идущей из верхнего левого в нижний правый угол. Числа в них заметно больше чисел в других клетках таблицы. Это наводит на мысль о связи между приемом аспирина и риском тромбоза.

Теперь взглянем на табл. 5.2. Это таблица ожидаемых чисел, которые мы получили бы, если бы аспирин не влиял на риск тромбоза. Как рассчитать ожидаемые числа, мы разберем чуть ниже, а пока обратим внимание на внешние особенности таблицы. Кроме немного пугающих дробных чисел в клетках можно заметить еще одно отличие от табл. 5.1 — это суммарные данные по группам в правом столбце и по тромбозам — в нижней строке. В правом нижнем углу — общее число больных в испытании. Об-

Таблица 5.1. Тромбозы шунта при приеме плацебо и аспирина
Тромбоз есть Тромбоза нет
Плацебо 18 7
Аспирин 6 13

ратите внимание, что, хотя числа в клетках на рис.

5.1 и 5.2 разные, суммы по строкам и по столбцам одинаковы.

Как же рассчитать ожидаемые числа? Плацебо получали 25 человек, аспирин — 19. Тромбоз шунта произошел у 24 из 44 обследованных, то есть в 54,55% случаев не произошел — у 20 из 44, то есть в 45,45% случаев. Примем нулевую гипотезу о том, что аспирин не влияет на риск тромбоза. Тогда тромбоз должен с равной частотой 54,55% наблюдаться в группах плацебо и аспирина. Рассчитав, сколько составляет 54,55% от 25 и 19, получим соответственно 13,64 и 10,36. Это и есть ожидаемые числа больных с тромбозом в группах плацебо и аспирина. Таким же образом можно получить ожидаемые числа больных без тромбоза в группе плацебо — 45,45% от 25, то есть 11,36 в группе аспирина — 45,45% от 19, то есть 8,64. Обратите внимание, что ожидаемые числа рассчитываются до второго знака после запятой — такая точность понадобится при дальнейших вычислениях.

Сравним табл. 5.1 и 5.2. Числа в клетках довольно сильно различаются. Следовательно, реальная картина отличается от той, которая наблюдалась бы, если бы аспирин не оказывал влияния на риск тромбоза. Теперь осталось построить критерий, который бы характеризовал эти различия одним числом, и затем найти его критическое значение, — то есть поступить, так как в случае критериев F, t или z.

Однако сначала вспомним еще один уже знакомый нам при-

Таблица 5.2. Тромбозы шунта при приеме плацебо и аспирина: ожидаемые числа
Тромбоз есть Тромбоза нет Всего
Плацебо 13,64 11,36 25
Аспирин 10,36 8,64 19
Всего 24 20 44

Таблица 5.3.
Операционная летальность при галотановой и мор- финовой анестезии
Живы Умерли Всего
Галотан 53 8 61
Морфин 57 10 67
Всего 110 18 128

мер — работу Конахана по сравнению галотана и морфина, а именно ту часть, где сравнивалась операционная летальность. Соответствующие данные приведены в табл. 5.3. Форма таблицы такая же, что и табл. 5.1. В свою очередь табл. 5.4 подобно табл. 5.2 содержит ожидаемые числа, то есть числа, вычисленные исходя из предположения, что летальность не зависит от анестетика. Из всех 128 оперированных в живых осталось 110, то есть 85,94%. Если бы выбор анестезии не оказывал влияния на летальность то в обеих группах доля выживших была бы такой же и число выживших составило бы в группе галотана — 85,94% от 61, то есть 52,42 в группе морфина — 85,94% от 67, то есть 57,58. Таким же образом можно получить и ожидаемые числа умерших. Сравним таблицы 5.3 и 5.4. В отличие от предыдущего примера, различия между ожидаемыми и наблюдаемыми значениями очень малы. Как мы выяснили раньше, различий в летальности нет. Похоже мы на правильном пути.

Критерии х2 для таблицы 2x2

Критерий х2 (читается «хи-квадрат») не требует никаких предположений относительно параметров совокупности, из которой извлечены выборки, — это первый из непараметрических критериев, с которым мы знакомимся. Займемся его построением. Во-первых, как и всегда, критерий должен давать одно число,

Таблица. 5.4. Операционная летальность при галотановой и морфиновой анестезии: ожидаемые числа
Живы Умерли Всего
Галотан 52,42 8,58 61
Морфин 57,58 9,42 67
Всего 110 18 128

которое служило бы мерой отличия наблюдаемых данных от ожидаемых, то есть в данном случае различия между таблицей наблюдаемых и ожидаемых чисел. Во-вторых критерий должен учитывать, что различие, скажем, в одного больного имеет большее значение при малом ожидаемом числе, чем при большом.

Определим критерий х2 следующим образом:

(O - E)2

E

где О — наблюдаемое число в клетке таблицы сопряженности, Е — ожидаемое число в той же клетке. Суммирование проводится по всем клеткам таблицы. Как видно из формулы, чем больше разница наблюдаемого и ожидаемого числа, тем больший вклад вносит клетка в величину %2. При этом клетки с малым ожидаемым числом вносят больший вклад. Таким образом, критерий удовлетворяет обоим требованиям — во-первых, измеряет различия и, во-вторых, учитывает их величину относительно ожидаемых чисел.

Применим критерии х2 к данным по тромбозам шунта. В табл. 5.1 приведены наблюдаемые числа, а в табл. 5.2 — ожидаемые.

х2 =Х

Много это или мало? Испытаем наш новый критерий на данных по галотановой и морфиновой анестезии (табл. 5.3 и 5.4):

х (53 - 52,42)2 , 77 - 8,58) +(77 - 57,58) . (10 - 9,42)2 =

К 52,42 8,58 57,58 9,42 , '

Разница найденных значений %2 довольно велика: 7,10 в первом случае и 0,09 во втором, что соответствует тем впечатлениям, которые мы получили, сравнивая табл. 5.1 с 5.2 и 5.3 с 5.4. В первом случае мы получили «большое» значение %2, «большим» бы-

Рис. 5.7. Распределение %2 с 1 степенью свободы. Заштрихованная зона — это 5% наибольших значений.

ло и значение z, полученное по тем же данным. Можно показать, что для таблиц сопряженности размером 2x2 выполняется равенство X2 = z2.

Критическое значение %2 можно найти хорошо знакомым нам способом. На рис. 5.7 показано распределение возможных значений X2 для таблиц сопряженности размером 2x2 для случая, когда между изучаемыми признаками нет никакой связи. Величина X2 превышает 3,84 только в 5% случаев. Таким образом, 3,84 — критическое значение для 5% уровня значимости. В примере с тромбозом шунта мы получили значение 7,10, поэтому мы отклоняем гипотезу об отсутствии связи между приемом аспирина и образованием тромбов. Напротив, данные из табл. 5.3 хорошо согласуются с гипотезой об одинаковом влиянии галотана и морфина на послеоперационный уровень смертности.

Разумеется, как и все критерии значимости, х2 даёт вероятностную оценку истинности той или иной гипотезы. На самом деле аспирин может и не оказывать влияния на риск тромбоза. На самом деле галотан и морфин могут по-разному влиять на операционную летальность. Но, как показал критерий, и то и другое маловероятно.

Применение критерия х2 правомерно, если ожидаемое число в любой из клеток больше или равно 5[24]. Это условие аналогично условию применимости критерия z.

Критическое значение %2 зависит от размеров таблицы сопряженности, то есть от числа сравниваемых методов лечения (строк таблицы) и числа возможных исходов (столбцов таблицы). Размер таблицы выражается числом степеней свободы v:

V = (r - 1)(с - 1),

где r — число строк, а с — число столбцов. Для таблиц размером 2x2 имеем v = (2 - l)(2 - l) = l. Критические значения %2 для разных v приведены в табл. 5.7.

Приведенная ранее формула для х2 в случае таблицы 2x2 (то есть при 1 степени свободы) дает несколько завышенные значения (сходная ситуация была с критерием z). Это вызвано тем, что теоретическое распределение х2 непрерывно, тогда как набор вычисленных значений х2 дискретен. На практике это приведет к тому, что нулевая гипотеза будет отвергаться слишком часто. Чтобы компенсировать этот эффект, в формулу вводят поправку Йеитса:( 1 O - E - -

E

Заметим, поправка Йеитса применяется только при v = 1, то есть для таблиц 2x2.

Применим поправку Йеитса к изучению связи между приемом аспирина и тромбозами шунта (табл. 5.1 и 5.2):

Как вы помните, без поправки Йейтса значение %2 равнялось 7,10. Исправленное значение %2 оказалось меньше 6,635 — критического значения для 1% уровня значимости, но по-прежнему превосходит 5,024 — критическое значение для 2,5% уровня значимости.

Критерий х2 для произвольной таблицы сопряженности

Теперь рассмотрим случай, когда таблица сопряженности имеет число строк или столбцов, большее двух. Обратите внимание, что критерий z в таких случаях неприменим.

В гл. 3 мы показали, что занятия бегом уменьшают число менструаций*. Побуждают ли эти изменения обращаться к врачу? В табл. 5.5 приведены результаты опроса участниц исследования. Подтверждают ли эти данные гипотезу о том, что занятия бегом не влияют на вероятность обращения к врачу по поводу нерегулярности менструации?

Из 165 обследованных женщин 69 (то есть 42%) обратились к врачу, остальные 96 (то есть 58%) к врачу не обращались. Если

Таблица 5.5. Частота обращения к врачу по поводу менструаций
Группа Обращались Не обращались Всего
Контрольная 14 40 54
Физкультурницы 9 14 23
Спортсменки 46 42 48
Всего 69 96 165

* При этом мы для простоты вычислений размеры всех трех групп — контрольной, физкультурниц и спортсменок — полагали одинаковыми. Теперь мы воспользуемся настоящими данными.

занятия бегом не влияют на вероятность обращения к врачу, то в каждой из групп к врачу должно было обратиться 42% женщин. В табл. 5.6 приведены соответствующие ожидаемые значения. Сильно ли отличаются от них реальные данные?

Для ответа на этот вопрос вычислим %2:

(14 - 22,58)2 (40 - 31,42)2 (9 - 9,62)2

22,58 31,42 9,62

(14 - 13,38)2 (46 - 36,80)2 (42 - 51,20)2

13,38 36,80 51,20

Число строк таблицы сопряженности равно трем, столбцов — двум, поэтому число степеней свободы v = (3 - 1)(2 - 1) = 2. Если гипотеза об отсутствии межгрупповых различий верна, то, как видно из табл. 5.7 значение %2 превзойдет 9,21 не более чем в 1% случаев. Полученное значение больше. Тем самым, при уровне значимости 0,01 можно отклонить гипотезу об отсутствии связи между бегом и обращениями к врачу по поводу менструации. Однако, выяснив, что связь существует мы, тем не менее, не сможем указать какая (какие) именно группы отличаются от остальных.

Итак, мы познакомились с критерием %2. Вот порядок его применения.

• Постройте по имеющимся данным таблицу сопряженности.

• Подсчитайте число объектов в каждой строке и в каждом столбце и найдите, какую долю от общего числа объектов составляют эти величины.

• Зная эти доли, подсчитайте с точностью до двух знаков после запятой ожидаемые числа — количество объектов, которое

попало бы в каждую клетку таблицы, если бы связь между строками и столбцами отсутствовала

• Найдите величину, характеризующую различия наблюдаемых и ожидаемых значений. Если таблица сопряженности имеет размер 2x2, примените поправку Йеитса

• Вычислите число степеней свободы, выберите уровень значимости и по табл. 5.7, определите критическое значение %2. Сравните его с полученным для вашей таблицы.

Как вы помните, для таблиц сопряженности размером 2x2 критерий х2 применим только в случае, когда все ожидаемые числа больше 5. Как обстоит дело с таблицами большего размера? В этом случае критерии %2 применим, если все ожидаемые числа не меньше 1 и доля клеток с ожидаемыми числами меньше 5 не превышает 20%. При невыполнении этих условии критерии х2 может дать ложные результаты. В таком случае можно собрать дополнительные данные, однако это не всегда осуществимо. Есть и более простой путь — объединить несколько строк или столбцов. Ниже мы покажем, как это сделать.

Преобразование таблиц сопряженности

В предыдущем разделе мы установили существование связи между занятием бегом и обращениями к врачу по поводу менструаций или, что, то же самое, существование различий между группами по частоте обращения к врачу. Однако мы не могли определить, какие именно группы отличаются друг от друга, а какие нет. С похожей ситуацией мы сталкивались в дисперсионном анализе. При сравнении нескольких групп дисперсионный анализ позволяет обнаружить сам факт существования различий, но не указывает выделяющиеся группы. Последнее позволяют сделать процедуры множественного сравнения, о которых мы говорили в гл. 4. Нечто похожее можно проделать и с таблицами сопряженности.

Глядя на табл. 5.5, можно предположить, что физкультурницы и спортсменки обращались к врачу чаще, чем женщины из контрольной группы. Различие между физкультурницами и спортсменками кажется незначительным.

Проверим гипотезу о том, что физкультурницы и спортсмен-

V 0,50 0,25 0,10 0,05 0,025 0,01 0,005 0,001
41 40,335 46,692 52,949 56,942 60,561 64,950 68,053 74,745
42 41,335 47,766 54,090 58,124 61,777 66,206 69,336 76,084
43 42,335 48,840 55,230 59,304 62,990 67,459 70,616 77,419
44 43,335 49,913 56,369 60,481 64,201 68,710 71,893 78,750
45 44,335 50,985 57,505 61,656 65,410 69,957 73,166 80,077
46 45,335 52,056 58,641 62,830 66,617 71,201 74,437 81,400
47 46,335 53,127 59,774 64,001 67,821 72,443 75,704 82,720
48 47,335 54,196 60,907 65,171 69,023 73,683 76,969 84,037
49 48,335 55,265 62,038 66,339 70,222 74,919 78,231 85,351
50 49,335 56,334 63,167 67,505 71,420 76,154 79,490 86,661
Уровень значимости

J. H. Zar, Biostatistical Analysis, 2d ed, Prentice-Hall, Englewood Cliffs, N.J., 1984.

ки обращаются к врачу одинаково часто. Для этого выделим из исходной таблицы подтаблицу, содержащую данные по двум этим группам. В табл. 5.8 приведены наблюдаемые и ожидаемые числа; они довольно близки.

Размер таблицы 2x2. Поэтому вычислим %2 с поправкой Йейтса:

Полученная величина значительно меньше критического значения. Поэтому гипотеза об отсутствии межгрупповых различий не отклоняется. Следовательно, эти группы можно объединить в одну. Полученную объединенную группу бегуний сравним с контрольной (табл. 5.9). На этот раз значение %2 равно 7,39, то

Таблица 5.8. Частота обращения к врачу по поводу менструаций (в скобках — ожидаемые числа)
Группа Обращались Не обращались Всего
Физкультурницы 9(11,40) 14(11,60) 23
Спортсменки 46(43,60) 42(44,40) 88
Всего 55 56 111
Таблица 5.8. Частота обращения к врачу по поводу менструаций (в скобках — ожидаемые числа)
Группа Обращались Не обращались Всего
Контрольная 14(22,58) 40(30,42) 54
Физкультурницы

спортсменки

и 55(46,42) 56(64,58) 111
Всего 69 96 165

есть больше критического значения 6,63, соответствующего уровню значимости 0,01.

Заметьте, мы выполнили два сравнения, используя одни и те же данные. Поэтому нужно применить поправку Бонферрони, умножив уровень значимости на 2. Исправленное значение уровня значимости 2x0,01 = 0,02. Итак, с уровнем значимости 0,02 мы заключаем, что физкультурницы не отличаются от спортсменок, но обе эти группы отличаются от женщин, не занимающихся бегом.

<< | >>
Источник: С. Гланц. Медико-биологическая статистика. Пер. с англ. — М., Практика1998. 1998

Еще по теме ТАБЛИЦЫ СОПРЯЖЕННОСТИ: КРИТЕРИЙ х2:

  1. ТАБЛИЦА СОПРЯЖЕННОСТИ 2x2
  2. ЧУВСТВИТЕЛЬНОСТЬ ТАБЛИЦ СОПРЯЖЕННОСТИ[30]
  3. СОПРЯЖЕННОСТЬ РЕАКЦИЙ ГЛЮКУРОНИРОВАНИЯ ЛЕКАРСТВ С ДРУГИМИ ПРОЦЕССАМИ БИОТРАНСФОРМАЦИИ
  4. II. Кининовые рецепторы и сопряжение рецептор-эффектор X. П. РАНГ (Н.Р. RANG)
  5. Таблица 4. Выбор антипсихотического средства в зависимости от типа мании
  6. Табл. 4. Таблица доз и аминазиновых эквивалентов антипсихотических средств
  7. Таблица 7. Альтернативне варианты лечения резистентних маниакальных состояний
  8. Таблица 3. Противопоказания к назначению стабилизаторов настроени
  9. Таблица 3. ЛЕКАРСТВЕННЫЕ ВЗАИМОДЕЙСТВИЯ ПСИХОТРОПНЫХ СРЕДСТВ
  10. ТОЧНЫЙ КРИТЕРИЙ ФИШЕРА
  11. Таблица 9. Выбор стабилизатора настроения при обострении маниакального состояния
  12. Таблица 1. Схема купирования психомоторного возбуждения клопиксоло
  13. Таблица 5. Выбор антипсихотических препаратов (АПП) в случаях отягощенного анамнеза
  14. КРИТЕРИИ ТЬЮКИ
  15. Таблица 6. Терапевтические цели и способы дополнительной терапии маниакальных состояний
  16. Таблица № 1. Стратегии психофармакотерапии согласно дименсиональной модели шизофрении
  17. РЕКОМЕНДАЦИИ, КАСАЮЩИЕСЯ СТАТИСТИЧЕСКИХ ТАБЛИЦ ДЛЯ МЕЖДУНАРОДНОГО СРАВНЕНИЯ