Яндекс.Метрика Вычисление критерия Хи-квадрат для таблицы 2х2
Вычисление критерия Хи-квадрат для таблиц
сопряженности 2х2 (без поправки Иэйтса)

    Используя данную таблицу вы можете провести анализ таблиц сопряженности двух качественных признаков 2х2, вычислить статистику Хи-квадрат для этих таблиц и сравнить ее значение с приведенными ниже критическими величинами этой статистики для уровней значимsости р=0,05, р=0,025, р=0,01 и р=0,005. Данный анализ позволит Вам ответить на вопрос "Можно ли утверждать, исходя из данных Вашей выборки, что два исследуемых дискретных, качественных признака независимы друг от друга в генеральной совокупности?" Иными словами, что между этими признаками отсутствует взаимосвязь. Если эта гипотеза будет отвергнута, то с большой долей вероятности мы можем утверждать, что такая зависимость существует. Для иллюстрации этого анализа используем пример из монографии "Обучение медицинской статистике. Двадцать лекций и семинаров" под редакцией С.К.Лванга и Чжо-Ек Тыэ. Издание ВОЗ, Женева 1989 (на русском языке выпущено издательством "Медицина") приведенный на стр. 83. Исследуется наличие взаимосвязи между приемом контрацептивных таблеток матерями, и желтухой у детей получающих грудное вскармливание. Таблица сопряженности для этого примера имеет следующий вид
 
  Наличие заболевания у детей  
Прием матерью таблеток Есть желтуха Нет желтухи Всего
Принимала таблетки 33 24 57
Не принимала таблетки 14 45 59
Всего 47 69 116

В этом примере у 33 матерей принимавших таблетки дети болели желтухой, а у 24 матерей также принимавших таблетки дети не болели желтухой. Далее, у 14 матерей которые не принимали таблетки, дети болели желтухой и у 45 матерей не принимавших таблетки, дети не болели желтухой. Объем выборки для данного примера равен 116. Обозначим градации по строкам как А1 (прием таблеток) и А2 (таблетки не принимались), а градации по столбцам обозначим как В1 (дети больны желтухой) и В2 (желтухи нет). Соответствующие комбинации этих градаций между собой будем обозначать как a1b1(33), a1b2 (24), a1b1 (14) и a2b2 (45).


  Таблица сопряженности 2х2 для вычисления критерия хи-квадрат
(без поправки Иэйтса на непрерывность)
 
  B1 B2 Всего
A1




A2





    Для вычисления критерия хи-квадрат введите в cоответствующие клетки расположенной слева таблицы числа 33, 24, 14 и 45 нажмите кнопку "Вычислить". 
Всего





   Числа, расположенные в столбце и строке "Всего", вводить не надо, программа вычислит и введет их сама. После нажатия кнопки "Вычислить" в нижнем правом углу появится вычисленное значение критерия Хи-квадрат  равное 14,042. 
     

Хи-квадрат =

    Сравнив это значение с приведенными ниже  критическими значениями для трех уровней значимости, увидим, что вычисленное значение превосходит каждое из них.  Поэтому гипотезу о независимости между заболеванием желтухой и приемом контрацептивных таблеток мы отвергнем при уровне значимости p < 0,005.

Критические значения статистики хи-квадрат
для числа степеней свободы df=1
 
Уровни значимости "р" 0,05  0,025  0,01  0,005 
Кыритические значения  3,842  5,024  6,635  7,880 

 Если же обратиться к более полным таблицам распределения статистики хи-квадрат, то значению 14,042 при числе степеней свободы равном 1, будет отвечать достигнутый уровень значимости р=0,000179 .

   Обратим внимание наших читателей на то, что приведенный в этой монографии пример носит несколько искусственный характер, поскольку здесь ничего не сказано о том, какой контрацептив принимали женщины, как долго и т.д. Поэтому результат этого примера конечно же нельзя распространять на все пероральные  контрацептивы в целом. Отметим также, что данную таблицу можно использовать в первом приближении и для проверки нулевой гипотезы о равенстве частот в двух генеральных совокупностях.  Применительно к содержанию приведенной выше таблицы, можно говорить о проверке гипотезы о равенстве частоты заболевания желтухой в популяциях принимающих пероральные контрацептивы, и не принимающих таковые.

   Для анализа собственной таблицы сопряженности нажмите кнопку "Очистить" и введите свои частоты, после чего вновь нажмите кнопку "Вычислить".


Замечание 1. Ожидаемые частоты, которые вычисляются исходя из гипотезы независимости признаков, должны иметь значения не менее 5. Если эти частоты имеют значения менее 5, то появляется соответствующее предупреждение. Оно означает, что ваш результат неустойчив и имеет смысл увеличить объем выборки.

Замечание 2. В том случае, когда нулевая гипотеза о независимости признаков отвергается (вычисленное значение статистики хи-квадрат больше критического), необходим дальнейший анализ этой таблицы. Такой детальный анализ таблицы сопряженности, особенно для таблиц с числом градаций более двух - 3х3, 3х4, 4х5 и т.д. может провести только опытный биостатистик. Отметим, что результаты такого анализа могут дать очень много полезной информации.



© 1997 - 2017 Василий Леонов
 

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ.
Rambler's Top100