Яндекс.Метрика Статистика в медицине

Каждый слышит то, что понимает. Гете

Статистика посещаемости БИОМЕТРИКИ

16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц
14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц
14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страницы
17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц
03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц
30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц
06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц
08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы

Если приходят, значит полезное находят.
 
Пишите нам на адрес

Выбрав изображение, кликните мышкой, и Вы прочитаете о том, как ...

Редактор БИОМЕТРИКИ
В. Леонов

Яндекс
цитирования
Яндекс цитирования
 
25 наиболее популярных ссылок, посещаемых читателями нашего сайта
http://www.biometrica.tomsk.ru/comp_aver.htm
http://www.biometrica.tomsk.ru/kuzbass5.htm
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/kuzbass6.htm
http://www.biometrica.tomsk.ru/erevan_4.html
http://www.biometrica.tomsk.ru/principals.htm
http://www.biometrica.tomsk.ru/kk.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/paradigma.htm
http://www.biometrica.tomsk.ru/index.htm
http://www.biometrica.tomsk.ru/freq1.htm

http://www.biometrica.tomsk.ru/percent_00.htm
http://www.biometrica.tomsk.ru/cluster_3.htm
http://www.biometrica.tomsk.ru/k_s.htm
http://www.biometrica.tomsk.ru/edu_1.htm
http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/kuzbass2.htm
http://www.biometrica.tomsk.ru/ftp/dict/cult/gramm.htm
http://www.biometrica.tomsk.ru/biometrica_15.htm
http://www.biometrica.tomsk.ru/stat_cardio5.htm
http://www.biometrica.tomsk.ru/krasnojarsk.htm http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/logit_6.htm

 Журнал "Медицинские технологии. Оценка и выбор", 2014, №1, с. 17-28.
Леонов В.П. "Статистика в кардиологии. 15 лет спустя".

Логистическая регрессия в медицине и биологии

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.

5. Особенности логистической регрессии в акушерстве.
6. Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?

Анализ таблиц сопряжённости 2х2
с вычислением статистик связи (с поправкой Иэйтса)

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ ДИССЕРТАНТОВ

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. Стандартные сроки анализа данных: для статей и докладов - 5-10 дней, для кандидатских диссертаций 1 месяц, для докторских диссертаций 1,5 месяца. (См. далее)

Отзывы заказчиков по статистическому анализу данных

Данная таблица вычисляет критерий хи-квадрат  для таблицы сопряженности 2х2 и достигнутый уровень значимости (с поправкой Иэйтса на непрерывность). Кроме того производится оценка таких статистик связи, как отношения шансов (odds ratio), относительного риска (relative risk), чувствительности (sensitivy, Se), специфичности (specificity, Sp), прогностичность положительного результата (PVP), прогностичность отрицательного результата (PVN) а также границ 95% -ных доверительных интервалов для них. Аппроксимация для достигнутого уровня значимости дает погрешность в четвертом-пятом знаке после запятой. Такая погрешность не сказывается на решении об отвержении нулевой гипотезы. Введем данные таблицы о соотношении между приемом контрацептивных таблеток матерями,  и желтухой у их детей, получающих грудное вскармливание (пример из монографии "Обучение медицинской статистике. Двадцать лекций и семинаров" под редакцией С.К.Лванга и Чжо-Ек Тыэ). Как и в предыдущей таблице числа в столбе и строке "Всего" вводить не обязательно, т.к. программа вычисляет их самостоятельно. После нажатия кнопки "Вычислить статистики" получим значение хи-квадрат равное 12,6604 при достигнутом уровне значимости равном 0,0011 . Напомним, что вычисление статистики хи-квадрат без поправки Иэйтса дает значение хи-квадрат равное 14,042.
 
Наличие А 
Отсутствие А 
Всего 
Наличие
признака В
Отсутствие
признака В
Всего

Хи-квадрат 
Степени свободы 
Уровень значимости "p" 
 
Статистики 
Значение 
статистик 
Нижняя граница 
95%-ного 
доверительного 
интервала 
Верхняя граница 
95%-ного 
доверительного 
интервала 
Отношение шансов
Относительный риск
Индекс Каппа
Чувствительность
Специфичность
Прогностичность 
положительного результата
Прогностичность 
отрицательного результата

В том случае, когда достигнутый уровень значимости будет меньше критического, и будет принята гипотеза о наличии статистической взаимосвязи между парой качественных признаков, весьма важно идентифицировать в каких сочетаниях градаций этих признаков сконцентрирована данная взаимосвязь. Отметим, что факт наличия взаимосвязи не обязательно может трактоваться как установление причинно-следственной связи. Так как в этом случае возможны 2 ситуации. Во-первых, действительно один из признаков может быть причиной, а второй - следствием. Во-вторых, оба признака могут быть следствиями других признаков. Однако в обоих случаях важно установить как сочетание градаций (клетки) этих двух анализируемых признаков, для которых имеет место максимальное проявление взаимосвязи. А также установить те комбинации градаций (клетки), в которых взаимосвязь отсутствует. Следующий аспект такого углублённого анализа заключается в определении в клетках с максимальными вкладами в установленную взаимосвязь, направления этой взаимосвязи. Ниже приведена таблица сопряжённости 3*2 (3 строки и 2 столбца), в которой представлены частоты, полученные при анализе реальных данных. В данном исследовании был проведён опрос 1082 респондентов (медиков). Респонденты давали ответы на 659 вопросов. Основная цель исследования заключалась в изучении спектра лекарственных средств, применяемых в клинической практике для профилактики и лечения конкретных, наиболее распространённых заболеваний и синдромов в различных федеральных округах России, и оценить их соответствие современным рекомендациям. 3 строки данной стаблицы сопряжённости отвечают 3 специальностям респондентов. А 2 столбца означают 2 варианта ответа на вопрос об использовании конкретного препарата при конкретном заболевании.

Специальность

медика

Использование препарата

Итого

Нет, не

используют

данный

препарат

Да,

используют

данный

препарат

Специальность 1 72 484 556
Специальность 2 210 170 380
Специальность 3 95 51 146
Итого 377 705 1082

Для этой таблицы сопряжённости вычисленный критерий Пирсона Хи-квадрат равен 245,9354. Для двух степеней свободы достигнутый уровень значимости "р <0,0001". Интенсивность взаимосвязи между специальностью респондентов и использованием конкретного препарата оценивается с помощью V-критерия Крамера, который равен 0,4768. Поскольку критерий Крамера может изменяться в интервале от 0 до 1, то можно говорить о наличии значительной статистической взаимосвязи для данной пары признаков. Очевидно, что в данной паре признаков специальность респондента является причиной, а следствием является отношение этого специалиста к использованию конкретного препарата. Более детальный анализ этой таблицы сопряжённости позволяет получить вклады каждой комбинации двух признаков (отдельной клетки таблицы) в значение критерия Крамера. Ниже представлена таблица с 6-ю клетками, в каждой из которых представлены проценты вклада данной клетки в V-критерий Крамера. Эти результаты говорят о том, что максимальный вносит первый столбец и первая строка.

Специальность

медика

Использование препарата

Итого

Нет, не

используют

данный

препарат

Да,

используют

данный

препарат

Специальность 1 31,1% 16,63% 47,73%
Специальность 2 18,49% 9,89% 28,38%
Специальность 3 15,57% 8,32% 23,89%
Итого 65,16% 34,84% 100%

Ниже представлена таблица, в которой для 6 комбинаций градаций двух анализируемых признаков отмечены положительные или отрицательные направления взаимосвязи.

Специальность

медика

Использование препарата

Нет, не

используют

данный

препарат

Да,

используют

данный

препарат

Специальность 1 - +
Специальность 2 + -
Специальность 3 + -

Данный подход к анализу структуры взаимосвязи между парой качественных признаков продуктивен также и при анализе таблиц сопряжённости с большим числом градации обоих признаков. Например, нередко такие признаки могут иметь не 2-3 градации, а один или более десятков градаций. И в этом случае возникает задача редукции таких многоклеточных таблиц. Уменьшение числа градаций отдельных признаков может быть достигнуто разными алгоритмами. Однако в любом случае такая агрегация отдельных градаций приводит к увеличению значения частот в новых градациях. Что в принципе является положительным моментом для анализа таблиц сопряжённости.

Обращаем внимание читателей также на следующий аспект анализа таблиц сопряжённости. Данный анализ есть один из вариантов исследования ПАРНЫХ взаимосвязей признаков. Все анализируемые в статистике признаки делятся на 2 группы: признаки КОЛИЧЕСТВЕННЫЕ (вес, рост, систолическое давление, и т.д.), и признаки КАЧЕСТВЕННЫЕ (пол, состояние пациента, исход лечения, и т.д.). Для этих 2-х групп признаков существует 3 парных комбинации (сочетания признаков). 1-я комбинация: оба признака КАЧЕСТВЕННЫЕ. В этом случае как раз используется анализ таблиц сопряжённости. 2-я комбинация: оба признака КОЛИЧЕСТВЕННЫЕ. В этом случае используются различные методы корреляционного и регрессионного анализа. 3-я комбинация: один признак КАЧЕСТВЕННЫЙ, имеющий определённое количество групп (градаций), второй признак - КОЛИЧЕСТВЕННЫЙ. В этом случае используются различные методы сравнения групповых характеристик количественных признаков. Однако для любой из перечисленных комбинаций полученный результат наличия или отсутствия статистически значимой взаимосвязи будет относиться лишь К ОДНОЙ ПАРЕ ПРИЗНАКОВ. Например, есть 5 признаков, часть которых является КАЧЕСТВЕННЫМИ признаками, а остальные - КОЛИЧЕСТВЕННЫМИ. В этом случае статистический анализ позволяет проверить статистические гипотезы относительно наличия (отсутствия) взаимосвязей для следующих пар признаков: 1-2, 1-3, 1-4, 1-5, 2-3, 2-4, 2-5, 3-4, 3-5, и 4-5. Число таких пар для 5 признаков равно 5*(5-1)/2=10. А в общем случае для V признаков число парных комбинаций равно V*(V-1)/2. Так для 100 признаков это будет 100*(100-1)/2=50*99=4950. Однако это будут только ПАРНЫЕ завимосвязи. В реальных же ситуациях при изучении любых объектов, будь то живые организмы, или данные по геологии, химии, гидрологии, метеорологии, и т.д., помимо ПАРНЫХ взаимосвязей существуют и иные взаимосвязи между признаками, число которых более 2. И в этом случае такие "цепочечные" взаимосвязи требуют иных, многомерных статистических методов. Причём очень часто для таких подмножеств признаков сущестуют несколько КАЧЕСТВЕННЫХ признаков, которые группируют несколько отличающихся исходов. Например, для медицины это может быть признак "Исход лечения" с двумя градациями: 1- пациент вылечен; 2- пациент умер. Либо с большим числом градаций. Ниже приведён график, отражающий факт наличия как ПАРНЫХ

Схема парных связей между предикторами и зависимой переменной

взаимосвязей, так и МНОЖЕСТВЕННЫХ связей между анализируемыми признаками. Предположим, что исходя из результатов выполненных исследований, взаимосвязь между исходом лечения и лечебными факторами желательно представить в виде зависимой переменной Z, а также двух уровней потенциальных предикторов (переменных, объясняющих результат лечения). В первом уровне имеется 4 предиктора (2 количественных – К1 и К2, и 2 дискретных – D1 и D2). Во втором уровне имеется 3 потенциальных предиктора (2 количественных – К3 и К4, и 1 дискретный – D3). Как видим, в этом случае помимо ПАРНЫХ взаимосвязей между 28 парами признаков, здесь могут быть статистически значимые взаимосвязи между 3, 4, 5, 6, 7 и 8 признаками. В такой ситуации могут быть использованы разные многомерные методы биостатистики. Однако наиболее продуктивным в этом случае является использование метода логистической регрессии. Подробное описание этого метода и его возможностей приведено в наших статьях: "Логистическая регрессия в медицине и биологии", "Логистическая регрессия. Анализ массивов большой размерности", "Логистическая регрессия. Примеры анализа реальных данных",Логистическая регрессия и ROC-анализ", "Особенности логистической регрессии в акушерстве","Особенности логистической регрессии в психиатрии, психологии и социологии", "Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения", "Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?" и "Основные понятия ROC-анализа". Метод логистической регрессии является продолжением метода анализа таблицы сопряжённости для двух качественных признаков. Поскольку в этом случае второй качественный признак расширяется до подмножества качественных и количественных признаков.


1997 - 2017.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Сравниваем средние, а также и ... В. Леонов

Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.

Отзывы слушателей семинара по биометрике в Петропавловске-Камчатском