Яндекс.Метрика Статистика в медицине

Каждый слышит то, что понимает. Гете

Статистика посещаемости БИОМЕТРИКИ


16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц
14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц
14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страниц
17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц
03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц
30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц
06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц
08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы

Если приходят, значит полезное находят.
.  
Наш 
адрес:  
Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...

Редактор БИОМЕТРИКИ
В. Леонов
  • 385
data-counter data-url="http://www.biometrica.tomsk.ru/">
Популярные страницы посещаемые читателями

http://www.biometrica.tomsk.ru/index.htm
http://www.biometrica.tomsk.ru/biostat_1.htm
http://www.biometrica.tomsk.ru/biostat_2.htm
http://www.biometrica.tomsk.ru/biostat_3.htm
http://www.biometrica.tomsk.ru/biostat_4.htm

http://www.biometrica.tomsk.ru/biostat_5.htm
http://www.biometrica.tomsk.ru/biostat_6.htm

http://www.biometrica.tomsk.ru/biostat_7.htm
http://www.biometrica.tomsk.ru/biostat_8.htm
http://www.biometrica.tomsk.ru/biostat_9.htm
http://www.biometrica.tomsk.ru/biostat_10.htm

http://www.biometrica.tomsk.ru/biostat_11.htm
http://www.biometrica.tomsk.ru/nauka_33.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/nauka_19.htm
http://www.biometrica.tomsk.ru/logit_0.htm
http://www.biometrica.tomsk.ru/stat_cardio_1998.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/leonov_vak.htm
http://www.biometrica.tomsk.ru/erevan_4.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/biometrica_18.htm

 Полезно: ... стоимость заявок по статистическому анализу баз данных
сокращена с июня месяца на 50%
...

Анализ таблиц сопряжённости 2х2
с вычислением статистик связи (с поправкой Иэйтса)
 

    Приводимые ниже рекомендации основаны на 40-летнем опыте автора этой статьи по статистическому анализу баз данных исследователей по медицине, фармакологии, биологии, психологии, социологии, техники, и т.д. При этом в последние 10 лет ежегодно  производится статистический анализ примерно по 100 базам данных. Часть этих исследователей выкладывают на этом сайте свои отзывы о сотрудничестве с нашим НЦ БИОСТАТИСТИКА.


    Первоначально есть статья "Вычисление критерия Хи-квадрат для таблиц сопряжённости 2х2 (без поправки Иэйтса)". А в данной статье ниже представлена таблица, в которой вычисляется критерий Хи-квадрат  для таблицы сопряжённости 2х2, и достигнутый уровень значимости (с поправкой Иэйтса на непрерывность). Кроме того производится оценка таких статистик связи, как отношения шансов (odds ratio), относительного риска (relative risk), чувствительности (sensitivy, Se), специфичности (specificity, Sp), прогностичность положительного результата (PVP), прогностичность отрицательного результата (PVN) а также границ 95% -ных доверительных интервалов для них. Аппроксимация для достигнутого уровня значимости даёт погрешность в четвертом-пятом знаке после запятой. Такая погрешность не сказывается на решении об отвержении нулевой гипотезы.

    При этом следует помнить, что в реальных исследованиях используется не просто пара группирующих, качественных признаков, а набор качественных признаков (KACH1F, KACH2F, KACH3F, ... и т.д.), и набор количественных признаков (KOL1, KOL2, KOL3, ... и т.д.). И тогда для продуктивного исследования нужно осозновать, что в объектах, введённых в анализируемую базу данных, между всеми признаками могут быть, или отсутствовать, статистически значимые взаимосвязи. Что и важно установить.

     Также следует понимать и то, что такие состояния по разному относятся и к разным типам взаимосвязей. В частности, при наличии двух этих типов признаков, качественных и количественных, между этими признаками реальных, но не простых, элементарных типов зависимостей, очень много. И главным направлением статистического анализа таких баз данных как раз и состоит в том, что нужно найти именно те продуктивные виды зависимостей, которые и оказываются статистически значимыми. И тогда, определив такие зависимости, и список конкретно влияющих признаков, как раз и можно будет их использовать для улучшения состояния конкретных признаков. Именно для медиков это и является основным направлением их исследования, чтобы постоянно улучшать свои технологии работы над больными пациентами. Соответственно при этом будет установлено, а какие конкретно признаки не входят в эти зависимости.

    Итак, какие же наиболее важные и продуктивные виды зависимостей этих признаков следует помнить и использовать в своих исследованиях?  Во-первых, следует помнить, что такие зависимости имеются не только для пары признаков, но и для более двух признаков. А для пары качественных признаков как раз и используется анализ таблицы сопряжённости. Однако и при таком анализе также используется немало разных статистических критериев и параметров. Ниже приводятся 5 графиков с продуктивными результатами анализа таблицы сопряжённостипо двум качественным признакам А и В, каждая из которых имеют по 2 подгруппы. Т.е. в таком примере таблицы сопряжённости было всего 4 клетки, и 150 наблюдений.

   При анализе таблицы сопряжённости с разными объёмами подгрупп продуктивно и построение графика с долями наблюдений в анализируемых подгруппах. Ниже приведён один из примеров такого графика. Можете просматривать все графики по данной тематике.

    Аналогично и для пары количественных признаков можно производить корреляционный анализ не только по одному методу. Поскольку набор более двух методов корреляционного анализа позволит осознать и сам тип этой парной взаимосвязи.Так весьма продуктивно и исследование частной корреляции. В итоге, учитывая число имеющихся количественных и качественных признаков, общее число производимых анализов корреляции оказывается немалым.

    А для анализа двух групп количественных признаков продуктивно использовать  и каноническую корреляцию. И при всех методах корреляционного анализа продуктивно производить и графики распределения наблюдений в осях двух анализируемых признаков. А при этом можно будет установить наличие или отсутствие так называемых выбросов.Т.е. аномальных, ошибочных значений признаков. И при наличии этих аномальных значений можно отредактировать базу данных и вновь повторить этот же анализ. При этом можно будет установить и расположение сравниваемых подгрупп.

  Производя корреляционный анализ в таких сравниваемых подгруппах, как раз важно и установить, имеется ли во всех этих подгруппах одинаковые интенсивности парных корреляций. Либо напротив, при переходе от одной подгруппы к другой подгруппе, существенно изменяется эти коэффициенты корреляционного анализа. Т.е. в начальной подгруппе, например, у больных пациентов, у конкретно пары количественных признаков коэффициент корреляции статистически значимый, и не малый по значению. А в окончательной подгруппе, напнример, у пациентов после лечения, для данной пары признаков отсутствует статистически значимая корреляция.

   Наконец, для зависимости между одним количественным и одним группирующим признаком, также нужно использовать сразу несколько алгоритмов. При этом выбор этих алгоритмов, и выбор сравниваемых параметров, зависит и от вида распределения даннного количественного признака в каждой из сравниваемых подгрупп. В частности наличия или отсутствия нормального распределения. Очень часто в публикуемых статьях и диссертациях авторы используют сравнение групповых средних с помощью t-критерия Стьюдента. Однако при этом столь же часто используют этот критерий ошибочно, не проверяя условия корректности его использования.

    Когда имеется только 2 сравниваемых подгруппы, то по каждому количественному признаку необходимо производить и построение ROC-кривых с вычислением специфичности и чувствительности каждого количественного признака при сравнении двух подгрупп. Ниже приведён пример такой ROC-кривой.

    А при сравнении двух или более подгрупп важно производить проверку гипотез  о равенстве не только средних групповых, но и таких параметров, как дисперсия, медиана и мода. Поскольку результаты таких сравнений как раз и объяснят, а в чём же подразделяются сравниваемые подгруппы. Например, может быть и так, что средние значения в подгруппах не различаются, но при этом существенно различаются дисперсии. Т.е. в этих подгруппах существенно различаются минимальные и  максимальные значения этого конкретного признака. Либо напротив, дисперсии равны, а различаются именно средние групповые. И т.п.

   Если же сравниваются более двух подгрупп, то необходимо одновременно производить и попарные сравнения. Например при 4-х подгруппах производить сравнения подгрупп 1-2, 1-3, 1-4, 2-3, 2-4 и 3-4. Ну а при N количестве подгрупп, число таких парных сравнений будет равно N*(N-1)/2. Т.е. при N=4 число этих попарных сравнений равно 4*(4-1)/2 = (4*3)/2 = 12/2 = 6.

    Далее, когда в базе данных имеется более двух признаков, то весьма продуктивно использовать для них и разные многомерные методы анализа. Например, для количественных признаков можно использовать метод множественной регрессии. Но, учитывая результаты парных зависимостей, реально следует использовать не только стандартный линейный регрессионный анализ, но также и многие иные методы регрессионного анализа. В частности, методы нелинейной регрессии. Либо при этом изменяя исходные значения каждого количественного признака. Например, используя логарифмы для признаков, либо возводя их в некую степень, или же используя произведения или дроби пар конкретных признаков. Для выборов преобразований предварительно нужно вначале создать все графики распределения наблюдений в осях всех пар признаков. А также сделать такие графики и раздельно по всем подгруппам.

      Ну а для оценки зависимости одного группирующего признака от многих количественных и качественных признаков, следует использовать метод логистической регрессии. Также сообщаю читателю этой статьи, что и в этом методе логистической регрессии также более 1 предиктора. Т.е. разными методами этой логистической регрессии как раз и следует получить побольше таких уравнений, из которых и можно выбрать самые лучшие уравнения, в которых и нужно выбрать и самые важные предикторы.

    И не менее важным аспектом получения самых продуктивных уравнений зависимости, следует осозновать и тот нюанс, что в собираемой базе данных все наблюдения часто имеют ещё и иное группирование. Т.е. кроме уже имеющихся группирующих признаков следует перепроверить возможность наличия, или отсутствия, таких скрытых группировок методом кластерного анализа. При том, что и этот  анализ также имеет несколько разных методов, которые как раз и уточняют, имеются ли реально такие скрытые группировки, или же они отсутствуют.

 По мнению экспертов диссертаций, с которыми я беседовал по их просьбам, объёмы использования упомянутых выше разных методов статистического анализа, используются авторами этих диссертаций и статей по разному. В частности, при оценке ими достаточно простыми своих анализируемых технологий, эти авторы также и применяют достаточно простые, а нередко и ошибочные методы анализа. Что в результате весьма проблематично продуктивно использовать полученные результаты для улучшения своих технологий. Тогда как осознавая что их технологии отнюдь не элементарны, а достаточно сложные, и их как раз и необходимо улучшать, то авторы и используют те сложные результаты статистического анализа, которые помогают им профессионалы по статистике. Можете просматривать все графики по данной тематике.

   Итак, вернёмся к получению результата анализа таблицы сопряжённости по двум качественным признакам, имеющим по 2 подгруппы (с поправкой Иэйтса). Вводите частоты наблюдений в эти 4 клетки, и затем кликайте мышкой на клетку "Вычислить статистики".

Ответ на письмо Леонова В.П. от  начальника Управления аттестации научных и научно-педагогических работников Федеральной службы по надзору в сфере образования и науки Н.И. Аристера


Обращение межрегионального Общества специалистов доказательной медицины в ВАК РФ


Мониторинг качества научных медицинских публикаций


СТАТИСТИКА УМЕЕТ МНОГО ГИТИК. С.Е. Бащинский, главный редактор Международного журнала медицинской практики, 1998; №4, с.13-15.

... стоимость заявок по
статистическому анализу баз данных
сокращена с июня месяца на 50%
...



НЦ БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. Стандартные сроки анализа данных: для статей и докладов - 5-10 дней, для кандидатских диссертаций 1 месяц, для докторских диссертаций 1,5 месяца. (См. далее)


Примеры оформления исследователями базы данных, описания признаков и целей статистического анализа этой базы данных

Островок  здоровья

Пример 1  Пример 2   Пример 3

Отзывы исследователей по статистическому анализу данных 

Примеры отличных результатов статистического анализа в диссертациях, дипломных работах и статьях, полученных с нашей помощью.

 В данном разделе приведены как наши статьи, так диссертации и статьи иных авторов, для которых мы с коллегами НЦ БИОСТАТИСТИКА производили работу по статистическому анализу их баз данных. При этом мы использовали современные и продуктивные методы статистического анализа, доступные лишь профессионалам по биостатистике.

Камчатская биометрика-2014. Семинар по биометрике в камчатском НИИ КамчатНИРО. (24.03.2014 - 3.04.2014).

Камчатская фото-биометрика-2014. Фоторепортаж с семинара по биометрике в Петропавловске-Камчатском.

Отзывы слушателей семинара по биометрике в Петропавловске-Камчатском

ВОЗМОЖНОСТИ БИОМЕТРИЧЕСКОГО АНАЛИЗА ВЗАИМОСВЯЗИ СОМАТИЧЕСКИХ ПОКАЗАТЕЛЕЙ И СИСТЕМАТИКИ ПСИХИЧЕСКИХ РАССТРОЙСТВ.
Н.П.Гарганеева1, В.П.Леонов2. Сибирский государственный медицинский университет1, Томск. 
Томский государственный университет2. Сибирский медицинский журнал, № 2, 2001, с.25-32.

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Камчатская биометрика-2014. Семинар по биометрике в камчатском НИИ КамчатНИРО. (24.03.2014 - 3.04.2014).

Камчатская фото-биометрика-2014. Фоторепортаж с семинара по биометрике в Петропавловске-Камчатском.

Отзывы слушателей семинара по биометрике в Петропавловске-Камчатском



Сравниваем средние, а также и ... В. Леонов

     Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров. Такими новыми сравнениями являются проверки равенства дисперсий, коэффициентов корреляции, коэффициентов регрессии или векторов групповых средних, сравнение групп многомерными методами, и т.д. В статье объяснена большая ценность обнаружения не нормального распределения признака.


В новый век - с доказательной биомедицино  

ОТВЕТ ВАК РФ   

  Отклики читателей

В. Леонов. Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента. ч.1.

В. Леонов. Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента. ч.2.

ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК РФ. В.П. Леонов, П.В.Ижевский.

В.П. Леонов.  Применение статистики в статьях и диссертациях по медицине и биологии. Часть  III. Проблемы взаимодействия "Автор - Редакция - Читатель".

Применение статистики в статьях и диссертациях по медицине и биологии. Часть IV. Наукометрия статистической парадигмы экспериментальной биомедицины.     Международный журнал медицинской практики, 2002 г. вып. 3. Леонов В.

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Доклад "Почему и как надо учить медиков статистике?" Леонов В. П. Доклад на международной конференции по доказательной медицине  в Ереване 18-20.10.2012

Зачем нужна статистика в доказательной медицине?  В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193.

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35.

Наиболее часто посещаемые экспонаты КУНСТКАМЕРЫ:
"Поверхностная архитектоника эритроцитов периферической крови у психически больных". Авторы - член экспертного совета ВАК, академик РАМН Новицкий В.В., д.м.н. Рязанцева Н.В., д.м.н. Семин И.Р. Сибирский государственный медицинский университет, Томск. НИИ фармакологии Томского научного центра РАМН. Бюллетень экспериментальной биологии и медицины, вып. 10, 2000, стр. 429-432.

Обращение Межрегиональной общественной организации «Общество специалистов доказательной медицины»  в ВАК РФ.

Статистика - это что? Статистика - нужна зачем? Статьи читаем - зачем? Статьи пишем - зачем? Краткая версия лекции для слушателей-медиков в Ереване, прочитанной в 2014 году по Скайпу.

Доклад "Почему и как надо учить медиков статистике?" В. Леонов.

Зачем нужна статистика в доказательной медицине?  В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193.

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях. Почему появилась эта статья?


Вычисление чувствительности (статистической мощности) и объёма при сравнении долей двух независимых выборок

Можете просматривать все графики по данной тематике...

... стоимость заявок по
статистическому анализу баз данных сокращена с июня месяца на 50% ...

 

 
Наличие А 
Отсутствие А 
Всего 
Наличие
признака В
Отсутствие
признака В
Всего

Хи-квадрат 
Степени свободы 
Уровень значимости "p" 
 
Статистики 
Значение 
статистик 
Нижняя граница 
95%-ного 
доверительного 
интервала 
Верхняя граница 
95%-ного 
доверительного 
интервала 
Отношение шансов
Относительный риск
Индекс Каппа
Чувствительность
Специфичность
Прогностичность 
положительного результата
Прогностичность 
отрицательного результата
... стоимость заявок по
статистическому анализу баз данных
сокращена с июня месяца на 50%
...

Для анализа собственной таблицы сопряжённости нажмите кнопку "Очистить" и введите свои частоты, после чего вновь нажмите кнопку "Вычислить".

    Итак, представленная выше таблица вычисляет значение критерия Хи-квадрат для таблицы сопряжённости 2х2, и достигнутый уровень статистической значимости (c поправкой Иэйтса).

     При использовании анализа таблицы сопряжённости необходимо также понимать и тот нюанс, что надёжность получаемого результата зависит также и от объёмов наблюдений в этих клетках таблицы. Часто бывает так, что при относительно небольшом количестве наблюдений в одной, или в нескольких клетках такой таблицы сопряжённости, уровень статистической значимости Prob оказывается менее критического уровня. Например, менее критического уровня 0,05. Т.е. этот результат указывает на наличие статистической значимости взаимосвязи между парой этих группирующих признаков. Но при этом детальный анализ такой таблицы обнаруживает, что в отдельных клетках ожидаемое количество наблюдений оказывается менее 5. В этом случае обязательно необходимо производить для данной таблицы сопряжённости метод Монте-Карло, увеличивая при этом количество наблюдений от 100 тысяч до 1 миллиона наблюдений. Ниже приводится пример такого результата анализа 4-х клеточной таблицы сопряжённости между признаком ISH и признаком MOZG_KROV, содержащей 88 наблюдений. При этом три варианта вычисления критерия Хи-квадрат приводят уровни статистической значимости менее 5%, в частности, со значениями Prob=0,0309 , Prob=0,0224 , Prob=0,0319.

Однако при этом же сообщается, что 50% клеток этой таблицы, т.е. в двух клетках, ожидаемое (расчётное) число наблюдений менее 5. И поэтому приведённые значения 3-х вариантов вычисления критерия Хи-квадрат не являются надёжными. И далее метод Монте-Карло применяющий 100 тысяч наблюдений, приводит уровень значимости равный 0,0595 . А 99-процентый интервал этого уровня значимости имеет значения от 0,0576 до 0,0614. Т.е. мощный метод Монте-Карло отвергает наличие статистически значимой взаимосвязи между признаком ISH и признаком MOZG_KROV

   Этот мощный метод Монте-Карло продуктивно использовать практически по всем анализам таблиц сопряжённости. Даже и в тех случаях, когда ожидаемые (расчётные) числа наблюдений в анализируемых клетках таблицы и не менее 5. Ниже приводится пример такого результата, когда как раз расчётные частоты для всех 4-х клеток более 5. Почему при этом и не приводится выражение типа

Далее и приводится пример такого результата анализа 4-х клеточной таблицы сопряжённости между признаком ALL_ISH и признаком INSULIN, содержащей 88 наблюдений. При этом три варианта критерия Хи-квадрат приводят уровни статистической значимости менее 5%, в частности, со значениями Prob=0,0335 , Prob=0,0326 , Prob=0,0346. А метод Монте-Карло, с использованием в 1 миллион наблюдений, приводит для критерия Хи-квадрат значение равное 0,05626.  А 99-процентый интервал этого уровня значимости имеет значения от 0,0508 до 0,0544. Т.е. мощный метод Монте-Карло отвергает наличие статистически значимой взаимосвязи между признаком ALL_ISH и признаком INSULIN.

При этом три варианта критерия Хи-квадрат приводят уровни статистической значимости менее 5%, в частности, со значениями Prob=0,0335 , Prob=0,0326 , Prob=0,0346. А метод Монте-Карло, с использованием в 1 миллион наблюдений, приводит для критерия Хи-квадрат значение равное 0,05626.  А 99-процентый интервал этого уровня значимости имеет значения от 0,0508 до 0,0544. Т.е. мощный метод Монте-Карло отвергает наличие статистически значимой взаимосвязи между признаком ALL_ISH и признаком INSULIN.

   В том случае, когда достигнутый уровень значимости будет меньше критического, и будет принята гипотеза о наличии статистической взаимосвязи между парой качественных признаков, весьма важно идентифицировать в каких сочетаниях градаций этих признаков сконцентрирована данная взаимосвязь. Отметим, что факт наличия взаимосвязи не обязательно может трактоваться как установление причинно-следственной связи. Так как в этом случае возможны 2 ситуации.

    Во-первых, действительно один из признаков может быть причиной, а второй - следствием. Во-вторых, оба признака могут быть следствиями других признаков. Однако в обоих случаях важно установить как сочетание градаций (клетки) этих двух анализируемых признаков, для которых имеет место максимальное проявление взаимосвязи. А также установить те комбинации градаций (клетки), в которых взаимосвязь отсутствует.

   Следующий аспект такого углублённого анализа заключается в определении в клетках с максимальными вкладами в установленную взаимосвязь, направления этой взаимосвязи. Ниже приведена таблица сопряжённости 3*2 (3 строки и 2 столбца), в которой представлены частоты, полученные при анализе реальных данных. В данном исследовании был проведён опрос 1082 респондентов (медиков). Респонденты давали ответы на 659 вопросов. Основная цель исследования заключалась в изучении спектра лекарственных средств, применяемых в клинической практике для профилактики и лечения конкретных, наиболее распространённых заболеваний и синдромов в различных федеральных округах России, и оценить их соответствие современным рекомендациям. 3 строки данной стаблицы сопряжённости отвечают 3 специальностям респондентов. А 2 столбца означают 2 варианта ответа на вопрос об использовании конкретного препарата при конкретном заболевании.

Специальность медика

Использование препарата

Итого

Нет, не используют данный препарат

Да, используют данный препарат

Специальность 1 72 484 556
Специальность 2 210 170 380
Специальность 3 95 51 146
Итого 377 705 1082

Для этой таблицы сопряжённости вычисленный критерий Пирсона Хи-квадрат равен 245,9354. Для двух степеней свободы достигнутый уровень значимости "р <0,0001". Интенсивность взаимосвязи между специальностью респондентов и использованием конкретного препарата оценивается с помощью V-критерия Крамера, который равен 0,4768. Поскольку критерий Крамера может изменяться в интервале от 0 до 1, то можно говорить о наличии значительной статистической взаимосвязи для данной пары признаков. Очевидно, что в данной паре признаков специальность респондента является причиной, а следствием является отношение этого специалиста к использованию конкретного препарата.

Более детальный анализ этой таблицы сопряжённости позволяет получить вклады каждой комбинации двух признаков (отдельной клетки таблицы) в значение критерия Крамера. Ниже представлена таблица с 6-ю клетками, в каждой из которых представлены проценты вклада данной клетки в V-критерий Крамера. Эти результаты говорят о том, что максимальный вносит первый столбец и первая строка.

Специальность

медика

Использование препарата

Итого

Нет, не используют данный препарат

Да, используют данный препарат

Специальность 1 31,1% 16,63% 47,73%
Специальность 2 18,49% 9,89% 28,38%
Специальность 3 15,57% 8,32% 23,89%
Итого 65,16% 34,84% 100%

Ниже представлена таблица, в которой для 6 комбинаций градаций двух анализируемых признаков отмечены положительные или отрицательные направления взаимосвязи.

Специальность медика

Использование препарата

Нет, не используют данный препарат

Да, используют данный препарат

Специальность 1 - +
Специальность 2 + -
Специальность 3 + -

 

 

 

 

 

 

Данный подход к анализу структуры взаимосвязи между парой качественных признаков продуктивен также и при анализе таблиц сопряжённости с большим числом градации обоих признаков. Например, нередко такие признаки могут иметь не 2-3 градации, а один или более десятков градаций. И в этом случае возникает задача редукции таких многоклеточных таблиц. Уменьшение числа градаций отдельных признаков может быть достигнуто разными алгоритмами. Однако в любом случае такая агрегация отдельных градаций приводит к увеличению значения частот в новых градациях. Что в принципе является положительным моментом для анализа таблиц сопряжённости.

Когда в реальной базе данных исследования имеется более 2-х группирующих признаков, т.е. от 3-х и более таких признаков, весьма продуктивно использовать и метод логлинейного анализа. В таком логлинейном методе анализуется многомерная таблица сопряжённости, содержашей более 2-х качественных признаков. Например, используются следующие 4 группирующих признака: NCC = "Наличие сосудистого синдрома", NKS="Наличие кожного синдрома", NOS="Наличие общих симптомов", NLS="Наличие лёгочного синдрома". В этом случае можно проанализировать взаимосвязь всех 4-х признаков: NCC*NKS*NOS*NLS. Но при этом обязательно необходимо использовать как все парные взимосвязи, так и все тройные взаимосвязи. Т.е. использовать следующие 6 парных анализов методом логлинейного анализа: NCC*NKS, NCC*NOS, NCC*NLS, NKS*NOS,  NKS*NLS, NOS*NLS. А также и следующие 4 анализа по наборам трёх группирующих признаков: NKS*NOS*NLS, NCC*NOS*NLS, NCC*NKS*NLS, NCC*NKS*NOS.   

Обращаем внимание читателей также на следующий аспект анализа таблиц сопряжённости. Данный анализ есть один из вариантов исследования ПАРНЫХ взаимосвязей признаков. Все анализируемые в статистике признаки делятся на 2 группы: признаки КОЛИЧЕСТВЕННЫЕ (вес, рост, систолическое давление, и т.д.), и признаки КАЧЕСТВЕННЫЕ (пол, состояние пациента, исход лечения, и т.д.).

    Для этих 2-х групп признаков существует 3 парных комбинации (сочетания признаков). 1-я комбинация: оба признака КАЧЕСТВЕННЫЕ. В этом случае как раз используется анализ таблиц сопряжённости. 2-я комбинация: оба признака КОЛИЧЕСТВЕННЫЕ. В этом случае используются различные методы корреляционного и регрессионного анализа. 3-я комбинация: один признак КАЧЕСТВЕННЫЙ, имеющий определённое количество групп (градаций), второй признак - КОЛИЧЕСТВЕННЫЙ. В этом случае используются различные методы сравнения групповых характеристик количественных признаков.

   Однако для любой из перечисленных комбинаций полученный результат наличия или отсутствия статистически значимой взаимосвязи будет относиться лишь К ОДНОЙ ПАРЕ ПРИЗНАКОВ. Например, есть 5 признаков, часть которых является КАЧЕСТВЕННЫМИ признаками, а остальные - КОЛИЧЕСТВЕННЫМИ. В этом случае статистический анализ позволяет проверить статистические гипотезы относительно наличия (отсутствия) взаимосвязей для следующих пар признаков: 1-2, 1-3, 1-4, 1-5, 2-3, 2-4, 2-5, 3-4, 3-5, и 4-5. Число таких пар для 5 признаков равно 5*(5-1)/2=10. А в общем случае для V признаков число парных комбинаций равно V*(V-1)/2. Так для 100 признаков это будет 100*(100-1)/2=50*99=4950. Однако это будут только ПАРНЫЕ взаимосвязи.

 В реальных же ситуациях при изучении любых объектов, будь то живые организмы, или данные по геологии, химии, гидрологии, метеорологии, и т.д., помимо ПАРНЫХ взаимосвязей существуют и иные взаимосвязи между признаками, число которых более 2. И в этом случае такие "цепочечные" взаимосвязи требуют иных, многомерных статистических методов. Причём очень часто для таких подмножеств признаков сущестуют несколько КАЧЕСТВЕННЫХ признаков, которые группируют несколько отличающихся исходов. Например, для медицины это может быть признак "Исход лечения" с двумя градациями: 1- пациент вылечен; 2- пациент умер. Либо с большим числом градаций. Можете просматривать все графики по данной тематике.

Схема парных связей между предикторами K1, K2, K3, K4, D1, D2, D3 и зависимой переменной Z.

   

   Слева приведён график, отражающий факт наличия связей как ПАРНЫХ, так и МНОЖЕСТВЕННЫХ между анализируемыми признаками. Предположим, что исходя из результатов выполненных исследований, взаимосвязь между исходом лечения и лечебными факторами желательно представить в виде зависимой переменной Z, а также двух уровней потенциальных предикторов (переменных, объясняющих результат лечения). В первом уровне имеется 4 предиктора (2 количественных – K1 и K2 , и 2 дискретных – D1 и D2).

 

   Во втором уровне имеется 3 потенциальных предиктора (2 количественных – K3 и K4, и 1 дискретный – D3). Как видим, в этом случае помимо ПАРНЫХ взаимосвязей между 28 парами признаков, здесь могут быть статистически значимые взаимосвязи между 3, 4, 5, 6, 7 и 8 признаками. В такой ситуации могут быть использованы разные многомерные методы биостатистики. Однако наиболее продуктивным в этом случае является использование метода логистической регрессии. Подробное описание этого метода и его возможностей приведено в следующей серии наших статей:
"Введение"
"Логистическая регрессия в медицине и биологии"
"Логистическая регрессия. Анализ массивов большой размерности"
"Логистическая регрессия. Примеры анализа реальных данных"
"Логистическая регрессия и ROC-анализ"
"Особенности логистической регрессии в акушерстве"
"Особенности логистической регрессии в психиатрии, психологии и социологии"
"Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечени
"Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?"
"Основные понятия ROC-анализа".

    Метод логистической регрессии является продолжением метода анализа таблицы сопряжённости для двух качественных признаков. Поскольку в этом случае второй качественный признак расширяется до подмножества качественных и количественных признаков.

ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК N5 1997 г. В.П.Леонов, П.В.Ижевский.

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику". Якутск, (12-13 ноября 2009).

История биометрики

Применение статистики в статьях и диссертациях по медицине и биологии. Часть I. Описание методов статистического анализа в статьях и диссертациях. Международный журнал медицинской практики, 1998 г., вып. 4. В.П. Леонов, П.В. Ижевский

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.   ЧАСТЬ 2. ИСТОРИЯ БИОМЕТРИКИ И ЕЁ ПРИМЕНЕНИЯ В РОССИИ. Леонов В.П.

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.  ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ  "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ". Леонов В.П.

Применение статистики в статьях и диссертациях по медицине и биологии. Часть IV. Наукометрия статистической парадигмы экспериментальной биомедицины.     Международный журнал медицинской практики, 2002 г. вып. 3. Леонов В.

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ  ДЛЯ МЕДИКОВ И БИОЛОГОВ.  (время и опыт). Леонов В.

Сравниваем средние, а также и ... В. Леонов

     Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров. Показано, что не нормальное распределение количественного признака, означает наличие взаимосвязей данного признака с другими признаками.


НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ  (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ). В.П.Леонов. Вестник Томского государственного университета. Серия "Математика. Кибернетика. Информатика". №275. АПРЕЛЬ 2002, стр. 17-24.


Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.

Мотивом к написанию данной статьи стал следующий инцидент. 11 апреля 2016 г. я получил вот какое письмо.

Уважаемый Василий Петрович!

Я являюсь одним из читателей Вашего сайта "Биометрика", который нашёл по ссылке, размещённой на странице http://bono-esse.ru/blizzard/ais.html C большим интересом ознакомившись, в частности, с разделом "Кунсткамера", обращаюсь к Вам с несколько необычным вопросом по независимому, неформальному рецензированию работы ....


3 примера оформления данных, их описания и описания целей исследования

Пример 1  Пример 2
   Пример 3


В ноябре 2013 года сайту БИОМЕТРИКА исполнилось 16 лет. А что было раньше? И что теперь?


Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа

В.В. Половинкин
ТОТАЛЬНАЯ МЕЗОРЕКТУМЭКТОМИЯ — ФАКТОР ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ СРЕДНЕАМПУЛЯРНОГО И НИЖНЕАМПУЛЯРНОГО РАКА ПРЯМОЙ КИШКИ.

Н.Г. Веселовская 
КЛИНИЧЕСКОЕ И ПРОГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ЭПИКАРДИАЛЬНОГО ОЖИРЕНИЯ У ПАЦИЕНТОВ ВЫСОКОГО СЕРДЕЧНО-СОСУДИСТОГО РИСКА.

В.А. Габышев  ФИТОПЛАНКТОН КРУПНЫХ РЕК ЯКУТИИ И СОПРЕДЕЛЬНЫХ ТЕРРИТОРИЙ ВОСТОЧНОЙ СИБИРИ.


Камчатская биометрика-2014. Семинар по биометрике в камчатском НИИ КамчатНИРО. (24.03.2014 - 3.04.2014).

Отзывы слушателей семинара по биометрике в Петропавловске-Камчатском


В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).


Обращение Межрегиональной общественной организации «Общество специалистов доказательной медицины»  в ВАК РФ.

ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК N5 1997 г. В.П.Леонов, П.В.Ижевский.

Применение методов статистики в кардиологии (по материалам журнала "Кардиология" за 1993-1995 гг.). Леонов В.П. Кардиология, 1998, № 1, с. 55-58.

Леонов В.П. Ошибки статистического анализа биомедицинских данных.  Международный журнал   медицинской практики,  2007, вып. 2, стр.19-35.

Цели, возможности, и проблемы использования биостатистики в доказательной медицине. В. Леонов В.П. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Оформление баз данных для статистического анализа

Леонов В.П.  Оценка статистического анализа в статьях журнала
 "Вестник современной клинической медицины"

Примеры отличных результатов статистического анализа в диссертациях, дипломных работах и статьях, полученных с нашей помощью.

 В данном разделе приведены как наши статьи, так диссертации и статьи иных авторов, для которых мы с коллегами НЦ БИОСТАТИСТИКА производили работу по статистическому анализу их баз данных. При этом мы использовали современные и продуктивные методы статистического анализа, доступные лишь профессионалам по биостатистике.


Примеры "Программы по статистическому анализу", и подобных результатов статистического анализа по таким "Программам"

В. Леонов. КЛАССИФИКАЦИЯ ОШИБОК ПРИМЕНЕНИЯ СТАТИСТИКИ В ОТЕЧЕСТВЕННОЙ МЕДИЦИНЕ.


В. Леонов. МЕМЕТИЧЕСКИЙ АНАЛИЗ СТАТИСТИЧЕСКИХ ЗАБЛУЖДЕНИЙ В ПУБЛИКАЦИЯХ НАУЧНЫХ ШКОЛ

Леонов В.П. Введение в семиотику информационных технологий: учебное пособие. – Томск: Изд-во НТЛ, 2011. – 248 с. Учебное пособие является первой книгой из серии учебных пособий по современным проблемам информатики, подготавливаемых на факультете информатики ТГУ. Книга предназначена для студентов как естественных, так и гуманитарных факультетов, изучающих информатику. Изложены основные понятия семиотики как одной из составляющих частей информатики. Рассмотрены классификации знаков и их свойств, в частности мобильность и ареальность, а также изменение природы носителей информации. 5-я глава - "Статистическая структура информационных массивов".


Статистический анализ в медицине, биологии, психологии, и т.д.

 В данном разделе приведено немало статей и книг по статистическому анализу, а также ГОСТ и доклады.

НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ  (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ). В.П.Леонов. Вестник Томского государственного университета. Серия "Математика. Кибернетика. Информатика". №275. АПРЕЛЬ 2002, стр. 17-24.


Можете просматривать все графики по данной тематике...


... стоимость заявок по статистическому анализу баз данных
сокращена с июня месяца на 50%
...


Наш адрес      1997 - 2020. © Василий Леонов

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Зачем нужна статистика в доказательной медицине? 

Доклад "Почему и как надо учить медиков статистике?" В. Леонов.