Яндекс.Метрика

Результаты статистического анализа

Каждый слышит то, что понимает. Гете


"Люди перестают мыслить,
когда перестают читать
".
Д. Дидро

Статистика посещаемости БИОМЕТРИКИ

Наш адрес:

Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...


Редактор БИОМЕТРИКИ
В. Леонов

Популярные страницы посещаемые читателями

http://www.biometrica.tomsk.ru/index.htm
http://www.biometrica.tomsk.ru/biostat_1.htm
http://www.biometrica.tomsk.ru/biostat_2.htm
http://www.biometrica.tomsk.ru/biostat_3.htm
http://www.biometrica.tomsk.ru/biostat_4.htm

http://www.biometrica.tomsk.ru/biostat_5.htm
http://www.biometrica.tomsk.ru/biostat_6.htm

http://www.biometrica.tomsk.ru/biostat_7.htm
http://www.biometrica.tomsk.ru/biostat_8.htm
http://www.biometrica.tomsk.ru/biostat_9.htm
http://www.biometrica.tomsk.ru/biostat_10.htm

http://www.biometrica.tomsk.ru/biostat_11.htm
http://www.biometrica.tomsk.ru/nauka_33.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/nauka_19.htm
http://www.biometrica.tomsk.ru/logit_0.htm
http://www.biometrica.tomsk.ru/stat_cardio_1998.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/leonov_vak.htm
http://www.biometrica.tomsk.ru/erevan_4.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/biometrica_18.htm

 

Примеры исходных результатов
отдельных методов статистического анализа
по медицине и биологии,

полученных с нашей помощью.

 

  В этом разделе приведены примеры исходных результатов разных методов статистического анализа. В некоторых примерах приводятся пояснения этих результатов. Такие пояснения всегда высылаем исследователям по всем таким результатам анализа их баз данных. Наш 40-летний опыт статистического анализа баз данных исследователей по медицине, биологии, психологии, и по многим иным направлениям, приводит к тому, что для продуктивности результатов необходимо использовать не 2-3 стандартных методов анализа, а от 8 до 15 и более разных методов анализа. Такие результаты, с учётом количества анализируемых признаков баз данных, имеют весьма большие объёмы. Поэтому данные примеры содержат небольшие доли подобных результатов. И объёмы этих примеров увеличиваются за счёт приводимых пояснений этих результатов. При этом они и показывают, как много важных результатов можно получать используя разные методы статистического анализа. Например используя как популярные методы сравнения групповых параметров, корреляционный анализ, таблицы сопряжённости, ROC-кривые, и т.д., так и многомерные методы статистического анализа. В частности, методы логистической регрессии, канонический корреляционный анализ, факторный анализ, кластерный анализ, множественная регресссия, дискриминантный анализ, многомерный дисперсионный анализ, многомерное шкалирование, и т.д. При этом следует помнить, что все методы анализа имеют разные алгоритмы. И поэтому для продуктивности проводимых исследований как раз и следует использовать все возможные алгоритмы.


Приглашаем читателей сайта принять участие в конкурсе входа в список исследователей, для которых НЦ "БИОСТАТИСТИКА" произведёт оперативно и бесплатно статистический анализ их баз данных. Для чего исследователю нужно выслать нам согласно Пример 1  Пример 2   Пример 3 свои базы данных с описанием признаков и целей исследования. Выбор исследователей с оперативным  бесплатным проведением статистического анализа их баз данных, будет произведён после набора 21 исследователя.


Оригинальная информация с результатами статистического анализа выделена этим цветом.

А наши комментарии к этим результатам выделены этими двумя цветами.

 


Анализ таблиц сопряжённости пары группирующих признаков
Aнализ НЦ БИОСТAТИСТИКA. Skype: leo_1911 
E-mail:leo.biostat@gmail.com
Сайт БИОМЕТРИКА  http:\\www.biometrica.tomsk.ru\

В этом файле приведён пример с результатами анализа таблиц сопряжённости пары группирующих признаков. Для  лучшего понимания подобных результатов необходимо также внимательно ознакомиться с описанием данных методов анализа в изданиях по математической статистике. В частности, в следующих книгах:

1. Г. Аптон. Анализ таблиц сопряженности. Перевод с английского и предисловие Ю. П. Адлера. Москва. Финансы и статистика. 1982.
2. Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Пер. с англ. - М.: Мир, 1982. - 488с. 
3. Леонов В.П. Обработка экспериментальных данных на программируемых микрокалькуляторах (Прикладная статистика на Б3-34, МК-52, МК-56, МК-61). - Томск: Изд-во Томского университета, 1990. - 376с. 
4. Р. Флетчер, С. Флетчер, Э. Вагнер. Клиническая эпидемиология. Основы доказательной медицины. Пер. с англ. - М.: МедиаСфера, 1998. - 352с.
5. Р. Рунион. Справочник по непараметрической статистике. М.: Финансы и статистика. Современный подход. 1982. - 198 с.
6. Петри А., Сэбин К. Наглядная статистика в медицине. Перевод с английского под редакцией В. Леонова. М.: ГЭОТАР-Медиа, 2-е изд. Переработанное и дополненное, 2009. 168 с.

Таблицы с двумя одинаковыми признаками приводятся для подтверждений правильности, корректности анализа всех остальных результатов. Об этом свидетельствует наличие ненулевых частот лишь в клетках с обеими одинаковыми грациями. Тогда как в клетках с разными градациями, частоты равны НУЛЮ.

Для рассмотрения результатов анализа таблиц сопряжённости изучим их на примере таблицы для пары признаков VAR14A (наличие суставного синдрома) и VAR107A (возрастная группа). Структура 6 значений в каждой такой таблицы представлена обозначениями, расположенными в левом верхнем углу каждой таблицы. Вот эти обозначения:
Frequency – частота фактическая.
Expected  - частота ожидаемая (вычисляется из условия независимости двух признаков).
Cell Chi-Square – ячейка Хи-квадрат.
Percent – процент, равен отношению фактической частоты к общему числу наблюдений.
Row Pct – процент по строке, равен отношению фактической частоты к сумме частот по строке.
Col Pct – процент по колонке, равен отношению фактической частоты к сумме частот по колонке.   

Ниже приведена эта таблица сопряжённости пары признаков       

  VAR14A (строки наличия суставного синдрома)  *  VAR107A (столбцы возрастных групп)

Frequency     
Expected      
Cell Chi-Square
Percent       
Row Pct       
Col Pct 
              

до 40 лет 41-50 лет 51-60 лет старше 60 лет Total
Нет

      1
      3
1.3333
1.28
5.56
7.69

    10
4.6154
6.2821
12.82
55.56
50.00

      3
6.6923
2.0371
3.85
16.67
10.34

     4
3.6923
0.0256
5.13
22.22
25.00

18

 

23,08

Есть

     12
10
0.4
15.38
20.00
92.31

    10
15.385
1.8846
12.82
16.67
50.00

     26
22.308
0.6111
33.33
43.33
89.66

    12
12.308
0.0077
15.38
20.00
75.00

60

 

76,92

Total

13
16.67

20
25.64

29
31.18

16
20.51

78
100

 

 

 

 

 

 

 

 

 

 

 

                             Frequency Missing = 30

           Statistics for Table of VAR14A by VAR107A

   Statistic                                   DF       Value      Prob
-----------------------------------------------------------------------
Chi-Square                               3     12.5816    0.0056
Likelihood Ratio Chi-Square    3     12.2098    0.0067
Mantel-Haenszel Chi-Square   1     0.0844      0.7715
Phi Coefficient                                 0.4016
Contingency Coefficient                  0.3727
Cramer's V                                       0.4016

   WARNING: 38% of the cells have expected counts less than 5.
(Asymptotic) Chi-Square may not be a valid test.

  Pearson Chi-Square Test
----------------------------------------
Chi-Square                       12.5816
DF                                       3
Asymptotic Pr >  ChiS q      0.0056

Обращаю внимание на то, что интенсивность взаимосвязи между этой парой признаков VAR14A и VAR107A представлена тремя показателями: Phi Coefficient, Contingency Coefficient,  Cramer's V. Причём для подобных таблиц сопряжённости наиболее продуктивен показатель Cramer's V = 0.4016. Однако при этом данная взаимосвязь не идентична по всех 8 клетках данной таблицы, в которых представлены детали этих связей сочетаний одной градации признака VAR14A (наличие суставного синдрома) и одной градации признака VAR107A (возрастная группа). В одних клетках эта связь практически отсутствует, а в других клетках напротив, весьма интенсивна. И такие cвязи бывают как положительными, так и отрицательными. И далее можно вычислить для каждой из этих 8 клеток проценты интенсивности взаимосвязи данной пары признаков. Детали этой специфики я объясню при обсуждении результатов анализа этих таблиц сопряжённости в беседах по Скайпу. При этом рекомендую все эти обсуждения по Скайпу сохранять как видео. Для этого нужно войти в "Настройки" Скайпа и сделать" Разрешить использование NDI":

 

Следующий аспект таких результатов касается сообщения

"WARNING: 38% of the cells have expected counts less than 5.
(Asymptotic) Chi-Square may not be a valid test
".

Т.е. в 38% расчётные частоты менее 5. Поэтому для проверки таких полученных результатов используется несколько надёжных методов. В частности, метод Монте-Карло (Monte Carlo Estimate for the Exact Test). Этим методом создаётся очень большая коллекция подобных, аналогичных таблиц, которые все анализируются, и по полученным результатам приводятся доверительные интервалы для вероятности (уровня стат. значимости). Ниже расположены таблицы с этими результатами, в которых приводятся как само значение уровня значимости, так и  99%-ные доверительные интервалы для уровней статистической значимости. При этом указывается, какое количество выборок было использовано для получения этих результатов. Так ниже сообщается, что было использовано 100000 сконструированных подобных выборок (Number of Samples 100000). Т.е. исходный результат очень надёжен, несмотря на то, что в 38% клеток значения ожидаемых (расчётных) частот, было менее 5. Итак, вывод о наличии взаимосвязи двух качественных признаков, подтверждается методом Монте-Карло.

Monte Carlo Estimate for the Exact Test

Pr >= ChiSq                       0.0050
99% Lower Conf Limit        0.0044
99% Upper Conf Limit        0.0055

Number of Samples           100000
Initial Seed                 1645274467

Likelihood Ratio Chi-Square Test
---------------------------------------------
Chi-Square                         12.2098
DF                                        3
Asymptotic Pr >  ChiSq      0.0067

Pr >= ChiSq                       0.0110
99% Lower Conf Limit        0.0101
99% Upper Conf Limit        0.0118

Number of Samples           100000
Initial Seed                 1731976366

 


Хорошая книга:

Д. Химмельблау. Анализ процессов статистическими методами.

В.С.Степин, В.Г.Горохов, М.А.Розов. Философия науки и техники

Основатели биометрики
Francis Galton
Френсис Гальтон
(16.02.1822-17.01.1911)

Вальтер Уэлдон
Вальтер Уэлдон
(15.03.1860-13.04.1906)

Карл Пирсон
Карл Пирсон
(27.03.1857-27.04.1936)

Оптимизировано для разрешения 1024х768 в Mozilla Firefox, Opera.

Центр БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. (См. далее )


Примеры оформления заказчиками базы данных, описания признаков и целей статистического анализа этой базы данных

Островок  здоровья

Пример 1  Пример 2  
Пример 3


Отзывы исследователей по
статистическому анализу
данных


СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ МЕДИКОВ И БИОЛОГОВ (время и опыт). Леонов В.


В. Леонов. Применение методов статистики в кардиологии (по материалам журнала "Кардиология" за 1993-1995 гг.).     Журнал "Кардиология", 1998, № 1 

В. Леонов. Статистика в кардиологии. 15 лет спустя. В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним.


Логистическая регрессия в медицине и биологии.
Леонов В.

В серии 10 статей рассмотрены основы метода логистической регрессии. На многочисленных примерах анализа реальных массивов данных поясняется специфика использования данного метода. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных.

Введение.

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5.Особенности логистической регрессии в акушерстве.
6.Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество логистической регрессии.


Сравниваем средние, а также и ... В. Леонов Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров. Показано, что не нормальное распределение количественного признака, означает наличие взаимосвязей данного признака с другими признаками.

Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.


Примеры отличных результатов статистического анализа в диссертациях, дипломных работах и статьях, полученных с нашей помощью.

М.И. Антоненко.  Гиперкортицизм без специфических клинических симптомов: эпидемиология, клиника, диагностика.  (диссертация на соискание учёной степени кандидата медицинских наук)

А.Г. Сыркина. Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук).  

Берсенёва О.Ю. Изучение внутрипопуляционной изменчивости Calamagrostis obtusata в Саяно-Шушенском заповеднике.


Доклад "Почему и как надо учить медиков статистике?" В. Леонов.

Зачем нужна статистика в доказательной медицине?  В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193.

Роль «малых» доз ионизирующего излучения в развитии неонкологических эффектов: гипотеза или реальность? Бюллетень сибирской медицины, № 2, 2005, с. 63-70. Карпов А.Б., Семенова Ю.В., , Тахауов Р.М., Литвиненко Т.М., Попов С.В., Леонов В.П.

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.

Наш адрес

1997 - 2019. © Василий Леонов