Яндекс.Метрика Проверка нормальности и сравнение групповых средних

Каждый слышит то, что понимает. Гете


"Люди перестают мыслить,
когда перестают читать
".
Д. Дидро

Статистика посещаемости БИОМЕТРИКИ

Наш адрес:

Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...


Редактор БИОМЕТРИКИ
В. Леонов

  • 385
data-counter data-url="http://www.biometrica.tomsk.ru/">
Популярные страницы посещаемые читателями

http://www.biometrica.tomsk.ru/index.htm
http://www.biometrica.tomsk.ru/biostat_1.htm
http://www.biometrica.tomsk.ru/biostat_2.htm
http://www.biometrica.tomsk.ru/biostat_3.htm
http://www.biometrica.tomsk.ru/biostat_4.htm

http://www.biometrica.tomsk.ru/biostat_5.htm
http://www.biometrica.tomsk.ru/biostat_6.htm

http://www.biometrica.tomsk.ru/biostat_7.htm
http://www.biometrica.tomsk.ru/biostat_8.htm
http://www.biometrica.tomsk.ru/biostat_9.htm
http://www.biometrica.tomsk.ru/biostat_10.htm

http://www.biometrica.tomsk.ru/biostat_11.htm
http://www.biometrica.tomsk.ru/nauka_33.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/nauka_19.htm
http://www.biometrica.tomsk.ru/logit_0.htm
http://www.biometrica.tomsk.ru/stat_cardio_1998.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/leonov_vak.htm
http://www.biometrica.tomsk.ru/erevan_4.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/biometrica_18.htm

 

ПОПУЛЯРНОЕ МНЕНИЕ СТОМАТОЛОГА ХАБАРОВСКА О СТАТИСТИКЕ...

 

 

 

Сравниваем средние, а также и ...

В. Леонов

Читай не затем, чтобы противоречить и опровергать;
не затем, чтобы принимать на веру;
и не затем, чтобы найти предмет для беседы;
но чтобы мыслить и рассуждать.
____________
Фрэнсис Бэкон


Оглавление

  1. Нормально и не нормально…
  2. Как возникает нормальное и не нормальное распределение
  3. А сколько этих взаимозависимостей?
  4. Сравниваем средние, дисперсии,  и т.д.
  5. Что сравнивать в корреляции и регрессии?
  6. Заключение. Список литературы

 


Сравниваем средние, дисперсии,  и т.д.

Наука есть не что иное,
как отображение действительности.
____________
Фрэнсис Бэкон

 

 

Сравнение групповых средних, является  одним из наиболее часто используемых методов проверки взаимосвязи между количественным и качественным признаком. То есть проверка статистической гипотезы о равенстве групповых средних. Когда с помощью конкретного статистического критерия отвергается гипотеза равенства групповых средних, то это как раз и означает наличие взаимосвязи между конкретным количественным признаком, и конкретным качественным, группирующим признаком. Напомним, что для таких зависимостей имеется показатель интенсивности связи, так называемый коэффициент детерминации η², обозначаемый в иных публикациях как R² (см. например, статью "Коэффициент детерминации" в Википедии). Величина этого показателя есть доля дисперсии зависимой переменной, объясняемая рассматриваемой моделью. Формула коэффициента детерминации  приведена на стр. 121 в нашей книге  [37], изданной в 1990 г. Как и коэффициенты корреляции, этот показатель имеет значения от 0 до 1. Однако при количестве сравниваемых групп более 2-х, следует установить, между какими конкретными группами имеется различие средних, а между каким группами они не различаются. Например, при наличии трёх сравниваемых групп следует произвести сравнение средних для пар 1 – 2; 1 – 3, и 2 – 3. Поскольку вполне вероятно, что между некоторыми парами групп таких различий не будет, а между остальными парами групп различия будут. Весьма продуктивно такие результаты  отображать ещё и графически. И в зависимости от результатов проверки этих парных гипотез, имеет смысл проверки и иных парных гипотез. Например, таких  пар: 1– (2+3), (1+2) – 3, (1+3) – 2. Здесь (2+3) означает объединение групп 2 и 3 в одну общую группу, и т.п. И такое объединение разумно производить после принятия гипотезы о равенстве групповых средних в двух этих группах. И т.д.

Вернёмся к массиву исследователя G.L., в котором  32 количественных и 24 качественных признаков были представлены в 708 наблюдениях. Ниже на рисунке представлена гистограмма распределения значений количественного признака SP, полученная по 708 наблюдениям:

 

Кривая красного цвета изображает теоретическую нормальную функцию плотности распределения вероятности, с использованием вычисленных параметров распределения (среднее и дисперсия). Как видим, эта кривая весьма значительно отличается от фактического распределения значений этого признака. Проверка гипотезы нормальности распределения значений этого признака, с помощью критериев Шапиро-Уилка, Колмогорова-Смирнова с правкой Лиллиефорса, Крамера-фон-Мизеса и Андерсона-Дарлинга, отвергла нормальность распределения. Особенностью этого распределения можно также отметить и наличие двух значений моды (мода – наиболее часто встречающаяся величина признака). Видим, что первая мода находится в интервале 120-125, а вторая мода в интервале 140-145.

В таблице приведены оценки основных дескриптивных статистик признака SP.
N Mean Std.Dev. Coef.Var. Variance Std.Err. Range Median Max Min
708 129,95 12,58 9,68 158,28 0,47 60 127 166 106

    Выше мы уже говорили о том, что наличие не нормального распределения, в частности распределения асимметричного, свидетельствует о наличии неких зависимостей этого количественного признака от одного или нескольких других признаков. Причём эти другие признаки могут быть как дискретными, группирующими признаками, так и количественными признаками. Поскольку упомянутый набор данных содержал 32 количественных признака, и 24 качественных признаков, то, следовательно, для этого признака SP необходимо было провести оценку связей с 31 количественным и 24 качественными признаками. Что и было сделано, установив в результате наличие статистически значимых взаимозависимостей признака SP с 19 количественными признаками, и с 17 качественными признаками. Более того, при оценке взаимосвязей признака SP с остальными 31 количественными признаками, проводимой не по всему массиву в целом, а раздельно по подгруппам в каждом из 24 качественных признаков, было обнаружено наличие 79 статистически значимых взаимосвязей в 17 группах наблюдений. Все эти парные взаимосвязи были упорядочены по уменьшению интенсивности показателей связи. Наибольший интерес в этих парных взаимосвязях представляли группирующие признаки TIME и  PAT. Каждый из этих признаков содержал две подгруппы.

   Таким образом, если проводить оценку парных взаимосвязей не только по всему массиву данных, а раздельно в подгруппах, обусловленных отдельными градациями группирующих признаков, то общее количество возможных взаимосвязей многократно возрастает. И в этой ситуации вновь естественно возникает вопрос о целесообразности и необходимости выполнения такого большого объёма работы по проверке наличия/отсутствия таких связей. Для объяснения подобного возрастания объёма работы, покажем, как увеличится количество потенциальных парных взаимосвязей в данном массиве наблюдений. Выше мы уже показали, что количество парных взаимосвязей между количественными признаками равно 496. Поэтому для 57 градаций в упомянутых 24 качественных признаков, можно провести 496*57=28272  оценки этих парных взаимосвязей. То есть количество оцениваемых парных взаимосвязей увеличивается в 57 раз!

   Подобный многократный рост количества парных связей будет и для  комбинаций между парами качественных признаков, и для комбинаций одного количественного и одного качественного признака.  При принятии решения о целесообразности и необходимости выполнения подобных детальных исследований, следует помнить и о том, что при этом объём работы увеличивается на порядки не только для проведения самого анализа, но и для просмотра и оценки будущих результатов. Причём объём работы реализации первого этапа – выполнение самого анализа, может быть несколько уменьшен написанием аналитических программ с использованием внутренних языков используемых статистических пакетов. Что, естественно, доступно лишь профессиональным статистикам. Тогда как объём второй части – просмотр, оценка и интерпретация результатов усилиями самого специалиста в медицинской и биологической науке,  вообще не может быть уменьшен. Однако и в работе с оценкой и интерпретацией такого огромного объёма результатов есть свои положительные детали. В частности, с помощью профессионального статистика, пишущего программы анализа на специальном языке программирования, могут быть уменьшены объёмы  просматриваемых результатов, либо с его помощью конкретизировано, какие именно детали результатов следует исследователю-заказчику просматривать в первую очередь.

   Таким образом, принятие решения о первом этапе статистического анализа требует весьма аргументированного выбора вариантов анализа, что возможно только в результате сотрудничества двух специалистов – исследователя-медика или биолога, и профессионального биостатистика. В результате такого диалога и будет принято оптимальное решение о выборе раздельного анализа в подгруппах, которые являются основными, доминирующими в проводимом исследовании. Например, в подгруппах «Больной» и «Здоровый», или в подгруппах «До лечения» и «После лечения», или в подгруппах «Не летальный исход»  и «Летальный исход», и т.п. Именно такую практику планирования объёмов статистического анализа мы с коллегами используем уже более 30 лет. Вначале разрабатывая первую версию Программы работ по анализу данных исследователя (Заказчика). Она создаётся на основе результатов пробных анализов, соответствующих целям и задачам исследования, сформулированных исследователем-заказчиком. Далее эта первая версия 1-2 раза обсуждается с исследователем, и в результате принимается окончательная версия.

    Важнейшей особенностью таких диалогов является доступное объяснение исследователю потенциальных возможностей предлагаемых методов статистического анализа. Подобные объяснения специфики предлагаемых БЛОКОВ Программы работ, вводятся в текст Программы в начале каждого отдельного БЛОКА.  В результате таких диалогов примерно 50% исследователей соглашаются с предлагаемой версией Программы работ. 25% исследователей немного сокращают объём Программы, а последние 25% исследователей напротив, увеличивают этот объём, дополняя её новыми пунктами или БЛОКАМИ.

   Достаточно полезно при выборе этих вариантов анализа использовать возможности графических отображений распределения значений признаков.  Поскольку одним из основных группирующих признаков в упомянутом выше массиве данных был признак TIME, то целесообразно было рассмотреть гистограммы раздельно по двум подгруппам этого признака. Ниже представлены гистограммы распределения значений упомянутого признака SP для подгрупп TIME=1 и TIME=2. Кривые красного цвета изображают теоретические нормальные функции плотности распределения вероятности, с использованием параметров, полученных по выборкам.

 

     Глядя на эти рисунки, не сложно отметить, что эти две группы наблюдений отличаются не только средними значениями, но также существенно различаются и интервалами этих значений. То есть максимальными и минимальными значениями. Поэтому они сильно отличаются и значениями размахов (интервала, диапазона) – Range, равных разностям SPmax – SPmin . Если сравнить две эти гистограммы, то видно, что для группы TIME=1 вершина распределения не очень «острая». И такие распределения принято называть плосковершинными. Причём самая максимальная частота отдельного центрального интервала равна 79 наблюдениям (пациентам). И при этом интервал значений этого признака от 116 до 166, с разностью между максимальным  и минимальным значением равной  166-116=50.Тогда как для группы TIME=2 вершина распределения очень «острая». И такие распределения принято называть островершинными. А самая максимальная частота отдельного центрального интервала равна 136, при интервале значений этого признака от 106 до 127. А разность между максимальным  и минимальным значением равна  127-106=21.

В таблице приведены оценки основных дескриптивных статистик признака SP для каждой из двух этих подгрупп признака TIME.

TIME Mean N Std.Dev. Coef.Var. Variance Std.Err. Range Median Max Min
1 140,35 354 8,84 6,3 78,2 0,47 50 140 166 116
2 119,54 354 4,66 3,9 21,71 0,25 21 120 106 127

    Итак, основные отличия двух приведённых выше гистограмм  распределения SP в подгруппах TIME=1 и TIME=2, не только в структуре вершин, но и в интервале значений признака SP. Значения двух приведённых выше размахов различаются в 2,4 раза, а дисперсии (Variance) отличаются в 3,6 раза.Проверка гипотезы нормальности распределения значений этого признака, с помощью упомянутых выше статистических критериев,  отвергла нормальность распределения значений признака SP в обеих подгруппах. Подобные ситуации служат примером того, что при сравнении параметров распределения количественных признаков в отдельных группах, необходимо сравнивать не только средние, но и дисперсии.

  О необходимости проведения подобных сравнений свидетельствует и тот факт, что практически для всех количественных признаков, анализируемых в проведении исследований в медицине, указываются референтные интервалы. Например, для эритроцитов указывается интервал (3,100 – 5,700)*1012 /л, для гемоглобина указывается интервал (122,000 – 168,000) г/л, и т.п. Очевидно, что в этих случаях оптимальными могут считаться те группы, в которых не только средние значения близки к конкретным рекомендуемым значениям, но также в этих группах дисперсия имеет минимальное значение. То есть значения конкретного признака, у анализируемых наблюдений, ближе к оптимальному значению, а не к минимальному или максимальному.

  Однако для проверки гипотез о равенстве и неравенстве групповых дисперсий, вначале необходимо сделать выбор соответствующего статистического критерия. Как известно, первым таким критерием был предложен критерий Фишера – Снедекора. Чаще всего этот критерий называют просто F-критерием Фишера. Значение этого критерия равно отношению двух дисперсий. Причём в числителе должно быть помещено значение максимальной дисперсии, а в знаменателе – дисперсия из второй группы. То есть, используя приведённые выше в таблице значения двух групповых дисперсий, получаем значение F-критерия равное F=78,2/21,71 = 3,6.

  Однако теория F-критерия базируется на том, что исследуемые дисперсии получены в обеих группах с нормальным распределением значений признака. И если проверка нормальности распределения в одной, или в обеих группах, не подтверждает нормальный закон, то при проверке гипотез о равенстве двух дисперсий использовать F-критерий Фишера нельзя. В разделе 4.4. «О проверке однородности двух независимых выборок» издания [61], достаточно подробно описывается специфика проверки гипотез равенства групповых средних и дисперсий.  В частности, упоминается и о том, что при проверке гипотезы равенства двух дисперсий с помощью F-критерия Фишера, распределения значений признака в обеих сравниваемых группах должны иметь нормальный закон. А в том случае, если нормальный закон распределения в обеих группах сравнения не подтверждается упомянутыми выше критериями, то соответственно критерий Фишера использовать нельзя. И этот аспект весьма подробно описывается в большинстве материалов посвящённых F-критерию Фишера.

    При чтении этого аспекта, у читателя, не очень хорошо знающего теорию этого критерия, возникает резонный вопрос: А почему же в этом случае нельзя использовать F-критерий? Попробуем кратко объяснить эту особенность данного критерия. Итак, значение F-критерия равно отношению двух дисперсий. При этом распределение случайной величины, называемой F-отношением, определяется отношением двух дисперсий, величин, каждая из которых должна подчиняться распределению Пирсона Хи-квадрат:

              (5)

где m – степени свободы для распределения дисперсии в числителе, а n – степени свободы в знаменателе.

   Теперь следует напомнить, а как же получается распределение Пирсона Хи-квадрат? Данное распределение непосредственно связано с нормальным распределением. В частности, если стандартизованное нормальное распределение с нулевым средним и единичным стандартным отклонением, возвести в квадрат, то оно и будет подчиняться распределению Пирсона Хи-квадрат. Данный закон распределения был получен Пирсоном в 1900 году. Этот аспект построения распределения Пирсона описан практически во всех учебниках статистики.

    Очень ясно и доступно для медиков и биологов, это описание приведено в популярном издании [18]. В 11 главе «Теоретические распределения, используемые в статистических выводах» данного издания, достаточно подробно описаны следующие распределения: нормальное; Хи-квадрат; F-распределение; t-распределение. В отдельных четырёх разделах подробно описана основа каждого из этих четырёх распределений. Причём примеры этих распределений хорошо иллюстрируются вполне ясными и доступными графиками. А в конце этой главы, в разделе 11.6 «Соотношение между нормальным, t-, Хи-квадрат и F-распределениями», приведены формулы, показывающие функциональные взаимосвязи этих распределений между собой. Ниже приведём начальный фрагмент этого раздела на стр. 214:

   Таким образом, если распределение значений количественного признака в одной подгруппе сравнения не подчиняется нормальному закону, то в этом случае распределение получаемой дисперсии по данной подгруппе не подчиняется закону распределения Пирсона Хи-квадрат. Следовательно, и отношение двух дисперсий, обозначаемое как F, также не подчиняется распределению Фишера. Аналогичный вывод получается и в том случае, когда нет нормального распределения в обеих сравниваемых подгруппах. Следовательно, не проверяя нормальность распределения количественного признака в каждой из групп сравнения, исследователь, используя такие параметрические критерии, как t-критерий Стьюдента, Хи-квадрат Пирсона, и F-критерий Фишера-Снедекора, фактически получает не только весьма сомнительный результат, но и результат противоположный истинному.

    То есть, подтверждают нулевую гипотезу равенства средних или дисперсий, когда в действительности эта гипотеза отвергается, или наоборот. Поскольку в реальных, анализируемых количественных признаках, нормальный закон распределения подтверждается достаточно редко. Этот факт известен уже давно и упоминается во многих популярных изданиях по статистике. Например, в книге Шторм Р. «Теория вероятности и математическая статистика»  (М.: Мир. 1970. – 368 с.) на странице 67 читаем: «Следует, однако, подчеркнуть, что на практике часто приходится иметь дело со случайными величинами, распределёнными не по нормальному закону».

  А в книге Орлова А.И. «Прикладная статистика» (М.: Издательство «Экзамен», 2004. – 656 с.) на стр. 164 читаем: «В лаборатории прикладной математики Тартуского государственного университета проанализировано 2500 выборок из архива реальных статистических данных. В 92% гипотезу нормальности пришлось отвергнуть. …  Это означает, в частности, что большинство применений критерия Стьюдента, классического регрессионного анализа и других статистических методов, основанных на нормальной теории, строго говоря, не является обоснованным. Поскольку неверна лежащая в их основе аксиома нормальности распределений соответствующих случайных величин».  

    Об этом же читаем и на стр. 166: «В большинстве случаев распределения существенно отличаются от нормальных». А вот как данный аспект описывается в книге [7] на стр. 61. «Нормальное распределение.  Симметричная колоколобразная кривая была открыта Абрахамом де Муавром в 1733 году. … Однако для большинства физиологических случайных величин распределение имеет тенденцию к большей сглаженности, одновершинности и несимметричности, и диапазон среднее ± 2 среднеквадратичных отклонения не охватывает 95% значений». То есть автор издания как раз и утверждает, что большинство физиологических величин не имеют нормального распределения.

   В большом количестве исследований массивов данных по медицине, биологии, зоологии, агрохимии, экономике, металлургии, а также и по ряду специальных направлений, выполненных нами за последние 35 лет, нормальность распределения количественных признаков подтверждалась лишь в 5-10% случаев. И это можно трактовать как весьма надёжную информацию о том, что в большинстве случаев исследуемые количественные признаки имеют реальные взаимосвязи со многими другими качественными и количественными признаками. То есть отсутствие нормального распределения  является аргументом расширения списка проверяемых статистических гипотез о наличии подобных связей.

Следовательно, следует не только сравнивать групповые средние, то есть проверять наличие взаимосвязи между одним количественным и одним качественным признаком, но также производить иные сравнения, и анализ различных взаимосвязей. При этом учитывая наличие не только парных взаимосвязей признаков, но и наличие цепочек многомерных взаимосвязей. То есть следует использовать и различные многомерные методы анализа. Отметим, что данный факт фиксируется лишь практикующими исследователями, выполняющими проверки гипотез о нормальном законе распределения.

Если в Яндексе сделать запрос на выражение «как часто встречается нормальный закон распределения», то получим 2 млн результатов. Естественно, что в большинстве этих ссылок рассматриваются теории нормального закона. И во многих ответах можно прочитать выражения типа «Нормальный закон распределения наиболее часто встречается на практике». Однако при этом автор не уточняет, в какой конкретно практике нормальный закон встречается наиболее часто. Также в этих страницах кроме теории нормального закона распределения, не приводятся практические примеры проверки гипотез нормальности. То есть данные выражения написаны не практикующими статистиками, у которых нет реальных знаний о частотах нормального распределения признаков.

  Иные утверждения о частоте встречаемости нормального закона читаем на страницах написанных практикующими статистиками. Так по  ссылке "Большая Энциклопедия Нефти Газа. Нормальный закон – распределение" читаем: «Нормальный закон распределения наблюдается в тех случаях, когда на признак явления действует много факторов, каждый из которых мало связан с большинством других, и влияние каждого фактора на конечный результат существенно меньше суммарного влияния всех остальных факторов». Там же приводится и фрагмент из книги Котельникова Р.Б. «Анализ результатов наблюдений» [33], из которого приведено это предложение.

   Вот что написано на странице 76 этой книги. «Установлено, что для многих наблюдений распределение отдельных полученных результатов по отношению к среднему значению измеряемой величины характеризуется законом нормального распределения я ошибок (закон Гаусса).  Нормальный закон распределения наблюдается в тех случаях, когда на признак явления действует много факторов, каждый из которых мало связан с большинством других, и влияние каждого фактора на конечный результат существенно меньше суммарного влияния всех остальных факторов. Необходимо отметить, что установившаяся терминология "нормальный закон распределения" может натолкнуть на мысль о том, что именно этому закону должны соответствовать "нормальные", "правильные" экспериментальные данные. В действительности же это не так. Для этого не существует особых объективных причин, и распределение Гаусса (и основанное на нём распределение Стьюдента и др.) хорошо описывает реальные данные не чаще, чем другие. Так, например, указывалось, что среди 250 серий анализов, включающих 50000 отдельных определений, только в 10-15% случаев достаточно хорошо выполняется нормальное распределение.

Примеры, приведённые выше в гл. 2, также показывают отклонения от закона Гаусса. Можно, по-видимому, сказать, что только в некоторых случаях, благоприятных для постулированных Гауссом положений, это распределение выполняется достаточно точно, как, например, в геодезии, астрономии, иногда в аналитической химии и т.п. Тем не менее, это распределение занимает в статистическом анализе особое положение, что связано и с традицией, и с огромным и тщательно разработанным, удобным для использования математическим аппаратом».

   Итак, факт наличия не нормального закона распределения, является, по сути, весьма ценным свойством исследуемого количественного признака. Поскольку это есть отражение наличия различных реальных взаимосвязей данного количественного признака как с качественными, группирующими признаками, так и количественными признаками. То есть наличие не нормального распределения, является весьма надёжным аргументом в пользу проведения исследований достаточно большого количества различных видов взаимосвязей этих количественных признаков.

  Запрос в Яндексе поиска на выражение «история нормального закона распределения», на момент написания этой статьи 14.11.2016, дал 6 млн результатов. А при запросе, например, 10.12.2017, было уже 86 млн. результатов. Первые результаты по нормальному закону распределения внёс Абрахам де Муавр в 1733 году.  Далее нор­мальное распределение вновь открыли и исследовали Карл Фридрих Гаусс (1809 г.) и Пьер-Симон Лаплас (1812 г.), которые исследовали теорию ошибок измерений. Если внимательно прочитать много ссылок данного поиска, то станет ясно, когда доминирует нормальное распределение. Вот одно из таких объяснений: «Нормальное распределение возникает тогда, когда на изменение случайной величины действует множество различных независимых факторов, каждый из которых в отдельности не имеет преобладающего значения». В частности, доминирование нормального закона распределения имеется у погрешностей многократных измерений одной и той же конкретной величины. Например, электрического напряжения у одного и того же источника напряжения, или одной и той же температуры, или одного и того же веса, и т.п.

   В качестве подобного примера расскажу об одной ситуации, которую обнаружила примерно 30 лет назад моя бывшая студентка, которая училась на вечернем экономическом факультете  Томского госуниверситета. Эта студентка работала на одном оборонном предприятии, на котором в весьма большом количестве использовались такие драгметаллы, как золото, серебро и платина. Данные металлы применялись в технологии создания радиоэлектронных изделий. И данная студентка, работая лаборантом, ежедневно взвешивала несколько сотен образцов этих металлов, передавая их работающим инженерам и технологам. При написании курсовой работы данная студентка производила по моему предложению порядка 100 взвешиваний одного и того же образца драгметалла на одних и тех же аналитических весах. Этот образец взвешивался ею на данных весах в течение 3-х месяцев в разное время рабочего дня.

 Анализ полученных взвешиваний показал, что получаемые при этом значения веса одного и того же образца драгметалла, взвешиваемого на одном и том же весовом устройстве, имели нормальное распределение. Однако при этом было установлено, что с течением времени средние значения веса одного и того же образца драгметалла уменьшались. То есть, вес неизменного конкретного образца драгметалла, через 3 месяца становился несколько меньшем, чем ранее, в самом начале серии его взвешиваний. Сравнение средних значений показало статистически значимое уменьшение средних весов на многих аналитических весах. При этом с течением времени изменялись и значения  дисперсий получаемых весовых значений. И это при том, что сам образец оставался неизменным и недоступным для откусывания от него каких-либо фрагментов.

  Отметим, что данная курсовая работа была предложена ввиду того, что со слов данной студентки в её лаборатории часто обнаруживалась недостача драгметалла. По результатам этой курсовой работы руководству соответствующего отдела было предложено сократить интервалы времени между проверкой и отладкой данных аналитических весов. В результате чего данный недостаток технологии взвешивания, обусловленный весьма большим количеством взвешиваний на одних и тех же весах, был ликвидирован.

   Напомним о весьма важной особенности функции плотности нормального распределения, называемой правилом 3 сигм, т.е. правилом 3 стандартных (среднеквадратичных) отклонений. Выше были приведены графики функции нормального распределения, согласно которой в интервалах ±s,  ±2s, и  ±3s от среднего значения, должны быть 68,26%, 95,44% и 99,72% всех анализируемых наблюдений. Естественно, что при отклонении гипотезы нормального отклонения в этих интервалах фиксируются частоты, весьма существенно иные. То есть либо гораздо меньшие, либо гораздо большие. Рассмотрим специфику не нормального распределения, при котором в нарушение правила 3 сигм наблюдается существенно меньшие частоты в указанных интервалах. То есть различия сравниваемых групп могут проявляться не только в различиях средних значений, но также и в различиях дисперсий.

    Для проверки гипотез равенства дисперсий в группах с нормальным распределением, можно использовать такие популярные критерии, как Фишера, Бартлетта, Хатрли, Кохрана, и т.д. А в том случае, когда гипотезы нормальности отвергаются, то достаточно эффективно проверять гипотезы равенства дисперсий с помощью непараметрических критериев Ансари-Бредли [90] и Сиджела-Тьюки  [95].

  Вернёмся к рассмотренному выше примеру анализа признака SP. Напомню, что основные отличия двух приведённых выше гистограмм  распределения SP в подгруппах TIME=1 и TIME=2, были в том, что в первой подгруппе распределение плосковершинное, а во второй подгруппе распределение островершинное. А также в различном виде асимметрий двух этих распределений. Об основных причинах подобных распределений, мы писали ещё в своей книге  [37] на стр. 22-28. Так на стр. 25 этой книги приводится следующая гистограмма с плоской вершиной:

 

Причиной возникновения плосковершинного распределения в этом издании назван сдвиг, дрейф центра распределения в подгруппах, которые в совокупности образуют анализируемую единую группу. Выше уже сообщалось, что упомянутый набор данных содержал 24 качественных признака. Просмотр распределений значений признака SP в отдельных подгруппах этих 24 признаков показал различные результаты. То есть в некоторых подгруппах расположение гистограмм различалось не очень сильно. То есть упомянутый сдвиг, дрейф центра распределения, был не велик. А в других подгруппах такие сдвиги были весьма существенными. Ниже приведён пример такого различия гистограмм признака SP в двух подгруппах по признаку PAT при значениях признака TIME=1  и GROUP=1:

В приведённой ниже таблице видно, что в группе PAT=2 стало больше не только среднее значение признака SP, но также и дисперсия (Variance), коэффициент вариации и размах.

TIME PAT N Means Median Std.Dev. Coef.Var Variance Std.Err. Range
1       1 151 133,18 132,00 4,48 3,37 20,11 0,36 20,00
1       2 203 146,15 145,00 6,93 4,74 48,04 0,49 34.00

Проверка гипотез нормальности распределения признака SP упомянутыми выше критериями, раздельно в каждой из двух этих подгрупп, также отвергла нормальность обоих распределений. Гораздо большая дисперсия признака SP в группе сравнения PAT=2, по сравнению с группой PAT=1, является аргументом в пользу того, чтобы провести отдельное исследование разных взаимосвязей в этой второй группе. Поскольку одной из причин такой большой дисперсии может быть различие между собой нескольких иных подгрупп сравнения, что и приводит к существенному возрастанию дисперсии. Такие сравнения были произведены в группах по 23 качественным признакам. Общее количество этих групп равняется 55. Во многих сравнениях были обнаружены статистически значимые различия, как средних величин, так и дисперсий.

Ниже приведён  график с тремя гистограммами распределений  признака SP по 3 группам признака PAT, которые входят в группу GROUP=2 при TIME=1. Кривые линии отображают теоретические функции плотности для трёх этих групп наблюдений по признаку SP.

  

На данном графике видим, что все 3 распределения перекрываются друг с другом. И при этом отчётливо видно смещение параметров этих групп в сторону увеличения. В частности, в группе PAT=1  среднее значение M=119,45, а дисперсия s2= 22,68. В группе PAT=2 среднее значение M=131,84, а дисперсия s2= 32,34;  в группе PAT=3  среднее значение M=146,15, а дисперсия s2= 48,04.  То есть увеличиваются значения не только средних, но и дисперсий. Ниже представлены раздельно три этих гистограммы. 

А теперь сделаем аналогичный анализ для двух этих групп PAT при значении TIME=2.

TIME

PAT

N

Means

Median

Std.Dev.

Coef.Var.

Variance

Std.Err.

Range

2      

1

174

119,31

120,00

4,66

3,90

21,68

0,35

21,00

2      

2

180

119,77

120,00

4,66

3,89

21,74

0,35

20,00

   Итак, в этих группах параметры распределения почти равны практически все. Проверка гипотезы нормальности распределения значений этого признака, с помощью критериев Шапиро-Уилка и Колмогорова-Смирнова с правкой Лиллиефорса, не отвергла эти гипотезы. Приведённые выше графики с гистограммами для количественной переменной SP, являются с одной стороны отражением вида распределения, – нормального, или не нормального, а с другой стороны и графическим отображением наличия или отсутствия взаимосвязи между переменной SP и группирующим признаком. Выше мы сообщали о том, что для 32 количественных переменных, при наличии 24 качественных признаков, можно (и следует!) исследовать 32*24=768 взаимосвязей. А поскольку гистограммы строились для разных комбинаций пары группирующих признаков, – PAT и TIME, то очевидно, что количество подобных парных взаимосвязей может быть равно не 768, а значительно больше. Например, для каждой из двух отдельных градаций группирующего признака TIME можно исследовать  23*32=736 парных взаимосвязей. А общее количество таких взаимосвязей для двух этих градаций будет равно 736*2=1472.

Если сделать аналогичные расчёты и для других группирующих признаков, то это суммарное количество станет весьма огромным. Напомню, что в подобных ситуациях исследователю следует принимать решение о количестве анализируемых взаимосвязей в результате обсуждения этих деталей с профессиональным статистиком.Не менее актуальным является процедура сравнения долей, пропорций для качественных признаков. То есть производится проверка гипотезы равенства, например, пропорций Р1 и Р2 в популяциях (генеральных совокупностях), из которых были взяты две анализируемые выборки, и получены выборочные значения пропорций р1 и р2. Две альтернативные статистические гипотезы, для подобных сравнений, можно записать следующим образом:H0: Р1 = Р2;  H1: Р1 ≠ Р2.  В качестве примера проверки подобной статистической гипотезы, воспользуемся описанием из [83], приведённым на стр. 34-35. Пропорции для выделенного признака в двух независимых выборках

 

Размер выборки Пропорция
Выборка 1
Выборка 2
Объединённая
n1.
n2.
n..
p1 (=n11/ n1.)
p2 (=n21/ n2.)
p.. (=n.1/ n..)

Значение n.1 вычисляется по следующей формуле:   n.1 = n1.* p1 + n2.* p2 . Для проверки статистической значимости разности между p1 и p2 оценивается z-статистика с  помощью следующей формулы:

   (6)

Напоминаем, что детали сравнения двух долей, и приведённой выше формулы, приведены в книге [83], стр. 34-35.  В качестве примера сравнения двух подобных долей, используем табл. 2.7 со стр. 35 [83]:

 

Размер
выборки

Пропорция объектов с признаком В

Наличие А 
Отсутствие А
Всего

150
50
200
0,10 = p1
0,20 = p2
0,125 = p..

Напомним, как вычисляется значение p.. :

p.. = (150*0,1 + 50*0,2)/200 = (15+10)/ 200 = 25/200=0,125

     (7)

Если величину z = 1,604755  возвести в квадрат, то получим значение z2 = 2,575238 ≈ 2,58. Это значение приведено в выражении (2.2) на стр. 29 , при анализе 4-х клеточной таблицы сопряжённости  [83].     

       В задачах сравнения долей (пропорций) полезна также оценка доверительного интервала для разности между этими независимыми пропорциями. Достаточно подробно эта оценка описана на стр. 41-42  в [83]. Ниже приведём фрагмент этого описания с формулами и образцом расчёта такого доверительного интервала. «Когда допускается, что пропорция Р1 и Р2 могут быть неравными, хорошей оценкой стандартной ошибки разности р1 – р2 является следующая:

 

где q1 = 1- p1 и q2 = 1- p2 .  Предположим, что n1. n2. велики в том смысле, что ni* pi ≥ 5  и  ni*qi ≥  5 для i=1,  2 и что требуется построить 100 (1–α) %-ный доверительный интервал для разности Р2 – Р1 . Пусть сα/2 обозначает величину, отсекающую долю вероятности α/2 от верхнего хвоста стандартной нормальной кривой (1– α/2) – квантиль» [83].

ЛГДИ ≤ Р2 – Р1 ≤ ПГДИ,

где ЛГДИ – Левая Граница Доверительного Интервала;

       ПГДИ –Правая Граница Доверительного Интервала.

Ниже приведём формулы для ЛГДИ и ПГДИ.

  Данный интервал ЛГДИ ≤ Р2 – Р1 ≤ ПГДИ таков, что будет включать истинную разность пропорций приблизительно в 100*(1– α)% случаев.

«Рассмотрим, например, данные из табл. 2.7. Выборочная разность есть p2 – p1 = 0,10 , и оценка её стандартной ошибки

Приближённый 95%-ный  доверительный интервал для истинной разности равен 0,10–1,96*0,062 – 0,013 ≤Р2 – Р1 ≤0,10 + 1,96*0,062 + 0,013. Или  0,035 ≤Р2 – Р1 ≤ +0,235. Интервал включает значение 0, что согласуется с полученным ранее отрицательным результатом (см. уравнение (2.6)) при попытке найти значимое различие между p1 и  p2» [83].

  Приведённые выше формулы несложно реализовать в пакете EXCEL.

   Сравнения групповых средних и дисперсий являются важными процедурами статистического анализа исследуемых массивов данных. Однако следует помнить, что используемые групповые признаки не всегда достаточно полно и адекватно выражают наличие фактически имеющихся группировок наблюдений. То есть помимо установленных, зафиксированных групп наблюдений, очень часто в анализируемой генеральной совокупности (популяции), из которой взяты анализируемые массивы наблюдений, есть и скрытые, латентные группировки.  И такие скрытые группировки следует обязательно обнаруживать, используя различные методы. Например, метод кластерного анализа [1, 24, 53, 81].

   Алгоритмы  кластерного анализа содержат сравнения между собой наблюдений. Например, если по всем признакам два наблюдения идентичны, то есть «расстояние» между этими двумя наблюдениями равно нулю, то эта первая пара образует первый кластер. И далее с этим кластером сравниваются другие наблюдения, или другие кластеры. Отмечу, что кластерный анализ содержит очень большое количество различных алгоритмов сравнения и кластеризации. В результате применения этого метода сравнений наблюдений, в анализируемом массиве наблюдений обнаруживаются скрытые, латентные группировки наблюдений – кластеры. Ниже приведён график с дендрограммой, полученной в результате процедуры кластерного анализа наблюдений ранее упомянутого массива, по одному из популярных алгоритмов. Структура данной дендрограммы свидетельствует о наличии нескольких латентных группировок наблюдений. В частности, двух, трёх и четырёх кластеров.

    Наличие подобных латентных группировок активирует сравнение этих установленных групп. В частности, сравнение и групповых средних, и дисперсий, и т.д. Сравнение этих групп (кластеров) позволит проверить не только равенство/неравенство средних значений количественных признаков, но и взаимосвязи этих кластеров со всеми качественными, группирующими признаками, а также установить их структуру с помощью такого мощного метода, как логистическая регрессия. При этом для интерпретации структуры этих выявленных группировок наблюдений, обязательно следует произвести упомянутые выше методы сравнения и взаимосвязей.

Далее: Что сравнивать в корреляции и регрессии?

Примеры оформления заказчиками базы данных, описания признаков и целей статистического анализа этой базы данных

Островок  здоровья

Пример 1  Пример 2  
Пример 3


  НЦ БИОСТАТИСТИКА
выполняет статистический анализ данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Нашими услугами пользуются аспиранты и докторанты по медицине, биологии, социологии, психологии и т.д. (См. далее )

Отзывы исследователей по статистическому анализу данных


Интересная ссылка


ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК № 5, 1997 г. В.П.Леонов, П.В.Ижевский.

Сравниваем средние, а также и ... В. Леонов Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров. Показано, что не нормальное распределение количественного признака, означает наличие взаимосвязей данного признака с другими признаками.


Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.

Роль «малых» доз ионизирующего излучения в развитии неонкологических эффектов: гипотеза или реальность? Бюллетень сибирской медицины, № 2, 2005, с. 63-70. Карпов А.Б., Семенова Ю.В., , Тахауов Р.М., Литвиненко Т.М., Попов С.В., Леонов В.П.

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


Логистическая регрессия в медицине и биологии.
Леонов В.

В серии 10 статей рассмотрены основы метода логистической регрессии. На многочисленных примерах анализа реальных массивов данных поясняется специфика использования данного метода. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных.

Введение.

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5.Особенности логистической регрессии в акушерстве.
6.Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество логистической регрессии.


Статистика - это что? Статистика - нужна зачем? Статьи читаем - зачем? Статьи пишем - зачем? Краткая версия лекции для слушателей-медиков в Ереване, прочитанной в 2014 году по Скайпу.

В. Леонов. КЛАССИФИКАЦИЯ ОШИБОК ПРИМЕНЕНИЯ СТАТИСТИКИ В ОТЕЧЕСТВЕННОЙ МЕДИЦИНЕ.


В. Леонов. МЕМЕТИЧЕСКИЙ АНАЛИЗ СТАТИСТИЧЕСКИХ ЗАБЛУЖДЕНИЙ В ПУБЛИКАЦИЯХ НАУЧНЫХ ШКОЛ

Леонов В.П. Введение в семиотику информационных технологий: учебное пособие. – Томск: Изд-во НТЛ, 2011. – 248 с. Учебное пособие является первой книгой из серии учебных пособий по современным проблемам информатики, подготавливаемых на факультете информатики ТГУ. Книга предназначена для студентов как естественных, так и гуманитарных факультетов, изучающих информатику. Изложены основные понятия семиотики как одной из составляющих частей информатики. Рассмотрены классификации знаков и их свойств, в частности мобильность и ареальность, а также изменение природы носителей информации. 5-я глава - "Статистическая структура информационных массивов".

Леонов В.П. Обработка экспериментальных данных на программируемых микрокалькуляторах.

Леонов В.П. Введение в физику и технологию элементной базы ЭВМ и компьютеров.

Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях. Почему появилась эта статья? За время существования сайта БИОМЕТРИКА его автору пришло довольно много писем, в которых читатели консультировались относительно различных нюансов использования и описания методов статистики в статьях и диссертациях. Этот поток писем периодически возрастал после публикаций статей автора на сопутствующие темы в "Бюллетене ВАК РФ",  "Международном журнале медицинской практики",  "Медицинской газете",  "Сибирском медицинском журнале", а также непосредственно на сайте БИОМЕТРИКА. С каждым годом таких писем становится все больше...

Леонов В.П. Общие проблемы применения статистики в биомедицине. 

ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК N5 1997 г. В.П.Леонов, П.В.Ижевский.

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).

Леонов В.П. Факторный анализ: основные положения и ошибки применения.

История биометрики

Применение статистики в статьях и диссертациях по медицине и биологии. Часть I. Описание методов статистического анализа в статьях и диссертациях. Международный журнал медицинской практики, 1998 г., вып. 4. В.П. Леонов, П.В. Ижевский

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.   ЧАСТЬ 2. ИСТОРИЯ БИОМЕТРИКИ И ЕЁ ПРИМЕНЕНИЯ В РОССИИ. Леонов В.П.

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.  ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ  "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ". Леонов В.П.

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ 
ДЛЯ МЕДИКОВ И БИОЛОГОВ. 

(время и опыт)
. Леонов В.

Общие проблемы применения статистики в биомедицине,  или что разумнее: ДДПП или ДППД?

Леонов В.П. Ошибки статистического анализа биомедицинских данных.  Международный журнал   медицинской практики,  2007, вып. 2, стр.19-35.
Ошибка – это …
Ошибка или обман?

Обзоры ошибок применения статистики в медицине

Причины возникновения ошибок и меры борьбы с ними

Ошибки описания статистических методов

Меметический анализ описаний методов статистики

Локализация ошибочных описаний внутри научных школ

Мемы камуфляжных описаний

Смутно пишут о том, о чём смутно представляют

Коварный t-критерий Стьюдента

«… не зная законов языка ирокезского, можешь ли ты делать такое суждение  по  сему предмету…»

Что же делать, чтобы избежать ошибок?

КРАТКОСТЬ – СЕСТРА ТАЛАНТА? ИЛИ ПРИЗНАК НЕЗНАНИЯ?

Н.Бейли. МАТЕМАТИКА В БИОЛОГИИ И МЕДИЦИНЕ

Критерий Колмогорова-Смирнова: особенности применения

Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях

В.П. Леонов.  Камуфляжные мемы инфоценоза научных школ // Философия математики: актуальные проблемы. Материалы Международной научной конференции 15-16 июня 2007. Москва, Изд. Саван С. А., 2007. - с. 212-216.

ВОЗМОЖНОСТИ БИОМЕТРИЧЕСКОГО АНАЛИЗА ВЗАИМОСВЯЗИ СОМАТИЧЕСКИХ ПОКАЗАТЕЛЕЙ И СИСТЕМАТИКИ ПСИХИЧЕСКИХ РАССТРОЙСТВ.
Н.П.Гарганеева, В.П.Леонов. Сибирский медицинский журнал, № 2, 2001, с.25-32.

НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ   (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ). В.П.Леонов.Cамая читаемая наша статья после отправки в мае м-це с.г. более 300 писем авторам статей мед. журналов о наличии в них примитивных и ошибочных методов статистического анализа, и получаемых при этом результатах..


В. Леонов. Общие проблемы применения статистики в биомедицине. 

ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК № 5, 1997 г. В.П.Леонов, П.В.Ижевский.

В. Леонов. Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях. 

В. Леонов. Общие проблемы применения статистики в биомедицине.

В.П.Леонов. Применение разведочного анализа для оценки исходных данных (на примере наблюдений по уролитиазу)

Леонов В.П. Классификация ошибок применения статистики в отечественной медицине. Материалы научной конференции "Системный анализ в медицине" (САМ 2007). Благовещенск, 2007, Амурский государственный университет.

Леонов В.П. Стандартизация формы представления экспериментального материала как проблема информационной экологии. Материалы научной конференции "Системный анализ в медицине" (САМ 2007). Благовещенск, 2007, Амурский государственный университет.

Леонов В.П. Сравнительный анализ статистических парадигм отечественных и американских публикаций по медицине и биологии методами наукометрики. Материалы научной конференции "Системный анализ в медицине" (САМ 2007). Благовещенск, 2007, Амурский государственный университет.

Леонов В.П. Камуфляжные мемы инфоценоза научных школ. Материалы Международной научной конференции 15-16 июня 2007  г. "Философия математики: Актуальные проблемы." - Московский государственный университет.

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).

Леонов В.П. Принципы описания статистики в биомедицинских публикациях. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).

Леонов В.П. Основные понятия ROC-анализа. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009).

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35


Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа

В.В. Половинкин
ТОТАЛЬНАЯ МЕЗОРЕКТУМЭКТОМИЯ — ФАКТОР ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ СРЕДНЕАМПУЛЯРНОГО И НИЖНЕАМПУЛЯРНОГО РАКА ПРЯМОЙ КИШКИ.

Н.Г. Веселовская 
КЛИНИЧЕСКОЕ И ПРОГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ЭПИКАРДИАЛЬНОГО ОЖИРЕНИЯ У ПАЦИЕНТОВ ВЫСОКОГО СЕРДЕЧНО-СОСУДИСТОГО РИСКА.

О.Я. Васильцева ЗАКОНОМЕРНОСТИ ВОЗНИКНОВЕНИЯ, КЛИНИЧЕСКОГО ТЕЧЕНИЯ И ИСХОДОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ ПО ДАННЫМ ГОСПИТАЛЬНОГО РЕГИСТРА ПАТОЛОГИИ.

В.А. Габышев 
ФИТОПЛАНКТОН КРУПНЫХ РЕК ЯКУТИИ И СОПРЕДЕЛЬНЫХ ТЕРРИТОРИЙ ВОСТОЧНОЙ СИБИРИ.

М.И. Антоненко  ГИПЕРКОРТИЦИЗМ БЕЗ СПЕЦИФИЧЕСКИХ КЛИНИЧЕСКИХ СИМПТОМОВ: ЭПИДЕМИОЛОГИЯ, КЛИНИКА, ДИАГНОСТИКА.

Н.Г. Веселовская"ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ"

М.А. Будникова АНАЛИЗ ДИНАМИКИ ЧАСТОТЫ И СПЕКТРА АНОМАЛИЙ МИТОЗА, МЕЙОЗА И ЭЛЕМЕНТОВ ПРОДУКТИВНОСТИ Allium cepa L., ВЗЯТОГО ИЗ АГРОПОПУЛЯЦИЙ С РАЗНОЙ АНТРОПОГЕННОЙ НАГРУЗКОЙ ( Дипломная работа )

И.А. Бирюкова Научно - практическая работа " ФАРМАКОЭКОНОМИЧЕСКИЕ ИССЛЕДОВАНИЯ РОЗНИЧНОГО РЫНКА ГОРОДА ОМСКА"

Г.А. Попова СРАВНИТЕЛЬНОЕ ИЗУЧЕНИЕ ПОДВИДОВ LINUM USITATISSIMUM L . В УСЛОВИЯХ ЗАПАДНОЙ СИБИРИ. (диссертация на соискание учёной степени кандидата биологических наук).

А.Г. Сыркина Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук).

В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с Конференции по доказательной медицине в Ереване.

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине (24 - 26 сентября 2015 года).

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


Новые полезные книги...

(Заказать книгу можно через издательство)

Ланг Т., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов. Пер. с англ. В.П. Леонова. 2016 - 480 с.

Петри А., Сэбин К. Наглядная медицинская статистика. Учебное пособие. 3-е издание. Пер. с англ. В.П. Леонова. 2015. - 216 с.

Банержи А. Медицинская статистика понятным языком: вводный курс. Издательство "Практическая медицина", 2014. - 287 с. Пер. с англ. В.П. Леонова.

Т. Гринхальх. Основы доказательной медицины. Издательство "ГЭОТАР-Медиа", 2015. - 336 с. 4-е издание переработанное и дополненное. Пер. с англ. Под ред. И.Н. Денисова, К.И. Сайткулова, В.П. Леонова.


Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.
ВВЕДЕНИЕ

ДОКАЗАТЕЛЬНАЯ МЕДИЦИНА И СТАТИСТИКА.

КРАТКОСТЬ – СЕСТРА ТАЛАНТА? ИЛИ ПРИЗНАК НЕЗНАНИЯ?

ПРОЦЕНТЫ – ПРИМИТИВНО? ЗАТО ДОСТУПНО!

СТАТИСТИЧЕСКАЯ ВАМПУКИЗАЦИЯ,  ОНА ЖЕ ВСЕОБЩАЯ СТЬЮДЕНТИЗАЦИЯ.

«ЛОШАДЕНДУС СВАЛЕНДУС С МОСТЕНДУС».

КАК ПРАВИЛЬНО: EXCEL ИЛИ EXEL, WINDOWS ИЛИ WINDOUS,
MICROSOFT ИЛИ MIKROSOFT, STATISTICA ИЛИ STATISTIKA?
 

ЗЕММЕЛЬВЕЙС И СТАТИСТИЧЕСКАЯ ТЕХНИКА БЕЗОПАСНОСТИ.

«ЗАЧЕМ НАМ КУЗНЕЦ? НАМ КУЗНЕЦ НЕ НУЖЕН».

ПРИМЕРЫ ПОДРОБНОГО ОПИСАНИЯ.

КТО ВИНОВАТ?  ЧТО ДЕЛАТЬ?

ВМЕСТО ЗАКЛЮЧЕНИЯ.

Весь обзор одним файлом


Отзывы читателей обзора Статистика в кардиологии. 15 лет спустя.

В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним...

Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента.
К большому сожалению, в большинстве учебников, в которых рассматривается критерий Стьюдента, не акцентируется внимание читателей на ограничениях этого критерия, и на последствиях их нарушения.    

В. Леонов. Применение методов статистики в кардиологии (по материалам журнала "Кардиология" за 1993-1995 гг.).     Журнал "Кардиология", 1998, № 1 

В. Леонов. Статистика в кардиологии. 15 лет спустя. В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним..

Камчатская биометрика-2014. Семинар по биометрике в камчатском НИИ КамчатНИРО. (24.03.2014 - 3.04.2014).

Камчатская фото-биометрика-2014. Фоторепортаж с семинара по биометрике в Петропавловске-Камчатском.

Отзывы слушателей семинара по биометрике в Петропавловске-Камчатском


Отзывы исследователей по
статистическому анализу
данных




Введение
Наши возможности. О возможностях статистического анализа
Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35.

Статистическое рецензирование статей и диссертаций
Долгое прощание с лысенковщиной...
Семинар по биометрике в Красноярске


 Музыка для души ...

Когда после многочасовой работы с числами, статистическими процедурами, программами для статистического анализа и т.д., в глазах начинают ...


После взрыва на СХК в 1993г. в Томске и Северске увеличилась частота рождения детей с пороками развития

Статистика - это что? Статистика - нужна зачем? Статьи читаем - зачем? Статьи пишем - зачем? Краткая версия лекции для слушателей-медиков в Ереване, прочитанной в 2014 году по Скайпу.

«Роющая деятельность кабана». Статья в "Независимой" газете...

Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях. Почему появилась эта статья?

Леонов В.П. Общие проблемы применения статистики в биомедицине. 

ОБ ИСПОЛЬЗОВАНИИ ПРИКЛАДНОЙ СТАТИСТИКИ ПРИ ПОДГОТОВКЕ ДИССЕРТАЦИОННЫХ РАБОТ ПО МЕДИЦИНСКИМ И БИОЛОГИЧЕСКИМ СПЕЦИАЛЬНОСТЯМ. Бюллетень ВАК N5 1997 г. В.П.Леонов, П.В.Ижевский.

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику". Якутск, (12-13 ноября 2009).

История биометрики

Применение статистики в статьях и диссертациях по медицине и биологии. Часть I. Описание методов статистического анализа в статьях и диссертациях. Международный журнал медицинской практики, 1998 г., вып. 4. В.П. Леонов, П.В. Ижевский

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.   ЧАСТЬ 2. ИСТОРИЯ БИОМЕТРИКИ И ЕЁ ПРИМЕНЕНИЯ В РОССИИ. Леонов В.П.

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.  ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ  "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ". Леонов В.П.

Применение статистики в статьях и диссертациях по медицине и биологии. Часть IV. Наукометрия статистической парадигмы экспериментальной биомедицины.     Международный журнал медицинской практики, 2002 г. вып. 3. Леонов В.

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ  ДЛЯ МЕДИКОВ И БИОЛОГОВ.  (время и опыт). Леонов В.

Общие проблемы применения статистики в биомедицине,  или что разумнее: ДДПП или ДППД?

Леонов В.П. Ошибки статистического анализа биомедицинских данных.  Международный журнал   медицинской практики,  2007, вып. 2, стр.19-35.

КРАТКОСТЬ – СЕСТРА ТАЛАНТА? ИЛИ ПРИЗНАК НЕЗНАНИЯ?

Н.Бейли. МАТЕМАТИКА В БИОЛОГИИ И МЕДИЦИНЕ

Критерий Колмогорова-Смирнова: особенности применения


Хорошая книга:

Основы кардиологии. Принципы, практика, статистика

Д. Химмельблау. Анализ процессов статистическими методами.


Как две капли воды... Удивительные совпадения встречаются подчас в текстах журнальных статей, диссертаций и книг разных авторов. Этому феномену и посвящён данный раздел, который открывает ЭКСПЕРИМЕНТАЛЬНО-МЕДИЦИНСКАЯ ГАВРИЛИАДА".
Вы ко мне писали... (Переписка с нашими читателями)
- Выпуск 2
- Выпуск 1


1997 - 2019.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Отклики читателей статьи "Доказательная или сомнительная?"

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ

Т. Кун "Структура научных революций"