Яндекс.Метрика

Кластерный анализ в медицине

Каждый слышит то, что понимает. Гете

Статистика посещаемости БИОМЕТРИКИ


16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц
14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц
14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страницы
17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц
03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц
30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц
06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц
08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы

Если приходят, значит полезное находят.
    Пишите нам на адрес
Выбрав любое изображение, кликните по нему мышкой, и Вы прочитаете о том, как ...

Редактор БИОМЕТРИКИ
В. Леонов

Страницы  часто посещаемые  читателями

http://www.biometrica.tomsk.ru/biostat_1.htm
http://www.biometrica.tomsk.ru/biostat_2.htm
http://www.biometrica.tomsk.ru/biostat_3.htm
http://www.biometrica.tomsk.ru/biostat_4.htm

http://www.biometrica.tomsk.ru/biostat_5.htm
http://www.biometrica.tomsk.ru/biostat_6.htm

http://www.biometrica.tomsk.ru/biostat_7.htm
http://www.biometrica.tomsk.ru/biostat_8.htm
http://www.biometrica.tomsk.ru/biostat_9.htm
http://www.biometrica.tomsk.ru/biostat_10.htm

http://www.biometrica.tomsk.ru/biostat_11.htm
http://www.biometrica.tomsk.ru/nauka_33.htm
http://www.biometrica.tomsk.ru/comp_aver.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/nauka_19.htm
http://www.biometrica.tomsk.ru/logit_0.htm
http://www.biometrica.tomsk.ru/stat_cardio_1998.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/leonov_vak.htm
http://www.biometrica.tomsk.ru/erevan_4.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/biometrica_18.htm

НЦ БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. (См. далее )

 



  Отзывы исследователей по статистическому анализу данных


Кластерный анализ:
основы метода и его применение в биомедицине
 

ОСНОВНЫЕ ПОНЯТИЯ И ТЕРМИНЫ

1. ОБЪЕКТ И ПРИЗНАК

Введем первоначально такие понятия, как объект и признак. Объект - от латинского objectum - предмет. Применительно к медицине и биологии под объектами мы будем подразумевать конкретные предметы исследования, которые изучаются с помощью физических, химических и иных методик. Такими объектами могут быть, например, пациенты, страдающие теми или иными заболеваниями, отдельные системы или органы, растения, животные и т.д. Некоторую совокупность объектов, доступную исследователю для изучения, мы будем называть выборкой, или выборочной совокупностью. Количество объектов в такой совокупности принято называть объемом выборки. Обычно объём выборки обозначают латинской буквой "n" или "N" . 

Признак (синонимы - свойство, переменная, характеристика; англ. - variable - переменная.) - представляет собой конкретное свойство объекта. Эти свойства могут выражаться как числовыми, так и не числовыми значениями. Например, артериальное давление (систолическое или диастолическое) измеряют в миллиметрах ртутного столба, вес - в килограммах, рост в сантиметрах и т.д. Далее такие признаки мы будем называть количественными признаками [5]. В отличие от этих непрерывных числовых характеристик (шкал), ряд признаков может иметь дискретные, прерывистые значения. В свою очередь такие дискретные признаки принято делить на две группы. Первая группа - ранговые, или как их еще называют порядковые переменные (шкалы). Таким признакам присуще свойство упорядоченности этих значений.  К ним можно отнести стадии того или иного заболевания, возрастные группы, балльные оценки знаний учащихся, 12-балльную шкалу магнитуд землетрясений по Рихтеру и т.д. Вторая же группа дискретных признаков не имеет такой упорядоченности и носит название номинальных (от слова "номинал" - образец ) или классификационных признаков. Примером таких признаков может быть состояние пациента - "здоров" или "болен", пол пациента, период наблюдения - "до лечения" и "после лечения" и т.д. В этих случаях принято говорить, что такие признаки относятся к шкале наименований. Строго говоря, не вполне корректно в таких случаях будет использование выражения "измерение в шкале наименований", поскольку процедура измерения предполагает наличие некоторых средств измерения для нахождения численного значения измеряемой величины. Эти две группы дискретных признаков условимся далее именовать качественными признаками.[5] 

Используя понятия объекта и признака, условимся впредь называть матрицей "Объект-свойство" или "Объект-признак" прямоугольную таблицу, состоящую из значений признаков описывающих свойства исследуемой выборки наблюдений. В данном контексте одно наблюдение будет записываться в виде отдельной строки состоящей из значений используемых признаков. Отдельный же признак в такой матрице данных будет представлен столбцом, состоящим из значений этого признака по всем объектам выборки. Ниже приведена такая матрица, содержащая небольшую часть данных реального исследования свойств эритроцитов крови и ряда биохимических показателей у детей с больной щитовидной железой. В первом столбце матрицы размещен порядковый номер наблюдения, Х1-Х7 - количественные переменные представляющие собой электронномикроскопические характеристики эритроцитов крови, качественный признак Х8 - характер группы пациентов (здоровые, больные до лечения и больные после лечения) и качественный признак Х9 - вид заболевания щитовидной железы.

Таблица 1
 

N
п/п
X1
X2
X3
X4
X5
X6
X7
X8
X9
1
80,93
0,605
0,303
4,94
1,21
5,85
0,2
1
1
2
80,3
0,5
0,7
5,1
1,3
5,7
0,1
1
1
3
80,22
0,599
0,599
5,59
1,09
5,29
0,2
2
1
4
80,8
0,3
0,6
4,9
1,2
5,9
0,1
2
1
5
80
0,5
0,9
5,2
1,1
5,8
0,1
1
1
6
80,6
0,7
0,3
5,1
1,2
5,9
0,2
2
1
7
79,9
0,2
1
4,7
1,9
5,7
0,2
1
1
8
81,4
0,6
0,5
5,3
1,8
3,9
0,2
2
2
9
80
0,3
0,8
4,9
1,8
5,1
0,3
3
2
10
80,3
0,5
0,4
5,4
1,9
5,1
0,2
2
2
11
79,8
0,8
0,2
5,3
2
5,2
0,3
3
2
12
80,7
0,6
0,3
5,7
2,1
4,7
0,2
2
1
13
80,9
0,3
0,6
4,1
2
5,7
0,3
1
1
14
80,5
0,5
0,5
4,9
1,9
5,1
0,2
2
1
15
79,5
0,5
0,6
5,3
2
5,3
0,1
3
1
16
80,2
0,7
0,2
5,1
2,2
5
0,2
1
1
17
80,5
0,6
0,3
5,1
2,1
4,7
0,2
2
2
18
80,42
0,499
0,399
4,89
1,89
5,09
0,3
2
2
19
80,3
0,7
0,3
5,3
2
5,2
0,2
1
2
20
80,5
0,5
0,5
5,1
1,9
4,9
0,2
3
2

 

Весь массив данных включал 8 групп количественных признаков: общий анализ крови, биохимия крови, содержание гормонов, характеристики эритроцитов крови, полученные с помощью электронной микроскопии и т.д. и 4 группы качественных признаков: жалобы, анамнез заболевания, наследственность, и пункция щитовидной железы. Общее количество исследуемых признаков равнялось 85. Выборка включала наблюдений за 105 детьми. Таким образом, вся матрица данных для анализа представляла собой таблицу, состоящую из 105 строк и 86 столбцов: 85 признаков плюс еще один столбец - идентификатор наблюдения, в качестве которого выступали фамилия и имя ребенка. 

2. РАССТОЯНИЕ МЕЖДУ ОБЪЕКТАМИ (МЕТРИКА)

Теперь необходимо ввести понятие "расстояние между объектами". Интуитивно многие из нас понимают, что это понятие должно отражать меру сходства, близости объектов между собой по всей совокупности используемых признаков. Иными словами служить интегральной мерой сходства объектов между собой. Расстоянием между объектами в пространстве признаков называется такая величина dij , которая удовлетворяет следующим достаточно разумным аксиомам:

  1. dij > 0 (неотрицательность расстояния)
  2. dij = dji (симметрия)
  3. dij + djk > dik (неравенство треугольника)
  4. Если dij не равно 0, то i не равно  j (различимость нетождественных объектов)
  5. Если dij = 0, то i = j (неразличимость тождественных объектов)
Меру близости (сходства) объектов удобно представить как обратную величину от расстояния между объектами. В многочисленных изданиях посвященных кластерному анализу описано более 50 различных способов вычисления расстояния между объектами. Кроме термина "расстояние" в литературе часто встречается и другой термин - "метрика", который подразумевает метод вычисления того или иного конкретного расстояния. Мы будем пользоваться как первым, так и вторым термином. Наиболее доступно для восприятия и понимания в случае количественных признаков является так называемое "евклидово расстояние" или "евклидова метрика". Те, кто помнит школьную теорему Пифагора, могут использовать в качестве примера такого расстояния длину гипотенузы. Формула для вычисления такого расстояния весьма напоминает школьную формулу:

В данной формуле использованы следующие обозначения:

  • dij - расстояние между i-тым и j-тым объектами; 
  • xik - численное значение k-той переменной для i-того объекта;
  • xjk - численное значение k-той переменной для j-того объекта;
  • v - количество переменных, которыми описываются объекты.
Таким образом, для случая v=2, когда мы имеем всего два количественных признака, расстояние dij будет равно длине гипотенузы прямоугольного треугольника, которая соединяет собой две точки в прямоугольной системе координат. Эти две точки будут отвечать i-тому и j-тому наблюдениям выборки. Нередко вместо обычного евклидового расстояния используют его квадрат d2ij. Кроме того, в ряде случаев используется "взвешенное" евклидово расстояние, при вычислении которого для отдельных слагаемых используются весовые коэффициенты. Для иллюстрации понятия евклидовой метрики используем простой обучающий пример. Матрица данных, приведенная ниже в таблице, состоит из 5 наблюдений и двух переменных. 
 
X1 X2
1 5,000 11,000
2 6,000 11,000
3 6,000 12,000
4 7,000 14,000
5 8,000 15,000

 

Используя евклидову метрику, вычислим матрицу межобъектных расстояний, состоящую из величин dij - расстояние между i-тым и j-тым объектами. В нашем случае i и j - номер объекта, наблюдения. Поскольку объем выборки равен 5, то соответственно i и j могут принимать значения от 1 до 5. Очевидно также, что количество всех возможных по парных расстояний будет равно 5*5=25. Действительно, для первого объекта это будут следующие расстояния: 1-1; 1-2; 1-3; 1-4; 1-5. Для объекта 2 также будет 5 возможных расстояний: 2-1; 2-2; 2-3; 2-4; 2-5 и т.д. Однако число различных расстояний будет меньше 25, поскольку необходимо учесть свойство неразличимости тождественных объектов - dij = 0 при i = j. Это означает, что расстояние между объектом №1 и тем же самым объектом №1 будет равно нулю. Такие же нулевые расстояния будут и для всех остальных случаев i = j. Кроме того, из свойства симметрии следует, что dij = dji для любых i и j. Т.е. расстояние между объектами №1 и №2 равно расстоянию между объектами №2 и №1. Ниже приведена симметричная (dij = dji) квадратная матрица с нулевой (dij = 0 при i = j) диагональю. 
 

Номер объекта 1 2 3 4 5
1 0,00  1,00 1,41 3,61 5,00
2 1,00  0,00 1,00 3,16 4,47
3 1,41  1,00 0,00 2,24 3,61
4 3,61  3,16 2,24 0,00 1,41
5 5,00  4,47 3,61 1,41 0,00

 

Вспомнив школьную алгебру, нетрудно вычислить количество расстояний dij в одном из треугольников матрицы (верхнем или нижнем). Всего в матрице количество элементов (чисел) равно N*N (в нашем случае 5*5=25).  Вычтем из этого числа количество элементов находящихся на диагонали, равно объему выборки N. Далее разделим количество элементов находящихся над диагональю и под диагональю на два. В результате этого получим следующее выражение: (N*N - N)/2= N*(N-1)/2. Итак, для нашего случая всего будет 5*(5-1)/2=10 разных расстояний. 

А теперь попытаемся вычислить некоторые их этих расстояний самостоятельно, например, между объектом №1 и №2. Вначале вычислим квадрат этого расстояния, а потом извлечем из него квадратный корень. d212 = [(5-6)2 + (11-11)2 ]= 12 + 02 =1. Отсюда получаем, что d12 =1. Аналогично вычислим величину d213 а затем и d13 : d213 =[(5-6)2 + (11-12)2 ] = 12 + 12 = 2. Откуда находим, что корень квадратный из двух с точностью до второго знака после запятой равен 1,41. Запомним, что минимальная величина в данной матрице равна 1 и отвечает расстоянию d12. Чуть ниже мы увидим, что процесс кластеризации этих 5 наблюдений начнется именно с объектов №1 и №2. Рекомендуем нашим читателям самостоятельно вычислить расстояние между 4 и 5 объектами, убедившись, что оно действительно равно 1,41.

Весьма напоминает выражение для евклидового расстояния так называемое обобщенное степенное расстояние Минковского, в котором в степенях вместо двойки используется другая величина. В общем случае эта величина обозначается символом "р". 

При р = 2 мы получаем обычное Евклидово расстояние. Ниже приводится выражение для обобщенной метрики Минковского.

Выбор конкретного значения степенного показателя "р" производится самим исследователем. 

Частным случаем расстояния Минковского является так называемое манхэттенское расстояние, или "расстояние городских кварталов" (city-block), соответствующее р=1:

Таким образом, манхеттенское расстояние является суммой модулей разностей соответствующих признаков объектов. Устремив p к бесконечности, мы получаем метрику "доминирования", или Sup-метрику: 

которую можно представить также в виде dij = max| xik - xjk|.

Как видим, метрика Минковского фактически представляет собой большое семейство метрик, включающее и наиболее популярные метрики. Однако существуют и методы вычисления расстояния между объектами, принципиально отличающиеся от метрик Минковского. Наиболее важное из них так называемое расстояние Махаланобиса, которое имеет достаточно специфические свойства. Ниже приведено выражение для данной метрики:

Здесь через Xi и Xj обозначены вектор-столбцы значений переменных для i-того и j-того объектов. Символ Т в выражении (Xi - Xj)Т обозначает так называемую операцию транспонирования вектора. Символом S обозначена общая внутригрупповая дисперсионно-ковариационная матрица. А символ -1 над S означает, что необходимо обратить матрицу S (желающих более детально разобраться с этими математическими тонкостями отправляем к вполне доступным для медиков и биологов книгам [6-10]). В отличие от метрики Минковского и евклидовой метрики, расстояние Махаланобиса через матрицу дисперсий-ковариаций S связано с корреляциями переменных. Когда корреляции между переменными равны нулю, расстояние Махаланобиса эквивалентно квадрату евклидового расстояния. 

В случае использования дихотомических (имеющих всего два значения) качественных признаков широко используется расстояние Хемминга

равное числу несовпадений значений соответствующих признаков для рассматриваемых i-того и j-того объектов.

Кроме этих достаточно известных и популярных метрик используются и такие метрики, как коэффициенты Рао, Хемминга, Роджерса-Танимото, Жаккара, Гауэра, меры близости Журавлева, Воронина, Миркина, метрики Брея-Кертиса, Канберровская и многие другие [5, 11-33]. 

3. ПЛОТНОСТЬ И ЛОКАЛЬНОСТЬ КЛАСТЕРОВ

Как уже говорилось выше, главной целью кластерного анализа является нахождение в выборке групп объектов схожих между собой. Предположим, что каким-то из возможных методов мы получили такие группы - кластеры. Теперь имеет смысл обсудить наиболее важные свойства кластеров. Одно из таких свойств - это плотность распределения точек, наблюдений внутри кластера. Это свойство дает нам возможность определить кластер в виде скопления точек в многомерном пространстве, относительно плотное по сравнению с иными областями этого пространства, которые либо вообще не содержат точек, либо содержат малое количество наблюдений. Иными словами, насколько данный кластер является компактным, или же наоборот - достаточно разреженным. Несмотря на достаточную очевидность этого свойства, однозначного способа вычисления такого показателя (плотности) не существует. Наиболее удачным показателем, характеризующим компактность, плотность "упаковки" многомерных наблюдений в данном кластере, является дисперсия расстояния от центра кластера до отдельных точек кластера. Чем меньше дисперсия этого расстояния, тем ближе к центру кластера находятся наблюдения, тем больше плотность кластера.  И наоборот, чем больше дисперсия расстояния, тем более разрежен данный кластер, и, следовательно, есть точки находящиеся как вблизи центра кластера, так и достаточно удаленные от центра кластера. 

Следующее свойство кластеров - его размеры. Основным показателем размера кластера является его "радиус". Это свойство наиболее полно отображает фактический размер кластера, если рассматриваемый кластер имеет круглую форму и является гиперсферой в многомерном пространстве. Однако если кластеры имеют удлиненные формы, то понятие радиуса или диаметра уже не отображает истинного размера кластера. 

Другое важное свойство кластера - их локальность, отделимость. Оно характеризует степень перекрытия и взаимной удаленности кластеров друг от друга в многомерном пространстве. К примеру, рассмотрим распределение трех кластеров в пространстве новых, интегрированных признаков на приведенном ниже рисунке. Оси 1 и 2 были получены специальным методом из 12 признаков отражающих свойства разных форм эритроцитов, изучавшиеся с помощью электронной микроскопии.

Мы видим, что минимальный размер имеет кластер 1, а кластеры 2 и 3 имеют примерно равные размеры. В то же время, можно говорить о том, что минимальная плотность, а стало быть, и максимальная дисперсия расстояния, характерна для кластера 3. Кроме того, кластер 1 отделяется достаточно большими участками пустого пространства как от кластера 2, так и от кластера 3. Тогда как кластеры 2 и 3 частично перекрываются друг с другом. Представляет интерес и тот факт, что кластер 1 имеет гораздо большее различие от 2-го и 3-го кластеров по оси 1, нежели по оси 2. Напротив, кластеры 2 и 3 примерно одинаково различаются между собой как по оси 1, так и по оси 2. Очевидно, что для такого визуального анализа необходимо иметь все наблюдения выборки проецировать на специальные оси, подобные использованным нами, в которых проекции элементов кластеров будут видны как отдельные скопления. 

4. РАССТОЯНИЕ МЕЖДУ КЛАСТЕРАМИ 

В более широком смысле под объектами можно понимать не только исходные предметы исследования, представленные в матрице "объект-свойство" в виде отдельной строки, или отдельными точками в многомерном признаковом пространстве, но и отдельные группы таких точек, объединенные тем или иным алгоритмом в кластер. В этом случае возникает вопрос о том, каким образом понимать расстояние между такими скоплениями точек (кластерами) и как его вычислять. Отметим, что в этом случае разнообразных возможностей еще больше, нежели в случае вычисления расстояния между двумя наблюдениями в многомерном пространстве. Эта процедура осложняется тем, что в отличие от точек кластеры занимают определенный объем многомерного пространства и состоят из многих точек. Как, например, можно определить расстояние от Новосибирска до Академгородка, от Хабаровска до Владивостока, или от Москвы до Санкт-Петербурга? Можно принять за это расстояние протяженность прямой линии соединяющей главпочтамты этих городов. А можно измерить расстояние между главпочтамтами по автомобильной дороге или по железной дороге. Но эти методы не единственные из возможных. Учитывая протяженность самих объектов, можно понять, что эти расстояния будут различаться, если их измерять между ближними окраинами этих городов, или между дальними окраинами. Не лишено смысла и измерение расстояния между геометрическими центрами этих городов. Вопрос только в том, что при этом считать геометрическим центром города?

Аналогично этим вариантам в кластерном анализе широко используются межкластерные расстояния, вычисляемые по принципу ближайшего соседа (nearest neighbour) (расстояния между ближними домами двух городов), центра тяжести, дальнего соседа (furthest neighbour), медиан. Наиболее широко используются четыре метода: одиночной связи, полной связи, средней связи и метод Варда. Последний метод в ряде книга называется методом Уорда. В методе одиночной связи объект будет присоединен к уже существующему кластеру, если хотя бы один из элементов кластера имеет тот же уровень сходства, что и присоединяемый объект. Отсюда и название метода - одиночная или единственная связь. Для метода полных связей присоединение объекта к кластеру производится лишь в том случае, когда сходство между кандидатом на включение и любым из элементов кластера не меньше некоторого порога. Для метода средней связи имеется несколько модификаций, которые являются некоторым компромиссом между одиночной и полной связью. В них вычисляется среднее значение сходства кандидата на включение со всеми объектами существующего кластера. Присоединение производится в том случае, когда найденное среднее значение сходства достигает или превышает некоторый порог. Наиболее часто используют среднее арифметическое сходство между объектами кластера и кандидата на включение в кластер. 

Многие из методов кластеризации отличаются между собой тем, что их алгоритмы на каждом шаге вычисляют разнообразные функционалы качества разбиения. Такие экстремальные задачи позволяют определить тот количественный критерий, следуя которому можно было бы предпочесть одно разбиение другому. Под наилучшим разбиением понимает такое разбиение, на котором достигается экстремум (минимум или максимум) выбранного функционала качества. Выбор такого количественного показателя качества разбиения опирается подчас на эмпирические соображения. В качестве таких функционалов качества часто берутся "взвешенная" сумма внутриклассовых дисперсий расстояний, сумма попарных внутриклассовых расстояний между внутрикластерными элементами и т.д. Популярный метод Варда построен таким образом, чтобы оптимизировать минимальную дисперсию внутрикластерных расстояний. На первом шаге каждый кластер состоит из одного объекта, в силу чего внутрикластерная дисперсия расстояний равна 0. Объединяются по этому методу те объекты, которые дают минимальное приращение дисперсии, вследствие чего данный метод имеет тенденцию к порождению гиперсферических кластеров.


Краткий обзор методов

Примеры оформления базы данных, описания признаков и целей исследования, для статистического анализа в нашем НЦ БИОСТАТИСТИКА.
Пример 1
  Пример 2
Пример 3


Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35.

Камуфляжные мемы инфоценоза научных школ // Философия математики: актуальные проблемы. Материалы Международной научной конференции 15-16 июня 2007. Москва, Изд. Саван С. А., 2007. - с. 212-216. Леонов В.П.

Доклад "Почему и как надо учить медиков статистике?" Леонов В. П. Доклад на международной конференции по доказательной медицине  в Ереване 18-20.10.2012

Зачем нужна статистика в доказательной медицине?  В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193.

НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ   (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ).Леонов В.П. Вестник Томского государственного университета. Серия "Математика. Кибернетика. Информатика", №275. АПРЕЛЬ 2002, стр. 17-24. Cамая читаемая наша статья после отправки в мае м-це с.г. более 300 писем авторам статей мед. журналов о наличии в них примитивных и ошибочных методов статистического анализа, и получаемых при этом результатах...


ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ. ЧАСТЬ 1. ОПИСАНИЕ МЕТОДОВ СТАТИСТИЧЕСКОГО АНАЛИЗА В СТАТЬЯХ И ДИССЕРТАЦИЯХ. Международный журнал медицинской практики, 1998 г., вып. 4. В.П. Леонов, П.В. Ижевский

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.   ЧАСТЬ 2. ИСТОРИЯ БИОМЕТРИКИ И ЕЁ ПРИМЕНЕНИЯ В РОССИИ. Леонов В.П.

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.  ЧАСТЬ 3. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ  "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ". Леонов В.П.

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.
ЧАСТЬ 4. НАУКОМЕТРИЯ СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ
МЕЖДУНАРОДНЫЙ ЖУРНАЛ МЕДИЦИНСКОЙ ПРАКТИКИ, 2002 Г., ВЫП. 3.
.  Леонов В.П.


Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа

В.В. Половинкин.
ТОТАЛЬНАЯ МЕЗОРЕКТУМЭКТОМИЯ — ФАКТОР ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ЛЕЧЕНИЯ СРЕДНЕАМПУЛЯРНОГО И НИЖНЕАМПУЛЯРНОГО РАКА ПРЯМОЙ КИШКИ.

Н.Г. Веселовская. 
КЛИНИЧЕСКОЕ И ПРОГНОСТИЧЕСКОЕ ЗНАЧЕНИЕ ЭПИКАРДИАЛЬНОГО ОЖИРЕНИЯ У ПАЦИЕНТОВ ВЫСОКОГО СЕРДЕЧНО-СОСУДИСТОГО РИСКА.

О.Я. Васильцева.
ЗАКОНОМЕРНОСТИ ВОЗНИКНОВЕНИЯ, КЛИНИЧЕСКОГО ТЕЧЕНИЯ И ИСХОДОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ ПО ДАННЫМ ГОСПИТАЛЬНОГО РЕГИСТРА ПАТОЛОГИИ.

В.А. Габышев. 
ФИТОПЛАНКТОН КРУПНЫХ РЕК ЯКУТИИ И СОПРЕДЕЛЬНЫХ ТЕРРИТОРИЙ ВОСТОЧНОЙ СИБИРИ.

М.И. Антоненко.
  ГИПЕРКОРТИЦИЗМ БЕЗ СПЕЦИФИЧЕСКИХ КЛИНИЧЕСКИХ СИМПТОМОВ: ЭПИДЕМИОЛОГИЯ, КЛИНИКА, ДИАГНОСТИКА.

Н.Г. Веселовская
"ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ"


 105 музыки для души ...

Послушать и скачать...

После многочасовой работы с числами, статистическими процедурами и программами, можете прослушать и скачать 105 песен и музыки ...


В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Фоторепортаж с Конференции по доказательной медицине в Ереване.

Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине.

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.

Международная конференция по доказательной медицине в Ереване (18 - 20.10.2012)

В 2012 году исполнилось 10 лет со дня создания "Армянского медицинского реферативного журнала". В связи с этой датой главный редактор АМРЖ Рубен Ованесян организовал международную конференцию "Доказательная медицина в Армении: миф или реальность?". Конференция прошла в Ереване 18-20.10.2012. Ниже мы приводим материалы этой конференции
. Доклад "Почему и как надо учить медиков статистике?" В. Леонов.

Зачем нужна статистика в доказательной медицине?  В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193.


КУНСТКАМЕРА. Обзор большой коллекции медицинских статей и диссертаций с существенными ошибками и нелепыми использованиями и описаниями методов статистики.

Новый экспонат КУНСTКАМЕРЫ - Диссертация «Анализ полиморфизма генов сердечно-сосудистой системы и системы детоксикации в различных возрастных группах Санкт-Петербурга». Обсуждаемая диссертация являет собой ярчайший пример того, какую злую шутку может сыграть с автором игнорирование проблемы множественных сравнений при статистическом анализе полученных данных.

Новый экспонат КУНСTКАМЕРЫ - Диссертация "Оценка проаритмических факторов при постинфарктной систолической дисфункции миокарда и эффективности их фармакологической коррекции", Кемеровская государственная медицинская академия, Кемерово - 2004 г.

Новый экспонат КУНСTКАМЕРЫ - Диссертация "Сравнительная характеристика показателей кардиореспираторной системы спортсменов и лиц, не занимающихся спортом, в условиях северного промышленного города", Тюменский государственный университет, Тюмень - 2006 г.

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35.

Когда нельзя, но очень хочется, или Ещё раз о критерии Стьюдента.
К большому сожалению, в большинстве учебников, в которых рассматривается критерий Стьюдента, не акцентируется внимание читателей на ограничениях этого критерия, и на последствиях их нарушения. Вот как пишет об этом известный специалист в области прикладной статистики профессор А.И. Орлов в своей книге ЭКОНОМЕТРИКА (Издательство ЭКЗАМЕН, Москва, 2004. - 576 с.). "Приведённые описания экспериментальных данных показывают, что погрешности измерений в большинстве случаев имеют распределения, отличные от нормальных. Это означает, что большинство применений критерия Стьюдента, ... строго говоря, не является обоснованным, поскольку неверна лежащая в их основе аксиома нормальности распределений  соответствующих случайных величин. Именно Александр Иванович в своём письме от 4 апреля 1998 г. и обратил моё внимание на эту проблему


Логистическая регрессия в медицине и биологии. Леонов В.

В серии из 10 статей рассмотрены основы метода логистической регрессии. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных.

Введение.

1. Логистическая регрессия. Основные понятия и возможности метода.
2. Логистическая регрессия. Анализ массивов большой размерности.
3. Логистическая регрессия. Примеры анализа реальных данных.
4. Логистическая регрессия и ROC-анализ.
5.Особенности логистической регрессии в акушерстве.
6.Особенности логистической регрессии в психиатрии, психологии и социологии.
7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.
8. Логистическая регрессия  - "вершина пирамиды". А в "фундаменте" - что?
9. Как повысить качество логистической регрессии


Статистика в кардиологии. 15 лет спустя. Журнал "Медицинские технологии. Оценка и выбор", 2014, №1, с. 17-28. Леонов В.П.

Отзывы читателей обзора "Статистика в кардиологии. 15 лет спустя". В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним...


ВАК для учёных? или ВАК для… бумагомарак? «ТРОИЦКИЙ ВАРИАНТ» № 8 (127), 2013 год.

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.
ВВЕДЕНИЕДОКАЗАТЕЛЬНАЯ МЕДИЦИНА И СТАТИСТИКА.
КРАТКОСТЬ – СЕСТРА ТАЛАНТА? ИЛИ ПРИЗНАК НЕЗНАНИЯ?
ПРОЦЕНТЫ – ПРИМИТИВНО? ЗАТО ДОСТУПНО!

СТАТИСТИЧЕСКАЯ ВАМПУКИЗАЦИЯ,  ОНА ЖЕ ВСЕОБЩАЯ СТЬЮДЕНТИЗАЦИЯ
.
«ЛОШАДЕНДУС СВАЛЕНДУС С МОСТЕНДУС».
КАК ПРАВИЛЬНО: EXCEL ИЛИ EXEL, WINDOWS ИЛИ WINDOUS,
MICROSOFT ИЛИ MIKROSOFT, STATISTICA ИЛИ STATISTIKA?
 
ЗЕММЕЛЬВЕЙС И СТАТИСТИЧЕСКАЯ ТЕХНИКА БЕЗОПАСНОСТИ.
«ЗАЧЕМ НАМ КУЗНЕЦ? НАМ КУЗНЕЦ НЕ НУЖЕН». ПРИМЕРЫ ПОДРОБНОГО ОПИСАНИЯ.
КТО ВИНОВАТ?  ЧТО ДЕЛАТЬ?
ВМЕСТО ЗАКЛЮЧЕНИЯ.
Весь обзор одним файлом


Камчатская биометрика-2014. Семинар по биометрике в камчатском НИИ КамчатНИРО. (24.03.2014 - 3.04.2014).

Камчатская фото-биометрика-2014. Фоторепортаж с семинара по биометрике в Петропавловске-Камчатском.

Отзывы слушателей семинара по биометрике в Петропавловске-Камчатском

1997 - 2020.© Василий Леонов. E-mail:

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ