Яндекс.Метрика

Статистика в медицине и биологии

Каждый слышит то, что понимает. Гете


"Люди перестают мыслить,
когда перестают читать
".
Д. Дидро

Статистика посещаемости БИОМЕТРИКИ

Наш адрес:

Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...


Редактор БИОМЕТРИКИ
В. Леонов

Популярные страницы посещаемые читателями

http://www.biometrica.tomsk.ru/index.htm
http://www.biometrica.tomsk.ru/biostat_1.htm
http://www.biometrica.tomsk.ru/biostat_2.htm
http://www.biometrica.tomsk.ru/biostat_3.htm
http://www.biometrica.tomsk.ru/biostat_4.htm

http://www.biometrica.tomsk.ru/biostat_5.htm
http://www.biometrica.tomsk.ru/biostat_6.htm

http://www.biometrica.tomsk.ru/biostat_7.htm
http://www.biometrica.tomsk.ru/biostat_8.htm
http://www.biometrica.tomsk.ru/biostat_9.htm
http://www.biometrica.tomsk.ru/biostat_10.htm

http://www.biometrica.tomsk.ru/biostat_11.htm
http://www.biometrica.tomsk.ru/nauka_33.htm

http://www.biometrica.tomsk.ru/potencial.htm
http://www.biometrica.tomsk.ru/nauka_19.htm
http://www.biometrica.tomsk.ru/logit_0.htm
http://www.biometrica.tomsk.ru/stat_cardio_1998.htm
http://www.biometrica.tomsk.ru/erevan_3.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/error.htm
http://www.biometrica.tomsk.ru/leonov_vak.htm
http://www.biometrica.tomsk.ru/erevan_4.html
http://www.biometrica.tomsk.ru/student.htm
http://www.biometrica.tomsk.ru/stat_cardio1.htm
http://www.biometrica.tomsk.ru/biometrica_18.htm

Логистическая регрессия в медицине и биологии. В. Леонов

   В данной серии 10 статей , на уровне доступном для начинающих, рассмотрены цели и направления метода логистической регрессии. В частности, приводятся пояснения, какие надёжные результаты этого метода могут быть использованы для поставленных целей медицинских и биологических исследований. На примерах реальных медицинских массивов данных, поясняется специфика использования данного метода. Объяснено, что метод имеет много алгоритмов оценки уравнений логистической регрессии, что позволяет находить для использования во врачебной практике самые удобные и надёжные методы лечения. Рассмотрено использование метода к массивам данных, содержащим несколько сотен признаков разной природы. Показано, что корректное создание таких массивов, и их анализ, возможны лишь при участии биостатистиков на самых первых этапах таких исследований. Рассмотрена связь логистической регрессии и ROC-анализа. Приведены многочисленные уравнения логистической регрессии и ROC-кривые, полученные при анализе реальных данных. Объяснена целесообразность использования вместе с методом логистической регрессии набора методов анализа парных взаимосвязей между различными признаками, а также использование более сложных методов многомерной статистики. На странице "Примеры отличных результатов статистического анализа в диссертациях, дипломных работах и статьях, полученных с нашей помощью" приведено много диссертаций и статей, для авторов которых мы в НЦ БИОСТАТИСТИКА произвели продуктивные методы статистического анализа, включая и разные алгоритмы логистической регрессии.


Приглашаем читателей сайта принять участие в конкурсе входа в список исследователей, для которых НЦ БИОСТАТИСТИКА произведёт оперативно и бесплатно статистический анализ их баз данных. Для чего исследователю нужно выслать нам согласно Пример 1  Пример 2   Пример 3 свои базы данных с описанием признаков и целей исследования. Выбор исследователей с оперативным  бесплатным проведением статистического анализа их баз данных, будет произведён после набора 21 исследователя.


 

Введение. 

       Эта вводная статья, с доступным описанием возможностей логистической регрессии, написана через пару лет после создания серии из 9 статей по этому методу. Данные статьи являются самыми посещаемыми читателями сайта БИОМЕТРИКА. При этом по ним приходит немало вопросов как от читателей этой серии статей, так и от многих заказчиков, которые получают результаты логистической регрессии при анализе их массивов данных. Именно поэтому было решено написать ещё одну вводную статью об этом методе. В которой без описания основ его теории, рассказать об основных возможностях использования метода логит-регрессии в биомедицинских исследованиях. А также использования этого метода статистического анализа в психологии, экономике, геологии, социологии, почвоведении, гидрологии, и т.д. Метод логистической регрессии всё активнее вводится в практику мировой медицинской науки, являясь примерами продуктивных исследований в доказательной медицине. Это объясняется наличием следующих основных возможностей данного метода.

........

В наших статьях "Проценты - статистический анализ? Или проценты - арифметический анализ?" и "Сравниваем средние, а также и ... " достаточно подробно описаны методы оценки количества всех пар признаков, для которых можно (и нужно!) производить анализ наличия/отсутствия и направленности причинно-следственной взаимосвязи.  Например, для 5 признаков VAR1, VAR2, VAR3, VAR4, VAR5 имеется 10 парных взаимосвязей, показанные ниже на рисунке.

Это следующие 10 парных зависимостей: VAR1-VAR2; VAR1-VAR3; VAR1-VAR4; VAR1-VAR5; VAR2-VAR3; VAR2-VAR4; VAR2-VAR5; VAR3-VAR4; VAR3-VAR5; VAR4-VAR5.

В общем случае при наличии V признаков, количество таких парных зависимостей будет равно числу сочетаний (неупорядоченных комбинаций) из V по 2:

Так при значении V=5 получаем, Z = 5! / ((5-2)!*2!) = 5*4*3*2*1 / (3!*2!) = 5*4*3*2*1 / (3*2*1*2*1) = 20/2=10.

......

Таблица 3

В данной таблице показано, что третье уравнение также было получено при анализе 281 наблюдения. При этом из 103 наблюдений 1-й группы уравнение отнесло в эту же группу 101 наблюдение, из 87 наблюдений 2-й группы - 86 наблюдений, и из 91 наблюдения 3-й группы - 90 наблюдений. Общее количество наблюдений, отнесённых уравнением логит-регрессии в иные группы, равно 2+1+1=4. Значит доля неверно отнесённых наблюдений равно 4 / 281 = 1,4% . По сравнению с уравнением по таблице 2, в уравнение по таблице 3 также было введено в 2 раза больше признаков-предикторов.

....

(далее ...)


1. Логистическая регрессия. Основные понятия и возможности метода.

    Данная статья посвящена методу логистической регрессии и особенностям его применения в медицине и смежных науках. Теория логистической регрессии достаточно сложна, поэтому мы рассмотрели ниже лишь основные понятия этого метода, а также привели небольшой обзор решений, полученных автором в последнее время при анализе реальных данных. Статья  имеет  3 основных цели. Во-первых, познакомить с основными понятиями и возможностями данного метода. Во-вторых, рассмотреть специфику подхода к постановке и решению таких задач, которые могут быть решены с помошью этого метода. В-третьих, продемонстрировать на примере анализа реальных массивов данных типичные результаты, получаемые при использовании этого метода.

.....

В разделе «ДОКАЗАТЕЛЬНАЯ МЕДИЦИНА И СТАТИСТИКА»  (http://www.biometrica.tomsk.ru/kuzbass2.htm ) нашего обзора «Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты» мы уже частично касались возможностей данного метода. Большинство используемых на практике статистических методов можно рассматривать как способы оценки статистической взаимосвязи между двумя или более признаками, переменными. Например, при сравнении средних значений одного количественного признака двух или более групп пациентов (контроль, больные и т.п.), мы изучаем статистическую взаимосвязь между одним группирующим признаком, и одним количественным признаком. В том случае, когда такая взаимосвязь оказывается статистически значимой, возможно оценить также и силу, интенсивность этой связи. Для этого могут быть использованы различные показатели интенсивности такой связи. Как правило, такие показатели имеют значения в интервале от 0 до 1.

....

Рассмотрим набор данных, в котором зависимой переменной будет бинарный признак «Исход лечения» с градациями «1=выздоровление», и «2=пациент умер».  Обозначим вероятность выздоровления пациента как «р». Поскольку сумма вероятностей этих двух исходов должна равняться 1, то вероятность летального исхода равна «1- р».

(далее ...)


2. Логистическая регрессия. Анализ массивов большой размерности.

В данной серии статей, на уровне доступном для начинающих, рассмотрены цели и направления метода логистической регрессии. В частности, приводятся пояснения, какие надёжные результаты этого метода могут быть использованы для поставленных целей медицинских и биологических исследований. На примерах реальных медицинских массивов данных, поясняется специфика использования данного метода. Объяснено, что метод имеет много алгоритмов оценки уравнений логистической регрессии, что позволяет назходить для использования во врачебной практике самые удобные и надёжные методы лечения. Рассмотрено использование метода к массивам данных, содержащим несколько сотен признаков разной природы. Показано, что корректное создание таких массивов, и их анализ, возможны лишь при участии биостатистиков на самых первых этапах таких исследований. Рассмотрена связь логистической регрессии и ROC-анализа. Приведены многочисленные уравнения логистической регрессии и ROC-кривые, полученные при анализе реальных данных. Объяснена целесообразность использования вместе с методом логистической регрессии набора методов анализа парных взаимосвязей между различными признаками, а также использование более сложных методов многомерной статистики.

Наиболее интересны, и в то же время наиболее сложны и трудоёмки, оценки уравнений логистической регрессии для массивов большой размерности, т.е. для данных, содержащих по несколько сотен переменных. С двумя примерами анализа таких объёмных матриц можно познакомиться в статьях «Логистическая регрессия в анализе связи артериальной гипертонии и психических расстройств». Н.П.Гарганеева, В.П.Леонов. Сибирский медицинский журнал, № 3-4, 2001, с.42-48.  (http://www.biometrica.tomsk.ru/lib/psycho3.htm ) и «Артериальная гипертония как психосоматическая проблема». Н.П. Гарганеева, Ф.Ф. Тетенев, В.Я. Семке, В.П. Леонов. Клиническая медицина, № 1, 2004, с. 35-41 (http://www.biometrica.tomsk.ru/lib/psycho2.htm ). Рассмотрим несколько таких массивов и обсудим специфику работы с ними. Первый массив, созданный Евдокимовой Т.А. при изучении аллергии, содержит более 1200 наблюдений и более 400 признаков. Ниже приведён перечень этих признаков.

....

Рис. 1 Схема парных связей между предикторами и зависимой переменной

 

 

На рис. 1 стрелками представлены возможные парные связи между этими признаками. Число парных связей внутри 1-го уровня равно
[4*(4-1)/2]=6. Число парных связей внутри 2-го уровня равно [3*(3-1)/2]=3. Число парных связей между 1 и 2 уровнями равно 4*3=12. И число парных связей между зависимой переменной Z и предикторами 1 и 2 уровней равно соответственно 4 и 3.

Итого мы имеем 28 парных связей. Эту же самую оценку можно получить и иным способом: 8*(8-1)/2= 28, (где 8 – общее число анализируемых признаков). Несложно аналогичным образом подсчитать число тройных связей, в каждой из которых обязательно должен присутствовать зависимый признак Z.

....

(далее ...)


3. Логистическая регрессия. Примеры анализа реальных данных.

Для иллюстрации возможностей использования метода логистической регрессии ниже приведём описания небольшого набора наиболее интересных реальных массивов и полученных при этом результатов.   Массив VERA, созданный кардиологом В.В. К., содержал в себе  более 90 признаков. Вот эти признаки:  NUMBER="Номер наблюдения" , GRUPPA="Группа" , VAR2A="Пол" , VAR3="Возраст" , ........,

VAR4913="VAR49/VAR13" , VAR4950="VAR49-(VAR50/VAR49" .

Программа работы по данному массиву содержала в себе более 50 пунктов, среди которых несколько пунктов были посвящены анализу взаимосвязи ряда дискретных признаков с наборами предикторов методом логистической регрессии. Среди этих задач в качестве зависимых признаков выступали такие показатели, как VAR47A="Расширение аорты",  VAR60A="Трикуспидальная регургитация степень" и VAR61A="Аортальная регургитация степень", имеющие по 2-3 градации. В процессе анализа этих данных было получено порядка 50 статистически значимых уравнений, в которых показатели конкордации находились в интервал 88 – 97,9%.

....

Следующий массив, созданный Е.К. (г. Сургут) при изучении метаболического синдрома у женщин в менопаузе, состоял из 248 наблюдений и включал в себя 71 признак, которые приведены ниже.

NUMBER="Номер наблюдения"

GRUPPA="Группа пациентов"

....

VAR21="ХС исходно"

VAR22="ХС через 3 г "

VAR23="ТГ исходно"

....

VAR42="Индекс Homo через 3 г "

....

VAR67="тромбоциты через 3 г "

Зависимым признаком выступал показатель GR="Состояние здоровья пациентов", имеющий 2 уровня: 1="Здоровые", 2="Больные". Ниже приведена одна из оценок уравнения логит-регрессии, которая обеспечивала показатель конкордации равный 99,4%.

 

....

(далее ...)


4. Логистическая регрессия и ROC-анализ.

Как уже говорилось выше, логистической регрессии имманентно присуща поливариантность решений. Она позволяет исследователю отобрать те решения, которые наиболее интересны высокими значениями показателя конкордации, а также возможностью убедительной интерпретации и практического использования. Не менее важным достоинством такой поливариантности решений является возможность использования всех этих решений в ROC-анализе. (см. нашу статью «Основные понятия ROC. URL: http://www.biometrica.tomsk.ru/ROC-analysis.pdf ) Напомним, что ROC-кривая (Receiver Operator Characteristic), называемая также ещё операционной  характеристикой приёмника, пришла в медицину из радиолокации, где она использовалась как инструмент при обработке сигналов. Наиболее разработан данный анализ для случая бинарной классификации. Хотя в настоящее время уже есть работы для классификации с тремя исходами.

....

Во втором уравнении в качестве предикторов используются уже 8 признаков. Данное уравнение обеспечивало показатель конкордации равный 100%. Ниже приведён рис. 4 с ROC-кривыми для второго уравнения. Показатель AUC для конечной модели в этом случае равен 1.


Рис. 4. ROC-кривые для 8 шагов отбора предикторов

....

(далее ...)


5. Особенности логистической регрессии в акушерстве.

В этом, и следующем разделе нашей статьи, мы остановимся на специфике использования метода логистической регрессии в двух отдельных направлениях научных исследований. Поводом к написанию этих двух разделов послужила переписка с двумя исследователями. Один из них работает акушером, а второй - психиатром. На примере этих двух работ мы и рассмотрим некоторые специфичные детали использования метода логистической регрессии в данных отраслях медицины.

Исследователь Н.Г. собрал уникальную базу данных по роженицам, содержащую около 2000 наблюдений и порядка 70 признаков. Ниже приведена таблица, содержащая набор основных переменных, использованных в анализе.

....

Рассматривая 2 группы признаков, качественных и количественных, получим 3 вида таких парных взаимосвязей: "Качественный" - "Качественный", "Качественный" - "Количественный" и "Количественный" - "Количественный". В первом случае для 60 качественных признаков имеем общее число парных взаимосвязей равное 60*(60-1)/2=30*59=1770. Отметим, что при изучении этих 1770 парных взаимосвязей с помощью анализа таблиц сопряжённости, важно получить не только ответ на вопрос "Если ли между двумя качественными признаками статистически значимая взаимосвязь?", но также и проанализировать детали таких статистически значимых связей

(далее ...)

 

6. Особенности логистической регрессии в психиатрии, психологии и социологии.

Сложность использования метода логистической регрессии, как и многих других статистических методов, в психиатрии и психологии во многом определяется спецификой анализируемых данных. В медицине и биологии в большинстве случаев используются количественные и качественные признаки, которые по своему содержанию таковыми и являются. Многие из количественных признаков имеют эталоны для используемых шкал. Например, есть эталоны массы, длины и т.д. Значения других количественных признаков получаются путём вычислений, с использованием величин, измеряемых в шкалах обладающих эталонами. Однако во всех случаях для таких величин, измеряемых в абсолютных шкалах, в шкалах отношений или в интервальных шкалах, допустимы не только отношения "Равно - Не равно" и "Больше - Меньше", но также и операции сложения, вычитания, умножения и деления.

....

Основоположником применения статистики в психологии, создателем психометрии, считается основатель биометрики Френсис Гальтон. В 1890 г. один из основателей психологической науки и психометрических шкал, Кеттел Джеймс Маккин написал книгу "Mental Test and Measurements". В послесловии к этой книге основоположник науки БИОМЕТРИИ Френсис Гальтон написал следующее: "Психология не может стать прочной и точной, как физические науки, если не будет основываться на эксперименте и измерении".

.....

При этом обращаем внимание читателей на главу 2 "Адекватность", и, в частности, на разделы 2.4. "Адекватная статистика" и 2.5. "Примеры адекватных и неадекватных статистик". Ниже приводим фрагмент текста данного раздела со стр. 43:

Т.е. порядковых шкалах нельзя выполнять операции сложения, вычитания, умножения и деления. Эти же проблемы подробно обсуждаются в книгах...

....

(далее ...)


7. Пример использования логистической регрессии для расчёта прогноза исхода оперативного лечения.

    Целью исследования было выявления факторов риска для определения прогноза развития неблагоприятных исходов хирургического лечения травматических повреждений поджелудочной железы. Какие из этих факторов позволяют определить прогноз развития послеоперационных осложнений и летальности после операций по поводу травмы поджелудочной железы, остаётся до конца не выясненным. В работе проводится анализ 35 количественных и 115 качественных признаков. База данных основана на 202 наблюдениях. Для каждого случая травматического повреждения поджелудочной железы учитывались следующие наборы признаков, из которой формировалась база данных (БД): 1) демографические данные; 2) вид, механизм и давность повреждений; 3) степень тяжести состояния пациента; 4) степень тяжести повреждений; 5) количество повреждённых органов; 6) объём кровопотери; 7) способ хирургического лечения; 8) осложнения; 9) летальность; 10) данные лабораторного исследования при поступлении и в динамике послеоперационного периода (ферменты поджелудочной железы, глюкоза, лейкоцитоз, ЛИИ и др.), и многие другие.  Оценку тяжести состояния больных и степени тяжести повреждений проводили по шкале комы Глазго (GCS), шкалам  APACHE II и  SAPS II, физиологическому показателю тяжести травмы (RTS), анатомическому показателю тяжести травмы NISS, шкале повреждений AIS, шкале комплексной оценки тяжести состояния «ВПХ–СП» и шкале оценки тяжести повреждений «ВПХ–П».

....

Например, для выяснения факторов риска развития послеоперационных осложнений было получено около 100 уравнений. Ниже приведены три из полученных уравнений.

Первое уравнение:

Процент конкордации уравнения равен 97,5%. В это уравнение вошли 4 предиктора. Два из них управляемые – это продолжительность операции и тактические ошибки. При этом наибольшие значения стандартизованные коэффициенты имеют у признаков VAR41A и VAR74A. Однако недостатком этого уравнения является наличие у признаков VAR41A и VAR44A пропущенных значений в большом количестве наблюдений. Кроме того, в этом уравнении отсутствуют признаки, определяющие исходное состояние пациента, но его можно использовать для оценки прогноза в динамике, например в 1 сутки послеоперационного периода.

....

(далее ...)

8. Логистическая регрессия - "вершина пирамиды". А в "фундаменте" - что?

Статистика вербальная и статистика математическая.
"Вершина" и "фундамент".
"Мойте руки перед едой".
Много измерений - много уравнений. Мало измерений - ещё больше уравнений.
Упрощаем и усложняем предикторы.
Цель определяет средства.
Заключение.
Литература.

Любое ЗНАНИЕ содержит в себе результат концентрации опытных ДАННЫХ. Например, обучаясь в медуниверситете, студент получает знания о методиках диагностирования заболеваний и их лечении. Все эти методики представлены в словесном (вербальном) формате, и концентрируют в себе результаты работы с больными пациентами (опытные данные). В том числе содержат информацию об использовании фармпрепаратов, операционных вмешательствах, методах терапии, и т.д. Фактически эти методики есть словесные алгоритмы увеличения вероятности достижения благоприятных исходов лечения (не летальный исход, возврат организма пациента в здоровое состояние, и т.п.). Однако такие вербальные алгоритмы не имеют возможности оценки числовых значений вероятности этих благоприятных исходов. При этом в самих методиках используются количественные показатели (дозы лекарственных препаратов, длительность и интенсивность лечебных процедур, значения показателей полученных при анализе крови, мочи, ЭКГ, и т.д.). Вместе с этими показателями используются во всех методиках и качественные показатели. Например, пол, генотип, тип инфекции во время беременности, наличие эндемического зоба, форма комплекса QRS, и т.д. Именно сочетание различных видов информации о пациенте, а также информации о самом лечении, и позволяют медику определять возможность благоприятного исхода лечения.

....

Рассмотрим наиболее простой вариант оценки уравнения логистической регрессии для случая двух альтернативных исходов. То есть оценка уравнения производится с использованием выборки наблюдений по двум сравниваемым группам. При этом с помощью полученного уравнения оценивается вероятность благоприятного исхода (выздоровление пациента). Поскольку рассматриваются только 2 исхода, то сумма вероятностей этих двух исходов равна 1. Обозначим через P1 вероятность первого исхода - выздоровления. Тогда вероятность второго альтернативного исхода P2 =1- P1. Напомним, что вероятность  P1 для конкретного пациента вычисляется с помощью следующего выражения:

      (1),

где величина BETA вычисляется с помощью полученного уравнения логистической регрессии: 

,       (2)

....

Используя модель логистической регрессии следует обязательно вначале сформулировать цель получения такой модели. Такая цель всегда имеет как минимум 2 уровня. На первом уровне устанавливается сама структура модели - состав отдельных элементов, интенсивность и направленность связей этих элементов, надёжность и точность модели, и т.п. Второй уровень содержит оценку возможностей продуктивного использования модели для достижения конкретных, практических целей. Например, использования уравнения логистической регрессии для повышения вероятности благоприятного исхода лечения. Получаемые наборы моделей образно можно представить в виде сети, или некой паутины. В этих сетях узел можно представить как связующее звено. А сетевые нити как отдельные признаки, переменные. Представим полученное уравнение логит-регрессии в следующем виде:

   Как видно из этой схемы величина вероятности "Р" определяется параметром

,

который, в свою очередь, определяется слагаемыми. А величины слагаемых определяются значениями сомножителей.

....

(далее ...)


9. Как повысить качество уравнений логистической регрессии.

     В предыдущей нашей статье "Логистическая регрессия - "вершина пирамиды". А в "фундаменте" - что? " речь шла о тех методах статистического анализа, которые позволяют более результативно и осмысленно интерпретировать получаемые уравнения логистической регрессии. Целью настоящей статьи является объяснение мотивов предварительного использования некоторых методов анализа, которые позволяют существенно улучшить качество получаемых уравнений логистической регрессии.

В восьми предыдущих статьях о логистической регрессии мы объясняли основную цель использования этого метода. Напомним, что доминирующий в медицинских публикациях критерий Стьюдента, который был предложен более 100 лет тому назад, позволяет лишь сравнивать две групповые средние. Например, образно выражаясь, сравнить средние температуры больных и здоровых пациентов. Либо средние систолические давления больных и здоровых пациентов, и т.п. Если в этих двух группах сравнения фиксируется, например, 20 количественных признаков (вес, рост, возраст, результаты анализа крови, и т.д.), то с помощью критерия Стьюдента авторы могут проверить гипотезы равенста средних значений отдельно для каждого из этих 20 признаков. Однако при этом следует помнить, что одновременно два ограничения для корректного использования этого критерия выполняются крайне редко, в нескольких процентах случаев. Поэтому чаще всего выводы, получаемые в результате использования критерия Стьюдента, весьма сомнительны. В результате авторы исследований дезинформируют не только себя, но и своих читателей, в том числе и врачей, тем самым отрицательно влияя на здоровье больных пациентов, которых лечат читатели-врачи. По сути подобное доминирование некорректного использования критерия Стьюдента является СТАТИСТИЧЕСКОЙ ВАМПУКИЗАЦИЕЙ со стороны авторов.

....

Ниже приведена таблица со значениями вкладов отдельных клеток, строк и столбцов в установленную взаимосвязь двух группировок. Значения приведены в процентах; в последнем столбце приведены суммы вкладов по строкам, а в самой нижней строке приведена сумма вкладов по столбцам.

Другое важное отличие последнего варианта уравнения логистической регрессии от первичного заключается в том, что в нём дисперсия модулей стандартизованных коэффициентов предикторов была примерно в 4 раза больше, чем в первом варианте уравнения. То есть существенно увеличились чувствительности взаимосвязи включённых в уравнение предикторов. А это означает возможность выделения предикторов, в полученном уравнении, наиболее сильно влияющих на изменение параметра beta, а значит, и на изменение вероятности перевода наблюдения (пациента) из подгруппы до приёма фармпрепарата в подгруппу после приёма, или в контрольную подгруппу здоровых.

(далее ...)


Основатели биометрики
Francis Galton
Френсис Гальтон
(16.02.1822-17.01.1911)

Вальтер Уэлдон
Вальтер Уэлдон
(15.03.1860-13.04.1906)

Карл Пирсон
Карл Пирсон
(27.03.1857-27.04.1936)

Оптимизировано для разрешения 1024х768 в Mozilla Firefox, Opera.

Примеры оформления заказчиками базы данных, описания признаков и целей статистического анализа этой базы данных

Островок  здоровья

Пример 1,   Пример 2,   Пример 3


  Центр БИОСТАТИСТИКА
выполняет статистический анализ экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Нашими услугами пользуются аспиранты и докторанты по медицине, биологии, социологии, психологии и т.д. (См. далее )


Отзывы исследователей по
статистическому анализу
данных


У моего отца, Леонова Петра Андреевича, на войне погибли 4 родных брата. Старший его брат Иван, родился в 1902 г. в Донбассе, в селе Сергеево Красноармейского района... 

Интересная ссылка






К 95-летию образования Союза Советских Социалистических Республик
... 
30 декабря 2017 года всё прогрессивное человечество отмечало 95-летие со дня образования великой державы — Союза Советских Социалистических Республик. Ещё на заре Советской власти её ярый и ненавистный враг У. Черчилль говорил: «Этого младенца надо уничтожить ещё в колыбели». И силы, враждебные социализму и его непосредственному носителю — трудовому народу, начиная с внутренней контрреволюции до внешних врагов, не раз пытались задушить первое в мире социалистическое государство. Но оно оказалось не только жизнеспособным, но и созидательным... 

В. Леонов. Применение методов статистики в кардиологии (по материалам журнала "Кардиология" за 1993-1995 гг.).     Журнал "Кардиология", 1998, № 1 

В. Леонов. Статистика в кардиологии. 15 лет спустя. В ноябре 2013 г. был опубликован наш обзор "Статистика в кардиологии. 15 лет спустя". За прошедшие полгода более 20 читателей этого обзора прислали нам свои отзывы по нему. Далее приведены фрагменты из двух отзывов, и наши комментарии к ним.

Камчатская биометрика-2014. Семинар по биометрике в камчатском НИИ КамчатНИРО. (24.03.2014 - 3.04.2014).

Камчатская фото-биометрика-2014. Фоторепортаж с семинара по биометрике в Петропавловске-Камчатском.

Отзывы слушателей семинара по биометрике в Петропавловске-Камчатском


Долгое прощание
с
лысенковщиной 

История науки не ограничивается перечислением успешных исследований. Она должна сказать нам о безуспешных исследованиях и объяснить, почему некоторые из самых способных людей не могли найти ключа знания, и как репутация других дала лишь большую опору ошибкам, в которые они впали.

Дж. Максвелл 

Функциональный кризис отечественной науки, переживаемый в последнее десятилетие, вынуждает беспристрастно анализировать основные причины этого явления [1-2, 45-47]. Последние результаты библиометрического анализа говорят о том, что вклад России в мировую науку по основным направлениям составляет уже порядка 5-8% [1-2]. По данным того же источника вклад США составляет 32-41%. 

Коммунистическая идеология, уродовавшая многие направления отечественной науки на потребу вождей, породила и такое явление, как лысенковщина. Для большинства читателей фамилия Лысенко ассоциируется с августовской сессией ВАСХНИЛ 1948 г. и разгромом генетики. Однако лысенковщину нельзя сводить только к запрету на генетику. Достигнув своего апогея в середине текущего века, и став воистину периодом средневековья в отечественной биологии и медицине, лысенковщина изуродовала и методологию этих наук, изгнав из них в частности математику, и в первую очередь статистику. Последствия этого уродства и по сей день не позволяют биологии и медицине приблизиться к статусу точных наук. В статье описаны основные этапы этого явления и особенности методологии применения статистики в биологии и медицине, полученные автором при анализе нескольких сот диссертаций и монографий а также более 1500 статей в области экспериментальной биомедицины. 


Автор понимает, что поднятая им проблема достаточно обширна и не может быть полностью освещена в одной статье, содержащей лишь малую часть материалов готовящейся к изданию монографии, посвященной проблемам применения статистики в медицине и биологии. Автор будет признателен читателям, которые выскажут свой взгляд на эту проблему, а также смогут дополнить авторские материалы новыми примерами.  Обсуждаемая в данной статье проблема может быть решена только общими усилиями всех заинтересованных в этом специалистов.

Работая над этой статьей, мне довелось несколько раз встречаться с одним из ректоров медицинского вуза. Обсуждая с ним предлагаемые в статье меры, направленные на исправление этого неприглядного положения, я с изумлением услышал от него такой ответ: "Как ученый - я "За", а как ректор - "Против"! И если так мыслит и говорит ректор, доктор медицинских наук, член-корреспондент РАМН, то несложно понять отношение к этой проблеме рядовых сотрудников такого вуза. Не потому ли многие из них представлены в разделе КУНСТКАМЕРА, вместе с моим собеседником, своими диссертациями и статьями...

За те несколько лет, что прошли с момента публикации этой статьи, а также статей  "В новый век - с доказательной биомедициной" (ПОИСК, N 20 (522) 21 мая 1999) и "Куплю 500 диссертаций! (Медицинская Газета N10 за 14.02.2001)", практически ничего не изменилось. Да, в России стали писать и говорить о доказательной медицине, проводить конференции по этой тематике, а в некоторых медицинских вузах даже открыли центры доказательной медицины. Однако откроем биомедицинские журналы и диссертации, и станет ясно, что это не более чем дань моде... 

В.В. Фадеев. Представление данных в оригинальных работах и их статистическая обработка.
Проблемы эндокринологии – 2002 - Т. 48, N 3. – С. 47 – 48.

Балацкий Е.В. Диссертационная ловушка


Авторский ресурс Зорина Н.А.


После взрыва на СХК в 1993г. в Томске и Северске увеличилась частота рождения детей с пороками развития

ПРИКЛАДНАЯ СТАТИСТИКА XXI ВЕКА.


 Музыка для души ...

Когда после многочасовой работы с числами, статистическими процедурами, программами для статистического анализа и т.д., в глазах начинают ...


Водянова О.В., аспирант Белорусской медицинской академии последипломного образования, г. Минск. Я открыла для себя удивительные возможности логистической регрессии. Поставленная мной задача была решена оперативно...

НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ   (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ). В.П.Леонов.Cамая читаемая наша статья после отправки в мае м-це с.г. более 300 писем авторам статей мед. журналов о наличии в них примитивных и ошибочных методов статистического анализа, и получаемых при этом результатах...

Очередная диссертация нашего заказчика.
Петрикеева Л.В. ПОКАЗАТЕЛИ ГОМЕОСТАЗА ЛОШАДЕЙ ЧИСТОКРОВНОЙ АРАБСКОЙ ПОРОДЫ В ПЕРИОД ИППОДРОМНЫХ ИСПЫТАНИЙ. Специальность: 03.03.01 - физиология. Диссертация на соискание учёной степени кандидата биологических наук.

Сравниваем средние, а также и ... В. Леонов

Проценты - статистический анализ? Или проценты - арифметический анализ?
В. Леонов
.

Мотивом к написанию данной статьи стал следующий инцидент. 11 апреля 2016 г. я получил вот какое письмо.

Уважаемый Василий Петрович!

Я являюсь одним из читателей Вашего сайта "Биометрика", который нашёл по ссылке, размещённой на странице http://bono-esse.ru/blizzard/ais.html C большим интересом ознакомившись, в частности, с разделом "Кунсткамера", обращаюсь к Вам с несколько необычным вопросом по независимому, неформальному рецензированию работы ....

P.S. Сайт дополнен PDF-файлом полной версии данной статьи.


НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ  (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ). В.П.Леонов. Вестник Томского государственного университета. Серия "Математика. Кибернетика. Информатика". №275. АПРЕЛЬ 2002, стр. 17-24.

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ МЕДИКОВ И БИОЛОГОВ (время и опыт).
Леонов В.


ВАК для учёных? или ВАК для… бумагомарак? «ТРОИЦКИЙ ВАРИАНТ» № 8 (127), 2013 год. К середине 2017 года статью прочитали более 50 тысяч читателей. 
"Плагиат, обнаруживаемый в диссертациях, это «пена» диссертационного бизнеса. Поскольку в производстве диссертаций «под заказ» гораздо легче просто копировать фрагменты одних диссертаций, вставляя их в очередные заказные диссертации. Производители такого «товара» фабрикуют не только диссертации, но и массу журнальных статей. Основные причины появления этого бизнеса описал профессор Е.В. Балацкий ещё в 2005 г. [1-2], изложив и сценарии его ликвидации. Одной из ключевых причин рождения этого бизнеса являются изменения в Положениях ВАК".


Статистика - это что?
Статистика - нужна зачем?
Статьи читаем - зачем?
Статьи пишем - зачем?

Краткая версия лекции для слушателей-медиков в Ереване, прочитанной в 2014 году по Скайпу.


«Роющая деятельность кабана». Статья в "Независимой" газете...

В.В. Фадеев. Представление данных в оригинальных работах и их статистическая обработка.



Доказательная или сомнительная?
Медицинская наука Кузбасса: статистические аспекты.
ВВЕДЕНИЕ
ДОКАЗАТЕЛЬНАЯ МЕДИЦИНА И СТАТИСТИКА
.
КРАТКОСТЬ – СЕСТРА ТАЛАНТА? ИЛИ ПРИЗНАК НЕЗНАНИЯ?
ПРОЦЕНТЫ – ПРИМИТИВНО? ЗАТО ДОСТУПНО!

СТАТИСТИЧЕСКАЯ ВАМПУКИЗАЦИЯ,  ОНА ЖЕ ВСЕОБЩАЯ СТЬЮДЕНТИЗАЦИЯ
.
«ЛОШАДЕНДУС СВАЛЕНДУС С МОСТЕНДУС».
КАК ПРАВИЛЬНО: EXCEL ИЛИ EXEL, WINDOWS ИЛИ WINDOUS,
MICROSOFT ИЛИ MIKROSOFT, STATISTICA ИЛИ STATISTIKA?
 
ЗЕММЕЛЬВЕЙС И СТАТИСТИЧЕСКАЯ ТЕХНИКА БЕЗОПАСНОСТИ.
«ЗАЧЕМ НАМ КУЗНЕЦ? НАМ КУЗНЕЦ НЕ НУЖЕН». ПРИМЕРЫ ПОДРОБНОГО ОПИСАНИЯ.
КТО ВИНОВАТ?  ЧТО ДЕЛАТЬ?
ВМЕСТО ЗАКЛЮЧЕНИЯ.
Весь обзор одним файлом


Примеры отличных результатов статистического анализа в диссертациях, дипломных работах и статьях полученных с нашей помощью.

Д.С. Симанков. Применение метода логистической регрессии для факторов риска, влияющих на исход операции в условиях искусственного кровообращения. (статья)

О.Я. Васильцева. Закономерности возникновения, клинического течения и исходов тромбоэмболии легочной артерии по данным госпитального регистра патологии.  (диссертация на соискание учёной степени доктора медицинских наук)

О.Я. Васильцева, И.Н. Ворожцова. Госпитальная тромбоэмболия правых отделов сердца. Журнал "Кардиология", №6, 2013, с. 46-50.

В.В. Половинкин. Тотальная мезоректумэктомия — фактор повышения эффективности лечения среднеампулярного и нижнеампулярного рака прямой кишки.  (диссертация на соискание учёной степени доктора медицинских наук)

Н.Г. Веселовская.  Клиническое и прогностическое значение эпикардиального ожирения у пациентов высокого сердечно-сосудистого риска.  (диссертация на соискание учёной степени доктора медицинских наук)

В.А. Габышев.  Фитопланктон крупных рек Якутии и сопредельных территорий восточной Сибири.  (диссертация на соискание учёной степени доктора биологических наук)

М.И. АнтоненкоГиперкортицизм без специфических клинических симптомов:
эпидемиология, клиника, диагностика
.  (диссертация на соискание учёной степени кандидата медицинских наук)

Н.Г. Веселовская. Прогнозирование риска рестеноза коронарных артерий после их стентирования у пациентов с ожирением. (статья)

Будникова М.А. Анализ динамики частоты и спектра аномалий митоза, мейоза и элементов продуктивности allium cepa l., взятого из агропопуляций с разной антропогенной нагрузкой ( Дипломная работа )

Попова Г.А. Сравнительное изучение подвидов LINUM USITATISSIMUM L . в условиях Западной  Сибири (диссертация на соискание учёной степени кандидата биологических наук).

А.Г. Сыркина. Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук).

Сутурина Л.В. Гипоталамический синдром: основные звенья патогенеза, диагностика, патогенетическая терапия и прогноз (диссертации на соискание учёной степени доктора медицинских наук)


В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

Чтобы не допускать ошибок в использовании и описании статистики в статьях и диссертациях, следует прочитать материалы представленные в КУНСТКАМЕРЕ - коллекции диссертаций и статей по медицине и биологии, с набором статистических ошибок и нелепостей.

Экспозиция 1  Экспозиция 2  Экспозиция 3 
Экспозиция 4  Экспозиция 5  Экспозиция 6 
Экспозиция 7  Экспозиция 8   Экспозиция 9
Экспозиция 10  Экспозиция 11  Экспозиция 12
Экспозиция 13  Экспозиция 14  Экспозиция 15
Экспозиция 16  Экспозиция 17  


Статистика в кардиологии. 15 лет спустя. Журнал "Медицинские технологии. Оценка и выбор", 2014, №1, с. 17-28. Леонов В.П.


Хорошая книга:

Д. Химмельблау. Анализ процессов статистическими методами.

В.С.Степин, В.Г.Горохов, М.А.Розов. Философия науки и техники

 

Наш адрес

1997 - 2019. © Василий Леонов