Яндекс.Метрика

Ошибки медицинской статистики

Каждый слышит то, что понимает. Гете

Статистика посещаемости БИОМЕТРИКИ


16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц
14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц
14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страниц
17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц
03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц
30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц
06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц
08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы
Если приходят, значит полезное находят..  

Наш адрес:  
Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...

Редактор БИОМЕТРИКИ
В. Леонов

Support Academia’s Mission

  • 385
data-counter data-url="http://www.biometrica.tomsk.ru/">

    На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайте БИОМЕТРИКА, рекомендую перейти на файл "Поиски методов или результатов статистического анализа". Можете просматривать все графики по данной тематике.

НЦ БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. (См. далее )

Отзывы исследователей по статистическому анализу их баз данных


Примеры оформления исследователями базы данных, описания признаков и целей статистического анализа этой базы данных

Островок  здоровья

Пример 1  Пример 2 
  Пример 3


В. Леонов. СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ МЕДИКОВ И БИОЛОГОВ. (время и опыт)

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35.


Примеры "Программы по статистическому анализу", и подобных результатов статистического анализа по таким "Программам"

Применение статистики в статьях и диссертациях по медицине и биологии. Часть I. Описание методов статистического анализа в статьях и диссертациях. Международный журнал медицинской практики, 1998 г., вып. 4. В.П.Леонов, П.В.Ижевский.

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.   ЧАСТЬ 2. ИСТОРИЯ БИОМЕТРИКИ И ЕЁ ПРИМЕНЕНИЯ В РОССИИ. Леонов В.П.

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ.  ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ  "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ". Леонов В.П.

Применение статистики в статьях и диссертациях по медицине и биологии. Часть IV. Наукометрия статистической парадигмы экспериментальной биомедицины.     Международный журнал медицинской практики, 2002 г. вып. 3. Леонов В.

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35.

Доклад "Почему и как надо учить медиков статистике?" Леонов В. П. Доклад на международной конференции по доказательной медицине  в Ереване 18-20.10.2012

Зачем нужна статистика в доказательной медицине?  В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193.

Применение методов статистики в кардиологии (по материалам журнала "Кардиология" за 1993-1995 гг.). Леонов В.П. Кардиология, 1998, № 1, с. 55-58.

Леонов В.П. Ошибки статистического анализа биомедицинских данных.  Международный журнал   медицинской практики,  2007, вып. 2, стр.19-35.

Статистика - это что? Статистика - нужна зачем? Статьи читаем - зачем? Статьи пишем - зачем? Краткая версия лекции для слушателей-медиков в Ереване, прочитанной в 2014 году по Скайпу.

Цели, возможности, и проблемы использования биостатистики в доказательной медицине. В. Леонов В.П. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года).

НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ   (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ). Леонов В.П. Вестник Томского государственного университета. Серия "Математика. Кибернетика. Информатика", №275. АПРЕЛЬ 2002, стр. 17-24. Cамая читаемая наша статья после отправки в мае м-це с.г. более 300 писем авторам статей мед. журналов о наличии в них примитивных и ошибочных методов статистического анализа, и получаемых при этом результатах....


    На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА  размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайте БИОМЕТРИКА, рекомендую перейти на файл "Поиски методов или результатов статистического анализа". Можете просматривать все графики по данной тематике.


Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.

Международная конференция по доказательной медицине в Ереване (18 - 20.10.2012)

В 2012 году исполнилось 10 лет со дня создания "Армянского медицинского реферативного журнала". В связи с этой датой главный редактор АМРЖ Рубен Ованесян организовал международную конференцию "Доказательная медицина в Армении: миф или реальность?". Конференция прошла в Ереване 18-20.10.2012. Ниже мы приводим материалы этой конференции. Доклад "Почему и как надо учить медиков статистике?" В. Леонов.

Зачем нужна статистика в доказательной медицине?  В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193.


Сравниваем средние, а также и ... В. Леонов

 Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов.

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.


НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ   (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ). В.П.Леонов. Вестник Томского государственного университета, Серия "Математика. Кибернетика. Информатика", №275. АПРЕЛЬ 2002, стр. 17-24. Cамая читаемая наша статья после отправки более 300 писем авторам статей мед. журналов о наличии в них примитивных и ошибочных методов статистического анализа, и получаемых при этом результатах...


НЦ БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. (См. далее )

Отзывы исследователей по статистическому анализу их баз данных


Очередной отзыв о нашем сотрудничестве Корнеевой Н.В., доцента кафедры факультетской терапии ДВГМУ г. Хабаровск.

ВОЗМОЖНОСТИ БИОМЕТРИЧЕСКОГО АНАЛИЗА ВЗАИМОСВЯЗИ СОМАТИЧЕСКИХ ПОКАЗАТЕЛЕЙ И СИСТЕМАТИКИ ПСИХИЧЕСКИХ РАССТРОЙСТВ.
Н.П.Гарганеева1, В.П.Леонов2. Сибирский государственный медицинский университет1, Томск 
Томский государственный университет2. Сибирский медицинский журнал, № 2, 2001, с.25-32.

Особенности развития органов растений фасоли в условиях освещения и темноты. Л. В. Ивлева, И.Ф. Головацкая, В.П. Леонов.  ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ. ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ".

НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ   (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ). В.П.Леонов.Cамая читаемая наша статья после отправки в мае м-це с.г. более 300 писем авторам статей мед. журналов о наличии в них примитивных и ошибочных методов статистического анализа, и получаемых при этом результатах...


Чтобы не допускать ошибок в использовании и описании статистики в статьях и диссертациях, следует прочитать материалы представленные в КУНСТКАМЕРЕ - коллекции диссертаций и статей по медицине и биологии, с набором статистических ошибок и нелепостей.

Экспозиция 1  Экспозиция 2  Экспозиция 3  Экспозиция 4  Экспозиция 5  Экспозиция 6 
Экспозиция 7  Экспозиция 8   Экспозиция 9 Экспозиция 10  Экспозиция 11  Экспозиция 12
Экспозиция 13  Экспозиция 14  Экспозиция 15 Экспозиция 16  Экспозиция 17
 


В. Леонов. «Применение методов статистики в кардиологии (по материалам журнала «Кардиология» за 1993–1995 гг.) Кардиология, 1998, № 1.

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ  ДЛЯ МЕДИКОВ И БИОЛОГОВ.  (время и опыт). Леонов В.

Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал  медицинской практики, 2007, вып. 2, стр.19-35.

Доклад "Почему и как надо учить медиков статистике?" Леонов В. П. Доклад на международной конференции по доказательной медицине  в Ереване 18-20.10.2012

Зачем нужна статистика в доказательной медицине?  В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193.

Применение методов статистики в кардиологии (по материалам журнала "Кардиология" за 1993-1995 гг.). Леонов В.П. Кардиология, 1998, № 1, с. 55-58.

Леонов В.П. Ошибки статистического анализа биомедицинских данных.  Международный журнал   медицинской практики,  2007, вып. 2, стр.19-35.

НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ   (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ). Леонов В.П. Вестник Томского государственного университета. Серия "Математика. Кибернетика. Информатика", №275. АПРЕЛЬ 2002, стр. 17-24. Cамая читаемая наша статья после отправки в мае м-це с.г. более 300 писем авторам статей мед. журналов о наличии в них примитивных и ошибочных методов статистического анализа, и получаемых при этом результатах...

Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г.

Международная конференция по доказательной медицине в Ереване (18 - 20.10.2012). Ниже мы приводим материалы этой конференции. Доклад "Почему и как надо учить медиков статистике?" В. Леонов.

Зачем нужна статистика в доказательной медицине?  В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193

ОТЗЫВ Корнеевой Н.В., доцента ДВГМУ, г. Хабаровск.

Здравствуйте! Меня зовут Корнеева Наталья Вячеславовна, я являюсь доцентом кафедры факультетской терапии ДВГМУ г. Хабаровск. Как и полагается доценту, я имею степень кандидата медицинских наук, диссертация защищена в 2011 году. Работая над кандидатской диссертацией, самой сложной для меня была статистическая обработка данных. Обучаясь в очной аспирантуре, я посетила 5 занятий по статистике, предусмотренные программой подготовки аспирантов. Занятия проводила то ли студентка технического ВУЗа, то ли молодая преподаватель, которая постоянно заглядывала в конспект и не могла понять суть преподаваемого ею, тем более эту суть не могли понять и обучающиеся. Прикладного значения полученным «знаниям», я так и не нашла. (далее...)

 

КУНСТКАМЕРА

 

На белую страницу строчка ляжет - 
И вашу мысль увидят и прочтут. 
...
Как часто эти найденные строки
Для нас таят бесценные уроки.
У. Шекспир. Сонет 77

Вырази ложную мысль ясно,
И она сама себя опровергнет.
Л. Вовенарг

В начале 2001 г. был объявлен конкурс на эпиграфы к разделу "КУНСТКАМЕРА". За два месяца читатели прислали более 50  эпиграфов...       (дальше...)

 

Диссертация "Сравнительная характеристика показателей кардиореспираторной системы спортсменов и лиц, не занимающихся спортом, в условиях северного промышленного города".

Диссертант - Погонышева И.А., специальность 13.00.13 - физиология. Научный руководитель: доктор медицинских наук, профессор, В.С. Соловьёв.

Тюменский государственный университет, Тюмень - 2006 г.

Как и многие предыдущие экспонаты, в данной работе представлены все типичные ошибки, которые можно обнаружить и в диссертациях, выполненных в организациях Томска, Омска, Тюмени, Сургута, Кемерово, Барнаула, Новосибирска, Красноярска, Новокузнецка и многих других городов Сибири.

Не обсуждая научную ценность, новизну и актуальность самой темы диссертации, остановимся лишь на статистических аспектах этого экспериментального исследования. Поскольку все сформулированные выше "Положения, выносимые на защиту", полностью базируются на результатах использования статистического анализа полученных экспериментальных данных. Прежде чем мы перейдём к непосредственному анализу корректности проведённых автором статистических манипуляций, напомню читателям отдельные пункты Раздела 2 действующего "Положения о порядке присуждения научным и научно-педагогическим работникам учёных степеней" ВАК РФ.

«Раздел 2. Критерии, которым должны отвечать диссертации, представленные на соискание ученой степени. … п. 8. Диссертация на соискание ученой степени кандидата наук должна быть научно–квалификационной работой, в которой содержится решение задачи, имеющей существенное значение для соответствующей отрасли знаний, либо изложены научно обоснованные технические, экономические или технологические разработки, имеющие существенное значение для экономики или обеспечения обороноспособности страны».

«Раздел 2.П. 9. «Диссертация должна быть написана единолично, содержать совокупность новых научных результатов и положений, выдвигаемых автором для публичной защиты, иметь внутреннее единство и свидетельствовать о личном вкладе автора в науку. Предложенные автором новые решения должны быть строго аргументированы и критически оценены по сравнению с другими известными решениями».

Итак, диссертант должен научно обосновать и строго аргументировать свои научные выводы.

Перейдём непосредственно к анализу приведённой в диссертации аргументации и попытаемся оценить, насколько эта аргументация "научно обоснована" и "критически оценена".

 

На стр. 67 автор сообщает о том, что "А=М ± m , где А - результат исследования; М - среднее арифметическое, m - ошибка среднего арифметического". Уже при чтении этой фразы возникает вопрос: А что в данном случае считать "результатом исследования"? Например, у спортсмена Иванова измерили значение САД, которое оказалось равным 120 мм рт ст. И как в этом случае вычислить ошибку среднего арифметического? Или измеренное значение САД не является "результатом исследования"? Другой пример. На стр. 92 автор приводит следующие "результаты исследования":

Итак, у 5,89% в группе 17-21 год обнаружено нарушение функций возбудимости и автоматии. Это "результат исследования"? А если результат, то как для этого "результата" вычислить значение М ± m ? При кажущейся нелепости такой ситуации подобные вопросы вполне резонны, поскольку, как увидим ниже, они не лишены смысла. Ниже автор сообщает "Достоверность различий результатов производившихся исследований, определялась с помощью критерия Стьюдента, который вычислялся по формуле: (см. текст справа)". Прежде всего обратим внимание на некорректность использования выражения "достоверность различий", применительно к процедуре сравнения средних с помощью статистических критериев. Такие заключения не могут быть "достоверными" или "не достоверными", поскольку они имеют вероятностную природу. В данном контексте следует использовать оборот "статистически значимо". Детально это заблуждение рассмотрено в статье Зорина Н.А. "О НЕПРАВИЛЬНОМ УПОТРЕБЛЕНИИ ТЕРМИНА "ДОСТОВЕРНОСТЬ" В РОССИЙСКИХ НАУЧНЫХ ПСИХИАТРИЧЕСКИХ ИОБЩЕМЕДИЦИНСКИХ СТАТЬЯХ".

Далее на стр. 68 автор сообщает, что "Достоверными считали различия сравниваемых величин при 95%-ном уровне значимости". Обратимся к толкованию этого термина в "Статистический словарь"/ Гл. ред. М.А. Королев, - 2-е изд., перераб. и доп. - М.: Финансы и статистика. - 1989. - 623с. На стр. 542 читаем: "УРОВЕНЬ ЗНАЧИМОСТИ - одна из характеристик качества критерия статистической проверки гипотез. Пусть выдвинута гипотеза H0 (основная, или "нулевая"). Всякое стат. решение, принимаемое на основе ограниченного ряда наблюдений, неизбежно сопровождается вероятностью ошибочного заключения. С вероятностью альфа гипотеза H0 может оказаться отвергнутой, в то время как на самом деле она является справедливой (ошибка первого рода), или наоборот, с вероятностью бэта может быть принята гипотеза H0 в то время, как на самом деле она является ошибочной (ошибка второго рода). ... В частности, при фиксированном объеме выборки обычно задаются величиной альфа вероятности ошибочного отвержения проверяемой гипотезы H0 . Эту вероятность ошибочного отклонения "нулевой" гипотезы принято называть УРОВНЕМ ЗНАЧИМОСТИ... На практике часто пользуются след. стандартными значениями альфа: 0,1 , 0,05 , 0,025 , 0,01 , 0,005 , 0,001. Особенно распространенной является величина УРОВНЯ ЗНАЧИМОСТИ альфа равная 0,05. Она означает, что в среднем в пяти случаях из ста ошибочно отвергают высказанную гипотезу при пользовании данным критерием статистическим". Таким образом, используя уровень значимости 95% , автор ошибочно отвергал высказанные гипотезы в 95 случаях из 100! О какой же "достоверности" можно говорить в этом случае? Дополним это толкование термина "УРОВЕНЬ ЗНАЧИМОСТИ" обратившись к определению понятия доверительной вероятности, и, применив его, объясним смысл авторского утверждения.

Более искушённый читатель скажет, что видимо диссертант и его научный руководитель перепутали между собой два основных понятия статистики - уровень значимости и доверительную вероятность. Возможно и так, а может и нет. Беда подобных работ в том, что на основании приведённой в диссертации информации невозможно сделать однозначный вывод об этом. Примеры других аналогичных нелепостей смотрите в разделе "Типология описания использованных методов" нашей работы "Долгое прощание с лысенковщиной".

Для этого используем упомянутую автором на стр. 67 книгу Г.Ф. Лакина "Биометрия" (Москва, изд-во "Высшая школа", 1990. - 352с.), в которой на стр.107 читаем следующее. "...С доверительной вероятностью тесно связан уровень значимости альфа, под которым понимают разность альфа=1-Р."  Следуя авторскому утверждению получается, что при уровне значимости 95% он использовал доверительную вероятность в 5%! Фактически автор утверждает, что он верит собственным результатам менее, чем на 5%! Из чего следует, что выводы автора не могут быть признаны корректно обоснованными методами статистики, а стало быть их надёжность весьма сомнительна. 
К сожалению, такое абсурдное утверждение ничуть не смутило ни научного руководителя диссертации,ни членов диссертационного совета. Причина этого видимо в том, что уровень знаний в области статистики у тех и у других, такой же, как и у автора диссертации.

 

Теперь рассмотрим непосредственно формулу (10) для критерия Стьюдента, с помощью которой автор производил сравнения средних.

 

Автор утверждает, что средние значения X1 и Х2 определялись по формуле: X1=n1/N1*100 % и X2=n2/N2*100 % .

Иными словами, средние значения в данном случае были ни чем иным, как долями, выраженными в процентах. Настораживает правда один момент в формуле для t-критерия Стьюдента, а именно использование знаков модуля. Из чего следует, что автор имел дело в том числе и с ОТРИЦАТЕЛЬНЫМИ долями. К примеру, как при обследовании "нарушения функций возбудимости и автоматии" у 17-21 летних или у 22-24 летних спортсменов можно путём таких вычислений получить отрицательные доли? Ведь в этом случае либо числитель n1 либо знаменатель N1 должны иметь знаки минус?

Как следует из приведённого ниже "Списка сокращений", автор использовал 25 количественных признаков.

Логично задаться вопросом, каким образом автор производил с помощью приведённого ранее t-критерия Стьюдента сравнения средних этих количественных показателей? Увы, ответа автор не даёт. Возможно автор, совместно с научным руководителем, полагает, что это достаточно секретная информация, чтобы приводить её в диссертации. Впрочем, причина, видимо, гораздо тривиальнее... Скорее всего как автор, так и научный руководитель этой диссертации, не считает эту информацию важной для аргументации приведённых в диссертации умозаключений .

На стр. 69-70 автор приводит средние значения и их ошибки для многих количественных показателей.

Как видим, на стр. 69 автор утверждает: "Масса тела у студентов 17-21 года была равна 63,2±1,32 кг, в 22-24 года она составила 71,4±1,01 кг, что достоверно выше (Р<0,05) предыдущего возрастного периода." Из чего можно сделать вывод, что для получения этого утверждения был использован упомянутый на стр. 67 t-критерий Стьюдента. Однако неясно, каким образом этот критерий, вычисляемый для долей, был использован для количественных признаков?

Судя по тому, что в этих таблицах приведена нумерация отдельных подгрупп, например, студенты 17-21 года - подгруппа 1, а спортсмены этого же возраста - подгруппа 2 и т.д. до 4-й подгруппы, автор проводил с помощью t-критерия Стьюдента попарные сравнения этих 4-х подгрупп. Всего для 4 подгрупп имеем 4*(4-1)/2 = 6 попарных сравнений. Напомним, что при попарных сравнениях возникает так называемая проблема множественных сравнений. Суть её в том, что при увеличении числа сравниваемых пар вместо задаваемой изначально критической значимости, например, 5%, следует использовать новый уровень статистической значимости, равный частному от деления исходного уровня значимости, например, 5% , на число парных сравнений. Выше мы уже сказали, что в этом случае для 4-х подгрупп имеем 6 парных сравнений. Т.о. вместо исходного критического кровня значимости равного 0,05 следовало использовать новую величину равную 0,05/6 = 0,008.  При этом меняется не только величина критического уровня значимости, но и такой параметр, как число степеней свободы. [1-4]Увы, стерильность в подобных знаниях характерна не только для начинающих исследователей уровня аспирантов, но и для опытных исследователей, облечённых академическими регалиями. В ноябре м-це 2009 г. в рамках проводимой в Якутске научно-практической конференции "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику" мне довелось беседовать с зам. директора по научной работе НИИ медицинских проблем Севера д.м.н., профессором С. В своём докладе она также привела несколько аналогичных парных сравнений. Однако на мой вопрос "Учитывалась ли при этом проблема парных сравнений?" ничего не смогла ответить, т.к. не подозревала о существовании таковой проблемы.

Ниже мы приводим ещё несколько аналогичных таблиц, чтобы показать, что подобные сравнения в работе имеют многочисленный характер.

Рассмотрим результаты, приведённые автором в табл. 2. Напомним, что всего в диссертации использовано 9 таблиц. Причём большинство из них имеют аналогичную структуру. Т.е. средние значения и ошибки средних для количественных признаков, названия двух группирующих признаков, и последний столбец "достоверность различий".

Учитывая обилие в приведённых таблицах сравнения средних, предположим, что диссертант использовал классический вариант t-критерия Стьюдента для двух независимых (несвязанных) групп. Однако в силу забывчивости самого диссертанта или его научного руководителя, в диссертации этот факт не нашёл отражения. В этом случае уместно задаться вопросом о правомочности использования t-критерия Стьюдента во всех приведённых в таблицах случаях парных сравнений. Как известно, использование t-критерия Стьюдента имеет два ограничения. [1-4] Согласно первому ограничению распределение количественного признака в каждой из групп сравнения должно подчиняться нормальному распределению. Многочисленные исследования свидетельствуют о том, что нормальное рспределение встречается далеко не часто. Вот как пишет об этом известный специалист в области прикладной статистики профессор А.И. Орлов в своей книге ЭКОНОМЕТРИКА (Издательство ЭКЗАМЕН, Москва, 2004. - 576 с.). "Приведенные описания экспериментальных данных показывают, что погрешности измерений в большинстве случаев имеют распределения, отличные от нормальных. Это означает, что большинство применений критерия Стьюдента, ... строго говоря, не является обоснованным, поскольку неверна лежащая в их основе аксиома нормальности распределений соответствующих случайных величин. Очевидно, для оправдания или обоснованного изменения существующей практики анализа статистических данных требуется изучить свойства процедур анализа данных при «незаконном» применении. Изучение процедур отбраковки показало, что они крайне неустойчивы к отклонениям от нормальности, а потому применять их для обработки реальных данных нецелесообразно; поэтому нельзя утверждать, что произвольно взятая процедура устойчива к отклонениям от нормальности". Именно Александр Иванович в своём письме от 4 апреля 1998 г. и обратил моё внимание на эту проблему. Второе необходимое условие, это равенство генеральных дисперсий в этих группах. Это условие также называется условием однородности дисперсий, или условием гомоскедастичности, буквально равнораспределённости (не путать с равномерным распределением!). Справа приведены типичные гистограммы распределения таких количественных признаков, и результаты их проверки на нормальность. Наш 20-летний опыт анализа биомедицинских данных говорит о том, что нормальность распределения количественных признаков в медицине и биологии наблюдается от силы в 10-20 % случаев. А равенство дисперсий в группах сравнения примерно в 30-50 % случаев.

Если принять эти оценки, то имеем вывод, что корректное использование t-критерия Стьюдента возможно от силы лишь в 5-10% случаев. Как следует из текста диссертации, такая проверка нормальности и равенства дисперсий не производилась. Это позволяет утверждать отсутствие строгой аргументации и достоверности выводов, полученных на основе статистических манипуляций.

Гистограмма

 

Если нормальность распределения количественных признаков без исходных данных проверить невозможно, то статистическую гипотезу о равенстве даух генеральных дисперсий проверить не представляет особого труда.  Поскольку диссертант приводит в таблицах после знака ± значение ошибки среднего m, то проверим гипотезу  с помощью F- критерия Фишера, который равен отношению двух выборочных дисперсий. Напомним, что ошибка среднего "m" равна отношению стандартного отклонения s на корень квадратный из объёма наблюдений n. Отсюда несложно найти выборочную дисперсию: s2=(m2n). Сравним дисперсии, например, показателя ОГК (объем грудной клетки) в таблице 2 для группы 2 (93,9 ± 1,83; n=68) и для группы 4 (99,5 ± 1,39; n=32). Вычислив две выборочные дисперсии, и далее разделив большую дисперсию на меньшую, получим F-критерий Фишера, равный 2,798. При данных объемах выборок этому значению F-критерия отвечает достигнутый уровень значимости р=0,001. Это означает, что генеральные дисперсии сравниваемых совокупностей не равны, и значит производить сравнение средних с помощью t-критерия Стьюдента нельзя (см. проблему Беренса-Фишера). Возникает резонный вопрос, каким же образом диссертант пришёл к заключению о том, что имеет место различие средних значений ОГК между 2-й и 4-й группами? С помощью какого статистического критерия было проверено это утверждение, и вообще, имела ли место такая проверка? Или же это не более чем личное мнение диссертанта, не подкреплённое надёжным статистическим методом?

Надёжность утверждения диссертанта о различии этих групповых средних можно оценить также путём построения доверительных интервалов для генеральных средних каждой из сравниваемых групп. Все необходимы для этого величины диссертант приводит в таблице 2. В частности, есть выборочное среднее, есть ошибка среднего, и есть количество наблюдений (пациентов) в каждой группе. Напомним, что для построения доверительного интервала необходимо найти полуширину ДИ [1-4]по формуле δ=m*t 1-α/2; (n-1) . Где m - ошибка среднего, а t 1-α/2; (n-1) - квантиль t-распределения Стьюдента. Построим двусторонний доверительный интервал для уровня значимости р=5%. В этом случае значения двух квантилей распределения Стьюдента для каждой средней будут следующими: t 0,975; (68-1) = 1,996 и t 0,975; (32-1) = 2,04. Проведём необходимые вычисления для первой средней: δ1=1,83*1,996=3,65. Аналогично  δ2=1,39*2,04=2,84. В этом случае для первой группы доверительный интервал будет иметь значения 93,9 ± 3,65, т.е. (90,25; 97,55). А для второй группы доверительный интервал будет иметь значения 99,5 ± 2,84 , т.е. (96,66; 102,34). Как видим, два 95-процентных доверительных интервала перекрываются между собой. Что позволяет утверждать, что следует принять нулевую гипотезу о равенстве генеральных средних этих двух групп, т.е. различия между генеральными средними нет. Такой же результат получим тем более и для случаев р=0,01 и 0,001. Предлагаем читателям повторить аналогичные вычисления и для остальных случаев, в которых диссертант утверждает различие групповых средних.

Следует отметить, что игнорирование требования равенства двух генеральных дисперсий при использовании t-критерия Стьюдента довольно часто встречается в диссертациях. Типичный пример такого игнорирования представлен в диссертации "Особенности регуляторнометаболических параметров иммунокомпетентных клеток крови у лиц с разным соматотипом" выполненной в упоминавшемся выше Институте медицинских проблем Севера СО РАМН, Красноярск. Очевидно, что в случае некорректного использования методов статистики для анализа экспериментальных наблюдений нельзя говорить о том, что авторские выводы «научно обоснованы», «строго аргументированы», и "достоверны".

Таким образом, можно констатировать, что диссертант, как и его научный руководитель, проявили отсутствие необходимой квалификации в анализе экспериментальных данных, вследствие чего сформулированные в диссертации выводы научно не обоснованы, и не отвечают критериям, которым должны отвечать диссертации, представленные на соискание ученой степени. Всё это даёт основания обратиться в ВАК РФ с предложением провести повторную экспертизу данной работы. Наличие столь неаргументированных заключений в диссертации вызывает также сомнение в компетентности диссертационного совета, принявшего решение по данной работе. Будем полагать, что ВАК РФ учтёт это в своей работе.

Литература

1. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере/ Под ред. Фигурнова В.Э. - М.: ИНФРА-М, Финансы и статистика, 1995. - 384 с.

2. Поллард Дж. Справочник по вычислительным методам статистики. М.: Финансы и статистика, 1982. - 344 с.

3. Ермолаев О.Ю. Математическая статистика для психологов. М.: Флинта, 2003. - 336 с.

4. Браунли К.А. Статистическая теория и методология в науке и технике. М.: Наука, 1997. - 408 с.

    На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайте БИОМЕТРИКА, рекомендую перейти на файл "Поиски методов или результатов статистического анализа". Можете просматривать все графики по данной тематике.


1997 - 2020.© Василий Леонов. E-mail: 

Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.

Зачем нужна статистика в доказательной медицине? 

Доклад "Почему и как надо учить медиков статистике?" В. Леонов