Действительно, я думаю, мы все
согласны с Ньютоном: самый глубокий
фундамент науки – это уверенность
в том, что в природе одинаковые явления
наступают при одинаковых условиях.
Н. Бор
Последние 20 лет для отечественной медицины характерны бурным внедрением в исследовательскую практику современных информационных технологий. Совпадение этого внедрения по времени с экономическим спадом деформировали этот процесс. В результате широкое использование компьютеров в отечественной медицине не привело к качественному скачку в статистической методологии этих исследований [1-2]. Аналогичный процесс освоения в медицине информационных технологий начался в США 30 лет назад. Технология извлечения информации из клинических данных способна оказывать каталитическое воздействие на пересмотр основных парадигм медицинской науки. В качестве примеров можно указать на такую реакцию после появления технологий анализа генома человека, и технологии компьютерной томографии. Детали использования авторами публикаций технологий извлечения информации из клинических данных отображают не только уровень их знаний в области статистики, но и существующую у исследователя парадигму научной медицины.
Как известно, статистика есть наука об извлечении информации из эмпирических наблюдений за объектами, состояние которых подвержено влиянию не только детерминированных, но и многих случайных факторов. При этом носителями такой информации являются не сами объекты как таковые, а их изменяющиеся состояния. Именно эти состояния являются материальными носителями сигналов, из которых методами статистического анализа извлекается необходимая исследователю информация. Выбор метода анализа может быть обусловлен двумя основными факторами: знаниями и навыками выполнения того или иного вида анализа самим исследователем, а также явно или неявно культивируемой им моделью изучаемого явления, процесса, заболевания. Отметим, что оба этих фактора в реальных условиях неразрывно взаимосвязаны. Результаты статистического анализа доступные исследователю далее формируют его модель изучаемого явления, и наоборот, авторская модель явления диктует ему выбор метода статистического анализа. В свою очередь доминирование в публикационном массиве по конкретной тематике ограниченного набора методов статистического анализа формирует у исследователя и столь же ограниченную модель явления.
По аналогии с биоценозом и техноценозом [3], описывающими совокупности мира живого и мира техники, в соответствующих средах обитания, можно ввести новое понятие «инфоценоз» для информационных носителей. Ареалы обитания публикаций, доступных российским и американским исследователям, существенно различаются. Столь же существенно различается и «видовой состав» этих публикаций. Одним из отличительных признаков этих публикаций является уровень использования современных методов системного анализа, в частности, такого его инструмента, как статистика. Сравнение статистических технологий, используемых отечественными и зарубежными исследователями возможно путём наукометрического анализа публикаций [4-5]. Данный анализ позволяет также сформулировать доминирующие в России и США статистические парадигмы моделей, культивируемые в национальной медицине.
Для анализа были использованы 2234 отечественных публикации (диссертации, статьи, монографии) по медицине и биологии, изданные за последние 10 лет. Американские статьи, в количестве 851, были опубликованы в ведущих американских журналах по медицине. Анализировались только те публикации, в которых использовались методы статистики. По каждой публикации определялось количество использованных статистических методов. Далее публикации ранжировались по количеству использованных методов. Минимальное количество методов принималось равным 1, максимальное – 10. После чего оценивалась относительная частота публикаций для каждого ранга. Ниже в таблице приведены относительные частоты встречаемости публикаций с разным количеством использованных статистических методов (Р – для российских публикаций, А – для американских).
|
Число использованных статистических методов |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Р |
0,342 |
0,186 |
0,116 |
0,082 |
0,064 |
0,056 |
0,048 |
0,041 |
0,036 |
0,035 |
А |
0,144 |
0,121 |
0,110 |
0,102 |
0,098 |
0,093 |
0,089 |
0,085 |
0,083 |
0,073 |
Обращает на себя внимание тот факт, что если для российских публикаций 52,8% публикаций используют один или два метода, то в американских публикациях один или два метода используют лишь 26,5%. Обе зависимости хорошо описываются законом Ципфа , где Pi – относительная частота, k – константа, r – ранг статьи, V – показатель степени. Отметим, что для российских публикаций k=0,34601, V = –1,00171, тогда как для американских публикаций k=0,14533, V = –0,25915. Это говорит о том, что распределение частот американских публикаций, использующих несколько статистических методов, изменяется менее резко, нежели аналогичное распределение для российских публикаций.
В работе [5] мы показали, что 58,05% российских авторов медико-биологических публикаций используют проверку гипотез о равенстве средних t-критерием Стьюдента. Тогда как англоязычные авторы используют этот критерий лишь в 10,97% случаев. На основании этого можно сформулировать доминирующую в российской биомедицинской науке статистическую парадигму как СДВИГОВУЮ. Суть её заключается в том, что, по мнению исследователей, основное различие сравниваемых групп, как правило, это группа здоровых и группа больных, заключается в тривиальном изменении среднего значения того или иного признака. Было установлено, что англоязычные авторы в 82,5 раза чаще используют проверку нормальности распределения, и в 25,8 раза чаще используют корреляционный анализ. В каждой третьей англоязычной статье используются многомерные методы. Тогда как для российских публикаций суммарная доля многомерных методов составила всего лишь 3%. Это говорит о том, что статистическая парадигма зарубежных исследователей содержит выраженный многомерный подход к исследованию изучаемых объектов. В англоязычных публикациях в 33,4 раза чаще применяют анализ таблиц дожития и оценку уравнений кривых выживаемости, что позволяет высказать предположение о том, что конечной целью их исследований является не столько обнаружение локального эффекта изменения среднего значения, сколько оценка совокупной связи этого эффекта с длительностью жизни пациентов
ЛИТЕРАТУРА
- Леонов В.П., П.В. Ижевский. Применение статистики в медицине и биологии: анализ публикаций 1990-1997 гг. /Сибирский медицинский журнал. - 1997. - вып. 3-4, с. 64-74.
- Леонов В.П., Реброва О.Ю., Солнцев В.Н. и др. В новый век - с доказательной биомедициной//Поиск. 1999. № 20 (522).
- Техноценоз как наличное бытие и наука о технической реальности. Материалы к «Круглому столу» конф. «Онтология и гносеология технической реальности» (Новгород Великий, 21-23 января 1998г.). - Абакан: Центр системных исследований, 1998. - 180с.
- Хайтун С.Д. Наукометрия. Состояние и перспективы. М.: Наука. 1983. – 344 с.
- Леонов В.П. Наукометрика статистической парадигмы экспериментальной биомедицины. Вестник Томского государственного университета. Серия «Математика. Кибернетика. Информатика», № 275, 2002. – с.17-24.
|