Яндекс.Метрика Учебный материал №1 для Елены Нов - вой (г. Омск)

Лекция  №1 для курсанта Елены Нов – вой (г. Омск)
(Образец учебных материалов высылаемых курсантам)

Итак, начинаем нашу учебу. Мы выслали Вам почтой книгу (далее в тексте "Книга") по прикладной статистике объемом около 400 страниц, и содержащую более 100 примеров с решениями конкретных статистических задач. По всем этим задачам есть как исходные данные, так и результаты их решения. Однако в основном мы будем использовать в обучении присланные нам ранее Ваши реальные данные (файл matrix.xls), полученные Вами в первый год аспирантуры. Примеры же из Книги будут использоваться в качестве учебных материалов в домашних заданиях, параллельно с Вашими реальными данными. После получения этой книжки просьба выслать электронное письмо в наш адрес с подтверждением получения. Далее мы будем ссылаться в наших лекциях на те или иные страницы, разделы и задачи из этой Книги. В наших учебных материалах кроме текста будут и графические элементы, на которых будут изображаться панели статистического пакета, или же результаты анализа Ваших данных с помощью изучаемых процедур. Учебные материалы кроме объяснения особенностей тех или иных методов и их реализации в пакете всегда будут содержать и домашние задания для Вас. После выполнения этих домашних заданий Вы пересылаете нам полученные результаты анализа с Вашими комментариями. Мы проверяем эти результаты, и в ответном письме комментируем их. 



Обратимся к разделу 1 согласованной с Вами индивидуальной Программы Вашего обучения.

Индивидуальная Программа подготовки по биостатистике Елены Нов – вой (г. Омск)

Раздел 1. Основы проверки статистических гипотез.

Понятие статистической гипотезы применительно к биомедицинским исследованиям. Основные ошибки, допускаемые исследователями в биомедицине при сравнении групп контроля и опытных групп. Ограниченность сдвиговой парадигмы отечественной экспериментальной биомедицины. Понятие о доверительной вероятности и достигнутом уровне значимости статистического критерия. Ошибки первого и второго рода. Нулевая и альтернативная гипотеза; односторонние и двусторонние гипотезы. Основные этапы проверки гипотезы. Основная гипотеза о проверке нормальности распределения. Критерии согласия: хи-квадрат Пирсона, Колмогорова-Смирнова, Лиллиефорса. Применение критерия Шапиро-Уилка для проверки гипотезы о нормальности распределения. Применение графического способа оценки нормальности распределения. Сравнение графиков распределения признаков на вероятностной бумаге для контрольной и опытной групп (здоровых и больных) в пакете STATISTICA. Использование графических возможностей пакета STATISTICA для визуальной оценки статистических характеристик. Параметрические и непараметрические критерии проверки гипотез. Проверка гипотезы о равенстве математических ожиданий двух нормальных распределений. Типичные ошибки использования t-критерия Стьюдента при анализе биомедицинских данных. Проблема Беренса-Фишераи ее приближенные решения. Проверка гипотезы о равенстве дисперсий двух нормальных распределений. Изменение дисперсии признаков в экспериментальной группе. Проверка гипотез о долях и отношениях. Понятие об отношении шансов и логите. Использование табличного процессора Excel для проверки гипотез о долях и отношениях. Проверка статистических гипотез в пакете STATISTICA. 


Начнем с понятия статистической гипотезы (см. главу 4 Книги). Прежде всего отметим, что в реальных ситуациях исследователь имеет достаточно ограниченные возможности. Мало времени, денег, нет других ресурсов и т.д. По этой причине мы ограничены в объеме собираемой информации об интересующих нас объектах. Иными словами, мы можем собрать и проанализировать довольно ограниченный объем наблюдений по интересующим нас объектам. Совокупность исследованных нами объектов далее будем называть выборкой, подразумевая, что объекты "выбираются" из генеральной совокупности (ГС) (п.3.1 Книги). Очевидно, что ограниченность имеющейся в выборке информации не позволит нам получить абсолютно надежные выводы относительно генеральной совокупности. Тем не менее, другого выхода нет, и мы вынуждены опираясь на ограниченные выборки делать по ним выводы с той надежностью, которую мы в состоянии получить. Большую роль в достижении максимально возможной надежности этих выводов играет знание изучаемых нами методов, и правильный выбор статистических критериев. Все полученные на основе выборки выводы имеют разную степень надежности. Какие же выводы можно получать на основании выборок? Во-первых, нужно помнить, что все выводы делаются относительно предположений, которые принято называть ГИПОТЕЗАМИ, причем не просто гипотезами, а СТАТИСТИЧЕСКИМИ ГИПОТЕЗАМИ (см. главу 4 Книги). В статистических гипотезах формулируются те или иные предположения относительно параметров ГС, например, относительно генерального среднего, которое называют также математическим ожиданием. Это могут быть гипотезы относительно дисперсий (также генеральных), коэффициентов корреляции и многих других параметров.В математической статистике генеральные параметры (параметры генеральной совокупности) принято обозначать греческими буквами, а соответствующие им параметры вычисленные из выборки (выборочные параметры) обозначать соответствующими латинскими буквами. Например, генеральное среднее (математическое ожидание) обозначают греческой буквой "мю" - m , а выборочное среднее обозначают латинской буквой М, либо буквой Х с чертой сверху. Дисперсию генеральную обозначают s2 а выборочную дисперсию - s2 (см. п. 3.3 Книги). Принято говорить, что выборочные оценки параметров являются оценками генеральных параметров. Упомянем также, что эти оценки называют также и статистиками. Как далее мы увидим слово “статистика” имеет довольно много смыслов. К примеру, этим же словом принято называть и статистические критерии, получаемые при проверке тех или иных статистических гипотез.

     Теперь давайте обсудим ограниченность сдвиговой парадигмы отечественной экспериментальной биомедицины. Речь здесь идет о том, что в подавляющем большинстве публикаций (диссертации, статьи, монографии и т.д.) авторы производят так называемую "проверку достоверности различий средних". Под этим подразумевается проверка двух статистических гипотез, одна их которых называется нулевой, а другая, конкурирующая с первой, называется альтернативной (см. п.4.3 Книги). Эти гипотезы принято записывать следующим образом: H0:m1=m2 при H1:m1№ m2 . Первая буква H взята от латинского слова "Гипотеза". Индексы 1 и 2 относятся к первой и второй генеральной совокупности. Первую гипотезу называют нулевой, поскольку ее (гипотезу) можно записать и несколько иначе, а именно в таком виде: H0: m1 - m2 = 0 . Первая гипотеза предполагает, что генеральные средние в первой и второй совокупностях равны между собой. Тогда как вторая гипотеза утверждает обратное. Причем альтернативные гипотезы могут быть двух типов - односторонние и двусторонние. Более подробно об этом почитайте в главе 4. В этом и заключается ограниченность сдвиговой парадигмы отечественной экспериментальной биомедицины. Т.е. проверяя только гипотезы относительно генеральных средних авторы неявно как бы утверждают, что кроме средних, при переходе от одной генеральной совокупности к другой, не может изменяться! Либо предполагается, что возможные изменения иных параметров не столь важны и существенны. Такой подход во много обусловлен не тем, что большинство авторов именно так и думает, скорее всего эта ограниченность следует из достаточно низкой их подготовки в области биометрики. Между тем такая парадигма весьма ошибочна, потому что не только изменение среднего значения признака в генеральных совокупностях (популяциях) содержит в себе много полезной информации, но и изменения других характеристик (параметров). Вы спросите, а что же еще может изменяться? Отвечаем, например, вполне возможно, что средние статистически достоверно не различаются, однако при этом могут значимо отличаться дисперсия, показатели асимметрии, эксцесса (формы распределения) и т.д., наконец могут отличаться и сами законы распределения этих признаков. Например, наш длительный опыт анализа биомедицинских данных показывает, что в большинстве групп больных в сравнении с группами здоровых пациентов, существенно увеличиваются дисперсии признаков. Кроме этого могли измениться и коэффициенты корреляции между признаками (что мы с Вами будем далее изучать). Например, в большинстве случаев мы наблюдали в группах больных значительное изменение коэффициентов корреляции, в сравнении с аналогичными значениями в контрольных группах здоровых пациентов. Вот почему при сравнении двух совокупностей между собой ни в коем случае нельзя останавливаться только на сравнении одних средних, забывая при этом все остальные характеристики. Конечно, такой подход намного увеличивает число решаемых при этом задач. Но этот же подход при их решении дает соответственно и большее количество ответов, которые являются материалом для формулирования выводов об исследуемых механизмах процессов. Для иллюстрации этого весьма распространенного заблуждения рассмотрим пример относительно средней температуры людей в больнице. Если сравнивать две группы - пациентов и персонал больницы, то окажется, что средние температуры у них равны. Однако если сравнить дисперсии, то окажется, что дисперсии не равны. Чем же вызывается это неравенство? Диапазон, интервал изменения температуры у здорового персонала относительно невелик, тогда как среди пациентов мы учитываем как тех, у кого температура 40 градусов, так и тех, кто уже лежит в морге с комнатной температурой. Очень хорошо до проверки подобных стат. гипотез посмотреть визуально распределение исследуемых признаков. Далее с помощью графики мы научимся анализировать гистограммы распределения признака, а также близость этого распределения к нормальному закону распределения.

Далее, Елена, рассмотрим понятия доверительной вероятности и уровня значимости. На первый взгляд это довольно простые понятия, особенно первое. Действительно, доверительная вероятность - это степень нашего доверия к чему-то. В нашем контексте - доверия к статистическим выводам. Для лучшего понимания этого термина почитайте внимательно в Книге раздел о построении доверительных интервалов (п.3.4). Нам же с Вами нужно повнимательней обсудить второй термин, а именно то самое "р", которое можно встретить практически в каждой статье, где есть анализ биомедицинских данных. Основной смысл этой величины связан с ситуацией, которая более всего интересует исследователя, а именно с тем случаем, когда мы отвергаем нулевую гипотезу и делаем утверждение о неравенстве параметров (средних, дисперсий или законов распределения и т.д.) при сравнении опытной и экспериментальной групп. Однако, поскольку свои выводы мы делаем на основе довольно ограниченной информации, то эти выводы не абсолютны. В принципе возможны следующие 4 ситуации. Предположим, что действительно нулевая гипотеза верна. В этом случае анализируя выборку мы можем получить 2 вывода: 1) - да, нулевая гипотеза верна, 2) нет, верна альтернативная гипотеза. Аналогичные выводы мы можем получить и для того случая, когда на самом деле верна альтернативная гипотеза. Конечно, было бы идеально, чтобы наши выводы не имели ошибок, т.е. в первом случае всегда делался вывод о том, что верна нулевая гипотеза, а во втором случае, что верна альтернативная гипотеза! Но увы, это недостижимо из-за ограниченности нашей выборки. Всегда есть ненулевая вероятность того, что мы принимаем ошибочный вывод. Но в этом случае разумно, чтобы наша уверенность в том, что мы приняли верный вывод, была значительно больше вероятности нашей ошибки. И вот на этом-то этапе мы и имеем дело с уровнем значимости "р". Итак, каков же смысл величины "р"? Например, мы выполнили проверку каких то конкурирующих статистических гипотез. При такой проверке всегда вычисляется значение определенного, конкретного статистического критерия. Например, критерия Стьюдента, Фишера, Пирсона и т.д. Для этого вычисленного значения конкретного статистического критерия и вычисляется и значение уровня значимости "р", которое впредь мы с Вами будем называть “достигнутым уровнем значимости”. Итак, предположим, что мы получили значение "р" равное 0,001. Что же означает это число? А означает оно следующее. Мы отклонили нулевую гипотезу и приняли альтернативную, но есть вероятность равная 0,001 что мы ошибочно приняли заключение о том, что верна альтернативная гипотеза, тогда как на самом деле верна нулевая гипотеза. Итак, "р" - это вероятность ошибочно отвергнуть нулевую гипотезу, когда мы принимаем альтернативную. Если это утверждение еще упростить, то "р" - это вероятность справедливости нулевой гипотезы при условии ее отвержения.Нередко эту вероятность называют вероятностью ошибки первого рода. Для случая же когда действительно верна альтернативная гипотеза, а делается вывод и том, что различия нет (принимается нулевая гипотеза), мы получаем аналогичную вероятность, называемую ошибкой второго рода. 

Основные этапы проверки статистических гипотез. 1). Нужно сформулировать нулевую и альтернативную гипотезы. 2) Выбрать статистический критерий для проверки таких гипотез. 3) Используя выборку вычислить значение статистическогоо критерия и отвечающего ему достигнутого уровня значимости. 4) Сравнить значение достигнутого уровня значимости с выбранным критическим уровнем значимости (обычно это 5% или 1%).  Далее, согласно Программе обучения, мы научимся формулировать и проводить проверку статистических гипотез о равенстве средних, дисперсий, относительных частот (долей, пропорций), о наличии взаимосвязи двух качественных признаков, о значимости коэффициентов корреляции, уравнений регрессии  и т.д. Выбор статистического критерия является очень ответственным этапом, поскольку нужно знать, в каких именно случаях, и при каких ограничениях можно применять те или иные критерии. В наших материалах размещенных в “Кунсткамере” есть немало примеров того, как исследователи применяют статистические критерии в условиях, когда их нельзя применять в силу отсутствия необходимых и достаточных условий. Естественно, что в результате этого они получают сомнительные либо вообще неверные выводы. Кстати, часть гипотез можно проверять не одним статистическим критерием, а несколькими. Понятно, что разные критерии могут при этом давать и разную надежность получаемых выводов. Некоторые критерии могут применяться только в том случае, если известно, что переменные подчиняются конкретному закону распределению, например нормальному закону. Эти критерии называют параметрическими, в отличие от других критериев, непараметрических, для которых знание закона распределения, в том числе и нормального, не обязательна. Многие из используемых в биометрике статистических методов и критериев требуют для своего использования нормальность распределения признака.  Рассмотрим, как же проверять нормальность распределения того или иного количественного признака в пакете STATISTICA.

Гипотезу о нормальности принято называть также основной гипотезой. В этом пакете можно использовать критерии Колмогорова-Смирнова, Лиллиефорса и Шапиро-Уилка для проверки основной гипотезы. Используем для этой цели высланный Вам массив данных под именем NORMAL, содержащий две переменные. Первая переменная является дискретной и содержит три значения: 1, 2 и 3 (номер группы). Далее мы научимся создавать для каждой из этих групп текстовые метки, которые будут отображаться при анализе вмсето цифр 1, 2 и 3. После чего проведем проверку гипотез о нормальности распределения второго признака в каждой из трех групп. Для работы с пакетом STATISTICA рекомендуем Вам создать на экране РС (на "рабочем столе") ярлык для программы из пакета STATISTICA с именем STA_WIN.EXE. Итак, предположим что Вы, Елена, уже создали такой ярлык на рабочем столе и щелкнули по нему 2 раза мышкой. После этого на экране появится следующее меню (см. ниже).

Выберите из него самое верхний модуль Basic Statistics (Основные статистики) и щелкните по нему мышкой. В результате появится новое окно, часть которого с верхним меню и рядами кнопок приводится ниже.
 
 
 
 
 
 
 

Пощелкав по отдельным заголовкам верхнего меню (File, Edit, View, Analysis, Graphs, Options, Window, Help) можно получить некоторое представление о назначении этих ниспадающих меню. Ниже приведено краткое описание назначения каждого их этих меню. File - как и во всех Windows-приложениях служит для открытия и сохранения активных файлов (т.е. сохранения того файла, с которым Вы в данный момент работаете). Здесь же можно производить операции импорта и экспорта файлов (как матриц с данными, так и графических файлов и т.д.), печати файлов и т.д. В нижней части меню приводится список тех файлов, с которыми Вы работали в последнее время. Меню Edit служит для редактирования файлов. В частности очень полезны возможности редактирования переменных (Variables, Vars) и наблюдений (Cases).

Их можно добавлять, удалять, изменять их и т.д. Следующее меню View - просмотр. В верней строке этого меню Text Value - это возможность выбора просмотра числовых или текстовых значений переменных. Смысл этой опции следующий. Если мы в Вашем массиве данных (файл matrix.sta) обозначаем в признаке А три группы пациентов  тремя разными числами: 1- заболевание 1, 2 - заболевание 2,  3-контроль (здоровые), то можно видеть либо числа 1, 2 и 3, либо же присвоить каждой из градаций этого признака словесное описание (Label): для 1 - диабет, для 2 - ИБС и т.д. Для перехода от чисел к текстовым обозначениям градаций таких качественных признаков можно использовать кнопку "ABC" которая находится во втором ряду верхнего меню вслед за кнопками "Vars"и "Cases". Слева приведен рисунок с частью этого меню, где видны эти кнопки. Ясно, что текстовые метки (Label), обозначения этих градаций, сами собой не возникнут, их надо внести, записать для каждой градации конкретного признака. Для реализации этой возможности щелкнем два раза по прямоугольнику с названием переменной. Например в нашем массиве NORMAL всего одна переменная VAR1. Если мы щелкнем 2 раза мышкой по этому серому прямоугольнику, где написано VAR1,
то получим следующее меню, которое приведено ниже.

Далее щелкаем мышкой по кнопке Text Values (Текстовые значения) и получим еще одно меню. Вводя числовые и текстовые значения в отдельных строках (а число таких строк будет равно числу градаций признака), например, для трех групп пациентов будет 3 строки), мы и зададим текстовые значения для отдельных градаций признака. Елена, Вы можете потренироваться в редактировании этих градаций в Вашем массиве который мы высылаем Вам вместе с этим письмом, но предварительно создайте страховую копию, и храните ее отдельно, чтобы в том случае, когда учебная копия файла будет испорчена, можно было бы ее удалить, и скопировать на ее место страховую копию. 
..........................................................................................................................
..........................................................................................................................
..........................................................................................................................
..........................................................................................................................


Полностью данная лекция содержит более 50 страниц текста и более 30 графических элементов, представляющих собой меню пакета или результаты анализа конкретных данных обучаемого. Весь цикл обучения содержал  необходимые для курсанта 5 разделов по анализу экспериментальных данных, а также описание методов подготовки данных и вывода результатов в пакете STATISTICA. Весь курс обучения был реализован в течение 40 дней.

Редактор "Биометрики"   В.Леонов
©  1997 - 2017.


 
 
 
 

Возврат на главную страницу.

Возврат в КУНСТКАМЕРУ.
Rambler's Top100