|
Тема: «Методы сравнительной статистики»Наиболее часто встречающейся и достаточно сложной математико-статистической задачей является сравнение данных, полученных в процессе наблюденийилиэкспериментов, в выборочных совокупностях. Исследователь старается описать результаты наблюдения количественными методами и «на выходе» получает числовой массив тех или иных доступных ему измерений – вариационный ряд. Однако, как правило, содержащаяся в результатах измерений содержательная информация, имеет гораздо большую ценность при сравнении ее с аналогичной информацией, но полученной некоторым иным образом. Например, это может быть ситуация сравнения опытных данных (когда мы как-то повлияли на изучаемый объект или явление) с контрольной группой, в которой никакого воздействия на объект наблюдения не было. Возможно и сравнение двух вариантов опытов. Возможно сравнение двух серий наблюдений, разделенных в пространстве и времени и т.п. Допустим, что удается заметить какие-либо численные различия в характеристиках сравниваемых рядов. Первым делом возникает вопрос: какова вероятность, что эти различия неслучайны и будут систематически повторяться в дальнейшем при воспроизведении условий эксперимента или наблюдения, т.е. выявленные различия являются статистически значимыми.
Выбор подходящего метода сравнения выборочных совокупностей определяется несколькими факторами: характером сравниваемых признаков (качественные или количественные), числом сопоставляемых групп, зависимостью или независимостью выборок, а также видом распределения признака. Выборки являются независимыми, если набор объектов исследования в каждую из групп осуществлялся независимо от того, какие объекты исследования включены в другую группу. Так, в частности, происходит при рандомизации, когда распределение объектов происходит случайным образом. Примером сравнения независимых выборок может служить сопоставление данных анализа крови в группе пациентов с аналогичными показателями в группе здоровых. Группы являются зависимыми (связанными) в динамических исследованиях, когда изучаются одни и те же объекты в разные моменты времени. Например, показатели анализа крови у одних и тех же пациентов до и после лечения. От вида распределения и типа исследуемого признака зависит выбор подходящего математико-статистического критерия. Критерии делятся на два типа – параметрические и непараметрические. Параметрические критерии – критерии, основанные на оценке параметров распределения, к которым относятся среднее арифметическое, среднеквадратическое отклонение, дисперсия.Они применимы только в том случае, если численные данные подчиняются нормальному распределению. Если распределение отличается от нормального, то следует пользоваться так называемыми непараметрическими критериями. Непараметрические критерии не основаны на оценке параметров распределения и вообще не требуют, чтобы данные подчинялись какому-то определенному типу распределения. Непараметрические критерии дают более грубые оценки, чем параметрические, но являются более универсальными. А параметрические методы более точны, но лишь в случае, если правильно определено распределение совокупности.
Перед тем как перейти к рассмотрению статистических критериев, введем понятия нулевой и альтернативной гипотез, которые нам потребуются в дальнейшем. На каждом шаге процесса анализа данных выдвигаются две гипотезы.Первая обозначается Нулевая гипотезане может быть отвергнута, если ее вероятность окажется выше некого наперед заданного уровня α, достаточно близкого к 0, т.е. Альтернативная гипотеза Поскольку Например, в процессе исследования ставится задача доказать наличие статистически значимых различий между результатами наблюдений в опытной и контрольной группах.Это значит, что данные, полученные при применении того или иного статистического критерия, должны позволить отвергнуть нулевую гипотезу об отсутствии указанных различий.
Параметрические критерии Заключение о случайности или неслучайности различий между выборочными совокупностями при использовании параметрических критериев осуществляется на основании сравнения параметров распределений, т.е. сводных числовых характеристик. Каждый из параметров компактно,в виде одного единственного числа, отражает некие характерные свойства распределения данной случайной величины. Они являются количественными мерами этих свойств. На практике, как правило, рассматривают лишь два параметра – среднее значение, являющееся «мерой положения математического центра» полученного вариационного ряда, и дисперсию, но чаще всего корень из нее – стандартное отклонение, являющиеся мерой вариации. Для этих параметров разработаны два наиболее популярных параметрических критерия: критерий Стьюдента и критерий Фишера. Критерий Стьюдента (t -критерий) – критерий, основанный на сравнении средних значений выборок. Критерий Стьюдента является наиболее известным. С одной стороны, анализ средних значений сравнительно прост для вычислений. С другой стороны, средние величины наиболее наглядны и понятны. Наиболее часто t -критерий используется в двух вариантах. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t -критерий). В этом случае есть контрольная группа и опытная группа, состоящая из разных пациентов, количество которых в группах может быть различно. Во втором же случае используется так называемый парный t-критерий, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних. Поэтому эти выборки называют зависимыми, связанными. Например, измеряется содержание лейкоцитов у здоровых животных, а затем у тех же самых животных после облучения определенной дозой излучения. В обоих случаях должно выполняться требование нормальности распределения исследуемого признака в каждой из сравниваемых групп. Для того, чтобы определить, является ли нормальным исследуемое распределение, используются критерии Шапиро-Уилка и Колмогорова-Смирнова.
![]() ![]() Что делает отдел по эксплуатации и сопровождению ИС? Отвечает за сохранность данных (расписания копирования, копирование и пр.)... ![]() Что делать, если нет взаимности? А теперь спустимся с небес на землю. Приземлились? Продолжаем разговор... ![]() ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала... ![]() Что вызывает тренды на фондовых и товарных рынках Объяснение теории грузового поезда Первые 17 лет моих рыночных исследований сводились к попыткам вычислить, когда этот... Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:
|