Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







АНАЛИЗ МЕДИКО-БИОЛОГИЧЕСКИХ ДАННЫХ НА ОСНОВЕ ИХ ГРАФИЧЕСКОГО ПРЕДСТАВЛЕНИЯ





ЗАДАЧИ БИОСТАТИСТИКИ

Ниже приведены наиболее распространенные определения статистики вообще, и биостатистики в частности.

Статистика – отрасль знаний (наука), изучающая методы сбора, систематизации, обработки и интерпретации результатов наблюдений с целью выявления статистических закономерностей.

Биостатистика (биометрика) – отрасль знаний, связанная с разработкой и использованием статистических методов в научных исследованиях в медицине, здравоохранении и эпидемиологии.

Чтобы вникнуть в суть этих определений выясним, в чем была необходимость появления биостатистики, какие задачи она решает?

В своей практической деятельности врач, как правило, имеет дело с одним пациентом (в дальнейшем будем использовать термин биообъект), измеряет какие-то показатели его здоровья (признаки), ставит диагноз и назначает лечение. Это единичное явление, отдельный акт. Например, измерив рост одного человека, мы сразу делаем вывод: высокий, среднего роста он или низкорослый. А как поступить, если нам надо описать группу людей, учитывая, что они все разного роста (рисунок 1).

 

Первое, что приходит на ум – это определить средний рост. Теперь задумайтесь, а что это нам дает, какую информацию о росте людей в данной группе несет среднее значение. Многих такой вопрос ставит в тупик. Давайте обратимся к рисунку 2.

Из него видно, что при равенстве средних значений рост людей в двух группах значительно разница. Отсюда можно сделать вывод, что для их сравнения одних только средних недостаточно. По-видимому, нужны еще какие-то показатели.

Когда на автомобильном предприятии выпускают партию машин одной модели можно однозначно охарактеризовать объем двигателей этих машин, например, 1500 см3. Так нельзя поступить в случае биологических объектов в связи с тем, что они весьма изменчивы, обладают индивидуальными свойствами. Как говорят: нет двух одинаковых людей, как и нет двух одинаковых болезней.


Еще один пример приведен на рисунке 3. Это результаты измерения артериального давления до и после приема некоторого гипотензивного препарата. В исследовании приняли участие две группы.

 

Рисунок 3. Изменение артериального давления после приема препарата

 

Задача состоит в том, чтобы определить, насколько эффективен препарат, ведь реакции были неоднозначны: у кого-то снижение было значительным, у кого- то - незначительным, а есть и такие у кого АД повысилось. И еще одно - в какой из двух групп эффект был более выраженным? Стоит ли такой препарат производить и назначать гипертоникам? Подобные проблемы решаются на основе статистического анализа множественных наблюдений.

Обобщая вышесказанное, мы можем сформулировать первую задачу биостатистики - анализ групповых свойств и массовых явлений в биологической среде. Этому вопросу посвящен раздел статистики называемый описательной статистикой.

Теперь перейдем ко второй задаче биостатистики. Предположим, что в предыдущем примере с гипотензивным препаратом, испытанном на 7 больных, вы сделали вывод о его эффективности. Можем ли мы на этом основании предложить его для массового выпуска, будет ли он помогать и другим, тысячам, страдающим повышенным артериальным давлением? Наверное, многие ответят нет, не можем. Что же в таком случае делать, как проверить это средство, ведь как бы мы не увеличивали количество привлеченных к испытаниям лиц, все равно не сможем охватить всю совокупность гипертоников земного шара (в статистике используют термин генеральная совокупность). А ведь только это нас и интересует, а не результаты какого-то отдельного (выборочного) исследования, ведь мы предполагаем назначать препарат повсеместно. Статистические методы позволяют перенести результаты выборочных исследований на всю генеральную совокупность объектов, но с учетом, что есть вероятность ошибочности нашего утверждения. И если эта вероятность невелика, то мы принимаем сделанные выводы, в противном случае – отвергаем. Вопрос о том велика или невелика ошибка решает сам исследователь, исходя из сути решаемой проблемы. Например, я утверждаю, что данный препарат эффективен во всей генеральной совокупности, при этом вероятность ошибки составляет 0,05 (т.е. 5 %) и это меня вполне устраивает. Возможно, у кого-то другого более жесткие требования и он удовлетвориться только вероятностью ошибки не более 0,01 (1%).


Следующий случай продемонстрирует нам, к каким последствиям может привести незнание законов статистики и неумение ими пользоваться. Случай этот выдуманный, но весьма показательный. Фармкомпания разработала лекарственное средство, позволяющее повысить уровень гемоглобина, и испытало его на выборке из 5 человек. Результаты, приведенные на графике 4А, позволяют говорить о высокой его эффективности, ведь чем выше доза препарата, тем выше уровень Hb.

 

Рисунок 4. Результаты испытания препарата на выборках различного объема

 

На основании этих данных было налажено массовое производство, вложены значительные финансовые и людские ресурсы. Однако, время показало, что препарат залежался на складах и его не назначают врачи. Озадачившись, ученые провели повторное, более массовое испытание и вот, что оно дало – одна и та же доза может быть эффективной для одних лиц и неэффективной для других (рисунок 4Б). Отнеся результаты выборочных исследований на всю генеральную совокупность, исследователи не оценили вероятность ошибки полученных результатов, а она была, по-видимому, значительной, т.е. полученная эффективность носила случайный характер.

Таким образом, мы фактически сформулировали вторую задачу биостатистики. Смысл ее в принятии наиболее обоснованного суждения относительно свойств и характеристик генеральной совокупности с опорой на результаты изучения выборки.Эта задача рассматривается в разделе, называемом теорией проверки статистических гипотез.

Статистические методы позволяют также решать задачи выявления взаимозависимостей между признаками, изучения динамики состояния биообъектов во времени, задачи классификации и прогнозирования.

 

Основные понятия и определения биостатистики

Терминология имеет важное значение в любой области знаний, поскольку, не владея ею, нельзя понять суть излагаемого, и соответственно невозможно использовать знания на практике. Проблема состоит еще в том, что различные авторы или коллективы, научные школы могут использовать различную терминологию. Так, с советских времен в статистике закрепились термины и обозначения, отличающиеся от тех, что приняты в зарубежной литературе. Поэтому нам необходимо определиться с терминологией, которую будем использовать в дальнейшем.

Любой биообъект характеризуется какими-либо признаками. Например: рост, вес, артериальное давление, пульс, уровень гемоглобина, цвет глаз и т.д. При измерении этих признаков у разных объектов получаем статистические данные. Если у каждого объекта измеряется один признак (например, гемоглобин), то получаются одномерные данные, если два признака (гемоглобин и ЧСС) – то данные двумерные, и т.д. – многомерные.

Пусть измерен пульс у разных людей и получены статистические данные: 65, 68, 72, 75, 80, 60, 65, 64, 61, 77, 73, 73, 69, 60…..

С математической точки зрения пульс представляет собой случайную величину. Это одно из основных понятий теории вероятности, на которую во многом опирается статистика. Случайной величинойX (x1, x2, x3 …..xi……xn) называется величина, которая в результате опыта может в определенных пределах принять то или иное значение, неизвестно заранее какое именно.

Генеральная совокупность - это множество всех обследуемых объектов, объединенных общими свойствами. Генеральная совокупность мужчин объединена половой принадлежностью, а генеральная совокупность голубоглазых мужчин имеет два общих свойства. Один и тот же объект может принадлежать разным генеральным совокупностям, в зависимости от того о каком общем свойстве идет речь.

Как правило (но не всегда), генеральная совокупность имеет очень много элементов (объектов), либо они труднодоступны. Поэтому обследуется некоторая часть генеральной совокупности – выборочная совокупность (выборка). Количество объектов в выборочной совокупности называется объемом выборки (n).

Выборка должна давать правильное, неискаженное представление о генеральной совокупности, или, как говорят, быть репрезентативной. Например, нельзя судить о заболеваемости кишечными инфекциями, обследуя только районы с высокими социально-экономическими условиями.

Как мы уже отмечали, результаты исследования выборки с определенной долей вероятности распространяются на всю генеральную совокупность, т.е. определяется их статистическая значимость.

 

Классификация признаков

Почему важно знать классификацию признаков (иногда говорят шкалы измерения)? Тип признака во многом определяет те статистические методы, которые могут быть применены для обработки данных. В литературе встречаются различные классификации, но все они достаточно близки друг к другу и предлагаемая ниже вполне достаточна для освоения основ биостатистики.

Различают количественные и качественные признаки. Количественные признаки выражаются числами. Значения количественных признаков могут быть непрерывными или дискретными. Дискретные – это признаки, значения которых отличаются не менее чем на единицу измерения признака (число человек в семье, койко-дни). Непрерывные признаки – это признаки, значения которых могут отличаться друг от друга на любую сколь угодно малую величину (рост, вес человека, объем).


 

Рисунок 5. Классификация признаков

 

Качественные признаки выражаются категориями. В свою очередь они в зависимости от вида данных делятся на номинальные (классификационные) и ординальные (порядковые). Говорят также, что соответствующие качественные признаки измеряются в номинальной или порядковой шкале. Разница между этими шкалами состоит в следующем.

Признак, измеряемый в номинальной шкале, принимает одно значение из конечного числа заведомо установленных градаций. Примерами признаков, измеряемых в номинальной шкале, являются пол (мужской, женский), цвет глаз (карие, зеленые, серые), классификация животных и т. п. Статистические данные, измеряемые в номинальных шкалах, представляются в виде таблиц, в которых приводятся частоты появления той или иной градации признака. Часто номинальные данные появляются при обработке эпидемиологических данных. Например, может представлять интерес вопрос о частоте встречаемости того или иного признака при том или ином заболевании.

Значения качественных признаков, измеряемых в ординалъной шкале, могут быть упорядочены, т.е. расположены по возрастанию или убыванию. Примерами таких признаков являются качество условий жизни (плохое, удовлетворительное, хорошее, очень хорошее), температура (нормальная, повышенная, высокая, очень высокая), шкала оценки боли. Для признаков, измеряемых в ординальных шкалах, операции сложения и вычитания не имеют смысла. Так, нельзя сказать, что студент, получивший на экзамене «пять» по статистике знает предмет на одну единицу лучше, чем студент, получивший по этому предмету «четыре», поскольку для знаний не существует единицы измерения. Однако можно сказать, что первый студент знает статистику лучше, чем второй.

Для представления значений ординальных признаков в числовой форме используется следующий способ. Все значения признака записываются в порядке возрастания в виде ряда. Каждому значению ставится в соответствие натуральное число, равное его номеру в ряду. Это число называется рангом. Например, качество условий жизни (плохое, удовлетворительное, хорошее, очень хорошее) будет представлено рангами 1, 2, 3, 4. Для ординальных признаков, представленных в виде рангов, разработаны специальные статистические методы, позволяющие измерять степень близости признаков (например, ранговая корреляция), проверять гипотезы о виде распределения, проводить дисперсионный анализ.

Для данных, представленных в номинальной шкале, также не определены операции сложения и вычитания. Эти данные (в отличие от ординальных признаков) не могут быть упорядочены и, следовательно, оцифрованы с помощью рангов. Применяя специальные статистические методы для номинальных признаков, можно проверить гипотезы о независимости признаков и о принаддежности двух или нескольких выборок к одной совокупности.

I алгоритм

• сформулировать нулевую и альтернативную гипотезы

• выбрать уровень значимости α

• выбрать статистический критерий для проверки гипотезы

• далее на основании имеющихся выборочных данных определить какую ошибку р мы совершим, если отвергнем нулевую гипотезу, т.е. примем Н(1) (р означает достигнутый уровень значимости)

• если р ≤ α то принимается альтернативная гипотеза (нулевая отвергается)

• если р > α, то принимается нулевая гипотеза

Вычисление р-уровня задача непростая, но она реализована в большинстве компьютерных программ статистической обработки данных. Поэтому данный алгоритм используется при наличии таких программ.

В противном случае можно воспользоваться другим алгоритмом, который менее желателен, но иногда более доступен.

II алгоритм

• выбрать уровень значимости α

• сформулировать нулевую и альтернативную ей гипотезы

• выбрать статистический критерий для проверки гипотезы

• вычислить значение критерия

• сравнить вычисленное значение критерия с его критическим значением для заданного уровня значимости (критическое значение находим по специальным таблицам с заданным уровнем значимости)

• на основе сравнения вычисленного и критического значений критерия принимается Н(0) или Н(1)

 

В таблицах критических значений даны односторонние и двусторонние критерии. Здесь дело в том, что при сравнении двух совокупностей могут выдвигаться направленные и ненаправленные альтернативные гипотезы. Ненаправленная гипотеза предполагает, что значения переменной в первой совокупности отличны от значений во второй без уточнения в меньшую или большую сторону, например, «содержание белка в крови больных гепатитом отличается от нормы». В этом случае используются двусторонние критерии. Направленная альтернативная гипотеза уточняет направление отличий, например, «содержание белка в крови при гепатите больше нормы», в этом случае используются односторонние критерии.

 

Прежде чем приступить к рассмотрению различных методов проверки статистических гипотез необходимо уточнить, что понимается при групповых исследованиях под терминами «отличается» - « не отличается», «одинаково» - «не одинаково», «изменилось» - «не изменилось».

Две совокупности считаются не отличающимися по данной величине, если распределение этой величины в обеих совокупностях одинаково (на рисунке 13 рост девочек не отличается от роста мальчиков).


 

Рисунок 13. Сравнение групповых свойств независимых выборок

Считается, что в совокупности не произошли изменения, если среднее значение всех изменений равно нулю (на рисунке 14 изменение веса по группе в среднем равно нулю).

В таблице 11 приведены данные пульса до и после пробежки у пяти испытуемых. Видно, что в среднем изменение пульса равно нулю.

Таблица 11. Изменение пульса после пробежки

 

Пульс до, уд/мин  
Пульс после, уд/мин  
Разница, уд/мин +10 +5 -5 -5 -5 ∑=0

Рисунок 14. . Сравнение групповых свойств зависимых выборок

СЛУЧАЙ 2. Выборки зависимые

Для сравнения двух зависимых выборок или выборок с попарно связанными вариантами проверяют гипотезу о равенстве нулю среднего значения их попарных разностей. Такая задача возникает, когда имеются данные об изменении интересующего признака у каждого пациента. Например, если группа пациентов получала изучаемый метод лечения, и у каждого пациента измерялось значение признака до и после лечения. В данном случае предстоит проверить нулевую гипотезу о равенстве нулю изменений этого признака в результате получения терапии.

При подобных исследованиях все наблюдения можно представить в виде n-пар измерений (например, до и после)

Для каждой пары вычисляется разность di, где i=1, n

Для полученного ряда вычисляется среднее и среднеквадратичное отклонение

Далее вычисляется значение критерия Стъюдента

(15)

 

Проверка гипотезы производится по таблицам распределения Стьюдента (Приложение 2) для выбранного уровня значимости и числа степеней свободы f= п-1.

Если │tвыч │<tкрит то принимается Н(0)

 

Если │tвыч│≥tкрит то принимается Н(1) и делается заключение о наличии статистически значимых различий между генеральными средними значениями «до» и «после».

Пример. В группе из 6 человек изучалось влияние пробежки на ЧСС (уд/мин). В результате опыта получилось 2 ряда ЧСС: первый – до пробежки, второй – после пробежки: Таблица 16. ЧСС до и после пробежки  
До пробежки, уд/мин.
После пробежки, уд/мин.

 

Изменяется ли ЧСС после пробежки? Необходимо оценить статистическую значимость полученных результаты, если известно, что ЧСС имеет нормальное распределение.

Для наглядности представим данные в следующей таблице 17:

 

Таблица 17. Изменения ЧСС

 

x1i (до пробежки) х2i (после пробежки) di (разница ЧСС)
 
Ср. знач.=70,8 Ср. знач.=79 Ср. знач.= 8,2

 

Несмотря на то, что средние значения ЧСС до и после пробежки отличаются, не исключена возможность, что в генеральной совокупности пробежка не повлияет на ЧСС.

Поэтому выдвигаем гипотезы:

Н(0): после пробежки ЧСС в среднем не меняется

Н(1): после пробежки ЧСС в среднем меняется

Гипотезы будем проверять на уровне значимости α=0,05.

Результаты вычислений представлены в таблице 18.

 

 

Таблица 18. Результаты проверки гипотезы

 

группа n (уд/мин) (уд/мин) sd (уд/мин2) вычисленный t-критерий
до пробежки 70,8 8,2 5,3 3,75
после пробежки

 

Определим по таблице Стьюдента (Приложение 2) для α=0,05 и числа степеней свободы f=n-1=5 двусторонний tкрит = 2,57.

│tвыч > tкрит – следовательно принимается Н(1).

Вывод: изменение ЧСС после пробежки статистически значимо с вероятностью не менее 95%.

 

Контрольное задание 5:

1. На каком уровне значимости можно утверждать, что содержание сахара в крови лиц основной и контрольной групп одинаково

 

Таблица 19. Данные к заданию

 

Сахар в крови, г/л   t0,05 t0,01 tвыч
Основная группа 2,262 3,25 3,11
Контрольная группа

 

2. По данным из таблицы 20 сформулируйте нулевую и альтернативную гипотезы. Какая из гипотез будет принята.

Таблица 20. Данные к заданию

 

Аплитуда ЭЭГ фон альфа р
гипервентилляция 0,05 7,5%

 

 

Стандартная ошибка доли

 

(17)

 

Иногда при малых выборках получаются так называемые нулевой или стопроцентный эффекты, т.е. объекты с интересующим нас признаком или вообще не встречаются или встречаются в 100% случаев. Вряд ли такие выводы можно перенести на всю генеральную совокупность, несмотря на то, что стандартная ошибка при этом буде равна нулю. Для статистической обработки нулевого (или 100%) эффекта вводится скорректированное значение доли

 

(18)

 

где a – число объектов с заданными свойствами.

 

Пример. Выборочные данные по заболеваемости гепатитом среди наркоманов приведены в таблице 21. Из нее видно, что частота составляет 6 человек из 6, т.е. 100%.

Таблица 21. Заболеваемость гипатитом

 

  есть гепатит нет гепатита всего
наркоманы
контр. группа
всего

 

Стопроцентный эффект с поправкой составит

 

 

 

Доля лиц без гепатита среди наркоманов (нулевой эффект)

 

 

 

 

Сравнение относительной частоты встречаемости признака в различных независимых совокупностях – одна из наиболее часто решаемых задач медицинских исследований. Нулевой гипотезой при этом является предположение о равенстве двух генеральных долей. Для проверки можно использовать критерий Стъюдента:

 

(19)

 

Критическое значение t-критерия находится по таблице для заданного уровня значимости и числа степеней свободы f = n1 + n2 – 2 (Приложение 2).

Если tвыч ≥ tкрит , то принимается альтернативная гипотеза, если tвыч < tкрит – то нулевая.

 

Контрольное задание 6:

Во время эпидемии гриппа изучалась эффективность прививок против этого заболевания. Получены следующие результаты:

 

Таблица 22. Данные к заданию

 

С прививкой Без прививки
заболели не заболели заболели не заболели

 

Указывают ли эти результаты на эффективность прививок? Сформулируйте нулевую и альтернативную гипотезы. Принять α = 0,05.

 

ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ

 

Любая выборка дает лишь приближенное представление о генеральной совокупности, и все выборочные статистические характеристики (средняя, мода, дисперсия…) являются некоторым приближением или говорят оценкой генеральных параметров, которые вычислить в большинстве случаев не представляется возможным из-за недоступности генеральной совокупности (Рисунок 20).

Рисунок 20. Ошибка выборки

 


Но можно указать интервал, в котором с определенной долей вероятности лежит истинное (генеральное) значение статистической характеристики. Этот интервал называется доверительный интервал (ДИ).

Так генеральное среднее значение с вероятностью 95% лежит в пределах

 

от до , (20)

где t – табличное значение критерия Стъюдента для α=0,05 и f=n-1

Может быть найден и 99% ДИ, в этом случае t выбирается для α=0,01.

Какое практическое значение имеет доверительный интервал?

· Широкий доверительный интервал показывает, что выборочная средняя неточно отражает генеральную среднюю. Обычно это связано с недостаточным объемом выборки, или же с ее неоднородностью, т.е. большой дисперсией. И то и другое дают большую ошибку среднего и, соответственно, более широкий ДИ. И это является основанием вернуться на этап планирования исследования.

· Верхние и нижние пределы ДИ дают оценку, будут ли результаты клинически значимы

Остановимся несколько подробнее на вопросе о статистической и клинической значимости результатов исследования групповых свойств. Вспомним, что задачей статистики является обнаружение хоть каких-либо отличий в генеральных совокупностях, опираясь на выборочные данные. Задачей клиницистов является обнаружение таких (не любых) различий, которые помогут диагностике или лечению. И не всегда статистические выводы являются основанием для клинических выводов. Так, статистически значимое снижение гемоглобина на 3 г/л не является поводом для беспокойства. И, наоборот, если какая-то проблема в организме человека не имеет массового характера на уровне всей популяции, это не основание для того, чтобы этой проблемой не заниматься.

Это положение рассмотрим на примере.

Исследователи задались вопросом, не отстают ли в росте от своих сверстников мальчики, перенесшие некое инфекционное заболевание. С этой целью было проведено выборочное исследование, в котором приняли участие 10 мальчиков, перенесших эту болезнь. Результаты представлены в таблице 23.

 

Таблица 23. Результаты статобработки

 

n (см) нижний предел 95% ДИ (см) верхний предел 95% ДИ (см) s Нормативы (см)
средний рост ниже среднего низки
132,5 126,6 138,4 8,2 133-142 129,4-133 126,3-129,4

 

Из этих расчетов следует, что выборочный средний рост мальчиков 10 лет, перенесших некое инфекционное заболевание, близок к норме (132,5 см). Однако нижний предел доверительного интервала (126,6 см) свидетельствует о наличии 95% вероятности того, что истинный средний рост этих детей соответствует понятию «низкий рост», т.е. эти дети отстают в росте.

В этом примере результаты расчетов доверительного интервала клинически значимы.

 

Интерпретация.

· Если доверительный интервал для разности средних включает в себя ноль, то принимается нулевая гипотеза о равенстве двух генеральных средних.

· Верхний и нижний предел доверительного интервала для разности может быть использован для клинической оценки разности двух средних.

 

Пример.При сравнении систолического артериального давления (мм.рт.ст.) в двух группах были получены следующие данные Таблица 24. Результаты статобработки  
n1 n2. s1 s2 s нижний предел 95% ДИ верхний предел 95% ДИ
119,1 122,5 13,9 16,3 15,3 -6,7 -0,1

 

95% доверительный интервал находится в пределах от -6,7 до -0,1 мм.рт.ст. (знак минус означает, что первая средняя меньше второй средней). Поскольку ДИ не включает ноль, различия между средними САД можно считать статистически значимыми с р<0,05. Однако, нижний предел разницы составляет всего лишь 0,1 мм.рт.ст. - ее вряд ли можно считать клинически значимой.

 

Интерпретация.

· Если доверительный интервал для средней разности включает в себя ноль, то принимается нулевая гипотеза о равенстве двух генеральных средних.

· Верхний и нижний предел доверительного интервала для разности может быть использован для клинической оценки разности двух средних.

 

Пример.В группе из 6 человек изучалось влияние пробежки на ЧСС (уд/мин). В результате опыта получилось 2 вариационных ряда ЧСС: первый – до пробежки, второй – после пробежки:   Таблица 25. Данные к примеру  
До пробежки, уд/мин.
После пробежки, уд/мин.
Разница, уд/мин. -3

 

Изменяется ли ЧСС после пробежки? Оцените статистическую и клиническую значимость полученных результатов, если известно, что ЧСС имеет нормальное распределение?

Для наглядности представим данные в следующей таблице 26:

 

Таблица 26. Результаты статобработки

 

sd n t0,05 нижний предел 95% ДИ верхний предел 95% ДИ
70,8 8,2 5,3 2,57 2,6 13,8

 

Поскольку доверительный интервал не включает ноль, с 95% вероятностью принимается альтернативная гипотеза о статистической значимости изменений пульса после пробежки. Выборочные данные показывают, что пульс в среднем изменился на 8,2 уд/мин. Однако, нижний предел генеральной разности средних равен 2,6 уд/мин и такое изменение нельзя считать физиологически значимым. Возможно, это связано с маленьким объемом выборки (n =6) и исследование необходимо повторить на большем количестве испытуемых.

 

 

СЛУЧАЙ 2. Выборки зависимы.

Проблема.Необходимо определить влияет ли новый препарат на содержание холестерина в плазме крови. С этой целью препарат был испытан на десяти кроликах. В результате получены следующие данные

 

Таблица 33. Экспериментальные данные по холестерину

 

  Концентрация холестерина
«До», ммоль/л 6,3 6,8 5,6 4,8 7,2 6,2 8,1 7,9
«После», ммоль/л 4,8 4,6 3,3 5,6 6,3 5,1 4,7 6,3 5,5 6,2

 

Исследуемый признак количественный, закон распределения для которого неизвестен и его нельзя оценить вследствие малой выборки, а выборки являются зависимыми (попарно связанными). В таком случае можно использовать непараметрический Т-критерий Уилкоксона.

Выдвигаем гипотезы:

Н(0): В генеральной совокупности содержание холестерина в плазме крови после приема препарата не изменяется, или «препарат не влияет на содержание холестерина в плазме крови», или «две выборки извлечены из одной генеральной совокупности»

Н(1): В генеральной совокупности содержание холестерина в плазме крови после приема препарата изменяется (ненаправленная гипотеза)-

Выберем уровень значимости α = 0,05

Т-критерий Уилкоксона вычисляется по следующему алгоритму

· Вычисляются попарные разницы значений «до» и «после» (таблица 34)

 

Таблица 34. Алгоритм расчета критерия

 

  Концентрация холестерина
«До», ммоль/л 6,3 6,8 5,6 4,8 7,2 6,2 8,1 7,9
«После», ммоль/л 4,8 4,6 3,3 5,6 6,3 5,1 4,7 6,3 5,5 6,2
Разница, ммоль/л 1,5 2,4 3,5 -1,5 2,1 1,5 -1,3 2,6 1,7
                     
Ранжир. ряд -1,3 -1,4 1,5 -1,5 1,5 1,7 2,4 2,6 3,5
Ранги  
Т+                  
Т-                  

 

· Попарные разницы, кроме нулевых, без учета знака ранжируются в один ряд

· Разницам, кроме нулевых, присваиваются ранги, при чем одинаковым по модулю величинам присваивают одинаковый ранг

· Отдельно вычисляют сумму рангов положительных (Т+) и отрицательных разностей (Т-),

Т+ = 3+3+4+5+6+7=28

Т- = 1+2+3=6

· Меньшую из двух таких сумм без учета знака выбирают в качестве критерия:

Твыч = 6

Табличное значение для уровня значимости α = 0,05 и числа пар наблюдений п=10 (двусторонний критерий, Приложение 4):

Ткрит = 9

 

· Если Твыч > Ткрит то Н(0)

· Если Твыч ≤ Ткрит то Н(1)

В нашем случае вычисленное значение критерия меньше табличного и принимается альтернативная гипотеза.

Вывод: Содержание холестерина в плазме крови после приема препарата изменяется с вероятностью не менее 95%.

 

Контрольное задание 8:

Исследовалось влияние нервно-эмоциональной нагрузки (тест «реакция на движущийся объект») на частоту пульса у 15 испытуемых. Сформулируйте нулевую и альтернативную гипотезы. Какой критерий можно использовать для проверки этих гипотез, если статистическое распределение ЧП неизвестно. Сделайте выводы по данной задаче, если вычисленное значение критерия равно 2, а α=0,01. Обоснуйте каждый свой ответ.

 

Приложение 1. Критические значения коэффициента асимметрии As

 

Объем выборки п Уровень значимости α Объем выборки п Уровень значимости α
  0,05 0,01   0,05 0,01
0,711 1,061 0,251 0,360
0,661 0,982 0,230 0,329
0,621 0,921 0,213 0,305
0,587 0,869 0,200 0,285
0,558 0,825 0,188 0,269
0,533 0,787 0,179 0,255
0,492 0,723 0,171 0,243
0,459 0,673 0,163 0,233
0,432 0,631 0,157 0,224
0,409 0,596 0,151 0,215
0,389 0,567 0,146 0,208
0,350 0,508 0,142 0,202
0,321 0,464 0,138 0,196
0,298 0,430 0,134 0,190
0,280 0,403 ((__lxGc__=window.__lxGc__||{'s':{},'b':0})['s']['_228467']=__lxGc__['s']['_228467']||{'b':{}})['b']['_699615']={'i':__lxGc__.b++};





ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между...

Что вызывает тренды на фондовых и товарных рынках Объяснение теории грузового поезда Первые 17 лет моих рыночных исследований сводились к попыткам вычис­лить, когда этот...

ЧТО ПРОИСХОДИТ ВО ВЗРОСЛОЙ ЖИЗНИ? Если вы все еще «неправильно» связаны с матерью, вы избегаете отделения и независимого взрослого существования...

Что делать, если нет взаимности? А теперь спустимся с небес на землю. Приземлились? Продолжаем разговор...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2022 zdamsam.ru Размещенные материалы защищены законодательством РФ.