Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Тема: Анализ линейной регрессионной модели





По приведенным данным своей задачи необходимо:

1. Придумать содержательную постановку задачи.

2. Получить линейные регрессионные модели y=a +a x и x=b +b y.

3. Сформулировать гипотезы H и H и проверить значимость коэффициента корреляции r .

4. Сформулировать гипотезы H и H и проверить значимость коэффициентов регрессий а и в .

5. Вычислить коэффициент детерминации и проверить его значимость.

 

Задача 3.1

X                                
Y                                

 

Задача 3.2

X                                
Y                                

 

Задача 3.3

X                                
Y                                

 

Задача 3.4

X                                
Y                                

 

Задача 3.5

X                                
Y                                

 

Задача 3.6

X                                
Y                                

 

 

Задача 3.7

X                                
Y                                

 

Задача 3.8

X                                
Y                                

 

Задача 3.9

X                                
Y                                

 

Задача 3.10

X                                
Y                                

 

 


Примерные вопросы для подготовки к зачету

1. Понятие модели.

2. Понятие моделирования.

3. Типы моделей.

4. Понятие выборки.

5. Понятие генеральной совокупности.

6. Двумерная линейная регрессионная модель.

7. Постановка задачи.

8. Суть метода наименьших квадратов.

9. Стандартная форма системы нормальных уравнений.

10. Интерпретация уравнения регрессии.

11. Простая линейная корреляция. Парная корреляция.

12. Коэффициент корреляции Пирсона.

13. Основные свойства коэффициента корреляции.

14. Проверка значимости коэффициента корреляции.

15. Оценка значимости коэффициентов регрессионной модели.

16. Статистический критерий.

17. Гипотезы, выдвигаемые при проверки значимости коэффициентов.

18. Коэффициент детерминации.

19. Свойства коэффициента детерминации.

20. Проверка значимости коэффициента детерминации.

21. Таблица Чеддока.

22. F-распределение Фишера.

23. Проверка значимости уравнения регрессии.

24. Понятие о многофакторном регрессионном анализе.

25. Понятие о многофакторном коэффициенте корреляции.


Литература

Основная

1. Наследов А.Д. Математические методы психологического исследования. С-П.: Речь, 2004-390с.

2. Сидоренко Е.В. Методы математический обработки в психологии. С-П.: Речь, 2003-330с.

3. Ермолаев-Томин О.Ю. Учебник для бакалавров. Математическая статистика в психологии. Учебник. М.: Юрайт. 2012-512с.

4. Романко В.К. Статистический анализ данных в психологии. М.: Бином. 2009-312с.

Дополнительная

1. Волков Б.С., Волкова Н.В., Губанов А.В. Методология и методы психологического исследования. Учебное пособие. М.: Трикста. 2006-352с.

2. Гоуфруа Ж. Что такое психология. М.: Мир, 1996-376с.

 


Глоссарий

t-критерий Стьюдента – параметрический критерий, используемый для проверки статистических гипотез: 1) о достоверности различий средних значений признака между двумя выборками, 2) о достоверности коэффициентов корреляции Пирсона и Спирмена.

χ2-критерий Пирсона – параметрический критерий, используемый для проверки статистических гипотез: 1) о достоверности различий двух эмпирических распределений признака, 2) о достоверности различий между эмпирическим распределением признака и теоретическим распределением (чаще всего равномерным или нормальным).

Абсцисса – горизонтальная ось графика на которой чаше всего фиксируют значения или степень выраженности независимой переменной

Альтернативная гипотеза — статистическая гипотеза о наличии различий между выборками по тем или иным характеристикам (например, по средним значениям того или иного признака) или о значимости той или иной характеристики (например, коэффициента корреляции) в одной выборки. Альтернативная гипотеза – противоположность нулевой гипотезе.

Вариационный ряд – упорядоченный (по значениям признака) двойной ряд чисел – значений признака и соответствующих им вероятностей (частот).

Вариация — см. Дисперсия.

Вероятность — число между 0 и 1, отражающее относительную частоту появления события. Сумма альтернативных вероятностей равна 1.

Выборка — часть популяции. По результатам анализа выборки делают выводы о всей популяции, что правомерно только в случае репрезентативности выборки по отношению к популяции.

Генеральная совокупность — см. Популяция.

Гипотеза научная — утверждение, которое можно подтвердить или опровергнуть на основании результатов исследования.

Гипотеза статистическая — представление научной гипотезы в форме, приемлемой для проверки методами статистического анализа данных (см. нулевая и альтернативная гипотезы).

Гистограмма — способ графического задания распределения в виде столбиковой диаграммы без пропуска "пустых" (с нулевыми частотами) интервалов.

Гистограмма — способ графического задания распределения в виде столбиковой диаграммы без пропуска "пустых" (с нулевыми частотами) интервалов значений признака. На горизонтальной оси откладываются значения признака, на вертикальной – вероятности (частоты) значений, попадающих в тот или иной интервал квантования.

Дискретные случайные величины — признаки, принимающие числовые значения через некоторые интервалы (обычно равные 1) и выражаемые ограниченным набором значений (обычно целыми числами). Альтернатива непрерывным данным.

Дисперсия (вариация) — числовая мера разброса значений признака относительного среднего арифметического.

Достоверность — степень, с которой измерение отражает истинное значение измеряемого признака. Достоверность исследования (внутренняя обоснованность исследования) определяется тем, в какой мере полученные результаты справедливы в отношении данной выборки.

Зависимый признак — признак, значение которого может быть рассчитано по значениям других признаков.

Корреляция – взаимосвязь между двумя переменными (порядковыми или метрическими), характеризующая её направление, силу и уровень значимости.

Коэффициент корреляции – число, отражающее силу (тесноту) и направление взаимосвязи между двумя метрическими или порядковыми переменными. Интервал возможных значений коэффициента корреляции: от ­1 до +1.

Коэффициент линейной корреляции Пирсона – число, отражающее силу (тесноту) и направление взаимосвязи между двумя метрическими переменными. Интервал возможных значений коэффициента линейной корреляции: от ­1 до +1.

Линейная функция – функция вида , графиком которой является прямая линия.

Математическое моделирование – описание различных явлений, процессов (в том числе и социально-психологических) посредством математического аппарата с выделением основных факторов, влияющих на процесс, определением вклада каждого фактора, выявлением их взаимосвязи и вероятностным предсказанием протекания процесса и его результата.

Медиана – числовая мера положения распределения признака, значение признака, разделяющее выборку на две равные части. Для определения медианы удобно упорядочить значения признака от меньшего к большему по всей выборке.

Меры разброса (рассеяния) — статистики, описывающие вариабельность значений признака (дисперсия, стандартное отклонение, размах, интерквартильный интервал).

Мода – значение признака, наиболее часто встречающееся в исследуемой выборке. Распределения бывают унимодальными (с одной модой), бимодальными (с двумя модами) и полимодальными (с большим количеством мод).

Независимые (несвязанные) выборки — выборки, в которые объекты исследования набирались независимо друг от друга. Альтернатива независимым выборкам — зависимые (связанные, парные) выборки.

Непараметрический критерий – критерий проверки статистических гипотез, не требующий допущения о метрическом уровне измерения и нормальности распределения признака.

Непараметрические методы статистики — класс статистических методов, которые используются для анализа порядковых данных, а также для метрических данных, не образующих нормальное распределение.

Номинативная (номинальная, обозначений) шкала – совокупность символов для обозначения категорий признака (например, символы "м" и "ж" для признака "пол").

Нормальное (гауссово) распределение – распределение признака колоколообразной формы, унимодальное, симметричное, с одинаковыми значениями среднего арифметического, медианы и моды. Большинство психологических свойств имеют распределения близкие к нормальному. Большинство параметрических тестов разработаны для анализа распределений, подчиняющихся закону нормального распределения.

Нулевая гипотеза – статистическая гипотеза в форме утверждения об отсутствии различий (нулевых различиях) между теми или иными характеристиками двух распределений (например, между двумя средними значениями признака в двух выборках) или о равенстве нулю одной характеристики распределения (например, коэффициента корреляции Пирсона). Нулевая гипотеза – противоположность альтернативной гипотезе.

Описательная статистика — раздел статистики, задача которого – описание распределений исследуемых признаков в виде числовых характеристик (например, среднее арифметическое, медиана, дисперсия, стандартное отклонение).

Ордината – вертикальная ось графика, на которой чаще всего фиксируют частоту встречаемости значений переменной.

Параметрический критерий – критерий проверки статистических гипотез, требующий допущения о метрическом уровне измерения и нормальности распределения признака.

Параметрические методы статистики — класс статистических методов, используемых для анализа данных, которые образуют известное распределение (обычно нормальное). Названы так потому, что опираются на анализ параметров (числовых характеристик) нормального распределения.

Параметры рассеяния (разброса) — числовые характеристики распределения, отражающие вариабельность значений признака на выборке (дисперсия, стандартное (среднеквадратическое) отклонение).

Порядковые признаки — признаки, значения которых могут быть упорядочены (ранжированы), но интервал между этими значениями не может быть выражен количественно. Отражают только степень выраженности какого-либо качества изучаемых объектов.

Порядковая (ординальная) шкала – совокупность чисел для обозначения величин признака, значения которых могут быть упорядочены (по возрастанию или по убыванию), но интервал между которыми не определен: равным интервалам в числовой шкале не сопоставлены равные интервалы интенсивности измеряемого признака (например, интервалу в один балл в шкале школьных оценок не обязательно соответствует равное количество знаний между отличником, четверочником, троечником и двоечником).

Признак (переменная) — характеристика объекта исследования (наблюдения). Различают качественные и количественные признаки

Проверка (статистической) гипотезы — математический способ тестирования статистической гипотезы на конкретных данных. Решение принимается путем отклонения или не отклонения нулевой гипотезы об отсутствии различий. Не отклонение нулевой гипотезы — это признание существующих различий случайными. Принятие альтернативной гипотезы — это признание значимости различий (значимости воздействия изучаемого фактора).

Размах значений признака – разность между наибольшим и наименьшим значением признака в выборке.

Распределение признака на выборке — описание, связывающее значения признака на выборке с их частотами (вероятностями). Обычно представляется в виде графика: по оси абсцисс — значения признака, по оси ординат — частоты (вероятности) значений признака.

Регрессия – уравнение, связывающее значения независимого признака (независимых признаков) со значениями зависимого признака, или линия, соответствующая этому уравнению. Различают простые и множественные, линейные и нелинейные регрессии.

Регрессия линейная – регрессия в виде линейного уравнения или соответствующей этому уравнению прямой линии.

Регрессия нелинейная – регрессия в виде нелинейного уравнения или соответствующей этому уравнению линии.

Регрессия множественная – регрессия с двумя или более независимыми переменными.

Регрессия простая – регрессия с одной независимой переменной.

Репрезентативность выборки – возможность распространить полученные на выборке выводы на всю генеральную совокупность. Репрезентативность имеет две стороны – по составу и по количеству.

Связанные (зависимые) выборки — выборки, в которые участники исследования набирались парами (или с использованием какого-либо иного принципа) или состоящие из одних и тех же объектов исследования, обследованных в разные моменты времени.

Сопряженность — термин, применяемый для обозначения взаимосвязи качественных (номинальных) признаков.

Среднее значение — описательная статистика (параметр), являющаяся мерой центральной тенденции для приближенно нормально распределенных данных. Если распределение не соответствует закону нормального распределения, то для характеристики центральной тенденции следует использовать медиану.

Стандартное (среднеквадратическое) отклонение — описательная статистика (параметр), являющаяся мерой рассеяния для приближенно нормально распределенных данных, числовая характеристика разброса распределения признака равная квадратному корню из дисперсии.

Уровень статистической значимости (критический, пороговый уровень статистической значимости) — допускаемая исследователем величина α -ошибки, т.е. максимально допускаемая исследователем вероятность ошибочного отклонения нулевой гипотезы (об отсутствии различия между группами, об отсутствии взаимосвязи признаков и т.д.). Обычно за величину уровня значимости принимаются значения 0,05; 0,01 или 0,001.

Центральной тенденции параметры — статистические параметры распределения, отражающие наиболее типичные (средние) значения признака на выборке (среднее арифметическое, медиана, мода).

Шкала интервалов – совокупность чисел для обозначения величин признака, интервал между которыми определен (равным интервалам в числовой шкале соответствуют равные интервалы интенсивности измеряемого признака), но нулевая точка является договорной отметкой, а не показателем отсутствия измеряемого качества (например, шкала измерения температуры по Цельсию).

Шкала отношений – совокупность чисел для обозначения величин признака, интервал между которыми определен (равным интервалам в числовой шкале соответствуют равные интервалы интенсивности измеряемого признака), а нулевая точка является показателем отсутствия измеряемого качества (например, шкала измерения скорости).

Шкала рангов – частный случай порядковой шкалы, в которой значения признака ранжированы (по возрастанию или по убыванию).

Шкала числовая – система обозначений (качественных или количественных) для фиксации значений измеряемых величин. Шкалы бывают номинативные, порядковые, метрические (интервальные и отношений).

 

 







Конфликты в семейной жизни. Как это изменить? Редкий брак и взаимоотношения существуют без конфликтов и напряженности. Через это проходят все...

Живите по правилу: МАЛО ЛИ ЧТО НА СВЕТЕ СУЩЕСТВУЕТ? Я неслучайно подчеркиваю, что место в голове ограничено, а информации вокруг много, и что ваше право...

ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между...

ЧТО ПРОИСХОДИТ, КОГДА МЫ ССОРИМСЯ Не понимая различий, существующих между мужчинами и женщинами, очень легко довести дело до ссоры...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.