Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Связь анализа данных с другими этапами исследования





Использование математических методов предполагает определенную формализацию реальности, построение ее модели. Поскольку данные предстают перед социологом в виде фактов, характер которых объясняется влиянием искомых закономерностей, элементами модели являются как объекты, так и закономерности, которые как бы являются "причинами" того, что факты имеют заданный вид. Построение такой модели предполагает выделение нескольких этапов, при этом корректность использования математического аппарата на любом из них тесно связана с принципами реализации других этапов, в том числе и таких, в которых не задействованы никакие математические методы.

Таким образом, моделирование реальности, включающее формирование представлений об объекте и предмете исследования, выделение и операционализация основных понятий, измерение объектов, реализация конкретного алгоритма анализа данных и интерпретация полученных результатов предстает в виде цельного процесса, каждый из этапов которого тесно связан и взаимообусловлен с остальными.

Основные цели анализа данных

На определенном этапе моделирования реальности в исходных данных условно выделяют два аспекта:

содержательный уровень(совокупность реальных объектов, т.е. то, что в теории измерения называют эмпирической системой с отношениями);

формальный уровень(совокупность математических конструктов, отражающих в результате измерения реальные объекты и отношения между ними - т.е. числовая система с отношениями).

Статистические методы анализа используют именно формальные данные, при этом они предстают в виде совокупности значений каких либо признаков (характеристик, переменных, величин и т.п.), измеренных для каждого из изучаемых объектов.



Каждый изучаемый объект рассматривается исследователем как последовательность чисел - значений для него некоторых признаков. Такие данные предстают в виде матрицы "объект - признак".

В соответствии с представлениями исследователя, связи между признаками, отображенными в матрице, объясняются определенными закономерностями.

Закономерность возникает как результат взаимодействия большого числа элементов, составляющих совокупность, и характеризует не столько поведение отдельного элемента совокупности, сколько совокупность в целом.

Любая выявленная в процессе научного исследования закономерность является определенного рода "сжатием" какой-то информации (в нашем случае - матрицы "объект- признак"). Результаты такого сжатия чаще всего выражаются в виде определенных характеристик частотных распределений значений рассматриваемых признаков. Можно сказать также, что результат сжатия - некоторые числа, которые характеризуют данные в целом.

Таким образом, выявление (подтверждение, корректировка) неких интересующих социолога статистических закономерностей, или, другими словами, - определенного рода сжатие, усреднение содержащихся в данных информации является основной целью анализа социологической информации. По выражению Дж. Тьюки, целью АД является "охват" содержания исходных данных значительного объема, который позволяет прийти к представлениям, легко доступным для понимания пользователя.

Помимо этого в качестве целей анализа данных выделяют:

● объяснение интересующего социолога явления

● описание исходных данных

● предсказание того или иного явления

Задача объяснения, которое понимается здесь как подведение явления под какой-либо закон, является актуальной для любого исследования. Объясняемым явлением может быть как сама совокупность наблюдаемых фактов (формальные данные), так и содержательные закономерности, определяющие характер исходных данных. В первом случае искомым законом будет коэффициент связи между определенными признаками (например, между образовательным уровнем и доходами), а во втором - некие содержательные представления о причинах, связывающих исходные данные (например, высокий образовательный статус подразумевает получение ответственной должности, которая оплачивается сравнительно более высоко).

Описание - начальный этап анализа, который служит для элементарного упорядочивания данных. Достигается оно обычно при помощи самых простых алгоритмов сжатия исходной информации. Совокупность наиболее употребительных приемов получения закономерностей, описывающих изучаемое множество объектов называют описательной или дескриптивной статистикой.

Прогнозтех или иных социальных характеристик или явлений служит целью выявления любой закономерности, поскольку изучать ту или иную сторону жизни общества нужно прежде всего для того, чтобы управлять какими-то процессами. Прогноз обычно осуществляется при помощи довольно сложных алгоритмов, например, регрессионного анализа.

Основные этапы анализа данных.

4 основных этапа анализа:

1. Описание совокупности данных

2. Уплотнение исходной информации.

3. Углубление интерпретации и переход к объяснению

4. Прогноз развития явлений.

Описание совокупности данных

А) Чистка массива.

● выявление ошибок и пропусков, допущенных в ходе сбора и ввода информации.

Здесь задача - поиск "выбросов" (неправильно забитых ответов респондента) и логических нарушений в ходе интервью (например, не сделанный переход).

● коррекция выборки.

Наиболее распространенным методом коррекции выборки является перевзвешивание. При его использовании, ответы более представленной категории респондентов учитываются с определенным коэффициентом (например, 0,9).

Б) Описание

● описание распределения данных по существенным с точки зрения целей и задачи признакам.

Здесь используются методы:

статистической группировки – строятся одномерные распределения;

меры центральной тенденции;

меры рассеяния, вариации.

Уплотнение исходной информации.

· укрупнение шкал (например, группировка возраста)

· расчет индексов и агрегированных показателей.

Цель данного этапа – сокращение числа признаков, необходимых для анализа.

Углубление интерпретации и переход к объяснению путём выявления возможных прямых и косвенных влияний по полученным агрегированным показателям.

Цель данного этапа – поиск статистических закономерностей в распределении данных.

Здесь же проверяются основные гипотезы, строятся выводы. На данном этапе основной применяемый метод – корреляционный анализ.

4. Прогноз развития социальных явлений

и процессов при определенных условиях.

Этот этап имеет место лишь в аналитических исследованиях. Происходит построение содержательных представлений об основе процесса.

Методы – регрессионный анализ и т.п.

ВЫБОРОЧНЫЙ МЕТОД В СОЦИОЛОГИЧЕСКОМ ИССЛЕДОВАНИИ. ОСНОВНЫЕ ПОНЯТИЯ.

 

Выборочный методпозволяет делать заключения о характере распределения изучаемых признаков генеральной совокупности на основании рассмотрения некоторой ее части — выборочной совокупности; предполагает различные способы ее формирования, обеспечивающие возможность распространения выводов, полученных при ее рассмотрении, на изучаемую (генеральную) совокупность.

Основное назначение:применяется для того, чтобы, изучив характеристики минимума объектов, произвести по ним оценку параметров генеральной совокупности. Он значительно со кращает затраты труда, времени, средств на решение той или иной проблемы; повышает качество и надежность процедур сбора и обработки данных; позволяет изучать объекты, сплош ное исследование которых невозможно из-за большого объема затрат.

Область применения:неприменим для изучения объектов, элементы которых не обладают качественной однородностью признаков, значимых с точки зрения целей исследования.

Основные нормативные требования:каждый элемент генеральной совокупности должен иметь определенную, принципиально задаваемую вероятность попасть в выборку. Предполагает наличие необходимой системы показателей генеральной совокупности, отражающих ее качественные и количественные характеристики.

Основные понятия:

Генеральная совокупность— множество объектов, являю щихся предметом изучения в пределах, очерченных программой социологического исследования и территориально-временными границами.

Выборочная совокупностьпредставляет собой модель гене ральной совокупности, результат определенным образом по строенного извлечения части элементов генеральной совокупно сти, выступающих в качестве объектов наблюдения. Расчет выборочной совокупности: n=δ2t2/∆2,

где n – объем выборки, δ – дисперсия (степень однородности исследуемых единиц анализа), t – коэффициент доверия (заданная точность), ∆ - предельно допустимая ошибка выборки (обычно берут до 5%).

Что бы найти дисперсию надо хорошо знать структуру генеральной совокупности. Δ=√∑(хi-x)2/N , где N – объем генеральной совокупности, xi – значение исследуемых параметров, x – среднее число параметра.

Существует еще одна формула: n=(0,25t2N)/(A2N+0,25t2), где n – объем выборочной совокупности, N- объем генеральной, t2- число определяемое по спец. таблицам с учетом предельной ошибки выборки и доверительной вероятности, A – предельная ошибка выборки.

 

Основа выборки— перечень элементов генеральной совокупности, который удовлетворяет требованиям полноты, точности, адекватности, удобства работы с ним, отсутствия дублирования единиц анализа. В качестве основы могут служить алфавитные списки сотрудников учреждения, домовые книги, картотеки от дела кадров. Наиболее полно удовлетворяют требованиям выборки социальные карты организаций, регионов, представляющие собой пространственные распределения показателей для определенных организаций или регионов и включающие демографические, экономические, политические и другие социальные показатели.

Единицы отбора— элементы генеральной совокупности, отбираемые на каждом этапе выборки.

Единицы анализа— элементы сформированной выборочной совокупности, подвергающиеся непосредственному исследованию.

Дисперсия— разброс (отклонения) отдельных значений признаков элементов генеральной или выборочной совокупности (от средней величины признака). При нулевой дисперсии все единицы отбора имели бы одинаковое, равное среднему значению распределение признаков, и для выборки достаточно было бы одной единицы, чтобы обеспечить репрезентативность данных. Чем больше дисперсия, тем больший объем выборочной совокупности потребуется для дальнейшего исследования.

Репрезентативность— свойство выборочной совокупности представлять параметры генеральной совокупности, значимые с точки зрения задач исследования. Она означает, что с некоторой наперед заданной или вычисленной погрешностью можно отождествить установленное на выборочной совокупности распределение изучаемых признаков с их действительным распре делением в генеральной совокупности. Оценка репрезентативности выводится на основе анализа и расчета ошибок: процедурных (допущенных при регистрации признаков) и случайных (зависящих от степени изменчивости изучаемого признака).Ошибкой репрезентативности называется отклонение характеристик выборки, имеющее статичную природу, от истинных значений этих характеристик в генеральной совокупности. Она рассчитывается: М= , Где n объем выборки, G дисперсия признака.

, где S дисперсия генеральная.

 









Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2018 zdamsam.ru Размещенные материалы защищены законодательством РФ.