Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Графический анализ данных. Гистограмма





Важным способом «описания» переменной является форма ее распределения, которая показывает, с какой частотой значения переменной попадают в определенные интервалы. Эти интервалы, называемые интервалами группировки, выбираются исследователем. Обычно исследователя интересует, насколько точно распределение можно аппроксимировать каким-либо стандартным распределением, например нормальным. Простые описательные статистики дают об этом некоторую информацию. Более точную информацию о законе распределения можно получить с помощью графического анализа, а также с использованием специальных статистических критериев.

1. Построение гистограммы в Excel. Рассмотрим построение гистограммы в Excel с помощью «Пакета анализа»: Данные → Анализ данных → Гистограмма → ОК. После этого появится диалоговое окно (рис. 1.14), где в качестве входного интервала требуется ввести ссылку на ячейки, содержащие анализируемые данные. Установите флажок напротив слов Вывод графика и нажимаем OK.

Рис. 1.14

Кроме этого пользователь может выбрать необязательный параметр Интервал карманов - набор граничных значений, определяющих отрезки (карманы). Excel вычисляет число попаданий данных в диапазон между текущим началом отрезка и соседним большим по порядку, если такой существует. Если диапазон карманов не введен, то набор отрезков, равномерно распределенных между минимальным и максимальным значениями данных, будет создан автоматически.

2. Построение гистограммы в STATISTICA. Рассмотрим построение гистограмм в системе STATISTICA с помощью модуля Descriptive statistics.

Статистика → Основная статистика/Таблицы → Descriptive statistics → OK. Далее выбираем вкладку Normality (рис. 1.15), которая предназначена для исследования возможности аппроксимации эмпирического закона распределения нормальным законом.

Рис. 1.15

Если установить флажок на Number of intervals, переменная воспринимается программой как непрерывная случайная величина и можно указать число интервалов разбиения диапазона ее изменения для построения гистограммы или Frequency tables (таблицы частот). При этом можно указать критерии соответствия эмпирического распределения нормальному закону (например, Kolmogorov-Smirnov & Liliefors test for normality).

Если переменная является дискретной, то гистограмма визуализирует количественное соотношение различных значений переменной. Так, если установить флажок на Integer intervals, переменная воспринимается программой как дискретная случайная величина и число интервалов разбиения диапазона ее изменения определяется как число различных значений переменной.

После выбора всех параметров, предоставляемых программой, нажимаем кнопку Histograms. На рис. 1.16 показана гистограмма для показателя уровня безработицы.

Рис. 1.16

Гистограмма показывает, что исследуемая выборка плохо аппроксимируется нормальным законом распределения.

Задание для самостоятельной работы

1. Найти данные (в Интернете, журналах, статистических сборниках, справочниках). Используя средства Excel и STATISTICA, провести их группировку, графический анализ, вычисление и анализ описательных статистик.

2. В системе STATISTICA, используя возможности справки, рассмотреть различные способы графического представления данных.

Задание для самостоятельного изучения

Генератор случайных чисел

Важно отметить, что компьютер можно использовать не только для автоматизации выполнения рутинных расчетов в ходе анализа и обработки данных, но и как инструмент познания при исследовании математических моделей.

Цели задания

Знать – определения понятий «случайное число» и «псевдослучайное число».

Уметь – генерировать последовательность случайных чисел на интервале [0;1) и осуществлять их отображение на произвольный интервал [a; b).

Владеть – навыками генерации случайных чисел в различных программных средах.

Статистическое моделирование – построение математических имитаций случайных явлений или процессов. Это перспективное научное направление получило развитие в середине XX века в связи с ростом возможностей вычислительной техники и широко применяется для решения задач из различных областей человеческого знания. Например, расчеты систем массового обслуживания, расчеты качества и надежности изделий, задачи теории игр, задачи дискретной оптимизации, задачи финансовой математики, численное интегрирование, задачи динамики разреженного газа [1]. Появление методов статистического моделирования (Монте-Карло) в различных областях прикладной математики, как правило, связано с необходимостью решения качественно новых задач, возникающих из потребностей практики. Основа методов Монте-Карло – генератор случайных чисел (ГСЧ). О видах генераторов случайных чисел можно прочитать в [1,12].

Согласно [4], случайными числами будем называть возможные значения x k равномерно распределенной случайной величины x, где 0 £ x < 1. Т.е. при генерировании последовательности случайных чисел ξ1, ξ2,…, ξ n числовой промежуток [0; 1) покрывается равномерно: в интервалы равной длины попадает примерно одинаковое количество чисел.

Различают случайные числа, генерируемые каким-либо стохастическим устройством, и псевдослучайные числа, конструируемые с помощью арифметических алгоритмов.







Живите по правилу: МАЛО ЛИ ЧТО НА СВЕТЕ СУЩЕСТВУЕТ? Я неслучайно подчеркиваю, что место в голове ограничено, а информации вокруг много, и что ваше право...

Конфликты в семейной жизни. Как это изменить? Редкий брак и взаимоотношения существуют без конфликтов и напряженности. Через это проходят все...

ЧТО ПРОИСХОДИТ ВО ВЗРОСЛОЙ ЖИЗНИ? Если вы все еще «неправильно» связаны с матерью, вы избегаете отделения и независимого взрослого существования...

Что будет с Землей, если ось ее сместится на 6666 км? Что будет с Землей? - задался я вопросом...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.