Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Графическое изображение статистического распределения. Гистограмма.





Для оценки вида функции распределения вероятностей по экспери­ментальным данным часто используют графический метод, связанный с построением гистограммы. Он состоит в следующем. Пусть проведено n измерений непрерывной случайной величины А. Обозначим мини­мальное значение случайной величины хмин., максимальное — хмакс..

Разобьем интервал, содержащий полученные значения величины А, на Кинтервалов одинаковой ширины х.

Подсчитаем количество значений случайной величины (частоту), попавших в каждый интервал xi (m = 1, 2, ..., к). Получим частоты встречаемости всех значений случайной величины, попадающих в интервал с номером i mi (i = 1, 2, ..., к), каждую частоту поделим на ширину интервала х.

Величина называется плотностью частоты. Затем на каждом интервале х, следует построить прямоугольник с основанием х и высотой

(или высотой плотностью относительной частоты Р*i=mi/n )

Полученную ступенчатую фигуру, состоящую из прямоугольников, называют гистограммой. (Гистограмма — от греческих слов «histos» — столб и «gramma» — запись).

Задача. В20 экспериментах непрерывная случайная величина А принимает значения: 21, 11, 17, 23, 28, 14, 19, 22, 24, 33, 16, 21, 18, 29, 23, 22, 31, 24, 27, 26. Построить гистограмму частот и гистограмму отно­сительных частот.

Решение.Находим среди данных минимальное и максимальное значения случайной величины:

Самым простым было бы разделить разность

Хmax --Хmin на равное число частей. Но часто эта разность не делит­ся нацело на требуемое число частей. В таком случае весь интервал несколько расширяется как в сторону меньших, так и в сторону боль­ших значений. В рассматриваемой задаче удобно выбрать х = 5. Тогда логично рассмотреть интервал (10, 35). Получаем, что в первый интервал (10—15) попадают всего два значения переменной х, равные 11, 14, то есть частота m1 = 2. Во второй интервал (15—20) попадают значения переменной, равные 17,19,16,18, из чего следует m2 = 4. Про­должая аналогичные рассуждения, составим таблицу, содержащую последовательность интервалов и соответствующих им частот — ста­тистический интервальный ряд распределения:



В общем виде статистический интервальный ряд распределения имеет вид таблицы:

Зная частоты и величину х, найдем плотности частот mi/ х и плотности относительных частот Например, для 1-го интерва­ла плотность частоты плотность относительной частоты

Данные обработки результатов представлены в таблице:

 

Замечание.Гистограммы на рис. 7 и 8 имеют один и тот же вид, что и следовало ожидать, исходя из метода обработки экспери­ментальных данных. Поэтому с точки зрения вида гистограммы не имеет значения, представлять ли данные в виде гистограммы плот­ности частот или гистограммы плотности относительных частот. Однако для установления вида функции плотности распределения вероятностей (ПРВ) необходимо пользоваться гистограммой плот­ности относительных частот. Это можно пояснить, рассматривая пре­дельный случай, когда объем совокупности очень большой, а интер­вал разбиения х — мал. Прямоугольники гистограмм будут узкими, и число их будет велико. Ступенчатая линия гистограммы станет мало отличаться от плавной кривой, которая и будет являться функцией У =f(Х)указывающей чему равна ордината у, соответствующая задан­ной абсциссе х. Приближенно предполагаемый вид функции ПРВ показан на рис.6 пунктирной линией. Кроме этого, представление экспериментальных данных именно в виде гистограммы плотности относительных частот необходимо, если ставится задача, например, сравнения вида распределений двух или нескольких совокупностей. В этом случае необходимо совмещение различных гистограмм, а это возможно только, если рассматриваются плотности относительных частот, что позволяет исключить зависимость от объема выборки и ширины интервала. Так, в клинической практике часто прихо­дится сравнивать разные группы пациентов, например: здоровые и больные, принимающие лекарство и не принимающие и т.п.; коли­чество пациентов в сравниваемых группах, как правило, не одина­ково (48 здоровых и 21 больной). В этом случае для сравнения можно пользоваться только гистограммой плотности относительных частот. Если же взять гистограммы плотности частот, то высота столбцов для здоровых (48) и больных (21) будет заведомо не одинакова.

При построении гистограммы весьма важно правильно выбрать ширину интервала ∆ х. Если число интервалов к будет мало (ширина интервала х — велика), следует ожидать, что частично информация о случайной величине может быть потеряна. С другой стороны, если К будет слишком велико ( х — мало), обработка результатов измерений будет излишне трудоемкой, не давая при этом существенного выигры­ша в информации.

 

 

Рис. 7. Гистограмма плотности частот

 

Рис. 8. Гистограмма плотности относительных частот

Практика показывает, что рационален выбор числа интервалов Кв зависимости от объема выборки с помощью таблицы:









Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2019 zdamsam.ru Размещенные материалы защищены законодательством РФ.