Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Вибірка. Варіаційний та статистичний ряди





Графічне зображення статистичних рядів

Означення 1. Ламана лінія, ланки якої з’єднують точки . . . , називається полігоном відносних частот.

Полігон застосовують для дискретних статистичних рядів. Нижче подаємо полігон відповідно до табл. 6 (див.§2.1).

Рис.2

Можна побудувати також полігон частот ..., , але в цьому випадку приходиться все одно змінювати масштаб, бо - можуть бути великими, тому краще брати відносні частоти

На рис.3 подаємо полігон відносних частот росту за данними таблиці 3, які розміщені в 2-му і 5-му стовпцях (див.§2.1, табл.3). Таким чином, ми отримуємо наочне зображення розподілу росту у даний вибірці.

Рис. 3.

Означення 2. Комулятивною лінією статистичного ряду називається ламана лінія, яка побудована за точками ( ).

Кумулятивна крива росту див. на рис. 4.

Рис. 4.

 

Означення 3. Огівою називається ламана лінія, ланки якої з’єднують точки з координатами ( ).

Огіва росту показана на рис. 5

Рис.5.

 

Для графічного зображення інтервального розподілу застосовують гістограму.

Означення 4. Гістограмою частот називають ступінчату фігуру, яка утворена із прямокутників, основами яких є окремі інтервали ( ) довжиною h, а висоти дорівнюють відношенням (щільність частоти).

Рис. 6

 

На рис.6 зображена гістограма за даними таблиці 3. Гістограма показує розподіл значень варіант на відповідних інтервалах. У даному дослідженні розподілу росту можна собі уявити що на спортивній площадці відмічені у відповідному масштабі вздовж лінії (осі) інтервали, які відповідають таблиці 3. Тоді навпроти кожного з інтервалів, що перпендикулярно осі, вишикувати в ряд тих студентів, ріст яких попав у даний інтервал. Всі вишикувані ряди починаються на лінії, а закінчуються в залежності від кількості людей у даному ряду. На площадці вирисується ступінчата фігура, так звана „жива” гістограма, по формі подібна до фігури на рисунку 6.



Зауважимо, що площа і-того частинного прямокутника на рис.6 дорівнює - відносній частоті варіанти на і-тому інтервалі, а, значить, площа гістограми питомих відносних частот дорівнює сумі усіх відносних частот, тобто дорівнює одиниці.

Означення 5.Гістограмою питомих відносних частот називають ступінчату фігуру, утворену із прямокутників, основами яких є окремі інтервали довжини h, а висоти дорівнюють відношенню (щільність питомої відносної частоти).

 

Форма статистичних розподілів

Означення. Розподіл називається симетричним,якщо частоти всяких двох варіант, рівновіддалених від деякої середньої варіанти, рівні між собою.

На практиці точного збігу частот всіх варіант, рівновіддалених від середньої, у більшості немає. Тому симетричним вважається розподіл, у якого вказані частоти відрізняються одна від одної незначно.

Часто зустрічаються і несиметричні розподіли. Їх ділять на три види:

а) помірно асиметричні;

б) крайньо асиметричні;

в) U – подібні.

Помірно асиметричні – це такі розподіли у яких частоти варіант, що знаходяться по одну сторону від найбільшої частоти більші (менші) частот, рівновіддалених відносно найбільшої частоти.

Відповідно цьому розрізняють лівосторонню або від’ємну, і правосторонню або додатну асиметрію. На рис.7 показана правостороння асиметрія.

Рис.7

 

Крайньо асиметричні – це такі розподіли, у яких частоти або весь час зростають (рис.8), або весь час спадають (рис.9).

 

Рис.8 Рис.9

 

Розподіл називають U – подібним, якщо полігон (гістограма) мають вигляд, який зображено на рис. 10.

 

Рис.10.

 

 

Числові характеристики статистичного ряду

Середнє арифметичне

Означення 1. Середнім арифметичним варіаційного ряду (позначається ) називається сума значень всіх варіант, розділена на їх кількість(обсяг вибірки), тобто

(1)

Якщо ж окремі значення варіант повторюється з відповідними частотами , то сума (1) запишеться:

При = ,

= ,

,

= ,

,

=

 


Маємо

,

причому .

 

Означення 2. Середнім арифметичним статистичного ряду називається сума добутків значень варіант на відповідні частоти , розділена на обсяг вибірки (суму всіх частот):

(2)

Приклад 1. Кожна з двох груп, по 20, студентів здали іспит з такими результатами

Таблиця 1

Оцінки, „2” „3” „4” „5”
Кількість отриманих оцінок, , в I групі
в II групі

 

Знайти середній бал для кожної групи.

Розв’язання. За формулою (2) знаходимо середній бал для

I-ої групи

 

.

Середній бал для другої групи:

.

Як бачимо сереній бал в обох групах однаковий. В той же час друга група поступається першій хоча б тим, що має 4 невстигаючих студенти. В першій групі оцінки більше сконцентровані біля середнього арифметичного значення , в другій же – вони більш розсіяні відносно середнього . Отже, необхідні інші характеристики, які б враховували степінь розсіювання варіант відносно середньоарифметичного значення. Такими характеристиками є лінійне середнє арифметичне та дисперсія, які будуть розглядатись у наступних параграфах.

Приклад2. Розподіл місячного заробітку в бригаді робітників вийшов таким: по 450 грн. заробили 2-є робітників, по 540 грн. – 4, 590грн. – 3-є. Знайти розмір середнього заробітку в бригаді.

Розв’язання. Статистичний ряд має вигляд:

 

 

 

Середнє арифметичне дорівнює

 

 

Якщо ж статистичний ряд заданий інтервалами, то за беруть середини інтервалів.

Приклад3. Знайти середній ріст за даними таблиці 3.

Розв’язання.

Розглянемо деякі властивості середньої арифметичної величини.

Розв’язання.

І-ий спосіб. За означенням

;

ІІ-ий спосіб. Оскільки ; ; , то середнє арифментичне сталої , повтореної тричі, є ця ж величина, тому залишається знайти середнє арифметичне для чисел , , і додати до сталої результат: .

 

Приклад 2. Знайти середнє арифметичне статичного ряду

 

 

Розв’язання. Тут варіанти рівновідділені з кроком .

Позначимо через ту варіанту, якій відповідає найбільша частота. Це , бо її частота . Введемо допоміжну варіанту за формулою

.

 

Тоді: ;

Запишемо статистичний ряд для з тими ж частотами , які відповідають :

 

Знаходимо середнє арифметичне

Оскільки із виразу маємо

то

Можна перевірити, що

.

Перейдемо до загального викладу спрощеного способу.

Для статистичного ряду

... ...
... ...

де - рівновіддалені варіанти з кроком ,

або ,

знайти середнє арифметичне значення варіант.

Введемо допоміжні варіанти за формулою

, (1)

де -та із варіант , якій відповідає найбільша із частот .

Складемо статистичний ряд для допоміжних варіант

 

... ...
... ...
... ...

 


і знайдемо середнє арифметичне допоміжних варіант

. (2)

Тоді має місце.

 

Теорема. Середнє арифметичне значення основних рівновіддалених з кроком варіант дорівнює добутку середнього арифметичного допоміжного ряду на крок плюс значення тієї варіанти, якій відповідає найбільша із частот ряду, тобто

. (3)

Доведення. Із заміни (формула (1)) знаходимо

і підставляємо у формулу середнього арифметичного.

.

Отже, формула (3) доведена.

 

Приклад 3. Знайти середнє арифметичне за даними таблиці 3 (див. § 2.1, табл. 3), використовуючи спрощений спосіб,

 

 

.

Розв’язання. Найбільшою частотою у таблиці є =23, їй відповідає варіанта =175, позначимо її через , крок для рівновіддалених варіант

.

Вводимо допоміжні варіанти

,

Запишемо новий статистичний ряд

-1

Знаходимо

.

Тоді за формулою (3)

.

Отже, підтвердилось значення, знайдене раніше у прикладі 3 §2. 4. 1.

 

2.4.3. Середнє лінійне відхилення

 

У таблиці 1 (див. § 2.4.1, приклад 1) вже приводились результати здачі іспита у двох групах по 20 студентів в кожній.

 

Таблиця 1

Оцінки “2” “3” “4” “5”
Кількість оцінок у І групі
Кількість оцінок у ІІ групі

 

За даними таблиці було установлено, що середні бали у цих групах однакові ( ), тому для більш детального вивчення статистичних рядів необхідно враховувати розсіювання варіант відносно середнього арифметичного.

Для характеристики розсіювання використовуються середнє лінійне відхилення, а також дисперсія.

Означення. Середнім лінійним відхиленням називається середнє арифметичне абсолютних величин відхилень варіант від їх середньої арифметичної

. (1)

 

Приклад. За даними таблиці 1 знайти середні лінійні відхилення.

Розв’язання.

Оскільки середні арифметичні вже відомі , то за формулою (1) знаходимо

Отже, , ; , і це означає, що значення варіант (оцінок) у другій групі більш розсіяні ніж у першій.

Властивості дисперсії

Теорема 1. Якщо всі варіанти збільшити або зменшити у h разів, то дисперсія збільшиться або зменшиться у h2 разів.

Доведення.Враховуючи відповідну властивість для середньої арифметичної (див. в 2.4.1), маємо

Медіана статистичного ряду

Означення. Медіаною називається варіанта, яка находиться посередині варіаційного ряду.

Тобто медіаною є та варіанта, яка ділить варіаційний ряд на дві рівні за обсягом сукупності. До медіани і після неї однакова кількість членів варіаційного ряду. При знаходженні медіани дискретного ряду слід розрізняти два випадки:

1) обсяг сукупності непарний;

2) обсяг сукупності парний.

Нехай обсяг сукупності непарний і дорівнює тобто

.

У цьому ряду кожна варіанта повторена стільки разів, скільки вона зустрічається в обсязі, тому серед них можуть бути і однакові. Медіаною цього розподілу є варіанта з номером , оскільки вона знаходиться посередині ряду, до і після неї знаходиться по варіант, тобто

. (1)

 

Якщо обсяг сукупності парний, дорівнює , то немає варіанти, яка б ділила варіаційний ряд на дві рівні частини,. тому за медіану умовно приймають близькі до середини. Ними будуть варіанти з номером і номером , тобто

. (2)

Приклад.Знайти медіану варіаційного ряду, заданого таблицею 2 параграфа 2. 1.

Розв’язання. За даними таблиці 2 кількість варіант , тому , а . Під номером знаходяться значення , воно розміщене у ІІІ-му стовпці табл. 2, і за ним зразу ж наступне , тому

.

Відмітимо, що середня арифметична змінюється із зміною всякої варіанти, і вона особливо чутлива до зміни крайніх варіант. На значенні медіани зовсім не відбиваються зміни значень крайніх варіант, якщо тільки при цих змінах варіанти продовжують залишатись по тіж самі сторони відносно медіани.

Ця властивість медіани робить її більш вірною характеристикою варіаційного ряду в тих випадках, коли кінці розподілу за певних причин неточні або ненадійні.

 

Мода

Означення. Модою називається варіанта, яка найбільш часто зустрічається.

Для дискретного розподілу знаходження моди не вимагає якихось обчислень: нею є варіанта, якій відповідає найбільша частота.

Зауважимо,що при спрощеному обчисленні середнього арифметичного та дисперсії за допомогою умовних варіант, ми за сталу вибирали якраз моду.

Приклад. Дано розподіл оцінок студентів при перевірці знань з даного розділу

 

Оцінки „2” „3” „4” „5”
Кількість студентів

Знайти моду, середній бал. Визначити чи достатньо засвоєний матеріал.

Розв’язання.Найбільшою серед частот є їй відповідає - мода,

.

Знайдемо середний бал

.

Хоча середний бал відповідає задовільній оцінці, однак оскільки мода , то це означає що 13 студентів (половина групи) матеріал не засвоїла, а про всю групу можна сказати, що матеріал засвоєний недостатньо.

Біля моди групуються і інші варіанти з великими частотами, тому вона виявляє те значення ознаки, біля якого групується більша частина обсягу вибірки.

Коефіцієнт варіації

 

Щоб охарактеризувати, наскільки добре представляє середня арифметична статистичний ряд, використовують коефіцієнт варіації, який дорівнює вираженому у процентах відношенню середнього квадратичного відхилення і середнього арифметичного:

(1)

Якщо статистичні ряди мають однакові середні арифметичні, то середнє арифметичне з меншим коефіцієнтом варіації є більш представлюваним.

Наприклад, у §2.4.3. (приклади 1 та 2) ми розглядали результати здачі єкзамена у двох групах. Там знайшли середні квадратичні відхилення

і

при середніх арифметичних

.

Тепер їхні коефіцієнти варіації запищуться:

,

Якщо полігон статистичного ряду не має значних скошень у ліву чи праву сторону, і досліджувана ознака може приймати тільки додатні значення, то . Якщо коефіцієнт варіації , то, як правило, можна зробити висновок, що спостереження неоднорідні.

Моменти статистичного ряду

Означення. Початковим моментом статистичного ряду порядку називається середня арифметична -тих степенів варіант, тобто

.(1)

При отримаємо початковий момент нульового порядку:

.

Якщо , то отримаємо початковий момент першого порядку:

-це є середнє арифметичне.

 

Означення. Центральним моментом статистичного ряду -того порядку називаються середнє арифметичне - тих степенів відхилень варіант від їх середньої

. (2)

Якщо , то отримаємо центральний момент нульового порядку.

.

При маємо центральний момент першого порядку

,

бо за теоремою 3 про властивості середнього арифметичного

.

Центральний момент другого порядку запишеться у вигляді:

це дисперсія статистичного ряду.

Асиметрія і ексцес

Означення. Коефіцієнтом асиметрії називається відношення центрального моменту третього порядку до кубу середнього квадратичного відхилення:

. (1)

Якщо у варіаційному ряді переважають варіанти більші ніж , то коефіцієнт асиметрії додатній, і має місце правостороння асиметрія, див. рис. 1. 2.

 

 

а) б)

Рис. 1

Означення. Ексцесом або коефіцієнтом крутості називається зменшене на 3 одиниці відношення центрального моменту четвертого порядку до четвертого степеня середнього квадратичного відхилення:

.(2)

За стандартне значення ексцесу приймають . Криві, у яких , у порівнянні із нормальною кривою менш круті і називаються плоско вершинними (див. рис. 2.б).

Криві, у яких , більш круті, мають більш гостру вершину і називаються гостровершинними (див. рис. 2.а)

а) б)

Рис 2.

Задачі до глави II

1.Протягом 5 днів температура повітря складала 3 , 5 , 4 , 1 , 2 . Знайти середню температуру повітря.

2. Відомі оцінки учнів в сумі балів за 3 іспити 10, 10, 11, 9, 15, 12, 9, 12, 13, 9, 8, 11, 14, 13, 12, 9. Побудувати полігон, гістограму, кумуляту, огіву. Знайти , , , .

3. Дано розподіл оцінок студентів

 

Оцінки
Кількість студентів

 

Визначити, чи достатньо засвоєний матеріал?

 

У задачах 4, 5 скласти емпіричну функцію розподілу і побудувати її графік.

 

4.

5.

6.Для ряду, який задано на інтервалах, знайти .

Інтервали 36-38 38-40 40-42 42-44 44-46 46-48 48-50 50-52 52-54 54-56 56-58

7.Знайти .

2,6 3,0 3,4 3,8 4,2

8. Знайти . Побудувати гістограму відносних частот і функцію - відносних накопичених частот.

Урожайн. Жита (у/га) 9-12 12-15 15-18 18-21 21-24 24-27
Ділянки в гектпрах

Відповіді. 1. . 2. , , , . 3.Ні, оскільки , але (найбільш часто зустрічається оцінка “2”). 6. ; ; ; ; . 7. ; . 8. .

 

Вибірка. Варіаційний та статистичний ряди

 

У попередній главі розглядалось статистичне означення ймовірності з використанням статистичних рядів. Прикладами їх були таблиці 2 і 3 у § 1.4.

Як складаються статистичні ряди? Які числові характеристики для аналізу статистичного ряду необхідно знаходити? Як для наочності статистичний ряд описують графічно? Коротко ці питання будемо тут розглядати.

Нехай при одних і тих же умовах здійснено випробувань і кожного разу фіксуються значення певної спостережуваної величини. Отримані у результаті випробувань числа називаються вибіркою. Загальне число елементів або одиниць називається обсягом вибірки.

Методи обробки даних вибірки відносять до математичної статистики, яка опирається на апарат теорії ймовірностей.

Математична статистика для економічних спеціальностей вивчається окремим курсом. Ми тут розглянемо ті моменти математичної статистики, які допоможуть студентам краще усвідомити таке поняття теорії ймовірностей, як розподіл випадкових величин. Перейдемо до більш детального вивчення поняття вибірки. Елементи вибірки можуть характеризуватися однією або кількома ознаками.

Так швейні підприємства при випуску одягу враховують попит покупців на той чи інший розмір і зріст. Для більш точного прогнозування потрібно знайти закони розподілу таких ознак як розмір і ріст серед маси населення. Розмір у свою чергу залежить від співвідношення між ростом і вагою конкретної особи.

Нижче подаємо вибірку конкретних даних росту і ваги 54 студентів другого курсу однієї із спеціальностей. Розглянемо основні моменти обробки статистичного матеріалу: побудова статистичного та варіаційного рядів, обчислення основних числових характеристик, графічне зображення розподілу росту, ваги(гістограми) та ін.

В таблиці 1 записані дані вибірки згідно з порядком їх надходжень


Таблиця 1

№ п.п Ріст Вага № п.п Ріст Вага № п.п Ріст Вага
1. 19. 37.
2. 20. 38.
3. 21. 39.
4. 22. 40.
5. 23. 41.
6. 24. 42.
7. 25. 43.
8. 26. 44.
9. 27. 45.
10. 28. 46.
11. 29. 47.
12. 30. 48.
13. 31. 49.
14. 32. 50.
15. 33. 51.
16. 34. 52.
17. 35. 53.
18. 36. 54.

 

Із таблиці видно, що ознаки значення росту і ваги змінюються, або, як кажуть, варіюються при переході від одного номера до іншого. Якщо б не було цього варіювання, і ознака приймала б одне й теж значення, то не було б потреби у проведенні дослідження.

Значення ознаки в окремих членів сукупності (даних таблиці) будемо називати варіантами.

Після збору початкового матеріалу варіанти упорядковують у порядку зростання (або спадання). У таблиці 2 виписані варіанти росту із таблиці 1 у порядку їх зростання. Окремі варіанти повторюються по кілька разів.

Таблиця, в якій елементи вибірки упорядковуються за величиною їх зростання (або спадання) називаєтьсяваріаційним рядом.

Процес упорядкування елементів(вибірки) за зростанням (за спаданням) називається ранжуванням ряду.


Таблица 2









Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2019 zdamsam.ru Размещенные материалы защищены законодательством РФ.