Тема 3а. Ряди розподілу

3а.1 Загальне поняття і види рядів розподілу

3а.2 Ранжируваний ряд і його графічне зображення

3а.3 Дискретний ряд і його графічне зображення

3а.4 Правила побудови інтервального ряду і його графічне зображення

3а.5 Абсолютні і відносні величини

З раніше сказаного ми установили, що в результаті групування первинних статистичних матеріалів одержують ряди цифрових показників, згрупованих за тією чи іншою ознакою. Такі ряди називаються статистичними. За своїм змістом вони підрозділяються на ряди розподілу і ряди динаміки.

Рядами розподілу називаються ряди, що характеризують розподіл одиниць сукупності на групи за якою-небудь ознакою. Тобто це не що інше як групування.

Якщо ряд розподілу утворений за атрибутивною ознакою – він називається атрибутивним. НАПРИКЛАД, розподіл населення за статтю, освітою, на міське і сільське і т.п.

Якщо ж він утворений за кількісною ознакою – варіаційним. НАПРИКЛАД, розподіл населення за віком, розміру доходу і т.п.

Існує три форми варіаційного ряду:

– ранжируваний (впорядкований) ряд;

– дискретний ряд;

– інтервальний ряд.

Ранжируваний ряд – це перелік окремих одиниць сукупності розташованих у порядку зростання (чи убування) досліджуваної ознаки.

НАПРИКЛАД:

Таблиця 3а.1 – Перелік районів області за врожайністю зернових

Райони Врожайність, ц/га
Ямпільський 15,2
С.-Будський 15,5
Шосткинський 16,0
Роменський 31,3

З побудови ранжируваних рядів і починається перший етап обробки й аналізу результатів статистичного спостереження.

НАПРИКЛАД: ми хочемо перевірити (дослідити) наскільки правильна вага шоколадних батончиків, що випускаються Тростянецькой фабрикою, знаючи, що вага кожного батончика повинна бути 50 г.

Спостереження шляхом зважування 20 наявних у продавця штук дало наступні результати:

52,7 51,0 49,3 49,5 50,0 49,7 51,4 50,2 50,0 49,8 50,5 47,7 50,0 50,3 49,0 50,1 49,1 51,3 51,5 52,4.

Ці числа ми записали в ряд у порядку результатів зважування. Ніякій упорядкованості і послідовності тут немає. Тому такий ряд називається неупорядкованим. Зробити які-небудь висновки й аналіз на основі цього ряду дуже важко, тому першим етапом обробки ряду спостережень є ранжирування результатів спостережень. Тобто значення ознаки (вага батончика) розташовуються в порядку зростання чи убування.

У результаті одержимо ряд, називаний ранжируваним:

47,7 49,0 49,1...51,5 52,4 52,7.

Ранжируваний ряд уже дозволяє зробити деякі висновки про коливання (варіювання) ваги батончика.

Він показує, що найменша вага з ряду спостережень дорівнює 48,7 м, а найбільша дорівнює 52,7 г. Крім того, він показує як розташувалися інші результати між мінімальною і максимальною вагою.

Таким чином, основною позитивною якістю ранжируваного ряду є те, що:

– він дає можливість побачити результати спостереження в упорядкованому виді;

– характеризує всю сукупність і кожну її одиницю окремо.

НАПРИКЛАД: при вивченні продуктивності праці робітників однієї і тієї ж професії досить побудувати ранжируваний ряд. Він відразу дасть чітку картину розходжень у виробітку окремих робітників.

Для більшої наочності й аналітичності, з метою створення повного образу досліджуваного явища, ранжируваний ряд зображують графічно.

При цьому на осі абсцис відкладається число одиниць сукупності, а на осі ординат – значення відповідних ознак, тобто результатів спостереження.

Поставивши перпендикуляри, висота яких дорівнює значенню ознаки кожної одиниці сукупності, одержимо ряд вертикальних ліній. З'єднавши їхньої вершини одержимо криву, яка називається огіва (та, що огинає варіанти).

У випадку, якщо ознаки, що варіюють, носять дискретний характер (цілі числа) - огіва здобуває східчастий вид.

У нашому прикладі з батончиками це буде виглядати в такий спосіб:

Рис. 1. Приклад огіви

За крутістю огіви і за розривами можна судити про ступінь однорідності даної сукупності.

Віддаючи належне відміченим позитивним якостям ранжируваних рядів, треба, разом з тим визнати, що вони малопоказові.

Це особливо виявляється у випадках, коли досліджувана сукупність складається з великої кількості одиниць.

Навіть представивши її у виді ранжируваного ряду, ми одержимо настільки громіздкий матеріал, що аналізувати його буде дуже складно.

Тому звичайно переходять до більш компактних і зручних форм варіаційного ряду: дискретного чи інтервального.

При цьому ранжируваний ряд може бути основою для побудови таких рядів.

Дискретний ряд формують у тих випадках коли:

– ознака, що варіює, виражається тільки цілими числами (число дітей у родині, верстатів у цеху, студентів у вузі і т.д.);

– число значень ознаки, що варіює, не дуже велико, тобто якщо ознака варіює в невеликих межах.

Дискретний ряд являє собою групову таблицю, що складається з двох стовпців чи рядків. В одному з них розташовуються конкретні значення ознаки, що варіює, так звані варіанти, в іншому - частоти, що показують як часто (скільки разів) зустрічаються в одній сукупності кожні значення ознаки (варіанта). В другому стовпці (рядку) можуть бути і відносні числа – частки, що показують частку частоти окремих варіант у загальній сумі частот.

Сума всіх часток дорівнює одиниці чи 100 % (якщо вони виражені в %). Частки звичайно позначають через , тобто:

.

У загальному виді дискретний ряд можна представити таким чином:

Варіанти (Х) Частоти (f) Частки (w)
Х1 f1 w1
Х2 f2 w2
 
Хn fn wn
Разом: åfi 100 %

Графічно дискретний ряд зображується у вигляді полігону (багатокутника) розподілу частот у прямокутній системі координат. На осі абсцис відкладається значення ознаки, що варіює, (Х), на осі ординат - частота (f).

НАПРИКЛАД, дискретний ряд розподілу міст області за кількості заводів у них можна представити в такий спосіб:

Рис. 2 Приклад полігону.

Слід зазначити, що дискретні варіаційні ряди в практиці статистичної роботи застосовуються нечасто.

Як підкреслювалося вище, вони застосовуються в тих, випадках, коли варіюча ознака приймає невелику кількість значень, тобто зустрічається в малій кількості варіантів.

Більш поширені інтервальні варіаційні ряди. Вони застосовуються коли число варіант ознаки велике і коли ознаки приймають будь-яки значення – як цілі, так і дробові.

У загальному вигляді інтервальний варіаційний ряд являє собою групову таблицю, що теж складається з двох стовпців (рядків). Один з них складається зі значень ознаки, що варіює, згрупованих у певні інтервали –варіанти, інший – число одиниць сукупності, що попадають у даний інтервал –частоти.

Значення ознаки, що варіює, з якого починається той чи інший інтервал, називається нижньою межею інтервалу, а значення ознаки, яким закінчується інтервал - верхньою його межею.

Таким чином, інтервальний варіаційний ряд, це ряд, у якому варіанти об'єднані у визначені інтервали.

ПРИКЛАД: побудуємо інтервальний ряд розподілу 20 спостережень ваги згадуваного раніше шоколадного батончика.

У нас уже є ранжируваний ряд, у якому результати спостережень розташовані в порядку зростання. Щоб перетворити його в інтервальний, треба утворити групи у вигляді інтервалів. Тобто треба установити величину інтервалу, яка і буде в основі інтервального ряду.

Візьмемо, як приклад, розподіл ваги шоколодного батончика. Тоді розмір інтервалу буде (г).

Кількість груп підбіраємо у такому випадку експертним шляхом. Тоді інтервальний ряд буде мати вигляд:

Вага батончиків, м (Х) Число батончиків з даною вагою (f)
47,7 – 48,7  
48,7 – 49,7  
49,7 – 50,7  
50,7 – 51,7  
51,7 – 52,7  
Разом:  

Розглядаючи побудований ряд відразу можна сказати, у яких групах спостерігається скупчення випадків, тобто яка вага є переважною, яка зустрічається рідко і т.д.

Отже, інтервальний ряд є більш показовим.

Графічно интервальный ряд зображується у вигляді так званої гістограми (гістос – тканина, будівля; графо – писати).

Техніка її побудови відрізняється від побудови полігона тим, що одному значенню ординати тут відповідає два значення абсциси – верхня і нижня межі інтервалів.

Тому на графіку утвориться не точка, як у полігоні, а лінія, що з'єднує два значення абсциси.

Ці горизонтальні лінії з'єднуються один з одним вертикальними лініями і виходить східчастий багатокутник.

Рис.3 Приклад гистограми

Масштаб по вертикалі звичайно установлюють від нуля, по горизонталі – від тих значень, з яких починається нижня межа ознаки, що варіює.

Побудова інтервалу і інтервального ряду.

Інтервали підрозділяються на закриті і відкриті.

Закритим називається інтервал, у якого є обидві межі – верхня і нижня.

Відкритим називається інтервал, що має одну межу – або верхню, або нижню.

НАПРИКЛАД: при групуванні міст за кількостю населення можна зустріти два таких інтервали: «менш 3 тис. чол.» і «500 і більш тис. чол.». У першому випадку не позначена нижня межа, у другому – верхня. Наявність таких інтервалів, звичайно, небажано, але часом – неминуче, тому що практично буває важко вказати інший інтервал.

При побудові інтервального ряду необхідно:

1. Визначити кількість груп, на які буде розбита вся сукупність. Занадто велике їхнє число робить ряд громіздким і утрудняє аналіз, роблячи ряд менш доступним для огляду.

Тому питання про кількість груп у кожному конкретному випадку вирішується окремо, у залежності від мети й об'єкту дослідження.

На практиці найчастіше будують варіаційні ряди з 4-11 груп, чи розраховують їхню кількість за формулою, запропонованою американським статистиком Стержессом:

,

де – число груп;

– чисельність сукупності.

2. Установити величину інтервалу. Якщо кількість груп визначена, то величина інтервалу встановлюється звичайно на основі крайніх значень ознак ранжируваного ряду.

Тобто береться різниця між максимальним і мінімальним значенням ознаки, що варіює, і поділяється на кількість груп. Отриманий результат при необхідності округляють і одержують, таким чином, величину інтервалу, тобто:

,

де – число груп.

ПРИКЛАД: нехай є дані про врожайність зернових культур у колективних сільгосппідприємствах (КСП) Сумської області. Необхідно побудувати варіаційний ряд. Крайні члени ранжируваного ряду 5 ц/га і 19 ц/га.

При утворенні 7 груп розмір інтервалу . (Слід зазначити, що інтервали можуть бути і нерівними).

3. Побудувати шкалу інтервалів. Тобто побудувати перший стовпчик ряду, що показує межі інтервалів. При цьому необхідно мати на увазі наступне.

На практиці часто буває так, що верхня межа одного інтервалу збігається з нижньою межею наступного. При цьому неясно до якої групи повинні бути віднесені одиниці сукупності, числові значення ознаки в якій збігаються з однієї з межею.

НАПРИКЛАД: візьмемо групування міст країни за чисельністю жителів:

Менш 3 тис.

Від 3 до 5 тис.

Від 5 до 10 тис.

У яку з груп, наприклад, віднести місто з населенням 5 тис. чол.? Якщо немає пояснень, то існує правило: вважати нижню межу інтервалу – включно, а верхню – винятково.

Тобто, місто з 5 тис.чол. треба включити в групу від 5 до 10 тис.

Узагалі ж необхідно будувати шкалу інтервалів таким чином, щоб верхня межа одного інтервалу трохи відрізнялася від нижньої межі наступного.

НАПРИКЛАД, при групуванні за 5-річними віковими групами інтервали звичайно будують так: 0 – 4 роки, 5 – 9, 10 – 14, 15 – 19 і т.д.

При побудові інтервального ряду велике значення має також принцип його побудови.

Існують наступні принципи побудови інтервальных рядів:

1. Арифметичний (рівності інтервалів);

2. Геометричний;

3. Типологічний.

Вибір того чи іншого принципу залежить від ступеня однорідності сукупності.

1. Якщо сукупність цілком однорідна за складом і останній член ранжируваного ряду в невелике число разів перевищує початковий – застосовують принцип рівності інтервалів (арифметичний). Тобто утворюють групи з рівними інтервалами, у яких ряд нижніх границь, наприклад, утворить арифметичну прогресію.

Як приклад можна привести вже згадуваний варіаційний ряд розподілу КСП області за врожайностю зернових.

Розподіл КСП області за врожайностю зернових

Врожайність (ц/га) Число КСП
5 – 7  
7 – 9  
9 – 11  
11 – 13  
13 – 15  
15 – 17  
17 – 19  
Разом:  

Тут, у цій шкалі, кожен інтервал дорівнює 2 і ряд меж утворить арифметичну прогресію, а останній член ряду менш чим у 4 рази перевищує початковий. Тому зручно застосувати арифметичний принцип.

2. Якщо ж значення досліджуваної ознаки варіюють у великих межах, то доцільно застосувати принцип кратних інтервалів (геометричний).

У цьому випадку (у цій шкалі) інтервали не рівні один одному, а безупинно збільшуються за законами геометричної прогресії.

Як приклад можна привести розподіл КСП за чисельністю дворів, які входять у КСП (зі статистичного збірника):

  Число дворів у КСП Величина інтервалу (різниця між нижніми межами; або «від і до»)
20 – 29  
30 – 49  
50 – 89  
90 – 169  
170 – 329  

У цьому ряді розподілу інтервал не однаковий, а безупинно росте за законом геометричної прогресії зі знаменником, рівним 2.

3. У випадку, якщо статистична сукупність різнорідна за складом, в основу побудови інтервального ряду закладається економічний критерій. Він дозволяє згрупувати сукупність у групи, однорідні в соціально-економічному відношенні за типами. Тому цей принцип і називається типологічним.

ПРИКЛАД: розподіл міст за кількістю жителів. Міста настільки значно відрізняються за числом жителів, що єдино можливий принцип їхнього розподілу на групи – типологічний. Тобто формування груп з однорідних типів міст на основі ознаки числа жителів. У цьому випадку величина інтервалу не однакова і визначається типологічною структурою сукупності.

Розподіл міст за кількістю жителів

Число жителів (тис.) Величина інтервалу (тис. жителів) Число міст
  1939 г.   1959 г.   1970 г.
До 10      
10 – 19        
20 – 49        
50 – 99        
100 – 499        
Разом:        

Дана таблиця показує, що величина інтервалу безупинно росте, але в основі росту немає якого-небудь математичного закону. Проте, саме в наведеному групуванні можна бачити картину змін, що відбулися в містах.

Загалом же величина нерівних інтервалів визначається в кожному конкретному випадку з урахуванням особливостей об'єкта вивчення.

Перетворення інтервальних рядів.

У інтервальних рядах з нерівними інтервалами аналіз і порівняння частот і чисельності окремих груп є дуже складною справою, тому що зі зміною інтервалу змінюється чисельність груп і характер розподілу.

Тому в рядах з нерівними інтервалами здійснюєтьсявиробляється перетворення абсолютних чисел, що складають ряд, у показники, зручні для порівняння й аналізу.

Найбільш простим з перетворень є застосування відсотків. Для цього загальне число усіх випадків (суму частот) приймають за 100 %, а потім розраховують скільки відсотків приходиться на кожну групу.

У результаті одержуємо питому вагу кожного випадку (частоти) у сумі усіх випадків, що значно полегшує аналіз і сприяє наочності даних (частки).

Зіставлення частот, за наявності нерівних інтервалів, вимагає також уведення поправки, яка б нівелювала нерівність інтервалу.

З цією метою використовують щільність розподілу, що розраховується як відношення частот чи частосток до величини інтервалу. .

Тобто, шляхом ділення частоти інтервалу на його величину уводиться поправка на нерівність інтервалу.

Щільність розподілу може бути абсолютної, якщо вона розраховується на основі частот, і відносною, якщо розраховується за частками: .

Для різних цілей буває доцільним здійснити ще одне перетворення ряду розподілу. Воно полягає в побудові ряду накопичених частот (кумулятивного ряду).

Цей ряд показує скількох випадків було нижче чи вище визначеного рівня. Тобто, скільки випадків було «менш чим» чи «більш ніж».

НАПРИКЛАД, скільки шоколадних батончиків було вагою до 49,9 г і скільки понад 50 г.

Графічно кумулятивний ряд зображується у вигляді кумуляти – кривої, подібної огіві при графічному зображенні ранжированого ряду.

При побудові кумуляти ознаку, що варіює, відкладають (звичайно це центр інтервалу) на осі абсцис, а на осі ординат – накопичені частоти.

Перетворення рядів переслідує, насамперед, мету виявити закономірності розподілу.

Для того, щоб на основі випадкових спостережень можна було б одержати закономірний результат, необхідно щоб вступив у силу Закон великих чисел. А для цього потрібно, щоб на кожну групу приходилося б не декілька, а десятки і сотні спостережень. Тобто треба прагнути, по можливості, збільшити число спостережень. Це самий вірний спосіб «змусити» ряд розподілу виявити закономірність.

Якщо ж не представляється можливим збільшити число спостережень, то виявлення закономірності можна досягти зменшенням числа груп, тобто збільшенням інтервалу.

А у випадку нерівних інтервалів – обчисленням щільності розподілу.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: