Непараметричні показники зв’язку

Методи кореляції і регресії орієнтовані на виявлення і оцінку

тісноти зв’язку між кількісними показниками.

Статистика одночасно оцінює наявність і вимірює тісноту зв’язку і між якісними показниками, для чого застосовуються непараметричні методи.

Серед значної кількості непараметричних методів розглянемо метод, який дозволяє досліджувати зв’язки паралельних рядів не на основі первинних даних, а на основі рангів.

Ранжування - це упорядкування досліджуваних об’єктів на основі переваг. Згідно з ранжуванням кожній одиниці сукупності присвоюється порядковий номер ряду, який надається їй за рівнем ознаки. Таким чином, ряд значень ознаки ранжується, а номер кожної окремої одиниці буде її рангом. Ранг – це порядковий номер значень ознак, установлений в порядку зростання або зменшення їх величин.

Для ранжованих об’єктів показником зв’язку є коефіцієнт рангової кореляції.

Серед непараметричних методів для визначення тісноти зв’язку між ознаками на практиці використовуються коефіцієнти рангової кореляції Спірмена () і Кендалла ().

Коефіцієнт рангової кореляції Спірмена обчислюється за такою формулою:

(9.19)

де n- кількість одиниць вибіркової сукупності;

d2=(Rx – Ry)2 Rx – ранг факторної ознаки;

Ry – ранг результативної ознаки.

Коефіцієнт кореляції рангів Кендалла визначається за формулою:

. (9.20)

Порядок розрахунку цього показника такий:

а) значення х і у ранжуються, тобто визначаються Rx і Ry;

б) значення Rx записуються суворо в порядку зростання або, навпаки, зниження (Rx =1;2;3; …; n);

в) ранги результативної ознаки (Ry) розміщуються в порядку, які відповідають значенню “х” в початкових даних;

г) для кожного значення Ry підраховують число наступних за ним рангів більш високого порядку. Загальна сума таких випадків, які враховуються зі знаком “+”, позначається буквою Р;

д) аналогічно для кожного значення Ry послідовно підраховується кількість наступних за ним рангів, менших за значенням. Вони враховуються зі знаком “-“, а загальна сума позначається буквою Q;

ж) визначається загальна сума S = P + Q.

Величина коефіцієнтів рангової кореляції знаходиться в межах: -1

Приклад розрахунків коефіцієнтів рангової кореляції Спірмена і Кендалла розглянемо на підставі даних таблиці 9.4.

Таблиця 9.4 - Обсяг йоду у воді та їжі і захворювання населення зобом

Кількість йоду у воді та їжі, г (х) Захворювання населення зобом, % (у) Ранг     d=Rx-Ry     d2 Підрахунок балів
  Rx   Ry   “ + ”   “ – “
  0,2     -6   -  
  0,6     -4   -  
  1,1     -1      
  0,8     -1   -  
  2,5     +2   -  
  4,4     +4   -  
  16,9     +6   - -
Разом - - -     Р=1 Q=-20

На підставі результатів розрахунків, наведених в таблиці 9.4, обчислимо:

коефіцієнт рангової кореляції Спірмена

;

коефіцієнт рангової кореляції Кендалла:

.

Значення розрахованих коефіцієнтів рангової кореляції свідчать, по-перше, про значний вплив обсягу споживання йоду, який міститься у їжі та воді, на рівень захворювання зобом і, по-друге, між досліджуваними показниками є обернений зв’язок, який дозволяє зробити такий висновок - зі збільшенням споживання йоду захворювання зобом знижується.

Питання для самоконтролю:

1. Наведіть приклади статистичних зв’язків.

2. В чому відмінність між функціональною і стохастичною залежністю?

3. Визначіть основні етапи проведення кореляційного і регресивного аналізу.

4. Які види рівнянь вам відомі?

5. Якими методами визначаються параметри рівнянь?

6. Дайте інтерпретацію економічної суті параметрам рівнянь.

7. За допомогою яких показників визначається тіснота зв’язку між результативною ознакою і факторіальними ознаками?

8. З якою метою і в яких напрямках використовуються рівняння часового тренда?

9. В яких випадках використовуються непараметричні методи вивчення зв’язків?

10. Як оцінюється тіснота зв’язку в ранжованих ознаках?

Задачі

9.1. Є такі дані про строк збирання і урожайність кукурудзи:

Строк збирання, дні                    
Урожайність кукурудзи, ц/га                    

Визначити взаємозв’язок між наведеними показниками за допомогою парного лінійного рівняння і обчислити:

а) параметри рівняння;

б) парний лінійний коефіцієнт кореляції;

в) коефіцієнт еластичності;

г) середню помилку апроксимації.

Обгрунтувати напрямок зв’язку і зробити висновки.

9. 2. Вихід цукру (відношення кількості одержаного цукру до обсягу перероблених буряків, %) і цукристість буряків (вміст цукру в буряках, %) характеризуються такими даними:

Вихід цукру, % 11,7 12,9 11,2 12,8 13,2 13,4 13,1 12,4 12,0 12,5
Цукристість буряків, % 15,4 13,3 14,8 16,5 16,7 16,9 16,1 16,0 15,7 16,2

Взаємозв’язок наведених показників описати парним лінійним рівнянням.

Визначити:

а) параметри рівняння;

б) парний лінійний коефіцієнт кореляції;

в) середню помилку апроксимації.

Зробити висновки.

9.3 Динаміка рівня механізації робіт характеризуються такими даними:

Рівень механізації, робіт %              
Роки (t)            

За наведеними даними побудувати лінійне рівняння тренда, оцінити його за допомогою парного лінійного коефіцієнта кореляції і середньої помилки апроксимації. На основі одержаного рівняння скласти прогноз рівня механізації робіт на наступні п’ять років.

9.4 Урожайність сільськогосподарської культури в залежності від кількості внесених добрив характеризується такими даними:

Внесено добрив, ц/га                    
Урожайність, ц/га                    

Взаємозв’язок показників описати за допомогою квадратичного рівняння.

Визначити:

а) параметри рівняння;

б) кореляційне відношення;.

в) середню помилку апроксимації.

Зробити висновки.

9.5 Є такі дані по магазинам району:

Товарообіг, тис.грн.                    
Витрати обігу, тис. грн.                    

Для оцінки тісноти зв’язку між показниками визначити коефіцієнти рангової кореляції Спірмена і Кендалла.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: