Проста прямолінійна кореляція

 

Найповніше в статистиці розроблена методологія парної кореляції, що розглядає вплив варіації однієї факторної ознаки на результатний. Дослідження парної кореляції здійснюється на основі кореляційного аналізу, який припускає послідовне вирішення ряду завдань:

• Виявлення зв'язку;

• Опис зв'язку в табличній і графічній формах;

• Вимірювання тісноти зв'язку;

• Формулювання виводів про характер існуючого зв'язку.

Завдання виявлення зв'язку між факторною і результативною ознаками може бути вирішена за допомогою наступних прийомів: - візуалізація зв'язку (побудова і візуальний аналіз кореляційного поля); - використання результатів аналітичного угрупування і ін. Кореляційним полем є точковий графік в системі координат {x,y}. Кожна крапка відповідає одиниці сукупності. Положення крапок на графіці визначається величиною двох ознак - факторного і результативного. Точки кореляційного поля можуть розташовуватися на графіці хаотично, без всякої закономірності - тоді робиться вивід про відсутність зв'язку між ознаками; або певним чином уздовж деякої гіпотетичної лінії - тоді робиться вивід про існування зв'язку між ознаками.

При другому способі - використанні результатів аналітичного угрупування зв'язок вважається встановленим, якщо угрупування показує зміну середнього значення результативної ознаки в групах при зміні факторної ознаки (підстави угрупування).

Опис виявленого зв'язку при проведенні кореляційного аналізу проводиться в двох формах - табличною і графічною. При табличному описі зв'язку статистичні одиниці групуються за значенням факторної ознаки (розташовуються в порядку його зростання або убування)

Графічний опис зв'язку полягає в побудові лінії емпіричної регресії - ламаній лінії, що сполучає на кореляційному полі крапки, абсцисами яких є значення факторної ознаки (індивідуальні значення або групові значення), а ординатами - середні значення результативної ознаки. Емпірична лінія регресії відображає основну тенденцію даної залежності. Якщо по своєму вигляду вона наближається до прямої лінії, то можна припустити наявність прямолінійного зв'язку між ознаками.

Тіснота зв'язку показує міру впливу факторної ознаки на загальну варіацію результативної ознаки.

На емпіричному рівні, при проведенні кореляційного аналізу тіснота зв'язку вимірюється за допомогою інтегральних показників, побудованих на правилі складання дисперсії. Відповідно до нього загальна дисперсія результативної ознаки розкладається на внутрішньогрупову і міжгрупову.

Через співвідношення дисперсій визначаються показники, що вимірюють ступінь тісноти зв'язку між результативними і факторними ознаками: коефіцієнт детерміації 2 і емпіричне кореляційне відношення  .

Коефіцієнт детерміації розраховується по формулі:

 


 

Приведене відношення визначає питома вага варіації, з'ясовної впливом врахованого чинника на результат, в загальній варіації результативної ознаки. Показник змінюється в діапазоні від 0 до 1.

Коефіцієнт детерміації складно інтерпретується, тому на його основі розраховується ще один показник тісноти зв'язку - емпіричне кореляційне відношення .

Емпіричне кореляційне відношення розраховується по формулі: . Діапазон зміни цього показника: від 0 до 1. Нульове значення емпіричного кореляційного відношення означає відсутність зв'язку між результативною і факторною ознаками, при  зв'язок класифікується як функціональна.

Якщо відомо, що між результативною і факторною ознакою існує лінійний зв'язок, то для оцінки її тісноти використовується лінійний коефіцієнт кореляції, що розраховується по формулі:

 

 

На основе предоставленных данных исследуем с помощью коэффициента линейной корреляции тесноту связи между признаками Х («Урожайность льноволокна»), В («Качество ленотрести») («Расходы труда на 1 центнер ленотрести»):

 


 

 

 

 


Таким чином, згідно із класифікацією Чеддока зв'язок між показниками «Урожайність льоноволокна» та «Якість льонотрести» можна вважати прямим тісним, зв'язок між показниками «Урожайність льоноволокна» та «Витрати праці на 1 центнер льонотрести» можна вважати прямим слабким, а зв'язок між показниками «Якість льонотрести» та «Витрати праці на 1 центнер льонотрести» відсутня.

Для коефіцієнту кореляції  значення критерію Стьюдента становить:

 

 

Для коефіцієнту кореляції  значення критерію Стьюдента становить:

 

 

Для коефіцієнту кореляції  значення критерію Стьюдента становить:

 

 

Критичнее значення критерію Стьюдента при рівні значущості 0,05 та  становить 2,063.

Оскільки розраховані значення критерію Стьюдента для коефіцієнтів кореляції більші за критичне, можна стверджувати, що числові значення цих коефіцієнтів не являються випадковими.

 







Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: