Теоретичні відомості
Статистична залежність називається кореляційною, якщо у разі зміни однієї величини, змінюється середнє значення іншої.
1. Лінійна кореляція
Якщо обидві лінії регресії Y на X і X на Y – прямі, то кореляцію називають лінійною. Вибіркове рівняння прямої лінії регресії Y на X має вигляд
де – умовна середня;
і – вибіркові середні ознак X і Y;
і – вибіркові середні квадратичні відхилення X і Y;
– вибірковий коефіцієнт кореляції, причому
Вибіркове рівняння прямої лінії регресії X на Y має вигляд
Якщо дані спостережень над ознаками X і Y задані у виді кореляційної таблиці з рівновіддаленими варіантами, то доцільно перейти до умовних варіант:
де – «хибний нуль» варіант X (новий початок відліку); як хибний нуль вигідно прийняти варіанту, що розташована приблизно в середині варіаційного ряду (умовимося приймати як хибний нуль варіанту, що має найбільшу частоту);
– крок, тобто різниця між двома сусідніми варіантами X;
– «хибний нуль» варіант Y (новий початок відліку);
– крок, тобто різниця між двома сусідніми варіантами Y.
У цьому випадку вибірковий коефіцієнт кореляції
Величини , , , можуть бути знайдені або методом добутків (при великому числі даних), або безпосередньо за формулами:
Знаючи ці величини, можна обчислити величини, що входять в рівняння регресії за формулами:
Для оцінки сили лінійного кореляційного зв'язку служить вибірковий коефіцієнт кореляції .
Для обґрунтованого судження про наявність зв'язку між кількісними ознаками варто перевірити, чи значимий вибірковий коефіцієнт кореляції.
Кореляційну залежність у від х можна визначити як функціональну залежність умовної середньої у від х. Виконавши певні алгебраїчні перетворення отримаємо:
(3.1) – рівняння регресії у на х;
(3.2) - рівняння регресії х на у.
Функцію f(x) (або f(y)) називають регресією у на х (або х на у). Графік цієї функції називається лінією регресії.
Тіснота зв’язку між х та у оцінюється за допомогою коефіцієнта кореляції . Для незалежних величин =0. Такі величини називаються некорельованими, а корельованими є ті величини, у яких коефіцієнт кореляції відповідно відмінний від нуля. Якщо | |> 0,75, це свідчить про наявність зв’язку між величинами. Якщо | | > 0,997, то зв'язок між величинами дуже тісний. Кореляційний коефіцієнт не може перевищувати 1.
3.1. Рівняння прямих ліній регресії X на Y, Y на X;
1-9 | 9-17 | 17-25 | 25-33 | 33-41 | 41-49 | ny | y | V | nyV | nyV2 | q | qV | |
13-23 | -2 | -24 | -23 | ||||||||||
23-33 | -1 | -14 | -13 | ||||||||||
33-43 | 25,5 | ||||||||||||
43-53 | |||||||||||||
53-63 | |||||||||||||
nx | -6 | ||||||||||||
x | |||||||||||||
U | -2,5 | -1,5 | -0,5 | 0,5 | 1,5 | 2,5 | |||||||
nxU | -12,5 | -19,5 | -9 | 26,5 | 5,5 | ||||||||
nxU2 | 31,25 | 29,25 | 4,5 | 13,25 | 22,5 | 12,5 | 113,25 | ||||||
t | -10 | -20 | -2 | ||||||||||
tU |
Табл. 3.1.
Результати обчислень будемо записувати до кореляційної таблиці (табл. 3.1). Перейдемо від початкових варіант та до умовних варіант:
і ,
де . Як візьмемо варіанту х =29, що має найбільшу частоту , як - варіанту у =38, що має найбільшу частоту .
Елементи рядка дорівнюють добуткам відповідних елементів рядків і u; елементи стовпця дорівнюють добуткам відповідних елементів стовпця і v; аналогічно заповнюємо рядок і стовпець .
Кожен елемент стовпця q дорівнює сумі добутків частот , які знаходяться у відповідному рядку вихідної кореляційної таблиці, на відповідні елементи рядка u:
У рядку t кожен елемент дорівнює сумі добутків частот , які знаходяться у відповідному стовпці кореляційної таблиці, на відповідні елементи стовпця v:
і т.д.
У стовпці qv кожен елемент дорівнює добутку відповідних елементів і стовбців q і v, в останньому ряду кожен елемент дорівнює добутку відповідних елементів t і u. Рівність сум використовується для контролю правильності обчислень.
Далі знаходимо:
Тепер знайдемо:
;
;
;
.
Підставивши знайдені величини в (3.1), отримаємо шукане рівняння:
- рівняння регресії у на х;
Порівняємо у з рівняння регресії і у, підрахований за таблицею:
x | yx | yx*табл |
18,1087 | ||
25,66304 | 22,61538 | |
33,21739 | 36,88889 | |
40,77174 | 40,64151 | |
48,32609 | ||
55,88043 |
Підставивши знайдені величини в (3.1), отримаємо шукане рівняння:
рівняння регресії х на у.
Порівняємо х з рівняння регресії і х*, підрахований за таблицею:
YI | ẍy | ẍy* |
9,666667 | 12,89653 | |
17,57143 | 19,35801 | |
29,16327 | 25,81949 | |
27,4 | 32,28097 | |
38,33333 | 38,74246 |
3.2. Знайдемо коефіцієнт кореляції:
Зв'язок між величинами наявний, але він не дуже тісний.
3.3.Висновок: в даній роботі ми знаходили рівняння прямих ліній регресії X на Y, Y на X, розрахували вибірковий коефіцієнт кореляції та оцінили силу зв’язку Y і X
.
Додаток 1
поліном першого порядку | |||||||||
№ | x | y | x2 | xy | y^ | (y-y^)2 | |||
141,1 | =B26^2 | =B26*C26 | =$E$40+$F$40*B26 | =(C26-F26)^2 | |||||
=B27^2 | =B27*C27 | =$E$40+$F$40*B27 | =(C27-F27)^2 | ||||||
111,7 | =B28^2 | =B28*C28 | =$E$40+$F$40*B28 | =(C28-F28)^2 | |||||
86,1 | =B29^2 | =B29*C29 | =$E$40+$F$40*B29 | =(C29-F29)^2 | |||||
58,4 | =B30^2 | =B30*C30 | =$E$40+$F$40*B30 | =(C30-F30)^2 | |||||
29,1 | =B31^2 | =B31*C31 | =$E$40+$F$40*B31 | =(C31-F31)^2 | |||||
9,56 | =B32^2 | =B32*C32 | =$E$40+$F$40*B32 | =(C32-F32)^2 | |||||
сума | =СУММ(B26:B34) | =СУММ(C26:C34) | =СУММ(D26:D34) | =СУММ(E26:E34) | =СУММ(G26:G34) | ||||
=A32 | =B33 | =C33 | a0 | a1 | |
=B33 | =D33 | =E33 | =C50 | =C49 |
середня кв. похибка |
=КОРЕНЬ(G33/A32) |
схема єдиного ділення | ||||
x1 | x2 | b | сума | |
=A39 | =B39 | =C39 | =A44+B44+C44 | |
=A40 | =B40 | =C40 | =A45+B45+C45 | |
=A44/A44 | =B44/A44 | =C44/A44 | =D44/A44 | |
=B45-A45*B46 | =C45-A45*C46 | =B47+C47 | ||
=B47/B47 | =C47/B47 | =B48+C48 | ||
=C48 | =D48 | |||
=C46-B46*C49 | =D46-B46*D49 | |||
поліном другого порядку | |||||||||
№ | x | y | x2 | x3 | x4 | xy | x2y | ||
=B26 | =C26 | =B56^2 | =B56^3 | =B56^4 | =B56*C56 | =D56*C56 | |||
=B27 | =C27 | =B57^2 | =B57^3 | =B57^4 | =B57*C57 | =D57*C57 | |||
=B28 | =C28 | =B58^2 | =B58^3 | =B58^4 | =B58*C58 | =D58*C58 | |||
=B29 | =C29 | =B59^2 | =B59^3 | =B59^4 | =B59*C59 | =D59*C59 | |||
=B30 | =C30 | =B60^2 | =B60^3 | =B60^4 | =B60*C60 | =D60*C60 | |||
=B31 | =C31 | =B61^2 | =B61^3 | =B61^4 | =B61*C61 | =D61*C61 | |||
=B32 | =C32 | =B62^2 | =B62^3 | =B62^4 | =B62*C62 | =D62*C62 | |||
сума | =СУММ(B56:B62) | =СУММ(C56:C62) | =СУММ(D56:D62) | =СУММ(E56:E62) | =СУММ(F56:F62) | =СУММ(G56:G62) | =СУММ(H56:H62) | ||
y^ | (y-y^)2 | ||||||||
=$F$68+$G$68*B56+$H$68*(B56^2) | =(C56-I56)^2 | ||||||||
=$F$68+$G$68*B57+$H$68*(B57^2) | =(C57-I57)^2 | ||||||||
=$F$68+$G$68*B58+$H$68*(B58^2) | =(C58-I58)^2 | ||||||||
=$F$68+$G$68*B59+$H$68*(B59^2) | =(C59-I59)^2 | ||||||||
=$F$68+$G$68*B60+$H$68*(B60^2) | =(C60-I60)^2 | ||||||||
=$F$68+$G$68*B61+$H$68*(B61^2) | =(C61-I61)^2 | ||||||||
=$F$68+$G$68*B62+$H$68*(B62^2) | =(C62-I62)^2 | ||||||||
=СУММ(J56:J62) | |||||||||
коефіцієнти | |||||||
=A62 | =B63 | =D63 | =C63 | ||||
=B63 | =D63 | =E63 | =G63 | a0 | a1 | a2 | |
=D63 | =E63 | =F63 | =H63 | =F87 | =F86 | =F85 |
середня кв. похибка | |
=КОРЕНЬ(J63/A62) |
схема єдиного ділення
хід | етапи | коефіцієнти | b | суми | |||
x1 | x2 | x3 | |||||
прямий | =A68 | =B68 | =C68 | =D68 | =C76+D76+E76+F76 | =B76+C76+D76+E76+F76 | |
=A69 | =B69 | =C69 | =D69 | =C77+D77+E77+F77 | =C77+D77+E77+F77 | ||
=A70 | =B70 | =C70 | =D70 | =C78+D78+E78+F78 | =C78+D78+E78+F78 | ||
=C76/C76 | =D76/C76 | =E76/C76 | =F76/C76 | =G76/C76 | =C79+D79+E79+F79 | ||
=D77-C77*D79 | =E77-C77*E79 | =F77-C77*F79 | =D80+E80+F80 | =D80+E80+F80 | |||
=D78-C78*D79 | =E78-C78*E79 | =F78-C78*F79 | =D81+E81+F81 | =D81+E81+F81 | |||
=D80/D80 | =E80/D80 | =F80/D80 | =G80/D80 | =D82+E82+F82 | |||
=E81-D81*E82 | =F81-D81*F82 | =E83+F83 | =E83+F83 | ||||
=E83/E83 | =F83/E83 | =G83/E83 | =E84+F84 | ||||
зворотній | =F84 | =G84 | =E85+F85 | ||||
=F82-E82*F85 | =G82-E82*G85 | =D86+F86 | |||||
=F79-E79*F85-D79*F86 | =G79-E79*G85-D79*G86 | =C87+F87 |
Додаток 2
2.1) | |||||
xi | |||||
ni | |||||
N | =B3+C3+D3+E3+F3 | ||||
x ≤2 | |||||
2<x ≤5 | =B3/B4 | ||||
5<x ≤7 | =(B3+C3)/B4 | ||||
7<x ≤11 | =(B3+C3+D3)/B4 | ||||
11<x ≤15 | =(B3+C3+D3+E3)/B4 | ||||
x >15 | =(B3+C3+D3+E3+F3)/B4 |
2.2) | |||||
Ii | 2-5 | 5-8 | 8-11 | 11-14 | 14-17 |
ni | |||||
ni/h | =B16/H15 | =C16/H15 | =D16/H15 | =E16/H15 | =F16/H15 |
Wi | =B16/H16 | =C16/H16 | =D16/H16 | =E16/H16 | =F16/H16 |
Wi/h | =B19/H15 | =C19/H15 | =D19/H15 | =E19/H15 | =F19/H15 |
Ii | 2-5 | 5-8 | 8-11 | 11-14 | 14-17 |
ni | |||||
xi | =(2+5)/2 | =(5+8)/2 | =(8+11)/2 | =(11+14)/2 | =(14+17)/2 |
N | =B23+C23+D23+E23+F23 |
xв | =(B23*B24+C23*C24+D23*D24+E23*E24+F23*F24)/I24 |
DB | =((B23*(B24-I25)^2)+(C23*(C24-I25)^2)+(D23*(D24-I25)^2)+(E23*(E24-I25)^2)+(F23*(F24-I25)^2))/I24 |
σB | =КОРЕНЬ(I26) |
xr | =I25 |
D | =(I26/(I24-1))*I24 |
σr | =КОРЕНЬ(I29) |
Додаток 3
Ū | =I14/I11 | |||||
Ṽ | =L11/I11 | |||||
Ϭu | =КОРЕНЬ((I15/I11)-(C19^2)) | |||||
Ϭv | =КОРЕНЬ((M11/I11)-(C20^2)) | |||||
rв | =(I17-(I11*C19*C20))/(I11*C21*C22) | |||||
ẍ | =(C19*8)+R10 | |||||
ȳ | =(C20*10)+J8 | |||||
Ϭx | =C21*8 | |||||
Ϭy | =C22*10 | |||||
Y | =(C23*C27)/C26 | =((C23*C27)/C26)*(-C24)+C25 | ȳx=0,944293x+13038723 | |||
XI | ȳx | ȳx* | ȳx*-ȳx | |||
=C5 | =(C6*B6)/C11 | =$C$26*B32+$D$26 | =D32-C32 | |||
=D5 | =(D6*B6+D7*B7)/D11 | =$C$26*B33+$D$26 | =D33-C33 | |||
=E5 | =(E7*B7+E8*B8+E9*B9)/E11 | =$C$26*B34+$D$26 | =D34-C34 | |||
=F5 | =(F8*B8+F9*B9+F10*B10)/F11 | =$C$26*B35+$D$26 | =D35-C35 | |||
=G5 | =(G8*B8+G9*B9+G10*B10)/G11 | =C29*B36+D29 | =D36-C36 | |||
=H5 | =(H10*B10)/H11 | =C29*B37+D29 | =D37-C37 |