1-й способ. Определить ошибку (m ρху) коэффициента ранговой корреляции и оценить достоверность его с помощью критерия t:
= 0,16
Полученный критерий t = 5,75 соответствует вероятности безошибочного прогноза ρ больше 95 %:
ρху = - 0,92; m ρху = ± 0,16; t = 5,75; ρ> 95%.
2-й способ. По таблице "Стандартных коэффициентов корреляции": при числе степеней свободы (n - 2) = 5 - 2 = 3 наш расчетный коэффициент корреляции ρху= - 0,92 больше табличного 0,878 и меньше 0,934, что соответствует вероятности безошибочного прогноза больше 95% и меньше 98%. Это позволяет считать полученный коэффициент ранговой корреляции достоверным.
Вывод. С вероятностью безошибочного прогноза (р) больше 95% установлено, что чем больше стаж работы, тем меньше частота травм (связь обратная, сильная, достоверная корреляционная: ρху = - 0,92, ρ > 95%.
Задача 2 - эталон
на применение метода квадратов (метод Пирсона).
Задание: вычислить коэффициент корреляции, определить направление и силу связи между количеством кальция в воде и жесткостью воды, если известны следующие данные (табл. 1). Оценить достоверность связи. Сделать вывод.
|
|
Таблица 1
Жесткость воды (в градусах) | Количество кальция в воде (в мг/л) |
4 8 11 27 34 37 | 28 56 77 191 241 262 |
Обоснование выбора метода. Для решения задачи выбран метод квадратов (Пирсона), т.к. каждый из признаков (жесткость воды и количество кальция) имеет числовое выражение; нет открытых вариант.
Решение.
Последовательность расчетов изложена в тексте, результаты представлены в таблице 2. Построив ряды из парных сопоставляемых признаков, обозначить их через х (жесткость воды в градусах) и через у (количество кальция в воде в мг/л).
Таблица 2
Жесткость воды (в градусах) x | Количество кальция в воде (в мг/л) y | dх | dу | dх х dу | dx2 | dy2 |
4 8 11 27 34 37 | 28 56 77 191 241 262 | -16 -12 -9 +7 +14 +16 | -114 -86 -66 +48 +98 +120 | 1824 1032 594 336 1372 1920 | 256 144 81 49 196 256 | 12996 7396 4356 2304 9604 14400 |
Мх=Σ х / n | Му=Σ у / n | Σ dх x dу=7078 | Σ dх2=982 | Σ dy2=51056 | ||
Мх=120/6=20 | Мy=852/6=142 |
|
1. Определить средние величины Mx ряду вариант "х" и Му в ряду вариант "у" по формулам:
Мх = Σх/n (графа 1)
Му = Σу/n (графа 2)
2. Найти отклонение (dх и dу) каждой варианты от величины вычисленной средней в ряду "x" и в ряду "у"
dх = х -Мх (графа 3) и dy = у -Му (графа4).
3. Найти произведение отклонений dx х dy и суммировать их: Σ dх х dу (графа 5)
4. Каждое отклонение dx и dу возвести в квадрат, и суммировать их значения по ряду "х" и по ряду "у": Σ dx2 = 982 (графа 6) и Σ dy2 = 51056 (графа 7).
5. Определить произведение Σ dx2 х Σ dy2 и из этого произведения извлечь квадратный корень
|
|
6. Полученные величины Σ (dx x dy) и √(Σdx2 x Σdy2) подставляем в формулу расчета коэффициента корреляции:
= = =
7. Определить достоверность коэффициента корреляции:
1-й способ. Найти ошибку коэффициента корреляции (mrxy) и критерий t по формулам:
14,1
Критерий t = 14,1, что соответствует вероятности безошибочного прогноза ρ> 99,9%.
2-й способ. Достоверность коэффициента корреляции оценивается по таблице "Стандартные коэффициенты корреляции" (см. приложение 1). При числе степеней свободы (n — 2)=6 – 2=4, наш расчетный коэффициент корреляции rxу = + 0,99 больше табличного (rтабл = + 0,917 при ρ = 99%).
Вывод. Чем больше кальция в воде, тем она более жесткая (связь прямая, сильная и достоверная: rху = + 0,99, ρ > 99,9%).
Задача 3 - эталон
Определить коэффициент корреляции Пирсона, сделать выводы
Результаты определения потребного количества калорий в сутки в зависимости от веса, у девочек 8 лет (табл. 1).
Таблица 1
Средний вес 8-летних девочек (кг) | Потребное количество ккал.в сутки/кг веса |
21 22 24 25 27 28 29 | 61,9 63,6 62,5 64,0 61,1 60,7 60,3 |
Построив ряды из парных сопоставляемых признаков, обозначить их через х (вес девочек в килограммах) и через у (потребного количества килокалории в сутки в зависимости от веса, у девочек 8 лет) (табл. 2)
Таблица 2
Вес девочек (кг), X | Потребное количество ккал в сутки/кг веса, Y | dx = | dy | dx×dy | dx2 | dy 2 | |
1 | 21 | 61,9 4 | 4,1 | 0,1 | 0,41 | 16,81 | 0,01 |
2 | 22 | 63,6 6 | 3,1 | –1,6 | –4,96 | 9,61 | 2,56 |
3 | 24 | 62,5 5 | 1,1 | –0,5 | –0,55 | 1,21 | 0,25 |
4 | 25 | 64,0 7 | 0,1 | –2,0 | –0,2 | 0,01 | 4,0 |
5 | 27 | 61,1 3 | –1,9 | 0,9 | –1,71 | 3,61 | 0,81 |
6 | 28 | 60,7 2 | –2,9 | 1,3 | –3,77 | 8,41 | 1,69 |
7 | 29 | 60,3 1 | –3,9 | 1,7 | –6,63 | 15,21 | 2,89 |
Мх=Σ х / n | Му= Σ у / n | Σ dх x dу=-17,41 | Σ dх2= 54,87 | Σ dy2= 12,21 | |||
Мх=176/7=25,1 | Мy= 434,1/7= 62,0 |
1. Определить средние величины Mx ряду вариант "х" и Му в ряду вариант "у" по формулам:
Мх = Σх/n (графа 1)
Му = Σу/n (графа 2)
2. Найти отклонение (dх и dу) каждой варианты от величины вычисленной средней в ряду "x" и в ряду "у"
dх = х -Мх (графа 3) и dy = у -Му (графа4).
3. Найти произведение отклонений dx х dy и суммировать их: Σ dх х dу (графа 5)
4. Каждое отклонение dx и dу возвести в квадрат, и суммировать их значения по ряду "х" и по ряду "у": Σ dx2 = 982 (графа 6) и Σ dy2 = 51056 (графа 7).
5. Определить произведение Σ dx2 х Σ dy2 и из этого произведения извлечь квадратный корень
6. Полученные величины Σ (dx x dy) и √(Σdx2 x Σdy2) подставляем в формулу расчета коэффициента корреляции:
= = =
Вывод: связь корреляционная, сильная, обратная.
7. Определить достоверность коэффициента корреляции:
Представительность коэффициента корреляции может быть определена по его средней ошибке, которую можно вычислить по формуле:
Коэффициент корреляции достоверен в том случае, если он превышает свою ошибку в 3 и более раз. Это условие в данном случае не выполняется.
8. Оценка значимости по t–критерию:
2,03
Так как t > 2, то это говорит о значимости критерия.
Вывод: в результате проведённого анализа полученных данных можно говорить о наличии сильной и обратной взаимосвязи между средним весом 8-летних девочек и потребным количеством калорий в сутки. При расчете и оценке коэффициента Пирсона вычислили его ошибку: т.к. она не более чем в 3 раза меньше самого коэффициента, можно говорить о недостоверности данного коэффициента. Также была проведена оценка значимости по t–критерию: т.к. t > 2, можно говорить о значимости полученных результатов.
Таким образом, можно говорить о недостаточной достоверности влияния веса 8-летних девочек на потребное количество калорий в сутки и о значимости полученных результатов.
|
|
Задача 4 - эталон
На основе приведенных данных в таблице 1 требуется: 1) вычислить коэффициент корреляции рангов; 2) определить характер и силу связи между соответствующими признаками; определить достоверность коэффициента корреляции.
Задание: д лина и масса тела у 12 девочек в возрасте 5 лет (табл. 1):
Таблица 1
Длина тела (см.) | Масса тела (кг.) | |
87 | 13 | |
95 | 14 | |
115 | 20 | |
89 | 12 | |
90 | 14 | |
90 | 15 | |
101 | 17 | |
95 | 15 | |
110 | 18 | |
110 | 21 | |
88 | 14 | |
93 | 16 |
Решение.
1. Рангами (порядковыми номерами) обозначаем места показателей в рядах «x» и «y» (табл. 2), затем находим разность между рангами (d) и возводим ее в квадрат (d2). При обозначении места показателей рангами начинают с меньшего (или с большего).
Если отдельные показатели ряда встречаются несколько раз (14, 15, 90, 95, 110) ранги проставляются следующим образом: масса тела 14 кг.встречается трижды занимая по величине 3-е, 4-е и 5-е места, поэтому порядковые номера в этом случае будут равны
т.е. против каждого показателя 14 кг.будет проставлен ранг 4 и т.д.
Таблица 2
Длина тела (см.) x | Масса тела (кг.) y | Порядковые номера (ранги) | Разность рангов | Квадрат разности рангов | |
X | Y | d = (х-у) | d2 | ||
87 | 13 | 1 | 2 | -1 | 1 |
95 | 14 | 7,5 | 4 | +3,5 | 12,25 |
115 | 20 | 12 | 11 | +1 | 1 |
89 | 12 | 3 | 1 | +2 | 4 |
90 | 14 | 4,5 | 4 | +0,5 | 0,25 |
90 | 15 | 4,5 | 6,5 | -2 | 4 |
101 | 17 | 9 | 9 | 0 | 0 |
95 | 15 | 7,5 | 6,5 | +1 | 1 |
110 | 18 | 10,5 | 10 | +0,5 | 0,25 |
110 | 21 | 10,5 | 12 | -1,5 | 2,25 |
88 | 14 | 2 | 4 | -2 | 4 |
93 | 16 | 6 | 8 | -2 | 4 |
Σ d2 = 34 |
Подставляем полученные данные в формулу коэффициента корреляции рангов:
|
|
= 1 - = 1 -
2. Коэффициент корреляции, равный + 0,881, свидетельствует о наличии прямой сильной связи между ростом девочек и массой их тела.
3. Определяем достоверность коэффициента ранговой корреляции.
1-й способ. Определяем ошибку (m ρху) коэффициента ранговой корреляции и оцениваем достоверность его с помощью критерия t:
= = 0,15
Полученный критерий t = 5,867 соответствует вероятности безошибочного прогноза ρ больше 95 %:
ρху = 0,881; m ρху = ± 0,15; t = 5,867; ρ > 95%.
2-й способ. Достоверность коэффициента корреляции оценивается по таблице «Стандартных коэффициентов корреляции». При числе степеней свободы (n - 2) = 12 - 2 = 10 наш расчетный коэффициент корреляции ρху= 0,881 больше табличного 0,708 что соответствует вероятности безошибочного прогноза больше 99%. Это позволяет считать полученный коэффициент ранговой корреляции достоверным.
Вывод. С вероятностью безошибочного прогноза (р) больше 99% установлено, что чем больше рост, тем больше масса тела (связь прямая, сильная, достоверная корреляционная: ρху = 0,881, ρ > 99%.
Задача5 – эталон
Путем вычисления коэффициента ранговой корреляции Спирмена определить характер и размер связи между уровнем мертворождаемости и весом ребенка при рождении (табл. 1).
Таблица 1
Вес в граммах | Мертворождаемость (на 1000 родов) |
до 1500 | 137,2 |
1500 – 1749 | 86 |
1750 – 1999 | 44,2 |
2000 – 2249 | 35,6 |
2250 – 2499 | 18 |
2500 – 2749 | 12 |
2750 – 3000 | 7,2 |
Решение:
1. Каждый из рядов парных признаков обозначить через "х" и через "у" (графы 1—2).
2. Величину каждого из признаков заменить ранговым (порядковым) номером. Порядок раздачи рангов в ряду "x" следующий: минимальному значению признака (вес в граммах до 1500) присвоен порядковый номер "1", последующим вариантам этого же ряда признака соответственно в порядке увеличения 2-й, 3-й, 4-й и 5-й порядковые номера — ранги (см. графу 3).
Аналогичный порядок соблюдается при раздаче рангов второму признаку "у" (графа 4) (табл. 2).
Таблица 2
Вес (в граммах), Х | Мертворож- даемость, Y | Ранги | d | d2 | |
Х | Y | ||||
до 1500 | 137,2 | 1 | 7 | – 6 | 36 |
1500 – 1749 | 86 | 2 | 6 | – 4 | 16 |
1750 – 1999 | 44,2 | 3 | 5 | – 2 | 4 |
2000 – 2249 | 35,6 | 4 | 4 | 0 | 0 |
2250 – 2499 | 18 | 5 | 3 | 2 | 4 |
2500 – 2749 | 12 | 6 | 2 | 4 | 16 |
2750 – 3000 | 7,2 | 7 | 1 | 6 | 36 |
n = 7 | =112 |
3. Определить разность рангов d = (х - у) - (графа 5)
4. Разность рангов возвести в квадрат (d2) и получить сумму квадратов разности рангов Σ d2 (графа 6).
5. Произвести расчет коэффициента ранговой корреляции по формуле:
где n — число сопоставляемых пар вариант в ряду "x" и в ряду "у"
Вывод: установлена функциональная связь.