Зависимость освоения «Статистики» от типа школы, которую

Таблица для вычисления коэффициентов ассоциации и контингенции

Непараметрические методы анализа.

Как мы изучили на предыдущих занятиях, для изучения тесноты связи между Х и У используется коэффициент (индекс) корреляции.

В некоторых случаях мы можем встретиться с такими качествами, которые не поддаются выражению числом единиц.

Эти обстоятельства заставляют прибегать к использованию т. н. непараметрических методов, позволяющих измерить интенсивность связи как между количественными признаками, так и между качественными.

При исследовании тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффици­енты ассоциации (Ка) и контингенции (Кк). Для их вычисления строится таблица, которая показывает связь между двумя явлениями, каж­дое из которых должно быть альтернативным, т. е. состоящим из двух качественно отличных друг от друга значений признака (табл. 8).

Таблица 8

a b a + b
с d с + d
а + с b + d a+b+с+d

Коэффициенты вычисляются по формулам:

ассоциации:

контингенции:

Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Ка > 0,5 или Кк>0,3.

Пример 1: Оцените наличие связи между студентами группы, распределённых по полу, и заинтересованностью их предметом «Статистика» (табл. 9), рассчитав Ка и Кк. (Данные получаем на основании опроса, проведенного в классе.)

Таблица 9

Статистика, как предмет изучения Пол Всего
Мужской Женский
Интересный      
Неинтересный      
Итого      

Ка = Кк =

Вывод: Т. к. Ка < 0,5 и Кк < 0,3 то заинтересованность статистикой не зависит от пола студентов.

Когда каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно при­менение коэффициентов взаимной сопряженности Пирсона и Чупрова, которые вычисляются по следующим формулам:

; ,

Где:

- показатель взаимной сопряжённости;

- определяется как сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот соответствующего столбца и строки минус 1:

,

где К1- число значений (групп) первого признака

К2- число значений (групп) второго признака

Чем ближе Кп и Кч, тем связь теснее.

Таблица 10

Вспомогательная таблица для расчёта коэффициента взаимной сопряжённости

Х У I I I I I I Всего
I nху nх
I I   nх
I I I   nх
Итого nу nу nу n

Пример 2. Оцените зависимость освоения курса «Статистика» от типа школы, которую окончили студенты данной группы (табл. 11) (исходные данные получаем путём опроса студентов группы непосредственно на занятии).

Таблица 11

закончили студенты

Тип школы Освоение курса «Статистика» Итого
Хорошее Среднее Плохое
Лицей, гимназия, специализированные школы, классы        
Общеобразовательная городская школа        
Общеобразовательная сельская школа        
Итого        

Решение: Кп =;

1 + =+

+0,316+0,693+0,146=1,055

= 1,055-1=0,055

Кп ==0,228

Кч = ==0,164

Чем Кп и Кч ближе к 1, тем связь сильнее.

Вывод: Освоение курса «Статистика» не зависит от типа школы, которую закончили студенты.

Для определения тесноты связи как между количественными, так и между качественными признаками при условии, что значения этих признаков могут быть упорядочены (проранжированы) по степени убывания или возрастания признака используют коэффициент корреляции рангов Спирмена, который рассчитывается по формуле:

,

где di – квадраты разности величин x и y.

n - число наблюдений (число пар рангов)

Используя данные примера 2 по нелинейной корреляционной зависимости, рассчитаем коэффициент Спирмена. Для этого построим таблицу 12.

Таблица 12

Расчётная таблица

№п/п Произведено продукции, тыс. штук, Х Себестоимость единицы продукции, руб. У Ранги Разность рангов di = Rх - Rу   di2
1. 0,5 25,0     -11  
2. 1,8 20,1     -9  
3. 2,0 19,8     -7  
4. 2,5 19,5     -5  
5. 3,1 19,0     -3  
6. 3,4 18,0     -1  
7. 5,4 16,6        
8. 5,8 17,2        
9. 6,0 15,8        
10. 7,2 17,1        
11. 8,3 15,4        
12. 12,0 15,2        
Итого            

ρ

Пользуясь определением тесноты связи по шкале Чеддока, можно сказать, что полученная связь очень сильная, обратная.

Коэффициент Спирмена принимает любые значения в интервале. Значимость коэффициента корреляции рангов Спирмена проверяется на основе t – критерия Стьюдента по формуле:

tp = ρх/у ; tp = - 0,965

Значение коэффициента корреляции считается статистически существенным, если tptk. При k = n - 2 tk=2,228 11,622,228

Ранговый коэффициент Кендалла () используется для измерения взаимосвязи между количественными и качественными признаками, характеризующими однородные объекты, ранжированные по одному принципу. Расчёт коэффициента Кендалла осуществляется по формуле:

,

где S = P + Q, n – число наблюдений, S – сумма разностей между числом последовательностей и числом инверсий по второму признаку.

Расчёт данного коэффициента выполняется в следующей последовательности:

1) значения Х ранжируются в порядке возрастания или убывания

2) значения У ранжируются в порядке, соответствующем значениям Х.

3) для каждого ранга У определяется число следующих за ним значений рангов, превышающих его величину. Суммируя таким образом числа, определяют величину Р как меру соответствия последовательности рангов по Х и У. Она учитывается со знаком +.

4) для каждого ранга У определяется число следующих за ним значений рангов, меньших его величины. Суммарная величина обозначается через Q и фиксируется со знаком -.

5) определяется сумма баллов по всем членам ряда.

Пример 3: В качестве примера возьмём данные предыдущего примера и заполним таблицу 13.

Таблица 13

Расчётная таблица

Ранг продукции по производству Х                        
Ранг по себестоимости У                        

Р = 0 + 0 + 0 + 0 + 0 +0

Q = -11 – 10 - 9 - 8 - 7 - 6 - 3 – 4 - 2 - 2 - 2 -1 = -63

S = 0 + (-63) = -63

= . Связь между признаками можно признать значимой, если значения коэффициентов ранговой корреляции Спирмена и Кендалла >0,5.

Для определения тесноты связи между произвольным числом ранжированных признаков применяется множественный коэффициент ранговой корреляции (коэффициент конкордации) W, который вычисляется по формуле:

где m – количество факторов n – число наблюдений

S – отклонение суммы квадратов рангов от средней квадратов рангов.

Пример 4: по данным таблицы 14 о фондовооружённости и фондообеспеченности определить зависимость между ними и производительностью труда.

Таблица 14

Расчетная таблица

Фондовооруженность X1 Фондообеспеченность X2 Производительность Y   Rx1   Rx2   Ry Сумма строк рангов Rx1+ Rx2 Квадраты рангов R
9,6 11,3 11,9 13,3 14,8 16,0 17,8 18,7 20,7 22,8 65,4 71,0 76,0 88,9 94,4 100,5 102,9 106,7 112,4 121,8 4,8 4,4 5,9 6,7 6,5 7,6 8,8 9,6 10,5 10,6          
               

Связь тесная.

Значимость коэффициента конкордации проверяется на основе x2- критерия Пирсона:

> 22,3>2,201

Ранговые коэффициенты корреляции Спирмена, Кендалла и конкордации имеют преимущество, что с помощью их можно измерить и оценить связи как между количественными, так и между атрибутивными признаками, которые поддаются ранжированию.

Контрольные вопросы:

1. Сформулируйте определение корреляционной зависимости.

2. Дайте классификацию статистических связей по направлению.

3. С помощью какого коэффициента корреляции оценивается связь между двумя признаками?

4. Какие показатели используются в оценке связей качественных признаков?

5. Для каких признаков используются ранговые коэффициенты корреляции?

6. Дайте экономическую интерпретацию коэффициента регрессии а1.

7. В каких пределах изменяются коэффициенты конкордации?


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: