Коэффициента ассоциации

Последовательность расчета коэффициента ассоциации отражена ниже.

 

Алгоритм расчета коэффициента ассоциации (Q),

его ошибки (ma) и коэффициента достоверности (ta).

1. Построить четырехпольную таблицу. В первом столбце этой таблицы наносят обе разновидности одного явления – Х1 и Х2, а в первой строке – обе разновидности второго – У1 и У2. При этом Х1 и У2 обозначают положительные разновидности (например, выздоровевшие, иммунизированные и т. д.), а Х2 и У2 – отрицательные (например, не выздоровевшие, не иммунизированные). Обозначить через буквы а, в, с, d четыре поля, в которые внести исходные данные:

 

                    Y      Х Y1 Заболело Y2 Не заболело
Х1 Вакцинировано а в
Х2 Невакцинировано с d

 

2. Вычислить произведения аd и вс.

3. Подставить полученные данные в формулу и рассчитать коэффициент ассоциации.

4. Подставить необходимые данные в формулу и рассчитать среднюю ошибку коэффициента ассоциации.

5. Подставить необходимые данные в формулу и рассчитать коэффициент достоверности.

 

 

Методику расчета и оценки коэффициента ассоциации разберем на следующем примере.

Необходимо определить, влияет ли вакцинация против гриппа на заболеваемость от этой инфекции. Известно, что на промышленном предприятии с общей численностью в 2000 человек 1200 рабочим были сделаны прививки против гриппа, а 800 рабочих остались не привитыми. Заболело из привитых 240 человек, а из непривитых – 320.

Данные о заболевших и не заболевших среди привитых и не привитых приведены в табл. 12.

Таблица 12

Распределение заболевших и не заболевших среди

привитых на промышленном предприятии

 

  Заболело Не заболело Всего
Привитых 240 960 1200
Не привитых 320 480 800
Всего 560 1440 2000

Вычислим произведения аd и вс:

a×d =240×480=11520

b×c =960×320=307200

Подставим полученные данные в формулу и рассчитаем коэффициент ассоциации:

Рассчитаем среднюю ошибку (mQ):

Рассчитаем коэффициент достоверности:

Таким образом, 0,45>3×0,074>0,222. Коэффициент статистически достоверен, что означает, что существует обратная, средней силы связи между заболеваемостью гриппом и вакцинацией против него.

 

Задания для коррекции умений

Изучив теоретические вопросы темы, приступайте к решению задач, которые помогут Вам в отработке умений, первая из которых направлена на решение вопроса о возможности наличия связи между явлениями.

Задача 1

В двух городах (взятых как основная и контрольная группа) регистрировали температуру воздуха и вычисляли среднюю для каждой недели. Одновременно регистрировали число смертей от болезней органов дыхания. Результаты измерений представлены ниже в графических изображениях:

 


Рис. 3. Сопоставление числа зарегистрированных за неделю случаев смерти с данными о средней температуре воздуха в изучаемых городах


Задание.

Определите, возможна ли связь между изучаемыми явлениями (температура воздуха и смертность от болезней органов дыхания) в основной и контрольной группах.

Ответ.

В основной группе возможна корреляционная связь, т.к. распределение точек показывает, что их общее направление соответствует прямой линии и тенденции к образованию кривой не заметно. В контрольной группе отмечается полное отсутствие корреляционной связи.

Решив задачи 2 и 3, Вы сможете проверить умение определения вида и характера корреляционной связи.

Задача 2

Определите вид связи между:

а) температурой тела человека и скоростью протекания химических реакций в организме;

б) возрастом матери и количеством грудного молока;

в) возрастом и количеством госпитализированных больных с сердечно-сосудистой недостаточностью.

Ответ.

а) функциональная связь;

б) корреляционная связь;

в) корреляционная связь.

Задача 3

Укажите характер корреляционной связи между названными ниже парными признаками:

а) числом детей, вакцинированных против коклюша и заболеваемостью детей коклюшем;

б) перенаселенностью городов и высоким уровнем смертности от туберкулеза легких;

в) наличием противорецидивного лечения у больных ревматизмом и уровнем осложнений;

г) снижением температуры воздуха и ростом заболеваемости бронхитом;

д) ростом ребенка и увеличением массы тела и окружности грудной клетки.

Ответ.

а) причинно-следственная, где вакцинация – факториальный признак (причина), заболеваемость детей коклюшем – результативный (следствие);

б) причинно-следственная, где перенаселенность городов причина, а смертность от туберкулеза легких – следствие;

в) обусловленная, т.к. проведение противорецидивного лечения у больных ревматизмом приводит к снижению осложнений заболевания;

г) обусловленная, т.к. рост заболеваемости бронхитом может быть обусловлен низкой температурой воздуха;

д) параллельная, т.к. с изменением одного признака меняются и другие.

 

Следующий набор задач предлагается для отработки целого комплекса умений:

  ◊ выбрать наиболее целесообразную методику измерения корреляционной связи в каждом конкретном случае;

  ◊ рассчитать показатель корреляционной связи;

  ◊ оценить достоверность полученных результатов;

  ◊ сделать выводы о степени связи, ее силе и направленности.

Задача 4

При изучении уровней гипертонической болезни (ГБ) среди металлургов получены данные, показывающие связь между стажем работы и уровнем заболеваемости (табл. 13).

Таблица 13

Уровень заболеваемости ГБ среди металлургов при разном стаже работы

Стаж работы (годы) 1 3 6 9 12 15
Заболеваемость ГБ (на 1000 рабочих) 3,8 15,1 78,5 95,8 97,9 98,0

Задания:

1. Выберите наиболее целесообразную методику измерения корреляционной связи в данном случае.

2. Рассчитайте коэффициент корреляции по выбранной Вами методике, его среднюю ошибку и критерий достоверности коэффициента корреляционной связи.

3. Оцените полученные данные.

4. Сделайте выводы о степени, силе и направленности связи.

Ответ.

1. В задаче прослеживается прямолинейная зависимость между стажем работы и уровнем заболеваемости ГБ. Наиболее целесообразен расчет коэффициента линейной корреляции (rxy).

2. Результаты расчета (согласно алгоритма) представлены в табл. 14:

Таблица 14

Зависимость уровня заболеваемости ГБ металлургов от стажа работы

Стаж работы (годы), х Уровень ГБ (на 1000 раб.), y dx (x-Mx) dx (y-My) dx×dx dх2 dу²
1 3,8 –6,7 –61,0 408,70 44,89 3721,00
3 15,1 –4,7 –49,8 234,06 22,09 2480,04
6 78,5 –1,7 13,7 –23,29 2,89 187,69
9 95,8 1,3 31,0 40,30 1,69 961,00
12 97,9 4,3 33,1 142,33 18,49 1095,61
15 98,0 7,3 33,2 242,36 53,29 1102,24
∑x=46 ∑y=389,1     ∑dx×dy =1091,04 ∑dx2= =143,34 ∑dy2= =9547,58

Подставим полученные данные в формулу и рассчитаем коэффициент корреляции:

Рассчитаем среднюю ошибку (mr) коэффициента достоверности:

Рассчитаем коэффициент достоверности:

3. Коэффициент корреляции, равный +0,93, достоверен согласно таблицы Н.А. Плохинского с вероятностью безошибочного прогноза р>99%, т.к. при n=4 (6 2) полученный нами критерий t будет больше tтабл.=4,6 (р=99%) и меньше tтабл.=8,6 (р=99,9%).

4. Вывод. Между стажем работы металлургов и уровнем заболеваемости ГБ существует прямая, сильная и достоверная (р>99% или р<0,01) корреляционная связь.

Задача 5

При изучении гинекологической заболеваемости получены данные, показывающие связь между возрастом женщин и уровнем заболеваемости (табл. 15).

Таблица 15

Уровень гинекологической заболеваемости

в различных возрастных группах женщин

Возраст (годы), х 10 15 25 35 45 55
Заболеваемость (на 100 женщин), y 0,8 2,7 18,3 23,0 18,7 7,6

Задания.

1. Выберите наиболее целесообразную методику измерения корреляционной связи в данном случае.

2. Рассчитайте коэффициент корреляции по выбранной Вами методике, его среднюю ошибку и критерий достоверности коэффициента корреляционной связи.

3. Оцените полученные данные.

Ответ.

1. В приведенном примере имеется небольшое число сравниваемых пар и криволинейная зависимость. С возрастом женщин гинекологические заболевания сначала увеличивается, а потом уменьшается непропорционально возрасту. Поэтому в данном случае можно воспользоваться коэффициентом ранговой корреляции.

2. Результаты расчета (согласно алгоритму) приведены в табл. 16.

Таблица 16

Зависимость уровня гинекологической заболеваемости

от возраста

Возраст (годы) Заболеваемость (на 100 женщин)y

Порядковые номера

(ранги)

Разность рангов Квадрат разности рангов
х у х′ у′ d (х′–у′) d2
10 0,8 1 1 0 0
15 2,7 2 2 0 0
25 18,3 3 4 –1 1
35 23,0 4 6 –2 4
45 18,7 5 5 0 0
55 7,6 6 3 3 9
          ∑d2=14

Подставим полученные данные в формулу и рассчитываем коэффициент ранговой корреляции:

Рассчитаем среднюю ошибку коэффициента ранговой корреляции (mp):

Рассчитаем коэффициент достоверности коэффициента ранговой корреляции:

3. В данном случае t меньше 2, следовательно, нельзя говорить о достоверной связи уровня гинекологической заболеваемости с возрастом женщин.

Задача 6

Необходимо проверить эффективность проведения противорецидивного лечения у больных язвенной болезнью желудка и 12-ти перстной кишки. На диспансерном учете в лечебно-профилактических учреждениях района состояло 759 человек, из которых 594 пациента получили противорецидивное лечение в условиях стационара. Результаты наблюдения приведены в табл. 17.

Задания.

1. Выберите наиболее целесообразную методику изучения корреляционной связи между проведением противорецидивного лечения и наступлением обострения язвенного процесса.

2. Измерьте эту связь.

3. Оцените полученные данные.

 

Таблица 17

Распределение заболевших и не заболевших

среди получивших и не получивших противорецидивное

лечение диспансерных больных язвенной болезнью желудка и 12-ти перстной кишки

 

                   Y Х Y1 Наступило обострение Y2 Не наступило обострение Всего
Х1 Получили противорецидивное лечение 66 528 594
Х2 Не получили противорецидивное лечение 132 33 165
Всего 198 561 759

Ответ.

1. В приведенной задаче имеет место альтернативная вариация (наступило обострение или не наступило обострение), поэтому измерение корреляционной связи может быть произведено по методу четырех полей путем вычисления коэффициента ассоциации.

2. Для измерения корреляционной связи рассчитаем коэффициент ассоциации, среднюю ошибку и критерий достоверности коэффициент ассоциации. Согласно алгоритма:

2.1. Вычислим произведения аd и вс:

ad=66×33=2178

bc=528×132=69696

2.2. Подставим полученные данные в формулу и рассчитаем коэффициент ассоциации:

Рассчитаем среднюю ошибку (mQ):

Рассчитаем коэффициент достоверности:

3. Полученный коэффициент ассоциации статистически достоверен (t=4,05), что свидетельствует о наличии обратной, сильной силы связи между проведением противорецидивного лечения и наступлением обострения. Следовательно, можно утверждать об эффективности противорецидивного лечения у больных язвенной болезнью желудка и 12-ти перстной кишки.

                                        Задача 7

Определите размер связи между уровнем концентрации фтора в питьевой воде и числом лиц, пораженных флюорозом (в % к числу обследованных).

 

Содержание фтора в воде, мг/л Пораженность флюорозом, %

Порядковые номера

(ранги)

Разность рангов Квадрат разности рангов
х у х′ у′ d (х′-у′) d2
Низкое            (0,5) 0,0 1 1 0 0
Оптимальное (1,0) 3,0 2 2 0 0
Условно допустимое    (1,5) 15,0 3 3 0 0
Повышенное  (3,5) 98,0 4 4,5 –0,5 0,25
Недопустимое (5,0) 98,0 5 4,5 0,5 0,25
          d2 =0,5

Задача 8

Смертность от рака молочной железы и от рака матки в пяти районах области (на 100000 женщин).

Районы А Б В Г Д
Рак молочной железы 28,6 23,5 21,1 5,8 3,3
Рак шейки матки 14,9 13,4 16,3 15,3 19,1

Задания.

1. Выберите наиболее целесообразную методику изучения корреляционной связи в данном случае.

2. Измерьте эту связь.

3. Оцените полученные данные.

Задача 9

Подтвердите влияние на заболеваемость противорецидивного лечения, если из 400 рабочих промышленного предприятия, состоящих на диспансерном учете по поводу заболеваний органов дыхания 260 человек получили противорецидивное лечение, а 140 – нет. Заболело из пролеченных 80 человек. Среди лиц, не получивших противорецидивное лечение, заболело 62 человека.

Задача 10

Имеются данные о частоте инфекционной заболеваемости у детей разных возрастных групп:

Возраст, лет Число инфекционных заболеваний (на 100 тыс. детей каждой возрастной группы)
до 3 150,0
от 4 до 6 580,0
от 7 до 10 250,0
от 11 и старше 300,0

Задание.

Определите коэффициенты корреляции и оцените их с помощью показателей оценки достоверности.

Задача 11

Между показателями заболеваемости населения различных городов болезнями органов дыхания и загрязненностью воздушной среды установлены следующие величины корреляционной связи: в городе А. – r =+0,8; в городе С. – r =+0,2; в городе П. – r =–0,7.

В каком из городов отмечается прямая полная корреляционная связь между заболеваемостью населения и загрязнением атмосферного воздуха.

Задача 12

При изучении заболеваемости подростков было установлено, что при снижении температуры воздуха на 1°С заболеваемость среди них увеличивается на 20 случаев на каждую 1000 подростков.

С помощью какого статистического коэффициента могла быть установлена подобная зависимость между заболеваемостью подростков и температурой атмосферного воздуха.

 


Приложение 1

ГРАФ ЛОГИЧЕСКОЙ СТРУКТУРЫ ТЕМЫ

«ИЗМЕРЕНИЕ И ОЦЕНКА СВЯЗИ МЕЖДУ ЯВЛЕНИЯМИ

ИЛИ ПРИЗНАКАМИ»

 

 

ТЕМА 8. ГРАФИЧЕСКИЕ ИЗОБРАЖЕНИЯ



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: