double arrow

Корреляционная зависимость. Уравнения регрессии

Функциональные зависимости достаточно хорошо знакомы чи­тателю. Часто эти зависимости можно выразить аналитически. Например, площадь круга зависит от радиуса (S = pr2), ускорение тела — от силы и массы (а = F/m0) и т. д.

При изучении объектов в биологии и медицине приходится иметь дело с функциональными связями другого рода. При этом определенному значению одного признака соответствует не одно значение другого, а целое распределение значений. Такая связь называется корреляционной связью, или просто корреляцией. Корреляционная связь, например, между возрастом и ростом де­тей выражается в том, что каждому значению возраста соответст­вует определенное распределение роста (а не одно единственное значение). При этом с увеличением возраста (до определенных пределов) возрастает и среднее значение роста.

Количественную характеристику взаимосвязи изучаемых при­знаков можно дать на основании вычисления показателя силы связи между ними (коэффициента корреляции) и определения за­висимости одного признака от изменений другого (уравнения рег­рессии). Коэффициент корреляции определяет не только степень, но и направление связей между величинами. Если отсутствие функциональной зависимости между величинами условно соот­ветствует нулевой корреляции, а полная функциональная зависи­мость — корреляции, равной единице, то сила корреляционной связи, вообще говоря, измеряется промежуточными значениями (от 0 до +1). При этом при положительном коэффициенте корре­ляции с увеличением одной величины возрастает и другая. Если же коэффициент корреляции отрицателен, то возрастание одного параметра сопровождается уменьшением другого.

В простом случае при линейной зависимости между исследуе­мыми параметрами используют коэффициент корреляции Бравэ — Пирсона, вычисляемый по формуле:

(3.32)

Здесь п — количество пар анализируемых признаков,—выборочные средние значения в распределениях соответствую­щих параметров,— средние квадратические отклонения. Рассчитанный по формуле (3.32) коэффициент корреляции сравнивают с теоретическим, который находят в специальной таблице с учетом определенного уровня значимости и объема выборки (см. табл. 12). Входными значениями таблицы являются число пар ис­следуемых признаков (п) и уровень значимости (0,05 или 0,01). При этом нулевая гипотеза заключается в том, что корреляцион­ной связи между исследуемыми параметрами не существует. Если получают значения коэффициента корреляции больше таблично­го, с определенной степенью вероятности полагают, что корреля­ция в генеральной совокупности отличается от нуля.

Таблица 12. Критические значения выборочного коэффициента корреляции г для двух уровней значимости

п 0,05 0,01 п 0,05 0,01 п 0,01 0,01 п 0,05 0,01
                       
                       
                       
                       
                       
                       
                       
                       
                       
                       
                       

Примечание. Нуль целых и запятая в значениях r опущены. Ну­левая гипотеза отбрасывается при r > r0 с данным уровнем значимости (0,05 или 0,01).

Покажем на примере, как рассчитывают коэффициент корре­ляции Бравэ—Пирсона.

*Оценить взаимосвязь частоты пульса X и максимального артериаль­ного давления Y у детей:

Х (удары/мин) 121,8 119,2 111,3 113,3 98,3 93,8

Y (мм.рт.ст) 99,5 103,0 103,1 106,8 99,1 99,2

Согласно нулевой гипотезе, корреляционной связи между изучае­мыми параметрами нет. Рассчитаем выборочные средние значения и средние квадратичные отклонения для приведенных выше выборок ис­следуемых параметров: = 109,6; = 101,8; sх = 10,29 и sу = 2,81. По формуле (3.32) рассчитываем коэффициент корреляции r = 0,44. Затем обращаемся к таблице 12 и находим для шести пар признаков (п = 6), те­оретическое значение коэффициента корреляции 0,811 при уровне значимости 0,05 и 0,917 при уровне значимости 0,01. В том и другом случае нулевая гипотеза оказывается справедливой и корреляционной связи между анализируемыми признаками не существует с вероятностью 0,95 и 0,99.

Количественное представление зависимости изменений одного признака от изменений другого позволяет получить показатели регрессии. Как правило, анализ регрессии начинают с графиче­ского изображения данных. При большом числе исходных дан­ных для выявления общей закономерности вычисляются средние значения одного признака (у) в группах (классах), соответствую­щих определенному интервалу значений другого признака (х). При построении графика по усредненным данным точки на гра­фике располагаются вдоль так называемой эмпирической линии регрессии. Затем проводят подбор и составление уравнения рег­рессии. С помощью такого уравнения можно теоретически рас­считать значения, которые должен принимать один признак при определенных значениях другого (уравнение прогноза).

Если предполагается существование линейной зависимости между исследуемыми признаками (линейная регрессия), то про­водить регрессионный анализ наиболее просто. Часто при этом применяют графический метод. Для проведения линии регрессии используют прозрачную линейку, придавая ей такое положение, чтобы выше и ниже предполагаемой линии регрессии оказалось приблизительно одинаковое число эмпирических точек. На полу­ченной прямой определяют координаты двух наиболее отдален­ных точек x1, yl и х2, у2. Затем составляют систему двух уравне­ний:

Из полученной системы уравнений определяют неизвестные а иНаконец, при известных коэффициентах а и b записывают уравнение прогноза, на основании которого можно рассчитать значение параметра у при известном значении х.

В настоящее время при статистическом анализе эксперимен­тальных данных ироко используются компьютерные вычисли­тельные программы, позволяющие проводить корреляционный и регрессионный анализ. Более подробно практическое применение этого вида анализа рассматривается в курсе социальной гигиены и организации здравоохранения.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



Сейчас читают про: