Множественная линейная корреляция

Линейная регрессия

Парная корреляция

Основные понятия корреляционного и регрессионного анализа

ТЕМА

Тема: СТАТИСТИЧЕСКИЕ ПРИЕМЫ ИЗУЧЕНИЯ ВЗАИМОСВЯЗЕЙ

1. Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом проявляются количественные характеристики причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействия одних факторов на другие является одной из важнейших задач статистики.

В качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи. В первом случае величине факторного признака строго соответствует одно или несколько значений функции. Полная связь довольно часто проявляется в физике и химии. В экономике примером может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции.

Корреляционная связь (полная или статистическая) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому - сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. При этом, каждому значению аргумента соответствует случайно распределенные в некотором интервале значения функции. (ПРИМЕР С УРОЖАЙНОСТЬЮ)

По направлению связи бывают прямыми, когда зависимая переменная растет с увеличением факторного признака, и обратными, при которых рост последнего сопровождается уменьшением функции. Их также называют положительными и отрицательными.

По аналитической форме связи бывают линейными и нелинейными

С точки зрения взаимодействующих факторов связь бывает парной и множественной.

Кроме перечисленных различают также непосредственные, косвенные и ложные связи. В первом случае факторы взаимодействуют между собой непосредственно. Для косвенной характерно участие какой-то третьей переменной, которая обусловит связь. Ложная связь не имеет под собой качественной основы или же бессмысленна.

По силе связи различаются сильные и слабые связи.

Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак.

Задачи регрессионного анализа - это установление формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значений зависимой переменной.

2. Простейшим приемом выявления связи является построение корреляционной таблицы. В основу группировки положены два изучаемых во взаимосвязи признака – Х и У. Частоты f показывают количество соответствующих сочетаний Х и У. Если частоты расположены в таблице беспорядочно, то можно говорить об отсутствии связи между переменными. В случае образования какого-либо характерного сочетания частот допустимо утверждать о связи между Х и У. При этом, если значения концентрируются около одной из двух диагоналей, имеет место прямая или обратная линейная связь.

Наглядным изображением корреляционной таблицы служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладываются значения Х, по оси ординат – У, а точками показывается сочетание Х и У.

Линейный коэффициент корреляции (r) используют для количественной оценки тесн от ы с вяз и между двумя признаками:

r = XY – X*Y

sx*sy, где sx*sy среднеквадратические отклонения признаков. Можно использовать и другие формулы, но результат должен быть одинаковым для всех вариантов расчета.

Линейный коэффициент корреляции принимает значения в интервале от (-1) до (+1). Принято считать, что если [ r ] < 0, то связь слабая; при [ r ] = (0,3 –0,7) – средняя; при [ r ] > 0,7 – сильная, или тесная. Когда r =1 - связь функциональная. Если же r = 0, то это говорит об отсутствии линейной связи между Х и У. Однако в этом случае возможно нелинейное взаимодействие, что требует дополнительной проверки и других измерителей.

3. Если результативный признак с увеличением факторного признака равномерно возрастает или убывает, то такая зависимость является линейной и выражается уравнением прямой

Ух= а0 1х ,

где у - индивидуальные значения результативного признака;

х- индивидуальные значения факторного признака;

а0 , а1 параметры уравнения прямой (уравнения регрессии);

Ух теоретическое значение результативного признака.

Параметры уравнения прямой а0 и а1 определяются путем решения системы нормальных уравнений, полученных методом наименьших квадратов или по формулам:

Sу = na0 + a1Sx

Syx = a0Sx + a1Sx2 ®, a1 = n Syx - Sx Sy

nSx2 - Sx Sx;

или а1= Σ(х - )(у - )

Σ(х - )2; а0 = – a1 р

НАПРИМЕР: Имеются выборочные данные по 10 однородным предприятиям:

Исходные данные Расчетные значения
№ предприятия Электровооруженность труда на одного рабочего, кВт-ч Х Выпуск продукции на одного рабочего, т У ху х – у – (х – )2 (у – )2
1. 2. 3. 4. 5. 6. 7. 8. 9. 10.       -3 -2 -3 -1 -1 -3 -2 -2 -1    
Итого:              
В среднем       34,3        

а1 = 9 +0 +4+ 0 +6 +2 + 0 +12 +9 +1 = 43 = 0,7963


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: