Тема 9. Методы измерения взаимосвязей

В практике статистического исследования зависимости явлений вскрываются причинно-следственные отношения между признаками. Одни признаки выступают в качестве причин и называются факторными, другие являются следствием изменения факторных признаков и носят название результативных.

Изучение и измерение взаимосвязей между признаками состоит из трёх этапов. В основе первого этапа лежит качественный анализ изучаемого явления и процесса, который основан на всестороннем изучении его природы. На втором этапе происходит построение модели, на третьем – оценка качества модели и интерпретация полученных результатов.

В статистике различают два вида связи – функциональную и стохастическую (вероятностную). Функциональной называют связь, при которой определённому значению факторного признака соответствует одно значение результативного признака. Например, площадь круга , где −радиус окружности.

Стохастическая зависимость проявляется не в каждом конкретном случае, а в общем, при большом числе наблюдений. Частным случаем стохастической связи является корреляционная связь, которая показывает изменение среднего значения результативного признака под действием колеблемости факторных признаков. Например, на урожайность зерновых культур влияет количество выпавших осадков, внесённых удобрений, температурный режим и т.д.

Связи между признаками и явлениями имеют определённую классификацию: по степени тесноты связи; по направлению; по аналитическому выражению.

По степени тесноты связи обычно используют шкалу Чеддока..

По направлению связи делятся на прямые и обратные, В случае прямой связи с увеличением или уменьшением значений факторного признака происходит увеличение или уменьшение результативного. При обратной связи изменение результативного признака осуществляется наоборот, с увеличением фактора− уменьшается результат.

По аналитическому выражению связи различают на прямолинейные и криволинейные. Если связь может быть описана уравнением прямой, такую связь называют линейной. Если же она выражается уравнением кривой линии (параболы, экспоненты, гиперболы, логистической кривой и т.д.), то такая связь называется криволинейной.

Для измерения связи используются следующие методы: относительных и средних величин; аналитических группировок; индексный; корреляционно-регрессионный анализ.

Корреляция – это статистическая зависимость, между факторными и результативными признаками, не имеющими функционального характера. Задачей корреляционнго анализа является количественное определение тесноты связи между факторным и результативным признаком или между множеством факторных признаков и результативным. Теснота связи количественно выражается величиной коэффициентов корреляции.

В статистическом анализе связей различают следующие варианты корреляционных зависимостей:

1. Парная корреляция – связь между факторным и результативным признаками или двумя факторными признаками.

2. Множественная корреляция – связь между двумя и более факторными признаками и результативным.

3. Частная корреляция – связь между двумя факторами при погашении связи с другими переменными.

Регрессионный анализ определяет форму, направление и силу связи.

При проведении корреляционно-регрессионного анализа следует соблюдать следующие требования:

1) наличие достаточно большого объема исследуемой совокупности;

2) число наблюдений должно быть не менее чем в 5−6, а лучше 10 раз больше числа факторов;

2) совокупность изучаемых характеристик должна быть однородной;

3) все признаки и их совместное распределения должны подчиняться закону

нормального распределения;

4) должна соблюдаться территориальная и временная структура данных.

Наиболее разработанной является методология парной регрессии.

В случае анализа прямой зависимости применяется уравнение прямой:

,

где − теоретическое значение результативного признака, найденное по уравнению регрессии;

и − параметры уравнения регрессии;

− значение факторного признака.

При криволинейной зависимости применяется ряд математических функций:

- параболическая ;

- гиперболическая ;

- показательная ;

- степенная и т.д.

В уравнении регрессии параметр показывает усреднённое влияние на результативный признак неучтённых факторов; параметр (а в уравнении параболы ) – коэффициент регрессии определяет, насколько в среднем изменяется значение результативного признака при изменении факторного на единицу. Параметры уравнения прямой исчисляются на основе системы нормальных уравнений:

отсюда

;

.

Найденные параметры подставляют в уравнение прямой:

.

Если численность объектов анализа меньше 30 единиц, то возникает необходимость испытания параметров уравнения регрессии на их типичность с помощью -критерия Стьюдента:

- для параметра :

,

где − объём совокупности;

− среднеквадратическое отклонение остаточной дисперсии:

,

−фактическое значение результативного признака;

− теоретическое значение результативного признака;

-для параметра :

,

− среднеквадратическое отклонение факторного признака от общей средней факторного признака :

.

Полученные значения и сравнивают с табличным , который находят по таблице Стьюдента с учётом принятого уровня значимости и числа степеней свободы . Если фактическое больше табличного, то параметры уравнения регрессии признаются типичными:

и .

Важным этапом корреляционно-регрессионного анализа является определение тесноты связи между факторным и результативным признаками:

1. При прямолинейной парной форме связи показатель тесноты связи определяется по формуле линейного коэффициента корреляции:

,

где − среднеквадратическое отклонение результативного признака

.

Линейный коэффициент корреляции изменяется от –1 до +1.

Линейный коэффициент корреляции, рассчитанный по данным сравнительно небольшой статистической совокупности, может искажаться действием случайных причин, что вызывает необходимость проверки существенности на основе -критерия Стьюдента. При объеме совокупности меньше 30 -критерий рассчитывается по формуле

.

В случае когда больше 50, то -статистика определяется:

.

Вычисленные значения сравниваются с табличным , с учётом уровня значимости и числа степеней свободы . Если больше , то линейный коэффициент корреляции признается статистически значимым.

2. Индекс детерминации рассчитывается как для линейной, так и для криволинейной зависимости. Он отражает долю факторной дисперсии в общей дисперсии, т.е. показывает, какая часть общей вариации результативного признака объясняется изучаемым фактором .

,

где − факторная дисперсия, т.е. колеблемость объясняется уравнением регрессии:

,

− среднее значение результативного признака;

− общая дисперсия, т.е. колеблемость результативного признака:

.

Индекс детерминации изменяется в пределах от -1 до +1.

3. Индекс корреляции – это корень квадратный из коэффициента детерминации. Он показывает тесноту связи между факторным и результативным признаками:

,

т.к. общая дисперсия − это сумма факторной и остаточной дисперсии:

, то

.

По абсолютной величине индекс корреляции равен линейному коэффициенту корреляции и изменяется в пределах от 0 до =1.

Для оценки значимости индекса корреляции применяется -критерий Фишера. Фактическое значение критерия определяется по формуле

,

где − число параметров уравнения. Если уравнение линейное, то =2 (параметры и ), если криволинейное, выраженное параболой второго порядка, то =3 (параметры и ).

Величина сравнивается с табличным , с учётом уровня значимости и числа степеней свободы и . Если ,то величина индекса корреляции признаётся статистически значимой.

Пример 1. И меются следующие данные по 10 сахарным заводом о стоимости основных производственных фондов, х (млн руб.) и суточной переработке сахарной свеклы, у (тыс. т):

Стоимость ос-новных произ-водственных фондов, млн руб.   2,0   2,3   2,4   2,9   2,9   3,7   3,7   4,1   4,6   4,7
Суточная пере-работка сахар- ной свеклы, тыс.т     8,9     10,0     9,9     10,3     10,0     13,0     12,8     13,1     13,2     13,5

1. Построить уравнение регрессии, используя уравнение прямой и определить значимость его параметров.

2. Измерить тесноту связи между стоимостью основных производственных фондов и суточной переработкой сахарной свеклы с помощью линейного коэффициента корреляции и проверить его значимость с помощью -критерия Стьюдента при уровне значимости .

3. Определить тесноту связи между факторным и результативным признаком на основе индекса корреляции, а также проверить, существенность этой характеристики с помощью -критерия Фишера ( = 0,05).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: