Статистическое изучение взаимосвязей между признаками

По характеру зависимости между факториальными и результативными признаками связи делятся на функциональные и стохастические.

Стохастическая связь называется корреляционной, если при изменении значений факториальных признаков меняется средняя величина результативного признака. Уравнение, характеризующее изменение средней величины результативного признака в зависимости от изменений значений факториального признака, называется уравнением корреляционной связи или уравнением регрессии. Корреляционный анализ предназначен для изучения тесноты связи между факторным и результативным признаками, а регрессионный анализ – для нахождения уравнения корреляционной связи (регрессии), оценки ее точности и надежности.

Первая задача сводится к определению формы и вида связи.

Существует несколько методов выявления наличия связи между признаками: метод параллельных рядов или параллельного сопоставления, графический метод (построение поля корреляции), способ группировки и выведение средних по группам.

Если уравнение связывает два признака (один факториальный и один результативный), то это – уравнение парной регрессии. При определении функции, связывающей результативный признак с одним факториальным, используется графическое изображение связи. Полученная эмпирическая линия (ломаная) регрессии показывает, какую функцию для отображения связи можно применить.

В случае линейной парной регрессии уравнение имеет следующий вид:

,

где - среднее значение результативного признака;

- индивидуальные значения факториального признака;

- параметры уравнения связи.

Параметр «b» – (коэффициент регрессии) показывает на сколько в среднем изменяется результативный признак (y) при изменении факториального признака (x) на единицу. Параметр «а» - характеризует изменение результативного признака под воздействием всех прочих факторов, которые здесь не учитываются.

Для определения параметров уравнений прямой на основе методов наименьших квадратов решается следующая система нормальных уравнений:

,

где n – объем совокупности;

y – индивидуальные значения результативного признака;

x – индивидуальные значения факториального признака.

При наличии линейной зависимости степень тесноты связи можно рассчитать с помощью коэффициента парной корреляции () или эмпирического корреляционного отношения ().

Коэффициент корреляции можно определить следующим образом:

;

Коэффициент корреляции изменяется в пределах от –1 до +1. Знак при коэффициенте корреляции говорит о направлении связи (прямая или обратная), а его величина – о степени тесноты связи (чем ближе к 1, тем связь теснее).

Оценка существенности коэффициента корреляции определяется на основании критерия его надежности t, который рассчитывается по формуле:

В математической статистике доказано, что если t < 2,56, то связь между признаками признается несущественной. В этом случае считается, что факториальный признак не оказывает существенного влияния на результативный признак. Если t > 2,56, то связь признается существенной, т.е. факториальный признак оказывает существенное влияние на признак результативный.

Литература

1. Ефремова М.Р. Практикум по общей теории статистики. Учебное пособие. М.: Финансы и статистика, 2000.

2. Петрова Е.В. и др. Статистика транспорта. Учебник для вузов. М.: Финансы и статистика, 2001.

3. Степанова Н.И. Статистика часть I (общая теория статистики) М.: МГТУ ГА, 1998.

4. Степанова Н.И. Методические указания по изучению дисциплины «Статистика».. М.: МГТУ ГА, 1998

СОДЕРЖАНИЕ

Введение  
1. Исходные данные для выполнения курсовой работы  
2. Варианты заданий на курсовую работу  
3.Методические указания по выполнению курсовой работы  
3.1. Сводка и группировка данных статистического наблюдения  
3.2. Средние величины  
3.3. Показатели вариации  
3.4. Показатели выборочного наблюдения  
3.5. Статистическое изучение взаимосвязей между признаками  
Литература  

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: