I. Понятие о корреляционной связи и предпосылки её использования

В статистике различают две категории зависимостей между явлениями и признаками:

1) функциональная;

2) стохастическая, частным случаем которой является корреляционная

При этом признаки для изучения взаимосвязи по их значению делятся на два класса. Признаки, обуславливающие изменение других, связанных с ними признаков, называются факторными (х). Признаки, изменяющиеся под действием факторных признаков, являются результативными (у).

Функциональной называется связь, при которой каждому значению факторного признака соответствует вполне определённое значение результативного признака.

Функциональная связь является строгой, точной, полной зависимостью; проявляется и для каждой единицы совокупности, и во всех случаях наблюдения. Чаще всего она встречается в естественных науках: физике, математике, астрономии и др. Например, длина окружности всегда в 6,28 раза больше его радиуса. Функциональная связь может связывать результативный признак с несколькими факторными признаками. Например, влияние тока в цепи зависит от напряжения и сопротивления.

Характерной особенностью функциональной связи является то, что в каждом отдельном случае известен полный перечень факторов, влияющих на результативный признак, а также механизм этого влияния, выраженный определённым уравнением.

Реже подобные связи встречаются в общественной жизни, в частности в экономических процессах. Если, например, при сдельной оплате труда рабочий получает 100 рублей за одну изготовленную деталь, то его общий заработок будет функционально зависеть от количества изготовленных деталей.

Стохастическая (вероятностная) связь не проявляется в каждом отдельном случае в силу влияния на социально-экономические явления помимо существенных ещё и случайных факторов, а лишь в общем, среднем, при большом числе наблюдений.

Корреляционной называется связь, при которой каждому значению факторного признака может соответствовать несколько значений результативного признака. Например, известно, что повышение квалификации ведёт к росту производительности труда. Однако это не значит, что у двух или трёх рабочих одного разряда будет одинаковая производительность труда (выработка), так как у этих рабочих может быть разный стаж работы, техническое состояние станка, состояние здоровья, возраст и др.

Для исследования функциональных связей в статистике применяются балансовый и индексный методы. Для изучения стохастических связей используется метод сопоставления параллельных рядов, метод аналитических группировок, дисперсионный анализ и корреляционно-регрессионный анализ.

Корреляционные связи имеют ряд характеристик:

По форме (аналитическому выражению) корреляционные связи между признаками могут быть линейными (прямолинейными) и нелинейными (криволинейными).

При линейной форме равномерное изменение значений одного признака сопровождается более или менее равномерным изменением значений другого признака. Математически она выражается уравнением прямой ух = а + вх, графически - прямой линией.

При нелинейной форме равномерному изменению значений одного признака соответствует неравномерное изменение значений другого. Выражается уравнением какой- либо кривой линии: параболы, гиперболы, показательной, степенной, логарифмической, логической функции и др.

По направлению (характеру изменения) корреляционные связи бывают прямыми и обратными.

Прямой (положительной) является зависимость, при которой направление изменения значений факторного и результативного признаков совпадает, то есть с увеличением факторного признака, результативный также возрастает, и наоборот, при уменьшении факторного признака результативный тоже убывает.

Обратной (отрицательной) называется связь, при которой изменение значений факторного и результативного признаков осуществляется в разных направлениях, то есть с ростом факторного результативный признак убывает или при убывании факторного признака результативный возрастает.

Степень тесноты корреляционной связи оценивается по специальным шкалам, например, по шкале Чеддока.

Количественный критерий оценки тесноты связи по шкале Чеддока

Величина показателя для измерения тесноты связи Характер связи
до |0,3| слабая
|0,3|-|0,5| умеренная
|0,5|-|0,7| заметная
|0,7|-|0,9| высокая
|0,9|-|1| весьма высокая
|1| функциональная
  отсутствие связи  

Существуют и другие менее детальные шкалы.

В статистике различают следующие варианты зависимостей:

1) парная корреляция – связь между двумя признаками (результативным и факторным);

2) частная корреляция – зависимость между результативным и одним факторным признаком при фиксированном значении других факторных признаков;

3) множественная корреляция – зависимость результативного от двух или более факторных признаков.

В практике статистических исследований выделяют:

  • корреляционный анали з, который имеет своей задачей количественное измерение тесноты связи между признаками;
  • корреляционно-регрессионный анализ, который включает в себя установление аналитического выражения (формы), направления связи и измерение её тесноты;
  • р егрессионный анализ, который заключается в определении формы связи, построении одно- или многофакторных моделей (уравнений) регрессии.

При исследовании корреляционных зависимостей можно выделить следующие этапы:

1) предварительный (априорный) анализ;

2) сбор информации и её первичная обработка;

3) установление факта наличия связи, определение её направления и формы;

4) измерение степени тесноты связи;

5) построение регрессионной модели (уравнения регрессии);

6) оценка адекватности модели, её экономическая интерпретация и практическое использование.

Первый этап включает в себя следующие виды работ:

а) в самом общем виде формулируется задача исследования, например, изучение влияния различных факторов на производительность труда;

б) определяется методика измерения результативного показателя, то есть выбирается измеритель, который наилучшим образом характеризует этот показатель с точки зрения задачи исследования. Так, если результативным показателям является производительность труда, то необходимо выяснить, каким методом (стоимостным, трудовым, натуральным) целесообразнее всего исследовать её в конкретных условиях данного производства;

в) решается вопрос о числе факторов, оказывающих наиболее существенное влияние на формирование результативного показателя и о способах их измерения. Обычно проводят 2-х или 3-х стадийный отбор факторов:

на первой стадии отбирают все факторы, связанные с результативным показателем, на второй стадиив процессе качественного и количественного анализа этот перечень конкретизируется и уточняется.При этом значительную помощь оказывает метод экспертной оценки факторов, основанный на привлечении специалистов в исследуемой области и другие методы;

г) в отношении факторов, включённых в исследование, вводятся требования:

- факторные признаки должны быть количественными, лучше всего - непрерывными, иначе составить модель корреляционной зависимости не представляется возможным. Если в данном исследовании трудно обойтись без атрибутивных признаков, то целесообразно искусственно привести их к количественному виду путём ранжирования;

- факторные признаки должны рассчитываться по отношению к единой базе.

Если результативный показатель – производительность труда одного рабочего, то и факторные показатели (машиновооружённость, заработная плата и др.) тоже должны быть в расчёте на одного рабочего. Иначе истинное влияние каждого из этих факторов на результативный признак искажается;

- факторы должны быть независимыми друг от друга, так как наличие тесной связи между ними свидетельствует о том, что они характеризуют одни и те же стороны изучаемого явления и в значительной мере дублируют друг друга;

- изучаемые признаки должны подчиняться закону нормального распределения. Поэтому изучается форма распределения, дающая возможность обосновать правомерность применения корреляционного метода.

На втором этапе корреляционно-регрессионного анализа проверяют качество исходной информации. Поэтому информационная база должна соответствовать следующим условиям:

- совокупность должна быть достаточно большой по числу единиц, чтобы в силу действия закона больших чисел определяемые в процессе корреляционно-регрессионного анализа статистические характеристики были достаточно типичными и надёжными. Как показывает практика, число единиц совокупности должно быть минимум в 6-8 раз больше количества включённых в исследование факторов;

- исходные данные должны быть качественно и количественно однородными.

Качественная однородност ь предполагает близость условий формирования факторного и результативного признаков. Так, при изучении производительности труда предприятия должны быть однородны по географическому размещению, принадлежности к определённой отрасли, по типу выпускаемой продукции, применяемым технологиям производства.

Количественная однородность заключается в отсутствии единиц наблюдения, которые по своим числовым характеристикам значительно отличаются от остальной массы данных. Такие «аномальные» наблюдения следует исключить из совокупности. В качестве показателя для оценки количественной однородности традиционно применяют коэффициент вариации (vх< 33%) или исключают все единицы, у которых значения не попадают в интервал .

ТЕМА: «РЯДЫ ДИНАМИКИ»

Основные задачистатистического изучения динамики социально-экономических явлений и процессов являются:

1) характеристика интенсивности изменений в уровнях ряда от периода к периоду или от даты к дате;

2) определение средних показателей динамического ряда;

3) выявление основных закономерностей развития исследуемого явления на отдельных этапах и в целом за анализируемый период;

4) выявление факторов, обуславливающих изменение изучаемого объекта во времени;

5) прогноз развития явления на будущее.

Таблица 1 – Размер прибыли на предприятии №1 за 2002 -2007г.г.

2002г. 2003г. 2004г. 2005г. 2006г. 2007г. - моменты времени (t)
546,5 544,1   528,1   511,7 - уровни ряда динамики (у)


Рисунок 1–Виды рядов динамики

Таблица 1– Показатели размера крестьянских (фермерских) хозяйств в Тамбовской области в 2003-2007 годы

Показатели Вид ряда 2003 г. 2004 г. 2005 г. 2006 г. 2007 г.
Число зарегистрированных крестьянских хозяйств абсолютных величин          
Удельный вес посевной площади сельскохозяйственных культур в общей посевной площади хозяйств всех категорий относительных величин     4,8     5,4     6,1     10,7     13,2
Средний размер предоставленных крестьянским хозяйствам земельных участков, га средних величин                    

Приемы приведения уровней динамического ряда к сопоставимому виду:

· смыкание рядов динамики;

· приведение уровней к одному основанию;

· приведение сравниваемых показателей к однородной структуре;

· замена абсолютных показателей относительными;

· приведение промежутков времени, по которым ведется сравнение, к тождественности.

Рисунок 2– Типы колебаний в динамических рядах


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: