ТЕМА 11.
СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗЕЙ
СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ
1. Виды и формы взаимосвязей между социально-экономическими явлениями. Общественная жизнь состоит из большого количества сложных явлений, которые формируются под влиянием многочисленных, разнообразных и взаимосвязанных факторов. Понять и изучить какое-либо явление можно, исследуя его во взаимосвязи с окружающими признаками.
В статистике различают факторные и результативные признаки.
Факторные (независимые) признаки обусловливают изменения других, связанных с ними признаков.
Результативные (зависимые) признаки изменяются под действием факторных признаков.
Между явлениями и их признаками различают прежде всего два вида связей: функциональные и стохастические (статистические, вероятностные), каждая из которых имеет свои особенности. Частный случай стохастических связей — корреляционные связи.
При функциональной связи изменение результативного признака полностью зависит от изменения факторного признака :
|
|
Примером функциональной связи в экономике может служить зависимость производительности труда от объема произведенной продукции и затрат рабочего времени. Следует отметить, что если – детерминированная, не случайная величина, то и функционально зависящая от нее величина тоже является детерминированной.
Для функциональной связи характерны следующие особенности:
1) каждому значению величины факторного признака соответствует только одно или несколько точно определенных значений результативного признака:
2) эта связь обычно выражается формулами, что в большей степени присуще точным наукам (математике, физике):
3) функциональная зависимость с одинаковой силой проявляется у всех единиц в совокупности;
4) она является полной и точной, так как обычно известны перечень всех факторов и механизм их воздействия на результативный признак (в виде уравнения).
Однако гораздо чаше в экономике имеет место не функциональная, а статистическая зависимость, когда каждому фиксированному значению независимой переменной соответствует не одно, а множество значений зависимой переменной , причем заранее нельзя сказать, какое именно значение примет . Это связано с тем, что на , кроме переменной , влияют и многочисленные неконтролируемые случайные факторы. В этой ситуации – случайная величина, а переменная может быть как детерминированной, так и случайной величиной. Частным случаем статистической зависимости является корреляционная, при которой функциональной зависимостью связаны фактор и среднее значение (математическое ожидание) результативного показателя .
|
|
При корреляционной связи изменение результативного признака не всецело зависит от факторного признака , а лишь частично, так как возможно влияние прочих факторов :
.
Примером корреляционной связи показателей коммерческой деятельности является зависимость сумм издержек обращения от объема товарооборота. В этой связи, помимо факторного признака — объема товарооборота , на результативный признак (сумму издержек обращения ) влияют и другие факторы, в том числе и не учтенные .
Корреляционные связи имеют следующие особенности:
1) средняя величина результативною признака меняемся под влиянием изменения многих факторных признаков, ряд из которых может быть неизвестен;
2) разнообразие факторов, их взаимосвязи и противоречивое действие вызывают широкое варьирование результативного npизнака;
3) корреляционные связи обнаруживаются не в единичных случаях, а в массе, для их исследования требуются массовые наблюдения;
4) связь между признаками-факторами и результативным признаком неполная, а проявляется лишь в общем, среднем.
Изучая взаимосвязи между признаками, их классифицируют по направлению, форме, числу факторов:
· по направлению связи делятся на прямые и обратные. При прямой связи направление изменения результативного признака совпадает с направлением изменения признака-фактора. С увеличением (уменьшением) значений факторного признака происходит увеличение (уменьшение) результативного признака. Обратные связи характеризуются тем, что направление изменения результативного признака не совпадает с направлением изменения признака-фактора. С увеличением (уменьшением) значений факторного признака происходит уменьшение (увеличение) результативного признака. Например, чем выше квалификация рабочего, тем выше уровень производительности его труда (прямая связь). Чем выше производительность труда, тем ниже себестоимость единицы продукции (обратная связь);
· по форме (виду функции) связи делят на линейные (прямолинейные) и нелинейные (криволинейные). Линейная связьотображается прямой линией, нелинейная связь – кривой (параболой, гиперболой и т.д.). При наличии этих связей с возрастанием значения факторного признака происходит равномерное возрастание (или убывание) значения результативного признака;
по количеству факторов, действующих на результативный признак, связи подразделяются на однофакторные (парные) и многофакторные. Однофакторные (парные) связи отражают зависимость между одним признаком-фактором и результативным признаком (при абстрагировании от влияния других признаков). Многофакторные (множественные) связи характеризуются зависимостью между несколькими факторными признаками и результативным признаком (факторы действуют комплексно, т.е. одновременно и во взаимосвязи).
Для изучения связей и их количественного выражения в статистике используются различные методы.
Для выражения функциональных связей применяют балансовый метод и метод компонентных связей.
Метод балансовых построений широко используют для анализа связей и пропорций в экономике. Статистический баланс представляет собой систему показателей, которая состоит из двух сумм абсолютных величин, связанных знаком равенства:
.
Примером балансов такого рода служат баланс основных средств и баланс трудовых ресурсов в какой-нибудь организации. Суммы показателей в них образуют систему величин, характеризующих размер ресурсов на начало периода, поступление и выбытие по источникам, размер ресурсов на конец периода. Например, , где – остаток товаров на начало отчетного периода; – поступление товаров за период; – выбытие товаров в изучаемом периоде; – остаток товаров на конец отчетного периода.
|
|
Левая часть формулы характеризует предложение товаров , а правая часть – использование товарных ресурсов .Посредством балансов связывают в единую систему абсолютные величины, показывающие движение ресурсов.
Данную сумму можно представить следующим равенством: остаток на начало + приход = расход + остаток на конец. Пример, продано в розницу = остаток на начало + приход – продано оптом – остаток на конец (табл.1).
Таблица 1
Таблица балансового метода
Товары | Остаток на 1.01 | Приход за квартал | Итого (баланс) | Продано в розницу | Продано оптом | Итого в расход | Остаток на 1.04 | Баланс |
А | ||||||||
- | ||||||||
Итого |
Балансовый метод дает возможность не только анализировать показатели во взаимосвязи, но и осуществлять взаимный контроль данных и рассчитывать недостающие показатели.
Компонентные связи показателей экономической деятельности характеризуются тем, что изменение статистического показателя определяется изменением компонентов, входящих в этот показатель, как множители:
В статистике экономической деятельности компонентные связи используются в индексном методе. Например, индекс товарооборота в фактических ценах представляет произведение двух компонентов — индекса товарооборота в сопоставимых ценах и индекса цен , т.е.
.
Важное значение компонентной связи состоит в том, что она позволяет определять величину одного из неизвестных компонентов:
или
При статистическом изучении корреляционной связи показателей экономической деятельности перед статистикой ставятся следующие основные задачи:
1) проверка положений экономической теории о возможности связи между изучаемыми показателями и придание выявленной связи аналитической формы зависимости;
2) установление количественных оценок тесноты связи, характеризующих силу влияния факторных признаков на результативные.
|
|
Для того, чтобы установить, есть ли зависимость между величинами, используются многообразные статистические методы, позволяющие определить, во-первых — какие связи; во-вторых — тесноту связи (в одном случае она сильная, устойчивая, в другом — слабая); в-третьих — форму связи (т.е. формулу, связывающую величину и ).
В процессе изучения связи надо учитывать, что мы используем математический аппарат, но всегда надо иметь теоретические обоснования той связи, которую пытаются показать.
При рассмотрении корреляционных связей используют:
· методы взаимной сопряженности – для изучения связи между атрибутивными (качественными) признаками;
· метод параллельных рядов;
· графический метод (корреляционного поля);
· табличный метод (корреляционной таблицы);
· метод аналитических группировок;
· корреляционно-регрессионный анализ и другие методы — для выявления связей между количественными (варьирующими) признаками.
Проведение корреляционно-регрессионного анализа предполагает решение следующих задач:
· выявление из большого числа факторов наиболее информативных, оказывающих более существенное воздействие на результативную величину (предварительный анализ, базирующийся на простейших моделях выявления зависимостей и экспертных оценках);
· определение направления и количественной оценки тесноты зависимости между факторной величиной и результативной (при этом факторных переменных может быть достаточно много, тогда определяется множественная корреляция);
· нахождение математической функции, описывающей зависимость результативного показателя Y от наиболее информативных факторных . Эта функция выполняет роль модели, которая аналитически выражает зависимость условного среднего значения результативного признака от факторных переменных ;
· оценка качества полученной модели, определение возможной величины ошибки получаемых по этой модели прогнозных значений ;
· построение прогнозов.
Из перечисленных задач первые две относят непосредственно к задачам к орреляционного анализа, три последующие — к регрессионному анализу и только по отношению к количественным показателям.
Методы корреляционно-регрессионного анализа можно применить не ко всем статистическим данным. Перечислим основные требования, предъявляемые к анализируемой информации:
· используемые для исследования наблюдения должны являться случайно выбранными из генеральной совокупности объектов. В противном случае исходные данные, представляющие собой определенную выборку из генеральной совокупности, не будут отражать ее характер, полученные по ним выводы о закономерностях развития окажутся бессмысленными и не имеющими никакой практической ценности;
· требование независимости наблюдений друг от друга. Зависимость наблюдений друг от друга называется автокорреляцией, для ее устранения в теории корреляционно-регрессионного анализа созданы специальные методы;
· исходная совокупность данных должна быть однородной, без аномальных наблюдений. И действительно, одно-единственное, резко выделяющееся наблюдение может привести к катастрофическим последствиям для регрессионной модели, ее параметры окажутся смещенными, выводы абсурдными;
· желательно, чтобы исходные данные для анализа подчинялись нормальному закону распределения. Нормальный закон распределения используется для того, чтобы при проверке значимости коэффициентов корреляции и построении для них интервальных границ можно было использовать определенные критерии. Если же проверять значимость и строить интервальные оценки не требуется, переменные могут иметь любой закон распределения.
В регрессионном анализе при построении уравнения регрессии требование нормальности распределения исходных данных предъявляется лишь к результативной переменной Y, независимые факторы рассматриваются как неслучайные величины и могут в действительности иметь любой закон распределения. Как и в случае корреляционного анализа, требование нормальности распределения нужно для проверки значимости регрессионного уравнения, его коэффициентов и нахождения доверительных интервалов;
· число наблюдений, по которым устанавливается взаимосвязь признаков и строится модель регрессии, должно превышать количество факторных признаков хотя бы в 3—4 раза (а лучше в 8—10 раз).
Как отмечалось выше, статистическая связь проявляется только при значительном числе наблюдений на основе действия закона больших чисел, причем чем связь слабее, тем больше требуется наблюдений для установления связи, чем сильнее – тем меньше;
· факторные признаки не должны находиться между собой в функциональной зависимости. Значительная связь независимых (факторных, объясняющих) признаков между собой указывает на мулътиколлениарностъ. Ее наличие приводит к построению неустойчивых регрессионных моделей, «ложных» регрессий.
2. Измерение тесноты связей между качественными признаками. Изучение и оценка связей между атрибутивными (качественными) признаками в статистике осуществляется с использованием методов взаимной сопряженности (непараметрических методов оценки связи).
Методы взаимной сопряженности строятся на применении следующих показателей:
· коэффициента ассоциации;
· коэффициента контингенции;
· биссериального коэффициента корреляции;
· коэффициента взаимной сопряженности Л.А. Чупрова;
· коэффициента взаимной сопряженности Пирсона.
Взаимосвязи между атрибутивными признаками анализируются на основе таблиц взаимной сопряжённости (взаимозависимости).
Коэффициент ассоциации применяется для изучения связи между качественными признаками в том случае, когда каждый признак принимает только по два значения (состоит только из двух групп), т.е. позволяет изучить связь между альтернативными признаками.
Да | Нет | |
Да | ||
Нет |
Он определяется по формуле:
,
где – частоты «таблицы четырех полей».
Коэффициент ассоциации изменяется в пределах от (-1) до (+1). Чем ближе этот показатель к 1 или (-1), тем сильнее связаны между собой изучаемые признаки. Если коэффициент ассоциации не ниже 0,3, можно говорить о наличии существенной связи между признаками.
Пример
При анализе работы фирмы, оказывающей сантехнические услуги как компаниям, так и индивидуальным заказчикам, возникла необходимость оценить, нет ли связи между типом клиента и качеством обслуживания. С этой целью была построена таблица сопряженности (табл.2).
Таблица 2
Соотношение типа клиента и качества обслуживания
Клиенты | Качество обслуживания | Количество обслуженных | |
Устраивает | Не устраивает | ||
Компании | 150 a | 18 b | |
Индивидуальные заказчики | 352 c | 113 d | |
Итого |
Коэффициент ассоциации равен
.
Коэффициент контингенции определяется по формуле:
.
По абсолютной величине коэффициент контингенции всегда меньше коэффициента ассоциации и изменяется в пределах от (-1) до (+1). Чем ближе к (+1) или (-1), тем сильнее связаны между собой изучаемые признаки.
Для предыдущего примера коэффициент контингенции равен
.