Количество легковых автомобилей по отношению к доходу и размеру семьи

Таблица 5.5

Количество легковых автомобилей по отношению к доходу и размеру семьи

Таблица 5.4

Проценты всегда рассчитываются в направлении причинного фактора или поперек результирующего фактора.

Поэтому в данном примере логично принимать доход за причинную, или независимую переменную, а владение автомобилем зависимой переменной, т.е. правильный расчет в табл. 4.3.

Двумерная табуляция хотя и обеспечивает некоторое проникновение в суть зависимой взаимосвязи, но не дает окончательного ответа.

Например, тоже самое можно сделать и с зависимостью количества машин и размером семьи. Поэтому правильный подход состоит в одновременной обработке дохода, размера семьи и владения не одним автомобилем.

Из табл. 5.5 видно, что 4% составляют малые семьи с доходами ниже среднего, владеющие двумя или более автомобилями. Остальные 96%, представляют семьи, во владении которых есть только одна машина или нет ни одной.

Отдельное влияние дохода на владение несколькими при постоянном размере семьи прочитывается по колонкам сверху вниз, а эффект размера семьи при постоянном доходе можно определить, считывая цифры по строкам (табл.5.4).

Доход 4 человека или менее: число машин 5 человек или более: число машин Всего: число машин
1 или нет 2 или более всего 1 или нет 2 или более всего 1 или нет 2 или более всего
Менее 37500 44 2 46 4 4 8 48 6 54
Более 37500 26 6 32 1 13 14 27 19 46
Всего 70 8 78 5 17 22 75 25 100

Покажем процентное распределение количество легковых автомобилей по отношению к доходу и размеру семьи (табл.4.5).

Доход 4 человека или менее: число машин 5 человек или более: число машин Всего: число машин
1 или нет 2 или более всего 1 или нет 2 или более всего 1 или нет 2 или более всего
Менее 37500 96% 4% 100%(46) 50% 50% 100%(8) 89% 11% 100%(54)
Более 37500 81% 19% 100%(32) 7% 93% 100%(14) 59% 41% 100%(46)

Исходная взаимосвязь, показанная в табл.5.2 называется полной (или нулевого порядка) связью между переменными.

Полная связь – связь, существующая между переменными вне зависимости от уровней любых других переменных (еще называется связью нулевого порядка между переменными).

Табл. 5.4, которая дает картину связи между двумя переменными (если брать только 2 или более машин) в пределах категорий размера семьи, называется условной таблицей, позволяющей обнаружить условную связь между переменными.

Условная связь – связь, существующая между двумя переменными, когда в процессе анализа рассматриваются уровни одной или более других переменных (условных переменных).

Размер семьи в табл. 5.4 является регулируемой переменной.

Условные таблицы, построенные на основе одной регулируемой переменной, называются условными таблицами первого порядка.

Таблицы, составленные с использованием двух регулируемых переменных, называются условными таблицами второго порядка и т.д.

Для определения того, доход или размер семьи имеют наибольшее влияние, необходимо рассмотреть их одновременно, используя метод разности долей.

Сначала рассмотрим влияние дохода и владение несколькими автомобилями для малых семей, а затем тоже для больших семей. Среди малых семей более высокий доход увеличивает вероятность владения несколькими автомобилями на 0,15 (0,19-0,04). Среди больших семей повышение вероятности владения несколькими автомобилями с ростом дохода составляет 0,43 (0,93-0,50). Эти разности являются мерами связи между доходом и владением несколькими автомобилями для семей разных размеров. Чтобы получить единственную оценку влияния дохода на владение несколькими автомобилями необходимо рассчитать среднее отдельных эффектов (средневзвешенное). Выборка объемом 100 семей состояла из 78 малых и 22 больших семей, поэтому весовой коэффициент для малых семей будет равен 0, 78, а для больших – 0,22. Средневзвешенное рассчитывается как:

0,15´0,78 + 0,43´0,22=0,21

Это показывает, что переход из разряда низких доходов в разряд высоких в среднем повышает вероятность владения несколькими машинами на 0,21 (или21%).

Рассмотрим влияние размера семьи и владение несколькими автомобилями для семей с низкими доходами, а затем тоже для семей с высокими доходами.

Среди семей с низкими доходами их большой размер повышает вероятность владения несколькими автомобилями на 0,46 (0,50-0,04) по сравнению с семьями малого размера. Среди семей с высокими доходами их большой размер повышает ту же вероятность на 0,74 (0,93-0,19) по сравнению с малочисленными семьями. Т.к. семей с низкими доходами в выборке было 54, а высокодоходных семей – 46, соответствующие веса для осреднения двух влияний равны 0,54 и 0,46 соответственно. Тогда средневзвешенное будет равно:

0,46´0,54+0,74´0,46=0,59.

Таким образом, размер семьи обладает более существенным влиянием на владение не одним автомобилем, чем доход. Он повышает вероятность владения двумя и более автомобилями на 0,59, тогда как доход увеличивает ее только на 0,21.

Приведенный пример показывает важное приложение перекрестной табуляции – использование дополнительной переменной для очистки исходной перекрестной табуляции. В данном случае для очистки взаимосвязи между владением несколькими автомобилями и доходом был использован размер семьи. В действительности возможно появление ряда условий, при которых может возникнуть необходимость введения в перекрестную табуляцию дополнительных переменных. Исходная двумерная табуляция может указывать на существование или не существование взаимосвязи между переменными. Введение третьей переменной может либо оставить сделанное заключение неизменным, либо изменить его.

В настоящее время табулированные результаты чаще представляются в виде баннеров. Баннер – это последовательныйряд перекрестных табуляций между критерием и несколькими (часто большим числом) факторными переменными, оформленный в виде единой таблицы. Зависимая переменная или какое-то подлежащее объяснению явление определяет название строк таблицы. Заранее предсказанные или факторные переменные определяют колонки таблицы, а каждое значение этих переменных называется баннерной точкой. В табл. 5.6 показан баннерный формат для исследования владения легковыми автомобилями.

Достоинства баннерных таблиц:

- позволяют представить большой объем информации на небольшом носителе;

- формат представления удобен для восприятия.

Недостатки:

- имеют тенденцию к сокрытию взаимосвязей;

- затрудняют возможность зондирования возможных альтернативных объяснений полученных результатов;

- трудность в обнаружении ошибок в представляемых данных в результате неправильного кодирования или редактирования.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: