Выборочное корреляционное отношение. Его значимость

Пусть имеется п наблюдений двумерной величины (Χ, Υ). Наблюдавшиеся «иксы «и «игреки» поместим в табл. 17, которая называется корреляционной таблицей и строится следующим образом:

- «иксы» группируются в вариационный ряд, число групп которого обозначим ν; если это дискретный ряд, то х 1, х 2, …, х ν– различающиеся между собой результаты наблюдений или варианты; если это интервальный ряд, то х 1, х 2, …, х ν– центры интервалов;

- «игреки» группируют в вариационный ряд, число групп которого обозначим q: у 1, у 2, …, уq – это либо варианты, если ряд дискретный, либо середины интервалов, если ряд интервальный;

- подсчитывают числа тji таких наблюдавшихся пар чисел (х, у), у которых х попадает в группу хi, а у – в группу уj, i = 1, 2, …, ν, j = 1, 2, …, q; например, т 12 – число пар чисел (х, у), у которых х попало в группу х 2, а у – в группу у 1. Числа т 11, т 12, …, тq ν называются частотами.

Прежде чем пояснить остальные элементы этой таблицы, сделаем следующее замечание по поводу схемы построения выборочного корреляционного отношения: от табл. 17, содержащей частоты, можно перейти к таблице частостей (табл. 18). Сравним табл.18 и табл. 9. Их различие состоит в следующем: табл.9 относилась к генеральной совокупности, поэтому в ней были указаны все мыслимые значения величин Χ и Υ и вероятности комбинаций этих значений; табл. 18 относится к выборочной совокупности, и в ней приведены наблюдаемые значения величин Χ и Υ и частости, или опытные вероятности комбинаций наблюдаемых значений. Поэтому выборочное корреляционное отношение можно строить по той же схеме, что и генеральное корреляционное отношение, если заменить возможные значения величин Χ и Υ на наблюдаемые, вероятности на частости, математические ожидания на средние, дисперсии на выборочные дисперсии.

Однако чаще выборочное корреляционное отношение строят, используя непосредственно табл.17, а не табл.9.

В табл. 17 кроме сгруппированных наблюдений и частот содержатся следующие данные:

- суммы частот по каждой строке

m 1 = , m 2= , …, mq = , (30)

- суммы частот по каждому столбцу

п 1 = , п 2 = , …, п ν = , (31)

Таблица 17.

  j i     ν  
Х Υ х 1 х 2 х ν Σ
  у 1 т 11 т 12 т т 1
2… у 2… т 21… т 22… т 2ν… т 2…
q уq тq 1 тq 2   тq ν тq
Σ п 1 п 2 п ν п = =
Групповое среднее  
Групповая выборочная дисперсия σ*12 σ*12 σ*ν2  

Таблица 18

  j i     ν  
Х Υ х 1 х 2 х ν  
  у 1 р *11 р *12 р *  
2… у 2… р *21 р *22… р *2ν… p*ij = mij / n, i = 1, 2, …, ν j = 1, 2, …, q.
q уq р*q 1 р*q 2   р*q ν  

- групповые средние значения «игреков»

= (у 1 т 11 + у 2 т 21 + … + уqmq 1)/ n 1,

= (y 1 m 12+ y 2 m 22+ … + yqmq 2)/ n 2, (32)

……………………………………….

= (у 1 т + у 2 т + … + yqm)/ n ν.

Эти средние являются выборочными аналогами соответствующих условных математических ожиданий: - выборочный аналог математического ожидания величины Υ при условии, что Χ = х 1, т.е. аналог величины М(Υ/Χ=х1); - аналог М(Υ/Χ = х2) и т.д.

Групповые выборочные дисперсии:

,

,

………………………………………………………………………………………

(33)

Эти дисперсии являются выборочными аналогами соответствующих условных дисперсий: – выборочный аналог условной дисперсии D(Y/X= ), – аналог D(Y/X= ) и т.д.

Построим выборочный аналог генерального корреляционного отношения. Выборочным аналогом генеральной дисперсии является величины . Для того чтобы вычислить , найдем сначала среднее по данным табл. 17. Это можно сделать по одной из следующих тождественных формул:

(34)

Напомним, что – это выборочный аналог M(Y). Теперь найдем

(35)

Тогда

(36)

Выборочным аналогом генеральной дисперсии является выборочная дисперсия групповых средних; обозначим ее . Имеем

,(37)

где

. (38)

Выборочным аналогом дисперсии является средняя групповых выборочных дисперсий. Обозначим эту среднюю

, (39)

где .

Получаем

. (40)

Для вычисленных дисперсий справедливо тождество

, или , (41)

аналогичное тождеству, имеющему место в генеральной совокупности.

Выборочный аналог генерального корреляционного отношения вычисляется следующим образом:

(42)

Величина называется выборочным коэффициентом детерминации. Этот коэффициент показывает, какую долю дисперсии составляет выборочная дисперсия групповых средних «игреков» или, иначе говоря, какая доля дисперсии объясняется зависимостью Y от X.

Как правило, дисперсии и находят не по рассмотренным выше формулам, а по следующим, более удобным для вычислений:

, . (43)

, . (44)

, . (45)

Проверим гипотезу (46)

Предварительно отметим, что в силу свойства 2 корреляционного отношения при выполнении гипотезы имеет место равенство условных, или групповых математических ожиданий величины Y:

M(Y/X=x1)=M(Y/X=x2)= … =M(Y/X=xv).

Поэтому проверка гипотезы сводится к проверке гипотезы о равенстве групповых математических ожиданий – это задача дисперсионного анализа. Ее можно решить, если выполняются требования, применительно к нашим условиям формулирующиеся следующим образом (*):

- при каждом наблюдаемом значении xi величины X наблюдения величины Y должны быть независимыми и проводиться в одинаковых условиях; наблюдения должны быть независимы и при различных «иксах»;

- при каждом значении xi величина Y должна иметь нормальный закон с постоянной для различных «иксов» генеральной дисперсией (обозначим эту дисперсию ;

Допустим, что эти требования выполняются. Тогда для проверки гипотезы (46) следует заполнить табл. 19.

В заключение заметим, что если гипотеза отвергается, то говорят, что выборочное корреляционное отношение статистически значимо. Если гипотеза не отвергается, то говорят, что выборочное корреляционное отношение незначимо.

Обратим внимание на то, что вычислить выборочное корреляционное отношение, а также проверить его значимость можно только в том случае, когда результаты наблюдений сгруппированы в таблицу типа таблицы.

Допустим, что, располагая выборочными данными, мы пришли к выводу, что корреляционная зависимость Y от X существует, т.е. при измененииx изменяются условные математические ожидания M(Y/X=x). Тогда возникает вопрос: каков вид функции регрессии, т.е. функции φ (x) = M(Y/X=x)?

Располагая только выборочными данными, нельзя дать точный ответ на поставленный вопрос, но высказать гипотезу о виде функции φ (x) можно; также можно провести статистическую проверку этой гипотезы, т.е. выяснить, противоречит или нет эта гипотеза имеющимся выборочным данным.

Мы рассмотрим только схему проверки гипотезы о том, что функция регрессии линейная, т.е. φ (x)=a+bx. Покажем, что при линейной функции регрессии алгоритм вычисления корреляционного отношения значительно упрощается.


Таблица 19.

  j i         5=v   mj  
Стоимость фондов (интервал) 0-2 2-4 4-6 6-8 8-10
Объем продукции (интервал) Центр интервала xi Центр интервала yi          
  0 – 0,2 0,1           (1)
  0,4 0,04
  0,2 – 0,4 0,3             5,7 1,71
  0,4 – 0,6 0,5             13,0 6,50
  0,6 – 0,8 0,7             6,3 4,41
5=q 0,8 – 1,0 0,9             1,8 1,62
ni (1)           N=60
(2) 0,8 3,3 14,3 5,6 3,2
(3) 0,2 0,3 0,46 0,56 0,8
(4) 0,2 1,15 7,11 3,22 2,60
(5) 0,05 0,104 0,229 0,332 0,65  
(6) 0,04 0,09 0,212 0,314 0,64
(7) 0,01 0,014 0,017 0,008 0,01
(8) 0,16 0,099 6,572 3,14 2,56
(9) 0,04 0,154 0,527 0,08 0,04 ;
(10)          
(11)          
(12) 0,8 9,9 71,5 39,2 28,8

Таблица 20.

Источник вариации выпуска продукции Показатель вариации Число степеней свободы Несмещенная оценка дисперсии
Основные фонды = =1,26/60=0,021 v – 1 = 5 – 1 = 4 (при выполнении гипотезы H0)
Остаточные факторы =0,841/60=0,014 n – v = 60 – 5 = 55
Общая вариация ==0,035 n – 1 = 60 – 1 = 59 (привыполнении гипотезы H0)

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: