Элементы теории корреляции

Переменные величины x и y связаны статистически, если каждому значению одной из них соответствует распределение другой, меняющийся с изменением 1-ой величины и по вариантам, и по частотам.

Рассмотрим конкретную задачу. Пусть после обработки данных и перехода к соответствующим дискретным распределениям получены распределения 100 га пахотной земли по количеству внесенных удобрений и по урожайности. x -количество удобрений x ц на 1 га, а урожайность y -ц с 1 га.

Таблица 1

x
y

              Итого:
  - - -   - - - - - -  
Итого:              

Таблица такого типа называется корреляционной. Корреляционная таблица дает основание сделать вывод, что с увеличением количества внесенных удобрений x, урожайность y имеет тенденцию к повышению, однако вид ее зависимости, ее аналитическое выражение остаются не ясными. Представим в отдельной таблице распределения по урожайности той S- площади, на каждый гектар которой было внесено одинаковое количество удобрений.

Таблица 2.

yi га
   
Итого:  

Таблица 3

yi га
   
Итого:  

Таблица 4

yi га
   
Итого:  

Таблица 5

yi га
   
Итого:  

Средние арифметические этих распределений являются групповыми средними урожайности, обозначим их соответственно

Т.е. -групповая средняя , выражает среднюю урожайность на той площади, на каждый га которой было внесено 10 ц удобрений и является среднеарифметической распределения.

Таблица 6

xi
  10,86 13,22 15,71 17,66

 
 

Последний столбец показывает, что с увеличением x, групповые средние возрастают, причем почти равномерно. Отметим в системе координат точки

Таким образом, зависимость групповых средних урожайности от количества внесенных удобрений xi, близка к линейной, т.е. можно записать y=ax+b.

Можно поставить в соответствии каждому значению урожайности, среднеарифметическую площади по количеству внесенного удобрения.

На участке каждой группы внесено не одинаковое количество удобрений.

xi га
   
Итого:  
xi га
   
Итого:  
xi га
   
Итого:  
xi га
   
Итого:  
xi га
   
Итого:  
xi га
   
Итого:  

Средние арифметические этих распределений - это групповые средние переменной x, обозначим их .

;

;

;

;

;

.

  27,5 38,2 55,2

Можно также считать, что эта зависимость линейная, т.е. x=cy+d.

Решим задачу в общем виде. Пусть зависимость между x и y дана в виде корреляционной таблицы. Отложим по горизонтали и обозначим значения от 1 до t и от 1 до xj.

yi
xi

y 1     y 2     …. yj …. yt nxi
x1 x2 . xi . xs n 11 n 21 . ni 1 . nS 1 n 12 n 22 . ni 2 . nS2 …. …. …. …. …. …. n 1 j n 2 j . nij …. nSj …. …. …. …. …. …. n 1 t n 2 t …. nit …. nSt n x1 n x2 …. nxi …. n xt
  ny1 ny2 …. nyi …. nyt n

Здесь частота ; , показывает, что из n -членов совокупности имеется n и j таких, у которых переменная x примет значение xj, а переменная y - yj, т.е. сумма всех частот:

(1)

Просуммируем частоты по вертикали и горизонтали. Переменная x принимает s - различных значений их частоты по всей совокупности составляют nxi и

(2)

(3)

Сумма частот i -той строки nxi -это есть сумма , а -сумма частот j -того столбца. Таким образом, возможны 3 различных представления объема, т.е. (1)=(2)=(3). Любая из частот может равняться 0. Однако все частоты любой строки одновременно не могут равняться 0, это означает, что , в противном случае x и y исключаются из таблицы.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: