Переменные величины x и y связаны статистически, если каждому значению одной из них соответствует распределение другой, меняющийся с изменением 1-ой величины и по вариантам, и по частотам.
Рассмотрим конкретную задачу. Пусть после обработки данных и перехода к соответствующим дискретным распределениям получены распределения 100 га пахотной земли по количеству внесенных удобрений и по урожайности. x -количество удобрений x ц на 1 га, а урожайность y -ц с 1 га.
Таблица 1
| Итого: | ||||||||||
- - | - | - | - - | - - - | |||||||
Итого: |
Таблица такого типа называется корреляционной. Корреляционная таблица дает основание сделать вывод, что с увеличением количества внесенных удобрений x, урожайность y имеет тенденцию к повышению, однако вид ее зависимости, ее аналитическое выражение остаются не ясными. Представим в отдельной таблице распределения по урожайности той S- площади, на каждый гектар которой было внесено одинаковое количество удобрений.
|
|
Таблица 2.
yi | га |
Итого: |
Таблица 3
yi | га |
Итого: |
Таблица 4
yi | га |
Итого: |
Таблица 5
yi | га |
Итого: |
Средние арифметические этих распределений являются групповыми средними урожайности, обозначим их соответственно
Т.е. -групповая средняя , выражает среднюю урожайность на той площади, на каждый га которой было внесено 10 ц удобрений и является среднеарифметической распределения.
Таблица 6
xi | |
10,86 13,22 15,71 17,66 |
Последний столбец показывает, что с увеличением x, групповые средние возрастают, причем почти равномерно. Отметим в системе координат точки
Таким образом, зависимость групповых средних урожайности от количества внесенных удобрений xi, близка к линейной, т.е. можно записать y=ax+b.
Можно поставить в соответствии каждому значению урожайности, среднеарифметическую площади по количеству внесенного удобрения.
На участке каждой группы внесено не одинаковое количество удобрений.
xi | га |
Итого: |
xi | га |
Итого: |
xi | га |
Итого: |
xi | га |
Итого: |
xi | га |
Итого: |
xi | га |
Итого: |
Средние арифметические этих распределений - это групповые средние переменной x, обозначим их .
;
;
;
;
;
.
27,5 38,2 55,2 |
Можно также считать, что эта зависимость линейная, т.е. x=cy+d.
Решим задачу в общем виде. Пусть зависимость между x и y дана в виде корреляционной таблицы. Отложим по горизонтали и обозначим значения от 1 до t и от 1 до xj.
|
|
| y 1 | y 2 | …. | yj | …. | yt | nxi | ||||
x1 x2 . xi . xs | n 11 n 21 . ni 1 . nS 1 | n 12 n 22 . ni 2 . nS2 | …. …. …. …. …. …. | n 1 j n 2 j . nij …. nSj | …. …. …. …. …. …. | n 1 t n 2 t …. nit …. nSt | n x1 n x2 …. nxi …. n xt | ||||
ny1 | ny2 | …. | nyi | …. | nyt | n |
Здесь частота ; , показывает, что из n -членов совокупности имеется n и j таких, у которых переменная x примет значение xj, а переменная y - yj, т.е. сумма всех частот:
(1)
Просуммируем частоты по вертикали и горизонтали. Переменная x принимает s - различных значений их частоты по всей совокупности составляют nxi и
(2)
(3)
Сумма частот i -той строки nxi -это есть сумма , а -сумма частот j -того столбца. Таким образом, возможны 3 различных представления объема, т.е. (1)=(2)=(3). Любая из частот может равняться 0. Однако все частоты любой строки одновременно не могут равняться 0, это означает, что , в противном случае x и y исключаются из таблицы.