Поле корреляции. Выборочный коэффициент корреляции

При решении практических задач обычно не располагают сведениями о законе распределения двумерной случайной величины (X,Y), поэтому нельзя знать генеральное корреляционное отношение и коэффициент кор­реляции, а также вид функции регрессии.

Выше было показано, как вычисляется корреляционное отношение по результатам наблюдений величины (X,Y) и как, зная это отношение, проверить гипотезу об отсутствии кор­реляционной зависимости в генеральной совокупности, т. е. о том, что при любом допустимом х.

Если эта гипотеза не принимается, то возникает вопрос о виде функции регрессии .

Располагая только результатами наблюдений, точный ответ на
поставленный вопрос дать нельзя. Можно лишь сформулировать гипотезу о виде функции регрессии.

Для того чтобы сформулировать эту гипотезу, поступают следующим образом. Результаты наблюдений группируют в табл. (17), по которой строят поле корреляции - это прямоугольная сетка, в каждом прямоугольнике (j, i) которого проставляют nji точек. Затем на поле корреляции наносят точки с координатами и соединяют их отрезками. .

Полученная линия дает представление об изменении групповых средних при изменении х.

Так как групповая средняя — это выборочный аналог условного математического ожидания, то по поведению линии групповых средних можно составить некоторое представление о виде функции регрессий. Дополнительно вычисляют выборочный коэффициент кор­реляции

(59)

(выборочный аналог генерального коэффициента корреляции: математические ожидания заменены на средние, а ге­неральные средние квадратические отклонения - выборочными средними квадратическими отклонениями).

Выполним тождественные преобразования числителя вы­ражения:

Получаем следующую, более удобную для вычислений выбо­рочного коэффициента корреляции, формулу:

(60)

Если результаты (Xi,Yi) наблюдений величины (X, Y)не сгруппированы в корреляционную таблицу, то

Если наблюдения сгруппированы в табл. (17), то

(61)

Вычислив , сравнивают |rXY| с выборочным корреляци­онным отношением py/x. Если их значения близки, то это дает основание выдвинуть гипотезу о том, что в генеральной совокупности функция регрессии линейная, т.е. M(Y/X=x) = a + bx.

Задача. По результатам наблюде­ний, сгруппированным в табл. 19, вычислить коэффициент корреляции. Сфор­мулировать гипотезу о виде функции ре­грессии.

Вычислим выборочный коэффициент корреляции по формуле (60). Среднее = 2,503; оно рассчитано по формуле (61) в строке (12) табл. 19. Среднее и дисперсия 2 x величины X вычислены в строках (10) и (11): =4,95; 2 x= 3,499. Среднее Y и дисперсия 2 y величины Y вычислены в столбцах (2) и (3): Y =0,45; 2 y = 0,035. Тогда

Так как значение близко к pY/X = 0.78, то это дает основание выдвинуть гипотезу о том, что функция регрессии линейная (напомним, что если функция регрессии линейная, то модуль генерального коэффициента корреляции равен генеральному кор­реляционному отношению, т.е. | rxr|=pY!X).

Однако прежде чем рассматривать, как проводится провер­ка гипотезы о том, что функция регрессии линейная, т. е. M(Y/X=x) = a + bx, покажем, как найти по выборочным дан­ным оценки и параметров а и b линейной функции регрессии.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: