При решении практических задач обычно не располагают сведениями о законе распределения двумерной случайной величины (X,Y), поэтому нельзя знать генеральное корреляционное отношение и коэффициент корреляции, а также вид функции регрессии.
Выше было показано, как вычисляется корреляционное отношение по результатам наблюдений величины (X,Y) и как, зная это отношение, проверить гипотезу об отсутствии корреляционной зависимости в генеральной совокупности, т. е. о том, что при любом допустимом х.
Если эта гипотеза не принимается, то возникает вопрос о виде функции регрессии .
Располагая только результатами наблюдений, точный ответ на
поставленный вопрос дать нельзя. Можно лишь сформулировать гипотезу о виде функции регрессии.
Для того чтобы сформулировать эту гипотезу, поступают следующим образом. Результаты наблюдений группируют в табл. (17), по которой строят поле корреляции - это прямоугольная сетка, в каждом прямоугольнике (j, i) которого проставляют nji точек. Затем на поле корреляции наносят точки с координатами и соединяют их отрезками. .
|
|
Полученная линия дает представление об изменении групповых средних при изменении х.
Так как групповая средняя — это выборочный аналог условного математического ожидания, то по поведению линии групповых средних можно составить некоторое представление о виде функции регрессий. Дополнительно вычисляют выборочный коэффициент корреляции
(59)
(выборочный аналог генерального коэффициента корреляции: математические ожидания заменены на средние, а генеральные средние квадратические отклонения - выборочными средними квадратическими отклонениями).
Выполним тождественные преобразования числителя выражения:
Получаем следующую, более удобную для вычислений выборочного коэффициента корреляции, формулу:
(60)
Если результаты (Xi,Yi) наблюдений величины (X, Y)не сгруппированы в корреляционную таблицу, то
Если наблюдения сгруппированы в табл. (17), то
(61)
Вычислив , сравнивают |rXY| с выборочным корреляционным отношением py/x. Если их значения близки, то это дает основание выдвинуть гипотезу о том, что в генеральной совокупности функция регрессии линейная, т.е. M(Y/X=x) = a + bx.
Задача. По результатам наблюдений, сгруппированным в табл. 19, вычислить коэффициент корреляции. Сформулировать гипотезу о виде функции регрессии.
Вычислим выборочный коэффициент корреляции по формуле (60). Среднее = 2,503; оно рассчитано по формуле (61) в строке (12) табл. 19. Среднее и дисперсия 2 x величины X вычислены в строках (10) и (11): =4,95; 2 x= 3,499. Среднее Y и дисперсия 2 y величины Y вычислены в столбцах (2) и (3): Y =0,45; 2 y = 0,035. Тогда
|
|
Так как значение близко к pY/X = 0.78, то это дает основание выдвинуть гипотезу о том, что функция регрессии линейная (напомним, что если функция регрессии линейная, то модуль генерального коэффициента корреляции равен генеральному корреляционному отношению, т.е. | rxr|=pY!X).
Однако прежде чем рассматривать, как проводится проверка гипотезы о том, что функция регрессии линейная, т. е. M(Y/X=x) = a + bx, покажем, как найти по выборочным данным оценки и параметров а и b линейной функции регрессии.