№ п\п | Внесено удобрений, ц на 1 га, | Урожайность, ц с1 га, | ||||||
6,2 8,5 10,4 11,9 13,0 | ||||||||
50,0 |
Поданным табл. 4.3 система нормальных уравнений составит:
Решая ее методом определителей, получим: . Откуда параметры искомого уравнения составят: == 3,4; =2,986; 0,214, а уравнение параболы второй степени примет вид
.
Подставляя в это уравнение последовательно значения х, найдем теоретические значения (см. табл. 4.3, гр. 9).
Каквидно из табл. 2.3, уравнение параболы второго порядка хорошо описывает рассматриваемую зависимость. Сумма квадратов отклонений остаточных величин . Ввиду того, что данные табл. 4.3 демонстрируют лишь сегмент параболы второго порядка, то рассматриваемая зависимость может быть охарактеризована и другой функцией. Используя, в частности, степенную функцию ,было получено уравнение регрессии . Для него , что означает еще лучшую сходимость фактических и расчетных значений y.
Среди класса нелинейных функций, параметры которых без особых затруднений оцениваются МНК, следует назвать хорошо известную в эконометрике равностороннюю гиперболу: .
Она может быть использована не только, как уже указывалось в параграфе (2.2), для характеристики связи удельных расходов сырья, материалов, топлива с объемом выпускаемой продукции, времени обращения товаров от величины товарооборота, т.е. на микроуровне, но и на макроуровне. Классическим ее примером является кривая Филлипса, характеризующая нелинейное соотношение между нормой безработицы x и процентом прироста заработной платы у:
.
Английский экономист А. В. Филлипс, анализируя данные
более чем за 100-летний период, в конце 50-х гг. XX в. установил
обратную зависимость процента прироста заработной платы от
уровня безработицы.
Для равносторонней гиперболы вида №№, заменив , заменив на z, получим линейное уравнение регрессии оценка параметров которого может быть дана МНК. Система нормальных уравнений составит:
.
При > 0 имеем обратную зависимость, которая при характеризуется нижней асимптотой, т. е. минимальным предельным значением у, оценкой которого служит параметр a. Так, для кривой Филипса
величина параметра a, равная 0,00679, означает, что с ростом уровня безработицы темп прироста заработной платы в пределе стремится к нулю. Соответственно можно определить тот уровень безработицы, при котором заработная плата оказывается стабильной и темп ее прироста равен нулю.
При < 0 имеем медленно повышающуюся функцию с верхней асимптотой при , т. е. с максимальным предельным
уровнем у, оценку которого в уравнении дает пара метр .
Примером может служить взаимосвязь доли расходов на товары длительного пользования и общих сумм расходов (или доходов). Математическое описание подобного рода взаимосвязей получило название кривых Энгеля. В1857 г. немецкий статистик Э. Энгель на основе исследования семейных расходов сформулировал закономерность — с ростом дохода доля доходов, расходуемых на продовольствие, уменьшается. Соответственно с увеличением дохода доля доходов, расходуемых на непродовольственные товары, будет возрастать. Однако это увеличение не беспредельно, ибо на все товары сумма долей не может быть больше единицы, или 100%, а на отдельные непродовольственные товары этот предел может характеризоваться величиной параметра а для уравнения вида
,
где у — доля расходов на непродовольственные товары;
х — доходы (или общая сумма расходов как индикатор дохода).
Правомерность использования равномерной гиперболы для кривой Энгеля довольно легко доказывается.
Соответственно можно определить границу величины дохода, дальнейшее увеличение которого не приводит с росту доли расходов на отдельные непродовольственные товары.
Вместе с тем равносторонняя гипербола не является единственно возможной функцией для описания кривой Энгеля. В 1943 г. Уоркинг и в 1964 г. Лизер для этих целей использовали полулогарифмическую кривую .
Заменив на z,опять получим линейное уравнение: . Данная функция, как и предыдущая, линейна по параметрам и нелинейна по объясняющей переменной х. Оценка параметров и может быть найдена МНК. Система нормальных уравнений при этом окажется следующей:
Применим полулогарифмическую функцию зависимости доли расходов на товары длительного пользование в общих расходах семьи от дохода семьи (табл. 4.4).
Таблица 4.4
Доля расходов на товары длительного пол в зависимости от дохода семьи
Среднемесячный доход семьи, тыс. долл. США, x | ||||||
Процент расходов на товары длительного пользования, y | 13,4 | 15,4 | 16,5 | 18,6 | 19,1 |
Суммы, необходимые для расчета, составили:
.
Решая систему нормальных уравнений
мы получили уравнение регрессии , которое достаточно хорошо описывает исходные соотношения дохода семьи и доли расходов на товары длительного пользования, что видно из сравнения фактических и теоретических значений у:
9,9 | 13,4 | 15,5 | 17,0 | 18,1 | 19,1 | Сумма | |
y | 0,1 | 0,0 | -0,1 | -0,5 | 0,5 | 0,0 | 0,0 |
0,01 | 0,0 | 0,01 | 0,25 | 0,25 | 0,0 | 0,52* | |
*При более точном подсчете эта величина составит 0,4864. |
Возможны и иные модели, нелинейные по объясняющим переменным. Например, . Соответственно система нормальных уравнений для оценки параметров составит:
.
Уравнения с квадратными корнями использовались в исследованиях урожайности, трудоемкости сельскохозяйственного производства. В работе Н. Дрейпера и Г. Смита справедливо отмечено, что если нет каких-либо теоретических обоснований в использовании данного вида кривых, то основная цель подобных преобразований состоит в том, чтобы для преобразованных переменных получить более простую модель регрессии, чем для исходных данных.
Иначе обстоит дело с регрессией, нелинейной по оцениваемым параметрам. Данный класс нелинейных моделей подразделяется на два типа: нелинейные модели внутренне линейные и
нелинейные модели внутренне нелинейные. Если нел инейная модель внутренне линейна, то она с помощью соответствующих преобразований может быть приведена к линейному виду. Если же нелинейная модель внутренне нелинейна, то она не может быть сведена к линейной функции. Например, в эконометрических исследованиях при изучении эластичности спроса от цен широко используется степенная функция:
где спрашиваемое количество;
цена;
случайная ошибка.
Данная модель нелинейна относительно оцениваемых параметров, ибо включает параметры а и b не аддитивно. Однако ее можно считать внутренне линейной, ибо логарифмирование данного уравнения по основанию е приводит его к л шейному виду:
.
Соответственно оценки параметров a и b пут быть найдены МНК. В рассматриваемой степенной функции предполагается, что случайная ошибка е мультипликативно связана с объясняющей переменной х. Если же модель представить в виде то она становится внутренне нелинейной, ибо ее невозможно превратить в линейный вид.
Внутренне нелинейной будет и модель вила
или модель
,
ибо эти уравнения не могут быть преобразованы в уравнения, линейные по коэффициентам.
В специальных исследованиях по регрессионному анализу часто к нелинейным относят модели, только внутренне нелинейные по оцениваемым параметрам, а все другие модели, которые внешне нелинейные, но путем преобразований параметров могут быть приведены к линейному виду, относятся к классу линейных моделей. В этом плане к линейным относят, например, экспоненциальную модель ,ибо логарифмируя ее по натуральному основанию, получим линейную форму модели
.
Если модель внутренне нелинейна по параметрам, то для оценки параметров используются итеративные процедуры, успешность которых зависит от вида уравнений и особенностей применяемого итеративного подхода. Модели внутренне нелинейные по параметрам могут иметь место в эконометрических исследованиях. Однако гораздо большее распространение получили модели, приводимые к линейному виду. Решение такого типа моделей реализовано в стандартных пакетах прикладных программ. Среди них, в частности, можно назвать и обратную модель вида
Обращая обе части равенства, получим линейную форму модели для переменной :
Среди нелинейных функций, которые могут быть приведены к линейному виду, в эконометрических исследованиях очень широко используется степенная функция .Связано это с тем, что параметр в ней имеет четкое экономическое истолкование, т. е. он является коэффициентом эластичности. Это значит, что величина коэффициента показывает, на сколько процентов изменится в среднем результат, если фактор изменится на 1 %. Так, если зависимость спроса от цен характеризуется уравнением вида , то, следовательно, с увеличением цен на 1 % спрос снижается в среднем на 1,12 %. О правомерности подобного истолкования параметра для степенной функции можно судить, если рассмотреть формулу расчета коэффициента эластичности
где первая производная, характеризующая соотношение приростов результата и фактора для соответствующей формы связи.
Для степенной функции она составит: . Соответственно коэффициент эластичности окажется равным:
Коэффициент эластичности, естественно, можно определять и при наличии других форм связи, но только для степенной функции он представляет собой постоянную величину, равную параметру . В других функциях коэффициент эластичности зависит от значений фактора х. Так, для линейной регрессии функция и эластичность следующие:
и
В силу того что коэффициент эластичности для линейной функции не является величиной постоянной, а зависит от соответствующего значения х, то обычно рассчитывается средний показатель эластичности по формуле
Для оценки параметров степенной функции применяется метод наименьших квадратов к линеаризованному уравнению , т.е. решается система нормальных уравнений:
Параметр определяется непосредственно из системы, а параметр — косвенным путем после потенцирования величины . Так, решая систему нормальных уравнений зависимости спроса от цен, было получено уравнение Если потенцировать его, получим:
Поскольку параметр экономически не интерпретируется, то нередко зависимость записывается в виде логарифмически линейной. В виде степенной функции изучается не только эластичность спроса, но и предложения. При этом обычно эластичность спроса характеризуется параметром < 0, а эластичность предложения: > 0.
Поскольку коэффициенты эластичности представляют экономический интерес, а виды моделей не ограничиваются только степенной функцией, приведем формулы расчета коэффициентов эластичности для наиболее распространенных типов уравнений регрессии (табл. 4.5).
Таблица 4.5
Коэффициенты эластичности для ряда математических функций
Вид функции, | Первая производная, | Коэффициенты эластичности, |
Линейная | ||
Парабола второго порядка | ||
Гипербола | ||
Показательная | ||
Степенная | ||
Полулогарифмическая | ||
Логарифмическая | ||
Обратная |
Несмотря на широкое использование в эконометрике коэффициентов эластичности, возможны случаи, когда их расчет экономического смысла не имеет. Это происходит тогда, когда для рассматриваемых признаков бессмысленно определение изменения значений в процентах. Например, вряд ли кто будет определять, на сколько процентов может измениться заработная плата с ростом стажа работы на 1 %. Или, например, на сколько процентов изменится урожайность пшеницы, если качество почвы, измеряемое в баллах, изменится на 1 %. В такой ситуации степенная функция, даже если она оказывается наилучшей по формальным соображениям (исходя из наименьшего значения остаточной вариации), не может быть экономически интерпретирована. Например, изучая соотношение ставок межбанковского кредита у (в процентах годовых) и срока его предоставления х (в днях), было получено уравнение регрессии с очень высоким показателем корреляции (0,9895). Коэффициент эластичности 0,352% лишен смысла, ибо срок предоставления кредита не измеряется в процентах. Значительно больший интерес для этой зависимости может представить линейная функция , имеющая более низкий показатель корреляции 0,85. Коэффициент регрессии 0,403 показывает в процентных пунктах изменение ставок кредита с увеличением срока их предоставления на один день.
В моделях, нелинейных по оцениваемым параметрам, но приводимых к линейному виду, МНК применяется к преобразованным уравнениям. Если в линейной модели и моделях, нелинейных по переменным, при оценке параметров исходят из критерия , то в моделях, нелинейных по оцениваемым параметрам, требование МНК применяется не к исходным данным результативного признака, а к их преобразованным величинам, т. е. . Так, в степенной функции МНК применяется к преобразованному уравнению .
Это значит, что оценка параметров основывается на минимизации суммы квадратов отклонений в логарифмах.
.
Соответственно если в линейных моделях (включая нелинейные по переменным) , то в моделях, нелинейных по оцениваемым параметрам,
.
Вследствие этого оценка параметров для линеаризуемых функций МНК оказываются несколько смещенной.
Возьмем, например, показательную кривую: или равносильную ей экспоненту . Прологарифмировав, имеем:
.
Применяя МНК, минимизируем . Система нормальных уравнений составит:
Из первого уравнения видно, что
Предположим, что фактические данные сложились так, что . Тогда или , т. е. параметр представляет собой среднюю геометрическую из значений переменной у. Между тем в линейной зависимости при параметр
т. е. средней арифметической. Поскольку средняя геометрическая всегда меньше средней арифметической, то и оценки параметров, полученные из минимизации , будут несколько смещены (занижены).
Практическое применение экспоненты возможно, если результативный признак не имеет отрицательных значений. Поэтому если исследуется, например, финансовый результат деятельности предприятий, среди которых наряду с прибыльными есть и убыточные, то данная функция не может быть использована. Если экспонента строится как функция выравнивания по динамическому ряду для характеристики тенденции с постоянным темпом, то , где у — уровни динамического ряда; t - хронологические даты, параметр b означает средний за период коэффициент роста. В уравнении этот смысл приобретает величина антилогарифма параметра .
При исследовании взаимосвязей среди функций, использующих , в эконометрике преобладают степенные зависимости — это и кривые спроса и предложения, и кривые Энгеля, и производственные функции, и кривые освоения для характеристики связи между трудоемкостью продукции и масштабами производства в период освоения выпуска нового вида изделий, и зависимость валового национального дохода от уровня занятости.
В отдельных случаях может использоваться и нелинейная модель вида
так называемая обратная модель, являющаяся разновидностью гиперболы. Но если в равносторонней гиперболе преобразованию подвергается объясняющая переменная и .то для по. В результате обратная модель оказывается внутренне нелинейной и требование МНК выполняется не для фактических значений признака у, а для их обратных величин , а именно:
Соответственно
.
Проанализируем зависимость рентабельности продукции от ее трудоемкости по данным семи предприятий (табл. 4.6).
Таблица 4.6
Зависимость рентабельности продукции y (%) от ее
трудоемкости x ()
x | y | |||||||
1,0 | 0,0312 | 0,0312 | 1,00 | 0,0285 | 35,1 | 0,0027 | -3,1 | |
1,2 | 0,0357 | 0,0428 | 1,44 | 0,0341 | 29,3 | 0,0016 | -1,3 | |
1,5 | 0,0455 | 0,0682 | 2,25 | 0,0424 | 23,6 | 0,0031 | -1,6 | |
2,0 | 0,0500 | 0,1000 | 4,00 | 0,0563 | 17,7 | -0,0063 | 2,3 | |
2,5 | 0,0625 | 0,1563 | 6,25 | 0,0703 | 14,2 | -0,0078 | 1,8 | |
2,7 | 0,0667 | 0,1800 | 7,29 | 0,0758 | 13,2 | -0,0091 | 1,8 | |
3,0 | 0,1000 | 0,3000 | 9,00 | 0,0842 | 11,9 | 0,0158 | -1,9 | |
13,9 | 0,3916 | 0,8785 | 31,23 | 0,3936 | 145,0 | 0,0000 | -2,0 |
Для оценки параметров исследуемой функции по МНК система нормальных уравнений примет вид:
Исходя из данных табл. 2.6, имеем:
Решая эту систему уравнений, получим оценки параметров искомой функции: = 0,0007; = 0,0278. Соответственно уравнение регрессии составит:
Сравним последние две графы табл. 2.6. Получим , тогда как для обратных значений эта величина равна нулю. Кроме того, заметим, что положительные отклонения фактических и теоретических обратных значений сменяются на отрицательные значения для аналогичных показателей по исходным данным. Уравнение отражает обратную связь рассматриваемых признаков: чем выше трудоемкость, тем ниже рентабельность. Поскольку данное уравнение линейно относительно величин , то если обратные значения имеют экономический смысл, коэффициент регрессии интерпретируется, так же как в линейном уравнении регрессии. Если, например, под y подразумеваются затраты на 1 руб. продукции, а под х — производительность труда (выработка продукции на одного работника), то обратная величина характеризует затратоотдачу и параметр имеет экономическое содержание — средний прирост продукции в стоимостном измерении на 1 руб. затрат с ростом производительности труда на единицу своего измерения.
Уравнение вида характеризует прямую зависимость результативного признака от фактора. Оно целесообразно при очень медленном повышении уровней результативного признака с ростом значений фактора.
Возможно и одновременное использование логарифмирования, и преобразование в обратные величины: Прологарифмировав, получим: . Далее заменим на z, и тогда для оценки параметров к линейному уравнению может быть применен МНК.
При всех положительных значениях х функция возрастает; при кривая имеет точку перегиба — ускоренный рост при сменяется на замедленный рост при . Подобного типа функции используются при анализе статистических данных о бюджетах потребителей, где выдвигается гипотеза о существовании асимптотического уровня расходов, об изменении предельной склонности к потреблению товара, о существовании «порогового уровня дохода». В этом случае при .
При использовании линеаризуемых функций, затрагивающих преобразования зависимой переменной у, следует особенно проверять наличие предпосылок
МНК (они будут рассмотрены в п. 3, 10), чтобы они не нарушались при преобразовании. При не линейных соотношениях рассматриваемых признаков, приводимых к линейному виду, возможно интервальное оценивание параметров нелинейной функции. Так, для показательной кривой сначала строятся доверительные интервалы для параметров нового преобразованного уравнения , т. е. для и . Далее с помощью обратного преобразования определяются доверительные интервалы для параметров в исходном соотношении. В степенной функции доверительный интервал для параметра b строится так же. как в линейной функции, т. е. . Отличие состоит лишь в том. что при определении стандартной ошибки параметра b, используются не исходные данные, а их логарифмы:
(2.28)
4.7. Множественный регрессионный анализ
Экономические явления, как правило, определяются большим числом одновременно и совокупно действующих факторов. В связи с этим часто возникает задача исследования зависимости одной зависимой переменной 7 от нескольких объясняющих переменных . Эта задача решается с помощью множественного регрессионного анализа.
Обозначим е наблюдение переменной , а объясняющих переменных . Тогда модель множественной линейной регрессии можно представить в виде:
, (13.22)
где , а удовлетворяет приведенным выше предпосылкам (13.3)—(13.5).
Включение в регрессионную модель новых объясняющих переменных усложняет получаемые формулы и вычисления. Это приводит к целесообразности использования матричных обозначений. Матричное описание регрессии облегчает как теоретические концепции анализа, так и необходимые расчетные процедуры.
Введем обозначения: матрица-столбец, или вектор, значений зависимой переменной размера n;
— матрица значений объясняющих переменных, или матрица плана размера (обращаем внимание на то, что в матрицу X дополнительно введен столбец, все элементы которого равны 1, т.е. условно полагается, что в модели (13.22) свободный член умножается на фиктивную переменную , принимающую значение 1 для всех ;
матрица-столбец, или вектор, параметров размера (k+1);
матрица-столбец, или вектор, возмущений (случайных ошибок, остатков) размера п.
Тогда в матричной форме модель (13.22) примет вид:
. (13.23)
Оценкой этой модели по выборке является уравнение
, (13.24)
где , .
Для оценки вектора неизвестных параметров применим метод наименьших квадратов. Так как произведение транспонированной матрицы на саму матрицу
,
то условие минимизации остаточной суммы квадратов запишется в виде:
. (13.24)
Учитывая, что при транспонировании произведения матриц получается произведение транспонированных матриц, взятых в обратном порядке, т.е. , получим после раскрытия скобок:
. (13.24)
Произведение есть матрица размера , т.е. величина скалярная, следовательно, оно не меняется при транспонировании: . Поэтому условие минимизации (13.24) примет вид:
.
На основании необходимого условия экстремума функции нескольких переменных , представляющей , необходимо приравнять к нулю частные производные по этим переменным или в матричной форме — вектор частных производных
.
Таким образом, встает задача найти минимум этой функций. Для этого выражение следует продифференцировать по векторному аргументу и полученное выражение приравнять к нулю, то есть:
Отсюда получается следующее выражение:
Данная система уравнений называется нормальной системой уравнений регрессии. Требуется ввести обозначения: матрица коэффициентов нормальных уравнений, вектор-столбец свободных членов нормальных уравнений регрессии.
С учетом введенных обозначений нормальная система уравнений регрессии перепишется в окончательном виде:
(13.25)
Для решения матричного уравнения (13.25) относительно вектора оценок параметров необходимо ввести предпосылку для множественного регрессионного анализа: матрица является неособенной, т.е. ее определитель не равен нулю. Следовательно, ранг матрицы равен ее порядку, т.е. . Из матричной алгебры известно, что , значит, , т.е. ранг матрицы плана равен числу ее столбцов.
Кроме того, полагают, что число имеющихся наблюдений (значений) каждой из объясняющих переменных превосходит ранг матрицы , т.е. или , ибо в противном случае в принципе невозможно получение сколько-нибудь надежных статистических выводов.
Если матрица коэффициентов нормальных уравнений хорошо обусловлена и обратима, то можно получить решение системы (13.25), например, в виде:
(13.26)
где - обратная матрица, соответствующая условиям:
где - единичная матрица соответствующих размеров.
Зная вектор , модель уравнения множественной регрессии можно представить в виде:
(13.27)
Преобразуем вектор оценок (13.26) с учетом (13.23) получим:
,
Откуда
, (13.28)
т. е. оценки параметров (13.28), найденные по выборке, будут содержать случайные ошибки.
Пример 13.4. Имеются следующие данные (условные) о сменной добыче угля на одного рабочего Y(t), мощности пласта Х\ (м) и уровне механизации работ Х2 (%), характеризующие процесс добычи угля в 10 шахтах.
Таблица 13.6
Предполагая, что между переменными , и существует линейная корреляционная зависимость, найти ее аналитическое выражение (уравнение регрессии , по и .
Решение. Обозначим
,
(напоминаем, что в матрицу плана X вводится дополнительный столбец чисел, состоящий из единиц).
Решение системы уравнении найдем методом псевдонормального решения:
, (13.29)
где псевдообратная матрица к исходной матрице .
Псевдообратную матрицу найдем по рекурсивному алгоритму (№№№) и она равна:
Тогда по формуле (13.29) найдем вектор столбец параметров регрессии:
.
С учетом (13.27) уравнение множественной регрессии имеет вид:
. (13.30)
Уравнение множественной регрессии (13.30) показывает, что при увеличении только мощности пласта (при неизменном ) на 1 м, добыча угля на одного рабочего Y увеличивается в среднем на 0,854 т, а при увеличении только уровня механизации работ на 1% (при неизменной ) в среднем на 0,367 т.
Добавление в регрессионную модель новой объясняющей переменной изменило коэффициент регрессии (Y по ) с 1,016 для парной регрессии (см. пример 13.1) до 0,854 — для множественной регрессии. В этом никакого противоречия нет, так как во втором случае коэффициент регрессии позволяет оценить прирост зависимой переменной Y при изменении на единицу объясняющей переменной в чистом виде, независимо от . В случае парной регрессии учитывает воздействие на Y не только переменной , но и косвенно корреляционно связанной с ней переменной . ►
На практике часто бывает необходимо сравнение влияния на зависимую переменную различных объясняющих переменных, когда последние выражаются разными единицами измерения. В этом случае используют стандартизованные коэффициенты регрессии и коэффициенты эластичности :
. (13.31)
. (13.32)
Стандартизованный коэффициент регрессии показывает, на сколько величин изменится в среднем зависимая переменная Y при увеличении только j-й объясняющей переменной на , а коэффициент эластичности на сколько процентов (от средней) изменится в среднем Y при увеличении только на 1%.
13.6. Ковариационная матрица и ее выборочная оценка
Вариации оценок параметров будут в конечном счете определять точность уравнения множественной регрессии. Для их измерения в многомерном регрессионном анализе рассматривают так называемую ковариационную матрицу К, являющуюся матричным аналогом дисперсии одной переменной:
.
где элементы ковариации (или корреляционные моменты) оценок параметров и . Ковариация двух переменных определяется как математическое ожидание произведения отклонений этих переменных от их математических ожиданий (см. § 5.6). Поэтому
, (13.28)
где и математические ожидания соответственно для параметров и .
Ковариация характеризует как степень рассеяния значений двух переменных относительно их математических ожиданий, так и взаимосвязь этих переменных.
В силу того, что оценки , полученные методом наименьших квадратов, являются несмещенными оценками параметров , т.е. , выражение (13.28) примет вид:
.
Рассматривая ковариационную матрицу К, легко заметить, что на ее главной диагонали находятся дисперсии опенок параметров регрессии, ибо
. (13.29)
В сокращенном виде ковариационная матрица К имеет вид:
. (13.30)
Учитывая (13.28) мы можем записать
.
Тогда выражение (12.30) примет вид:
, (13.31)
ибо элементы матрицы X —неслучайные величины.
Матрица представляет собой ковариационную матрицу вектора возмущений :
в которой все элементы, не лежащие на главной диагонали, равны нулю в силу предпосылки 4 о некоррелированности возмущений , и между собой, а все элементы, лежащие на главной диагонали, в силу предпосылок 2 и 3 регрессионного анализа равны одной и той же дисперсии :
.
Поэтому матрица , где единичная матрица го
порядка. Следовательно, в силу (13.31) ковариационная матрица вектора оценок параметров:
Так как и , то окончательно получим:
(13.32)
Таким образом, с помощью обратной матрицы нормальных уравнении регрессииопределяется не только сам вектор оценок параметров (13.28), но и дисперсии и ковариации его компонент.
Входящая в (13.32) дисперсия возмущений неизвестна. Заменив ее выборочной остаточной дисперсией
(13.33)
по (13.32) получаем выборочную оценку ковариационной матрицы К. (В знаменателе выражения (13.33) стоит , а не , как это было выше в (13.6). Это связано с тем, что теперь степеней свободы (а не две) теряются при определении неизвестных параметров, число которых вместе со свободным членом равно .
13.7. Определение доверительных интервалов
для коэффициентов и функции регрессии
Перейдем теперь к оценке значимости коэффициентов регрессии и построению доверительного интервала для параметров регрессионной модели .
В силу (13.29), (13.32) и изложенного выше оценка дисперсии коэффициента регрессии определится по формуле:
где несмещенная оценка параметра
Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями: