Зависимость урожайности озимой пшеницы от количества внесенных удобрений

№ п\п Внесено удобрений, ц на 1 га, Урожайность, ц с1 га,
                 
                6,2 8,5 10,4 11,9 13,0
              50,0

Поданным табл. 4.3 система нормальных уравнений составит:

Решая ее методом определителей, получим: . Откуда параметры искомого уравнения составят: == 3,4; =2,986; 0,214, а уравнение па­раболы второй степени примет вид

.

Подставляя в это уравнение последовательно значения х, найдем теоретические значения (см. табл. 4.3, гр. 9).

Каквидно из табл. 2.3, уравнение параболы второго порядка хорошо описывает рассматриваемую зависимость. Сумма квад­ратов отклонений остаточных величин . Ввиду то­го, что данные табл. 4.3 демонстрируют лишь сегмент параболы второго порядка, то рассматриваемая зависимость может быть охарактеризована и другой функцией. Используя, в частности, степенную функцию ,было получено уравнение регрес­сии . Для него , что означает еще лучшую сходимость фактических и расчетных значений y.

Среди класса нелинейных функций, параметры которых без особых затруднений оцениваются МНК, следует назвать хорошо известную в эконометрике равностороннюю гиперболу: .

Она может быть использована не только, как уже указывалось в параграфе (2.2), для характеристики связи удельных расходов сырья, материалов, топлива с объемом выпускаемой продукции, времени обращения товаров от величины товарооборота, т.е. на микроуровне, но и на макроуровне. Классическим ее примером является кривая Филлипса, характеризующая нелинейное соот­ношение между нормой безработицы x и процентом прироста за­работной платы у:

.

Английский экономист А. В. Филлипс, анализируя данные
более чем за 100-летний период, в конце 50-х гг. XX в. установил
обратную зависимость процента прироста заработной платы от
уровня безработицы.

Для равносторонней гиперболы вида №№, заменив , заменив на z, получим линейное уравнение регрессии оценка параметров которого может быть дана МНК. Система нормальных уравнений составит:

.

При > 0 имеем обратную зависимость, которая при ха­рактеризуется нижней асимптотой, т. е. минимальным предель­ным значением у, оценкой которого служит параметр a. Так, для кривой Филипса

величина параметра a, равная 0,00679, означает, что с ростом уровня безработицы темп прироста заработной платы в пределе стремится к нулю. Соот­ветственно можно определить тот уровень безработицы, при ко­тором заработная плата оказывается стабильной и темп ее при­роста равен нулю.

При < 0 имеем медленно повышающуюся функцию с верх­ней асимптотой при , т. е. с максимальным предельным

уровнем у, оценку которого в уравнении дает пара­ метр .

Примером может служить взаимосвязь доли расходов на товары длительного пользования и общих сумм расходов (или доходов). Математическое описание подобного рода взаимосвя­зей получило название кривых Энгеля. В1857 г. немецкий ста­тистик Э. Энгель на основе исследования семейных расходов сформулировал закономерность — с ростом дохода доля дохо­дов, расходуемых на продовольствие, уменьшается. Соответ­ственно с увеличением дохода доля доходов, расходуемых на непродовольственные товары, будет возрастать. Однако это уве­личение не беспредельно, ибо на все товары сумма долей не мо­жет быть больше единицы, или 100%, а на отдельные непродо­вольственные товары этот предел может характеризоваться ве­личиной параметра а для уравнения вида

,

где у — доля расходов на непродовольственные товары;

х — доходы (или общая сумма расходов как индикатор дохода).

Правомерность использования равномерной гиперболы для кривой Энгеля довольно легко доказывается.

Соответственно можно определить границу величины дохода, дальнейшее увеличение которого не приводит с росту доли рас­ходов на отдельные непродовольственные товары.

Вместе с тем равносторонняя гипербола не являет­ся единственно возможной функцией для описания кривой Эн­геля. В 1943 г. Уоркинг и в 1964 г. Лизер для этих целей использо­вали полулогарифмическую кривую .

Заменив на z,опять получим линейное уравнение: . Данная функция, как и предыдущая, линейна по параметрам и нелинейна по объясняющей переменной х. Оценка параметров и может быть найдена МНК. Система нормальных уравнений при этом окажется следующей:

Применим полулогарифмическую функцию зависимости до­ли расходов на товары длительного пользование в общих расхо­дах семьи от дохода семьи (табл. 4.4).

Таблица 4.4

Доля расходов на товары длительного пол в зависимости от дохода семьи

Среднемесячный доход семьи, тыс. долл. США, x            
Процент расходов на товары длительного пользования, y   13,4 15,4 16,5 18,6 19,1

Суммы, необходимые для расчета, составили:

.

Решая систему нормальных уравнений

мы получили уравнение регрессии , кото­рое достаточно хорошо описывает исходные соотношения дохо­да семьи и доли расходов на товары длительного пользования, что видно из сравнения фактических и теоретических значений у:

9,9 13,4 15,5 17,0 18,1 19,1 Сумма
y 0,1 0,0 -0,1 -0,5 0,5 0,0 0,0
0,01 0,0 0,01 0,25 0,25 0,0 0,52*
*При более точном подсчете эта величина составит 0,4864.

Возможны и иные модели, нелинейные по объясняющим пе­ременным. Например, . Соответственно система нормальных уравнений для оценки параметров составит:

.

Уравнения с квадратными корнями использовались в иссле­дованиях урожайности, трудоемкости сельскохозяйственного производства. В работе Н. Дрейпера и Г. Смита справедливо от­мечено, что если нет каких-либо теоретических обоснований в использовании данного вида кривых, то основная цель подобных преобразований состоит в том, чтобы для преобразованных пере­менных получить более простую модель регрессии, чем для ис­ходных данных.

Иначе обстоит дело с регрессией, нелинейной по оценивае­мым параметрам. Данный класс нелинейных моделей подразде­ляется на два типа: нелинейные модели внутренне линейные и
нелинейные модели внутренне нелинейные. Если нел инейная мо­дель внутренне линейна, то она с помощью соответствующих пре­образований может быть приведена к линейному виду. Если же нелинейная модель внутренне нелинейна, то она не может быть све­дена к линейной функции. Например, в эконометрических ис­следованиях при изучении эластичности спроса от цен широко используется степенная функция:

где спрашиваемое количество;

цена;

случайная ошибка.

Данная модель нелинейна относительно оцениваемых пара­метров, ибо включает параметры а и b не аддитивно. Однако ее можно считать внутренне линейной, ибо логарифмирование дан­ного уравнения по основанию е приводит его к л шейному виду:

.

Соответственно оценки параметров a и b пут быть найдены МНК. В рассматриваемой степенной функции предполагается, что случайная ошибка е мультипликативно связана с объясняющей пе­ременной х. Если же модель представить в виде то она становится внутренне нелинейной, ибо ее невозможно превратить в линейный вид.

Внутренне нелинейной будет и модель вила

или модель

,

ибо эти уравнения не могут быть преобразованы в уравнения, ли­нейные по коэффициентам.

В специальных исследованиях по регрессионному анализу часто к нелинейным относят модели, только внутренне нелиней­ные по оцениваемым параметрам, а все другие модели, которые внешне нелинейные, но путем преобразований параметров могут быть приведены к линейному виду, относятся к классу линейных моделей. В этом плане к линейным относят, например, экспонен­циальную модель ,ибо логарифмируя ее по натураль­ному основанию, получим линейную форму модели

.

Если модель внутренне нелинейна по параметрам, то для оценки параметров используются итеративные процедуры, ус­пешность которых зависит от вида уравнений и особенностей применяемого итеративного подхода. Модели внутренне нели­нейные по параметрам могут иметь место в эконометрических исследованиях. Однако гораздо большее распространение полу­чили модели, приводимые к линейному виду. Решение такого ти­па моделей реализовано в стандартных пакетах прикладных прог­рамм. Среди них, в частности, можно назвать и обратную модель вида

Обращая обе части равенства, получим линейную форму мо­дели для переменной :

Среди нелинейных функций, которые могут быть приведены к линейному виду, в эконометрических исследованиях очень ши­роко используется степенная функция .Связано это с тем, что параметр в ней имеет четкое экономическое истолко­вание, т. е. он является коэффициентом эластичности. Это значит, что величина коэффициента показывает, на сколько процентов изменится в среднем результат, если фактор изменится на 1 %. Так, если зависимость спроса от цен характеризуется уравнением вида , то, следовательно, с увеличением цен на 1 % спрос снижается в среднем на 1,12 %. О правомерности по­добного истолкования параметра для степенной функции можно судить, если рассмотреть формулу расчета коэф­фициента эластичности

где первая производная, характеризующая соотношение прирос­тов результата и фактора для соответствующей формы связи.

Для степенной функции она составит: . Соот­ветственно коэффициент эластичности окажется равным:

Коэффициент эластичности, естественно, можно определять и при наличии других форм связи, но только для степенной функ­ции он представляет собой постоянную величину, равную па­раметру . В других функциях коэффициент эластичности за­висит от значений фактора х. Так, для линейной регрессии функция и эластичность следующие:

и

В силу того что коэффициент эластичности для линейной функции не является величиной постоянной, а зависит от соот­ветствующего значения х, то обычно рассчитывается средний по­казатель эластичности по формуле

Для оценки параметров степенной функции при­меняется метод наименьших квадратов к линеаризованному уравнению , т.е. решается система нормальных уравнений:

Параметр определяется непосредственно из системы, а пара­метр — косвенным путем после потенцирования величины . Так, решая систему нормальных уравнений зависимости спроса от цен, было получено уравнение Если потенцировать его, получим:

Поскольку параметр экономически не интерпретируется, то нередко зависимость записывается в виде логарифмически ли­нейной. В виде степенной функции изучается не только эластичность спроса, но и предложения. При этом обычно эластичность спроса характеризуется параметром < 0, а эластичность предложения: > 0.

Поскольку коэффициенты эластичности представляют эко­номический интерес, а виды моделей не ограничиваются только степенной функцией, приведем формулы расчета коэффициентов эластичности для наиболее распространенных типов уравнений рег­рессии (табл. 4.5).

Таблица 4.5

Коэффициенты эластичности для ряда математических функций

Вид функции, Первая производная, Коэффициенты эластичности,
Линейная
Парабола второго порядка
Гипербола
Показательная
Степенная
Полулогарифмическая
Логарифмическая
Обратная

Несмотря на широкое использование в эконометрике коэф­фициентов эластичности, возможны случаи, когда их расчет эко­номического смысла не имеет. Это происходит тогда, когда для рассматриваемых признаков бессмысленно определение измене­ния значений в процентах. Например, вряд ли кто будет опреде­лять, на сколько процентов может измениться заработная плата с ростом стажа работы на 1 %. Или, например, на сколько процен­тов изменится урожайность пшеницы, если качество почвы, из­меряемое в баллах, изменится на 1 %. В такой ситуации степенная функция, даже если она оказывается наилучшей по формаль­ным соображениям (исходя из наименьшего значения остаточ­ной вариации), не может быть экономически интерпретирована. Например, изучая соотношение ставок межбанковского кредита у (в процентах годовых) и срока его предоставления х (в днях), было получено уравнение регрессии с очень вы­соким показателем корреляции (0,9895). Коэффициент эластич­ности 0,352% лишен смысла, ибо срок предоставления кредита не измеряется в процентах. Значительно больший интерес для этой зависимости может представить линейная функция , имеющая более низкий показатель корреля­ции 0,85. Коэффициент регрессии 0,403 показывает в процент­ных пунктах изменение ставок кредита с увеличением срока их предоставления на один день.

В моделях, нелинейных по оцениваемым параметрам, но приводимых к линейному виду, МНК применяется к преобразо­ванным уравнениям. Если в линейной модели и моделях, нели­нейных по переменным, при оценке параметров исходят из кри­терия , то в моделях, нелинейных по оцениваемым параметрам, требование МНК применяется не к исходным дан­ным результативного признака, а к их преобразованным величи­нам, т. е. . Так, в степенной функции МНК применяется к преобразованному уравнению .

Это значит, что оценка параметров основывается на миними­зации суммы квадратов отклонений в логарифмах.

.

Соответственно если в линейных моделях (включая нелиней­ные по переменным) , то в моделях, нелинейных по оцениваемым параметрам,

.

Вследствие этого оценка параметров для линеаризуемых функций МНК оказываются несколько смещенной.

Возьмем, например, показательную кривую: или равносильную ей экспоненту . Прологарифмировав, имеем:

.

Применяя МНК, минимизируем . Система нор­мальных уравнений составит:

Из первого уравнения видно, что

Предположим, что фактические данные сложились так, что . Тогда или , т. е. параметр представляет собой среднюю геометрическую из значений переменной у. Между тем в линейной зависимости при параметр

т. е. средней арифметической. Поскольку средняя геометри­ческая всегда меньше средней арифметической, то и оценки па­раметров, полученные из минимизации , будут нес­колько смещены (занижены).

Практическое применение экспоненты возможно, если ре­зультативный признак не имеет отрицательных значений. Поэто­му если исследуется, например, финансовый результат деятель­ности предприятий, среди которых наряду с прибыльными есть и убыточные, то данная функция не может быть использована. Ес­ли экспонента строится как функция выравнивания по динами­ческому ряду для характеристики тенденции с постоянным тем­пом, то , где у — уровни динамического ряда; t - хроноло­гические даты, параметр b означает средний за период коэффи­циент роста. В уравнении этот смысл приобретает вели­чина антилогарифма параметра .

При исследовании взаимосвязей среди функций, использую­щих , в эконометрике преобладают степенные зависимости — это и кривые спроса и предложения, и кривые Энгеля, и произ­водственные функции, и кривые освоения для характеристики связи между трудоемкостью продукции и масштабами производ­ства в период освоения выпуска нового вида изделий, и зависи­мость валового национального дохода от уровня занятости.

В отдельных случаях может использоваться и нелинейная мо­дель вида

так называемая обратная модель, являющаяся разновидностью гиперболы. Но если в равносторонней гиперболе преобразованию подвергается объясняющая переменная и .то для по. В результате обратная модель оказывается внутренне нелинейной и требование МНК выполняется не для фактических значений признака у, а для их обратных величин , а именно:

Соответственно

.

Проанализируем зависимость рентабельности продукции от ее трудоемкости по данным семи предприятий (табл. 4.6).

Таблица 4.6

Зависимость рентабельности продукции y (%) от ее

трудоемкости x ()

x y
1,0   0,0312 0,0312 1,00 0,0285 35,1 0,0027 -3,1
1,2   0,0357 0,0428 1,44 0,0341 29,3 0,0016 -1,3
1,5   0,0455 0,0682 2,25 0,0424 23,6 0,0031 -1,6
2,0   0,0500 0,1000 4,00 0,0563 17,7 -0,0063 2,3
2,5   0,0625 0,1563 6,25 0,0703 14,2 -0,0078 1,8
2,7   0,0667 0,1800 7,29 0,0758 13,2 -0,0091 1,8
3,0   0,1000 0,3000 9,00 0,0842 11,9 0,0158 -1,9
13,9   0,3916 0,8785 31,23 0,3936 145,0 0,0000 -2,0

Для оценки параметров исследуемой функции по МНК система нормальных уравнений примет вид:

Исходя из данных табл. 2.6, имеем:

Решая эту систему уравнений, получим оценки параметров искомой функции: = 0,0007; = 0,0278. Соответственно уравне­ние регрессии составит:

Сравним последние две графы табл. 2.6. Получим , тогда как для обратных значений эта величина равна нулю. Кроме того, заметим, что положительные отклонения фак­тических и теоретических обратных значений сменяются на отрицательные значения для аналогичных показателей по исход­ным данным. Уравнение отражает обратную связь рассматривае­мых признаков: чем выше трудоемкость, тем ниже рентабель­ность. Поскольку данное уравнение линейно относительно величин , то если обратные значения имеют экономический смысл, коэффициент регрессии интерпретируется, так же как в линейном уравнении регрессии. Если, например, под y подразу­меваются затраты на 1 руб. продукции, а под х — производитель­ность труда (выработка продукции на одного работника), то об­ратная величина характеризует затратоотдачу и параметр имеет экономическое содержание — средний прирост продукции в сто­имостном измерении на 1 руб. затрат с ростом производитель­ности труда на единицу своего измерения.

Уравнение вида характеризует прямую зависимость результативного признака от фактора. Оно целесообразно при очень медленном повышении уровней результативного признака с ростом значений фактора.

Возможно и одновременное использование логарифмирова­ния, и преобразование в обратные величины: Про­логарифмировав, получим: . Далее заменим на z, и тогда для оценки параметров к линейному уравнению может быть применен МНК.

При всех положительных значениях х функция возрастает; при кривая имеет точку перегиба — ускоренный рост при сменяется на замедленный рост при . Подобного типа функции используются при анализе статистических данных о бюджетах потребителей, где выдвигается гипотеза о существо­вании асимптотического уровня расходов, об изменении пре­дельной склонности к потреблению товара, о существовании «порогового уровня дохода». В этом случае при .

При использовании линеаризуемых функций, затрагиваю­щих преобразования зависимой переменной у, следует особенно проверять наличие предпосылок

МНК (они будут рассмотрены в п. 3, 10), чтобы они не нарушались при преобразовании. При не линейных соотношениях рассматриваемых признаков, приводи­мых к линейному виду, возможно интервальное оценивание па­раметров нелинейной функции. Так, для показательной кривой сначала строятся доверительные интервалы для пара­метров нового преобразованного уравнения , т. е. для и . Далее с помощью обратного преобразования определяются доверительные интервалы для параметров в исход­ном соотношении. В степенной функции доверитель­ный интервал для параметра b строится так же. как в линейной функции, т. е. . Отличие состоит лишь в том. что при оп­ределении стандартной ошибки параметра b, используются не исходные данные, а их логарифмы:

(2.28)

4.7. Множественный регрессионный анализ

Экономические явления, как правило, определяются боль­шим числом одновременно и совокупно действующих факторов. В связи с этим часто возникает задача исследования зависимо­сти одной зависимой переменной 7 от нескольких объясняющих переменных . Эта задача решается с помощью множе­ственного регрессионного анализа.

Обозначим е наблюдение переменной , а объясняющих переменных . Тогда модель множественной линейной регрессии можно представить в виде:

, (13.22)

где , а удовлетворяет приведенным выше предпосыл­кам (13.3)—(13.5).

Включение в регрессионную модель новых объясняющих пе­ременных усложняет получаемые формулы и вычисления. Это приводит к целесообразности использования матричных обозначе­ний. Матричное описание регрессии облегчает как теоретические концепции анализа, так и необходимые расчетные процедуры.

Введем обозначения: матрица-столбец, или вектор, значений зависимой переменной размера n;

— матрица значений объясняющих переменных, или матрица плана размера (обращаем внимание на то, что в матрицу X до­полнительно введен столбец, все элементы которого равны 1, т.е. условно полагается, что в модели (13.22) свободный член умножается на фиктивную переменную , принимающую зна­чение 1 для всех ;

матрица-столбец, или вектор, параметров размера (k+1);

матрица-столбец, или вектор, возмущений (случайных ошибок, остатков) размера п.

Тогда в матричной форме модель (13.22) примет вид:

. (13.23)

Оценкой этой модели по выборке является уравнение

, (13.24)

где , .

Для оценки вектора неизвестных параметров применим метод наименьших квадратов. Так как произведение транспони­рованной матрицы на саму матрицу

,

то условие минимизации остаточной суммы квадратов запишет­ся в виде:

. (13.24)

Учитывая, что при транспонировании произведения матриц получается произведение транспонированных матриц, взятых в обратном порядке, т.е. , получим после раскрытия ско­бок:

. (13.24)

Произведение есть матрица размера , т.е. величина скалярная, следовательно, оно не меняется при транспонировании: . По­этому условие минимизации (13.24) примет вид:

.

На основании необходимого условия экстремума функции не­скольких переменных , представляющей , необ­ходимо приравнять к нулю частные производные по этим пере­менным или в матричной форме — вектор частных производных

.

Таким образом, встает задача найти минимум этой функций. Для этого выражение следует продифференцировать по векторному аргументу и полученное выражение приравнять к нулю, то есть:

Отсюда получается следующее выражение:

Данная система уравнений называется нормальной системой уравнений регрессии. Требуется ввести обозначения: матрица коэффициентов нормальных уравнений, вектор-столбец свободных членов нормальных уравнений регрессии.

С учетом введенных обозначений нормальная система уравнений регрессии перепишется в окончательном виде:

(13.25)

Для решения матричного уравнения (13.25) относительно вектора оценок параметров необходимо ввести пред­посылку для множественного регрессионного анализа: матрица является неособенной, т.е. ее определитель не равен нулю. Следовательно, ранг матрицы равен ее порядку, т.е. . Из матричной алгебры известно, что , значит, , т.е. ранг матрицы плана равен числу ее столбцов.

Кроме того, полагают, что число имеющихся наблюдений (значений) каждой из объясняющих переменных превосходит ранг матрицы , т.е. или , ибо в противном случае в принципе невозможно получение сколько-нибудь на­дежных статистических выводов.

Если матрица коэффициентов нормальных уравнений хорошо обусловлена и обратима, то можно получить решение системы (13.25), например, в виде:

(13.26)

где - обратная матрица, соответствующая условиям:

где - единичная матрица соответствующих размеров.

Зная вектор , модель уравнения множественной рег­рессии можно представить в виде:

(13.27)

Преобразуем вектор оценок (13.26) с учетом (13.23) получим:

,

Откуда

, (13.28)

т. е. оценки параметров (13.28), найденные по выборке, будут содержать случайные ошибки.

Пример 13.4. Имеются следующие данные (условные) о сменной добыче угля на одного рабочего Y(t), мощности пласта Х\ (м) и уровне механизации работ Х2 (%), характеризующие процесс добычи угля в 10 шахтах.

Таблица 13.6

               

Предполагая, что между переменными , и существует линейная корреляционная зависимость, найти ее аналитическое выражение (уравнение регрессии , по и .

Решение. Обозначим

,

(напоминаем, что в матрицу плана X вводится дополнительный столбец чисел, состоящий из единиц).

Решение системы уравнении найдем методом псевдонормального решения:

, (13.29)

где псевдообратная матрица к исходной матрице .

Псевдообратную матрицу найдем по рекурсивному алгоритму (№№№) и она равна:

Тогда по формуле (13.29) найдем вектор столбец параметров регрессии:

.

С учетом (13.27) уравнение множественной регрессии имеет вид:

. (13.30)

Уравнение множественной регрессии (13.30) показывает, что при увели­чении только мощности пласта (при неизменном ) на 1 м, добыча угля на одного рабочего Y увеличивается в среднем на 0,854 т, а при увеличении только уровня механизации работ на 1% (при неизменной ) в среднем на 0,367 т.

Добавление в регрессионную модель новой объясняющей переменной изменило коэффициент регрессии (Y по ) с 1,016 для парной регрессии (см. пример 13.1) до 0,854 — для множественной регрессии. В этом никакого противоречия нет, так как во втором случае коэффициент регрессии позволяет оценить прирост зависимой переменной Y при изменении на единицу объясняющей переменной в чистом виде, независи­мо от . В случае парной регрессии учитывает воздействие на Y не только переменной , но и косвенно корреляционно связанной с ней переменной . ►

На практике часто бывает необходимо сравнение влияния на зависимую переменную различных объясняющих переменных, когда последние выражаются разными единицами измерения. В этом случае используют стандартизованные коэффициенты регрессии и коэффициенты эластичности :

. (13.31)

. (13.32)

Стандартизованный коэффициент регрессии показывает, на сколько величин изменится в среднем зависимая переменная Y при увеличении только j-й объясняющей переменной на , а коэффици­ент эластичности на сколько процентов (от средней) изме­нится в среднем Y при увеличении только на 1%.

13.6. Ковариационная матрица и ее выборочная оценка

Вариации оценок параметров будут в конечном счете опре­делять точность уравнения множественной регрессии. Для их измерения в многомерном регрессионном анализе рассматрива­ют так называемую ковариационную матрицу К, являющуюся матричным аналогом дисперсии одной переменной:

.

где элементы ковариации (или корреляционные моменты) оце­нок параметров и . Ковариация двух пере­менных определяется как математическое ожидание произведения отклонений этих переменных от их математических ожиданий (см. § 5.6). Поэтому

, (13.28)

где и математические ожидания соответственно для параметров и .

Ковариация характеризует как степень рассеяния значений двух переменных относительно их математических ожиданий, так и взаимосвязь этих переменных.

В силу того, что оценки , полученные методом наименьших квадратов, являются несмещенными оценками параметров , т.е. , выражение (13.28) примет вид:

.

Рассматривая ковариационную матрицу К, легко заметить, что на ее главной диагонали находятся дисперсии опенок пара­метров регрессии, ибо

. (13.29)

В сокращенном виде ковариационная матрица К имеет вид:

. (13.30)

Учитывая (13.28) мы можем записать

.

Тогда выражение (12.30) примет вид:

, (13.31)

ибо элементы матрицы X —неслучайные величины.

Матрица представляет собой ковариационную матри­цу вектора возмущений :

в которой все элементы, не лежащие на главной диагонали, равны нулю в силу предпосылки 4 о некоррелированности воз­мущений , и между собой, а все элементы, ле­жащие на главной диагонали, в силу предпосылок 2 и 3 регрес­сионного анализа равны одной и той же дисперсии :

.

Поэтому матрица , где единичная матрица го

порядка. Следовательно, в силу (13.31) ковариационная матрица вектора оценок параметров:

Так как и , то окончательно получим:

(13.32)

Таким образом, с помощью обратной матрицы нормальных уравнении регрессииопределяется не только сам вектор оценок параметров (13.28), но и дисперсии и ковариации его компонент.

Входящая в (13.32) дисперсия возмущений неизвестна. За­менив ее выборочной остаточной дисперсией

(13.33)

по (13.32) получаем выборочную оценку ковариационной мат­рицы К. (В знаменателе выражения (13.33) стоит , а не , как это было выше в (13.6). Это связано с тем, что теперь степеней свободы (а не две) теряются при определении не­известных параметров, число которых вместе со свободным чле­ном равно .

13.7. Определение доверительных интервалов

для коэффициентов и функции регрессии

Перейдем теперь к оценке значимости коэффициентов рег­рессии и построению доверительного интервала для парамет­ров регрессионной модели .

В силу (13.29), (13.32) и изложенного выше оценка диспер­сии коэффициента регрессии определится по формуле:

где несмещенная оценка параметра

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: