Методом Монте-Карло

При работе на компьютере проще многократно проделать простые вычисления, чем один раз решить сложную аналитическую задачу. Поэтому для исследования стохастических моделей удобен метод Монте-Карло, позволяющий, в частности, оценивать погрешности параметров сложных моделей. Основные этапы реализации метода Монте-Карло:

1. Построение модели с “идеальными” параметрами.

2. Изменение значений переменных случайным образом в соответствии с дисперсией и законом распределения.

3. Расчет по проверяемой методике и сохранение параметров модели.

4. Возврат к п.2.

Пункты 2 и 3 выполняются заданное число раз – десятки, сотни, тысячи. В результате накапливаются массивы параметров, которые можно статистически обработать и установить надежность их оценок. В принципе, это можно сделать по аналитическим формулам дисперсионного анализа, но для сложной системы с внутренними связями такие расчеты становятся сложными и неустойчивыми.

В качестве примера используем эконометрическую модель парной регрессии, рассмотренную в предыдущем разделе. Этапы работы:

1. Задать коэффициенты линейной модели Yидеал = a + bX и стандартное отклонение остатков (Sост). В данном случае a= - 4,27, b= 1,78, Sост =2,44. Полученные результаты представлены в таблице 5.1. в столбце Yидеал.

Таблица 5.1.

X Y Yидеал Yимит. Ŷ остатки
    13,55 13,55 13,13 0,42
    15,33 13,50 14,91 -1,41
    17,11 15,28 16,68 -1,4
    18,89 18,28 18,46 -0,18
    20,67 21,77 20,24 1,53
    22,45 23,55 22,01 1,54
    24,24 25,34 23,79 1,55
    26,02 25,65 25,56 0,09
    27,8 23,53 27,34 -3,81
    29,58 34,34 29,11 5,23
    31,36 27,34 30,89 -3,55
           
        48,48  

2. Ввести в ячейки формулы и функции для расчета коэффициента детерминации R 2, коэффициента автокорреляции остатков Rавт и статистики Дарбина-Уотсона DW = 2(1- Rавт), дисперсий остатков по первой и второй половинам диапазона и теста Голдфелда-Квандта GQ=МАКС(ДИСП1; ДИСП2)/МИН(ДИСП1; ДИСП2); кроме того, в данном примере вычисляется прогнозное значение для Х =30. Y(30), GQ и DW размещаются в той же строке таблицы Excel, что и коэффициенты b и a, что упрощает их сохранение.

3. Расчёт параметров модели с использованием функции ЛИНЕЙН.

b a Y(30) GQ DW
1,77 -4,62 48,48 8,05 3,11
0,25 3,94      
0,84 2,70   Автокорреляция -0,55
47,53     Дисп.ост.1 1,76
346,88 65,68   Дисп.ост.2 14,20

4. Сохранение в таблице Excel вычисленных параметров модели (сотни и тысячи имитаций) и статистическая обработка. В Таблице представлена часть массива результатов. Вычислено среднее значение каждого параметра, что позволяет оценить несмещённость, стандартное отклонение и относительную погрешность.

  b a Y(30) GQ DW
  0,95 7,60 36,22 3,88 4,11
  1,69 -3,91 46,91 1,40 3,31
  1,71 -3,55 47,90 9,47 2,69
  2,08 -10,59 51,70 1,55 3,34
  1,74 -5,20 47,14 1,93 2,86
  2,08 -8,47 53,85 7,99 2,25
           
           
Среднее 1,78 -4,42 48,96 4,37 3,09
СКО 0,2 3,14 3,113 3,52 0,64
% 11,4 71,2 6,358 80,58 20,82

В представленных таблицах не предусмотрено сохранение коэффициента детерминации, вычисляемого функцией ЛИНЕЙН. Включите его в рассмотрение.

Процедура и программный модуль для создания имитаций и сохранения результатов, а также упрощенная технология создания имитаций, позволяющая обойтись без программирования, представлены в Приложении 1.

       
   
 

5. После завершения набора результатов (не меньше 100 циклов) вычислите стандартные отклонения a, b, Y(30), GQ, DW, Rxy, сравните полученные значения с вычисленными по аналитическим формулам

6. Постройте корреляционные графики a(b), a(R2), b(R2).

7. Постройте гистограммы частотных распределений a, b, R2, Y(30), DW, GQ. Для этого введите в таблицу Excel границы интервалов значений параметров (карманы) и запустите Сервис (или Данные) – Анализ данных – Гистограмма.

Исследования сравнительно простой модели – парной линейной регрессии – приводят к интересным результатам.

1. На рисунках представлены графики частотных распределений DW и GQ. Тесты показывают наличие автокорреляции для 7,5 % имитаций и гетероскедастичности для 8,5 % имитаций, причём график GQ имеет длинный хвост. Имитации создавались на основе нормального распределения возмущений, значит, автокорреляцию и гетероскедастичность можно обнаружить, если для них нет никаких предпосылок.

Рис.5.1.

2. В данном случае гипотеза a = 0 является приемлемой. Одна серия испытаний проведена с исключением a из модели, другая – без исключения. При ислючении aSb уменьшается втрое, а СКО Ŷпрогн(30) вдвое, но появляется систематическая погрешность (смещение).

  b a Ŷпрогн(30)
Среднее 1,509 0,000 45,26
СКО 0,053 0,000 1,6
СКО /среднее % 3,536   3,535

Похожие результаты были получены и при исследовании нелинейной зависимости Ŷ = a + bX + cX2. При исключении слагаемого с коэффициентом b, имеющим погрешность 157%, погрешности a, c и Ŷ(30) уменьшились вдвое, но появилось смещение Ŷ(30) примерно на 10%.

4. Обработка расчетов методом Монте-Карло показала правомерность расчета погрешности точечной оценки прогноза Ŷ по формуле

S2(Ŷ)=(Sa)2 + X2(Sb)2+2XCov(a,b).

Особый интерес представляет полученный коэффициент корреляции a и b, равный -0,98, что неудивительно, т.к. a = YсрbXср. Из этого следует важнейший вывод: погрешность прогнозного значения Ŷ меньше относительных погрешностей a и b, и вдали от средних X и Y близка к разности погрешностей слагаемых в уравнении регрессии:

S(Ŷпрог) =| Sb * Xпрог– Sa |, здесь 0,2*30 – 3,14 = 2,86

что совпадает с результатами расчетов по формуле (=2,92) и методом Монте-Карло (=3,11).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: