Метод скользящих средних

В техническом анализе, применяемом трейдерами на форексе, существует достаточно много методов прогнозирования и выявления тренда. Одним из них является метод скользящей средней.

Данный метод основан на том факте, что для расчета самой скользящей средней в течение расчетного периода, берутся средние цены закрытия.

Термин «скользящее» взят потому, что по мере добавления к среднему значению новых данных старые опускаются. В результате такого обновления среднего значения оно постоянно «скользит».

Математическая статистика– это наука о способах измерения, обработки и анализа результатов исследования массовых случайных явлений.

Исходными понятиями математической статистики являются понятия генеральной совокупности и выборочной совокупности (выборки), теоретических и выборочных характеристик распределения.

В результате эксперимента реализовались n значений измеряемой величины, которые получены случайным выбором из генеральной совокупности. Этот набор из n чисел называется простой статистической совокупностью, или выборкой. Выбираем из этой совокупности Хнаим и Хнаибол. Эти граничные значения удобно округлить и рассматривать интервал. Разобьем этот интервал на частичные интервалы (разряды) и подсчитаем количество наблюдений mi, приходящийся на каждый разряд[4].

Примем, что частичные разряды имеют одинаковые длины h.

 

 (3.1)

 

где k– число разрядов.

Обычно число разрядов выбирают в промежутке 7–15. Наряду с количеством наблюдений mi рассчитываем также их частоты

 

 (3.2)

 

По этим данным составляем интервальный статистический ряд.

Анализ статистических данных можно проводить с помощью временных рядов, т.е. в виде последовательностей измерений, упорядоченных в неслучайные моменты времени. В отличие от анализа случайных выборок, анализ временных рядов основывается на предположении о том, что последовательные значения данных наблюдаются через равные промежутки времени (тогда как в других методах нам не важна привязка наблюдений ко времени). Подробное обсуждение этих методов можно найти в следующих работах [4-11].

Существуют две основные цели анализа временных рядов: определение природы ряда и прогнозирование (предсказание будущих значений временного ряда по настоящим и прошлым значениям). Обе эти цели требуют, чтобы модель ряда была идентифицирована и, более или менее, формально описана. Как только модель определена, можно с ее помощью интерпретировать рассматриваемые данные.

Большинство регулярных составляющих временных рядов принадлежит к двум классам: они являются либо трендом, либо сезонной составляющей. Тренд представляет собой общую систематическую линейную или нелинейную компоненту, которая может изменяться во времени. Сезонная составляющая - это периодически повторяющаяся компонента. Оба эти вида регулярных компонент часто присутствуют в ряде одновременно.

Не существует «автоматического» способа обнаружения тренда во временном ряде. Однако если тренд является монотонным (устойчиво возрастает или устойчиво убывает), то анализировать такой ряд обычно нетрудно. Если временные ряды содержат значительную ошибку, то первым шагом выделения тренда является сглаживание.

Сглаживание всегда включает некоторый способ локального усреднения данных, при котором несистематические компоненты взаимно погашают друг друга. Самый общий метод сглаживания - скользящее среднее.

Скользящие средние значения из нечетного числа эмпирических значений, например из трех, образуются так [5]:

 

,                                        (3.3)

 

где у 1, у 2,…, уk - наблюдаемое значение выгрузки грузов соответственно в моменты времени t 1, t 2,…, tk.

Аналогично образуются средние значения для пяти, семи и более значений.

Если необходимо образовать скользящее среднее значение из четного числа наблюдений, то для такого упорядочения отдельных средних уi к соответствующим моментам времени ti используются следующие выражения (для четырех значений):

 

,                     (3.4)


Средние значения для шести, восьми и большего четного числа значений определяются аналогично.

Пусть экспериментально полученные данные имеют вид эмпирического ряда

 

t t1 t2 ti tn
y y1 y2 yi yn

 

Требуется подобрать формулу, описывающую приближенно функциональную зависимость у = у (t), заданную этим рядом. Таким образом, будем строить такую приближающую функцию, которая не обязательно совпадет с эмпирическим рядом в узлах, но, в некотором смысле, «не далеко отклоняется» от значений ряда. При этом ее аналитическая формула должна содержать небольшое количество параметров, а их количество не должно зависеть от количества значений эмпирического ряда.

Каждое измерение в эксперименте производится с некоторой погрешностью, и табличные значения функции у = у (t) отличаются от истинных. Одна из целей построения эмпирической формулы является сглаживание случайных погрешностей.

После составления эмпирического ряда необходимо найти параметры эмпирической формулы, описывающие характер зависимости наблюдений от нее.

Один из самых распространенных методов выбора параметров – метод наименьших квадратов [22]. Он заключается в таком выборе коэффициентов эмпирической функции, при котором сумма квадратов всех уклонений значений функции от опытных данных минимальна.

Пусть эмпирическая формула имеет вид [5]:

 

,   m < n,                         (3.5)


где m - количество параметров эмпирической формулы;

n - количество экспериментальных точек.

Величина

 

.                                (3.6)

 

задает уклонения при всевозможных значениях ti. Наилучшими параметрами аi считаются те, для которых сумма:

 

.        (3.7)

 

будет минимальной.

Чтобы найти требуемые коэффициенты, используется необходимый признак экстремума функции нескольких переменных. Приравниваем частные производные первого порядка функции  нулю. Для определения коэффициентов получается система уравнений:

 

.           (3.8)

 

Среднеквадратичное уклонение характеризует величину отклонения опытных значений от теоретических, полученных по эмпирической формуле. Эта величина определяется выражением:


,                                     (3.9)

 

где - сумма квадратов уклонений.

Величину ε используют при этом для определения пригодности эмпирической значимости. Если ее значение примерно равно погрешности экспериментальных данных и число параметров формулы много меньше, чем точек в таблице, то формулой можно пользоваться. Если величина среднеквадратичного уклонения ε существенно превосходит погрешности исходных значений, то следует поискать другой, более подходящий, вид эмпирической формулы.

Для определения динамики работы железной дороги Св с грузами и определения ее зависимости необходимо рассчитать внутригодовое выборочное среднее для каждой станции и виду работы с ней. Для этого необходимо рассчитать коэффициент ежегодного прироста, который определяется:

 

,                                                 (3.10)

 

где Qi     - внутригодовая погрузка (выгрузка) i - того типа контейнеров, конт.;

α - коэффициент прироста ( = α);

n - объем исследуемого ряда, (n =0, 1,…, m).

Среднегеометрический прирост временного ряда определяется:

 

.                              (3.11)


По полученным данным составляется новый временной ряд, используя метод скользящего среднего значения. Для полученного графика выбираем эмпирическую формулу, параметры которой определяем с помощью метода наименьших квадратов. Затем по (3.8) вычисляется среднеквадратичное уклонение. Ошибка расхождения эмпирического значения от наблюдаемых определена, в процентах:

 

.                                     (3.12)

 

Выгрузка угля на станции Мрефт за январь-апрель 2010 года

Таблица 3.1 – Объемы выгрузки угля за январь

 Число

1

2

3

4

5

6

7

8

9

10

11

12

13

14

Выгрузка

580

496

579

457

555

636

718

393

460

785

654

524

718

665

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

528

594

395

470

583

511

529

468

518

467

590

528

458

586

461

520

607
                                                             

 

Хнаим=393

Хнаибол=785

k=10

h=40

 

Таблица 3.2–Интервальный статистический ряд за январь 2010 года

Разряды

390-430

430-470

470-510

510-550

550-590

Число наблюдений

2

7

1

7

6

Частоты pi*

0,06

0,23

0,03

0,23

0,19

0,002

0,006

0,001

0,006

0,005

590-630

630-670

670-710

710-750

750-790

сумма

2

3

0

2

1

31

0,06

0,10

0,00

0,06

0,03

1,00

0,002

0,002

0,000

0,002

0,001

 

                     

 

Важными характеристиками выборки являются статистики выборочного распределения (выборочные характеристики, оценки), каждая из которых оказывается аналогом соответствующей характеристики теоретического распределения. Для вычисления статистик распределения интервальный ряд (таблица 3.2) заменим дискретным статистическим рядом, принимая в качестве «представителя» каждого разряда его середину, например, первый интервал (390-430) заменяем числом 410, сопоставляя с ним число наблюдений (2), соответствующее всему интервалу (390-430).

 

Таблица 3.3 – Средний интервальный статистический ряд

Середина инт xi

410

450

490

530

570

610

650

690

Число наблюдений mi

2

7

1

7

6

2

3

0

Частоты pi*

0,06

0,23

0,03

0,23

0,19

0,06

0,10

0,00

xi pi*

26,45

101,61

15,81

119,68

110,32

39,35

62,90

0,00

730

770

сумма

2

1

31

0,06

0,03

1,00

47,10

24,84

548,06

                     

 

Таблица 3.4– Объемы выгрузки угля за февраль–апрель

 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

февраль

326

723

598

653

590

610

522

523

510

470

525

524

519

531

март

527

523

467

479

581

398

460

596

396

657

459

463

652

395

апрель

326

260

649

597

533

563

595

655

461

587

590

792

525

599

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

530

530

396

594

714

398

461

465

602

399

593

533

407

517

 

524

528

460

329

531

454

388

462

402

401

590

456

393

588

396

589

600

785

524

524

855

537

528

530

653

420

500

599

563

792

                                                         

 


Таблица 3.5 – Интервальный статистический ряд за февраль 2010 года

Разряды

325-365

365-405

405-445

445-485

485-525

525-565

Число наблюдений mi

1

3

1

3

7

3

Частоты pi*

0,04

0,11

0,04

0,11

0,25

0,11

0,001

0,003

0,001

0,003

0,006

0,003

565-605

605-645

645-685

685-725

Сумма

6

1

1

2

28

0,21

0,04

0,04

0,07

1,00

0,005

0,001

0,001

0,002

 

                     

 

Таблица 3.6 – Средний интервальный статистический ряд за февраль 2010 года

Середина инт. xi

345

385

425

465

505

545

585

625

Число наблюдений mi

1

3

1

3

7

3

6

1

Частоты pi*

0,04

0,11

0,04

0,11

0,25

0,11

0,21

0,04

xi pi*

12,32

41,25

15,18

49,82

126,25

58,39

125,36

22,32

665

705

Сумма

1

2

28

0,04

0,07

1,00

23,75

50,36

525,00

                     

 

Таблица 3.7 – Интервальный статистический ряд за март 2010 года

Разряды

325-355

355-385

385-415

415-445

445-475

475-505

Число наблюдений mi

1

0

8

0

9

1

Частоты pi*

0,03

0,00

0,26

0,00

0,29

0,03

0,001

0,000

0,009

0,000

0,010

0,001

505-535

535-565

565-595

595-625

625-655

655-685

Сумма

6

0

3

1

1

1

31

0,19

0,00

0,10

0,03

0,03

0,03

1,00

0,006

0,000

0,003

0,001

0,001

0,001

 

                         

 


Таблица 3.8 – Средний интервальный статистический ряд за март 2010 года

Середина инт. xi

340

370

400

430

460

490

420

Число наблюдений mi

1

0

8

0

9

1

6

Частоты pi*

0,03

0,00

0,26

0,00

0,29

0,03

0,19

xi pi*

10,97

0,00

103,23

0,00

133,55

15,81

81,29

450

480

510

540

570

Сумма

0

3

1

1

1

31

0,00

0,10

0,03

0,03

0,03

1,00

0,00

46,45

16,45

17,42

18,39

443,55

                         

 

Таблица 3.9 – Интервальный статистический ряд за апрель 2010года

Разряды

260-320

320-380

380-440

440-500

500-560

560-620

Число наблюдений mi

1

1

1

2

8

10

Частоты pi*

0,03

0,03

0,03

0,07

0,27

0,33

0,001

0,001

0,001

0,001

0,004

0,006

620-680

680-740

740-800

800-860

сумма

3

0

3

1

30

0,10

0,00

0,10

0,03

1,00

0,002

0,000

0,002

0,001

 

                     

 

Таблица 3.10 – Средний интервальный статистический ряд за апрель 2010

Середина инт.xi

290

350

410

470

530

590

650

Число наблюдений mi

1

1

1

2

8

10

3

Частоты pi*

0,03

0,03

0,03

0,07

0,27

0,33

0,10

xi pi*

9,67

11,67

13,67

31,33

141,33

196,67

65,00

710

770

830

Сумма

0

3

1

30

0,00

0,10

0,03

1,00

0,00

77,00

27,67

574,00

                     

 

 

Рассмотрим данные роста выгрузки с учетом поправочного коэффициента (асргеом).

Январь∙(1,02)

Февраль∙(1,02)2

Март∙(1,02)3

Апрель∙(1,02)4

 

Таблица 3.11 – Рост выгрузки с учетом поправочного коэффициента

Месяц

Число

Выгрузка

 

Март 60 527 559

Январь

1

580

580

  61 523 555

 

2

496

496

  62 467 496

 

3

579

579

  63 479 508

 

4

457

457

  64 581 617

 

5

555

555

  65 398 422

 

6

636

636

  66 460 488

 

7

718

718

  67 596 632

 

8

393

393

  68 396 420

 

9

460

460

  69 657 697

 

10

785

785

  70 459 487

 

11

654

654

  71 463 491

 

12

524

524

  72 652 692

 

13

718

718

  73 395 419

 

14

665

665

  74 524 556

 

15

528

528

  75 528 560

 

16

594

594

  76 460 488

 

17

395

395

  77 329 349

 

18

470

470

  78 531 564

 

19

583

583

  79 452 480

 

20

511

511

  80 388 412

 

21

529

529

  81 462 490

 

22

468

468

  82 402 427

 

23

518

518

  83 401 426

 

24

467

467

  84 590 626

 

25

590

590

  85 456 484

 

26

528

528

  86 393 417

 

27

458

458

  87 588 624

 

28

586

586

  88 396 420

 

29

461

461

  89 458 486

 

30

520

520

  90 533 566

 

31

607

607

Апрель 91 326 353

Февраль

32

326

339

  92 260 281

 

33

723

752

  93 649 702

 

34

598

622

  94 597 646

 

35

653

679

  95 553 599

 

36

590

614

  96 563 609

 

37

610

635

  97 595 644

 

38

522

543

  98 655 709

 

39

523

544

  99 461 499

 

40

510

531

  100 587 635

 

41

470

489

  101 590 639

 

42

525

546

  102 792 857

 

43

524

545

  103 525 568

 

44

519

540

  104 599 648

 

45

531

552

  105 589 638

 

46

530

551

  106 600 649

 

47

530

551

  107 785 850

 

48

396

412

  108 524 567

 

49

594

618

  109 524 567

 

50

714

743

  110 855 925

 

51

398

414

  111 537 581

 

52

461

480

  112 528 572

 

53

465

484

  113 530 574

 

54

602

626

  114 653 707

 

55

399

415

  115 420 455

 

56

593

617

  116 500 541

 

57

593

617

  117 599 648

 

58

407

423

  118 563 609

 

59

517

538

  119 792 857

 

 

 

 

  120 524 567

 

Анализ временных рядов выгрузки угля на станции Мрефт с января по апрель 2010 года

Значениями переменной величины, или уровнями ряда Yt, выступает выгрузка грузов; периодом, или единицей временного интервала t, – сутки; длиной ряда n – количество суток за четыре месяца Yt =120

Предположим, что эмпирическая формула является линейной: Yt = a 0+ a 1 t, тогда параметры a 0, a 1 определяются из системы уравнений:

 

 

Чтобы найти коэффициенты этой системы, проделаем предварительные расчеты, результаты которых сведем в следующую таблицу:

 

Таблица 3.12 –Коэффициенты линейной системы

t

R

t 2

tR

R (t)

e

e2

1

558

1

558

1019

461

212139

2

558

4

1117

1019

461

212161

3

559

9

1676

1019

461

212098

4

559

16

2234

1019

461

212119

5

559

25

2797

1020

460

212013

6

560

36

3357

1020

460

212009

7

559

49

3912

1019

461

212089

8

557

64

4460

1018

461

212259

9

559

81

5030

1019

461

212082

10

560

100

5598

1020

460

211975

11

558

121

6135

1018

461

212221

12

557

144

6683

1018

461

212327

13

557

169

7243

1018

461

212291

14

556

196

7779

1017

461

212472

15

555

225

8320

1016

461

212596

16

555

256

8878

1016

461

212565

17

555

289

9427

1016

461

212611

18

556

324

10009

1017

461

212424

19

557

361

10581

1018

461

212322

20

557

400

11133

1017

461

212354

21

557

441

11699

1018

461

212299

22

557

484

12263

1018

461

212264

23

558

529

12841

1019

461

212155

24

559

576

13409

1019

461

212105

25

560

625

13992

1020

460

211990

26

559

676

14543

1020

460

212028

27

560

729

15112

1020

460

211988

28

561

784

15702

1021

460

211856

29

561

841

16255

1021

460

211889

30

562

900

16848

1022

460

211758

31

562

961

17424

1022

460

211702

32

562

1024

17970

1022

460

211763

33

564

1089

18615

1024

460

211459

34

562

1156

19106

1022

460

211719

35

561

1225

19643

1021

460

211803

36

560

1296

20154

1020

460

211970

37

559

1369

20690

1020

460

212048

38

558

1444

21215

1019

461

212157

39

558

1521

21781

1019

461

212135

40

559

1600

22346

1019

461

212114

41

559

1681

22919

1020

461

212071

42

560

1764

23515

1020

460

211965

43

560

1849

24083

1020

460

211944

44

560

1936

24651

1021

460

211920

45

561

2025

25224

1021

460

211888

46

561

2116

25789

1021

460

211875

47

561

2209

26356




double arrow