Решение системы нелинейных уравнений с двумя неизвестными с помощью средства Поиск решения

Надстройка Поиск решения позволяет находить решение систе­мы нелинейных уравнений с двумя неизвестными:

, (18)

где fi (x,y), i = 1,2 – нелинейная функция от переменных х и у;

Сi, i = 1,2 – произвольная постоянная.

Известно, что пара (х, у) является решением системы уравнении (18) тогда и только тогда, когда она является решением следующего нелинейного уравнения с двумя неизвестными:

. (19)

С другой стороны, решение системы (18) – это точки пересечения двух кривых: f1(x, y) = C1 и f2(х, у) = С2 на плоскости XOY.

Из этого следует метод нахождения корней системы нелинейных уравнений.

1. Определить (хотя бы приближенно) интервал существования решения системы уравнений (18) или уравнения (19). Здесь необходимо учитывать вид уравнений, входящих в систему, область определения каждого их уравнений и т.п. Иногда применяется подбор начального приближения решения.

2. Протабулировать решение уравнения (19) по переменным х и у на выбранном интервале, либо построить графики функций f1(х, у) = С1 и f2(x, y) = C2 (система (18).

3. Локализовать предполагаемые корни системы уравнений – найти несколько минимальных значений из таблицы табули­рования корней уравнения (19), либо определить точки пересе­чения кривых, входящих в систему (18).

4. Найти корни для системы уравнений (18) с помощью надстрой­ки Поиск решения.

Пример 4. Решить следующую систему нелинейных уравнений:

Решение. Решением системы уравнений являются точки пересечения окружности (с радиусом 2 и центром (1, -1) и прямой

у = 0,5-1,25 x.

Данную систему заменим равносильным уравнением:

,

для которого будем искать решения с помощью надстройки Поиск решения.

1. Исходя из графиков уравнений интервал локализации корней определим в границах от -3 до 3 (рис. 28). Ячейки В3:В43 содержат значения Х.

Рис. 28. Графическое решение системы нелинейных уравнений

Формулы для построения графиков:

- в ячейки С3:

= -1+КОРЕНЬ(4-(B3-1)^2;

- в ячейки D3:

= -1-КОРЕНЬ(4-(B3-1)^2);

- в ячейки E3:

= (2-5*B3)/4.

2. Табулируем равносильное уравнение на отрезке [-3; 3] c шагом 0,5 (рис. 29).

Рис. 29. Табулирование функции для нахождения решения

системы уравнений

3. Локализуем корни равносильного уравнения (рис. 30):

Рис. 30. Локализация корней системы уравнений

- ячейки A47:A59 cодержат значения Х на отрезке [-3; 3] с шагом 0,5;

- ячейки В46:N46 содержат значения Y на отрезке [-3; 3] с шагом 0,5;

- формула для ячейки В47 (копируем на диапазон B47:N59):

=(($A47-1)^2+(B$46+1)^2-4)^2+(5*$A47+4*B$46-2)^2;

- формула для ячейки В62 (копируем на диапазон B62:N62):

= МИН(B47:B59)

Исходя из результатов вычислений следующие пары предполагаемых корней уравнения: (-2,5; -2,5), (2; -2), (0; 0,5) и (0;1).

4. Найдем корни равносильного уравнения (рис. 31) – для этого поместим пары значений для предполагаемых корней в ячейки D69:E72. В ячейку G69 введем формулу для равносильного уравнения (копируется на диапазон G69:G72):

Рис. 31. Подготовка листа рабочей книги для нахождения корней нелинейной системы уравнений

Рис. 32. Ввод данных в окно Поиск решения для задачи нахождения корней системы уравнений

С помощью надстройки Поиск решенияокне Параметры поиска решения (рис. 32) флажок Линейная модель должен быть снят) установим необходимые параметры для поиска корня равносильного уравнения (рис. 33), затем вы­полним поиск решения. Процедуру повторим для всех имею­щихся пар корней.

Рис. 33. Окно Параметры поиска решения

Результаты поиска решения (рис. 34) позволяют сделать вывод о том, что система имеет 2 решения: (2,3675745729901; -2,45934248863711) и (-0,123564081639673; 0,654434224216163).

Рис. 34. Результаты поиска решения для нелинейной системы уравнений

5. Балансовые модели

5.1. Экономико-математическая модель межотраслевого баланса (модель Леонтьева)

Рассмотрим наиболее простой вариант модели межотраслевого баланса (ее называют моделью Леонтьева, или моделью «затраты – выпуск»).

Алгебраическая теория анализа модели «затраты – выпуск» сводится к решению системы линейных уравнений, в которых параметрами являются коэффициенты затрат на производство продукции.

Пусть весь производственный сектор народного хозяйства раз­бит на п «чистых» отраслей. «Чистая» отрасль – это условное понятие, некоторая часть народного хозяйства, более или менее цельная (например, энергетика, машиностроение, сельское хозяйствои т.п.).

Пусть Xij объем продукции отрасли i, расходуемый в отрас­ли j; Хi объем производства отрасли i за данный промежуток времени (так называемый валовой выпуск продукции i); Yi – объем потребления продукции отрасли i в непроизводственной сфере (объем конечного потребления); Ζј условно чистая продукция, которая включает в себя оплату труда, чистый доход и амортизацию.

Единицы измерения всех указанных величин могут быть или натуральными (кубометры, тонны, штуки и т.п.), или стоимост­ными. В зависимости от этого различают натуральный и стоимостной межотраслевые балансы. Ниже мы будем рассматривать стоимостной баланс. В таблице 8 представлена принципиальная схема межотраслевого баланса в стоимостном выражении.

Таблица 8

Матрица межотраслевого баланса (в общем виде)

Производящие отрасли Потребляющие отрасли Конечный продукт Валовой продукт
1 2 n
1 Х11 Х12 Х1n Y1 Х1
2 Х21 Х22 Х2n Y2 Х2
n Хn1 Хn2 Хnm Y3 Хn
Условно чистая продукция Z1 Z2 Zn  
Валовой продукт Х1 Х2 Xn  

Рассматривая схему баланса по столбцам, можно заметить, что итог материальных затрат любой потребляющей отрасли и ее ус­ловно чистой продукции равен валовой продукции этой отрасли. Данный вывод можно записать в виде соотношения:

. (20)

Напомним, что величина условно чистой продукции Ζј равна сумме амортизации, оплаты труда и чистого дохода отрасли j. Данноесоотношение охватывает систему из п уравнений, отражаю­щих стоимостный состав продукции всех отраслей материальной сферы.

Рассматривая схему МОБ по строкам для каждой производя­щей отрасли, замечаем, что валовая продукция той или иной отрасли равна сумме материальных затрат потребляющих ее про­дукцию отраслей и конечной продукции данной отрасли:

. (21)

Формула (21) описывает систему из n уравнений, которые называются уравнениями распределения продукции отраслей материального производства по направлениям использования.

Балансовый характер таблицы выражается в том, что

.

Коэффициенты прямых материальных затрат. Основу экономико­-математической модели МОБ составляет технологическая матрица коэффициентов прямых затрат А ij).

Коэффициент прямых материальных затрат аij показывает, сколько необходимо единиц продукции отрасли i для производ­ства единицы продукции отрасли j, если учитывать только прямые затраты:

. (22)

Сделаем два важных предположения, необходимых для дальнейшего рассмотрения модели Леонтьева.

1. Сложившуюся технологию производства считаем неизменной. Таким образом, матрица А = ij) постоянна.

2. Постулируем свойство линейности существующих техно­логий: для выпуска отраслью j любого объема продукции Xj необходимо затратить продукцию отрасли i в количестве aijXj, т.е. материальные издержки пропорциональны объему производи­мой продукции:

xij = aijXj. (23)

Подставляя (23) в балансовое соотношение (21), получаем

, (24)

или в матричной форме

X=AX+Y. (25)

С помощью этой модели можно выполнять три вида плановых расчетов:

– задавая для каждой отрасли величины валовой продукции (Xi), можно определить объемы конечной продукции каждой от­расли (Yi):

Y= (Е - А)Х; (26)

– задавая величины конечной продукции всех отраслей (Yi), можно определить величины валовой продукции каждой отрас­ли (Xi):

Х = - А)-1 Y; (27)

– задавая для ряда отраслей величины валовой продукции, а для всех остальных отраслей – объемы конечной продукции, мож­но найти величины конечной продукции первых отраслей и объемы валовой продукции вторых.

В формулах (26) и (27) символ Е обозначает единичную матри­цу порядка n, а - А)-I – матрицу, обратную к матрице - А).

Если определитель матрицы - А) не равен нулю, т.е. эта матрица невырожденная, то существует обратная к ней матрица. Обозна­чим обратную матрицу через В = - А)- 1, тогда систему уравнений в матричной форме (8) можно записать в виде Х = ВY.

Элементы матрицы В называются коэффициентами полных ма­териальных затрат. Они показывают, сколько всего нужно произвести продукции отрасли i для выпуска в сферу конечного использования единицы продукции отрасли j. Плановые расчеты по модели Леонтьева можно выполнять, если соблюдается усло­вие продуктивности.

Неотрицательную матрицу А будем называть продуктивной, если существует такой неотрицательный вектор Х ≥ 0, что

Х > АХ. (28)

Очевидно, что условие (9) означает существование положи­тельного вектора конечной продукции Y > 0 для модели межот­раслевого баланса (25).

Для того чтобы матрица коэффициентов прямых материаль­ных затрат А была продуктивной, необходимо и достаточно, чтобы выполнялось одно из перечисленных ниже условий:

1) матрица - А) неотрицательно обратима, т.е. существует обратная матрица - А)-1 0;

2) матричный ряд Е + А + А2 + АЗ +... = сходится, причемего сумма равна обратной матрице - A)-1:

В = А) -I = Е + А + А2 + АЗ +...; (29)

3) наибольшее по модулю собственное значение λматрицы А, т.е. решение характеристического уравнения │λ Е–А │= 0 строго меньше единицы;

4) все главные миноры матрицы (Е – А), т.е. определители матриц, образованные элементами первых строк и первых столбцов этой матрицы, порядка от 1 до n положительны.

Более простым способом проверки продуктивности матрицы А является ограничение на величину её нормы, в данном случае на величину наибольшей из сумм элементов матрицы в каждом столбце. Если норма матрицы А строго меньше единицы, то эта матрица продуктивна. Данное условие является достаточным, но не необходимым условием продуктивности, поэтому матрица А может оказаться продуктивной и в случае, когда её норма больше единицы.

Пример 5. Даны коэффициенты прямых затрат аij и конеч­ный продукт Yj для трехотраслевой экономической системы:

Требуется определить:

1) коэффициенты полных затрат;

2) вектор валового выпуска;

3) межотраслевые поставки продукции;

4) проверить продуктивность матрицы А;

5) заполнить схему межотраслевого баланса.

Для решения задачи воспользуемся функциями Excel.

В таблице 9 приведены результаты решения задачи по первым трем пунктам.

1. Вычислим матрицу коэффициентов полных затрат В = (Е – А)-1.

Таблица 9

Решение модели межотраслевого баланса

Для вычисления обратной матрицы необходимо:

•выделить диапазон ячеек для размещения обратной матрицы;

•выбрать функцию МОБР в категории Математические;

•ввести диапазон ячеек, где содержится матрица ЕА;

•нажать клавиши CTRL+SHIFT+ENTER.

В ячейки B6:D8 запишем элементы матрицы Е – А. Массив Е – А задан как диапазон ячеек. Выделим диапазон B10:D12 для размещения обратной матрицы В = (EA)-1 и введем форму­лу для вычислений МОБР (B6:D8). Затем следует нажать клавиши CTRL+SHIFT+ENTER.

Все элементы матрицы коэффициентов полных затрат В не­отрицательны, следовательно, матрица А продуктивна (это ответ на пункты 1 - 3).

2. Вычислим вектор валового выпуска X по формуле X = BY.

Для умножения матриц необходимо:

выделить диапазон ячеек для размещения результата умноже­ния матриц;

выбрать функцию МУМНОЖ в категории Математические;

ввести диапазоны ячеек, где содержатся матрицы В и Y;

нажать клавиши CTRL+SHIFT+ENTER.

В ячейки G10:G12 запишем элементы вектора конечного про­дукта Y. Выделим диапазон В15:В17 для размещения вектора валового выпуска X, вычисляемого по формуле Х= (Е – А)-1 Y. Затем вводим формулу для вычислений МУМНОЖ (B10:D12, G10:G12). Далее следует нажать клавиши CTRL+SHIFT+ENTER.

3. Межотраслевые поставки xij вычисляем по формуле xij = aijXj.

4.Заполняем схему МОБ (табл. 10).

Таблица 10

Схема межотраслевого баланса

Производящие отрасли Потребляющие отрасли Конечный продукт Валовой продукт
1 2 3
1 232,6 51,0 291,8   775,3
2 155,1 255,0 0,0   510,1
3 232,6 51,1 145,9   729,6
Условно чистая продукция 155,0 153,1 291,9    
Валовой продукт 775,3 510,1 729,6    

Найдем условно чистую продукцию Z:

1) рассчитать полученную сумму в потребляющих отраслях;

2) найти разницу между объемом валового продукта потребляющей отрасли и объем потребления в каждой отрасли.

Найдем баланс в общем распределении продукции между производящими и потребляющими отраслями:

1) в балансе конечный продукт должен быть равен условно чистой продукции;

2) валовой продукт в потребляющих отраслях должен быть равен валовой продукции в производящих отраслях.

5.2. Межотраслевые балансовые модели в анализе экономических показателей

К числу важнейших аналитических возможностей данного балансового метода относится определение прямых и полных затрат труда на единицу продукции и разработка на этой основе балансовых продуктово-трудовых моделей. При этом ис­ходной моделью служит отчетный межпродуктовый баланс в нату­ральном выражении. В отдельной строке баланса дается распреде­ление затрат живого труда в производстве всех видов продукции. Предполагается, что трудовые затраты выражены в единицах труда одинаковой степени сложности.

Пусть Lj – затраты живого труда в производстве продукта j, а Хj – объем производства этого продукта (валовой выпуск). Тогда прямые затраты труда на единицу продукции вида j (коэффициент прямой трудоемкости) можно задать следующей формулой:

(1)

Введем понятие полных затрат труда как суммы прямых за­трат живого труда и затрат овеществленного труда, перенесенных на продукт через израсходованные средства производства. Если обозначить величину полных затрат труда на единицу продукции вида j через Tj, то произведения вида aijTi отражают затраты ове­ществленного труда, перенесенного на единицу продукта j через средство производства i. Предположим, что коэффициенты прямых материальных затрат aij выражены в натуральных едини­цах. Тогда полные трудовые затраты на единицу продукции вида j (коэффициент полной трудоемкости) будут равны

(2)

Введем вектор-строку коэффициентов прямой трудоемкости и вектор-строку коэффициентов полной трудоем­кости . Тогда с помощью матрицы коэффициен­тов прямых материальных затрат А (в натуральном выражении) систему (2) можно переписать в матричном виде

. (3)

Произведя очевидные матричные преобразования с ­использованием единичной матрицы Е

,

получим следующее соотношение для вектора коэффициентов полной трудоемкости:

. (4)

Матрица (Е - А) -1 нам уже знакома, это матрица коэффици­ентов полных материальных затрат – В, поэтому равенство (4) можно переписать в виде:

. (5)

Обозначим через L величину совокупных затрат живого труда по всем видам продукции, которая с учетом формулы (1) будет равна

. (6)

Используя соотношения (X>AX), (5) и (6), приходим к следующему равенству:

. (7)

Здесь и векторы-строки коэффициентов прямой и пол­ной трудоемкости, а и векторы-столбцы валовой и конеч­ной продукции соответственно.

Соотношение (7) представляет собой основное балансовое равенство в теории межотраслевого баланса труда. В данном слу­чае его конкретное экономическое содержание заключается в том, что стоимость конечной продукции, оцененной по полным затра­там труда, равна совокупным затратам живого труда. Сопоставляя потребительский эффект различных взаимозаменяемых продуктов с полными трудовыми затратами на их выпуск, можно судить о сравнительной эффективности их производства. Показатели пол­ной трудоемкости выявляют структуру затрат на выпуск различных видов продукции, и, прежде всего, соотношение между затратами живого и овеществленного труда.

На основе коэффициентов прямой и полной трудоемкости могут быть разработаны межотраслевые и межпродуктовые ба­лансы затрат труда и использования трудовых ресурсов. Схемати­чески эти балансы строятся по общему типу матричных моделей, однако все показатели в них (межотраслевые связи, конечный продукт, условно чистая продукция и др.) выражены в трудовых измерителях.

5.3. Модель международной торговли

В модели международной торговли процесс взаим­ных закупок товаров анализируется с использованием понятий собственного числа и собственного вектора матрицы А. Будем по­лагать, что бюджеты п стран, которые мы обозначим, соответственно, x1, х2,..., хп, расходуются на покупку товаров. Обозначим:

хi – национальный доход страны i;

аij доля национального дохода страны j, которую она рас­ходует на закупку товаров страны i;

рi – общая выручка страны от внутренней и внешней тор­говли.

Предположим, что государство расходует весь свой нацио­нальный доход на закупку товаров внутри страны и на импорт из других стран. Это означает, что

Матрица А, элементами которой являются коэффициенты аij, называется структурной матрицей торговли. Сумма элементовкаждого столбца этой матрицы равна единице.

Предположим, что в течение некоторого фиксированного про­межутка времени не меняется структура международной торговли (т.е. структурная матрица торговли остается постоянной), тогда как национальные доходы торгующих стран могут измениться. Тре­буется определить, какими могут быть национальные доходы, чтобы международная торговля осталась сбалансированной, т.е. что­бы сумма платежей всех государств была равна суммарной выручке от внешней и внутренней торговли.

Для любой страны выручка от внутренней и внешней торгов­ли составит

В сбалансированной системе международной торговли не дол­жно быть дефицита, т.е. у каждой страны выручка от торговли должна быть не меньше ее национального дохода:

Последнее неравенство справедливо только в случае, когда т.е. у всех торгующих стран выручка от внешней и внутренней торговли должна совпадать с национальным доходом. В матричной записи это означает, что имеет место равенство: , где А – структурная матрица международной торговли, а Х – вектор национальных доходов.

Вектор Х является собственным вектором структурной матри­цы торговли А, а соответствующее собственное значение равно единице. Отсюда следует, что баланс в международной торговле будет достигнут, если собственное значение структурной матрицы международной торговли равно единице, а вектор национальных доходов торгующих стран является собственным вектором, отве­чающим этому единичному собственному значению.

Пример 6. Требуется найти национальные доходы Х1, Х2, Хз торгующих стран в сбалансированной системе международной торговли. Структурная матрица торговли трех стран имеет вид

.

Решение. Найдем собственный вектор Х, отвечающий собственному зна­чению λ = 1, решив уравнение (А - λ Е) = 0. Система уравнений имеет вид

.

С помощью метода Жордана-Гаусса найдем общее решение этой системы

Из приведенных вычислений следует, что сбалансированность торговли трех стран достигается при векторе национальных доходов Х = (2,25 с; 2,5 с; с), т.е. при соотношении национальных доходов стран 2,25:2,5:1, или 9:10:4.

5.4. Модель Неймана

Модель Неймана является обобщенной моделью Леонтьева, поскольку допускает производство одного продукта разными способами (в модели Леонтьева каждая отрасль производит один продукт и никакая другая отрасль не может производить этот продукт).

В модели представлено п продуктов и т способов их произ­водства, каждый способ j задается вектором-столбцом затрат aj и вектором-столбцом выпусков bj в расчете на единицу интен­сивности процесса

, .

Из векторов затрат и выпуска образуются матрицы затрат и выпуска

А = (a1, a2, …, am), В = (b1, b2,..., bm).

Коэффициенты затрат aij и выпуска bij неотрицательны. Пред­положим, что для реализации любого процесса необходимы затраты хотя бы одного продукта, т.е. для каждого j найдется хотя бы одно i, такое что

aij > 0, (31)

и каждый продукт может быть произведён хотя бы одним способом, т.е. для каждого i существует некоторое j, такое что

bij >0. (32)

Из (31) и (32) следует, что каждый столбец матрицы А и каждая строка матрицы В должны иметь по крайней мере один положительный элемент.

Обозначим через xt неотрицательный вектор-столбец интенсивности производственных процессов

,

а через рt – вектор-строку неотрицательных цен pt = (p 1 (t), p 2 (t),…, pm(t)).

Вектор уt = А xt – это вектор затрат при заданном векторе интенсивности процессов xt, а вектор zt = B xt – вектор выпусков.

Модель Неймана описывает замкнутую экономику в том смысле, что для производства продукции в следующем производственном цикле, т.е. в год (t –1):

А хtВ хt- 1, xt > 0, . (32)

При этом предполагается, что задан первоначальный вектор запасов В х0 ≥ 0, В х0 ≠ 0. Система (32) – это модель Неймана в натуральной форме.

6. Экономические модели и статистические методы

Основы математической статистики

Статистические методы являются составной частью эконометрики – науки, изучающей экономические явления с количественной точки зрения. Эконометрика устанавливает и исследует ко­личественные закономерности в экономике на основе мето­дов теории вероятности и математической статистики, адап­тированных к обработке экономических данных.

Закономерности в экономике выражаются в виде связей и зависимостей экономических показателей, математических моделей их поведения. Такие зависимости и модели могут быть получены только путем обработки реальных статисти­ческих данных, с учетом внутренних механизмов связи и случайных факторов.

Эконометрический анализ дает возможность обосно­вать и уточнить форму зависимостей в рассматриваемых макроэкономических моделях, лучше понять механизмы взаимосвязи макроэкономических показателей. Основным элементом экономического исследования является анализ и построение взаимосвязей экономических переменных. Изуче­ние таких взаимосвязей осложнено тем, что они, особенно ­в макроэкономике, не являются строгими функциональными зависимостями. Во-первых, всегда очень трудно определить все основные факторы, влияющие на данную переменную. Во-вторых, многие такие воздействия носят случайный ха­рактер, т.е. содержат случайную составляющую.

Любое эконометрическое исследование всегда предпо­лагает объединение теории (экономической модели) и прак­тики (статистических данных).

Целью сбора экономических данных является получение информационной базы для принятия решений. Анализ данных и принятие решения проводится на основе какой-либо интуитивной (неявной) или количествен­ной (явной) экономической модели.

Использование инструментов Пакета анализа

В пакете Excel помимо мастера функций имеется набор более мощных инструментов для работы с несколькими выборками и углубленного анализа данных, называемый Пакет анализа, который может быть использован для решения задач статистической обработки выборочных данных.

Для установки раздела Анализ данных в пакете Excel сделайте следующее:

- в меню Сервис выберите команду Надстройки;

- в появившемся списке установите флажок Пакет анализа.

Ввод данных. Исследуемые данные следует представить в виде таблицы, где столбцами являются соответствующие показатели. При создании таблицы Excel формация вводится в отдельные ячейки. Совокупность ячеек, содержащих анализируемые данные, называется входным диапазоном. Необходимо соблюдать последовательность обработки данных. Для использования статистического ­пакета анализа данных следует:

- указать курсором мыши на пункт меню Сервис и щелкнуть левой кнопкой мыши;

- в раскрывающемся списке выбрать команду Анализ данных (если команда Анализ данных отсутствует в меню Сервис, то необходимо установить в Excel пакет анализа данных);

- выбрать необходимую строку в появившемся списке Инструменты анализа;

- ввести входной и выходной диапазоны и выбрать необходимые параметры.

Нахождение основных выборочных характеристик. Для определения характеристик выборки используется процедура Описательная статистика. Процедура позволит получить статистический отчет, содержащий информацию о центральной тенденции и изменчивости входных данных. Для выполнения процедуры необходимо:

- выполнить команду Сервис Анализ данных;

- в появившемся списке Инструменты анализа выбрать строку Описательная статистика и нажать кнопку ОК (рис. 35);

Рис. 35. Окно выбора метода обработки данных

- в появившемся диалоговом окне указать входной диапазон, то есть ввести ссылку на ячейки, содержащие анализируемые данные. Для этого следует навести указатель мыши на левую верхнюю ячейку данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к правой нижней ячейке, содер­жащей анализируемые данные, затем отпустить левую кнопку мыши;

- указать выходной диапазон, то есть ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить переключатель в положение Выходной диапазон (навести указатель мыши и щелкнуть левой кла­вишей), далее навести указатель мыши в поле ввода Выходной диапазон и щелк­нуть левой кнопкой мыши, затем указатель мыши навести на левую верхнюю ячейку выходного диапазона и щелкнуть левой кнопкой мыши;

- в разделе Группировка переключатель установить в положение по столбцам;

- установить флажок в поле Итоговая статистика;

- нажать кнопку ОК.

В результате анализа в указанном выходном диапазоне для каждого столбца дан­ных выводятся следующие статистические характеристики: среднее, стандартная ошибка (среднего), медиана, мода, стандартное отклонение, дисперсия выборки, эксцесс, асимметричность, интервал, минимум, максимум, сумма, счет, наиболь­шее, наименьшее, уровень надежности.

6.1. Проверка статистических гипотез

Помимо описательной статистики важной областью является также аналитиче­ская статистика. Как уже указывалось в разделе «Понятие математической стати­стики», аналитическая статистика, или теория статистических выводов, ориенти­рована на обработку данных, полученных в ходе эксперимента, с целью формули­ровки выводов, имеющих прикладное значение. Здесь решается вопрос, отражают ли наблюдаемые данные объективно существующую реальность. Указанный вопрос решается проверкой соответствующих статистических гипотез. При этом мо­гут выявляться достоверности различий между выборками, взаимосвязи между выборками, влияющие факторы и т.п.

Принятие статистических решений

Статистическая гипотеза – это предположение о виде или отдельных параметрах распределения вероятностей, которое подлежит проверке на имеющихся данных.

Проверка статистических гипотез – это процесс формирования решения о возмож­ности принять или отвергнуть утверждение (гипотезу), основанный на информации, полученной из анализа выборки. Методы проверки гипотез называются критериями.

В большинстве случаев рассматривают так называемую нулевую гипотезу (нуль-гипотезу Н0), состоящую в том, что все события произошли случайно, естествен­ным образом. Альтернативная гипотеза (Н1) состоит в том, что события случай­ным образом произойти не могли, и имело место воздействие некого фактора.

Обычно нулевая гипотеза формулируется таким образом, чтобы на основании эк­сперимента или наблюдений ее можно было отвергнуть с заранее заданной веро­ятностью ошибкиα. Эта заранее заданная вероятность ошибки называется уров­нем значимости.

Уровень значимости – максимальное значение вероятности появления события, при котором событие считается практически невозможным. В статистике наиболь­шее распространение получил уровень значимости, равный α = 0,05. Поэтому если вероятность, с которой интересующее событие может произойти случайным обра­зом р < 0,05, то принято считать это событие маловероятным, и если оно все же произошло, то это не было случайным. В наиболее ответственных случаях, когда требуется особая уверенность в достоверности полученных результатов, надежно­сти выводов, уровень значимости принимают равным α = 0,01 или даже α = 0,001.

Величину Р, равную 1- α, называют доверительной вероятностью (уровнем надежности), то есть вероятностью, признанной достаточной для того, чтобы уве­ренно судить о принятом статистическом решении. Соответственно, в качестве до­верительных вероятностей выбирают значения 0,95, 0,99 и 0,999. Интервал, в котором с заданной доверительной вероятностью Р = 1-α находится оцениваемый параметр, называется доверительным интервалом. В соответствии с доверительными вероятностями на практике используются 95-, 99-, 99,9%-ные доверительные интервалы. Граничные точки доверительного интервала называют доверительными пределами.

Выбор того или иного уровня значимости, выше которого результаты отвергаются как статистически не подтвержденные, или, соответственно, доверительной веро­ятности, в общем случае является произвольным. Окончательное решение зави­сит от исследователя, традиций и накопленного практического опыта в данной области исследований.

Анализ одной выборки

Анализ однородности выборки. Одним из важных вопросов, возникающих при анализе выборки, является вопрос: относится та или иная варианта к данной ста­тистической совокупности? Решение вопроса не представляет сложности, если распределение в этой совокупности является нормальным. Для этого достаточно использовать правило трех сигм. Согласно этому правилу в пределах М ± 3σ на­ходится 99,7% всех вариант. Поэтому если варианта попадает в этот интервал, то она считается принадлежащей к данной совокупности. Если не попадает, то она может быть отброшена. Хотя этот метод и предполагает нормальность исходного распределения, на практике он успешно работает и может быть использован в боль­шинстве других случаев.

При числе элементов в выборке п < 30 способ более точного определения границ доверительного интервала рассчитан по формуле

, (39)

где М – среднее значение;

s – стан­дартное отклонение;

tn,p табличное значение распределения Стьюдента с числом степеней свободы п и доверительной вероятностью р.

Построение доверительных интервалов для среднего. Еще одной важной зада­чей, возникающей при анализе одной выборки, является сравнение выборочного среднего арифметического со средним значением генеральной совокупности. Эта задача решается с помощью статистических критериев. При этом выясняется, зна­чимо ли отличие выборочного среднего значения от среднего значения генераль­ной совокупности, из которой предположительно взята выборка, или наблюдае­мое различие является случайным.

Действительно, средние значения, получаемые по выборочным данным, обычно не совпадают с генеральным средним (математическим ожиданием). В связи с этим возникает вопрос: можно ли по результатам выборочной оценки судить о свой­ствах всей генеральной совокупности?

Поскольку каждую оценку, полученную в отдельной выборке, можно рассматри­вать как случайную величину, то при увеличении числа выборок распределение отдельных оценок будет принимать характер нормального распределения. Это зна­чит, что в случае средних арифметических значения выборочных средних относи­тельно генерального среднего распределяются по нормальному закону, то есть так же как относительные отклонения нормально распределенных вариант от среднего арифметического выборки.

Отсюда, в частности, следует, что 68,3% всех выборочных средних находятся в пре­делах ∆ = М ± т, где ∆ – предельная ошибка выборки, М – среднее выборочное, m – стандартное отклонение среднего значения. Иными словами, имеется вероятность 0,683, что выборочное среднее отличается от генерального не более, чем на ± m. Здесь 0,683 – доверительная вероятность,

1 – 0,683 = 0,317 – уровень значимости α, ∆ = М ± т – 68%-ный доверительный интервал.

Для принятой в большинстве исследований доверительной вероятности 0,95 доверительный интервал для средних при достаточно большом числе наблюдений (n > 30) примерно равен ± 2 т. При доверительной вероятности 0,99, доверительный интервал составит примерно ± 3 т. Дляболее точного определения границ доверительного интервала можно воспользоваться формулой

, (40)

где М – среднее значение;

s – стандартное отклонение;

tn,p табличное значение распределения Стьюдента с числом степеней свободы п и доверительной вероят­ностью p;

п – количество элементов в выборке.

В MS Excel для более точного вычисления границ доверительного интервала и при числе элементов в выборке п < 30 можно воспользоваться функцией ДОВЕРИТ или процедурой Описательная статистика.

Функция ДОВЕРИТ (альфа;станд_откл;размер) определяет полуширину довери­тельного интервала и содержит следующие параметры:

- Альфа – уровень значимости, используемый для вычисления доверительной вероятности. Доверительная вероятность равняется 100*(1 – альфа) % процен­там, или, другими словами, альфа, равное 0,05, означает 95%-ный уровень дове­рительной вероятности;

- Станд_откл – стандартное отклонение генеральной совокупности для интер­вала данных, предполагается известным;

- Размер – это размер выборки.

Пример 1. Найти границы 95%-ного доверительного интервала для среднего значения, если у 25 телефонных аккумуляторов среднее время разряда в режиме ожидания составило 140 часов, а стандартное отклонение — 2,5 часа.

Решение:

1. Откройте новую рабочую таблицу. Установите табличный курсор в ячейку А1.

2. Для определения границ доверительного интервала необходимо на панели ин­струментов Стандартная нажать кнопку Вставка функции (fx). В появившемся диалоговом окне Мастер функций выберите категорию Статистические и функцию ДОВЕРИТ, после чего нажмите кнопку ОК.

Рис. 36. Пример заполнения диалогового окна ДОВЕРИТ

3. В рабочие поля появившегося диалогового окна ДОВЕРИТ с клавиатуры введите условия задачи: Альфа равна 0,05; Станд_откл – 2,5; Размер – 25 (рис. 36). Нажми­те кнопку ОК.

4. В ячейке А1 появится полуширина 95%-ного доверительного интервала для среднего значения выборки – 0,979981. Другими словами, с 95%-ным уровнем надежности можно утверждать, что средняя продолжительность разряда акку­мулятора составляет 140 ± 0,979981 часа, или от 139,02 до 140,98 часа.

Использование инструмента Пакет анализа для выявления различий между выборками

Для анализа двух выборок с помощью t -теста Стьюдента могут быть использова­ны следующие процедуры: Парный двухвыборочный t -тест для средних; Двухвыбороч­ный t -тест с одинаковыми дисперсиями и Двухвыборочный t -тест с различными дисперсиями. В общем случае необходимо воспользоваться процедурой Двухвыборочный t -тест с различными дисперсиями, так как процедуры Парный двухвыборочный t -тест для средних и Двухвыборочный t -тест с одинаковыми дисперсиями относятся к частным, специальным случаям.

Для выполнения процедуры анализа необходимо:

- выполнить команду Сервис Анализ данных;

- в появившемся списке Инструменты анализа выбрать строку Двухвыборочный t-тест с различными дисперсиями, щелкнуть левой кнопкой мыши и нажать кнопку ОК;

- в появившемся диалоговом окне указать Интервал переменной 1, то есть ввести ссылку на первый диапазон анализируемых данных, содержащий один столбец данных. Для этого следует навести указатель мыши на верхнюю ячейку перво­го столбца данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши;

- указать Интервал переменной 2, то есть ввести ссылку на второй диапазон ана­лизируемых данных, содержащий один столбец данных. Для этого следует на­вести указатель мыши в поле ввода Интервал переменной 2 и щелкнуть левой кнопкой мыши, затем навести указатель мыши на верхнюю ячейку второго стол­бца данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши;

- указать выходной диапазон, то есть ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить флажок в левое поле Выходной диапазон (навести указатель мыши и щелкнуть левой кнопкой), далее навести указатель мыши на правое поле ввода Выходной диапазон и щелкнуть левой кнопкой мыши, затем указатель мыши навести на левую верхнюю ячей­ку выходного диапазона и щелкнуть левой кнопкой мыши. Размер выходного диапазона будет определен автоматически, и на экран будет выведено сообще­ние в случае возможного наложения выходного диапазона на исходные дан­ные;

- нажать кнопку ОК.

Результаты анализа. В выходной диапазон будут выведены: средняя, дисперсия и число наблюдений для каждой переменной, гипотетическая разность средних, df (число степеней свободы), значение t -статистики, Р(Т<= t) одностороннее, t кри­тическое одностороннее, Р(Т<= t) двухстороннее, t критическое двухстороннее.

Интерпретация результатов. Если величина вероятности случайного появления анализируемых выборок (P(T<=t) двухстороннее) меньше уровня значимости (α = 0,05), принято считать, что различия между выборками не случайные, то есть различия достоверные.

Пример 7. Рассматривается заработная плата основных групп работников агропромышленной компании: обслуживающего персонала и работников низшего звена.

Можно ли по этим данным сделать вывод о большей зарплате работников низшего звена?

Персонал Работники низшего звена
   
   
   
   
   
   
   
   

Решение. Для решения задач такого типа используются так называемые критерии различия, в частности, t -критерий Стьюдента.

1. Введите данные: для персонала – в диапазон А1:А8; работников ресторана – в диапазон В1:В6.

2. Выбор процедуры осуществляется из трех вариантов t- теста. Поскольку дан­ные не имеют попарного соответствия, число их различно, и говорить о равен­стве дисперсий затруднительно, выберите процедуру Двухвыборочный t-тест с различными дисперсиями.

Для реализации процедуры в пункте меню Сервис выберите строку Анализ дан­ных и далее укажите курсором мыши на строку Двухвыборочный t-тест с различ­ными дисперсиями.

3. В появившемся диалоговом окне задайте Интервал переменной 1. Для этого на­ведите указатель мыши на верхнюю ячейку столбца (А1), нажмите левую кноп­ку мыши и, не отпуская ее, протяните указатель мыши к нижней ячейке (А8), затем отпустите левую кнопку мыши.

4. Аналогично укажите Интервал переменной 2, то есть введите ссылку на диапа­зон второго столбца В1:В6.

5. Далее укажите выходной диапазон. Для этого поставьте переключатель в поло­жение выходной диапазон (наведите указатель мыши и щелкните левой кноп­кой), затем наведите указатель мыши на правое поле ввода выходной диапазон и, щелкнув левой кнопкой мыши, указатель мыши наведите на левую верхнюю ячейку выходного диапазона (С1).Щелкните левой кнопкой мыши и нажмите кнопку ОК.

Результаты анализа. В выходном диапазоне С1:Е13 появятся результаты процеду­ры Двухвыборочный t-тест с различными дисперсиями (рис. 37).

Рис. 37. Исходные данные (А1:В8) и результаты анализа (С1:Е13)

Интерпретация результатов. Средние значения заработной платы (1962 руб. – для персонала и 2400 руб. – для работников низшего звена) довольно сильно отличаются. Тем не менее нулевая гипотеза о том, что разницы между группами нет (то средние выборок равны между собой), отвергнута быть не может. Это следует из того, что вероятность реализации нулевой гипотезы достаточно велика (р = 0,1389, что больше, чем уровень значимости 0,05, то есть р > 0,05) и величина вероятности случайного появления анализируемых выборок (Р(Т<=t) двухстороннее) боль­ше уровня значимости (α = 0,05). А это позволяет говорить, что различия между выборками могут быть случайными, то есть различия недостоверные.

Таким образом, из полученных результатов исследования вытекает, что на осно­вании приведенных данных нельзя сделать вывод о достоверно большей зарплате работников низшего звена.

6.2. Дисперсионный анализ

В случае необходимости оценить достоверность различия между несколькими группами наблюдений (выборками) используют методы дисперсионного анализа.

Дисперсионный анализ предназначен для исследования задачи о действии на из­меряемую случайную величину (отклик) одного или нескольких независимых факторов, имеющих несколько градаций. Причем в однофакторном, двухфактор­ном и т.д. анализе влияющие на результат факторы считаются известными, и речь идет только о выяснении существенности или оценке этого влияния.

Применение дисперсионного анализа возможно, если можно предполагать соот­ветствие выборочных групп генеральным совокупностям с нормальным распреде­лением и независимость распределений наблюдений в группах.

В дальнейшем ограничимся рассмотрением простейшего случая дисперсионного анализа – однофакторного анализа. При этом задача заключается в том, чтобы сравнить дисперсию, обусловленную случайными причинами, с дисперсией, вызываемой наличием исследуемого фактора. Если они значимо различаются, то считают, что фактор оказывает статистически значимое влияние на исследуемую переменную. Значимость различий проверяется по критерию Фишера.

Влияние случайной составляющей характеризуют внутригрупповая дисперсия, а влияние изучаемого фактора – межгрупповая. Внутригрупповая дисперсия рас­считывается по формуле:

(41)

межгрупповая:

(42)

где М – общее среднее:

т – количество групп;

п – количество эле­ментов в группе.

В MS Excel для проведения однофакторного дисперсионного анализа использует­ся процедура Однофакторный дисперсионный анализ.

Для проведения дисперсионного анализа необходимо:

- ввести данные в таблицу, так чтобы в каждом столбце оказались данные, соот­ветствующие одному значению исследуемого фактора, а столбцы располагались в порядке возрастания (убывания) величины исследуемого фактора;

- выполнить команду Сервис → Анализ данных;

- в появившемся диалоговом окне Анализ данных в списке Инструменты анализа выбрать процедуру Однофакторный дисперсионный анализ, указав курсором мыши и щелкнув левой кнопкой мыши. Затем нажать кнопку ОК;

- в появившемся диалоговом окне задать Входной интервал, то есть ввести ссылку на диапазон анализируемых данных, содержащий все столбцы данных. Для этого следует навести указатель мыши на верхнюю левую ячейку диапазона данных нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней правой ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши (рис. 38);

- в разделе Группировка переключатель установить в положение по столбцам

- указать выходной диапазон, то есть ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить переключатель в положение Выходной интервал (навести указатель мыши и щелкнуть левой кноп­кой), далее навести указатель мыши на правое поле ввода Выходной интервал и щелкнуть левой кнопкой мыши, затем указатель мыши навести на левую верх­нюю ячейку выходного диапазона и щелкнуть левой кнопкой мыши. Размер выходного диапазона будет определен автоматически, и на экран будет выведе­но сообщение в случае возможного наложения выходного диапазона на исход­ные данные;

- нажать кнопку ОК.

Рис. 38. Пример заполнения окна Однофакторный дисперсионный анализ

Результаты анализа. Выходной диапазон будет включать в себя результаты дисперсионного анализа: средние, дисперсии, критерий Фишера и другие показатели.

Интерпретация результатов. Влияние исследуемого фактора определяется по величине значимости критерия Фишера, которая находится в таблице Дисперсионный анализ на пересечении строки Между группами и столбца Р-Значение. В случаях, когда Р-Значение < 0,05, критерий Фишера значим и влияние исследуемого фактора можно считать доказанным.

Кроме рассмотренной процедуры однофакторного дисперсионного анализа, для проведения двухфакторного дисперсионного анализа в пакете анализа реализованы процедуры Двухфакторный дисперсионный анализ с повторениями и Двухфакторный дисперсионный анализ без повторений.

6.3. Корреляционный анализ

Корреляционный анализ слу­жит для выявления взаимосвязей между выборками.

Коэффициент корреляции

Знание взаимозависимостей отдельных признаков дает возмож­ность решать одну из кардинальных задач любого научного исследования: возмож­ность предвидеть, прогнозировать развитие ситуации при изменении конкретных характеристик объекта исследования. Например, основное содержание любой эко­номической политики в конечном счете может быть сведено к регулированию эко­номических переменных, осуществляемому на базе выявленной тем или иным обра­зом информации об их взаимовлиянии. Поэтому проблема изучения взаимосвязей показателей различного рода является одной из важнейших в статистическом ана­лизе.

Обычно взаимосвязь между выборками носит не функциональный, а вероятност­ный (или стохастический) характер. В этом случае нет строгой однозначной зави­симости между величинами. При изучении стохастических зависимостей разли­чают корреляцию и регрессию.

Регрессионный анализ устанавливает фор­мы зависимости между случайной величиной Y и значениями одной или несколь­ких переменных величин.

Корреляционный анализ состоит в определении степени связи между двумя слу­чайными величинами Х и Y. В качестве меры такой связи используется коэффи­циент корреляции. Коэффициент корреляции оценивается по выборке объема n связанных пар наблюдений (xi, yi) из совместной генеральной совокупности Х и Y.

Существует несколько типов коэффициентов корреляции, применение которых зависит от предположений о совместном распределении величин Х и Y.

Для оценки степени взаимосвязи наибольшее распространение получил коэффи­циент линейной корреляции (Пирсона), предполагающий нормальный закон рас­пределения наблюдений.

Коэффициент корреляции (R, r) – параметр, характеризующий степень линей­ной взаимосвязи между двумя выборками. Коэффициент корреляции изменяется от -1 (строгая обратная линейная зависимость) до 1 (строгая прямая пропорцио­нальная зависимость). При значении 0 линейной зависимости между двумя вы­борками нет. Здесь под прямой зависимостью понимают ту, при кото­рой увеличение или уменьшение значения одного признака ведет, соответственно, к увеличению или уменьшению второго. Например, при увеличении температуры возрастает давление газа, а при уменьшении – снижается (при постоянном объе­ме). При обратной зависимости увеличение одного признака приводит к умень­шению второго и наоборот. Примером обратной корреляционной зависимости может служить связь между температурой воздуха на улице и количеством топли­ва, расходуемого на обогрев помещения.

На практике коэффициент корреляции принимает некоторые промежуточные зна­чения между 1 и -1. Для оценки степени взаимосвязи можно руковод­ствоваться следующими эмпирическими правилами. Если коэффициент корреля­ции (r) по абсолютной величине (без учета знака) больше, чем 0,95, то принято считать, что между параметрами существует практически линейная зависимость (прямая – при положительном r и обратная – при отрицательном r). Если коэф­фициент корреляции | r | лежит в диапазоне от 0,8 до 0,95, говорят о сильной степе­ни линейной связи между параметрами. Если 0,6 < | r | < 0,8, говорят о наличии ли­нейной связи между параметрами. При | r | < 0,4 обычно считают, что линейную взаимосвязь между параметрами выявить не удалось.

В MS Excel для вычисления парных коэффициентов линейной корреляции исполь­зуется специальная функция КОРРЕЛ. Параметры функции КОРРЕЛ (масcuв 1; мaccuв 2), где: массив 1 – это диапазон ячеек первой случайной величины; массив 2 – это второй интервал ячеек со значениями второй случайной величины.

Пример 8. Имеются результаты семимесячных наблюдений реализации минеральных удобрений вида А и вида В.

Месяц Вид удобрения А Вид удобрения В
     
     
     
     
     
     
     

Необходимо определить, имеется ли взаимосвязь между количеством продаж удобрений обоих видов.

Решение. Для выявления степени взаимосвязи прежде всего необходимо ввести данные в рабочую таблицу. Откройте новую рабочую таблицу. Введите в ячейку А1 слова Вид удобрения А. Затем в ячейки А2:А8 – соответствующие значения числа продаж.

В ячейки В1:В8 введите название и значения для Вид удобрения В. Затем вычисляется значение коэффициента корреляции между выборками. Для этого табличный курсор установите в свободную ячейку (А9). На панели инструментов нажмите кнопку Вставка функции (fx). В появившемся диалоговом окне Мастер функций выберите категорию Статистические и функцию КОРРЕЛ, после чего нажмите кнопку ОК. Появившееся диалоговое окно КОРРЕЛ з


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: