Признаки | Гграницы интервалов вариации признака | Количество значений признака х;, находящихся в диапазоне | ||
- σn <Хi< + σn | -2 σn <Хi< +2 σn | -3σn <Хi< + 3σn | ||
Первый признак | ||||
Второй признак |
По значениям показателей и σ можно определить границы интервалов вариации признака, т.е. установить, какая доля единиц совокупности попадает в тот или иной интервал отклонений значений признака от .
Согласно вероятностной теореме П.Л.Чебышева следует ожидать, что независимо от формы распределения 75% значений признака будут находиться в интервале ±2σ, а 89% значений - в интервале ±3σ.
В нормально распределенных и близких к ним рядах вероятностные оценки границ интервалов таковы:
68,3% значений признака войдет в интервал ± σ,
95,4% значений признака попадет в интервал ±2σ, (1)
99,7% значений признака появится в интервале ± Зσ.
Соотношение (1) известно, как правило «трех сигм».
Для выборочной совокупности значения и σ п рассчитаны и являются точными, поэтому, основываясь на правиле «трех сигм», можно точно оценить границы всех трех вероятностных интервалов отклонений значений признака от средней.
Ожидаемые границы вариации выборки для признака «Среднегодовая стоимость основных производственных фондов» соответствуют:
±σ с вероятностью Р=68,3%, т. е. ±253,969;
±2σ с вероятностью Р=95,4%, т. е. ±507,938;
±3σ с вероятностью Р=99,7%, т. е. ±761,907.
Ожидаемые границы вариации выборки для признака «Выпуск продукции» соответствуют:
±σ с вероятностью Р=68,3%, т. е. ±302,963;
±2σ с вероятностью Р=95,4%, т. е. ±605,926;
±3σ с вероятностью Р=99,7%, т. е. ±908,889.
Для генеральной совокупности точно известна только величина σN, a величина рассчитывается, поэтому прогнозные оценки попадания значений признака в тот или иной интервал является прогнозным и обычно задается в форме (1) с учетом известного значения σ N.
Ожидаемые границы вариации генеральной совокупности для признака «Среднегодовая стоимость основных производственных фондов» соответствуют:
±σ с вероятностью Р=68,3%, т. е. ±253,969;
±2σ с вероятностью Р=95,4%, т. е. ±507,938;
±3σ с вероятностью Р=99,7%, т. е. ±761,907.
Ожидаемые границы вариации генеральной совокупности для признака «Выпуск продукции» соответствуют:
±σ с вероятностью Р=68,3%, т. е. ±302,963;
±2σ с вероятностью Р=95,4%, т. е. ±605,926;
±3σ с вероятностью Р=99,7%, т. е. ±908,889.
Учитывая правило «трех сигм», в статистической практике величину Зσ считают в условиях нормального и близких к нему распределений максимально допустимой ошибкой наблюдения и отбрасывают результаты наблюдений для которых
|хi-х| > 3σ (2)
Для нормального распределения справедливо равенство
R=6σ (3)
Задача 4
Важная функция обобщающих показателей вариации , σ2, σ, - оценка надежности (типичности) средней величины.
Для «Среднегодовая стоимость основных производственных фондов» значения показателей = 200,9, σ2 = 62350,05, σ = 253,969, = 17,103 невелики, индивидуальные значения признака ряда мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, среднее арифметическая величина является надежной характеристикой данной совокупности.
Для «Выпуск продукции» значения показателей = 229,46, σ2 = 88726,87, σ =302,963, = 21,749 невелики, индивидуальные значения признака ряда мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, среднее арифметическая величина является надежной характеристикой данной совокупности.
Задача 5
Возможность отнесения кривой распределения эмпирических данных к типу кривых нормального распределения устанавливается путем анализа формы гистограммы вариационного ряда распределения с учетом оценок показателей особенностей формы распределения (рис.2).
При анализе формы гистограммы прежде всего следует оценить распределение вариантов значений признака по интервалам (группам). Гистограмма имеет одновершинную форму, поэтому можно считать выборку однородной по данному признаку.
Установив однородность совокупности, для дальнейшего анализа формы распределения используются описательные параметры выборки. Анализируются параметры и σ п, выступающие в качестве статистических оценок соответствующих параметров нормального распределения - математического ожидания М[ ] и стандартного отклонения σ n генеральной совокупности.
Распределение приблизительно симметрично, так как параметры , Mo, Me отличаются незначительно:
= 1460 Mo= 1512,5 Me= 1475,75
Графический анализ показывает, что гистограмма приблизительно симметрична, ее «хвосты» не очень длинны, что позволяет судить о близости эмпирического распределения нормальному закону распределения.
Результаты визуального анализа не противоречат значениям полученных коэффициентов эксцесса и асимметрии, которые приведены в таблице:
Коэффициент | Значение коэффициента | Анализ значения коэффициента |
Эксцесса | -0,345 | Распределение пологое |
Асимметрии | -0,153 | Асимметрия низкая |
Следовательно, можно сделать заключение о близости изучаемого распределения к нормальному.
II. Статистический анализ генеральной совокупности
Задача 1
Генеральные показатели , , As, Ek рассчитаны с помощью инструмента Описательная статистика и их значение представлены в табл.3. Для этих показателей сформирована отдельная таблица 10.
Таблица 10
«Описательные статистики генеральной совокупности».
Наименование показателя | Среднегодовая стоимость основных производственных фондов, млн.руб." | "Выпуск продукции, млн. руб." | |
Асимметричность | -0.153 | 0,043 | |
Эксцесс | -0.345 | -0.205 | |
Дисперсия выборки | 64500,052 | 91786,420 | |
Стандартное отклонение | σn | 253,969 | 302,963 |
Дисперсия | σ2n \ | 62350,05 | 88726,873 |
Коэффициент асимметрии | Asn | -0,210 | 0,015 |
Установить степень расхождения между σ2n и , можно по формуле:
= σ2n
Для «Среднегодовой стоимости основных производственных фондов»
64500,052 =(30/29)* 62350,05
64500,052=64500,052
Для «Выпуск продукции» значения показателей
91786,420= (30/29)* 88726,873
91786,420=91786,420
Равенство выполняется.
Ожидаемый размах вариации признаков RN:
- для первого признака RN =1050,
- для второго признака RN =1260
Соотношениемежду генеральной и выборочной дисперсиями:
- для первого признака 1,03 т.е. расхождение между дисперсиями незначительное;
-д ля второго признака 1,03 т.е. расхождение между дисперсиями незначительное.
Задача 2
Значения предельных ошибок выборки имеются в табл.3, табл.4а и табл.4б. На основе этих данных сформирована таблица 11.
Таблица 11
Предельные ошибки выборки и ожидаемые границы для генеральных средних
Доверительная вероятность Р | Коэффициент доверия t | Предельные ошибки выборки | Ожидаемые границы для средних | ||
Для первого признака | Для второго признака | Для первого признака | Для второго признака | ||
0,683 | 1 | 47,212 | 56,320 | 1412,788 ≤ ≤ 1507,212 | 1313,230 ≤ ≤ 1425,870 |
0,954 | 2 | 96,669 | 115,318 | 1363,331 ≤ ≤ 1556,669 | 1254,232 ≤ ≤ 1484,868 |
0,997 | 3 | 150,205 | 179,182 | 1309,795 ≤ ≤ 1610,205 | 1190,368 ≤ ≤ 1548,732 |
Учитывая близость уровней надежности 95,4% и 99,7% и значительное расхождение соответствующих им диапазонов попадания средних .
Применения в экономических исследованиях уровня надежности 99,7% не целесообразно.
Задача 4
Значения коэффициентов асимметрии As и эксцесса Ек представлены в таблице 12.
| As | 0,25 - асимметрия незначительная;
0,25<| As | 0,5 - асимметрия заметная (умеренная);
| As |>0,5 - асимметрия существенная.
Таблица 12
«Среднегодовая стоимость основных фондов» | ||
Коэффициент | Значение коэффициента | Анализ значения коэффициента |
Эксцесса | -0,345 | Распределение пологое |
Асимметрия | -0,153 | Асимметрия низкая |
«Выпуск продукции» | ||
Коэффициент | Значение коэффициента | Анализ значения коэффициента |
Эксцесса | -0,205 | Распределение пологое |
Асимметрия | 0,0429 | Асимметрия низкая |
В данной лабораторной работе был проведен расчет статистических показателей. После группирования исходных данных по признаку «Среднегодовая стоимость основных производственных фондов» был получен ряд распределения, на основе чего была построена гистограмма.
В результате проведенного графического анализа было установлено, что полученное эмпирическое распределение близко к нормальному закону распределения. Это предположение получило подтверждение после расчета показателей коэффициента асимметрии (As) и коэффициента эксцесса (Ек).
Рассчитанное значение коэффициента As свидетельствует о том, что асимметрия распределения является незначительной, а полученное значение коэффициента Ек говорит о том, что данное распределение по сравнению с кривой нормального распределения является пологим, т. е. значения признака рассеянны от xmin до хmaх.