Статистические методы обработки опытных данных. Числовые характеристики выборки

Лабораторная работа №1

Цель: Научиться основным методам обработки данных, представленных выборкой. Изучить графические представления данных. Овладеть навыками расчета с помощью ЭВМ основных числовых характеристик выборки.

Основным объектом исследования в эконометрике является выборка. Выборкой объема n называются числа х12….хn получаемые на практике при n – кратком повторении эксперимента в неизменных условиях. На практике выборку чаще всего представляют статистическим рядом. Для этого вся числовая ось, на которой лежат значения выборки, разбивается на k интервалов (это число выбирается произвольно от 5 до 10), которые обычно равны, вычисляются середины интервалов zn и считается число элементов выборки, попадающих в каждый интервал n1. статистическим рядом называется последовательность пар (z1.n1). Рассмотрим решение задачи на ЭВМ и ППП EXCEL на следующей примере.

ПРИМЕР. Дана выборка числа проданных автомобилей торговой фирмой за 25 недель:

14, 18, 16, 21, 12, 19, 27, 19, 15, 20, 27, 29, 22, 28, 19, 17, 18, 24, 23, 22, 19, 20, 23, 21, 19.

Построим статистический ряд, полигон, гистограмму и кумулятивную кривую.

Откроем книгу программы EXCEL. Введем в первый столбец (ячейки А1-А25) исходные данные. Определим область чисел, на какой лежат данные. Для этого найдем максимальный и минимальный элементы выборки.

Введем в В1 «Максимум», а в В2 «Минимум», а в соседних ячейках С1 и С2 определим функции «МАХ» и «МIN», используя «Вставить функцию», категорию Статистические.

Полученный результат (12, 29) укладывается на отрезке [12;30]. Разделим его на девять (выбирается произвольно от 5 до 10) интервалов по 2 единицы каждый: 12-14, 14-16, 16-18, 18-20, 20-22, 22-24, 24-26, 26-28, 28-30.

в ячейке D1-D9 вводим верхние границы интервалов группировки – числа 14, 16, 18, 20, 22, 24, 26, 28, 30. Для вычисления частот n1 используют функцию ЧАСТОТА, находящуюся в категории «Статистические». Вычислите ее в ячейке Е1, используя для «Массив данных» диапазон исходной выборки, а в строке «Двоичный массив» диапазон верхних границ интервалов группировки.

Результат функции является массивом и выводится в ячейках Е1-Е9. Для полного выбора (не только первого числа в Е1) нужно выделить ячейки Е1-Е9, и нажать F2, а далее одновременно CTRL+SHIFT+ENTER. Результат – частоты интервалов 2, 2, 3, 7, 3, 0, 3, 1.

Необходимо построить гистограмму по интервалам значений. Диапазон – значения частот, ось Х – значения верхних границ, сделать подписи осей и самой Гистограммы.

Для создания полигона сделать то же самое, только вместо типа диаграммы «ГИСТОГРАММА», выбрать «ГРАФИК».

Для построения кумулятивной кривой нужно посчитать накопленные частоты. Для этого в ячейку F1 вводим «=Е1», в F2 – вводим «=F1+Е2» и автозаполнением перетаскиваем эту ячейку до F9.

Далее строим график как и в случае полигона, но в строке «ДИАПАЗОН» вводим накопленные частоты, а для оси Х вводим верхние границы интервалов.

Находим основные числовые характеристики выборки. Для их ввода выделяем два столбца, например G и H, в первом вводим название характеристики, во втором – функцию из категории Статистические, как показано в таблице снизу. В качестве массива данных (строка»ЧИСЛО1»), указывать ссылку на А1-А25

Характеристика Функция
Объем выборки СЧЕТ (массив данных)
Выборочное среднее СРЗНАЧ (массив данных)
Дисперсия ДИСП (массив данных)
Стандартное отклонение СТАНДОТКЛОН (массив данных)
Медиана МЕДИАНА (массив данных)
Мода МОДА (массив данных)
Коэффициент эксцесса ЭКСЦЕСС (массив данных)
Коэффициент асимметрии СКОС (массив данных)
Персентиль 40% ПЕРСЕНТИЛЬ (массив данных; 0,4)
Персентиль 80% ПЕРСЕНТИЛЬ (массив данных; 0,8)

Существует другой способ вычисления числовых характеристик выборки. Для этого ставим курсор в свободную ячейку (например, D11). Затем на вкладке Данные вызываем «Анализ данных» (если отсутствует, зайти в кнопку Office в левом верхнем углу рабочего листа, Параметры Excel, Надстройки, выбрать Анализ данный, нажать Перейти и установить нужный компонент). В «Анализ данных» нужно выбрать пункт «Описательная статистика». В появившемся окне в поле «Входной интервал» делаем ссылку на выборку А1-А25. Оставляем группирование «По столбцам» в разделе «Параметры вывода» ставим флажок на «Выходной интервал» и в соседнем поле создаем ссылку на верхнюю левую ячейку области вывода (например D11), ставим флажок напротив «Итоговая статистика», и получаем основные характеристики выборки.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: