Лабораторная работа 3

Использование электронных таблиц Excel для построения выборочных функций распределения [1]

Рассмотренные в лабораторной работе 2 распределения вероятностей СВ опираются на знание закона распределения СВ. Для практических задач такое знание – редкость. Здесь закон распределения обычно неизвестен, или известен с точностью до некоторых неиз­вестных параметров. В частности, невозможно рассчитать точное значение соот­ветствующих вероятностей, так как нельзя определить количество общих и благо­приятных исходов. Поэтому вводится статистическое определение вероятности. По этому определению вероятность равна отношению числа испытаний, в ко­торых событие произошло, к общему числу произведенных испытаний. Такая вероятность называется статистической частотой.

Связь между эмпирической функцией распределения и функцией распределения (теоретической функцией распределения) такая же, как связь между частотой со­бытия и его вероятностью.

Для построения выборочной функции распределения весь диапазон изменения случайной величины X (выборки) разбивают на ряд интервалов (карманов) одинаковой ширины. Число интервалов обычно выбирают не менее 3 и не более 15. Затем определяют число значений случайной величины X, попавших в каждый интервал (абсолютная частота, частота интервалов).

Частота интервалов – число, показывающее сколько раз значения, относящиеся к каждому интервалу группировки, встречаются в выборке. Поделив эти чис­ла на общее количество наблюдений (n), находят относительную частоту (частость) попадания случайной величины X в заданные интервалы.

По найденным относительным час­тотам строят гистограммы выборочных функций распределения. Гистограмма распределения частот – это графическое представление выборки, где по оси абсцисс (ОХ) отложены величины интервалов, а по оси ординат (ОУ) – величины частот, попадающих в данный классовый интервал. При увеличении до бесконечности размера выборки выборочные функции распределения превращаются в теоретические: гистограмма превращается в график плотности распределения.

Накопленная частота интервалов – это число, полученное последовательным суммированием частот в направлении от первого интервала к последнему, до того интервала включительно, для которого определяется накопленная частота.

В Excel для построения выборочных функций распределения используются спе­циальная функция ЧАСТОТА и процедура Гистограмма из пакета анализа.

Функция ЧАСТОТА (массив_данных, двоичный_массив) вычисляет частоты появления случайной величины в интер­валах значений и выводит их как массив цифр, где

массив_данных — это массив или ссылка на множество данных, для которых
вычисляются частоты;

двоичный_массив — это массив интервалов, по ко­торым группируются значения выборки.

Процедура Гистограмма из Пакета анализа выводит результаты выборочного распределения в виде таблицы и графика. Параметры диалогового окна Гистограмма:

Входной диапазон - диапазон исследуемых данных (выборка);

Интервал карманов - диа­пазон ячеек или набор граничных значений, определяющих выбранные интервалы (карманы). Эти значения должны быть введены в воз­растающем порядке. Если диапазон карманов не был введен, то набор интерва­лов, равномерно распределенных между минимальным и максимальным зна­чениями данных, будет создан автоматически.

выходной диапазон предназначен для ввода ссылки на левую верхнюю ячейку выходного диапазона.

• переключатель Интегральный процент позволяет установить режим включения в гистограмму гра­фика интегральных процентов.

• переключатель Вывод графика позволяет установить режим автоматическо­го создания встроенной диаграммы на листе, содержащем выходной диапа­зон.

Пример 1. Построить эмпирическое распределение веса студентов в килограм­мах для следующей выборки: 64, 57, 63, 62, 58, 61, 63, 70, 60, 61, 65, 62, 62, 40, 64, 61, 59, 59, 63, 61.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: