Этот инструмент в отличие от соответствующих функций не просто определяет ранги и персентили, а сортирует их в порядке уменьшения значения. Он может производить эту операцию не для одной характеристики (например, одного размера), а нескольких, сгруппированных по столбцам или по строкам (рис. 2.10).
Рис. 2.10. Инструмент анализа данных «Ранг и персентиль»
Инструмент выводит значения рангов и персентилей на тот же рабочий лист (необходимо указать ячейку, откуда начнётся вывод), новый рабочий лист или новую рабочую книгу. (Необходимо установить переключатель в положение «по столбцам» или «по строкам» в зависимости от расположения данных во входном диапазоне.)
2.4 Представление эмпирических и теоретических распределений в программе MS EXCEL
Функция ЧАСТОТА (рис. 2.11) используется для подсчета количества значений случайной величины (частот), попадающих в заданные интервалы («карманы»).
Рис. 2.11. Аргументы функцииЧАСТОТА
Последовательность действий должна быть следующей.
|
|
1. В таблице строится массив границ интервалов, который в аргументах функцииЧАСТОТА, см. рис. 2.11, обычно представлен как «массив интервалов» (а в ряде версий MS EXCEL - как «Двоичный массив»). Для правильного выбора массива границ интервалов нужно первоначально оценить оптимальное количество интервалов m, например по формуле (1.1), и длину интервала: L = (xmax - xmin)/m, округлив L в бόльшую сторону.
2. Выделяется массив ячеек, куда в результате будут введены значения частот (на единицу больше числа заданных границ интервалов). Это объясняется тем, что первый и последний интервалы (в порядке увеличения значений их границ) строго ограничены лишь с одной стороны, а со второй - соответственно -∞ и +∞.
3. Открывается функцияЧАСТОТА.
4. В открытое окно аргументов функциивводятся массив данных и массив границ интервалов. При этом значения частот уже появляются в окне.
5. Для выведения значений частот в таблицу (в выделенный по п. 2 массив ячеек) необходимо одновременно нажать комбинацию клавиш CTRL+SHIFT+ENTER.
Таким образом, с помощью функцииЧАСТОТА можно сформировать интервальный статистический ряд, который будет состоять из двух строк. В первой строке определены границы интервалов, причём первый и последний интервалы ограничены с одной стороны. Во второй строке должны быть расположены значения частот, попавших в заданные интервалы.
Функция МОДА (рис. 2.12) родственна функции ЧАСТОТА, но определяет не эмпирическую плотность, а наиболее часто повторяющееся значение в каждом из массивов или аргументов, число которых («Число1, число2,...»), может быть не более 30. Поэтому если множество данных не содержит одинаковых значений, то функция МОДА показывает ошибку.
|
|
Рис. 2.12. Аргументы функцииМОДА
Инструмент анализа «Гистограмма» близок по решаемым задачам к функции «ЧАСТОТА», но имеет значительно более широкие возможности. В нём поле «Входной интервал» (рис. 2.13) соответствует полю «Массив данных» в функции «ЧАСТОТА», а поле «Интервал карманов» соответствует полю «Массив интервалов» в функции «ЧАСТОТА». Но в отличие от функции «ЧАСТОТА» поле «Интервал карманов» не обязательно для заполнения. При заполнении эти значения должны быть введены в возрастающем порядке. В Microsoft EXCEL вычисляется число (частота) «попаданий» данных между текущим началом отрезка и соседним бóльшим по порядку, если такой есть. При этом включаются значения на нижней границе отрезка и не включаются значения на верхней границе. Если «Интервал карманов» не был введен, то набор отрезков, равномерно распределенных между минимальным и максимальным значениями данных, будет создан автоматически. Может потребоваться, чтобы интервалы располагались не в возрастающем порядке, как обычно, а в порядке убывания частоты. Получаемый график в этом случае будет напоминать по форме известную диаграмму Парето [17]. Для этого следует поставить «галочку» в окне «Парето (отсортированная диаграмма)» (см. рис. 2.13).
Рис. 2.13. Инструмент анализа данных «Гистограмма»
Иногда необходимо знать не только распределение частот, но и накопленный процент частот (интегральную функцию дискретного распределения) из расчёта, что сумма всех частот = 100 %. Для вывода этого дополнительного графика интегральных процентов следует установить флажок не только в окне «Вывод графика», но и в окне «Интегральный процент» (см. рис. 2.13). В результате в дополнение к синим столбцам плотности распределения «Частота» появится график лилового цвета «Интегральный %». (Следует знать, что график «Интегральный %» появляется только при выводе основного графика «Частота»).
Гистограммы различного вида уже не в виде частот, а либо просто как раскладки значений по категориям и рядам данных, либо как накопленный абсолютный или относительный вклад каждой категории в общую сумму, могут быть получены также в рамках графических опций программыMS EXCEL. Кроме того, эти опции позволяют преобразовать не только форму получаемой гистограммы (ширину зазора между столбцами частот, формат осей, подписи данных, и т.д.), но и сам тип диаграммы, представляющей «Частоту» и «Интегральный %».
Выбор направления расчёта (интегральной функции или плотности распределения) в статистических функциях
В окне многих статистических функций распределения случайной величины, определяемых программой MS EXCEL, см. § 4.4, присутствует аргумент «Интегральная» (рис. 2.14).
Рис. 2.14 Аргумент «Интегральная»
Здесь «Интегральная» - логическое значение, определяющее «направление» расчёта; если этот аргумент имеет значение ЛОЖЬ (нуль), то определяется функция плотности распределения f; если этот аргумент имеет значение ИСТИНА (любое другое число), то определяется интегральная функция F.