Статистический анализ данных

Решение задач прикладной информатики в менеджменте.

Цель работы:

1. Освоение приемов работы с функциями массивов (табличными функциями).

2. Изучение элементарных статистических функций Excel

· Формулы массивов (табличные формулы)

Массивом называют блок ячеек электронной таблицы, который используется для создания формул, возвращающих некоторое множество результатов или оперирующих множеством значений, а не отдельными значениями.

Формулы массивов (иногда их называют табличными формулами), используют несколько множеств значений (массивов аргументов), и возвращают одно или несколько значений. Такие формулы позволяют обращаться с блоками, как с обычной ячейкой.

Рассмотрим работу с использованием массивов на следующем примере. Требуется определить прибыль для каждого, представленного в таблице 1.1 года деятельности предприятия.

Таблица 1‑1. Пример использования функция массива.

A	B	C	D
Год	Приход	Расход	Прибыль
			{B2:B5-C2:C5}.
			{B2:B5-C2:C5}.
			{B2:B5-C2:C5}.
			{B2:B5-C2:C5}.

Выделим блок D2:D5, активная ячейка при этом D2. Начнем ввод формулы – наберем знак =. Выделим блок B2:B5, наберем знак минус -, выделим блок С2:С5. Ввод формул массива заканчивается комбинацией клавиш Ctrl+Shift+Enter. После нажатия такой комбинации во всех ячейках блока D2:D5 появится формула {B2:B5-C2:C5}.

Основные правила работы с формулами массива:

- перед вводом формулы нужно выделить ячейку или диапазон для результатов, если формула возвращает несколько значений, то диапазон результатов должен быть того же размера, что и диапазон исходных данных;

- фигурные скобки, отмечающие формулу массива, вводятся при завершении ввода формулы клавишами Ctrl+Shift+Enter, если фигурные скобки ввести вручную, такой ввод будет воспринят Excel как текст.

- для редактирования формулы массива необходимо выделить блок, активировать строку формул, внести изменения и завершить редактированием клавишами Ctrl+Shift+Enter;

- блок ячеек может указываться присвоенным ему именем (клавиша F3 и выбор имени в диалоге «Вставка имени»;

- массив исходных данных и массив результатов могут быть многомерными, т.е. включать несколько строк и столбцов.

· Функции Excel, используемые для статистического анализа

Статистический анализ данных необходим для оценки деятельности турфирмы и прогноза ее работы на какой-то срок. Такой анализ основывается на сборе информации, определении по представленным массивам данных оценок, статистических показателей и тенденций развития фирмы.

В категорию статистических функций Excel входит около 80 функций, кроме того, значительное число функций статистического анализа входят в надстройку «Пакет анализа».

Для выполнения задания потребуются статистические функции, полное описание которых приведено ниже.

· МАКС(число1;число2;...) - возвращает наибольшее значение из набора значений.
Число1, число2,...— от 1 до 30 чисел, среди которых требуется найти наибольшее.
Можно задавать аргументы, которые являются числами, пустыми ячейками, логическими значениями или текстовыми представлениями чисел. Аргументы, которые являются значениями ошибки или текстами, не преобразуемыми в числа, вызывают значения ошибок.
Если аргумент является массивом или ссылкой, то в нем учитываются только числа. Пустые ячейки, логические значения или текст в массиве или ссылке игнорируются. Если логические значения или текст не должны игнорироваться, следует использовать функцию МАКСА. Если аргументы не содержат чисел, то функция МАКС возвращает 0 (ноль);

· МИН(число1;число2;...) - возвращает наименьшее значение из набора значений, в остальном полностью аналогична функции МАКС;

· СРЗНАЧ(число1; число2;...) - возвращает среднее (арифметическое) своих аргументов.
Число1, число2,... — это от 1 до 30 аргументов, для которых вычисляется среднее.
Аргументы должны быть либо числами, либо именами, массивами или ссылками, содержащими числа.
Если аргумент, который является массивом или ссылкой, содержит тексты, логические значения или пустые ячейки, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются ;

· ТЕНДЕНЦИЯ (известные_значения_y; известные_значения_x; новые значения_x; конст) - возвращает значения в соответствии с линейным трендом, т.е. аппроксимирует прямой линией (по методу наименьших квадратов) массивы ”звестные_значения_y” и “ известные_значения_x”. Возвращает значения y, в соответствии с этой прямой для заданного массива новые_значения_x.
Известные_значения_y — множество значений y, которые уже известны для соотношения y = mx + b.
Если массив известные_значения_y имеет один столбец, то каждый столбец массива известные_значения_x интерпретируется как отдельная переменная.
Если массив известные_значения_y имеет одну строку, то каждая строка массива известные_значения_x интерпретируется как отдельная переменная.
Известные_значения_x — необязательное множество значений x, которые уже известны для соотношения y = mx + b.
Массив известные_значения_x может содержать одно или несколько множеств переменных. Если используется только одна переменная, то известные_значения_y и известные_значения_x могут иметь любую форму, при условии, что они имеют одинаковую размерность.
Если используется более одной переменной, то известные_значения_y должны быть вектором (то есть интервалом высотой в одну строку или шириной в один столбец).
Если известные_значения_x опущены, то предполагается, что это массив {1;2;3;...} такого же размера, как и известные_значения_y.
Новые_значения_x — новые значения x, для которых ТЕНДЕНЦИЯ возвращает соответствующие значения y. Новые_значения_x должны содержать столбец (или строку) для каждой независимой переменной, как и известные_значения_x. Таким образом, если известные_значения_y — это один столбец, то известные_значения_x и новые_значения_x должны иметь такое же количество столбцов. Если известные_значения_y — это одна строка, то известные_значения_x и новые_значения_x должны иметь такое же количество строк.
Если новые_значения_x опущены, то предполагается, что они совпадают с известные_значения_x.
Если опущены оба массива известные_значения_x и новые_значения_x, то предполагается, что это массив {1;2;3;...} такого же размера, что и известные_значения_y.
Конст — логическое значение, которое указывает, требуется ли, чтобы константа b была равна 0.
Если конст имеет значение ИСТИНА или опущено, то b вычисляется обычным образом.
Если конст имеет значение ЛОЖЬ, то b полагается равным 0, и значения m подбираются таким образом, чтобы выполнялось соотношение y = mx.

· РОСТ (известные_значения_y;известные_значения_x;новые_значения_x; конст) - возвращает значения y для последовательности новых значений x, задаваемых с помощью существующих x - и y -значений, т.е. функция рассчитывает прогнозируемый экспоненциальный рост на основании имеющихся данных.

Известные_значения_y — это множество значений y, которые уже известны в соотношении y = b*m^x. Если массив известные_значения_y имеет один столбец, то каждый столбец массива известные_значения_x интерпретируется как отдельная переменная. Если массив известные_значения_y имеет одну строку, то каждая строка массива известные_значения_x интерпретируется как отдельная переменная.

Известные_значения_x — это необязательное множество значений x, которые уже известны для соотношения y = b*m^x. Если массив известные_значения_y имеет один столбец, то каждый столбец массива известные_значения_x интерпретируется как отдельная переменная. Массив известные_значения_x может содержать одно или несколько множеств переменных. Если используется только одна переменная, то известные_значения_y и известные_значения_x могут иметь любую форму, при условии, что они имеют одинаковую размерность. Если используется более одной переменной, то известные_значения_y должны быть вектором (то есть интервалом высотой в одну строку или шириной в один столбец). Если известные_значения_x опущены, то предполагается, что это массив {1;2;3;...} такого же размера, как и известные_значения_y.
Новые_значения_x — это новые значения x, для которых РОСТ возвращает соответствующие значения y. Новые_значения_x должны содержать столбец (или строку) для каждой независимой переменной, как и известные_значения_x. Таким образом, если известные_значения_y — это один столбец, то известные_значения_x и новые_значения_x должны иметь такое же количество столбцов. Если известные_значения_y — это одна строка, то известные_значения_x и новые_значения_x должны иметь такое же количество строк. Если аргумент новые_значения_x опущен, то предполагается, что он совпадает с аргументом известные_значения_x. Если оба аргумента известные_значения_x и новые_значения_x опущены, то предполагается, что это массив {1;2;3;...} такого же размера, как и известные_значения_y.

Конст — это логическое значение, которое указывает, требуется ли, чтобы константа b была равна 1. Если конст имеет значение ИСТИНА или опущено, то b вычисляется обычным образом. Если конст имеет значение ЛОЖЬ, то b полагается равным 1, а значения m подбираются так, чтобы y = m^x.

Замечания. 1) Формулы, которые возвращают массивы, должны быть введены как формулы массива.

2) При вводе константы массива для аргумента, такого как известные_значения_x, следует использовать точку с запятой для разделения значений в одной строке и двоеточие для разделения строк.

₊

· Задание

Для приведенных в таблице 1-2 данных о реализации туристической фирмой туров [1] вычислить:

- минимальные, максимальные и среднее показатели по каждому кварталу;

- средние показатели по каждому туру;

- вычислить средний доход по всей фирме за отчетный период;

- дать оценку каждому туру: «хорошо», если доход от тура превышает средний по фирме, и «плохо», если доход от тура меньше среднего по фирме;

- построить линейную и экспоненциальную модель деятельности фирмы и дать прогноз для двух следующих кварталов;

- оценить относительные отклонения для среднего значения и «Тенденции», для среднего значения и «Роста».

Таблица 1‑2. Исходные данные и представление результатов.

A	B	C	D	E	F	G
Тур	1 кв.	2 кв.	3 кв.	4 кв.	Ср.по туру	Оценка
Швеция
Дания
Норвегия
Финляндия
Германия
Польша
Чехия
Словакия
Венгрия
Болгария
Мин
Мах
Среднее

Тенденция по средн.
Рост по средн.
Погрешность тенденции
Погрешность роста

Экономическое развитие Германии в XIX – начале XX века

Либерализм и консерватизм в политике Александра I

Требования к складским помещениям и хранению пищевых продуктов

Ассортимент полуфабрикатов из птицы и их кулинарное использование

Культура Древней Руси 9-12 вв. Значение принятия Русью православия в формировании культуры и ментальности русского народа

Определение конфигурации сердца, размеров поперечника сердца и сосудистого пучка

Самый сильный аргумент, почему эволюция человека не могла быть