Процедуры обработки данных

 

В базовую систему STATGRAPHICS входят следующие опции:

Меню Describle содержит статистические методы анализа по одной из переменных, процедуры подбора распределений, средства группировки данных.

· Меню Compare включает методы сравнений двух и более выборок данных, процедуры одно- и многофакторного дисперсионного анализа.

· Меню Relate содержит процедуры простого, полиномиального и множественного регрессионного анализа.

Опция Describle содержит следующие команды:

- Анализ одной переменной: суммарная статистика, процент, табуляция частот, график «древо с листьями»,  доверительные интервалы, проверка гипотез, диаграмма рассеивания, график «ящик с усами», гистограмма, ивентильный график, график нормального распределения, график плотности, симметричный график.

- Анализ множества переменных: суммарные статистики, доверительные интервалы, корреляции (ранговые, частные, ковариации, диаграмма рассеивания, «график звезда», график «солнечные лучи»).

- Подбор распределения: встроенные распределения, проверка на нормальность (кси-квадрат, тест Шапиро-Уилиса, для малых выборок), тесты согласия, площади остатков, критические значения, плотности распределения, симметрические графики, график нормального распределения, график распределения Вейбула, частотная гистограмма, функции распределения (плотность, распределение кумуляты, функция выживаемости, логарифм функции выживаемости, функции риска).

- Табулирование: таблица группировки, гистограмм, пороговые диапазоны.

- Кросстабуляция: таблица частот, критерий кси-квадрат, измерение связи, гистограммы, мозаичные отображения (горизонтальные, вертикальные), трехмерная диаграмма.

- Сравнение двух выборок: суммарные статистики, сравнение средних, сравнение стандартных отклонений, сравнение медианы (тест Манна-Уитнея), тест Колмогорова-Смирнова, гистограммы частот, плотности распределений, сравнительные графики «ящик с усами», график квантилей, графики Квантиль-Квентим.

- Сравнение множества выборок: суммарные статистки, таблица дисперсионного анализа, таблица и график средних (стандартные ошибки, доверительные интервалы), наименьшие значимые различия, множественные ранговые тесты, соответствие дисперсий, диаграммы рассеивания, график «ящик с усами», остатки для выборок, остатки для  прогнозов, остатки для наблюдений.

- Однофакторный дисперсионный анализ: суммарные статистки, таблицы дисперсионного анализа, таблицы и графики средних, множественные ранговые тесты, анализ дисперсии, диаграммы рассеивания, график «ящик с усами», анализ остатков.

- Многофакторный дисперсионный анализ, таблицы дисперсионного анализа, таблица средних, множественные ранговые тесты, диаграммы рассеивания, графики средних, графики взаимодействий, анализ остатков.

Опция Relate состоит из следующего набора команд:

- простая регрессия: модели различного вида (линейная, экспоненциальная, обратная Y, обратная Х, дважды обратная, логарифм Х, мультипликативная, квадратный корень Х, квадратный корень Y, S-кривая, логистическая, логарифм вероятности), t-статистики, анализ дисперсии (коэффициент корреляции, коэффициент детерминации, стандартная ошибка оценки), прогнозы, сравнение альтернативных моделей, необычные остатки, точки влияния, график подобранной модели, анализ остатков;

- множественная регрессия: коэффициенты модели, t-статистики, анализ дисперсии, доверительные интервалы, корреляционная матрица, отчеты, точки влияния, компонентные эффекты, анализ остатков.

 

Контрольные вопросы

 

1 Назначение графического пакета «STATGRAPHICS».

2 Что содержит меню Describle?

3 Что содержит меню Compare?

4 Что содержит меню Relate?

5 Что содержит меню Special?

6 Для чего предназначены графические опции программы?

7 Как происходит ввод данных в электронную таблицу?

 

Построение графиков

Одномерные графики

 

Для работы в программе необходимо загрузить исходные данные. Выполняется это тремя способами:

- данные загружаются с помощью команды Open Data File (загрузка данных из файла) при первичной загрузки;

- данные загружаются с помощью команды Open Stat Folio (загрузка данных из созданного проекта) при последующих загрузках;

- пакет поддерживает технологию OLE, что позволяет копировать данные из различных приложений Windows.

После заполнения таблицы для задания имени и сохранения файла данных требуется выполнить команду File/Save Data File As, ввести имя файла и подтвердить запись ОК.

В качестве исходных данных используем замеры диаметров деревьев сосны на высоте 1,3 метра в сосновых насаждениях Среднеобских боров различного возраста (приложение А).

Для построения одномерных графиков используют команду P lot/ Scatterplots/Univariate Plot. В данном случае точки расположены в пространстве. Разброс точек задается относительно горизонтальной оси (рисунок 8).

 

 

Рисунок 8 – Окно построения одномерных графиков Plot/Scatterplots/ Univariate Plot

 

При построении одномерных графиков может использоваться диаграмма – «ящик с усами», который строится с помощью команды Plot/Exploratory Plots/Box-and-Whsker Plot (рисунок 9).

График показывает расположения среднего значения и отклонения точек относительно среднего в пределах ± G.

 

 


Рисунок 9 – Окно диаграммы «ящик с усами» (команда Plot/Exploratory Plots/Box-and-Whsker Plot)


Третий тип диаграмм – гистограммы распределения данных по сформированным классам. Формируются с помощью команды Plot/ Exploratory Plots/Frequency Histogram (рисунок 10).

 

 

Рисунок 10 – Окно построения гистограммы (команда Plot/ Exploratory Plots/Frequency Histogram

 



Двухмерные графики

 

Применяются для изучения связи двух признаков и распределения объектов на плоскости (например, деревьев). Осуществляются построения с помощью команды Plot/Scatterplots/X-Y Plot (рисунок 11).

 

Рисунок 11 – Окно построения двумерных графиков (команда Plot/Scatterplots/X-Y Plot)

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: