Вайс А.А., Воробьева И.А.
ОСНОВЫ АНАЛИЗА ДАННЫХ
В ПРОГРАММЕ «STATGRAPHICS»
лабораторный практикум по изучению курса
для студентов бакалавриата направлений 35.03.01 «Лесное дело» профиля подготовки «Лесовосстановление и лесопользование», «Лесовосстановление, лесоводство и лесоустройство», «Лесное хозяйство», 35.03.10 «Ландшафтная архитектура» профиля подготовки «Ландшафтное строительство», 20.03.02 «Природообустройство и водопользование» профиля подготовки «Природоохранное обустройство территорий»; магистрантов направлений 35.04.01 «Лесное дело» профилей «Лесоуправление и лесоустройство», «Лесовосстановление, лесная пирология и защита леса»; 35.04.09 «Ландшафтная архитектура» профиля «Ландшафтное строительство» всех форм обучения
Красноярск, 2019
Вайс, А.А. Основы анализа данных в программе «STATGRAPHICS»: учебное пособие для студентов направлений 35.03.01 «Лесное дело» профиля подготовки «Лесовосстановление и лесопользование», «Лесовосстановление, лесоводство и лесоустройство», «Лесное хозяйство», 35.03.10 «Ландшафтная архитектура» профиля подготовки «Ландшафтное строительство», 20.03.02 «Природообустройство и водопользование» профиля подготовки «Природоохранное обустройство территорий»; магистрантов направлений 35.04.01 «Лесное дело» профилей «Лесоуправление и лесоустройство», «Лесовосстановление, лесная пирология и защита леса»; 35.04.09 «Ландшафтная архитектура» профиля «Ландшафтное строительство» всех форм обучения / А.А. Вайс, И.А. Воробьева. – Красноярск: СибГАУ, 2019. – 68 с.
Учебное пособие содержит пояснения и примеры обучению процедурам статистического и регрессионного анализа программы «STATGRAPHICS».
Поможет обучающимся в обработке учебного и научно-исследовательского материала на современном уровне. Позволит визуализировать и обобщить полученные результаты.
Рецензенты:
д-р с.-х. наук, проф. Г.С. Вараксин (Институт леса им. В.Н. Сукачева);
канд.биол.наук О.П. Ковылина (научно-методический совет СибГАУ).
© А.А. Вайс, 2019
© ФГБОУ ВО «Сибирский государственный университет науки и технологий» им. академика М.Ф. Решетнева
Содержание
Введение. 4
1 Пакет прикладных программ «STATGRAPHICS». 5
1.1 Общий вид программы.. 5
1.2 Работа с графикой. 7
1.3 Статистический проект и консультация. 9
1.4 Ввод данных, преобразование переменных. 10
1.5 Процедуры обработки данных. 13
2 Построение графиков. 16
2.1 Одномерные графики. 16
2.2 Двухмерные графики. 19
2.3 Трехмерные графики и множества связи. 20
3 Анализ числовых переменных. 22
3.1 Статистический анализ. 22
3.2 Группировка данных. 27
3.3 Корреляционный анализ. 28
4 Регрессионный анализ. 32
4.1 Парный регрессионный анализ. 32
4.2 Полиномиальная регрессия. 40
4.3 Множественная регрессия. 42
5 Сравнение данных и подбор распределений. 45
5.1 Сравнение выборочных совокупностей. 45
5.2 Соответствие нормальному распределению, критерий согласия. 46
5.3 Сравнение выборок в STATGRAPHICS. 50
Библиографический список. 53
Приложение А (обязательное) Исходные данные замеров диаметров деревьев сосны на пробных площадях в условиях Среднеобских боров. 54
Введение
В настоящее время на смену «ручной» обработки данных приходит автоматическая работа с информацией, которая в значительной мере позволяет ускорять процесс вычислений и больше внимания уделять непосредственно анализу.
Большое распространение получили пакеты прикладных программ, предназначенных для статистической и графической обработки данных. К ним относятся ППП «STATGRAPHICS», «SPSS», «STATGRAPHICA», «Curve Expert», пакет анализа в «Excel». Все эти пакеты обладают различными инструментами и интерфейсами. Поэтому главным критерием отбора программ для обучения является простота интерфейса и возможности по первичному преобразованию переменных.
Из всех представленных программ оптимальными возможностями обладает программа «STATGRAPHICS». Единственным недостатком можно считать наличие только англоязычных версий.
Учебное пособие предназначено для бакалавров очной и заочной формы обучения, изучающих предметы «Математические методы в расчетах на ЭВМ», «Основы моделирования древостоев», «Математическое моделирование», а также для студентов, подготавливающих к защите выпускную квалификационную работу.
Успешное освоение учебного материала, изложенного в учебном пособии, способствует формированию у обучающихся следующей профессиональной компетенции:
ПК 1 – использование основных законов естественнонаучных дисциплин в профессиональной деятельности, применение методов математического анализа и моделирования, экспериментального исследования.
Пакет прикладных программ «STATGRAPHICS»
Общий вид программы
Статистический графический пакет «STATGRAPHICS», разработанный американской программой Manugistics для IBM – совместимых компьютеров, по признанию многих авторитетных журналов является одной из наиболее эффективных систем статистического анализа данных [1]. Это пособие разработано на основе книги В. Дюка «Обработка данных на ПК в примерах» [1].
STATGRAPHICS Plus for Windows включает более 250 статистических и системных процедур, которые имеют модульную структуры.
Каждой группе соответствует собственное меню. В базовой системе функционируют следующие процедуры (рисунок 1):
- меню Describle – содержит статистические методы анализа одной и множества переменных, процедуры подбора распределений, средства табуляции и кросс-табуляции данных;
- меню Compare – включает методы сравнения двух и более выборок данных, процедуры одно- и многофакторного дисперсионного анализа;
- меню Relate содержит процедуры простого, полиномиального и множественного регрессионного анализа.
Для расширения возможностей базовой системы используют специальное меню.
Меню Special содержит целый набор модулей различного назначения (этот набор процедур используется после освоения базовой системы программы):
Рисунок 1 – Окно программы «STATGRAPHICS»
- модуль «Контроль качества» – предназначен для оценки эффективности всех звеньев производственного процесса и формирования соответствующих контрольных карт;
- модуль «Планирование эксперимента» – помогает сформулировать критерий оптимальности плана эксперимента, организации сбора и обработки информации;
- модуль «Анализ временных рядов» содержит описательные методы, процедуры сглаживания рядов, сезонной декомпозиции и прогнозирования;
- модуль «Многомерные методы» предназначен для изучения и раскрытия взаимоотношений множества факторов (переменных). Это кластерный анализ, метод главных компонент, факторный анализ, дискриминантный анализ, канонический анализ, корреляционный анализ;
- модуль расширенного регрессионного анализа помимо базисных процедур регрессионного анализа, включает различные калибровочные модели, процедуры сравнения линий регрессий, отбора моделей, нелинейную множественную регрессию, ридж-регрессию и логистическую регрессию.
Работа с графикой
Представлена в программе в виде пиктограмм (ярлыков) и меню работы с графикой (Plot) (рисунок 2).
Меню графического отображения данных представлено следующими опциями:
Диаграммы рассеивания.
- Диаграммы рассеивания (одномерные Х-Y): линии, диаграммы рассеивания, оцифрованная диаграмма, связанные диаграммы рассеивания, графики с наборами стандартных ошибок X-Y-Z, диаграммы рассеивания X-Y-Z, чертежный график, переплетенные графики.
- Диаграммы рассеивания (множественные X-Y): точки сети линии.
- Диаграммы рассеивания (множественные X-Y-Z).
Разведочные графики.
- Графики «линии с усами»: горизонтальный и вертикальный; усеченный, с внешними обозначениями; с маркерами средних.
Рисунок 2 – Меню процедур графики (Plot)
- Графики вероятностей.
- Частотные гистограммы: относительные и кумулятивные, гистограмма или полигон.
Деловые карты.
- Диаграммы: горизонтальные и вертикальные, множественные, кластерные, процентные.
- Круговые диаграммы: с вырезанными частями, с надписями.
Каждая статистическая процедура в STATGRAPHICS сопровождается интегрированной в систему графикой. Щелкнув мышью на специальной пиктограмме, мы получаем меню, в котором представляется выбор графических отображений, релевантных используемой процедуре. Все элементы графических отображений (масштабы, метки, цвета, надписи и пр.) могут быть подвергнуты коррекции и преобразованию. Для этого нужно выбрать требуемый элемент, щелкнув на нем левой кнопкой мыши, и затем щелкнуть правой кнопкой. Тогда на экране появится окно диалога, в которое вносятся необходимые изменения (рисунок 3).
Статистический проект и консультация
Для сохранения результатов работы и создания собственных алгоритмов обработки информации применяют статистические проекты.
Статистический проект – это последовательность действий (выбранные методы, параметры статистических процедур, виды графических отображений результатов анализа, табличные формы, комментарии и т.п.) для получения полного результата в виде файла StatFolio. В случае потребности в обработке следующего набора данных по разработанной схеме анализа необходимо просто загрузить новый файл данных. Результаты выдаются автоматически. StatFolio отображает технологическую цепочку анализа данных в виде набора пиктограмм (рисунок 3).
В STATGRAPHICS существует специальное средство Статиконсультант (Stat Advisor). С помощью этой процедуры проводится интерпретация результатов, определяют значимые эффекты и выявляют изъяны в проведенном анализе. Чтобы получить доступ к консультанту, необходимо щелкнуть мышью на графическом или табличном окне программы и затем на пиктограмме Stat Advisor.
Рисунок 3 – Графические опции программы (правая клавиша мыши)
С помощью специальной процедуры Stat Gallery можно комбинировать текст и графику для формирования отчета. В одном окне можно располагать до 9 фрагментов текста и графических иллюстраций.