Двухфакторный дисперсионный анализ. Дисперсионный анализ

Дисперсионный анализ

Однофакторный дисперсионный анализ (от англ. AN alysis O f VA riance) отвечает на вопрос, есть ли различия в средних значениях в нескольких несвязанных группах (более 2х). Нулевая гипотеза — все средние в выборках равны друг другу. Альтернативная гипотеза — хотя бы два средних в выборках статистически значимо отличаются друг от друга. Если можно отвергнуть нулевую гипотезу и принять альтернативную (F-статистика — F value — выше некоторого значения и соответственно достигнутый уровень значимости — Pr(>F) —меньше критического 0,05), то приступают ко второму этапу исследования и проводят так называемые апостериорные тесты (post hoc), проводящие сравнения всех возможных пар групп. для сравнения нескольких групп наблюдений.

Файл данных: лаба2pregn1.sav

Медицинская постановка задачи. Сравнить средние значения массы тела и длины новорождённых, а также их соотношение (переменные: P_CH1, LEN_CH1, P_LEN) в зависимости от состояния здоровья матерей. Изучаемые признаки — масса и длина — количественные показатели. Состояние здоровья матери охарактеризовано качественными признаками, хранящимися в соответствующих переменных

GESTOZ — c 3 градациями: отсутствие гестоза, гестоз лёгкой степени тяжести и гестоз средней степени тяжести;

PROF — c 3 градациями: студентка, домохозяйка, служащая;

FAMILY — c 2 градациями: не замужем, замужем;

CHFPN — c 4 градациями: хронической фето-плацентарной недостаточности нет, 1, 2а, 2б степени тяжести;

IMT_ID — c 4 градациями: норм. вес, предожирение, ожирение 1, ожирение 2, ожирение 3;

AGE_ID — c 5 градациями: возраст до 20 лет, 20–24, 25–29, 30–34, >=35 лет.

 

Группирующие переменные для анализа: GESTOZ, IMT_ID, PROF, FAMILY, CHFPN, AGE_ID

Порядок выполнения однофакторного дисперсионного анализа в среде SPSS

Анализ

Сравнение средних

Однофакторный дисперсионный анализ

В раскрывшемся диалоговом окне выбрать группирующий фактор (один) и несколько количественных признаков.

На закладке «апостериорные» выберите «Тьюки», продолжить.

На закладке «Параметры» выберите «Описательные», продолжить.

OK.

Полученные результаты анализа сгруппированы в три таблицы. Таблица Descriptives содержит описательные статистики рассматриваемых переменных (например, массы и длины детей) по группам. В описательные статистики входят число наблюдений в каждой группе, среднее, стандартное отклонение, стандартная ошибка, 95% доверительный интервал для среднего, минимальное и максимальное значение.

Таблица ANOVA (дисперсионный анализ) содержит промежуточные расчёты для F-статистики (столбец F) и значение достигнутого уровня значимости (sig от англ. significance level или в русскоязычной версии знч). На первом этапе дисперсионного анализа не известно, в каких именно группах есть различия. Если они есть (достигнутый уровень значимости меньше критического), то можно анализировать следующую таблицу.

Таблица PostHocTests (множественные сравнения) содержит данные попарных сравнений групп. Так, группа со значением гестоза 0 сравнивается с группами 1 и 2. Столбец Mean Difference (I–J) показывает разницу в средних в группах, указанных в столбце I и J, соответственно. Следующий столбец таблицы показывает стандартную ошибку этой разницы. Столбец sig (знч) показывает уровень значимости отличий данных групп.

Следующая группа таблиц (однородные подмножества) показывает, какие группы однородны, то есть не различаются друг от друга, а какие различаются

Графическое представление дисперсионного анализа:

Графика

Устаревшие

Столбики ошибок

Простой, итоги по группам наблюдений, задать.

Количественный признак перетащить в «переменную», а группирующий (то есть фактор) — в «категориальную ось».

Проанализируйте полученные результаты. Какие признаки различаются статистически значимо, а какие нет? А в каких группах?

Сравните эти же показатели непараметрическим аналогом дисперсионного анализа — анализом Краскелла–Уоллиса:.

Анализ

Непараметрические критерии

Для k независимых выборок

Далее заполните диалоговое окно по аналогии с выполненным ранеепараметирческим дисперсионным анализом.

Сравните полученные результаты с полученными ранее.

 

Двухфакторный дисперсионный анализ

Цель 2х-факторного дисперсионного анализа — расщепление суммарной дисперсии изучаемой величины на отдельные составляющие: дисперсию, обусловленную действием первого, второго фактора и их совместным влиянием. Именно поиск возможного эффекта взаимодействия наиболее интересен в 2х факторном анализе.

вариант 1 P_CH1 и GESTOZ P_CH1 и PROF вариант 2 LEN_CH1 и GESTOZ LEN_CH1 и PROF вариант 3 P_CH1 и PROF P_CH1 и CHFPN вариант 4 LEN _CH1 и PROF LEN _CH1 и CHFPN

 

Анализ

Общая линейная модель

ОЛМ одномерная

 

В поле «зависимые перменные» внесите заданный в своем варианте задания количественный признак.

В поле «фиксированные факторы» внесите группирующие признаки.

В закладке «параметры» поставьте галочку на «описательных статистиках» и выберете overall.

OK.

 

Проанализируйте описательные статистики по группам. В полученных результатах представляет интерес таблица Tests of Between-Subjects Effects(оценка эффектов межгрупповых факторов), её два самых правых столбца, гда представлены F-статистика и достигнутый уровень значимости. По этому столбцу можно оценить влияние каждого из анализируемых факторов на переменную отклика, а также эффект взаимодействия двух факторов.

Наглядно эффект взаимодействии можно проиллюстрировать графически

Графика

Устаревшие

Столбики ошибок

Кластер, итоги по группам наблюдений, задать.

Количественный признак перетащить в «переменную», а фактор 1 — в «категориальную ось», фактор 2 в «задать кластеры по».

OK.

 

Попробуйте поменять местами факторы. Посмотрите, какой из рисунков будет удобнее анализировать и описывать. Дважды кликните по рисунку и посмотрите, какие возможности его редактирования появятся.

 

Дайте содержательную интерпретацию полученным результатам.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: