Вопрос №16. Дисперсионный анализ. Понятие и геологические задачи. Однофакторный дисперсионный анализ, понятия о двух- и многомерном анализе

Раздел статистики, изучающий влияние факторов на из­менчивость случайной величины, называется дисперсионным анализом. Задача его — выделить те факторы и их сочета­ния, которые оказывают существенное влияние на изменение изучаемой величины.

Суждение о влиянии определенного фактора или комбинации факторов на изменчивость изучаемой случайной величины основано на группировке ее замеров по факторам и их уровням и проверке гипотезы о равенстве дисперсий, обусловленных данными факторами, с остаточной (случайной) дисперсией, вызванной неучтенными факторами. Если гипотеза отвергается, то делается вывод о том, что данный фактор или взаимодействие факторов оказывают существенное влияние на изменение изучаемого свойства геологического объекта

Примеров геологических задач:

1. Установить влияние выветривания на изменение содер­жаний элемента А в изучаемых породах 2. Определить влияние веса пробы и способа ее отбора на изменение содержаний разведываемого компонента.

3. Установить влияние состава пород, трещин различной ориентировки, разрывных нарушений на формирование оруднения.

Если количество значений случайной величины на раз­ных уровнях всех факторов одинаково, то дисперсионный ана­лиз называют равномерным, если различное — неравномер­ным. Как и при решении других задач статистическими мето­дами, при дисперсионном анализе формулируется предполо­жение о том, что фактор или их вза­имодействие не оказывают существенного влияния на изме­нение величины X.

Если на случайную величину действуют взаимонезависимые факторы А и Б, то общую дисперсию этой случайной величины s2 можно рассматривать как сумму дисперсий:

 

Тре­бование нормальности выборочного распределения допускает некоторые отклонения, так как критерий Фишера, используе­мый в дисперсионном анализе, применим и к распределени­ям, отличным от нормальных

В зависимости от количества учитыва­емых факторов различают однофакторный, двух- и многофакторный дисперсионный анализ. Каждый фактор представляет собой переменную величину, изменяющуюся дискретно или непре­рывно.

Однофакторный

С его помощью осуществляется проверка гипотезы об однородности нескольких независимых выборок.

При равномерном однофакторном дисперсионном анализе случайной величины х относительно фактора А, имеющего k уровней при количестве замеров на каждом уровне равном n, результаты наблюдений обозначаются как xij, где i—номер наблюде­ния (i=1, 2,.., n), aj—номер уровня фактора (j=1, 2,.., k).

По этим данным рассчитываются следующие статистики:

1) общая сумма

2) факторная сумма

3) остаточная сумма

 

4) общая, факторная и остаточная дисперсии:

5) значение критерия Фишера:

Значение критерия Фишера сравнивается с критическим для заданного уровня значимости α и числа степеней свободы k—1 и k(n—l).

При неравномерном однофакторном дисперсионном анализе, когда количество наблюдений на уровне А1 равно n1, на уровне

A2-n2,.., на уровне Аk—nk, а общее их число равно

Факторная и остаточная дисперсии находятся по формулам

Остальные операции выполняются так же, как при равномерном анализе.

При двухфакторном дисперсионном анализе сумма квадратов отклонений от общего среднего разделяется на компоненты, отвечающие двум предполагаемым факторам изменчивости - А и В. Если по фактору А выделяется р уровней, а по фактору B - q уровней, то общее количество групп будет равно m=pq, а исходные данные можно записать в виде таблицы.

Если для каждого сочетания факторов АiВi произведено по n наблюдений,

Оценки средних значений по группам , по факторам (хi.. и x.j.) и общее среднее в этом случае рассчитываются по формулам

Общая схема вычисления дисперсий при двухфакторном анализе приведена ниже в таблице 3

Проверка гипотезы о влиянии на изменчивость изучаемого свойст­ва каждого фактора в отдельности и их совместного влияния производится по критерию Фишера:

Полученные значения F-критерия сравниваются с критическим для заданного уровня значимости и числа степеней свободы, приведен­ного в таблице 3

Таблица 3

Вычисление дисперсий при двухфакторном дисперсионном анализе

Вид дисперсии Сумма квадратов отклонений Число степеней свободы Дисперсия  
Факторная по фактору А p-1
Факторная по фактору В q-1
Смешанная по факторам АВ (p-1)(q-1)
Остаточная pq(n-1)
Общая npq-1

При расчете F-критерия в данном случае в знаменателе всегда берется остаточная дисперсия. Поэтому его значение иногда может получиться меньше 1.

Вопрос№17. Анализ однородности геологических совокупностей. Проблемы аномальных значений случайных величин. При использовании одномерных статистических моделей для описания свойств геологических объектов предполагается, что данный объект однороден в отношении изучаемого свойства. Обычно вопрос об однородности решается исходя из принятой геологической модели. Исследуемый объект считается статистически однородным, если он однороден по геологическому строению. Задачи, основанные на проверке гипотезы о статистической однородности геологических объектов, можно разделить на три типа: выделение аномальных значений; разделение неоднородных выборочных совокупностей; оценка степени влияния различных факторов на характер изменчивости свойств геологических объектов. Выявление локальных неоднородностей(аномалий) в строении геологических объектов имеет исключительно важное практическое значение при проведении поисковых работ, так как они часто используются в качестве признаков, указывающих на наличие повышенных концентраций полезных ископаемых. Задача выявления аномальных значений не имеет универсального решения статистическими методами. Аномальное значение должно определятся опытным путем на основе анализа геологических причин изменения значений изучаемых свойств. Статистические характеристики при этом будут иметь вспомогательное значение. В практике геохимических исследований за аномальные значения часто принимают маловероятные значения по абсолютной величине превышающие тройное сигма. Однако этот способ нельзя признать корректным, так как он не гарантирует от ошибок как первого, так и второго рода, причем вероятность этих ошибок оценить нельзя. Если количество наблюдений, принадлежащих разным геологическим совокупностям в неоднородной выборке велико, то возникает необходимость и возможность ее разделения на несколько однородных совокупностей. Простейший способ разделения неоднородных выборочных совокупностей основан на анализе графиков эмпирических кривых распределения.

Вопрос№18. Статистические гипотезы. Критерий Пирсона и другие критерии. Сравнение выборочного распределения с теоретическим. Примеры использования в геологии. После вычисления частот выбранного теоретического распределения необходимо оценить степень согласия между эмпирическими и теоретическими частотами. Для оценки используют критерии лямбда и хи квадрат. Критерий лямбда предложен Колмогоровым и Смирновым. Единственным условием его применения является достаточная численность выборочных данных(несколько десятков). Для сравнения эмпирического распределения с теоретическим критерий лямбда определяют по формуле λ=D/√n, где D – наибольшее значение абсолютной разности между накопленными значениями частот эмпирического и теоретического распределений. Теоретическое значение лямбда не зависит от объема выборки и числа степеней свободы, а определяется только выбранным уровнем значимости. Критерий хи квадрат, предложенный Пирсоном определяют по формуле

σe=√24/n σa=√6/n

Где n эмпирическая частота. Если хи квадрат эмпирическое будет меньше, чем хи квадрат теоретическое гипотеза о согласии эмпирического и теоретического распределения не отвергается. Число степеней свободы определяется в зависимости от применяемого нормального закона f=k-3, k – число интервалов группировки). Условия: 1)Количество интервалов 5-7; 2)количество в интервалах не меньше 5; 3)интервал не должен прерываться. Показатели нормальности распределения Ka<=3, Ke<=3. Ka = A/ σa

Ke=E/ σe.

Вопрос №19. Статистические гипотезы. Проверка гипотез о равенстве дисперсии 2 выборочных совокупностей. Примеры использования в геологии. Сравнение геологических объектов по степени изменчивости, которая оценивается по величине дисперсии или коэффициента вариации тех или иных свойств, необходимо для обоснованного применения принципа аналогии при их изучении. Различие в дисперсиях свойств аналогичных по составу геологических объектов может указывать на различие в истории их формирования и установить однородность изучаемого материала. На сравнении дисперсий основаны также методы определения величин случайных погрешностей различных способов опробования анализов. Если количественные данные о свойствах геологического объекта получены различными способами, то более надежным следует признать тот способ, который дает меньший разброс значений изучаемого свойства, т.е характеризуется меньшей дисперсией. Для проверки гипотезы о равенстве дисперсии обычно используется критерий Фишера. Фишером было установлено, что в случае равенства дисперсий двух нормально распределенных случайных величин, величина F=S1^2/S2^2 при S1^2>S2^2. Распределение по закону Фишера с n1-1 и n2-1 степенями свободы, где n1 – число проб в выборке, по которой получена большая оценка дисперсии S1^2, а n2 – объем второй выборки. Процедура проверки гипотезы сводится к нахождению эмпирического значения F-критерия и сравнению его с табличным значением для принятой доверительной вероятности и степенях свободы k1=n1-1 и k2=n2-1. Если вычисленное значение критерия Фишера превышает табличное, то гипотеза о равенстве двух дисперсий отвергается.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: