Вопрос №20. Статистические гипотезы. Проверка гипотезы о равенстве средних значений двух эмпирических совокупностей. Примеры использования в геологии

В палеонтологии статистические методы проверки гипотезы о равенстве средних способствуют объективному разделению семейств ископаемых организмов на виды. Проверка гипо­тезы о равенстве средних содержаний полезного компонента, рассчитанных по рядовым и контрольным пробам, позволяет объективно решить вопрос о наличии или отсутствии система­тических ошибок в результатах рядового опробования. Общим во всех перечисленных случаях является невозможность уверенного решения задач такого типа путем визуального сравнения сред­них значений свойств, так как они характеризуются большой изменчивостью, а объем выборок часто бывает невелик. Как правило, выборочные оценки средних обладают значительными дисперсиями и могут заметно различаться даже для совершен­но аналогичных объектов.

Наиболее часто в геологической практике употребляется па­раметрический критерий Стьюдента t. Его применение основа­но на том, что если из нормально распределенной совокупности отобраны выборки х1, x2,..., хk объемом в n1 значений и выбор­ки y1, y2 …..ykобъемом в n2 значений, то величина

 

подчиняется закону распределения Стьюдента с n1 + n2 - 2 сте­пенями свободы. — выборочные оценки среднего, a , —выборочные оценки дисперсии. Проверка гипотезы о равенстве двух выборочных средних заключается в подстановке в формулу оценок и по первой и и по второй выборке и сравнении полученного значения критерия t с табличным для данного числа степеней свободы и заданной доверительной вероятности. Если расчетное значение критерия превышает табличное, то гипотеза о равенстве выбо­рочных средних отвергается.

Число степеней свободы – число данных изучаемой совокупности, которые могут принимать произвольные значения, не изменяющие общего уровня, около которого это варьирование происходит.

Вопрос №21. Статистические гипотезы о нулевой и альтернативных гипотезах, критерии согласия. Критерии односторонние и двусторонние, параметрические и непараметрические. Примеры использования в геологии. Если задача сводится к проверке гипотезы об отсутствии различия сравниваемых статистик. Такое предположение принято называть нулевой гипотезой и обозначать H0 – Так, для первой ситуации нулевой гипотезой является допущение того, что сомнительное значение принадлежит к той же генеральной совокупности, что и остальные выборочные данные. Для второй ситуации ею является допущение, что изучаемые явления не различаются по средним содержаниям. Нулевая гипотеза должна быть отвергнута в том случае, если ее вероятность мала. На практике она отвергается при P(H0)<α, где α – принятый уровень значимости. В том случае, когда нулевая гипотеза не подтверждается и должна быть отвергнута, Различие сравниваемых статистик признается существенным. Если нулевая гипотеза не отвергается, утверждать, что рассматриваемые статистики действительно равны, нет оснований, хотя это и возможно. Отбор дополнительных данных может привести к тому, что нулевую гипотезу придется отвергнуть. Для гипотезы H0 может существовать несколько альтернативных гипотез H1. Альтернативные гипотезы: 1) Mx больше или меньше верхней границы доверительного интервала. 2) Mx больше верхней или меньше нижней границы доверительного интервала. Для решения задач используются параметрические(Стьюдента, Фишера) и непараметрические(Вилкоксона, Сиджела-Тьюки) критерии согласия, учитывающие свойства выборочных оценок. Параметрические критерии согласия выводятся из свойств известных статистических законов распределения. Для их использования необходимо предварительно проверить гипотезу о соответствии выборочных данных теоретическому закону распределения. Непараметрические критерии могут использоваться даже в том случае, если закон распределения случайных величин неизвестен. Критерий Вилкоксона основан на процедуре ранжирования двух сравниваемых выборок(А и Б) и представляет собой сумму рангов членов меньшей выборки в общем ранжированном ряду из обеих выборок. Если гипотеза о равенстве средних по совокупностям А и Б верна, т.еH0:x1=x2, математическое ожидание статистики Вилкоксона и величины возможных отклонений от нее выборочных оценок зависят только от объемов выборок n1 и n2. Для случаев, когда n1 и n2<25 значения удвоенного математического ожидания критерия Вилкоксона (2MW) и его нижнего критического значения W1 для заданного уровня значимости приведены в специальных таблицах. Верхнее критическое значение критерия W2 определяется из уравнения W2=2MW-W1.

Критерий Сиджела-Тьюки построен исходя из предположения о равенстве центров распределения сравниваемых совокупностей. Поэтому в случае несоблюдения этого условия исходные данные по каждой выборке необходимо центрировать относительно их медиан т.е сравнивать не сами значения изучаемых параметров, а их отклонения от медиан. Значения сравниваемых выборочных совокупностей объединяются в общую выборку и записываются в виде вариационного ряда в порядке их возрастания: x1<x2…<xN-1, где N=n1+n2 – объем общей выборки, n1 – объем меньшей выборки.

Вопрос №22. Двумерные статистические модели. Сущности и условия их применения. Функциональные и корреляционные связи. Основные характеристики двумерного распределения случайных величин. Ковариация, коэффициент корреляции и корреляционное отношение.

В двумерной статистической модели объект исследования рассматривается как двумерная статистическая совокупность, а ее основной характеристикой является двумерная функция рас­пределения случайных величин X и Y.

Основными числовыми характеристиками двумерного рас­пределения случайных величин являются показатели их связи: ковариация, или корреляционный момент, ко­эффициент корреляции и корреляционное отношение.

Ковариация, или корреляционный момент, представляет со­бой математическое ожидание произведения отклонений двух случайных величин от их математических ожиданий

cos (x; у) = М[(х - Мх) (у - My)] = М [(- М) (- М)].

Коэффициент корреляции представляет собой ковариацию, нор­мированную по стандартным отклонениям:

 

 

Пределами изменения коэффициента корреляции являются р = - 1 и р = + 1, причем значение ±1 соответствует функцио­нальной связи величин, а р —0 полному отсутствию линейной связи. Знак коэффициента (+) или (-) указывает на харак­тер связи (прямая или обратная).

Корреляционным отношением называется отношение дис­персий (стандартов) центров условных распределений к общей дисперсии (стандарту) величины. Таких отношений в двумер­ном распределении, может быть два:

 

 

Величины корреляционных отношений изменяются в пре­делах от 0 до 1. Значение h = 0 свидетельствует о независимо­сти величин, образующих двумерное распределение.

 

Вопрос №23. Корреляционный анализ. Понятие и геологические задачи. Корреляционное поле точек, его поле и ориентировка. Линейная и не линейная, прямые и обратные корреляционные связи. Проверка гипотезы о наличии корреляционной связи и ее характере.

Между случайными переменными X и Y существует кор­реляционная зависимость, если каждому значению независи­мой переменной X соответствует некоторое распределение пе­ременной Y, причем с изменением значений Xi закономерно изменяются математические ожидания yi этих распределений.

Выявление корреляционных связей между различными свойствами геологических объектов способствует решению весьма широкого круга задач (изучении геологических процессов, разработке поисковых критериев и факторов контроля оруденения, а также при выборе рациональных комплексов методов исследований при геологическом картировании, поисках и разведке месторождений).

По тесноте различают связь сильную, среднюю и слабую; по характеру — прямую и обратную; по форме — линейную и нелинейную.

Изучение корреляционных зависимостей проводится таб­личным, графическим и аналитическим методами.

При табличном изучении корреляционных связей зави­симость между величинами X и Y задается двумерной табли­цей, называемой корреляционной решеткой.

Каждому интервалу значений интенсивности магнитного поля соответствует определенное распределение запасов, при­чем с изменением Z распределения Q изменяются в сторону бо льших значений.

Графическим изображением совокупности всех пар зна­чений (хi, yi) является множество точек плоскости, образую­щих поле корреляции.

Наиболее полный метод изучения корреляционных зави­симостей — аналитический, состоящий в установлении число­вых показателей меры и формы зависимости между X и Y. Основные из них — корреляционное отношение и коэффици­ент корреляции.

Выявление корреляционных связей между различными свойствами геологических объектов способствует решению весьма широкого круга задач (изучении геологических процессов, разработке поисковых критериев и факторов контроля оруденения, а также при выборе рациональных комплексов методов исследований при геологическом картировании, поисках и разведке месторождений).

Проверка гипотезы о наличии корреляционной связи обычно основана на том, что для двумерной нормально распределенной случайной величины XY при отсутствии корреляции между Х и У ко­эффициент корреляции и корреляционное отношение равны нулю.

Проверки заключается в расчете выборочных оценок этих характеристик и оценке значимости их отличия от нуля. Выборочная оценка коэффициента корреляции может быть рассчи­тана по формуле:

где и - выборочные оценки средних значений случайных величин X и У; Sx и Sy - выборочные оценки их стандартов; n - количество сравниваемых пар значений.

Когда математическое ожидание выборочного коэффициента корреляции равно нулю,

величина имеет распределение Стьюдента с n - 2 степенями свободы. Если рассчитанное по этой формуле значение величины превышает табличное значение критерия Стьюдента для принятой доверительной вероятности и числа степеней свободы n - 2, гипотеза об отсутствии корреляционной связи отвергается.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: