В палеонтологии статистические методы проверки гипотезы о равенстве средних способствуют объективному разделению семейств ископаемых организмов на виды. Проверка гипотезы о равенстве средних содержаний полезного компонента, рассчитанных по рядовым и контрольным пробам, позволяет объективно решить вопрос о наличии или отсутствии систематических ошибок в результатах рядового опробования. Общим во всех перечисленных случаях является невозможность уверенного решения задач такого типа путем визуального сравнения средних значений свойств, так как они характеризуются большой изменчивостью, а объем выборок часто бывает невелик. Как правило, выборочные оценки средних обладают значительными дисперсиями и могут заметно различаться даже для совершенно аналогичных объектов.
Наиболее часто в геологической практике употребляется параметрический критерий Стьюдента t. Его применение основано на том, что если из нормально распределенной совокупности отобраны выборки х1, x2,..., хk объемом в n1 значений и выборки y1, y2 …..ykобъемом в n2 значений, то величина
подчиняется закону распределения Стьюдента с n1 + n2 - 2 степенями свободы. — выборочные оценки среднего, a , —выборочные оценки дисперсии. Проверка гипотезы о равенстве двух выборочных средних заключается в подстановке в формулу оценок и по первой и и по второй выборке и сравнении полученного значения критерия t с табличным для данного числа степеней свободы и заданной доверительной вероятности. Если расчетное значение критерия превышает табличное, то гипотеза о равенстве выборочных средних отвергается.
Число степеней свободы – число данных изучаемой совокупности, которые могут принимать произвольные значения, не изменяющие общего уровня, около которого это варьирование происходит.
Вопрос №21. Статистические гипотезы о нулевой и альтернативных гипотезах, критерии согласия. Критерии односторонние и двусторонние, параметрические и непараметрические. Примеры использования в геологии. Если задача сводится к проверке гипотезы об отсутствии различия сравниваемых статистик. Такое предположение принято называть нулевой гипотезой и обозначать H0 – Так, для первой ситуации нулевой гипотезой является допущение того, что сомнительное значение принадлежит к той же генеральной совокупности, что и остальные выборочные данные. Для второй ситуации ею является допущение, что изучаемые явления не различаются по средним содержаниям. Нулевая гипотеза должна быть отвергнута в том случае, если ее вероятность мала. На практике она отвергается при P(H0)<α, где α – принятый уровень значимости. В том случае, когда нулевая гипотеза не подтверждается и должна быть отвергнута, Различие сравниваемых статистик признается существенным. Если нулевая гипотеза не отвергается, утверждать, что рассматриваемые статистики действительно равны, нет оснований, хотя это и возможно. Отбор дополнительных данных может привести к тому, что нулевую гипотезу придется отвергнуть. Для гипотезы H0 может существовать несколько альтернативных гипотез H1. Альтернативные гипотезы: 1) Mx больше или меньше верхней границы доверительного интервала. 2) Mx больше верхней или меньше нижней границы доверительного интервала. Для решения задач используются параметрические(Стьюдента, Фишера) и непараметрические(Вилкоксона, Сиджела-Тьюки) критерии согласия, учитывающие свойства выборочных оценок. Параметрические критерии согласия выводятся из свойств известных статистических законов распределения. Для их использования необходимо предварительно проверить гипотезу о соответствии выборочных данных теоретическому закону распределения. Непараметрические критерии могут использоваться даже в том случае, если закон распределения случайных величин неизвестен. Критерий Вилкоксона основан на процедуре ранжирования двух сравниваемых выборок(А и Б) и представляет собой сумму рангов членов меньшей выборки в общем ранжированном ряду из обеих выборок. Если гипотеза о равенстве средних по совокупностям А и Б верна, т.еH0:x1=x2, математическое ожидание статистики Вилкоксона и величины возможных отклонений от нее выборочных оценок зависят только от объемов выборок n1 и n2. Для случаев, когда n1 и n2<25 значения удвоенного математического ожидания критерия Вилкоксона (2MW) и его нижнего критического значения W1 для заданного уровня значимости приведены в специальных таблицах. Верхнее критическое значение критерия W2 определяется из уравнения W2=2MW-W1.
Критерий Сиджела-Тьюки построен исходя из предположения о равенстве центров распределения сравниваемых совокупностей. Поэтому в случае несоблюдения этого условия исходные данные по каждой выборке необходимо центрировать относительно их медиан т.е сравнивать не сами значения изучаемых параметров, а их отклонения от медиан. Значения сравниваемых выборочных совокупностей объединяются в общую выборку и записываются в виде вариационного ряда в порядке их возрастания: x1<x2…<xN-1, где N=n1+n2 – объем общей выборки, n1 – объем меньшей выборки.
Вопрос №22. Двумерные статистические модели. Сущности и условия их применения. Функциональные и корреляционные связи. Основные характеристики двумерного распределения случайных величин. Ковариация, коэффициент корреляции и корреляционное отношение.
В двумерной статистической модели объект исследования рассматривается как двумерная статистическая совокупность, а ее основной характеристикой является двумерная функция распределения случайных величин X и Y.
Основными числовыми характеристиками двумерного распределения случайных величин являются показатели их связи: ковариация, или корреляционный момент, коэффициент корреляции и корреляционное отношение.
Ковариация, или корреляционный момент, представляет собой математическое ожидание произведения отклонений двух случайных величин от их математических ожиданий
cos (x; у) = М[(х - Мх) (у - My)] = М [(- М) (- М)].
Коэффициент корреляции представляет собой ковариацию, нормированную по стандартным отклонениям:
Пределами изменения коэффициента корреляции являются р = - 1 и р = + 1, причем значение ±1 соответствует функциональной связи величин, а р —0 полному отсутствию линейной связи. Знак коэффициента (+) или (-) указывает на характер связи (прямая или обратная).
Корреляционным отношением называется отношение дисперсий (стандартов) центров условных распределений к общей дисперсии (стандарту) величины. Таких отношений в двумерном распределении, может быть два:
Величины корреляционных отношений изменяются в пределах от 0 до 1. Значение h = 0 свидетельствует о независимости величин, образующих двумерное распределение.
Вопрос №23. Корреляционный анализ. Понятие и геологические задачи. Корреляционное поле точек, его поле и ориентировка. Линейная и не линейная, прямые и обратные корреляционные связи. Проверка гипотезы о наличии корреляционной связи и ее характере.
Между случайными переменными X и Y существует корреляционная зависимость, если каждому значению независимой переменной X соответствует некоторое распределение переменной Y, причем с изменением значений Xi закономерно изменяются математические ожидания yi этих распределений.
Выявление корреляционных связей между различными свойствами геологических объектов способствует решению весьма широкого круга задач (изучении геологических процессов, разработке поисковых критериев и факторов контроля оруденения, а также при выборе рациональных комплексов методов исследований при геологическом картировании, поисках и разведке месторождений).
По тесноте различают связь сильную, среднюю и слабую; по характеру — прямую и обратную; по форме — линейную и нелинейную.
Изучение корреляционных зависимостей проводится табличным, графическим и аналитическим методами.
При табличном изучении корреляционных связей зависимость между величинами X и Y задается двумерной таблицей, называемой корреляционной решеткой.
Каждому интервалу значений интенсивности магнитного поля соответствует определенное распределение запасов, причем с изменением Z распределения Q изменяются в сторону бо льших значений.
Графическим изображением совокупности всех пар значений (хi, yi) является множество точек плоскости, образующих поле корреляции.
Наиболее полный метод изучения корреляционных зависимостей — аналитический, состоящий в установлении числовых показателей меры и формы зависимости между X и Y. Основные из них — корреляционное отношение и коэффициент корреляции.
Выявление корреляционных связей между различными свойствами геологических объектов способствует решению весьма широкого круга задач (изучении геологических процессов, разработке поисковых критериев и факторов контроля оруденения, а также при выборе рациональных комплексов методов исследований при геологическом картировании, поисках и разведке месторождений).
Проверка гипотезы о наличии корреляционной связи обычно основана на том, что для двумерной нормально распределенной случайной величины XY при отсутствии корреляции между Х и У коэффициент корреляции и корреляционное отношение равны нулю.
Проверки заключается в расчете выборочных оценок этих характеристик и оценке значимости их отличия от нуля. Выборочная оценка коэффициента корреляции может быть рассчитана по формуле:
где и - выборочные оценки средних значений случайных величин X и У; Sx и Sy - выборочные оценки их стандартов; n - количество сравниваемых пар значений.
Когда математическое ожидание выборочного коэффициента корреляции равно нулю,
величина имеет распределение Стьюдента с n - 2 степенями свободы. Если рассчитанное по этой формуле значение величины превышает табличное значение критерия Стьюдента для принятой доверительной вероятности и числа степеней свободы n - 2, гипотеза об отсутствии корреляционной связи отвергается.