Сравнение выборок

5.1. Пакет анализа включает в себя несколько средств для сравнения двух выборок по критериям t, z и F:

Двухвыборочный t-тест с одинаковыми дисперсиями служит для проверки гипотезы о равенстве средних для двух выборок. Эта форма t-теста предполагает совпадение дисперсий генеральных совокупностей.

Двухвыборочный t-тест с разными дисперсиями используется для проверки гипотезы о равенстве средних для двух выборок данных из разных генеральных совокупностей. Эта форма t-теста предполагает несовпадение дисперсий генеральных совокупностей.

Парный двухвыборочный t-тест для средних используется для проверки гипотезы о различии средних для двух выборок данных. В нем не предполагается равенство дисперсий генеральных совокупностей. Парный тест используется, если имеется естественная парность наблюдений в выборках, например, когда генеральная совокупность тестируется дважды.

Двухвыборочный z-тест для средних с известными дисперсиям используется для проверки гипотезы о различии между средними двух генеральных совокупностей. Применяется для двух независимых генеральных совокупностей, имеющих нормальное распределение, при известных дисперсиях этих распределений и неизвестных математических ожиданиях.

Двухвыборочный F-тест для дисперсий применяется для сравнения дисперсий двух генеральных совокупностей.


5.2. Двухвыборочный z-тест для средних

5.2.1. В данном методе предполагается, что дисперсии сравниваемых выборок известны. Поэтому в рассчитайте дисперсии для двух совокупностей значений для периодов 1951-1981 гг и 1982-2012 гг., которые разместите в ячейках, как на рисунке. Для расчета дисперсии используйте функции Excel ДИСП.В или ДИСП.

5.2.2. Вызовите инструмент создания выборки через Данные > Анализ данных > Двухвыборочный z-тест для средних.

5.2.3. Опции инструмента.
В поле Интервал переменной 1 задается адрес диапазона ячеек, содержащий выборку с большим математическим ожиданием.
В поле Интервал переменной 2 указывается адрес второй выборки.
Гипотетическая средняя разность, задает предполагаемое наибольшее различие между средними выборок, и должно было неотрицательным.
В полях ввода Дисперсия переменной 1 и Дисперсия переменной 2 вводятся значения дисперсий соответственно первой и второй выборок.
В поле Альфа вводится значение уровня значимости.
Выходной интервал – область вывода рассчитанных данных.

5.2.4. Заполните параметры как на рисунке, при этом значения в полях Дисперсия переменной 1 и Дисперсия переменной 2 должны быть равны значения, которые были вычислены ранее. Нажмите OK.

5.2.5. Ζ-тест позволяет проверить гипотезу Н0 против разных конкурирующих гипотез: H1: μ1 ≠ μ2 + δ или H1: μ1 > μ2 + δ, либо H1: μ1 < μ2 + δ, где μ1 и μ2 – неизвестные математические ожидания сравниваемых выборок, δ – предполагаемое допустимое различие. Критериальная статистика вычисляется по формуле:

где х и у – выборочные средние соответственно первой и второй выборок.
Для выборок из нормально распределенных генеральных совокупностей критериальная статистика z имеет стандартное нормальное распределение. Поэтому при заданном уровне значимости α критическая область строится на основе стандартного нормального распределения – вычисляется квантиль t1-α для проверки гипотезы о равенстве, либо квантиль t1-α/2 для проверки гипотез неравенства.
Нулевая гипотеза о равенстве принимается, если |z| < t1-α (в противном случае отвергается); гипотеза Н0 при конкурирующей гипотезе H1: μ1 > μ2 + δ принимается, если z < t1-α/2; и при конкурирующей гипотезе H1: μ1 > μ2 + δ нулевая гипотеза принимается при выполнении неравенства – t1-α/2 < z.

5.2.6. В итоговой таблице приводятся следующие данные:

Среднее – выборочные средние выборок.

Известная дисперсия – дисперсии выборок, которые указаны в диалоговом окне.

Наблюдения – объемы выборок.

Гипотетическая разность средних – предполагаемая разность между математическими ожиданиями.

z – значение критериальной статистики.

P(Z<=z) одностороннее – вероятность Р(Х<г). где X – случайная величина, распределенная по стандартному нормальному закону, z – подсчитанное значение критериальной статистики.

z критическое одностороннее – значение квантиля порядка 1-α/2.

P(Z<=z) двухстороннее – вероятность Р(|Х|<|г|). где X – случайная величина. распределенная по стандартному нормальному закону, z – подсчитанное значение критериальной статистики.

z критическое двухстороннее – значение квантиля порядка 1-α.

5.2.7. В рассматриваемом примере нет статистических различий между математическими ожиданиями рассмотренных выборок при заданном уровне значимости α=0.05.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: