5.1. Пакет анализа включает в себя несколько средств для сравнения двух выборок по критериям t, z и F:
Двухвыборочный t-тест с одинаковыми дисперсиями служит для проверки гипотезы о равенстве средних для двух выборок. Эта форма t-теста предполагает совпадение дисперсий генеральных совокупностей.
Двухвыборочный t-тест с разными дисперсиями используется для проверки гипотезы о равенстве средних для двух выборок данных из разных генеральных совокупностей. Эта форма t-теста предполагает несовпадение дисперсий генеральных совокупностей.
Парный двухвыборочный t-тест для средних используется для проверки гипотезы о различии средних для двух выборок данных. В нем не предполагается равенство дисперсий генеральных совокупностей. Парный тест используется, если имеется естественная парность наблюдений в выборках, например, когда генеральная совокупность тестируется дважды.
Двухвыборочный z-тест для средних с известными дисперсиям используется для проверки гипотезы о различии между средними двух генеральных совокупностей. Применяется для двух независимых генеральных совокупностей, имеющих нормальное распределение, при известных дисперсиях этих распределений и неизвестных математических ожиданиях.
Двухвыборочный F-тест для дисперсий применяется для сравнения дисперсий двух генеральных совокупностей.
5.2. Двухвыборочный z-тест для средних
5.2.1. В данном методе предполагается, что дисперсии сравниваемых выборок известны. Поэтому в рассчитайте дисперсии для двух совокупностей значений для периодов 1951-1981 гг и 1982-2012 гг., которые разместите в ячейках, как на рисунке. Для расчета дисперсии используйте функции Excel ДИСП.В или ДИСП.
5.2.2. Вызовите инструмент создания выборки через Данные > Анализ данных > Двухвыборочный z-тест для средних.
5.2.3. Опции инструмента.
В поле Интервал переменной 1 задается адрес диапазона ячеек, содержащий выборку с большим математическим ожиданием.
В поле Интервал переменной 2 указывается адрес второй выборки.
Гипотетическая средняя разность, задает предполагаемое наибольшее различие между средними выборок, и должно было неотрицательным.
В полях ввода Дисперсия переменной 1 и Дисперсия переменной 2 вводятся значения дисперсий соответственно первой и второй выборок.
В поле Альфа вводится значение уровня значимости.
Выходной интервал – область вывода рассчитанных данных.
5.2.4. Заполните параметры как на рисунке, при этом значения в полях Дисперсия переменной 1 и Дисперсия переменной 2 должны быть равны значения, которые были вычислены ранее. Нажмите OK.
5.2.5. Ζ-тест позволяет проверить гипотезу Н0 против разных конкурирующих гипотез: H1: μ1 ≠ μ2 + δ или H1: μ1 > μ2 + δ, либо H1: μ1 < μ2 + δ, где μ1 и μ2 – неизвестные математические ожидания сравниваемых выборок, δ – предполагаемое допустимое различие. Критериальная статистика вычисляется по формуле:
где х и у – выборочные средние соответственно первой и второй выборок.
Для выборок из нормально распределенных генеральных совокупностей критериальная статистика z имеет стандартное нормальное распределение. Поэтому при заданном уровне значимости α критическая область строится на основе стандартного нормального распределения – вычисляется квантиль t1-α для проверки гипотезы о равенстве, либо квантиль t1-α/2 для проверки гипотез неравенства.
Нулевая гипотеза о равенстве принимается, если |z| < t1-α (в противном случае отвергается); гипотеза Н0 при конкурирующей гипотезе H1: μ1 > μ2 + δ принимается, если z < t1-α/2; и при конкурирующей гипотезе H1: μ1 > μ2 + δ нулевая гипотеза принимается при выполнении неравенства – t1-α/2 < z.
5.2.6. В итоговой таблице приводятся следующие данные:
Среднее – выборочные средние выборок.
Известная дисперсия – дисперсии выборок, которые указаны в диалоговом окне.
Наблюдения – объемы выборок.
Гипотетическая разность средних – предполагаемая разность между математическими ожиданиями.
z – значение критериальной статистики.
P(Z<=z) одностороннее – вероятность Р(Х<г). где X – случайная величина, распределенная по стандартному нормальному закону, z – подсчитанное значение критериальной статистики.
z критическое одностороннее – значение квантиля порядка 1-α/2.
P(Z<=z) двухстороннее – вероятность Р(|Х|<|г|). где X – случайная величина. распределенная по стандартному нормальному закону, z – подсчитанное значение критериальной статистики.
z критическое двухстороннее – значение квантиля порядка 1-α.
5.2.7. В рассматриваемом примере нет статистических различий между математическими ожиданиями рассмотренных выборок при заданном уровне значимости α=0.05.