Статистическая гипотеза – это предположение о свойствах случайных величин или событий, которое мы хотим проверить по имеющимся данным

Примеры статистических гипотез в педагогических исследованиях:

Гипотеза 1. Успеваемость класса стохастически (вероятностно) зависит от уровня обучаемости учащихся.

Гипотеза 2. Усвоение начального курса математики не имеет существенных различий у учащихся, начавших обучение с 6 или 7 лет.

Гипотеза 3. Проблемное обучение в первом классе эффективнее по сравнению с традиционной методикой обучения в отношении общего развития учащихся.

Выдвижение предположения составляет основное содержание гипотезы.

Предположение, чтобы стать гипотезой, должно удовлетворять следующим требованиям:

а) предположение не должно быть логически противоречивым;

б) предположение должно быть принципиально проверяемым.

Статистической гипотезой называется предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки. Статистическую гипотезу обозначают символом H.

Обычно выдвигают и проверяют две противоречащие друг другу гипотезы:

1. нулевую (основную) H0;

2. конкурирующую (альтернативную) H1.

Примеры статистических гипотез:

1) Нулевая гипотеза H0: закон распределения результатов измерения является нормальным. Конкурирующая гипотеза H1: закон распределения результатов измерения отличен от нормального.

2) Нулевая гипотеза H0: среднее арифметическое значение генеральной совокупности результатов измерения показателя после цикла тренировок не изменилось. Конкурирующая гипотеза H1: среднее арифметическое значение увеличилось.

2. Для проверки выдвинутых нулевых гипотез применяют статистические критерии, разработанные математиками и носящие, как правило, их имена.

Статистическим критерием называют определенное правило, задающее условия, при которых проверяемую нулевую гипотезу следует либо отклонить, либо принять. При отклонении нулевой гипотезы принимается конкурирующая. Критерий обозначается буквой К.

Значение критерия, вычисленное по данным выборки, называют наблюдаемым значением критерия (Кнабл).

  Совокупность значений критерия, при которых отвергают нулевую гипотезу, называют критической областью.

Совокупность значений критерия, при которых нулевую гипотезу принимают, называют областью принятия гипотезы (областью допустимых значений). Указанные области разграничены критическим (граничным) значением критерия, который находится по соответствующей таблице.

Односторонняя критическая область используется, если, согласно конкурирующей гипотезе, одна рассматриваемая величина может быть только больше (или только меньше) другой величины.

Двусторонняя критическая область используется, если, согласно конкурирующей гипотезе, одна рассматриваемая величина может быть как больше, так и меньше (не равна) другой.

Отклонение нулевой гипотезы, когда она фактически верна, называется ошибкой первого рода. Принятие нулевой гипотезы, когда фактически она не верна, называется ошибкой второго рода.

Уровень значимости – это вероятность попадания критерия К в критическую область, если верна нулевая гипотеза, другими словами, уровень значимости – это вероятность ошибки первого рода. Он служит для определения по таблицам критических значений критерия (Ккрит), которые указывают положение критических точек, отделяющих критическую область от области принятия гипотезы. Обычно величина p выбирается малой. Поэтому попадание критерия К в критическую область при справедливости нулевой гипотезы мало вероятно. В этом случае, при попадании критерия К в критическую область считают, что должна быть принята конкурирующая гипотеза.

Часто p принимают равной 0,05. Это означает, что вероятность ошибочно принять гипотезу H1, если справедлива гипотеза H0, равна только 5 %.

Сформулируем основные этапы проверки статистических гипотез:

1) Исходя из задач исследования, формулируются статистические гипотезы.

2) Выбирается уровень значимости, на котором будут проверяться гипотезы.

3) На основе выборки, полученной из результатов измерения, определяется статистическая характеристика гипотезы.

4) Определяется критическое значение статистического критерия по соответствующей таблице на основании выбранного уровня значимости и объема выборки.

5) Вычисляется наблюдаемое (фактическое) значение статистического критерия.

6) На основе сравнения наблюдаемого и критического значения критерия в зависимости от результатов проверки нулевая гипотеза либо принимается, либо отклоняется в пользу альтернативной.

Для проверки статистических гипотез используются параметрические и непараметрические методы.

Параметрические методы служат для проверки гипотез о неизвестных параметрах генеральной совокупности, когда закон распределения случайной величины известен.

Непараметрические методы применяются в тех случаях, когда закон распределения случайной величины неизвестен, или когда условия применения параметрических методов не выполняются.

Параметрические методы эффективнее непараметрических.

32. Научная и статистическая гипотезы. Соотношение, использование в исследовании.

Гипотеза – научно обоснованное, но неочевидное предположение, требующее специального доказательства для своего окончательного утверждения в качестве теоретического положения или его опровержения.

Научная гипотеза - модель создаваемой системы нового научного знания и план ее реализации.

Научные гипотезы формулируются как предполагаемое решение проблемы. Первична. Ее также называют экспериментальной, т.к. она служит для организации эксперимента.

Научная гипотеза должна удовлетворять принципам:

1. Фальсифицируемости (т.е. гипотеза может быть опровергнута в ходе эксперимента);

2. Верифицируемости (может быть подтверждена в ходе эксперимента).

Принцип фальсифицируемости абсолютен, так как опровержение теории окончательно. Принцип верифицируемости относителен, так как всегда есть вероятность опровержения гипотезы в следующем исследовании.

Статистическая гипотеза – утверждение в отношении неизвестного параметра, сформулированное на языке математической статистики. Любая научная гипотеза требует перевода на язык математической статистики.

Статистическая гипотеза – это предположение о распределении вероятностей, которое мы хотим проверить по имеющимся данным.

Статистические гипотезы подразделяются на нулевые и альтернативные:

Нулевая гипотеза (Но) – это гипотеза об отсутствии различий. Это то, что мы хотим опровергнуть, если перед нами стоит задача доказать значимость различий.

Альтернативная гипотеза1) – это гипотеза о значимости различий. Это то, что мы хотим доказать, поэтому ее иногда называют экспериментальной гипотезой.

После проведения конкретного эксперимента проверяются многочисленные статистические гипотезы, поскольку в каждом психологическом исследовании регистрируется не один, а множество поведенческих параметров.

Научная гипотеза Статистическая гипотеза
первична вторична
Научные гипотезы формулируются как предполагаемое решение проблемы. Статистическая гипотеза — утверждение в отношении неизвестного параметра, сформулированное на языке математической статистики. При проверке статистических гипотез используются лишь два понятия:  - Н1 (гипотеза о различии) и  - Н0 (гипотеза о сходстве, нуль-гипотеза). Подтверждение первой свидетельствует о верности статистического утверждения Н1, а второй — о принятии гипотезы Н0 — об отсутствии различий.
Служит для организации эксперимента Служит для организации процедуры сравнения регистрируемых параметров, т.е. необходима на этапе математической интерпретации данных эмпирических исследований

Гипотезы, не опровергнутые в эксперименте, превращаются в компоненты теоретического знания о реальности: факты, закономерности, законы.

33. Статистические гипотезы о различии и о связи. Принципы выдвижения, связь со статистическими методами их проверки.

Статистическая гипотеза (statistical hypothesys) — это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных.

Проверка статистической гипотезы (testing statistical hypotheses) — это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.

Статистический тест или статистический критерий — строгое математическое правило, по которому принимается или отвергается статистическая гипотеза.

Нулевая гипотеза (null hypothesis) – гипотеза об отсутствии различий (утверждение об отсутствии различий в значениях или об отсутствии связи в генеральной совокупности)

 Согласно нулевой гипотезе (Н0), различие между значениями недостаточно значительно, а независимая переменная не оказывает никакого влияния Альтернативная гипотеза (alternative hypothesis) – гипотеза о значимости различий (утверждает наличие различий или существование связи) •

Альтернативная гипотеза (HА) является «рабочей» гипотезой исследования. В соответствии с этой гипотезой, различия достаточно значимы и обусловлены влиянием независимой переменной

 Нулевая и альтернативная гипотезы представляют полную группу несовместных событий: отклонение одной влечет принятие другой

• Основной принцип метода проверки гипотез состоит в том, что выдвигается нулевая гипотеза Н0, с тем чтобы попытаться опровергнуть ее и тем самым подтвердить альтернативную гипотезу HА. Если результаты статистического теста, используемого для анализа разницы между средними, окажутся таковы, что позволят отклонить Н0, это будет означать, что верна НА, т.е. выдвинутая рабочая гипотеза подтверждается •

 Не можем отклонить нулевую гипотезу - не значит «принять» альтернативную (нулевая гипотеза никогда не может быть абсолютно подтверждена!)

При проверке статистических гипотез возможны ошибки (ошибочные суждения) двух видов:

— можно отвергнуть нулевую гипотезу, когда она на самом деле верна (так называемая ошибка первого рода );

— можно принять нулевую гипотезу, когда она на самом деле не верна (так называемая ошибка второго рода ).

Ошибка, состоящая в принятии нулевой гипотезы, когда она ложна, качественно отличается от ошибки, состоящей в отвержении гипотезы, когда она истинна. Эта разница очень существенна вследствие того, что различна значимость этих ошибок.

Процедура проверки нулевой гипотезы в общем случае включает следующие этапы:

1. задается допустимая вероятность ошибки первого рода (Ркр=0,05)

2. выбирается статистика критерия (Т)

3. ищется область допустимых значений

4. по исходным данным вычисляется значение статистики Т

5. если Т (статистика критерия) принадлежит области принятия нулевой гипотезы, то нулевая гипотеза принимается (корректнее говоря, делается заключение, что исходные данные не противоречат нулевой гипотезе), а в противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза. Это основной принцип проверки всех статистических гипотез.

       Обычно первые три этапа выполняют профессиональные математики, а последние два – пользователи для своих частных данных.

В современных статистических пакетах на ЭВМ используются не стандартные уровни значимости, а уровни, подсчитываемые непосредственно в процессе работы с соответствующим статистическим методом. Эти уровни, обозначенные буквой P, могут иметь различное числовое выражение в интервале от 0 до 1, например, 0,7 0,23 0,012. Понятно, что в первых двух случаях полученные уровни значимости слишком велики и говорить о том, что результат значим нельзя. В последнем случае результаты значимы на уровне 12 тысячных. Это достоверный результат.

При проверке статистических гипотез с помощью статистических пакетов, программа выводит на экран вычисленное значение уровня значимости Р и подсказку о возможности принятия или неприятия нулевой гипотезы.

Если вычисленное значение Р превосходит выбранный уровень Ркр,
то принимается нулевая гипотеза, а в противном случае — альтернативная гипотеза. Чем меньше вычисленное значение Р, тем более исходные данные противоречат нулевой гипотезе.

 

34. Уровень статистической значимости. Понятие, практическое применение.

Зона значимости                                                                     зона неопределенности                         зона незначимости

                                                                   |                  |

0                 |0,001         |0,01           |0,05           |0,1                                     1


Статистическая значимость (p-уровень) – вероятность получить результат о наличии связи, когда в генеральной совокупности связи нет (верна H0), т.е. полученная связь носит случайный характер

Уровень значимости – это вероятность того, что мы сочли различия существенными, а они на самом деле не случайны.

p-уровень значимости – количественная оценка надежности связи: чем меньше p, тем надежнее связь (значимость выше)

Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или при р≤0,05, то мы имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0,05.

Когда мы указываем, что различия достоверны на 1%-ом уровне значимости, или при р≤0,01, то мы имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0,01.

напр., проверка гипотезы про память дала результат p = 0,05; это означает, что вероятность случайного различия уровня памяти мальчиков и девочек не превышает 5%

⇨ Уровень значимости – это вероятность отклонения нулевой гипотезы, в то время как она верна

Что определяет уровень значимости (p)?

Значимость тем выше (p меньше), чем:

• больше величина связи;

• больше объем выборки;

• меньше изменчивость признака.

NB: чем больше гипотез проверяется на одной выборке, тем выше вероятность получить случайный результат

• напр., если при p < 0,05 проверяется 20 гипотез (напр., корреляция), то одна из гипотез наверняка подтвердится

Принято (в психологии) использовать несколько критических значений p-уровня

 

35. Интерпретация статистических решений. Основные принципы. Статистический вывод.

p-уровень Решение Возможный статистический вывод
p > 0,1 Принимается H0 «Статистически достоверные результаты не обнаружены»
p ≤ 0,1 Сомнение в истинности H0 (неопределенность) «Различия обнаружены на уровне тенденции»
p ≤ 0,05 Значимость различий, отклонение H0 «Обнаружены статистически значимые (достоверные) различия»
p ≤ 0,01 Высокая значимость различий, отклонение H0 «Различия обнаружены на высоком уровне статистической значимости»

Модель статистического вывода – оценка значимости (истинности) проверяемой гипотезы в рамках выбранной описательной модели

Статистический вывод (statistical inference) представляет собой процесс получения логических выводов о статистической совокупности на основании случайно извлеченных выборок. Логика статистического вывода не зависит от конкретной проблемы и используемых статистических методов. На основании выборки исследователь тестирует те или иные гипотезы, часто:

· о различии статистических совокупностей,

  • наличии закономерностей,
  • отсутствии случайностей.

Проверка этих статистических гипотез может быть уложена в следующую последовательность этапов статистического вывода:

· Формируется нулевая и альтернативная гипотезы. Например, нулевая гипотеза (Ho): параметр совокупности равен какому-то определённому значению, альтернативная теория (Ha): не равен. Обычно исследовательская теория является альтернативной к уже существующей парадигме. Чаще всего мы хотим указать на имеющую место новую закономерность (альтернативная гипотеза) и соотнести ее с консервативной нулевой гипотезой (которая часто говорит о случайной природе находок и об отсутствии закономерностей в реальности).

· Формируется случайная выборка элементов совокупности и определяются параметры выборки.

· Преобразуется параметр выборки в статистический критерий.

· Находим p-значение для полученного статистического критерия.

· Сравниваем с критическим значением статистического критерия.

· Делаем выводы о сохранении нулевой гипотезы или о подтверждении альтернативной.

   Нулевая гипотеза сохраняется или отвергается исходя из того, насколько вероятным оказывается наблюдаемый результат. Для оценки выборочных статистик в отношении изменчивости используются статистические критерии, для которых имеются рассчитанные распределения и по которым эти самые вероятности можно посчитать (z-, хи-квадрат-, t-, и прочие виды распределений).

Если различие между исследуемыми группами (выборками) заметно выражено относительно величины изменчивости данных, исследователь отвергает нулевую гипотезу и делает вывод, что случайное появление такого результата маловероятно: полученный результат статистически значим.

       Обобщение и интерпретация статистической информации - проводится анализ статистической информации на основе применения обобщающих статистических показателей: абсолютных, относительных и средних величин, вариации, тесноты связи и скорости изменения социально-экономических явлений во времени, индексов и др. проведение анализа позволяет проверить причинно-следственные связи изучаемых явлений и процессов, определить влияние и взаимодействие различных факторов, оценить эффективность принимаемых управленческих решений, возможные экономические и социальные последствия складывающихся ситуаций.

Основные принципы:

  •  Принцип полноты материалов предполагает охват наблюдением всех намеченных к обследованию единиц наблюдения и получение ответов на все вопросы программы. Если не обеспечена полнота учета, то возможна корректировка итогов путем «досчета». Сопоставимыми являются материалы наблюдения, полученные по единой методике, по одинаковому кругу единиц, за одни и те же сроки, на одной и той же территории. Для приведения данных к сопоставимому виду необходимо все несоответствия устранить путем расчета относительных величин или смыкания рядов совокупностей.
  •  Принцип своевременности означает необходимость проведения наблюдения и предоставления пользователям сводных итогов в такие сроки, в пределах которых информация не устаревает, сохраняет актуальность и отвечает потребностям пользователя.

 

36. Проблема статистического вывода в психолого-педагогическом исследовании.

Статистические выводы используются для обобщения данных из выборки в отношении всей генеральной совокупности. Случайные ошибки, характерные для выборочного исследования, могут привести к тому, что выборка не будет [достаточно точной] моделью генеральной совокупности. В действительности выборка никогда не является моделью генеральной совокупности на все 100%, а лишь ее более или менее искаженным вариантом. Для того, чтобы оценить такие искажения и, следовательно, сделать более точные выводы о генеральной совокупности и используются статистические выводы.

       Прежде всего, они позволяют оценить вероятность того, что выявленные в выборке взаимосвязи, различия, величины и т.д. характерны исключительно для выборки, но не для генеральной совокупности. Логика здесь следующая: если такая вероятность высока, то принимается решение, согласно которому параметры выборки не характерны для генеральной совокупности и наоборот – если такая вероятность низка, то принято считать, что соответствующие параметры выборки говорят о параметрах генеральной совокупности.

       Важно помнить – достижение 100% гарантии того, что результаты, полученные в исследовании, характерны для генеральной совокупности, возможно лишь в том случае, когда проведено сплошное исследование, т.е. опрос всех представителей генеральной совокупности. Но это уже не выборочное исследование и оно не предполагает использование статистических выводов.

В самом общем виде статистические выводы можно разделить на две группы:

1) интервальное оценивание (построение интервала, в который с заданной вероятностью должно попасть среднее значение либо пропорция генеральной совокупности);

2) проверка статистических гипотез (вероятностный вывод о том, что определенные параметры выборочной совокупности отображают (или же нет) параметры генеральной совокупности).

 

37. Описательные статистики и представление результатов исследования.

Первичная обработка данных: описательные статистики (источник презентация)

Первый шаг в обработке данных (второй – после проверки на ошибки, выбросы и пропуски) – оценка свойств распределения количественных переменных

Тесно связана с представлением данных

Цель – продемонстрировать характер данных, описание их в обобщенной форме

Обычно используется при описании выборки и основных переменных

Выделяют 2 группы описательных статистик:

· Меры центральной тенденции

· Меры изменчивости

Меры центральной тенденции отражают наиболее типичное значение выборки (распределения)

Среднее – основная мера центральной тенденции. Применима лишь к метрическим данным (интервальным, отношений). Удобно для интерпретации нормального (симметричного) распределения.

(источник сеть) Количественные (метрические) данные являются непрерывными по своей структуре. Эти данные либо измерены с помощью интервальной шкалы (числовая шкала, количественно равные промежутки которой отображают равные промежутки между значениями измеряемых характеристик)

Категориальные (неметрические) данные – это качественные данные с ограниченным числом уникальных значений и категорий. Существует два вида категориальных данных: номинальные – используется для нумерации объектов и порядковые – данные, для которых существует естественный порядок категорий.

(источник презентация)! Грубая ошибка – среднее для номинативных переменных.

Примеры номинальных переменных включают регион, почтовый индекс или религию.

Медиана – делит распределенные данные пополам. Может выступать альтернативой среднему, когда она не симметрично или использованы порядковые переменные.

Мода – наиболее часто встречающееся значение. Это единственная МЦТ для номинальных данных (модальная категория – та градация, которая встречается чаще всего). Нередко может встречаться несколько мод.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: