Ранговый коэффициент корреляции Спирмена г

В предыдущих разделах предполагалось, что данные включают в себя ка измерения. Если же возможны какие-либо процедуры, связанные с пострс последовательности, то действия без параметров неуместны. Типичным при являются маркетинговые исследования, например, исследование вкуса пищи нам понадобится испробовать четыре вида супа, то мы можем располож! в последовательности в порядке предпочтения от 1 до 4, но мы не сможем у точный принцип предпочтения. Такой вид данных называется порядк Данные, которыми мы пользовались до настоящего времени, называются i вальными.

Положим, двух людей попросили попробовать четыре вида супа. Вер что будет иметь место два вида вариаций принципов предпочтения. Две пс«вательности составляют две порядковые переменные. Мы можем сравни' последовательности по степени согласованности, используя ранговый kos циент корреляции Спирмена.

Коэффициент Спирмена г₅ не является параметрическим критерием в чии от коэффициента Пирсона:

Анализ данных как составная часть принятия решений

где d — разница между значениями рангов для каждой единицы- Так же как и коэффициент Пирсона, значение r_s изменяется от -1 до +1. Значимость коэффициента Спирмена может быть проверена таким же образом, что и значение коэффициента Пирсона.

□ Пример 8.4. Два человека дегустируют 10 супов. Нам нужно узнать, какой уровень согласованности достигнут между этими двумя дегустаторами.

Таблица 8.14. Определение уровня согласованности между двумя дегустаторами

Дегустатор*	А	В	С	D	Е	F	G	Н	/	У	Всего
Первый Второй	1 3	3 2	4 5		8 9	10 10	2 1	7 6		5 8
Разница (d) d²	-2 4	1 1	-1 1	2 4	-1	0 0		1 1	2 4	-3 9

Отсюда:

6 26 10-99'

1 - 0,158» 0,842

Для того чтобы оценить достоверность этого результата, укажем гипотезы, которыми мы руководствуемся.

Но: между двумя дегустаторами либо нет связи, либо они просто не согласованы друг с другом, т. е. р й 0.

Hf. существует согласованность (положительная связь), т.е. p_s>0.

Это односторонний критерий. Двусторонний критерий мы бы использовали, если бы нас интересовала либо положительная, либо отрицательная связь.

Значение критерия для п £ 10 (приближенно) имеет вид:

'■ = 2,53.

(г, - 0) 0,842

W(n-1) Vi

Из стандартных таблиц:

Zo_OS= 1,645.

Полученное значение критерия больше, чем 1,645. Результат достоверен на 5%-ном уровне. Отвергаем Нд и становится очевидной положительная связь между двумя дегустаторами. Нормальному приближение распределения верно только для п £ 10. Для п < 10 существуют специальные таблицы.

Гл. 8. Линейная регрессия

РЕЗЮМЕ

Построение линейной регрессии — это не что иное, как построение модели. Нам нужно объяснить изменяемость зависимой переменной в результате изменения независимой переменной.

Построение модели всегда начинается с выбора факторов, которые, вероятно, могут повлиять на зависимую переменную. Необходимо выбрать основные из них. В простой линейной регрессии (парной) имеется только одна независимая переменная. Модель выражается как:

у = а + Рх + е,

где е - остаток, часть у, которая не объясняется моделью, рассчитываемой -обычно по выборочной совокупности при помощи метода наименьших квадратов. Для прямой линии показатель наклона рассчитывается по формуле:

_ь_ ^пЕ^ху- Е*£у

а пересечение с осью OY:

5> ь£* а =

п п

Теснота линейной связи измеряется коэффициентом корреляции Пирсона г:

"Е³^^- Е^х£у

V(n£x²-(Xx)²)(n£y²-<£y)²)

Чем ближе г к -1 или к +1, тем точнее линейная модель описывает связь между хну. Коэффициент детерминации, г², измеряет долю вариации у, объяснимой х.

Кроме того, предполагается, что остатки нормально распределены с нулевым средним значением и стандартным отклонением ст_е, которое постоянно для всех значений х. Доверительные интервалы могут быть установлены для параметров р, а и Р с использованием выборочных оценок г, а и Ь. Для оценки достоверности используют гипотезы о значениях параметров. Для всех критериев нулевые гипотезы являются предположением о том, что в генеральной совокупности между переменными в генеральной совокупности не существует линейной связи. Значение критерия для р будет следующим:

t - Л/ ^ <^п ~ ²>

0-г²)

при (п-2) степенях свободы;

t &24.2. Анализ данных как составная часть принятия решений

дляр:

при (п-2) степенях свободы.

Для данного х, скажем хо, рассчитывается доверительный интервал для среднего значения у и для индивидуальных значений у, близких к среднему значению. Ширина таких интервалов изменяется, и они могут быть изображены с помощью кривых линий с каждой стороны линии регрессии.

Множественная регрессия имеет более чем одну независимую переменную в модели.-Обычно в этом случае все расчеты производятся с помощью компьютера. Для проверки достоверности связи также используют гипотезы. Если мы исследуем большое количество независимых переменных, применяется быстрый метод исключения недостоверных и не имеющих силу моделей и построения лучших моделей.

Нелинейные модели алгебраически могут быть превращены в линейные.

Коэффициент ранговой корреляции Спирмена рассчитывается аналогично, как и коэффициент Пирсона, когда нам важно прежде всего упорядочивание данных, нежели прямое измерение.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

24 25 26 27 28 29 30

Виды юридических лиц

Субъект, объект, объективная, субъективная стороны правонарушения

Соотношение законности и правопорядка

Раннее средневековье. Апологетика. Патристика. Схоластика

Технология приготовления заправочных супов

Язык как общественное явление

Самый сильный аргумент, почему эволюция человека не могла быть