Ранговые корреляции и взаимосвязи в педагогических экспериментах

Доверительный интервал

До сих пор мы находили различные числовые характеристики выборки, которые определяются одним числом. Такие оценки называются точечными. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. Поэтому для небольших выборок следует пользоваться интервальными оценками. Интервальной называют оценку, которая определяется двумя числами – концами интервала. Интервальная оценка позволяет установить точность и надежность оценок, а сами интервалы в этом случае называются доверительными.

Доверительным интервалом называется интервал, построенный с помощью случайной выборки из распределения с неизвестным параметром, такой, что он содержит данный параметр с заданной вероятностью α.

В педагогике наиболее распространенным является оценка математического ожидания a случайной величины X, распределенной по нормальному закону, при известном среднем квадратическом отклонении σ. В этом случае для оценки математического ожидания a служит интервал:

где – точность оценки, n – объём выборки, – выборочное среднее, t – аргумент функции Лапласа, при котором.

Рассмотрим пример. Пусть среднее квадратическое отклонение σ нормально распределенного признака X генеральной совокупности равно 5, объём выборки n равен 100 и выборочное среднее. Найдем доверительный интервал математического ожидания a при α=0,9.

Все величины, кроме t, известны. Найдем t по специальной таблице, исходя из соотношения Получим, что t=1,65, следовательно:

или 19,175≤a≤20,825.

Таким образом, можно сделать вывод о том, что математическое ожидание генеральной совокупности с вероятностью α=0,9 окажется внутри полученного интервала.

Во многих педагогических задачах требуется установить и оценить зависимость одной случайной величины от другой. Две случайные величины могут быть связаны функциональной зависимостью, что случается крайне редко, либо зависимостью другого рода, называемой статистической, либо быть независимыми.

Статистической называется зависимость, при которой изменение одной из величин влечет изменение распределения другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется выборочная средняя другой. В этом случае статистическую зависимость называют корреляционной.

В математической статистике для любой измеряемой величины можно вычислить числовые характеристики. Они помогают произвести интерпретацию данных, записанных в числовом виде. Однако, с их помощью не представляется возможным описать связь между двумя величинами. Существует ряд способов, позволяющих определить параметры связи нескольких измеряемых величин. Наиболее простым среди них можно назвать метод, использующий понятие ранговой корреляции. Для применения данного метода на практике регистрируют два показателя на одной выборке испытуемых, предварительно их проранжировав.

Коэффициент ранговой корреляции – это число, по которому можно определить характер и силу связи.

Предположим, что у группы испытуемых с помощью некоторой методики оценивались такие качества, как аккуратность и вежливость. По характеру связь может быть либо прямой, либо обратной.

Прямая связь показывает, что высокий уровень одной измеряемой величины (например, аккуратности) соответствует достаточно высокому уровню другой измеряемой величины (в данном случае, вежливости). Таким образом, прямая связь между аккуратностью и вежливостью показывает, что от аккуратного человека следует ожидать, что он окажется вежливым. Обратная связь, напротив, демонстрирует, что наиболее высоким значениям первой величины соответствуют наиболее низкие значения второй измеряемой величины. Т.е. наличие обратной связи между аккуратностью и вежливостью показало бы, что наиболее аккуратные люди данной выборки являются наименее вежливыми, и наоборот: вежливым людям не свойственна аккуратность.

Однако, знать только характер связи величин недостаточно для полноценного описания этой связи. Важным является также понятие силы. Чем сильнее связь, тем ярче выражена зависимость измеряемых величин.

Коэффициент ранговой корреляции позволяет выявить как силу, так и характер связи. В определении рангового коэффициента корреляции ключевую роль играет понятие ранга. Расположим значения x1, x2, …, xn величины X в порядке возрастания (или убывания), т.е. x1<x2<…<xn (или x1>x2>…>xn). Тогда в имеющейся выборке значение xi величины X можно заменить рангом i этого значения. При наличии равных показателей у записанных значений им присваивается общий ранг, равный среднему арифметическому соответствующих вариантных мест. Замена значений величины X на соответствующие ранги называется ранжированием. Проранжировав значения величин X и Y, мы получим новые выборки, по которым можно вычислять ранговые коэффициенты корреляции.

Среди ранговых коэффициентов корреляции следует выделить коэффициент Спирмена, определяющийся по формуле:

где di – разность соответствующих рангов величин X и Y, n – объём выборки.

Коэффициент корреляции Спирмена обладает следующими свойствами:

  1. Коэффициент корреляции может принимать значения от минус единицы до единицы, причем при rs=1 имеет место строго прямая связь, а при rs= -1 – строго обратная связь.
  2. Если коэффициент корреляции отрицательный, то имеет место обратная связь, если положительный, то – прямая связь.
  3. Если коэффициент корреляции равен нулю, то связь между величинами практически отсутствует.
  4. Чем ближе модуль коэффициента корреляции к единице, тем более сильной является связь между измеряемыми величинами. Связь принято считать сильной, если, средней силы, если 0.3<|rs|<0.7 и слабой, если. Заметим, что существует и более тонкая градация силы связи, представленная шкалой Чертока, отображенной в таблице:
Коэффициент корреляции Характеристика силы связи
|rs|<0,1 связь практически отсутствует
0,1<|rs|<0,3 слабая связь
0,3<|rs|<0,5 умеренная связь
0,5<|rs|<0,7 связь средней силы
0,7<|rs|<0,9 сильная связь
0,9<|rs|<1 очень сильная связь

Проиллюстрируем на примере, как рассчитывается коэффициент корреляции Спирмена. Определим характер и силу связи между результатами ЕГЭ по математике и физике, используя данные из приведенной ниже таблицы.

ученик                    
ЕГЭ, физика                    
ЕГЭ, математика                    

Проранжируем имеющиеся данные в порядке их убывания и найдём квадраты разностей соответствующих рангов. Особое внимание следует обратить на то, что пятое и шестое место по физике делят два ученика, набравшие по 75 баллов. В этом случае для данных испытуемых следует присвоить ранг 5,5 (т.е. среднее арифметическое значение между 5 и 6).

Физика, ранг         5,5 5,5        
Математика, ранг                    
di2         12,25 6,25        

Объём выборки n=10.Тогда:

Следовательно, имеет место прямая связь средней силы.

Использование коэффициента ранговой корреляции Спирмена очень удобно в силу относительной простоты его расчёта. Однако, в математической статистике показано, что коэффициент корреляции Спирмена применим не во всех случаях. Эффективность и качество оценки методом Спирмена снижается, если разница между различными значениями какой-либо из измеряемых величин достаточно велика. Не рекомендуется использовать коэффициент Спирмена, если имеет место неравномерное распределение значений измеряемой величины.

В рассмотренном примере значения измеряемой величины изменяется практически равномерно, без явных «скачков». Т.е., если расположить оценки в порядке убывания, то каждая последующая оценка отличается от предыдущей примерно одинаково. Кроме того, отличие значений двух оценок по сравнению с самими оценками относительно невелико. Поэтому в данном примере целесообразно использовать коэффициент Спирмена.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: