Диаграмма разброса (рассеивания)

Диаграмма разброса представляет собой точечную диаграмму в виде графика, получаемого путем нанесения в определенном масштабе экспериментальных точек, полученных в результате наблюдений. Координация точек на графике соответствует значениям рассматриваемой величины и влияющего на него фактора. Расположение точек показывает наличие и характер связи между двумя переменными. По полученным экспериментальным точкам могут быть определены и числовые характеристики связи между рассматриваемыми случайными величинами коэффициент корреляции и коэффициенты регрессии.

Диаграмма разброса (рассеяния) применяется для выявления зависимости (корреляции) одних показателей от других или для определения степени корреляции между n парами данных для переменных x и y:

(x1,y1), (x2,y2),..., (xn, yn).

Эти данные наносятся на график (диаграмму разброса), и для них вычисляется коэффициент корреляции по формуле

,

,

,

Где, ковариация;

стандартные отклонения случайных переменных x и у;

n – размер выборки (количество пар данных – хi и уi);

и – среднеарифметические значения хi и уi cоответственно.

На рис. представлены различные варианты диаграмм разброса (или полей корреляции).

Рис. Варианты диаграмм разброса.

В случае:

а) можно говорить о положительной корреляции (с ростом x увеличивается y);

б) проявляется отрицательная корреляция (с ростом x уменьшается y);

в) при росте x y может как расти, так и уменьшаться, говорят об отсутствии корреляции. Но это не означает, что между ними нет зависимости, между ними нет линейной зависимости. Очевидная нелинейная (экспоненциальная) зависимость представлена и на диаграмме разброса г).

Коэффициент корреляции всегда принимает значения в интервале . Т.е. при r>0 – положительная корреляция, при r=0 – нет корреляции, при r <0 – отрицательная корреляция.

Для тех же n пар данных (x1,y1), (x2,y2),..., (xn, yn) можно установить зависимость между x и y. Формула, выражающая эту зависимость, называется уравнением регрессии (или линией регрессии), и ее представляют в общем виде функцией

у = а +

Для определения линии регрессии (рис.10) необходимо статистически оценить коэффициент регрессии b и постоянную a.

Для этого должны быть выполнены следующие условия:

1) Линия регрессии должна проходить через точки (x,y) средних значений x и y.

2) Сумма квадратов отклонений от линии регрессии значений y по всем точкам должна быть наименьшей.

3) Для расчета коэффициентов а и b используются формулы

()

, ()

Рис. Пример линии регрессии.

Правила построения диаграммы разброса (рассеивания) [Кузьмин ММк2006 №2]:

1. Определить, между какими парами данных необходимо установить наличие и характер связи (желательно не менее 25-30 пар).

2. Для сбора данных подготовить бланк таблицы или листок регистрации, предусмотрев в нем графы для порядкового номера наблюдения, независимой переменной характеристики (х), зависимой переменной, называемой функцией – откликом (у).

3. По данным наблюдения заполнить листок регистрации данных.

4. По полученным данным построить график в координатах х-у и нанести на него данные. Длина осей, равная разности между максимальными и минимальными значениями для оси х и у, по вертикали и по горизонтали должна быть примерно одинаковой, тогда диаграмму легче читать.

5. Нанести на диаграмму все необходимые обозначения. Данные на диаграмме должны быть понятны любому человеку, а не только тому кто занимался построением диаграммы.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: