Корреляционная связь — статистическая взаимосвязь величин

Стандартная ошибки выборки (u) — стандартное отклонение выборочных средних.

Q — среднее квадратическое отклонение, n — объём выборки

 

 

 

 

Предельная ошибка выборкизначение, которое определяет величину доверительного интервала в целом. D = tu

 

Величина доверительного интервала пропорциональна ошибке выборки. Величина доверительного интервала зависит от параметра t, который выбирается, исходя из уровня надёжности. T=1, уверенность 67%, t=2, уверенность 95%, t=3, уверенность 99,7%.

 

Точность (D) и уверенность (P) оценки находятся в обратной зависимости, чем больше точность и меньше предельная ошибка и доверительный интервал, тем меньше надёжность такой оценки.

 

Последовательность действий при построении доверительного интервала:

1) вычисляется коэффициент вариации и x;

2) вычисляется средняя ошибка выборки;

3) выбирается доверительная вероятность P и соответствующее ей значение параметра;

4) вычисляется предельная ошибка D как произведение t и u.

5) строится интервал.

 

Билет 6.

 

Роль среднего арифметического в выборочном методе играет доля или частота признака.

 

Доля вычисляется как отношение числа объектов, обладающих данным признаком n к числу объектов всей совокупности q=n0/n. Часто выражена в процентах.

 

Роль меры рассеяния играет величина

 

Стандартная ошибка выборки для оценки доли качественного признака в генеральной совокупности вычисляется по формуле:

 

 

Используя стандартную ошибку выборки, можно построить доверительный интервал для доли:

 

 

 

Последовательность действий такая же.

 

Билет 7.

 

Корреляционная связь — статистическая взаимосвязь величин.

Коэффициент корреляции — показатель тесноты связи между двумя переменными. Принимает значения r от -1 до 1.

Если r=1, между двумя переменными существует положительная линейная связь, т. е. На диаграмма рассеяния соответствующие точки лежат на одной прямой с положительным наклоном. Удалённость точек от прямой указывает на силу связи — чем они дальше, тем связь слабее. Прямая снизу вверх.

 

Если r=-1, между двумя переменными существует функциональная отрицательная линейная зависимость, т. е. На диаграмме рассеяния соответствующие точки лежат на одной прямой с отрицательным наклоном. Прямая сверху вниз.

 

Коэффициент детерминации — показатель того, насколько сильно изменения зависимого признака объясняются изменениями независимого. Это квадрат r(r^2). Диапазон от 0% до 100%.

 

Значимость коэффициента детерминации проверяется в результате построения для него доверительного интервала. Если в этот интервал не попадает 0, значит, r является статистически значимым. Положительные или отрицательные значения в интервале роли не играет.

 

Если коэффициент детерминации вычислен на основе выборки, то не исключено, что его ненулевое значение обусловлено только особенностями выборки. Нужно понять насколько r далёк от 0.

1. Вычисляем ошибку r

 

умножаем на t

2. Доверительный интервал r+-sr

3. Если 0 не попадает в интервал, коэффициент статистически значим.

 

Билет 8.

 

Парная регрессия — взаимосвязь между двумя признаками.

 

Прямая линия описывается уравнением вида y=a+bx, где y — зависимая переменная, a — координата точки пересечения прямой с осью y, b — коэффициент регрессии (указывает на наклон прямой).

 

Коэффициент регрессии показывает, как в среднем изменится результативный признак y, если факторный признак (x) увеличится на единицу. Единица измерения — y/x — результативный на факторный. Может принимать любые значения.

 

Пример: y=5+127x — при увеличении x на единицу y увеличится на 127.

 

Для проверки значимости каждого коэффициента регрессии вычисляется t-статистика, которая показывает, во сколько раз этот коэффициент превышает свою среднюю ошибку в выборке.

 

Соответствующая величина P измеряет вероятность случайного появления в выборке значений t, равных или больших, чем данное значение. Если вероятность p меньше выбранного уровня значимости (по умолчанию 5% или 0,05), то соответствующий коэффициент регресии, является статистически значимым.

 

Чем больше по абсолютной величине значение t, тем меньше соответствующая вероятность p. Величина t для коэффициентов, значимых на уровне 5%, больше 2 по модулю.

 

Билет 9.

 

Множественная регрессия — тип связи, при котором на зависимую переменную действуют сразу несколько факторов, среди которых трудно выделить единственный или главный. Регрессионное уравнение выглядит y=a+bx1+bx2…

 

В свою очередь, коэффициент регрессии в множественной регрессии показывает, как в среднем изменится значение зависимого признака, если соответствующий независимый признак увеличится на единицу при фиксированных значениях всех остальных факторов.

 

Мультиколлинеарность — влияние независимых факторов друг на друга. При этом, факторные признаки рассматриваются как независимые к результирующему, но таковыми по отношению друг к другу не являются.

 

Коэффициент множественной корреляции — обобщение коэффициента парной корреляции для случаев, где число независимых факторов больше одного. R безразмерен, не меняется при изменени единиц измерения признаков и принимает значения от 0 до 1.

 

Коэффициент детерминации R2 показывает, насколько изменения зависимого признака (в процентах) объясняются изменениями совокупности независимых признаков.

 

Билет 10.

 

Методы анализа структуры множества объектов образуют совокупность методов многомерной классификации. Методы многомерной классификации позволяют группировать объекты с учётом всех существенных признаков. Такая классификация производится на основе стремления собрать в одну группу схожие объекты, чтобы остальные были несхожими.

 

Основные методы многомерного анализа:

· кластерный анализ;

· метод k-средних;

· нечёткая классификация.

 

Кластерный анализобъединение множества сходных признаков в одну группу в зависимости от расстояния между соответствующими точками в пространстве. Характер распределения этих точек в пространстве признаков определяет структуру сходства и различия объектов в заданной системе показателей. О сходстве объектов судят по расстоянию между соответствующими точками.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: