Теоретические сведения. Тема: Исследование двумерной выборки

Тема: Исследование двумерной выборки.

Цель работы: научиться проводить корреляционный и регрессионный анализ заданной выборки.

Теоретические сведения.

При проведении корреляционного и регрессионного анализа, параметры могут подчиняться линейной и нелинейной зависимости.

Метод наименьших квадратов

Пусть на вход некоторого устройства подается сигнал х, а на выходе измеряется сигнал у, известно, что величины х и у связаны с функцией зависимостью, а какой именно – не известно. Требуется приближенно определить эту функцию, зависимость у= (х) по опытным данным.

Пусть в результате n-измерений получен ряд экспериментальных точек х у . Известно, что через n точек можно провести кривую аналитически, выражаемую многочленом (n-1), этот многочлен называется интерполяционным. Таким образом, замену функции f(x) на (x), так, что их значения совпадают в заданных точках называют, интерполяцией. Однако такое решение проблемы не является удовлетворительным, т.к. у от х часто отличаются из-за случайных ошибок. Поэтому у= (х)+ , где - некоторая случайная ошибка, поэтому требуется провести кривую, так чтобы она в наименьшей степени зависела от случайных ошибок. Это задача называется сглаживанием или аппроксимацией экспериментальной зависимости и часто решается она методом наименьших квадратов.

Задача аппроксимации решается следующем образом: в декартовой системе координат наносят точки х у , по расположению этих точек высказывается предположение о принадлежности искомой функции к определенному классу функции.

В общем случае (х)= (х, ), неизвестные параметры функции определяются из требования минимума суммы квадратов случайных ошибок. В случае линейной зависимости, необходимо найти таки параметры линии – коэффициент угла наклона и свободный коэффициент, при которых сумма квадратов отклонений всех точек от этой линии будет минимальна. Необходимый минимум величины (суммарной невязки) является обращение в 0 частных производных невязки.

Решая систему из r-уравнений, находят неизвестные параметры а , которые наилучшим образом аппроксимируют искомую функцию .

Имеем матричное уравнение, которое можно решить любым численным методом Гаусса (приводим матрицу к диагональному виду).

Ввиду простоты расчетов аппроксимации полиномами малых степеней используется довольно часто. Кроме того, многие функции, зависящие от двух параметров можно привести к линейному полиному. Для этого необходимо преобразовать исходную зависимость, в результате чего, она приобретает линейный вид.

Далее решается задача линейной аппроксимации для новой зависимости, и вычисленные коэффициенты пересчитываются в коэффициенты и . Ряд возможных замен приводится в таблице:

Вид зависимости	Замена переменных	Ограничения	Обратная замена переменных
Гиперболическая	v=y	u=	x	a	a
Логарифмическая	v=y	u=lnx	x>0	a	a
Показательная	v=lny	u=x	y>0 a	a	a
Степенная	v=lny	u=lnx	y>0 x>0 a	a	a
Комбинированная	v=	u=e	y	a	a