Один из критериев, которые мы могли бы применить для подходящей линии регрессии на диаграмме рассеяния, основан на выборе линии, для которой сумма квадратов погрешностей будет минимальна.

Близость точек рассеяния к прямой измеряется ординатами отрезков. Отклонения этих точек могут быть положительными и отрицательными, но сумма квадратов отклонений теоретической прямой от экспериментальной всегда положительна и должна быть минимальна. Факт несовпадения всех точек рассеяния с положением линии регрессии указывает на существование расхождения между экспериментальными и теоретическими данными. Таким образом, можно сказать, что никакая другая линия регрессии, кроме той, которую нашли, не может дать меньшую сумму отклонений между экспериментальными и опытными данными. Следовательно, найдя теоретическое уравнение ý и линию регрессии, мы удовлетворяем требованию наименьших квадратов.
Это делается с помощью уравнения связи
, используя формулы для нахождения параметров а и b. Взяв теоретическое значение
и обозначив левую часть уравнения через f, получим функцию
от неизвестных параметров а и b. Значения а и b будут удовлетворять минимуму функции f и находятся из уравнений частных производных
и
. Это необходимое условие, однако для положительной квадратической функции это является и достаточным условием для нахождения а и b.
Выведем из уравнений частных производных формулы параметров а и b:


получим систему уравнений:

где
– среднеарифметические погрешности.
Подставив числовые значения, найдем параметры а и b.
Существует понятие
. Это коэффициент аппроксимации.
Если е < 33%, то модель приемлема для дальнейшего анализа;
Если е > 33%, то берём гиперболу, параболу и т.д. Это даёт право для анализа в различных ситуациях.
Вывод: по критерию коэффициента аппроксимации наиболее подходящей является та линия, для которых
, и никакая другая линия регрессии для нашей задачи не даёт минимум отклонений.






