При выполнении физических экспериментов данные обычно представляются с той или иной случайной погрешностью. Поэтому их обработка нуждается в соответствующих статистических методах. Рассмотрим функцию rnd (x) – функция генерации случайных чисел. При каждом обращении к ней она возвращает случайное число с равномерным распределением на отрезке [0,1]. Эта функция широко применяется при статистическом моделировании различных физических процессов. Числа являются не строго случайными, в действительности, это повторяющиеся последовательности из большого количества чисел, распределение которых близко к нормальному.
Рассмотрим некоторые функции, относящиеся к вычислению основных статистических параметров одномерного массива данных – вектора:
mean (V) возвращает среднее значение элементов вектора V;
var (V) – возвращает дисперсию (вариацию) для элементов вектора V;
stdev (V) – задает стандартное отклонение элементов вектора V;
Задача_8. Применим описанные функции. Зададим 1000 случайных чисел, т.е. сгенерируем вектор X из 1000 случайных чисел: задать i в диапазоне от 1 до 1000; задать
как rnd(10). Построить график распределения случайных чисел: зависимость xi от i (использовать точечное представление типа «линий»). Вычислить среднее значение для элементов вектора X, дисперсию, максимальное и минимальное значения и стандартное отклонение.
Выполнение регрессии
Широко распространенной задачей обработки данных является представление их совокупности некоторой функцией y (x). Задача регрессии заключается в получении параметров этой функции такими, чтобы функция приближала «облако» исходных точек (заданных векторами VX, VY) с наименьшей среднеквадратичной погрешностью.
Выполнение линейной регрессии. Чаще всего используется линейная регрессия, при которой функция y (x) имеет вид: y (x)= a + bx и описывает отрезок прямой.
Для проведения линейной регрессии используются функции:
corr (VX,VY) – возвращает скаляр – коэффициент корреляции Пирсона.
intercrpt (VX,VY) – возвращает значение параметра a (смещение линии регрессии по вертикали);
slope (VX,VY) – возвращает значение параметра (угловой коэффициент линии регрессии).
Чем ближе коэффициент корреляции к 1, тем точнее представленная исходными точками зависимость приближается к линейной.
Задача_9. Выполним линейную регрессию для векторов VX, VY. Найти коэффициент Пирсона. Построить график функции регрессии и исходных точек.
¿ _9. 1) Зададим векторы VX, VY

2) Установим опцию (столбцы матрицы нумеруются с 1)

3) Вычислим значения параметров a и b для задания функции в виде y (x)= a + bx:
Вывести значения параметров на экран.
4) Зададим теперь некоторое i от 1 до 5 и зададим функцию y (x).
5) Вычислим коэффициент корреляции Пирсона:

6) Построить график, на котором отобразить зависимость VYi от VXi и y от i.
Выполнение линейной регрессии общего вида. При выполнении регрессии такого вида заданная совокупность точек приближается функцией вида:
. Таким образом, функция регрессии является линейной комбинацией функций
, причем сами эти функции могут быть нелинейными. Для реализации линейной регрессии общего вида используется функция:
linfit (VX,VY,F) – возвращает вектор коэффициентов линейной регрессии общего вида K, при котором среднеквадратичная погрешность приближения «облака» исходных точек, координаты которых хранятся в векторах VX, VY, оказывается минимальной. Вектор F должен содержать функции
, записанные в символьном виде.
Расположение координат точек исходного массива может быть любым, но вектор VX должен содержать абсциссы, упорядоченные в порядке возрастания. Вектор VY должен содержать ординаты, соответствующие абсциссам в векторе VY.
Задача_10. Выполним линейную регрессию общего вида для заданных значений.
¿ _10. 1) Зададим векторы VX, VY и F(x):

2) Задать i, вектор коэффициентов, задать функцию g(t) как искомую и равную произведению K 1 F 1 (см. выше определение), т.е. в нашем случае:

3) Построить график зависимости VYi от VXi и g от r.






