Статические методы исследования данных

Возникает вопрос: существует ли взаимосвязь между различными переменными экосистемы. Ответ можно получить посредством регрессионного или корреляционного анализа в зависимости от цели задачи. Вид связи между переменными выражается регрессионным уравнением, а ее интенсивность — с помощью корреляции.

Регрессия и корреляция. Регрессионный анализ необходим для решения задач, в которых стохастические зависимости (стохастические отношения «причина — следствие») описываются функциями с одной или несколькими переменными, определяемыми как независимые.

Простая регрессия с одной независимой переменной х и одной зависимой переменной.у может быть линейной или нелинейной. Обычно нелинейные регрессии (рис. 1) можно получить с помощью линеаризации (преобразования переменных) и упрошенных вычислительных методов. Этот подход может отрицательно сказаться на качестве аппроксимации. Методы оценивания дают так называемые несмещенные оценки. В тех случаях, когда ни одну из переменных нельзя считать зависимой, для статистического описания более всего подходят такие методы, как линия наилучшего приближения Бартлетта или геометрическое среднее. В основе метода геометрического среднего лежит усреднение наклонов линейных регрессий у = f(x) и x = f (v), и то время как линия наилучшего приближения Бартлетта строится на основе оценочных данных подвыборки.

Множественная регрессия имеет одну зависимую и несколько независимых переменных. Наиболее часто используются линейные уравнения.

Во многих ситуациях для описания экологических процессов или систем используются полиномы n-го порядка {полиномиальные регрессии) (рис. 1.).

Самая высокая степень п выражает порядок полинома. Если используются полиномы высоких порядков, то возникает вопрос о возможности интерпретации переменных в степени. Для некоторых переменных, имеющих наивысшуюую степень третьего порядка, возможна вполне обоснованная физическая интерпретация (например, насыщение растворенным кислородом / (T_w) можно выразить в виде полинома третьего порядка. Однако в большинстве случаев полиномы служат лишь для описания взаимосвязей.

В результате замены переменных х функциями синуса и косинуса получаем уравнение:

у = а + b₁sinх + b ₂ cosх.

Оно представляет собой простейший вид периодической регрессии, или так называемого полинома Фурье. В более широком смысле этот метод называйся анализом Фурье

Этот вид регрессии часто используется для определения периодической направленности изменений, когда проводится анализ данных измерений качества воды, воздуха и т.д.


РИС. 1. Регрессия полиномами 2 порядка (2-7-го порядков). Для каждого порядка используется одна и та же система точек. Возрастание порядка сопровождается увеличением показателя эффективности г² до тех пор, пока кривая не пройдет через все точки (г² = I). Высшие порядки могут сопровождаться отрицательными модельными результатами, которые не согласуются с действительностью (например, как в 7-м порядке). Значения модельных параметров резко уменьшаются по мере возрастания порядка.
Нелинейные регрессии

Корреляционный анализ применяется с целью установления степени корреляции между двумя или большим числом стохастических переменных, а также для определения степени стохастической зависимости, существующей между ними. Последняя может быть описана с помощью коэффициентов корреляции. Двусторонние и многосторонние зависимости описываются простыми коэффициентами, а также коэффициентами частной и множественной корреляции. Коэффициент частной корреляции также необходим при выборе переменных, оказывающих влияние на экосистему. Если предполагается многомерное нормальное распределение, то оно будет служить мерой линейной зависимости двух случайных переменных х_j и х_k при устранении влияния всех остальных случайных переменных. Квадрат коэффициента корреляции называется коэффициентом детерминации R².

Дисперсионный и ковариационный анализы. Дисперсионный анализ (AOV) представляет собой способ качественного и количественного изучения влияния одной или нескольких переменных на результаты эксперимента. В тех моделях, где это влияние имеет фиксированный характер, обычно сравниваются лишь средние значения нескольких случайных выборок. Однако в моделях, учитывающих случайные эффекты, сами влияющие факторы рассматриваются как случайные выборки из множества возможных появлений этих факторов. Такая же картина может иметь место при рассмотрении непрерывно контролируемых качественных параметров воды.

Ковариационный анализ можно использовать при количественном изучении различной степени воздействия одной или нескольких переменных на экспериментальные данные, и при этом обязательно учитывается влияние дополнительных случайных переменных. По существу этот метод позволяет объединить дисперсионный и регрессионный анализы, каждый из которых относится к моделям с фиксированными воздействиями.

Дискриминантный и факторный анализы. Дискриминантный анализ применяется для разделения или классификации объектов и их связи с двумя и более совокупностями (группами, популяциями). Фактически он представляет собой способ разделения. Последнее выполняется на основе анализа количественных характеристик и учета дискриминантной (разделительной) функции, с которой связано принятие решения о проведении классификации.

Факторный анализ используется для изучения соотношений между случайными переменными, обусловленных общими причинами, или факторами, а также с целью вывода этих соотношений. При этом особое внимание уделяется точечному оцениванию параметров.

Методы дискриминантного и факторного анализов были разработаны в общей экологии и фитоэкологии высших растений с целью типизации пространственно-временных отношений различных видов и переменных окружающей среды. В результате информация о различных биологических видах или переменных окружающей среды, представляющих собой кластеры в пространстве и времени, поступает одновременно. Это обстоятельство является отправной точкой, от которой начинается использование кластерного анализа для обнаружения источников загрязнения потоков. Этот же метод применен в для определения взаимосвязи между переменными трофического состояния.

Методы оценки параметров. Обычно очень трудно получить параметры модели из реальной системы. Поэтому они оцениваются исходя из данных наблюдений за различными переменными и их выборочных статистических функций. Это могут быть точечные оценки или оценки на интервалах, в зависимости от того, определяется ли сам параметр или интервал, в котором он находится. Подобные оценки удобно получать с помощью статистических компьютерных пакетов программ. Для получения нелинейной оценки (простых) функций существует несколько способов – алгоритм Гаусса — Зайделя, алгоритм Ньютона — Рафсона, метод Маркварта и др

Чтобы получить неизвестный параметр а на основе данных измерений, а затем оценить его, необходимо рассчитать значение g определенной оценочной функции G, распределение которой зависит от а. Значение g используется для оценки а, обозначаемой а. Функция С определяется как оценочная функция неизвестного параметра а.

Методы оценки параметров, в основе которых лежит метод наименьших квадратов, оказались особенно эффективными в экологии. Существуют прямые и косвенные методы. Прямые методы (регрессия, марковская оценка, оценка Байеса, оценка максимального правдоподобия) позволяют оценивать параметры в течение одного шага, исходя из массива данных измерений на входе и выходе сигналов из системы. При использовании этих методов могут возникнуть проблемы их применимости на практике ввиду необходимости иметь априорную информацию о системе, играющей роль исходной модели. Косвенные методы делятся на рекурсивные и нерекурсивные. Рекурсивные методы позволяют подстраивать модель с данной структурой к системе пошаговым способом, при котором каждая новая группа данных измерений дает возможность сделать очередной шаг в подстройке модели. Все параметры должны подвергаться переоценке на протяжении всего процесса

16 17 18 19 20 21 22

Подборка статей по вашей теме: