Корреляционный анализ

 

Между природными явлениями и процессами связь бывает односторонней и взаимной. Примером односто­ронней связи может быть формирование ледников в го­рах при низких температурах. Не менее широко пред­ставлена в географической среде двусторонняя связь, или взаимозависимость. Так, растительность влияет на аккумуляцию и качество гумуса почвы и, наоборот, со­держание гумуса в почве влияет на продуктивность растительности.

Связи между явлениями (или корреляцию) опреде­ляют путем постановки серии опытов. Математические методы позволяют установить тесноту таких связей с помощью корреляционного анализа. Корреляцию не сле­дует отождествлять с причинностью. Однако необходимо иметь в виду, что доказательство математической связи должно опираться на реальную зависимость между яв­лениями, так как иногда можно установить несущест­вующие корреляции. Например, минерализация воды понижается с севера на юг Белоруссии, в этом же на­правлении понижается содержание питательных веществ в почве. Между рассматриваемыми показателями может быть получена положительная достоверная зависимость. Однако степень минерализации воды не определяет оптимальное содержание питательных веществ. Иначе в ландшафтах пустынь плодородие было бы максималь­ным, так как здесь самая высокая минерализация воды, а это противоречит истине. Поэтому установление по­добной связи при проведении исследований бессмыс­ленно.

Любой показатель связи служит приближенной оцен­кой рассматриваемой зависимости и не является гаран­тией существования жесткой (функциональной) соподчиненности. Отсутствие жестких зависимостей способст­вует саморегуляции процессов и явлений в ландшафте. Вскрытие корреляции в географической среде позволяет предвидеть, прогнозировать закономерности развития природы.

По форме корреляционная связь бывает линейной и нелинейной (криволинейной), по направлению — прямой и обратной, по величине— от 0 до ±1, по количеству кор­релируемых признаков — парной и множественной.

Выделяют несколько видов парной корреляционной связи: а) параллельно-соотносительную, или ассоциа­тивную, когда оба признака изменяются сопряженно, ча­стично под действием общих причин и следствий (приуроченность растительности и почв к определенным формам рельефа); б) субпричинную, когда один фактор выступает как отдельная причина сопряженного измене­ния признака (связь биомассы с количеством осадков); в) взаимоупреждающую, когда причина и следствие, находясь в устойчивой взаимной связи, последовательно влияют друг на друга.

 

 

Рис. 3.1. Формы корреляционной связи:

а—прямая линейная; б—обратная линейная; в—параболиче­ская; г—гиперболическая

 

 

 

Рис. 3.2. Степень рассеяния частот и величина связи:

а – r ≈ 0; б – r ≈ 0,5; в – r ≈ 0,8

 

Если на признак влияет несколько факторов, то при­ходится оценивать множественную корреляцию. Множе­ственная корреляция служит основой выявления связей между признаками, но требует строгой нормальности и прямолинейности распределения, поэтому использование ее затруднено. С ростом числа переменных объем вы­числительных работ увеличивается пропорционально квадрату числа переменных. В этом случае труднее оце­нивать значимость результатов, так как увеличиваются ошибки коэффициентов корреляции. Поэтому практиче­ски ограничиваются изучением лишь главных факторов. При этом обработку данных проводят с применением ЭВМ. Однако характер влияния главных факторов на признак более детально и точно исследуют путем фак­торного анализа.

В практической работе по установлению корреляции между признаками и явлениями необходимо придержи­ваться следующей последовательности: 1) на основании исследований определяют, существует ли связь между рассматриваемыми признаками; 2) если связь между явлениями и признаками существует, устанавливают форму, направление и тесноту связи, используя график или корреляционную решетку.

В случае небольшой выборки составляются сопряженные вариационные ряды, в которых следует опреде­лить аргумент xи функцию у:

          x  10 12 16 18 21 23 25 30

          y   2 4     5  7  8    9   9  10

Сопряженные варианты наносятся на график, который помогает установить вид зависимости между аргументом и функцией. От формы корреляционной связи зави­сит дальнейшая обработка аналитических данных. Пря­молинейная зависимость (линейная зависимость) пред­полагает вычисление коэффициента корреляции г, а не­линейная (криволинейная) зависимость — корреляцион­ного отношения т] (рис. 3.1). Степень рассеяния частот или вариант относительно линии регрессии на графике указывает ориентировочно на тесноту связи: чем меньше рассеяние, тем сильнее связь (рис. 3.2).

Для взвешенных сопряженных вариационных рядов при большом объеме выборочных совокупностей строит­ся корреляционная решетка (табл. 3.1). В корреляцион­ной решетке указываются середины классов сверху по горизонтали — по аргументу х, слева по вертикали — по функции у. В центре расположены частоты выделенных классов. Справа по вертикали суммируются частоты по функции у, внизу по горизонтали — по аргументу х, Сумма частот по вертикали и горизонтали дает один и тот же объем выборки N=65. Исходя из распределения частот в корреляционной решетке, можно заключить, что связь между аргументом и функцией нелинейная, поэтому в данном случае следует рассчитывать корре­ляционное отношение η.

 

 

 

Таблица 3.1


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: