Экспериментальный анализ двумерной совокупности

Пусть получена выборка из двумерной совокупности при наблюдении двух случайных величин Х и Y (табл. 1.1).

Таблица 1.1

J       ... j ... N
X x 1 x 2 x 3 ... xi ... XN
Y y 1 y 2 y 3 ... yi ... YN

Обработку результатов наблюдений в данном случае можно осуществлять по следующей схеме:

3.1 Построение поля рассеяния, как правило, первый шаг при обработке результатов наблюдений двумерной совокупности случайных величин X, Y; для этого на плоскости с координатами х, у отмечают экспериментальные точки — поле рассеяния.

3.2 Составление таблицы двумерного распределения. Эту таблицу составляют следующим образом. Оси и разбивают на отдельные интервалы длиной D х и D y. Величины D х, D y, количество Кх, Ку (обычно Ку = Кх = К, так как число точек N общее для X и Y.) и размещение этих интервалов для каждой из переменных Х и Y находят с помощью правил, изложенных в п.2. Соответствующие границы наносят на диаграмму рассеяния и затем подсчитывают количество точек , попавших в каждый из образовавшихся прямоугольников (при условии, что если какая-либо точка расположена на границе, то ее относят к правому или верхнему прямоугольнику). Далее составляют таблицу (табл. 1.2). В этой таблице отмечают величины , а также относительные величины (ниже диагонали). Подобную таблицу можно использовать как исходную для построения гистограмм и диаграмм накопленных частот в трехмерном пространстве, которые являются эмпирическими аналогами двумерного интегрального закона и двумерной функции распределения.

Отметим, что с помощью таблицы двумерного распределения легко получить исходные данные для построения гистограмм, соответствующих каждой из двух одномерных случайных величин Х и Y. Для этого достаточно просуммировать значения таблицы либо по каждому столбцу (при построении гистограммы для Y),либо по каждой строке (при построении гистограммы для X).

3.3 Вычисление оценки коэффициента корреляции производят по формуле

, (1.23)

где и sx, sy находят с помощью формул (1.20) - (1.22). Отметим, что между значением и знаком коэффициента корреляции, с одной стороны, и видом диаграммы рассеяния — с другой, существует определенная связь. Если начало координат перенести в точку (), то: 1) при r > 0 точки на диаграмме рассеяния группируются в основном в I и III квадрантах, а при r < 0 — во II и IV; 2) при r ” 0 точки беспорядочно разбросаны во всех четырех квадрантах; при r = ±1 точки группируются на прямых (находящихся либо в I и III квадрантах, либо во II и IV).

Таблица 1.2

Интервалы Для y Интер- валы для х   [ у 1, у 1 + D у)   [ у 2, у 2 + D у)   ...     ...  
[ х 1, х 1 + D х)     ...   ...  
            1/40
[ х 2, х 2 + D х)     ...   ...  
             
... ... ... ... ... ... ...
    ... ...  
... ... ... ... ... ... ...
    ...   ...  
  1/40 1/40        

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: