Определение расчётных статистических характеристик (мер положения, рассеивания, и форм кривой распределения)

Обработка данных натурных наблюдений методами математической статистики

Цель работы: научиться обрабатывать экспериментальные данные методами математической статистики, оценивать полученные результаты.

 

Необходимо выполнить следующие этапы обработки:

1) Построение вариационного ряда

2) Группировка данных натурных наблюдений

3) Определение расчётных статистических характеристик (мер положения, рассеивания, и форм кривой распределения)

4) Изучение формы кривой распределения

5) Графическое представление сгруппированных рядов данных натурных наблюдений

6) Проверка статистических гипотез

7) Построение доверительных интервалов

8) Определение объёмов выборки

 

Построение вариационного ряда

Вариационный ряд - последовательность каких-либо чисел, расположенная в порядке возрастания их величин.

  27.58
  28.61
  24.31
  25.82
  29.89
  30.96
  23.48
  25.34
  30.91
  23.35
  26.96
  30.19
  27.24
  26.27
  27.64

Исходные данные Вариационный ряд

  25.69
  27.53
  27.87
  27.79
  30.43
  32.92
  27.17
  35.04
  27.02
  29.19
  24.82
  26.14
  23.96
  26.28
  25.82
  27.24
  27.53
  27.58
  27.64
  27.79
  27.87
  28.61
  29.19
  29.89
  30.19
  30.43
  30.91
  30.96
  32.92
  35.04
  23.35
  23.48
  23.96
  24.31
  24.82
  25.34
  25.69
  25.82
  25.82
  26.14
  26.27
  26.28
  26.96
  27.02
  27.17

 

Группировка данных натурных наблюдений

 

а) для определения количества классов используем формулу Старжесса:

К=1+3,3*lg N

К -количество классов

N – объём выборки или количество значений в ряду

 

К=1+3,3*lg 30=5,884=6

 

б) определение длины каждого интервала

 

Формулы: R=Xmax-Xmin

h=R/K

R - размах

h – длина каждого интервала

 

R=35,04-23,35=11,69

h=1,95

 

в) определение границ каждого интервала

 

Формула; Xk-1+h=Xk -граница К-го интервала

Результаты расчёта:

Границы 1-го интервала – [23,35;25.3];

Границы 2-го интервала – [25,3;27,25];

Границы 3-го интервала – [27,25;29,2];

Границы 4-го интервала – [29;2,31,15];

Границы 5-го интервала – [31,15;33,1];

Границы 6-го интервала - [33,1;35,05].

 

г) определение эмпирической частоты

 

Частота – это количество значений, попавших в каждый интервал.

 

 

  Границы интервалов мг/л Частота, ni Ср. арифм. интервала, Xi, мг/л ni*Xi
         
  23.35 – 25.3   17,95 89,75
  25.3 – 27.25   19,17 76,68
  27.25 – 29.2   20,39 163,12
  29.2 – 31.15   21,61 172,88
  31.15 – 33.1   22,83 45,66
  33.1 – 35.05   23,98 71,94
    620,03

 

Определение расчётных статистических характеристик (мер положения, рассеивания, и форм кривой распределения)

 

а) определение мер положения

 

Среднее арифметическое значение является первым начальным моментом и вычисляется по формуле:

Xср=20,67

 

ni - частота каждого интервала;

Xi –среднее арифметическое значение выборки (мг/л)

 

Мода (значение, имеющее максимальную частоту, т.е. наиболее часто встречаемое значение случайной величины в выборке) определяется по формуле:

 

М0=X0+ h*

М0=19,78+1,22*1=21

 

 

X0 – начало модального интервала (мг/л)

 

 

Медиана – срединный элемент выборки – определяется по формуле:

 
 


Me=X0+h*

 

 

Ме=19,78+1,22*0,75=20,695

 

б) меры рассеивания

 

Характеристикой рассеивания или отклонения случайной величины от центра распределения выступает дисперсия – второй центральный момент.

Дисперсия вычисляется по формуле:

 

 
 

 


M2=D=

 

 

М2=3,195

 

σ – средне квадрат. отклонение

σ =

σ=1,787

 

Нормированное отклонение определяется коэффициентом вариации:

Сv=σ/Xср*100%

 

Cv=8,6%

 

в) характеристики формы кривой распределения

 

Характеристиками формы кривых распределения выступают третий и четвёртый центральные моменты. Третий центральный момент характеризует асимметричность ряда, т.е. неравномерность распределения случайной величины относительно центра и определяется по формуле:

 
 

 


М3=

 

M3=0,7098

Безразмерный коэффициент асимметрии (Cs) определяется отношением третьего центрального момента к кубу среднего квадратичного отклонения:

 

Cs=M3/ σ* σ* σ

Cs=0,124

 

Четвёртый центральный момент характеризует форму симметричной кривой распределения и называется эксцесс (островершинность).

 

Формула: М4=

 

 

М4=23,461

 

Показателем островершинности выступает коэффициент эксцесса (Се), который определяется по формуле: Се=М4/ σ* σ* σ* σ-3

Се=-0,7

Так как ряд вариационный и сгруппированный, то для расчётов центральных моментов можно использовать следующие формулы:

 

ML= Zi=(Xi-Xср) L=2,3,4

 

 

Определение центральных выборочных моментов

 

K ni Zi Zi^2 Zi^3 Zi^4 ni*Zi^2 ni*Zi^3 ni*Zi^4
                 
    -2,72 7,4 -20,12 54,73   -100,6 273,65
    -1,5 2,25 -3,375 5,0625   -13,5 20,25
    -0,28 0,0784 -0,021 0,0061 0,6272 -0,168 0,0488
    0,94 0,8836 0,83 0,78 7,0688 6,64 6,24
    2,16 4,66 10,071 21,767 9,32 20,142 43,534
    3,31 10,95 36,26 120,036 32,85 108,78 360,108
        95,866 21,294 703,83

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: