Описательная статистика. Задачи описательной статистики таковы

Задачи описательной статистики таковы:

- классификация данных, построение распределения их частот;

- выявление центральных тенденций этого распределения, т.е. моды, медианы, среднего арифметического;

- оценка разброса данных относительно средних.

Для классификации данных сначала их располагают в возрастающем порядке, затем разделяют их на классы по величине, интервалы между величинами определяются тем, что хочет выявить исследователь в данном распределении.

Наиболее часто используются такие параметры для описания распределения: с одной стороны, это мода, медиана и среднее арифметическое (средняя); с другой стороны, показателями разброса являются дисперсия и стандартное отклонение.

Мода соответствует значению, которое встречается чаще других или находится в середине класса, обладающего наибольшей частотой (Мо).

Медиана (Ме) соответствует значению центрального данного, которое может быть получено после того, как все данные будут расположены в возрастающем порядке (проранжированы).

Если число данных п будет четное, то Ме равна среднему арифметическому между значениями, находящимися в ряду данных на месте п/2 или п/2 + 1.

Среднее арифметическое (средняя) М равна частному от деления суммы всех данных на их число.

Распределение считается нормальным, если все показатели центральной тенденции совпадают (Мо, Ме, М), что свидетельствует о симметричности распределения, а кривая распределения имеет колоколообразный вид.

Диапазон распределения (размах результатов) равен разности между наибольшим и наименьшим значениями результатов.

Среднее отклонение - это более точный показатель разброса, чем диапазон распределения.

Для расчета среднего отклонения вычисляют среднюю разность между всеми значениями данных и средней арифметической, т.е. среднее отклонение равно , где

- сумма,

- абсолютное значение отдельного отклонения,

- число данных.

Показателем разброса, вычисляемым из среднего отклонения является дисперсия (варианса), равная среднему квадрату разностей между значениями всех данных и средней.

Дисперсия = = (S2)

Для популяции для выборки

Наиболее употребительным показателем разброса данных служит отклонение, равное квадратному корню из вариансы (дисперсии).

Таким образом, стандартное отклонение равно квадратному корню из суммы квадратов всех отклонений от средней.

Важное свойство стандартного отклонения (квадратичное отклонение от нормы) – то, что, независимо от его абсолютной величины в нормальном распределении, оно всегда соответствует одинаковому % данных, располагающихся по обе стороны от средней: 68% результатов располагаются в пределах одного стандартного отклонения в обе стороны от средней.

 
 


 
 


68%

       
   
 
 
 
   


7 11 16 20 25

- +

С помощью этих показателей можно осуществить оценку различий между двумя распределениями, позволяющую проверить, насколько эти различия могут быть экстраполированы (перенесены) на всю популяцию, из которой взяты эти две выборки. Для этого применяют метод индуктивной статистики. Экстраполяция – распространение полученных из наблюдения выводов одной части явления на другую его часть или на целое явление.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: