Математическая статистика - теория, в которой рассматриваются способы агрегирования информации посредством вычисления совокупных и средних значений показателей.
Виды средних значений:
1) среднее арифметическое:
M = (V1 + V2 +... + Vn) / n
2) среднее геометрическое:
G = SQRT(V1*V2*...*Vn)
(здесь и далее SQRT - функция извлечения квадратного корня)
3) среднее квадратическое (выражается в тех же единицах, что и характеризуемый показатель):
S = SQRT((V1*V1 + V2*V2 +... + Vn*Vn) / n)
4) дисперсия (сумма квадратов отклонений случайной величины от ее среднего значения, взвешенных на вероятности этих отклонений):
V = Р1(V1 - M)**2 + Р2(V2 - M)**2 +.. + Рn(Vn - M)**2
где M - среднее арифметическое значение;
Рi - вероятность отклонения Vi - M;
5) среднее гармоническое:
H = n / (1/V1 + 1/V2 +... + 1/Vn)
6) мода: наиболее часто встречаемое значение;
7) медиана (значение, равное среднему между наибольшим и наименьшим):
M = (Vmax + Vmin) / 2
8) среднее взвешенное:
W = (V1*W1 + V2*W2 +... + Vn*Wn) / (W1 + W2 +... + Wn)
где Wi - количество значений Vi;
Характеристики разнообразия (разброса значений):
1) среднее квадратичное отклонение (характеризует абсолютный разброс значений; выражается в тех же единицах, что и характеризуемый показатель):
S = SQRT(((V1-M)*(V1-M)+(V2-M)*(V2-M)+...+(V1-M)*(V1-M))/n-1)
здесь:
M - средняя арифметическая величина;
n - количество значений показателя;
2) коэффициент вариации (характеризует относительный разброс значений - относительно среднего арифметического):
C = (100 * S) / M
здесь:
S - среднее квадратичное отклонение;
M - средняя арифметическая величина;
3) размах (разница между наибольшим и наименьшим значением):
L = Vmax - Vmin