Основные статистические методы построения формул, выражающих взаимозависимость измеренных показателей некоторых объектов:
1. Метод корреляционного анализа - аппроксимация эмпирической зависимости между величинами X и Y формулой вида
Y = K*X + A где K - коэффициент корреляции.
2. Метод множественной регрессии - аппроксимация зависимости показателя от некоторого набора показателей, не зависящих один от другого, формулой вида
Y = A + B1*X1 + B2*X2 +... + BN*XN
где Xi - показатели;
Bi - коэффициенты регрессии.
3. Метод факторного анализа - выявление новых показателей Y1..YN (факторов) вместо имеющихся показателей X1..XM, где N < M. Метод реализуется в предположении, что корреляционные связи между большим числом наблюдаемых показателей X1..XM определяются влиянием на них меньшего числа ненаблюдаемых показателей Y1..YN.
При использовании какого-либо метода математической статистики для получения математической модели некоторой зависимости исследователь должен иметь априорную гипотезу о типе этой зависимости. Статистические методы позволяют лишь подтвердить гипотезу или выяснить значения коэффициентов в формуле, выражающей предполагаемую зависимость между параметрами.
|
|
Опасности использования статистики
Есть три разновидности лжи: ложь,
гнусная ложь и статистика.
Б. Дизраэли.
Некорректное применение статистики бывает причиной самообмана, а также используется иногда как средство ввода в заблуждение.
К примеру, можно рассмотреть три типичных варианта разброса значений свойства Q некоторых объектов (это может быть уровень жизни граждан некоторой страны, количество побед в воздушных боях, приходящееся на одного летчика-истребителя и т. д.):
A: B: C: +
Q| Q| * * * Q| * * * |I
| | * * | * * +
| | * * * |
|** * ** * ** * |* * | +
| * ** * *** * | * * * * | * * ** *|II
| | * * * |* ** * * ** +
-+----------------->N -+----------------->N -+----------------->N
Показатель "среднее значение" может быть корректно применен в качестве единственной характеристики возможных значений Q только в отношении варианта A, но не вариантов B и C. Для варианта B следует совместно использовать две статистические характеристики: среднее арифметическое значение и показатель разброса значений - среднее квадратичное отклонение. В варианте C следует использовать по одному показателю "среднее арифметическое значение" для каждой из групп I и II.