Статистические методы построения моделей

Основные статистические методы построения формул, выражающих взаимозависимость измеренных показателей некоторых объектов:

1. Метод корреляционного анализа - аппроксимация эмпирической зависимости между величинами X и Y формулой вида

Y = K*X + A где K - коэффициент корреляции.

2. Метод множественной регрессии - аппроксимация зависимости показателя от некоторого набора показателей, не зависящих один от другого, формулой вида

Y = A + B1*X1 + B2*X2 +... + BN*XN

где Xi - показатели;

Bi - коэффициенты регрессии.

3. Метод факторного анализа - выявление новых показателей Y1..YN (факторов) вместо имеющихся показателей X1..XM, где N < M. Метод реализуется в предположении, что корреляционные связи между большим числом наблюдаемых показателей X1..XM определяются влиянием на них меньшего числа ненаблюдаемых показателей Y1..YN.

При использовании какого-либо метода математической статистики для получения математической модели некоторой зависимости исследователь должен иметь априорную гипотезу о типе этой зависимости. Статистические методы позволяют лишь подтвердить гипотезу или выяснить значения коэффициентов в формуле, выражающей предполагаемую зависимость между параметрами.

Опасности использования статистики

Есть три разновидности лжи: ложь,

гнусная ложь и статистика.

Б. Дизраэли.

Некорректное применение статистики бывает причиной самообмана, а также используется иногда как средство ввода в заблуждение.

К примеру, можно рассмотреть три типичных варианта разброса значений свойства Q некоторых объектов (это может быть уровень жизни граждан некоторой страны, количество побед в воздушных боях, приходящееся на одного летчика-истребителя и т. д.):

A: B: C: +

Q| Q| * * * Q| * * * |I

| | * * | * * +

| | * * * |

|** * ** * ** * |* * | +

| * ** * *** * | * * * * | * * ** *|II

| | * * * |* ** * * ** +

-+----------------->N -+----------------->N -+----------------->N

Показатель "среднее значение" может быть корректно применен в качестве единственной характеристики возможных значений Q только в отношении варианта A, но не вариантов B и C. Для варианта B следует совместно использовать две статистические характеристики: среднее арифметическое значение и показатель разброса значений - среднее квадратичное отклонение. В варианте C следует использовать по одному показателю "среднее арифметическое значение" для каждой из групп I и II.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: