Статистические методы построения моделей

Основные статистические методы построения формул, выражающих взаимозависимость измеренных показателей некоторых объектов: 1. Метод корреляционного анализа - аппроксимация эмпирической зависимости между величинами X и Y формулой вида Y = K*X + A где K - коэффициент корреляции. 2. Метод множественной регрессии - аппроксимация зависимости показателя от некоторого набора показателей, не зависящих один от другого, формулой вида Y = A + B1*X1 + B2*X2 +... + BN*XN где Xi - показатели; Bi - коэффициенты регрессии. 3. Метод факторного анализа - выявление новых показателей Y1..YN (факторов) вместо имеющихся показателей X1..XM, где N < M. Метод реализуется в предположении, что корреляционные связи между большим числом наблюдаемых показателей X1..XM определяются влиянием на них меньшего числа ненаблюдаемых показателей Y1..YN. При использовании какого-либо метода математической статистики для получения математической модели некоторой зависимости исследователь должен иметь априорную гипотезу о типе этой зависимости. Статистические методы позволяют лишь подтвердить гипотезу или выяснить значения коэффициентов в формуле, выражающей предполагаемую зависимость между параметрами.

Опасности использования статистики.

Есть три разновидности лжи: ложь, гнусная ложь и статистика. Б. Дизраэли. Некорректное применение статистики бывает причиной самообмана, а также используется иногда как средство ввода в заблуждение. К примеру, можно рассмотреть три типичных варианта разброса значений свойства Q некоторых объектов (это может быть уровень жизни граждан некоторой страны, количество побед в воздушных боях, приходящееся на одного летчика-истребителя и т. д.): A: B: C: +Q| Q| * * * Q| * * * | I | | * * | * * + | | * * * | |** * ** * ** * |* * | + | * ** * *** * | * * * * | * * ** * | II | | * * * |* ** * * ** +-+----------------->N -+----------------->N -+----------------->N Показатель "среднее значение" может быть корректно применен в качестве единственной характеристики возможных значений Q только в отношении варианта A, но не вариантов B и C. Для варианта B следует совместно использовать две статистические характеристики: среднее арифметическое значение и показатель разброса значений - среднее квадратичное отклонение. В варианте C следует использовать по одному показателю "среднее арифметическое значение" для каждой из групп I и II.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: