Точность статистических характеристик

Одним из наиболее важных вопросов является определение точности расчета статистических характеристик. Если точность характеристики не оценена или оценена неправильно, использование ее в климатических исследованиях может привести к неверным выводам.

Рассматривая статистическую совокупность значений метеорологических величин как выборку из генеральной совокупности статистические ошибки климатических характеристик оценивают по отношению к соответствующим характеристикам генеральное совокупности (неявно предполагаем, что нет закономерных изменений климата).

Средние ошибки климатических характеристик являются средними квадратическими отклонениями этих характеристик из совокупностей данного объема от соответствующих характеристик генеральной совокупности. Чаще всего при этом исходят из допущения (достаточно справедливого при используемых в климатологической практике объемах совокупностей) о нормальности распределения характеристик распределений.

Если допустить также стационарность метеорологических процессов и отсутствие внутрирядной связности, то формулы средних ошибок можно записать следующим образом.

Ошибка средней арифметической

(7.1)

где σ — среднее квадратичное отклонение отдельных измерений в рассматриваемой выборке. Ошибка средней включает в себя инструментальную ошибку отдельных измерений (доля которое в климатологии, как правило, мала) и ошибку, обусловленную ограниченностью выборки, когда (при неизменном климате) в рассмотрение вошло ограниченное число членов генеральной совокупности. Речь идет о том, что средние различных ограниченных выборок из одной генеральной совокупности отличаются друг от друга и, естественно, от неизвестной нам средней всей генеральной совокупности. Аналогично для ошибок других статистических характеристик:

ошибка среднего квадратического отклонения

(7.2)

ошибка коэффициента вариации

(7.3)

ошибка коэффициента асимметрии

(7.4)

ошибка коэффициента эксцесса

(7.5)

ошибка относительной частоты данной градации

(7.6)

ошибка р-квантили

(7.7)

ошибка коэффициента корреляции

(7.8)

Обратим внимание на σp. Погрешность определения Р изменяется от при Р = 0,05 (или 0,95) до при P = 0,5. Это значит, что даже при n = 100 , что составляет почти 50% от Р, т. е. даже при больших рядах малые относительные повторяемости определяются с большой погрешностью. В частности, в разобранном примере с доверительной вероятностью 0,7 (см. ниже) можно говорить, что Р находится в интервале [3—7 %]. Насколько это существенно, особенно видно, если от Р перейти к временному промежутку . Вместо рассчитанного «один раз в 20 лет» с вероятностью 0,7 получается интервал от «одного раза в 15 лет» до «одного раза в 35 лет». А если требование к доверительной вероятности повысить, то интервал расползается еще сильнее. Таким образом, к надежности малых значений Р надо относиться с осторожностью.

В случае малых выборок величина ошибки для коэффициентов асимметрии и эксцесса, которая велика даже и при относительно больших выборках и для коэффициента корреляции, вычисляется по уточненным формулам

(7.9)

(7.10)

(7.11)

Формулами σr следует пользоваться с большой осторожное особенно при больших r и малых n. При r ± 1 получаются заниженные значенияσr.

Вообще, все ошибки, рассчитанные без учета связности рядов; несколько занижены, поэтому для наиболее важных характеристик, таких, как и σ, следует учитывать связность климатологических рядов, и тогда формулы приобретают вид:

(7.12)

(7.13)

где r1— коэффициент корреляции между соседними членами ряда.

Формулы для ошибок, в первую очередь, для ошибки среднего могут быть использованы для определения необходимого количества наблюдений. Задавая допустимую и зная σ по выборочной совокупности, можно из (7.1) определить необходимое n. Однако в климатологии такой подход часто использовать нельзя, так как при этом не учитываются разнопериодные колебания климата. Поэтому вопрос о необходимой продолжительности ряда, для того чтобы могло быть использовано для прогноза, должен решаться путем непосредственной проверки на прошлом материале.

Все приведенные выражения позволяют получить лишь сред значения статистических ошибок климатических характеристик. Более полное представление о точности климатических характеристик дают их доверительные интервалы.

Доверительным интервалом Jβ называют интервал, который включает неизвестный параметр генеральной совокупности (М, D, Cv, A, K и др.) с некоторой доверительной вероятностью. Доверительная вероятность β. — это та вероятность, которую можно признать достаточной для решения конкретной задачи на эмпирическом материале.

Обычно принимают в качестве доверительной вероятное β = 0,95 или β = 0,99.

Для особо важных сооружений могут быть приняты значения β = 0,999 и даже β= 0,9999.

Для достаточно больших статистических совокупностей n>30 доверительные интервалы определяют в предположении о нормальности распределения всех характеристик по формулaм

(7.14)

(7.15)

(7.16)

Значение при заданном β определяется по таблице интеграла вероятностей Ф1

Например, при β = 0,95 =0.95=1.96,при β =0,99 =2,58 Ошибка при этом будет вычисляться как

Таким образом, с вероятностью 0,95 можно считать, что истинное лежит в интервале

Ошибка σ будет равна

и.т.д.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: