Дискретные случайные величины. Формулы для матожидания, дисперсии и стандартного отклонения. Коэффициент вариации

Эконометрия

Основы математической статистики

Одномерные величины

Дискретные случайные величины. Формулы для матожидания, дисперсии и стандартного отклонения. Коэффициент вариации.

Описание дискретной случайной величины в теории вероятностей начинается со следующего допущения: пусть у нас есть дискретная случайная величина X, {xi} – список ее возможных значений, а {рi} – список соответствующих им вероятностей, т.е. значение xi наблюдается в опытах с вероятностью рi. Как подобные характеристики могут быть обнаружены в реальности? Мы можем провести серию опытов по измерению значений величины X и зафиксировать, что значение случайной величины Х с номером i наступило ni раз в серии из N опытов. При этом теория вероятностей гласит, что если общее число испытаний будет стремиться к ¥, то частота  появления значения xi будет стремиться к рi. [1]

Однако в реальности мы ведь никогда не можем произвести бесконечное количество опытов, да еще в идеально одинаковых условиях, и это первое несовпадение модели, которую предлагает нам теория вероятностей, с реальными задачами. Первое, но далеко не последнее – беда в том, что чаще всего с дискретными случайными величинами мы встречаемся в ситуациях, которые выглядят в принципе не так.

Пусть, например, наша случайная величина – рост призывника очередного призыва в г. Киеве, выраженный в сантиметрах. Тут в принципе невозможно поставить бесконечное число опытов. В лучшем случае мы можем измерить рост всех киевских юношей призывного возраста. Совокупность всех объектов исследования (в нашем примере – всех киевских юношей призывного возраста) называется генеральной совокупностью. И мы можем получить сведения обо всех объектах генеральной совокупности – это в лучшем случае, как максимум.

Однако чаще всего не происходит и этого – полное исследование генеральной совокупности потребовало бы слишком больших денег и заняло бы слишком много времени. Поэтому обычно идут по пути выборочного исследования. Выбирается некоторое количество представителей из всей совокупности объектов исследования (производится выборка), замеры осуществляются только по этой группе (получаем выборочные данные) и по данным выборки оцениваются все параметры генеральной совокупности. Так, выборочное среднее  , где Nв есть объем выборки, будет рассматриваться в дальнейшем как оценка генерального среднего µ. Отметим, что в такой ситуации индекс i указывает не номер одного значения из списка возможных значений (как в модели теории вероятностей), а просто номер опыта (номер элемента, номер варианты [2]). При этом, конечно, некоторые значения будут повторяться, но на первом этапе нам это никак не помешает – в дальнейшем при вычислении выборочных характеристик мы будем использовать индекс i как номер опыта (номер объекта).

Строго говоря, такие понятия теории вероятностей, как матожидание, дисперсия и т.п. в данной ситуации теряют смысл – мы не можем точно получить значения вероятностей рi, а значит и величины основных характеристик вычислить не можем, поскольку для их вычисления вероятности рi должны быть известны. Но мы в дальнейшем не будем делать различия между теоретическими величинами и величинами, вычисленными для генеральной совокупности. Предполагается, что совокупности достаточно большие, и значения характеристик для них с достаточной точностью можно считать соответствующими представлениям теории вероятностей.

 

Итак, пусть  у нас есть дискретная случайная величина, представленная таблицей значений, причем эта таблица представляет не выборку, а всю генеральную совокупность. Тогда основные характеристики этой величины, а именно: матожидание (генеральное среднее) µ, дисперсию D и стандартное (среднеквадратичное) отклонение σ для генеральной совокупности могут быть вычислены по следующим формулам:

            (1.1)

Здесь N означает количество всех доступных наблюдению значений дискретной случайной величины (объём генеральной совокупности).

При такой постановке задачи генеральное среднее  и матожидание µ просто совпадают.

Отметим, что стандартное (среднеквадратичное) отклонение как и дисперсия представляет собой характеристику рассеяния, т.е. характеризует «размазанность» случайной величины вокруг матожидания. Однако применение стандартного отклонения в большинстве случаев предпочтительнее, т.к. σ имеет ту же размерность что и сама величина х, и ее матожидание (генеральное среднее) µ, тогда как дисперсия имеет размерность равную квадрату размерности самой случайной величины Х – как следствие стандартное отклонение σ можно сравнить по величине со средним µ, а вот дисперсию со средним значением сравнить нельзя.

Поэтому знание стандартного отклонения не только позволяет лучше представить себе общую картину распределения величины х, но и позволяет производить математические операции с величинами х и σ, например, при вычислении доверительных интервалов (см. далее).

Для оценки формы кривой распределения желательно иметь безразмерную характеристику рассеяния, такой характеристикой обычно служит коэффициент вариации.

Коэффициент вариации – отношение стандартного отклонения к матожиданию (или к среднему), иногда в процентах

                                   (1.2)


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: