Графическое представление распределения случайной величины. Графические изображения статистических данных облегчают их обобщение и анализ

Графические изображения статистических данных облегчают их обобщение и анализ. Графики применяются для характеристи­ки развития явления во времени, в пространстве, отображения структуры явления и структурных сдвигов, при контроле за вы­полнением плана, изучении взаимосвязи между явлениями.

По способу построения графики делятся на диаграммы, кар­тограммы и картодиаграммы.

Диаграмма — изображение статистических данных при помо­щи геометрических фигур, линий, точек.

Картограмма — это географическая (контурная) карта, которая графически характеризует пространственное распределение ка­кого-либо статистического показателя путем различной окраски, штриховки и т. д. (например, плотность населения в различных регионах).

Картодиаграмма — это совмещение картограммы с диаграм­мой, т. е. в отдельных районах условными знаками наносят абсо­лютные значения статистических показателей.

Самым распространенным видом графиков являются диа­граммы, которые делятся на линейные, столбиковые, структур­ные, фигурные, знаки Варзара и др.

Линейные диаграммы — наиболее простой способ наглядного изображения статистических данных, когда изучаемое явление представляется в виде отрезков ломаной линии, называемой ста­тистической кривой. Они применяются для характеристики и сравнения развития различных явлений во времени, пространст­ве, а также для отображения взаимосвязи между явлениями.Для построения линейной диаграммы используется прямо­угольная система координат. На оси абсцисс (по горизонтальной шкале) откладываются равные отрезки, представляющие собой периоды времени, на ось ординат наносят масштаб для отображе­ния уровня явления. Соединение точек, построенных на коорди­натной системе, дает ломаную линию, представляющую собой закономерность развития явления.Рекомендуется строить координатную сетку с учетом соотно­шения масштабов по осям координат примерно 1:1,5 (правило «золотого сечения»), т. е. с учетом соотношения масштабов по сторонам занятого графиком пространства по вертикали и гори­зонтали. Преимуществом линейных графиков является то, что на од­ном графике имеется возможность отображения закономерности нескольких явлений. Разновидностью линейных диаграмм явля­ются контрольно-плановые графики, обеспечивающие оператив­ный контроль за ходом выполнения задания как за отдельные промежутки (дни, пятидневки), так и нарастающим итогом с на­чала периода. Для сравнения различных величин между собой и для изобра­жения динамики могут быть использованы столбиковые (ленточ­ные) диаграммы. Для их построения также используется система прямоугольных координат. Основания столбиков одинакового размера, представляющие собой периоды времени (годы, меся­цы, дни), размещаются на оси абсцисс, а вершины столбиков со­ответствуют величине изучаемого показателя. Столбиковые диа­граммы называют ленточными, если столбики расположены го­ризонтально в виде лент.

Структурные диаграммы применяются для изображения струк­туры явления и характеристики структурных сдвигов. При пост­роении таких графиков состав совокупности выражается относи­тельными величинами структуры, исчисленными в процентах. Они могут быть двух видов: столбиковые и круговые. Общая вы­сота столбика и площадь круга отображают целое и принимаются соответственно за 100%. При построении круговой диаграммы необходимо проценты перевести в градусы, учитывая, что каждый процент равен 3,6° (360: 100).

Знаки Варзара (по имени статистика В. Е. Варзара) являются разновидностью столбиковых диаграмм. Они позволяют отобра­зить на графике сложное явление, представляющее собой произ­ведение двух показателей. Например, объем продукции — произ­ведение производительности труда и численности работников. Если в прямоугольнике одну сторону взять пропорционально уровню производительности труда, а другую — пропорционально численности работников, то площадь прямоугольника будет пропорциональна объему произведенной продукции.

Одномерная выборка случайной величины графически представляется гистограммой, полигоном частот и их накопительными аналогами.

Гистограмма – столбчатая диаграмма (рис. 1.1, диаграмма 1), широко используемая для иллюстрации распределения случайной величины.

По горизонтальной оси откладываются интервалы случайной величины, получаемые делением размаха на обычно равные части. Каждый интервал является основанием вертикального столбца, высота которого отражает частоту попадания в него вариант. Высота столбца может быть выражена как частость, то есть доля попавших в интервал вариант по отношению ко всему объему выборки. Соответственно сумма высот всех столбцов равна объему выборки или единице.

Количество интервалов, на которые делится размах, не должно быть слишком большим, так как при этом в интервалы попадет мало вариант и частоты будут слишком неустойчивыми. Это следует из примера с подбрасыванием монеты. При небольшом числе подкидываний количество выпадений «орла» может составлять от 0 до 100%, но по мере увеличения подкидываний количество выпадений «орла» будет приближаться к 50%, то есть истинной вероятности явления. Естествоиспытатель XVIII века Ж. Бюффон при 4040 подкидываниях монеты получил частость выпадений орла 0,5080. У известного статистика К. Пирсона при 12000 подкидываниях частость составила 0,5016 и при 24000 – 0,5005. Опыты подтверждают за кон больших чисел – теорему Бернулли об асимптотической сходимости частот событий к их вероятностям при увеличении числа испытаний.

При малом количестве интервалов, на которые делится размах, в интервалы попадает больше вариант и частота оценивается более надежно, но теряется детальность отображения распределения случайной величины.

Ясно, что количество интервалов прямо зависит от объема выборки и примерно подсчитывается как 1 + 3,32lg N, где N – объем выборки. Например, для объема 100 вариант получается ≈8 интервалов, при увеличении выборки до 500 вариант количество интервалов возрастает до 10. Подсчеты носят ориентировочный характер, и количество интервалов корректируется соответственно особенностям эмпирического распределения.

Полигон частот – это график в виде ломаной линии (рис. 1.1, график 2), которая соединяет середины верхних оснований интервальных столбцов.

Гистограмма при имитации рассеяния случайной величины кучей песка со ступенчатой поверхностью отвечает вертикальному сечению через вершину. Полигон частот в таком вертикальном сечении получается при сглаживании ступеней.

Необходимым, но, к сожалению, недостаточным условием однородности распределения является одновершинность гистограммы и полигона частот, то есть их мономодальность.

Накопительная (иначе – интегральная, кумулятивная) гладкая кривая или ломаная линия, то есть полигон накопленных частот (рис. 1.2, график 2) и соответствующая

столбиковая диаграмма (рис. 1.2, диаграмма 1), являются графическими формами отображения эмпирической функции распределения F(x).

При этом по горизонтальной оси откладываются значения случайной величины. По вертикальной оси для интервалов откладываются накопленные частоты, получающиеся добавлением к частоте текущего интервала суммы частот интервалов, расположенных левее. Для первого, самого левого, интервала ордината равна его частоте. Для второго интервала ордината складывается из его частоты и частоты первого интервала. Ордината третьего интервала получается прибавлением его частоты к сумме частот первого и второго интервалов и т.д.

Такие накопленные частоты, выраженные в долях объема (от 0 до 1), рассматриваются как эмпирические функции распределения F (x). Однородные выборки характеризуются гладкими эмпирическими накопительными кривыми, которые удобно сравнивать с теоретическими распределениями.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: