Графические изображения статистических данных облегчают их обобщение и анализ. Графики применяются для характеристики развития явления во времени, в пространстве, отображения структуры явления и структурных сдвигов, при контроле за выполнением плана, изучении взаимосвязи между явлениями.
По способу построения графики делятся на диаграммы, картограммы и картодиаграммы.
Диаграмма — изображение статистических данных при помощи геометрических фигур, линий, точек.
Картограмма — это географическая (контурная) карта, которая графически характеризует пространственное распределение какого-либо статистического показателя путем различной окраски, штриховки и т. д. (например, плотность населения в различных регионах).
Картодиаграмма — это совмещение картограммы с диаграммой, т. е. в отдельных районах условными знаками наносят абсолютные значения статистических показателей.
Самым распространенным видом графиков являются диаграммы, которые делятся на линейные, столбиковые, структурные, фигурные, знаки Варзара и др.
Линейные диаграммы — наиболее простой способ наглядного изображения статистических данных, когда изучаемое явление представляется в виде отрезков ломаной линии, называемой статистической кривой. Они применяются для характеристики и сравнения развития различных явлений во времени, пространстве, а также для отображения взаимосвязи между явлениями.Для построения линейной диаграммы используется прямоугольная система координат. На оси абсцисс (по горизонтальной шкале) откладываются равные отрезки, представляющие собой периоды времени, на ось ординат наносят масштаб для отображения уровня явления. Соединение точек, построенных на координатной системе, дает ломаную линию, представляющую собой закономерность развития явления.Рекомендуется строить координатную сетку с учетом соотношения масштабов по осям координат примерно 1:1,5 (правило «золотого сечения»), т. е. с учетом соотношения масштабов по сторонам занятого графиком пространства по вертикали и горизонтали. Преимуществом линейных графиков является то, что на одном графике имеется возможность отображения закономерности нескольких явлений. Разновидностью линейных диаграмм являются контрольно-плановые графики, обеспечивающие оперативный контроль за ходом выполнения задания как за отдельные промежутки (дни, пятидневки), так и нарастающим итогом с начала периода. Для сравнения различных величин между собой и для изображения динамики могут быть использованы столбиковые (ленточные) диаграммы. Для их построения также используется система прямоугольных координат. Основания столбиков одинакового размера, представляющие собой периоды времени (годы, месяцы, дни), размещаются на оси абсцисс, а вершины столбиков соответствуют величине изучаемого показателя. Столбиковые диаграммы называют ленточными, если столбики расположены горизонтально в виде лент.
Структурные диаграммы применяются для изображения структуры явления и характеристики структурных сдвигов. При построении таких графиков состав совокупности выражается относительными величинами структуры, исчисленными в процентах. Они могут быть двух видов: столбиковые и круговые. Общая высота столбика и площадь круга отображают целое и принимаются соответственно за 100%. При построении круговой диаграммы необходимо проценты перевести в градусы, учитывая, что каждый процент равен 3,6° (360: 100).
Знаки Варзара (по имени статистика В. Е. Варзара) являются разновидностью столбиковых диаграмм. Они позволяют отобразить на графике сложное явление, представляющее собой произведение двух показателей. Например, объем продукции — произведение производительности труда и численности работников. Если в прямоугольнике одну сторону взять пропорционально уровню производительности труда, а другую — пропорционально численности работников, то площадь прямоугольника будет пропорциональна объему произведенной продукции.
Одномерная выборка случайной величины графически представляется гистограммой, полигоном частот и их накопительными аналогами.
Гистограмма – столбчатая диаграмма (рис. 1.1, диаграмма 1), широко используемая для иллюстрации распределения случайной величины.
По горизонтальной оси откладываются интервалы случайной величины, получаемые делением размаха на обычно равные части. Каждый интервал является основанием вертикального столбца, высота которого отражает частоту попадания в него вариант. Высота столбца может быть выражена как частость, то есть доля попавших в интервал вариант по отношению ко всему объему выборки. Соответственно сумма высот всех столбцов равна объему выборки или единице.
Количество интервалов, на которые делится размах, не должно быть слишком большим, так как при этом в интервалы попадет мало вариант и частоты будут слишком неустойчивыми. Это следует из примера с подбрасыванием монеты. При небольшом числе подкидываний количество выпадений «орла» может составлять от 0 до 100%, но по мере увеличения подкидываний количество выпадений «орла» будет приближаться к 50%, то есть истинной вероятности явления. Естествоиспытатель XVIII века Ж. Бюффон при 4040 подкидываниях монеты получил частость выпадений орла 0,5080. У известного статистика К. Пирсона при 12000 подкидываниях частость составила 0,5016 и при 24000 – 0,5005. Опыты подтверждают за кон больших чисел – теорему Бернулли об асимптотической сходимости частот событий к их вероятностям при увеличении числа испытаний.
При малом количестве интервалов, на которые делится размах, в интервалы попадает больше вариант и частота оценивается более надежно, но теряется детальность отображения распределения случайной величины.
Ясно, что количество интервалов прямо зависит от объема выборки и примерно подсчитывается как 1 + 3,32lg N, где N – объем выборки. Например, для объема 100 вариант получается ≈8 интервалов, при увеличении выборки до 500 вариант количество интервалов возрастает до 10. Подсчеты носят ориентировочный характер, и количество интервалов корректируется соответственно особенностям эмпирического распределения.
Полигон частот – это график в виде ломаной линии (рис. 1.1, график 2), которая соединяет середины верхних оснований интервальных столбцов.
Гистограмма при имитации рассеяния случайной величины кучей песка со ступенчатой поверхностью отвечает вертикальному сечению через вершину. Полигон частот в таком вертикальном сечении получается при сглаживании ступеней.
Необходимым, но, к сожалению, недостаточным условием однородности распределения является одновершинность гистограммы и полигона частот, то есть их мономодальность.
Накопительная (иначе – интегральная, кумулятивная) гладкая кривая или ломаная линия, то есть полигон накопленных частот (рис. 1.2, график 2) и соответствующая
столбиковая диаграмма (рис. 1.2, диаграмма 1), являются графическими формами отображения эмпирической функции распределения F(x).
При этом по горизонтальной оси откладываются значения случайной величины. По вертикальной оси для интервалов откладываются накопленные частоты, получающиеся добавлением к частоте текущего интервала суммы частот интервалов, расположенных левее. Для первого, самого левого, интервала ордината равна его частоте. Для второго интервала ордината складывается из его частоты и частоты первого интервала. Ордината третьего интервала получается прибавлением его частоты к сумме частот первого и второго интервалов и т.д.
Такие накопленные частоты, выраженные в долях объема (от 0 до 1), рассматриваются как эмпирические функции распределения F (x). Однородные выборки характеризуются гладкими эмпирическими накопительными кривыми, которые удобно сравнивать с теоретическими распределениями.