Тренировочные задания
Контрольный тест
1. Основными принципами статистического наблюдения являются:
а) планомерность, массовость, научная организация;
б) повторяемость, закономерность, организация;
в) планомерность, закономерность, массовость;
г) повторяемость, организованность, научное обоснование;
2. Одной из форм статистического наблюдения является:
а) отчетность;
в) регистрация транспортных средств в ГИБДД;
3. По охвату единиц совокупности статистическое наблюдение бывает:
а) сплошное;
б) непосредственное;
в) непрерывное;
г) единичное.
4. Критическим моментом статистического наблюдения называется:
а) период времени, в течение которого проводится наблюдение;
б) момент времени, по состоянию на который проводится наблюдение;
в) момент времени, с которого начинается наблюдение;
г) момент времени, когда должно окончится наблюдение.
5. План статистического наблюдения включает:
а) программно-методологический раздел;
б) учебный раздел;
в) разработочный;
г) подготовительный раздел.
6. Единовременным называется наблюдение:
а) проводимое только один раз;
б) проводимое время от времени по мере необходимости;
в) проводимое только один раз в год;
г) проводимое только в течение одного дня.
7. Перечень признаков (или вопросов), подлежащих регистрации в процессе наблюдения,
называется:
а) статистическим формуляром;
б) планом наблюдения;
в) инструментарием наблюдения;
г) программой наблюдения.
8. Объектом статистического наблюдения называется:
а) совокупность единиц наблюдения, подлежащих статистическому исследованию;
б) первичная ячейка совокупности, от которой должны быть получены сведения в процессе наблюдения;
в) совокупность явлений и процессов, реально существующих во времени и пространстве;
г) население РФ
9. Ошибки репрезентативности возможны только при:
а) сплошном наблюдении;
б) выборочном наблюдении;
в) единовременном наблюдении;
г) периодическом наблюдении.
10. При большом объеме совокупности в определенной степени взаимопогашаются:
а) арифметические ошибки наблюдения;
б) логические ошибки наблюдения;
в) систематические ошибки наблюдения;
г) случайные ошибки наблюдения.
№ п\п | Задание |
Определите форму и вид статистического наблюдения: | |
Годовая отчетность промышленных предприятий о проиводственно-хозяйственной деятельности | |
Ежедневная регистрация пациентов, поступивших в стационар лечебного учреждения | |
Перепись крупного рогатого скота | |
Определите объект и единицу статистического наблюдения | |
Перепись населения страны | |
Обследование сельхозпроиводителей Омской области | |
Обследование уровня жизни жителей Саратовской области | |
С помощью логического и арифметического контроля выявите ошибки в следующем формуляре (дата заполнения формуляра – 1 марта 2004 года) | |
1. Пол | |
Женский | |
2. Возраст | |
8 лет | |
3. Национальность | |
русская | |
4. Дата рождения | |
5 марта 1955 года | |
Сформулируйте цель проведения статистического наблюдения | |
Перепись населения | |
Обследование сельхозпроиводителей Омской области |
1.2. Требования, предъявляемые
к статистическим данным. Формы и виды
статистического наблюдения
Основной задачей государственной статистики является формирование государственных информационных ресурсов. Это достигается посредством статистического наблюдения. Адекватность отражения важнейших социально-экономических процессов, происходящих в стране, во многом зависит от используемых методов сбора и обработки первичных данных. В настоящее время нет стандартного определения качества данных, принято отмечать два основных требования к материалам статистического наблюдения: достоверность и сопоставимость.
Достоверность — это соответствие первичных данных фактическому положению. Исходя из практической потребности, достоверность обычно описывают в терминах ошибок. Для предупреждения ошибок наблюдения выявляют их виды и причины возникновения. Ошибки наблюдения подразделяют на два вида: ошибки регистрации и ошибки репрезентативности.
Ошибки регистрации — это погрешности, которые возможны независимо от вида наблюдения. Они бывают случайными и систематическими (тенденциозными). Существуют преднамеренные ошибки, причиной которых становится сознательное искажение данных. Непреднамеренные ошибки, как правило, носят случайный характер, они могут возникнуть в результате низкой квалификации работников.
Ошибки репрезентативности присущи только выборочному наблюдению. Причина их возникновения заключается в том, что выборочная совокупность недостаточно точно отображает состав всей изучаемой совокупности. Подробнее о таких ошибках говорится в гл. 5.
Сопоставимость статистических данных рассматривается в разных аспектах:
1) сопоставимость в рамках одного наблюдения;
2) сопоставимость данных разных наблюдений;
3) сравнимость с данными прошлых исследований.
Причины различий могут быть вызваны организационно-методологическими факторами, влияющими на изменение методики сбора данных, времени регистрации и т.п.
В настоящее время устанавливается более широкое понятие качества статистических данных с точки зрения их адаптации к потребностям пользователей. К компонентам такого определения качества, наряду с сопоставимостью и достоверностью, относятся востребованность, доступность, интерпретируемость.
Достижение необходимого уровня качества результатов статистической деятельности требует соблюдения научно разработанных методик сбора, обработки и распространения статистических данных (включая соответствие принятым международным стандартам).
Статистическое наблюдение — первая стадия статистического исследования, представляющая собой организованный по единой программе сбор данных о социально-экономических явлениях и процессах путем регистрации их существенных признаков с целью получения первичной статистической информации.
Различают формы организации и виды статистического наблюдения, источники получения первичных данных и способы сбора данных.
К формам организации относятся:
— отчетность;
—специально организованное наблюдение.
Виды наблюдения делят:
— по времени регистрации фактов на непрерывное (текущее),
периодическое и единовременное;
—охвату единиц на сплошное и несплошное.
Источниками получения первичных данных являются:
—непосредственное наблюдение;
—документальный способ;
—опрос.
К способам сбора данных относятся:
—экспедиционный;
—саморегистрация;
—корреспондентский.
Организация статистического наблюдения предполагает решение определенных программно-методологических вопросов:
• конкретизация цели и формулировка задач статистического
исследования;
• составление программ наблюдения и разработки полученной статистической информации;
• ограничение обследуемой совокупности (установление ее рамок);
• создание статистической основы (для выборочного наблюдения — основы выборки), определение ее единицы и единицы наблюдения;
• выбор метода наблюдения (для выборочного наблюдения — установление оптимального процента отбора);
• формирование выборочной совокупности;
• сбор и редактирование первичной информации, включающее логический и арифметический способы контроля, основанные на
соотношениях между связанными пунктами вопросника и допустимыми значениями статистических признаков, представленных респондентами.
Количественные признаки могут выражаться дискретными или непрерывными величинами, соответственно, и вариационный ряд будет либо дискретным, либо интервальным (непрерывным в пределах интервала). Так, количество детей в семье может выражаться только целыми числами, а вес человека может отличаться от веса другого на сколь угодно малую величину, определяемую точностью измерения.
При построении вариационного ряда непрерывного признака невозможно указать абсолютно точное значение варианта, поэтому совокупность распределяется по интервалам его значений. Интервалы можно брать как равные, так и неравные. Для каждого из них указывается частота или частость, т.е. абсолютное или относительное число единиц, у которых значение признака находится внутри данного интервала.
Первый и последний интервалы рядов чаше всего берутся открытыми. Использование открытых интервалов удобно, когда в совокупностях встречается незначительное число единиц с очень малыми или очень большими значениями вариантов, резко отличающимися от всех остальных значений.
Если построен ряд с равными интервалами, то частоты дают представление о том, как заполнен единицами совокупности тот или иной интервал. При сравнении частот ряда с неравными интервалами для характеристики их заполненности рассчитывают плотность распределения. Средняя плотность в интервале — это частное от деления частоты или частости на величину интервала: в первом случае получается абсолютная, во втором — относительная плотность распределения. Средняя плотность показывает, сколько единиц (или сколько процентов единиц) совокупности приходится на единицу изменения варианта.
Для характеристики распределения используют также накопленные частоты. Если вместо абсолютных частот взять частости, то аналогично получим накопленные частости.
Накопленная частота (частость) для данного варианта или для верхней границы данного интервала получается суммированием (накапливанием) частот (частостей) всех предшествующих интервалов, включая данный. Накопленная частота показывает, какое число единиц имеет значение признака, не большее данной варианта или верхней границы интервала. Частота, частость, плотность и накопленная частота вариационного ряда — это различные функции от величины варианта.
Зависимость частот, иди, точнее, плотностей распределения от величины вариантов в идеальном случае может быть представлена в виде некоторой функции, изображаемой графически кривой определенною вида. Любое реальное распределение можно также изобразить схематически в виде некоторой кривой, воспроизводящей основные особенности данного распределения. В зависимости от вида кривых, изображающих распределение, выделяют несколько основных типов распределений. Прежде всего распределения по виду их графического изображения можно разделить на одновершинные и многовершинные. К одновершинным относятся те, в которых один, обычно центральный, вариант имеет наибольшую частоту (точнее, наибольшую плотность распределения), частоты же остальных вариантов убывают по мере удаления от центрального. Если частоты убывают одинаково и справа и слева от центрального значения, то такие распределения называются симметричными. Если частоты убывают слева и справа от центра распределения с разной скоростью, то такие распределения называют асимметричными, выделяя при этом распределения, растянутые вправо и влево. Степень асимметрии может быть различной: от совершенно незначительной до крайней, при которой наибольшая частота относится к одному из крайних значений вариантов — самому большому или, наоборот, наименьшему. Различные виды распределений представлены на рис. 3.1.
РИСУНОК НЕ ОТСКАНИРОВАЛСЯ
Идеальное симметричное распределение крайне редко встречается на практике. Достаточно близки к нему распределения мужчин и женщин по несу или росту (при достаточно большом количестве людей, включенных в совокупность). Основная масса распределений, с которыми приходится иметь дело экономисту. — это асимметричные распределения с разной степенью асимметрии.
Многовершинные распределения - это распределения, в которых несколько центров, т.е. такие, у которых несколько максимумов частот. Многовершинность распределения часто является свидетельством того, что совокупность состоит из неоднородных, с точки зрения изучаемою признака, единиц. Поэтому, убедившись в том. что распределение имеем более чем один максимум частоты, исследователь должен тщательно проверить, можно ли считать однородными единицы совокупности.
В практической деятельности очень важно фактическое распределение (структуру совокупности) привести к известному теоретическому. Обычно в экономических расчетах апроксимируют к таким теоретическим распределениям, как:
нормальное
равномерное
показательное
распределение Пуассона (для дискретных распределений)
Возникает задача проверки соответствия выбранной кривой для представления фактической структуры. т.е. проверки тою, действительно ли различия между теоретической и эмпирической кривой распределения настолько малы, что их можно считать случайными, а не закономерными.
Наиболее известный метод проверки соответствия фактического ряда распределения теоретическому — применение критерия согласия Пирсона. Определяем …. Сравниваем Х²расч с Х²табл при заданном уровне значимости и числе степеней свободы. Если Х²расч < Х²табл, можно считать, что фактическое распределение адекватно теоретическому. Например, имеется следующий интервальный ряд распределения рабочих цеха по уровню заработной платы:
Уровень заработной платы, руб. Численность рабочих
До 200 10
200-250 20
250-300 40
300-350 20
350 и более 10
Итого 100
Предполагая, что распределение рабочих но уровню заработной платы является нормальным, рассчитаем теоретические частоты распределения (табл. 3.1)
Расчет теоретических частот распределения
X — | f факт | х´ f факт | (х´)² f факт | f (t)* | Г твор = | Округлен- | ||
середины интервалов | = f (t) К= | ные теоре- | ||||||
= f (t) • 9 1,29 | тические | |||||||
частоты | ||||||||
-2 | -20 | -1,823 | 0,0761 | 6,947 | ||||
-1 | -20 | 20 -0,913 | 0,2637 | 24,073 | ||||
0,0 | 0,3989 | 36,416 | ||||||
0,913 | 0,2637 | 24,073 | ||||||
1,823 | 0,0761 | 6,947 | ||||||
Итого |
· Здесь f (t) — плотность нормального распределения. Для определения используются либо таблицы f (t),. либо непосредственно формула плотности f (t)
Рассчитаем х и а метолом моментов, где центральный момент А = 275, а величина интервала i = 50; x ¯ = 275 + 50-0 = 275;
Ð = 50 √(120/100)-0 =54,77
где а — уровень значимости; v — число степеней свободы; L — число групп; r — число параметров распределения;
X²расч < X²табл = распределение является нормальным.
Аналитическая (факторная) группировка предназначена для установления тесноты связи между взаимодействующими признаками — факторным и результативным. Она позволяет выявить наличие и направление связи, а также измерить ее тесноту и силу. Методологическими вопросами построения факторной группировки являются выбор группировочного признака, определение числа групп и величины интервала, выбор системы показателей для характеристики групп. Если типологическая группировка, преследующая цель разграничения качественно однородных совокупностей, должна отвечать их объективной качественной природе, то для аналитической группировки, цель которой исследование взаимосвязи признаков, такого объективного критерия нет. Поэтому в качестве группировочного чаше всего принимают факторный признак, выделенный на основе априорного анализа. Интервалы в аналитической группировке берутся преимущественно равные либо равнонаполненные (группы с приблизительно одинаковой частотой). Величина интервала рассчитывается так же, как при построении структурной группировки. Среди показателей групп обязательным является среднее значение результативного показателя по каждой группе. Теснота связи оценивается сравнением вариации этих средних значений с обшей дисперсией результативного показателя. Эмпирический коэффициент детерминации определяется как
Статистические сводки и группировки
Сводка — особая стадия статистического исследования, в ходе которой систематизируются первичные материалы статистического наблюдения. Проведение сводки включает 3 этапа:
• предварительный контроль материалов, т. е. проверку исходных данных;
• группировку данных по заданным признакам, определение производных показателей;
• оформление результатов сводки в виде статистических таблиц, удобных для восприятия информации.
Предварительный контроль включает логическую проверку данных, т. е. смысловую согласованность сведений, исключение «нелогичных» данных и арифметическую согласованность.
Пример. Рассогласованные данные.
В документах на предприятии обнаружены арифметическая и логическая рассогласованности:
№ п/п | Заработная плата | Возраст | Общий стаж | Непрерывный стаж |
Итого |
Арифметическая — неправильно определена сумма заработной платы.
В 3-й строке имеется логическая ошибка: человек 25-ти лет неможет иметь общего стажа 45 лет и, кроме того, непрерывна стаж, как часть общего, не может его превосходить.
Группировка данных производится в соответствии с программой сводки для того, чтобы впоследствии представить полученную информацию в доступном для восприятия виде.
Группировка — объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака. Результаты группировки оформляются в виде группировочных таблиц, делающих информацию обозримой. Таблица содержит сводную числовую характеристику ис-1?емой совокупности по одному или нескольким существен-I признакам, взаимосвязанным логикой анализа.
Пример. Основа группированной таблицы. Название таблицы (общий заголовок). Группировочная таблица три вида заголовков: общий, верхний и боковые. Заголовки таблиц должны быть краткими и раскрывать содержание показателей.
Содержание строк | Наименования граф (верхние заголовки) | |||||
А | … | |||||
Наименования строк (боковые заголовки) | ||||||
Итоговая строка | Итоговая графа |
Общий заголовок отражает содержание всей таблицы с указанием, к какому месту и времени она относится. Он располагается над макетом по центру и является внешним заголовком.
Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) — строк.
Подлежащее статистической таблицы — объект, характеризующийся цифрами.
Сказуемое — система показателей, которыми характеризуется объект изучения, т. е. подлежащее.
В зависимости от строения подлежащего все статистические таблицы можно разделить на три группы:
• простые или перечневые;
• групповые;
• комбинационные.
Следует избегать появления клеток, в которых не может быть исходных данных. В клетках, где отсутствуют данные по причине неполноты исходной информации, делают специальные пометки (...; —; НС).
Пример. Группировочная таблица.
Отношение студентов одного из факультетов к понижению размера стипендии (по результатам исследования в январе 2003 г.).
Сказуемое
Поддерживаю | Не поддерживаю | Безразлично | |
Студенты 1-го курса | |||
Студенты 2-го курса | |||
Студенты 3-го курса | |||
Студенты 4-го курса | — | — | |
Студенты 5-го курса | — | — | |
Итого |
Подлежащее
Таким образом, группировка – это разделение единиц совокупности на группы по выбранным варьирующим признакам.
Группировки различают:
по задачам систематизации данных;
по числу группировочных признаков;
по используемой информации.
Метод группировок применяется для решения задач, возникающих в ходе научного статистического исследования:
• выделения социально-экономических типов явлений;
• изучения структуры явления и структурных сдвигов, про
исходящих в нем;
• выявления связей и зависимостей между отдельными
признаками явления.
Для решения этих задач применяют (соответственно) 3 вида группировок: типологические, структурные и аналитические (факторные).
Типологические группировки предназначаются для выявления качественно однородных групп совокупностей, т.е. объектов, близких друг к другу одновременно по всем группировочным признакам. Например, группировка предприятий города по формам собственности.
Структурные — разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку. Например, группировка рабочих цеха ж? квалификации.
Аналитические — предназначены для выявления зависимости между признаками. Строят аналитические группировки, выделив результирующие, которые изменяются, и факторные, зависимость от которых исследуется. По числу группировочных признаков различают простые (по одному признаку) и сложные (по нескольким признакам — санированные и многомерные).
Комбинированные группировки строятся путем разбивки каждой группы на подгруппы в соответствии с дополнительными признаками.
Многомерные — строятся с помощью специальных алгоритмов, когда осуществляется поиск скопления в п -мерном пространстве. где каждый объект — точка, т.е. построить многомерную группировку — найти скопление точек.
При используемой информации различают первичные и вторичные группировки.
Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.
Вторичные — результат объединения или расщепления первичной группировки.
Правила оформления статистических таблиц
Статистическая таблица обязательно имеет заголовок, в котором должны быть указаны цель построения таблицы, территория и время, к которому относятся данные. Если все единицы измерения одинаковы, то они указываются в заголовке таблицы. Если же они разные — в верхних или боковых заголовках таблицы.
Разграфка таблицы должна включать как можно меньше линий — только горизонтальные линии, отделяющие таблицу от ее заголовка; заголовки граф от значений показателей; итоговую строку таблицы. Вертикальных линий вообще может не быть. Таблица не очерчивается рамкой, если она не включена в текст. Иногда графы сказуемого нумеруются.
4.2. Сводка и группировка материалов статистического наблюдения
В результате первой стадии статистического исследования (статистического наблюдения) получают статистическую информацию, представляющую собой большое количество первичных, разрозненных сведений об отдельных единицах объекта исследования (например, записи о каждом гражданине страны при переписи населения: пол, национальность, возраст, образование, род занятий и другие признаки).
Дальнейшая задача статистики заключается в том, чтобы привести эти материалы в определенный порядок, систематизировать, и на этой основе дать сводную характеристику всей совокупности фактов при помощи обобщающих статистических показателей, отражающих сущность социально-экономических явлений и определенные статистические закономерности. Это достигается в результате сводки — второй стадии статистического исследования.
Статистическая сводка — научно организованная обработка материалов наблюдения, включающая в себя систематизацию группировку данных, составление таблиц, подсчет групповых и общих итогов, расчет производных показателей (средних относительных величин). Она позволяет перейти к обобщающим показателям совокупности в целом и отдельных ее частей, осуществлять анализ и прогнозирование изучаемых процессов.
Если производится только подсчет общих итогов по изучаемой совокупности единиц наблюдения, то сводка называется простой. Например, для получения общей численности студентов высших учебных заведений России достаточно сложить данные о численности студентов всех высших учебных заведений (на начало 1995/96 учебного года в государственных вузах страны обучалось 2,66 млн. чел.).
По технике или способу выполнения сводка может быть ручной либо механизированной (с помощью ЭВМ).
Статистическая сводка должна проводиться по определенным программе и плану.
Программа статистической сводки устанавливает следующие этапы:
• выбор группировочных признаков; определение порядка формирования групп;
• разработка системы статистических показателей для характеристики групп и объекта в целом;
• разработка макетов статистических таблиц для представления результатов сводки.
ПЛАН статистической сводки содержит указания о последовательности и сроках выполнения отдельных частей сводки, ее исполнителях и порядке изложения и представления результатов
В сводке статистического материала отдельные единицы статистической совокупности объединяются в группы при почет ода группировок.
Статистическая группировка — процесс образования однородных групп на основе расчленения статистической совокупностина части или объединения изучаемых единиц в частные совокупности по существенным для них признакам, каждая характеризуется системой статистических показателей. Например, группировка промышленных предприятий по формам собственности, населения по размеру среднедушевого дохода, коммерческих банков по сумме активов баланса и т.д.
Особым видом группировок является классификация. Представляющая собой устойчивую номенклатуру классов и групп, образованных на основе сходства и различия единиц изучаемого объекта. Классификация выступает в роли своеобразного статистического стандарта, устанавливаемого на определенный промежуток времени, например, ЕГРПО, Общероссийский классификатор видов экономической деятельности, продукции и услуг (ОКДП), классификация основных фондов в промышленном строительстве, капитальных вложений, затрат на производство и др.
Метод статистических группировок позволяет разрабатывать первичный статистический материал. На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения, анализа причин различий между группами, изучения взаимосвязей между признаками. Расчет сводных показателей в целом по совокупности позволяет изучить ее структуру.
Кроме того, группировка создает основу для последующей сводки и анализа данных. Этим определяется роль группировок как научной основы сводки.
Большие достижения в области применения метода группировок имеет современная отечественная статистика. Введение группировочных таблиц, содержащих показатели международной СНС, превращает группировки (классификации) в эффективный метод анализа и вскрытия резервов в экономике.
4.3. Выполнение группировки по количественному признаку
При составлении структурных группировок на основе варьирующих количественных признаков необходимо определить количество групп и интервалы группировки.
Интервал — количественное значение, отделяющее одну единицу (группу) от другой, т. е. он очерчивает количественные границы групп.
Как правило, величина интервала представляет собой разность между максимальным и минимальным значениями признака в каждой группе.
Вопрос о числе групп и величине интервала следует решать с учетом обстоятельств, прежде всего исходя из целей исследования, значения изучаемого признака и т. д.
Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот. Количество групп зависит от числа единиц исследуемого объекта и степени колеблемости группировочного признака. При небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными.
При определении количества групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому количество групп должно быть оптимальны м, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел. Однако в отдельных случаях представляет интерес и малочисленные группы: новое, передовое, пока не станет массовым, проявляется в незначительном числе фактов; поэтому задача статистики — выделить эти факты, изучить их.
Таким образом, при решении вопроса о численности единиц в группах нужно руководствоваться не формальными признаками, а знанием сущности изучаемого явления.
На количество выделяемых групп существенное влияние оказывает степень колеблемости группировочного признака: чем она больше, тем больше следует образовать групп.
Ориентировочно определить оптимальное количество групп с равнымиинтервалами можно по формуле американского ученого Стерджесса
N | 15-24 | 25-44 | 45-89 | 90-179 | 180-359 | 360-719 |
n | 6 | 7 |
Формула Стерджесса пригодна при условии, что распределение единиц совокупности по данному признаку приближается к нормальному, и при этом применяются равные интервалы в группах. Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления.
Интервалы могут быть равные и неравные. При исследовании экономических явлений могут применяться неравные (прогрессивно возрастающие, прогрессивно убывающие) интервалы. Так, например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы: до 100 чел., 100-200; 200-300; 300-500; 500-1000; 1000 и более человек. Это объясняется тем, что количественные изменения размера признака имеют неодинаковые значения в низших и высших по размеру признака группах; изменение количества работающих на 50-100 чел. имеет существенное значение для мелких предприятий, а для крупных — не имеет.
Группировки с равными интервалами целесообразны в тех, случаях, когда вариация проявляется в сравнительно узких границах и распределение является практически равномерным (например, при группировке рабочих одной профессии по размеру заработной платы, посевов какой-либо культуры — по урожайности).
Для группировок с равными интервалами величина интервала
I= (X max – X min) /n
X max, X max – наибольшее и наименьшее значения признака, n- число групп.
Если, например, требуется произвести группировку с равными интервалами по данным об уровне месячной заработной платы рабочих, которая в 2006 г. колебалась в пределах от 600-до 7500 руб., и необходимо при этом выделить 5 групп, то величина интервала, в рублях, составит:
I =(7500-6000) /5 = 300
Если в результате деления получится нецелое число и возникнет необходимость в округлении, то округлять нужно, как правило, в большую сторону, а не в меньшую.
Прибавляя к минимальному значению признака (в данном случае 6000 тыс. руб.) найденное значение интервала, получаем верхнюю границу первой группы, тыс. руб.:
6000 + 300 = 6300.
Прибавляя далее значение интервала к верхней границе первой группы, получаем верхнюю границу второй группы
6300 + 300 = 6600, и т. д.
В результате получим такие группы рабочих по размеру заработной платы, руб.:
6000-6300; 6300-6600; 6600-6900; 6900-7200; 7200-7500.
В этом распределении имеет место неопределенность: к группе, например, отнести рабочего с заработком в 6300 первой или второй? Для устранения неопределенности открывают един из крайних интервалов или используют принцип единообразия — левое число включает в себя обозначенные, а правое — не включает. Значит рабочий, получающий 6300 руб., должен быть отнесен ко второй группе. Аналогично нужно поступать в отношении всех остальных групп могут быть закрытыми, когда указаны верхняя границы (как в приведенном примере), и открытыми, когда указана лишь одна из границ (первый или интервалы, величина которых принимается равной величине смежных с ними интервалов). Во втором случае, чтобы показать, что рабочий с заработной платой, равной, например, верхней границе интервала, включается в последнюю группу, ее следует обозначить «7500 и выше». И наоборот, чтобы значение, равное верхней границе интервала, не входит в данную группу, последнюю группу нужно обозначить «свыше 750». Подобные функции выполняют слова «до», «менее» и «более».
Все сказанное выше относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но иногда приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, имеющиеся группировки могут быть несопоставимы из-за различного числа выделенных групп или неодинаковых границ интервалов. Для приведения таких группировок к сопоставимому виду в целях их дальнейшего сравнительного анализа используется метод вторичной группировки, являющейся особым видом группировки.
Вторичная группировка — образование новых групп на основе ранее осуществленной группировки.
Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединением первоначальных интервалов (путем их укрупнения) и долевой перегруппировкой (на основе закрепления за каждой группой определенной доли единиц совокупности).
Использование вторичной группировки для приведения двух группировок с различными интервалами к единому виду рассмотрим, на примере распределения акционеров двух районов области по размеру дивидендов на одну акцию в 1996 г. (по условным данным табл. 4.1).
Приведенные данные не позволяют сравнить распределение акционеров двух районов по размеру дивидендов на одну акцию, так как в этих районах имеется различное число групп акционеров, и, кроме того, различны величины интервалов.
Необходимо ряды распределения привести к сопоставимому виду. За основу сравнения возьмем структуру распределения акционеров второго района (как наиболее крупную). Следовательно, по первому району нужно произвести вторичную группировку или перегруппировку акционеров, образовав такое же число групп и с теми же интервалами, как во втором районе.