Статистическое наблюдение, сводка и группировка
Статистическое наблюдение – это сбор данных, фактов, сведений об изучаемом явлении
Статистическая сводка – это приведение собранной информации к виду, удобному для проведения анализа.
Группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным существенным для них признаками.
Важным направлением в статистической сводке является построение рядов распределения. Ряд распределения – простейшая группировка, представляющая собой распределение численности единиц изучаемой совокупности по значению какого-либо признака. Если в основу построения ряда распределения положен качественный признак (мужчина/женщина, сельское население/городское население, форма собственности ООО/АО/ИП и т.д.), то ряд называется атрибутивным. Если ряд построен по количественному признаку, то он называется вариационным (объем производства, размер выручки, численность населения, среднедушевой доход, объем инвестиций и т.д.). Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное числовое выражение варьирующего признака. Например, в зачетке оценки (баллы) 5,4,3,2 - это признаки. Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Например, в зачетке количество пятерок 3 шт., т.е. 3 это частота появления признака 5, количество четверок 2 шт., т.е. 2 это частота появления признака 4 и т.д. Сумма всех частот определяет численность всей совокупности, ее объем. Частота появления признака в статистике обозначается f.
Вариационные ряды делят на дискретные и интервальные ряды распределения. В дискретном ряду признак это просто число (2,8,9,4,6). В интервальном ряду признак число принимает разные значения в пределах интервала, например, заработная плата работников предприятия в зависимости от занимаемой должности варьируется (тыс. руб.):
1. До 5
2. 5-10
3. 10-15
4. 15-20
5. Свыше 20
Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами. Величина интервала обозначается h.
Закрытыми называются интервалы, у которых имеются верхняя и нижняя границы. В примере это интервалы под номерами 2,3,4.
Открытые - это те интервалы, у которых указана только одна граница: верхняя - у первого, нижняя - у последнего. В примере это интервалы под номерами 1,5.
В статистике признаки делятся на факторные (Х) и результативные (У). Факторными называются признаки, под воздействием которых изменяются другие - результативные признаки. Взаимосвязь проявляется в том, что с возрастанием значения факторного признака систематически возрастает или убывает значение признака результативного.
Достаточно часто информацию, собранную в ходе наблюдения и представленную в виде вариационного ряда распределения, необходимо сократить. Для этого вариационный ряд преобразуют в интервальный ряд. Чтобы преобразовать вариационный ряд в интервальный ряд распределения, необходимо найти оптимальное число интервалов и величину равного интервала.
1) Оптимальное число интервалов можно определить с использованием формулы Стерджесса:
n = 1 + 3,322 x lоg N, (1)
где n - число групп
N - число единиц совокупности
2) После определения числа интервалов, следует определить величину равного интервала. Величина равного интервала определяется по следующей формуле:
h = (2)
где хmax, xmin - максимальное и минимальное значения признака в совокупности;
n – количество интервалов.
Пример 1: имеются данные о деятельности коммерческих банков Дальневосточного региона
№ банка | Процентная ставка, % | Сума выданных кредитов, млн. руб. |
1. Построить интервальный ряд с равными интервалами.
2. Изучить взаимосвязь между признаками.
3. Сделать вывод о направлении связи данных признаков с применением методов статистики.
Решение:
1. Определим оптимальное количество интервалов для 30 единиц совокупности по формуле Стерджесса: n = 1 + 3,322 x lоg 30 = 5,9. Округлим результат до шести интервалов.
2. Определим величину равного интервала по процентной ставке, используя формулу 2:
h =
Величина равного интервала по процентной ставке составляет 2,5%.
Чтобы преобразовать имеющийся дискретный ряд в интервальный, надо к минимальному значению признака 11% прибавить величину равного интервала 2,5% и закрыть первый интервал значением 13,5%, далее к 13,5 прибавить 2,5% и закрыть второй интервал 16% и т.д.
3. Построим учебную таблицу 1, в которой распределим банки по процентной ставке. По исходным данным распределим банки по процентной ставке. Банк № 1 имеет процентную ставку 20%, следовательно, он относится к 4 группе; банк № 2 имеет процентную ставку 17%, следовательно, он относится к 3 группе; банк № 3 имеет процентную ставку 14%, следовательно, он относится ко 2 группе; банк № 4 имеет процентную ставку 11%, следовательно, он относится к 1 группе; банк № 2 имеет процентную ставку 17%, следовательно, он относится к 3 группе; … банк № 7 имеет процентную ставку 21%, следовательно, он относится к 4 группе и т.д.
Таблица 1 – Распределение банков по величине процентной ставке
(таблица учебная)
№ группы | Интервал % ставка | № банка | Число банков |
11-13,5 | 4,29 | ||
13,5-16,0 | 3,12,9,15,18,21,25,30 | ||
16,0 -18,5 | 2,5,10,14,17,22,24,27,28 | ||
18,5-21,0 | 1,6,7,11,16,19 | ||
21,0-23,5 | 20,23 | ||
23,5-26 | 18,13,26 | ||
итого | - | - |
4. Далее построим рабочую таблицу 2. В столбцы процентная ставка (столбец 4) и сумма выданных кредитов (столбец 5) надо выписать исходные данные. В строке итого надо написать количество банков в группе, сумму процентных ставок, сумму выданных кредитов.
Таблица 2 – Группировка банков по величине процентной ставке
(таблица рабочая)
№ группы | Интервал % ставка | № банка | % ставка | Сумма выданных кредитов, млн. руб. |
11-13,5 | ||||
итого | ||||
13,5-16,0 | ||||
итого | ||||
16,0 -18,5 | ||||
итого | ||||
18,0-21,0 | ||||
Итого | ||||
21,0-23,5 | ||||
итого | ||||
23,5-26 | ||||
итого |
Определим, существует ли взаимосвязь между процентной ставкой и суммой выданных кредитов в таблице 3.
В столбцы % ставка и сумма выданных кредитов надо выписать итоговые значения из таблицы 2.
Чтобы рассчитать среднее значение по % ставке надо 23/2 = 11,5%, 120/8 = 15%, 159/9 = 17,7% и т.д.
Чтобы рассчитать среднее значение по сумме выданных кредитов надо 55/2 = 27,5, 168/8 = 21, 121/9 = 13,4 и т.д.
Таблица 3 – Взаимосвязь между процентной ставкой и суммой выданного кредита
№ группы | Интервал % ставка | Число банков | % ставка
| Сумма выданных кредитов, млн. руб. | ||
итого | в среднем | итого | в среднем | |||
11-13,5 | 11,5 | 27,5 | ||||
13,5-16,0 | 15,0 | 21,0 | ||||
16,0 -18,5 | 17,7 | 13,4 | ||||
18,0-21,0 | 20,3 | 9,5 | ||||
21,0-23,5 | 22,0 | 5,0 | ||||
23,5-26 | 24,7 | 2,3 | ||||
итого | - | - | - | - | - |
По данным таблицы 3 видно (столбцы в среднем), что связь между процентной ставкой и суммой выданного кредита существует и эта связь обратная, т.е. с увеличением процентной ставки сумма кредита уменьшается и наоборот, с уменьшением процентной ставки сумма выданных кредитов увеличивается.