double arrow

Статистическое наблюдение, сводка и группировка

Статистическое наблюдение, сводка и группировка

Статистическое наблюдение – это сбор данных, фактов, сведений об изучаемом явлении

Статистическая сводка – это приведение собранной информации к виду, удобному для проведения анализа. 

Группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным существенным для них признаками.

Важным направлением в статистической сводке является построение рядов распределения. Ряд распределения – простейшая группировка, представляющая собой распределение численности единиц изучаемой совокупности по значению какого-либо признака. Если в основу построения ряда распределения положен качественный признак (мужчина/женщина, сельское население/городское население, форма собственности ООО/АО/ИП и т.д.), то ряд называется атрибутивным. Если ряд построен по количественному признаку, то он называется вариационным (объем производства, размер выручки, численность населения, среднедушевой доход, объем инвестиций и т.д.). Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное числовое выражение варьирующего признака. Например, в зачетке оценки (баллы) 5,4,3,2 - это признаки. Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Например, в зачетке количество пятерок 3 шт., т.е. 3 это частота появления признака 5, количество четверок 2 шт., т.е. 2 это частота появления признака 4 и т.д. Сумма всех частот определяет численность всей совокупности, ее объем. Частота появления признака в статистике обозначается f.

Вариационные ряды делят на дискретные и интервальные ряды распределения. В дискретном ряду признак это просто число (2,8,9,4,6). В интервальном ряду признак число принимает разные значения в пределах интервала, например, заработная плата работников предприятия в зависимости от занимаемой должности варьируется (тыс. руб.):

1. До 5

2. 5-10

3. 10-15

4. 15-20

5. Свыше 20

Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами. Величина интервала обозначается h.

Закрытыми называются интервалы, у которых имеются верхняя и нижняя границы.  В примере это интервалы под номерами 2,3,4.

Открытые - это те интервалы, у которых указана только одна граница: верхняя - у первого, нижняя - у последнего. В примере это интервалы под номерами 1,5.

В статистике признаки делятся на факторные (Х) и результативные (У). Факторными называются признаки, под воздействием которых изменяются другие - результативные признаки. Взаимосвязь проявляется в том, что с возрастанием значения факторного признака систематически возрастает или убывает значение признака результативного.

Достаточно часто информацию, собранную в ходе наблюдения и представленную в виде вариационного ряда распределения, необходимо сократить. Для этого вариационный ряд преобразуют в интервальный ряд. Чтобы преобразовать вариационный ряд в интервальный ряд распределения, необходимо найти оптимальное число интервалов и величину равного интервала.                                                                                           

1) Оптимальное число интервалов можно определить с использованием формулы Стерджесса:

n = 1 + 3,322 x lоg N,                                    (1)

где n - число групп

N - число единиц совокупности

2) После определения числа интервалов, следует определить величину равного интервала. Величина равного интервала определяется по следующей формуле:

h =                                                 (2)

где хmax, xmin - максимальное и минимальное значения признака в совокупности;

n – количество интервалов.

Пример 1: имеются данные о деятельности коммерческих банков Дальневосточного региона

№ банка

Процентная ставка, %

Сума выданных кредитов, млн. руб.

 

1. Построить интервальный ряд с равными интервалами.

2. Изучить взаимосвязь между признаками.

3. Сделать вывод о направлении связи данных признаков с применением методов статистики.

Решение:

1. Определим оптимальное количество интервалов для 30 единиц совокупности по формуле Стерджесса: n = 1 + 3,322 x lоg 30 = 5,9. Округлим результат до шести интервалов.

2. Определим величину равного интервала по процентной ставке, используя формулу 2:

h =

Величина равного интервала по процентной ставке составляет 2,5%.

Чтобы преобразовать имеющийся дискретный ряд в интервальный, надо к минимальному значению признака 11% прибавить величину равного интервала 2,5% и закрыть первый интервал значением 13,5%, далее к 13,5 прибавить 2,5% и закрыть второй интервал 16% и т.д.

3. Построим учебную таблицу 1, в которой распределим банки по процентной ставке. По исходным данным распределим банки по процентной ставке. Банк № 1 имеет процентную ставку 20%, следовательно, он относится к 4 группе; банк № 2 имеет процентную ставку 17%, следовательно, он относится к 3 группе; банк № 3 имеет процентную ставку 14%, следовательно, он относится ко 2 группе; банк № 4 имеет процентную ставку 11%, следовательно, он относится к 1 группе; банк № 2 имеет процентную ставку 17%, следовательно, он относится к 3 группе; … банк № 7 имеет процентную ставку 21%, следовательно, он относится к 4 группе и т.д.

Таблица 1 – Распределение банков по величине процентной ставке

(таблица учебная)

№ группы Интервал % ставка № банка Число банков
  11-13,5 4,29  
  13,5-16,0 3,12,9,15,18,21,25,30  
  16,0 -18,5 2,5,10,14,17,22,24,27,28  
  18,5-21,0 1,6,7,11,16,19  
  21,0-23,5 20,23  
  23,5-26 18,13,26  
итого - -  

 

4. Далее построим рабочую таблицу 2. В столбцы процентная ставка (столбец 4) и сумма выданных кредитов (столбец 5) надо выписать исходные данные. В строке итого надо написать количество банков в группе, сумму процентных ставок, сумму выданных кредитов.

 

Таблица 2 – Группировка банков по величине процентной ставке

(таблица рабочая)

№ группы Интервал % ставка № банка % ставка Сумма выданных кредитов, млн. руб.

11-13,5

     
     
  итого      

13,5-16,0

     
     
     
     
     
     
     
     
  итого      

16,0 -18,5

     
     
     
     
     
     
     
     
     
  итого      

18,0-21,0

     
     
     
     
     
     
  Итого      

21,0-23,5

     
     
  итого      

23,5-26

     
     
     
  итого      

 

Определим, существует ли взаимосвязь между процентной ставкой и суммой выданных кредитов в таблице 3.

В столбцы % ставка и сумма выданных кредитов надо выписать итоговые значения из таблицы 2.

Чтобы рассчитать среднее значение по % ставке надо 23/2 = 11,5%, 120/8 = 15%, 159/9 = 17,7% и т.д.

Чтобы рассчитать среднее значение по сумме выданных кредитов надо 55/2 = 27,5, 168/8 = 21, 121/9 = 13,4 и т.д.

Таблица 3 – Взаимосвязь между процентной ставкой и суммой выданного кредита

№ группы

Интервал % ставка

Число банков

% ставка

 

 

Сумма выданных кредитов, млн. руб.

итого в среднем итого в среднем
  11-13,5     11,5   27,5
  13,5-16,0     15,0   21,0
  16,0 -18,5     17,7   13,4
  18,0-21,0     20,3   9,5
  21,0-23,5     22,0   5,0
  23,5-26     24,7   2,3
итого -   - - - -

 

По данным таблицы 3 видно (столбцы в среднем), что связь между процентной ставкой и суммой выданного кредита существует и эта связь обратная, т.е. с увеличением процентной ставки сумма кредита уменьшается и наоборот, с уменьшением процентной ставки сумма выданных кредитов увеличивается.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



Сейчас читают про: