Значения финансовых показателей выбранных банков экспортируются в файл Exсel со страницы http://www.banki.ru/banks/ratings/, нажав на закладку «рэнкинг банков по мсфо 2016» (рис. 1).
Рисунок 1 – Экспорт показателей деятельности банков РФ
Определение числа групп с можно осуществить математическим путем, используя формулу Стерджесса:
n = 1 + 3,322 • lgN, (1)
где п - число групп; N - число единиц совокупности.
Недостаток формулы Стерджесса состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц, распределение единиц по признаку, положенному в основание группировки, близко к нормальному и при этом в группах применяются равные интервалы.
Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления.
Величина равного интервала вычисляется по формуле
i = (Хmax- Xmin) /n, (2)
где хmах и xmin - максимальное и минимальное значения признака в совокупности.
Прежде чем определять максимальное и минимальное значения, из совокупности рекомендуется исключить аномальные наблюдения.
Если максимальное и минимальное значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное и минимальное значения, а значения, несколько превышающие минимум и несколько меньше, чем максимум.
Полученное значение величины интервала необходимо округлить, как правило, в большую сторону.
Если размах вариации признака совокупности велик и значения признака варьируются неравномерно, то следует использовать группировку с неравными интервалами. Использование неравных интервалов характерно для большинства социально-экономических явлений, особенно при анализе макроэкономических показателей. |
Неравные интервалы могут быть прогрессивно возрастающими или прогрессивно убывающими в арифметической или геометрической прогрессии, а также произвольными и специализированными.
Использование прогрессивно-возрастающих и прогрессивно-убывающих интервалов объясняется тем, что количественные изменения размера признака имеют неодинаковые значения в низших и высших по размеру признака группах.
Специализированные интервалы используются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.
Если основанием группировки служит непрерывный признак, то одно и то же значение признака выступает и верхней, и нижней границами двух смежных интервалов. Таким образом, нижняя граница (i + 1)-го интервала равна верхней границе i-ro интервала.
Если в основании группировки лежит прерывный признак, то нижняя граница (i + 1)-го интервала равна верхней границе i-ro интервала, увеличенной на 1.