Основная задача выборочного метода – определение ошибки выборки, т.к. если не известен размер ошибки, данные выборки не могут иметь практического значения. Результаты выборочного наблюдения тем точнее, чем меньше колеблемость изучаемого признака.
При выборочном наблюдении по количественному признаку ставится задача определить среднее значение этого признака в выборочной совокупности. Далее возникает вопрос, насколько это среднее значение типично или показательно, т.е. насколько правильно и точно характеризует среднее значение данную совокупность по изучаемому признаку. Для ответа на этот вопрос необходимо вычислить особый показатель - среднее квадратическое отклонение.
Судебная статистика, в частности уголовно-правовая, чаще имеет дело с качественными признаками. При выборочном наблюдении интересующих явлений по качественному признаку, ставится задача установить долю явлений, обладающих этим признаком. Если долю явлений, обладающих данным признаком, обозначить символом , то доля остальных явлений, не обладающих этим признаком, будет определяться как .Действительно, если допустить, что доля осужденных, совершивших хулиганство в состоянии опьянения, составляет 90% (или 0,9), то очевидно, доля хулиганов «трезвенников», будет равна разности: 100% — 90% (или 1-0,9), т.е. 10% (или 0,1).
|
|
Разработанная математической статистикой формула колеблемости отдельных вариантов ряда для совокупности явлений, исчисляемых по качественным признакам, выглядит следующим образом:
– дисперсия качественного признака.
Дисперсия – это средний квадрат отклонения изучаемого признака от среднего значения признака.
Напомним, дисперсия количественного признака определяется следующим образом:
.
Среднее квадратическое отклонение можно получить, извлекая квадратный корень из дисперсии:
- для качественного признака,
- для количественного признака.
Основной вопрос выборочного наблюдения заключается в том, насколько средняя выборочной совокупности отличается средней генеральной совокупности, т.е. как велика ошибка репрезентативности.
Ответ на вопрос, каким образом определить размер ошибки выборки, дает математическая теория выборочного метода.
При достаточно большом числе независимых наблюдений можно почти достоверно, утверждать, что отклонение выборочной средней от генеральной будет сколько угодно малым (теорема П.Л. Чебышева). На размерах ошибки выборки будет сказываться, с одной стороны, действие закона больших чисел: чем больше единиц попадает в выборку, тем будет меньше возможная ошибка, а с другой стороны размер ошибки зависит от колеблемости, пестроты обследуемых по определенному признаку единиц совокупности.
|
|
Для определения ошибки репрезентативности, обозначаемой в статистике W, рекомендуется пользоваться следующими двумя формулами:
- для количественного признака;
- для качественного признака.
где W - средняя ошибка репрезентативности; - показатель колеблемости количественного признака ( - среднее квадратическое отклонение); п - число единиц, попавших в выборку; Р - доля данного качественного признака в выборке - доля противоположного признака.
Правило трех сигм. Необходимо отметить, что данное правило можно использовать для случайных величин, имеющих нормальный закон распределения. Следующее свойство среднего квадратического отклонения позволяет правильно оценить надежность выборочных показателей. Если площадь, ограниченную кривой нормального распределения, принять за 1 или 100%, то площадь, заключенная в пределах 1 вправо и влево от средней арифметической, составит 0,683 всей площади. Это означает, что 68,3% всех изученных вариант отклоняется от средней арифметической не более чем на 1 , т.е. находится в пределах . Интервал значений от до принято называть первым доверительным интервалом.
Рис 2. Правило трех .
Площадь, заключенная в пределах 2 вправо и влево от средней арифметической, составляет 0,954 всей площади, т.е. 95,4% всех единиц совокупности находится в пределах . Интервал значений от до принято называть вторым доверительным интервалом. Площадь, заключенная в пределах 3 влево и вправо от средней арифметической, составляет 0,997 всей площади, или 99,7% всех единиц совокупности находится в пределах . Интервал значений от до принято называть третьим доверительным интервалом.
ПРАКТИЧЕСКИЕ ЗАДАНИЯ И ПОРЯДОК ИХ ВЫПОЛНЕНИЯ
Для закрепления изученного материала предлагается выполнить практические задания по расчету характеристик выборочной совокупности. Для этого воспользуемся персональным компьютером и офисными приложениями Word и Excel.
Порядок выполнения заданий №1. При выборочном наблюдении получены данные о возрасте осужденных.
Выборочная совокупность
Возраст | |||||||
Количество осужденных |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Возраст | |||||||
Количество осужденных |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Решение
Определим среднее значение признака для выборочной совокупности, учитывая, что частоты вариант различны. Поэтому для расчета воспользуемся формулой взвешенной средней арифметической
,
получим .
Далее рассчитаем среднее квадратическое отклонение по данным выборочной совокупности, для этого воспользуемся выражением
,
в результате получаем .
Найдем ошибку репрезентативности выборочных данных
,
где n – объем выборочной совокупности, его можно найти как сумму частот, т.е. .
Определим первый доверительный интервал
или (22,5÷23,1), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,638.
Определим второй доверительный интервал
или (22,2÷23,4), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,954.
Определим третий доверительный интервал
или (19,9÷23,7), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,997.
|
|
Для определения в какой доверительный интервал попадает среднее значение признака для генеральной совокупности определим это значение:
.
Значение оказывается в интервале (22,2÷23,4), с вероятностью 0,954.
Порядок выполнения заданий №2. В порядке случайной выборки обследовано 700 заключенных из 4000. В результате наблюдения установлено, что доля заключенных, совершивших преступление в состоянии опьянения, составила 0,7 или 70 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы, если коэффициенты доверия принимают значения , , .
Решение
Для определения ошибки репрезентативности при исследовании качественного признака необходимо воспользоваться выражением:
,
где п – объем выборки, Р - доля исследуемого качественного признака в выборке (совершение преступления в состоянии опьянения), а - доля противоположного признака.
Подставляя имеющиеся данные получим
или 1,7 %.
Определим первый доверительный интервал
или (68,3% ÷ 71,7%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,638.
Определим второй доверительный интервал
или (66,6% ÷ 73,4%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,954.
Определим третий доверительный интервал
или (64,9% ÷ 75,1%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,997.
Вариант №1
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
|
|
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 300 водителей из 2000, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,78 или 78 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №2
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 150 водителей из 1000, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,68 или 68 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №3
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 200 водителей из 1500, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,83 или 83 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №4
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 120 водителей из 800, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,75 или 75 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №5
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 100 водителей из 900, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,73 или 73 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №6
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 140 водителей из1200, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,69 или 69 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №7
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 130 водителей из 1400, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,7 или 70 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №8
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 160 водителей из 1300, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,66 или 66 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №9
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 110 водителей из 1600, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,63 или 63 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №10
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 160 водителей из 1800, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,57 или 57 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Задание на самостоятельную подготовку.
К следующему практическому занятию повторите материал по теме «Выборочный метод статистического наблюдения», для закрепления и углубления полученных знаний воспользуйтесь предложенной литературой.
Литература:
основная:
1. Савюк Л.К. Правовая статистика [Текст]: учебник / Л.К. Савюк. – 2-е изд., перераб. и доп. – М.: Юристъ, 2006. – 637 с.
2. Лунеев В.В. Юридическая статистика [Текст]: учебник / В.В. Лунеев. – 2-е изд., перераб. и доп. – М.: Юристъ, 2004. – 392 с.
дополнительная:
3. Лялин В.С. Правовая статистика [Текст]: учебник / В.С. Лялин. – М.: ИВЭСЭП, 2006. – 235 с.
4. Правовая статистика [Текст]: учебник / В.Н. Демидов и др.; под ред. С.Я. Казанцева, С.Я. Лебедева. – М.: ЮНИТИ-ДАНА, Закон и право, 2007. – 255 с.
5. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики [Текст]: учебник / М.Р. Ефимова, Е.В. Петрова, В.Н. Румянцев – 2-е изд., испр. и доп. – М.: ИНФРА-М, 2001. – 416 с.
6. Горемыкина Т.К. Общая и правовая статистика [Текст]: учебное пособие / Т.К. Горемыкина. – М.: МГИУ, 2001. – 175 с.