Основные характеристики выборочной совокупности

Основная задача выборочного метода – определение ошибки выборки, т.к. если не известен размер ошибки, данные выборки не могут иметь практического значения. Результаты выборочного на­блюдения тем точнее, чем меньше колеблемость изучае­мого признака.

При выборочном наблюдении по количественному приз­наку ставится задача определить среднее значение этого признака в выборочной совокупности. Далее возникает вопрос, насколько это среднее значение типично или показательно, т.е. насколько правильно и точно характе­ризует среднее значение данную совокупность по изучаемому признаку. Для от­вета на этот вопрос необходимо вычис­лить особый показатель - среднее квадратическое отклонение.

Судебная статистика, в частности уголовно-правовая, чаще име­ет дело с качественными признаками. При выборочном наблюдении интересующих явлений по качественному признаку, ставится задача установить долю явлений, обладающих этим признаком. Если долю явлений, обладающих данным призна­ком, обозначить символом , то доля остальных явлений, не обла­дающих этим признаком, будет определяться как .Действительно, если допустить, что доля осужденных, совершивших хулиганство в со­стоянии опьянения, составляет 90% (или 0,9), то очевидно, доля ху­лиганов «трезвенников», будет равна разности: 100% — 90% (или 1-0,9), т.е. 10% (или 0,1).

Разработанная математической статистикой формула колеблемо­сти отдельных вариантов ряда для совокупности явлений, исчисляе­мых по качественным признакам, выглядит следующим образом:

 

– дисперсия качественного признака.

 

Дисперсия – это средний квадрат отклонения изучаемого признака от среднего значения признака.

Напомним, дисперсия количественного признака определяется следующим образом:

 

.

 

Среднее квадратическое отклонение можно получить, извлекая квадратный корень из дисперсии:

 

- для качественного признака,

 

- для количественного признака.

Основной вопрос выборочного наблюдения заключается в том, насколько средняя выборочной совокупности отличается средней гене­ральной совокупности, т.е. как велика ошибка репрезентативности.

Ответ на вопрос, каким образом определить размер ошибки вы­борки, дает математическая теория выборочного метода.

При достаточно большом числе независимых наблюдений мож­но почти достовер­но, утверждать, что отклонение выборочной средней от гене­ральной будет сколько угодно малым (теорема П.Л. Чебышева). На размерах ошибки выборки будет сказываться, с одной стороны, действие закона больших чисел: чем больше единиц попадает в выборку, тем будет меньше возможная ошибка, а с другой стороны размер ошибки зависит от колеблемости, пе­строты обследуемых по определенному признаку единиц совокуп­ности.

Для определения ошибки репрезентативности, обозначае­мой в статистике W, рекомендуется пользоваться следующими двумя формулами:

 

- для количественного признака;

 

- для качественного признака.

где W - средняя ошибка репрезентативности; - показатель колеб­лемости количественного признака ( - среднее квадратическое от­клонение); п - число единиц, попавших в выборку; Р - доля данного качественного признака в выборке - доля противо­положного признака.

Правило трех сигм. Необходимо отметить, что данное правило можно использовать для случайных величин, имеющих нормальный закон распределения. Следующее свойство среднего квадратического отклонения позво­ляет правильно оценить надежность выборочных показателей. Если пло­щадь, ограниченную кривой нор­мального распределения, принять за 1 или 100%, то площадь, заключенная в пределах 1 вправо и влево от средней арифметической, составит 0,683 всей площади. Это означает, что 68,3% всех изученных вариант откло­няется от средней арифметической не более чем на 1 , т.е. находится в пре­делах . Интервал значений от до принято называть первым доверительным интервалом.

 

 

Рис 2. Правило трех .

 

Площадь, заключенная в преде­лах 2 вправо и влево от средней арифметической, составляет 0,954 всей площади, т.е. 95,4% всех единиц совокупности находится в пре­делах . Интервал значений от до принято называть вторым доверительным интервалом. Площадь, заключенная в пределах 3 влево и вправо от средней арифметической, составляет 0,997 всей площади, или 99,7% всех единиц совокупности находится в пределах . Интервал значений от до принято называть третьим доверительным интервалом.

 

ПРАКТИЧЕСКИЕ ЗАДАНИЯ И ПОРЯДОК ИХ ВЫПОЛНЕНИЯ

 

Для закрепления изученного материала предлагается выполнить практические задания по расчету характеристик выборочной совокупности. Для этого воспользуемся персональным компьютером и офисными приложениями Word и Excel.

Порядок выполнения заданий №1. При выборочном наблюдении получены данные о возрасте осужденных.

 

Выборочная совокупность

Возраст              
Количество осужденных              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Возраст              
Количество осужденных              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Решение

 

Определим среднее значение признака для выборочной совокупности, учитывая, что частоты вариант различны. Поэтому для расчета воспользуемся формулой взвешенной средней арифметической

 

,

 

получим .

Далее рассчитаем среднее квадратическое отклонение по данным выборочной совокупности, для этого воспользуемся выражением

 

,

 

в результате получаем .

Найдем ошибку репрезентативности выборочных данных

,

где n – объем выборочной совокупности, его можно найти как сумму частот, т.е. .

Определим первый доверительный интервал

 

 

или (22,5÷23,1), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,638.

Определим второй доверительный интервал

 

 

или (22,2÷23,4), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,954.

Определим третий доверительный интервал

 

 

или (19,9÷23,7), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,997.

Для определения в какой доверительный интервал попадает среднее значение признака для генеральной совокупности определим это значение:

 

.

 

Значение оказывается в интервале (22,2÷23,4), с вероятностью 0,954.

 

Порядок выполнения заданий №2. В порядке случайной выборки обследовано 700 заключенных из 4000. В результате наблюдения установлено, что доля заключенных, совершивших преступление в состоянии опьянения, составила 0,7 или 70 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы, если коэффициенты доверия принимают значения , , .

 

Решение

 

Для определения ошибки репрезентативности при исследовании качественного признака необходимо воспользоваться выражением:

 

,

 

где п – объем выборки, Р - доля исследуемого качественного признака в выборке (совершение преступления в состоянии опьянения), а - доля противо­положного признака.

Подставляя имеющиеся данные получим

 

или 1,7 %.

 

Определим первый доверительный интервал

 

 

или (68,3% ÷ 71,7%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,638.

Определим второй доверительный интервал

 

 

или (66,6% ÷ 73,4%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,954.

Определим третий доверительный интервал

 

 

или (64,9% ÷ 75,1%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,997.

Вариант №1

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 300 водителей из 2000, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,78 или 78 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

 

Вариант №2

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 150 водителей из 1000, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,68 или 68 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Вариант №3

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 200 водителей из 1500, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,83 или 83 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Вариант №4

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 120 водителей из 800, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,75 или 75 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Вариант №5

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 100 водителей из 900, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,73 или 73 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Вариант №6

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 140 водителей из1200, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,69 или 69 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

 

Вариант №7

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 130 водителей из 1400, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,7 или 70 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Вариант №8

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 160 водителей из 1300, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,66 или 66 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Вариант №9

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 110 водителей из 1600, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,63 или 63 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Вариант №10

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 160 водителей из 1800, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,57 или 57 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Задание на самостоятельную подготовку.

К следующему практическому занятию повторите материал по теме «Выборочный метод статистического наблюдения», для закрепления и углубления полученных знаний воспользуйтесь предложенной литературой.

 

Литература:

 

основная:

1. Савюк Л.К. Правовая статистика [Текст]: учебник / Л.К. Савюк. – 2-е изд., перераб. и доп. – М.: Юристъ, 2006. – 637 с.

2. Лунеев В.В. Юридическая статистика [Текст]: учебник / В.В. Лунеев. – 2-е изд., перераб. и доп. – М.: Юристъ, 2004. – 392 с.

дополнительная:

3. Лялин В.С. Правовая статистика [Текст]: учебник / В.С. Лялин. – М.: ИВЭСЭП, 2006. – 235 с.

4. Правовая статистика [Текст]: учебник / В.Н. Демидов и др.; под ред. С.Я. Казанцева, С.Я. Лебедева. – М.: ЮНИТИ-ДАНА, Закон и право, 2007. – 255 с.

5. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики [Текст]: учебник / М.Р. Ефимова, Е.В. Петрова, В.Н. Румянцев – 2-е изд., испр. и доп. – М.: ИНФРА-М, 2001. – 416 с.

6. Горемыкина Т.К. Общая и правовая статистика [Текст]: учебное пособие / Т.К. Горемыкина. – М.: МГИУ, 2001. – 175 с.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: