Выборочный метод. Статистические оценки параметров распределения.
План.
1. Генеральная совокупность и выборка.
2. Сущность выборочного метода.
3. Дискретные и интервальные вариационные ряды. Полигон и гистограмма.
4. Числовые характеристики выборки.
1.Df: Математическая статистика – раздел математики, который имеет своим предметом изучение методов сбора, систематизации, обработки и использования статистических данных для получения научно-обоснованных данных и принятия решений.
Df: Статистические данные – совокупность чисел, которые представляют количественные характеристики интересующих нас признаков изучаемых объектов.
Статистические данные получаются в результате специально поставленных опытов, наблюдений.
Exp: Последовательность чисел, которые получаются в результате неоднократного измерения некоторой величины, например, взвешивание некоторого тела на аналитических весах.
Результаты проводимых исследований методами математической статистики применяются к принятию решения, в частности, при планировании и организации производства, при анализе технологических процессов, при предупредительном и приёмочном контроле качества продукции, при выборе оптимального времени настройки или замены действующей аппаратуры.
|
|
Математическая статистика возникла в XVIII веке в работах Бернулли и Лапласа. Большой вклад внесли русские учёные Буняковский, Чебышёв, Марков, Колмогоров, Гнеденко и другие.
Основные понятия математической статистики
Пусть требуется изучить данную совокупность объектов относительно некоторого признака. Например, требуется определить, в какой степени параметры выпускаемых изделий соответствуют стандартным нормативам. Если число элементов в совокупности не очень большое и обследование объектов не связано с его уничтожением и не требует больших затрат, то можно исследовать каждый элемент по отдельности, фиксировать значения исследуемого признаки соответствующей обработкой результатов, сделать тот или иной вывод об изучаемом признаке. В противном случае исследования не целесообразны. Бессмысленно например, исследовать на срок горения все лампочки данной партии, т.к. в результате вся партия уничтожается. В таком случае выводы делаются на основании изучения ограниченного числа объектов, должным отобранных из общей совокупности.
Df: Генеральной совокупностью называется множество числовых значений некоторого признака всех объектов, рассматриваемой совокупности, т.е. генеральной совокупностью называют совокупность объектов, из которых производится выборка.
Df: Выборочной совокупностью называют совокупность объектов, отобранных случайным образом.
|
|
Или просто выборкой множества числовых значений некоторого признака всех объектов, случайным образом отобранных из всей совокупности рассматриваемых объектов.
Exp: генеральной совокупностью является совокупность чисел, соответствующих сроком службы всех лампочек выпущенной партии, а выборочной – совокупность чисел соответствующая сроком службы отобранных, для испытания лампочек.
Для простоты, если это не приводит к противоречиям, т.е. недвусмысленного известно, о каком признаке идёт речь, под «генеральной совокупностью» и под «выборкой» будем понимать саму «совокупность» изучаемых объектов.
Exp: партия всех лампочек, выпущенная заводом – есть генеральная совокупность, а множество лампочек, взятых для обследования – выборочная.
Основная задача математической статистики – получение обоснованных выводов о неизвестных свойствах генеральной совокупности по известным свойствам, извлечённой из неё выборки.
Df: Число объектов совокупности (генеральной или выборочной) называется объёмом данной совокупности.
Exp: Если цех выпустил 2000 деталей, а для обследования отобрано 150 деталей, то объёмом генеральной совокупности равен 2000 (N=2000), а объём выборки равен 150 (n=150).
2. Виды выборок.
Различают выборки с возвращением и без возвращения. Если после фиксирования значения параметра объект возвращается в генеральную совокупность и, таким образом, он может многократно повторяться в выборке, то говорят о выборке с возвращением. В противном случае речь идёт о выборке без возвращения.
Df: Говорят, что выборка репрезентативна (представительна), если она достаточно полно представляет изучаемые признаки генеральной совокупности.
Способы отбора.
Df: Простым называется отбор, при котором из генеральной совокупности случайным образом извлекается по одному элементу с возвращением или без возвращения.
Exp: Для изучения белых медведей экспедиция ловит случайным образом попавшихся ей белых медведей, измеряет исследуемые параметры и отпускает животных на волю или сдаёт в зоопарк, в зависимости от целей.
Df: Типическим называется отбор, при которым объекты случайным образом отбираться из каждой «типической» части генеральной совокупности.
Exp: Если детали изготавливаются разными цехами, то для обеспечения репрезентативности выборки отбор производиться случайным образом с соблюдением пропорций их продукции каждого цеха.
Df: Механическим называется отбор, при котором объекты отбираются через определённый интервал, скажем каждый пятый.
Df: Серийным называется отбор, при котором выборка состоит из целой серии объектов. Этим способом пользуются в тех случаях, когда исследуемый признак в генеральной совокупности колеблется незначительно.
Exp: Если квалификация всех рабочих цеха, качество технических средств и сырья существенно не изменяются в течении недели, то для проверки недельной продукции данного цеха можно провести сплошную проверку продукции одного дня.
3. Группировка статистических данных.
Изучение статистических данных обычно начинается с их группировки в порядке возрастания значения признака.
Df: Наблюдаемые значения рассматриваемого признака называются вариантами, а последовательность вариант, записанных в возрастающем порядке, называется выборочным или вариационном рядом.
Условимся обозначать через х1,х2,…,хk значения вариант в данной выборке.
х1, х2, х3,…хk – вариационный ряд.
х1<x2<x3<…<xk.
х1 – наименьшее значение признака
xk – наибольшее значение признака
xk - х1 – размах выборки.
Пусть из генеральной совокупности отобрана выборка, в которой значения х1 признака х наблюдалось n1 раз, значение х2 - n2 раз,…., значения хn - nk раз. Если объём выборки равен n, то .
|
|
Df: Числа n1,...........nk – называются частотами, а их отношения к объёму выборки, т.е.
- относительными частотам соответствующих вариант.
Df: Статистическим распределением выборки называется перечень вариант и соответствующих им частот или относительных частот.
В теории вероятности изучается аналогичное понятие, а именно закон распределения случайной величины, который записывается в виде таблицы.
Аналогичным образом, статистическое распределение выборки можно записать в виде таблицы.
|
Х | Х1 | Х2 | … | Хk |
р | P1 | P2 | … | Pk |
|
Хi | Х1 | Х2 | … | Хk |
ni | n1 | n2 | … | nk |
i | 1 | 2 | … | k |
|
Exp: Дано статистическое распределение выборки. Найти относительные частоты.
Хi | |||
ni |
Exp: Найти вариационный ряд, частоты, относительные частоты для выборки, полученной при измерении электрической ёмкости двадцати пластин в электродах по следующим результатам
9,9; 11,0; 9,2;12,0;8,0;8,7;7,0;11,8;11,7;10,3;11,2;8,1;9,5;11,5;11,6;9,7;10,2;11,4;8,6;10,0.
Вариационный ряд для данной выборки будет:
х1=7,0 х6=9,2 х11=10,2 х16=11,5
х2=8,0 х7=9,5 х12=10,3 х17=11,6
х3=8,1 х8=9,7 х13=11,0 х18=11,7
х4=8,6 х9=9,9 х14=11,2 х19=11,8
х5=8,7 х10=10,0 х15=11,4 х20=12,0
Здесь каждая варианта встречается по одному разу, поэтому ni=1 для всех i=1,2….,20.
Равными будут также и относительные частоты
Df: Выборка является репрезентативной (редставительной), если относительные частоты вариант выборки близки к соответствующим относительным частотам вариант генеральной совокупности (по всем вариантам генеральной совокупности).
Exp: Исследовать репрезентативность выборки
Хi | ||||||
ni |
для генеральной совокупности, заданной таблицей
х1 |
| |||||||
ni | ||||||||
i | 0,04 | 0,06 | 0,12 | 0,16 | 0,44 | 0,18 |
Вычислим относительные частоты для нашей выборки и обозначим их i' =25
|
|
Вывод: выборка репрезентативна.