ТЗР-2. Многоугольник распределения СВ

Таблица 4. Негруппированный статистический ряд

Значения СВ (варианты) Х х1 х2 х3 …. хi   Хk
n - количество повторений (частоты) n1 n2 n3 …. ni   nk
Pi* - статистические вероятности (частости) p1* p2* p3* …. pi*   pk*

Сумма частот в вариационном ряду равна числу проведенных опытов N:

= N.

Статистическая вероятность вычисляется по формуле: рi*= ni/N. (17)

По аналогии с теоретическим рядом распределения = 1 .

Пример 25

Таблица 5 Вариационный ряд распределения оценок, полученных на экзамене

Оценка        
Частота ni        
Частость рi* 0,093 0,474 0,309 0,124

СтЗР-1б. Группированный вариационный ряд

Данный ряд применяется, когда количество вариант (наблюдавшихся в опыте значений СВ) велико. Чаще такое возможно для непрерывных СВ, но не исключено и для дискретных. Если все наблюдавшиеся варианты (а их может быть десятки и сотни) указать в таблице, ряд получится громоздким и неудобным для анализа. Поэтому значения группируются (табл. 6) в разряды (интервалы), что существенно упрощает последующий анализ.

Для заполнения группированного ряда достаточно подсчитать количество наблюдавшихся значений СВ внутри каждого разряда, а затем вычислить статистические вероятности по формуле (17). В случае когда какое-то значения СВ совпало с границами интервала, к частотам каждого из граничных разрядов добавляется по 0,5 наблюдения.

Таблица 6. Группированный статистический (вариационный) ряд

№ разряда     i k
Границы разрядов хi …хi+1 х1...х2 х2...х3 хi...хi+1 хk...хk+1
n – число наблюдений (частоты) n1 n2 ni nk
рi* - статистические вероятности (частости) p1* p2* pi* pk*

Количество интервалов, на которые разбиваются все зафиксированные в опыте варианты, выбирается исследователем, и обычно лежит в пределах от 10 до 20. Как правило, ширина интервалов выбирается одинаковой. Однако если количество наблюдений в разряде невелико (до десяти), то ширина разряда может быть увеличена (часто это происходит в крайних интервалах распределения).

Правильный выбор ширины интервала может существенно повлиять на результат исследования. Если интервалы широкие, то количество их уменьшается, и отдельные иногда важные детали закономерности распределения СВ могут быть упущены из рассмотрения. Наоборот, при большом числе разрядов, количество наблюдений в каждом из них получается малым, и случайности, характерные для каждого отдельного наблюдения, будут заметно влиять на результат исследования, искажая его картину.

Целесообразное число интервалов k рекомендуется определять в зависимости от объёма N собранной статистики по формуле Стерджеса:

k = 1 + 3,32 lg N. (18)

Полученный результат округляется до целого и затем с учётом максимальной хМАК и минимальной хМИН вариант находится целесообразная ширина ∆xi разрядов:

∆xi = (хМАК – хМИН)/k. (19)

Пример 26

При помощи прибора САКН (статистический анализатор качества напряжения) собраны эмпирические данные об уровне напряжения на подстанции. Всего получено 17280 наблюдений. Минимальное зафиксированное значение напряжения uМИН равно 370,2 В, максимальное u МАК 394,2 В. Определить целесообразное количество разрядов, на которые следует сгруппировать статистические данные, и их ширину.

Решение.

По формуле Стерджеса (18) целесообразное число интервалов

k = 1 + 3,32 lg N = 1 + 3,32 lg17280 = 15,07.

Целесообразная ширина разрядов (19)

∆ui = (uМАК – uМИН)/k = (394,2 – 370,2)/15 = 1,6 В.

Для удобства обработки и анализа данных целесообразно иметь по возможности округленные границы интервалов. Поэтому ширину интервала имеет смысл принять равной 1,5 В, а общее число разрядов равным 17. Тогда нижняя граница первого разряда равна 369,5 В, верхняя – 371,0 В, для 2-го – 371,0 В и 372,5 В соответственно и т.д. Границы последнего 17-го разряда – 393,5 В и 395,0 В.

Группированный статистический ряд (табл. 7) записан в общем виде, так как количества наблюдений в различных разрядах в задаче не заданы.

Таблица 7. Группированный вариационный ряд уровней напряжения на подстанции

Напряжение 369,5-371 371-372,5 392-393,5 393,5-395
Частота n1 n2 nk-1 nk
Частость p1* p2* pk-1* pk*

Многоугольник распределения (рис. 27)– это графическое оформление ряда распределения. Как и ряд распределения, применяется в качестве теоретического способа задания закона распределения дискретной случайной величины.

 
 


На рис.27 значения отдельных вероятностей можно было бы не соединять между собой ломаной линией. Но для увеличения наглядности, чтобы подчеркнуть тенденцию изменения вероятности, их соединяют пунктирными линиями. Пунктирная линия подразумевает, что значения СВ – дискретны, и между значениями х1 и х2 других значений нет.

СтЗР-2. Полигон относительных частот

Полигон относительных частот (рис. 28) представляет собой аналогию многоугольника распределения, и есть ни что иное, как графическое изображение негруппированного статистического ряда.

В нём ломаной линией соединяются точки с координатами (х1; p1*) - (х2; p2*); (х2; p2*) - (х3; p3*) и т.д.

Полигон относительных частот может быть построен и для группированного ряда, тогда отрезки ломаной линии соединяют между собой значения частостей, соответствующие серединам интервалов.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: