Задания для самостоятельной работы

 

1 По данным таблицы 1 вычислить дисперсию и среднее квадратическое отклонение.

Таблица 1 – Число продовольственных магазинов: выборка из 30 населенных пунктов Северной Франции.

4 7 69 20 3 8 30 234 14 5 4 4 4 1 1 6 4 3 1 1 5 405 2 18 2 2 16 3 696 10

2 Известны показатели изменения температуры почвы в течение месяца (в градусах Цельсия): -20; -15; -14; -11; -5; -4; - 3; - 1; +1; +5; +6; + 7. Определить коэффициент вариации.

 

3 Известны показатели изменения температуры почвы в течение месяца (в градусах Цельсия) на разных участках (таблица 2). Определить коэффициент вариации.

Таблица 2 – Показатели изменения температуры почвы в течение месяца

Вариант задания

11 12 13 14 15 16 17 18 19 20
1 2 3 4 5 6 7 8 9 10 11 12 13 14 -20 -15 -14 -11 -5 -4 - 3 - 1 +1 +5 +6 + 7 +10 +12 +11 +13 +4 +16 +12 +14 +13 +12 +14 +17 +13 +12 -11 -10 -9 -8 -7 -6 -5 -4 -3 -2 -1 -1 0 +1 +20 +17 +15 +13 +12 +10 +8 +8 +6 +5 +3 +2 +1 0 -5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5 +6 +7 +8 -12 -13 -14 -15 -16 -15 -14 -13 -12   -1 -1 +1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +10 +11 -7 -6 -5 -3 -1 +1 +3 +3 +4 +5 +5 +6 +8 +8 +2 +1 +2 +3 +6 +6 +7 +7 +3 +1 +5 +4 +4 +6 -23 -20 -18 -12 -11 -7 -8 -5 -3 -1 0 +1 +2 +3

4 По данным вычислить: дисперсию; среднее квадратическое отклонение; ошибку среднего квадратического отклонения и точность данных

Таблица 3 - Содержание белка в суточном рационе питания (в расчете на душу населения)

Страна г/сут.
1 2
Австрия Бельгия Дания Финляндия Франция Германия Греция Ирландия Нидерланды Норвегия Португалия Испания Швеция Швейцария Великобритания Канада США Шри-Ланка Китай Индия Пакистан Израиль 86,6 85,0 92,3 92,9 98,6 97,7 94,2 90,2 78,2 80,8 74,2 79,9 83,5 8,2 89,3 91,1 90,6 41,8 58,8 49,7 47,8 85,2

 

 

Вопросы для самоконтроля

 

1 Для чего используют показатели разнообразия признаков?

2 Какие показатели разнообразия признаков вы знаете?

3 Какие показатели используют как составляющие параметры нормального распределения?

4 Что показывает среднее квадратическое отклонение?

5 На что указывает дисперсия?

6 Что представляет собой коэффициент вариации?

7 Каким бывает разброс вариант в зависимости от значения коэффициента вариации?

 

 

 

Тема 4 Методы, используемые для установления

Подобия и отличия объектов и систем

Критерий Стъюдента (t)

Критерий наименьшей существенной разности (НСР)

Критерий Фишера (F)

4 Критерий соответствия (χ2)

 

 

Достоверность различий между генеральными сово­купностями (Ni, N2...) может быть определена с помощью следующих критериев достоверности: критерия Стьюдента (t), наименьшей существенной разности (НСР), кри­терия соответствия (χ2), критерия Фишера (F).

 

1Критерий Стьюдента. Сравнение выборочных сово­купностей по критерию Стьюдента t позволяет утверж­дать с некоторой долей уверенности сходство или раз­личие между средними выборок по разнице между ними с использованием фор­мулы

                                      (4.1)

где d – разность между средними 1 М2); тd – ошиб­ка разности средних.

Выделяют три типа сравниваемых статистических со­вокупностей: независимые с одинаковым объемом вы­борок (N1 = N2), независимые с разным объемом выбо­рок (N1 N2), сопряженные только с одинаковым объ­емом выборок (N1=N2).

Независимые статистические совокупности могут быть получены на одной или нескольких точках, но при оди­наковых условиях проведения эксперимента: например, измерение температуры воздуха в июле в г. Минске в течение нескольких лет и установление достоверных раз­личий между этими показателями по годам исследова­ний; определение содержания бора в автономных ланд­шафтах. Поэтому при установ­лении степени свободы в каждом независимом экспери­менте выборочные совокупности суммируются.

Сопряженные статистические совокупности, как и не­зависимые, однозначны по смыслу, их получают при про­ведении исследований на одном или нескольких ключах, но в разных условиях. Например: измерение температур воздуха и почвы на глубине 5 см в г. Минске в июле и сравнение полученных показателей (условия разные, точка наблюдения одна и та же); Степень свободы в каждом рассматриваемом эксперименте опреде­ляется по числу пар сравниваемых выборок (Nu). Рассмотрим расчеты достоверности различий для одинакового и разного объемов выборок.

 

Пример 1. При исследовании глубины расчленения рельефа в Воложинском районе N1 и Браславском районе N2 необходимо уста­новить, объединять рассматриваемые участки в один геоморфологи­ческий район по степени расчленения рельефа или различать их как самостоятельные. Воложинский район – 20, 17, 16, 15, 15; Браславский район – 17,16, 15, 14, 14. (N1 = N2)

1) Находим среднее арифметическое для каждой выборки

 

 

Таблица 2 – Форма обработки вариант в независимых совокупностях

х1 (x1 – M1) (x1 – M1)2 х2 (x2 – M2) (x2 – M2)2
20 3,4 11,56 17 1,8 3,24
17 0,4 0,16 16 0,8 0,64
16 - 0,6 0,36 15 - 0,2 0,04
15 - 1,6 2,56 14 - 1,2 1,44
15 - 1,6 2,56 14 - 1,2 1,44
    Σ = 17,2     Σ = 6,8

 

2) Находим разность между средними

                                   d=М1M2                                              (4.2)

d = 16,6 – 15,2 = 1,4 м

При расчете разницы между средними из большей величины вычитают меньшую независимо от нумерации выборочных совокупностей.

3) Затем находят ошибки средних для каждой выборки в отдельности по формуле

                        (4.3)


4) Находим ошибку разности между средними по формуле:

                                      (4.4)

 

5) Число степеней свободы устанавливают следующим об­разом:

                                     v =N1 + N2 – 2                                    (4.5)

                                     v= 5 + 5 – 2 = 8

6) Определяем Критерий Стьюдента

                                              (4.6)

 

Сопоставляем табличные значения критерия Стьюдента tт=2,32 и 3,36 (см. приложение 4) при Р=0,95 и 0,99 для v=8 с расчетным. Поскольку tТ >tФ,, то разность между средними признается несу­щественной (недостоверной). Следовательно, при выделении геомор­фологических районов по глубине расчленения рельефа рассматри­ваемые участки необходимо объединить в один геоморфологический район.

 

Пример 2. При исследовании глубины расчленения рельефа в Воложинском районе N1 и Браславском районе N2 необходимо уста­новить, объединять рассматриваемые участки в один геоморфологи­ческий район по степени расчленения рельефа или различать их как самостоятельные. Воложинский район – 20, 17, 16, 15, 15; Браславский район – 17,16, 15, 14, 14, 16. (N1 ≠ N2)

1) Находим среднее арифметическое для каждой выборки

 

 

Таблица 2 – Форма обработки вариант в независимых совокупностях

х1 (x1 – M1) (x1 – M1)2 х2 (x2 – M2) (x2 – M2)2
20 3,4 11,56 17 1,7 2,89
17 0,4 0,16 16 0,7 0,49
16 - 0,6 0,36 15 - 0,3 0,09
15 - 1,6 2,56 14 - 1,3 1,69
15 - 1,6 2,56 14 - 1,3 1,69
      16 0,7 0,49
    Σ = 17,2     Σ = 7,34

2) Находим разность между средними d=М1M2 = 16,6 – 15,3 = 1,3 м

3) Ошибка разности средних, определяется по формуле

 

              (4.7)

где Σ(x1 – M1)2  – сумма квадратов отклонений от среднего для первой выборки; Σ 2 –М2)2 – второй выборки; N1, N2– количество вариант в первой и второй выборках соответственно;

4) Число степеней свободы для разного объема выборок устанавливают следующим об­разом:

                      (4.8)

 

                                         (4.9)

m1, m2— ошибка среднего первой и второй выборок соответственно

                   (4.10)

 

 

5) Определяем Критерий Стьюдента

                                               (4.11)

Сопоставляем табличные значения критерия Стьюдента tт=2,45 и 3,71 (приложение 4) при Р=0,95 и 0,99 для v=6 с расчетным. Поскольку tТ > tФ,, то разность между средними признается несу­щественной (недостоверной) рассматри­ваемые участки необходимо объединить в один геоморфологический район.

 

Пример 3. Получены сопряженные выборки только с одинаковым объ­емом конечно-моренного ландшафта N1 и донно-моренного ландшафта N2. Число пар NП = 5. Воложинский район – 20, 17, 16, 15, 15; Браславский район – 17,16, 15, 14, 14  ( N1=N2).

1) Находим среднее арифметическое для каждой выборки

 

 

 

Таблица 3 – Форма обработки данных сопряженных наблюдений

Глубина расчленения,

м

di

N1 N2
20 17 3 9 + 1,6 2,56
17 16 1 1 —0,4 0,16
16 15 1 1 —0,4 0,16
15 14 1 1 —0,4 0,16
15 14 1 1 —0,4 0,16
Σ=83 Σ=76 Σ=7 Σ=13 Σ=0 Σ=3,20
M1=16,6 М2=15,2  = l,4  

=1,4

2) Находим разность между средними

                                                                                                (4.12)

= 16,6 –15,2=1,4

 

3) Находим ошибку разности между средними по формуле:

                      (4.13)

                                             (4.14)

где di – разность между индивидуальными сопряжен­ными вариантами в выборках;   – разность между сред­ними сопряженных выборок; NП число сопряженных пар в сопряженных выборках.

4) Число степеней свободы устанавливают следующим об­разом:

                                  v = NП – 2                                                  (4.15)

v= 5 – 2=3

5) Определяем Критерий Стьюдента

Сопоставляем табличные значения критерия Стьюдента tт=3,18 и 5,84 (приложение 4) при Р=0,95 и 0,99 для v=3 с расчетным. Поскольку tФ > tТ при Р=0,95,то разность между средними признается су­щественной (достоверной). Следовательно, при выделении геомор­фологических районов по глубине расчленения рельефа рассматри­ваемые участки необходимо рассматривать как самостоятельные.

 

2 Критерий наименьшей существенной разности (НСР) показывает то ми­нимальное различие между средними, начиная с которо­го при выбранном уровне вероятности средние сравни­ваемые показатели существенно отличаются друг от дру­га. Величина критерия НСР выражается в тех же единицах, что и сравниваемые средние выборочных со­вокупностей, и определяется по формуле:

                                                                       (4.16)

где тd – ошибка разности средних; tT – табличное зна­чение критерия Стьюдента при выбранном значении уровня вероятности.

Если разность между сравниваемыми средними в условиях эксперимента больше или равна величине НСР при Р = 0,95 или 0,99, то различие существенно. Если разность между средними меньше НСР, то различие обусловлено случайными факторами и признается недо­стоверным.

Проверим достоверность разности между средними арифметическими с использованием критерия НСР для случаев независимого и сопряженного наблюдений по формуле:

НСР0,95 = 2,32 • 1,1 = 2,55 м, НСР0,99 = 3,36• 1,1 = 3,696 м для независимых наблюдений;

НСР0,95 = 3,18 • 0,40= 1,27 м, НСР0,99 = 5,84 •,40 = 2,34 м для сопряженных наблюдений.

По величине НСР достоверное различие между средними уста­новлено лишь при сопряженном наблюдении для уров­ня вероятности 0,95 (HCP0,95=1,27< = 1,4 м).

 

3 Критерий Фишера (F) используется для установления достоверностиразличия между совокупно­стями по дисперсиям. В таких случаях лучше использовать критерий Фишера F (положи­тельное асимметричное распределение). Расчет критерия Фишера производится по формуле:

                                                                      (4.17)

где  по абсолютной величине должна быть больше, чем .

Если величина расчетного критерия Фишера FФ не превышает величины приведенного в таблице FT (при­ложение 5), то различие между сравниваемыми диспер­сиями считается недостоверным. При Fф > Fт эти диспер­сии достоверно различны, а различие сравниваемых ге­неральных совокупностей признается неодинаковым. Степень свободы рассчитывается для сравниваемых со­вокупностей отдельно по формуле v = N – 1.

 

Пример. Необходимо установить достоверность различия в содержании гумуса в дерново-подзолистой заболоченной суглинистой почве для северной n1 и центральной n2 провинций РБ. Количе­ство вариант в обеих совокупностях одинаковое.

В результате обра­ботки данных получены следующие средние и дисперсии: M1 = 3,53 %, =0,0024 %; M2 = 3,32 %, =0,00032 %. Сравниваемые совокуп­ности весьма сходны и можно констатировать отсутствие различия между ними. Однако пределы колебаний в совокупностях сущест­венно отличаются по вариантам (более чем в 2 раза), что требует для доказательства сходства или различия использовать критерий Фишера. В результате вычислительных операций получены следую­щие результаты:

Fф = / = 0,0024: 0,00032 = 7,5.

 

Степень свободы равна: v1 = 5—1=4,

                                v2 = 5—1=4.

Для P=0,95 и 0,99 FT = 6,39 и 15,98 (приложение 5) соответственно. Поскольку Fф>Fт, то различие в содержании гумуса по провинциям признается существенным при уровне вероят­ности Р=0,95.

4 Критерий соответствия (χ2) -количественное изучение явле­ний требует создания гипотез, с помощью которых мож­но объяснить эти явления. Для этой цели используется критерий кси-квадрат (χ2), или кри­терий соответствия, который рассчитывается по формуле

                               (4.18)

где φ, φ' – число наблюдений в опыте фактическое и теоретически ожидаемое.

Если рас­четные значения кси-квадрат превышают табличные (приложение 6), то гипотеза о независимости признаков отвергается. Если < , то признаки можно считать не­зависимыми.

Степень свободы при проверке гипотезы о нормальном распределении вычисляется по формуле

                                             v = k –3                                          (4.19)

где k – число классов.

Достоверность расчетных данных можно также оце­нить по формуле:

                                                                       (4.20)

Различие считается достоверным, если D 3. При обра­ботке данных по условиям применения критерия кси-квадрат требуется, чтобы частота в каждом классе была не менее пяти.

 

Пример. Следует определить число сельских жителей с бронхолегочными заболеваниями, обострение болезни у которых связано с природными условиями местожительства.

Для обработки выбороч­ных вариант составляем таблицу. Всего выявлен 71 больной жи­тель из 639 обследованных одного возраста и пола по 9 человек в каждом населенном пункте.

Таблица 4 - Сравнение эмпирических и теоретических частот с использованием критерия кси-квадрат

Число обследованных жителей (классы) Число фактических больных, φ Число теоретически больных, φ' φ – φ' (φ- φ')2 (φ- φ')2 φ'
1 2 3 4 5 6
1-71 72-142 143-213 214-284 285-355 356-426 427-497 498-568 569-639 10 15 12 10 13 14 10 11   -4 (11-15)   -3 1 2 -1 5   16   9 1 4 1 25   1,06   0,69 0,07 0,40 0,09 3,12
i=9 N=71 N=71  

=5,43

Для обработки данных количество об­следованных сгруппировано в 9 классов. Поскольку частота в каж­дом классе φ, φ' должна быть не менее 5, объединяем первые три и последние два класса в столбцах 2 и 3. Получаем новые классы с частотами 11,15 и 13,8 (всего по 6 классов распределения). Затем производим расчеты, которые позволяют получить критерий  (см. таблицу).

Сравниваем и при величине степени свободы v= k –3=6–3=3 и для Р= 0,95. Поскольку =5,43< =7,815 (приложение 6), теоретическое распределение частот несущественно отличается от эмпи­рического, а гипотеза признается состоятельной.

Определим также достоверность :

 

Полученная величина D=0,99<3, следовательно, рассчитанное значение  показывает достоверное влияние природных условий на распространение бронхолегочных заболеваний.

 

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: