План лекции

Лекция 8. Проверка статистических гипотез

8.1. Статистические гипотезы и критерии

8.2. Т – критерий

8.3. F – критерий

8.4. Критерий согласия Пирсона

8.1. Статистические гипотезы и критерии

Пусть име­ет­ся не­ко­то­рая ге­не­раль­ная со­во­куп­ность, по­ро­ж­дён­ная функ­ци­ей рас­пре­де­ле­ния F (x) слу­чай­ной ве­ли­чи­ны Х. Ка­ж­дое вы­ска­зы­ва­ние или вся­кое мно­же­ст­во не­про­ти­во­ре­чи­вых пред­по­ло­же­ний от­но­си­тель­но па­ра­мет­ров ге­не­раль­ной со­во­куп­но­сти (M (Х), D (X) и т.д.) или ви­да функ­ции рас­пре­де­ле­ния F (x), будем на­зы­вать ста­ти­сти­че­ской ги­по­те­зой и обозначать Но. В качестве при­ме­ров можно привести такие ги­по­тезы: 1) М (Х) = 2,2; 2) D (X) < 10; 3) Х Î N (-1; 4); 4) X рав­но­мер­но рас­пре­де­ле­на на отрезке [-1; 3]; 5) Гxy = 0; 6) M (X) = M (Y); 7) M (X) - M (Y) < 0; 8) D (X) = D (Y); 9) F 1(x) = F 2(x), где F 1(x), F 2(x) - функ­ции рас­пре­де­ле­ния слу­чай­ных ве­ли­чи­н X и Y.

Поставим следующую задачу. На ос­но­ва­нии имею­щей­ся вы­бор­ки или двух вы­бо­рок и из раз­ных ге­не­раль­ных со­во­куп­но­стей про­ве­рить ги­по­те­зу Но, т.е. при­нять одно из двух ре­ше­ний: ги­по­те­за Но при­ни­ма­ет­ся или от­вер­га­ет­ся. Правило, по которому принимается или отклоняется данная гипотеза, называется статистическим критерием.

Для про­вер­ки ги­по­те­зы Но подбирается кон­троль­ная ве­ли­чи­на j, яв­ля­ющаяся функцией от результатов наблюдений: или . Такая, со­от­вет­ст­вую­щим об­ра­зом вы­бран­ная и при­спо­соб­лен­ная к ре­шае­мой за­да­че, вы­бо­роч­ная функ­ция называется ста­ти­сти­кой критерия. Последняя дол­жна удов­ле­тво­рять следующим ус­ло­ви­ям.

1. При вы­пол­не­нии ги­по­те­зы Но статистика j, дол­жна под­чи­нять­ся из­вест­но­му (та­бу­ли­ро­ван­но­му) за­ко­ну рас­пре­де­ле­ния.

2. Зна­че­ние статистики или долж­но быть ме­рой “рас­хо­ж­де­ния вы­бор­ки и ги­по­те­зы Но ”.

Про­вер­ка ста­ти­сти­че­ской ги­по­те­зы Но сво­дит­ся к сле­дую­ще­му.

По за­дан­но­му уров­ню зна­чи­мо­сти a (обыч­но a = 0,05; a = 0,01, a = 0,001) отыскива­ет­ся та­кая кри­ти­че­ская об­ласть Акр, что условная вероятность попадания в неё статистики j при условии справедливости гипотезы Но меньше a:

. (8.1)

Об­ласть Акр все­гда мож­но най­ти, ес­ли из­вест­но рас­пре­де­ле­ния статистики j или хо­тя бы её асим­пто­ти­че­ское рас­пре­де­ле­ние, т.е. рас­пре­де­ле­ние для боль­ших объ­е­мов вы­бор­ки.

Ес­ли реа­ли­зо­вав­шее­ся зна­че­ние статистики jэмп попало в область Акр (это событие, имеющее маленькую вероятность a), то от гипотезы Но отказываются.

Ес­ли же jэмп не попало в область Акр, то го­во­рят, что дан­ные на­блю­де­ний не про­ти­во­ре­чат ги­по­те­зе Но на уров­не зна­чи­мо­сти a.

Ес­ли ги­по­те­за Но от­вер­га­ет­ся, хо­тя она на самом деле вер­на, то го­во­рят, что со­вер­ше­на ошиб­ка пер­во­го ро­да.

За­ме­тим, что уро­вень зна­чи­мо­сти a есть ве­ро­ят­ность ошиб­ки пер­во­го ро­да, т.к. .

Ес­ли ги­по­те­за Но при­ни­ма­ет­ся, хо­тя она в действительности не­вер­на, то го­во­рят, что со­вер­ше­на ошиб­ка вто­ро­го ро­да. Ве­ро­ят­ность ошиб­ки вто­ро­го ро­да обо­зна­ча­ют b, т.е. .

Ес­ли уро­вень зна­чи­мо­сти a за­дан, то кри­ти­че­скую об­ласть Акр, оп­ре­де­ляе­мую по фор­му­ле (8.1), мож­но най­ти мно­ги­ми спо­со­ба­ми. При­ня­то так оп­ре­де­лять Акр, что­бы ве­ро­ят­ность ошиб­ки вто­ро­го ро­да бы­ла наи­мень­шей. Кри­ти­че­ские об­лас­ти, ко­то­рые бу­дут в даль­ней­шем по­строе­ны, будут вы­би­рать­ся имен­но по этому критерию.

Итак, пе­ре­чис­лим ос­нов­ные эта­пы про­це­ду­ры про­вер­ки ста­ти­сти­че­ской ги­по­те­зы.

1. Ис­хо­дя из ус­ло­вий рас­смат­ри­вае­мой за­да­чи и рас­по­ла­гая вы­бор­кой или вы­бор­ка­ми ; , фор­му­ли­ру­ют ос­нов­ную или ну­ле­вую ги­по­те­зу Но и аль­тер­на­тив­ную ги­по­те­зу Н1, ко­то­рая кон­ку­ри­ру­ет с Но.

Кон­ку­рен­ция ги­по­тез Но и Н1 оз­на­ча­ет, что со­бы­тия (Но - вер­на) и (Н1 - вер­на) яв­ля­ют­ся до­пол­ни­тель­ны­ми или как ино­гда го­во­рят, про­ти­во­по­лож­ны­ми, т.е. про­це­ду­ра про­вер­ки ста­ти­сти­че­ской ги­по­те­зы за­кан­чи­ва­ет­ся при­ня­ти­ем ре­ше­ния: Но - вер­на или Н1 - вер­на.

2. За­дав­шись уров­нем зна­чи­мо­сти a и вы­брав кри­те­рий или , оп­ре­де­ля­ют кри­ти­че­скую об­ласть Акр из ус­ло­вия .

В за­ви­си­мо­сти от ви­да ос­нов­ной Но и аль­тер­на­тив­ной Н1 ги­по­тез и рас­пре­де­ле­ния кри­те­рия j воз­мож­ны три ви­да кри­ти­че­ской области Акр:

а) - ле­во­сто­рон­няя кри­ти­че­ская об­ласть, а зна­че­ние хкр оп­ре­де­ля­ет­ся из урав­не­ния , где - плот­ность ве­ро­ят­но­сти статистики j;

б) - пра­во­сто­рон­няя кри­ти­че­ская об­ласть, а зна­че­ние хкр оп­ре­де­ля­ет­ся из урав­не­ния ;

в) - дву­сто­рон­няя кри­ти­че­ская об­ласть, а ве­ли­чи­ны х1 и х2 оп­ре­де­ля­ют­ся из урав­не­ний

.

3. Ис­поль­зуя дан­ные вы­бор­ки или вы­бо­рок ;вы­чис­ля­ют зна­че­ние кри­те­рия или . И ес­ли j эмп Î Акр, то при­ни­ма­ет­ся ги­по­те­за Н1, а ес­ли j эмп Ï Акр, то ги­по­те­за Но.

Итак, ес­ли jэмп Ï Акр, то Но принимается, но это не означает, что Но яв­ля­ет­ся един­ст­вен­но под­хо­дя­щей ги­по­те­зой, а про­сто говорит о том, что рас­хо­ж­де­ние ме­ж­ду дан­ны­ми вы­бор­ки и ги­по­те­зой Но ма­ло, или дру­ги­ми сло­ва­ми, что гипотеза Но не про­ти­во­ре­чит ре­зуль­та­там на­блю­де­ний. Но на­ря­ду с Но та­ким же свой­ст­вом мо­гут об­ла­дать и дру­гие ги­по­те­зы.

Ес­ли jэмп . Î Акр, то ги­по­те­за Но от­вер­га­ет­ся и при­ни­ма­ет­ся аль­тер­на­тив­ная ги­по­те­за Н1, хотя при этом мож­но и до­пус­тить ошиб­ку с ве­ро­ят­но­стью a.

П р и м е р № 1. Из ге­не­раль­ной со­во­куп­но­сти, имею­щей рас­пре­де­ле­ние , про­из­ве­де­на вы­бор­ка объ­е­ма n = 100. Реа­ли­зо­вав­шие­ся зна­че­ния функ­ций вы­бо­рок (ста­ти­стик) и рав­ны и .

На уров­не зна­чи­мо­сти a = 0,05 про­ве­рить ста­ти­сти­че­скую ги­по­те­зу Но: а = 1 при на­ли­чии аль­тер­на­тив­ных ги­по­те­з Н1: 1) Н1: а ¹ 1; 2) Н1: а > 1;3) Н1: а < 1.

Р е ш е н и е.

1. Рас­смат­ри­ва­ют­ся ос­нов­ная ги­по­те­за Но: а = 1 и аль­тер­на­тив­ная Н1: а ¹ 1.

В ка­че­ст­ве кри­те­рия выби­ра­ем ста­ти­сти­ку , слу­чай­ная ве­ли­чи­на j име­ет рас­пре­де­ле­ние Стью­ден­та с m = n - 1 = 99 сте­пе­ня­ми сво­бо­ды. Для уров­ня зна­чи­мо­сти a = 0,05 и m = 99 най­дем та­кое хкр > 0, что­бы , где Т - слу­чай­ная ве­ли­чи­на, имею­щая рас­пре­де­ле­ние Стью­ден­та с m = 99 сте­пе­ня­ми сво­бо­ды.

По таб­л. 4 Приложения на­хо­дим ко­рень урав­не­ния : хкр » 1,99. Поэтому в рас­смат­ри­вае­мом слу­чае кри­ти­че­ская об­ласть Акр име­ет вид: (-¥; -1,99) È (1,99; +¥).

Вы­чис­лим зна­че­ние кри­те­рия по дан­ным вы­бор­ки . Как видим, jэмп Î Акр, и поэтому при­ни­ма­ет­ся ги­по­те­за Н1: а = М (Х) ¹ 1.

2. Рас­смот­рим ос­нов­ную ги­по­те­зу Но: а =1 и аль­тер­на­тив­ную Н1: а > 1.

Кри­те­рий ос­та­ет­ся преж­ним: , од­на­ко кри­ти­че­ская об­ласть в дан­ном слу­чае бу­дет пра­вой од­но­сто­рон­ней . Ве­ли­чи­на хкр есть ко­рень урав­не­ния . С по­мо­щью таб­л. 4 находим ко­рень урав­не­ния для m = 99: . Следовательно, критическая область в этом случае: (1,66; +¥). Т.к. jэмп = 6,7 Î Акр, то при­ни­ма­ет­ся ги­по­те­за: а > 1.

3. Рас­смот­рим ос­нов­ную ги­по­те­зу Но: а =1 и аль­тер­на­тив­ную Н1: а < 1. Кри­те­рий преж­ний: , а кри­ти­че­ская об­ласть Акр - ле­вая од­но­сто­рон­няя: (-¥; хкр), где хкр < 0.

Ве­ли­чи­на хкр есть ко­рень урав­не­ния

, т.е. .

По таб­л. 4 Приложения на­хо­дим ко­рень урав­не­ния : . Приравняв хкр = - х, получаем . Итак, , и т.к. j эмп = 6,7 Ï Акр, то при­ни­ма­ет­ся ос­нов­ная ги­по­те­за Но (а = 1) и от­вер­га­ет­ся конкурирующая гипотеза Н1 (а > 1).

Под­ве­дем ито­ги. Про­вер­ка ста­ти­сти­че­ской ги­по­те­зы Но: а = 1, про­ве­дён­ная в п. 1, по­ка­за­ла, что а ¹ 1. Ре­зуль­та­ты, по­лу­чен­ные в п. 3, да­ли ос­но­ва­ние счи­тать не­вер­ной ги­по­те­зу Н1: а < 1. В п. 2 ус­та­нов­ле­но, что а > 1 с ве­ро­ят­но­стью 1- a = 0,95.

П р и м е р № 2. Из ге­не­раль­ной со­во­куп­но­сти, имею­щей рас­пре­де­ле­ние , про­из­ве­де­на вы­бор­ка объ­е­мом n = 26. Вы­чис­лен­ное по вы­бор­ке зна­че­ние ста­ти­сти­ки ока­за­лось рав­ным S 2 = 30.

Рас­смат­ри­ва­ют­ся ос­нов­ная и аль­тер­на­тив­ная ги­по­те­зы. Ка­ким дол­жен быть па­ра­метр , что­бы на уров­не зна­чи­мо­сти a = 0,1 ока­за­лась вер­ной ос­нов­ная ги­по­те­за Но?

Р е ш е н и е. В ка­че­ст­ве кри­те­рия вы­берем ста­ти­сти­ку , ко­то­рая в слу­чае спра­вед­ли­во­сти ги­по­те­зы Но име­ет вид . Слу­чай­ная ве­ли­чи­на j име­ет хи-квад­рат рас­пре­де­ле­ние с m = n - 1 = 25 сте­пе­ня­ми сво­бо­ды. Кри­ти­че­ская об­ласть, со­от­вет­ст­вую­щая ос­нов­ной и аль­тер­на­тив­ной гипотезам име­ет вид , где ве­ли­чи­ны х1 и х2 удов­ле­тво­ря­ют урав­не­ни­ям:

.

Ре­шая с по­мо­щью таб­л. 5 Приложения урав­не­ния: и , по­лу­чим . Значит, критическая область такова: .

Зна­че­ние вы­чис­лен­ного по вы­бор­ке кри­те­рия рав­но . Что­бы ока­за­лась вер­ной ги­по­те­за Но на уров­не зна­чи­мо­сти a = 0,1, долж­но вы­пол­нить­ся ус­ло­вие jэмп Ï Акр, т.е. 14,6 £ j эмп. £ 37,7 или . Окон­ча­тель­но по­лу­ча­ем ответ на поставленный вопрос: значение дисперсии должно лежать в диапазоне .

П р и м е р № 3. Дана пар­ная вы­бор­ка объ­е­ма n = 52: . Известно, что в ге­не­раль­ной со­во­куп­но­сти слу­чай­ные ве­ли­чи­ны Х и Y рас­пре­де­ле­ны нор­маль­но, а их ко­эф­фи­ци­ент кор­ре­ля­ции ра­вен . По вы­бо­рке получено зна­че­ние ко­эф­фи­ци­ен­та кор­ре­ля­ции . На уров­не зна­чи­мо­сти a = 0,05 про­ве­рить ста­ти­сти­че­скую ги­по­те­зу: .

Р е ш е н и е. Ос­нов­ная ги­по­те­за , а аль­тер­на­тив­ная - . В ка­че­ст­ве кри­те­рия вы­би­ра­ем ста­ти­сти­ку , ко­то­рая в слу­чае спра­вед­ли­во­сти ос­нов­ной ги­по­те­зы Но име­ет рас­пре­де­ле­ние Стью­ден­та с m = = n - 2 = 50 сте­пе­ня­ми сво­бо­ды. Кри­ти­че­ская об­ласть име­ет вид: , где хкр яв­ля­ет­ся кор­нем урав­не­ния . Ре­шая с по­мо­щью таб­л. 4 Приложения урав­не­ние , по­лу­ча­ем . Итак, .

Зна­че­ние кри­те­рия, вы­чис­лен­ное по дан­ным вы­бор­ки, рав­но . Т.к. jэмп Î Акр, то ос­нов­ная ги­по­те­за от­вер­га­ет­ся, а аль­тер­на­тив­ная ги­по­те­за при­ни­ма­ет­ся.

В ка­че­ст­ве аль­тер­на­тив­ной было бы разумно рас­смот­реть ги­по­те­зу , ибо . В этом слу­чае , где хкр есть ко­рень урав­не­ния . С помощью таб­л. 4, для чис­ла сте­пе­ней сво­бо­ды m = n - 2 = 50 на­хо­дим ко­рень урав­не­ния : . Итак, , и т.к. jэмп Î Акр, то при­ни­ма­ет­ся ги­по­те­за .

8.2. Т – критерий

Т - кри­те­рий слу­жит для срав­не­ния ма­те­ма­ти­че­ских ожи­да­ний двух ге­не­раль­ных со­во­куп­но­стей аx и аy, по­ро­ж­дён­ных нор­маль­ными рас­пре­де­ле­ниями с не­из­вест­ны­ми, но оди­на­ко­вы­ми дис­пер­сия­ми.

Пусть и - не­за­ви­си­мые ма­те­ма­ти­че­ские вы­бор­ки из пер­вой и вто­рой ге­не­раль­ной со­во­куп­но­стей. Про­ве­ря­ет­ся ос­нов­ная ги­по­те­за , т.е. . В слу­чае спра­вед­ли­во­сти ги­по­те­зы Но ста­ти­сти­ка

име­ет рас­пре­де­ле­ние Стью­ден­та с m = n + k - 2 сте­пе­ня­ми сво­бо­ды. Здесь,

Этот факт по­зво­ля­ет по­стро­ить кри­те­рий для про­вер­ки ги­по­те­зы Но.

В ка­че­ст­ве кри­те­рия вы­би­ра­ет­ся ста­ти­сти­ка j = Т.

1. Ес­ли аль­тер­на­тив­ная ги­по­те­за , то кри­ти­че­ская об­ласть име­ет вид , где ве­ли­чи­на хкр > 0 яв­ля­ет­ся кор­нем урав­не­ния , где a - за­дан­ный уро­вень зна­чи­мо­сти, m = n + k - 2 - чис­ло сте­пе­ней сво­бо­ды рас­пре­де­ле­ния Стью­ден­та. Урав­не­ние ре­ша­ет­ся с по­мо­щью таб­л. 4 Приложения.

По дан­ным вы­бо­рок вы­чис­ля­ют­ся зна­че­ния

по­сле че­го оп­ре­де­ля­ет­ся зна­че­ние кри­те­рия

.

Ес­ли jэмп Î Акр, то при­ни­ма­ет­ся аль­тер­на­тив­ная ги­по­те­за , а ес­ли j эмп Ï Акр, то при­ни­ма­ет­ся ос­нов­ная ги­по­те­за .

2. Ес­ли аль­тер­на­тив­ная ги­по­те­за , т.е. , где хкр > 0 есть ко­рень урав­не­ния , т.е. . Этот корень на­хо­дится по таб­л. 4 Приложения. Затем вы­чис­ля­ет­ся jэмп ., и ес­ли jэмп Î Акр, то при­ни­ма­ет­ся ги­по­те­за , а ес­ли jэмп Ï Акр, то при­ни­ма­ет­ся ос­нов­ная ги­по­те­за .

3. Ес­ли аль­тер­на­тив­ная ги­по­те­за , то кри­ти­че­ская об­ласть име­ет вид , где ве­ли­чи­на хкр > 0 есть ко­рень урав­не­ния . По таб­л. 4 оп­ре­де­ля­ет­ся хкр, вы­чис­ля­ет­ся jэмп ., и ес­ли, jэмп Î Акр, то при­ни­ма­ет­ся аль­тер­на­тив­ная ги­по­те­за , а ес­ли jэмп Ï Акр, то при­ни­ма­ет­ся ос­нов­ная ги­по­те­за .

П р и м е р. После об­ра­бот­ки вту­лок на стан­ке-ав­то­ма­те в по­не­дель­ник и пят­ни­цу бы­ло ото­бра­но две про­бы по де­сять де­та­лей в ка­ж­дой. Были измерены диаметры этих втулок с точностью до тысячных долей сантиметра. Ре­зуль­та­ты из­ме­ре­ния (в см) диа­мет­ров этих вту­лок при­во­дят­ся в таб­ли­це:

№ детали          
Про­ба 1 2,066 2,063 2,068 2,060 2,067
Про­ба 2 2,063 2,060 2,057 2,056 2,059
         
2,063 2,059 2,062 2,062 2,060
2,058 2,062 2,059 2,059 2,057

Рас­пре­де­ле­ние диа­мет­ров пред­по­ла­га­ет­ся нор­маль­ным, и по­сколь­ку вы­бор­ки из­вле­че­ны из про­дук­ции, про­из­ве­ден­ной од­ним стан­ком, то мож­но счи­тать дис­пер­сии обо­их вы­бо­рок рав­ны­ми.

Про­ве­рить на уров­не зна­чи­мо­сти a = 0,01 ги­по­те­зу о том, что ма­те­ма­ти­че­ские ожи­да­ния ге­не­раль­ных со­во­куп­но­стей де­та­лей, про­из­ве­ден­ных в по­не­дель­ник и пят­ни­цу, рав­ны. Дру­ги­ми сло­ва­ми, на­до про­ве­рить, что ре­жим ра­бо­ты стан­ка-ав­то­ма­та с по­не­дель­ни­ка до пят­ни­цы не из­ме­нил­ся.

Р е ш е н и е. За ос­нов­ную ги­по­те­зу принимаем , а за аль­тер­на­тив­ную -. В ка­че­ст­ве кри­те­рия вы­би­ра­ем ста­ти­сти­ку

имею­щую рас­пре­де­ле­ние Стью­ден­та с m = 10 + 10 - 2 = 18 сте­пе­ня­ми сво­бо­ды. Кри­ти­че­ская об­ласть име­ет вид , где хкр есть ко­рень урав­не­ния . По таб­л. 4 Приложения для a = 0,01 и m = 18 на­хо­дим . Поэтому .

Вы­чис­лим эм­пи­ри­че­ское зна­че­ние кри­те­рия j, для чего посчитаем входящие туда величины.

× (2,066 + 2,063 + 2,068 + 2,060 + 2,067 + 2,063 + 2,059 + 2,062 + 2,062

+ 2,060) = 2,063;

× (2,063 + 2,060 + 2,057 + 2,056 + 2,059 + 2,058 + 2,062 + 2,059 + 2,059+ +2,057) = 2,059;

По­сколь­ку j Î Акр, то при­ни­ма­ет­ся аль­тер­на­тив­ная ги­по­те­за , т.е. ре­жим ра­бо­ты стан­ка-ав­то­ма­та c по­не­дель­ни­ка до пят­ни­цы из­ме­нил­ся.

З а м е ч а н и я.

1. По от­но­ше­нию к тре­бо­ва­нию нор­маль­но­го рас­пре­де­ле­ния ге­не­раль­ной со­во­куп­но­сти Т - кри­те­рий не очень чув­ст­ви­те­льный. Его мож­но при­ме­нять, ес­ли ста­ти­сти­че­ское рас­пре­де­ле­ние обе­их вы­бо­рок (т.е. их гис­то­грам­мы) име­ют по од­ной вер­ши­не и при­бли­зи­тель­но сим­мет­рич­ны от­но­си­тель­но сво­их мод.

2. Тре­бо­ва­ние час­то мо­жет быть обос­но­ва­но на со­дер­жа­тель­ном уров­не, при этом ги­по­те­зу мож­но про­ве­рить по F - кри­те­рию.

8.3. F – критерий

Ги­по­те­зы о дис­пер­си­ях име­ют в тех­ни­ке боль­шое зна­че­ние, так как есть чи­сло­вая ме­ра та­ких ха­рак­те­ри­стик, как точ­ность об­ра­бот­ки из­де­лия, ошиб­ки из­ме­ри­тель­ных при­бо­ров, точ­ность тех­но­ло­ги­че­ских про­цес­сов и т. п. При этом часто требуется сравнить дисперсии различных математических выборок. Для про­вер­ки ги­по­те­зы или строится F - кри­те­рий. Дело в том, что при спра­вед­ли­во­сти ги­по­те­зы Но слу­чай­ная ве­ли­чи­на , рав­ная от­но­ше­нию исправленных вы­бо­роч­ных дис­пер­сий, со­от­вет­ст­вую­щих не­за­ви­си­мым ма­те­ма­ти­че­ским вы­бор­кам из ге­не­раль­ных со­во­куп­но­стей рас­пре­де­ле­ний и , име­ет так на­зы­вае­мое F - рас­пре­де­ле­ние с (m, l) сте­пе­ня­ми сво­бо­ды, где m = n - 1; l = k - 1, а чис­ла n и k - объ­е­мы вы­бо­рок и . В качестве од­ной из трех воз­мож­ных аль­тер­на­тив­ных ги­по­тез берут: а); б); в).

В табл. 6 Приложения F - рас­пре­де­ле­ние приводятся для двух зна­че­ний па­ра­мет­ра a: a = 0,05 и a = 0,01 (a - уро­вень зна­чи­мо­сти), при­чем счи­тается, что , т.е. рас­смат­ри­вается слу­чай, ко­гда . По этой таблице можно найти решение урав­не­ния , где , - плот­ность ве­ро­ят­но­сти F - рас­пре­де­ле­ния с m и l сте­пе­нями сво­бо­ды.

Рассмотрим три задачи, соответствующие трём различным альтернативным гипотезам.

1. Про­вер­ка ос­нов­ной ги­по­те­зы при на­ли­чии аль­тер­на­тив­ной

ги­по­те­зына уров­не зна­чи­мо­сти a сво­дит­ся к по­строе­нию кри­ти­че­ской об­лас­ти , где хкр есть ко­рень урав­не­ния , и вы­чис­ле­нию зна­че­ния статистики , где - это зна­че­ния исправленных вы­бо­роч­ных дис­пер­сий, вы­чис­лен­ные по имею­щим­ся вы­бор­кам и . Ес­ли jэмп Î Акр, то при­ни­ма­ет­ся аль­тер­на­тив­ная ги­по­те­за , а ес­ли jэмп Ï Акр, то при­ни­ма­ет­ся ос­нов­ная ги­по­те­за .

2. Про­вер­ка ги­по­те­зы при на­ли­чии аль­тер­на­тив­ной ги­по­те­зы сво­дит­ся к п. 1, т.е. к про­вер­ке ос­нов­ной ги­по­те­зы при на­ли­чии аль­тер­на­тив­ной . От­ли­чи­е будет состоять лишь в том, что те­перь хкр – это ко­рень урав­не­ния .

3. Про­вер­ка ос­нов­ной ги­по­те­зы при на­ли­чии аль­тер­на­тив­ной сво­дит­ся к вы­чис­ле­нию статистики , где - наибольшая из дисперсий , а - наименьшая, и вы­чис­ле­нию кри­ти­че­ской об­лас­ти , где хкр ³ 1 и яв­ля­ет­ся кор­нем урав­не­ния , где m - чис­ло сте­пе­ней сво­бо­ды наболь­шей вы­бо­роч­ной дис­пер­сии.

Как и пре­ж­де, ес­ли jэмп Î А кр, то при­ни­ма­ет­ся аль­тер­на­тив­ная ги­по­те­за , а ес­ли jэмп Ï Акр, то - ос­нов­ная ги­по­те­за .

П р и м е р № 1. Пусть не­за­ви­си­мые слу­чай­ные ве­ли­чи­ны нор­маль­но рас­пре­де­ле­ны и име­ют оди­на­ко­вые дис­пер­сии. Най­ти зна­че­ния х1, х2, х3, х4 та­кие, что для слу­чай­ной ве­ли­чи­ны выполняются следующие равенства:

Р е ш е н и е. Как уже говорилось, слу­чай­ная ве­ли­чи­на , где , име­ет F - рас­пре­де­ле­ние с m = 20 и l = 30 сте­пе­ня­ми сво­бо­ды. Вна­ча­ле най­дем х1 > 1 и x2 > 1 та­кие, что . Име­ем

.

По таб­л. 6 Приложения для a = 0,05 и a = 0,01 при m = 20; l = 30 на­хо­дим: х1 = 1,93; x2 = 2,55.

Теперь за­ме­тим, что ес­ли име­ет F - рас­пре­де­ле­ние с m и l сте­пе­ня­ми сво­бо­ды, то слу­чай­ная ве­ли­чи­на име­ет F - рас­пре­де­ле­ние с l и m сте­пе­ня­ми сво­бо­ды. По­это­му ве­ли­чи­ны х3 < 1 и x4 < 1, удов­ле­тво­ряю­щие ра­вен­ст­вам , оп­ре­де­ля­ют­ся из урав­не­ний , где . По таб­л. 6 на­хо­дим: , а следовательно, .

Ана­ло­гич­но по­лу­ча­ем

.

По таб­л. 6 на­хо­дим: , а .

П р и м е р № 2. Дву­мя из­ме­ри­тель­ны­ми при­бо­ра­ми про­из­ве­де­ны из­ме­ре­ния диа­мет­ров ва­лов не­ко­то­рых из­де­лий, сде­лан­ных на од­ном стан­ке в те­че­ние од­ной сме­ны. Пер­вый из­ме­ри­тель­ный при­бор ис­поль­зо­ва­ли 17 раз, а вто­рой - 25 раз. По ре­зуль­та­там из­ме­ре­ний вы­чис­ли­ли зна­че­ния исправленных вы­бо­роч­ных дис­пер­сий от­кло­не­ний диа­мет­ров ва­лов от но­ми­на­ла. По­лу­че­но, что

.

Про­ве­рить на уров­не зна­чи­мо­сти a = 0,01 ги­по­те­зу о том, что оба из­ме­ри­тель­ных при­бо­ра име­ют один класс точ­но­сти, т.е. дис­пер­сии оши­бок из­ме­ре­ний при­бо­ров одинаковы.

Р е ш е н и е. Обыч­но ре­зуль­та­ты из­ме­ре­ний не­за­ви­си­мы и рас­пре­де­ле­ны нор­маль­но или при­бли­зи­тель­но нор­маль­но. По­это­му ис­поль­зу­ем F - кри­те­рий. В ка­че­ст­ве ос­нов­ной ги­по­те­зы Но вы­би­ра­ем - точ­но­сти пер­во­го и вто­ро­го при­бо­ра оди­на­ко­вые. За аль­тер­на­тив­ную ги­по­те­зу бе­рем - вто­рой при­бор име­ет бо­лее вы­со­кий класс точ­но­сти. Кон­ку­ри­рую­щая ги­по­те­за Н1 вы­бра­на та­кой, по­то­му что .

Статистикой кри­те­рия яв­ля­ет­ся ве­ли­чи­на , имею­щая F - рас­пре­де­ле­ние с (16; 24) сте­пе­ня­ми сво­бо­ды. Кри­ти­че­ская об­ласть име­ет вид , хкр > 1 есть ко­рень урав­не­ния

.

По таб­л. 6 Приложения на­хо­дим хкр = х = 2,85, т.е. .

Зна­че­ние кри­те­рия рав­но . И так как jэмп Ï то при­ни­ма­ет­ся ос­нов­ная ги­по­те­за , т.е. из­ме­ри­тель­ные при­бо­ры име­ют оди­на­ко­вый класс точ­но­сти.

З а м е ч а н и е. При ис­поль­зо­ва­нии F - кри­те­рия пред­по­ла­га­лось, что вы­бор­ки про­из­во­ди­лись из ге­не­раль­ных со­во­куп­но­стей, имею­щих нор­маль­ные рас­пре­де­ле­ния. Од­на­ко опыт и ис­сле­до­ва­ния по­ка­зы­ва­ют, что F - кри­те­рий ус­той­чив по от­но­ше­нию к от­кло­не­нию от нор­маль­но­го рас­пре­де­ле­ния, осо­бен­но ес­ли объ­е­мы вы­бо­рок не мень­ше не­сколь­ких де­сят­ков.

Все кри­те­рии, по­стро­ен­ные ра­нее и при­ме­нен­ные в при­ме­рах этого раздела, на­зы­ва­ют­ся кри­те­рия­ми зна­чи­мо­сти.

Эти кри­те­рии по­зво­ля­ют ста­ти­сти­че­ски про­ве­рить ос­нов­ную ги­по­те­зу при на­ли­чии од­ной из аль­тер­на­тив­ных ги­по­тез , где l - не­ко­то­рый па­ра­метр ге­не­раль­ной со­во­куп­но­сти, из ко­то­рой про­из­во­дит­ся вы­бор­ка, а l0 - не­ко­то­рое за­дан­ное чис­ло.

На­при­мер, Т - кри­те­рий или F - кри­те­рий по­зво­ля­ют про­ве­рить, яв­ля­ют­ся ли не­ко­то­рые раз­ли­чия в на­блю­де­ни­ях двух вы­бо­рок зна­чи­мы­ми (су­ще­ст­вен­ны­ми) или слу­чай­ны­ми.

8.4. Критерий согласия Пирсона

Рас­смот­рим те­перь один из так на­зы­вае­мых кри­те­ри­ев со­гла­сия: кри­те­рий Пир­со­на или хи-квад­рат. Кри­те­рий со­гла­сия Пир­со­на слу­жит для ста­ти­сти­че­ской про­вер­ки ги­по­те­зы , где - за­дан­ное (ги­по­те­ти­че­ское) рас­пре­де­ле­ние, а - функ­ция рас­пре­де­ле­ния слу­чай­ной ве­ли­чи­ны Х. Ги­по­те­за Но мо­жет иметь вид , где - ги­по­те­ти­че­ская плот­ность ве­ро­ят­но­сти, а - плот­ность ве­ро­ят­но­сти рас­пре­де­ле­ния слу­чай­ной ве­ли­чи­ны Х. Для дис­крет­ной слу­чай­ной ве­ли­чи­ны, ги­по­те­за Но име­ет вид .

В на­ча­ле рас­смот­рим слу­чай, ко­гда функ­ция рас­пре­де­ле­ния пол­но­стью оп­ре­де­ле­на, т.е. не со­дер­жит не­из­вест­ных па­ра­мет­ров.

По­строе­ние кри­те­рия со­гла­сия Пир­со­на на­чи­на­ет­ся с раз­бие­ния об­лас­ти воз­мож­ных зна­че­ний слу­чай­ной ве­ли­чи­ны Х на ко­неч­ное чис­ло не­пе­ре­се­каю­щих­ся мно­жеств ко­то­рые на­зы­ва­ют­ся клас­са­ми.

Ес­ли Х - слу­чай­ная не­пре­рыв­ная ве­ли­чи­на, то - ин­тер­вал или по­лу­открытый от­ре­зок ви­да или , где k - чис­ло клас­сов. Воз­мож­ны слу­чаи, ко­гда . Это будет, на­при­мер, когда величина Х нор­маль­но рас­пре­де­ле­на. Ес­ли со­глас­но ги­по­те­зе Но слу­чай­ная ве­ли­чи­на рав­но­мер­но рас­пре­де­ле­на на от­рез­ке , то .

Для слу­чай­ной дис­крет­ной ве­ли­чи­ны Х её воз­мож­ные зна­че­ния объединяют последовательно в k множеств , содержащих соответственно mi значений ().

Да­лее, пред­по­ла­гая, что ги­по­те­заспра­вед­ли­ва, вы­чис­ля­ют­ «тео­ре­ти­че­ские» ве­ро­ят­но­сти попадания случайной величины в класс : . Для случайной непрерывной величины Х имеем: . Ес­ли Х - слу­чай­ная дис­крет­ная ве­ли­чи­на, то pi – это сумма вероятностей для всех mi значений из интервала : , где хj Î .

Раз­бие­ние выборки объёма n на клас­сы осуществляется про­из­воль­но, но при этом следует соблюдать правило: для гра­нич­ных клас­сов должны вы­пол­няться не­ра­вен­ст­ва , а для ос­таль­ных - . Для удов­ле­тво­рения этим ус­ло­ви­ям воз­мож­но объ­е­ди­не­ние не­ко­то­рых со­сед­них клас­сов в один. Опыт по­ка­зы­ва­ет, что чис­ло клас­сов же­ла­тель­но брать в пределах от 5 до 15.

Итак, пусть все вы­ше пе­ре­чис­лен­ные по­строе­ния про­из­ве­де­ны, а необходимые тре­бо­ва­ния вы­пол­не­ны. Пусть - ма­те­ма­ти­че­ская вы­бор­ка из ге­не­раль­ной со­во­куп­но­сти, по­ро­ж­дён­ной рас­пре­де­ле­ни­ем , путь - чис­ло слу­чай­ных ве­ли­чин, по­пав­ших в i - ый класс, . То­гда в тео­рии ве­ро­ят­но­стей до­ка­зы­ва­ет­ся, что слу­чай­ная ве­ли­чи­на име­ет хи-квад­рат рас­пре­де­ле­ние с m = k – 1 cте­пе­нями сво­бо­ды.

Так как c2 есть ме­ра от­клоне­ния ис­тин­но­го рас­пре­де­ле­ния от ги­по­те­ти­че­ско­го , то в ка­че­ст­ве кри­те­рия вы­би­ра­ет­ся ста­ти­сти­ка , ко­то­рая при боль­ших n (око­ло сот­ни и бо­лее) име­ет хи-квад­рат рас­пре­де­ле­ние с m = k - 1 сте­пе­нями сво­бо­ды.

Кри­ти­че­ская об­ласть при ис­поль­зо­ва­нии кри­те­рия со­гла­сия Пир­со­на име­ет вид , где хкр > 0 есть ко­рень урав­не­ния , где - плот­ность ве­ро­ят­но­сти слу­чай­ной ве­ли­чи­ны с m сте­пе­ня­ми сво­бо­ды, a - уро­вень зна­чи­мо­сти кри­те­рия j. По таб­л. 5 Приложения для за­дан­ных значений a и m на­хо­дим хкр. Вы­чис­ля­ем по вы­бор­ке зна­че­ние кри­те­рия , где m i - чис­ло зна­че­ний из вы­бор­ки, по­пав­ших в i - ый класс .

Ес­ли jэмп Î Акр, то ги­по­те­за от­вер­га­ет­ся на уров­не зна­чи­мо­сти a, т.е. при­ни­ма­ет­ся ре­ше­ние, ве­ро­ят­ность ошиб­ки ко­то­ро­го рав­на a. Ес­ли jэмп Ï Акр, то ги­по­те­за Но при­ни­ма­ет­ся.

З а м е ч а н и е. Ес­ли ги­по­те­ти­че­ская функ­ция рас­пре­де­ле­ния за­ви­сит от l не­из­вест­ных па­ра­мет­ров и для оп­ре­де­ле­ния при­шлось ис­поль­зо­вать оцен­ки этих па­ра­мет­ров, то схе­ма при­ме­не­ния кри­те­рия со­гла­сия Пир­со­на ос­та­ёт­ся преж­ней, толь­ко из­ме­ня­ет­ся чис­ло сте­пе­ней сво­бо­ды, его сле­ду­ет брать рав­ным m = k – - l - 1.

П р и м е р № 1. В 1890 го­ду был измерен рост 1000 взрос­лых муж­чин - ра­бо­чих мо­с­ков­ских фаб­рик. Ре­зуль­та­ты из­ме­ре­ний ука­за­ны в таб­лице, в которой верхняя строка – это диапазоны измеренных ростов в см, а нижняя – число мужчин, рост которых попал в соответствующие диапазоны:

Рост 143¸146 146¸149 149¸152 152¸155 155¸158
Число          
158¸161 161¸164 164¸167 167¸170 170¸173 173¸176 176¸179
             
179¸182 182¸185 185¸188
     

Табл. 8.1

Ис­поль­зуя кри­те­рий со­гла­сия Пир­со­на, на уров­не зна­чи­мо­сти a = 0,01 про­ве­рить ги­по­те­зу о том, что рост муж­чин име­ет нор­маль­ное рас­пре­де­ле­ние.

Р е ш е н и е. Пусть слу­чай­ная ве­ли­чи­на - рост муж­чины име­ет плот­ность ве­ро­ят­но­сти . Тре­бу­ет­ся на уров­не зна­чи­мо­сти a = 0,01 ста­ти­сти­че­ски про­ве­рить ги­по­те­зу . Эта плотность вероятности зависит от двух параметров: а и s, значит, l = 2.

В ка­че­ст­ве не­из­вест­ных па­ра­мет­ров и возь­мем их оцен­ки, вы­чис­лен­ные по ста­ти­сти­че­ской таб­ли­це 8.1 (- се­ре­ди­на i - ого ин­тер­ва­ла, mi - чис­ло муж­чин, рост ко­то­рых по­пал в i - ый ин­тер­вал):

144,5 147,5 150,5 153,5 156,5 159,5 162,5
mi              
165,5 168,5 171,5 174,5 177,5 180,5 183,5 186,5
               

За­ме­тим, что

З а м е ч а н и е. Рас­чет и удоб­но про­из­во­дить на современных инженерных ­каль­ку­ля­то­рах, имеющих соответствующие функциональные клавиши.

В ка­че­ст­ве и бе­рём .

Мно­же­ст­во воз­мож­ных зна­че­ний слу­чай­ной ве­ли­чи­ны Х ра­зо­бьем на 11 клас­сов (край­ние три ин­тер­ва­ла, стоящие и сле­ва, и спра­ва в таб­л. 8.1, объ­е­ди­ня­ем):

Рост -¥¸152 152¸155 155¸158 158¸161 161¸164
Чис­ло          
164¸167 167¸170 170¸173 173¸176 176¸179 179¸+¥
           

Вы­чис­лим теоре­ти­че­ские ве­ро­ят­но­сти

,

где Ф (х) - функ­ция Ла­п­ла­са, зна­че­ния ко­то­рой при­во­дят­ся в таб­л. 2 Приложения.

Итак,

при этом ;

Со­ста­вим таб­ли­цу эм­пи­ри­че­ских чи­сел mi и тео­ре­ти­че­ских чи­сел i муж­чин, по­пав­ших в i - ый класс, i = 1,2,3,...11.

mi                      
i 11,3 28,8 65,5   174,7 197,4 174,7   65,5 28,8 11,3

Вы­чис­ля­ем зна­че­ние кри­те­рия

Чис­ло сте­пе­ней сво­бо­ды рав­но m = k - l - 1 = 11 – 2 - 1 = 8. Для уров­ня зна­чи­мо­сти a = 0,01 и m = 8 по таб­л. 4 Приложения находим ко­рень урав­не­ния : хкр = х = 20,1. Следовательно, критической областью Акр будет открытый интервал (20,1; + ¥). По­сколь­ку jэмп Ï Акр, то на уров­не зна­чи­мо­сти a = = 0,01 при­ни­ма­ет­ся ги­по­те­за о нор­маль­ном рас­пре­де­ле­нии рос­та муж­чин с плот­но­стью ве­ро­ят­но­сти .

П р и м е р № 2. За время вто­рой ми­ро­вой вой­ны на Лон­дон упа­ло 537 са­мо­лётов-сна­ря­дов. Вся тер­ри­то­рия Лон­до­на бы­ла раз­де­ле­на на 576 уча­ст­ков пло­ща­дью по 0,25 кв. км. В при­во­ди­мой ни­же таб­ли­це ука­за­ны чис­ла уча­ст­ков mi, на ко­то­рые упа­ло хi са­мо­лё­тов-сна­ря­дов:

хi           5 и больше
m i            

Как и положено, объём выборки .

С по­мо­щью кри­те­рия со­гла­сия Пир­со­на про­ве­рить, со­гла­су­ют­ся ли эти дан­ные с ги­по­те­зой о том, что чис­ло са­мо­лё­тов-сна­ря­дов, по­пав­ших на один уча­сток, рас­пре­де­ле­но по за­ко­ну Пу­ас­со­на с па­ра­мет­ром l, зна­че­ния ко­то­ро­го рав­но зна­че­нию вы­бо­роч­но­го сред­не­го. Уро­вень зна­чи­мо­сти при­нять рав­ным a = 0,05.

Р е ш е н и е. В сред­нем на один уча­сток по­па­ло са­мо­лё­та-сна­ря­да. Поэтому единственный (l = 1) параметр l распределения Пуассона по­ла­га­ем равным l =.

Рас­смот­рим слу­чай­ную ве­ли­чи­ну Х - чис­ло по­па­да­ний сна­ря­дов на один уча­сток. Нулевая ги­по­те­за, ко­то­рую на­до ста­ти­сти­че­ски про­ве­рить, записывается как .

Ра­зо­бьем весь диа­па­зон воз­мож­ных зна­че­ний ве­ли­чи­ны Х на шесть клас­сов:

1 - на уча­сток не упал ни один са­мо­лёт-сна­ряд;

2 - на уча­сток упал один са­мо­лёт-сна­ряд;

3 - на уча­сток упа­ло два са­мо­лёта-сна­ря­да;

4 - на уча­сток упа­ло три са­мо­лё­та-сна­ря­да;

5 - на уча­сток упа­ло че­ты­ре са­мо­лё­та-сна­ря­да;

6 - на уча­сток упа­ло пять и бо­лее са­мо­лё­тов-сна­ря­дов.

Вы­чис­лим тео­ре­ти­че­ские ве­ро­ят­но­сти:

Эм­пи­ри­че­ские и тео­ре­ти­че­ские чис­ла са­мо­ле­тов - сна­ря­дов по­пав­ших в i -ый класс, i = 1,2,...,6 со­б­ра­ны в таб­ли­цу

mi            
i 227,3 211,3 98,3 30,5 7,1 1,6

Вы­чис­ля­ем зна­че­ние кри­те­рия

.

Чис­ло сте­пе­ней сво­бо­ды рав­но m = k - l - 1 = 6 - 1 - 1 = 4. Кри­ти­че­ская об­ласть Акр име­ет вид: , где хкр есть ко­рень урав­не­ния . По таб­л. 5 Приложения для a = 0,05 и m = 4 на­хо­дим хкр = 9,5. Итак, .

По­сколь­ку jэмп Ï Акр, то на уров­не зна­чи­мо­сти a = 0,05 при­ни­ма­ет­ся ги­по­те­за Но, т.е. чис­ло са­мо­л­ётов-сна­ря­дов, упав­ших на один уча­сток пло­ща­дью 0,25 кв. км в Лон­до­не, под­чи­ня­ет­ся за­ко­ну Пу­ас­со­на с па­ра­мет­р­ом l = 0,93.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: