Задание на контрольную работу

по дисциплине          Основы научных исследований

 

 

студенту   ИЭиТ З/О  института 3 курса     151000.62 специальность

 

_________________Азизову Руслану Забитовичу_____________________

 

 

ТЕМА: Статистическая обработка результатов экспериментов

 

Вариант № 2

 

Дата выдачи работы: 23мая 2014 год. Срок сдачи работы: 17 ноября 2014 год.

 

 

Руководитель работы _________________ _______________ Шитков А В.

                         

СОСТАВ ПОЯСНИТЕЛЬНОЙ ЗАПИСКИ:

 

1 СТАТИСТИЧЕСКИЕ ОЦЕНКИ РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ

1.1 Исходные данные

1.2 Теоретические положения

1.3 Результаты расчетов

2 РАСЧЕТ ДОВЕРИТЕЛЬНОГО ИНТЕРВАЛА ДЛЯ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ. ОПРЕДЕЛЕНИЕ НЕОБХОДИМОГО ОБЪЕМА ВЫБОРКИ. ОТБРАСЫВАНИЕ ГРУБЫХ НАБЛЮДЕНИЙ

2.1 Исходные данные

2.2 Теоретические положения

2.2.1 Расчет доверительного интервала для математического ожидания

2.2.2 Определение необходимого объема выборки

2.2.3 Отбрасывание грубых наблюдений

2.3 Результаты расчетов

3 ПРОВЕРКА ГИПОТЕЗЫ ОБ ОДНОРОДНОСТИ ДВУХ ДИСПЕРСИЙ. ПРОВЕРКА ОДНОРОДНОСТИ НЕСКОЛЬКИХ ДИСПЕРСИЙ, НАЙДЕННЫХ ПО ВЫБОРКАМ ОДИНАКОВОГО ОБЪЕМА. ПРОВЕРКА ОДНОРОДНОСТИ СРЕДНИХ

3.1 Исходные данные

3.2 Теоретические положения

3.2.1 Проверка гипотезы об однородности двух дисперсий

3.2.2 Проверка однородности нескольких дисперсий, найденных по выборкам одинакового объема

3.2.3 Проверка однородности средних

3.3 Результаты расчетов

4 ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОСТИ РАСПРЕДЕЛЕНИЯ

4.1 Исходные данные

4.2 Теоретические положения

4.3 Результаты расчетов

 

 

ЛИСТ ДЛЯ ЗАМЕЧАНИЙ

 

ОГЛАВЛЕНИЕ

 

1 СТАТИСТИЧЕСКИЕ ОЦЕНКИ РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ

 

1.1 Исходные данные

 

Определить для выборки среднее значение, дисперсию, стандартное отклонение, коэффициент вариации, среднюю квадратическую ошибку среднего значения, показатель точности среднего значения и ошибку стандартного отклонения.

Вариант №2

474

410

478

465

429

451

393

435

441

426

436

436

453

465

479

472

469

462

497

433

469

420

472

459

441

419

342

194

498

479

483

458

467

435

480

447

479

427

432

583

498

415

441

459

449

371

450

498

415

389

466

415

455

454

457

434

528

455

544

447

506

495

432

520

435

506

404

428

413

501

461

488

479

371

448

440

498

603

506

386

440

445

467

459

419

521

410

417

409

411

465

438

461

433

456

441

498

471

483

464

515

464

435

447

436

425

423

416

448

430

488

426

481

448

458

451

451

453

469

389

425

459

424

504

441

413

446

406

408

440

416

397

459

441

438

424

434

421

435

425

427

488

422

412

476

494

537

442

461

469

 

 

1.2 Теоретические положения

 

Множество значений случайной величины, полученных в результате эксперимента или наблюдений над объектом исследования, представляет собой статистическую совокупность. Статистическая совокупность, содержащая в себе все возможные значения случайной величины, называется генеральной статистической совокупностью. Выборочной статистической совокупностью называется совокупность, в которой содержится только некоторая часть элементов генеральной совокупности. По результатам экспериментов практически всегда встречаются с выборочной, а не с генеральной совокупностью. Выборочную статистическую совокупность будем в дальнейшем называть выборкой, а число опытов (наблюдений) n, содержащееся в выборке – объемом выборки.

При повторении опытов в одинаковых условиях обычно обнаруживается закономерность в частоте появления тех или иных результатов. Некоторые значения случайной величины появляются значительно чаще других, при этом в целом они группируются относительно некоторого значения - центра группирования, которое мы обозначим через . Для описания этого явления используется вероятностный подход. Пусть  - вероятность того, что случайная величина, являющаяся результатом эксперимента, примет значение ,  Если значения  известны для всех возможных значений  из генеральной совокупности, то величину  можно найти по формуле

Величину  называют математическим ожиданием или генеральным средним случайной величины. Одно только математическое ожидание не может отобразить все характерные черты статистической совокупности.

Исследователю необходимо знать, кроме того, изменчивость, или вариацию наблюдаемой характеристики объекта.

Рассеивание случайной величины относительно математического ожидания характеризуется величиной, называемой дисперсией. Обычно она обозначается через . Для генеральной совокупности дисперсия определяется по формуле

Дисперсию  часто называют генеральной дисперсией. Квадратный корень из дисперсии называется средним квадратическим отклонением случайной величины, или стандартом .

Как и дисперсия, среднее квадратическое отклонение является характеристикой рассеивания значений случайной величины относительно математического ожидания.

Формулы справедливы для дискретных случайных величин. Для непрерывных случайных величин математическое ожидание и дисперсия выражаются через соответствующие интегралы.

Поскольку экспериментатор встречается не с генеральной совокупностью, а с выборкой, необходимо иметь формулы, позволяющие приближенно оценить математическое ожидание   и дисперсию  на основе экспериментальных данных.

Пусть по результатам однородной серии опытов получена выборка . Наилучшей оценкой для математического ожидания  является среднее арифметическое или просто «среднее»

Найденное значение  называют еще выборочным средним в отличие от генерального среднего . Оценкой дисперсии  случайной величины является выборочная, или эмпирическая дисперсия. Она обозначается через  и вычисляется по формуле

Числитель этой формулы представляет собой сумму квадратов отклонений значений случайной величины от среднего значения . Знаменатель формулы для выборочной дисперсии называется числом степеней свободы, связанным с этой дисперсией, и обозначается через :

Величина

является оценкой среднего квадратического отклонения  выборки.

Ее также называют выборочным стандартом или стандартным отклонением выборки.

Часто для оценки изменчивости (вариации) случайных величин используют коэффициент вариации . Он равен отношению  к , %:

Коэффициент вариации характеризует не абсолютное, а относительное рассеивание случайной величины относительно среднего.

Важное значение имеют также следующие статистические показатели:

средняя квадратическая ошибка среднего значения

показатель точности среднего значения

ошибка среднего квадратического отклонения

* Для вычисления среднего арифметического значения  и выборочной дисперсии  и стандартного отклонения выборки  в Microsoft Excel можно воспользоваться встроенными статистическими функциями, соответственно СРЗНАЧ, ДИСП и СТАНДОТКЛОН.

 

1.3 Результаты расчетов

 

Таблица 1. - расчетный лист из Microsoft Excel части №1.

 

2 РАСЧЕТ ДОВЕРИТЕЛЬНОГО ИНТЕРВАЛА ДЛЯ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ. ОПРЕДЕЛЕНИЕ НЕОБХОДИМОГО ОБЪЕМА ВЫБОРКИ. ОТБРАСЫВАНИЕ ГРУБЫХ НАБЛЮДЕНИЙ

 

2.1 Исходные данные

 

«Расчет доверительного интервала для математического ожидания.

Определение необходимого объема выборки.

Отбрасывание грубых наблюдений»

Вариант №2

1) Определить доверительный интервал для математического ожидания при уровне значимости .

789

807

769

731

752

638

833

736

716

684

2.1) Определить необходимый объем выборки, при котором среднее значение отличалось бы от математического ожидания не более чем на  с доверительной вероятностью .

2.2) Определить необходимый объем выборки при уровне значимости  и относительной допускаемой ошибке .

2.3) Проверить, являются ли минимальное и максимальное значения выборки промахом при уровне значимости .


 

410 420 448 449 415 439 480 435
457 450 417 443 470 439 448 432
435 424 450 460 402 407 449 446
430 455 413 462 446 412 443 475
438 455 419 426 470 442 453 421
412 419 439 482 459 444 435 420
420 411 439 414 442 435 482 464
439 406 423 461 447 442 410 427
483 456 428 450 423 435 436 454
472 424 466 452 470 456 450 432
455 408 439 436 392 437 398 446
448 424 408 462 447 424 491 452
407 469 437 387 447 467 461 468
458 472 450 452 402 430 404 453
432 456 448 450 420 453 440 439
424 439 394 476 427 489 472 466
452 412 424 473 439 475 455 462
444 489 444 439 453 449 474 430
454 452 429 414 458 421 442 451
480 446 460 414 443 479 483 435
427 447 432 494 433 435 393 418
465 444 434 439 433 470 395 433
421 469 433 455 447 455 432 404
480 467 463 445 435 446 409 419
451 446 456 389 440 439 436 438

 

2.2 Теоретические положения

 

2.2.1 Расчет доверительного интервала для математического ожидания

 

Величина среднего арифметического значения , найденная по выборке, представляет ценность постольку, поскольку по ней можно судить об истинном среднем, математическом ожидании . Представляет интерес отыскание величины максимальной ошибки , которую мы допускаем, предполагая   равным . Требуется, следовательно, найти величину при которой

Этим неравенством задается интервал, в котором находится значение математического ожидания . Этот интервал называется доверительным интервалом для математического ожидания. Величина  зависит от объема выборки n. Чем больше n, тем меньше максимальная ошибка . Однако, даже при заданном n нельзя абсолютно достоверно указать величину  , так как расчет этой величины, как и любой статистический вывод, делают на основе результатов эксперимента, а они заведомо содержат ошибки. Выводы, которые делают на основе неточных данных, принципиально не могут быть абсолютно достоверными. Поэтому говорят о надежности статистического вывода, которую оценивают величиной доверительной вероятности p, где . Например, статистический вывод, сделанный с доверительной вероятностью , будет справедлив в 95 случаях из 100. Будем пользоваться чаще величиной , называемой уровнем значимости. Уровень значимости задается заранее, до проведения расчетов. Типичные значения для q: 0,01; 0,05 и 0,1 или, в процентах: 1, 5, 10.

Величина  определяется по формуле , следовательно, доверительный интервал для математического ожидания равен

где   – стандартное отклонение выборки;

 - табличное значение  - критерия Стьюдента;

 - объем (количество элементов) выборки.

Величину  - критерия Стьюдента определяют из соответствующих таблиц (они имеются практически в каждом руководстве по математической статистике или планированию эксперимента) ее следует выбирать по предварительно заданному уровню значимости  и числу степеней свободы .

Оценку для математического ожидания в виде интервала часто называют интервальной оценкой.

Не следует думать, что во всех случаях целесообразно задаваться возможно большей надежностью статистического вывода. С большей надежностью можно гарантировать только более широкий доверительный интервал для математического ожидания при тех же опытных данных.

 

2.2.2 Определение необходимого объема выборки

 

Пусть требуется найти минимальное число n повторений опытов, при котором среднее арифметическое , найденное по этой выборке, отличалось бы от математического ожидания не более чем на заданную величину .

Это, по существу, задача, обратная предыдущей. Для ее решения необходимо знать оценку дисперсии . Здесь можно использовать, например, результаты проведенных ранее исследований (разведывательных опытов). Искомое значение n определяется по формуле

При проведении экспериментальных исследований необходимое число наблюдений в опыте определяют по формуле

где  - коэффициент вариации (определяется по результатам проведенных ранее исследований), %;

 - показатель точности, %.

Обычно показатель точности   принимают равным 5 %. Величину уровня значимости  выбирают равной 0,05, при этом  или 0,01 и .

При статистической обработке данных широко используют процедуры проверки статистических гипотез. Статистическая гипотеза – это некоторое предположение относительно свойств генеральной совокупности, проверяемое по выборке. Например, гипотеза об однородности средних или дисперсий, законе распределения и т. д. Проверка статистической гипотезы – это процедура, по результатам которой гипотеза принимается или отбрасывается.

Выдвинутую гипотезу называют основной, или нулевой. Гипотезу, противоречащую нулевой, называют конкурирующей. Для проверки нулевой гипотезы используют специально подобранную случайную величину, распределение которой известно. Ее называют статистическим критерием. Например, при проверке гипотезы об однородности дисперсий в качестве критерия используют отношение выборочных дисперсий, которое подчиняется статистическому распределению Фишера. Для проверки статистической гипотезы вычисляют значения критерия по имеющимся опытным данным. Если оно находится внутри некоторой заданной заранее области, называемой областью принятия гипотезы (областью допустимых значений), то нулевая гипотеза принимается. В противоположном случае значение критерия попадает в критическую область, и тогда гипотеза отвергается.

Однако попадание критерия в область допустимых значений не дает права категорически утверждать, что гипотеза полностью подтвердилась.

Можно только заключить, что по данным выборки значение критерия не противоречит гипотезе. Поэтому, принимая решение о правильности гипотезы, можно допустить ошибку. Ошибка первого рода состоит в том, что отвергается гипотеза, которая на самом деле верна. Вероятность этой ошибки задается заранее выбором уровня значимости q. (Как указывалось, типичные значения q:0,01; 0,05; 0,1 или 1, 5 и 10%.) Ошибка второго рода состоит в том, что гипотеза принимается, а на самом деле она неверна. Уменьшение ошибки второго рода достигается увеличением уровня значимости. Таким образом, уменьшение уровня значимости приводит к уменьшению ошибки первого рода и при этом к увеличению ошибки второго рода. Необходимо отметить, что единственный способ одновременного уменьшения вероятностей ошибок первого и второго рода состоит в увеличении объема выборок.

 

2.2.3 Отбрасывание грубых наблюдений

 

Грубые наблюдения (промахи) подлежат исключению из выборки. Для их обнаружения можно вновь воспользоваться  - критерием Стьюдента. В этом случае сомнительный результат , временно исключают из выборки, а по оставшимся данным рассчитывают среднее арифметическое   и стандартное отклонение выборки . Далее вычисляют величину

Из таблиц распределения Стьюдента по выбранному уровню значимости   и числу степеней свободы , находят табличное значение  - критерия . Если , то подозреваемый результат является промахом и должен быть исключен из выборки.

Иногда сомнение вызывают одновременно два или даже три элемента выборки. Исследование начинают с того из сомнительных элементов, значение которого ближе к среднему арифметическому выборки, а остальные сомнительные элементы временно отбрасывают. Затем рассчитывают значения  и  выборки без исключенных элементов, а также значение   для оставшегося сомнительного элемента. Далее решают вопрос об исключении этого элемента с уровнем значимости . Если , то оставшийся элемент выборки отбрасывают как грубое измерение. Тем более грубымибудут и остальные, ранее исключенные элементы. Если наименее сомнительный элемент не оказался промахом , то его присоединяют к выборке и исследуют следующий сомнительный элемент, и т.д.

 

*Примечание.

Для вычисления среднего арифметического значения  и стандартного отклонения выборки  в Microsoft Excel можно воспользоваться встроенными статистическими функциями СРЗНАЧ и СТАНДОТКЛОН. При определении табличного значения критерия Стьюдента используют функцию СТЬЮДРАСПОБР . Для поиска максимального и минимального элемента  используют встроенные статистические функции МАКС и МИН. При вычислениях в ячейки содержащие эти элементы помещают текст.

 

2.3 Результаты расчетов

Таблица 2...4. - расчетный лист из Microsoft Excel части №2

 

 

3 ПРОВЕРКА ГИПОТЕЗЫ ОБ ОДНОРОДНОСТИ ДВУХ ДИСПЕРСИЙ. ПРОВЕРКА ОДНОРОДНОСТИ НЕСКОЛЬКИХ ДИСПЕРСИЙ, НАЙДЕННЫХ ПО ВЫБОРКАМ ОДИНАКОВОГО ОБЪЕМА. ПРОВЕРКА ОДНОРОДНОСТИ СРЕДНИХ

 

3.1 Исходные данные

 

«Проверка гипотезы об однородности двух дисперсий.

Проверка однородности нескольких дисперсий, найденных по выборкам одинакового объема. Проверка однородности средних»

Вариант №2

1) Для сравнения точности двух электровлагомеров каждым из них проведено 10 измерений влажности одного и того же участка доски. Результаты замеров влажности W, %, первым и вторым прибором следующие:

Первый прибор 42 45 32 34 30 27 29 40 35 28
Второй прибор 41 42 40 40 42 43 41 42 41 42

На основании приведенных данных проверить, являются ли расхождения в точности исследуемых приборов значимыми.

2) На станке обработано пять однородных заготовок. Для каждой полученной детали в шести точках замерялась ее толщина.

№ детали

Толщина, мм, в зависимости от номера точек замеров

1 2 3 4 5 6
1 50,43 50,38 50,19 50,28 50,43 50,24
2 50,41 50,47 50,27 50,28 50,14 50,53
3 50,12 50,29 50,07 50,14 50,33 50,46
4 50,54 50,35 50,26 50,02 50,35 50,37
5 50,46 50,37 50,51 50,49 50,43 50,40

Требуется выяснить, можно ли считать, что разброс значений толщин для всех деталей одинаков.

3) Сравнивалась шероховатость поверхностей двух деталей. Для каждой было получено 10 значений шероховатости Rz, мкм.

 

Деталь №1 28 40 32 34 30 27 29 40 35 28
Деталь №2 57 50 42 41 48 50 41 48 43 40

Требуется выяснить, является ли различие между шероховатостями двух деталей значимым.

 

3.2 Теоретические положения

 

3.2.1 Проверка гипотезы об однородности двух дисперсий

Результаты экспериментальных исследований часто используют, например, для сравнения условий функционирования объектов, оценки сравнительной эффективности различных технологий, разных способов измерения и т. д. Во многих случаях соответствующие выводы делают на основе анализа и сравнения нескольких выборок. Одна из простых задач такого типа возникает, когда надо сравнивать точность двух измерительных приборов. В этом случае, очевидно, следует сравнить оценки дисперсий соответствующих выборок.

Пусть имеются две выборки объемом , по которым найдены выборочные дисперсии . Они являются оценками для генеральных дисперсий соответственно . Предположим, что . Требуется выяснить, можно ли утверждать, что обе выборки взяты из одной и той же генеральной совокупности. Ее это так, то . В этом случае выборочные дисперсии  называются однородными, а различие между ними объясняется влиянием случайных ошибок. В противном случае генеральные дисперсии  не равны друг другу. Тогда говорят, что различие между выборочными дисперсиями значимо.

Для проверки статистической гипотезы об однородности двух дисперсий используется F - критерий Фишера. Вначале вычисляется величина , равная отношению большей из выборочных дисперсий к меньшей. Пусть .

Тогда

Далее задаются уровнем значимости  и вычисляют числа степеней свободы дисперсий числителя и знаменателя по формуле:  и . По трем величинам  таблиц распределения Фишера отыскивают величину . Если , то выборочные дисперсии считаются неоднородными (различие между ними значимо) для выбранного уровня значимости . Если ,, то можно принять гипотезу об однородности дисперсий.

 

3.2.2 Проверка однородности нескольких дисперсий, найденных по выборкам одинакового объема

Для проверки однородности нескольких дисперсий при равных объемах всех рассматриваемых выборок  может быть использован G - критерий Кохрена.

Пусть  - количество выборочных дисперсий, однородность которых проверяется. Обозначим эти дисперсии . Вычисляется расчетное G - отношение по формуле

В числителе этой формулы стоит наибольшая из рассматриваемых дисперсий, а в знаменателе – сумма всех дисперсий. Далее обращаются к таблицам распределения Кохрена. По выбранному уровню значимости q, числу степеней свободы каждой выборки    и по количеству выборок  из этой таблицы отыскивают величину . Если  то можно принять гипотезу об однородности дисперсий. В противном случае она отвергается.

 

3.2.3 Проверка однородности средних

Здесь исследуются две выборки, имеющие различные средние арифметические. Данная проверка позволяет установить, вызвано ли расхождение между средними случайными ошибками измерения или оно связано с влиянием каких-либо неслучайных факторов. Эта процедура находит широкое применение, например, в случаях, если требуется установить идентичность параметров одинаковых изделий, изготавливаемых на разном оборудовании.

Проверка проводится с применением  критерия Стьюдента. Пусть  объемы выборок,  соответствующие средние,  оценки дисперсий, найденные по этим выборкам.

Предстоит рассмотреть два случая.

1. Дисперсии  однородны.Вычисляется расчетное отношение по формуле

Из таблиц распределения Стьюдента при уровне значимости  и числе степеней свободы  находят табличное значение . Если , то расхождение между средними значимо. В противном случае можно принять гипотезу об однородности средних. Формула упрощается, если обе выборки имеют одинаковый объем, т. е. . В этом случае

2. Дисперсии  неоднородны.Как и в предыдущем случае здесь можно использовать  критерий Стьюдента, но формула для расчета имеет уже следующий вид:

Далее вычисляют величину   по формуле

Найденное значение  округляют до целого и принимают за число степеней свободы. По этой величине и по уровню значимости  из таблиц распределения Стьюдента отыскивается . Дальнейший ход проверки не отличается от предыдущего случая.

 

*Примечание.

Табличное значение критерия Фишера определяют, используя встроенную статистическую функцию FРАСПОБР .

 

 

3.3 Результаты расчетов

 

 

 

Таблица 5...7. - расчетный лист из Microsoft Excel части №3.

4 ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОСТИ РАСПРЕДЕЛЕНИЯ

 

4.1 Исходные данные

474

410

478

465

429

451

393

435

441

426

436

436

453

465

479

472

469

462

497

433

469

420

472

459

441

419

342

194

498

479

483

458

467

435

480

447

479

427

432

583

498

415

441

459

449

371

450

498

415

389

466

415

455

454

457

434

528

455

544

447

506

495

432

520

435

506

404

428

413

501

461

488

479

371

448

440

498

603

506

386

440

445

467

459

419

521

410

417

409

411

465

438

461

433

456

441

498

471

483

464

515

464

435

447

436

425

423

416

448

430

488

426

481

448

458

451

451

453

469

389

425

459

424

504

441

413

446

406

408

440

416

397

459

441

438

424

434

421

435

425

427

488

422

412

476

494

537

442

461

469

 

«Проверка гипотезы о нормальности распределения»

Вариант №2

В результате проведения разведывательных опытов была получена выборка. Проверить гипотезу о нормальности распределения.

 

4.2 Теоретические положения

 

«Проверка гипотезы о нормальности распределения»

Предположение о том, что выходная величина подчиняется нормальному закону распределения, можно проверить разными способами. Наиболее строгим из них является применение критерия  Пирсона. Для этого необходимо иметь выборку достаточно большого объема: . Диапазон изменения выходной величины в этой выборке разбивается на  интервалов так, чтобы эти интервалы покрывали всю ось от  до  и в каждый интервал при этом попало не менее пяти значений выходной величины. Подсчитывают количество , наблюдений, попавших в каждый интервал. Затем вычисляют теоретические вероятности попадания случайной величины в каждый  интервал. Для этого используют формулу

где  - среднее арифметическое выборки;  - среднее квадратическое отклонение выборки;  - нижняя граница го интервала; верхняя граница го интервала; нормированная функция Лапласа:

Значения ее для  и  определяются из специальных таблиц, которые приведены во многих справочных и учебных пособиях по теории вероятностей и математической статистике. При отыскании значений этой функции для отрицательных аргументов следует иметь ввиду, что функция Ф (z) нечетная:

 

Для вычисления теоретических вероятностей попадания случайной величины в каждый й интервал можно воспользоваться формулой

Следующим этапом является вычисление величины  по формуле

По выбранному уровню значимости  и числу степеней свободы   из таблиц распределения  выбирают величину . Гипотезу о нормальности распределения можно принять, если .

Менее строгой и поэтому не часто применяемой является проверка нормальности распределения по критерию Колмогорова.

 

4.3 Результаты расчетов

Таблица 8. - расчетный лист из Microsoft Excel части №3.

 



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: