double arrow

Домашнее задание к семинару 1


Задачи к семинару 1

Повторение:

– Выборочная оценка и ее свойства.

– Пусть являются независимыми одинаково распределенными случайными величинами с . Покажите, что выборочное среднее является несмещенной и состоятельной оценкой генерального среднего. Найдите дисперсию этой оценки.

– Повторить терминологию проверки гипотез (вставка 3.5).

– Тестирование гипотез о среднем, о равенстве двух средних.

 

Задачи из учебника Стока и Уотсона:

 

3.5.Проводится опрос 1055 зарегистрированных избирателей, и их просят выбрать между кандидатом A и кандидатом B. Пусть p обозначает долю голосующих в генеральной совокупности, которые предпочитают кандидата A, и пусть обозначает долю голосующих в выборке, которые предпочитают кандидата A.

а. Вы заинтересованы в тестирования конкурирующих гипотез против . Предположим, что вы решаете отвергнуть , если .

i. Какой размер этого теста?

ii. Вычислите мощность этого теста, если .

б. В опросе .

i. Протестируйте гипотезу о том, что против , используя 5%-й уровень значимости.

ii. Протестируйте гипотезу о том, что против , используя 5%-й уровень значимости.




iii. Постройте 95%-й доверительный интервал для p.

iv. Постройте 99%-й доверительный интервал для p.

v. Постройте 50%-й доверительный интервал для p.

в. Предположим, что опрос проводился 20 раз, используя независимо выбранных голосующих в каждом опросе. Для каждого из этих 20 опросов построен 95%-й доверительный интервал для p.

i. Какова вероятность того, что истинное значение p содержится во всех 20 доверительных интервалах?

ii. Сколько этих доверительных интервалов, как вы ожидаете, содержат истинное значение p?

г. На жаргоне опроса, «погрешность» – это ; т.е. это половина длины 95%-го доверительного интервала. Предположим, что вы хотите создать опрос, который имел погрешность не более 1%. Т.е. вы хотите, чтобы . Насколько большим должно быть n, если опрос использует простую случайную выборку?

3.8. Известны результаты новой версии теста SAT 1000 случайно выбранных старшеклассников. Выборочное среднее экзаменационной оценки составляет 1110, и выборочное стандартное отклонение – 123. Постройте 95%-й доверительный интервал для среднего экзаменационной оценки генеральной совокупности старшеклассников.

 

3.9. Предположим, что завод по производству лампочек производит лампы со средней продолжительностью работы, равной 2000 часов, и стандартным отклонением в 200 часов. Изобретатель утверждает, что разработал улучшенный процесс, который производит лампы с более длинной средней продолжительностью работы и тем же самым стандартным отклонением. Директор завода случайно выбирает 100 новых ламп. Она сказала, что она поверит в заявление изобретателя, если выборочное среднее продолжительности работы ламп будет больше, чем 2100 часов; в противном случае она заключит, что новый процесс не лучше, чем старый. Пусть обозначает среднее нового процесса. Рассмотрим нулевую и альтернативную гипотезы против .



а. Какой размер тестовой процедуры директора завода?

б. Предположим, что новый процесс фактически лучше и средняя продолжительность работы лампы равна 2150 часов. Какова мощность тестовой процедуры директора завода?

в. Какая тестовая процедура должна использоваться директором завода, если она хочет получить размер теста, равный 5%?

 

3.12. Для исследования гендерной дискриминации в фирмах случайно выбрана выборка из 100 мужчин и 64 женщин с похожими должностями. Информация об их месячных зарплатах говорит следующее:

 

  Средняя зарплата ( ) Стандартное отклонение ( ) n
Мужчины $3100 $200
Женщины $2900 $320

 

а. Что говорят эти данные по поводу гендерных различий в фирме? Представляют ли они статистически значимое свидетельство того, что средние зарплаты мужчин и женщин различны? (Чтобы ответить на этот вопрос, во-первых, сформулируйте нулевую и альтернативную гипотезы; во-вторых, вычислите соответствующую t-статистику; в-третьих, вычислите p-значение, связанное с t-статистикой; и наконец, используйте p-значение для ответа на вопрос.)



б. Свидетельствуют ли эти данные о том, что в фирме есть гендерная дискриминация в политике оплаты труда? Объясните.

3.16. Известно, что результаты стандартного школьного теста в США имеют среднее, равное 1000. Тест проходят 453 случайно выбранных школьников во Флориде; и в этой выборке среднее составляет 1013, а стандартное отклонение (s) 108.

а. Постройте 95%-й доверительный интервал для среднего результата теста школьников Флориды.

б. Можно ли говорить о наличии статистического свидетельства того, что школьники из Флориды выполняют тест иначе, чем другие школьники в Соединенных Штатах?

в. Другие 503 школьника были случайно выбраны во Флориде. Им был прочитан 3-часовой подготовительный курс до выполнения теста. Их средняя оценка составила 1019 со стандартным отклонением 95.

i. Постройте 95%-й доверительный интервал для изменения в средней оценке, связанной с подготовительным курсом.

ii. Есть ли статистическое свидетельство того, что подготовительный курс помог?

г. Первым 453 студентам также прочитали подготовительный курс, а затем попросили пройти тест во второй раз. Среднее изменение их оценки составило 9 пунктов, и стандартное отклонение изменилось на 60 пунктов.

i. Постройте 95%-й доверительный интервал для изменения в средней оценке.

ii. Есть ли статистически значимое свидетельство того, что студенты выполнят тест лучше со второй попытки после подготовительного курса?

iii. Студенты могут выполнить тест лучше со второй попытки из-за подготовительного курса или из-за своего полученного опыта при первой попытке. Опишите эксперимент, который будет количественной оценкой этих двух эффектов.

 

Домашнее задание к семинару 1

 

3.6.Пусть есть i.i.d., выбранные из распределения со средним значением . Тест против , используя обычную t-статистику, приводит к p-значению, равному 0,03.

а. Содержит ли 95%-й доверительный интервал ? Объясните.

б. Можете ли вы определить, содержится ли в доверительном интервале? Объясните.

 

3.11. Рассмотрим оценку , определенную в уравнении (3.1). Покажите, что (a) и (б) .

 

3.17. Прочитайте вставку «Гендерный разрыв в заработных платах выпускников колледжей в США» из раздела 3.5.

а. Постройте 95%-й доверительный интервал для изменения в средних почасовых зарплатах мужчин между 1992 и 2008.

б. Постройте 95%-й доверительный интервал для изменения в средних почасовых зарплатах женщин между 1992 и 2008.

в. Постройте 95% доверительный интервал для изменения в гендерном разрыве средних почасовых зарплатах между 1992 и 2008. (Подсказка: не зависит от .)

 

3.18. Это упражнение показывает, что выборочная дисперсия является несмещенной оценкой дисперсии генеральной совокупности, когда являются i.i.d. со средним и дисперсией .

а. Используйте уравнение (2.31), чтобы показать, что .

б. Используйте уравнение (2.33), чтобы показать, что .

в. Используйте результаты в (a) и (б), чтобы показать, что .

 

3.19. а. – несмещенная оценка . Является ли несмещенной оценкой ?

б. – состоятельная оценка . Является ли состоятельной оценкой ?

 







Сейчас читают про: