Временными выборками

Эксперимент в его наиболее типичной форме пред­полагает использование эквивалентной выборки испы­туемых, чтобы получить «базовую линию», с которой сравнивается действие экспериментальной переменной. В отличие от этого рекуррентная форма эксперимента с одной группой использует две эквивалентные выборки ситуаций, в одной из которых экспериментальное воздействие имеет место, а в другой — нет. Схема та кого эксперимента имеет следующий вид (хотя предпоч­тительнее случайное, а не регулярное чередование):

Х 1 O X 0 O Х 1 O X 0 O.

Этот эксперимент можно рассматривать как разновид­ность временной серии с повторным введением экспери­ментального воздействия. Достоинства такого экспери-

_________________________________________________________________________________

1 В последнее время было разработано много приемов, которые могут быть использованы для статистической обработки результатов экспериментов по этому плану. См., например: B o x G. E. P., T i a o G. C. Intervention analysis with applications to economic and environmental problems. — «Journal of Amer. Statistical Association» 1975, v. 70, p. 70—92; B o x G. E. P., T i a o G. C. A change in level of a non-stationary time series. «Biometrica», 1965, v. 52, p. 181—192.

мента наиболее очевидны, когда ожидается, что эффект воздействия будет носить преходящий или обратимый характер. Хотя этот эксперимент может трактоваться как расширенный вариант временной серии, методика статистического анализа более сходна с обработкой ре­зультатов эксперимента, использующего две группы, в котором применяется критерий значимости различий между средними двух наборов измерений. Обычно из­менения точно совпадают с экспериментальными воз­действиями, часто сопутствуя им, как в исследованиях научения, производительности труда, выработки услов­ных связей, физиологических реакций и т. д. Среди ран­них примеров применения этого типа эксперимента, пожалуй, самыми типичными были исследования Олпорта [1] и Сорокина [105], в которых изучалась эффек­тивность деятельности учащихся в различных условиях, причем сравнивалось не наличие и отсутствие экспери­ментального воздействия, а два различных эксперимен­тальных воздействия, то есть Х 1и Х 2.В большинстве случаев простое чередование условий и использование постоянных промежутков времени нежелательны, осо­бенно если имеется опасность смешивания эффекта X с влиянием дневных, недельных или месячных циклов или когда очевидная периодичность приводит к выра­ботке нежелательной реакции на временной интервал, что в свою очередь может усилить различие между двумя воздействиями. Так, Сорокин позаботился о том, чтобы каждое из экспериментальных воздействий имело место с одинаковой частотой в утреннее и послеобеден­ное время.

В большинстве экспериментов, проведенных до сих пор по данному плану, каждое экспериментальное воз­действие повторялось сравнительно небольшое число раз. Однако тип обобщения теории выборочного иссле­дования, представленный в работе Брунсвика [9], за­ставляет обратить внимание на необходимость примене­ния больших, репрезентативных и эквивалентных случайных выборок временных интервалов. Керр [63], по-видимому, очень близко подошел к этому идеалу в своих исследованиях влияния музыки на производитель­ность труда в промышленности, В каждой серии, его опытов использовалась единственная эксперименталь­ная группа и применялись рандомизированные выборки

дней в течение каждого месячного периода. Так, в од­ном эксперименте он сравнил 56 «музыкальных» дней с 51 днем без музыки, а в другом — влияние трех раз­личных видов музыкальных произведений, каждый из которых был использован в эквивалентных выборках по 14 дней.

В том виде, в каком план 8 применялся Керром, он в целом представляется внутренне валидным. Фактор фона, самое слабое место временной серии, контроли­руется благодаря предъявлению X в большом числе отдельных случаев, что делает крайне малоправдопо­добным любое конкурентное объяснение результатов за счет одновременного действия побочных явлений. Другие источники невалидности находятся под контро­лем в силу тех же соображений, которые были подроб­но приведены для плана 7. Что касается внешней валидности, то обобщение возможно только по отношению к часто обследовавшимся популяциям. Реакция испы­туемых на эксперимент, осведомленность об экспери­ментировании — особенно уязвимое место данного плана. Если отдельные воздействия X применяются пос­ледовательно к различным группам, то испытуемые (особенно в плане 6) могут даже не подозревать, что проводится опыт и сравниваются различные воздей­ствия. Иное дело, если исследуется одна-единственная группа, для которой повторно создаются те или иные ус­ловия — например, применяется то один, то другой спо­соб расчета зарплаты, как в опытах Сорокина; или то одни, то другие условия работы, как у Олпорта; или то один, то другой вид вентиляции (Wyatt, Fraser, Stock [138]; или то один, то другой музыкальный жанр (хотя Керр принял меры предосторожности, чтобы раз­нородная программа стала естественной составной ча­стью рабочего окружения). Что касается взаимодей­ствия состава групп с X, то здесь, как и обычно, суще­ствуют ограничения в распространении обнаруженного эффекта на всю популяцию.

В плане 8 кроется риск для внешней валидности. Его можно обнаружить во всех тех экспериментах, упоминаемых в данной работе, в которых на одной и той же группе испытывается действие нескольких уров­ней X. Этот эффект был обозначен как «межуровневая интерференция X». Эффект X 1, который в простей-

шем случае сравнивается с действием Х 0,может быть распространен только на условия повторного и разде­лённого промежутками времени предъявления Х 1. Нет оснований распространять его на возможные ситуации непрерывного действия Х 1или на случаи, когда Х 1 появляется один-единственный раз. Кроме того, условие Х o, то есть отсутствие X, не типично для периодов от­сутствия X вообще. Оно репрезентативно только для отсутствия X, перемежающегося с его наличием. Если Х 1обладает некоторым последействием, распространяю­щимся на периоды без X, как это обычно представляет­ся вероятным, применение плана 8 может привести к недооценке эффекта Х 1в сравнении, скажем, с планом 6. Кроме того, сам факт частых изменений может уве­личить значение X как стимула по сравнению с тем, что было бы при непрерывном, гомогенном воздействии. Гавайская музыка в опытах Керра могла бы совсем по-иному влиять на работу испытуемых, если бы она не перемежалась с другими жанрами, а составляла посто­янный «музыкальный рацион». Эксперименты Эббингауза [32], очевидно, в основном принадлежат к этому типу, и, как отмечал Андервуд [128], установленные им законы распространяются только на тех, кто усвоил десятки других весьма сходных списков. Многие из его результатов фактически недействительны для людей, запоминающих единственный список бессмысленных слогов. Таким образом, хотя этот план эксперимента внутренне валиден, его внешняя валидность значитель­но ограничена некоторыми типами содержания (см. также Kempthorne [58, гл. 29]).

Отметим, однако, что действие многих факторов школьного обучения, представляющих интерес для экспериментального исследования, во всех практически важных отношениях ограничено временем фактическо­го присутствия X. В таких случаях данная схема может оказаться весьма ценной. Предположим, что учитель стремится выяснить значение чтения вслух по сравне­нию с индивидуальным чтением про себя. Применяя в серии уроков то один, то другой способ, он может про­вести эксперимент, результаты которого поддаются ин­терпретации. Этим путем можно исследовать и эффект присутствия кого-либо из родителей в классе во время добровольной дискуссии учеников. Знание такого плана

сделает экспериментальную проверку альтернатив до­ступной для учителя. Это позволит проводить пробные испытания методик, которые в случае положительного исхода могут быть исследованы посредством более об­ширных и более скоординированных экспериментов.

Этот подход может быть применен в отношении вы­борок ситуаций при исследовании одного испытуемого. Примером может служить рекуррентный план экспери­мента, реализуемый (обычно без проверки статистиче­ской значимости) в физиологических исследованиях, в которых животному повторно предъявляют стимулы, стремясь избежать какой бы то ни было периодичности стимуляции, что соответствует требованию рандомиза­ции, следующему из логики эксперимента. Вместо про­стой рандомизации могут также быть использованы ла­тинские квадраты (см., например, Cox [26]; Maxwell [73]).

Проверка значимости для плана 8

Для данного конкретного типа эксперимента нам опять необходима соответствующая процедура провер­ки статистической значимости экспериментального эф­фекта. Отметим, что предполагается два типа обобще­ния: по ситуациям и по испытуемым. В случае если используется лишь один испытуемый, проверка значимости эффекта, очевидно, будет ограничена обоб­щениями в отношении только данного индивида и будет предполагать обобщение ситуаций (реализации X). Для этой цели подходит t -критерий с числом степеней сво­боды, равным числу ситуаций (реализаций) минус 2. При наличии индивидуальных результатов по ряду ис­пытуемых, которым как членам одной группы предъяв­лялось одно и то же экспериментальное воздействие, данные позволяют осуществить обобщение в отношении испытуемых. В этой ситуации обычно применяются две стратегии. Ошибочная стратегия состоит в получении для каждого испытуемого по одному численному ре­зультату при каждом воздействии и затем в проверке значимости различий между средними, при использова­нии коррелированных данных. Этой логике следовали Олпорт и Сорокин, хотя они фактически не прибегали к проверке значимости эффекта. Но если каждая экспе­риментальная ситуация воспроизводится всего один или

два раза, ошибка выборки по ситуациям может быть весьма значительной или контроль фоновой стимуляции может оказаться весьма слабым. И то, что при таком способе анализа будет представляться значимым разли­чием, в какой-то мере может быть вызвано случайными ошибками выборки. Такая ошибка станет весьма серь­езной, если велик и статистически значим обучающий эффект тестирования. Так, согласно этой логике мож­но получить весьма значимые различия между Х 1и Х 2, когда каждое из этих воздействий применялось только однажды и когда одно из них совпало с появлением побочной стимуляции, оказавшей заметное влияние на результат. Поэтому важно, чтобы каждое воздействие (Х 1и Х 2 ) имело по крайней мере две реализации и тем самым были представлены степени свободы случа­ев (ситуаций), сгруппированных по данному воздей­ствию. Это требование, вероятно, легче всего удовле­творить путем первоначальной проверки значимости различия между средними для обоих воздействий, срав­нивая ее с величиной ошибки реализации каждого воз­действия. Установив таким путем значимость эффекта экспериментального воздействия, можно определить, для какой части испытуемых он имеет место, и тем са­мым получить сведения о воспроизводимости (обобщаемости) эффекта на разных испытуемых. Повторные измерения и использование выборок ситуаций ставят на повестку дня многие статистические проблемы, часть которых все еще не решена (Collier [24], Cox [26], Kempthorne [58]).

План с сериями


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: