Хотя идея предварительного тестирования глубоко проникла в сознание исследователей, работающих в области педагогики и психологии, оно не является неотъемлемой частью истинного эксперимента. По причинам психологического порядка трудно отказаться от того,
чтобы удостовериться в «равенстве» экспериментальной и контрольной групп до введения дифференцированного режима эксперимента. Тем не менее, наиболее адекватной во всех отношениях гарантией отсутствия изначального смещения между группами является рандомизация. В рамках доверительных пределов, устанавливаемых статистической моделью, рандомизации достаточно и без предварительного тестирования. Фактически почти все агробиологические эксперименты, выдержанные в традициях работ Фишера [37, 38], выполнены без предварительного тестирования. Проводя педагогические исследования, особенно в младших классах, часто приходится испытывать методы изложения ученикам совершенно нового учебного материала, и в этой обстановке предварительное тестирование в обычном смысле слова невозможно. Точно так же при исследовании влияния доводов адвокатов на решение присяжных неуместно определять априорные оценки виновности или невиновности подсудимого. Схема 6 годится для этих случаев, а также для тех, в которых можно было бы применить планы 4 или 5, позволяющие производить подлинную рандомизацию. Вот как выглядит план 6:
R X O 1
R O2.
Хотя этот план применялся еще в 20-х годах, он не рекомендуется большинством руководств по методам исследования в педагогике. Причина этого отчасти в неумении отличить его от плана 3, а отчасти в недоверии к рандомизации как средству уравнивания. Этот план представляет собой как бы половину плана Соломона, и, как нетрудно видеть, в нем контролируется как главный эффект тестирования, так и его взаимодействие с X, но в отличие от плана 5 они не измеряются. Однако такое измерение несущественно для решения центрального вопроса о наличии эффекта X. Таким образом, хотя план 5 предпочтительнее плана 6 по упомянутым причинам, выигрыш от плана 5 может не стоить большого труда, затрачиваемого на его реализацию. Аналогично план 6 обычно лучше плана 4, если только нет оснований сомневаться в подлинности рандомизации. Эксперимент типа 6 слишком редко применяется в педагогике и психологии.
Если, как это часто бывает при проведении педагогических исследований, доступны данные, полученные до введения X, ими, разумеется, следует воспользоваться формирования блоков, определения факторных уровней или как сопутствующими переменными. Этот совет основан на двух соображениях. Во-первых, статистические модели, соответствующие плану 4, обладают большей мощностью, чем те, которые применимы для плана 6. Хотя значительные усилия, необходимые для реализации плана 4, в большинстве ситуаций делают подобный выигрыш неоправданным, положение меняется, когда нужные исходные показатели «лежат на поверхности». Во-вторых, доступность таких показателей позволяет проверить наличие взаимодействия X сначальным уровнем и тем самым составить более полное представление о возможности обобщения результатов. Правда, нечто подобное может быть выполнено и в рамках плана 6, если вместо предварительного тестирования воспользоваться другими имеющимися данными. Кроме того, для генеральной совокупности, на которую предполагается распространять выводы педагогического исследования, характерно частое тестирование. Последние два обстоятельства могут изменить ситуацию, делая план 6 предпочтительнее плана 4. Отметим также, что при заметном выбывании испытуемых между R и итоговым тестированием исходные данные в плане 4 обеспечивают больше возможностей для отклонения гипотезы о влиянии на эффект неравномерности выбывания из экспериментальной и контрольной групп.
Как бы то ни было, существует ряд проблем, применительно к которым предварительное тестирование невозможно, неуместно или легко провоцирует нежелательную реакцию испытуемых; для исследования этих проблем более приемлем план 6. Кроме упомянутого ранее изучения способов подачи нового учебного материала, можно привести много примеров, когда: 1) Х и итоговое тестирование О могут быть предъявлены учащимся или группам естественным образом в единой композиции и 2) предварительное тестирование нельзя провести должным образом. Такие ситуации часто возникают при исследовании самой процедуры тестирования — например, при сравнении эффективности различ-
ных инструкций, бланков для регистрации ответов и т. д. Это относится и к сравнению эффективности обращений о наборе добровольцев и т. д. Когда необходимо сохранить анонимность респондентов, удобнее других оказывается план 6. В таких случаях рандомизация достигается путем перетасовки материалов, подлежащих распределению среди респондентов.
Статистические модели для плана 6
Простейший способ обработки — это применение t- критерия. План 6, пожалуй, единственный, для которого он оптимален. Однако ковариационный анализ и формирование блоков по таким исходным показателям испытуемых (Underwood [129]), как успеваемость, оценки в тестах, профессия родителей и т. д., позволяют повысить мощность статистической процедуры примерно до того же уровня, что и при использовании предварительного тестирования. Идентичность предварительного и итогового тестов несущественна. Часто это различные формы «одного и того же» теста, и, следовательно, они менее идентичны, чем буквальное повторение предварительного теста. Точность возрастает с увеличением степени ковариации, и, хотя она обычно выше для эквивалентных форм «одного и того же» теста, чем для «различных» тестов, это чисто количественное различие, причем такой надежный комплексный показатель, как, скажем, средний балл успеваемости ученика, может оказаться лучше короткого предварительного тестирования. Отметим, однако, что использование среднего баллав качестве итогового показателя обычно нежелательно из-за его вероятной нечувствительности к X в сравнении с показателями, имеющими более тесную связь с содержанием и временем тестирования.
Неважно, как трактовать этот план с предварительным псевдотестированием — как план 6 или как план 4. Он обладает достоинствами плана 6, избавляя экспериментатора от проведения настоящего предварительного тестирования, от повторного применения идентичного или весьма сходного по содержанию необычного материала (как при изучении изменений социальных установок). По этим причинам оценка плана 6 в отношении реакции на эксперимент будет несколько выше, чем для
планов 4 и 5. В социальных науках в целом это преимущество еще важнее, чем в педагогических исследованиях.
Факторные планы
На концептуальной основе трех последних планов, особенно планов 4 и 6, добавляя к ним новые группы с новыми X, можно построить сложные факторные планы, типичные для фишеровской традиции. В обычном однофакторном дисперсионном анализе мы будем иметь несколько «уровней» воздействия (Х 1, Х 2, Х 3и т. д., а также, возможно, Х 0«без X»). Если отсутствие X считать одним из уровней («режимов») эксперимента Х 0, то в планах 4 и 6 будет по одной группе на каждый уровень. По плану 5 мы будем иметь две группы (прошедшую и не прошедшую предварительное тестирование) для каждого режима, так что можно провести двухфакторный дисперсионный анализ. Нам неизвестно о применении более чем двухуровневых планов, аналогичных плану 5.
Обычно, если интерес представляет влияние предварительного тестирования, применяется план 6, так как иначе требуется большое число групп. Очень часто используются две и более независимых экспериментальных переменных, каждая из которых реализуется на нескольких «уровнях», для чего требуется ряд групп: Хa 1 Хb 1, Хa 1 Хь 2, Ха 1 Хь 3 … Ха 2 Хь 1и т. д.
Разработка соответствующих планов, сопровождаемая попытками экономить, устраняя из них некоторые из возможных перестановок из Ха и Хь, породила пугающие тайны факторного планирования (рандомизированные блоки, расщепленные делянки, греко-латинские квадраты, дробные реплики, смешивание и т. п.). В результате возникла пропасть между передовыми и традиционными методами педагогического исследования. Мы надеемся перебросить мост через эту пропасть, сохраняя непрерывную связь с традиционными методами и уповая на присущий каждому здравый смысл. По-видимому, большинство идей, необходимых для понимания планирования эксперимента, легче всего понять, если рассмотреть их на материале
планов с двумя экспериментальными режимами без дополнительных усложнений. Вместе с тем полное изложение проблем традиционного характера позволит достичь понимания необходимости и роли современных подходов. Уже в связи с поисками наиболее эффективного способа обработки результатов всеми признанного старого эксперимента по плану 4 мы познакомились с необходимостью ковариационного анализа, который пока почти не использовался в этих условиях. Точно так же при обсуждении плана 5, когда в связи с необходимостью контроля за некоторыми факторами мы столкнулись с задачей двух режимов, мы отказались от t -критерия в пользу соответствующей модели дисперсионного анализа.
Здесь мы не можем вдаваться в детали статистического анализа факторных планов или хотя бы привести их примеры. Элементарные аспекты этих методов с ориентацией на исследователей в области педагогики изложены Эдвардсом [33], Фергюсоном [36], Джонсоном и Джексоном [54] и Линдквистом [68]. Надо надеяться, однако, что следующие несколько разделов позволят читателю составить себе известное представление о некоторых возможностях и трудностях, связанных с обсуждаемыми в этой главе вопросами планирования эксперимента. Мы не станем рассматривать обычные соображения по поводу использования латинских квадратов и многих других неполных планов, где ради экономии в жертву приносится информация о факторных взаимодействиях. (Однако применение латинских квадратов взамен контрольных групп, когда невозможна рандомизация, будет рассмотрено ниже — см. квазиэкспериментальный план 11.) Причина, по которой мы решили не обсуждать неполные планы, состоит в том, что подробная информация о взаимодействиях имеет прямое отношение к проблеме внешней валидности, особенно в науке, где возникают трудности с воспроизведением результатов в разных условиях (см. Wilk, Kempthorne [132]). Мы хотели бы рассмотреть в этом разделе следующие понятия: взаимодействие, нестинг и перекрестная классификация, а также конечные, фиксированные, рандомизированные и смешанные факторные модели.