Статистические методы являются базовым инструментарием обработки данных измерений практически во всех областях науч-
1 См.: Ратанова Т.А., Шляхта Н. Ф. Методы изучения психодиагностики личности: Учеб. пособие. — 2-е изд. — М., 2000. — С. 114—117.
ного знания. Наиболее широкое применение они получили в естественных науках, где возникла острая необходимость анализа огромного массива эмпирических данных. В сочетании с методами планирования и моделирования эксперимента статистические методы позволяют выявлять объективные закономерности при проверке различных научных гипотез.
В гуманитарных науках, таких как педагогика и психология, статистические методы прочно утвердились тогда, когда эти науки стали активно использовать эксперимент в качестве метода научного исследования, где измерениям различных параметров, факторов, признаков отводится важная роль. Правда, нельзя не отметить, что по ходу «математизации» педагогической науки не удалось избежать и определенных издержек. Некритически восприняв положение о том, что в каждой науке столько науки, сколько в ней математики, практические работники школ, методисты, дидакты пытались и отчасти пытаются сейчас формализовать буквально все элементы педагогического процесса. Например, разрабатывались методики оценки эффективности обучающих воздействий учителя на основе подсчета количества используемых технических средств обучения, плакатов, раздаточного материала, демонстраций, количества учащихся, отвечающих у доски, общего числа правильных ответов учащихся, количества выполненных упражнений, решенных задач и т. д. И в зависимости от общего числа набранных баллов давалась оценка обучающей деятельности педагога. Не случайно, что такие механистические процедуры оценки работы учителей большинством из них не были приняты в качестве рабочих средств анализа урока, поскольку развивающий эффект урока связан прежде всего с внутренними психическими процессами школьника, которые невозможно оценить через внешние формы урока и которые далеко не всегда коррелируют с внешними педагогическими воздействиями.
И все же статистические методы сегодня стали неотъемлемой частью педагогических и психологических исследований, поскольку без них при решении целого ряда исследовательских задач невозможно дать объективную интерпретацию результатов измерений. Дело в том, что психолого-педагогические измерения, выполненные с помощью различных тестов, опросников, всегда сопровождаются некоторой ошибкой, которую вызывают несовершенство диагностического инструментария (чаще всего он отражает некоторую модель изучаемого объекта, которая никогда не бывает абсолютно тождественной его сущности), различные обстоятельства, связанные с условиями проведения измерений. Поэтому результат психолого-педагогического исследования имеет вероятностный характер, следовательно, необходимо доказывать статистическую достоверность (значимость) полученных результатов. Это
й обусловило применение в педагогике и психологии статистических методик сравнения уровней исследуемых параметров, интегральных характеристик результатов измерений, мер вариации параметров и т. д. Мы рассматриваем лишь некоторые примеры использования статистических методов и процедур формализации средств обработки результатов измерений, с нашей точки зрения представляющих тот минимум, которым должен владеть педагог или психолог для грамотного проведения исследования. При решении сложных исследовательских задач, требующих применения соответствующих статистических методов (факторного, дисперсионного анализа, методик множественных сравнений и др.), необходимо обратиться к источникам, часть из которых приведена в библиографии.
Применению статистических методов предшествует этап формализации задачи (введение символьных обозначений, выбор параметров, установление порядка предположительных процедур, сравнений и т.д.). Например, при формализации объекта (предмета) исследования его определяют как некоторую модель, обладающую диагностическими признаками (параметрами, фиксируемыми с помощью измерительных процедур), при этом определяют совокупность интересующих исследователя диагностических признаков; подбирают измерительные инструменты, определяют границы вариаций, шкалы оценок; с позиций структурно-функционального подхода определяются связи и компоненты объекта (предмета) исследования.
Для разработки моделей (как сравнительных объектов) часто используют методы математического моделирования: составление уравнений, определение функций, имеющих прогностическое назначение; возможно выражение регрессионных связей или конструирование алгоритмов и т. д.
Один из наиболее распространенных методологических приемов формализации объекта исследования — это представление его в виде «черного ящика» (кибернетический подход). Предполагается, что точное поведение объекта не известно, его структурные компоненты в точности не определены, не выяснены их функции. Идея состоит в том, что варьируют факторы, влияющие на поведение объекта, и измеряют отклики (следствие экспериментального воздействия). Цель эксперимента — определить закономерность зависимости откликов от факторов-раздражителей (экспериментального влияния). Математически это можно выразить в виде функции R=f(S) [реакция есть функция от раздражителя (стимула)].
R
Функция/является предметом изучения. Определение социальных, педагогических, психологических закономерностей, отношений, зависимостей является целью психолого-педагогического исследования.
Если речь вести о педагогических исследованиях, то роль стимулов (S) играют чаще всего психолого-педагогические условия (независимые переменные): учебные программы, методики и технологии обучения, формы и методы организации учебно-воспитательного процесса, социальные проекты и т. д. Результаты экспериментального влияния (зависимые переменные) — это параметры личностного роста воспитанника, его психологическое состояние, показатели адаптированное™, социализации, здоровья, интеллекта, уровня знаний и др.
Особенностью психолого-педагогических экспериментов является влияние на ход и результаты исследования незапланированных (случайных) факторов, которые трудно поддаются контролю, регулированию и влияние которых подчас может сильно исказить результаты эксперимента, что в ряде случаев может привести к артефактам (лат. arte — искусственный + factus — сделанный, т. е. искаженный факт). В этом случае рассматривается функция R—f*(S), где/* — учитывает непланируемые факторы.
Непланируемые факторы |
•R
К непланируемым (случайным) факторам относят: субъективную позицию экспериментатора, влияющую на его действия, внешние источники, влияние на ход исследования, индивидуальные особенности испытуемых и др.
Формализация объекта исследования, планирование самого исследования должны предполагать минимизацию разности (/—/*) посредством выбора соответствующего плана эксперимента и методов профилактики артефактов. Также необходимо корректно определить типы независимых переменных (факторов) и зависимых (откликов), выбрать соответствующие измерительные инструменты и в зависимости от цели исследования, проверяемых научных гипотез выбрать статистические критерии оценки полученной исследователем информации.
Как правило, эта работа выполняется в теоретических исследованиях при обработке количественной информации, полученной в ходе эксперимента. И речь идет не только о том, чтобы наиболее наглядно представить результаты исследования: постро-
ение графиков, таблиц, диаграмм, матриц и т.д., но и о необходимости использования статистических методов для доказательства достоверности сделанных выводов.
В связи с этим нельзя обойти вниманием одно обстоятельство. Используемые методы математической обработки исходных данных не ответственны за их истинность (достоверность). Они лишь инструмент, с помощью которого можно выполнить более глубокую и основательную интерпретацию полученного экспериментального материала, результатов наблюдений, опросов. Достоверность эмпирического материала должна обеспечиваться выбором адекватных задачам исследования методов, подбором соответствующих методик и шкал измерения, строгим следованием процедуре методики измерения, тщательностью и аккуратностью проведения измерений, точностью выполнения расчетов.
Следует также заметить, что изучаемые в психолого-педагогической области процессы трудно поддаются математическому описанию и всякой формализации. Психолого-педагогические процессы сложны: они динамичны, многофакторны, иногда неповторимы, всегда замыкаются на человеке, следовательно, и выбираемые методы должны быть адекватными, соответствовать морально-этическим нормам, гуманитарным ценностям. Очевидно, далеко не все методы исследования, подходящие для естественно-научных дисциплин, могут быть использованы в гуманитарной области.
В экспериментальной педагогике и психологии приходится изучать эффективность средств, способов, условий обучения, развития, воспитания, адаптации ребенка, при этом производится сравнение различных методик, систем, моделей. Поэтому исследователю чаще всего приходится сталкиваться со сравнительным экспериментом.
Существуют различные схемы (планы) сравнительного эксперимента. Рассмотрим вариант схемы, минимизирующей влияние случайных факторов, ставящих под сомнение внутреннюю и внешнюю валидность эксперимента. Внутренняя валидность соблюдается, когда очевидно, что именно изучаемое экспериментальное воздействие привело к изменениям в данном эксперименте. Внешняя валидность соблюдается, когда очевидно, на какие ситуации, случаи, области и т.д. могут быть распространены результаты эксперимента. Д. Кэмпбелл приводит 8 факторов, угрожающих внутренней валидности.
1. Фактор фона — неконтролируемые события между началь
ным и контрольным измерениями.
2. Фактор естественного развития.
3. Эффект тестирования — влияние выполнения заданий пер
воначального тестирования на результаты следующего.
4. Инструментальная погрешность, связанная с неточностью
Измерительного инструмента.
5. Статистическая регрессия. Имеет место, когда группы отби
раются на основе крайних показателей и оценок. Известно, что
точность измерений на крайних участках шкалы снижается.
6. Фактор отбора испытуемых — неэквивалентность групп по
составу.
7. Отсев в ходе эксперимента.
8. Взаимодействие фактора отбора с естественным развитием.
Перечислим факторы, ставящие под угрозу внешнюю валидность[.
1. Реактивный эффект — увеличение или уменьшение чувстви
тельности к экспериментальному воздействию под влиянием пред
варительного тестирования.
2. Эффект взаимодействия фактора отбора и эксперименталь
ного воздействия.
3. Условия организации эксперимента, вызывающие реакцию
испытуемых на эксперимент.
4. Взаимная интерференция экспериментальных воздействий1.
Отдельно можно выделить неэкспериментальные влияния, которые могут привести к артефактам (искусственно полученным фактам).
1. Эффект плацебо, механизм которого основан на самовнуше
нии и внушении.
2. Эффект Хоторна. Стимулируются осознанные или непроиз
вольные попытки соответствовать ожиданиям исследователя.
3. Эффект Пигмалиона (эффект Розенталя) — субъективные
влияния исследователя, заинтересованного в том или ином ре
зультате.
4. Эффект аудитории —"изменение поведения испытуемых под
влиянием экспериментатора, публики.
5. Эффект первичности — зависимость оценки суждения от пер
вого впечатления2.
Предусмотреть действие всех случайных факторов в социально-педагогическом или психологическом исследовании очень сложно. Но их минимизация возможна при использовании экспериментальных планов с контрольными группами.
Предположим, что требуется изучить эффективность различных учебных программ с точки зрения формирования общелогических умений (анализа, синтеза, выделения главного, упорядочивания, определения причинно-следственных связей и т.д.). Пусть в 5 «а» классе реализуется экспериментальная программа, в 5 «б» классе (контрольной группе) — типовая программа. Контрольная группа подбирается так, чтобы обеспечить конструирование эксперимента
1 См.: Кэмпбелл Д. Т. Модели экспериментов в социальной психологии и при
кладных исследованиях. — СПб., 1996. — С. 46—47.
2 См.: Горбатов Д. С. Практикум по психологическому исследованию. — Сама
ра, 2000. - С. 24.
ро принципу единственного различия, т. е. все параметры эксперимента, за исключением указанных программ, должны быть идентичными. Независимыми переменными (факторами) в данном случае являются содержание учебных программ, методические особенности их реализации; зависимой переменной (откликом) является уровень овладения общелогическими умениями.
Цель исследования: определить степень эффективности экспериментальной программы с точки зрения формирования общелогических умений.
Задача: провести сравнение сформированности общелогических умений в экспериментальной и контрольной группах в начале и в конце эксперимента.
Формализация задачи
Вводим обозначения:
Х0э — средний уровень овладения общелогическими умениями в экспериментальной группе на начальной стадии эксперимента;
JST]3 — средний уровень овладения общелогическими умениями в экспериментальной группе на завершающей стадии эксперимента;
Х0к — средний уровень овладения общелогическими умениями в контрольной группе на начальной стадии эксперимента;
xik — средний уровень овладения общелогическими умениями в контрольной группе на завершающей стадии эксперимента.
Выбираем схему сравнений:
Устанавливаем признаки эффективности экспериментальной программы.
Я, |
Я, (Я0)
Конец
Я, |
исследования (через год)
1. Справедливость Я0 (нулевой гипотезы) при сравнении аоэ и
А"ок (отсутствие статистически достоверных различий).
2. Справедливость Я] (альтернативной гипотезы) при сравне
нии а'оэ.и Xi3 (Xi3 > Х0э) для выбранного уровня значимости ис
следования.
3. Справедливость Я: при сравнении Х1э и Х1к (Х{э > Х{к).
4. Справедливость Н\ при сравнении Х0к и Х[к (возможно Н0, так как в контрольной группе тоже формируются общелогические умения, хотя, возможно, и не столь эффективно, как в экспериментальной).
Выбираем критерий проверки статистических гипотез.
Например, при нормальном распределении признака это может быть /"-критерий Стьюдента. Для сравнения Х0э и Хъ; Х0к и J$flK -/-критерий для зависимых выборок. Для сравнения Х0э и Xi3; Х0к и xik — /-критерий для независимых выборок.
Определяем уровень требуемой статистической достоверности (уровень значимости).
Р—0,95 (или 0,99; 0,999 — в зависимости от степени ответственности выполняемой исследовательской работы и ее результатов). Уровень значимости — 0,05.
При такой схеме исследования становится ясно, что удается избежать многих угроз нарушения валидности исследования: фактора фона, естественного развития, эффекта тестирования, фактора отбора, реактивного эффекта и др.
Для профилактики артефактов могут быть использованы различные приемы. Например, рандомизация выборок (случайный отбор испытуемых), дезинформирование испытуемых (сообщение им ложных целей, гипотезы эксперимента), маскировка экспериментальных воздействий, использование метода «скрытого» эксперимента (когда испытуемые не подозревают, что участвуют в исследовании), использование «двойного слепого метода» (когда экспериментатор и испытуемые не знают, какая группа является экспериментальной, какая — контрольной), неинформированность лица, проводящего эксперимент, относительно его целей1. Выбор тех или иных методов должен соотноситься не только с их целесообразностью, но и с нравственно-этическими нормами, поскольку в социально-педагогических исследованиях очень важно не нанести урон, психологическую травму испытуемым. Условия развития личности, формирования нравственных качеств должны соблюдаться при любых экспериментах.
Проверка статистической гипотезы требует выбора статистического критерия, адекватного методике измерений и особенностям выборки. Наибольшее распространение в практике получили /-критерий Стьюдента, Г-критерий Вилкоксона, Q-критерий Розенбау-ма, <р*-критерий Фишера и др. Подробную информацию об использовании перечисленных критериев можно найти в литературе2.
1 См.: ГорбатовД.С. Указ. соч. — С. 25.
2 См.: Гласе Дж., Стенли Дж. Статистические методы в педагогике и психо
логии: Пер. с англ. / Под ред. Ю.П.Афлера. — М., 1976; Сидоренко Е.В. Методы
математической обработки в психологии. — СПб., 1996.
формирование навыков использования средств формализации лучше всего отрабатывать при проведении лабораторных работ.
Ниже — примеры лабораторных работ, которые были проведены автором в процессе изучения данного курса.