Тема 7. Характеристика неэкспериментальных методов исследования 10 страница

Сравнение числа движений, совершенных в каждые 5 сек на протяжении 30 сек работы, дает материал для заключения о силе НС. Для наглядности обычно вычерчиваются соответствующие графики. Так, нарастание темпа в первые 10-15 сек с последующим спадом до или ниже исходного (в первые 5 сек) уровня говорит о сильной НС. На графиках это отражается выпуклой кривой. Быстрый спад темпа (после первых 5 сек) и невозможность его возврата к исходному уровню указывает на слабую НС. Графики – нисходящие. Поддержание равномерного темпа все 30 сек с возможными небольшими отклонениями от начального показателя сопоставляется со средней силой НС (ровный тип графиков). Дифференцируется и промежуточный тип: среднеслабая НС. Для него характерны два варианта динамики: либо равномерность темпа на первых этапах (10-15 сек) и спад в дальнейшем, либо спад с самого начала, но кратковременный подъем в конце работы (вогнутая кривая) до исходного уровня.

Кинематометрическая методика позволяет определить уравновешенность и подвижность нервных процессов.

Определение уравновешенности НС. Уравновешенность – это соотношение возбудительных и тормозных нервных процессов. Методика базируется на известном факте, что в отсутствие зрительного контроля за своими движениями человек с преобладанием возбудительных процессов воспроизводит заданную (и сохраняемую в двигательной памяти) амплитуду движения с преувеличением (переводом), а в случае преобладания тормозных нервных процессов – с приуменьшением (недоводом). Предусматривается воспроизведение малых и больших амплитуд. Используется специальное приспособление – кинематометр, где амплитуда задается в градусной системе. Малые движения – до 20°, большие – более 55°. Повышение малых и больших амплитуд одновременно диагносцируется как преобладание возбуждения, недовод в обоих случаях сигнализирует о преобладании торможения, а превышение одних (обычно малых) и уменьшение других (обычно больших) сопоставляется с уравновешенностью.

Определение подвижности НС. Подвижность – это способность НС быстро реагировать на изменение среды путем поочередной смены процессов возбуждения и торможения. Диагноз о скорости этой смены ставится на основании легкости или трудности развития противоположного процесса. Методика использует известную закономерность: увеличение амплитуды движения вызывает у субъекта возбудительные процессы, а уменьшение – тормозные. Если чередовать в опыте приращение и убавление амплитуд, то реакции торможения и возбуждения станут препятствовать друг другу. Измеряя в этих ситуациях воспроизводимые амплитуды и вычисляя их различия, можно квалифицировать подвижность НС.

Если после прибавления амплитуды разность при убавлении становится меньшей, чем в попытках без предшествовавшего прибавления, то, значит, возбуждение еще не исчезло, так как оно препятствует убавлению амплитуд. Если эта разность увеличилась, то возбуждение сменилось торможением, убавление происходит в облегченных условиях. Если же эта разность не увеличилась и не уменьшилась, а осталась прежней, то, значит, возбуждение успело исчезнуть, а торможение еще не наступило.

Дополнительно с кинематометрической методикой в контексте психологического практикума можно ознакомиться в работах [253, 296, 402].

Методы исследования моторики

Тонометрия – метод измерения мышечного тонуса. Поскольку тонус проявляется в напряженности мышц, постольку в физическом плане мышца, находящаяся в тонусе, обладает определенной твердостью. Чем сильнее тонус, тем тверже мышца и тем больше ее сопротивляемость (как физического тела) внешнему механическому давлению. Именно на этом эффекте и зиждется этот метод. Для измерения сопротивляемости (твердости) мышц используют специальное оборудование, именуемое тонометрами. Один из наиболее простых и удобных в эксплуатации – электротонометр конструкции Ю. М. Уфлянда и О. В. Плотникова. Механическая (и основная) его часть представляет собой систему сопряженных и скользящих друг относительно друга втулок и осевых цилиндров. При нажатии концевой частью этого приспособления на исследуемую мышцу происходит взаимное перемещение втулок и цилиндров, поскольку их торцы в исходном положении не совпадают. Изменение их взаимного положения сказывается на электропоказателях конструкции, что фиксируется.подсоединенным к ней гальванометром. Шкала гальванометра проградуирована в единицах силы давления (кг). Показания гальванометра, таким образом, отражают степень напряжения (твердости) мышцы.

Измерение можно проводить для всех трех случаев проявления мышечного тонуса. «Разность между тонусом покоя и расслабления характеризует степень расслабления, а разность между тонусом напряжения и расслабления характеризует сократительные возможности мышцы» [138, с. 68].

Методика стабилографии. Предназначена для измерения спонтанной (самопроизвольной) двигательной активности (СДА). Значительное распространение стабилографические методики получили при изучении и оценке способностей к удержанию равновесия в различных позах (стоя на одной или двух ногах, сидя). Наиболее проработанной считается методика, предложенная Г. С. Гурфинкелем с соавторами [102]. Мы приводим здесь ее модифицированный вариант, вкратце изложенный в работе [296, с. 190-192].

С помощью специального оборудования в виде кресла с вмонтированными в него тензодатчиками и усилителями биопотенциалов производится регистрация колебаний тела на самописце. По полученной кривой определяются амплитуда (А, мм) и частота (f, Гц) колебаний, а также длина огибающей (L, см) за экспериментальный период (обычно 30 сек). По средним значениям амплитуды и частоты вычисляется мощность колебаний (W=Af). Показатели L и W являются энергетическими характеристиками СДА.

Спонтанная двигательная активность очень чувствительна к изменениям функционального состояния нервной системы человека и к информационным условиям его деятельности. Это дает возможность судить о реактивности человеческого организма по динамике СДА при разных физических и психических нагрузках. В данной методике измерения производятся при трех условиях нагрузки: полный покой (фон), после нескольких глубоких вдохов и после серии активных приседаний (нагр.). Динамика СДА характеризуется индексом реактивности (ИР), вычисляемым по формуле:

ИР = (f фон - f нагр) / (f фон +f нагр)-100%

Реактивность понимается как отзывчивость на внешние воздействия.

Методики измерения тремора. Чаще всего в целях диагностики функционального состояния и координационных характеристик исследуют тремор рук. Оборудование и процедура измерения имеют множество модификаций.

При измерении статического тремора наибольшее распространение получили методики, использующие тремометр Мёде в разных модификациях. С середины 60-х годов прошлого века в Ленинградском университете (ныне СПбГУ) в лаборатории комплексных исследований для изучения двигательных координации стал применяться тремометр в виде горизонтально расположенной пластины с небольшими отверстиями (от 2 до 9 мм в диаметре). В эти отверстия последовательно от меньшего к большему вводится стержень диаметром < 2 мм, удерживаемый испытуемым определенное время с инструкцией не допускать касаний стержнем краев отверстий. Регистрируется число касаний в каждом отверстии, что косвенно дает информацию и об амплитуде колебаний через учет диаметров отверстий. Число колебаний можно перевести в частоту, но помня, что регистрации подлежали не все отклонения, а только те, амплитуда которых превышала диаметр отверстий. Обычно вначале (установочный тремор) амплитуда составляет 2,0-2,5 мм, а после врабатывания (основной тремор) достигает 3,0-3,5 мм. При вынесении диагноза полученные индивидуальные данные сравниваются со среднестатистическими данными соответствующей выборки. Этот элемент является неотъемлемой частью тестовых методик, к которым, как уже говорилось, можно причислить и большинство психомоторных испытаний.

При исследовании динамического тремора используют лабиринт дорожек (например, выпиленных на пластине), по которому испытуемый как можно быстрее ведет стержень, стараясь не касаться стенок дорожки. Здесь регистрируется число касаний стенок лабиринта и время его прохождения.

Диагностике подлежат уровни эмоциональной возбудимости и координации движений. Первое оценивается по количеству (а лучше, по частоте) колебаний установочного тремора. Второе – по частоте основного статического тремора, максимальной амплитуде среднего статического тремора, точности и скорости динамического тремора. Разность количества колебаний (или частот) установочного и основного треморов рассматривается как показатель подавления тремора, по которому можно судить о способности испытуемого произвольно управлять своими движениями.

Сопоставление данных для правой и левой рук позволяет судить о степени энергетического и координационного преобладания одного из полушарий головного мозга (билатеральная асимметрия). Обычно для этого вычисляется коэффициент асимметрии по формуле:

КА = (f пр - f л) / (f пр + f л)-100%,

где f – частота колебаний тремора (как статического, так и динамического) в Гц.

Если интерес представляет влияние на тремор различных дополнительных факторов, то данные испытания следует провести для ситуаций с присутствием и в отсутствие этих факторов. К таким факторам можно отнести физические нагрузки, фармакологические воздействия, психологический стресс и т. д. Для оценки влияния этих факторов вычисляется соответствующий индекс реактивности (ИР) по формуле, аналогичной для спонтанной двигательной активности.

Понятно, что данные измерения тремора, в свою очередь, могут служить показателями физиологических психологических состояний, обусловленных действием тех или иныхдополнительных факторов.

К основным двигательным качествам человека относятся сила, быстрота, координированность, ловкость и выносливость. Это интегральные психомоторные характеристики человека, которые не следует путать с характеристиками самих движений (отдельных единичных двигательных актов или их комплексов): сила, скорость, точность, модальность (вид), координированность, темп, ритм. Охватить в беглом обзоре всю совокупность способов измерения отдельных двигательных качеств человека невозможно. Ограничимся кратким освещением только одного вида подобных методик – динамометрией.

Динамометрия при измерении мышечной силы. Динамометрия (от греч. dinamis – 'сила') – это измерение силы различных мыщц. Под силой понимается предельный уровень физического напряжения (усилия), развиваемого той или иной мышцей, группой мышц, органом или организмом в целом. В психофизиологических исследованиях измеряют силу рук, ног, пальцев, спины и т. д.

Чаще всего обращаются к измерению силы кистей рук и становой силы (сила разгибателей туловища), которые рассматривают как показатели уровня общего физического развития человека. Полученные при тестировании результаты сопоставляют со среднестатистическими данными соответствующих выборок.

В методике могут использоваться любые динамометры, в частности ручной пружинный динамометр Колена и становой динамометр аналогичной конструкции. При измерениях необходимо соблюдать постоянство позы испытуемого. Как и при измерении тремора, здесь возможно выявление билатеральной асимметрии (для кистевой силы) и определение влияния физических нагрузок на показатели силы путем вычисления соответствующих коэффициентов асимметрии КА и индексов реактивности ИР.

Динамометрия при измерении мышечной выносливости. Мышечная выносливость – это способность к поддержанию заданного уровня двигательных характеристик (силы, скорости, точности, модальности, координированности, темпа, ритма) при длительном или многократном исполнении движений. При длительном исполнении какого-либо движения говорят о статической выносливости, при многократном – о динамической выносливости. Исследование статической выносливости представляет особый интерес, поскольку она присутствует во всякой мышечной деятельности и играет в ней довольно значительную роль. Поэтому в качестве примера приведем измерение именно этого вида выносливости. Она определяется длительностью поддержания заданной силы.

В большинстве подобных методик измеряется выносливость кистевых мышц. Обычно заданный уровень силы равен 1/2 (иногда 1/3) максимальной силы. При совмещении с предыдущими опытами по измерению силы максимальный уровень уже известен. На кистевом динамометре устанавливается ограничитель на соответствующей отметке. Удержание заданного усилия даже в течение одного интервала времени достигается разной энергетической ценой, т. е. обеспечивается разными видами психофизиологической активности. Поэтому в дополнение к показателю длительности полезно добавить какой-либо показатель психофизиологической активности. Одним из таких показателей может быть частота тремора. Ее можно зарегистрировать с помощью подключенных к ручному динамометру счетчика импульсов и самописца.

Тема 8. Лекция

Тема 8. Надежность и валидность исследований в психологии.

Качество отдельных индикаторов, суммарных показателей (индексов) и шкал определяется их надежностью и валидностью.

Надежность измерения связана с его устойчивостью и воспроизводимостью. Показатель может считаться надежным в той мере, в которой полученные оценки могут быть воспроизведены на данной совокупности объектов измерения. Основной вид надежности — это надежность-повторяемость (или диахронная, ретестовая надежность). Оценка ретестовой надежности отражает результаты повторного применения одного и того же показателя (вопроса, теста) для одной и той же выборки случаев (респондентов) в разные моменты времени. Если люди отвечают на вопрос одинаково и в первом, и во втором, и во всяком последующем случае, то этот вопрос надежен. Если тест умственных способностей дает те же результаты при повторной проверке на одной и той же группе старшеклассников, то это надежный тест.

Важно отметить, что надежность инструмента измерения не отражает его точность или правильность. Скажем, если на вопрос о доходе респонденты дважды дадут совершенно идентичные ответы, завышенные на какие-нибудь 100%, мы имеем дело с абсолютно надежным, но неточным показателем. Если, в другом случае, термометр с безукоризненной надежностью показывает электрическое сопротивление кожи, у нас нет оснований говорить о правильности, адекватности измерения. Оценка надежности-повторяемости — это корреляция между результатами повторных измерений. В случае единичного вопроса-индикатора достаточно просто сопоставить ответы одной и той же группы людей, полученные в первом опросе, с ответами, данными двумя неделями или месяцем позднее, и вычислить коэффициент корреляции (см. гл. 8). На практике хорошей можно считать корреляцию 0,8 и выше.

К недостаткам оценок надежности-повторяемости следует отнести, во-первых, сложность проведения повторных замеров на больших выборках, типичных для социологии. Во-вторых, истинное значение переменной также может изменяться с течением времени, например, политические симпатии могут измениться за неделю в результате каких-то скандальных разоблачений, а зарплата — существенно возрасти за месяц из-за введения обязательного индексирования в условиях инфляции. В последнем случае перед исследователем встанет трудноразрешимая задача отделить колебания, вызванные изменением истинного значения переменной, от колебаний, связанных с надежностью показателя. Поэтому так важен еще один вид надежности — надежность-согласованность. Оценить надежность-согласованность можно лишь в том случае, если для измерения одной и той же переменной используют множество индикаторов. Зато для такой оценки достаточно однократного измерения. В психологическом тестировании, например, используют батареи тестов, нацеленных на измерение одной способности или одного личностного качества. Социологи — если они располагают достаточными средствами и техническими возможностями — используют индексы и шкалы, состоящие из множества отдельных вопросов-индикаторов.

Самый простой способ оценки надежности-согласованности — это “расщепление пополам”. Если, например, у нас есть 12 вопросов, предположительно измеряющих политическую активность, где каждому вопросу присвоен 1 балл, а максимальной политической активности соответствует суммарный индекс 12 баллов, то применяется следующая процедура:

1. Вопросы в случайном порядке разбиваются на два равных списка (по 6 вопросов в каждом) и предъявляются один раз группе испытуемых.

2. Далее подсчитывается коэффициент корреляции между результатами одних и тех же испытуемых по разным “половинам” теста: чем выше его значение, тем согласованнее оценки истинного значения политической активности, получаемые с помощью данного набора индикаторов. Не исключено, однако, что полученная таким способом оценка надежности окажется весьма чувствительной к способу “расщепления пополам”: коэффициент корреляции будет заметно меняться в зависимости от способа составления двух списков.

Еще одна элементарная процедура, позволяющая оценить надежность отдельного вопроса (высказывания, пункта шкалы), — это проверка его корреляции с суммарным баллом, т. е. с суммарным значением индекса. Если для данной группы опрошенных коэффициент корреляции между отдельным вопросом о частоте зарубежных поездок и суммарным “индексом ксенофобии” оказался равен 0,3, то можно предположить, что названный вопрос не отражает истинного значения переменной “уровень ксенофобии” и может быть исключен из опросника. Ведь строго определенная надежность — это та доля измеренного разброса оценок, которая относится к истинному разбросу значений измеряемой переменной (мы пользуемся здесь менее строгим и скорее содержательным определением, поскольку пока не обсуждали необходимые статистические понятия). Очевидно, что коррелирование с суммарным баллом — это процедура, применимая для имеющих довольно простую структуру суммарных индексов и шкал

К другим методам увеличения надежности можно отнести “отсев” иррелевантных вопросов, анализ словесной формулировки вопроса, обучение и контроль интервьюеров, совершенствование методов кодирования данных и процедур ввода.

Валидность измерения, в самом общем смысле, характеризует соответствие измерения его цели. Эмпирический показатель валиден (обоснован, правилен) в той мере, в какой он действительно отражает значение той теоретической переменной, которую предполагалось измерить. Очевидно, что нет смысла говорить о валидности какого-то индикатора самого по себе. Валидность инструмента измерения состоит в однозначности и правильности получаемых результатов относительно измеряемого свойства объектов, т. е. относительно предмета измерения. Можно сказать, что валидность определяет “чистоту” измерения теоретического конструкта. Когда измерение является непосредственным, т.е. мы можем прямо подсчитать количество эталонных единиц измеряемого свойства, и на результаты измерения влияют только случайные ошибки, надежность и валидность неразличимы, валидность инструмента измерения равна его надежности. Если мы измеряем интересующее нас свойство лишь косвенно, используя какой-то индикатор, возникает различие между надежностью и валидностью. Индикатор может обладать высокой надежностью (воспроизводимостью), но при этом измерять интересующий нас социологический конструкт недостаточно “чисто”. Уже на интуитивном уровне очевидно, что вполне надежный инструмент может измерять нечто другое, помимо интересующего исследователя качества (например, не столько политическую активность, сколько конформизм). Косвенное измерение обычно содержит и случайный, и неслучайный ошибочный компонент. Именно неслучайный компонент, включающий в себя систематическую (скоррелированную) ошибку и, реже, имеющую одну и ту же величину для каждого случая постоянную ошибку измерения, определяет валидность показателя. Характерными примерами систематической ошибки измерения в социологическом опросе или эксперименте являются уже упоминавшиеся эффекты “памяти”, социальной желательности, установки за позитивный или негативный ответы. Они влияют не только на правильность, валидность индикатора интересующей исследователя переменной, но и на правильность и обоснованность результатов анализа данных: скоррелированная ошибка измерения может воздействовать на любые статистические показатели, в том числе на показатели взаимосвязи между переменными и на оценки значимости различий между подгруппами. Иными словами, конечным итогом “пользования невалидных индикаторов могут оказаться неверные содержательные выводы.

Проблема валидности измерения — сложнейшая проблема социологической методологии. Валидное измерение — это прежде всего результат валидной модели измерения, т. е. результат обоснованной и ясной концептуализации теоретических представлений. Здесь мы опишем лишь основные виды валидности и традиционные методы валидации, т. е. установления валидности измерений.

Валидностъ по содержанию показывает, в какой мере избранные исследователем индикаторы отражают различные аспекты теоретического понятия. Иными словами, речь идет о представительности данной совокупности измерений да отношению к концептуальной структуре переменной-признака, о полноте операционализации теоретических понятий. Например, экзамен по статистике может рассматриваться как валидный инструмент измерения статистических знаний студентов, так как экзаменационные вопросы отражают содержание лекций и учебников. Однако если все вопросы относятся лишь к одному разделу прочитанного курса — скажем, к нормальному распределению, — то результаты экзамена будут отражать, например, умение студентов переводить “сырые” баллы в стандартные оценки, но ничего не скажут о знании корреляции и регрессии.

Основная процедура оценки валидности по содержанию — это суждение эксперта. В некоторых случаях связь между теоретическими понятиями и измеряющими их индикаторами столь ясна, что никакие специальные обоснования попросту не требуются: понятно, что термометр измеряет температуру. Здесь можно говорить об очевидной (иногда—лицевой, от англ. face validity) валидности показателя. Очевидная валидность тем выше, чем тождественнее понимание цели вопроса, теста или иного показателя профессионалом-социологом и неискушенным респондентом. Вопрос о частоте покупки шампуня, по всей вероятности, не содержит в себе никаких подвохов и позволяет судить именно о том типе потребительского поведения, который описан в вопросе. Однако в более сложных случаях содержательная валидность отнюдь не сводится к очевидной. Набор простых вопросов о излюбленном способе проведения досуга, предпочитаемой марке автомобиля, частоте чтения престижного журнала и т. п. может быть нацелен на измерение “стиля жизни” респондента (в данном случае измерение позволяет отнести человека к одной из номинальных категорий стиля жизни — “выживающий”, “достиженческий”, “экзистенциальный”, “социальный” и т. п.). Судить о полноте этого набора и относительной значимости вопросов для измерения понятия “стиль жизни” могут только специалисты. Основой такого экспертного суждения является теоретическое определение, концептуализация исследовательской переменной. Обычно экспертное суждение о валидности по содержанию выносится более или менее стихийно, после публикации результатов исследования. Иногда все же удается использовать более организованные процедуры — метод параллельных панелей или метод нескольких судей. В первом случае две или три последовательные панели специалистов проводят всю процедуру валидации по содержанию, т. е. сравнивают существующие дефиниции, составляют список возможных индикаторов и оценивают их репрезентативность по отношению к исследуемой концептуальной области. Если сравнение индикаторов, независимо отобранных в двух и более панелях, обнаруживает множество совпадений, можно говорить о высокой содержательной валидности.

Валидность

Едва ли не самым главным показателем, обеспечивающим достоверность получаемых в эксперименте результатов, является валидность -уверенность в том, что эксперимент измерил именно то, что исследователи хотели измерить. Здесь проблема заключается в том, что одной надёжности как характеристики достоверности знания недостаточно: «… валидность предполагает надёжность, а обратное не верно. Надёжные измерения могут не быть валидными, но валидные должны быть надёжными …»

Необходимость введения критерия валидности связана с принципиальным несоответствием реальной и идеальной экспериментальной ситуации. Так же как план всегда не соответствует реальности его осуществления, так и: «… идеальный эксперимент – мысленный образец эксперимента …» всегда не соответствует экспериментальной реальности. Для оценки и контроля этого несоответствия и вводится критерий валидности.

Валидность и надёжность – это два взаимосвязанных показателя. Если надёжность обеспечивает уверенность в истинности знания, то валидность обеспечивает уверенность в точности знания: «… чтобы измерение имело ценность для психологического исследования, оно должно обладать одновременно и надёжностью, и валидностью. Надёжность важна для формирования уверенности в том, что проводимое измерение приближает к истинному значению, а валидность важна, так как она указывает, что измеряется именно то, что вы предполагаете …» [26, с.140]; «… вопрос валидности – это вопрос точности: направлено ли исследование на изучение того, что, как предполагается, изучается с его помощью? …»

Другими словами, валидность свидетельствует о том, что исследуется (измеряется) именно, то, что было запланировано: «… измерение характеристик поведения считается валидным, если измеряют именно то, что собирались …»

Внутренняя валидность

Среди всех видов валидности наибольшую важность имеет внутренняя. Внутренняя валидность характеризует меру соответствия идеального исследования – реальному: «… соответствие реального исследования идеальному будем называть внутренней валидностью …»

В естественнонаучном эксперименте внутренняя валидность характеризует степень влияния независимой переменной и зависит от неэквивалентности и динамики состава экспериментальных групп: «… валидность внутренняя – соответствие конкретного исследования идеальному; оценивает изменение зависимой переменной, определяется влиянием независимой переменной, а не другими причинами. Внутренняя валидность зависит от систематического изменения влияния независимой и других переменных от неэквивалентности и изменения сравниваемых групп в ходе эксперимента …»

Наиболее опасную угрозу внутренней валидности представляет формальный план с отсутствием контрольной группы: «… так называемая угроза для внутренней валидности наиболее опасна при отсутствии контрольной группы …».

Способом контроля внутренней валидности является формальное планирование: «… формальное планирование направлено на выбор схемы, т.е. плана организации воздействий, при котором гарантировано выделение исследуемого отношения между X и Y. Этот план включает указание как последовательности уровней НЗП, предъявляемых испытуемому или группам испытуемых, так и числа опытов (n). План эксперимента есть также план фиксации ЗП. В зависимости от способа получения данных, т.е. в соответствии с определёнными планами, выбираются способы обработки данных …».

Поскольку валидность определяет точность проводимого исследования, постольку планирование обеспечивает валидность любо вида: «… все без исключения мероприятия по планированию психологического эксперимента должны быть направлены на обеспечение валидности в эксперименте. Валидность – степень соответствия измеряемой переменной измеряемому свойству реального объекта …»

Внутренняя валидность обеспечивает достоверность полученного в исследовании результата: «… внутренняя валидность … - достоверность утверждения, что именно манипуляция независимой переменной вызвала изменение в зависимой переменной …».

Аналогом естественнонаучной внутренней валидности в креативном эксперименте имеет место технологическая валидность. Т.е. соответствие уровня развития учащихся группе развития и соответствие группы развития применяемой образовательной технологии.

Поскольку главным средством контроля внутренней (технологической) валидности является формальное планирование, постольку в своём исследовании мы использовали несколько приёмов.

Во-первых, был использован классический план Д.Кэмпбелла с экспериментальной и контрольной группами. В качестве экспериментальной группы выступали все учащиеся, участвовавшие в экспериментальном обучении. В качестве контрольной группы выступали все остальные учащиеся.

Во-вторых, в наиболее совершенных ситуациях экспериментального обучения осуществлялся контроль состава групп развития. Для этого в течение учебного года несколько раз (4-5 раз) осуществлялась психологическая диагностика учащихся. На основании результатов диагностики и на основании экспертных оценок учителей, родителей и исследователей формировались новые группы развития.

Конструктная валидность

Наряду с внутренней валидностью, решающее значения для получения лостоверных знаний имеет конструктная валидность.

Иногда конструктная валидность определяется как мера соответствия между терминами теории и наблюдаемыми (исследуемыми) признаками явления: «… конструктная валидность … - степень соответствия между термином, используемым для обозначения класса поведения (например, агрессии), и наблюдаемыми – изменяемыми или измеряемыми – признаками поведения (например, количество угрожающих высказываний) …».

Это определение конструктной валидности фактически означает, насколько адекватны теории используемые в исследовании независимые и зависимые переменные: «… в случае экспериментальных исследований термин конструктная валидность … обозначает, насколько адекватно определяется независимые и зависимые переменные, используемые в исследовании …».

12 13 14 15 16 17 18

Подборка статей по вашей теме: