Ответы на экзамен «Математические методы в психологии»

1. Цель применения математических методов. Измерение в психологии.

Математические методыв психологиипозволяют сделатьпроцесс исследованияявлений болеечетким, структурированными рациональным, что также необходимодля обработки большого количестваэмпирических данных (их количественных выразителей), дляих обобщенияи организации в«эмпирическойкартине» исследования.
Психометриказанимается количественнымизмерениеминдивидуально-психологических особенностей.

Любое измерение производится с помощью инструмента измерения. То, что измеряется, называется переменной, то чем измеряют – инструмент измерения. Результаты измерения называются данными либо результатами (говорят «были получены данные измерения»).В психологии довольно часто приходится иметь дело с измерением. По сути дела любой психологический тест является инструментом измерения, результатом которого, чаще всего, являются числовые данные.

Измерение – операция для определения отношения одного объекта к другому. Измерение реализуется за счет приписывания объектам значений так, чтобы отношения между значениями отражали отношения между объектами. Пр.: мы измеряем рост двух людей (объект измерения - рост). Получив значения 170 и 185 см. мы можем точно сказать, что один человек выше другого. Данный вывод был получен благодаря измерению роста. Таким образом, отношение между объектами было передано с помощью чисел.

В психологии можем видеть аналогичные предыдущему примеру явления. Мы используем тесты интеллекта, чтобы получить числовое значение IQ и иметь возможность сравнить его с нормативным значением, используем тесты личности, чтобы на основе полученных чисел описать психологические особенности человека, используем тесты достижений, чтобы выяснить насколько хорошо был усвоен учебный материал. Измерением так же является подсчет количества определённых актов поведения в ходе наблюдения за испытуемыми. В случае с ростом объектом измерения был не человек, а его рост. Изучая психику человека, мы так же измеряем не его самого, а определённые психологические особенности: черты личности, интеллект, отдельные характеристики познавательной сферы и т.д. Всё, что мы измеряем - называется переменными.

Психометри́я (психометрика) — дисциплина, изучающая теорию и методику психологических измерений, включая измерение знаний, способностей, взглядов и качеств личности.

Для данных измерений необходимы данные. Которые предоставляются самими людьми, отражаются в выполнении ими различных тестов, опросников, методов самооценки, информация о личности может быть получена путем регистрации реального поведения человека в повседневной жизни; и т.д.

Без знания психометрических правил современный специалист (не только исследователь, но и практик) не может корректно применять разнообразные измерительные методы в психологии. Целесообразно разделять психометрику на «общую» и «дифференциальную». Первая устанавливает числовые соответствия между каким-то свойством стимула (например, интенсивностью света, звука) и соответствующим ощущением определенной силы (яркостью, громкостью и т. п.). Дифференциальная же психометрика выражает в количественной форме индивидуальные психологические различия между людьми. В этой второй области психометрики разработаны основные критерии качества психологического измерения — такие свойства психологических тестов, как надежность, валидность, репрезентативность. В области дифференциальной психологии психометрика является технологической основой для измерительной психодиагностики.

Главное предназначение психологических тестов – помогать в принятии решений. От диагностики эмоциональных нарушений у детей до оценки интеллекта и социальных навыков при приеме на работу. Тесты в руках квалифицированного профессионала дают возможность оценить способности и черты личности с уверенностью, недоступной невооруженному наблюдателю. Психометрия является разделом прикладной статистики. В первую очередь, эта область касается создания и валидизации измерительных инструментов, таких как опросники, тесты и методики описания (оценки) личности. Она включает в себя две основные исследовательские задачи, а именно: 1) создание инструментов и построение процедур измерения; 2) развитие и усовершенствование теоретических подходов к измерению. Те, кто занимаются психометрией, могут быть как клиническими психологами, так и специалистами в области развития или HR.

Психологический тест как объективное измерение. Объективность психологического теста означает, что первичные показатели, их оценка и интерпретация не зависят от поведения и субъективных суждений экспериментатора. Первичными называют показатели, полученные после обработки данных выполнения респондентом тестовых заданий. Выражаются первичные показатели в так называемых "сырых баллах".

Разработка заданий, процедура проведения, обработка результатов теста осуществляется согласно определенным стандартным правилам.

Добиться объективности психологического теста можно при выполнении следующих условий:

· единообразие процедуры проведения теста для получения сравнимых с нормой результатов;

· единообразие оценки выполнения теста;

определение нормы выполнения теста для сопоставления с ними показателей, полученных в результате обработки данных тестирования.

2. Шкала измерения

Тест, как инструмент измерения, накладывает свои ограничения на получаемый результат. Такое ограничение называется шкалой измерения.

Шкала измерения – ограничение типа отношений между значениями переменных, накладываемое на результаты измерений. Чаще всего, шкала измерения зависит от инструмента измерения.

К примеру, если переменной является цвет глаз, то мы не можем сказать, что один человек больше или меньше другого по этой переменной, мы так же не можем найти среднее арифметическое цвета. Если переменной является порядок (именно порядок) рождения детей в семье, то мы можем сказать, что первый ребенок однозначно старше второго, но не можем сказать на сколько он старше (отношения «больше/меньше»). Имея результаты теста интеллекта, мы можем однозначно сказать на сколько один человек интеллектуальнее другого. С.Стивенс рассматривал четыре шкалы измерения:

1. Шкала наименований - простейшая из шкал измерения. Примером шкалы такого рода может служить классификация испытуемых на мужчин и женщин, нумерация игроков спортивных команд, номера телефонов, паспортов, штрих-коды товаров. Все эти переменные не отражают отношений больше/меньше, а значит являются шкалой наименований. Числа (равно как буквы, слова или любые символы) используются для различения объектов. Отображает те отношения, посредством которых объекты группируются в отдельные непересекающиеся классы. Номер (буква, название) класса не отражает его количественного содержания.

Особым подвидом шкалы наименований является дихотомическая шкала, которая кодируется двумя взаимоисключающими значениями (1/0). Пол человека является типичной дихотомической переменной.

В шкале наименований нельзя сказать, что один объект больше или меньше другого, на сколько единиц они различаются и во сколько раз. Возможна лишь операция классификации — отличается/не отличается.

В психологии иногда невозможно избежать шкалы наименований, особенно при анализе рисунков. К примеру, рисуя дом, дети часто рисуют солнце в верхней части листа. Можно предположить, что расположение солнца слева, посередине, справа или отсутствие солнца вообще может говорить о некоторых психологических качествах ребенка. Перечисленные варианты расположения солнца являются значениями переменной шкалы наименований. Причем, мы можем обозначить варианты расположения номерами, буквами или оставить их в виде слов, но как бы мы их не называли, мы не можем сказать, что один ребенок «больше» другого, если нарисовал солнце не посередине, а слева. Но мы можем точно сказать, что ребенок, нарисовавший солнце справа однозначно не является тем, кто нарисовал солнце слева (или не входит в группу). Таким образом, шкала наименований отражает отношения типа: похож/не похож, тот/не тот, относится к группе/не относится к группе.

2. Порядковая (ранговая) шкала - отображение отношений порядка. Самой типичной переменной этой шкалы является место, занятое спортсменом на соревнованиях. Известно, что победители соревнований получают первое, второе и третье место и мы точно знаем, что спортсмен с первым местом имеет лучшие результаты, чем спортсмен со вторым местом. Кроме места, имеем возможность узнать и конкретные результаты спортсмена.

Единственно возможные отношения между объектами измерения в данной шкале – это больше/меньше, лучше/хуже. Проведя измерение в порядковой шкале нельзя узнать на сколько единиц отличаются объекты, тем более во сколько раз они отличаются.

В психологии возникают менее определенные ситуации. К примеру, когда человека просят проранжировать цвета по предпочтению, от самого приятного, до самого неприятного. В этом случае, мы точно можем сказать, что один цвет приятнее другого, но о единицах измерения мы не можем даже предположить, т.к. человек ранжировал цвета не на основе каких-либо единиц измерения, а основываясь на собственных чувствах. То же самое происходит в тесте Рокича, по результатам которого мы так же не знаем на сколько единиц одна ценность выше (больше) другой. Т.е., в отличие от соревнований, мы даже не имеем возможности узнать точные баллы различий.

3. Интервальная шкала - помимо отношений указанных для шкал наименования и порядка, отображает отношение расстояния (разности) между объектами. Коэфициент интеллекта, результаты теста FPI, шкала градусов цельсия – всё это интервальные шкалы. Разности между соседними точками в этой шкале равны. Большинство психологических тестов содержат нормы, которые и являются образцом интервальной шкалы. Ноль в них условный: для IQ и FPI ноль – это минимально возможный балл теста (очевидно, что даже проставленные наугад ответы в тесте интеллекта, позволят получить какой-либо балл отличный от нуля). Если бы мы не создавали условный ноль в шкале, а использовали реальный ноль как начало отсчета, то получили бы шкалу отношений, но мы знаем, что интеллект не может быть нулевым.

Не психологический пример шкалы интервалов — шкала градусов Цельсия. Ноль здесь условный — температура замерзания воды и существует единица измерения — градус Цельсия. Хотя мы знаем, что существует абсолютный температурный ноль - это минимальный предел температуры, которую может иметь физическое тело, который в шкале Цельсия равен -273,15 градуса. Таким образом, условный ноль и наличие равных интервалов между единицами измерения являются главными признаками шкалы интервалов.

Измерив явление в интервальной шкале, мы можем сказать, что один объект на определенное количество единиц больше или меньше другого.

4. Шкала отношений. С помощью таких шкал могут быть измерены масса, длина, сила, стоимость (цена), т.е. всё, что имеет гипотетический абсолютный ноль. В отличие от шкалы интервалов может отражать то, во сколько один показатель больше другого. Шкала отношений имеет нулевую точку, которая характеризует полное отсутствие измеряемого качества. Данная шкала допускает преобразование подобия (умножение на константу). Определение нулевой точки - сложная задача для психологических исследований, накладывающая ограничение на использование данной шкалы.

3. Переменные.

Переменными являються характеристики людей или вещей, например, вес, возраст, время реакции, беглость чтения, количество детей, число студентов. Некоторые из этих переменных:

непрерывны – измерения их могут дать любое значение внутри некоторой области (вес, возраст, время реакции). Некоторые – дискретны – их изменения могут давать только отдельные значения (количество детей). Наиболее дискретны те переменные, что измеряются в результате счета, количество детей: 1,2,3… И эта переменная не может принимать значения промежуточное, типа 1,75.

Если бы были соответствующие приборы, средства, время, то можно было бы измерять непрерывные переменные с желаемой точностью. Время бега измеряется в десятых секунды, хотя более точно было бы в сотых, тысячных, но и это не точно, просто верно до сотых, тысячных.

Точного (настоящего) измерения переменной никогда нельзя достигнуть, т.к. измерение всегда должно где-то оборвать точное значение (т.к. м.б.нестабильно во времени). В силу этого точное значение переменной – это косвенное значение. Оно задает пределы для фактического значения и является результатом процесса измерения. Пр.: если рост чела 157см с точностью до сантиметра, то его действительный рост в это время и в этих условиях находится между 156,5 и 157,5 см.

Измерение любой непрерывной переменной должно сопровождаться определением точности процесса измерения. Пр.: Скорость – до десятой доли сек, рост до см, возраст с точностью до дня.

Чувствительность процесса измерения задается минимальной ед цифровой шкалы, которая фиксируется. Т.О. чувствительностью в Пр., были соответственно десятые доли секунды, сантиметры, дни.

Пределы, для точного значения в окрестности любого найденного значения, устанавливаются путем прибавления и вычитания половины чувствительности измерительного процесса от найденного значения. 147 см – (1см/2)=146,5 и 147 см + (1см/2)=147,5 см. (Если с возрастом 25лет, то 24г. И 6 мес, 25 л. И 6 мес; с реакцией в 0,53 сек: 0,525-0,523; время пробега 5,6сек: 5,5-5,7сек).

Также, например, в психологии, в тесте школьника на «речевые способности школьника» ответил правильно 45 вопр из 90, то точная отметка школьника лежит между 44,5-45,5; т.к. измеряется непрерывная величина: речевые способности школьника, а не дискретная: число точных ответов.

Категориальные переменные (качественные)- Переменные, принимающие значения из некоторого ограниченного набора категорий. Они обычно связаны с неисчисляемыми признаками, такими как названия (товаров, услуг и др.), имена людей, исходы событий (да/нет) и т.д. Категориальными всегда являются выходные переменные (Переменная, значение которой формируется на выходе аналитической модели) в классификационных моделях.

Как правило, значения категориальных переменных являются строковыми. Но иногда могут использоваться и числа, если, например, некоторое наименование кодируется числовым значением. Например, вместо категорий «Низкий», «Средний» и «Высокий» в модели оценки кредитного риска можно использовать значения 0, 1 и 2. Очевидно, что применять обычные математические операции к категориальным переменным нельзя (кроме «равно» - «не равно»), даже если они представлены числами.

Нечисловые статистические данные — это категоризованные данные, вектора разнотипных признаков, бинарные отношения, множества, нечеткие множества и др. Их нельзя складывать и умножать на коэффициенты. Поэтому не имеет смысла говорить о суммах нечисловых статистических данных. Они являются элементами нечисловых математических пространств (множеств). Математический аппарат анализа нечисловых статистических данных основан на использовании расстояний между элементами (а также мер близости, показателей различия) в таких пространствах.

Дихотомические переменные - Переменная, которая может принимать только два значения; например, мужской/женский.

4. Мартица.

Ма́трица — математический объект, записываемый в виде прямоугольной таблицы элементов кольца или поля (например, целых или комплексных чисел), которая представляет собой совокупность строк и столбцов, на пересечении которых находятся её элементы. Количество строк и столбцов матрицы задают размер матрицы.

Матрица «объекты × признаки» является стандартным и наиболее распространённым способом представления исходных данных в задачах классификации и регрессии. Подавляющее большинство методов обучения приспособлены к обработке именно таких данных. Когда определенному объекту соответствует определенный признак. Например, матрица для мнк в регрессии выглядит так, где у – объект, например, а х – признаки; строчек столько же сколько и наблюдений, а столбцов столько же сколько и наблюдений, каждый столбец это то что находится при коэффициенте.

Определитель матриц – является многочленом от элементов квадратной матрицы (то есть такой, у которой количество строк и столбцов равно). В общем случае матрица может быть определена над любым коммутативным кольцом, в этом случае определитель будет элементом того же кольца.

Куб Кеттела. Описание: Разграничение представленных возможных вариантов внедрения теста куб данных Кеттелла даёт возможность брать этапы заданий высшей сложности. Из всего возможного комплекса диагностических средств, данный тест наиболее популярный профессиональный механизм универсального исследования. К этому разделу использования склоняются в основном при коллективном, а так-же скрининг тестировании сразу нескольких личностных характеристик. В то время как, и в области более точной обработки данных или корректирующего практикума вновь, этот тест доминирует чаще других. Например, тестовые опросники: EPQ Айзенка, Ч.Спилбергера, CАH, УCK, А.Баса-Дарки находятся в той же группе.

Подход Кеттела Опросник Кеттела является одним из наиболее распространенных анкетных методов оценки индивидуально-психологических особенностей личности как за рубежом, так и у нас в стране. Он разработан по руководством Р.Б. Кеттела и предназначен для написания широкой сферы индивидуально-личностных отношений.

Отличительной чертой данного опросника является его ориентация на выявление относительно независимых 16 факторов (шкал, первичных черт) личности. Данное их качество было выявлено с помощью факторного анализа из наибольшего числа поверхностных черт личности, выделенных первоначально Кеттелом. Каждый фактор образует несколько поверхностных черт, объединенных вокруг одной центральной черты.

Существует 4 формы опросника: А и В (187 вопросов) и С и Д (105 вопросов). В России чаще всего используют формы А и С. Наибольшее распространение опросник получил в медицинской психологии при диагностике профессионально важных качеств, в спорте и научных исследованиях.

Опросник Кеттела включает в себя все виды испытаний – и оценку, и решение теста, и отношение к какому-либо явлению.

Перед началом опроса испытуемому дают специальный бланк, на котором он должен делать определенные пометки, по мере прочтения. Предварительно дается соответствующая инструкция, содержащая информацию о том, что должен делать испытуемый. Контрольное время испытания 25-30 минут. В процессе ответов на вопросы экспериментатор контролирует время работы испытуемого и, если испытуемый отвечает медленно, предупреждает его об этом. Испытание проводится индивидуально в спокойной, деловой обстановке.

Предлагаемый опросник состоит из 105 вопросов (форма С) на каждой из которых предлагается три варианта ответов (a, b, c). Испытуемый выбирает и фиксирует его в бланке ответов. В процессе работы испытуемый должен придерживаться следующих правил: не терять времени на обдумывание, а давать пришедший в голову ответ; не давать неопределенных ответов; не пропускать вопросов; быть искренним.

Вопросы группируются по содержанию вокруг определенных черт, выходящих в конечном итоге к тем или иным факторам.

Обработка результатов ведется по специальному ключу, где даны номера вопросов и количество баллов, которые получают ответ a, b, c в каждом вопросе. В тех клеточках, где проставлена буква, обозначающая фактор, количество баллов равно нулю. Таким образом, за каждый ответ испытуемый может получить 2, 1 или 0 баллов. Количество баллов по каждому фактору суммируется и заносится в бланк ответов (в правый столбик), экспериментатор получает профиль личности по 16-ти факторам в сырых оценках. Эти оценки переводятся в стандартные (стены) по таблице 3. Затем экспериментатор определяет какое развитие получил каждый фактор: низкая, средняя, высокая, выписывает черты, характеризующие степень их развития и анализирует результаты. Если какая – либо из черт вызывает сомнение, лучше ее не включать в характеристику.

Чтобы результаты были надежными, следует подтвердить их с помощью других методик или с помощью другой формы этого же теста.

Результаты применения данной методики позволяют определить психологическое своеобразие основных подструктур темперамента и характера. Причем каждый фактор содержит не только качественную и количественную оценку внутренней природы человека, но и включает в себя ее характеристику со стороны межличностных отношений. Кроем того, отдельные факторы можно объединить в блоки по трем направлениям:

1. Интеллектуальный блок: факторы: В – общий уровень интеллекта; М – уровень развития воображения; Q 1 – восприимчивость к новому радикализму.

2. Эмоционально-волевой блок: факторы: С – эмоциональная устойчивость; О – степень тревожности; Q 3 – наличие внутренних напряжений; Q 4 – уровень развития самоконтроля; G – степень социальной нормированности и организованности.

3. Коммуникативный блок: факторы: А – открытость, замкнутость; Н – смелость; L – отношение к людям; Е – степень доминирования – подчиненности; Q 2 – зависимость от группы; N – динамичность.

До некоторой степени эти факторы соответствуют факторам экстраверсии -интраверсии и нейтротизма по Айзенку, а так же могут быть интерпретированы с точки зрения общей направленности личности: на задачу, на себя, на других. В связи с этим, данную методику можно применять в сочетании с исследованием темпераментных особенностей личности по Айзенку (57 вопросов) и методикой Смекала и Кучера, адаптированной Пейсаховым, на выявление общей направленности личности.

Кубическая модель структуры интеллекта. Наибольшее число характеристик, лежащих в основе индивидуальных различий в интеллектуальной сфере, было названо Дж.Гилфордом. Согласно теоретическим представлениям Гилфорда, выполнение любой интеллектуальной задачи зависит от трех компонентов – операций, содержания и результатов.

Операции представляют собой те умения, которые человек должен проявить при решении интеллектуальной задачи. От него может потребоваться понимание той информации, которая ему предъявляется, ее запоминание, поиск правильного ответа (конвергентная продукция), нахождение не одного, а многих ответов, одинаково соответствующих имеющейся у него информации (дивергентная продукция), и оценивание ситуации в терминах правильный-неправильный, хороший-плохой.

Содержание определяется формой подачи информации. Информация может быть представлена в зрительной форме и в слуховой, может содержать символический материал, семантический (т.е. представленный в словесной форме) и поведенческий (т.е. обнаруживаемый при общении с другими людьми, когда по поведению других людей необходимо понять, как правильно реагировать на действия окружающих).

Результаты – то, к чему в итоге приходит человек, решающий интеллектуальную задачу, могут быть представлены в виде единичных ответов, в виде классов или групп ответов. Решая задачу, человек может также найти соотношение между разными объектами или понять их структуру (систему, лежащую в их основе). Он может также преобразовать конечный результат своей интеллектуальной деятельности и выразить его совершенно в другой форме, нежели та, в которой давался исходный материал. Наконец, он может выйти за рамки той информации, которая ему дана в тестовом материале, и найти значение или скрытый смысл, лежащий в основе этой информации, что и приведет его к правильному ответу.

Сочетание этих трех компонентов интеллектуальной деятельности – операций, содержания и результатов – образует 150 характеристик интеллекта (5 видов операций умножить на 5 форм содержания и умножить на 6 видов результатов, т.е. 5x5x6= 150). Для наглядности Гилфорд представил свою модель структуры интеллекта в виде куба, что и дало название самой модели. Каждая грань в этом кубе является одним из трех компонентов, а весь куб состоит из 150 маленьких кубиков, соответствующих разным интеллектуальным характеристикам (см.рис.П.) Для каждого кубика (каждой интеллектуальной характеристики) могут быть, как считает Гилфорд, созданы тесты, которые позволятэту характеристику диагностировать. Например, решение словесных аналогий требует понимания словесного (семантического) материала и установления логических связей (взаимоотношений) между объектами. Определение, что неправильно изображено на картинке (рис. 12), требует системного анализа материала, представленного в зрительной форме, и его оценки. Проводя почти 40 лет факторно-аналитические исследования, Гилфорд создал тесты для диагностики двух третей теоретически определенных им интеллектуальных характеристик и показал, что можно выделить, как минимум, 105 независимых факторов (GuilfordJ.P.,1982). Однако взаимная независимость этих факторов постоянно подвергается сомнению, а сама идея Гилфорда о существовании 150 отдельных,не связанных друг с другом интеллектуальных характеристик, не встречает сочувствия у психологов, занимающихся исследованием индивидуальных различий: они согласны с тем, что все многообразие интеллектуальных характеристик нельзя сводить к одному общему фактору, но составление каталога из полутора сотен факторов представляет собой другую крайность. Необходимо было искать способы, которые помогут упорядочить и соотнести друг с другом разнообразные характеристики интеллекта.

Возможность сделать это виделась многими исследователями в нахождении таких интеллектуальных характеристик, которые бы представляли собой промежуточный уровень между общим фактором (фактором g) и отдельными рядоположенными характеристиками (такими, как те, которые выделяли Терстон и Гилфорд).

Гиперкуб данных содержит одно или более измерений и представляет собой упорядоченный набор ячеек (Рис. 1). Каждая ячейка определяется одним и только одним набором значений измерений - меток. Ячейка может содержать данные - меру или быть пустой.

Под измерением будем понимать множество меток, образующих одну из граней гиперкуба. Примером временного измерения является список дней, месяцев, кварталов. Примером географического измерения может быть перечень территориальных объектов: населенных пунктов, районов, регионов, стран и т.д.

Для получения доступа к данным пользователю необходимо указать одну или несколько ячеек путем выбора значений измерений, которым соответствуют необходимые ячейки. Процесс выбора значений измерений будем называть фиксацией меток, а множества выбранных значений измерений - множеством фиксированных меток.

В SPSS:Матрица данных. Предположим, что 30 анкет были заполнены следующим образом:

fragebnr Sex age party  
  W-001 женский   ХДС/ХСС
  W-002 мужской   СДПГ
  W-003 мужской   сдпг
  W-004 женский   ХДС/ХСС

Приведенная выше таблица называется матрицей данных. Данные, предназначенные для обработки в SPSS для Windows, должны быть представлены в виде такой матрицы. Матрица данных состоит из определенного числа строк и столбцов. Строки и столбцы образуют прямоугольную таблицу. При этом каждая строка соответствует одной анкете, а каждый столбец — одной переменной. Так как в нашем небольшом опросе участвовало 30 респондентов, матрица содержит 30 строк. Каждая строка включает четыре столбца для переменных fragebnr, sex, age и party.

Мы предполагаем, что опрос проводился как в старых, так и в новых федеральных землях. Опрашивающие должны были отмечать это с помощью буквы перед номером анкеты. Буква "W" с дефисом должна была обозначать старые федеральные земли (West), а буква "О" — новые (Ost). Например, W-001 означает первую анкету, которая была заполнена в старых федеральных землях, а О-005 — пятую анкету, которая была заполнена в новых федеральных землях.

Схема статистического анализа данных: ген совокупность – выборка – матрица данных – анализ данных – выводы

Анализируя выборки мы делаем выводы о ген совокупностях, представленных выборками.

4. Основные этапы статистического исследования

Процесс статистического исследования состоит из шести этапов (Малхотра).

Этап 1. Определение проблемы Первый этап любого статистического исследования заключается в выяснении пробле­мы. При ее определении исследователь должен принимать во внимание цель исследования, соответствующую исходную информацию, какая информация необходима и как она будет использована при принятии решения. Определение проблемы включает в себя ее обсуждение с лицами, принимающими решения (топ-менеджерами), интервью с экспертами в данной сфере бизнеса, анализ вторичных данных и. возможно, проведение отдельных каче­ственных исследований, например фокус-групп. Как только проблема точно установлена, можно разрабатывать план статистического исследования и приступать к его проведению.

Этап 2. Разработка подхода к решению проблемы Разработка подхода к решению проблемы включает в себя формулировку теорети­ческих рамок исследования, аналитических моделей, поисковых вопросов, гипотез, а также определение факторов, которые могут влиять на план исследования. Этот этап характеризуется следующими действиями: обсуждение с руководством компании-клиента и экспертами по данной сфере, изучение ситуаций и моделирование, анализ вторичных дан­ных.качественные исследования и прагматические соображения.

Этап 3. Разработка плана исследования План статистического исследования детализирует ход выполнения процедур, необхо­димых для получения нужной информации. Он необходим для того, чтобы разработать план проверки гипотез, определить возможные ответы на поисковые вопросы и выяс­нить, какая информация необходима для принятия решения. Проведение поискового исследования, точное определение переменных и определение соответствующих шкал для их измерения — все это тоже входит в план статистического исследования. Необходимо опре­делить.каким образом должны быть получены данные от респондентов (например, проведе­ние опроса или эксперимента). Одновременно необходимо составить анкету и план выбо­рочного наблюдения. Более строго разработка плана статистического исследования состоит из следующих этапов.

1. Анализ вторичной информации.

2. Качественные исследования.

3. Сбор количественных данных (опрос, наблюдение и проведение эксперимен­тов).

4. Измерение и методы шкалирования.

5. Разработка анкеты.

6. Определение размера выборки и проведение выборочного наблюдения.

7. План анализа данных.

Этап 4. Полевые работы или сбор данных Сбор данных осуществляется персоналом по проведению полевых работ, которые ра­ботают либо в полевых условиях, как в случае личного интервьюирования (в домах по место­жительства.в местах покупок или с помощью компьютера), либо нз офиса с помощью теле­фона (телефонное или компьютерное интервьюирование), либо по почте (традиционная поч­та и почтовые панельные исследования с предварительно выбранными семьями), либо с по­мощью электронных средств (электронная почта или Ьнете^. Надлежащий отбор, обучение, контроль н опенка сотрудников, принимающих участие в полевых работах, минимизирует ошибки при сборе данных.

Этап 5. Подготовка данных и их анализ Подготовка данных включает в себя редактирование, кодирование, расшифровку и проверку данных. Каждая анкета или форма наблюдения проверяются или редактируются н. если необходимо, корректируются. Каждому ответу на вопрос анкеты присваиваются число­вые или буквенные коды. Данные анкет расшифровываются или набиваются на магнитной

ленте или на диске нлн вводятся непосредственно в компьютер. Проверка дает возможность удостовериться, что данные с оригиналов анкет расшифрованы точно. Для анализа данных используются одномерные методы статистического анализа в том случае, если элементы вы­борки измеряются по одному показателю, нлн когда имеется несколько показателей, но каж­дая переменная анализируется отдельно. С другой стороны, если имеется два или более из­мерений каждого элемента выборки, а переменные анализируются одновременно, то для анализа данных используются многомерные методы.

Этап б. Подготовка отчета и его презентация Ход н результаты статистических исследований должны быть изложены письменно в виде отчета, в котором четко обозначены конкретные вопросы исследования, описан метод и план исследования, процедуры сбора данных и их анализа, результаты и выводы. Получен­ные выводы должны быть представлены в виде, удобном для использования при принятии управленческих решений. Кроме того, руководству компании-клиента должна быть сделана и устная презентация с использованием таблиц, цифр и диаграмм, чтобы повысить доходчи­вость и воздействие на аудиторию.

6.SPSS

SPSS «StatisticalPackagefortheSocialSciences» является самой распространённой программой для обработки статистической информации. В настоящем разделе описан путь этой программы к такому выдающемуся успеху. Затем приведен обзор отдельных модулей программы.

В отличие от Экселя не имеет столбиков и строк. Первая страница:

- данные

- признаки

Редактор данных это приложение, напоминающее электронную таблицу. Под электронной таблицей подразумевается рабочий лист, разделенный на строки и столбцы, который позволяет про сто и эффективно вводить данные. Отдельные строки таблицы соответствуют отдельным наблюдениям. Например, при обработке данных опроса одна строка содержит данные одного респондента. Отдельные столбцы соответствуют отдельным переменным. При обработке данных наблюдений анкеты в одной переменной хранятся ответы на отдельный вопрос. Отдельные ячейки таблицы содержат значения переменных для каждого отдельного наблюдения; в каждой ячейке хранится одно значение переменной.

3.4.1 Определение переменных Начнем с определения переменных. Переменную можно определить следующим образом:

· В редакторе данных дважды щелкните на ячейке с надписью var или щелкните на ярлычке Variable view (Просмотр переменных) на нижнем краю таблицы.

В обоих случаях вы перейдете в режим просмотра переменных, который обеспечивает редактор данных (см. рис. 3.2). Здесь мы можем последовательно, строка за строкой определить необходимые переменные.

Имя переменной Чтобы задать имя переменной, поступите следующим образом:

· Введите в текстовом поле Name (Имя) выбранное имя переменной. В нашем примере мы сначала определим переменную fragebnr. Для этого введите в поле Name текст "fragebnr".

При выборе имени переменной следует соблюдать определенные правила:

· Имена переменных могут содержать буквы латинского алфавита и цифры. Кроме того, допускаются специальные символы _ (подчеркивание),. (точка), а также символы @ и #. Не разрешаются, например, пробелы, знаки других алфавитов и специальные символы, такие как!,?," и *.

· Имя переменной должно начинаться с буквы.

· Последний символ имени не может быть точкой или знаком подчеркивания (_).

· Длина имени переменной не должна превышать восьми символов.

Рис. 3.2: Редактор данных: просмотр переменных

· Имена переменных нечувствительны к регистру, то есть прописные и строчные буквы не различаются.

Примеры допустимых имен переменных:

budget99

gender

zarplata

quest_13

var3_1_2

Примеры недопустимых имен переменных:

1nа1 Имя начинается не с буквы
Assignment Имя длиннее 8 символов
Прибыль Имя содержит символы другого алфавита
State 94 Имя содержит пробел
None! Символ "!" не разрешается

· Нажмите на клавишу <Таb>, чтобы подтвердить ввод и перейти к установке типа переменной.

Тип переменной Как видно из электронной таблицы, вновь созданные в SPSS переменные по умолчанию являются численными с максимальной длиной восемь знаков, причем дробная часть состоит из двух знаков (формат F8.2).

• Если требуется изменить тип переменной, щелкните в ячейке на кнопке с тремя точками:

Откроется диалоговое окно Define Variable Type (Определение типа переменной). Рис. 3.3: Диалоговое окно Define Variable Type (для численной переменной)

В SPSS существуют следующие типы переменных:

Numeric (Численный) К допустимым значениям относятся цифры, перед которыми стоит знак плюс или минус и десятичный разделитель. Знак плюс перед числом, в отличие от минуса, не отображается. В текстовом поле Length (Длина) задается максимальное количество знаков, включая позицию для десятичного разделителя. В текстовом поле Decimals (Десятичные разряды) вводится количество отображаемых знаков дробной части.
Comma (Запятая) К допустимым значениям относятся цифры, перед которыми стоит знак плюс или минус, точка, как десятичный разделитель и одна или несколько запятых в качестве разделителей групп разрядов. Если запятые опускаются при вводе, они вставляются автоматически. Длина такой переменной равна максимальному количеству знаков, включая десятичный разделитель и запятые между группами разрядов.
Dot (Точка) К допустимым значениям относятся цифры, перед которыми стоит знак плюс или минус, запятая, как десятичный разделитель и одна или несколько точек в качестве разделителей групп разрядов. Если точки опускаются при вводе, они вставляются автоматически.
Scientific notation (Экспоненциальное представление) При вводе данных разрешаются все допустимые численные значения, включая экспоненциальное представление, о котором свидетельствует содержащаяся в числе буква Е или D, а также знак плюс или минус.
Date (Дата) Допустимые значения — дата и/или время.
Dollar (Доллар) К допустимым значениям относятся: знак доллара, точка, как десятичный разделитель и запятые, как разделители групп разрядов. Если знак доллара или запятые опускаются при вводе, они вставляются автоматически.
Special currency (Специальная валюта) Пользователь может задавать собственные форматы валюты. В поле Length в этом случае задается максимальное количество знаков, включая все знаки, заданные пользователем. Обозначение валюты при вводе не указывается; оно вставляется автоматически.
String (Строка) Строка символов. К допустимым значениям относятся: буквы, цифры и специальные символы. Различаются короткие и длинные строковые переменные. Короткие строковые переменные могут содержать не более восьми знаков. В большинстве процедур SPSS применение длинных строковых переменных ограничивается или вообще не допускается.

При вводе и выводе данных надо учитывать следующие особенности:

· Численные форматы: В численных форматах десятичным разделителем может быть либо точка, либо запятая. Тип десятичного разделителя зависит от настроек диалогового окна Язык и стандарты (Regional Settings) на панели управления Windows. Точное значение переменной хранится внутри программы, а Редактор данных отображает на экране лишь заданное число десятичных разрядов. Значения, которые имеют больше десятичных разрядов, округляются. Для вычислений применяется точное значение.

· Строковые форматы: В длинных строковых переменных значения дополняются пробелами до максимальной длины. Например, в строковой переменной длины 10 значение "SPSS" хранится внутри программы как "SPSS

· Форматы даты и времени: В форматах даты в качестве разделителей между значениями дня, месяца и числа могут применяться косая черта, дефис, пробел, запятая или точка. Можно выбрать один из нескольких форматов даты (dd-mm-yyyy, dd-mmm-yy, mm/dd/yyyy и т.д.). Дата в формате dd-mmm-yy отображается с разделителем-дефисом и сокращением названия месяца из трех букв. Дата в форматах dd/mm/yy и mm/dd/yy отображается с разделителем-косой чертой и номером месяца вместо названия.

· Всего доступно 27 различных форматов даты и времени, которые отображаются в разворачивающемся списке. В форматах времени в качестве разделителей между значениями часов, минут и секунд могут использоваться двоеточие, точка или пробел.

· Специальная валюта: Форматы отображения валюты ССА, ССВ, ССС, CCD и ССЕ задаются с помощью вкладки Currency (Валюта), которая открывается командой меню Edit (Правка) Options... (Параметры...)

· Установите для переменной fragebnr тип String и длину пять символов и щелкните на кнопке ОК.

Рис. 3.4: Диалоговое окно Define Variable Type (для строковой переменной).

Переменная fragebnr получила строковый тип. С такими переменными нельзя выполнять никаких вычислительных операций, но можно проводить, например, подсчеты повторяемости. Кроме того, становится возможным ввод букв, например, "W" для старых федеральных земель и "О" — для новых. Мы выбрали длину пять символов, чтобы можно было кодировать до 999 анкет для обеих групп земель. В этом случае для анкет в старых федеральных землях можно будет задавать номера анкет от "W-001" до "W-999", а для новых федеральных земель — от "О-001" до "О-999".

· Нажмите клавишу <ТаЬ>, чтобы перейти к установке формата столбца.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: