В файле приведены следующие данные

ID – номер испытуемого;

Gender – пол испытуемого;

Educ – образование испытуемого (количество лет, которые бедняга потратил на учебу);

JCAT – вид профессиональной деятельности (job category: 1 - клерк, 2 - охранник, 3 - менеджер);

Salary – зарплата в настоящий момент (тыс. долларов в год);

SAL_BEG – начальная зарплата на этой работе (тыс. долларов в год);

JTIME – трудовой стаж на данном рабочем месте (число месяцев);

PREVEX – предыдущий опыт – стаж до поступления на данную работу (число месяцев);

MINORITY – принадлежит ли испытуемый к национальному меньшинству (0 – нет, 1 – да).

 

2. Посчитайте всю ту описательную статистику, которую можно считать, для всех переменных.

2.1. Загружаем модуль описательной статистики:

Statistics ð Basic Statistics/Tables ð Descriptive Statistics ð OK

и выбираем переменные ð Variables (кнопка слева вверху) ð….

2.2. В разделе Advanced выбираем те статистики, которые нам нужны. Если надо посчитать все, можно нажать на кнопку Select all stats. В том же разделе можно выбрать доверительный интервал (Conf. limits for means, Interval), если не устраивает 95%, заданный по умолчанию.

2.3. Чтобы посчитать описательную статистику можно нажать кнопку Summary или кнопку Summary: Descriptive Statistics. Получится таблица для всех переменных со всеми статистиками.

 

3. Теперь посчитайте описательную статистику отдельно для группы мужчин и для группы женщин.

Для этого есть кнопочка Select cases – выбрать строки (справа посередине). Нажмите ее. Задайте условие Enable selection condition (включить условия выбора), а затем Include cases ð Specific, selected by. В окне By expression введите условия выбора, например, GENDER=’м’. Обратите внимание на одиночные кавычки, в которые следует заключать строковые значения!

 

Должно получиться что-то вроде этого:

 

Посчитайте описательную статистику для мужчин. Затем поменяйте условия выбора и посчитайте описательную статистику для женщин. Ответьте на вопросы:

3.1. С вероятностью 0,95 в каких пределах находится средняя зарплата женщин? А мужчин?

3.2. У кого в среднем выше зарплата?

3.3. Кто больше лет посвятил учебе?

3.4. Кто больше проработал на последнем рабочем месте? У кого больше общий стаж?

 

Не забудьте отключить условия выбора после выполнения задания!


 

4. Проверка на нормальность. Можно проверить, нормально ли распределена переменная, в разделе Normality. Для этого пометьте птичками K-S and Lilliefors test for normality и Shapiro-Wilk’s W test и нажмите на кнопку Histograms. Верху каждой гистограммы будут приведены результаты трех критериев и уровни статистической значимости для них.

K-S test – это критерий Колмогорова-Смирнова, который знают все преподаватели на факультете и на который можно смело ссылаться.

Кроме того, на гистограмме приведена кривая нормального распределения. Можно оценить нормальность распределения переменной просто визуально.

 

Проверьте, нормально ли распределены переменные: образование испытуемого; вид профессиональной деятельности; зарплата в настоящий момент; начальная зарплата на этой работе, трудовой стаж на данном рабочем месте и предыдущий опыт работы.

 

5. Ящик с усами. Находится в разделе Quick. Обратите внимание на кнопку Box & whisker plot for all variables. Выберите одну переменную (например, зарплата) и нажмите на эту кнопку. Если вы хотите построить разные ящики с усами, то можно менять условия в разделе Options ð Options for Box-Whisker Plots. Понажимайте различные условия, постройте разные ящики и догадайтесь, зачем они.

 

6. Для наглядного представления переменных часто используются графики. Построим некоторые из них для изучения возможностей программы.

6.1. Постройте круговую диаграмму для переменной GENDER (файл Empl_Data.sta):

Graphs ð 2D Graphs ð Pie Charts. Нажав на кнопку Variables,выберите переменную GENDER и нажмите кнопки ОК ð ОК. Получите пирог. Правда, красота? Попробуйте сделать пирог толстым, поменять цвет графика, шрифты и все остальное, чтобы график стал еще симпатичнее.

6.2. Постройте трехмерное распределение для двух переменных сразу.

Graphs ð 3D Sequential Graphs ð Bivariate Histograms

Теперь выберите переменные GENDER в одном из окошек и JCAT в другом. Нажмите кнопки ОК ð ОК. Вы увидите распределение мужчин и женщин по различным видам работы. Чтобы лучше рассмотреть график, щелкните два раза кнопкой мыши по фону и в появившемся окне выберите Point of View. Положение графика можно регулировать, пользуясь специальными полосами прокрутки. Добейтесь наглядного изображения распределения мужчин и женщин по видам работы и проанализируйте ситуацию. Кто захватил лучшие места?

 

Теперь постройте такое же трехмерное распределение для двух других переменных – JCAT и MINORITY. Вращая график, рассмотрите то, что получилось, и проанализируйте ситуацию. Кому живется лучше – неграм или женщинам? Попробуйте поменять цвет, шрифты, вид графика и т.д.

 

7. Сравните положение мужчин и женщин и напишите отчет в MS Word, используя таблицы и графики, которые считаете нужными. Представьте, что это курсовая работа, в которой вы изучали положение мужчин, женщин и национальных меньшинств в Штатах. Если отчет будет написан плохо – больше в Штаты не попадете!


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: