Творческий экзамен посредством защиты проекта

по дисциплине Статистический анализ

Проект предлагается рассматривать в качестве итога изучения прикладного курса СА, а также способа оценки результативности учебной исследовательской работы (УИРС) как междисциплинарного связующего звена между естественно-научными, профессиональными и специальными дисциплинами.

На защиту выносится следующее положение:

Важнейшие проблемы в управлении материальными системами связаны со своевременным принятием правильных решений в связи с меняющимися условиями функционирования систем (объектов). Если возникающие ситуации поддаются формализации (представлению в математической форме), то варианты наиболее целесообразных рекомендаций по управлению системой

могут быть получены из анализа результатов моделирования.

Цель проектной работы – самостоятельное исследование конкретной задачи (вопроса) предметной области на основе системного подхода (как методологии) и применения универсальных методов многомерного статистического анализа (как инструментария).

Возможные предметные области исследования: социально-экономическая сфера; информационная система; учебно-образовательный процесс; здравоохранение; любые научные направления (биология, психология, валеология и т.п.). Уровень исследования: отдельный объект, город, область, регион, отрасль, республика, страна.

Задачи проектной работы (подготовки к творческому экзамену:

× формирование фундаментальных понятий об общих закономерностях процессов обработки информации различной природы измерения;

× ознакомление с культурой анализа данных в процессе обработки результатов научно-технических экспериментов в информационных системах (ИС);

× овладение методологией построения и применения математического обеспечения в ИС для анализа (оценивания, прогнозирования) процессов и объектов различных предметных областей с целью обеспечения информационной поддержки принятия организационно-управленческих решений, планирования и прогнозирования в различных сферах и уровнях хозяйственного механизма (в условиях рынка);

× углубление теоретических знаний о проблеме оценивания состояний систем различной физической природы и направлениях решения этой проблемы;

× развитие системного взгляда на вопросы информатизации в Казахстане в частности и в мире в целом.

Функции проектной работы ( цели защиты проекта с позиции студентов):

демонстрация:

× знания основных принципов планирования эксперимента;

× знания существующих математических методов и моделей, применяемых при анализе, планировании и прогнозировании процессов любой физической природы (например, социально-экономических);

× умения представлять задачу в виде математических зависимостей и соотношений;

× наличия представления о тенденциях развития и совершенствования методов анализа данных и моделей с учетом современных информационных средств;

× умения ассоциировать с переменными теории (например, экономической) реально измеримые в конкретной национальной (региональной) экономике эмпирические показатели;

× собственного мнения (на основе жизненной, учебной и производственной практик, научно-популярных источников и др.) о возможности и необходимости моделей и методов анализа в предметных областях (экономике, бизнесе, коммерции, управлении, политике, образовании, информационных технологиях и др.);

× наличия представления о текущем состоянии в области применения методов СА в масштабах города, области, республики;

практическое применение методов СА, позволяющих:

× исследовать проблемы и решать задачи предметных областей с помощью аппарата математики и применения современных компьютерных технологий;

× интерпретировать модельные решения и использовать их для принятия решений;

Это предполагает умение (в проекте отразить наиболее существенные для конкретной задачи положения):

Ÿ представлять задачу в виде математических моделей, а именно:

- ставить (формулировать) задачу,

- получать данные,

- специфицировать модель,

- оценивать параметры,

- интерпретировать результаты;

Ÿ отвечать на вопросы о возможности измерения входящих в соотношения (модели) переменных, в том числе выявлять и преодолевать проблемы, искажающие результаты применения методов анализа и обработки данных:

- асимметричность связей,

- мультиколлинеарность объясняющих переменных,

- закрытость механизма связи между переменными в изолированной регрессии,

- эффект гетероскедастичности (отсутствия нормального распределения остатков регрессии),

- автокорреляции,

- ложной корреляции,

- наличия лагов;

Ÿ эмпирически проверять теорию, т.е. в ходе исследования решать следующие задачи:

- проводить качественный анализ связей модельных переменных – выделять зависимые и независимые переменные;

- строить выборки данных;

- специфицировать формы связи между зависимой и независимыми переменными;

- оценивать параметры модели;

- проверять ряд статистических гипотез о свойствах распределения вероятностей для случайной компоненты эконометрической модели;

- анализировать мультиколлинеарность объясняющих переменных, оценивать ее статистическую значимость, выявлять переменные, ответственных за мультиколлинеарность;

- вводить в модель исследования фиктивные переменные;

- выявлять автокорреляцию, лаги;

- выявлять тренд, циклическую и случайную компоненты;

- проверять остатки на гетероскедастичность;

- анализировать структуру связей и строить системы одновременных уравнений;

- проверять модель на качество (дисперсионный анализ регрессии);

Ÿ оптимально организовывать (планировать) эксперимент:

- ставить конкретную задачу в соответствии с целью эксперимента (задача измерения некоторой величины при фиксированных условиях; задача проверки гипотезы; задача выяснения механизма явления; задача оптимизации; динамические измерения; классификация наблюдений, или распознавание образов);

- выбирать критерий (параметр) степени достижения цели;

- выбирать и ранжировать факторы;

- проводить отсеивающие эксперименты и дисперсионный анализ;

- рандомизировать эксперимент (моделировать случайные величины, распределения);

- определять аналитического вида зависимости параметра от факторов;

- строить матрицу планирования;

- использовать методы многомерного статистического анализа;

- учитывать (исключать при возможности) аппаратные искажения.

Согласно целям, пререквизитам, траектории учебного плана специальности, направленности заданий СРС и СРСП рекомендуется применять методы и модели следующих научных дисциплин и разделов (или смежных с ними):

Ÿ кибернетики: системный анализ, теория информации, теория управляющих систем;

Ÿ математической статистики: проверка статистических гипотез, дисперсионный анализ, корреляционно-регрессионный анализ, многомерный статистический анализ, факторный анализ, компонентный анализ, кластерный анализ, дискриминантный анализ, частотный анализ, теория индексов и др.;

Ÿ методы принятия оптимальных решений: математическое программирование, сетевые и программно-сетевые методы планирования и управления, теория массового обслуживания, теория и методы управления запасами, теория игр, теория и методы принятия решений, теория расписаний и др.;

Ÿ приложения математического аппарата в предметной области, например, для экономики - математическая экономика и эконометрика: теория экономического роста, теория производственных функций, межотраслевые балансы, анализ спроса и предложения, региональный и пространственный анализ, глобальное моделирование и др.;

Ÿ специфические методы и дисциплины предметной области, например, рыночной (конкурентной) экономики: модели свободной конкуренции, модели монополии, индикативное планирование, модели теории фирмы и др.;

Ÿ экспериментальные методы изучения предметной области: математические методы анализа и планирования экспериментов, имитационное моделирование, деловые игры, методы экспертных оценок и др.

В качестве инструментального средства можно использовать:

Ÿ табличный процессор Excel;

Ÿ системы компьютерной математики MathCAD, MatLab, специализированные системы Statistica, Statgraphics, SPSS и др.;

Ÿ языки программирования высокого уровня (дополнительно, по выбору студента).

Основная литература – см. силлабус по предметам. Дополнительные информационные источники – УМКД по дисциплинам СА и АВР.

Варианты итогов проектной работы:

Ø Результаты научно-исследовательской работы.

Например, исследование можно построить на основе статистического материала:

1. полученного путем самостоятельно проведенного пассивного или активного эксперимента;

2. являющегося результатом исследований, проводимых в университете (в рамках оказания консультативно-технологической помощи преподавателям, магистрантам и аспирантам всех специальностей);

3. являющегося результатом деятельности подразделений университета (научный отдел, учебный отдел, отдел кадров, библиотека, кафедры, деканаты, ректорат, ЦМК, ЦКТ, ЦДО и др.).

Формы НИРС (для объединенного творческого экзамена):

- Самостоятельное проведение статистического исследования (от формирования исходных данных и первичной обработки до проведения корреляционно-регрессионного и факторного анализа) в виде опроса либо документированного наблюдения. Понимание процессов, породивших анализируемые данные, и насколько данные отражают исследуемое явление - вне компетенции проектной работы (но желательны; возможны посредством консультаций специалистов-предметников). Акцентируется адекватность отражения данных моделью, методов построения и «решения» модели. Способ формирования исходной информации, выбор применяемых методов и тестов, адекватных природе данных, интерпретация полученных результатов, реализация методов анализа в вычислительных средах проводится самостоятельно (обязательны консультации преподавателя).

- Комплексный статистический анализ реальной ситуации с привлечением изложенных в курсе СА приемов и методов статистического исследования. Выбор темы, формирование исходной информации, формулировка цели и задач, схема планирования эксперимента проводится самостоятельно под руководством преподавателя в соответствии с профессиональными интересами студента.

Ø Реферат или аналитический обзор, в котором отражение навыков использования стандартных методов и моделей в учебном практикуме являются лишь основой, обязательна демонстрация применения результатов современных исследований в области анализа и обработки информации.

Ø Методическая разработка, например, в виде учебного «кейса», или разработка и реализация тренинга по дисциплинам Статистический анализ, Анализ временных рядов, Математическое моделирование, Моделирование рыночной экономики, Теория принятия решений, Системный анализ, Исследование операций и т.п., в структуре которых имеется форма обучения - лабораторное и/или практическое занятие, а в качестве инструментального средства выступают методы математического моделирования, обработки информации, анализа данных.

Ø Разработка тетрады «наблюдение – анализ – модель – прогноз» как инструмента исследования конкретного объекта (явления), протестированного на фактическом (экспериментальном) материале. При этом основной акцент ставится не на обоснование выбора объекта исследования и оценку адекватности данных наблюдения, а на правомочность применения методов многомерного анализа, постановку прогностической задачи, обоснование выбора модели прогноза, построение модели, анализ и интерпретацию модельного решения. Использование изучаемых теоретических аспектов должно быть отражено в реальных (приближенных к реальности) ситуациях.

Ø … (самостоятельно предложенная форма).

К защите готовится отчет в форме пояснительной записки (см.методические материалы по оформлению письменных работ бакалавриата, курсовых и дипломных работ), включающей описание всех этапов работы и приложения (в случае необходимости. Обязательной частью отчета является электронная презентация в PowerPoint.

Допускается разработка проекта индивидуального, малой группой, учебной группой в целом. Для группового проекта обязательна демонстрация и подтверждение участия в проектировании каждого студента.

Выбор предметной области и тематики предлагается как подготовительный самостоятельный этап проектирования. Желательно, чтобы тема проекта была актуальной, направленной на решение конкретных социально-экономических и управленческих проблем, соответствовала состоянию и перспективам развития математической науки и информационных систем.

При определении тематики проектирования необходимо учитывать основные направления деятельности специалиста по сбору, обработке, передаче и хранению информации, а также по обеспечению информационной поддержки при решении практических задач.

Вопросы для самопроверки

1. Как вы понимаете понятия случайность и закономерность?

2. Дайте определение науки Эконометрика.

3. Укажите связь эконометрики с другими науками.

4. Приведите примеры практического применения эконометрических методов.

5. В каких случаях и почему не используется эконометрическое моделирование? Приведите примеры. Обоснуйте.

6. Что такое модель? Приведите примеры.

7. Обоснуйте необходимость моделирования в экономике. Приведите примеры.

8. Что такое математическая модель? Приведите примеры.

9. Назовите области приложения математических моделей. Приведите примеры из уже изученных дисциплин.

10. Почему модель только частично, в соответствии с целью исследования, может заменить оригинал? Приведите примеры.

11. Назовите основные типы математических моделей. Приведите примеры.

12. Обоснуйте невозможность составления «универсального рецепта моделирования».

13. Обобщите роль прикладных математических моделей в экономике.

14. Что вы можете рассказать по теме «Модель. Моделирование» дополнительно? Что вы узнали по этой тематике из периодических публикаций и Интернета? Известны ли вам разработки по этой тематике в рамках учебной научно-исследовательской работы студентов? преподавателей университета?

15. Каковы этапы эконометрического исследования?

16. Какие вопросы решает эконометрист?

17. В чем сложность этапа формулировки цели исследования? Приведите примеры.

18. Поясните ваше понимание творческого характера эконометрического исследования.

19. Что вы понимаете под размерностью эконометрической задачи?

20. Что такое неуправляемые и управляемые переменные? Приведите примеры.

21. Какова роль построения модели в эконометрическом исследовании?

22. Обоснуйте (по возможности, проиллюстрируйте примерами) роль информационных (компьютерных) технологий в эконометрическом исследовании.

23. На основании изученных ранее учебных предметов и результатов прохождения производственной практики, сформулируйте и прокомментируйте свое отношение к мониторингу в эконометрическом исследовании. Какова ситуация в отношении мониторинга в Казахстане (в различных сферах экономики), и чем, по-вашему, она вызвана?

24. Исходя из личного опыта, прокомментируйте связь научного исследования и практической реализацией его результатов? Как вы считаете, является ли отказ от внедрения итогов научной работы отрицательным результатом? По возможности, приведите примеры.

25. Что вы можете рассказать по теме «Эконометрическое исследование» дополнительно? Что вы узнали по этой тематике из периодических публикаций и Интернета? Известны ли вам разработки по этой тематике в рамках учебной научно-исследовательской работы студентов? преподавателей университета?

26. Какие типы данных используются в эконометрическом исследовании? Приведите примеры.

27. Какие проблемы данных возникают в экономических исследованиях?

28. Что понимается под измерением величин?

29. По каким типам шкал производятся измерения в эконометрике? Приведите примеры.

30. Каковы допустимые преобразования в каждой из шкал? Приведите примеры.

31. Как позиционировать тип шкалы измерения конкретного объекта?

32. Приведите примеры применения статистики и учета в эконометрическом моделировании.

33. Что вы можете рассказать по теме «Измерение экономических признаков» дополнительно? Что вы узнали по этой тематике из периодических публикаций и Интернета? Известны ли вам разработки по этой тематике в рамках учебной научно-исследовательской работы студентов? преподавателей университета?

34. Обосновать применение методов статистики как способа формирования информационной инфраструктуры в обществе (информационной системе).

35. Понятие статистического измерения. Виды шкал и их примеры.

36. Содержательно (на примерах) охарактеризовать роль абсолютных величин и относительных величин как характеристики количественной меры соотношения двух показателей (индексы, удельные веса, показатели динамики структуры, показатели степени устойчивости структуры)[1].

37. Привести содержательный пример статистического исследования в виде этапов2:

Ÿ выявление предмета исследования;

Ÿ постановка задачи исследования;

Ÿ сбор данных об исследуемых явлениях (статистическое наблюдение, в результате которого формируется система показателей, необходимых для анализа);

Ÿ обработка и анализ данных, собранных при статистическом наблюдении (выбор методов, реализация, анализ результата).

38. Привести содержательный пример статистического наблюдения в виде этапов2:

Ÿ формулировка цели, способствующей управляемости изучаемой системы;

Ÿ определение объекта наблюдения;

Ÿ выделение единиц наблюдения как первичных элементов объекта, являющихся носителем регистрируемых признаков;

Ÿ определение состава признаков, которые регистрируются по каждой единице наблюдения.

39. На примере пояснить смысл выборочного метода и различие показателей совокупности выборочных наблюдений и генеральной совокупности.

40. Что вы понимаете под однородностью выборки? Можно ли считать однородной выборку, представляющую значения разных случайных величин с существенно различными распределениями?

41. Что вы понимаете под репрезентативностью выборки? Можно ли считать репрезентативной выборку, если любой элемент генеральной совокупности имеет практически одинаковые шансы попасть в нее?

42. На примере продемонстрировать виды ошибок: репрезентативности и регистрации (точность гарантии результатов выборки, способ отбора единиц в выборку, объем выборки, степень вариации признаков совместимости).

43. Неравенство Чебышева и теорема Ляпунова как инструмент оценки расхождения между выборочной и генеральной средней (определения величины ошибки выборочного наблюдения).

44. Необходимость и способы группировки экспериментальных данных (типологическая, структурная, аналитическая)2.

45. Содержательно интерпретировать идеи кластерного анализа как способа многомерной группировки:

Ÿ совокупность объектов представляется в пространстве как скопление точек, определяющих близость объекта по каким либо сходствам;

Ÿ расстояние между объектами больше, если они менее похожи друг на друга.

46. Способы отбора единиц из генеральной совокупности (случайная выборка, механическая, типическая, серийная).

47. Содержательно охарактеризовать концепцию требований к данным (массовость; практическая ценность; сопоставимость по методологии расчета показателей, предметной принадлежности, единиц измерения; полноты и т.д.).

48. Вариационный ряд (дискретный, интервальный) как статистическое распределение, построенное с целью оценки причин вариации.

49. Что представляют собой гистограмма, полигон частот, полигон накопительных частот?

50. Верны ли утверждения:

Ÿ Гистограмма частостей и полигон частостей являются статистическими аналогами плотности распределения случайной величины.

Ÿ Кумулята частостей представляет собой кусочно-линейную аппроксимацию функции распределения и является ее статистическим аналогом.

Ÿ Кумулята частостей может быть получена интегрированием гистограммы частостей.

51. Дайте формальное определение и содержательную характеристику показателям статистического распределения:

Ÿ центр распределения (среднее, мода, медиана);

Ÿ ранговые характеристики, разделяющие вариационный ряд на определенное число равных отрезков (квартили, децили, процентили);

Ÿ показатели вариации (абсолютные – размах вариации, среднее линейное отклонение, дисперсия, среднеквадратичное отклонение; относительные (к среднему) – относительный размах вариации, относительное среднее линейное отклонение, коэффициент вариации);

Ÿ показатели формы распределения (асимметрия, эксцесс).

52. Проиллюстрируйте графически описательные статистики эмпирической выборки.

53. Приведите пример, демонстрирующий необходимость применения коэффициента вариации для сравнительного анализа случайных величин с разным математическим ожиданием и/или разной размерностью.

54. Дайте определение моментам распределения (начальный, центральный, условный) как характеристикам распределения.

55. Пояснить смысл предложения «Теоретическая кривая характеризует собой предельное распределение частот, к которым стремятся эмпирические данные при увеличении числа наблюдений».

56. На примере пояснить различие смешения распределений (закон распределения случайной величины образованный смешением двух или нескольких генеральных совокупностей в определенных пропорциях с одинаковыми законами распределения) и композиции распределения (закон распределения случайной величины, являющийся суммой двух или нескольких случайных величин с разными законами распределения).

57. Привести примеры и содержательно обосновать применение для моделирования распределения случайных величин законов (кривых) распределения:

Ÿ биноминального (дискретные данные, независимые наблюдения, вероятность появления события остается постоянной);

Ÿ нормального (непрерывные данные; распределение частот моделируется под воздействием множества случайных факторов, ни один из которых не оказывает преимущественного воздействия и все факторы независимы между собой; кривая распределения симметрична относительно максимальной ординаты и имеет две точки перегиба, мода и медиана равны, в промежутках xср±s, xср±2s и xср±3s находятся, соответственно, примерно 68,3%, 95,4% и 99,7%единиц наблюдения);

Ÿ распределение Пуассона (дискретные признаки; по мере увеличения значений признаков, частоты резко уменьшаются и средняя приблизительно равна дисперсии).

Ÿ предложите свой закон распределения.

58. Почему в приложениях чаще других встречается нормальное распределение? Можно ли объяснить это тем, что сложные процессы есть проявления суммарного действия большого числа независимых однородных случайных явлений?

59. Изложить суть общей методики проверки статистических гипотез.

60. В чем проявляется связь проверки гипотез и построения интервальных оценок? Привести примеры использования в анализе данных доверительных интервальных оценок.

61. Что такое точность оценки, уровень значимости, доверительная вероятность?

62. Что происходит с шириной доверительного интервала при увеличении доверительной вероятности?

63. Ошибка первого рода – это случайный отказ от верной основной гипотезы. Ошибка второго рода – это случайный отказ от верной альтернативной гипотезы. С ошибкой какого рода связана надежность выводов? Как вы понимаете фразу «Область принятия решения, или наилучшая критическая область, это область, минимизирующая ошибку второго рода среди всех критических областей, у которых ошибка первого рода не больше зафиксированного нами значения».

64. Привести примеры параметрической гипотезы, делающей предположение о параметрах распределения. Что такое непараметрическая гипотеза? Привести примеры.

65. Привести примеры использования критериев согласия (c2, Колмогорова-Смирнова, Романовского) для оценки степени соответствия эмпирических и теоретических распределений.

66. Существенно ли требование нормальности распределения случайной величины, если выборка большая? малая?

67. Можно ли использовать для проверки нормальности выборки малого объема c2-критерий? критерий Колмогорова-Смирнова? критерий близости к нулю выборочных значений асимметрии и эксцесса?

68. Привести примеры преимущественного использования t-критерия, рассчитанного по распределению Стьюдента при заданном уровне значимости a и числе степеней свободы k, по сравнению с t-критерием, рассчитанным по распределению Лапласа (стандартного нормального распределения).

69. Какие критерии проверки однородности вы знаете для зависимых и независимых выборок (парных и непарных наблюдений)?

70. Изложите идею непараметрических критериев серий, знаков, ранговых сумм.

71. Какие критерии – для зависимых или независимых выборок – вы будете применять, если каждому элементу одной выборки однозначно сопоставлен один элемент другой выборки.

72. Какие критерии – для зависимых или независимых выборок – вы будете применять, если выборки имеют разный объем.

73. Привести примеры функциональной и корреляционной взаимосвязи между факторами.

74. Привести примеры полного соответствия между факторными изменениями и результативными признаками.

75. Привести примеры проявления влияния на результативный признак отдельных факторов в виде общей тенденции при массовом наблюдении.

76. Возможно ли применение классической теории корреляции, если:

Ÿ исследуемые совокупности недостаточно однородны;

Ÿ выборки сравнительно малы по объему;

Ÿ нет убедительного обоснования независимости включаемых в исследование факторов;

Ÿ неизвестно распределение, которому соответствуют признаки совокупности;

Ÿ признаки и факторы выражены в номинальной или порядковой шкалах.

77. Какие виды анализа данных применяли, если порядок изучения взаимосвязи между факторами следующий

Ÿ изучены свойства моделируемой совокупности и установлен факт наличия взаимосвязи между признаками;

Ÿ произведена оценка степени тесноты взаимосвязи;

Ÿ построена аналитическая модель взаимосвязи между факторами; оценена адекватность полученной модели;

Ÿ проведена интерпретация параметров модели.

78. Привести примеры оценок степени тесноты факторов, измеренных в различных шкалах.

79. Возможно ли применение параметрических показателей степени тесноты факторов (Фехнера, линейного коэффициента Пирсона) если:

Ÿ выборки сравнительно малы;

Ÿ распределение признаков неизвестно;

Ÿ оценивается степень тесноты взаимосвязи между качественными признаками.

80. Обосновать собственную точку зрения на вопрос, является ли недостатком при оценке существенности взаимосвязи генеральных совокупностей необходимость оценивать значимость выборочных коэффициентов корреляции.

81. Можно ли считать коэффициенты ранговых корреляций Спирмена и Кендалла взаимоисключающими? взаимодополняющими? В чем состоит суть их «похожести» и «различия»?

82. Как учитывается при исследовании взаимосвязи признаков, измеренных в порядковой шкале, наличие одинаковых рангов? Изложите свою точку зрения на важность поправки, включающей количество связок повторяющихся рангов и число единиц в связке.

83. Если оценивается степень тесноты взаимосвязи между несколькими признаками, измеренными в ранговой шкале, то применяется коэффициент конкордации. Достаточно ли этого коэффициента, чтобы получить полную информацию о ранговой корреляции между признаками? в целом? фрагментарно?

84. Приведите пример использования для оценки взаимосвязи между качественными признаками коэффициента контингенции и ассоциации , построенного на принципе оценки сочетаний качественных признаков, имеющих несколько градаций.

85. По конструкции формул поясните смысл содержательного различия коэффициентов взаимной сопряженности Пирсона и Чупрова , где - коэффициента контингенции и ассоциации, n – число наблюдений, k1 и k2 – число градаций признаков.

86. Сформулируйте фразу «Аналитическая модель взаимосвязи в виде теоретической линии регрессии отражает изменения средних значений результативного признака в зависимости от изменения факторного признака при условии взаимного погашения всех прочих случайных причин» в терминах математической статистики.

87. Дайте определение понятиям несмещенности, состоятельности и эффективности оценок. Выполнение какого из перечисленных свойств является обязательным при оценивании параметров регрессии?

88. Сформулируйте принцип метода наименьших квадратов, позволяющий получить наилучшие несмещенные оценки параметров регрессии. Правомочно ли применение этого метода, если известно, что значения ошибок (остатков):

Ÿ нормально распределены с нулевой средней;

Ÿ имеют постоянную дисперсию;

Ÿ некоррелированны, т.е. независимы друг от друга.

89. По конструкции формул поясните содержательный смысл различия индекса корреляции , коэффициента детерминации и относительной ошибки аппроксимации , где y, и - значения отклика, соответственно, фактические, теоретические, общее среднее, n – число наблюдений, k- число параметров регрессии.

90. Значения индекса корреляции, коэффициента детерминации и относительной ошибки аппроксимации зависят от выбранной формы регрессионного уравнения и могут быть использованы для решения вопроса о целесообразности применения построенной модели для применения в прогнозировании. Достаточно ли этих показателей для принятия решения?

91. В чем различие коэффициентов корреляции: парного, множественного, частного?

92. Множественный коэффициент детерминации показывает долю вариации результативного показателя y под суммарным действием факторных признаков , , объясняемую регрессией , в общей доле дисперсии результативного признака. Связь множественного коэффициента детерминации и скорректированного множественного коэффициента детерминации выражается отношением , где n – число наблюдений, k - число параметров регрессии. Чем пояснить недостаточность множественной детерминации?

93. Какой содержательный смысл несут в себе коэффициенты регрессии , ? Всегда ли правомочно использование коэффициентов регрессии для непосредственной оценки влияния факторов на результативный признак?

94. Приведите схемы построения «чистой» множественной регрессии и стандартизованной. Какова связь между ними? Если исследуемые признаки имеют различные единицы измерения, какую схему построения модели использовать рациональнее?

95. Для интерпретации результатов статистического моделирования применяют коэффициент эластичности и бета-коэффициент . Свяжите с формулами показателей трактовку их содержания:

Ÿ показывает, на сколько процентов изменяется результативный признак при изменении факторного признака на один процент;

Ÿ показывает, на какую часть величины своего среднеквадратического отклонения изменится в среднем значение результирующего показателя при изменении факторного признака на величину его среднеквадратического отклонения.

96. Привести примеры, иллюстрирующие целесообразность применения в анализе данных индексного метода, учитывая, что индекс – это описательный статистический показатель, который обобщает относительное изменение одной переменной или группы переменных во времени, в пространстве или по сравнению с любым эталоном2.

97. Рассчитайте с помощью индекса совокупное изменение в группе составляющих, каждая из которых изменяется в разной степени2.

98. Проиллюстрируйте примерами негативные последствия нарушений принципов построения многофакторных моделей:

Ÿ при выборе показателей и факторов необходимо руководствоваться их предметным содержанием;

Ÿ должна существовать возможность агрегации модели, т.е. полная модель должна «распадаться на части» (допускать разную степень детализации).

99. На примерах изложить суть теоремы сложения дисперсии, позволяющей оценить, насколько процентов вариация результативного признака зависит от фактора, положенного в основу группировки:

Ÿ межгрупповая дисперсия характеризует вариацию результативного признака под влиянием только одного фактора;

Ÿ средняя дисперсия из внутригрупповой характеризует вариацию результативного признака под влиянием всех прочих факторов;

Ÿ общая дисперсия характеризует вариацию результативного признака под влиянием всех факторов, определяющих уровни индивидуальных значений результативного признака.

100. Привести содержательные примеры решения задач дисперсионного анализа:

Ÿ имеют ли влияние рассматриваемые факторы на результативный показатель;

Ÿ какова роль отдельных факторов в общем влиянии на результативный показатель;

Ÿ существует ли возможность оценки распространения результатов анализа, полученного по выборочным данным на всю генеральную совокупность в целом.

101. Проиллюстрировать правила организации однофакторного дисперсионного комплекса:

Ÿ отбор факторов;

Ÿ логическое обоснование группировки по факторному признаку;

Ÿ отбор единиц наблюдения в случайном порядке.

102. Верны ли действия в ситуации, когда числа столбца исходной таблицы нельзя интерпретировать как значения одной случайной величины:

Ÿ если наблюдения парные, то все числа столбцов стандартизуются, например, делятся на сумму чисел соответствующих строк (абсолютное значение заменяется процентным вкладом в общую сумму);

Ÿ если наблюдения непарные, то каждый столбец разбиваются методами кластерного анализа на группы и решается задача для каждой группы в отдельности.

103. В чем состоят основная (нулевая) и альтернативная гипотезы однофакторного дисперсионного анализа?

104. Можно ли применять однофакторный дисперсионный анализ, если выборка удовлетворяет условиям:

Ÿ наблюдаемые случайные величины независимы;

Ÿ наблюдаемые случайные величины нормально распределены;

Ÿ дисперсии наблюдаемых случайных величин равны.

105. Можно ли применять критерий Краскела-Уоллиса при однофакторном анализе, если не выполнено требование нормальности выборки?

106. Должны ли совпадать объемы выборок по каждой случайной величине в однофакторном дисперсионном анализе?

107. Проиллюстрировать специфику организации многофакторного комплекса:

Ÿ оценка факторов на мультиколлинеарность;

Ÿ обоснование исключения фактора из модели;

Ÿ усложнение исследования в зависимости от классификации многофакторных дисперсионных комплексов (равномерные, пропорциональные, неравномерные);

Ÿ дополнительные задачи (оценка влияния каждого фактора на результативный показатель и оценка совместного влияния факторов на результат).

108. Проиллюстрируйте разложение дисперсии признака в связи с дополнительной информацией об эволюции признака.

109. В связи с чем появляется проблема «чистой» ошибки аппроксимации?


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: