По дисциплине «Математические методы обработки данных в профессиональной деятельности»

Справочный материал

Для подготовки к комплексному экзамену по естественнонаучному модулю

по дисциплине «Математические методы обработки данных в профессиональной деятельности»

 

№ пункта Теоретический материал
1. Определение. Выборкой или выборочной совокупностью называется часть объектов из генеральной совокупности, отобранных для изучения с тем, чтобы сделать заключение обо всей генеральной совокупности.
2. Определение. Объемом выборки называется количество объектов в выборке.
3. Определение. Вариантами называются наблюдавшиеся значения х12,…, xk признака Х.
4. Замечание. Если варианты х12,…, xk расположены по возрастанию, то выборку называют вариационным рядом.
5. Определение. Частотой называется число ni появлений варианты хi.
6. Замечание. Сумма частот выборки ni равна объему выборки.
7. Определение. Относительными частотами вариационного ряда называются значения , ,…, .
8. Замечание. Сумма относительных частот выборки wi равна 1.
9. Замечание.Сумма частот вариационного ряда равна объему выборки. Таким образом, если выборка задана в виде таблицы распределения с частотами ni:
xi x1 x2 xk
ni n1 n2 nk

то сумма частот ni (т.е. чисел в нижней строке) равна объему выборки n: n1+n2+…+nk=n.

10. Замечание. Сумма относительных частот вариационного ряда равна 1. Таким образом, если выборка задана в виде таблицы распределения с относительными частотами wi:
xi x1 x2 xk
wi = w1 w2 wk

то сумма относительных частот wi (т.е. чисел в нижней строке) равна 1.

11. Характеристики положения выборки: мода, медиана, выборочное среднее.
12. Характеристики рассеивания выборки: размах вариации, дисперсия, среднее квадратическое отклонение, исправленная дисперсия, исправленное среднее квадратическое отклонение.
13. Определение. Модой выборки называется варианта, имеющая наибольшую частоту.
14. Определение. Медианой выборки называется число, являющееся серединой соответствующего вариационного ряда.
15. Замечание. Для выборки с нечетным числом вариант медиана равна серединной варианте. Для выборки с четным числом вариант медиана равна полусумме двух средних вариант.
16. Определение. Выборочным средним выборки называется число, показывающее среднее значение признака.
17. Замечание. Таким образом, мода показывает наиболее часто встречающееся значение признака в выборке, медиана показывает середину распределения признака в выборке, выборочное среднее показывает среднее значение признака в выборке.
18. Замечание. Выборочное среднее находится как среднее арифметическое вариант соответствующего вариационного ряда.
19. Замечание. Если выборка задана в виде таблицы распределения
xi x1 x2 xk
ni n1 n2 nk

то выборочное среднее находится по формуле

, где n=n1+n2+…+nk – объем выборки.

20. Определение. Размахом вариации выборки называется разность между наибольшей и наименьшей вариантами.
21. Замечание.Таким образом, размах вариации показывает разброс значений признака в выборке.
22. Определение. Дисперсией выборки называется величина, которая показывает, насколько значения выборки отдалены от ее выборочного среднего.
23. Замечание. Если выборка задана в виде таблицы распределения
xi x1 x2 xk
ni n1 n2 nk

то дисперсия находится по формуле

.

24. Определение. Исправленная дисперсия s2 находится по формуле .
25. Определение. Средним квадратическим отклонением выборки называется квадратный корень из ее дисперсии .
26. Определение. Исправленным средним квадратическим отклонением выборки называется квадратный корень из ее исправленной дисперсии: .
27. Графическое представление вариационного ряда. 1. Если вариационный ряд является дискретным, то для его графического представления используют полигон частот – это ломаная, отрезки которой соединяют точки с координатами (x1,n1), (x2,n2),…, (xk,nk). 2. Если вариационный ряд является интервальным, то для его графического представления используют гистограмму частот – это ступенчатая фигура, состоящая из прямоугольников, основаниями которой служат частичные интервалы xi – xi+1, а высоты равны частотам ni.
1. Дискретный вариационный ряд
xi 2 5 7
ni 1 3 6

Объем выборки n=1+3+6=10.

Полигон частот выборки – это чертеж (см. чертеж справа).

Сумма ординат ni всех точек на чертеже равна объему выборки.

Полигон частот выборки
2. Интервальный вариационный ряд
xi – xi+1 0–200 200–400 400–600
ni 30 53 17

Объем выборки n=30+53+17=100.

Гистограмма частот выборки – это чертеж (см. чертеж справа).

Сумма высот ni всех прямоугольников на чертеже равна объему выборки.

Гистограмма частот выборки
28. Определение. Статистическойгипотезой называется гипотеза о виде неизвестного распределения или о параметрах известных распределений. Выдвигается основная (нулевая) гипотеза Н 0 и проверяется, не противоречит ли она имеющимся эмпирическим данным.
29. Определение. Конкурирующей (альтернативной) гипотезой называется гипотеза Н 1, которая противоречит нулевой гипотезе Н 0.
30. Шесть возможных случаев взаимного расположения критических точек Н кр(α=0,05), Н кр(α=0,01) и точки Н эмп Условные обозначения: «+» – зона значимости, «–» – зона незначимости, «?» – зона неопределенности
Случай №1.                                                   Случай №2.    –                  ?                     +                 –                  ?                      + Н эмп Н кр(α=0,05)      Н кр(α=0,01)               Н эмп Н кр(α=0,05)      Н кр(α=0,01) Вывод: принимается нулевая гипотеза H 0 на уровне значимости α=0,05. Интерпретация: результаты индивидуальных значений в выборке различаются незначимо.
Случай №3.                                                    Случай №4.    –                  ?                     +                 –                  ?                      +      Н кр(α=0,05) Н эмп  Н кр(α=0,01)                   Н кр(α=0,05) Н эмп  Н кр(α=0,01) Вывод: принимается альтернативная гипотеза H 1 на уровне значимости α=0,05. Интерпретация: результаты индивидуальных значений в выборке не определены.
Случай №5.                                                    Случай №6.    –                  ?                     +                 –                  ?                      +      Н кр(α=0,05)       Н кр(α=0,01) Н эмп                  Н кр(α=0,05)  Н кр(α=0,01) Н эмп Вывод: принимается альтернативная гипотеза H 1 на уровне значимости α=0,01. Интерпретация: результаты индивидуальных значений в выборке различаются значимо.
31. Определение. Выборочный коэффициент корреляции – это величина, характеризующая линейную зависимость между случайными величинами. Выборочный коэффициент корреляции для величин X и Y находится по формуле:
32. Замечание. Значения выборочного коэффициента корреляции принадлежат промежутку [–1,1].
33. Замечание. Имеются 3 случая для знака выборочного коэффициента корреляции: 1) если rX,Y > 0, то связь прямая, 2) если rX,Y < 0, то связь обратная, 3) если rX,Y = 0, то связь отсутствует.
34. Шкала Чеддока для выборочного коэффициента корреляции
Величина коэффициента корреляции 0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 1,0
  слабая

средняя

сильная

Характеристика силы связи слабая Умеренная заметная высокая весьма высокая
35. Определение. Говорят, что величины X и Y положительно коррелированы, если с увеличением значения Х увеличивается и значение Y.
36. Определение. Говорят, что величины X и Y отрицательно коррелированы, если с увеличением значения Х значение Y уменьшается.
37. Семь случаев корреляционного поля эллиптической формы
Случай №1   Эллипснаправлен вдоль убывающей прямой. Значит, связь обратная. Эллипс узкий, значит, связь сильная. Случай №2   Эллипснаправлен вдоль возрастающей прямой. Значит, связь прямая. Эллипс узкий, значит, связь сильная.
Случай №3     Эллипснаправлен вдоль убывающей прямой. Значит, связь обратная. Эллипс средней толщины, значит, связь средняя. Случай №4     Эллипснаправлен вдоль возрастающей прямой. Значит, связь прямая. Эллипс средней толщины, значит, связь средняя.
Случай №5   Эллипснаправлен вдоль убывающей прямой. Значит, связь обратная. Эллипс по форме похож на круг, значит, связь слабая. Случай №6   Эллипснаправлен вдоль возрастающей прямой. Значит, связь прямая. Эллипс по форме похож на круг, значит, связь слабая.
Случай №7     Эллипс имеет форму круга, значит, связь отсутствует.  
38. Определение. Коэффициент ранговой корреляции Спирмена – это величина, характеризующая степень тесноты связи порядковых признаков между случайными величинами. Коэффициент ранговой корреляции Спирмена для величин X и Y, которые в этом случае проранжированы (т.е. записаны в виде ранжированных вариационных рядов) находится по формуле: где  и  – ранги значений величин X и Y.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: