Лабораторная работа №7
Основы матбиостатистики
Практические задания
Задание 1. Найдите среднее, стандартное отклонение, медиану, для следующей выборки 0; 0; 0; 1; 1; 1; 1;1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 3; 3; 3; 3; 4; 4; 5; 5; 5; 5; 6; 7; 9; 10; 11. Можно ли считать, что выборка извлечена из совокупности с нормальным распределением? Обоснуйте свой ответ.
Пример 1. Найдите среднее, стандартное отклонение, медиану, 25-й и 75-й процентили для следующих данных 289, 203, 359, 243,232, 210, 251, 246, 224, 239, 220, 211. Можно ли считать, что выборка извлечена из совокупности с нормальным распределением? Обоснуйте свой ответ.
Шаг 1. Создайте таблицу, содержащую номера по порядку и исходные данные:
Шаг 2. Рассчитайте среднее по формуле:
1 способ: в ячейку, например B14 введите формулу =сумм(B2:B13)/12;
2 способ: в ячейку, например B15 введите формулу =срзнач(B2:B13);
Шаг 3. Рассчитайте стандартное отклонение выборки по формуле:
1 способ: выполните следующие расчеты:
Обратите внимание!! Формулы в столбцах С и D вводятся только в первую строку, в остальные -просто копируются.
|
|
В результате вычислений получим:
2 способ:
Если Вы уже запомнили формулу стандартного отклонения, можно воспользоваться готовой встроенной функцией EXCEL:
=СТАНДОТКЛОН.Г(B2:B13). Она рассчитывает стандартное отклонение по генеральной совокупности.
Убедитесь, что значения, вычисленные первым и вторым способом совпали.
Шаг 4. Найдите медиану.
Скопируйте ряд данных в свободное место листа и отсортируйте его по возрастанию. Для этого, выделив данные нужно выбрать в меню Данные/Сортировка. Обратите внимание, что в выделенном фрагменте первый ряд должна занимать метка данных (х) а не сами данные.
Далее:
1 способ. Найдите середину ряда (это 6 и 7 значения) Найдите среднее среди них:=(232+239)/2. В результате получим: 235,5
2 способ: Воспользуйтесь стандартной функцией EXCEL:
=МЕДИАНА(укажите диапазон, в котором находится ряд)
Убедитесь, что оба способа позволили получить одинаковое значение медианы.
Вывод: Можно считать, что данная выборка могла быть извлечена из генеральной совокупности с нормальным распределением, так как медиана близка к среднему
Задание 2. Имеются следующие данные о диаметре фибром (доброкачественная опухоль) у крупного рогатого скота (см):
24,2; 25,8; 30,6; 32,0; 28,1; 29,6; 33,2; 34,0; 32,9; 29,9; 26,0; 28,1; 24,8;
27,3; 24,5; 30,1; 32,2; 33,6; 31,2; 31,9; 33,9; 25,6; 26,3; 27,4; 28,9; 32,0;
32,1; 33,3; 31,5; 24,9.
Составить вариационный ряд с равными интервалами, изобразить его графически. Определить средний, модальный, медианный диаметры фибром и показатели вариации.
Пример 2.
По 46 районам имеются следующие данные по молочной продуктивности коров (удой молока на одну голову) в хозяйствах населения, ц/гол.: 44,0; 37,1; 24,8; 37,9; 51,5; 52,5; 50,3; 47,5; 30,7; 39,0; 56,9; 62,3; 51,9; 53,9; 46,6; 32,0; 50,7; 50,5; 37,4; 54,4; 47,5; 52,1; 48,4; 50,0; 28,5; 57,8; 33,8; 24,4; 48,6; 47,5; 21,6; 38,9; 52,3; 54,4; 37,1; 36,5; 47,2; 47,9; 22,5; 43,0; 29,1; 53,7; 25,0; 30,5; 28,5; 38,6. Составить вариационный ряд с равными интервалами. Вариационный ряд изобразить графически.
|
|
Определить средний удой молока на одну голову, модальное и медианное значения, показатели вариации, коэффициент асимметрии и эксцесс.
Шаг 1.
Введем массив данных в диапазон А2:A47. Подсчитаем объем выборки n – число выборочных данных, для этого в ячейку C1 введем формулу =СЧЁТ(А1:A47). Заметим, что для того, чтобы в формулу ввести нужный диапазон, необязательно вводить его обозначение с клавиатуры, достаточно его выделить. Определим минимальное и максимальное значение в выборке, введя в ячейку C2 формулу =МИН(А1:A47), и в ячейку C3: =МАКС(А1:A47).
По формуле найдем число групп, на которое необходимо разбить вариационный ряд:
Для этого в ячейку C5 введем формулу =5*LOG10(С1).
Округлим полученное значение, примем k = 8 (С6).
Шаг 2. По формуле
определим величину интервала:
Для этого в ячейку С7 введем формулу: =(С2-С3)/C6
Шаг 3. Зададим массив интервалов, указывая для каждого из 6 интервалов верхнюю границу. Для этого в ячейке Е2 вычислим верхнюю границу первого интервала, введя формулу =С3+С7; в ячейке Е3 верхнюю границу второго интервала, введя формулу =E2+С7. Для вычисления оставшихся значений верхних границ интервалов зафиксируем номер ячейки С7 в введенной формуле при помощи знака $, так что формула в ячейке Е3 примет вид =E2+С$7, и скопируем содержимое ячейки Е3 в ячейки Е4-Е8. Последнее полученное значение равно вычисленному ранее в ячейке С2 максимальному значению в выборке.
Шаг 4. Теперь заполним массив «карманов» при помощи функции ЧАСТОТА:
Выделим столбец частот (F2:F8), введем формулу =ЧАСТОТА(А2:A47;E2:E8) и нажмем сочетание клавиш CTRL+SHIFT+ENTER
Для контроля вычислим сумму частот при помощи функции СУММ (значок функции S в группе «Редактирование» на вкладке «Главная»), вычисленная сумма должна совпасть с ранее вычисленным объемом выборки в ячейке C2.
Шаг 5. По полученному вариационном ряду построим гистограмму: выделим столбец частот и выберем на вкладке «Вставка» «Гистограмма». Получив гистограмму, изменим в ней подписи горизонтальной оси на значения в диапазоне интервалов, для этого выберем опцию «Выбрать данные» вкладки «Конструктор». В появившемся окне выберем команду «Изменить» для раздела «Подписи горизонтальной оси» и введем диапазон значений варианты, выделив его «мышью».
Второй способ получить такую же диаграмму -
Выбрать в меню Данные, Анализ данных, Гистограмма. Появившееся окно заполнить так:
Шаг 6. Рассчитаем показатели ряда с использованием встроенных статистических функций:
Среднее по выборке | =СРЗНАЧ(A2:A47) |
Мода | =МОДА(A2:A47) |
Медиана | =МЕДИАНА(A2:A47) |
Стандартное отклонение | =СТАНДОТКЛОН.В(A2:A47) |
Дисперсия | =ДИСП.В(A2:A47) |
Эксцесс | =ЭКСЦЕСС(A2:A47) |
Ассиметрия | =СКОС(A2:A47) |
Вывод: Результаты вычислений и вид полученной гистограммы не позволяют с достаточной уверенностью говорить о нормальном распределении данного показателя.