Одна из основных задач выборочного исследования состоит в том, чтобы на основе характеристик выборочной совокупности получить достоверные суждения об этих характеристиках в генеральной совокупности. Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются разностью между значением характеристики в генеральной совокупности и ее значением, вычисленным по результатам выборочного наблюдения. Так, для средней арифметической, это расхождение определяется по формуле
. (2.3)
Зная выборочную среднюю величину признака () и предельную ошибку выборки (), можно определить границы, в которых заключена генеральная средняя:
. (2.4)
Интервал () получил название доверительного интервала, а величины и - доверительных границ. Вероятность того, что случайный интервал () содержит в себе достоверную, но не известную наблюдателю характеристику , получила название доверительной вероятности . Вероятность характеризует надежность статистической оценки .
|
|
Функция в Excel ДОВЕРИТ рассчитывает значение предельной ошибки выборки и имеет следующий синтаксис
ДОВЕРИТ(альфа; станд_откл; размер).
Аргументы функции имеют следующее назначение:
альфа – уровень значимости, который связан с надежностью (доверительной вероятностью) зависимостью . Если получаем результат надежностью в 95%, то =1-0,95=0,05;
станд_откл – стандартное отклонение генеральной совокупности;
размер – размер выборки.
Пример 2.2 В результате выборочного обследования жилищных условий жителей города, получены результаты сведенные в таблицу 2.2. Требуется с уровнем надежности =95% определить границы интервала, в который попадает средний размер общей площади.
Таблица 2.2
общая площадь, приходящаяся на 1 человека, кв.м | До 5 | 5-10 | 10-15 | 15-20 | 20-25 | 25-30 | 30 и более |
число жителей | 8 | 95 | 204 | 270 | 210 | 130 | 83 |
Решение задачи приведено в таблицах 2.3 и 2.4.
Для использования функции ДОВЕРИТ необходимо вычислить три аргумента.
Аргумент альфа вычисляется по исходной надежности =1-0,95=0,05.
Для вычисления стандартного отклонения для генеральной совокупности можно воспользоваться формулой (1.4) расчета взвешенной дисперсии.
Однако, если неизвестно значение математического ожидания , расчет дисперсии ведется по средней арифметической и формула для расчета будет иметь вид
. (2.5)
По исходным данным были определены середины интервалов.
Было определено число жителей в выборочной совокупности n как сумма строки «число жителей» f.
|
|
Для оценки выборочной средней арифметической применена функция (1.3).
При этом использовалась функция СУММПРОИЗВ, которая перемножила два массива данных – строки «середина интервала» x и «число жителей» f.
Отдельно определены разности квадратов для каждого интервала, где - середина интервала.
После этого была определена , где также использована функция СУММПРОИЗВ, далее вычислено , для чего применена функция КОРЕНЬ.
Предельная ошибка выборки определена функцией ДОВЕРИТ, где последний аргумент – размер выборки уже известен () и аргументы функции будут
ДОВЕРИТ().
После определения предельной ошибка выборки легко вычислить определить границы интервала, в который попадает средний размер общей площади, приходящейся на одного человека в городе. Это от 18,56 до 19,45 квадратных метра. Надежность этого вывода не хуже 95%.
Таблица 2.3
общая площадь, приходящаяся на 1 человека, кв.м | середина интервала, x | число жителей, f |
| |
До 5 | 2,5 | 8 | 272,42 | |
5-10 | 7,5 | 95 | 132,37 | |
10-15 | 12,5 | 204 | 42,32 | |
15-20 | 17,5 | 270 | 2,27 | |
20-25 | 22,5 | 210 | 12,22 | |
25-30 | 27,5 | 130 | 72,17 | |
30 и более | 32,5 | 83 | 182,12 |
Таблица 2.4
Число жителей в выборочной совокупности | 1000 | |
Выборочная средняя | 19,01 | |
Генеральная дисперсия | 51,11 | |
Генеральная стандартное отклонение | 7,15 | |
Предельная ошибка выборки | 0,44 | |
Нижняя граница | 18,56 | |
Верхняя граница | 19,45 |