В маркетинговых целях обычно проводят опрос лишь небольшой части той группы людей (генеральной совокупности), которая представляет интерес для исследователей. Обычно это несколько сотен, иногда — тысяча респондентов. Поэтому исходным пунктом расчета выборки становится вопрос об определении размеров выборочной совокупности. Ее численность зависит от двух факторов: стоимости сбора информации и стремления к определенной степени статистической достоверности результатов, которую надеется получить исследователь. Конечно, даже не искушенные в статистике и социологии люди интуитивно понимают, что чем больше размеры выборки (чем ближе они к размерам генеральной совокупности в целом), тем надежнее и достовернее полученные данные. Практически невозможно проведение сплошных опросов на объектах, численность которых превышает десятки, сотни тысяч и даже миллионы. Понятно, что стоимость выборки (включающая в себя оплату тиражирования инструментария, труда анкетеров, полевых менеджеров и операторов по компьютерному вводу) сильно зависит от суммы, которую готов выделить заказчик, и мало зависит от исследователей. Хотя если требуется увеличить точность вдвое, выборку придется увеличить не в 2, а в 4 раза. Например, чтобы сделать в 2 раза более точной оценку данных, полученных путем опроса 400 чел., потребуется опросить не 800, а 1600 чел.
Ошибка выборки может зависеть не только от ее величины, но и от степени различий между отдельными единицами внутри данной генеральной совокупности. Например, если нужно узнать, сколько потребляется пива, может обнаружиться, что внутри имеющейся генеральной совокупности нормы потребления у различных людей существенно различны (гетерогенная генеральная совокупность). В другом случае изучение потребления хлеба может показать, что у разных людей оно различается значительно меньше (гомогенная генеральная совокупность). Чем больше различия (гетерогенность) внутри генеральной совокупности, тем больше возможная ошибка выборки. Численность (объем) выборки зависит от уровня однородности или разнородности изучаемых объектов. Чем более они однородны, тем меньшая численность может обеспечить статистически достоверные выводы.
Определение объема выборки зависит и от уровня доверительного интервала допустимой статистической ошибки. Имеются в виду случайные ошибки, связанные с природой любых статистических погрешностей.
Данные расчетов, касающихся систематических ошибок выборки, являются результатом многолетних эмпирических наблюдений, расчетов, проверок и перепроверок.