Для получения достаточно достоверных и информативных данных о распределении вектора случайной величины необходимо иметь достаточно большую выборку.
Выборка представляет собой совокупность наборов (векторов) значений
Как правило, число наблюдений велико и значительно превосходит число факторных переменных. Для получения хороших результатов должно выполняться условие а для получения удовлетворительных результатов должно выполняться условие
Существует такая проблема: наблюдения yi, которые при различных наборах объясняющих переменных рассматриваются как реализации случайных величин Yi, могут в общем случае иметь различные распределения, а это означает, что в конкретной таблице наблюдений для каждой случайной величины будет иметься только одно наблюдение.
В классической эконометрике рассматривают два вида данных:
1. Пространственная выборка или перекрёстные данные – это набор значений показателей, полученный в некоторый момент или за достаточно короткий интервал времени. Таким образом, для пространственной выборки можно говорить, что все ее наблюдения получены примерно в одинаковых условиях.
|
|
В таком случае в дальнейшем Xi можно не рассматривать как случайные величины. Если случайные величины Yi для различных i независимы, то это влечёт за собой некоррелированность остатков:
2. Временной или динамический ряд– это выборка наблюдений, в которой важны не только сами наблюдения, но и порядок следования их друг за другом. При этом предполагается, что тип распределения наблюдаемой случайной величины остается неизменным во времени, но его параметр
могут изменяться.
Модели временных рядов оказываются сложнее моделей пространственной выборки, так как наблюдения во временном ряду в общем случае не являются независимыми и остатки могут коррелировать друг с другом.