Комбинатория элементтері. Бернулли формуласы. Шектік теоремалар

Анықтама1. Берілген әртүрлі n элементтен m элемент бойынша орналастырулар деп

әрқайсысы бір-бірінен не құрамы бойынша, не орналасу реті бойынша ажыратылатын комбинацияларды айтады.

Анықтама2. Берілген әртүрлі n элементтен n элемент бойынша алмастырулар деп

әрқайсысы бір-бірінен тек орналасу реті бойынша ғана ажыратылатын комбинацияларды айтады.

Анықтама3. Берілген әртүрлі n элементтен m элемент бойынша терулер деп

әрқайсысы бір-бірінен тек құрамы бойынша ажыратылатын комбинацияларды айтады.

Егер сынақтар жүргізгенде, А оқиғасының ықтималдығы әрбір сынақтардан тәуелсіз болса, онда бұл сынақтар А оқиғасына қатысты тәуесліз дейміз.

Бернули формуласы. тәуелсіз сынақтарда, оқиғаның әрқайсысында орындалуы ықтималдығымен және орындалмауыықтималдығымен анықталса, онда А оқиғасы тура k рет пайда болады және (n- k) рет пайда болмайды. Сонымен А оқиғаның k рет пайда болатын ықтималдығы тең:

.

Мұндағы

А оқиғаның пайда болатын ықтималдығы:

а) k реттен кем, тең

б) k реттен артық, тең

в) k реттен кем емес, тең

г)) k реттен артық емес, тең

Жеткілікті үлкен сандары үшін Бернулли формуласын пайдалану мүмкін емес, сондықтан шектік теоремаларды пайдаланған орынды.

Локалды Лаплас теоремасы: тәуелсіз сынақтарда әрқашан А оқиғасының пайда болу ықтималдығы p (0<p<1) тең, А оқиғасы k рет пайда болуы жуықтан алғанда мынаған тең:

мұндағы,

Интегралдық Лаплас теоремасы.

тәуелсіз сынақтарда А оқиғасының пайда болу ықтималдығы p (0<p<1) тең, А оқиғасы k1 кемемес k2 реттен артық емес пайда болу ықтималдығы жуықтап алғанда мынаған тең:

мұндағы

- Лаплас функциясы.,,

,.

1-ші тақырып. Математикалық статистика элементтері.

1.1. Кездейсоқ шамалар. Үлестірім функциясы, үлестірім тығыздығы және олардың қасиеттері.

Анықтама

Кездейсоқ шама (айнымалы) деп кездейсоқ шамалардың әсерімен (белгілі бір ықтималдықпен) кейбір сандар жиынының (қабылдануы алдын-ала белгісіз) бір санын қабылдайтын шаманы айтады.

Кездейсоқ шамалар үлкен латын әріптерімен (X, Y,…), ал олардың мәндері кіші латын әріптерімен (x, y, …) белгіленеді.

Кездейсоқ шаманы толық сипаттау үшін оның қабылдайтын мәндерімен қатар, ол мәндердің қабылдану ықтималдықтары да берілуі керек.

Кездейсоқ шамасы көп жағдайда өзінің үлестірім функциясы арқылы беріледі.

Анықтама

кездейсоқ шамасының - үлестірім функциясы деп шамасының -тен кіші мәндер қабылдау ықтималдығын, яғни функциясын айтады. Мұнда -нақты сандар жиыны.

Үлестірім функциясының қасиеттері:

1.,

2.,

3. - кемімейтін функция, яғни егер болса, онда.

4. Егер кездейсоқ шаманың барлық мәндері интервалында жатса, онда

а) үшін,

б) үшін.

Кездейсоқ шамалар өздерінің қабылдайтын мәндер жиынына байланысты дискретті және үзіліссіз шамалар болып екіге бөлінеді.

Анықтама

Егер кездейсоқ шаманың қабылдайтын мәндер жиыны ақырлы немесе санамалы болатын болса, онда ол дискретті кездейсоқ шама деп аталады.

дискретті кездейсоқ шамасын үлестірім функциясымен емес, үлестірім қатарымен беру тиімді.

Дискретті кездейсоқ шаманың барлық қабылдайтын мәндерімен олардың қабылдау ықтималдықтарының арасындағы сәйкестік оның үлестірім заңы деп аталады.

дискретті кездейсоқ шамасының үлестірім заңын кесте арқылы берген ыңғайлы:

       
       

Мұнда,.

Анықтама

Егер кездейсоқ шаманың қабылдайтын мәндер жиыны ақырсыз болса, яғни ол мәндер бір сандық аралықты толық толтыратын болса, онда осы шама үзіліссіз кездейсоқ шама деп аталады.

Үзіліссіз кездейсоқ шаманың үлестірім функциясы -тың орнына әлбетте үлестірім тығыздығы -ты қолданады.

Анықтама

Үзіліссіз кездейсоқ шаманың үлестірім тығыздығы деп үлестірім функциясы -тың туындысын айтады:

.

Туындының анықтамасынан үлестірім тығыздығының ықтималдық мағынасы шығады:

яғни, айнымалы шамасының интервалында мәндер қабылдау ықтималдығының осы интервалдың ұзындығына қатынасының ғы шегі ықтималдықтың үлестірім тығыздығы -тің -гі мәніне тең.

Үлестірім тығыздығының анықтамасынан үлестірім функциясы –ың үлестірім тығыздығы үшін алғашқы функция болатындығы шығады.

Үлестiрiм тығыздығының қасиеттерi.

1. Кез-келген үшiн.

2.

3.. Егер болса, онда

Егер үлестiрiм тығыздығы белгiлi болса, онда үлестiрiм функциясы -тi мына формуламен табуға болады:

.

1.2. Кездейсоқ шамалар үлестiрiмiнiң сандық сипаттамалары.

Бас және таңдамалы жиындар математикалық статистика негiзiндерінің бірі болады.

Анықтама

Бас жиын -Байқау нәтижесiнде алынған кездейсоқ шаманың барлық мәндер жиыны.

Анықтама

Таңдамалы жиын(таңдама)- Байқау нәтижесiнде алынған бас жиынның тек бiр бөлiгi.

1.Бас жиын.

Дискреттi кездейсоқ шаманың математикалық күтiлуi (үміті) деп оның барлық мәндерiнiң сәйкес ықтималдықтарына көбейтулерiнiң қосындысын, яғни

қосындысын айтады.

Үзiлiссiз кездейсоқ шаманың математикалық күтiлуi деп

(немесе) санын айтамыз.

Кездейсоқ шаманың математикалық күтiлуi оның бас жиын мәндерiнiң орта мәнi болады.

Математикалық күтiлудiң негiзгi қасиеттерi:

1.,

2.,

3.,

4.,

5..

Егер әрбiр және мәндерi үшiн

болса, онда кездейсоқ шамалары өзара тәуелсiз шамалар деп аталады.

Салдар.

Егер пен өзара тәуелсiз кездейсоқ шамалар болса, онда

1.,

2.

Кездейсоқ шаманың теоретикалық (бас) дисперсиясы деп оның математикалық күтiлуiнен ауытқуының квадратының математикалық күтуiн айтады.

Сонымен, дискреттiк кездейсоқ шама үшiн

немесе.

Ал үзiлiссiз кездейсоқ шама үшiн

немесе

Дисперсия кездейсоқ шаманың орта мәнге қарағанда таралу өлшемi болады.

Дисперсияның квадраттық түбiрi кездейсоқ шаманың орта квадраттық (қалыпты) ауытқуы деп аталады:

Орта квадраттық ауытқу кездейсоқ шама мәндерi жиынының орта мәннен орташа қаншалықты ауытқуын көрсетедi.

Дисперсияның қасиеттерi:

1.;

2.;

3.;

Салдар. Егер Х,У кездейсоқ шамалары өзара тәуелсiз болса, онда:

1.,

2..

Математикалық күтілу мен дисперсия бас жиынның сандық сипаттамалары болады.

Егер кездейсоқ шаманың үлестіру тығыздығы болса, шамасы және параметрлі қалыпты үлестірілген дейді.

кездейсоқ шамасының қалыпты үлестірімі тек екі параметрден тәуелді, олар-математикалық күтілу (үміт) және дисперсия. Бұл жағдайда былай белгіленеді:

Қалыпты үлестірімді кездейсоқ шаманың орта мәні тан ауытқуының абсолют шамасы -нан кіші болу ықтималдығын

,,

формуласымен есептейді.

Мұнда - Лаплас функциясы.

1.3. Таңдамалы жиын .

Үлестірімі болатын көлемі -ге тең таңдамалы жиын теріп алынсын.

Таңдамалы байқаулар өзара тәуелсіз және олардың үлестірімдері бірдей болсын.

Таңдамалы орташа деп таңдамалы жиын бойынша мәндердің арифметиалық ортасын, яғни

мәнін айтады.

Таңдамалы дисперсия деп кездейсоқ шама мәндерінің арифметиалық ортадан ауытқуының квадраттарының арифметикалық ортасын, яғни

немесе

мәнін айтады.

Таңдамалы дисперсияның қасиеттері:

1.,

2.,

3 ..

және таңдамалы жиынның сандық сипаттамалары болады.

таңдамалы байқауларының өзара тәуелсіздігінен және олардың үлестірімдерінің бірдей болуынан мынандай қатынастар шығады:

,,;

мұнда.

Үлкен заңдар заңының негізгі шектік теоремасынан орта таңдамалы -тың жеткілікті үлкен сандары үшін қалыпты үлестіргендігі шығады, яғни

,

мұндай жағдайда

,.

1.4. Ковариация және корреляция.

Ковариация теоретикалық және таңдамалы болып екі түрге бөлінеді.

және кездейсоқ шамаларынның теоретикалық ковариациясы деп осы екі шаманың математикалық күтулерінен ауытқуларының көбейтінділерінің математикалық күтуін (үмітін) айтамыз, яғни

.

Теоретикалық ковариацияның қасиеттері:

1.,

2. Егер пен өзара тәуелсіз болса, онда

.

Егер болса, онда пен шамалары оң (тура) коррелденді дейді, ал егер болса, онда теріс (кері) коррелденді дейді.

айнымалыларының таңдамалы ковариациясы деп осы айнымалылардың өздерінің орта мәндерінен ауытқуларының көбейтінділерінің орта мәнін, яғни

немесе санын айтады. Мұнда - айнымалыларының таңдамалы орталары.

теңдігі орындалады.

Таңдамалы ковариация екі айнымалының арасындағы байланыс өлшемі болады.

Екі шама арасы байланысының дәлірек өлшемін корреляция коэффициенті береді.

Корреляция коэффициенті теоретикалық және таңдамалы болып екіге бөлінеді.

Теоретикалық корреляци коэффициенті

,

өрнегімен анықталады. Мұнда - кездейсоқ шамаларының орта квадраттық ауытқулары.

.

Корреляция коэффициенті екі айнымалы шамалардың сызықтық байланысының тарлығын көрсетеді:

Оң байланыста және қатаң оң сызықтық байланыста болады.

Теріс байланыста және қатаң теріс сызықтық байланыста болады;

Сызықтық байланыс болмаған жағдайда болады.

Егер болса, онда және кездейсоқ шамаларын өзара коррелденбеген, егер өзара коррелденген шамалар дейді.

Қасиеттері:

1. теңдігі олардың арасындағы сызықтық байланыстың жоқтығын көрсетеді, бұл жағдайда басқалай байланыс болуы мүмкін.

2. Бас жиын үшін болуынан міндетті түрде таңдамалы жиын үшін теңдігі шықпайды.

Таңдаманы корреляция коэффициенті

,

формуласымен анықталады.

Мұнда.

Егер болса, онда және кездейсоқ шамалары коррелденбеген және олар өзара тәуелді де тәуелсіз де болуы мүмкін. Егер болса, онда пен коррелденген.

Бұдан корреляция коэффициенті -дің пен арасындағы сызықтық байланыстың (тарлығының) дәрежесін көрсететіні шығады.

Таңдамалы корреляция коэффициенті кездейсоқ шама болады.

1.5. Үлестірім параметрлері. Нүктелік және интервалдық бағалаулар.

Бас жиынның сипаттамалары әлбетте белгісіз болады. Сондықтан таңдамалы жиын арқылы олардың сиппатамаларын бағалау қажеттігі туады.

Бас жиынның сипаттамаларын параметрлер, ал таңдамалы жиындыкін – бағалау деп атау қалыптасқан.

Бір санмен анықталатын бағалауды нүктелік бағалау дейді

Интервалдық бағалау деп екі санмен- интервалдың шеткі нүктелерімен анықталатын бағалауды айтады. Интервалдық бағалаулар бағалаудың дәлдігін және сенімділігін көрсетіп береді.

Берілген сенімділігімен белгісіз параметрді жабатын интервалын сенімділік интервалы дейді. Кездейсоқ шама болатын бағаланатын параметр емес, сенімділік интервалы болатындықтан -ның сенімділік интервалынан мән қабылдау ықтималдығы туралы емес, сенімділік интервалының -ның мәндерін жабу ықтималдығы туралы айту керек.

Сенімділік интервалдар әдісін Американ статистігі Ю.Нейман ағылшын статистігі Р.Фишердің ойларын дамыта отырып құрды.

бағасын классикалық баға дейді, мұнда.

Классикалық бағаның дәлдігін анықтайтын теңдігінен мынандай тұжырымдар шығады:

1. Таңдамалы көлемі өскен сайын саны кемиді, сондықтан бағаның дәлдігі артады.

2. Баға сенімділігі өссе -да өседі. Сондықтан, -өспелі функция болғандықтан, саны да өседі. Басқаша айтсақ классикалық бағаның сенімділігі өссе, оның дәлдігі кемиді.

Бас жиынның ізделінетін параметрі болсын, ал ол көлемді таңдамалы арқылы анықталатын болсын.

Таңдамалы баға бағалайтын параметрдің жақсы жуықтауы болуы үшін, ол белгілі сұраныстарды қанағаттандыруы керек. Олар: ауытқуланбағандық, әсерлілік, тиянақтылық.

Егер бағасының математикалық күтілуі бағаланатын параметрге таңдаманың кез-келген көлемінде тең болса, яғни теңдігі орындалса, онда - ауытқымайтын баға деп аталады, ал айырымы- ауытқу деп аталады

теңдігі орындалатындықтан, бас орта шамасының ауытқымайтын бағасы болады.

Таңдамалы дисперсия бас дисперсия шамасының ауытқыған бағасы болады және

.

теңдігі орындалады.

Бас дисперсияның ауытқымайтын бағасы ретінде

.

шамасы (түзетілген дисперсия) қолданылады. Мұнда.

шамасы таңдамалыдағы кездейсоқ шаманың қалыпты ауытқуы деп аталады.

Егер басқа таңдамалы бағаларға қарағанда ауытқымайтын баға -ның дисперсиясы ең кіші, яғни болатын болса, онда бағасы әсерлі деп аталады.

Таңдамалы орташа бас орташаның әсерлі бағасы болады, яғни ол ауытқымайтын бағалар классында ең кіші дисперсияға ие.

Егер болғанда ықтималдылық бойынша болса, яғни

теңдігі орындалса, онда бағасы тиянақты деп аталады. Үлкен сандардың Чебышев теоремасы бойынша

.

Сондықтан таңдамалы орташа шамасы бас орташа шамасының тиянақты бағасы болады.

1.6. Статистикалық болжамдарды тексеру.

Статистикалық болжам деп белгісіз үлестірімнің түрі туралы немесе белгілі үлестірімнің параметрлері туралы болжамды айтады.

Мысалы, статистикалық болатын мынандай болжамдар бар:

1. Бас жиын Пуассон заңы бойынша үлестірілген;

2. Қалыпты үлестірілген екі жиынның дисперсиялары өзара тең.

Бірінші болжамда үлестірудің түрі туралы айтылады, ал екіншіде- екі белгілі үлестірімнің параметрлері туралы сөз болады.

Болжам «Марста өмір бар» статистикалық болмайды, өйткені мұнда үлестірімнің түрі немесе оның параметрлері туралы айтылмайды.

Қабылданған болжамын нөлдік (негізгі) болжам дейді.

Балама (альтернативті) болжам деп нөлдік болжамға қарама-қайшы болжамын айтады.

Қабылданған болжам дұрыс және бұрыс болмауы мүмкін, сондықтан оны тексеру қажеттігі туындайды. Статистикалық болжамды тексеру кезінде екі түрлі қателік болуы мүмкін.

Бірінші қателік дұрыс болжам қабылданбағандықтан болады.

Екінші қателік қате болжам қабылданғаннан болады.

Бұл қателердің салдарлары әртүрлі болулары мүмкін.

Ескерту. Бірінші түрлі қателердің болу ықтималдығын әрпімен белгілеу қабылданған. Оның маңыздылық деңгейі деп атайды. Маңыздылық деңгейін көбінесе 0,05-ке немесе 0,01 (5 % немесе 1 %) тең етіп алады.

Мысалы, егер маңыздылық деңгейін 0,05-ке тең етіп алса, онда бірінші түрлі қатенің (дұрыс болжамды қабылдамау) болу жағдайы 100-дің 5-інде болуы мүмкін болады.

Нөлдік болжамды тексеру үшін дәл немесе жуық үлестірімі белгілі арнайы таңдалған кездейсоқ шаманы қолданады. Бұл шаманы қалыпты үлестірілген болса немесе әрпімен, Фишер-Снедекор заңымен үлестірілген болса немесе әрпімен, Стьюдент заңымен үлестірілген болса әрпімен, «хи квадрат» заңымен үлестірілген болса әрпімен белгілейді. Егер үлестірім түрі есепке алынбайтын болса, онда кездейсоқ шама әрпімен белгілейді.

Статистикалық критерий (немесе критерий) деп нөлдік болжамды тексеруге пайдаланатын кездейсоқ шамасын айтады. Мысалы, қалыпты үлестірілген бас жиындардың дисперсияларының теңдігі туралы болжамды тексеру керек болса, онда критерий ретінде түзетілген таңдамалылық дисперсиялардың қатынасын қолданады:

.

Бұл шама кездейсоқ, өйткені әртүрлі тәжірибелерде дисперсиялар әртүрлі, алдын-ала белгісіз мәндерді қабылдайды және Фишер-Снедекор заңы бойынша үлестірілген.

Таңдамалалылардың берілулері бойынша болжамды тексеру үшін критерийге кірген шамалардың дербес мәндерін есептейді, сондықтан критеридің дербес мәнін алады.

Таңдаманың берілулері бойынша есептелген критеридің мәні байқалған мән деп аталады, ол таңбасымен белгіленеді.

Нөлдік критерийді жоққа шығаратын критерийдің мәндер жиыны күдікті облыс деп аталады.

Нөлдік критерийді қабылдайтын критерийдің мәндер жиыны болжамды қабылдау облысы (болжамның анықталу облысы) деп аталады.

Статистикалық болжамды тексерудің негізгі принципін былай айтуға болады:

Егер критерийдің байқалған мәні күдікті облыста жатса, онда болжамды қабылдамайды, ал критерийді қабылдау облысында жатса -болжамды қабылдайды.

Күдікті нүктелер (шекаралар) деп күдікті облыс пен болжамды қабылдау облысын ажыратып тұрған нүктелерді айтады. Ол таңбасымен белгіленеді. Күдікті нүктелерді берілген маңыздылық деңгейі мен еркіндік дәрежелер санында таңдалған критерийінің үлестірімінің кестесі бойынша анықтайды.

Критерийдің байқалған мәнін күдікті нүктелермен салыстыра отырып, нөлдік болжамды қабылдайды не қабылдамайды.

Кездейсоқ шамалардың корреляциясы туралы болжамды тексеру.

Көлемі -ге тең таңдаманың берілімдері бойынша таңдаманы корреляция коэффициенті анықталған болсын. Корреляция коэффициентінің нақты мәнінің нөлге теңдігі туралы болжамды, яғни

өрнегін тексеру керек.

болжамын тексеру критерийі ретінде

кездейсоқ шамасы алынады.

болжамы дұрыс болған жағдайда шамасы еркіндік дәрежелер саны бар Стьюдент заңы бойынша үлестіріледі.

Критерий -ң байқалған мәнін берілген маңыздылық деңгейімен еркіндік дәрежелер саны бойынша кестеден алынған күдікті мән мен салыстыра отырып, мынадай қорытынды шығарамыз:

Егер болса, онда қабылданады, яғни айнымалылар арасында сызықты байланыс жоқ;

Егер болса, онда қабылданбайды, яғни айнымалылар арасында сызықты байланыс бар.

2-ші тақырып. Жұптық регрессияның моделі.

2.1. Экономикалық зерттеулердегі сызықтық регрессия және корреляция. Регресстік және корреляциялық талдаудың мәні және тапсырыстары. Ең кіші квадраттар әдісі. Регресстік талдаудың алғы шарттары.

Функциялық қатынас (тәуелділік) бірайнымалының әрбір мәніне екінші айнымалының нақты мәні сәйкес келетін дәл формула арқылы беріледі. Кездейсоқ факторлардың әсері мұнда есепке алынбайды.

Статистикалық тәуелділік деп айнымалылардың кездейсоқ құбылыстар әсер ететін байланысын айтады. Мұндай жағдайда бір айнымалының өзгеруі екінші айнымалының математикалық күтуінің өзгеруіне әкеп соғады. Осындай статистикалық тәуелділікті корреляциялық тәуелділік дейді.

Белгiлер ортасындағы байланыстар сипатына қарай екi түрге бөлiнедi: 1) функционалдық байланыс; 2) корреляциялық байланыс.

Фактор белгiсiнiң әрбiр мәнiне нәтижелiк белгiнiң бiр яки бiрнеше анық мәнi әрқашан сәйкес келiп тұрса, бұндай байланыс функционалдық байланыс деп аталады. Функционалдық байланыстың маңызды ерекшелiгi сол, онда барлық факторлардың толық тiзiмiн және олардың нәтижелiк белгiмен байланысын толық бейнелейтiн теңдiктi жазуға болады.

Факторларының санына қарай функционалдық байланыстар бiр немесе көп факторлы болып келедi. Олар әлеуметтiк пәндерге қарағанда анық пәндер саласында көбiрек қолданылады. Өйткенi функционалдық байланыстар табиғи құбылыстар ортасында жиi кездеседi.

Факторлардың әрбiр мәнiне түрлi уақыт және мекен жағдайында нәтижелiк белгiнiң анық мәндерi емес, әр түрлi мәндерi сәйкес келетiн байланыс түрi корреляциялық байланыс немесе қатынас деп аталады. Корреляциялық байланыстың өзiндiк ерекшелiгi сол, онда факторлардың толық саны беймәлiм болады.

Корреляция латынның с orrelation сөзiнен алынып, өзара қарым-қатынас, үндестiк, байланыстылық деген ұғымды бiлдiредi. Бұл терминдi статистика пәнiне ХІХ ғасырдың аяғында ағылшын биологы әрi статисi Френсис Гальта енгiзген. Бiрер X белгiнiң әрбiр мәнiне келесi айнымалы У белгiнiң бөлiнiсi сәйкес келсе, ондай байланыс корреляциялық байланыс деп аталады.

Қарастырылып отырған жинақтың бөлiнiске сай немесе оған жақын формада болса, корреляциялық кестенiң ортасына орналасқан X пен У -тiң жұп мәнi әдетте ең үлкен қайталану санына ие болады. Оған орай кесте төрт торкөзге бөлiнедi. Бiрiншi торкөз кестенiң сол жағының жоғарғы бөлiгiне орын тепкен X пен У мәндерiнен және олардың қайталану сандарынан құралады.

Одан төменiректе екiншi торкөз, оң жақ бөлiкте үшiншi торкөз орналасады. Екiншi торкөз X -тiң үлкен мәндерiне сәйкес келетiн У -тiң шағын мәндерiн және олардың жұптарына арналған қайталану сандарын қамтиды. Ал үшiншi торкөз керiсiнше X -тiң шағын мәндерiне сәйкес келетiн У -тiң үлкен мәндерiн және олардың жұпталып қайталану сандарын қамтиды.

Ең соңғы — төртiншi торкөз бiрiншi торкөздiң қарама-қарсы жағдайы ретiнде X пен У -тiң өзара сәйкес келетiн үлкен мәндерiнен және олардың қайталану сандарынан құралады.

Шынайы бақыланған X пен У бөлiнiстердiң осы торкөздерге орналасуына қарап, олардың арасында байланыстың бар не жоқ екендiгi, егер бар болған жағдайда оның сипаты туралы бастапқы жалпы пiкiр бiлдiруге болады. Мәселен, шынайы бөлiнiстiң қайталану сандары барлық торкөздер бойынша бейберекет шашылып жатса, ол X және У белгiлер арасында байланыс жоқтығын бiлдiредi. Басқа жағдайларда олардың торкөздер бойынша орналасуы белгiлi тәртiптегi ағымдар бағытына ие болады. Демек, бұндай кездерде X және У белгiлер арасында байланыс бар екендiгi туралы болжам жасасақ орынды болып саналады.

Байланыс өзгерiстiң бағыттарына қарай дұрыс, не керi болып бөлiнедi. Егер белгiнiң көбеюiне (азаюына) қарап, нәтижелiк белгi де көбейсе (азайса), онда олардың ортасындағы байланыс дұрыс байланыс болып табылады.

Талдау өрнектерiнiң көрiнiсiне орай байланыстар тура сызықты (сызықты) және қисық сызықты (немесе сызықсыз) болып келедi. Егер байланыстың теңдеуiнде факторлық белгiлер (X1, X2,... Xk) тек бiрiншi дәрежемен ғана қатысып, олардың жоғары дәрежелерi мен аралас көбейтiндiлерi қатыспаса, яғни көрiнiсiнде болса, онда ол сызықты байланыс деп, яки фактор жалғыз болған жағдайда тура сызықты байланыс деп аталады.

Өрнегi тура сызықты (яки сызықты) теңдеу емес байланыс қисық сызықты (немесе сызықсыз) байланыс деп аталады. Анығырақ айтқанда, парабола немесе гипербола немесе көрсеткiштi y=а0ха немесе және басқа көрiнiстер бойынша өрнектелетiн байланыстар қисық сызықты (немесе сызықсыз) байланысқа мысал болады.

Статистикада өзара байланыстарды оқып-үйрену үшiн арнайы әдiстер пайдаланылады. Соның iшiнде функционалдық байланыстарды тексеру үшiн баланстар мен индекстер әдiсi, ал корреляциялық байланыстарды үйрену үшiн паралель қатарлар, аналитикалық топтастыру, дисперсиялық талдау, регрессиялық және корреляциялық талдау әдiстерi кең қолданылады.

Корреляциялық байланыстарды оқып-үйрену кезiнде екi бағыттағы мәселеле туындайды. Бiрiншiсi, қарастырылып отырған құбылыстар (белгiлер) арасында қаншалықты тығыз (күштi не әлсiз) байланыс бар екенiн бағалаудан тұрады. Бұл — корреляциялық талдау деп аталатын әдiстiң мiндетi.

Корреляциялық талдау корреляция коэффициенттерiн анықтау мен олардың маңыздылығын, сенiмдiлiгiн бағалауға негiзделедi.

Корреляция коэффициенттерiнiң екi жақты сипаты бар. Оларды есептеу нәтижесiнде алынған мәндердi X және У белгiлер немесе У және X белгiлер арасындағы байланыс мөлшерi деп қарауға болады.

Корреляциялық байланысты тексерудiң екiншi мiндетi — бiр құбылыстың өзгерiстерiне қарап, екiншi құбылыстың қаншалықты өзгеретiнiн анықтау болып табылады. Өкiнiшке орай корреляциялық талдау әдiсi — корреляция коэффициенттерi бұл жөнiнде пiкiр жүргiзуге мүмкiндiк бермейдi. Бұл мақсатқа регрессиялық талдау деп аталатын басқа әдiс қызмет етедi.

Регрессия сөзi латынның regressio сөзiнен алынып, артқа қарай қозғалу деген мағынаны бiлдiредi. Бұл терминнiң статистикаға кiрiп келуi де корреляциялық талдаудың негiзiн қалаған Ф.Гальтон, К.Пирсондардың есiмiнен тiкелей байланысты.

Регрессиялық талдау практикалық мәселелердi шешуде маңызды рөл атқарады. Ол нәтижелiк белгiге ықпал жасайтын белгiлердiң тиiмдiлiгiн практикалық тұрғыдан жеткiлiктi дәрежеде анық бағалау мүмкiндiгiн бередi. Сонымен қатар регрессиялық талдаудың көмегiмен экономикалық құбылыстардың болашаққа арналған мөлшерлерiн бағалауға және олардың ықтималдық шегiн анықтауға болады.

Регрессиялық және корреляциялық талдауда байланыстың регрессиялық теңдеуi анықталады және ол белгiлi ықтималдық (сенiмдiлiк) дәрежесiмен бағаланады, сосын экономикалық-статистикалық талдау жасалады.

Сондықтан да регрессиялық және корреляциялық талдау төмендегiдей 4 сатыдан тұрады:

1) мәселенiң қойылуы және алғашқы талдау;

2) мәлiметтердi жинау және оларды үйрену;

3) байланыстың формасы мен регрессиялық теңдiктi анықтау;

4) регрессиялық теңдiктi бағалау және талдау.

Екі айнымалының статистикалық байланысының формуласын жұптық регрессия, ал екіден көп айнымалылардың байланысын көп өлшемді (жиындық) регрессия дейді.

Жұптық регрессия моделінде бас жиын айнымалыларының арасындағы байланыс

Y=

түрінде беріледі.

Мұнда Х-кездейсоқ емес шама,ал Y- және -кездейсоқ шамалар.

Y-шамасы анықталатын (тәуелді) шама,ал Х-анықтайтын (тәуелсіз) шама болады. теңдеудің параметрлері.

кездейсоқ шамасының (регрессиялық қатесінің) бар болуы тәуелді шамаға теңдеуде есепке алынбаған басқа факторлардың әсер ететіндігімен, модельдің сызықты емес болу мүмкіндігімен және өлшеу кезіндегі қателермен түсіндіріледі.

Таңдамалы байқау негізінде регрессияның (регрессия сызығының) теңдеуі

бағаланады.Мұнда мәндері () параметрлерінің бағалары.

шамаларының белгісіз мәндері ең кіші квадрат әдісімен анықталады.

Ең кіші квадрат әдісінің мағынасы ол қалдықтар квадраттарының қосындысын минимализациялау болады,яғни

Мұнда = - ші бақылаудағы қалдық, яғни тәуелді шаманың нақты мен есептелген мәндерінің айырымы, -байқаудың белгілі мәндері, -белгісіздер,

Сонымен функциясының ең кіші мәнін қабылдайтын нүктесін табамыз. Ол үшін функциясының мен айнымалылары бойынша туындыларын тауып, оларды нөлге теңестіреміз. Яғни екі айнымалылы функцияның экстремумының қажетті шартын пайдаланамыз.

Бұл жүйені және арқылы шешейік

,,,

Сонымен а мен b -ны таба отырып, ізделініп отырған регрессия сызығын табамыз:

немесе.

- регрессияның сызықтық коэффициенті, ол тәуелсіз шама х бірге өскенде у айнымалы шамасының қанша бірлікке өсетінін көрсетеді.

Корреляцияның сызықтық коэфиценті,

(мұнда, - Х және У айнымалыларының таңдамалы дисперсиялары) регрессия коэффицентіне қарағанда байланыстың тарлығының дәлірек көрсеткіші болады.

- тұрақтысы тәуелді шаманың дегі болжамдық мәнін береді. Мұның дәлдігі таңдамалы шама -тің нүктесінен қаншалықты алыста орналасуына байланысты.

Регрессия теңдеуін құрғаннан кейін байқалатын у-тің мәндерін

түрінде беруге болады. Қалдықтар және қателер і кездейсоқ шамалар болады. Бірақ тек - лер байқалатын шамалар болады.

Регрессиялық анализдің негізгі мақсаты –айнымалылар арасындағы байланыстарды зерттеу және оларды табу.

Корреляциялық анализдің негізгі мақсаты- кездейсоқ шамалардың арасындағы байланыстарды табу және олардың тарлықтарын бағалау.

Регрессиялық анализдің алғашқы тұжырымдары:

1. -тәуелді шамасы (немесе - қозғатушысы) кездейсоқ шама болады, ал анықтаушы айнымалы – кездейсоқ емес шама болады.

2. - қозғатушысының математикалық күтімі нөлге тең:

3. Айнымалы шама –ң (немесе - қозғатушысының) дисперсиясы кез-келген үшін тұрақты:

4. мен айнымалы шамалары (немесе және қозғатушылары) коррелденбеген:

5. тәуелді шамасы (немесе қозғатушысы) – қалыпты үлестірілген кездейсоқ шама.

2.2. Коррелляция мен сызықтық регрессияның параметрлерінің маңыздылығын бағалау. Регрессиялық модельдердегі болжамдар. Регрессия коэфициенттерінің стандартты қателерін есептеу.

Регрессия деңгейінің маңыздылығын бағалау дегеніміз, ол айнымалылардың тәуелділіктерін өрнектейтін математикалық модельдің тәжірибелік ақпараттарға сәйкес келетіндігінін тексеру және теңдеудің құрамындағы анықтайтын айнымалылардың (бір немесе бірнеше) анықталатын айнымалыны сипаттауға жеткіліктілігін тексеру.

Регрессия теңдеуінің маңыздылығын бағалау дисперсиялық талдау негізінде жүргізіледі. Дисперсиялық талдаудың негізгі міндеті факторлардың әсерімен туындаған факторлық дисперсиямен кездейсоқ себептер арқылы шыққан қалдық дисперсиялардың теңдігі туралы нөлдік болжамды тексеру.

Егер осы дисперсиялардың ұқсас еместігі қомақты болса, онда фактор нәтижеге үлкен әсер етеді, сондықтан нөлдік болжамды қабылдаудан алып тастайды.

Тәуелді шама -тің орта мәні тен ауытқуларының квадраттарының жалпы қосындысын, анықтайтын айнымалы тың әсерінен шыққан ауытқулар квадраттарының қосындысын, есепке алынбаған факторларды сипаттайтын квадраттардың қалдық қосындыларын қарастыралық:

Sжалпы=, Sфакт =, Sқалд =

немесе Sжалпы = Sфакт + Sқалд+

TSS=ESS+RSS, яғни Sжалпы Sфакт + Sқалд орындалу қажет.

Ауытқулар квадраттарының қосындысын сәйкес еркіндік дәрежелер санына бөле отырып, жалпы, факторлы және қалдық дисперсияларды табамыз:

;;.

Егер статистика мәні үшін

Немесе

болса, онда регрессия теңдеуі маңызды деп есептелінеді.

Мұнда корреляция индексі (корреляциялық катынас),

, - детерминация коэффициенті, -еркіндік дәрежелері және (- регрессия теңдеуінің параметрлер саны), маңыздылық деңгейі болатын Фишер-Снедекордың -критериінің кестелік мәні.

Эконометрикада болжау ретінде берілген байқауларда жоқ тәуелсіз айнымалылардың кейбір жиыны үшін бағалауды құруды түсінеді.

Болжаулар нүктелік және интервалдық болып бөлінеді. Бірінші жағдайда баға санмен, ал екінші жағдайда берілген маңыздылық деңгейі бар тәуелді шаманың дәл мәні жатқан интервалмен беріледі.

регрессия моделін қараймыз.

Тәуелді шаманың болғандағы мәні

болады. Мұнда,, мәндері белгісіз.

Болжанған мәні (нүктелік болжам)

өрнегімен табылады. Болжам қатесі болжанған мән мен нақты мәннің айырымына тең:

.

Болжам қатесінің математикалық күтілуі нөлге тең:

Болжамның дисперсиясын есептейік.

Жұптық регрессияда

болатындықтан болжам дисперсиясы үшін:

формуласы шығады.

Бұл формуладан мәнінің таңдамалы орта мәнінен ауытқуы өскен сайын болжам қатесі дисперсиясының да өсетіндігі және таңдамалы көлемі n өскен сайын дисперсияның кемитіндігі шығады.

Болжам дисперсиясында ты пен ауыстыра отырып және квадрат түбір ала отырып, болжамның қалыпты қатесін аламыз:

. Нақты мәні үшін сенімділік интервалы

теңсіздіктерімен анықталады. Мұнда -еркіндік дәрежесі n-2 және берілген маңыздылық деңгейдегі t-Стьюдент статистикасының күдікті мәні. (до сих пор напечатано, мадам.)

2.3. Сызықты емес регрессия.

Әлеуметті – экономикалық құбылыстар мен процестердің байланысын сызықтық функциялармен өрнектеу көп жағдайда мүмкін емес, өйткені мұндай жағдайда себепсіз үлкен қателерге келуіміз мүмкін. Сондықтан мүмкіндігінше сызықты емес регрессияны қолданады.

Регрессия теңдеуін таңдау корреляциялық кеңістіктегі нүктелердің орналасуларын зерттеу арқылы жүргізіледі. Регрессияның сызықты еместігі айнымалылар бойынша да, параметрлер бойынша да болуы мүмкін.

Айнымалылар бойынша сызықты еместік айнымалыны ауыстыру арқылы жөнделінеді. Мысалы:

-сызықты теңдеуін түрлендіруі арқылы сызықты теңдеуіне келтіруге болады. теңдеуі түрлендіруі арқылы сызықтық түріне келеді.

Параметр бойынша сызықты еместік көбінесе логарифмдік түрлендіру бойынша түзетіледі.

Мысал. ~;

~.

Экономикада түріндегі функциялар сұраныс қисықтарын моделдеуде қолданылады, ал -уақытылы тендерлерді моделдеуде қолданылады.

Сызықты емес регрессия теңдеулері, түрлерінде кездеседі. Мұнда бірінші -көрсеткіштік функция, екінші – гиперболалық, ал үшінші – параболалық функциялар.

Белгісіз параметрлерін анықтау үшін ең кіші квадраттар әдісі қолданылады.

Осы әдіс бойынша қалыпты теңдеулер жүйелерінің түрлері:

1. көрсеткіштік функция үшін,

2. гиперболалық функция,

3. параболалық функция.

Экономикалық талдауда функцияның икемділігі (эластичность) жиі қолданылады. функциясының икемділігі

Формуласымен есептелінеді.

Функцияның икемділігі тәуелсіз шама 1 %-ке өскенде, функциясы қанша пайызға өскендігін көрсетеді. сызықтық функциясының икемділігі

тұрақты емес, ол x-ке тәуелді болғандықтан, әдетте осы формуланың икемділігінің орта көрсеткішін есептейді:

Мұнда - x пен y айнымалыларының таңдамалыдағы орта мәндері.

Мысалы тамақ шығынының табыстан тәуелділігі өрнегімен берілсін. болсын. Сонда

Икемділігінің орта мәні 0,55 табыс 1%- ке өскенде, тағамға шығынның орташа 0,55% өсетінін көрсетеді.

Дәрежелік функция -ның икемділігі тұрақты шама болады:

Тамаққа шығынның табыстан тәуелділігі

болсын. Сонда табыс бойынша азық түлік бұйымдарына сұраныстың икемділігі 0,374 болады. Бұл деген, жеке табыс 1 % ұлғайғанда азық-түлік бұйымдарына шығынның 0,374 % өсетіндігін көрсетеді.

Коэффициент мәні 6,13 экономикалық мағынасы жоқ. Ол x пен -ті ортақ масштабқа келтіру арқылы x-тің берілген мәндері бойынша y-тің мәндерін болжауға көмектеседі.

3-ші тақырып. Жиындық регрессияның моделі..

3.1. Жиындық регрессия. Тәуелсіз шама вариациясын талдау.

Бір анықтаушы айнымалысы бар сызықты регрессияның моделінің жалпы түрі анықтаушы айнымалысы бар сызықты регрессия моделі болады. Ол жиындық регрессия моделі деп аталады, былай жазылады:

.

Мұнда - моделдің параметрлері, ал - кездейсоқ мүше. Кездейсоқ мүше жұптық регрессия моделіндегі сияқты алғышарттарды қанағаттандырады.

Анықтаушы айнымалылар бір-бірімен коррелденбеген болсын. байқаудың негізінде регрессияның таңдамалы теңдеуі бағаланатын болсын.

Мұнда - параметрлерінің бағалары. Регрессия парамтерлерін бағалау үшін ең кіші квадраттар әдісі қолданылады. Осы әдіс бойынша қалдықтар квадраттарының қосындысы

минимизацияланады.

Оның минимумының қажетті шарты параметрлері бойынша дербес туындыларының нолге тең болуы болады. Осы дербес туындыларды нолге теңестіре отырып, к+1 белгісізі бар к+1 сызықтық теңдеулер жүйесіне келеміз. Бұл жүйе нормалдық (қалыпты) теңдеулер жүйесі деп аталады. Жүйенің шешімі әдетте матрицалық түрде жазылады.

Модел параметрлерінің бағалары және олардың теоретикалық дисперсиялары матрицалық түрде мынандай өрнектермен анықталады:

,,

мұнда - вектор компоненттері;

- анықтайтын айнымалылардың мәндерінің матрицасы;

- тәуелді айнымалылар мәндерінің векторы;

- кездейсоқ мүшенің дисперсиясы.

-ң ауытқымайтын бағасы (қалдық дисперсия):.

S –шамасы регрессияның стандарттық қатесі деп аталады.

Теоретикалық дисперсияларда белгісіз дисперсия -ты оның бағасы ауыстыра отырып және түбірден шығара отырып, регрессия коэффициенттері бағаларының стандартты қателерін табамыз:.

Егер кездейсоқ шамаға қойылған талаптар орындалатын болса, онда жиындық регрессияның параметрлерінің бағалары ауытқымаған, орнықты және маңызды болады.

Компьютерлік бағдарламаларда регрессиялық коэффициенттер және олардың стандартты ауытқулары бірмезгілде есептелінеді.

Регрессия теңдеуінде анықтаушы айнымалылар болсын дейік. Тәуелді айнымалының дисперсиясы түсіндірілген және түсіндірілмеген қосылғыштарға жіктелетін болсын:

.

Таңдамалы дисперсияның анықтамасын қолдана отырып, бұл теңдеуді былай жазамыз:.

Белгілеулер енгіземіз: - тәуелді шаманың жалпы шашылуы;

- регрессиямен түсіндірілген шашылуы;

- регрессиямен түсіндірілмеген шашылуы.

Сонда=+.

Жақшаның ішінде теңдеудің әрбір мүшесіне сәйкес еркіндік дәреженің саны көрсетілген.

Анықтауыш коэффициенті айнымалы шама шашырауындағы түсіндірілген бөліктің үлесі болады:


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: