Mis on regressioon?
Regressioonianalüüs on statistikal põhinev mõõtmine, mida kasutatakse rahanduses, investeerimises jms., Mille eesmärk on luua seos sõltuva muutuja ja teiste sõltumatute muutujate seeriate vahel ning peamine tähelepanu on ülaltoodud seose tugevuse määramisel.
Seletused
- Regressioonianalüüsi selgitamiseks võhikuna oletame, et ettevõtte müügijuht üritab järgmise kuu müüki kõvasti prognoosida. Toote müüki juhivad arvukad tegurid, alates ilmast kuni konkurendi uue strateegia, festivali ja tarbijate elustiili muutumiseni.
- See on meetod, kuidas viia kokku müüki mõjutavad mitmed tegurid, millel on suurim mõju. See võib aidata vastata paljudele küsimustele, näiteks mis on kõige olulisemad tegurid, millised tegurid on vähem olulised, milline on nende tegurite suhe ja mis kõige tähtsam, milline on nende tegurite käendus.
- Neid tegureid nimetatakse muutujateks. Peamist tegurit, mida proovime prognoosida, nimetatakse sõltuvaks muutujaks ja muid tegureid, millel on sõltuvale muutujale mõju, nimetatakse sõltumatuteks muutujateks.
Valem
Excelis saab lihtsat lineaarset regressioonanalüüsi väljendada järgmise valemina ja see mõõdab sõltuva muutuja ja ühe sõltumatu muutuja vahelist suhet.
Y = a + bX + ϵSiin:
- Y - sõltuv muutuja
- X - sõltumatu (selgitav) muutuja
- a - pealtkuulamine
- b - kalle
- ϵ - jääk (viga)
Kuidas tõlgendada regressioonianalüüsi?
Seda saab tõlgendada, eeldades lihtsat stsenaariumi. Siinkohal vaatleme oksjonil olevate antiikesemete hindade ja selle vanuse kestuse suhet. Mida rohkem vanavara vananeb, seda suurema hinna see saab. Eeldades, et oleme määranud andmed viimase 50 enampakkumisel olnud eseme kohta, võime objekti vanuse põhjal ennustada, millised on tulevased oksjonihinnad. Neid andmeid kasutades saame luua regressioonivõrrandi.
Regressioonivalem, mis saab vanuse ja hinna vahelise seose luua, on järgmine:
y = β0 + β1 x + viga- Siin on sõltuv tegur Y. Y tähistab iga enampakkumisel oleva objekti hinda, samas kui sõltumatu tegur on X, mis määrab vanuse.
- Parameetrid β0 ja β1 on parameetrid, mis ei ole teada ja mida saab võrrandiga hinnata.
- β0 on konstant, mida kasutatakse Y-telje lõikava lineaarse suundjoone määratlemiseks.
- β1 on konstant, mis näitab sõltuva muutuja väärtuse muutuse suurust sõltumatute muutujate eeldatava muutuse seotud funktsioonina.
- Seda nimetatakse põhimõtteliselt võrrandi kallakuks. Kui kalle on vooder, tähendab see, et vanuse ja hinna vahel on proportsionaalne suhe ja kui kalle on pöördvõrdeline, tähendab see, et suhe on kaudselt proportsionaalne.
- Vea võib defineerida kui müra või variatsiooni sihtmuutuja ja on juhuslik iseloomuga.
Regressioonianalüüsi näited reaalses elus
Oletame, et peame looma seose toimunud müügi ja tootega seotud reklaamile kulutatud summa vahel.
Üldiselt võime täheldada positiivset suhet müügikoguse ja reklaamiks kulutatud summa vahel. Lihtsa lineaarse regressiooni võrrandi abil saame:
Y = a + bXOletame, et saame väärtuse nimega
Y = 500 + 30x
Tulemuste tõlgendamine:
Prognoositav kalle 30 aitab meil teha järelduse, et keskmine müük suureneb 30 dollarit aastas, kui kulutused reklaamile suurenevad.
Regressioonianalüüsi tüübid
# 1 - lineaarne
Seda saab väljendada alltoodud valemina ja see mõõdab sõltuva muutuja ja ühe sõltumatu muutuja vahelist suhet.
# 2 - polünoom
Selles meetodis kasutatakse analüüsi ühe sõltuva teguri ja mitme sõltumatu muutuja vahelise seose mõõtmiseks.
# 3 - logistiline
Siin on sõltuv tegur või muutuja binaarse iseloomuga. Sõltumatud muutujad võivad olla pidevad või binaarsed. Multinomiaalse logistilise regressiooni korral võime endale lubada rohkem kui kahe kategooria olemasolu, valides samal ajal oma sõltumatu muutuja.
# 4 - kvantiil
See on lineaarse regressiooni aditiivne mõiste ja seda kasutatakse peamiselt siis, kui andmetes esinevad välissuunad ja kalduvus.
# 5 - elastne võrk
See on kasulik, kui käsitletakse väga kõrge korrelatsiooniga sõltumatuid muutujaid.
# 6 - peamiste komponentide regressioon (PCR)
See on tehnika, mida saab kasutada juhul, kui andmetes on liiga palju sõltumatuid muutujaid või kui multikollineaarsus on olemas
# 7 - osalised kõige väiksemad ruudud (PLS)
See on põhikomponendi vastupidine meetod, kus sõltumatud muutujad on omavahel korrelatsioonis. See on rakendatav ka siis, kui on palju sõltumatuid muutujaid.
# 8 - tugivektor
See võib pakkuda lahendust lineaarsetele ja mittelineaarsetele mudelitele. Mittelineaarsete mudelite jaoks optimaalse lahenduse leidmiseks kasutatakse mittelineaarseid kerneli funktsioone.
# 9 - järjestus
Seda saab kasutada järjestatud väärtuste ennustamisel. Põhimõtteliselt sobib see siis, kui sõltuv muutuja on oma olemuselt järjestuslik
# 10 - Poisson
See on rakendatav juhul, kui sõltuval muutujal on loendusandmed.
# 11 - negatiivne binoom
Samuti on loendusandmete haldamiseks kohaldatav ainult see, et negatiivne binoomne regressioon ei eelda loenduse jaotust, mille dispersioon on võrdne tema keskmisega, Poissoni regressioon aga eeldab dispersiooni, mis on võrdne selle keskmisega.
# 12 - peaaegu Poisson
See asendab negatiivset binoomregressiooni. Seda saab kasutada ka hajutatud loendusandmete puhul. Kvaasipoissoni mudeli dispersioon on keskmise lineaarfunktsioon, negatiivse binoommudeli dispersioon on keskmise ruutfunktsioon.
# 13 - Cox
Seda kasutatakse rohkem sündmuse toimumise aja andmete analüüsimiseks.
Regressiooni ja korrelatsiooni vahe
- Regressioon loob suhte sõltumatu dispersiooni ja sõltuva muutuja vahel, kus mõlemad muutujad on erinevad, samas kui korrelatsioon määrab kahe muutuja seose või sõltuvuse, kui mõlema muutuja vahel pole erinevust.
- Regressiooni peamine eesmärk on luua rida kõige paremini ja ühe muutuja hindamine toimub teiste põhjal, samas kui korrelatsioonis demonstreeritakse lineaarset suhet kahe muutuja vahel.
- Selles prognoosime tunnustatud muutuja (X) teatud muutuse suurust hinnangulisele muutujale (Y), samas kui korrelatsioonis kasutatakse koefitsienti selle mõõtmiseks, mil määral need kaks muutujat koos liiguvad.
- See on protsess, mille alusel hinnatakse juhuslikult sõltumatute muutujate suurust staatilise sõltuva muutuja suuruse põhjal, samas kui korrelatsioon aitab meil otsustada konkreetse väärtuse üle, et väljendada mõlema muutuja vastastikust sõltuvust.
Järeldus
- Regressioonanalüüs kasutab andmeid peamiselt kahe või enama muutuja vahelise seose loomiseks. Siin eeldatakse, et minevikus eksisteerivad suhted peegelduvad ka olevikus või tulevikus. Vähesed peavad seda ajavahemikuks mineviku ja oleviku / tuleviku vahel.
- Kuid see on laialt kasutatav prognoosimise ja hindamise tehnika. Kuigi see hõlmab matemaatikat, mida paljud kasutajad võivad raskeks pidada, on tehnikat suhteliselt lihtne kasutada, eriti kui mudel on saadaval.