Lineaarne regressioon (määratlus, näited) Kuidas tõlgendada?

Lang L: none (table-of-contents)

Mis on lineaarne regressioon?

Lineaarne regressioon on põhimõtteliselt statistiline modelleerimistehnika, mida kasutatakse ühe sõltuva muutuja ja ühe või mitme sõltumatu muutuja vahelise seose näitamiseks. See on üks levinumaid ennustavaid analüüse. Seda tüüpi jaotust moodustatakse joones, seega nimetatakse seda lineaarseks regressiooniks. Selles artiklis võtame näited lineaarse regressiooni analüüsist Excelis.

Kõigepealt lineaarse regressioonianalüüsi tegemiseks peame lisama Exceli lisandmoodulid, järgides samme.

Klõpsake nuppu Fail - suvandid (see avab teile Exceli suvandite hüpikakna).

Klõpsake lisandmoodulitel - valige Exceli lisandmoodulid rippmenüüst Halda haldamine, seejärel klõpsake nuppu Mine.

See avab lisandmoodulite hüpikakna. Valige Analysis ToolPak ja seejärel klõpsake nuppu OK.

Andmeanalüüsi lisandmoodul kuvatakse vahekaardi Lisamine all.

Allpool mõistame lineaarse regressioonianalüüsi näiteid Excelis.

Lineaarse regressiooni analüüsi näited

Näide 1

Oletame, et eelmise aasta müügimaht on igakuine ja turundusele kulutatud ning nüüd peame ennustama tulevast müüki eelmise aasta müügi ja kulutatud turunduse põhjal.

Kuu Reklaam Müük
Jan 40937 502729
Veebruar 42376 507553
Märts 43355 516885
Apr 44126 528347
Mai 45060 537298
Juuni 49546 544066
Juuli 56105 553664
Aug 59322 563201
Sept 59877 568657
Okt 60481 569384
Nov 62356 573764
Dets 63246 582746

Klõpsake vahekaardi Andmed all valikut Andmeanalüüs ja see avab teile andmete analüüsi hüpiku.

Nüüd valige loendist Regressioon ja klõpsake nuppu OK.

Regressiooni hüpik avaneb.

Valige Y-telje lahtris müügivahemik $ C $ 1: $ C $ 13, kuna see on sõltuv muutuja ja $ B $ 1: $ B $ 14 X-teljel, kuna reklaam on kulutatud, on sõltumatu muutuja.

Märkeruut kastis Sildid, kui olete andmetest päised valinud, muidu annab see vea.

Valige Väljundivahemik, kui soovite saada töölehel konkreetse vahemiku väärtuse, muul juhul valige Uus töölehe kiht: ja see lisab uue töölehe ja annab teile tulemuse.

Seejärel märkige ruut Jääkid ja klõpsake nuppu OK.

See lisab töölehed ja annab teile järgmise tulemuse.

Mõistame väljundit.

Kokkuvõtlik väljund

Mitu R: See tähistab korrelatsioonikordajat. Väärtus 1 näitab positiivset suhet ja väärtus 0 ei näita suhet.

R ruut: R ruut tähistab määramistegurit. See annab teile teada, kui palju punkte regressiooniliinile langeb. 0,49 tähendab, et mudelile sobib 49% väärtustest

Kohandatud R ruut : see on kohandatud R ruut, mis nõuab, kui teil on rohkem kui üks X muutuja.

Standardviga: see näitab vea standardhälbe hinnangut. See on täpsus, millega mõõdetakse regressioonikordajat.

Vaatlused: see on valimis tehtud vaatluste arv.

ANOVA - Df: vabadusastmed

SS: ruutude summa.

MS: meil on kaks liikmesriiki

  • Regressioon MS on regressioon SS / regressioon Df.
  • Jääk MS on keskmine ruutviga (jääk SS / jääk Df).

F: F nullhüpoteesi test.

Tähendus F: Tähtsusega seotud P-väärtused

Koefitsient: Koefitsient annab teile hinnangu väikseimate ruutude kohta.

T statistika: T nullhüpoteesi vs alternatiivse hüpoteesi statistika.

P-väärtus: see on hüpoteesi testi p-väärtus.

Alumine 95% ja ülemine 95%: need on usaldusvahemiku alumine ja ülemine piir

Jääkide väljund: meil on andmete põhjal 12 vaatlust. 2 nd veerus on Eeldatav müügi ja 3 rd veerus ülejääke. Jäägid on põhimõtteliselt prognoositud müügi erinevus tegelikust.

Näide 2

Valige prognoositav müük ja turundus

Minge diagrammigruppi vahekaardi Lisamine all. Valige hajumisdiagrammi ikoon

See lisab hajumisgraafiku excelisse. Vaata pilti allpool

Paremklõpsake suvalisel punktil ja valige seejärel Exceli lisamine trendijoon. See lisab teie graafikule trendijoone.

  • Trendijooni saate vormindada, tehes paremklõpsu suvalises trendijoonel ja seejärel valides trendijooni.
  • Diagrammil saate teha rohkem täiendusi. st trendijoone vormistamine, värvi muutmine ja pealkirja muutmine jne
  • Valemit saate näidata ka graafikul, kontrollides diagrammi valemit Kuva ja kuvades diagrammil R ruutu.

Veel mõned näited lineaarse regressiooni analüüsist:

  1. Vihma põhjal müüdud vihmavarju ennustamine juhtus piirkonnas.
  2. Müüdud vahelduvvoolu prognoos suvise temperatuuri põhjal.
  3. Eksamihooajal kasvas peamiselt Stationary müük, eksamijuhendite müük.
  4. Müügi prognoosimine, kui reklaam on tehtud, põhineb reklaamide avaldamise seerial High TRP, brändi suursaadiku populaarsusel ja jalamil reklaami avaldamise kohas.
  5. Maja müük asukoha, piirkonna ja hinna põhjal.

Näide # 3

Oletame, et meil on üheksa õpilast, kelle IQ tase ja arv, mille nad testil skoorisid.

Üliõpilane Testi skoor IQ
Ram 100 145
Shyam 97 140
Kul 93 130
Kappu 91 125
Raju 89 115
Vishal 86 110
Vivek 82 100
Vinay 78 95
Kumar 75 90

1. samm: kõigepealt selgitage välja sõltuvad ja sõltumatud muutujad. Siin on testi skoor sõltuv muutuja ja IQ on sõltumatu muutuja, kuna testi skoor on erinev, kui IQ muutub.

2. samm: minge vahekaardile Andmed - klõpsake valikul Andmeanalüüs - valige regressioon - klõpsake nuppu OK.

See avab teie jaoks regressiooniakna.

Samm 3. Sisendtesti skoori vahemik sisendi Y vahemiku lahtris ja IQ sisendi X vahemiku kastis. (Kui teie andmevahemikus on päiseid, kontrollige silte. Valige väljundivalikud, seejärel kontrollige soovitud jääke. Klõpsake nuppu OK.

Saad kokkuvõtte, mis on näidatud alloleval pildil.

4. samm: regressiooni analüüs kokkuvõtte abil

Kokkuvõtlik väljund

Mitu R: Siin on korrelatsioonikordaja 0,99, mis on väga lähedal 1-le, mis tähendab, et lineaarne seos on väga positiivne.

R ruut: R ruutu väärtus on 0,983, mis tähendab, et 98,3% väärtustest sobib mudeliga.

P-väärtus: Siin on P-väärtus 1.86881E-07, mis on väga väiksem kui .1, mis tähendab, et IQ-l on märkimisväärsed ennustavad väärtused.

Vaadake allolevat diagrammi.

Näete, et peaaegu kõik punktid langevad reas või lähedal asuva trendijoonega.

Näide 4

Peame prognoosima vahelduvvoolu müüki teise kuu müügi ja temperatuuri põhjal.

Kuu Temp Müük
Jan 25 38893
Veebruar 28 42254
Märts 31 42845
Apr 33 47917
Mai 37 51243
Juuni 40 69588
Juuli 38 56570
Aug 37 50000

Regressioonitulemuse saamiseks järgige alltoodud samme.

1. samm: kõigepealt selgitage välja sõltuvad ja sõltumatud muutujad. Siin on müük sõltuv muutuja ja temperatuur sõltumatu muutuja, kuna müük varieerub, kui temperatuur muutub.

2. samm: minge vahekaardile Andmed - klõpsake valikul Andmeanalüüs - valige regressioon - klõpsake nuppu OK.

See avab teie jaoks regressiooniakna.

Samm 3. Sisendmüük sisend Y vahemiku kasti ja Temp sisendi X vahemiku kasti. (Kui teie andmevahemikus on päiseid, kontrollige silte. Valige väljundivalikud, seejärel kontrollige soovitud jääke. Klõpsake nuppu OK.

See annab teile kokkuvõtliku väljundi nagu allpool.

4. samm: analüüsige tulemust.

Mitu R: Siin on korrelatsioonikordaja 0,877, mis on lähedal 1-le, mis tähendab, et lineaarne seos on positiivne.

R ruut: R ruutu väärtus on 0,770, mis tähendab, et 77% väärtustest sobib mudeliga

P-väärtus: Siin on P-väärtus 1.86881E-07, mis on väga väiksem kui .1, mis tähendab, et IQ-l on märkimisväärsed ennustavad väärtused.

Näide 5

Nüüd tehkem mitme sõltumatu muutuja regressioonanalüüs:

Peate prognoosima järgmise aasta turule tuleva mobiiltelefoni müüki. Teil on hind ja riikide arv, mis mõjutavad mobiiltelefonide müüki.

Mobiilne versioon Müük Kogus Rahvaarv
USA 63860 858 823
Suurbritannia 61841 877 660
KZ 60876 873 631
CH 58188 726 842
HN 52728 864 573
AU 52388 680 809
NZ 51075 728 661
RE 49019 689 778

Regressioonitulemuse saamiseks järgige alltoodud samme.

1. samm. Kõigepealt selgitage välja sõltuvad ja sõltumatud muutujad. Siin sõltub müük muutujast, kogusest ja populatsioonist. Mõlemad on sõltumatud muutujad, kuna müük varieerub vastavalt riigi kogusele ja elanikkonnale.

Samm 2. Minge vahekaardile Andmed - klõpsake valikul Andmeanalüüs - valige regressioon - klõpsake nuppu OK.

See avab teie jaoks regressiooniakna.

Samm 3. Sisendmüük sisendi Y vahemiku lahtrisse ja valige lahtrisse Sisend X vahemik kogus ja populatsioon. (Kui teie andmevahemikus on päiseid, kontrollige silte. Valige väljundivalikud, seejärel kontrollige soovitud jääke. Klõpsake nuppu OK.

Käivitage regressioon andmeanalüüsi abil vahekaardil Andmed. See annab teile allpool toodud tulemuse.

Kokkuvõtlik väljund

Mitu R: Siin on korrelatsioonikordaja 0,93, mis on väga lähedal 1-le, mis tähendab, et lineaarne seos on väga positiivne.

R ruut: R ruutu väärtus on 0,866, mis tähendab, et 86,7% väärtustest sobib mudeliga.

Olulisus F: Olulisus F on väiksem kui .1, mis tähendab, et regressioonivõrrandil on märkimisväärne ennustav väärtus.

P-väärtus : kui vaadata koguse ja populatsiooni P-väärtust, näete, et väärtused on väiksemad kui .1, mis tähendab, et kogusel ja populatsioonil on märkimisväärne ennustav väärtus. Mida vähem P-väärtusi tähendab, et muutujal on olulisemad ennustavad väärtused.

Kuid nii kvantiteedil kui ka populatsioonil on märkimisväärne ennustav väärtus, kuid kui vaadata kvantiteedi ja populatsiooni P-väärtust, siis näete, et kvantiteedil on excelis väiksem P-väärtus kui populatsioonil. See tähendab, et kvantiteedil on olulisem ennustav väärtus kui populatsioonil.

Asjad, mida meeles pidada

  • Andmete valimisel kontrollige alati muutujaid Sõltuvad ja Sõltumatud.
  • Lineaarregressioonanalüüs võtab arvesse muutujate keskmise suhet.
  • See modelleerib ainult suhet muutujate vahel, mis on lineaarsed
  • Mõnikord ei sobi see reaalses maailmas kõige paremini. Näiteks: (vanus ja palgad). Enamasti kasvab palk vanuse kasvades. Pärast pensionile jäämist tõuseb aga vanus, kuid palk väheneb.

Huvitavad Artiklid...