Mis on lineaarne regressioon?
Lineaarne regressioon on põhimõtteliselt statistiline modelleerimistehnika, mida kasutatakse ühe sõltuva muutuja ja ühe või mitme sõltumatu muutuja vahelise seose näitamiseks. See on üks levinumaid ennustavaid analüüse. Seda tüüpi jaotust moodustatakse joones, seega nimetatakse seda lineaarseks regressiooniks. Selles artiklis võtame näited lineaarse regressiooni analüüsist Excelis.
Kõigepealt lineaarse regressioonianalüüsi tegemiseks peame lisama Exceli lisandmoodulid, järgides samme.
Klõpsake nuppu Fail - suvandid (see avab teile Exceli suvandite hüpikakna).

Klõpsake lisandmoodulitel - valige Exceli lisandmoodulid rippmenüüst Halda haldamine, seejärel klõpsake nuppu Mine.

See avab lisandmoodulite hüpikakna. Valige Analysis ToolPak ja seejärel klõpsake nuppu OK.

Andmeanalüüsi lisandmoodul kuvatakse vahekaardi Lisamine all.

Allpool mõistame lineaarse regressioonianalüüsi näiteid Excelis.
Lineaarse regressiooni analüüsi näited
Näide 1
Oletame, et eelmise aasta müügimaht on igakuine ja turundusele kulutatud ning nüüd peame ennustama tulevast müüki eelmise aasta müügi ja kulutatud turunduse põhjal.
Kuu | Reklaam | Müük |
Jan | 40937 | 502729 |
Veebruar | 42376 | 507553 |
Märts | 43355 | 516885 |
Apr | 44126 | 528347 |
Mai | 45060 | 537298 |
Juuni | 49546 | 544066 |
Juuli | 56105 | 553664 |
Aug | 59322 | 563201 |
Sept | 59877 | 568657 |
Okt | 60481 | 569384 |
Nov | 62356 | 573764 |
Dets | 63246 | 582746 |
Klõpsake vahekaardi Andmed all valikut Andmeanalüüs ja see avab teile andmete analüüsi hüpiku.

Nüüd valige loendist Regressioon ja klõpsake nuppu OK.

Regressiooni hüpik avaneb.

Valige Y-telje lahtris müügivahemik $ C $ 1: $ C $ 13, kuna see on sõltuv muutuja ja $ B $ 1: $ B $ 14 X-teljel, kuna reklaam on kulutatud, on sõltumatu muutuja.

Märkeruut kastis Sildid, kui olete andmetest päised valinud, muidu annab see vea.

Valige Väljundivahemik, kui soovite saada töölehel konkreetse vahemiku väärtuse, muul juhul valige Uus töölehe kiht: ja see lisab uue töölehe ja annab teile tulemuse.

Seejärel märkige ruut Jääkid ja klõpsake nuppu OK.

See lisab töölehed ja annab teile järgmise tulemuse.

Mõistame väljundit.
Kokkuvõtlik väljund
Mitu R: See tähistab korrelatsioonikordajat. Väärtus 1 näitab positiivset suhet ja väärtus 0 ei näita suhet.
R ruut: R ruut tähistab määramistegurit. See annab teile teada, kui palju punkte regressiooniliinile langeb. 0,49 tähendab, et mudelile sobib 49% väärtustest
Kohandatud R ruut : see on kohandatud R ruut, mis nõuab, kui teil on rohkem kui üks X muutuja.
Standardviga: see näitab vea standardhälbe hinnangut. See on täpsus, millega mõõdetakse regressioonikordajat.
Vaatlused: see on valimis tehtud vaatluste arv.
ANOVA - Df: vabadusastmed
SS: ruutude summa.
MS: meil on kaks liikmesriiki
- Regressioon MS on regressioon SS / regressioon Df.
- Jääk MS on keskmine ruutviga (jääk SS / jääk Df).
F: F nullhüpoteesi test.
Tähendus F: Tähtsusega seotud P-väärtused
Koefitsient: Koefitsient annab teile hinnangu väikseimate ruutude kohta.
T statistika: T nullhüpoteesi vs alternatiivse hüpoteesi statistika.
P-väärtus: see on hüpoteesi testi p-väärtus.
Alumine 95% ja ülemine 95%: need on usaldusvahemiku alumine ja ülemine piir
Jääkide väljund: meil on andmete põhjal 12 vaatlust. 2 nd veerus on Eeldatav müügi ja 3 rd veerus ülejääke. Jäägid on põhimõtteliselt prognoositud müügi erinevus tegelikust.
Näide 2
Valige prognoositav müük ja turundus

Minge diagrammigruppi vahekaardi Lisamine all. Valige hajumisdiagrammi ikoon

See lisab hajumisgraafiku excelisse. Vaata pilti allpool

Paremklõpsake suvalisel punktil ja valige seejärel Exceli lisamine trendijoon. See lisab teie graafikule trendijoone.


- Trendijooni saate vormindada, tehes paremklõpsu suvalises trendijoonel ja seejärel valides trendijooni.
- Diagrammil saate teha rohkem täiendusi. st trendijoone vormistamine, värvi muutmine ja pealkirja muutmine jne
- Valemit saate näidata ka graafikul, kontrollides diagrammi valemit Kuva ja kuvades diagrammil R ruutu.
Veel mõned näited lineaarse regressiooni analüüsist:
- Vihma põhjal müüdud vihmavarju ennustamine juhtus piirkonnas.
- Müüdud vahelduvvoolu prognoos suvise temperatuuri põhjal.
- Eksamihooajal kasvas peamiselt Stationary müük, eksamijuhendite müük.
- Müügi prognoosimine, kui reklaam on tehtud, põhineb reklaamide avaldamise seerial High TRP, brändi suursaadiku populaarsusel ja jalamil reklaami avaldamise kohas.
- Maja müük asukoha, piirkonna ja hinna põhjal.
Näide # 3
Oletame, et meil on üheksa õpilast, kelle IQ tase ja arv, mille nad testil skoorisid.
Üliõpilane | Testi skoor | IQ |
Ram | 100 | 145 |
Shyam | 97 | 140 |
Kul | 93 | 130 |
Kappu | 91 | 125 |
Raju | 89 | 115 |
Vishal | 86 | 110 |
Vivek | 82 | 100 |
Vinay | 78 | 95 |
Kumar | 75 | 90 |
1. samm: kõigepealt selgitage välja sõltuvad ja sõltumatud muutujad. Siin on testi skoor sõltuv muutuja ja IQ on sõltumatu muutuja, kuna testi skoor on erinev, kui IQ muutub.
2. samm: minge vahekaardile Andmed - klõpsake valikul Andmeanalüüs - valige regressioon - klõpsake nuppu OK.

See avab teie jaoks regressiooniakna.

Samm 3. Sisendtesti skoori vahemik sisendi Y vahemiku lahtris ja IQ sisendi X vahemiku kastis. (Kui teie andmevahemikus on päiseid, kontrollige silte. Valige väljundivalikud, seejärel kontrollige soovitud jääke. Klõpsake nuppu OK.

Saad kokkuvõtte, mis on näidatud alloleval pildil.

4. samm: regressiooni analüüs kokkuvõtte abil
Kokkuvõtlik väljund
Mitu R: Siin on korrelatsioonikordaja 0,99, mis on väga lähedal 1-le, mis tähendab, et lineaarne seos on väga positiivne.
R ruut: R ruutu väärtus on 0,983, mis tähendab, et 98,3% väärtustest sobib mudeliga.
P-väärtus: Siin on P-väärtus 1.86881E-07, mis on väga väiksem kui .1, mis tähendab, et IQ-l on märkimisväärsed ennustavad väärtused.
Vaadake allolevat diagrammi.

Näete, et peaaegu kõik punktid langevad reas või lähedal asuva trendijoonega.
Näide 4
Peame prognoosima vahelduvvoolu müüki teise kuu müügi ja temperatuuri põhjal.
Kuu | Temp | Müük |
Jan | 25 | 38893 |
Veebruar | 28 | 42254 |
Märts | 31 | 42845 |
Apr | 33 | 47917 |
Mai | 37 | 51243 |
Juuni | 40 | 69588 |
Juuli | 38 | 56570 |
Aug | 37 | 50000 |
Regressioonitulemuse saamiseks järgige alltoodud samme.
1. samm: kõigepealt selgitage välja sõltuvad ja sõltumatud muutujad. Siin on müük sõltuv muutuja ja temperatuur sõltumatu muutuja, kuna müük varieerub, kui temperatuur muutub.
2. samm: minge vahekaardile Andmed - klõpsake valikul Andmeanalüüs - valige regressioon - klõpsake nuppu OK.

See avab teie jaoks regressiooniakna.

Samm 3. Sisendmüük sisend Y vahemiku kasti ja Temp sisendi X vahemiku kasti. (Kui teie andmevahemikus on päiseid, kontrollige silte. Valige väljundivalikud, seejärel kontrollige soovitud jääke. Klõpsake nuppu OK.

See annab teile kokkuvõtliku väljundi nagu allpool.

4. samm: analüüsige tulemust.
Mitu R: Siin on korrelatsioonikordaja 0,877, mis on lähedal 1-le, mis tähendab, et lineaarne seos on positiivne.
R ruut: R ruutu väärtus on 0,770, mis tähendab, et 77% väärtustest sobib mudeliga
P-väärtus: Siin on P-väärtus 1.86881E-07, mis on väga väiksem kui .1, mis tähendab, et IQ-l on märkimisväärsed ennustavad väärtused.
Näide 5
Nüüd tehkem mitme sõltumatu muutuja regressioonanalüüs:
Peate prognoosima järgmise aasta turule tuleva mobiiltelefoni müüki. Teil on hind ja riikide arv, mis mõjutavad mobiiltelefonide müüki.
Mobiilne versioon | Müük | Kogus | Rahvaarv |
USA | 63860 | 858 | 823 |
Suurbritannia | 61841 | 877 | 660 |
KZ | 60876 | 873 | 631 |
CH | 58188 | 726 | 842 |
HN | 52728 | 864 | 573 |
AU | 52388 | 680 | 809 |
NZ | 51075 | 728 | 661 |
RE | 49019 | 689 | 778 |
Regressioonitulemuse saamiseks järgige alltoodud samme.
1. samm. Kõigepealt selgitage välja sõltuvad ja sõltumatud muutujad. Siin sõltub müük muutujast, kogusest ja populatsioonist. Mõlemad on sõltumatud muutujad, kuna müük varieerub vastavalt riigi kogusele ja elanikkonnale.
Samm 2. Minge vahekaardile Andmed - klõpsake valikul Andmeanalüüs - valige regressioon - klõpsake nuppu OK.

See avab teie jaoks regressiooniakna.

Samm 3. Sisendmüük sisendi Y vahemiku lahtrisse ja valige lahtrisse Sisend X vahemik kogus ja populatsioon. (Kui teie andmevahemikus on päiseid, kontrollige silte. Valige väljundivalikud, seejärel kontrollige soovitud jääke. Klõpsake nuppu OK.

Käivitage regressioon andmeanalüüsi abil vahekaardil Andmed. See annab teile allpool toodud tulemuse.
Kokkuvõtlik väljund
Mitu R: Siin on korrelatsioonikordaja 0,93, mis on väga lähedal 1-le, mis tähendab, et lineaarne seos on väga positiivne.
R ruut: R ruutu väärtus on 0,866, mis tähendab, et 86,7% väärtustest sobib mudeliga.
Olulisus F: Olulisus F on väiksem kui .1, mis tähendab, et regressioonivõrrandil on märkimisväärne ennustav väärtus.
P-väärtus : kui vaadata koguse ja populatsiooni P-väärtust, näete, et väärtused on väiksemad kui .1, mis tähendab, et kogusel ja populatsioonil on märkimisväärne ennustav väärtus. Mida vähem P-väärtusi tähendab, et muutujal on olulisemad ennustavad väärtused.
Kuid nii kvantiteedil kui ka populatsioonil on märkimisväärne ennustav väärtus, kuid kui vaadata kvantiteedi ja populatsiooni P-väärtust, siis näete, et kvantiteedil on excelis väiksem P-väärtus kui populatsioonil. See tähendab, et kvantiteedil on olulisem ennustav väärtus kui populatsioonil.
Asjad, mida meeles pidada
- Andmete valimisel kontrollige alati muutujaid Sõltuvad ja Sõltumatud.
- Lineaarregressioonanalüüs võtab arvesse muutujate keskmise suhet.
- See modelleerib ainult suhet muutujate vahel, mis on lineaarsed
- Mõnikord ei sobi see reaalses maailmas kõige paremini. Näiteks: (vanus ja palgad). Enamasti kasvab palk vanuse kasvades. Pärast pensionile jäämist tõuseb aga vanus, kuid palk väheneb.