Dispersioonide inflatsioonitegur (VIF) - ülevaade, valem, kasutusalad

Variansi inflatsioonitegur (VIF) mõõdab regressioonanalüüsis multikollineaarsuse raskusastet. Regressioonianalüüs Regressioonanalüüs on statistiliste meetodite kogum, mida kasutatakse sõltuvate muutujate ja ühe või mitme sõltumatu muutuja vaheliste seoste hindamiseks. Seda saab kasutada muutujate seose tugevuse hindamiseks ja nende vahelise tulevase suhte modelleerimiseks. . See on statistiline mõiste, mis näitab regressioonikordaja dispersiooni suurenemist kollineaarsuse tagajärjel.

Dispersiooni inflatsioonitegur

Kokkuvõte

  • Variansi inflatsioonitegurit (VIF) kasutatakse multikollineaarsuse raskusastme tuvastamiseks tavalises väikseima ruudu (OLS) regressioonanalüüsis.
  • Multikollineaarsus suurendab dispersiooni ja II tüübi viga. See muudab muutuja koefitsiendi järjepidevaks, kuid ebausaldusväärseks.
  • VIF mõõdab multikollineaarsusest põhjustatud pumbatud variatsioonide arvu.

Dispersioonide inflatsioonitegur ja multikollineaarsus

Tavalises väikseima ruudu (OLS) regressioonanalüüsis eksisteerib multikollineaarsus, kui kaks või enam sõltumatut muutujat Sõltumatu muutuja Sõltumatu muutuja on sisend, eeldus või draiver, mida muudetakse, et hinnata selle mõju sõltuvale muutujale (tulemus) . demonstreerivad nende vahelist lineaarset suhet. Näiteks, et analüüsida ettevõtte suuruse ja tulude suhet aktsiahindadega regressioonimudelis, on turukapitalisatsioonid ja tulud sõltumatud muutujad.

Ettevõtte turukapitalisatsioon Turukapitalisatsioon Turukapitalisatsioon (Market Cap) on ettevõtte käibel olevate aktsiate uusim turuväärtus. Turuväärtus on võrdne praeguse aktsia hinnaga, korrutatuna käibel olevate aktsiate arvuga. Investeeriv kogukond kasutab ettevõtete järjestamiseks sageli turukapitalisatsiooni väärtust ja selle kogutulu on tihedalt seotud. Kuna ettevõte teenib üha suuremat tulu, kasvab ka tema suurus. See viib OLS-i regressioonanalüüsis multikollineaarsuse probleemini. Kui regressioonimudeli sõltumatud muutujad näitavad täiesti prognoositavat lineaarset suhet, on see tuntud kui täiuslik multikollineeruvus.

Multikollineaarsuse korral on regressioonikordajad endiselt püsivad, kuid pole enam usaldusväärsed, kuna standardvead on liiga suured. See tähendab, et mudeli ennustusvõimsust ei vähendata, kuid II tüübi vea korral ei pruugi koefitsiendid olla statistiliselt olulised II tüübi viga Statistilise hüpoteesi testimisel on II tüübi viga olukord, kus hüpoteesitest ei lükka tagasi nullhüpoteesi, et on vale. Teistes.

Seega, kui muutujate koefitsiendid ei ole individuaalselt olulised - seda ei saa vastavalt t-testis tagasi lükata -, kuid see võib koos seletada sõltuva muutuja variatsiooni F-testi tagasilükkamise ja kõrge määramisteguriga (R2), võib eksisteerida multikollineaarsus. See on üks multikollineaarsuse tuvastamise meetoditest.

VIF on veel üks sageli kasutatav vahend regressioonimudelis multikollineaarsuse olemasolu tuvastamiseks. See mõõdab, kui palju on hinnangulise regressioonikordaja dispersioon (või standardviga) kollineaarsuse tõttu paisutatud.

Dispersioonide inflatsiooniteguri kasutamine

VIF-i saab arvutada järgmise valemi abil:

Dispersioonide inflatsioonitegur - valem

Kus Ri2 tähistab korrigeerimata määramistegurit i sõltumatu muutuja regressiooniks ülejäänud muutujale. VIF-i vastastikune on tuntud kui sallivus. Multikollineaarsuse tuvastamiseks võib kasutada kas VIF-i või tolerantsust, sõltuvalt isiklikest eelistustest.

Kui Ri2 on võrdne 0-ga, ülejäänud sõltumatute muutujate dispersiooni ei saa i-nda sõltumatu muutuja põhjal ennustada. Seega, kui VIF või tolerants on võrdne 1-ga, ei korreleeru i-s sõltumatu muutuja ülejäänud omadega, mis tähendab, et multikollineaarsust selles regressioonimudelis ei eksisteeri. Sellisel juhul ei suurendata i-nda regressioonikordaja dispersiooni.

Üldiselt näitab VIF üle 4 või tolerants alla 0,25, et võib esineda multikollineaarsust, ja on vaja täiendavaid uuringuid. Kui VIF on suurem kui 10 või tolerants on väiksem kui 0,1, on märkimisväärne multikollineaarsus, mida tuleb parandada.

Siiski on ka olukordi, kus kõrgeid VFI-sid saab turvaliselt ignoreerida, ilma et nad kannataksid multikollineaarsuse all. Kolm sellist olukorda on järgmised:

1. Kõrge VIF on olemas ainult kontrollmuutujate puhul, kuid mitte huvipakkuvates muutujates. Sellisel juhul ei ole huvipakkuvad muutujad üksteise ega kontrollmuutujate suhtes kollineaarsed. Regressioonikordajaid see ei mõjuta.

2. Kui muude muutujate toodete või jõudude lisamise tõttu on kõrge VIF tase kõrge, ei põhjusta multikollineaarsus negatiivset mõju. Näiteks sisaldab regressioonimudel sõltumatute muutujatena nii x kui ka x2.

3. Kui näiv muutuja, mis esindab rohkem kui kahte kategooriat, on kõrge VIF-iga, ei ole multikollineaarsust tingimata olemas. Muutujatel on alati kõrge VIF, kui kategoorias on väike osa juhtumeid, olenemata sellest, kas kategoorilised muutujad on korrelatsioonis teiste muutujatega.

Multikollineaarsuse korrigeerimine

Kuna multikollineaarsus suurendab koefitsientide dispersiooni ja põhjustab II tüüpi vigu, on hädavajalik see avastada ja parandada. Multikollineaarsuse parandamiseks on kaks lihtsat ja sageli kasutatavat viisi, mis on loetletud allpool:

1. Esimene neist on ühe (või mitme) tugevalt korreleerunud muutuja eemaldamine. Kuna muutujate pakutav teave on üleliigne, ei mõjuta eemaldamine määramistegurit oluliselt.

2. Teine meetod on kasutada OLS-regressiooni asemel põhikomponentide analüüsi (PCA) või osalist väikseima ruudu regressiooni (PLS). PLS regressioon võib vähendada muutujaid väiksemaks kogumiks ilma nende vahel korrelatsioonita. PCA-s luuakse uued korreleerimata muutujad. See minimeerib teabe kadu ja parandab mudeli prognoositavust.

Rohkem ressursse

Finance on ülemaailmse sertifitseeritud pangandus- ja krediidianalüütiku (CBCA) ™ CBCA ™ sertifikaadi ametlik pakkuja. Certified Banking & Credit Analyst (CBCA) ™ akrediteerimine on krediidianalüütikute globaalne standard, mis hõlmab finants-, raamatupidamis-, krediidianalüüsi-, rahavoogude analüüsi , pakti modelleerimine, laenu tagasimaksed ja palju muud. sertifitseerimisprogramm, mille eesmärk on aidata kellelgi saada maailmatasemel finantsanalüütikuks. Oma karjääri edendamiseks on kasulikud allpool olevad lisaressursid:

  • Finantsstatistika põhimõisted Rahanduse põhistatistika mõisted Statistika kindel mõistmine on ülioluline, et aidata meil rahandust paremini mõista. Pealegi võivad statistikakontseptsioonid aidata investoritel jälgida
  • Prognoosimeetodid Prognoosimeetodid Parimad prognoosimeetodid. Selles artiklis selgitame nelja tüüpi tulude prognoosimise meetodeid, mida finantsanalüütikud kasutavad tulevaste tulude prognoosimiseks.
  • Mitu lineaarne regressioon Mitu lineaarne regressioon Mitu lineaarne regressioon viitab statistilisele tehnikale, mida kasutatakse sõltuvate muutujate väärtuse põhjal sõltuva muutuja tulemuse ennustamiseks
  • Juhuslik muutuja Juhuslik muutuja Juhuslik muutuja (stohhastiline muutuja) on statistika muutuja tüüp, mille võimalikud väärtused sõltuvad teatud juhusliku nähtuse tulemustest

Lang L: none (rec-post)