Varianca

teorinë dhe statistikat e probabilitetit, varianca ose dispersioni është shamngia në katror nga mesatarja e një ndryshoreje rasti . Varianca shpesh përkufizohet gjithashtu si katrori i devijimit standard . Varianca është një matëse e shpërndarjes, që do të thotë se është një matëse se sa larg është shpërndarë një grup numrash nga vlera e tyre mesatare. Është momenti i dytë qendror i një shpërndarjeje, dhe kovarianca e ndryshores së rastësishme me vetveten, dhe shpesh përfaqësohet nga , , , , ose . [1]

Shembull i zgjedhjeve nga dy popullata me të njëjtën mesatare por varianca të ndryshme. Popullata e kuqe e ka mesataren 100 dhe variancën 100 (D.S=10) ndërsa popullata blu ka mesataren 100 dhe variancën 2500 (D.S=50).

Një avantazh i dispersionit si masë e shpërndarjes është se është më i përshtatshëm për manipulimin algjebrik sesa masat e tjera të shpërndarjes, siç është devijimi absolut i pritur ; për shembull, varianca e një shume ndryshoresh rasti të pakorreluara është e barabartë me shumën e variancave të tyre. Një disavantazh i dispersionit në zbatime praktike është se, ndryshe nga devijimi standard, njësitë e tij ndryshojnë nga ajo e n.r, kjo është arsyeja pse devijimi standard raportohet më shpesh si një masë e shpërndarjes pasi përfundon llogaritja.

Ka dy koncepte të ndryshme që emërtohen të dyja "variancë". Njëra, siç u diskutua më lart, është pjesë e një shpërndarjeje teorike probabiliteti dhe përcaktohet nga një ekuacion. Varianca tjetër është një karakteristikë e një grupi vëzhgimesh. Kur varianca llogaritet nga vëzhgimet, ato vëzhgime zakonisht maten nga një sistem i botës reale. Nëse të gjitha rezultatet e mundshme të sistemit janë të pranishme, atëherë varianca e llogaritur quhet variancë e popullsisë. Normalisht, megjithatë, vetëm një nëngrup është i gatshëm dhe varianca e llogaritur nga kjo mënyrë quhet variancë e mostrës. Varianca e llogaritur nga një kampion konsiderohet si një vlerësim i variancës së plotë të popullsisë. Ka shumë mënyra për të llogaritur një vlerësim të variancës së popullsisë, siç diskutohet në seksionin më poshtë.

Përkufizimi

Varianca e një ndryshoreje rasti është vlera e pritur e devijimit nga mesatarja në katror e ,  :

Ky përkufizim përfshin ndryshore rasti që krijohen nga procese që janë diskrete, të vazhdueshme, as ose të përziera. Varianca mund të konsiderohet gjithashtu si kovarianca e një ndryshoreje të rastësishme me vetveten:

Një tjetër formulë për dispersionin merret si më poshtë:

Me fjalë të tjera, varianca e X është e barabartë me mesataren e n.r të ngritur në katror minus katrorin e mesatares së . Ky ekuacion nuk duhet të përdoret për llogaritjet duke përdorur aritmetikën me pikë lundruese, sepse vuan nga anulimi katastrofik nëse dy komponentët e ekuacionit janë të ngjashëm në madhësi. Për alternativa të tjera numerikisht të qëndrueshme, shihni Algoritmet për llogaritjen e variancës .

Ndryshore e rastit diskrete

Nëse ndryshorja e rastit është diskrete me funksion mase probabiliteti , atëherë

ku është vlera e pritur. Kjo është,

Varianca e një bashkësie të vlerash njëlloj të mundshme shkruhet edhe si:

ku është vlera mesatare. Kjo është,

Ndryshoret e rastit absolutisht të vazhdueshme

Nëse ndryshorja e rastit ka një funksion të densitetit të probabilitetit , dhe është funksioni përkatës i shpërndarjes mbledhëse, atëherë

ose në mënyrë të njëvlershme,

Shembuj

Shpërndarja eksponenciale

Shpërndarja eksponenciale me parametërrin është një shpërndarje e vazhdueshme, funksioni i densitetit të probabilitetit të së cilës është dhënë nga

në intervalin [0, ∞ ) . Mesatarja e kësaj shpërndarje mund të tregohet se është

Duke përdorur integrimin me pjesë dhe duke përdorur pritje matematike tashmë të llogaritur, ne kemi:

Kështu, varianca e jepet nga

Zari i drejtë

Hedhja e një zari të drejtë mund të modelohet si n.r diskrete, , me rezultate nga 1 deri tek 6, secila me probabilitet të njëjtë 1/6. Pritja matematike e është Kështu që, varianca e është

Shpërndarjet e probabilitetit të përdorura zakonisht

Emri i shpërndarjes së probabilitetitFunksioni i shpërndarjes së probabilitetitMesatarjaVarianca
Shpërndarja binomiale
Shpërndarja gjeometrike
Shpërndarja normale
Shpërndarja uniforme (e vazhdueshme)
Shpërndarja eksponenciale
Shpërndarja Poisson

Vetitë

Vetitë themelore

Varianca është jo negative sepse madhësitë e ngritura në katror janë gjithmonë pozitive ose zero:

Varianca e një konstante është zero.

Çështja e pafundësisë

Nëse një shpërndarje nuk ka pritje matematike të fundme, siç është rasti për shpërndarjen Cauchy, atëherë edhe varianca nuk mund të jetë e fundme. Megjithatë, disa shpërndarje mund të mos kenë një variancë të fundme, pavarësisht se pritja matematike është e fundme. Një shembull i tillë është një shpërndarje Pareto, indeksi i së cilës plotëson kushtin

Njësitë matëse

Ndryshe nga devijimi absolut i pritur, varianca e një ndryshore ka njësi që janë katrori i njësive të vetë ndryshores. Për shembull, një ndryshore e matur në metra do të ketë një variancë të matur në metra katrorë. Për këtë arsye, përshkrimi i grupeve të të dhënave nëpërmjet devijimit të tyre standard ose devijimit mesatar katror nën rrënjë shpesh preferohet ndaj përdorimit të variancës. Në shembullin e zareve, devijimi standard është , pak më i madh se devijimi absolut i pritur, 1.5.

Përhapja

Mbledhja dhe shumëzimi me një konstante

Varianca është e pandjeshme ndaj ndryshimeve në një parametër vendndodhjeje . Kjo do të thotë se nëse një konstante u shtohet të gjitha vlerave të ndryshores, varianca mbetet e pandryshuar:

Nëse të gjitha vlerat shkallëzohen me një konstante, varianca shkallëzohet me katrorin e asaj konstante:

Varianca e shumës së dy ndryshoreve të rastit jepet nga barazimi

ku është kovarianca dhe është devijimi standard i .

Kombinimet lineare

Në përgjithësi, për shumën e ndryshoreve të rastit , varianca gjendet si:

Këto rezultate çojnë në variancën e një kombinimi linear të gjetur si:

Nëse ndryshoret e rastit janë të tilla që

atëherë thuhet se janë të pakorreluara . Kështu që për to mund të shkruhet:

Prodhimi ndryshoreve

Prodhimi i ndryshoreve të pavarura

Nëse dy ndryshore dhe janë të pavarura, varianca e prodhimit të tyre jepet nga [2]

Në mënyrë të njëvlerëshme, duke përdorur vetitë themelore të pritjes matematike, ajo jepet nga

Produkt i ndryshoreve statistikisht të varura

Varianca e popullatës dhe varianca e zgjedhjes/kampionimit

Vëzhgimet e botës reale të tilla si matjet e shiut të djeshëm gjatë gjithë ditës zakonisht nuk mund të jenë grupe të plota të të gjitha vëzhgimeve të mundshme. Si e tillë, varianca e llogaritur nga bashkësia e fundme në përgjithësi nuk do të përputhet me variancën që do të ishte llogaritur nga popullata e plotë e vëzhgimeve të mundshme. Kjo do të thotë që vlerësohet mesatarja dhe varianca nga një bashkësi e kufizuar vëzhgimesh duke përdorur një ekuacion vlerësues . Vlerësuesi është një funksion i zgjedhjes së vëzhgimeve të nxjerra pa paragjykime vëzhguese nga e gjithë popullata e vëzhgimeve të mundshme. Në këtë shembull ajo zgjedhje do të ishte grupi i matjeve të reshjeve të djeshme nga matësat në gatishmëri.

Vlerësuesit më të thjeshtë për mesataren e popullsisë dhe variancën e popullsisë janë thjesht mesatarja dhe varianca e zgjedhjes/kampionit, mesatarja e zgjedhjes dhe varianca (e pakorrigjuar) e zgjedhjes- këta janë vlerësues të qëndrueshëm (ata konvergjojnë në vlerën e saktë teksa numri i zgjedhjeve rritet), por mund të të përmirësohet. Vlerësimi i variancës së popullatës duke marrë variancën e zgjedhjes është afër optimales në përgjithësi, por mund të përmirësohet në dy mënyra. Më thjeshtë, varianca e kampionit llogaritet si një mesatare e devijimeve në katror rreth mesatares (së kampionit), duke e pjesëtuar me . Megjithatë, përdorimi i vlerave të tjera përveç përmirëson vlerësuesin në mënyra të ndryshme. Katër vlera për emëruesin janë , , , dhe : është më e thjeshta (varianca e popullsisë së kampionit), eliminon paragjykimet, minimizon gabimin mesatar në katror për shpërndarjen normale, dhe më së shumti eliminon zjvendosjet/anësinë në vlerësimin e paanshëm të devijimit standard për shpërndarjen normale.

Varianca e popullsisë

Në përgjithësi, varianca e popullsisë së një popullatefundme me madhësi me vlera jepet nga

ku mesatarja e popullësisë është

Varianca e popullsisë gjithashtu mund të llogaritet duke përdorur

Varianca e kampionit

Varianca e pazhvendosur e kampionit

Në shumë situata praktike, varianca e vërtetë e një popullate nuk dihet apriori dhe duhet të llogaritet sipas ndonjë mënyre. Kur kemi të bëjmë me popullata jashtëzakonisht të mëdha, nuk është e mundur të numërohet çdo objekt i popullatës, kështu që llogaritja duhet të kryhet në një zgjedhje të popullsisë. [3] Kjo zakonisht quhet variancë e zgjedhjes ose variancë empirike . Varianca e zgjedhjes mund të zbatohet gjithashtu për vlerësimin e variancës së një shpërndarjeje të vazhdueshme nga një kampion i asaj shpërndarjeje.

Marrim një kampion me zëvendësim të vlerave nga popullsia, ku , dhe vlerësojmë variancën në bazë të këtij kampioni. [4] Marrja e drejtpërdrejtë e variancës së të dhënave të mostrës jep mesataren e devijimeve në katror :

Këtu, tregon mesataren e mostrës :

Meqenëse Y i zgjidhen rastësisht, të dyja dhe janë ndryshore të rastit. Pritjet matematike të tyre mund të vlerësohen duke marrë një mesatare mbi grupin e të gjitha kampioneve të mundshme me madhësi n nga popullata. Për kjo jep:

Prandaj jep një vlerësim të variancës së popullatës që është e njëanshme/ e zhvendosur me një faktor prej . Per kete arsye, referohet si varianca e mostrës së njëanshme .

Varianca e pazhvendosur e zgjedhjes

Korrigjimi për këtë anësi jep variancën e pazhvendosur të mostrës, të shënuar  :

Secili vlerësues mund të referohet thjesht si varianca e kampionit kur versioni mund të përcaktohet nga konteksti.