Bajesovo zaključivanje

Bajesovo zaključivanje je metoda statističkog zaključivanja^[1]^[2] u kojoj se Bajesova teorema^[3]^[4] koristi koristi za ažuriranje verovatnoće za hipotezu kad god više dokaza ili informacija postane dostupno. Bajesovo zaključivanje je važna tehnika u statistici, a posebno u matematičkoj statistici.^[5]^[6] Bajesovo ažuriranje je posebno važno u dinamičkoj analizi niza podataka.^[7]^[8] Bajesovo zaključivanje je našlo primenu u širokom spektru aktivnosti, uključujući nauku, inženjerstvo, filozofiju, medicinu, sport i pravo. U filozofiji teorije odlučivanja, Bajesovo zaključivanje je usko povezano sa subjektivnom verovatnoćom, koja se često naziva i „Bajesova verovatnoća”.

Uvod u Bajesovo pravilo

Formalno objašnjenje

Bajesovo zaključivanje izvodi posteriornu verovatnoću kao konsekvencu dva antecedenta: prethodne verovatnoće i „funkcije verovatnoće” izvedene iz statističkog modela za uočene podatke. Bajesovim zaključivanjem se izračunava posteriorna verovatnoća prema Bajesovoj teoremi:

P(H\mid E)={\frac {P(E\mid H)\cdot P(H)}{P(E)}}

gde

$\textstyle H$ označava svaku hipotezu na čiju verovatnoću mogu da utiču podaci (zvani dokazi u nastavku). Često postoje hipoteze koje se nadmeću, i zadatak je da se utvrditi koja je najverovatnija.
$\textstyle P(H)$ , prethodna verovatnoća, procena je verovatnoće hipoteze $\textstyle H$ pre nego što su podaci $\textstyle E$ , sadašnji dokazi, uočeni.
$\textstyle E$ , dokazi, odgovara novim podacima koji nisu korišteni u računanju prethodne verovatnoće.
$\textstyle P(H\mid E)$ , posteriorna verovatnoća, verovatnoća je za $\textstyle H$ kad je dato $\textstyle E$ , i.e., nakon što je $\textstyle E$ uočeno. To je tražena veličina: verovatnoća hipoteze s obzirom na uočene dokaze.
$\textstyle P(E\mid H)$ je verovatnoća uočavanja $\textstyle E$ za dato $\textstyle H$ . Kao funkcija od $\textstyle E$ sa fiksnim $\textstyle H$ , ukazuje na kompatibilnost dokaza s datom hipotezom. Funkcija verovatnoće je funkcija dokaza, $\textstyle E$ , dok je posteriorna verovatnoća funkcija hipoteze, $\textstyle H$ .
$\textstyle P(E)$ se ponekad naziva marginalna verovatnoća ili „evidencija modela”. Ovaj faktor je isti za sve razmatrane hipoteze (što je vidljivo iz činjenice da se hipoteza $\textstyle H$ ne pojavljuje nigde u simbolu, za razliku od svih ostalih faktora), te ovaj faktor ne ulazi u utvrđivanje relativne verovatnoće različitih hipoteza.

Za različite vrednost $\textstyle H$ , samo faktori $\textstyle P(H)$ i $\textstyle P(E\mid H)$ , oba od kojih su u numeratoru, utiču na vrednost $\textstyle P(H\mid E)$ – posteriornu verovatnoću da je hipoteza proporcionalna svojoj priornoj verovatnoći (svojoj naslednoj verovatnoći) i novostečenu verovatnoću (njenu kompatibilnost sa novouočenim dokazima).

Bajesovo pravilo se isto tako može napisati na sledeći način:

P(H\mid E)={\frac {P(E\mid H)}{P(E)}}\cdot P(H)

gde faktor $\textstyle {\frac {P(E\mid H)}{P(E)}}$ može da bude interpretiran kao impakt $E$ na verovatnoću od $H$ .

Alternative Bajesovom ažuriranju

Bajesova ažuriranje nalazi široku primenu i računarski je podesno. Međutim, ono nije jedino pravilo ažuriranja koje se može smatrati racionalnim.

Ijan Haking je uočio da tradicionalni argumenti „Holandske knjige” nisu sadržali Bajesovo ažuriranje: oni su ostavili otvorenu mogućnost da pravila nebajesovog ažuriranja mogu izbeći Holandske knjige. Haking je napisao^[9]^[10] „Niti argument holandske knjige, niti bilo koji drugi iz personalističkog arsenala dokaza o aksiomima verovatnoće ne uključuje dinamičku pretpostavku. Nijedan ne podrazumeva bajezijanizam. Dakle, personalista zahteva da dinamička pretpostavka bude Bajesova. Tačno je da bi u doslednosti personalista mogao da odustane od Bajesovog modela učenja iz iskustva. So može izgubiti svoju draž.”

Zapravo, postoje nebajesova pravila za ažuriranje koja takođe izbegavaju Holandske knjige (o čemu se govori u literaturi o „kinematici verovatnoće”) nakon objavljivanja pravila Ričarda K. Džefrija, koje primenjuje Bajesovo pravilo na slučaj gde je samim dokazima dodeljena verovatnoća.^[11] Dodatne hipoteze neophodne za jedinstveno zahtevanje Bajesovog ažuriranja su smatrane znatnim, komplikovanim i nezadovoljavajućim.^[12]

Formalni opis Bajesovog zaključivanja

Opisi

$x$ , opšta tačka podataka. To zapravo može da bude vektor vrednosti.
$\theta$ , parameter distribucije tačaka podataka, i.e., $x\sim p(x\mid \theta )$ . To zapravo može da bude vektor parametara.
$\alpha$ , hiperparametar parameterske distribucije, i.e., $\theta \sim p(\theta \mid \alpha )$ . To zapravo može da bude vektor hiperparametara.
$\mathbf {X}$ je uzorak, skup $n$ uočenih tačaka podataka, i.e., $x_{1},\ldots ,x_{n}$ .
${\tilde {x}}$ , nova tačka podataka čija distribucija se predviđa.

Reference

Literatura

Spoljašnje veze

Hazewinkel Michiel, ур. (2001). „Bayesian approach to statistical problems”. Encyclopaedia of Mathematics. Springer. ISBN 978-1556080104.
Bayesian Statistics from Scholarpedia.
Introduction to Bayesian probability from Queen Mary University of London
Mathematical Notes on Bayesian Statistics and Markov Chain Monte Carlo
Bayesian reading list Архивирано на сајту Wayback Machine (25. јун 2011), categorized and annotated by Tom Griffiths
A. Hajek and S. Hartmann: Bayesian Epistemology, in: J. Dancy et al. (eds.), A Companion to Epistemology. Oxford: Blackwell 2010, 93-106.
S. Hartmann and J. Sprenger: Bayesian Epistemology, in: S. Bernecker and D. Pritchard (eds.), Routledge Companion to Epistemology. London: Routledge 2010, 609-620.
Stanford Encyclopedia of Philosophy: "Inductive Logic"
Bayesian Confirmation Theory
What Is Bayesian Learning?
Data, Uncertainty and Inference An introduction to Bayesian inference and MCMC with a lot of examples fully explained. (free ebook)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

Search