From veky@student.math.hr Wed Jan 14 21:03:48 2004 Newsgroups: hr.comp.mathematica,hr.sci.matematika Subject: Re: vjerojatnost ? Followup-To: hr.sci.matematika Lines: 191 Message-ID: <slrnc0b842.3d5.veky@student.math.hr> References: <brrlce$5b3$1@ls219.htnet.hr> In article <brrlce$5b3$1@ls219.htnet.hr>, Dragutin Culinovic wrote: >Imamo kutiju sa 2/3 kuglica jedne boje (ili crvena ili bijela, ne znamo >koja) i 1/3 kuglica druge boje(takodjer ne zanmo koje boje, ili crvena >ili bijela). Damo jednom covjeku da izvlaci 5 kuglica >i on izvuce 4 crvene i 1 bijelu. >Damo drugom da izvlaci 20 kuglica i on izvuce 12 crvenih i 8 bijelih. Hm. Kao prvo, zadatak je konceptualno laksi ako se kuglice vracaju u kutiju (ili ako ih ima toliko puno da tih 20ak izvucenih ne mijenja bitno omjer 2:1 boja u kutiji). Pise li sto o tome? Ja cu rijesiti za slucaj kad se vracaju, jer to se slaze s rezultatima dolje navedenim (donekle:). Ako treba rijesiti bez vracanja, javi. >Koji od te dvojice ljdi ce biti vise uvjeren da kutija sadrzi 2/3 >crvenih i 1/3 bijelih prije nego obrnuto (da sadrzi 1/3 bijeli i 2/3 >crvenih) Ovdje pretpostavljam da imas jos jedan mali lapsuz (ovo "obrnuto" ti je zapravo jednako). >U knjizi je izneseno i objasnjenje. >Kaze: "U tom problemu, tocne naknadne sanse su 8 prema 1 za 4:1 uzorak >(prvi covjek) dok su te sanse 16 prema 1 za 18:8 uzorak, uz uvjet >jednakih vjerojatnosti prije izvlacenja." > >Jel mi moze tko malo rastumaciti to objasnjenje? Mrzim tumaciti objasnjenja koja se ne sluze standardnom terminologijom. [:-)] Evo mog objasnjenja: [lesson title="uvjetne vjerojatnosti i neki terminoloski detalji"] Detaljno cu raspisati kako prvi covjek razmislja, iz toga bi trebalo biti prilicno jasno kako razmislja onaj drugi (samo drugi brojevi su u igri). Imamo dvije hipoteze, H1:={"kutija sadrzi 2/3 crvenih kuglica i 1/3 bijelih"} H2:={"kutija sadrzi 1/3 crvenih kuglica i 1/3 bijelih"} Dogadaj koji se dogodio (za prvog covjeka) je A:={"od 5 nasumce izvucenih kuglica, izvucene su 4 crvene i jedna bijela"} Ono sto mi zelimo je usporediti vjerojatnosti od H1 i H2 , _pod uvjetom_ da se dogodio dogadaj A . Ako dogadaje interpretiramo kao skupove (standardno u modernoj teoriji vjerojatnosti), to (zove se uvjetna vjerojatnost i biljezi s P(A1|A2) ) definira novu vjerojatnost "P"_A2 ( P uz uvjet A2 ), koja se racuna na A1 tako da nas zanima samo onaj dio dogadaja A1 koji je upao u A2 - dakle P(A1 n A2) ("n" mi oznacava presjek skupova). Tako bi to bilo, kad ne bi bilo zahtjeva da vjerojatnost bude _normirana_, odnosno P(Omega)=1 (gdje je Omega univerzalan skup dogadaja, u starijoj terminologiji zvan i siguran dogadaj). Lako je vidjeti da je "P"_A2(Omega)=P(Omega n A2)=P(A2) , sto ne mora biti 1 . No kako nas ionako zanimaju samo omjeri pojedinih vjerojatnosti, stvar se ne mijenja ako sve pomnozimo (ili podijelimo) s nekom konstantom. U ovom slucaju, naravno, treba podijeliti s P(A2) (pretpostavimo da A2 nije vjerojatnosti nula ) da se dobije 1 na Omega (a vidi se da svi ostali aksiomi vjerojatnosti ostaju sacuvani). So, formula je P(A1|A2)="P"_A2(A1)/P(A2)=P(A1nA2)/P(A2) . Iz toga odmah dobijemo P(A1nA2)=P(A1|A2)P(A2) . No kako je presjek komutativna operacija ( A1nA2=A2nA1 ), to je ujedno jednako i P(A2|A1)P(A1) . To ce nam omoguciti da invertiramo uvjetne vjerojatnosti, sto ce nam trebati za ovaj zadatak kao sto cemo uskoro vidjeti. Sad mozemo precizno formulirati zadatak: treba izracunati P(H1|A) i P(H2|A) , odnosno njihovu razliku/omjer, i to usporediti s analognom razlikom/omjerom za drugog covjeka (tj. H1 i H2 ostaju, a dogadaj A postaje dogadaj B:={"od 20 nasumce izvucenih kuglica, izvuceno je 12 crvenih i 8 bijelih"} ). Kako izracunati P(H1|A) , npr. ? Prvo primijetimo da H1 i H2 cine takozvan _potpun sustav_ hipoteza, odnosno ->nijedna od njih nije vjerojatnosti 0 ( P(H1)!=0!=P(H2) ) ->bar jedna od njih je sigurno ispunjena ( H1uH2=Omega , "u" mi znaci uniju) ->nikad nisu ispunjene obje ( H1nH2=0 <- prazan skup, dakle disjunktne su) Dakle, P(H1)+P(H2)=P(Omega)=1 . Stovise, H1 i H2 tvore tzv. Laplaceov sustav hipoteza, odnosno buduci da na pocetku ne znamo nista o tome je li vjerojatnija H1 ili H2 , a zadatak djeluje dovoljno simetricno (prije nego sto se spomenu dogadaji A i B ), logicno je pretpostaviti da imaju jednake vjerojatnosti: P(H1)=P(H2) . Iz onog gore sad ocito P(H1)=P(H2)=1/2 . Zapamtimo ovo. Remember, mi trebamo P(H1|A) , sto je jednako P(H1nA)/P(A) . P(H1nA) po onom sto smo gore pisali je isto sto i P(AnH1) , dakle P(A|H1)P(H1) . P(A|H1) kao i P(A|H2) cemo izracunati malo kasnije. Sad idemo napasti P(A) (nazivnik od P(H1|A) ). Buduci da je ocito A=AnOmega , a Omega=H1UH2 ("U" mi je disjunktna unija, odnosno unija skupova koji su disjunktni), vrijedi A=An(H1UH2)=(AnH1)U(AnH2) (ako su H1 i H2 bili disjunktni, ocito su ostali disjunktni i nakon sto ih presjecemo s A ). Dakle P(A)=P(AnH1)+P(AnH2) . Prvi clan smo vec izracunali (primijeti, to je upravo brojnik), a drugi je potpuno analogno sednak P(A|H2)P(H1) . Izveli smo dakle dvije vazne formule: Ako je {H1,H2} potpun sustav hipoteza (lako se generalizira i na vise njih), tad za bilo koji A vrijedi: P(A)=P(A|H1)P(H1)+P(A|H2)P(H2) <- formula totalne vjerojatnosti P(H1|A)=P(A|H1)P(H1)/(P(A|H1)P(H1)+P(A|H2)P(H2)) <- Bayesova formula Cak stovise, buduci da je P(H1)=P(H2) (Laplaceov sustav), oni se mogu u drugoj formuli izluciti u nazivniku i skratiti s brojnikom, pa dobijemo: Ako je {H1,H2} Laplaceov sustav hipoteza (takoder, lako se generalizira na vise njih), tad za bilo koji A vrijedi -> P(H1|A)=P(A|H1)/(P(A|H1)+P(A|H2)) <- Laplace-Bayesova formula Dakle, sve smo sveli na racunanje P(A|H1) i P(A|H2) . Detaljno cu izracunati samo P(A|H1) , P(A|H2) tad stvarno ne bi trebalo predstavljati problem. So, treba nam P(A|H1) , odnosno kolika je vjerojatnost da bismo izvukli 4 crvene i jednu bijelu kuglicu, ako je u kutiji 2/3 crvenih i 1/3 bijelih kuglica? Kao prvo, od tih 5 izvucenih moramo precizirati jednu bijelu (ostalr su tada odredene, crvene). To mozemo uciniti na (5povrh1) nacina (s binomnim koeficijentima se nadam da si upoznat, ako nisi procitaj moj lesson na hr.sci.matematika o tome;). Sad moramo izracunati vjerojatnost da uz taj preciziran polozaj bijele kuglice (sto je ocito svejedno, recimo da je prva) izvucemo jednu bijelu, pa nakon toga jednu crvenu, pa jednu crvenu, jednu crvenu i joos jeednu crrvenu, kao sto bi rekao Rafo. ;-) Sad do izrazaja dolazi ono sto sam rekao o vracanju kuglica - jer nakon sto smo izvukli prvu bijelu, omjer strogo gledano vise nije isti (ima jedna bijela manje u kutiji, a crvenih je ostalo jednako). No ako vratimo tu bijelu nakon izvlacenja natrag u kutiju, sve ostaje kako treba, i kao sto rekoh, pod tom pretpostavkom cu rijesiti zadatak. So, vjerojatnost da ce prva biti bijela je 1/3 (jer ima 1/3 bijelihbu kutiji). Jednako tako, vjerojatnost da ce i-ta (za i@{2..5} ) biti crvena je 2/3 . S obzirom da se sve to mora dogoditi upravo tim redom (dogadaji su nezavisni), ti brojevi se mnoze. Dakle imam P(A|H1)=(5povrh1)*(1/3)*(2/3)^4=5*2^4/3^5=80/243 . (samo kratka napomena, ako ti se ne da trazit moj lesson o binomnim koeficijentima: (npovrhk)=n!/(k!*(n-k)!) - sto su faktorijele valjda znas:) Potpuno analogno, dobijem P(A|H2)=10/243 (raspisi za domacu zadacu:). Uvrstivsi to u Laplace-Bayesovu formulu, dobijem P(H1|A)=(80/243)/(80/243+10/243)=80/(80+10)=8/9 . Opet potpuno analogno, dobijem i P(H2|A)=(10/243)/(90/243) , odnosno 1/9 (a to sam mogao i elegantnije, jer znam da mora biti zbroj 1 - dakle 1-8/9=1/9 ). E sad, ono sto uputa zeli reci je da je omjer ta dva broja u ovom slucaju 8:1 u korist hipoteze H1 (da ima vise crvenih nego bijelih). Opcenito se u ne_bas_previse_mathematickim tekstovima vjerojatnost koja je racionalan broj p/q prikazuje kao omjer nje i njoj komplementarne 1-p/q , dakle kao p:(q-p) . No to moze zbuniti, poput tvog pitanja "hoce li onaj drugi biti dvostruko uvjereniji...". Pa da vidimo tog drugoga. Rekoh, necu sve raspisivati, ali dobije se P(B|H1)=171991040/1162261467 (hint: (20povrh8)=125970 , no i to se zapravo skrati) P(B|H2)=10749440/1162261467 P(H1|B)=16/17 P(H2|B)=1/17 , dakle omjer je u ovom slucaju 16:1 u korist H1 . No to IMO ne znaci da ce drugi biti dvostruko uvjereniji (iako ce biti uvjereniji) u H1 , jer ako razmislja strogo mathematicki (a jako malo ljudi tako razmislja - napravljena je hrpa studija na temu psiholoskog dozivljaja vjerojatnosti, ali to ovdje nije tema:), dozivjet ce to kao P(H1|B) , dakle 16/17 , sto je tocno 128/119 puta vece od P(H1|A)=7/8 , odnosno onog sto ce prvi covjek percipirati (opet pod istom pretpostavkom o psihologiji:). Kao sto se vidi, da, vece je, ali niposto dvostruko vece. [/lesson] >Kako se doslo do tih 8-1 i 16-1? >Po tome bi bilo da je drugi covjek duplo sigurniji od prvog da su 2/3 >kuglica crvene, a ne obrnuto. Jel to to znaci? Pise gore. Ne. Ni blizu. Prije ~~1.0756 puta sigurniji. :-) >Intuitivno mi je ok da je to tako ali me zanima dokaz toga matematicki. Nadam se da je ovo gore dovoljno matematicki za tebe. :-) >Kako se prevodi u matematickoj struci "prior probability" >"posterior probability", "odds ratio" ? Sluzbeni prijevodi: "vjerojatnost a priori", "vjerojatnost a posteriori", "omjer (sanse)". Moji "prijevodi": -> "vjerojatnost kako je dozivljavamo prije nekog fiksnog dogadaja" -> "vjerojatnost kako je dozivljavamo nakon (tog) fiksnog dogadaja" -> "lousy nacin izrazavanja vjerojatnosti za ljude koji nisu svladali razlomke:-p" -- Veky ... did they play the pipe lowly ...