Zamislite da ste liječnik i da u razgovoru s pacijenticom saznate da joj je jedan djed bolovao od teške genetske bolesti. Kažete joj kako postoji mogućnost da je i ona ima, a da toga nije svjesna. Šansa da ju je naslijedila je vrlo mala: samo jedan u sto. Međutim, to je nije umirilo. Ona želi biti sigurna da nije u tih 1%.
A to nije tako jednostavno. Postoji, doduše, jedan eksperimentalni test za tu bolest, ali on je daleko od savršenog: učestalost krivo pozitivnih nalaza je deset posto. Dakle, u prosjeku, od sto ljudi koji nemaju bolest, deset će dobiti neispravan (pozitivan) nalaz. S druge strane, svi ljudi koji imaju bolest će dobiti pozitivan nalaz (nema krivo negativnih nalaza). Iako je svjesna činjenice da tim testom neće dobiti konačan odgovor, odlučuje se za test.
Nakon dva tjedna, dolazi vam sva u suzama. Nalaz testa je pozitivan! Kažete joj da ne očajava: test nije savršen i još uvijek postoji šansa da nema bolest. Vjerojatnost da je test pogriješio i da je ona ipak zdrava procjenjujete na otprilike... koliko posto?
(preskoči odgovaranje)
Većina ljudi, štoviše i većina liječnika, procjenila bi tu vjerojatnost na oko deset posto — ako test griješi u oko 10% slučajeva, to je ta nesigurnost za koju se hvatamo u ovom slučaju. Ali, srećom, ispada da je vjerojatnost da je sve u redu ipak veća.
Provođenje testa
Recimo da testiramo sto ljudi iz njene populacije. U prosjeku, jedna među njima ima tu bolest , a svi ostali su zdravi . Razmislite malo kakvi bi rezultati bili da testiranje provedemo nad cijelom populacijom.
Budući da ovaj test nikad ne daje lažno negativne rezultate, stvarno bolesna osoba je dobila pozitivan nalaz .
Ali što je sa preostalih 99 zdravih ljudi? Prema učestalosti krivo pozitivnih nalaza (10%), oko deset zdravih ljudi također će dobiti pozitivan nalaz . Ostali imaju negativan nalaz, što znači da su sigurno zdravi .
Dakle, možemo reći da je cca 11 ljudi dobilo pozitivan nalaz iako je samo jedan od njih stvarno bolestan. Tako dolazimo do vjerojatnosti da je netko iz opće populacije s pozitivnim rezultatom testa u stvari zdrav oko 10/11. Vjerojatnost da je cura zdrava je oko 91 posto!
Ali, zar pozitivan rezultat testa ne znači ništa?
Pa znači. Prije testa, vjerojatnost bolesti je bila 1%; nakon testa je 9%. To je devetorostruko gora prognoza! Stvar je u tome da je originalna vjerojatnost bila dovoljno mala da ovakav test nije dovoljan da bi nas se uvjerio u prisutnost bolesti. Nesavršen test pomiče početnu vjerojatnost u nekom smjeru, ali točno koliki će biti taj pomak ovisi o pouzdanosti testa i o početnoj vjerojatnosti.
Poanta je da u ovim slučajevima ne smijemo gledati samo vjerojatnost da je test pogriješio, nego i učestalost svojstva na kojeg se testira u populaciji. Malo je vjerojatno da je test pokazao krivo, ali je još manje vjerojatno da je baš ta cura u stvari bila bolesna. Konačna vjerojatnost je kombinacija 90-postotne šanse da rezultat testa znači urođenu bolest i jedan-u-sto šanse da osoba koja se testira ima tu bolest.
Zanemarivanje osnovne učestalosti je česta logička pogreška koju ljudi čine u ovakvim situacijama. Jednostavno ignoriraju tu informaciju, vjerojatno zato što na pacijenta ne gledaju kao na "statistiku", nego kao na pojedinca sa podjednakim potencijalom da bude i bolestan i zdrav.
Zeleno-plavi taksi
Za kraj, evo još jedan sličan problem:
Istražujete prometnu nesreću koju je skrivio nepoznati taksi. U gradu postoji ukupno sto taksija: 85 ih je zelenih, a 15 plavih. Svjedok kaže da je to bio plavi taksi. Budući da je bio mrak, postoji 20-postotna mogućnost da svjedok krivo prepoznao boju, zamjenivši zelenu i plavu. Ako pretpostavimo da je svjedok iskren, kolika je šansa da je pogriješio, i da je taksi u stvari bio zelene boje?
Pogledajte shemu. Prije nego što smo dobili izjavu svjedoka, smatrali smo da je jednaka vjerojatnost da je to bio bilo koji od sto taksija u gradu. 85 zelenih taksija i 15 plavih se dalje dijele na slučajeve kad je boja bila ispravno odnosno neispravno viđena. U krugu je boja kakvu ju je vidio svjedok i brojevi su raspoređeni tako da je 20% taksija krivo percipirana.
Od 85 taksija zelene boje, 20% odnosno njih 17 bi svjedok krivo percipirao kao plave. Od 15 plavih taksija, njih 80% (12) svjedok bi ispravno prepoznao kao plave. Dakle, od ukupno 17 + 12 = 29 taksija koje svjedok prepoznaje kao plave, samo 12 je stvarno plave boje. Šansa da je svjedok u stvari vidio zeleni taksi je 17/29 = oko 59%. Vjerojatnije je da je nesreću skrivio neki zeleni taksi.