Možda ste čuli kako bebe čija je porođajna težina ispod neke određene granice imaju smanjenu vjerojatnost preživljavanja u odnosu na djecu prosječne težine. Samo po sebi to nije iznenađujuće, dok ne čujete ovu statistiku: vjerojatnost preživljavanja te djece je veća ako je njihova majka pušila u trudnoći.
Da, istina je. Za bebe male porođajne težine je bolje da su im majke bile pušačice koje se nisu mogle suzdržati u trudnoći. Ali to ne znači da treba pušiti u trudnoći — pušenje šteti razvoju djeteta u maternici.
Zvuči nelogično: ako je pušenje majki loše za njihove bebe, zašto ta činjenica ne pogoršava šanse sitnim bebama, nego ih povećava? Hm... Dok razmišljate o tome, pogledajte još jedan slučaj iz medicinske prakse.
Kamen u bubregu
Evo primjera stvarne studije koja uspoređuje uspjeh dvije vrste operacija nad bubrežnim kamencem: otvorene i tzv. PCNL (perkutane nefrolitotripsije). Otvorene operacije prave veliki rez na koži, dok PCNL pravi samo mali rez i uvlači kirurške instrumente kroz taj procjep.
U tablici vidite rezultate 350 otvorenih operacija i još 350 PCNL operacija, podijeljene prema veličini bubrežnog kamenca. Udio uspješnih operacija je označen zelenom bojom, a operacije koje su ocijenjene neuspješnima su označene crveno. Kod operacija manjih kamenja otvorene operacije imaju veći udio uspješnosti nego PCNL (zeleni odsječak je veći). Kod većeg kamenja je ista priča: otvorena operacija se pokazala uspješnijom od PCNL. Dakle, bez obzira da li je kamen mali ili veliki, otvorena operacija ima veću uspješnost od PCNL-a. Slučaj zaključen.
otvorena operacija
PCNL
Manji kamenac
81/87
>
234/270
Veći kamenac
192/263
>
55/80
Ukupno
273/350
<
289/350
Ali, pričekajte još malo. Kolika je ukupna uspješnost kad zbrojimo sve operacije iste vrste, bez obzira na veličinu kamena?
Iznenađenje! Ako gledamo zbroj, zaključak je upravo suprotan. Ukupno gledajući sve provedene operacije bez obzira na veličinu kamena, otvorene operacije imaju manju uspješnost od PCNL-a. Opet paradoks. PCNL je ukupno uspješniji, iako je lošiji izbor za svaku kategorije bolesti ponaosob. Kako to može biti?
Pogledajmo opet podatke. Iako je u studiji jednak broj operacija obje vrste (350), one nisu podjednako raspoređene prema veličini kamena kojeg treba izvaditi. Vidite kako liječnici obično odabiru metodu PCNL kod malih kamenja, a za otvorene operacije odlučuju se kad su u pitanju veliki kamenci. Također, obratite pažnju da je uspješnost vađenja velikih kamenaca bitno lošija od vađenja malih, bez obzira koju metodu odabrali.
Iz toga bi mogli zaključiti da odmjeravanje snaga između otvorene operacije i PCNL-a nije bilo fer. PCNL je većinom dobio lakše slučajeve u kojima može postići puno bolje ishode nego u teškim slučajevima koji su mahom bili rješavani otvorenim operacijama. Liječnici su se odlučivali za PCNL kod manjih kamenaca vjerojatno zbog njegove manje cijene ili zbog manje šanse za ozbiljne komplikacije.
Zaključivanje iz ovih podataka je nezahvalno jer te dvije metode nisu imale iste uvjete. Da su se pacijenti raspoređivali nasumično i ravnopravno po svakoj metodi, onda bi mogli izravno uspoređivati njihove ukupne uspjehe. Međutim, ovdje to nije bio slučaj. Budući da se među njima diskriminiralo ovisno o težini pojedinog slučaja, onda jedino što možemo uspoređivati je uspješnost unutar iste kategorije slučaja, a ovi podaci pokazuju kako je otvorena operacija imala bolje rezultate.
Pušenje u trudnoći: dobro ili loše?
Vratimo se sad na novorođenčad s početka članka.
Radi jednostavnosti, pretpostavimo da postoje samo dva razloga za malu porođajnu težinu: pušenje i neki zločesti gen X. Također pretpostavimo da ta dva uzročnika dovode i do povećanja smrtnosti kod novorođenčadi, iako ne u istoj mjeri — gen X je puno gori po tom pitanju. Recimo dakle da je stanje ovako (svi brojevi su potpuno izmišljeni):
10% majki puši u trudnoći.
10% djece se rađa s genom X.
Pušenje i gen X su nezavisni.
Majčino pušenje i gen X su jedini uzroci male porođajne težine.
Pušenje u trudnoći uzrokuje povećanje smrtnosti novorođenčeta za 10%.
Gen X uzrokuje dvostruko povećanje smrtnosti novorođenčeta.
Kombinacija gena X i pušenja dovodi do povećanja smrtnosti od 120%.
Pogledajte shematski prikaz nad populacijom od sto beba. Ako beba ima malu porođajnu težinu, to je ili samo zbog majčinog pušenja (9 slučajeva) ili samo zbog gena X (drugih 9 slučajeva) ili zbog oba faktora (1 slučaj). To znači da se 19 rodilo s premalom težinom: 10 od majke pušačice i 9 od majke nepušačice. Prva grupa bi imala povećanu smrtnost za
dok bi druga grupa imala povećanje smrtnosti od 100%. Bebe male porođajne težine rođene od pušačica stoga imaju u prosjeku manju smrtnost od beba male porođajne težine rođene od nepušačica.
Dakle, pušenje može štetiti, ali dokle god šteti manje od drugih faktora koji vode smanjenoj težini, trebate se nadati da je samo pušenje bilo uzrok tog simptoma. Zbog toga pušačice imaju bolji ishod u ovom slučaju — iako kad gledamo ukupnu populaciju beba, povećanje smrtnosti kod nepušačica je
što je bitno manje od ukupnog povećanja smrtnosti kod pušačica (ranije izračunatih 21%).
Ovaj članak je dio serije članaka o varljivoj statistici:
Ono što ova dva primjera imaju zajedničko stručno se zove Simpsonov paradoks. On kaže kako se svaki statistički odnos između dvije varijable može obrnuti uvođenjem dodatnih faktora u analizu. Negativan odnos između pušenja i preživljavanja smo obrnuli fokusiranjem na djecu male porođajne težine. Pozitivan odnos između otvorene metode i uspjeha operacije smo obrnuli uvođenjem faktora veličine kamenca. Drugim riječima, statistiku možete interpretirati tako da isti podaci ukazuju na točno suprotan zaključak. Zar to nije fora?
Ilustracija grafom korelacije
(graf)
Da to ilustriram grafom korelacije. Klikom na ponuđene gumbe gore sakrit ćete dio podataka na grafu. Tako možete vidjeti kako svaki od podskupa pokazuje negativnu korelaciju, iako je ukupna korelacija svih podataka pozitivna. Različiti podskupi podataka mogu imati međusobno različita statistička svojstva, koja u konačnici dovode do drugačije interpretacije.
A sad vi!
Evo dva primjera Simpsonovog paradoksa u praksi. Razmislite malo o mogućim razlozima ovih naizgled paradoksalnih statistika prije nego što otvorite objašnjenje.
1. Među mornarima koji padnu u more s američkih ratnih brodova, češće se spase oni koji ne nose prsluk za spašavanje, iako svi mornari znaju da taj prsluk može samo pomoći. (vidi objašnjenje)
Mornari obično stavljaju prsluk za spašavanje samo ako je vrijeme loše. Po lošem vremenu je puno teže spasiti čovjeka iz mora, čak i ako nosi prsluk. Iako prsluk u oba slučaja (dobrom i lošem vremenu) definitivno pomaže, to što su prsluci prisutni samo po lošem vremenu daje im ukupno nepovoljniji ishod.
2. Sveučilište u Kaliforniji (Berkeley) je svojedobno bilo tuženo zbog seksizma. 1973. godine se činilo da su se muškarci značajno više upisivali od žena: od 8442 muška kandidata primljeno je njih 44%, dok je od 4321 ženska kandidata primljeno samo 35%. No, kad se detaljnije analizirao postotak primljenih studenata po svakom od studija pojedinačno, ispostavilo se da su žene čak bolje prolazile od muškaraca. (vidi objašnjenje)
Detaljnija studija pokazala je kako su se žene više prijavljivale na studije na koje je bilo teže upasti, tj. studije na kojima je bilo malo slobodnih mjesta u odnosu na broj prijava, poput studija jezika i ekonomije. Muškarci su češće birali studije na kojima je bila manja gužva, poput inženjerstva i kemije. To je bio presudan razlog zašto se ženama bilo teže upisati na sveučilište.