Često se kaže kako živimo u zemlji u kojoj za vrijeme velikih nogometnih prvenstava imamo 4 milijuna nogometnih izbornika. Čitajući komentare po društvenim mrežama i internetskim portalima slobodno mogu reći kako u vrijeme pandemije imamo i 4 milijuna epidemiologa. Većina građana prati izvješća Stožera civilne zaštite, prati razne stranice s podacima o broju potvrđenih slučajeva zaraze koronavirusa, računa stope smrtnosti, daje predviđanja o ponašanju virusa u ljetnim mjesecima te ocjenjuje koje su mjere efektivne, a koje nisu. Kao i u mnogim drugim državama svijeta, ekonomski i društveni život Hrvatske u potpunosti je zamrznut. Preostaje nam jedino educirati se što više i držati se preporuka zdravstvenih djelatnika i epidemiologa. Stoga nije naodmet da se pritom i sami (jednako vrijedi i za autora ovog teksta) podsjetimo nekih osnova znanosti koja trenutno upravlja našim životima.

Nedavno je Stožer civilne zaštite Republike Hrvatske objavio vijest da će se i u Hrvatskoj provesti nasumično serološko testiranje u svrhu dobivanja informacija o prevalenciji infekcije koronavirusom u populaciji Hrvatske. Serološko testiranje temelji se na otkrivanju prisustva antitijela te se rezultati testa dobiju u vrlo kratkom vremenskom roku, između 10 i 15 minuta. Bitna odrednica testiranja prisustva antitijela jest da se time ne otkriva je li osoba trenutno zaražena već je li osoba preboljela odnosno bila u kontaktu s koronavirusom te time razvila antitijela. Naravno, mnoge osobe bit će svjesne jesu li prebolile koronavirus jer će razviti ozbiljne simptome bolesti uzrokovane infekcijom. No uz to, testovi bi nam trebali otkriti i dio populacije koji je prebolio infekciju bez ikakvih simptoma. Pretpostavka je da će nam podaci dobiveni testiranjem poslužiti za donošenje odluka u vezi kontroliranja epidemije koronavirusa u Hrvatskoj.

Međutim, testiranja na antitijela imaju i ozbiljna ograničenja zbog kojih njihove rezulatate treba intepretirati s krajnjim oprezom. S time na umu, krenuo sam pisati ovaj članak. U trenutku kada sam pokušao saznati koji se točno testovi misle upotrijebiti u Hrvatskoj, naišao sam na članak objavljen 25. travnja na portalu index.hr pod naslovom ˝Profesor farmakologije objasnio: masovno testiranje na koronu je besmisleno˝ profesora zagrebačkog Medicinskog fakulteta dr. sc. Vladimira Trkulje upravo na ovu temu. U članku profesor Trkulja komentira ono o čemu zapravo većina statističara i epidemiologa već danima upozorava na društvenim mrežama: odluke od javnog zdravstvenog značaja ne bi se trebale temeljiti na podacima dobivenim nasumičnim testiranjem određene populacije serološkim testovima. Masovno testiranje na prisutnost antitijela za koronavirus serološkim testovima nije samo besmisleno, kako profesor Trkulja tvrdi u svom članku, već ono može biti i opasno ako će ljudi svoje ponašanje temeljiti prema nalazima testa.

O čemu se tu zapravo radi? Naime, ono što sada već svi znamo jest da se dijagnostička uspješnost testa procjenjuje prema (i) vjerojatnosti da je test pozitivan ako je testirana osoba pozitivna – senzitivnost i (ii) vjerojatnosti da je test negativan ako je testirana osoba negativna – specifičnost. Profesor Trkulja u članku uzima za primjer test koji bi imao potvrđenu senzitivnost i specifičnost 95%. Drugim riječima, ako testiramo 100 osoba za koje znamo da su pozitivne, test će njima 95 prikazati da su pozitivni, a od 100 negativnih osoba njih 95 će imati negativan nalaz testa. Dakle, od 100 pozitivnih osoba njih 5 će imati negativan nalaz testa. No, kako profesor Trkulja tvrdi, ono što nas zanima u ovoj situaciji nije vjerojatnost pozitivnog testa za osobu za koju znamo da je zaražena koronavirusom. Zanima nas pozitivna prediktivna vrijednost testa odnosno vjerojatnost da je osoba zaista pozitivna pod uvjetom da je rezultat testa pozitivan i negativna prediktivna vrijednost testa odnosno vjerojatnost da osoba nije zaražena pod uvjetom da je rezultat testa negativan.

Profesor Trkulja kreće od pretpostavke da je prevalencija zaraženosti koronavirusom u Hrvatskoj zapravo 0,1% odnosno 4000 ljudi. Prema tome, tvrdi profesor Trkulja, vjerojatnost da je osoba kojoj je nalaz testa pozitivan zaista pozitivna iznosi zapanjujućih 1,9%! Na čemu točno profesor Trkulja temelji takav podatak, s obzirom na to da navodi samo da su formule ˝malo kompleksnije˝ te da ih možemo preskočiti? Pozitivna i negativna prediktivna vrijednost zapravo nisu ništa drugo nego uvjetne vjerojatnosti dobivene najjednostavnijom primjenom Bayesovog teorema. Naspram autoriteta kao što je dotični profesor činilo mi se kako moj doprinos toj temi nije samo skroman već i suvišan (a možda i sramotan). Možda bih trebao pisati o nekoj drugoj temi. Situacija u kojoj se svijet nalazi nudi filozofima svih područja interesa razne teme, često i od praktične važnosti. Ipak, kako profesor Trkulja u članku nije prikazao kako je došao do rezultata, odlučio sam da možda nije naodmet sam doći do vjerojatnosti koje profesor navodi kako bih se uvjerio u moć te jednostavne formule.

Krenimo redom. Vjerojatnost nekog događaja označavamo kao P( ) te se kreće u rasponu od 0 do 1. U ovom slučaju neka to bude infekcija koronavirusom. Označit ću je kao P(K+). Ako uzmemo u obzir da je prevalencija zaraženosti koronavirusom u Hrvatskoj 0,1%, onda je P(K+)=0,001. Vjerojatnost da osoba u Hrvatskoj nije zaražena je, prema tome, 99,9%. Dakle, imamo P(K-)=0,999. Nadalje, označimo vjerojatnost pozitivnog testa kao P(T+), a vjerojatnost negativnog testa kao P(T-). Uvjetna vjerojatnost označava vjerojatnost nekog događaja pod uvjetom da se drugi događaj dogodio i zapisujemo je kao P( | ). Senzitivnost i specifičnost testa možemo zapisati kao uvjetovane vjerojatnosti P(T+|K+) i P(T-|K-) te u ovom slučaju one obje iznose 0,95. No, podsjetimo se, ono što nas zanima je vjerojatnost da je osoba pozitivna pod uvjetom da je test pozitivan. Dakle, ne zanima nas P(T+|K+), već P(K+|T+). Kako bismo dobili taj rezultat primjenjujemo Bayesov teorem, jednostavnu formulu za izračunavanje uvjetne vjerojatnosti i temelj statističkog zaključivanja. Izvod teorema u ovom ću slučaju preskočiti zbog veličine teksta, no i on je krajnje jednostavan. U slučaju serološkog testiranja na antitijela formula glasi:

P(K+|T+)=[P(T+|K+)*P(K+)]/P(T+)

Zadnja vrijednost u formuli koju ne znamo je vjerojatnost pozitivnog testa. Vjerojatnost da je test pozitivan razlučimo na (i) ljude koji su testirani kao pozitivni i zaista su pozitivni, P(T+|K+)*P(K+), i (ii) ljude koji su testirani kao negativni i zaista su negativni, P(T+|K-)*P(K-). Dakle,

P(T+)=P(T+|K+)*P(K+)+P(T+|K-)*P(K-)

Sada možemo zapisati uvjetnu vjerojatnost da je osoba zaražena koronavirusom pod uvjetom da je serološki test pozitivan kao:

P(K+|T+) = [P(T+|K+)*P(K+)]/ P(T+|K+)*P(K+)+P(T+|K-)*P(K-)

Vjerojatnost da je test pozitivan, a osoba je negativna jest 5% zbog specifičnosti testa od 95%. Dakle, P(T+|K-)=0,05. Kao što sam naveo, vjerojatnost da je osoba u Hrvatskoj negativna na koronavirus jest 99,9% jer je prevalencija u ovom slučaju 0,1%. Dakle, P(K-)=0.999. Uvrstimo sada sve vrijednosti u Bayesovu formulu.

P(K+|T+) = (0,95*0,001)/(0,95*0,001+(0,05*0,999)=0,018664

I zaista, nasumična testirana osoba kojoj bi test pokazao pozitivan nalaz imala bi vjerojatnost da je zaražena koronavirusom od samo 1,9% ako bi se testirala serološkim testovima od 95% specifičnosti i senzitivnosti u populaciji gdje je prevalencija zaraženosti 0,1%. 98,1% testova dat će pogrešan rezultat! Čak i da imamo test s 99% senzitivnosti i specifičnosti i prevalenciju od 0,1% vjerojatnost da je osoba s pozitivnim testom zaista pozitivna je 9%! Pri prevalenciji od 10%, što daje 400 000 zaraženih ljudi u Hrvatskoj, i senzitivnosti i specifičnosti 95% svaki treći test bit će lažno pozitivan. Na stranici vassarstats.net/clin2.html nudi se alat za izračunavanje pozitivnih i negativnih prediktivnih vrijednosti i zanimljivo ga je iskušati.

Nekoliko stvari treba napomenuti za kraj. Prvo, kako je moguće da je pozitivna prediktivna vrijednost testa tako mala? Senzitivnost i specifičnost svojstva su samih testova i u većini slučajeva ne ovise o broju zaraženih ljudi – prevalenciji. S druge strane, pozitivna i negativna prediktivna vrijednost ovise o prevalenciji bolesti u populaciji jer su njihove vrijednosti dobivene izravno iz Bayesovog teorema. Drugim riječima, pozitivna i negativna prediktivna vrijednost nisu svojstva samog testa. Držeći sve ostale vrijednosti fiksnima, vjerojatnost da je osoba pozitivna pod uvjetom da je test pozitivan bit će znatno veća u, primjerice, New Yorku gdje je i prevalencija puno veća nego u Hrvatskoj. No, problem nije samo u tome da su testovi iz tog razloga besmisleni te da je jedina šteta, kako profesor Trkulja u članku navodi, to što ˝čovjek mora u samoizolaciju, najvjerojatnije bespotrebno˝. Činjenica je kako će testovi na antitijela biti dostupni za populaciju u slobodnoj prodaji. U Americi su već u uporabi u privatnim laboratorijima te se nude pri cijeni od stotinjak dolara. Ljudi se nadaju da će im testovi na antitijela omogućiti da napokon vide svoje voljene ili da otvore svoje poslove. Posljedice za javno zdravstvo bile bi katastrofalne kad bi se većina onih koji su dobili lažno pozitivan rezultat počela ponašati vođena pretpostavkom da su preboljeli COVID-19 te time stvorili imunitet. Svi rezultati dobiveni samoizolacijom i gašenjem ekonomske aktivnosti bili bi bačeni u vjetar.

// Osvrti