Kontekst, braćo, a ne suvoparni podaci

KolUMnična Borba
Piše: Branko Dujović

Statistika je vrlo bitna nauka, a obradom podataka se može puno postići i predvidjeti. Uostalom, dovoljno danas o tome govori rasprostranjena upotreba tehnika kao što su data science ili machine learning, koje su dovele do toga da su nam neke stvari potpuno normalne, a bile su nezamislive prije 10 godina.

Međutim, statistika može biti i mač sa dvije oštrice, ako se zaključci vade bez smisla, ako se podaci vade iz konteksta ili ako se radi selektivno izvlačenje podataka (cherry picks) koje krivi realnu sliku.

Kada je u pitanju situacija sa covidom, prezentovanje podataka na jednostran način i van konteksta može biti i kontraproduktivno. Ne kažem da IJZ treba da bude poput Hansa Roslinga koji je “davao dušu” podacima, ali prezentovanje podataka kao da je mart 2020. godine se može smatrati i neodgovornim.

Punih 15 mjeseci nakon pojave prvog slučaja u CG, IJZ i dalje broji slučajeve. I to je to. Problem nastaje što prosječan građanin, laik za epidemiologiju, ima u svojoj glavi samo okvirne smjernice i obrada podataka se vrši vrlo paušalno. Nešto ovako: “50 slučajeva – lagano; 100 – auh, rastemo, 200 – biće opet zaključavanja za dva mjeseca, rastemo; 350 – haos; 500+ – kolaps sistema”. Da nas ima više od 600 hiljada, drugačije bi bile brojke, ali je jasna ideja. Pošto se niko ne trudi da malo edukuje građane, već se situacija predstavlja kao da smo u najvećem peaku iz novembra 2020. godine, mimo prirodnih AT i vakcina, jasno je i zašto raste panika. Dodajmo na to i pojedine medije koji zbog svojih političkih ciljeva dodaju ulje na vatru i eto nam opšteg haosa i najava apokalipse.

Ne kažem da je situacija dobra, ali definitivno nije ista kao ranije, već dosta bolja, i to iz dva razloga.

[1]
Realan broj slučajeva – sada već imamo ozbiljne formule koje na osnovu broja populacije, broja zaraženih i broja testiranja, dosta dobro računaju tamni faktor, a samim tim i realan broj slučajeva. Tamni faktor je obrnuto proporcionalan broju testova. U prevodu, što više testiranja, manje je “neotkrivenih” zaraženih, a teorijski – ako bi svaki dan testirali 100% stanovništva, tamni faktor bi bio 1, tj. detektovani slučajevi bi bili jednaki realnom broju slučajeva.

Na donjem grafiku, žutom punom linijom je označen detektovani broj slučajeva od 10.08. do 24.08.2021. godine (Period 1 – P1). Žutom isprekidanom linijom je označen od 10.11. do 14.11.2020. godine (Period 2 – P2). Ideja je upoređivanje petnaestodnevnih intervala sa vrlo sličnim brojkama i kretanjem. Narandžastom punom linijom je označen aproksimativni realni broj slučajeva od 10.08. do 24.08.2021. a narandžastom isprekidanom linijom aproksimativni realni broj slučajeva od 10.08. do 24.08.2021. godine. Dakle, u P2, najveći broj testova po danu je bio 2174, a u P1 je bio 4846. Razlika u broju testova je oko 31 hiljadu (P1~60 hiljada, P2~29 hiljada).

Samim tim, broj slučajeva nikako ne može biti isti, što se vidi i na grafiku (isprekidana narandžasta linija je mnogo iznad pune linije).

Evo konkretno, dva datuma gdje se žute linije na grafiku sijeku tj. broj detektovanih slučajeva je približno isti:

  • 15.08.2021. – detektovano je 446 slučajeva, realni broj je 1252, jer je urađeno 4388 testova.
  • 15.11.2020. – detektovano je 463, a realni broj je 2184, jer je urađeno 1378 testova.

Za većinu, 446 iz P1 i 463 iz P2 je isto.

[2]
Vakcinacija i prirodna prokuženost – brojni su radovi koji pokazuju da vakcinacija i reinfekcija višestruko smanjuju teške slučajeve i smrti. Case fatality rate, infection fatality rate i mogućnost hospitalizacije su mnogo manji za 446 iz P1 nego za 463 iz P2. Pomenimo i to da je već dokazano da je covid vrlo sezonalan i da je avgust mnogo povoljniji iz tog ugla nego oktobar.


Za kraj, jedna paralela koja govori o ‘suvim’ podacima.

Šta će reći neko ako ga pitate je li 5km velika distanca? Nema ni tačnog ni netačnog odgovora. Ako morate pješke, onda jeste, ako ste kolima, onda nije. Ako putujete avionom, onda je zanemarljivo malo.

Ako smo prošle godine hodali na koljenima i laktovima distancu do 5km, jer nismo ništa znali o virusu, ne može se 5km danas predstavljati na isti način, jer smo u međuvremenu ispravili kičmu, uspravili se i možda čak i nabavili biciklo. Kontekst je vrlo bitan!

Tagged

Komentariši

Vaša email adresa neće biti objavljivana. Neophodna polja su označena sa *