U Pergilla: Reprodukční číslo?

V dobách covidové epidemie jsme byli strašeni hodnotami tzv. reprodukčního čísla r, které, pokud to bylo možné, stále hrozivě narůstalo, přestože se relevantní ukazatele ohrožení (počty nově hospitalizovaných a zemřelých) zlepšovaly.

Reprodukční číslo

Toto číslo je v podstatě velmi primitivní co do definice. Udává nám, kolik se od nemocného nakazí v průměru dalších osob. Je-li větší než jedna, nemoc se v populaci šíří, je-li přesně jedna, nemoc v populaci setrvává, je-li menší než jedna, nemoc ustupuje.
Po této stránce žádný problém, tak to prostě funguje.
Problém nastává v momentě, kdy nemáme informace o všech členech populace, máme jen nějaké odhady. Jistěže i zde existují postupy, jak tyto odhady přiblížit realitě, ale jsou to už jen opravdu odhady. Zejména v situaci, kdy významná část případů probíhá bezpříznakově a my prostě o všech nových případech nemáme informace. Informace máme pouze o těch, kteří vyhledali lékařskou pomoc.

Hlavní zádrhel

Reprodukční číslo by se dalo dobře stanovit, pokud bychom každý týden náhodně, a to zdůrazňuji, vybrali třeba 100 lidí, a je důkladně vyšetřili na covid (práci by nám ušetřilo, pokud by los padl na nějaké nemocné s diagnostikovaným covidem nebo čerstvě vyšetřené s negativním výsledkem).
Pokud pomineme nezanedbatelné procento falešně pozitivních a falešně negativních výsledků, skutečně by se z rozdílů mezi těmi stovkami pacientů a týdny dalo číslo r docela slušně odhadnout a mělo by i nějakou vypovídací hodnotu.
Problém ovšem byl v tom, že ono číslo se počítalo z nových případů, které byly detekovány zdravotní službou. V řadě případů se jednalo o nemocné s covidovými příznaky, případně o příbuzné, spolupracovníky a další kontakty osob s prokázaným covidem. Tito lidé ovšem nejsou náhodný výběr, ale číslo "pseudo r", které z jejich vyšetření vypočteme, bude záviset na tom, jaká zvolíme kritéria kdo je a kdo není kontakt, a koho budeme dále vyšetřovat (čili jaký soubor potíží budeme považovat za prahový pro nasazení vyšetřovacích metod). Je jasné, že ono číslo bude ještě ovlivněno procentem falešně pozitivních a falešně negativních výsledků nasazených testů, takže pouhé přejití na jiného dodavatele testů muselo toto číslo ovlivnit (a dokonce při laboratorně orientovaných studiích se běžně ukazuje, že mohou být i rozdíly mezi šaržemi téhož prostředku od téhož výrobce).
Hlavní zádrhel ovšem spočívá v tom, že i když mezi kontakty najdeme někoho pozitivního, není nijak zaručeno, že se nakazil od onoho nemocného. Navíc ignorujeme obrovské množství nakažených a infekčních, o nichž se prostě neví v důsledku jejich bezpříznakového průběhu.
Jinými slovy, během epidemie se chaoticky a v různých oblastech státu různě měnila jak prahová kritéria pro nasazení testů, tak i jejich účinnost. Navíc výběr testovaných osob, jejichž výsledky se zohledňovaly, nebyl náhodný.
A potom se to dávalo do vzorečků, které jsou určeny pro náhodně vybraný vzorek populace, měřený identickou metodou. Jistě bylo možné kouzlit s nějakými korekčními koeficienty, ale ty do toho mohly vnášet (a zcela jistě i vnášely) další chyby a nejistoty.

Data a zpracování

Zcela jistě se mnou bude souhlasit asi každý, že i z velmi korektně a precisně posbíraných dat lze vyrobit použitím nekvalitní metody cosi naprosto nesmyslného.
Bohužel, tento proces je dosti asymetrický, tj. neexistuje žádná geniální metoda, která by z nekorektně sebraných a nekonzistentních dat vyrobila kvalitní výsledek. Informace, která byla v souboru, z něhož byla takováto data sebrána, je navěky ztracena. V podstatě je pak úplně jedno, jestli nad těmi daty provádíme nějaká pseudoexaktní výpočty, nebo zda si na papír s nimi postavíme kříšťálovou kouli a hluboce se soustředíme. Nebo si na té hromádce papírů (či jiných datových nosičů) vyložíme tarotové karty. Nebo si dáme turka a po jeho vypití budeme věštit ze sedliny.
Obávám se, že jakákoli z uvedených nebo i neuvedených alternativ je zdrojem stejně spolehlivých výsledků jako sebelépe zpracovaná nekvalitní data.

Co měl stát dělat?

Na to je jednoduchá odpověď: V době, kdy se testovaly tisíce až desetitisíce lidí každý den by rozhodně systém nezatížila dvacka (ani ne) denně spolehlivě náhodně vybraných lidí, z nichž by se pak korektní r vypočetlo. Nebo by se vytypovala "hlušší" období v rámci týdne a otestovali se tito lidé souběžně (metodicky správnější).
Existují profesionální agentury, které se zabývají průzkumy veřejného mínění, průzkumy trhu a podobnými aktivitami a jsou s to takový náhodný výběr provést. Nestálo by to asi ani tolik (na jednoho respondenta), jako odběr, provedení a vyhodnocení příslušných testů. A byla by jistota, že to, co počítáme a předkládáme veřejnosti, je skutečně exaktní odhad reprodukčního čísla, a ne nějaké hausnumero ekvivalentní onomu výše uvedenému věštění.

Stát tedy během covidové epidemie selhal v dost zásadní věci, v níž by selhat rozhodně neměl. Prakticky se odřízl od jakékoli zpětné vazby mezi jím vyhlášenými opatřeními a oním číslem r, které současně fetišizoval na hlavní charakteristiku epidemie.

U Pergilla

pátek 25. března 2022

Reprodukční číslo?

Reprodukční číslo

Hlavní zádrhel

Data a zpracování

Co měl stát dělat?

Žádné komentáře:

Okomentovat

Pravidelní čtenáři

Archiv blogu

O mně