2020-02-03 19:32:51 +0000 2020-02-03 19:32:51 +0000
28
28

Heeft COVID-19 een sterftecijfer van 41%?

Volgens de gegevens van de Johns Hopkins Coronavirus Tracker waren er op 3 februari 2020 wereldwijd 17491 bevestigde gevallen van COVID-19, 536 totale terugvorderingen en 362 sterfgevallen. Uit mijn niet-deskundige berekening blijkt een sterftecijfer van:

(Nd / (Nd + Nr)) * 100 = 41%

waarbij:

Nd het totale aantal sterfgevallen is, Nr het totale aantal volledige genezingen.

Dit laat 16593 mensen over die nog steeds aan de ziekte lijden en die niet zijn hersteld of gestorven.

Dit staat in schril contrast met de publiekelijk verspreide waarde van ~2% sterfte, dus heb ik een fout gemaakt in mijn berekening of aannames, of is COVID-19 veel gevaarlijker dan algemeen wordt beweerd?

  • [ Na een nuttige discussie in de commentaren is ‘sterftecijfer’ niet de juiste term om hier te gebruiken, in plaats daarvan moet ik zeggen ‘Case Fatality Rate ’.]**

Antwoorden (4)

39
39
39
2020-02-04 16:36:16 +0000

De definitie van sterftecijfer die u geeft, komt niet overeen met een praktische definitie die ik ken. * Wanneer mensen het over het sterftecijfer van een ziekte hebben, bedoelen ze gewoonlijk het sterftecijfer per geval of de verhouding tussen het aantal sterfgevallen en het aantal ziektegevallen, dat eenvoudig gedefinieerd wordt als Nd / Ni, waarbij Nd het aantal sterfgevallen is dat in een bepaalde periode aan de ziekte wordt toegeschreven en Ni het totale aantal nieuwe gevallen van de ziekte dat in dezelfde periode is vastgesteld. Volgens deze definitie is het huidige sterftecijfer van 2019-nCov volgens de door u geciteerde cijfers 362 / 17491 ≈ 2,07%.

(De tracker lijkt te zijn bijgewerkt sinds u uw vraag stelde, en vermeldt nu een totaal van 20679 bevestigde gevallen en 427 sterfgevallen, voor een CFR van 427 / 20679 ≈ 2,06%).

*) Als theoretische definitie van het sterftecijfer op lange termijn, wanneer alle besmette patiënten zijn gestorven of hersteld, kan het enigszins zinvol zijn. Maar dan wordt het gelijkwaardig aan de gebruikelijke definitie van het sterftecijfer.


Om dit te vergelijken met uw definitie van “sterftecijfer” (als Nd / (Nd + Nr), waarbij Nr het aantal personen is dat van de ziekte is hersteld), moeten we om te beginnen vaststellen dat er niet één universele en eenduidige definitie is van wat “van een ziekte herstellen” betekent. Vaak gebruikte definities zijn zoiets als “geen symptomen gedurende X dagen” en/of “virale belasting lager dan N deeltjes per ml gedurende X dagen” of gewoon “wanneer een dokter verklaart dat je weer gezond bent en je uit het ziekenhuis laat gaan”.

Laten we nu eens zeggen dat we een (enigszins) objectieve definitie van herstel hanteren, zoals “geen waarneembare symptomen gedurende twee dagen”. De eerste vaststelling is dat een epidemie die minder dan twee dagen geleden voor het eerst werd waargenomen, volgens uw definitie onvermijdelijk een sterftecijfer van 100% zou hebben, gewoon omdat geen van de tot dan toe besmette mensen tijd zou hebben gehad om al als definitief hersteld te worden beschouwd. (In de veronderstelling dat ten minste één persoon aan de infectie is overleden; anders zou zowel de teller als de noemer nul zijn, en het percentage dus onbepaald). Verder zou uw definitie, zelfs nadat sommige van de vroegste gevallen lang genoeg symptoomvrij zijn geweest om als hersteld te worden geteld, nog steeds een sterk naar boven toe vertekende schatting opleveren van het “ware” sterftecijfer op lange termijn tijdens de beginfase van de epidemie, wanneer het aantal nieuwe gevallen per dag nog steeds toeneemt. Dit komt omdat bij de meeste besmettelijke ziekten de sterfte meestal optreedt wanneer de ziekte het ernstigst is, terwijl degenen die de ziekte overleven daarna een geleidelijke afname van de symptomen zullen meemaken naarmate hun immuunsysteem erin slaagt de voortgang van de infectie tot staan te brengen en om te keren.


Ter illustratie een hypothetische ziekte met een theoretisch langetermijngemiddelde van 1% CFR - dat wil zeggen dat precies 1% van alle (herkenbaar) besmette patiënten aan de ziekte zal sterven. Laten we verder aannemen dat deze ziekte er typisch twee dagen over doet om te evolueren van het eerste begin van herkenbare symptomen tot de toestand van maximale ernst, wanneer de meeste sterfgevallen zich voordoen. Daarna, ervan uitgaande dat de patiënt het overleeft, nemen de symptomen geleidelijk af gedurende de volgende drie dagen. Aangezien remissie mogelijk is (maar zeldzaam), beschouwen artsen een patiënt over het algemeen pas als hersteld wanneer hij gedurende ten minste twee dagen geen symptomen vertoont. Een typisch geval zou dus als volgt verlopen:

begin van de symptomen → toenemende symptomen (2 dagen) → piek ernst → afnemende symptomen (3 dagen) → geen symptomen → observatie (2 dagen) → officieel hersteld (totale tijd: ca. 7 dagen vanaf begin)

of, voor de 1% van de patiënten voor wie de ziekte fataal is:

begin van de symptomen → toenemende symptomen (2 dagen) → dood (totale tijd: ca. 2 dagen vanaf begin)

2 dagen vanaf het begin)

Laten we nu eens aannemen dat tijdens de beginperiode van een epidemie, wanneer de infectie zich nog exponentieel verspreidt, het aantal nieuwe gevallen elke drie dagen met een factor 10 toeneemt. In die periode kan het aantal nieuwe gevallen, genezingen en sterfgevallen per dag dus ongeveer als volgt toenemen (in het kader van het voorbeeld wordt aangenomen dat elke dag precies 1% van de gediagnosticeerde patiënten twee dagen later sterft, afgerond naar beneden):

| cases | recovered | deaths | | |  
day | new | total | new | total | new | total | Nd / Ni | Nd/(Nd+Nr) |
----+-------+-------+-------+-------+-------+-------+---------+------------+
  1 | 1 | 1 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  2 | 2 | 3 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  3 | 5 | 8 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  4 | 10 | 18 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  5 | 20 | 38 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  6 | 50 | 88 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  7 | 100 | 188 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  8 | 200 | 388 | 1 | 1 | 0 | 0 | 0.00% | 0.0% |
  9 | 500 | 888 | 2 | 3 | 1 | 1 | 0.11% | 25.0% |
 10 | 1000 | 1888 | 5 | 8 | 2 | 3 | 0.16% | 27.3% |
 11 | 2000 | 3888 | 10 | 18 | 5 | 8 | 0.21% | 30.8% |
 12 | 5000 | 8888 | 20 | 38 | 10 | 18 | 0.20% | 32.1% |

Zoals u in bovenstaande tabel kunt zien, onderschat een naïeve berekening van het sterftecijfer als (totaal aantal sterfgevallen) / (totaal aantal gevallen) tijdens deze exponentiële groeiperiode het werkelijke CFR op lange termijn met een factor van (in dit geval) ongeveer 5 vanwege het tijdsverschil van twee dagen tussen infectie en overlijden. Aan de andere kant zou het gebruik van uw formule van (totaal aantal sterfgevallen) / (totaal aantal sterfgevallen + teruggevonden) het werkelijke CFR met een factor van ongeveer 30 overschatten!

Laten we ondertussen aannemen dat de epidemie na de eerste 12 dagen verzadigt met 10.000 nieuwe gevallen per dag. Nu is het totale zullen de getallen er als volgt uitzien:

| cases | recovered | deaths | | |  
day | new | total | new | total | new | total | Nd / Ni | Nd/(Nd+Nr) |
----+-------+-------+-------+-------+-------+-------+---------+------------+
 13 | 10000 | 18888 | 50 | 88 | 20 | 38 | 0.20% | 30.2% |
 14 | 10000 | 28888 | 99 | 187 | 50 | 88 | 0.30% | 32.0% |
 15 | 10000 | 38888 | 198 | 385 | 100 | 188 | 0.48% | 32.8% |
 16 | 10000 | 48888 | 495 | 880 | 100 | 288 | 0.59% | 24.7% |
 17 | 10000 | 58888 | 990 | 1870 | 100 | 388 | 0.66% | 17.2% |
 18 | 10000 | 68888 | 1980 | 3850 | 100 | 488 | 0.71% | 11.2% |
 19 | 10000 | 78888 | 4950 | 8800 | 100 | 588 | 0.74% | 6.3% |
 20 | 10000 | 88888 | 9900 | 18700 | 100 | 688 | 0.77% | 3.5% |
 21 | 10000 | 98888 | 9900 | 28600 | 100 | 788 | 0.80% | 2.7% |

Zoals u kunt zien, beginnen de twee metingen van het sterftecijfer uiteindelijk naar elkaar toe te groeien naarmate de groei van de epidemie afneemt. Op de lange termijn, wanneer de meerderheid van de patiënten herstelt of sterft, convergeren beide naar het “ware” sterftecijfer op de lange termijn van 1%. Maar tegen die tijd is de epidemie in principe voorbij.

Er zijn verschillende manieren om een nauwkeuriger schatting van het sterftecijfer op lange termijn te krijgen, zelfs tijdens de eerste exponentiële groeifase van een epidemie. Een van die methoden is te kijken naar de resultaten van een enkele cohort van patiënten bij wie op hetzelfde tijdstip een diagnose is gesteld. Voor onze hypothetische voorbeeld-epidemie, waarbij bijvoorbeeld alleen wordt gekeken naar de 1000 patiënten die op dag 10 zijn gediagnosticeerd, zouden we een nauwkeurige schatting van het CFR op dag 12 kunnen krijgen door eenvoudigweg de 10 sterfgevallen binnen dat cohort te delen door het totale aantal patiënten in het cohort. Bovendien zou het observeren van meerdere cohorten ons een vrij goed idee geven van hoe lang na de diagnose we moeten wachten voordat het geschatte sterftecijfer voor elke cohort in de buurt komt van zijn uiteindelijke werkelijke waarde.

Helaas is voor een dergelijke cohortenanalyse voor 2019-nCov gedetailleerdere informatie nodig dan de tracker waarnaar u verwijst. Zelfs de tijdreeks-spreadsheet waarnaar de tracker linkt, geeft niet direct zulke gedetailleerde cohortgegevens, hoewel het misschien mogelijk is om er betere schattingen uit te halen door enkele min of meer redelijke veronderstellingen te maken over het typische verloop van de ziekte.

  • *

Addendum: Er blijken al een paar voorlopige cohortstudies van het soort dat ik hierboven beschrijf, te zijn gepubliceerd voor 2019-nCoV.

Met name “A novel coronavirus outbreak of global health concern” 30185-9) van Wang et al. en “Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China” 30183-5) van Huang et al. _, beide gepubliceerd op 24 januari in _The Lancet, merken op dat van de eerste 41 patiënten bij wie vóór 2 januari 2020 in Wuhan een 2019-nCoV was vastgesteld, er op 22 januari zes waren overleden (en 28 waren ontslagen, waardoor er nog zeven in het ziekenhuis lagen), wat een fataliteitspercentage van 14,6% in dit cohort geeft.

Zij adviseren echter dit cijfer met de nodige voorzichtigheid te behandelen en wijzen op een aantal redenen (naast alleen het kleine aantal onderzochte gevallen) waarom het misschien niet volledig het uiteindelijke CFR op lange termijn weerspiegelt:

However, both of these [CFR] estimates [van 14. 6% van het cohort van 41 patiënten en van 2,9% van alle 835 gevallen die op het moment van schrijven zijn bevestigd] _moeten echter met grote voorzichtigheid worden behandeld omdat niet alle patiënten hun ziekte hebben beëindigd (d.w.z. hersteld of overleden) en het werkelijke aantal infecties en het volledige ziektespectrum onbekend zijn. Belangrijk is dat bij uitbraken van nieuwe virale infecties de verhouding tussen het aantal ziektegevallen en het aantal sterfgevallen in de beginfase vaak wordt overschat omdat de opsporing van de ziektegevallen sterk gericht is op de ernstigere gevallen. Naarmate meer gegevens beschikbaar komen over het spectrum van milde of asymptomatische infecties, waarvan één geval door Chan en collega’s is gedocumenteerd, zal de ratio van het sterftecijfer waarschijnlijk dalen. _”

Er is ook een later artikel, getiteld “Epidemiological and clinical characteristics of 99 cases of 2019 novel coronavirus pneumonia in Wuhan, China: a descriptive study” van Chen et al., gepubliceerd op 30 januari, dat een cohort van 99 patiënten onderzoekt die tussen 1 en 20 januari zijn gediagnosticeerd en een CFR van 11% binnen dit cohort rapporteert. De studie volgde deze patiënten echter slechts tot 25 januari, toen meer dan de helft van hen (57 van de 99) nog in het ziekenhuis was opgenomen.

19
19
19
2020-02-03 20:17:53 +0000

De vergelijking die u gebruikt voor het sterftecijfer is alleen echt nuttig op de zeer lange termijn voor een bekende ziekte, wanneer de meeste gevallen zijn opgelost.

Het is niet erg informatief op de korte termijn, wanneer de overgrote meerderheid van de totale gevallen noch sterfgevallen noch genezingen zijn.

Op dit moment heeft de overgrote meerderheid van de gediagnosticeerde mensen een milde ziekte en is het zeer onwaarschijnlijk dat ze zullen sterven, maar het duurt lang voordat ze tot de categorie “hersteld” worden gerekend. Bovendien zijn veel van degenen die zijn overleden bijzonder kwetsbaar. Van de WHO:

Net als bij andere aandoeningen van de luchtwegen kan infectie met 2019-nCoV milde symptomen veroorzaken, waaronder een loopneus, keelpijn, hoest en koorts. Bij sommige personen kan de ziekte ernstiger zijn en leiden tot longontsteking of ademhalingsmoeilijkheden. In zeldzamere gevallen kan de ziekte fataal zijn. Oudere mensen en mensen met reeds bestaande medische aandoeningen (zoals diabetes en hartaandoeningen) lijken kwetsbaarder te zijn om ernstig ziek te worden door het virus.

Schattingen van het sterftecijfer die u in het nieuws ziet, kunnen gebaseerd zijn op sterfgevallen, of zijn gebaseerd op vergelijkingen door deskundigen met vroegere epidemische coronavirusstammen en kennis van het typische verloop van de ziekte.

Bovendien weten we niet hoe nauwkeurig de cijfers zijn, vooral wat de gevallen betreft. Er kunnen veel meer milde gevallen zijn die niet gemeld worden.

Er zullen pas goede schattingen van het werkelijke sterftecijfer zijn als er meer tijd overheen is gegaan, en zelfs dan is het onwaarschijnlijk dat een enkel getal veel informatie zal opleveren. In plaats daarvan zal het risico variëren naar leeftijd en andere factoren. Goede informatiebronnen, zoals de WHO, maken geen melding van sterftecijfers: zij melden op dit moment alleen gevallen en sterfgevallen.

Enkele goede bronnen voor verdere informatie: https://www.who.int/emergencies/diseases/novel-coronavirus-2019 https://www.cdc.gov/coronavirus/2019-nCoV/summary.html https://www.nhs.uk/conditions/wuhan-novel-coronavirus/

11
11
11
2020-02-04 15:34:55 +0000

Ik zou graag willen inklokken met een uitleg van wat er precies mis is met de berekening die in de vraag wordt aangeboden, in plaats van alleen maar te zeggen “het is een verkeerde formule”. Het is belangrijk om het “waarom” van de misvatting te begrijpen. Dus ik zal proberen uw vraag te beantwoorden vanuit het oogpunt van de wiskunde.

TL;DR: De hoofdoorzaak van de drogreden is dat het herstel veel langer duurt dan de dood.

(Nd / (Nd + Nr)) * 100 = 41% waar: Nd is het totale aantal doden, Nr is het totale aantal volledige genezingen.

Die formule (en de logica erachter) is correct zolang Nd en Nr beide verwijzen naar dezelfde vaste groep mensen. Dat wil zeggen, als we N geïnfecteerde mensen hadden geplukt, en op hen hadden gewacht tot ze allemaal de uiteindelijke staat (herstel of dood) hadden bereikt, en die Nr en Nd bij die formule boven hadden gezet - dan zou dat inderdaad het statistische sterftecijfer in die groep opleveren.

De huidige tellingen van herstel- en sterftecijfers verwijzen echter niet naar dezelfde groep. Nd in elk WHO-rapport verwijst naar de groep van alle mensen die tot nu toe sinds het begin van de uitbraak geïnfecteerd zijn geweest. Maar de uiteindelijke uitkomst van alle mensen in die groep is nog onbekend. Dagelijks verwijst Nr alleen naar een subgroep van alle geïnfecteerden (met uitzondering van de onbekenden), zie? Dus je kunt Nd en Nr niet uit een WHO-rapport halen en die getallen op die formule zetten - dat zouden appels en sinaasappels zijn…

Om dit punt te illustreren, denk aan een sterk vereenvoudigde denkbeeldige situatie: er is een ziekte die kan leiden tot de dood op de 3de dag, terwijl de rest van de geïnfecteerde mensen volledig zal herstellen op de 15de dag. In dat geval zou Nd in het officiële rapport alle mensen omvatten die 3 dagen geleden en daarvoor geïnfecteerd waren, terwijl Nr alle mensen zou omvatten die 15 dagen geleden en daarvoor geïnfecteerd waren. Gezien de hoge stroom van nieuwe bevestigde gevallen die elke dag komt, is het verschil tussen die twee groepen enorm: het zijn al die mensen die in 12 dagen geïnfecteerd zijn!

In ons echte geval is dat verschil veel groter dan Nr en Nd samen, wat betekent dat de fout van het negeren van dat verschil de berekening totaal nutteloos maakt. (Wel, het is nuttig als een absolute bovengrens, maar meer niet).

3
3
3
2020-02-06 10:30:02 +0000

Volgens eerdere antwoorden is in deze vroege fase van 2019-nCoV, Nd/(Nd+Nr) een overschatter, en Nd/Nc een onderschatter.

Aangezien de momenteel gejubelde koers overeenkomt met de onderschatting Nd/Nc, heb je gelijk dat 2019-nCoV ‘gevaarlijker’ is dan algemeen wordt beweerd. Ik heb aanhalingstekens gebruikt, omdat gevaarlijk een onbetrouwbare term is.

Aangezien Nd/Nc gelijk is aan Nd/(Nd+Nr) nadat de epidemie voorbij is, zou een betere schatting zijn de twee quotiënten in de tijd te volgen en hun curven te extrapoleren tot het punt waarop zij elkaar ontmoeten. Dat zou nog steeds een vertekende schatter zijn, maar minder dan een van beide op zichzelf. Ik denk dat er meer verfijnde schatters zijn met minder vertekening, en ik heb die vraag hier gepost: Wat is een verfijnde schatting van het sterftecijfer in 2019-nCoV?