Curvas e máis curvas – entender os gráficos da pandemia

Ler de forma crítica representacións de datos é crucial para comprender a magnitude da crise e unha das competencias que debemos aquirir na nosa formación

Por: Wajih Al-Soufi

Estes días preséntannos nas noticias e nas redes sociais un gran número de datos en forma de curvas e simulacións que, afortunadamente, nunca viramos antes e que oxalá non teñamos que volver analizar no futuro. Pero para comprender a magnitude da catástrofe que nos afecta é importante entender o significado destas curvas. Saber ler de forma crítica representacións gráficas de datos é ademais unha das competencias que debemos adquirir como parte da nosa educación (así o sinala o informe PISA da OCDE).

Para as e os docentes as curvas tamén son bos exemplos para explicar conceptos como a escala logarítmica, o crecemento exponencial, a diferencial primeira e segunda ou a integral. Saber como obter os datos e poder facer un/unha mesmo/a representacións permite comprender mellor a base das decisións que nos afectan de forma tan drástica e ver o complexo que é tomalas.

De onde veñen os datos que se representan?

Vemos dous tipos: datos reais de estatísticas das entidades oficiais como o Ministerio de Sanidade ou a OMS que reflicten a situación actual da pandemia; e tamén datos de simulacións e modelos matemáticos que intentan reproducir os datos reais e predicir a evolución no futuro. Poden ser simulacións ou modelos sinxelos que podemos reproducir nós na casa, pero tamén poden ser o traballo de expertos epidemiólogos calculados con grandes ordenadores. Nesta entrada do blog XuvenCiencia imos analizar gráficos dos datos estatísticos e mentras atendemos ás recomendacións de #QuedanaCasa, ensinarémosvos como obtelos nós para representar as nosas propias curvas.

Todos coñecemos a gráfica co total de casos actualmente en España (ao final do texto indicamos as fontes dos datos empregados):

Figura 1. Casos confirmados de COVID-19 acumulados en España (Puntos azuis).
A curva continua laranxa son os datos suavizados sobre un intervalo de cinco días.

 

 

A velocidade da infección: os casos novos por día

Vemos na figura que o número de casos vai aumentando cos días transcorridos. O número cambia pouco ao principio, pero despois aumenta cada vez máis rápido. Observamos que a pendente da curva aumenta co tempo. Como sabedes, a pendente en cada punto da curva calcúlase coa súa derivada N’= dN/dt. Pero, como aquí temos datos discretos de cada día aproximamos o diferencial dN pola diferenza ΔN = Nt –Nt-1 do número de casos entre dous días consecutivos: N’ ≈ ΔNt.

A derivada destes datos co tempo é a “velocidade” da infección, os casos novos por día da Figura 2. Para ver mellor a tendencia sen tanta flutuación calculamos as mesmas diferenzas, mais da curva suavizada da media de cinco días dos casos acumulados (curvas continuas laranxas).

Figura 2. “Primeira derivada” da curva da Figura 1: casos novos diarios calculados.
A curva continua laranxa foi calculada da curva suavizada da Figura 1.

 

 

A aceleración da infección: o cambio no número de casos novos diarios

O número de casos novos aumenta cada día ata o día 25 cando empeza a estabilizarse en arredor de 8.000 casos novos diarios. Pero, ademais, o aumento dos casos novos acelerouse ao principio, é dicir, a pendente desta curva foi aumentando co tempo. Para visualizar esta aceleración representamos as diferenzas diarias entre os casos novos. Isto xa é a segunda derivada dos casos acumulados orixinais! Dinos como cambia a “velocidade” da infección co tempo. Vemos na Figura 3 que a velocidade da infección aumenta ata o día 25, momento no cal empeza a manterse constante e finalmente, por sorte, diminúe.

Figura 3. “Segunda derivada” da curva da Figura 1: a variación entre os casos novos diarios.
A curva continua laranxa foi calculada da curva suavizada da Figura 1.

 

 

O cambio relativo no número de casos novos

Nalgúns medios vemos gráficos que representan o cambio relativo no número de casos novos con respecto ao día anterior. Calculámolo facilmente como ΔN/N = (Nt –Nt-1) / Nt-1 (Figura 4). Ao principio, o número de casos novos era de media un 50% maior có día anterior. Isto foi baixando ata manterse case constante e incluso chegará a ser negativo, cando o número de novos casos vaia diminuír.

Figura 4. A variación relativa entre os casos novos dun día ao seguinte.
A curva continua laranxa foi calculada da curva suavizada da Figura 1.

 

 

O crecemento exponencial

Ben, e todos falan do incremento exponencial dos casos —que ten que ver con estes datos?— Para entendelo analizamos o exemplo dunha pandemia na que o número de casos se duplica cada T2 días. O período T2 chámase período de duplicación. Que función matemática describe o aumento de casos?

Para velo mellor, facemos unha táboa co número de casos de cada día. Se o primeiro día, a t = 0, temos un só caso, e o período de duplicación é un só día (T2 = 1 día) obtemos os seguintes números:

t/días 0 1 2 3 4 5
N 1 2 4 8 16 32
2t 20 = 1 21 = 2 22 = 2·2 23 = 2·2·2 24 25

Como vemos, o número de casos N calcúlase coa potencia N = 2t, unha función exponencial con base 2 e expoñente t, o tempo en días.

Afortunadamente, o número de casos non se dobra cada día, senón nun intervalo máis longo. Calculamos os números para o exemplo dun período T2 = 10 días. Entón, a táboa é a seguinte:

t/días 0 10 20 30 40 50
N 1 2 4 8 16 32
2t/T 1 210/10 = 2 220/10 = 2·2 230/10 240/10 250/10

O número aumenta agora con N = 2t/T. O expoñente t/T2 indica os múltiplos do período T2 nos días transcorridos t.

E se inicialmente temos, en lugar dun caso, por exemplo, N0 = 100 casos? Entón o número de casos multiplícase por este valor inicial N0. Finalmente a función exponencial que buscamos é a seguinte:

    \[N = {N_0}{2^{t/{T_2}}}\]

t/días 0 10 20 30 40 50
N 100 200 400 800 1600 3200
N0 · 2t/T 100 100 · 210/10 100 ·220/10 100 · 230/10 100 · 240/10 100 · 250/10

O período de duplicación T2 indícanos o tempo no que se dobra o número de casos. E se nos interesa o período no que se multiplica por 10? Entón a función exponencial tería a base 10 e un período T10 diferente:

    \[N = {N_0}{10^{t/{T_{10}}}}\]

Como calculamos o período T10 se coñecemos o período de duplicación T2? Pois igualamos as dúas ecuacións anteriores e aplicamos o logaritmo.

Próbao! Obtemos que T10/log 10 = T2/log 2, os períodos cambian en relación ao logaritmo das súas bases. Vale calquera logaritmo, pero se usamos o logaritmo decimal entón T10 = T2/log10 2 = T2 · 3,32 (xa que log10 10 = 1). Isto serve para calquera período Tb no que aumenta o número de casos polo factor b: Tb/log b = T2/log 2:

    \[N = {N_0}{b^{t/{T_b}}}\]

Se cada dous días se duplica o número de casos (T2 = 2), en case unha semana o número aumenta dez veces (T10 = 2 · 3,32), en dúas semanas 100 e en tres semanas 1.000 veces; un aumento vertixinoso!

Entón, a curva dos casos acumulados segue realmente un incremento exponencial? Menos mal que non! Vémolo ben se comparamos a curva real coas curvas calculadas do incremento exponencial para os casos de dobrar cada dous (T2 = 2), tres (T2 = 3) e cada seis (T2 = 6) días:


Figura 5. O número de casos totais en comparación co crecemento exponencial.
As curvas verdes indican curvas cunha duplicación cada dous, tres e seis días.

Os casos duplícanse xa ao principio máis lentamente que cada dous días, e o período de duplicación aumenta cada vez máis. A curva real non é unha función exponencial cun período T2 fixo, senón que T2 cambia co tempo.

 

O período de duplicación

Podemos representar nunha gráfica como cambia o período de duplicación cada día? Fácil! Aplicamos a función do crecemento exponencial a dous días consecutivos. Se un día temos Na casos e o día seguinte Nb, entón temos a seguinte relación entre eles:

    \[{N_a} = {N_0}{2^{{t_a}/{T_2}}},\,\,\,{N_b} = {N_0}{2^{{t_b}/{T_2}}}\,\,\,\,\, \Rightarrow \,\,\,\,\,\frac{{{N_b}}}{{{N_a}}} = \frac{{{2^{{t_b}/{T_2}}}}}{{{2^{{t_a}/{T_2}}}}} = {2^{({t_b} - {t_a})/{T_2}}}\]

Se tomamos o logaritmo (calquera vale, pero eliximos o natural) xa podemos despexar o período de duplicación T2:

    \[\log \frac{{{N_b}}}{{{N_a}}} = \frac{{{t_b} - {t_a}}}{{{T_2}}}\log 2\,\,\,\, \Leftrightarrow \,\,\,\,\,{T_2} = \frac{{({t_b} - {t_a})\cdot\log 2}}{{\log ({N_b}/{N_a})}} = {\rm{ }}\frac{{\log 2}}{{\log ({N_b}/{N_a})}}\cdot(1{\rm{ d\'i a)}}\]

E finalmente, coa diferenza de tempo tbta = 1 día obtemos a seguinte formula ­­sinxela

    \[\,{T_2} = \frac{{\log 2}}{{\log ({N_b}/{N_a})}}\cdot(1{\rm{ d\'i a)}}\]

Na Figura 6 calculamos este período de duplicación T2, da relación entre os números de casos de cada día e do día anterior. Vemos que ao principio o número de casos dobrábase cada 2 a 3 días, pero afortunadamente este tempo foi aumentando ata superar unha semana nos últimos días.

Figura 6. O período de duplicación do número de casos totais.

 

 

A representación co eixe de casos logarítmico

As curvas de crecemento exponencial cambian tan rapidamente que os valores dos primeiros días son difíciles de apreciar. Para ver mellor o cambio ao longo de todo o tempo podemos representar en vez de N o seu logaritmo log N, normalmente o logaritmo en base 10:

    \[{\log _{10}}N = {\log _{10}}{N_0} + \frac{{{{\log }_{10}}2}}{{{T_2}}}\,\cdot\,t\]

Figura 7. O número de casos totais en comparación co crecemento exponencial nunha escala logarítmica.
As curvas verdes indican curvas cunha duplicación cada 2, 3 e cada 6 días.

No eixe vertical da gráfica logarítmica (semilogarítmica en realidade, xa que só aplicamos o logaritmo ao eixe Y) os valores aumentan agora por factores de 10. O espazo entre 100 e 1.000 casos é igual ca entre 1.000 e 10.000. Isto fai que sexa moito máis fácil apreciar os valores de N nos primeiros días.

Observamos ademais, que a gráfica do logaritmo dunha función exponencial fronte ao tempo t dá unha recta coa ordenada na orixe log N0 e a pendente (log 2)/T2 que depende do período de duplicación T2.

Con todo, a curva real non é unha recta, senón que cambia de pendente ao longo do tempo. Isto é así porque o período de duplicación T2 vai cambiando. A pendente en cada día é (log 2)/T2 e ao aumentar T2 baixa.

Pero, ollo, o que temos que analizar é a pendente da curva, non o seu valor. Por exemplo, despois duns 25-30 días a curva segue entre as dúas rectas de 2 e 3 días, pero o período de duplicación T2 neste momento xa é moito mais longo que 3 días. Observa que a pendente da curva é menor cá da recta de 3 días e é mais semellante á dos 6 días. Este tipo de representacións pode enganar, xa que o período de duplicación non depende do valor, senón da pendente da curva.

 

Figura 8: Comparación do número de casos confirmados en diferentes países (curva laranxa). As rectas a trazos indican o crecemento cun período de duplicación de seis días (T2 = 6 días). (Fonte: Reuters, https://graphics.reuters.com/health-coronavirus-growth/0100B5KL438/ 24.3.2020)

 

Coidado, entón, coas rectas de duplicación indicadas nas gráficas logarítmicas publicadas. Por exemplo, na Figura 8 publicada pola axencia Reuters destácase que as curvas de casos confirmados destes países están aínda “por diante” da recta de duplicación en seis días (T2 = 6 días). Na gráfica vese que as curvas de Singapur e Hong Kong efectivamente están “adiantadas” (á dereita e debaixo da recta), pero o que importa é que as pendentes das curvas destes países son cada vez máis pronunciadas e polo menos igual se non máis altas cá recta dos seis días. Nestes países o número de casos duplícase polo menos cada seis días e cada vez máis rapidamente. Polo contrario, en Xapón a pendente é moito menor e a situación parece mellorar.

Animádevos a xogar vós mesmos/as cos datos e facer representacións que vos axuden a entender mellor o que está pasando. Tendes unha multitude de fontes en que recollelos, tanto de España e as súas comunidades autónomas como doutros países. Os profesionais usan ferramentas avanzadas para a análise, pero cunha folla de cálculo como o Calc do LibreOffice ou o Microsoft Excel xa se poden facer moitas cousas. Para que poidades probar vós ou como base para actividades co voso alumnado preparámosvos un manual detallado para facer estas gráficas nunha folla de cálculo.

Descarga do manual e da folla de cálculo para crear e actualizar as gráficas deste artigo como exercicio en clase ou para xogar na casa!

 

Wajih Al-Soufi
Profesor de Química Física
Campus de Lugo
Universidade de Santiago de Compostela

 

Referencias con datos e información sobre os casos da COVID-19:

Informes con representacións actualizadas

Agencia SINC https://www.agenciasinc.es/tag/coronavirus

WHO / OMS – Dashboard

Universidade John Hopkins, EE.UU.

Datos actualizados para descargar

Ministerio de Sanidade

Datadista

Evolución COVID-19, UDC, Carlos Fernández Lozano

Datos internacionais:

Johns Hopkins University Center for Systems Science and Engineering (JHU CSSE)

 

4 Responses

  1. Ola:
    eu coido que a curva non é exponencial senón do tipo loxística: dN/dt = kN-aN²
    as loxísticas teñen un tope de crecemento.
    Pero quizais este modelo é aínda demasiado sinxelosinxelo

    1. Ola Fernando,

      é certo, a curva exponencial é soamente unha aproximación para o inicio da curva do número de infectados. E tampouco a reproduce perfectamente xa que o período de reprodución va cambiando debido ás medidas que se toman no mundo real. A curva loxística pode reproducir o aplanamento máis adiante, pero non a baixada despois.
      Nunha próxima entrada do blog comentaremos modelos algo máis complexos – pero veremos que ningunha pode reproducir, e menos predicir, a realidade que vivimos.
      Saúdos, Wajih

  2. Ola,
    eu vos felicito a todos. Estou facendo lectura comprensiva dos artigos que estades a publicar cos alumnos de 3º ESO na materia de Bioloxía. Xusto iste o deixarei para máis adiante porque inda lles custa extraer a información, así que con táboas a cousa é un pouco máis difícil. Reitero a miña gratitude.
    Un saudiño, María Freire.

    1. Grazas María! Encántanos que che sexa útil! Se cadra podes facer xa algo moi sinxelo cunha folla de cálculo e datos totais de infeccións? Unha representación e despois calcular as diferenzas dun día ao seguinte?

Deixa unha resposta

O teu enderezo electrónico non se publicará Os campos obrigatorios están marcados con *