Estes días preséntannos nas noticias e nas redes sociais un gran número de datos en forma de curvas e simulacións que, afortunadamente, nunca viramos antes e que oxalá non teñamos que volver analizar no futuro. Pero para comprender a magnitude da catástrofe que nos afecta é importante entender o significado destas curvas. Saber ler de forma crítica representacións gráficas de datos é ademais unha das competencias que debemos adquirir como parte da nosa educación (así o sinala o informe PISA da OCDE).
Para as e os docentes as curvas tamén son bos exemplos para explicar conceptos como a escala logarítmica, o crecemento exponencial, a diferencial primeira e segunda ou a integral. Saber como obter os datos e poder facer un/unha mesmo/a representacións permite comprender mellor a base das decisións que nos afectan de forma tan drástica e ver o complexo que é tomalas.
De onde veñen os datos que se representan?
Vemos dous tipos: datos reais de estatísticas das entidades oficiais como o Ministerio de Sanidade ou a OMS que reflicten a situación actual da pandemia; e tamén datos de simulacións e modelos matemáticos que intentan reproducir os datos reais e predicir a evolución no futuro. Poden ser simulacións ou modelos sinxelos que podemos reproducir nós na casa, pero tamén poden ser o traballo de expertos epidemiólogos calculados con grandes ordenadores. Nesta entrada do blog XuvenCiencia imos analizar gráficos dos datos estatísticos e mentras atendemos ás recomendacións de #QuedanaCasa, ensinarémosvos como obtelos nós para representar as nosas propias curvas.
Todos coñecemos a gráfica co total de casos actualmente en España (ao final do texto indicamos as fontes dos datos empregados):
A velocidade da infección: os casos novos por día
Vemos na figura que o número de casos vai aumentando cos días transcorridos. O número cambia pouco ao principio, pero despois aumenta cada vez máis rápido. Observamos que a pendente da curva aumenta co tempo. Como sabedes, a pendente en cada punto da curva calcúlase coa súa derivada N’= dN/dt. Pero, como aquí temos datos discretos de cada día aproximamos o diferencial dN pola diferenza ΔN = Nt –Nt-1 do número de casos entre dous días consecutivos: N’ ≈ ΔN/Δt.
A derivada destes datos co tempo é a “velocidade” da infección, os casos novos por día da Figura 2. Para ver mellor a tendencia sen tanta flutuación calculamos as mesmas diferenzas, mais da curva suavizada da media de cinco días dos casos acumulados (curvas continuas laranxas).
A aceleración da infección: o cambio no número de casos novos diarios
O número de casos novos aumenta cada día ata o día 25 cando empeza a estabilizarse en arredor de 8.000 casos novos diarios. Pero, ademais, o aumento dos casos novos acelerouse ao principio, é dicir, a pendente desta curva foi aumentando co tempo. Para visualizar esta aceleración representamos as diferenzas diarias entre os casos novos. Isto xa é a segunda derivada dos casos acumulados orixinais! Dinos como cambia a “velocidade” da infección co tempo. Vemos na Figura 3 que a velocidade da infección aumenta ata o día 25, momento no cal empeza a manterse constante e finalmente, por sorte, diminúe.
O cambio relativo no número de casos novos
Nalgúns medios vemos gráficos que representan o cambio relativo no número de casos novos con respecto ao día anterior. Calculámolo facilmente como ΔN/N = (Nt –Nt-1) / Nt-1 (Figura 4). Ao principio, o número de casos novos era de media un 50% maior có día anterior. Isto foi baixando ata manterse case constante e incluso chegará a ser negativo, cando o número de novos casos vaia diminuír.
O crecemento exponencial
Ben, e todos falan do incremento exponencial dos casos —que ten que ver con estes datos?— Para entendelo analizamos o exemplo dunha pandemia na que o número de casos se duplica cada T2 días. O período T2 chámase período de duplicación. Que función matemática describe o aumento de casos?
Para velo mellor, facemos unha táboa co número de casos de cada día. Se o primeiro día, a t = 0, temos un só caso, e o período de duplicación é un só día (T2 = 1 día) obtemos os seguintes números:
t/días | 0 | 1 | 2 | 3 | 4 | 5 |
N | 1 | 2 | 4 | 8 | 16 | 32 |
2t | 20 = 1 | 21 = 2 | 22 = 2·2 | 23 = 2·2·2 | 24 | 25 |
Como vemos, o número de casos N calcúlase coa potencia N = 2t, unha función exponencial con base 2 e expoñente t, o tempo en días.
Afortunadamente, o número de casos non se dobra cada día, senón nun intervalo máis longo. Calculamos os números para o exemplo dun período T2 = 10 días. Entón, a táboa é a seguinte:
t/días | 0 | 10 | 20 | 30 | 40 | 50 |
N | 1 | 2 | 4 | 8 | 16 | 32 |
2t/T | 1 | 210/10 = 2 | 220/10 = 2·2 | 230/10 | 240/10 | 250/10 |
O número aumenta agora con N = 2t/T. O expoñente t/T2 indica os múltiplos do período T2 nos días transcorridos t.
E se inicialmente temos, en lugar dun caso, por exemplo, N0 = 100 casos? Entón o número de casos multiplícase por este valor inicial N0. Finalmente a función exponencial que buscamos é a seguinte:
t/días | 0 | 10 | 20 | 30 | 40 | 50 |
N | 100 | 200 | 400 | 800 | 1600 | 3200 |
N0 · 2t/T | 100 | 100 · 210/10 | 100 ·220/10 | 100 · 230/10 | 100 · 240/10 | 100 · 250/10 |
O período de duplicación T2 indícanos o tempo no que se dobra o número de casos. E se nos interesa o período no que se multiplica por 10? Entón a función exponencial tería a base 10 e un período T10 diferente:
Como calculamos o período T10 se coñecemos o período de duplicación T2? Pois igualamos as dúas ecuacións anteriores e aplicamos o logaritmo.
Próbao! Obtemos que T10/log 10 = T2/log 2, os períodos cambian en relación ao logaritmo das súas bases. Vale calquera logaritmo, pero se usamos o logaritmo decimal entón T10 = T2/log10 2 = T2 · 3,32 (xa que log10 10 = 1). Isto serve para calquera período Tb no que aumenta o número de casos polo factor b: Tb/log b = T2/log 2:
Se cada dous días se duplica o número de casos (T2 = 2), en case unha semana o número aumenta dez veces (T10 = 2 · 3,32), en dúas semanas 100 e en tres semanas 1.000 veces; un aumento vertixinoso!
Entón, a curva dos casos acumulados segue realmente un incremento exponencial? Menos mal que non! Vémolo ben se comparamos a curva real coas curvas calculadas do incremento exponencial para os casos de dobrar cada dous (T2 = 2), tres (T2 = 3) e cada seis (T2 = 6) días:
Os casos duplícanse xa ao principio máis lentamente que cada dous días, e o período de duplicación aumenta cada vez máis. A curva real non é unha función exponencial cun período T2 fixo, senón que T2 cambia co tempo.
O período de duplicación
Podemos representar nunha gráfica como cambia o período de duplicación cada día? Fácil! Aplicamos a función do crecemento exponencial a dous días consecutivos. Se un día temos Na casos e o día seguinte Nb, entón temos a seguinte relación entre eles:
Se tomamos o logaritmo (calquera vale, pero eliximos o natural) xa podemos despexar o período de duplicación T2:
E finalmente, coa diferenza de tempo tb – ta = 1 día obtemos a seguinte formula sinxela
Na Figura 6 calculamos este período de duplicación T2, da relación entre os números de casos de cada día e do día anterior. Vemos que ao principio o número de casos dobrábase cada 2 a 3 días, pero afortunadamente este tempo foi aumentando ata superar unha semana nos últimos días.
A representación co eixe de casos logarítmico
As curvas de crecemento exponencial cambian tan rapidamente que os valores dos primeiros días son difíciles de apreciar. Para ver mellor o cambio ao longo de todo o tempo podemos representar en vez de N o seu logaritmo log N, normalmente o logaritmo en base 10:
No eixe vertical da gráfica logarítmica (semilogarítmica en realidade, xa que só aplicamos o logaritmo ao eixe Y) os valores aumentan agora por factores de 10. O espazo entre 100 e 1.000 casos é igual ca entre 1.000 e 10.000. Isto fai que sexa moito máis fácil apreciar os valores de N nos primeiros días.
Observamos ademais, que a gráfica do logaritmo dunha función exponencial fronte ao tempo t dá unha recta coa ordenada na orixe log N0 e a pendente (log 2)/T2 que depende do período de duplicación T2.
Con todo, a curva real non é unha recta, senón que cambia de pendente ao longo do tempo. Isto é así porque o período de duplicación T2 vai cambiando. A pendente en cada día é (log 2)/T2 e ao aumentar T2 baixa.
Pero, ollo, o que temos que analizar é a pendente da curva, non o seu valor. Por exemplo, despois duns 25-30 días a curva segue entre as dúas rectas de 2 e 3 días, pero o período de duplicación T2 neste momento xa é moito mais longo que 3 días. Observa que a pendente da curva é menor cá da recta de 3 días e é mais semellante á dos 6 días. Este tipo de representacións pode enganar, xa que o período de duplicación non depende do valor, senón da pendente da curva.
Coidado, entón, coas rectas de duplicación indicadas nas gráficas logarítmicas publicadas. Por exemplo, na Figura 8 publicada pola axencia Reuters destácase que as curvas de casos confirmados destes países están aínda “por diante” da recta de duplicación en seis días (T2 = 6 días). Na gráfica vese que as curvas de Singapur e Hong Kong efectivamente están “adiantadas” (á dereita e debaixo da recta), pero o que importa é que as pendentes das curvas destes países son cada vez máis pronunciadas e polo menos igual se non máis altas cá recta dos seis días. Nestes países o número de casos duplícase polo menos cada seis días e cada vez máis rapidamente. Polo contrario, en Xapón a pendente é moito menor e a situación parece mellorar.
Animádevos a xogar vós mesmos/as cos datos e facer representacións que vos axuden a entender mellor o que está pasando. Tendes unha multitude de fontes en que recollelos, tanto de España e as súas comunidades autónomas como doutros países. Os profesionais usan ferramentas avanzadas para a análise, pero cunha folla de cálculo como o Calc do LibreOffice ou o Microsoft Excel xa se poden facer moitas cousas. Para que poidades probar vós ou como base para actividades co voso alumnado preparámosvos un manual detallado para facer estas gráficas nunha folla de cálculo.
Descarga do manual e da folla de cálculo para crear e actualizar as gráficas deste artigo como exercicio en clase ou para xogar na casa!
Wajih Al-Soufi
Profesor de Química Física
Campus de Lugo
Universidade de Santiago de Compostela
Referencias con datos e información sobre os casos da COVID-19:
Informes con representacións actualizadas
- Ministerio de Sanidade, Ministerio de Ciencia e Innovación
- Situación de COVID-19 en España https://covid19.isciii.es/
- Informes COVID-19 Vigilancia en Salud Pública – RENAVE,
https://www.isciii.es/QueHacemos/Servicios/VigilanciaSaludPublicaRENAVE/EnfermedadesTransmisibles/Paginas/InformesCOVID-19.aspx
Agencia SINC https://www.agenciasinc.es/tag/coronavirus
WHO / OMS – Dashboard
Universidade John Hopkins, EE.UU.
Datos actualizados para descargar
Ministerio de Sanidade
- https://covid19.isciii.es/resources/serie_historica_acumulados.csv
(Datos oficiais, algo incómodos para usar, xa que veñen acumulados na mesma columna por autonomías e días.)
Datadista
- https://github.com/datadista/datasets/tree/master/COVID%2019 https://github.com/datadista/datasets/blob/master/COVID%2019/ccaa_covid19_casos.csv
(Datos non oficiais cun formato cómodo para importar nas follas de cálculo. Descargar no botón “Raw”.)
Evolución COVID-19, UDC, Carlos Fernández Lozano
- https://www.udc.es/covid-19/evolucion/ (Datos non oficiais cun formato preparado para a análise con R)
Datos internacionais:
Johns Hopkins University Center for Systems Science and Engineering (JHU CSSE)
- https://github.com/CSSEGISandData/COVID-19/blob/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv
(Datos de moitos países. Descargar en “Raw”.)
4 Responses
Ola:
eu coido que a curva non é exponencial senón do tipo loxística: dN/dt = kN-aN²
as loxísticas teñen un tope de crecemento.
Pero quizais este modelo é aínda demasiado sinxelosinxelo
Ola Fernando,
é certo, a curva exponencial é soamente unha aproximación para o inicio da curva do número de infectados. E tampouco a reproduce perfectamente xa que o período de reprodución va cambiando debido ás medidas que se toman no mundo real. A curva loxística pode reproducir o aplanamento máis adiante, pero non a baixada despois.
Nunha próxima entrada do blog comentaremos modelos algo máis complexos – pero veremos que ningunha pode reproducir, e menos predicir, a realidade que vivimos.
Saúdos, Wajih
Ola,
eu vos felicito a todos. Estou facendo lectura comprensiva dos artigos que estades a publicar cos alumnos de 3º ESO na materia de Bioloxía. Xusto iste o deixarei para máis adiante porque inda lles custa extraer a información, así que con táboas a cousa é un pouco máis difícil. Reitero a miña gratitude.
Un saudiño, María Freire.
Grazas María! Encántanos que che sexa útil! Se cadra podes facer xa algo moi sinxelo cunha folla de cálculo e datos totais de infeccións? Unha representación e despois calcular as diferenzas dun día ao seguinte?