El % de casos de Covid de la variante Delta creció como una función logística
Etiquetas: Covid-19 , Variante Delta , Datos , Crecimiento Logístico , Tikz
(English: Covid-19 Delta Variant % Share of Cases Grew Logistically)
Hoy, como parte de mi trabajo, me topé con el sorprendente hecho de que en muchos países el porcentaje de los casos Covid-19 que son de la variante delta creció de 0% a 100% de forma casi perfectamente logística durante el año 2021.
La siguiente gráfica, de la cual surge todo esto, se puede ver de forma interactiva al seguir este link de Our World In Data.
Las curvas de la imagen parecen “logísticas” en el sentido de tener forma sigmoide (forma de S) y ser simétricas. Sin embargo, no todo lo que tiene forma sigmoide se puede modelar bien por una función logística.
La función logística general es de la forma $$f(t)=\frac{L}{1+e^{-k(t-a)}}$$ y su gráfica se ve como sigue (figura creada por mí con Tikz, ¡mostraré el código en otra entrada de blog!)
Hay formas elaboradas de verificar si unos datos se puede modelar con una función logística, como por ejemplo, usando con la ecuación diferencial del crecimiento logístico (ver la discusión abajo). Sin embargo, últimamente prefiero revisar si algo es logístico, ya sea:
- graficando los puntos de datos y tratando de ajustar una curva logística a los datos usando controles deslizantes para los parámetros $L$, $a$ y $k$.
- organizando una hoja de cálculo con los datos, la gráfica de los datos, y la gráfica de los valores de un modelo logístico que hacen referencia a los valores para los parámetros $L$, $a$ y $k$ en celdas especiales. Así, al modificar los valores de los parámetros la gráfica se actualiza, y con prueba y error, veo si hay un buen ajuste gráfico.
Este enfoque gráfico es lo que me propuse hacer, ¡y me sorprendió mucho lo que encontré!
Ajuste logístico al % de casos de Covid en los Estados Unidos que son de la variante Delta
Tomando $t=0$ como el 8 de febrero de 2021, un modelo que se ajusta muy bien a los datos está dado por:
- $L = 1$ (la variante Delta alcanzó a ser el $100\%$ de los casos en 2021 antes de la llegada de la variante Omicron).
- $k = 0.09$ (el valor de $k$ dice qué tan rápido es el crecimiento en una curva logística, y su valor $0.09 = 9 \%$ está relacionado con la tasa inicial de crecimiento exponencial en el % de los casos).
- $a=139$ (esto solo corresponde a una traslación horizontal de la curva y no tiene mucha importancia desde el punto de vista matemático — es solo el momento del año en que la tasa de crecimiento de la proporción de Delta fue la más alta, en $\%$ por día).
El modelo logístico se muestra en la siguiente figura:
Otra forma de decir esto: $$ \begin{array}{c} \text{Proporción de casos en los Estados}\cr \text{Unidos que son de la variante Delta} \cr \text{$t$ días después de febrero 8 de 2021} \end{array} = \frac{1}{1+e^{-0.09(t-139)}} $$
Puede encontrar usted mismo este ajuste logístico si la siguiente aplicación de Desmos se carga (use los controles deslizantes para $A$ y $k$). Si no se carga, simplemente siga este enlace o descargue los datos y juegue usted mismo en la hoja de cálculo que creé.
Visite esta página si la gráfica interactiva no carga.
Ajuste logístico al % de casos de Covid en el Reino Unido que son de la variante Delta
El buen ajuste no es solo para datos de los Estados Unidos. Intenté lo mismo con los datos del Reino Unido y obtuve un ajuste similar.
En este caso $k=0.11$, $a=104$ y $L=1$. Es interesante que $k$ sea diferente, ya que dice que la variante Delta superó a otras variantes ligeramente más rápido en el Reino Unido que en los Estados Unidos.
Aquí está la gráfica:
Y aquí está la aplicación de Demos con controles deslizantes (siga este enlace si no se carga). Intente cambiar $k$ a 0.09 para ver de la diferencia en la forma en que la variante Delta superó otras variantes entre los Estados Unidos y el Reino Unido.
Visite esta página si la gráfica interactiva no carga.
No tiene por que haber un buen ajuste con una función logística para datos en forma sigmoide
¡La mejor forma de ver esto es con un ejemplo!
Intente ajustar a un modelo logístico con los controles deslizantes en la siguiente aplicación de Desmos. Los datos son del número total (acumulativo) de casos en la primera ola de Covid-19 en Italia en 2020 (aquí hay un enlace en caso de que no se cargue).
Al intentar ajustar la curva a los datos con los controles deslizantes, pronto entenderá por qué no va a encontrar un buen ajuste.
Visite esta página si la gráfica interactiva no carga.
(datos de John’s Hopkins University).
Esta es una captura de pantalla por si la aplicación de Desmos no se carga:
Otras formas (más elaboradas) para saber si algo es logístico
El crecimiento logístico se rige por la ecuación diferencial $$ \frac{dy}{dt}=ky\left(1-\frac{y}{L}\right)\tag{1} $$ que también se puede escribir como $$ \frac{y’}{y}=k(1-y/L).\tag{2} $$ Esta última ecuación dice que el crecimiento relativo $y’/y$ (que se puede interpretar en un cambio porcentual en una unidad de tiempo) está disminuyendo linealmente como función de $y$.
Note:
- $y’/y\approx k$ cuando $y\approx0$ (que corresponde a crecimiento exponencial de $y$ con una tasa de crecimiento continua $k$ al inicio del crecimiento)
- $y’/y\approx 0$ cuando $y\approx L$ (que corresponde a que $y$ es aproximadamente constante cuando $y$ se acerca a $L$.
Las dos formas $(1)$ y $(2)$ de escribir la ecuación diferencial dan dos formas de ver si unos datos están creciendo logísticamente (se puede estimar $y’$ numéricamente a partir de los datos calculando la tasa de cambio entre datos consecutivos).
¿Es la gráfica de $y’/y$ contra $y$ una línea?
La ecuación $(2)$ dice que para el crecimiento logístico, la gráfica de $y’/y$ contra $y$ debe ser una línea. Si uno hace esta gráfica para datos exactamente logísticos, esto es lo que uno ve:
¿Es la gráfica de $y’$ contra $y$ una parábola?
La ecuación $(1)$ dice que para el crecimiento logístico, la gráfica de $y’$ contra $y$ debe ser una parábola que pasa por el origen y por el punto $(y,y’)=(L,0)$. Si uno hace esta gráfica con datos exactamente logísticos, esto es lo que uno ve:
Pero una vez más digo, últimamente he preferido revisar si algo es logístico simplemente graficando los datos e intentado ajustar una curva logística a través a los datos con controles deslizantes para $L$, $a$ y $k$. Tal como lo mostré en esta entrada de Blog.