Fecha de recepción: 09 de diciembre de 2021
Fecha de publicación: marzo de 2023
DOI del artículo: https://doi.org/10.22201/dgtic.26832968e.2022.7.2
2/7
Las plataformas desarrolladas en el laboratorio Chilam como EpI-PUMA, se caracterizan por contar con un clasificador de Bayes implementado para calcular la probabilidad condicional posterior P( C(t) | X(t’) ), de una clase de interés (C) y los predictores.
X(t')=X_1 (t'),X_2 (t'),...,X_N (t')
Por un lado, los indicadores epidemiológicos son las clases de interés de EpI-PUMA y se calculan a partir de los datos proporcionados por la Dirección General de Epidemiología [13]. Estas son:
Por otro lado, los predictores de estas clases de interés abarcan un amplio espectro de variables que incluyen estructuras sociodemográficas [14] y socioeconómicas [16]; infraestructura en Salud [15]2 ; la vulnerabilidad de las personas y su movilidad de un municipio a otro [14]; 20 variables bioclimáticas de temperatura y precipitación [17]3 ; y la contaminación ambiental (mol/cm2): concentración de dióxido de nitrógeno (NO2), formaldehído (CH2O) y dióxido de azufre (SO2) [18].
En nuestra perspectiva, consideramos una aproximación no paramétrica en la cual se buscan patrones emergentes en los datos. Estos están categorizados usando un “coarse graining” es decir, se dividen los datos continuos en intervalos. Así la información se traduce en un sistema binario, donde la respuesta es sí/no, donde ‘sí’ indica que el valor dado de una variable está en una categoría en particular De este modo, los datos expresan sus relaciones jerárquicas en el espacio multifactorial del sistema.
Los clasificadores de Bayes P( C(t)|X(t’) ) pueden interpretarse como la descripción del nicho de la clase de interés, de modo que una configuración de variables X, describe el nicho de C en el caso en que P(C|X) > P(C); y el “anti-nicho” P(C|X) < P(C).
Así, un conjunto de variables X puede representar un amplio espectro de factores de riesgo. Por ejemplo, condiciones en donde es muy probable que una persona infectada con SARS-CoV-2 fallezca por COVID-19.
El cálculo de P(C|X) requiere de un ensamble estadístico de elementos. En EpI-PUMA 1.0 este ensamble consiste en los municipios del territorio nacional y la clase C representa un subconjunto de municipios de mayor riesgo según una variable epidemiológica. Así, C puede representar, por ejemplo, el 10% de municipios con mayor número de fallecidos en un mes y X representará factores que se pueden discriminar entre municipios de mayor o menor número de fallecidos. Visto así, simplemente hay que contar cuántos municipios en la clase tienen valores particulares de los factores X.
P(X|C)=P(X1|C)·P(X2|C)...P(XN|C)
Esta aproximación de Bayes Ingenuo5 ofrece un marco teórico natural en el cual se pueden incorporar las relaciones causales, y también tiene las siguientes dos ventajas que son clave en la toma de decisiones: (1) incorpora elementos de la intuición humana en forma de hipótesis a priori (prior de Bayes) y (2) considera información cuantitativa en la forma de una función probabilística, para finalmente, mediante el Teorema de Bayes, combinarlas en una probabilidad posterior. Así, sucesivamente, la información nueva y nuestra intuición pueden incorporarse en forma de nuevos priors y funciones probabilísticas para ajustar las probabilidades posteriores.
De tal forma, los clasificadores P( C(t)|X(t’) ) pueden calcularse y recalcular sucesivamente, utilizando distintos modelos estadísticos y de aprendizaje de máquina.
La aproximación basada en la clasificación de Bayes es particularmente adecuada para modelar sistemas complejos adaptativos. Primero, porque tiene una naturaleza probabilística, con modelos de inferencia que incorporan la incertidumbre en una forma rigurosa. Segundo, porque esta aproximación puede lidiar de forma directa y eficiente con los sistemas complejos y multifactoriales, en la cual, la probabilidad de una clase de interés depende de un gran conjunto de variables potenciales (riesgo/nicho y factores) que abarcan un amplio espectro de escalas, desde lo micro a lo macro; y consecuentemente incorporan la transdisciplina.
Finalmente, la aproximación de Bayes hace manifiesta la adaptación en caso de las relaciones entre C y Xi que cambian en el tiempo. Este último aspecto es fundamental para entender sistemas como una pandemia, ya que con el tiempo cambia el riesgo en los grupos vulnerables, las mutaciones del coronavirus, y las intervenciones como la vacunación y el refuerzo de la infraestructura en Salud.
2 Por ejemplo, cantidad de camas de hospital, de respiradores artificiales, etcétera.
3 Temperaturas máximas máximas, mínimas y promedio, así como precipitaciones máximas, mínimas y promedio en diferentes periodos del año.
4 La “maldición de la dimensionalidad” se refiere al hecho de que los números Ncx y Nx tienden a ser nulos cuando existen muchas dimensiones (o componentes del vector X).
5 Se le llama Bayes Ingenuo a este método de aproximación porque presupone que todas las variables son independientes, lo cual no siempre es así.