Fecha de recepción: 09 de diciembre de 2021
Fecha de publicación: marzo de 2023

Publicación semestral   •  ISSN 2683-2968  •  Marzo 2023   •  Número de revista 7
DOI de la revista: https://doi.org/10.22201/dgtic.26832968e

DOI del número: https://doi.org/10.22201/dgtic.26832968e.2023.7

2/7

Desarrollo
Datos y marco teórico

Las plataformas desarrolladas en el laboratorio Chilam como EpI-PUMA, se caracterizan por contar con un clasificador de Bayes implementado para calcular la probabilidad condicional posterior P( C(t) | X(t’) ), de una clase de interés (C) y los predictores.

X(t')=X_1 (t'),X_2 (t'),...,X_N (t')

Por un lado, los indicadores epidemiológicos son las clases de interés de EpI-PUMA y se calculan a partir de los datos proporcionados por la Dirección General de Epidemiología [13]. Estas son:

  • casos positivos a SARS-CoV-2
  • decesos de personas positivas al virus
  • letalidad (la cantidad de decesos entre la cantidad de casos positivos)
  • positividad (casos positivos / número de pruebas realizadas)
  • incidencia (casos por cada 100 000 habitantes).

Por otro lado, los predictores de estas clases de interés abarcan un amplio espectro de variables que incluyen estructuras sociodemográficas [14] y socioeconómicas [16]; infraestructura en Salud [15]2 ; la vulnerabilidad de las personas y su movilidad de un municipio a otro [14]; 20 variables bioclimáticas de temperatura y precipitación [17]3 ; y la contaminación ambiental (mol/cm2): concentración de dióxido de nitrógeno (NO2), formaldehído (CH2O) y dióxido de azufre (SO2) [18].

En nuestra perspectiva, consideramos una aproximación no paramétrica en la cual se buscan patrones emergentes en los datos. Estos están categorizados usando un “coarse graining” es decir, se dividen los datos continuos en intervalos. Así la información se traduce en un sistema binario, donde la respuesta es sí/no, donde ‘sí’ indica que el valor dado de una variable está en una categoría en particular De este modo, los datos expresan sus relaciones jerárquicas en el espacio multifactorial del sistema.

Los clasificadores de Bayes P( C(t)|X(t’) ) pueden interpretarse como la descripción del nicho de la clase de interés, de modo que una configuración de variables X, describe el nicho de C en el caso en que P(C|X) > P(C); y el “anti-nicho” P(C|X) < P(C).  

Así, un conjunto de variables X puede representar un amplio espectro de factores de riesgo. Por ejemplo, condiciones en donde es muy probable que una persona infectada con SARS-CoV-2 fallezca por COVID-19.

El cálculo de P(C|X) requiere de un ensamble estadístico de elementos. En EpI-PUMA 1.0 este ensamble consiste en los municipios del territorio nacional y la clase C representa un subconjunto de municipios de mayor riesgo según una variable epidemiológica. Así, C puede representar, por ejemplo, el 10% de municipios con mayor número de fallecidos en un mes y X representará factores que se pueden discriminar entre municipios de mayor o menor número de fallecidos. Visto así, simplemente hay que contar cuántos municipios en la clase tienen valores particulares de los factores X.

P(X|C)=P(X1|C)·P(X2|C)...P(XN|C)

Esta aproximación de Bayes Ingenuo5  ofrece un marco teórico natural en el cual se pueden incorporar las relaciones causales, y también tiene las siguientes dos ventajas que son clave en la toma de decisiones: (1) incorpora elementos de la intuición humana en forma de hipótesis a priori (prior de Bayes) y (2) considera información cuantitativa en la forma de una función probabilística, para finalmente, mediante el Teorema de Bayes, combinarlas en una probabilidad posterior. Así, sucesivamente, la información nueva y nuestra intuición pueden incorporarse en forma de nuevos priors y funciones probabilísticas para ajustar las probabilidades posteriores.

De tal forma, los clasificadores P( C(t)|X(t’) ) pueden calcularse y recalcular sucesivamente, utilizando distintos modelos estadísticos y de aprendizaje de máquina.

La aproximación basada en la clasificación de Bayes es particularmente adecuada para modelar sistemas complejos adaptativos. Primero, porque tiene una naturaleza probabilística, con modelos de inferencia que incorporan la incertidumbre en una forma rigurosa. Segundo, porque esta aproximación puede lidiar de forma directa y eficiente con los sistemas complejos y multifactoriales, en la cual, la probabilidad de una clase de interés depende de un gran conjunto de variables potenciales (riesgo/nicho y factores) que abarcan un amplio espectro de escalas, desde lo micro a lo macro; y consecuentemente incorporan la transdisciplina.

Finalmente, la aproximación de Bayes hace manifiesta la adaptación en caso de las relaciones entre C y Xi que cambian en el tiempo. Este último aspecto es fundamental para entender sistemas como una pandemia, ya que con el tiempo cambia el riesgo en los grupos vulnerables, las mutaciones del coronavirus, y las intervenciones como la vacunación y el refuerzo de la infraestructura en Salud. 

Por ejemplo, cantidad de camas de hospital, de respiradores artificiales, etcétera.
Temperaturas máximas máximas, mínimas y promedio, así como precipitaciones máximas, mínimas y promedio en diferentes periodos del año.
La “maldición de la dimensionalidad” se refiere al hecho de que los números Ncx y Nx tienden a ser nulos cuando existen muchas dimensiones (o componentes del vector X).
 Se le llama Bayes Ingenuo a este método de aproximación porque presupone que todas las variables son independientes, lo cual no siempre es así.

TIES, REVISTA DE TECNOLOGÍA E INNOVACIÓN EN EDUCACIÓN SUPERIOR (www.ties.unam.mx) 2023, Año 4, No. 7, marzo 2023, es una publicación semestral editada por la Universidad Nacional Autónoma de México (UNAM), Ciudad Universitaria, Alcaldía Coyoacán, C.P. 04510, Ciudad de México, a través de la Dirección General de Cómputo y de Tecnologías de Información y Comunicación, (DGTIC), Circuito Exterior s/n, Ciudad Universitaria, Alcaldía Coyoacán, C.P. 04510, Ciudad de México, Teléfono: (55) 56228166, https://www.ties.unam.mx, revista.ties@unam.mx. Editor responsable: Mtra. Lizbeth Luna González. Número de reserva de Derechos de Autor otorgado por INDAUTOR: 04-2019-011816190900-203 ISSN: 2683-2968, ambos otorgados por el Instituto Nacional del Derecho de Autor. Responsable de la última actualización de este número, Dirección General de Cómputo y de Tecnologías de Información y Comunicación, (DGTIC). Circuito Exterior s/n, Ciudad Universitaria, Alcaldía Coyoacán, C.P. 04510, Ciudad de México, fecha de la última modificación, diciembre de 2022. El contenido de los artículos es responsabilidad de los autores y no refleja el punto de vista de los árbitros, del Editor o de la UNAM. Se autoriza la reproducción total o parcial de los textos aquí publicados siempre y cuando se cite la fuente completa y la dirección electrónica de la publicación. La revista se ha desarrollado sin fines de lucro, con finalidades de diseminación del conocimiento, bajo licencia Creative Commons Reconocimiento-NoComercial (CC BY-NC-SA 4.0). Hecho en México, 2023.