Autor |
Zeiser, Felipe André; |
Lattes do autor |
http://lattes.cnpq.br/1870564118351754; |
Orientador |
Costa, Cristiano André da; |
Lattes do orientador |
http://lattes.cnpq.br/9637121030877187; |
Co-orientador |
Ramos, Gabriel de Oliveira; |
Lattes do co-orientador |
http://lattes.cnpq.br/9281736089055094; |
Instituição |
Universidade do Vale do Rio dos Sinos; |
Sigla da instituição |
Unisinos; |
País da instituição |
Brasil; |
Instituto/Departamento |
Escola Politécnica; |
Idioma |
pt_BR; |
Título |
Multsurv: a multimodal deep learning model for hospitalized patients survival analysis in the contexto of a pandemic; |
Resumo |
CONTEXTO: As doenças infecciosas respiratórias representam um grande desafio na
sociedade moderna. Recentemente, enfrentamos o maior desafio de saúde pública do
último século. A Severe Acute Respiratory Syndrome Coronavirus 2 provocou uma
sobrecarga em quase todos os sistemas de saúde do mundo, evidenciando as fragilidades preexistentes. A heterogeneidade das manifestações clínicas da COVID-19 dificultou o manejo dos pacientes hospitalizados, tornando crucial a identificação daqueles em maior risco, especialmente para a alocação de recursos vitais. Diferentemente de pandemias passadas, os pacientes hospitalizados atualmente são monitorados de forma contínua e por meio de diferentes modalidades. Esses dados geram grandes conjuntos de dados longitudinais e multimodais nas instituições de saúde. Nesse contexto, soluções baseadas em dados podem apoiar as decisões clínicas e fornecer novas ferramentas para a gestão de riscos dos pacientes hospitalizados durante pandemias. OBJETIVO: Deste modo, propomos integrar características clínicas, laboratoriais e de imagens de Raio-X do tórax em um modelo de análise de sobrevivência para pacientes hospitalizados com COVID-19. Com o modelo, buscamos combinar dados multimodais e longitudinais para capturar a natureza dinâmica da COVID-19 e fornecer uma função de risco explicável. METODOLOGIA: A metodologia envolve a proposição e desenvolvimento do modelo MultSurv. O modelo é dividido em cinco componentes principais: (i) pre-processing; (ii) feature encoders; (iii) temporal attention; (iv) CheXReport; e (v) multitask networks. O pre-processing é responsável pela limpeza de dados, remoção de outliers, seleção de variáveis e processamento de imagens. Nos feature encoders, os dados categóricos e contínuos são transformados em um vetor de embeddings que captura as relações complexas e não-lineares entre as variáveis. Em seguida, com base nos embeddings até o instante de tempo atual, extraímos um vetor de contexto temporal utilizando a temporal attention. O CheXReport processa as imagens de
Raio-X do paciente utilizando uma arquitetura fully-transformers, que integra características visuais com os elementos textuais dos laudos. Finalmente, todos os vetores de características são concatenados para serem processados nas multitask
networks, um conjunto de redes neurais multitarefas que permite ao modelo capturar
as características específicas de cada risco. RESULTADOS: Para avaliar o desempenho
do modelo MultSurv, realizamos um estudo de ablação incremental. Utilizamos os
conjuntos de dados públicos PBC2, MIMIC-CXR, Curated Dataset for COVID-19 e um
conjunto de dados privado. Em seguida, comparamos os resultados do modelo MultSurv com o estado da arte. Os resultados obtidos demonstram que o modelo MultSurv superou todas as arquiteturas de referência, com um C-index de 0.723 ± 0.008 para t =1e t = 1, e 0.695 ± 0.003 para t =7e t = 7. CONCLUSÃO: A principal contribuição científica deste estudo é a proposta de um modelo multimodal para o processamento de dados dinâmicos e longitudinais na análise de sobrevivência no contexto da COVID-19. Além disso, o modelo MultSurv oferece uma ferramenta de apoio à priorização de pacientes em cenários de pandemia. Por fim, a aplicação do modelo MultSurv pode ser adaptada para diferentes contextos clínicos, estendendo-se além da COVID-19.; |
Abstract |
BACKGROUND: Respiratory infectious diseases represent a major challenge in modern society. We recently faced the most significant public health challenge of the last century. Severe Acute Respiratory Syndrome Coronavirus 2 has overwhelmed almost all health systems worldwide, highlighting pre-existing weaknesses. The heterogeneity of COVID-19 clinical manifestations has made it challenging to manage hospitalized patients, making it crucial to identify those at greatest risk, especially for eciently allocating vital resources. Unlike past pandemics, hospitalized patients are currently monitored continuously and through di↵erent modalities. These data generate large longitudinal and multimodal datasets in health institutions. In this context, data-driven solutions can support clinical decisions and provide new tools for risk management of hospitalized patients during pandemics. OBJECTIVE: Therefore, we propose integrating clinical, laboratory, and chest X-ray imaging features into a survival analysis model for hospitalized patients with COVID-19. With the model, we aim to combine multimodal and longitudinal data to
capture the dynamic nature of COVID-19 and provide an explainable hazard function. METHODOLOGY: The methodology involves the proposition and development of the model. The model is divided into five main components: (i) pre-processing; (ii) feature encoders; (iii) temporal attention; (iv) CheXReport; and (v) multitask networks. The pre-processing component is responsible for data cleaning, outlier removal, variable selection, and image processing. In the feature encoders, the categorical and continuous data are transformed into a vector of embeddings that capture the complex and non-linear relationships between the variables. Then, based on the embeddings up to the current time instant, we extract a temporal context vector using temporal attention. The CheXReport component processes the patient’s X-ray images using a fully-transformers architecture, which integrates visual features with the textual elements of the reports. Finally, all feature vectors are concatenated to be processed in the multitask networks, a set of neural networks that allow the model to capture the specific characteristics of each risk. RESULTS: To evaluate the model performance, we used an incremental ablation study. We use the public datasets PBC2, MIMIC-CXR, Curated Dataset for COVID-19, and a private dataset. Then, we compare the results of the MultSurv model with the state of the art. The results obtained demonstrate that the MultSurv outperforms all reference
architectures, with a C-index of 0.723 ± 0.008 for t = 1 and t = 1, and 0.695 ± 0.003 for t = 7 and t = 7. CONCLUSION: The main scientific contribution of this study is the proposal of a multimodal model for processing dynamic and longitudinal data in survival analysis in the context of COVID-19. Furthermore, the MultSurv model offers a tool to support patient prioritization in pandemic scenarios. Finally, the application of the model can be adapted to di↵erent clinical contexts, extending beyond COVID-19.; |
Palavras-chave |
Análise de sobrevivência; Pandemia; Multimodal data; Aprendizado profundo; Inteligência Artificial; Survival analysis; Pandemics; Deep learning; Artificial Intelligence; |
Área(s) do conhecimento |
ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação; |
Tipo |
Tese; |
Data de defesa |
2024-10-02; |
Agência de fomento |
CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior; |
Direitos de acesso |
openAccess; |
URI |
http://repositorio.jesuita.org.br/handle/UNISINOS/13418; |
Programa |
Programa de Pós-Graduação em Computação Aplicada; |