Multsurv: a multimodal deep learning model for hospitalized patients survival analysis in the contexto of a pandemic

metadataTrad.dc.contributor.author	Zeiser, Felipe André;
metadataTrad.dc.contributor.authorLattes	http://lattes.cnpq.br/1870564118351754;
metadataTrad.dc.contributor.advisor	Costa, Cristiano André da;
metadataTrad.dc.contributor.advisorLattes	http://lattes.cnpq.br/9637121030877187;
metadataTrad.dc.contributor.advisor-co1	Ramos, Gabriel de Oliveira;
metadataTrad.dc.contributor.advisor-co1Lattes	http://lattes.cnpq.br/9281736089055094;
metadataTrad.dc.publisher	Universidade do Vale do Rio dos Sinos;
metadataTrad.dc.publisher.initials	Unisinos;
metadataTrad.dc.publisher.country	Brasil;
metadataTrad.dc.publisher.department	Escola Politécnica;
metadataTrad.dc.language	pt_BR;
metadataTrad.dc.title	Multsurv: a multimodal deep learning model for hospitalized patients survival analysis in the contexto of a pandemic;
metadataTrad.dc.description.resumo	CONTEXTO: As doenças infecciosas respiratórias representam um grande desafio na sociedade moderna. Recentemente, enfrentamos o maior desafio de saúde pública do último século. A Severe Acute Respiratory Syndrome Coronavirus 2 provocou uma sobrecarga em quase todos os sistemas de saúde do mundo, evidenciando as fragilidades preexistentes. A heterogeneidade das manifestações clínicas da COVID-19 dificultou o manejo dos pacientes hospitalizados, tornando crucial a identificação daqueles em maior risco, especialmente para a alocação de recursos vitais. Diferentemente de pandemias passadas, os pacientes hospitalizados atualmente são monitorados de forma contínua e por meio de diferentes modalidades. Esses dados geram grandes conjuntos de dados longitudinais e multimodais nas instituições de saúde. Nesse contexto, soluções baseadas em dados podem apoiar as decisões clínicas e fornecer novas ferramentas para a gestão de riscos dos pacientes hospitalizados durante pandemias. OBJETIVO: Deste modo, propomos integrar características clínicas, laboratoriais e de imagens de Raio-X do tórax em um modelo de análise de sobrevivência para pacientes hospitalizados com COVID-19. Com o modelo, buscamos combinar dados multimodais e longitudinais para capturar a natureza dinâmica da COVID-19 e fornecer uma função de risco explicável. METODOLOGIA: A metodologia envolve a proposição e desenvolvimento do modelo MultSurv. O modelo é dividido em cinco componentes principais: (i) pre-processing; (ii) feature encoders; (iii) temporal attention; (iv) CheXReport; e (v) multitask networks. O pre-processing é responsável pela limpeza de dados, remoção de outliers, seleção de variáveis e processamento de imagens. Nos feature encoders, os dados categóricos e contínuos são transformados em um vetor de embeddings que captura as relações complexas e não-lineares entre as variáveis. Em seguida, com base nos embeddings até o instante de tempo atual, extraímos um vetor de contexto temporal utilizando a temporal attention. O CheXReport processa as imagens de Raio-X do paciente utilizando uma arquitetura fully-transformers, que integra características visuais com os elementos textuais dos laudos. Finalmente, todos os vetores de características são concatenados para serem processados nas multitask networks, um conjunto de redes neurais multitarefas que permite ao modelo capturar as características específicas de cada risco. RESULTADOS: Para avaliar o desempenho do modelo MultSurv, realizamos um estudo de ablação incremental. Utilizamos os conjuntos de dados públicos PBC2, MIMIC-CXR, Curated Dataset for COVID-19 e um conjunto de dados privado. Em seguida, comparamos os resultados do modelo MultSurv com o estado da arte. Os resultados obtidos demonstram que o modelo MultSurv superou todas as arquiteturas de referência, com um C-index de 0.723 ± 0.008 para t =1e t = 1, e 0.695 ± 0.003 para t =7e t = 7. CONCLUSÃO: A principal contribuição científica deste estudo é a proposta de um modelo multimodal para o processamento de dados dinâmicos e longitudinais na análise de sobrevivência no contexto da COVID-19. Além disso, o modelo MultSurv oferece uma ferramenta de apoio à priorização de pacientes em cenários de pandemia. Por fim, a aplicação do modelo MultSurv pode ser adaptada para diferentes contextos clínicos, estendendo-se além da COVID-19.;
metadataTrad.dc.description.abstract	BACKGROUND: Respiratory infectious diseases represent a major challenge in modern society. We recently faced the most significant public health challenge of the last century. Severe Acute Respiratory Syndrome Coronavirus 2 has overwhelmed almost all health systems worldwide, highlighting pre-existing weaknesses. The heterogeneity of COVID-19 clinical manifestations has made it challenging to manage hospitalized patients, making it crucial to identify those at greatest risk, especially for eciently allocating vital resources. Unlike past pandemics, hospitalized patients are currently monitored continuously and through di↵erent modalities. These data generate large longitudinal and multimodal datasets in health institutions. In this context, data-driven solutions can support clinical decisions and provide new tools for risk management of hospitalized patients during pandemics. OBJECTIVE: Therefore, we propose integrating clinical, laboratory, and chest X-ray imaging features into a survival analysis model for hospitalized patients with COVID-19. With the model, we aim to combine multimodal and longitudinal data to capture the dynamic nature of COVID-19 and provide an explainable hazard function. METHODOLOGY: The methodology involves the proposition and development of the model. The model is divided into five main components: (i) pre-processing; (ii) feature encoders; (iii) temporal attention; (iv) CheXReport; and (v) multitask networks. The pre-processing component is responsible for data cleaning, outlier removal, variable selection, and image processing. In the feature encoders, the categorical and continuous data are transformed into a vector of embeddings that capture the complex and non-linear relationships between the variables. Then, based on the embeddings up to the current time instant, we extract a temporal context vector using temporal attention. The CheXReport component processes the patient’s X-ray images using a fully-transformers architecture, which integrates visual features with the textual elements of the reports. Finally, all feature vectors are concatenated to be processed in the multitask networks, a set of neural networks that allow the model to capture the specific characteristics of each risk. RESULTS: To evaluate the model performance, we used an incremental ablation study. We use the public datasets PBC2, MIMIC-CXR, Curated Dataset for COVID-19, and a private dataset. Then, we compare the results of the MultSurv model with the state of the art. The results obtained demonstrate that the MultSurv outperforms all reference architectures, with a C-index of 0.723 ± 0.008 for t = 1 and t = 1, and 0.695 ± 0.003 for t = 7 and t = 7. CONCLUSION: The main scientific contribution of this study is the proposal of a multimodal model for processing dynamic and longitudinal data in survival analysis in the context of COVID-19. Furthermore, the MultSurv model offers a tool to support patient prioritization in pandemic scenarios. Finally, the application of the model can be adapted to di↵erent clinical contexts, extending beyond COVID-19.;
metadataTrad.dc.subject	Análise de sobrevivência; Pandemia; Multimodal data; Aprendizado profundo; Inteligência Artificial; Survival analysis; Pandemics; Deep learning; Artificial Intelligence;
metadataTrad.dc.subject.cnpq	ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação;
metadataTrad.dc.type	Tese;
metadataTrad.dc.date.issued	2024-10-02;
metadataTrad.dc.description.sponsorship	CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior;
metadataTrad.dc.rights	openAccess;
metadataTrad.dc.identifier.uri	http://repositorio.jesuita.org.br/handle/UNISINOS/13418;
metadataTrad.dc.publisher.program	Programa de Pós-Graduação em Computação Aplicada;

Files in this item

Name: Felipe Zeiser_.pdf

Size: 7.471Mb

Format: PDF

Description: MultSurv_multimodal

View/Open

This item appears in the following Collection(s)

PPG Computação Aplicada [46]
PPG Computação Aplicada

Show simple item record

Search

Browse

All of RDBU
- Communities & Collections
This Collection

My Account

Statistics

View Usage Statistics

Multsurv: a multimodal deep learning model for hospitalized patients survival analysis in the contexto of a pandemic

Files in this item

This item appears in the following Collection(s)

Search

Browse

All of RDBU

This Collection

My Account

Statistics