Autor |
Montenegro, João Luis Zeni; |
Orientador |
Costa, Cristiano André da; |
Lattes do orientador |
http://lattes.cnpq.br/9637121030877187; |
Instituição |
Universidade do Vale do Rio dos Sinos; |
Sigla da instituição |
Unisinos; |
País da instituição |
Brasil; |
Instituto/Departamento |
Escola Politécnica; |
Idioma |
pt_BR; |
Título |
Hope: a conversational agent based-model for pregnant health literacy; |
Resumo |
O período gestacional é caracterizado por ser um momento de muita expectativa e ao mesmo tempo crítico para as gestantes devido a um grande contingente de incertezas e dúvidas que atingem a gestante neste período. Os primeiros meses do início da gravidez e do início da maternidade envolvem os estágios de pré natal e pós natal e é conhecido como período dos mil dias do bebê. Durante essa fase, diversos tópicos são explorados pelas gestantes como mitigação de riscos, exercícios físicos, nutrição e outros assuntos que acabam por provocar incertezas e ansiedade neste grupo. Agentes conversacionais vêm sendo utilizados através dos anos como ferramentas de engajamento, suporte e informação em diferentes áreas. Na área da saúde este tipo de ferramenta já vem sendo pesquisada para atuação conjunta a atividades junto a pacientes e médicos. Para esta tese propomos o desenvolvimento, implementação e avaliação de agentes conversacionais baseados no modelo de arquitetura HoPE (Help in Obstetrician for PrEgant) que tem por objetivo atuar na promoção de educação para gestantes através de informações confiáveis. Avaliamos esse modelo por meio de estudos clínicos e experimentos envolvendo a recuperação de informações por uma nova arquitetura para agentes conversacionais. O número de estudos com profissionais de saúde e gestantes ainda são remotos e carecem de mais aprofundamento. As estratégias que elencamos para gerenciamento de diálogo e recuperação de informações são pouco exploradas em conjunto no contexto científico, sendo que não encontramos nenhuma proposta que promova modelos com conceitos similares. A arquitetura desenvolvida tem como principais características a capacidade de recuperação e desambiguação de informações utilizando ontologias e modelos Transformadores. Realizamos quatro avaliações principais que promoveram numerosos insights para estudos neste campo. Em um estudo de caráter quantitativo por meio de questionários semi-estruturados, gestantes e profissionais de saúde participaram de interações junto a agentes conversacionais treinados em dados nutricionais. Os resultados apontaram que ambos os grupos têm percepções positivas sobre a experiência com o agente conversacional e estatisticamente a hipótese nula foi aceita (P-value = 0.713). Em uma segunda avaliação com amostra formada por diferentes gestantes e médicos, verificou-se por meio de uma análise mista que as percepções desses grupos são complementares e positivas sobre o uso de agentes conversacionais na saúde treinados em dados gerais do conteúdo de mil dias na gravidez. A nova amostra de gestantes demonstrou novamente percepção positiva de forma geral sobre novos constructos avaliados (Média Geral = 4.0 Desvio médio = 1.1). Ainda, insights gerados por médicos através da análise qualitativa indicaram algumas melhorias como a inserção de conteúdos sobre COVID-19 e comportamento familiar, além de ajustes na abordagem e linguajar do agente conversacional. Buscamos também o desenvolvimento de um novo tipo de estudo, voltado a avaliação da arquitetura proposta e sua performance frente a tarefas de recuperação de informações. Inicialmente, avaliamos modelos Sentence-BERT pré-treinados em língua portuguesa ajustados a dados de protocolos da saúde que extraímos de protocolos oficiais do Governo do Brasileiro. O modelo BERTimbau treinado em estratégias de aumento de dados, obteve a maior correlação com embeddings gerados pelo corpus de dados da saúde (Spearman:95.55) e foi selecionado como modelo vencedor em nossos experimentos. Usando este modelo, realizamos o segundo estudo que avaliou a performance da arquitetura HoPE para agentes conversacionais. Neste estudo, três métricas principais foram avaliadas: eficácia na recuperação de informações, capacidade da arquitetura para identificar intenções compostas e velocidade de inferência da arquitetura. Para tarefa de recuperação de informações, a arquitetura HoPE obteve um F1-Score de (0.89) sob os dados de teste, um hit score de (90%) na identificação de intenções compostas/únicas sob um conjunto de 10 frases e um desempenho regular na velocidade de recuperação de informação (CPU=2.223, GPU=0.222). Estudos futuros irão avaliar por meio de estudos clínicos a arquitetura híbrida HoPE para recuperação de informações, a validação para grupos de gestantes de diferentes estratos demográficos e aprofundaram o estudo em mecanismos para identificação de múltiplas intenções em diálogos.; |
Abstract |
The gestational period is a moment of great expectation and critical for pregnant women due to many uncertainties and doubts that affect the pregnant woman. The first months of pregnancy and motherhood, known as the baby’s thousand days period, include the prenatal and postnatal stages with pregnant women investigating many topics, including risk management, physical activity, nutrition, and other issues that cause uncertainty and anxiety. Conversational agents have been played a role over the years as engagement, support, and information tools in different areas in the health field for collaborative action with patients and doctors. We propose in this thesis the development, implementation, and evaluation of conversational agents based on the HoPE (Help in Obstetrician for PrEgant) architecture model, which aims to promote literacy in pregnant women through reliable information. We evaluated this model through clinical trials and experiments involving information retrieval. Studies involving clinical trials with health professionals and pregnant women are still remote and need further investigation. The strategies we have listed for managing dialogue and retrieving information are unprecedented in the scientific context, and we have not found any proposal that promotes models with similar concepts. The architecture developed has as main pillars the ability to recover and disambiguate information using ontologies and architectures based on Transformers as a center. We carried out five assessments that provided numerous insights for studies in this field. Initially, we applied a survey to get a general picture of the subject in question. In a quantitative study using semi-structured questionnaires, pregnant women and health professionals interacted with conversational agents trained in nutritional data. The results showed that both groups have positive perceptions about the experience with the conversational agent and statistically the null hypothesis was accepted (P-value = 0.713). A second evaluation with a sample formed by different pregnant women and doctors verifies through a mixed analysis that the perceptions of these groups are complementary and positive, regarding the use of conversational health agents trained in general data of the content of a thousand days in pregnancy. The new sample of pregnant women again showed a positive perception in general about the new constructs evaluated (Overall Mean = 4.0 Mean Deviation = 1.1). Also, insights generated by doctors through qualitative analysis indicated some improvements as the inclusion of COVID-19 content and family behavior, as well as adjustments in the approach and language of the conversational agent. We evaluated the pre-trained Sentence-BERT models in Portuguese, adjusted to health protocol data that we extracted from official protocols of the Brazilian Government. The BERTimbau model, trained in data augmentation strategies, obtained the highest correlation with embeddings generated by the health data corpus (Spearman:95.55) and was selected as the winning model in our experiments. Using this model, we performed the second study that evaluated the performance of the HoPE architecture for conversational agents. Three main metrics were evaluated in this study: information retrieval efficacy, architecture’s ability to identify composite intents, and architecture inference speed. For the information retrieval task, the HoPE architecture obtained an F1-Score of (0.89) under the test data, a hit score of (90%) in the identification of composite/unique intents under a set of 10 sentences, and a performance regular in the information retrieval speed (CPU=2.223, GPU=0.222). Future studies will evaluate through clinical studies the hybrid HoPE architecture for information retrieval, validation for groups of pregnant women from different demographic strata, and deepen the study on mechanisms for identifying multiple intentions in dialogues.; |
Palavras-chave |
Agente conversacional; Gravidez; Alfabetização em saúde; Deep Learning; Ontologia; BERT; Conversational agent; Pregnancy; Health literacy; Ontology; |
Área(s) do conhecimento |
ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação; |
Tipo |
Tese; |
Data de defesa |
2022-03-31; |
Agência de fomento |
Nenhuma; |
Direitos de acesso |
openAccess; |
URI |
http://www.repositorio.jesuita.org.br/handle/UNISINOS/11553; |
Programa |
Programa de Pós-Graduação em Computação Aplicada; |