Resumo:
O domínio da saúde enfrenta desafios significativos no gerenciamento do crescente
volume de dados gerados diariamente, particularmente na coleta e compartilhamento
dessas informações. Profissionais de saúde, como médicos, enfermeiros, radiologistas,
cardiologistas, cirurgiões e outros especialistas frequentemente inserem dados de
pacientes em sistemas eletrônicos, geralmente em um formato textual aberto e não
estruturado. Uma revisão da literatura revela vários desafios no processamento de dados
do mundo real, com uma questão crítica sendo a escassez de ferramentas e dicionários
disponíveis em português para o setor de saúde. Essa lacuna, juntamente com os
desafios únicos inerentes ao processamento de dados de saúde, adiciona considerável
complexidade à extração e estruturação de informações essenciais de registros clínicos.
Além disso, garantir a interoperabilidade de dados entre diferentes provedores de saúde
se torna desafiador quando esses provedores não visam inicialmente a interoperabilidade
durante a coleta de dados. Observando esses desafios, esta pesquisa propôs um modelo
para permitir a interoperabilidade semântica de notas clínicas de sistemas de prontuários
eletrônicos. A metodologia usada nesta pesquisa tem um caráter aplicado e exploratório,
e foi avaliada por meio do desenvolvimento de um protótipo. Esta abordagem visa
mapear as limitações atuais no processamento e integração de dados, especificamente no contexto de notas clínicas em português brasileiro, e criar um modelo flexível que possa tratar dados do mundo real de forma mais eficaz na estruturação e compartilhamento de dados. Esta pesquisa faz parte do projeto MinhaSaudeDigital (MSD), uma colaboração entre a universidade e seis hospitais de Porto Alegre, que forneceram dados de pacientes hospitalizados que testaram positivo para COVID-19, garantindo um problema do mundo real para o contexto de dados de saúde. Foram analisadas as características dos dados com relação à interoperabilidade entre provedores e proposto um modelo que envolve técnicas híbridas para extração de informações, normalização lexical e estruturação de dados para harmonização de padrões. Assim, definiu-se um conjunto de experimentos que emprega o aprendizado de máquina, combinando a arquitetura Transformers para reconhecimento de entidades com processamento de linguagem natural para normalização lexical e correspondência semântica, por adotando ontologias OWL como uma estrutura de representação intermediária. Os experimentos revelaram três contribuições principais. Primeiro, o desenvolvimento de um conjunto de dados anotados especializados, classificando seis entidades com 18.666 anotações validadas por especialistas em 314 documentos. Em segundo lugar, conduzidos experimentos usando modelos BERT ajustados em um pequeno conjunto de dados para reconhecimento de entidades, alcançando 95% de precisão, com taxas de precisão de 90% para classificar entidades relacionadas a Procedimentos Invasivos ou Terapêuticos e 89% para Doenças ou Síndromes e Procedimentos Diagnósticos. Esses resultados demonstram a eficácia do
modelo na extração de informações relevantes de notas clínicas não estruturadas.
Terceiro, ontologias como estruturas de representação intermediárias garantiram a
consistência semântica necessária à interoperabilidade mantendo um formato
independente. As limitações e oportunidades para estudos futuros desta pesquisa
incluem a aplicação do modelo a dados de diferentes domínios, como notas de
enfermagem, odontologia, contexto clínico e registros de responsabilidade. Outro tópico
é a lacuna na desambiguação de termos e alinhamento semântico em dados de saúde,
com foco na vinculação de terminologias a dados estruturados, garantindo codificação
internacional para dados clínicos e permitindo a interoperabilidade entre fronteiras.
Finalmente, esta pesquisa visa contribuir para a continuidade do cuidado e saúde do
cidadão e orientar desenvolvedores e provedores na construção de plataformas robustas e complexas que implementem o uso de padrões de saúde. Também espera-se que cada vez mais profissionais e gestores de saúde melhorem a assistência médica em todo o mundo por meio da adoção de padrões internacionais em sistemas de prontuários eletrônicos.