Resumo:
CONTEXTO: Os avanços em estudos à nível molecular e de sequenciamento genético trouxeram significativos progressos no compreendimento do comportamento, tratamento e prognóstico do câncer de mama. No entanto, o diagnóstico do câncer de mama em estágios iniciais ainda é essencial para o sucesso no tratamento. Atualmente, o padrão ouro para o diagnóstico, tratamento e gerenciamento do câncer de mama é a análise histológica de uma seção suspeita. A histopatologia consiste na análise das características das lesões através de cortes de tecido corados com Hematoxilina e Eosina. Contudo, atualmente os patologistas são submetidos a altas cargas de trabalho, muito devido ao papel fundamental desempenhado pela análise histológica no tratamento do paciente. Neste contexto, aplicações que possam reduzir o tempo da análise histológica, fornecer uma segunda opinião, ou ainda apontar locais suspeitos como ferramenta de triagem podem auxiliar o patologista. OBJETIVO: Desse modo, vislumbramos dois desafios principais: o primeiro, como identificar regiões cancerígenas em Whole Slide Imaging (WSI) utilizando Deep Learning (DL) com uma precisão comparável as anotações do patologista, consideradas como padrão ouro na literatura. E, segundo, como um modelo baseado em DL pode fornecer um diagnóstico interpretável. A contribuição científica consiste em propor um modelo baseado em Convolutional Neural Networks (CNN) para fornecer uma segmentação refinada e multi-classe de WSI do câncer de mama. METODOLOGIA: A metodologia consiste em propor e desenvolver um modelo chamado de DeepBatch. O DeepBatch é dividido em quatro módulos: Preprocessing, ROI Detection, ROI Sampling e Cell Segmentation. Estes módulos são organizados de maneira a decodificar as informações aprendidas utilizando CNNs em previsões interpretáveis para os patologistas. O módulo de Preprocessing é responsável pela remoção do fundo e de ruído das WSI. No ROI Detection utilizamos a arquitetura convolucional U-Net para identificar regiões suspeitas em WSI de baixa ampliação. As regiões suspeitas identificadas são mapeadas de baixas ampliações pelo ROI Sampling para ampliações de 40×. As regiões em alta ampliação são então segmentadas pela Cell Segmentation. A segmentação é realizada utilizando uma ResNet50/U-Net. Para a validação do DeepBatch, utilizamos datasets de diversas fontes que podem ser utilizados em conjunto ou separadamente em cada módulo, conforme o objetivo do módulo. RESULTADOS: As avaliações realizadas demonstram a viabilidade do modelo. Avaliamos o impacto de quatro espaços de cores (RGB, HSV, YCrCb e LAB) para a segmentação multi-classe de WSI do câncer de mama. Utilizamos para o treinamento, validação e teste 205 WSI do câncer de mama. Para a detecção de regiões suspeitas pelo ROI Detection obtivemos uma IoU de 93.43%, acurácia de 91.27%, sensibilidade de 90.77%, especificidade de 94.03%, F1-Score de 84.17% e uma AUC de 0.93. Para a segmentação refinada das WSI pelo módulo de Cell Segmentation obtivemos uma IoU de 88.23%, acurácia de 96.10%, sensibilidade de 71.83%, especificidade de 96.19%, F1-Score de 82.94% e uma AUC de 0.86. CONCLUSÃO: Como contribuição, o DeepBatch fornece uma segmentação refinada das WSI do câncer de mama utilizando uma cascata de CNNs. Esta segmentação facilita a interpretação do diagnóstico pelo patologista, fornecendo com precisão as regiões consideradas durante a inferência da WSI. Os resultados indicam a possibilidade de utilização do modelo como um sistema de segunda leitura.