Abstract:
Atualmente são escassos os exemplos de áreas do conhecimento que não se beneficiam de recursos tecnológicos para aumentar a produtividade. Também figurando como uma das beneficiadas por esta tendência, a bioinformática, que surge da união entre biologia, ciência
da computação e medicina, estabeleceu técnicas, algoritmos e bases de dados que se tornaram fundamentais para o execício da pesquisa, seja no âmbito acadêmico ou comercial. Avanços recentes como as tecnologias de Sequenciamento Genético de Próxima Geração (NGS) trouxeram abundância de dados para a bioinformática e a filogenética, que foca no estudo das relações genealógicas entre organismos, aumentando a qualidade dos estudos outrora limitados apenas a observações manuais. Com o objetivo de aumentar o conhecimento sobre bioinformática e filogenética, em colaboração com o laboratório de Biologia da UNISINOS, foi realizado um mapeamento do estado da arte através de uma revisão da literatura que contribuiu para a elaboração de uma taxonomia capaz de classificar os projetos de software encontrados em termos de suas categorias, métodos e finalidades. Com base na revisão bibliográfica é possível concluir que, contrastando com os recentes avanços na filogenética, os projetos de software estão tecnologicamente defasados, demandando investimentos em modernização principalmente no que diz respeito a aplicação de técnicas mais recentes como elasticidade de recursos, balanceamento de carga e aceleração por GPUs. Através do modelo He–lastic é proposta uma abordagem de otimização para o projeto jModelTest que contempla o uso de elasticidade de recursos em um
ambiente de computação em nuvem, resultando em uma arquitetura de elasticidade em duas camadas, baseada nas tecnologias FaaS e de Orquestração de Contêineres. O modelo proposto foi submetido a uma série de cenários de avaliação que possibilitaram a comparação com o estado atual do jModelTest e resultaram, considerando tempo de execução e custo financeiro, em um impacto na faixa de 6% a 16%, conforme a quantidade de recursos utilizados. Dentre as contribuições alcançadas por este trabalho merecem destaque o modelo He–lastic, com sua abordagem baseada em duas camadas de elasticidade que possibilita prevenir custos em momentos de ociosidade, assim como o estudo de custos detalhando a interação entre as camadas de elasticidade, e a taxonomia que foi fundamental na classificação dos trabalhos contemplados pelo levantamento do estado da arte. Futuramente é possível vislumbrar esforços quanto a otimização da transição entre as camadas de elasticidade, que apresentou sensíveis perdas de eficiência durante a avaliação, assim como melhorias no protótipo e no modelo buscando extrair maiores ganhos de eficiência.