RDBU| Repositório Digital da Biblioteca da Unisinos

He-lasic : um modelo de elasticidade em nuvem baseado em duas camadas para acelerar o cálculo de best-fit em sistemas de substituição filogenética

Mostrar registro simples

Autor Aubin, Mateus Rauback;
Lattes do autor http://lattes.cnpq.br/4232123205140540;
Orientador Righi, Rodrigo da Rosa;
Lattes do orientador http://lattes.cnpq.br/2332604239081900;
Instituição Universidade do Vale do Rio dos Sinos;
Sigla da instituição Unisinos;
País da instituição Brasil;
Instituto/Departamento Escola Politécnica;
Idioma pt_BR;
Título He-lasic : um modelo de elasticidade em nuvem baseado em duas camadas para acelerar o cálculo de best-fit em sistemas de substituição filogenética;
Resumo Atualmente são escassos os exemplos de áreas do conhecimento que não se beneficiam de recursos tecnológicos para aumentar a produtividade. Também figurando como uma das beneficiadas por esta tendência, a bioinformática, que surge da união entre biologia, ciência da computação e medicina, estabeleceu técnicas, algoritmos e bases de dados que se tornaram fundamentais para o execício da pesquisa, seja no âmbito acadêmico ou comercial. Avanços recentes como as tecnologias de Sequenciamento Genético de Próxima Geração (NGS) trouxeram abundância de dados para a bioinformática e a filogenética, que foca no estudo das relações genealógicas entre organismos, aumentando a qualidade dos estudos outrora limitados apenas a observações manuais. Com o objetivo de aumentar o conhecimento sobre bioinformática e filogenética, em colaboração com o laboratório de Biologia da UNISINOS, foi realizado um mapeamento do estado da arte através de uma revisão da literatura que contribuiu para a elaboração de uma taxonomia capaz de classificar os projetos de software encontrados em termos de suas categorias, métodos e finalidades. Com base na revisão bibliográfica é possível concluir que, contrastando com os recentes avanços na filogenética, os projetos de software estão tecnologicamente defasados, demandando investimentos em modernização principalmente no que diz respeito a aplicação de técnicas mais recentes como elasticidade de recursos, balanceamento de carga e aceleração por GPUs. Através do modelo He–lastic é proposta uma abordagem de otimização para o projeto jModelTest que contempla o uso de elasticidade de recursos em um ambiente de computação em nuvem, resultando em uma arquitetura de elasticidade em duas camadas, baseada nas tecnologias FaaS e de Orquestração de Contêineres. O modelo proposto foi submetido a uma série de cenários de avaliação que possibilitaram a comparação com o estado atual do jModelTest e resultaram, considerando tempo de execução e custo financeiro, em um impacto na faixa de 6% a 16%, conforme a quantidade de recursos utilizados. Dentre as contribuições alcançadas por este trabalho merecem destaque o modelo He–lastic, com sua abordagem baseada em duas camadas de elasticidade que possibilita prevenir custos em momentos de ociosidade, assim como o estudo de custos detalhando a interação entre as camadas de elasticidade, e a taxonomia que foi fundamental na classificação dos trabalhos contemplados pelo levantamento do estado da arte. Futuramente é possível vislumbrar esforços quanto a otimização da transição entre as camadas de elasticidade, que apresentou sensíveis perdas de eficiência durante a avaliação, assim como melhorias no protótipo e no modelo buscando extrair maiores ganhos de eficiência.;
Abstract Currently there are few examples of areas of knowledge that don’t benefit from technological resources to increase productivity. Also being one of the beneficiaries of this trend, bioinformatics, which emerges from the combination of knowledge in biology, computer science and medicine, has established techniques, algorithms and databases that have become fundamental for the execution of research, whether in the academic or professional spheres. Recent advances such as Next Generation Gene Sequencing (NGS) technologies have brought abundance of data to bioinformatics and phylogenetics, which focuses on the study of genealogical relationships between organisms, increasing the quality of studies once limited to manual observations only. With the objective of increasing knowledge about bioinformatics and phylogenetics, in collaboration with the Biology laboratory of UNISINOS, we sought out to carry a mapping of the state of the art through a literature review that contributed to the formulation of a taxonomy capable of classifying the software projects found in terms of their categories, methods and purposes. We conclude, on the basis of the bibliography, that in contrast to the recent advances in phylogenetics, software projects are technologically outdated, requiring investments in modernization mainly regarding the application of more recent techniques such as resource elasticity, load balancing and GPU acceleration. Through the He–lastic model an optimization approach is propos ed for the jModelTest project which encompasses the use of resource elasticity in a cloud computing environment, resulting in a two layer elasticity architecture, base on FaaS and Container Orchestration technologies. The proposed model was submitted to a series of evaluation scenarios that allowed for comparison with the current state of jModelTest and resulted in an overhead, encompassing execution time and financial cost, between 6% to 16%, depending on the number of resources allocated. Among the contributions achieved by our proposal, the He–lastic model is highlighted, with its dual elasticity layers approach, which avoids idle costs, as well as a cost study detailing the interaction between elasticity layers, and a taxonomy which was fundamental in the classification of the papers included in the state of the art survey. In the future, we envision efforts to optimize the transition between elasticity layers, which presented significant efficiency losses during the evaluation, as well as improvements to the prototype and our model in order to extract greater efficiency gains.;
Palavras-chave Computação Paralela e Distribuída; Computação em Nuvem; Elasticidade; Bioinformática; Filogenética; Parallel and Distributed Computing; Cloud Computing; Elasticity; Bioinformatics; Phylogenetics;
Área(s) do conhecimento ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação;
Tipo Dissertação;
Data de defesa 2019-02-22;
Agência de fomento CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior;
Direitos de acesso openAccess;
URI http://www.repositorio.jesuita.org.br/handle/UNISINOS/7795;
Programa Programa de Pós-Graduação em Computação Aplicada;


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar

Busca avançada

Navegar

Minha conta

Estatística