RDBU| Repositório Digital da Biblioteca da Unisinos

Extração de informações em imagens de tráfego: uma abordagem com aprendizado profundo

Show simple item record

metadataTrad.dc.contributor.author Fraga, Vitor Augusto;
metadataTrad.dc.contributor.authorLattes http://lattes.cnpq.br/3296388905734067;
metadataTrad.dc.contributor.advisor Ramos, Gabriel de Oliveira;
metadataTrad.dc.contributor.advisorLattes http://lattes.cnpq.br/9281736089055094;
metadataTrad.dc.contributor.advisor-co1 Barbosa, Jorge Luis Victória;
metadataTrad.dc.contributor.advisor-co1Lattes http://lattes.cnpq.br/6754464380129137;
metadataTrad.dc.publisher Universidade do Vale do Rio dos Sinos;
metadataTrad.dc.publisher.initials Unisinos;
metadataTrad.dc.publisher.country Brasil;
metadataTrad.dc.publisher.department Escola Politécnica;
metadataTrad.dc.language pt_BR;
metadataTrad.dc.title Extração de informações em imagens de tráfego: uma abordagem com aprendizado profundo;
metadataTrad.dc.description.resumo Os sistemas de tráfego são fundamentais no desenvolvimento das cidades. Todavia, esses sistemas sofrem cada vez mais com problemas como congestionamentos. Problemas como este podem elevar o consumo de combustíveis e poluição do ar. Além disso, estes problemas afetam diretamente a saúde das pessoas, estudos apontam que a exposição ao tráfego como fator que colabora com fases iniciais de infarto do miocárdio. Uma maneira eficiente de reduzir essa categoria de problema é realizar o controle semafórico inteligentemente, por algoritmos de aprendizado por reforço ou gerenciamento de tráfego. Todavia, para implementar essa categoria de solução, é necessário extrair informações do ambiente. O advento do processamento digital de imagens e das redes neurais convolucionais possibilitaram a extração de dados de forma menos problemática comparado a métodos mais tradicionais, como a instalação de sensores nas pistas. Utilizando imagens é possível extrair diferentes categorias de dados, como a quantidade de veículos em uma faixa, tempo que ficam parados e também a categoria que este trabalho se propõe a extrair, a origem e destino dos veículos em cruzamentos. Com motivação gerada a partir da necessidade de obter dados para resolver problemas ligados ao tráfego, este trabalho contribuí com um pipeline completo para processamento de imagens em cruzamentos de tráfego filmados com angulação aérea. O pipeline detecta veículos, identifica suas trajetórias e metrifica as origens e destinos, diferenciado-se assim dos trabalhos da literatura pesquisados. O pipeline é composto por três principais Os sistemas de tráfego são fundamentais no desenvolvimento das cidades. Todavia, esses sistemas sofrem cada vez mais com problemas como congestionamentos. Problemas como este podem elevar o consumo de combustíveis e poluição do ar. Além disso, afeta diretamente a saúde das pessoas, estudos apontam que a exposição ao tráfego como fator que colabora com fases iniciais de infarto do miocárdio. Uma maneira eficiente de reduzir essa categoria de problema é realizar o controle semafórico inteligentemente, por algoritmos de aprendizado por reforço ou gerenciamento de tráfego. Todavia, para implementar essa categoria de solução, é necessário extrair informações do ambiente. O advento do processamento digital de imagens e das redes neurais convolucionais possibilitaram a extração de dados de forma menos problemática comparado a métodos mais tradicionais, como a instalação de sensores nas pistas. Utilizando imagens é possível extrair diferentes categorias de dados, como a quantidade de veículos em uma faixa, tempo que ficam parados e também a categoria que este trabalho se propõe a extrair, a origem e destino dos veículos em cruzamentos. Com motivação gerada a partir da necessidade de obter dados para resolver problemas ligados ao tráfego, este trabalho contribuí com um pipeline completo para processamento de imagens em cruzamentos de tráfego filmados com angulação aérea. O pipeline detecta veículos, identifica suas trajetórias e metrifica as origens e destinos, diferenciado-se assim dos trabalhos da literatura pesquisados. O pipeline é composto por três principais módulos. Uma rede neural convolucional do tipo YOLO (You Only Look Once) customizada, capaz detectar veículos em filmagens com angulação aérea. O segundo módulo possui a implementação de método rastreador referenciado na literatura cujo objetivo é atribuir identidade aos veículos em todos os frames. O terceiro módulo é chamado "origens e destinos", cujo objetivo é quantificar a quantidade de veículos que passam por um único local na cena e extrair a quantidade de veículos por rotas. Como método de avaliação, cada módulo do pipeline foi metrificado. O modelo detector atingiu o resultado de IDP 77,5% e IDR de 95,8%. O algoritmo rastreador obteve um resultado de MOTA 72,6% e MOTP 74,4%. Dado que cada módulo do pipeline depende do outro, o resultado geral é visto através da metrificação do terceiro, origens e destinos. Esta etapa é avaliada em duas fases, a primeira sendo a quantidade de veículos que passam por um único ponto na cena, onde a média de OD Error % é 1,80% e a média de OD Error % para rotas é 7.53%.tidade aos veículos em todos os frames. O terceiro módulo é chamado origens e destinos, cujo objetivo é metrificar a quantidade de veículos que passam por um único local na cena e extrair a quantidade de veículos por rotas. Como método de avaliação, cada módulo do pipeline foi metrificado. O modelo detector atingiu o resultado de IDP 77,5% e IDR de 95,8%. O algoritmo rastreador obteve um resultado de MOTA 72,6% e MOTP 74,4%. Dado que cada módulo do pipeline depende do outro, o resultado geral é visto através da metrificação do terceiro, origens e destinos. Esta etapa é avaliada em duas fases, a primeira sendo a quantidade de veículos que passam por um único ponto na cena, onde a média de OD Error % é 1,80% e a média de OD Error % para rotas é 7.53%.;
metadataTrad.dc.description.abstract Traffic systems are fundamental in the development of cities. However, these systems increasingly suffer from problems such as congestion. Problems like this can increase fuel consumption and air pollution. In addition, it directly affects people’s health. For example, studies indicate that exposure to traffic is a factor that collaborates with the early stages of myocardial infarction. An efficient way to reduce this problem category is to perform traffic light control intelligently by reinforcement learning or traffic management algorithms. However, it becomes necessary to extract information from the environment to implement this solution category. The advent of digital image processing and convolutional neural networks made it possible to extract data in a less problematic way compared to more traditional methods, such as installing sensors on the tracks. Using images, it is possible to extract different categories of data, such as the number of vehicles in a lane, the time they are stopped, and the category that this work proposes to extract, the origin and destination of vehicles at intersections. With motivation generated from the need to obtain data to solve problems related to traffic, this work contributes with a complete pipeline for image processing in traffic intersections filmed with aerial angle. The pipeline detects vehicles, identifies their trajectories, and metrifies origins and destinations, thus differentiating itself from the researched works in the literature. The pipeline consists of three main blocks. A custom YOLO (You Only Look Once) convolutional neural network capable of detecting vehicles in aerial angled footage. The second block has the implementation of a tracking method referenced in the literature whose objective is to attribute identity to vehicles in all frames. Finally, the third block is called origins and destinations, whose objective is to measure the number of vehicles that pass through a single location in the scene and extract the number of vehicles by the route. As an evaluation method, each block of the pipeline was metric. The detector model reached the result of IDP 77.5% and IDR of 95.8%. The tracking algorithm obtained a result of MOTA 72.6% and MOTP 74.4%. Since each block of the pipeline depends on the other, the overall result is seen through the metrification of the third, "origins and destinations". This step is evaluated in two phases, the first being the number of vehicles that pass through a single point in the scene, where the average OD Error% is 1.80% and the average OD Error% for routes it is 7.53%.;
metadataTrad.dc.subject Tráfego; Sistemas inteligentes de tráfego; Extração de dados; Visão computacional; Aprendizado profundo; Redes neurais convolucionais.; Traffic; Intelligent traffic systems; Data extraction; Computer vision; Deep learning; Convolutional neural networks;
metadataTrad.dc.subject.cnpq ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação;
metadataTrad.dc.type Dissertação;
metadataTrad.dc.date.issued 2022-04-06;
metadataTrad.dc.description.sponsorship Nenhuma;
metadataTrad.dc.rights openAccess;
metadataTrad.dc.identifier.uri http://www.repositorio.jesuita.org.br/handle/UNISINOS/11556;
metadataTrad.dc.publisher.program Programa de Pós-Graduação em Computação Aplicada;


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search

Advanced Search

Browse

My Account

Statistics