Identificação de atividade de voz baseada em vídeo

Identificação de atividade de voz baseada em vídeo

Scott, Dario

URI: http://www.repositorio.jesuita.org.br/handle/UNISINOS/2285

Data da Defesa: 2010-03-30

Orientador: Villamil, Marta Becker

Resumo:

Atualmente, existem diversos trabalhos com as mais variadas abordagens relativas ao processamento de imagens digitais para detecção de atividade de voz (VAD). As suas aplicações perpassam diferentes áreas, como por exemplo, comandos de voz em veículos e videoconferência. A motivação deste trabalho constitui-se na construção de um algoritmo que contribua para o aperfeiçoamento das técnicas de processamento de imagens aplicadas para a detecção de atividade de voz em vídeos. A problemática envolvida já apresenta uma grande diversidade de abordagens. No entanto, o foco deste trabalho situa-se na busca de alternativas para a melhoria na extração de um modelo de cor de pele e não-pele e, a partir daí, extrair um classificador para identificar a atividade de fala com mais precisão. Algoritmos já existentes de identificação de face e de classificação dos lábios foram utilizados e aprimorados. Através da criação de patches abaixo dos olhos, foi criado um modelo para determinar as características individuais de cor de

Mostrar registro completo

Arquivos deste item

Nome: DarioScottComputa ...

Tamanho: 1.566Mb

Formato: PDF

Descrição: DarioScottComputa ...

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

PPG Computação Aplicada [363]
PPG Computação Aplicada

Buscar

Navegar

Todo o repositório
- Comunidades e Coleções
Esta coleção

Minha conta

Estatística

Ver as estatísticas de uso

Identificação de atividade de voz baseada em vídeo

Identificação de atividade de voz baseada em vídeo

Resumo:

Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Buscar

Navegar

Todo o repositório

Esta coleção

Minha conta

Estatística