Identificação de atividade de voz baseada em vídeo

Autor	Scott, Dario;
Lattes do autor	http://lattes.cnpq.br/0234951091078070;
Orientador	Villamil, Marta Becker;
Lattes do orientador	http://lattes.cnpq.br/8408262156304669;
Instituição	Universidade do Vale do Rio do Sinos;
Sigla da instituição	UNISINOS;
País da instituição	Brasil;
Instituto/Departamento	Escola Politécnica;
Idioma	pt_BR;
Título	Identificação de atividade de voz baseada em vídeo;
Resumo	Atualmente, existem diversos trabalhos com as mais variadas abordagens relativas ao processamento de imagens digitais para detecção de atividade de voz (VAD). As suas aplicações perpassam diferentes áreas, como por exemplo, comandos de voz em veículos e videoconferência. A motivação deste trabalho constitui-se na construção de um algoritmo que contribua para o aperfeiçoamento das técnicas de processamento de imagens aplicadas para a detecção de atividade de voz em vídeos. A problemática envolvida já apresenta uma grande diversidade de abordagens. No entanto, o foco deste trabalho situa-se na busca de alternativas para a melhoria na extração de um modelo de cor de pele e não-pele e, a partir daí, extrair um classificador para identificar a atividade de fala com mais precisão. Algoritmos já existentes de identificação de face e de classificação dos lábios foram utilizados e aprimorados. Através da criação de patches abaixo dos olhos, foi criado um modelo para determinar as características individuais de cor de;
Abstract	Currently, there are several works with many di_erent approaches to image processing for detection of voice activity (VAD). Its applications cross over di_erent areas, such as voice commands in vehicles and videoconferencing. The motivation of this work consists in building an algorithm that contributes to the improvement of techniques image processing applied to detect voice activity on video. The issue already presents a great diversity of approaches. However, the focus of this work lies in _nding alternatives to improve the extraction of a skin and non-skin color model and, from there, extract a classi_er to identify the activity of speech more accurately. Existing algorithms of face detection and classi_cation of the lips were used and improved. Through the creation of patches under the eyes, a model was created to determine the individual characteristics of skin color using the mean and standard deviation of the pixels of the patches and the mouth area. The results are presented based on two approaches.;
Palavras-chave	detecção de fala; modelo de cor de pele; processamento de imagem; image processing; skin color model; voice activity detection;
Área(s) do conhecimento	Ciências Exatas e da Terra;
Tipo	Dissertação;
Data de defesa	2010-03-30;
Agência de fomento	Hewlett-Packard Brasil Ltda;
Direitos de acesso	openAccess;
URI	http://www.repositorio.jesuita.org.br/handle/UNISINOS/2285;
Programa	Programa de Pós-Graduação em Computação Aplicada;

Arquivos deste item

Nome: DarioScottComputa ...

Tamanho: 1.566Mb

Formato: PDF

Descrição: DarioScottComputa ...

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

PPG Computação Aplicada [363]
PPG Computação Aplicada

Mostrar registro simples

Buscar

Navegar

Todo o repositório
- Comunidades e Coleções
Esta coleção

Minha conta

Estatística

Ver as estatísticas de uso

Identificação de atividade de voz baseada em vídeo

Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Buscar

Navegar

Todo o repositório

Esta coleção

Minha conta

Estatística