| Autor | Blauth, Dante Augusto; |
| Lattes do autor | http://lattes.cnpq.br/7882466863069533; |
| Orientador | Villamil, Marta Becker; |
| Lattes do orientador | http://lattes.cnpq.br/8408262156304669; |
| Instituição | Universidade do Vale do Rio do Sinos; |
| Sigla da instituição | UNISINOS; |
| País da instituição | Brasil; |
| Instituto/Departamento | Escola Politécnica; |
| Idioma | pt_BR; |
| Título | Localização do locutor em ambiente de videoconferência utilizando sinal de áudio e vídeo; |
| Resumo | A localização do locutor ativo em ambientes de videoconferência traz benefícios importantes, como transmitir apenas o sinal relativo a este locutor, reduzindo a quantidade de informações trafegadas na rede, eliminar ruídos indesejados e ainda possibilitar focar a câmera no locutor. Embora essa tarefa não seja inovadora, ainda está sendo aperfeiçoada, visto que ambientes reais de videoconferência possuem ruído, problemas de iluminação, etc., o que torna o objetivo mais difícil de ser alcançado de maneira satisfatória. O presente trabalho apresenta uma metodologia para localização do locutor ativo em videoconferência, utilizando o sinal de áudio capturado por um arranjo de microfones e o sinal de vídeo capturado por uma web-câmera. No tratamento do sinal de vídeo, utiliza-se um algoritmo para detecção de faces, que é modificado para para diminuir seu custo computacional. O sinal de áudio é processado no domínio de frequência, utilizando-se o algoritmo SRP-PHAT para localizar a fonte sonora. A fusão dos dois; |
| Palavras-chave | sinal de áudio; sinal de vídeo; videoconferência; locutor ativo; |
| Área(s) do conhecimento | Ciências Exatas e da Terra; |
| Tipo | Dissertação; |
| Data de defesa | 2010-03-25; |
| Agência de fomento | Hewlett-Packard Brasil Ltda; |
| Direitos de acesso | openAccess; |
| URI | http://www.repositorio.jesuita.org.br/handle/UNISINOS/2288; |
| Programa | Programa de Pós-Graduação em Computação Aplicada; |