Trabalho de Conclusão de Curso
Documento
Autoria
Unidade da USP
Data de Apresentação
Orientador
Banca
Luppe, Maximiliam
Martins, André Luís
Título em Português
Sistema de comandos e identificação de voz
Palavras-chave em Português
Reconhecimento de voz
Raspberry Pi
Identificação de voz
Linux embarcado
Resumo em Português
Este projeto visa a implementação de um sistema capaz de compreender comandos de voz e executar as tarefas correspondentes. O processo de reconhecimento de voz foi implementado com base em um módulo que utiliza o conversor de fala para texto chamado Wit.ai. Para a coversão de texto-para-fala, foi utilizado o sintetizador de voz Flite. O sistema foi desenvolvido em Raspberry Pi e permite a execução das seguintes tarefas: acionamento de lâmpadas, gravação de áudios, captura de imagens, escrita e leitura de textos, buscas na internet e identificação de voz. Todos os comandos foram desenvolvidos na linguagem de programação Python. Uma página na web foi desenvolvida para permitir o acesso aos dados armazenados pelo sistema. A identificação da voz do usuário permite que acessos indevidos ao sistema sejam reportados. Nota-se que o número de amostras treinadas resulta em melhorias na identificação da voz. Os mecanismos de reconhecimento de fala são limitados, o Wit.ai necessita de conexão à internet e seu processamento é inferior quando comparado a outros serviços pagos.
Palavras-chave em Inglês
Voice recognition
Embebbed Linux
Resumo em Inglês
This project aims the implementation of a system capable of understanding voice commands and executing the corresponding tasks. The voice recognition process was implemented based in a module which uses a speech-to-text converter called Wit.ai. For the texto-to-speech conversion, was used the Flite synthesizer engine. The system was developed in Raspberry Pi and, permits the execution of the following tasks: lamps activation, audio recording, images capture, text writing and reading, searchs on the internet and voice identification. All the commands were developed in Python programming language. A webpage was developed to allow the access to all the recording data stored by the system. The user?s voice recognition permits that improper acces to the system be reported. It is noted that number of samples directly results in an improvement in the voice identification. The voice recognition engines are limited, the Wit.ai needs internet conection and its processing is inferior when compared to others services that require subscription.
Arquivos
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome(s) do(s) autor(es) do trabalho.
 
Data de Publicação
2018-01-17
Número de visitas
908
Número de downloads
4166
Copyright © 2010 Biblioteca Digital de Trabalhos Acadêmicos da USP. Todos os direitos reservados.