Sistema de comandos e identificação de voz

Este projeto visa a implementação de um sistema capaz de compreender comandos de voz e executar as tarefas correspondentes. O processo de reconhecimento de voz foi implementado com base em um módulo que utiliza o conversor de fala para texto chamado Wit.ai. Para a coversão de texto-para-fala, foi utilizado o sintetizador de voz Flite. O sistema foi desenvolvido em Raspberry Pi e permite a execução das seguintes tarefas: acionamento de lâmpadas, gravação de áudios, captura de imagens, escrita e leitura de textos, buscas na internet e identificação de voz. Todos os comandos foram desenvolvidos na linguagem de programação Python. Uma página na web foi desenvolvida para permitir o acesso aos dados armazenados pelo sistema. A identificação da voz do usuário permite que acessos indevidos ao sistema sejam reportados. Nota-se que o número de amostras treinadas resulta em melhorias na identificação da voz. Os mecanismos de reconhecimento de fala são limitados, o Wit.ai necessita de conexão à internet e seu processamento é inferior quando comparado a outros serviços pagos.

Palavras-chave em Inglês

Voice recognition
Embebbed Linux

Resumo em Inglês

This project aims the implementation of a system capable of understanding voice commands and executing the corresponding tasks. The voice recognition process was implemented based in a module which uses a speech-to-text converter called Wit.ai. For the texto-to-speech conversion, was used the Flite synthesizer engine. The system was developed in Raspberry Pi and, permits the execution of the following tasks: lamps activation, audio recording, images capture, text writing and reading, searchs on the internet and voice identification. All the commands were developed in Python programming language. A webpage was developed to allow the access to all the recording data stored by the system. The user?s voice recognition permits that improper acces to the system be reported. It is noted that number of samples directly results in an improvement in the voice identification. The voice recognition engines are limited, the Wit.ai needs internet conection and its processing is inferior when compared to others services that require subscription.

Arquivos

AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome(s) do(s) autor(es) do trabalho.

Landim_Tiago_Rafael_Giorgetti_tcc.pdf (2.50 Mbytes)

Data de Publicação

2018-01-17

Número de visitas

908

Número de downloads

4166