Ver registro no DEDALUS
Exportar registro bibliográfico

Detecção de atividade vocal empregando máquinas de Boltzmann restritas (2016)

  • Authors:
  • USP affiliated authors: BORIN, ROGÉRIO GUERRA - EP
  • USP Schools: EP
  • Sigla do Departamento: PSI
  • Subjects: INTELIGÊNCIA ARTIFICIAL; PROCESSAMENTO DE SOM; PROCESSAMENTO DE SINAIS; TELEFONIA
  • Language: Português
  • Abstract: Neste trabalho, uma versão de RBM (Restricted Boltzmann Machine) tendo uma camada de classificação é adaptada a fim de permitir o seu uso com dados definidos num domínio contínuo. Essa adaptação dá origem a uma variante do modelo para o qual são desenvolvidas as regras de atualização de parâmetros dos treinamentos discriminativo, generativo e híbrido. A aplicação da variante como classificador no problema de VAD (Voice Activity Detection) é então investigada. Por meio de simulações envolvendo o corpus NOIZEUS e empregando como entradas do classificador tanto MFCCs (Mel-Frequency Cepstral Coefficients) quanto FBEs (Filter-Bank Energies), são obtidos resultados comparáveis aos de detectores considerados como estado da arte, com um menor custo computacional. A variante de RBM é comparada também com as SVMs (Support Vector Machines) lineares e com núcleo gaussiano. Com treinamento discriminativo, a RBM fornece desempenhos intermediários entre as duas versões de SVM, porém um custo computacional que é consideravelmente inferior aos de ambas. Adicionalmente, um conjunto de medidas do áudio que tiveram seu uso em VAD proposto recentemente são avaliadas com o emprego da RBM com treinamento discriminativo. Embora os resultados não sejam conclusivos, os desempenhos conseguidos indicam que essas medidas não são vantajosas quando comparadas com os tradicionais MFCCs.
  • Imprenta:
  • Data da defesa: 06.12.2016
  • Acesso online ao documento

    Online access or search this record in

    Exemplares físicos disponíveis nas Bibliotecas da USP
    BibliotecaCód. de barrasNúm. de chamada
    EPBC31200032730FD-6870
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      BORIN, Rogério Guerra; SILVA, Magno Teófilo Madeira da. Detecção de atividade vocal empregando máquinas de Boltzmann restritas. 2016.Universidade de São Paulo, São Paulo, 2016. Disponível em: < http://www.teses.usp.br/teses/disponiveis/3/3142/tde-23012017-141914/pt-br.php >.
    • APA

      Borin, R. G., & Silva, M. T. M. da. (2016). Detecção de atividade vocal empregando máquinas de Boltzmann restritas. Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3142/tde-23012017-141914/pt-br.php
    • NLM

      Borin RG, Silva MTM da. Detecção de atividade vocal empregando máquinas de Boltzmann restritas [Internet]. 2016 ;Available from: http://www.teses.usp.br/teses/disponiveis/3/3142/tde-23012017-141914/pt-br.php
    • Vancouver

      Borin RG, Silva MTM da. Detecção de atividade vocal empregando máquinas de Boltzmann restritas [Internet]. 2016 ;Available from: http://www.teses.usp.br/teses/disponiveis/3/3142/tde-23012017-141914/pt-br.php

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: