Exportar registro bibliográfico

Detecção de voz cantada em sinais de áudio polifônicos (2020)

  • Authors:
  • Autor USP: CORRÊA, SHAYENNE LUZ MOURA - IME
  • Unidade: IME
  • Sigla do Departamento: MAC
  • Subjects: APRENDIZADO COMPUTACIONAL; COMPUTAÇÃO MUSICAL
  • Keywords: Computer music; Detecção de voz cantada; Machine learning; Music information retrieval; Recuperação de informação musical; Representações aprendidas automaticamente; Representation learning; Singing voice detection
  • Agências de fomento:
  • Language: Português
  • Abstract: Detecção de voz cantada em sinais de áudio polifônicos é o problema que trata de determinar quais trechos de um sinal musical com diversas fontes sonoras contêm voz cantada. Este é um tópico de pesquisa ativo na área de Recuperação de Informação Musical (MIR) e possui muitas aplicações, incluindo reconhecimento automático de cantor, alinhamento de letra e música, separação de voz cantada e extração de melodias. Neste projeto, o problema de detecção de voz cantada é abordado através do levantamento das técnicas utilizadas na literatura, com o desenvolvimento de um sistema capaz de classificar os segmentos de sinais de áudio em duas classes (os trechos que contêm e os trechos que não contêm voz cantada) e também pela comparação dos resultados de detecção de voz cantada utilizando ferramentas baseadas em aprendizado profundo. Os objetivos gerais são: apresentar a revisão da literatura e construir experimentos a fim de analisar os métodos de classificação e descritores de áudio. Os objetivos específicos são: avaliar as restrições presentes na classificação dos trechos cantados, usar descritores de áudio baseados em aprendizado profundo ainda não aplicados na tarefa e comparar o uso de métodos tradicionais de aprendizado de máquina com as possibilidades apresentadas pelas representações aprendidas automaticamente. A partir de uma série de experimentos, enfrentamos a complexidade do tema e as limitações apresentadas por descritores comumente usados. Ao usar um descritor baseado emaprendizado profundo, observa-se espaço para melhorias na abordagem clássica de aprendizado de máquinas baseada na seleção e combinação de representações tradicionais dos dados musicais na entrada dos algoritmos de aprendizado
  • Imprenta:
  • Data da defesa: 01.10.2020
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      CORRÊA, Shayenne Luz Moura. Detecção de voz cantada em sinais de áudio polifônicos. 2020. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2020. Disponível em: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-04112020-095115/. Acesso em: 28 abr. 2024.
    • APA

      Corrêa, S. L. M. (2020). Detecção de voz cantada em sinais de áudio polifônicos (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/45/45134/tde-04112020-095115/
    • NLM

      Corrêa SLM. Detecção de voz cantada em sinais de áudio polifônicos [Internet]. 2020 ;[citado 2024 abr. 28 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-04112020-095115/
    • Vancouver

      Corrêa SLM. Detecção de voz cantada em sinais de áudio polifônicos [Internet]. 2020 ;[citado 2024 abr. 28 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-04112020-095115/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024