Ver registro no DEDALUS
Exportar registro bibliográfico

Otimização e análise das máquinas de vetores de suporte aplicadas à classificação de documentos (2011)

  • Authors:
  • USP affiliated authors: KINTO, EDUARDO AKIRA - EP
  • USP Schools: EP
  • Sigla do Departamento: PSI
  • Subjects: APRENDIZADO COMPUTACIONAL; RECUPERAÇÃO DA INFORMAÇÃO; INTELIGÊNCIA ARTIFICIAL; REDES NEURAIS
  • Language: Português
  • Abstract: A análise das informações armazenadas é fundamental para qualquer tomada de decisão, mas para isso ela deve estar organizada e permitir fácil acesso. Quando temos um volume de dados muito grande, esta tarefa torna-se muito mais complicada do ponto de vista computacional. É fundamental, então, haver mecanismos eficientes para análise das informações. As Redes Neurais Artificiais (RNA), as Máquinas de Vetores-Suporte (Support Vector Machine - SVM) e outros algoritmos são frequentemente usados para esta finalidade. Neste trabalho, iremos explorar o SMO (Sequential Minimal Optimization) e alterá-lo, com a finalidade de atingir um tempo de treinamento menor, mas, ao mesmo tempo manter a capacidade de classificação. São duas as alterações propostas, uma, no seu algoritmo de treinamento e outra, na sua arquitetura. A primeira modificação do SMO proposta neste trabalho é permitir a atualização de candidatos ao vetor suporte no mesmo ciclo de atualização de um coeficiente de Lagrange. Dos algoritmos que codificam o SVM, o SMO é um dos mais rápidos e um dos que menos consome memória. A complexidade computacional do SMO é menor com relação aos demais algoritmos porque ele não trabalha com inversão de uma matriz de kernel. Esta matriz, que é quadrada, costuma ter um tamanho proporcional ao número de amostras que compõem os chamados vetores-suporte. A segunda proposta para diminuir o tempo de treinamento do SVM consiste na subdivisão ordenada do conjunto de treinamento, utilizando-se a dimensão de maior entropia. Esta subdivisão difere das abordagens tradicionais pelo fato de as amostras não serem constantemente submetidas repetidas vezes ao treinamento do SVM. Finalmente, aplicaremos o SMO proposto para classificação de documentos ou textos por meio de uma abordagem nova, a classificação de uma-classe usando classificadores binários.Como toda classificação de documentos, a análise dos atributos é uma etapa fundamental, e aqui uma nova contribuição é apresentada. Utilizaremos a correlação total ponto a ponto para seleção das palavras que formam o vetor de índices de palavras.
  • Imprenta:
  • Data da defesa: 17.06.2011
  • Acesso online ao documento

    Online access or search this record in

    Exemplares físicos disponíveis nas Bibliotecas da USP
    BibliotecaCód. de barrasNúm. de chamada
    EPBC31200039924FT-3007
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      KINTO, Eduardo Akira; DEL MORAL HERNANDEZ, Emilio. Otimização e análise das máquinas de vetores de suporte aplicadas à classificação de documentos. 2011.Universidade de São Paulo, São Paulo, 2011. Disponível em: < http://www.teses.usp.br/teses/disponiveis/3/3142/tde-04112011-151337/pt-br.php >.
    • APA

      Kinto, E. A., & Del Moral Hernandez, E. (2011). Otimização e análise das máquinas de vetores de suporte aplicadas à classificação de documentos. Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3142/tde-04112011-151337/pt-br.php
    • NLM

      Kinto EA, Del Moral Hernandez E. Otimização e análise das máquinas de vetores de suporte aplicadas à classificação de documentos [Internet]. 2011 ;Available from: http://www.teses.usp.br/teses/disponiveis/3/3142/tde-04112011-151337/pt-br.php
    • Vancouver

      Kinto EA, Del Moral Hernandez E. Otimização e análise das máquinas de vetores de suporte aplicadas à classificação de documentos [Internet]. 2011 ;Available from: http://www.teses.usp.br/teses/disponiveis/3/3142/tde-04112011-151337/pt-br.php

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: