Ver registro no DEDALUS
Exportar registro bibliográfico

Classificação semi-supervisionada baseada em desacordo por similaridade (2010)

  • Authors:
  • USP affiliated authors: GUTIÉRREZ, VICTOR ANTONIO LAGUNA - ICMC
  • USP Schools: ICMC
  • Subjects: APRENDIZADO COMPUTACIONAL; MINERAÇÃO DE DADOS
  • Language: Português
  • Abstract: O aprendizado semi-supervisionado é um paradigma do aprendizado de máquina no qual a hipótese é induzida aproveitando tanto os dados rotulados quantos os dados não rotulados. Este paradigma é particularmente útil quando a quantidade de exemplos rotulados é muito pequena e a rotulação manual dos exemplos é uma tarefa muito custosa. Nesse contexto, foi proposto o algoritmo Cotraining, que é um algoritmo muito utilizado no cenário semi-supervisionado, especialmente quando existe mais de uma visão dos dados. Esta característica do algoritmo Cotraining faz com que a sua aplicabilidade seja restrita a domínios multi-visão, o que diminui muito o potencial do algoritmo para resolver problemas reais. Nesta dissertação, é proposto o algoritmo Co2KNN, que é uma versão mono-visão do algoritmo Cotraining na qual, ao invés de combinar duas visões dos dados, combina duas estratégias diferentes de induzir classificadores utilizando a mesma visão dos dados. Tais estratégias são chamados de k-vizinhos mais próximos (KNN) Local e Global. No KNN Global, a vizinhança utilizada para predizer o rótulo de um exemplo não rotulado é conformada por aqueles exemplos que contém o novo exemplo entre os seus k vizinhos mais próximos. Entretanto, o KNN Local considera a estratégia tradicional do KNN para recuperar a vizinhança de um novo exemplo. A teoria do Aprendizado Semi-supervisionado Baseado em Desacordo foi utilizada para definir a base teórica do algoritmo Co2KNN, pois argumenta quepara o sucesso do algoritmo Cotraining, é suficiente que os classificadores mantenham um grau de desacordo que permita o processo de aprendizado conjunto. Para avaliar o desempenho do Co2KNN, foram executados diversos experimentos que sugerem que o algoritmo Co2KNN tem melhor performance que diferentes algoritmos do estado da arte, especificamente, em domínios mono-visão. Adicionalmente, foi proposto um algoritmo otimizado para diminuir a complexidade computacional do KNN Global, permitindo o uso do Co2KNN em problemas reais de classificação
  • Imprenta:
  • Data da defesa: 03.05.2010
  • Acesso online ao documento

    Online access or search this record in

    Exemplares físicos disponíveis nas Bibliotecas da USP
    BibliotecaCód. de barrasNúm. de chamada
    ICMC30300042224T G984cs e.1
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      GUTIÉRREZ, Victor Antonio Laguna; LOPES, Alneu de Andrade. Classificação semi-supervisionada baseada em desacordo por similaridade. 2010.Universidade de São Paulo, São Carlos, 2010. Disponível em: < http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21062010-142145/ >.
    • APA

      Gutiérrez, V. A. L., & Lopes, A. de A. (2010). Classificação semi-supervisionada baseada em desacordo por similaridade. Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21062010-142145/
    • NLM

      Gutiérrez VAL, Lopes A de A. Classificação semi-supervisionada baseada em desacordo por similaridade [Internet]. 2010 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21062010-142145/
    • Vancouver

      Gutiérrez VAL, Lopes A de A. Classificação semi-supervisionada baseada em desacordo por similaridade [Internet]. 2010 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21062010-142145/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: