Exportar registro bibliográfico


Metrics:

Overcoming challenging crban images: deep learning and data integration methods for detecting trees entangled with power lines (2023)

  • Authors:
  • Autor USP: OLIVEIRA, ARTUR ANDRE ALMEIDA DE MACEDO - IME
  • Unidade: IME
  • Sigla do Departamento: MAC
  • DOI: 10.11606/T.45.2023.tde-22032024-184659
  • Subjects: APRENDIZAGEM PROFUNDA; VISÃO COMPUTACIONAL
  • Keywords: Computer vision; Deep learning; Dificuldade de instância; Imagens urbanas; Instance hardness; Urban images
  • Agências de fomento:
  • Language: Inglês
  • Abstract: A classificação de imagens urbanas em nível de rua apresenta desafios devido à presença de diversos elementos, aparências variadas e poses complexas. Fatores como oclusão, confusão de fundo, condições climáticas e pontos de vista da câmera complicam ainda mais o processo de classificação. Neste estudo, aproveitamos as capacidades de redes de aprendizado profundo recentes, incluindo MobileNets, ResNets, DenseNets e EfficientNets, para enfrentar esses desafios. Nosso objetivo é avaliar o desempenho dessas redes, identificar limitações e propor novas técnicas para superá-las. Nossa pesquisa se concentra na tarefa específica de classificar imagens urbanas com ou sem árvores próximas à rede elétrica. Através de uma exploração extensiva, fornecemos métodos e insights úteis não só para esse problema de classificação, mas também aplicáveis a tarefas de classificação em outros domínios. Duas contribuições principais são introduzidas em nosso trabalho. Em primeiro lugar, ampliamos a plataforma INvestigate and Analyze a CITY (INACITY) integrando um banco de dados orientado a grafos, melhorando o desempenho e a cobertura da coleta de imagens urbanas com o Google Street View. Em segundo lugar, desenvolvemos a ferramenta Street-Level Image Labeler (SLIL), que reduz eficientemente o ônus de rotular imagens manualmente, facilitando a criação de conjuntos de dados. Com a ajuda do INACITY e do SLIL, criamos um conjunto de dados abrangente com 8.800 imagens urbanas em nível de rua rotuladasbinariamente como contendo árvores próximas à rede elétrica (i.e. classe positiva) ou não (i.e. classe negativa). A avaliação humana do conjunto de dados revela a presença de imagens desafiadoras que confundem até mesmo classificadores experientes. Por exemplo, distinguir se fios de poste cruzam ou passam por trás das copas das árvores pode ser difícil, dependendo do ponto de vista da câmera. A comparação de redes neurais profundas recentes nesse conjunto de dados revela que a maior precisão alcançada por redes comuns é de 74,6%. No entanto, ao introduzir uma nova classe distinta da positiva ou negativa, a classe \emph, e empregar o protocolo de treinamento \emph{Noisy Student} e a função de custo \emph{Focal Loss}, melhoramos efetivamente as taxas de revocação para as classe positiva de 66,5% para 83,7% e para a classe negativa de 63,7% para 78,8%. Essa abordagem nos permite identificar e classificar melhor imagens que anteriormente eram propensas a classificações incorretas
  • Imprenta:
  • Data da defesa: 11.08.2023
  • Acesso à fonteAcesso à fonteDOI
    Informações sobre o DOI: 10.11606/T.45.2023.tde-22032024-184659 (Fonte: oaDOI API)
    • Este periódico é de acesso aberto
    • Este artigo é de acesso aberto
    • URL de acesso aberto
    • Cor do Acesso Aberto: gold
    • Licença: cc-by-nc-sa

    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      OLIVEIRA, Artur André Almeida de Macedo. Overcoming challenging crban images: deep learning and data integration methods for detecting trees entangled with power lines. 2023. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2023. Disponível em: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-22032024-184659/. Acesso em: 06 maio 2024.
    • APA

      Oliveira, A. A. A. de M. (2023). Overcoming challenging crban images: deep learning and data integration methods for detecting trees entangled with power lines (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/45/45134/tde-22032024-184659/
    • NLM

      Oliveira AAA de M. Overcoming challenging crban images: deep learning and data integration methods for detecting trees entangled with power lines [Internet]. 2023 ;[citado 2024 maio 06 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-22032024-184659/
    • Vancouver

      Oliveira AAA de M. Overcoming challenging crban images: deep learning and data integration methods for detecting trees entangled with power lines [Internet]. 2023 ;[citado 2024 maio 06 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-22032024-184659/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024