Exportar registro bibliográfico


Metrics:

Uma abordagem baseada em aprendizagem de máquina e grafos para segmentação de páginas (2023)

  • Authors:
  • Autor USP: MAIA, ANA LUCIA LIMA MARREIROS - IME
  • Unidade: IME
  • Sigla do Departamento: MAC
  • DOI: 10.11606/T.45.2023.tde-31072023-115633
  • Subjects: IMAGEM DIGITAL; DOCUMENTOS ELETRÔNICOS; REDES NEURAIS
  • Keywords: Adjacency graph; Convolutional neural network; Document image; Document page layout; Grafo de adjacências; Image segmentation; Imagem de documento; Leiaute de página de documento; Rede neural convolucional; Segmentação de imagem
  • Agências de fomento:
  • Language: Português
  • Abstract: Muitos documentos originalmente gerados em papel são digitalizados para possibilitar sua preservação ou para agilizar seu processamento por meio de ferramentas computacionais. Consultar documentos em bancos de dados de imagens ou extrair informações de interesse de imagens de documentos requer a análiseddo conteúdo da imagem. Em particular, uma etapa crítica nesta análise é a análise lógica de leiaute, que consiste em detectar os componentes da página e identificar suas funções lógicas. A análise lógica de leiaute permite estabelecer as relações entre os componentes e determinar informações mportantes, como a ordem de leitura. Uma etapa fundamental na análise lógica de leiaute é detectar e classificar essas componentes de página, como blocos de texto, figuras e tabelas, problema conhecido como segmentação de página. Nesta tese, propomos um método que segue uma abordagem bottom-up, combinando modelagem de grafos e técnicas de aprendizado de máquina, para o problema de segmentação de páginas. O método proposto consiste em um pipeline no qual algumas etapas estratégicas são implementadas por meio de algoritmos de aprendizado de máquina. Como os algoritmos de aprendizado de máquina são treináveis a partir de dados, o método proposto pode ser facilmente adaptado a conjuntos de documentos com diferentes características, desde que os dados de treinamento estejam disponíveis. Esta tese também discute um procedimento experimental para otimizar o pipeline. Os experimentos utilizaramimagens de documentos (revistas e artigos científicos) do PRIMA Layout Analysis Dataset, com leiautes diversificados e complexos. Os resultados experimentais demonstram o potencial do método proposto
  • Imprenta:
  • Data da defesa: 31.05.2023
  • Acesso à fonteAcesso à fonteDOI
    Informações sobre o DOI: 10.11606/T.45.2023.tde-31072023-115633 (Fonte: oaDOI API)
    • Este periódico é de acesso aberto
    • Este artigo é de acesso aberto
    • URL de acesso aberto
    • Cor do Acesso Aberto: gold
    • Licença: cc-by-nc-sa

    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      MAIA, Ana Lucia Lima Marreiros. Uma abordagem baseada em aprendizagem de máquina e grafos para segmentação de páginas. 2023. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2023. Disponível em: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-31072023-115633/. Acesso em: 01 maio 2024.
    • APA

      Maia, A. L. L. M. (2023). Uma abordagem baseada em aprendizagem de máquina e grafos para segmentação de páginas (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/45/45134/tde-31072023-115633/
    • NLM

      Maia ALLM. Uma abordagem baseada em aprendizagem de máquina e grafos para segmentação de páginas [Internet]. 2023 ;[citado 2024 maio 01 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-31072023-115633/
    • Vancouver

      Maia ALLM. Uma abordagem baseada em aprendizagem de máquina e grafos para segmentação de páginas [Internet]. 2023 ;[citado 2024 maio 01 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-31072023-115633/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024