Exportar registro bibliográfico

Métodos de validação tradicional e temporal aplicados à avaliação de classificadores de RNAs codificantes e não codificantes (2018)

  • Authors:
  • Autor USP: SÁ, CLEBIANO DA COSTA - BIOINFORMÁTICA
  • Unidade: BIOINFORMÁTICA
  • Subjects: BIOINFORMÁTICA; RNA
  • Keywords: Aprendizado supervisionado; Classificação de RNAs; Classification of RNAs; Hold-out temporal; Hold-out tradicional; Non-coding RNAs; Pattern recognition; Reconhecimento de padrões; RNAs não codificantes; Supervised learning; Time Hold-out; Traditional hold-out
  • Agências de fomento:
  • Language: Português
  • Abstract: Os ácidos ribonucleicos (RNAs) podem ser classificados em duas classes principais: codificante e não codificante de proteína. Os codificantes, representados pelos RNAs mensageiros (mRNAs), possuem a informação necessária à síntese proteica. Já os RNAs não codificantes (ncRNAs) não são traduzidos em proteínas, mas estão envolvidos em várias atividades celulares distintas e associados a várias doenças tais como cardiopatias, câncer e desordens psiquiátricas. A descoberta de novos ncRNAs e seus papéis moleculares favorece avanços no conhecimento da biologia molecular e pode também impulsionar o desenvolvimento de novas terapias contra doenças. A identificação de ncRNAs é uma ativa área de pesquisa e um dos correntes métodos é a classificação de sequências transcritas utilizando sistemas de reconhecimento de padrões baseados em suas características. Muitos classificadores têm sido desenvolvidos com este propósito, especialmente nos últimos três anos. Um exemplo é o Coding Potential Calculator (CPC), baseado em Máquinas de Vetores de Suporte (SVM). No entanto, outros algoritmos robustos são também reconhecidos pelo seu potencial em tarefas de classificação, como por exemplo Random Forest (RF). O método mais utilizado para avaliação destas ferramentas tem sido a validação cruzada k-fold. Uma questão não considerada nessa forma de validação é a suposição de que as distribuições de frequências dentro do banco de dados, em termos das classes das sequências e outras variáveis, não se alteram ao longo do tempo.Caso essa premissa não seja verdadeira, métodos tradicionais como a validação cruzada e o hold-out podem subestimar os erros de classificação. Constata-se, portanto, a necessidade de um método de validação que leve em consideração a constante evolução dos bancos de dados ao longo do tempo, para proporcionar uma análise de desempenho mais realista destes classificadores. Neste trabalho comparamos dois métodos de avaliação de classificadores: hold-out temporal e hold-out tradicional (atemporal). Além disso, testamos novos modelos de classificação a partir da combinação de diferentes algoritmos de indução com características de classificadores do estado da arte e um novo conjunto de características. A partir dos testes das hipóteses, observamos que tanto a validação hold-out tradicional quanto a validação hold-out temporal tendem a subestimar os erros de classificação, que a avaliação por validação temporal é mais fidedigna, que classificadores treinados a partir de parâmetros calibrados por validação temporal não melhoram a classificação e que nosso modelo de classificação baseado em Random Forest e treinado com características de classificadores do estado da arte e mais um novo conjunto de características proporcionou uma melhora significativa na discriminação dos RNAs codificantes e não codificantes.Por fim, destacamos o potencial do algoritmo Random Forest e das características utilizadas, diante deste problema de classificação, e sugerimos ouso do método de validação hold-out temporal para a obtenção de estimativas de desempenho mais fidedignas para os classificadores de RNAs codificantes e não codificantes de proteína
  • Imprenta:
  • Data da defesa: 23.03.2018
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SÁ, Clebiano da Costa. Métodos de validação tradicional e temporal aplicados à avaliação de classificadores de RNAs codificantes e não codificantes. 2018. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2018. Disponível em: http://www.teses.usp.br/teses/disponiveis/95/95131/tde-19052018-122805/. Acesso em: 10 maio 2024.
    • APA

      Sá, C. da C. (2018). Métodos de validação tradicional e temporal aplicados à avaliação de classificadores de RNAs codificantes e não codificantes (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/95/95131/tde-19052018-122805/
    • NLM

      Sá C da C. Métodos de validação tradicional e temporal aplicados à avaliação de classificadores de RNAs codificantes e não codificantes [Internet]. 2018 ;[citado 2024 maio 10 ] Available from: http://www.teses.usp.br/teses/disponiveis/95/95131/tde-19052018-122805/
    • Vancouver

      Sá C da C. Métodos de validação tradicional e temporal aplicados à avaliação de classificadores de RNAs codificantes e não codificantes [Internet]. 2018 ;[citado 2024 maio 10 ] Available from: http://www.teses.usp.br/teses/disponiveis/95/95131/tde-19052018-122805/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024