Agrupamento de dados em fluxos contínuos com estimativa automática do número de grupos (2015)
- Authors:
- Autor USP: SILVA, JONATHAN DE ANDRADE - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- Subjects: COMPUTAÇÃO EVOLUTIVA; MINERAÇÃO DE DADOS; APRENDIZADO COMPUTACIONAL
- Keywords: Agrupamento de dados; Algoritmos evolutivos; Clustering; Data stream; Evolutionary algorithms; Fluxo contínuo de dados
- Language: Português
- Abstract: Técnicas de agrupamento de dados usualmente assumem que o conjunto de dados é de tamanho fixo e pode ser alocado na memória. Neste contexto, um desafio consiste em aplicar técnicas de agrupamento em bases de dados de tamanho ilimitado, com dados gerados continuamente e em ambientes dinâmicos. Dados gerados nessas condições originam o que se convencionou chamar de Fluxo Contínuo de Dados (FCD). Em aplicações de FCD, operações de acesso aos dados são restritas a apenas uma leitura ou a um pequeno número de acessos aos dados, com limitações de memória e de tempo de processamento. Além disso, a distribuição dos dados gerados por essas fontes pode ser não estacionária, ou seja, podem ocorrer mudanças ao longo do tempo, denominadas de mudanças de conceito. Nesse sentido, algumas técnicas de agrupamento em FCD foram propostas na literatura. Muitas dessas técnicas são baseadas no algoritmo das k-Médias. Uma das limitações do algoritmo das k-Médias consiste na definição prévia do número de grupos. Ao se assumir que o número de grupos é desconhecido a priori e que deveria ser estimado a partir dos dados, percorrer o grande espaço de soluções possíveis (tanto em relação ao número de grupos, k, quanto em relação às partições possíveis para um determinado k) torna desafiadora a tarefa de agrupamento de dados - ainda mais sob a limitação de tempo e armazenamento imposta em aplicações de FCD. Neste contexto, essa tese tem como principais contribuições: (i) adaptar algoritmos que têm sidousados com sucesso em aplicações de Fluxo Contínuo de Dados (FCD) nas quais k é conhecido para cenários em que se deseja estimar o número de grupos; (ii) propor novos algoritmos para agrupamento que estimem k automaticamente a partir do FCD; (iii) avaliar sistematicamente, e de maneira quantitativa, os algoritmos propostos de acordo com as características específicas dos cenários de FCD. Foram desenvolvidos 14 algoritmos de agrupamento para FCD capazes de estimar o número de grupos a partir dos dados. Tais algoritmos foram avaliados em seis bases de dados artificiais e duas bases de dados reais amplamente utilizada na literatura. Os algoritmos desenvolvidos podem auxiliar em diversas áreas da Mineração em FCD. Os algoritmos evolutivos desenvolvidos mostraram a melhor relação de custo-benefício entre eficiência computacional e qualidade das partições obtidas
- Imprenta:
- Publisher place: São Carlos
- Date published: 2015
- Data da defesa: 04.03.2015
-
ABNT
SILVA, Jonathan de Andrade. Agrupamento de dados em fluxos contínuos com estimativa automática do número de grupos. 2015. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2015. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-10082015-110127/. Acesso em: 28 mar. 2024. -
APA
Silva, J. de A. (2015). Agrupamento de dados em fluxos contínuos com estimativa automática do número de grupos (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-10082015-110127/ -
NLM
Silva J de A. Agrupamento de dados em fluxos contínuos com estimativa automática do número de grupos [Internet]. 2015 ;[citado 2024 mar. 28 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-10082015-110127/ -
Vancouver
Silva J de A. Agrupamento de dados em fluxos contínuos com estimativa automática do número de grupos [Internet]. 2015 ;[citado 2024 mar. 28 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-10082015-110127/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas