Observações atípicas em alta dimensão (2022)
- Authors:
- Autor USP: HISATUGU, MATHEUS TOSHIO - INTER: ICMC -UFSCAR
- Unidade: INTER: ICMC -UFSCAR
- Sigla do Departamento: SME
- DOI: 10.11606/D.104.2022.tde-21102022-112410
- Subjects: VALORES ATÍPICOS; MATEMÁTICA APLICADA; APRENDIZADO COMPUTACIONAL; ECONOMETRIA; ESTATÍSTICA
- Keywords: Análise de componentes principais; Curse of dimensionality; HeteroPCA; HeteroPCA; Heteroskedastic noise; High dimensional outliers; Maldição da dimensionalidade; Observações atípicas em alta dimensão; Principal component analysis; Ruído heteroscedástico
- Language: Português
- Abstract: Observações atípicas e ruído heteroscedástico são duas situações muito comuns em Estatística. Atualmente, a quantidade de dados gerada é muito alta e por essa razão é possível encontrar dados de alta dimensão (número de variáveis, ou dimensão, d tão grande ou maior do que o número de observações n). Além disso, é possível que os dados possuam ruído heteroscedástico, isto é, a variância do ruído pode variar de entrada para entrada. A análise de componentes principais (ACP) é uma técnica muito utilizada que tem como principal objetivo a redução da dimensionalidade. A técnica é utilizada em diversas áreas como a Estatística, Econometria, Aprendizado de Máquina e Matemática Aplicada. Choi e Marron (2019) apresentaram uma nova noção de valores atípicos em alta dimensão que engloba outros tipos e, além disso, investigaram o comportamento dessas observações atípicas no subespaço criado pela análise de componentes principais. Grande parte das técnicas utilizadas nesse contexto são utilizadas sob a suposição de homoscedasticidade, porém, como já mencionado, sabe-se que isso nem sempre acontece. Sendo assim, Zhang, Cai e Wu (2022) propuseram um novo método chamado HeteroPCA que tem como objetivo principal remover o viés da diagonal principal da matriz de covariâncias amostral sob o qual está sujeita devido à heteroscedasticidade. Este trabalho tem como objetivo combinar o método proposto por Zhang, Cai e Wu (2022) com a metodologia proposta por Choi e Marron (2019) para encontrar umsubespaço capaz de identificar a presença de observações atípicas quando o ruído heteroscedástico está presente.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2022
- Data da defesa: 15.09.2022
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
HISATUGU, Matheus Toshio. Observações atípicas em alta dimensão. 2022. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2022. Disponível em: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-21102022-112410/. Acesso em: 30 abr. 2024. -
APA
Hisatugu, M. T. (2022). Observações atípicas em alta dimensão (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/104/104131/tde-21102022-112410/ -
NLM
Hisatugu MT. Observações atípicas em alta dimensão [Internet]. 2022 ;[citado 2024 abr. 30 ] Available from: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-21102022-112410/ -
Vancouver
Hisatugu MT. Observações atípicas em alta dimensão [Internet]. 2022 ;[citado 2024 abr. 30 ] Available from: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-21102022-112410/
Informações sobre o DOI: 10.11606/D.104.2022.tde-21102022-112410 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas