Use este identificador para citar ou linkar para este item: http://dspace.bc.uepb.edu.br/jspui/handle/123456789/25640
Título: Análise de cluster aplicada aos dados de preços de combustíveis na cidade de Campina Grande - PB
Autor(es): Silva, Wylliam Eduardo Alves
Palavras-chave: Preços de combustível
Método hierárquico
Análise de cluster
Análise multivariada
Data do documento: 8-Jun-2021
Resumo: O presente trabalho teve por objetivo verificar as similaridades dos preços, através da análise de cluster para os combustíveis, gasolina comum e etanol referente ao ano de 2019 no município de Campina Grande – PB. Postos de combustíveis são instalações que vendem combustível para veículos a motor, os tipos mais comuns vendidos são gasolina ou diesel, alguns postos fornecem combustível alternativos como álcool (etanol) e gás natural. A análise de cluster, também chamada de análise de agrupamento, trata-se de uma técnica estatística multivariada usada para classificar elementos em grupos, de forma que elementos dentro de um mesmo cluster sejam muito parecidos e os elementos em diferentes clusters sejam distintos entre si. Os métodos mais utilizados nas análises de clusters são, método hierárquico que consiste em organiza um conjunto de dados em uma estrutura hierárquica de acordo com a proximidade dos indivíduos e o método não hierárquico que é caracterizados pela necessidade de definir uma partição inicial, dividem a base de dados em K-grupos, onde o número K é a quantidade de grupos definida previamente. Para tratamento e análise dos dados foi utilizado o programa computacional R, posteriormente foi realizada uma análise exploratória dos dados para observar algumas características importantes, também foi realizado o teste de Shapiro-Wilk para avaliar a normalidade dos dados, correlação de Spearman para medir a relação entre as variáveis. Partindo para análise de cluster, no método não hierárquico foi utilizado o método k-means, de modo que obteve-se os clusters e suas devidas características, como resultados, obtiveram-se 3 (três) clusters através de método de Elbow (cotovelo), cluster 1 contendo 15 postos de combustíveis, cluster 2, 37 postos e cluster 3 com 5 postos, em que por meio das análises exploratórias dos clusters observou-se que o cluster 1 teve a menor média de preço de combustível tanto para o etanol quanto para gasolina comum, ou seja, os postos que faziam parte deste cluster apresentavam os menores preços para estes dois combustíveis, já o cluster 3 apresentou a maior média para esses combustíveis. No método hierárquico foi utilizada a distância euclidiana, utilizando o mesmo critério do método anterior 3 clusters foram obtidos, através do gráfico do dendrograma verificou-se onde os postos se encontram em cada um dos clusters, assim identificando quais postos tem os melhores e os piores preços de etanol e gasolina comum. A partir do estudo proposto, pode-se concluir que a análise de cluster se mostra uma importante e muito útil para este estudo, no método hierárquico utilizou a distância euclidiana e a ligação completa, no não hierárquico utilizou-se o método k-means, ou seja, isso nos mostra que a análise de cluster foi bem empregada, pois em ambos os métodos não houve mudança dos postos de clusters.
Descrição: SILVA, Wylliam Eduardo Alves. Análise de cluster aplicada aos dados de preços de combustíveis na cidade de Campina Grande - PB. 2021. 31f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Universidade Estadual da Paraíba, Campina Grande, 2021.
URI: http://dspace.bc.uepb.edu.br/jspui/handle/123456789/25640
Aparece nas coleções:09 - TCC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
PDF - Termo de DepósitoPDF - Termo de Depósito81.99 kBAdobe PDFVisualizar/Abrir    Solictar uma cópia
PDF - Wylliam Eduardo Alves SilvaPDF - Wylliam Eduardo Alves Silva1.56 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.