Resumo:
O presente trabalho teve por objetivo verificar as similaridades dos preços, através da
análise de cluster para os combustíveis, gasolina comum e etanol referente ao ano de
2019 no município de Campina Grande – PB. Postos de combustíveis são instalações que
vendem combustível para veículos a motor, os tipos mais comuns vendidos são gasolina
ou diesel, alguns postos fornecem combustível alternativos como álcool (etanol) e gás
natural. A análise de cluster, também chamada de análise de agrupamento, trata-se de uma
técnica estatística multivariada usada para classificar elementos em grupos, de forma que
elementos dentro de um mesmo cluster sejam muito parecidos e os elementos em diferentes
clusters sejam distintos entre si. Os métodos mais utilizados nas análises de clusters são,
método hierárquico que consiste em organiza um conjunto de dados em uma estrutura
hierárquica de acordo com a proximidade dos indivíduos e o método não hierárquico que é
caracterizados pela necessidade de definir uma partição inicial, dividem a base de dados
em K-grupos, onde o número K é a quantidade de grupos definida previamente. Para
tratamento e análise dos dados foi utilizado o programa computacional R, posteriormente
foi realizada uma análise exploratória dos dados para observar algumas características
importantes, também foi realizado o teste de Shapiro-Wilk para avaliar a normalidade
dos dados, correlação de Spearman para medir a relação entre as variáveis. Partindo para
análise de cluster, no método não hierárquico foi utilizado o método k-means, de modo
que obteve-se os clusters e suas devidas características, como resultados, obtiveram-se 3
(três) clusters através de método de Elbow (cotovelo), cluster 1 contendo 15 postos de
combustíveis, cluster 2, 37 postos e cluster 3 com 5 postos, em que por meio das análises
exploratórias dos clusters observou-se que o cluster 1 teve a menor média de preço de
combustível tanto para o etanol quanto para gasolina comum, ou seja, os postos que
faziam parte deste cluster apresentavam os menores preços para estes dois combustíveis,
já o cluster 3 apresentou a maior média para esses combustíveis. No método hierárquico
foi utilizada a distância euclidiana, utilizando o mesmo critério do método anterior 3
clusters foram obtidos, através do gráfico do dendrograma verificou-se onde os postos se
encontram em cada um dos clusters, assim identificando quais postos tem os melhores e os
piores preços de etanol e gasolina comum. A partir do estudo proposto, pode-se concluir
que a análise de cluster se mostra uma importante e muito útil para este estudo, no
método hierárquico utilizou a distância euclidiana e a ligação completa, no não hierárquico
utilizou-se o método k-means, ou seja, isso nos mostra que a análise de cluster foi bem
empregada, pois em ambos os métodos não houve mudança dos postos de clusters.
Descrição:
SILVA, Wylliam Eduardo Alves. Análise de cluster aplicada aos dados de preços de combustíveis na cidade de Campina Grande - PB. 2021. 31f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Universidade Estadual da Paraíba, Campina Grande, 2021.