Estatística Multivariada
Estatística Multivariada
Estatística Multivariada
MULTIVARIADA
Relatório – Grupo C2
2021/2022
PUBLICIDADE E MARKETING – TURNO C
ESCOLA SUPERIOR DE COMUNICAÇÃO SOCIAL – INSTITUTO POLITÉCNICO DE LISBOA
Índice
Índice de Gráficos......................................................................................................................1
Índice de Tabelas........................................................................................................................1
Introdução..................................................................................................................................1
Capítulo I – Caracterização da Amostra (variáveis sociodemográficas)...............................2
Capítulo II – Análise Fatorial....................................................................................................4
2.1. Perguntas Utilizadas........................................................................................................4
2.2. Análise dos outliers..........................................................................................................4
2.3. Adequabilidade dos dados à aplicação de uma A.F......................................................4
2.4. Caracterização da Solução proposta..............................................................................4
2.4.1. Avalização da qualidade da solução........................................................................4
2.4.2. Identificação dos fatores a construir.......................................................................5
Capítulo III – Análise de Fiabilidade........................................................................................5
Capítulo IV – Segmentação.......................................................................................................8
4.1. Modelo hierárquico.........................................................................................................8
4.2. Modelo não hierárquico................................................................................................18
Capítulo V – Caracterização dos Segmentos..........................................................................18
5.1. Análise descritiva...........................................................................................................18
5.2. Explorar diferenças entre os segmentos......................................................................21
Testes de Comparação de Mann-Whitney......................................................................21
5.3. Análise de Correspondência Simples...........................................................................23
Conclusão..................................................................................................................................28
Índice de Gráficos
Índice de Tabelas
Introdução
1
Capítulo I – Caracterização da Amostra (variáveis
sociodemográficas)
Género
Idade
Trabalhador Estudante
2
Figura 2 - Gráfico circular representativo da variável Trabalhador Estudante
Podemos observar que a grande maioria dos indivíduos da amostra não são
trabalhadores estudantes.
Nota de Ingresso
Regime
Ano
3
Figura 4 - Gráfico de barras representativo da variável Ano
A maioria dos inquiridos pertence à categoria “1º” da variável Ano. Apenas 2,3%
pertence à categoria “3º”.
H0: Não existe correlação entre as variáveis i e j, com i e j = Stress 1 a Stress 15.
4
Tabela 1 - Tabela representativa das correlações entre as variáveis Stress 1 a Stress 15
Foram efetuados 105 testes, sendo que se verificou haver correlação em 85 deles, o
que corresponde a 80,95%.
5
Aplicação do teste de Bartlett e KMO
4) Decisão
5) Conclusão
Para um nível de confiança a 95%, é possível concluir que existe adequabilidade dos
dados para efetuar uma Análise Fatorial.
KMO
Para o valor de KMO encontrado é possível concluir que existe uma adequabilidade
boa.
6
Regra de Kaiser
Devem ser considerados tantos fatores quanto os que possuem autovalores iniciais
superiores a 1, com uma percentagem cumulativa superior a 70%.
7
Capítulo III – Análise de Fiabilidade
Teste de Alfa Cronbach
8
Tabela 6 - Estatísticas de confiabilidade do Fator 2
9
Tabela 8 - Estatísticas de confiabilidade do Fator 3
Visto que este fator tem apenas uma variável, não se aplica o Teste do Alfa de
Cronbach.
Visto que este fator tem apenas uma variável, não se aplica o Teste do Alfa de
Cronbach.
10
Capítulo IV – Segmentação
4.1. Modelo hierárquico
Prosseguir-se-á, agora, à apresentação das soluções ótimas identificadas nos
dendrogramas realizados. Logo de seguida serão apresentadas as soluções não
ótimas mas possíveis.
Soluções ótimas
11
2) Método: Armazenamento em Cluster Mediano
› Percentagem de casos: 12%
› Dimensão da subamostra: 29 casos
› Linha de corte: 24
› Nº de grupos: 2
12
3) Método: Ligação de grupos (Within-groups linkage)
› Percentagem de casos: 9%
› Dimensão da subamostra: 27 casos
› Linha de corte: 24
› Nº de grupos: 2
13
4) Método: Vizinho mais afastado
› Percentagem de casos: 8%
› Dimensão da subamostra: 11 casos
› Linha de corte: 23
› Nº de grupos: 2
14
5) Método: Ligação entre grupos (Between-groups linkage)
› Percentagem de casos: 9%
› Dimensão da subamostra: 27 casos
› Linha de corte: 24
› Nº de grupos: 2
15
6) Método: Vizinho mais próximo
› Percentagem de casos: 7%
› Dimensão da subamostra: 22 casos
› Linha de corte: 23
› Nº de grupos: 2
16
Soluções possíveis mas não ótimas
7) Método: Ward
› Percentagem de casos: 7%
› Dimensão da subamostra: 20
› Linha de corte: 21
› Nº de grupos: 2
17
8) Método: Vizinho mais afastado
› Percentagem de casos: 9%
› Dimensão da subamostra: 27
› Linha de corte: 20
› Nº de grupos: 2
18
9) Método: Ward
› Percentagem de casos: 11%
› Dimensão da subamostra: 33 casos
› Linha de corte: 21
› Nº de grupos: 2
19
10) Método: Ward
› Percentagem de casos: 9%
› Dimensão da subamostra: 28 casos
› Linha de corte: 20
› Nº de grupos: 2
20
4.2. Modelo não hierárquico
Tabela 10 - Número de casos em cada cluster
Dimensão Percentagem
Segmento 1 70 26,92%
Segmento 2 190 73,08%
Género
21
Pode-se observar que existe uma predominância do género feminino nos dois
segmentos, apesar deste género se destacar mais no Cluster 2, com uma
percentagem de 75,26%.
Idade
Analisando a tabela apresentada, é possível observar que tanto para o Cluster 1 como
para o Cluster 2, 50% dos inquiridos afirmou ter pelo menos 19 anos. Contudo,
surgiram diferenças ao nível do terceiro quartil: 75% das pessoas do primeiro Cluster
têm pelo menos 22 anos; e 75% das pessoas do segundo Cluster têm pelo menos 21
anos.
Por fim, para o Cluster 1, é possível notar que o coeficiente de variação é de 0,20. Por
sua vez, para o Cluster 2, o coeficiente de variação tem um valor de 0,1768. Assim,
pode-se afirmar que o coeficiente de variação do Cluster 1 é maior do que o do Cluster
2.
22
Trabalhador Estudante
Figura 16 - Gráficos circulares relativos à variável Trabalhador Estudante nos Clusters 1 e 2, respetivamente
Com estes gráficos, conclui-se que poucos inquiridos são trabalhadores estudantes
tanto no Cluster 1 como no Cluster 2. No entanto, o Cluster 1 tem uma maior
percentagem de respostas ‘Sim’ a esta variável, com 35,7% de trabalhadores
estudantes.
Notas de Ingresso
23
Tabela 13 - Estatísticas relativas aos Clusters 1 e 2 consoante a variável Notas de Ingresso
Para além disto, através da análise dos percentis podemos perceber que, no geral,
os inquiridos do Cluster 2 obtiveram notas de ingresso mais elevadas que os do
Cluster 1. Isto comprova-se, por exemplo, quando se observa que 25% dos
inquiridos do Cluster 1 tiveram pelo menos 152 como nota de ingresso, enquanto
25% dos inquiridos do Cluster 2 tiveram pelo menos 156. O mesmo se observa no
segundo quartil: no primeiro Cluster 50% dos inquiridos teve pelo menos 162 como
nota de ingresso, e, no segundo Cluster, 50% teve pelo menos 163. Se virmos o 3º
quartil, podemos até observar que 75% dos inquiridos do Cluster 1 tiveram pelo
menos 164,75 como nota de ingresso, e do Cluster 2 tiveram pelo menos 170.
3) Estatística de teste:
p-Value = 0,297
4) Decisão
5) Conclusão
Para um nível de confiança de 95% podemos afirmar que a distribuição dos interesses
no estudo é a mesma para todos os clusters.
25
Fator 2 – Comparar o “cansaço do estudo” por Cluster
3) Estatística de Teste:
p-Value = 0,668
4) Decisão
5) Conclusão
26
5.3. Análise de Correspondência Simples
Para a realização da Análise de Correspondência Simples, devem ser efetuados
testes de Qui-Quadrado, de forma a avaliar se as variáveis serão ou não
independentes (e, portanto, se se pode realizar a análise).
Assim, foram criados 3 Clusters: o primeiro Cluster com percentagem igual a 40,38%,
o segundo Cluster com percentagem igual a 20,77% e o terceiro Cluster com
percentagem igual a 38,85%.
Dimensão Percentagem
Segmento 1 105 40,38%
Segmento 2 54 20,77%
Segmento 3 101 38,85%
27
Tabela 18 - Sumarização do teste de Qui-Quadrado para a variável mais importante do Fator 1
H0: As variáveis Cluster e “Sinto-me cada vez mais cético relativamente à utilidade
potencial dos meus estudos” são independentes.
H1: As variáveis Cluster e “Sinto-me cada vez mais cético relativamente à utilidade
potencial dos meus estudos” não são independentes.
p-Value = 0,094
3) Decisão
4) Conclusão
Perante isto, será realizado um teste de Qui-Quadrado para a segunda variável mais
importante do Fator 1, de forma a averiguar se é ou não possível efetuar a Análise de
Correspondência Simples deste fator.
28
Tabela 19 - Sumarização do teste de Qui-Quadrado para a segunda variável mais importante do Fator 1
H0: As variáveis Cluster e “Tenho dúvidas sobre o significado dos meus estudos” são
independentes.
H1: As variáveis Cluster e “Tenho dúvidas sobre o significado dos meus estudos” não
são independentes.
p-Value = 0,186
3) Decisão
4) Conclusão
Visto que não é possível executar Análises de Correspondência Simples com as duas
variáveis mais importantes do Fator 1, prosseguir-se-á para o Fator 2.
29
1) Definição das hipóteses
H0: As variáveis Cluster e “Os meus estudos deixam-me completamente esgotado” são
independentes.
p-Value = 0,000
3) Decisão
4) Conclusão
Para um nível de confiança a 95% podemos afirmar que as variáveis não são
independentes.
30
Tabela 23 - Pontos de Coluna de visão geral do Fator 2
31
Conclusão
Quem pertence ao Cluster 3 tem tendência a responder ‘Sempre’ à variável ‘Os meus
estudos deixam-me completamente esgotado’.
Quem pertence ao Cluster 2 tem tendência a responder ‘Nunca’ e ‘4’ à variável ‘Os
meus estudos deixam-me completamente esgotado’.
Conclusão
32