Estatística I
Estatística I
Estatística I
Resposta a 2 perguntas
O que nos diz a evidência ? Quão certos podemos estar acerca dos
Estatística é uma forma rigorosa e nossos resultados (ou seja, a amostra dá-nos
informação fiável sobre a população)?
objetiva de descrever os padrões
Estatística permite calcular a
nos dados que recolhemos
precisão das nossas conclusões
Investigação científica:
• Objetivo: Beneficiar a sociedade, ou seja, colocar questões, investigá-las e chegar a resoluções dessas
questões.
• N (ou n): Número da amostra
• M - Média
• Mo - Moda: O mais comum.
• DP: desvio
• Missing: Resposta omissa, não resposta ou resposta errada. Motivos – Má interpretação, resposta impercetível,
engano na sinalização da obrigatoriedade da resposta, entre outros.
• Frequência absoluta: Contagem de respostas
• Frequência relativa: Percentagem – Bom para a comparação de grupos que têm amostras diferentes.
• Psicologia experimental: Cria-se uma situação com ausência de pressupostos e uma situação com presença de
pressupostos (exemplo: Se está vento caem ramos, se não está vento não caem).
Processos de Investigação:
1. Observação
2. Revisão teórica: Verificar o que diz a teoria
e, se for caso disso, corrigi-la.
3. Formulação de hipóteses
4. Identificar e selecionar os participantes da
pesquisa
5. Recolha de dados
6. Análise de dados
7. Divulgação de resultados
Amostra:
• Amostra: Subconjunto da população;
• Amostragem: Técnicas possíveis de escolher um subconjunto de um conjunto maior da população;
• Amostragem Probabilística Aleatória: Todos os elementos da população
• Amostragem Probabilística Estratificada: Permite ter mais confiança nos resultados que depois nos permitem
fazer aferência dos resultados para a população (exemplo: eleições);
• Amostragem não probabilística por conveniência: Pessoas facilmente recrutáveis para participar numa
investigação
• Amostragem não probabilística intencional: Ir ao local para recolher amostras.
• Ter atenção ao objetivo da investigação (exemplo: Por conveniência – Estudar os níveis de ansiedade nos
jovens que entraram agora no ensino superior e escolhemos os alunos de psicologia da lusófona do 1º ano;
Intencional – Estudar os níveis de ansiedade nos alunos de psicologia que entraram agora no ensino superior e
escolhemos os alunos de psicologia da lusófona do 1º ano)
Analise de dados:
1. Preparar os dados
2. Codificar os dados
3. Analisar os dados para chegar aos resultados
4. Interpretar os resultados
Ordinais
•São variáveis qualitativas, pois os valores (números discretos ou inteiros: 1, 2, 3, 4, 5, etc.) apenas indicam
uma ordem (e.g., do mais pequeno para o maior)
•Exemplos: nota num teste – insuficiente, suficiente, bom, muito bom; faixa etária: 18-35 anos, 36-50 anos, 51-
65 anos.
Intervalares
•São variáveis quantitativas, pois os valores são números contínuos com significado matemático, o que permite
fazer alguns cálculos matemáticos (adições, subtrações). O valor 0 não significa a ausência da característica
que está a ser medida.
•Exemplos: temperatura em º C (0 não significa que não existe temperatura); testes de QI.
Razão
•São variáveis quantitativas e são semelhantes às variáveis intervalares, mas o valor 0 é um valor absoluto,
significando a ausência da característica. Permite fazer divisões e multiplicações.
•Exemplos: nota num teste (de 0 a 100) – a nota 80 é o dobro da nota 40; idade; peso.
Frequências Cruzadas:
• Conjugação de frequências em duas variáveis diferentes
o Proporção de casos com dado valor numa dada variável, considerando os valores de uma segunda
variável
• Permitem perceber a associação entre 2 variáveis
o Exemplo: estado civil e planeamento da gravidez
• São apresentadas em tabelas de contingência
o Quartis:
• Correspondem à divisão dos dados em quatro grupos iguais:
1. Quartil – 25 percentil
2. Quartil – 50 percentil (mediana)
3. Quartil – 75 percentil
4. Quartil – 100 percentil (valor máximo)
O que é a variabilidade?
• Grau das diferenças existentes entre os participantes (quão espalhados estão os valores num conjunto de
dados)
• É a razão pela qual a estatística é necessária: a realidade não é estandardizada e não é possível conhecer as
pessoas todas analisando apenas uma delas
o Em variáveis em que as respostas são iguais, há muitas análises estatísticas que são
impossíveis de fazer´
• Ao apresentar apenas os valores típicos, estamos a tratar as pessoas como se fossem iguais e a ignorar a
variabilidade
Medidas de dispersão:
o Variância:
• A variância corresponde à soma dos quadrados dividida pelo número de casos (i.e., média do
quadrado dos desvios).
• Tende a ser maior quando as medidas incluem mais opções de resposta.
• Calcula-se a diferença numérica entre cada observação e a média do conjunto de dados.
o Desvio Padrão:
• Corresponde à raiz quadrada da variância e indica o grau médio em que as observações se desviam da
média.
• Quanto maior a variação e o número de opções de resposta, maior o DP.
o Amplitude:
• Diferença numérica entre o valor máximo e o valor mínimo de um conjunto de dados.
• Quanto maior o valor, mais espalhados estão os dados.
• É um indicador muito influenciado por valores extremos.
O que é a assimetria?
• Grau em que a curva de frequências é desigual: os valores da média, mediana e moda não coincidem e as
caudas da distribuição não são iguais. Frequentemente, a assimetria resulta do uso de medidas enviesadas. Se
a assimetria for elevada, pode influenciar as análises estatísticas.
Distribuição normal
✓ Valores igual a 0
✓ Caudas simétrica
✓ Iguais valores à esquerda da moda do que à direita
✓ Média, moda e mediana tomam valores muito próximos ou
iguais
Correlação positiva: Significa que quando uma variável contínua aumenta, a outra também aumenta.
Correlação negativa: Significa que quando uma variável contínua aumenta, a outra diminui.
• Não implica causalidade entre as duas variáveis, porque pode existir uma terceira variável, escondida, que
influencia as anteriores
Como se apresenta uma correlação?
• Gráfico de dispersão:
o Gráfico com dois eixos
✓ Eixo horizontal (X): amplitude de valores para uma das variáveis
✓ Eixo vertical (Y): amplitude de valores para a outra variável
o Cada coordenada (pontos vermelhos) representa a combinação dos valores das duas variáveis.
Quanto mais este conjunto de pontos estiver próximo da reta, maior será a associação entre as duas
variáveis. Pelo contrário, quanto mais dispersos, menor a associação.
A linha azul pretende atravessar os pontos do gráfico e é designada reta de regressão.
✓ Correlações positivas: a reta inclina da esquerda para a direita e de baixo para cima.
✓ Correlações negativas: a reta inclina da esquerda para a direita e de cima para baixo.
➢ Quanto mais elevado é o valor numérico da correlação, melhor a reta se adequa aos pontos do gráfico – ou
seja, os pontos estão mais próximos da reta
o Correlações perfeitas (1 ou -1): os pontos situam-se exatamente na reta mais adequada aos
dados.
o Ausência de correlação (0): os pontos estão dispersos de forma aleatória.
• Exemplo:
SPSS
Definir valores, missing value e tipo de medida das variáveis:
• Para definir os values: (Codificar: Transformar palavras em números)
Feminino = 1
Masculino = 2
Value - Número inteiro a partir de 0 (sem repetições)
Label - Categoria de resposta
1. Ir a tabela values, carregar nos 3 pontinhos da variável
2. Preencher o campo Value.
3. Preencher o campo Label.
4. Carregar em Add.
5. Carregar em OK.
• Para definir os missing values: (Codificar as “Não respostas”: 9, 99, 999, 9999 – Códigos
universais para as “Não respostas”)
Causas: Não querer responder, ter passado à frente sem querer, enganar-se na resposta, ...
Exemplo:
Género: Feminino (código 1), Masculino (código 2), N/R (código 9);
Idade: 0 – 120, a não resposta tem de ser codificada com o 999.
1. Ir a tabela missing, carregar nos 3 pontinhos da variável
2. Preencher o campo dos missing
Calcular Frequências:
1. Selecionar: Menu Analyze → Descriptive Statistics → Frequencies.
2. Transferir as variáveis relevantes para o campo Variable(s).
3. Selecionar se necessário os gráficos necessários em Charts. (histograma…)
4. Carregar em Continue.
5. Carregar em OK.
Cruzar Frequências:
1. Selecionar: Menu Analyze → Descriptive Statistics → Crosstabs
2. Transferir as variáveis relevantes para os campos Row(s) e Column(s).
3. Carregar em Cells.
4. Em Percentages, selecionar as opções Row, Column e Total.
5. Carregar em Continue.
6. Carregar em OK.
Gráfico de dispersão:
1. Selecionar: Menu Grahps → Scatter/Dot
2. Selecionar Simple Scatter
3. Na caixa Simple Scatterplot, colocar uma das variáveis no Y Axis e outra no X Axis.
4. Carregar em OK
5. Já no Output
6. Fazer duplo clique no gráfico, para abrir a caixa Chart Editor.
7. Selecionar a opção Add Fit Line atTotal.
8. Na caixa Properties, carregar em Close