Estatística I

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 12

Estatística I

Psicologia 1º Semestre 2022/2023


A22204605 Inês Santos

A impotência da estatística na psicologia:


• A investigação e teorias eram baseadas em autorrelatos (recolha de testemunhos de pessoas), o que foi
bastante criticado. Posteriormente, a Psicologia adotou a experiência controlada (psicologia experimental com
variáveis).
• Verificar se a intervenção, que escolhemos para aplicar, é válida. Para isso, a intervenção tem de ter uma base
experimental.
• Uma recolha de dados em psicologia é sempre suscetível a causar danos ao outro, por isso antes de aplicar
questionários (ou outro tipo de recolha) este tem de passar pela comissão de ética.
• Os investigadores têm de estudar/investigar as teorias sobre o assunto que querem estudar.
• Usa-se a estatística para validar as intervenções.
• Estatística descritiva: Noções básicas, perceber as medidas para descrever a investigação, características.

PORQUE É QUE A ESTATÍSTICA É ÚTIL PARA A PSICOLOGIA?

Resposta a 2 perguntas

O que nos diz a evidência ? Quão certos podemos estar acerca dos
Estatística é uma forma rigorosa e nossos resultados (ou seja, a amostra dá-nos
informação fiável sobre a população)?
objetiva de descrever os padrões
Estatística permite calcular a
nos dados que recolhemos
precisão das nossas conclusões

Investigação científica:
• Objetivo: Beneficiar a sociedade, ou seja, colocar questões, investigá-las e chegar a resoluções dessas
questões.
• N (ou n): Número da amostra
• M - Média
• Mo - Moda: O mais comum.
• DP: desvio
• Missing: Resposta omissa, não resposta ou resposta errada. Motivos – Má interpretação, resposta impercetível,
engano na sinalização da obrigatoriedade da resposta, entre outros.
• Frequência absoluta: Contagem de respostas
• Frequência relativa: Percentagem – Bom para a comparação de grupos que têm amostras diferentes.
• Psicologia experimental: Cria-se uma situação com ausência de pressupostos e uma situação com presença de
pressupostos (exemplo: Se está vento caem ramos, se não está vento não caem).
Processos de Investigação:
1. Observação
2. Revisão teórica: Verificar o que diz a teoria
e, se for caso disso, corrigi-la.
3. Formulação de hipóteses
4. Identificar e selecionar os participantes da
pesquisa
5. Recolha de dados
6. Análise de dados
7. Divulgação de resultados

Amostra:
• Amostra: Subconjunto da população;
• Amostragem: Técnicas possíveis de escolher um subconjunto de um conjunto maior da população;
• Amostragem Probabilística Aleatória: Todos os elementos da população
• Amostragem Probabilística Estratificada: Permite ter mais confiança nos resultados que depois nos permitem
fazer aferência dos resultados para a população (exemplo: eleições);
• Amostragem não probabilística por conveniência: Pessoas facilmente recrutáveis para participar numa
investigação
• Amostragem não probabilística intencional: Ir ao local para recolher amostras.
• Ter atenção ao objetivo da investigação (exemplo: Por conveniência – Estudar os níveis de ansiedade nos
jovens que entraram agora no ensino superior e escolhemos os alunos de psicologia da lusófona do 1º ano;
Intencional – Estudar os níveis de ansiedade nos alunos de psicologia que entraram agora no ensino superior e
escolhemos os alunos de psicologia da lusófona do 1º ano)

O que são dados?


• Os dados são respostas, recolhidas de forma sistemática, às perguntas que os investigadores fazem,
correspondendo a descrições de pessoas ou situações.
Qualitativos Quantitativos
• (palavras) • (números ou respostas que é possível contar:
frequências)
Exemplo:
Como decidiu o curso superior em que se Exemplo:
inscreveu? Que idade tem?
O que pensa sobre estatística? De 1 a 10, quanto gosta de estatística?

Analise de dados:
1. Preparar os dados
2. Codificar os dados
3. Analisar os dados para chegar aos resultados
4. Interpretar os resultados

➢ O que é a preparação de dados?


 É uma etapa que permite que os dados sejam codificados e analisados. Esta tarefa pode ser monótona,
pelo que deve ser feita em intervalos curtos, para evitar erros.
o Dados recolhidos eletronicamente:
Normalmente já estão prontos a codificar (estão numa base de dados), mas convém verificar.
o Dados recolhidos em papel:
Numerar os questionários começando no 1;
Introduzir os questionários numa base de dados, identificando-os pelo respetivo número.
➢ O que é a codificação de dados?
 É uma forma sistemática de garantir que cada dado quantitativo tem um código apropriado.
 O código pode ser um número, letra, palavra ou frase
➢ Que erros se pode cometer na preparação e codificação de dados?
 Erro de omissão: Não introduzir informação que deveria ter introduzido.
 Erro de comissão: Introduzir informação que não deveria ter introduzido.
 Erro de transposição: Inverter a ordem de dois números ou duas palavras.
 Erro tipográfico: Introduzir informação diferente da que se pretendia introduzir.

Que tipos de medidas existem?


Nominais
•São variáveis qualitativas, pois os valores são categorias ou grupos, que não têm uma ordem (não podem ser
traduzidos em números, porque não correspondem a quantidades, mas sim a qualidades)
•Exemplo: nota num teste – reprovado, aprovado; diagnóstico: esquizofrenia, perturbação bipolar.

Ordinais
•São variáveis qualitativas, pois os valores (números discretos ou inteiros: 1, 2, 3, 4, 5, etc.) apenas indicam
uma ordem (e.g., do mais pequeno para o maior)
•Exemplos: nota num teste – insuficiente, suficiente, bom, muito bom; faixa etária: 18-35 anos, 36-50 anos, 51-
65 anos.

Intervalares
•São variáveis quantitativas, pois os valores são números contínuos com significado matemático, o que permite
fazer alguns cálculos matemáticos (adições, subtrações). O valor 0 não significa a ausência da característica
que está a ser medida.
•Exemplos: temperatura em º C (0 não significa que não existe temperatura); testes de QI.

Razão

•São variáveis quantitativas e são semelhantes às variáveis intervalares, mas o valor 0 é um valor absoluto,
significando a ausência da característica. Permite fazer divisões e multiplicações.
•Exemplos: nota num teste (de 0 a 100) – a nota 80 é o dobro da nota 40; idade; peso.

O que é estatística descritiva?


• Primeira etapa da análise de dados, que serve de base a análises mais complexas
• Sumário rigoroso da informação potencialmente complexa de um grupo de participantes
• Representada em poucos números e organizada em tabelas ou gráficos
✓ Descreve os dados recolhidos
✓ Identifica padrões
✓ Permite identificar valores típicos
• Objetivo: Descrever as características da amostra, em determinadas variáveis para tentar ver se existem
padrões;
o Características mais comuns:
o Sexo; Idade; Estado civil; Entre outras.
Frequências Absolutas e relativas:
• São estatísticas descritivas usadas para apresentar sucintamente os dados de todos os tipos de medidas.
 Frequência Absoluta (N ou n)
o Correspondem a uma contagem do número de vezes que uma dada categoria ou valor aparece
nos dados.
o Exemplo: 5 pessoas têm nacionalidade angolana; 27 pessoas passam 5 minutos por dia a
aspirar a casa

 Frequência Relativa (%)


o Correspondem a uma proporção das vezes que uma dada categoria ou valor aparece nos dados
o Exemplo: 20% das pessoas têm nacionalidade angolana; 33% das pessoas passam 10 minutos
por dia a aspirar a casa

Frequências Cruzadas:
• Conjugação de frequências em duas variáveis diferentes
o Proporção de casos com dado valor numa dada variável, considerando os valores de uma segunda
variável
• Permitem perceber a associação entre 2 variáveis
o Exemplo: estado civil e planeamento da gravidez
• São apresentadas em tabelas de contingência

Medidas de tendência Central:


• São medidas que informam sobre os valores típicos de um conjunto de dados que, sendo extenso, é necessário
sumariar.
o Média (M) - Soma de todos os valores a dividir pelo número de valores
o Mediana (Md) – É o meio, é o valor central
o Moda (Mo) – É o valor que mais se repete

Medidas de tendência não central:


o Percentis:
• Forma de distribuição de frequências cumulativas em 100 grupos iguais
• Permitem descrever a pontuação de uma pessoa em comparação com as restantes
• Habitualmente, usam-se os percentis de 10 em 10
• O 50.º percentil corresponde à mediana

o Quartis:
• Correspondem à divisão dos dados em quatro grupos iguais:
1. Quartil – 25 percentil
2. Quartil – 50 percentil (mediana)
3. Quartil – 75 percentil
4. Quartil – 100 percentil (valor máximo)
O que é a variabilidade?
• Grau das diferenças existentes entre os participantes (quão espalhados estão os valores num conjunto de
dados)
• É a razão pela qual a estatística é necessária: a realidade não é estandardizada e não é possível conhecer as
pessoas todas analisando apenas uma delas
o Em variáveis em que as respostas são iguais, há muitas análises estatísticas que são
impossíveis de fazer´
• Ao apresentar apenas os valores típicos, estamos a tratar as pessoas como se fossem iguais e a ignorar a
variabilidade

Medidas de dispersão:
o Variância:
• A variância corresponde à soma dos quadrados dividida pelo número de casos (i.e., média do
quadrado dos desvios).
• Tende a ser maior quando as medidas incluem mais opções de resposta.
• Calcula-se a diferença numérica entre cada observação e a média do conjunto de dados.
o Desvio Padrão:
• Corresponde à raiz quadrada da variância e indica o grau médio em que as observações se desviam da
média.
• Quanto maior a variação e o número de opções de resposta, maior o DP.
o Amplitude:
• Diferença numérica entre o valor máximo e o valor mínimo de um conjunto de dados.
• Quanto maior o valor, mais espalhados estão os dados.
• É um indicador muito influenciado por valores extremos.

O que são valores extremos?


• Casos com valores muito diferentes dos valores dos restantes casos (atípicos)
• Ocorrência extremamente rara, que distorce a tendência dos dados, por ser muito baixa ou muito elevada – é
possível considerar a sua eliminação
• Quanto maior a distância entre uma observação individual e a média, maior o impacto que essa observação
tem na média

O que é a forma da distribuição?


• A distribuição de uma variável é uma descrição do número relativo de vezes que cada resultado possível
ocorrerá
• Relevante para medidas ordinais, intervalares e de razão
• Muitas análises estatísticas pressupõem que os dados seguem uma distribuição designada de distribuição
normal
• Quando há distorções face ao que é considerado normal, a interpretação das análises estatísticas pode ser
problemática
Distribuição Normal:
• É representada por uma curva em forma de sino.
• Traduz a distribuição mais comum em variáveis
que são influenciadas por múltiplos fatores
separados, como é o caso da maioria das variáveis
que os psicólogos investigam.

• Para descrever uma distribuição normal, basta


calcular a média e o desvio-padrão da variável.

O que é a assimetria?
• Grau em que a curva de frequências é desigual: os valores da média, mediana e moda não coincidem e as
caudas da distribuição não são iguais. Frequentemente, a assimetria resulta do uso de medidas enviesadas. Se
a assimetria for elevada, pode influenciar as análises estatísticas.

 Difere da normal: assimétrica à esquerda


✓ Valores negativos de assimetria
✓ Cauda mais longa à esquerda
✓ Mais valores à esquerda da moda do que à direita
✓ Média e mediana inferiores à moda
✓ Média pode estar subestimada devido a valores extremos baixos

 Distribuição normal
✓ Valores igual a 0
✓ Caudas simétrica
✓ Iguais valores à esquerda da moda do que à direita
✓ Média, moda e mediana tomam valores muito próximos ou
iguais

 Difere da normal: assimétrica à direita


✓ Valores positivos de assimetria
✓ Cauda mais longa à direita
✓ Mais valores à direita da moda do que à esquerda
✓ Média e mediana superiores à moda
✓ Média pode estar sobrestimada devido a valores extremos altos
O que é a Curtose?
• Grau em que a curva de frequências é íngreme ou plana.
• Um valor 0 de curtose indica ausência de curtose, o que ocorre numa distribuição normal.
• A curtose tem pouca influência nas análises estatísticas usadas.
 Distribuição platicúrtica
✓ Valores negativos de curtose
✓ Não se verifica um pico
✓ Muita variação nos dados
 Distribuição mesocúrtica
✓ Curtose com valor 0
✓ Distribuição normal
✓ Nem achatada nem alongada
 Distribuição leptocúrtica
✓ Valores positivos de curtose
✓ Pico bastante acentuado
✓ Pouca variação nos dados

Como se avalia a normalidade da distribuição?


• Procedimentos estatísticos: assimetria e curtose
• Análise de gráficos: histograma e caixa de bigodes

O que é uma correlação?


• Duas variáveis correlacionam-se quando os seus valores tendem a variar em simultâneo, de forma linear.
(Ou seja, que se pode visualizar através de uma linha reta)
• O coeficiente de correlação é um valor numérico.
• A correlação de Pearson é a mais usada, aplicando-se a variáveis
contínuas e sendo representada por r (minúsculo e em itálico).
• Correlação, relação ou associação são termos com o mesmo
significado.

 Correlação positiva: Significa que quando uma variável contínua aumenta, a outra também aumenta.
 Correlação negativa: Significa que quando uma variável contínua aumenta, a outra diminui.

• Não implica causalidade entre as duas variáveis, porque pode existir uma terceira variável, escondida, que
influencia as anteriores
Como se apresenta uma correlação?
• Gráfico de dispersão:
o Gráfico com dois eixos
✓ Eixo horizontal (X): amplitude de valores para uma das variáveis
✓ Eixo vertical (Y): amplitude de valores para a outra variável
o Cada coordenada (pontos vermelhos) representa a combinação dos valores das duas variáveis.
 Quanto mais este conjunto de pontos estiver próximo da reta, maior será a associação entre as duas
variáveis. Pelo contrário, quanto mais dispersos, menor a associação.
 A linha azul pretende atravessar os pontos do gráfico e é designada reta de regressão.
✓ Correlações positivas: a reta inclina da esquerda para a direita e de baixo para cima.
✓ Correlações negativas: a reta inclina da esquerda para a direita e de cima para baixo.
➢ Quanto mais elevado é o valor numérico da correlação, melhor a reta se adequa aos pontos do gráfico – ou
seja, os pontos estão mais próximos da reta
o Correlações perfeitas (1 ou -1): os pontos situam-se exatamente na reta mais adequada aos
dados.
o Ausência de correlação (0): os pontos estão dispersos de forma aleatória.
• Exemplo:
SPSS
Definir valores, missing value e tipo de medida das variáveis:
• Para definir os values: (Codificar: Transformar palavras em números)
Feminino = 1
Masculino = 2
Value - Número inteiro a partir de 0 (sem repetições)
Label - Categoria de resposta
1. Ir a tabela values, carregar nos 3 pontinhos da variável
2. Preencher o campo Value.
3. Preencher o campo Label.
4. Carregar em Add.
5. Carregar em OK.

• Para definir os missing values: (Codificar as “Não respostas”: 9, 99, 999, 9999 – Códigos
universais para as “Não respostas”)
Causas: Não querer responder, ter passado à frente sem querer, enganar-se na resposta, ...
Exemplo:
Género: Feminino (código 1), Masculino (código 2), N/R (código 9);
Idade: 0 – 120, a não resposta tem de ser codificada com o 999.
1. Ir a tabela missing, carregar nos 3 pontinhos da variável
2. Preencher o campo dos missing

• Tipos de medida das variáveis: (Nominal, Ordinal e Scale)


o Nominal: medidas categoriais ou nominais
o Ordinal: medidas ordinais
o Scale: Medidas intervalares e de razão
• BDI: Variável ordinal - Todos os itens
• Sexo e Estado civil: Variável nominal
• Idade e ID: Variável de escala

Criar uma nova variável:


1. Selecionar: Menu Transform → Compute variable
2. Introduzir o nome da variável compósita em Target Variable.
3. Introduzir a fórmula de cálculo em Numeric Expression.
Duas formas:
Colocar todos os itens da bdi separados por vírgulas;
Colocar bdi1 to bdi21.
4. Carregar em OK, surgirá uma nova variável na base de dados com esse nome.
Recodificar variáveis:
1. Selecionar Recode into diferente variable
2. Transferir a variável relevante para o campo Numeric Variable -> Output Variable.
3. Inserir uma designação para a nova variável em Output Variable ∙ Name.
4. Carregar em Change.
5. Carregar em Old and New Values.
6. Introduzir o valor original em Old Value.
7. Introduzir o novo valor em New Value.
8. Carregar em Add.
9. Carregar em Continue.

Transformar uma variável quantitativa em qualitativa.


1. Transform - Recode into diferente variable - Introduzir os códigos
2. Recode into same variables: Pega na variável e na mesma variável escreve os códigos (perde-se
dados)
3. Recode into diferente variable: Pega na variável, cria uma nova variável e escreve os códigos (não se
perde dados)

Calcular Frequências:
1. Selecionar: Menu Analyze → Descriptive Statistics → Frequencies.
2. Transferir as variáveis relevantes para o campo Variable(s).
3. Selecionar se necessário os gráficos necessários em Charts. (histograma…)
4. Carregar em Continue.
5. Carregar em OK.

Cruzar Frequências:
1. Selecionar: Menu Analyze → Descriptive Statistics → Crosstabs
2. Transferir as variáveis relevantes para os campos Row(s) e Column(s).
3. Carregar em Cells.
4. Em Percentages, selecionar as opções Row, Column e Total.
5. Carregar em Continue.
6. Carregar em OK.

Calcular medidas de tendência central, não central e de dispersão:


1. Selecionar: Menu Analyze → Descriptive Statistics → Frequencies.
2. Transferir as variáveis relevantes para o campo Variable(s)
3. Selecionar as estatísticas pretendidas em Statistics. (podemos pedir mais medidas para além dos
percentis e quartis.
4. Carregar em Continue, e depois em OK
Pedir percentis:
1. Selecionar: Menu Analyze → Descriptive Statistics → Frequencies.
2. Transferir as variáveis relevantes para o campo Variable(s)
3. Selecionar em Statistics os percentis pretendidos

Descobrir casos entre os percentis:


1. Selecionar: Menu Data → Select Cases
2. Seleccionar opção ‘If Conditions is Satisfied’, e clicar em if…
3. Escrever a expressão numérica do grupo que queremos selecionar.
4. Carregar ok

Calcular medidas de tendência central e dispersão por grupo:


Ex.: calcular o nível de depressão nos homens

Há 2 variáveis, a depressão e o género

1. Selecionar: Menu Analyze → Descriptive Statistics → Explore


2. Transferir a variável que se quer descrever para o campo Dependent List.
3. Transferir a variável que permite formar grupos para o campo Factor List.
4. Carregar em Statistics e selecionar a opção Descriptives.
5. Carregar em Continue.
6. Carregar em OK.

Apresentar um gráfico de barras:


1. Selecionar: Menu Graphs → Chart builder
2. Selecionar o tipo de gráfico que se quer, sendo cruzamento entre duas variáveis escolhe-se Simple
(carregar duas vezes rápidas ou deslocar para o espaço em cima branco).
3. Transferir a variável dos grupos a comparar para X Axis.
4. Transferir a variável quantitativa para o campo Count.
5. Carregar em OK.

Obter os dados de assimetria e de Curtose:


1. Selecionar: Menu Analyze → Descriptive Statistics → Frequencies.
2. Transferir a variável relevante para o campo Variable(s).
3. Carregar em Statistics.
4. Em Distribution, selecionar Kurtosis e Skewness.
5. Carregar em Continue.
6. Carregar em OK
Histograma:
1. Selecionar: Menu Analyze → Descriptive Statistics → Frequencies.
2. Transferir a variável relevante para o campo Variable(s).
3. Carregar em Charts.
4. Em Chart type, selecionar Histograms.
5. Carregar em Show normal curve on histogram.
6. Carregar em Continue.
7. Carregar em OK.

Caixa de bigodes (Outliers):


1. Selecionar: Menu Analyze → Descriptive Statistics → Explore
2. Transferir a variável relevante para o campo Dependent List
3. Transferir variável nominal relevante para ‘Factor List’.
4. Selecionar statistics, carregar em outliers
5. Carregar em Continue.
6. Carregar em OK

Calcular uma correlação:


1. Selecionar: Menu Analyze → Correlate → Bivariate
2. Transferir as variáveis relevantes para a caixa de texto Variables
3. Carregar em OK

Gráfico de dispersão:
1. Selecionar: Menu Grahps → Scatter/Dot
2. Selecionar Simple Scatter
3. Na caixa Simple Scatterplot, colocar uma das variáveis no Y Axis e outra no X Axis.
4. Carregar em OK
5. Já no Output
6. Fazer duplo clique no gráfico, para abrir a caixa Chart Editor.
7. Selecionar a opção Add Fit Line atTotal.
8. Na caixa Properties, carregar em Close

Você também pode gostar