DISTRIBUIÇÕES BIDIMENSIOnais
DISTRIBUIÇÕES BIDIMENSIOnais
DISTRIBUIÇÕES BIDIMENSIOnais
I
INSTITUTO SUPERIOR POLITÉCNICO DE TECNOLOGIAS E CIÊNCIAS
12/22/2020IS17PTEC 16 2
ESTATÍSTICA I
12/22/2020
PAULO TEKA 2
Exemplo 1
Um estudante de Estatística interrogou 20 turistas alemães acerca do
seu peso e da sua altura.
Registou os dados na seguinte tabela:
Peso (Kg) Altura(cm)
60 156
61 157
63 157
64 160
72 159
75 158
77 170
78 174
80 180
83 171
85 180
88 189
89 185
90 201
92 190
98 205
99 206
100 200
103 205
105 215
3
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 3
NUVEM DE PONTOS OU DIAGRAMA DE DISPERSÃO
Considere-se o peso como a variável x e altura como a variável y e construa-
se o seguinte gráfico que se chama nuvem de pontos ou diagrama de
dispersão.
Altura(cm) e Peso (Kg) de 20 turistas alemães
250
200
Altura (Cm)
150
100
50
0
50 60 70 80 90 100 110
Peso (Kg)
4
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 4
Observação 1
Pode-se observar que, como era de esperar, os pontos não ficaram situados
sobre a mesma recta, mas que também não estavam aleatoriamente
distribuídos.
De facto, os pontos concentraram-se ao longo de uma “linha”.
Quando se está perante este facto é porque há uma relação entre as duas
variáveis em estudo.
5
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 5
Exemplo 2
Quando se observa um diagrama de dispersão, intuitivamente é-se levado a afirmar que existe
ou não existe possibilidade de qualquer relação entre as variáveis.
7
7
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 7
5.2. IDEIA INTUITIVA DE CORRELAÇÃO
Quando existe alguma ligação de dependência entre duas variáveis diz-se que
existe uma correlação entre elas.
8
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 8
Objectivo
9
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 9
5.3. COEFICIENTE DE CORRELAÇÃO
O objectivo do estudo da correlação é verificar se existe, ou não, relação entre os
fenómenos em estudo, e avaliar o grau dessa relação.
Só se estudarão as correlações lineares, ou seja, aquelas em que se procura avaliar a
relação das variáveis quando a nuvem de pontos se condensa em torno de uma recta.
É o caso dos diagramas de dispersão anteriores, com excepção do A e do F.
Intuitivamente observa-se a existência, ou não, da correlação linear entre as variáveis.
Para quantificar essa correlação Pearson propôs o coeficiente de correlação lineare
de pearson, que se representa por ou e é definido por:
11
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 10
5.3. COEFICIENTE DE CORRELAÇÃO
(∑ 𝑥 )(∑ 𝑦 )
∑ 𝑥𝑦 −
𝑛
𝑟= ( 1)
2 2
√(∑ 𝑥 2
−
(∑
𝑛
𝑥)
)(∑ 𝑦 2
−
(∑
𝑛
𝑦)
)
O valor de r varia no intervalo .
12
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 11
Algumas situações que podem se apresentar os diagramas
de dispersão
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 12 13
Interpretações: avaliar o grau da relação
COEFICIENTE DE CORRELAÇÃO
CORRELAÇÃO
r=1 Perfeita positiva
0,8 Forte positiva
0,5 r 0,8 Moderada positiva
0 r 0,1 Íntima
Íntima positiva
positiva
rr =
=00 Nula
Nula
- 0,1 r 0 Íntima
Íntima negativa
negativa
-0,5 r Fraca negativa
Fraca negativa
-0,8 r Moderada negativa
Moderada negativa
-1 Forte negativo
Forte negativo
r= -1 Perfeita negativa
r= -1 Perfeita negativa
14
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 13
Observação 2
Correlação não é o mesmo que causa e efeito. Duas variáveis podem estar altamente
correlacionadas e, no entanto, não haver relação de causa e efeito entre elas.
Se duas variáveis estiverem amarradas por uma relação de causa e efeito elas estarão,
obrigatoriamente, correlacionadas.
O estudo de correlação pressupõe que as variáveis X e Y tenham uma distribuição
normal.
A palavra simples que compõe o nome correlação linear simples, indica que estão
envolvidas no cálculo somente duas variáveis.
O coeficiente de correlação linear de Pearson mede a correlação em estatística
paramétrica.
15
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 14
5.4. Exercícios práticos:
De acordo com a tabela seguinte, calcule o coeficiente de correlação de pearson.
Empresa Gastos em publicidade(Milhares de kwanzas) Vendas (Milhares de kwanzas)
A 1 15
B 1,5 25
C 0,8 20
D 1,3 80
E 5 66
F 15 200
G 40 850
H 2 22
I 25 486
J 20 580
15
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 15
Resolução:
1 15 1 225 15
1,5 25 2,25 625 37,5
0,8 20 0,64 400 16 Aplicando a formula:
1,3 80 1,69 6 400 104
5 66 25 4 356 330 (∑ 𝑥 )(∑ 𝑦 )
∑ 𝑥𝑦 −
15 200 225 40 000 3 000 𝑛
𝑟=
40 850 1600 722 500 34 000 2 2
2
25
22
486
4
625
484
236 196
44
12 150
√( ∑ 𝑥2−
(∑ 𝑥 )
𝑛 )(∑ 𝑦2 −
(∑ 𝑦 )
𝑛 )
20 580 400 336 400 11 600
111,6 2344 2884,58 1 347 586 61 296,5
16
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 16
Resolução:
111,6 ∙ 2344
∑ 61 296,5 − 10
𝑟=
( 111,6 )2 ( 2344 )2
√( 2884,58 −
10 )( 1 347 586 −
𝑛 )
𝑟=0,971 452 4494
Vem
17
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 17
5.4.Vantagem do conhecimento da recta de regressão
18
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 18
5.5. RECTA DE REGRESSÃO
19
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 19
5.5.2. RECTA DE REGRESSÃO
20
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 20
5.5.3.Representação da recta de regressão
• Método gráfico
A recta de regressão tem uma equação bem definida mas pode obter-se uma boa
aproximação da recta por um método gráfico. Este método consiste em, por
exemplo, utilizando uma régua transparente, traçar uma recta de modo que a soma
dos desvios dos pontos da nuvem em relação aos correspondentes da recta seja
menor possível .
21
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 21
5.5.2.Representação da recta de regressão
• Método algébrico
A recta tem de equação uma expressão do tipo:
Prova-se que a recta contém o ponto de coordenadas centro de gravidade da
nuvem de pontos, e que o declive da recta é dado pela fórmula :
22
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 22
5.5.4. Exemplo
Sobre a mesma matéria uma turma foi avaliada, em seis testes, por dois professores
diferentes . Os resultados médios estão indicados na tabelas seguinte (notas 0 a 20 ) .
23
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 23
PROBLEMAS RESOLVIDOS
Diagrama de dispersão
20
15
Notas Prof B
10
0
6 8 10 12 14 16 18 20
Notas Prof A
(∑ 𝑥 )(∑ 𝑦 )
∑ 𝑥𝑦 −
𝑛
12,0 15,0 144,0 225 180
𝑟=
2 2
√(
10,6 13,6 112,36 184,96 144,16
(∑ 𝑥 ) (∑ 𝑦 )
18,0
8,0
15,5
5,8
324
64
240,25
33,64
279
46,4
∑ 𝑥2−
𝑛 )(∑ 𝑦2 −
𝑛 )
14,0 13,5 196 182,25 189
9,5 12,3 90,25 151,29 116,85
0,72 (2 c.d) Moderada positiva
24
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 24
PROBLEMAS RESOLVIDOS
Recta: )
25
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 25
5.5.5. EXERCÍCIOS DE APLICAÇÕES
x 1 2 2 3 4 5 6 8 8 9
B. y 8 7 9 7 5 5 4 2 3 1
26
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 26
5.5.3. EXERCÍCIOS DE APLICAÇÕES
3.2. A não existência de correlação linear entre duas variáveis prova que as duas variáveis não
estão relacionadas de qualquer modo.
27
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 27
Resolução
2.1 10 B
8 A 10
6
5
Y
Y
4
2 0
0 0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10
x X
2.2. As correlações são ambas negativas pois, em geral, quando uma das variáveis aumenta a outra
diminui, e reciprocamente.
A correlação dos dados da tabela (B) é mais forte do que a dos dados da tabela (A) . Para chegar a esta
conclusão, basta verificar que os pontos do diagrama referente a (B) estão mais próximos de uma recta
imaginária (recta de regressão) do que os pontos do diagrama referente a (A) .
28
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 28
Resolução
3.
1. Verdade
verifica-se um bom ajuste entre uma recta e a nuvem de pontos, pelo que as mudanças
da variável x implicam , frequentemente, mudanças na variável y , e reciprocamente.
3.2. Falsidade a correlação linear avalia apenas a existência ou não existência de relações
lineares entre as variáveis . Logo, se as variáveis estiverem relacionadas de forma não linear
pode existir relação entre elas.
29
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 29
Exercícios
4.Trinta estudantes do ensino médio foram submetidos a uma pesquisa que relaciona o tempo
gasto na Internet e as notas médias (NM) deles. Os resultados são apresentados na seguinte
tabela. X representa a quantidade de tempo gasto na Internet semanalmente e Y é a NM do
estudante.
Horas NM Horas NM Horas NM
29
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 30
Exercícios
5.1. Mostre que a equação de uma recta que passa pelos pontos (,) e (,) é dada por :
5.3. Uma plantação de trigo cresce em 9 terrenos de mesmo tamanho. A quantidade de fertilizante
colocada em cada terreno é apresentada na seguinte tabela juntamente com a produção de trigo.
29
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 31
Exercícios
Determine :
6.
6.1. a inclinação;
6.2. a equação;
6.3. a interseção com Y e
6.4. a interseção com X da recta que passa pelos pontos
7. Determine a equação de uma recta que passa pelo ponto e que é paralela à recta
8. Determine a equação de uma recta cuja inclinação é e cuja interseção com Y é 16.
9.1. Construa uma recta que se ajuste aos dados na seguinte tabela.
9.2. Determine uma equação para essa recta.
X 1 3 4 6 8 9 11 14
Y 1 2 4 4 5 7 8 9
30
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 32
Exercícios
10. A tabela seguinte mostra as alturas e os pesos, arredondados para centímetro e quilograma
de uma amostra de 12 estudantes do sexo masculino, obtida aleatoriamente entre os do primeiro
ano de uma escola estadual.
Peso x (kg) 70 63 72 60 66 70 74 65 62 67 65 68
Altura Y (cm) 155 150 180 135 156 168 178 160 132 145 139 152
30
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 33
Resolução
Obrigado !
30
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 34