DISTRIBUIÇÕES BIDIMENSIOnais

Fazer download em pptx, pdf ou txt
Fazer download em pptx, pdf ou txt
Você está na página 1de 34

ESTATÍSTICA

I
INSTITUTO SUPERIOR POLITÉCNICO DE TECNOLOGIAS E CIÊNCIAS

12/22/2020 ISPTE 17/08/2016 C 1


5. DISTRIBUIÇÕES BIDIMENSIONAIS

Objectivo: é estudar relação entre duas variáveis quantitativas


 

5.1. – RELAÇÃO ESTATÍSTICA. DIAGRAMA DE DISPERSÃO

No estudo da Estatística , até agora desenvolvido, observou-se um conjunto e


atribui-se a cada observação um grupo de valores correspondente a única
variável, x , era unidimensional .
Se ao fazer - se uma observação se atribuir a cada elemento um par ordenado
de valores , tem-se uma variável estatística bidimensional.
ISPTE 17/08/2016 C

12/22/2020IS17PTEC 16 2
ESTATÍSTICA I
12/22/2020
PAULO TEKA 2
Exemplo 1
Um estudante de Estatística interrogou 20 turistas alemães acerca do
seu peso e da sua altura.
Registou os dados na seguinte tabela:
Peso (Kg) Altura(cm)
60 156
61 157
63 157
64 160
72 159
75 158
77 170
78 174
80 180
83 171
85 180
88 189
89 185
90 201
92 190
98 205
99 206
100 200
103 205
105 215
3
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 3
NUVEM DE PONTOS OU DIAGRAMA DE DISPERSÃO
Considere-se o peso como a variável x e altura como a variável y e construa-
se o seguinte gráfico que se chama nuvem de pontos ou diagrama de
dispersão.
Altura(cm) e Peso (Kg) de 20 turistas alemães
250

200
Altura (Cm)

150

100

50

0
50 60 70 80 90 100 110
Peso (Kg)

4
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 4
Observação 1

Pode-se observar que, como era de esperar, os pontos não ficaram situados
sobre a mesma recta, mas que também não estavam aleatoriamente
distribuídos.
De facto, os pontos concentraram-se ao longo de uma “linha”.
Quando se está perante este facto é porque há uma relação entre as duas
variáveis em estudo.

5
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 5
Exemplo 2

Idade e altura das crianças


Tempo de prática de desportos e ritmo cardíaco
Tempo de estudo e nota na prova
Taxa de desemprego e taxa de criminalidade
Expectativa de vida e taxa de analfabetismo

Ao analisar o exemplo nº1 acima mencionado. Agora repare!


Se os turistas vistos fossem chineses acha que as variáveis tomavam valores do
mesmo conjunto de pontos?
Investigaremos a presença ou ausência de
relação linear sob dois pontos de vista:
6
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 6
5.2. IDEIA INTUITIVA DE CORRELAÇÃO

Quando se observa um diagrama de dispersão, intuitivamente é-se levado a afirmar que existe
ou não existe possibilidade de qualquer relação entre as variáveis.

7
7
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 7
5.2. IDEIA INTUITIVA DE CORRELAÇÃO

Se os pontos se concentram à volta de uma linha recta ou à volta de uma curva


( parábola), por exemplo, é porque existirá uma relação entre as variáveis.

Quando existe alguma ligação de dependência entre duas variáveis diz-se que
existe uma correlação entre elas.

No caso da ausência de qualquer relação entre dois fenómenos, esses fenómenos


dizem-se independentes.

8
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 8
Objectivo

Investigar a presença ou ausência de relação linear sob dois


pontos de vista:
a) Quantificando a força dessa relação: correlação.
b) Explicitando a forma dessa relação: regressão.

Representação gráfica de duas variáveis quantitativas:


Diagrama de dispersão

9
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 9
5.3. COEFICIENTE DE CORRELAÇÃO
 O objectivo do estudo da correlação é verificar se existe, ou não, relação entre os
fenómenos em estudo, e avaliar o grau dessa relação.
Só se estudarão as correlações lineares, ou seja, aquelas em que se procura avaliar a
relação das variáveis quando a nuvem de pontos se condensa em torno de uma recta.
É o caso dos diagramas de dispersão anteriores, com excepção do A e do F.
Intuitivamente observa-se a existência, ou não, da correlação linear entre as variáveis.
Para quantificar essa correlação Pearson propôs o coeficiente de correlação lineare
de pearson, que se representa por ou e é definido por:

11
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 10
5.3. COEFICIENTE DE CORRELAÇÃO
  (∑ 𝑥 )(∑ 𝑦 )
∑ 𝑥𝑦 −
𝑛
𝑟= ( 1)
2 2

√(∑ 𝑥 2

(∑
𝑛
𝑥)
)(∑ 𝑦 2

(∑
𝑛
𝑦)
)
 
O valor de r varia no intervalo .

É uma medida que avalia o quanto a “nuvem de pontos”


no diagrama de dispersão aproxima-se de uma reta.

12
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 11
Algumas situações que podem se apresentar os diagramas
de dispersão

ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 12 13
Interpretações: avaliar o grau da relação
COEFICIENTE DE CORRELAÇÃO
CORRELAÇÃO
r=1 Perfeita positiva
0,8 Forte positiva
0,5 r 0,8 Moderada positiva
0 r 0,1 Íntima
Íntima positiva
positiva
rr =
=00 Nula
Nula
- 0,1 r 0 Íntima
Íntima negativa
negativa
-0,5 r Fraca negativa
Fraca negativa
-0,8 r Moderada negativa
Moderada negativa
-1 Forte negativo
Forte negativo
r= -1 Perfeita negativa
r= -1 Perfeita negativa
14
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 13
Observação 2

 Correlação não é o mesmo que causa e efeito. Duas variáveis podem estar altamente
correlacionadas e, no entanto, não haver relação de causa e efeito entre elas.
  Se duas variáveis estiverem amarradas por uma relação de causa e efeito elas estarão,
obrigatoriamente, correlacionadas.
  O estudo de correlação pressupõe que as variáveis X e Y tenham uma distribuição
normal.
  A palavra simples que compõe o nome correlação linear simples, indica que estão
envolvidas no cálculo somente duas variáveis.
  O coeficiente de correlação linear de Pearson mede a correlação em estatística
paramétrica.
 

15
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 14
5.4. Exercícios práticos:
De acordo com a tabela seguinte, calcule o coeficiente de correlação de pearson. 
   
 Empresa Gastos em publicidade(Milhares de kwanzas) Vendas (Milhares de kwanzas)

A 1 15
 
B 1,5 25

C 0,8 20

D 1,3 80

E 5 66

F 15 200
G 40 850
H 2 22

I 25 486
J 20 580

15
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 15
Resolução:

1 15 1 225 15
1,5 25 2,25 625 37,5
0,8 20 0,64 400 16 Aplicando a formula:
1,3 80 1,69 6 400 104
5 66 25 4 356 330   (∑ 𝑥 )(∑ 𝑦 )
∑ 𝑥𝑦 −
15 200 225 40 000 3 000 𝑛
𝑟=
40 850 1600 722 500 34 000 2 2

2
25
22
486
4
625
484
236 196
44
12 150
√( ∑ 𝑥2−
(∑ 𝑥 )
𝑛 )(∑ 𝑦2 −
(∑ 𝑦 )
𝑛 )
20 580 400 336 400 11 600
111,6 2344 2884,58 1 347 586 61 296,5

16
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 16
Resolução:

  111,6 ∙ 2344
∑ 61 296,5 − 10
𝑟=
( 111,6 )2 ( 2344 )2
√( 2884,58 −
10 )( 1 347 586 −
𝑛 )
𝑟=0,971 452 4494
 

  Vem

17
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 17
5.4.Vantagem do conhecimento da recta de regressão

O objectivo da correlação é verificar se existe relação entre os fenómenos em


estudo e avaliar o grau dessa relação. Se se concluir que existe dependência entre
as variáveis, haverá interesse em determinar uma estimativa do valor de uma das
variáveis conhecida ou valor da outra. Para isso usa-se a recta de regressão.
No caso da representação gráfica da recta de regressão da figura seguinte tem-se ,
por exemplo:

18
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 18
5.5. RECTA DE REGRESSÃO

Observe-se o seguinte diagrama de dispersão e a recta r .

 Odigrama de dispersão evidencia uma correlação negativa forte entre as variáveis


X e Y. A recta a que se chama recta de regressão, é o modelo matemático que
descreve a variação de y à média que x varia.

19
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 19
5.5.2. RECTA DE REGRESSÃO

- ao valor 2 da variável X corresponde a estimativa de 0,22 para a variável Y;


- ao valor 3 da variável x corresponde a estimativa de 0,19; para a variável y;
- ao valor 4 da variável x corresponde a estimativa de 0,16; para a variável y.

20
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 20
5.5.3.Representação da recta de regressão

• Método gráfico

A recta de regressão tem uma equação bem definida mas pode obter-se uma boa
aproximação da recta por um método gráfico. Este método consiste em, por
exemplo, utilizando uma régua transparente, traçar uma recta de modo que a soma
dos desvios dos pontos da nuvem em relação aos correspondentes da recta seja
menor possível .

21
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 21
5.5.2.Representação da recta de regressão

• Método algébrico
 A recta tem de equação uma expressão do tipo:
Prova-se que a recta contém o ponto de coordenadas centro de gravidade da
nuvem de pontos, e que o declive da recta é dado pela fórmula :

 Conhecido um ponto e o declive determina-se a equação da recta pela fórmula . O declive da


recta tem o sinal do coeficiente da correlação. Ao declive da recta também se chama o
coeficiente de regressão.

22
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 22
5.5.4. Exemplo

Sobre a mesma matéria uma turma foi avaliada, em seis testes, por dois professores
diferentes . Os resultados médios estão indicados na tabelas seguinte (notas 0 a 20 ) .

Prof. A 12,0 10,6 18,0 8,0 14,0 9,5 x

Prof. B 15,0 13,6 15,5 5,8 13,5 12,3 y

 1.1.Representa o diagrama de dispersão(nuvem de pontos)


1.2.Calcule o coeficiente de correlação.
1.3. Calcule .
1.4. Obtenha a equação da recta de regressão ( a e b com duas casas decimais)

23
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 23
PROBLEMAS RESOLVIDOS
Diagrama de dispersão
20

15

Notas Prof B
10

0
6 8 10 12 14 16 18 20
Notas Prof A
  (∑ 𝑥 )(∑ 𝑦 )
∑ 𝑥𝑦 −
𝑛
12,0 15,0 144,0 225 180
𝑟=
2 2

√(
10,6 13,6 112,36 184,96 144,16
(∑ 𝑥 ) (∑ 𝑦 )
18,0

8,0
15,5

5,8
324

64
240,25

33,64
279

46,4
∑ 𝑥2−
𝑛 )(∑ 𝑦2 −
𝑛 )
14,0 13,5 196 182,25 189
 
9,5 12,3 90,25 151,29 116,85
0,72 (2 c.d) Moderada positiva

24
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 24
PROBLEMAS RESOLVIDOS

 1.4. Recta de regressão


P

Recta: )

25
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 25
5.5.5. EXERCÍCIOS DE APLICAÇÕES

2. Considerem-se os conjuntos de dados:


A. x 1 2 3 3 4 5 6 6 7 7 8 9
y 7 9 6 8 4 4 3 6 1 4 3 2

x 1 2 2 3 4 5 6 8 8 9
B. y 8 7 9 7 5 5 4 2 3 1

2.1. Represente os dados de cada uma das tabelas atravás de um diagrama


de dispersão.
2.2. Indique o sinal de cada uma das correlações e especifique qual delas é
mais forte.

26
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 26
5.5.3. EXERCÍCIOS DE APLICAÇÕES

3.Indique , justificando, o valor lógico de cada uma das afirmações:


3.1. Uma alta correlação linear entre duas variáveis prova que as mudanças numa delas causa,
frequentemente, mudanças na outra.

3.2. A não existência de correlação linear entre duas variáveis prova que as duas variáveis não
estão relacionadas de qualquer modo.

27
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 27
Resolução

2.1 10 B
8 A 10
6
5
Y

Y
4
2 0
0 0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10
x X

2.2. As correlações são ambas negativas pois, em geral, quando uma das variáveis aumenta a outra
diminui, e reciprocamente.
A correlação dos dados da tabela (B) é mais forte do que a dos dados da tabela (A) . Para chegar a esta
conclusão, basta verificar que os pontos do diagrama referente a (B) estão mais próximos de uma recta
imaginária (recta de regressão) do que os pontos do diagrama referente a (A) .

28
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 28
Resolução
 3.
1. Verdade
verifica-se um bom ajuste entre uma recta e a nuvem de pontos, pelo que as mudanças
da variável x implicam , frequentemente, mudanças na variável y , e reciprocamente.

3.2. Falsidade a correlação linear avalia apenas a existência ou não existência de relações
lineares entre as variáveis . Logo, se as variáveis estiverem relacionadas de forma não linear
pode existir relação entre elas.

29
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 29
Exercícios
4.Trinta estudantes do ensino médio foram submetidos a uma pesquisa que relaciona o tempo
gasto na Internet e as notas médias (NM) deles. Os resultados são apresentados na seguinte
tabela. X representa a quantidade de tempo gasto na Internet semanalmente e Y é a NM do
estudante.
Horas NM Horas NM Horas NM

11 2,84 9 2,85 25 1,85


5 3,20 5 3,35 6 3,14
22 2,18 14 2,60 9 2,96 4.1. Construa um gráfico de dispersão dos
23 2,12 18 2,35 20 2,30 dados.
20 2,55 6 3,14 14 2,66 4.2. Ajustar uma linha recta aos dados e
20 2,24 9 3,05 19 2,36
10 2,90 24 2,06 21 2,24 determinar a e b.
19 2,36 25 2,00 7 3,08
15 2,60 12 2,78 11 2,84
18 2,42 6 2,90 20 2,45

29
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 30
Exercícios
 5.1. Mostre que a equação de uma recta que passa pelos pontos (,) e (,) é dada por :

5.2. Determine a equação de uma recta que passa pelos pontos

5.3. Uma plantação de trigo cresce em 9 terrenos de mesmo tamanho. A quantidade de fertilizante
colocada em cada terreno é apresentada na seguinte tabela juntamente com a produção de trigo.

Quantidade de trigo Fertilizante


2,4 1,2
3,4 2,3
4,4 3,3
5,1 4,1  
Use o MINITAB para ajustar a curva
5,5 4,8
5,2 5,0 parabólica + aos dados.
4,9 5,5
4,4 6,1
3,9 6,9

29
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 31
Exercícios
  Determine :
6.
6.1. a inclinação;
6.2. a equação;
6.3. a interseção com Y e
6.4. a interseção com X da recta que passa pelos pontos

 7. Determine a equação de uma recta que passa pelo ponto e que é paralela à recta

8. Determine a equação de uma recta cuja inclinação é e cuja interseção com Y é 16.

9.1. Construa uma recta que se ajuste aos dados na seguinte tabela.
9.2. Determine uma equação para essa recta.

X 1 3 4 6 8 9 11 14
Y 1 2 4 4 5 7 8 9
30
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 32
Exercícios
10. A tabela seguinte mostra as alturas e os pesos, arredondados para centímetro e quilograma
de uma amostra de 12 estudantes do sexo masculino, obtida aleatoriamente entre os do primeiro
ano de uma escola estadual.

Peso x (kg) 70 63 72 60 66 70 74 65 62 67 65 68
Altura Y (cm) 155 150 180 135 156 168 178 160 132 145 139 152

 a. Construa um diagrama de dispersão dos dados.


b. Trace uma recta , que se ajuste aos dados.
c. Escolhendo dois pontos quaisquer da recta traçada em (b) , tais como P e Q , por exemplo. As coordenadas destes
pontos, obtidas do gráfico , são aproximadamente Determine a equação da recta traçada em b.
d. Estime a altura de um estudante, cujo peso conhecida é de 63 kg.
e. Estime o peso de um estudante cuja altura conhecida é de 168 cm.

30
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 33
Resolução

Obrigado !

30
ESTATÍSTICA I
12/22/2020
PAULO TEKA ISPTE 17/08/2016 C
12/22/2020 34

Você também pode gostar