Estatística Não Paramétrica - Testes Envolvendo Duas Amostras Independentes

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 36

MAT02282 - ANÁLISE ESTATÍSTICA

NÃO PARAMÉTRICA

TESTES ENVOLVENDO DUAS


AMOSTRAS INDEPENDENTES

1 Profª. Lisiane Selau


Testes para duas amostras
independentes

• Teste de Kolmogorov-Smirnov para duas amostras

• Teste U de Mann-Whitney

2 Profª. Lisiane Selau


Teste de Kolmogorov-Smirnov (KS)
para duas amostras

• O teste de Kolmogorov-Smirnov de duas amostras verifica se


elas foram extraídas da mesma população.

• Assim como no teste para uma amostra, o teste diz respeito


à concordância entre duas distribuições acumuladas.

• A diferença é que o teste de uma amostra se refere à


concordância entre a distribuição de valores amostrais e
alguma distribuição teórica especificada, enquanto o teste
de duas amostras se refere à concordância entre duas
distribuições amostrais.

3 Profª. Lisiane Selau


• Se as duas amostras foram efetivamente extraídas da
mesma população, então, pode-se esperar que as
distribuições acumuladas de ambas as amostras estejam
próximas uma da outra.

• O fato de as distribuições acumuladas das duas amostras


serem “distantes” uma da outra sugere que as amostras
provêm de populações diferentes.

• Então, uma distância grande (em algum ponto do espaço


amostral) pode ser uma evidência para rejeitar H0.

4 Profª. Lisiane Selau


• Escala de medida: quantitativa contínua. Pode ser aplicado
para variável qualitativa ordinal ou quantitativa discreta, mas,
nestes casos, o teste é conservativo.

• Suposições do teste: as observações constituem o resultado


de duas amostras aleatórias independentes. Uma amostra
de tamanho n extraída de uma população com distribuição Fx(x)
e uma outra amostra de tamanho m extraída de uma população
com distribuição Fy(y). As distribuições Fx(x) e Fy(y) são
desconhecidas.

• Hipóteses:
H0 : amostras foram selecionadas da mesma população

 H1 : amostras foram selecionadas de populaçõesdistintas
OBS: as hipóteses podem ser adaptadas para um teste unilateral.

5 Profª. Lisiane Selau


• Estatística do Teste:

D = Max [|Sx(x) – Sy(y)|]

onde Sx(x) é a função distribuição acumulada da amostra


(X1,X2,...,Xn) e Sy(y) é a função distribuição acumulada da
amostra Y1, Y2, ...,Ym. Note que D é uma variável discreta que
assume valores entre 0 e 1. O número de possíveis valores D
depende de n1 e n2.

• Distribuição da ET sob H0: a distribuição amostral de D é


conhecida (Smirnov, 1948; Massey, 1951), estando tabeladas
as probabilidades associadas à ocorrência de valores tão
grandes quanto um D observado sob a hipótese nula (de que
as duas amostras tenham vindo da mesma distribuição).
6 Profª. Lisiane Selau
• Aplicação:

Ordenam-se as n + m observações de forma crescente.

Considera-se os estimadores Sx e Sy de Fx e Fy, isto é:

Sx(x) = kx/n e Sy(y) = ky/m

onde kx = número de valores Xi ≤ x;

ky = número de valores Yj ≤ y;

Define-se: D = max |Sx(x) – Sy(y)|

Rejeitamos H0, ao nível  de significância se:

D= max |Sx(x) – Sy(y)| ≥ D, onde P(D ≥ D) = 


7 Profª. Lisiane Selau
Exemplo: dois tipos de solução química, A e B, foram
ensaiadas para a determinação do PH (grau de acidez da
solução). As análises de 10 amostras de cada solução estão
apresentadas abaixo. Com base nestes dados pode-se concluir
que existe diferença quanto ao grau de acidez entre os dois
tipos de solução?
A B
7,49 7,37 7,28 7,48
7,35 7,51 7,35 7,31
7,54 7,50 7,52 7,22
7,48 7,52 7,50 7,41
7,48 7,46 7,38 7,45

H0 : A e B com mesmo grau de acidez



H1 : A e B com diferente grau de acidez

8 Profª. Lisiane Selau


Valores Amostra SA(a) SB(b) |SA(a) – SB(b)|
7,22 B 0 0,1 0,1
7,28 B 0 0,2 0,2
7,31 B 0 0,3 0,3
7,35 AB 0,1 0,4 0,3
7,37 A 0,2 0,4 0,2
7,38 B 0,2 0,5 0,3
7,41 B 0,2 0,6 0,4
7,45 B 0,2 0,7 0,5
7,46 A 0,3 0,7 0,4
7,48 AAB 0,5 0,8 0,3
7,49 A 0,6 0,8 0,2
7,5 AB 0,7 0,9 0,2
7,51 A 0,8 0,9 0,1
7,52 AB 0,9 1 0,1
7,54 A 1 1 0
0,5
9 Profª. Lisiane Selau
ET = D = diferença máxima entre as distribuições A e B = 0,5

Região crítica: Considerando =0,05 (teste bilateral) e n=m=10

n = 10 (linha) e m = 10 (coluna) e =0,05 (2º valor do bloco)

Rejeitamos H0 se nmD  c0,05

10*10*0,5 = 50 < c0,05 = 70  Não se rejeita H0.

p-valor: Na tabela, como c0,10 = 60, sabemos que p-valor > 0,10.

Conclusão: Considerando  de 5%, concluímos que os dois


tipos de solução podem ter o mesmo grau de acidez.
10 Profª. Lisiane Selau
No R

> a <- c(7.49,7.35,7.54,7.48,7.48,7.37,7.51,7.50,7.52,7.46)


> b <- c(7.28,7.35,7.52,7.50,7.38,7.48,7.31,7.22,7.41,7.45)
> ks.test(a, b)

Two-sample Kolmogorov-Smirnov test

data: a and b
D = 0.5, p-value = 0.1641
alternative hypothesis: two-sided

Warning message:
In ks.test(a, b) :
não é possível computar o valor de p exato com o de desempate
11 Profª. Lisiane Selau
No SPSS

 Analyze
 Nonparametric Tests
 Legacy Dialogs
 2 Intependent Samples ...

12 Profª. Lisiane Selau


No SAS
data acidez;
input amostra $ acidez;
datalines;
A 7.49
A 7.35
A 7.54
A 7.48
A 7.48
A 7.37
A 7.51
A 7.5
A 7.52
A 7.46
B 7.28
B 7.35
B 7.52
B 7.5
B 7.38
B 7.48
B 7.31
B 7.22
B 7.41
B 7.45
;

ods graphics on;


proc npar1way edf plots=edfplot data=acidez d;
class amostra;
var acidez;
run;
ods graphics off;
13 Profª. Lisiane Selau
Exercício: Compare os grupos de pacientes com
Trompocitopenia e leucemia aguda que foram aleatorizados em
um experimento duplamente cego. Neste experimento, os
pacientes foram tratados com platelets ou plasma com
reduzido platelet como profilaxia contra hemorragia. Os dados
a seguir apresentam a contagem de platelets durante o estudo
em indivíduos dos dois grupos. Calcule o valor da ET e
compare com o produzido pelo software. Utilize =0,05 e
apresente a decisão estatística e a conclusão do teste.

Platelets= c(20.3, 22.53, 25.70, 13.23, 29.67, 24.46, 19.35,


17.81, 16.00, 13.50, 32.90, 26.07)

Plasma= c(10.56, 28.13, 19.94, 11.03, 8.09, 12.95, 32.50,


10.90, 21.14)
D = 0.5556 p-value = 0.06063

14 Profª. Lisiane Selau


Exercício: Lepley comparou o aprendizado serial de 10 alunos da
sétimo grau com o aprendizado serial de 10 alunos do décimo primeiro
grau, para comprovar a hipótese de que o efeito de primazia é menos
predominante no aprendizado de estudantes mais jovens. O efeito de
primazia é a tendência para reter a matéria aprendida no começo de
determinada série mais facilmente do que a matéria aprendida no fim
daquela série. Lepley comprovou sua hipótese comparando a
percentagem de erros cometidos pelos dois grupos na primeira metade
da série, prevendo que o grupo mais velho (alunos do décimo primeiro
grau) cometeria relativamente menos erros do que o grupo mais jovem,
ao evocar a primeira metade da série.
Alunos do Alunos do
sétimo grau undécimo grau
39,1 35,2
41,2 39,2
45,2 40,9
46,2 38,1
48,4 34,4 D = 0,7
48,7 29,1 p-valor = 0,012
55,0 41,8
40,6 24,3
52,1 32,4
15 47,2 32,6 Profª. Lisiane Selau
Exercício: Amostras de n1 = n2 = 50 valores das opiniões de
diretores financeiros de grandes e pequenas empresas
mostraram os resultados da tabela seguinte, medidos em uma
escala Likert de 5 pontos:

Escala Grandes Pequenas


1 5 15
2 8 13
3 10 10
4 15 8
5 12 4
Total 50 50

Teste a hipótese de que opiniões dos diretores dos dois


tipos de empresa são divergentes.

D = 0.3 p-value = 0.022

16 Profª. Lisiane Selau


Exercício: Em um estudo dos corrrelatos da estrutura da personalidade autoritária
formulou-se a hipótese de que as pessoas com alto grau de autoritarismo
apresentariam maior tendência para possuir estereótipos sobre membros de
diversos grupos nacionais e étnicos, do que pessoas com baixo grau de
autoritarismo. A hipótese foi comprovada em um grupo de 98 estudantes
universitárias selecionadas ao acaso. Cada uma recebeu 20 fotografias e foi
solicitada a “identificar” aquelas cuja nacionalidade reconhecia, “casando” a
fotografia apropriada com o nome do grupo nacional. Não havia restrição quanto ao
número de fotos que pudessem identificar pelo processo descrito. Acontece que
(sem que as estudantes soubessem) todas as fotos eram de pessoas de
nacionalidade mexicana - ou candidatos à legislatura mexicana ou vencedoras de
um concurso de beleza mexicana; e como a lista de 20 nacionalidades não incluía a
nacionalidade mexicana, o número de fotos que cada um identificasse constituiria
um índice de sua tendência à estereotipia. O grau de autoritarismo, medido pela
escala F (de Adorno et al., 1950), foi classificado como “alto” ou “baixo”. Escores
considerados altos foram os situados acima da mediana e baixos os situados abaixo
da mediana.
Número de fotos
identificadas Escores baixos Escores altos
0-2 11 1 D = 0,406
3-5 7 3 p-valor = 0,000
6-8 8 6
9 - 11 3 12
12 - 14 5 12
15 - 17 5 14
17 18 - 20 5 6 Profª. Lisiane Selau
Teste U de Mann-Whitney

• Adequado para verificar se duas amostras independentes


foram extraídas de uma mesma população.

• Trata-se de uma alternativa do teste t paramétrico, quando


o pesquisador não atende as suposições exigidas por este
último, ou quando a mensuração atingida é inferior à escala
de intervalos.

• Também é referido na literatura por teste de Wilcoxon-Mann-


Whitney.

18 Profª. Lisiane Selau


• Escala de medida: no mínimo escala ordinal.

• Suposições do Teste: as observações constituem o


resultado de duas amostras aleatórias independentes,
uma de tamanho n1 (X1,X2,...,Xn1) extraída de uma população
com distribuição Fx(x) e a outra de tamanho n2 (Y1, Y2, ...,Yn2)
extraída de uma população com distribuição Fy(y). As
distribuições Fx(x) e Fy(y) são desconhecidas. Note que os
tamanhos amostrais não necessitam ser iguais.

• Hipóteses:

H0 : as duas amostras foram selecionad as da mesma população



H1 : as duas amostram foram selecionad as de populações distintas

OBS: as hipóteses podem ser adaptadas para um teste unilateral.


19 Profª. Lisiane Selau
• Estatística do Teste – Método U: a estatística do teste será
chamada de U e para seu cálculo considere n1 e n2 os
tamanhos das duas amostras onde n2  n1.
i) colocar as observações das duas amostras, conjuntamente, em
ordem crescente.
Exemplo: um novo treinamento para a execução de determinada
tarefa está sendo investigado. O tempo de execução da tarefa foi
observado em duas amostras: indivíduos treinados e indivíduos
controle (que não fizeram o treinamento).
Grupo de indivíduos treinados: 9, 11, 15
Grupo de indivíduos controle: 6, 8, 10, 13

tempos 6 8 9 10 11 13 15
grupos C C T C T C T

20 Profª. Lisiane Selau


ii) Calcular U1: para o menor valor observado da amostra de
tamanho n1 contar o número de observações da amostra de
tamanho n2 que precede esta observação. Anotar este valor.
Repetir para todas as outras observações da amostra de
tamanho n1. Chame de U1 a soma dos valores anotados.

iii) note que o valor de U1 varia de 0 até n1*n2.

iv) Calcular U2: fazendo raciocínio análogo (contar o número de


observações da amostra de tamanho n1 que precedem cada
observação da amostra de tamanho n2) ou, observando que
U1+U2=n1*n2 e, portanto U2=n1*n2-U1

v) Obter a ET: calcule U = min { U1 , U2 }

tempos 6 8 9 10 11 13 15 U1= 2+3+4 = 9


U2 = 0+0+1+2 = 3
grupos C C T C T C T U=min{9,3}=3
21 Profª. Lisiane Selau
A Tabela – para amostras pequenas
• Para n1 e n2 no máximo iguais a 8, pode-se utilizar a tabela
para determinar a probabilidade exata associada à
ocorrência, sob H0, de qualquer U tão extremo quanto o valor
observado.
• A tabela é constituída de subtabelas, uma para cada valor de
n2, de n2 = 3 a n2 = 8. Para determinar a probabilidade, sob
H0, associada aos dados é necessário saber o valor de n1,
de n2 e de U.
• No exemplo, tem-se: n1 = 3, n2 = 4 e U = 3. A subtabela para
n2 = 4 mostra que, para n1 = 3, U  3 tem probabilidade de
ocorrência, sob H0, de 0,20, ou seja, p-valor = 0,20.
• As probabilidades fornecidas na tabela são unilaterais. Para
um teste bilateral, deve-se duplicar o valor de p constante na
22
tabela.
Profª. Lisiane Selau
No R

> n1=3
> n2=4 U 0 1 2 3 4 5 6
F(u) 0,028 0,057 0,114 0,200 0,314 0,429 0,571
> u=seq(0,n1*n2)
f(u) 0,028 0,028 0,057 0,085 0,114 0,114 0,142
> fu=dwilcox(u,n1,n2)
> Fu_e=pwilcox(u,n1,n2)
> Fu_d=1-pwilcox(u-1,n1,n2)
> cbind(u,fu,Fu_e,Fu_d)

Wilcoxon rank sum test

> t=c(9,11,15)
data: y and x
> c=c(6,8,10,13)
W = 3, p-value = 0.4
> wilcox.test(t,c,exact=T) alternative hypothesis: true location shift is not equal to 0
23 Profª. Lisiane Selau
No SPSS

 Analyze
 Nonparametric Tests
 Legacy Dialogs
 2 Intependent Samples ...

24 Profª. Lisiane Selau


No SAS

data tempo;
input grupo $ tempo;
datalines;
C6
C8
C 10
C 13
T9
T 11
T 15
;

ods graphics on;


proc npar1way wilcoxon correct=no plots=all data=tempo;
class grupo;
var tempo;
exact wilcoxon;
run;
ods graphics off;
25 Profª. Lisiane Selau
A Tabela – para amostras médias

• Quando 9n220, a tabela apresenta apenas os valores


críticos de U para os níveis de significância de 0,001, 0,01,
0,025 e 0,05 (unilateral) ou 0,002, 0,02, 0,05 e 0,10
(bilateral).

• Se um valor U calculado, para n120 e n2 entre 9 e 20, não


supera o valor dado na tabela, pode-se rejeitar H0, a um dos
níveis de significância indicados no cabeçalho da tabela.

• Por exemplo, se n1=6 e n2=13, um valor de U12 permite


rejeitar H0 ao nível de =0,01 em uma prova unilateral e
rejeitar H0 ao nível =0,02 em uma prova bilateral.

26 Profª. Lisiane Selau


Outra maneira de calcular U – útil para amostras médias ou caso de
empates
i) Colocar as observações das duas amostras em ordem crescente.
Atribuir postos às observações, atribuindo o posto médio em caso de
empates.
ii) Calcular U1 = n1n2 + n1(n1+1)/2 – R1, onde R1 = soma dos postos
atribuídos ao grupo cujo tamanho de amostra é n1
iii) Calcular U2 = n1n2 + n2(n2+1)/2 – R2, onde , R2 = soma dos postos
atribuídos ao grupo cujo tamanho de amostra é n2
iv) O valor da estatística U será: U=min{U1,U2}
v) Note que (R1 + R2) = N(N+1)/2 , sendo N = n1 + n2
vi) Lembre que U1+U2=n1n2
Obs: as duas maneiras de calcular a estatística U apresentadas fornece valor
idêntico no caso de não haver empates.
tempos 6 8 9 10 11 13 15
U1= 12+3*4/2-15 = 3
grupos C C T C T C T U2= 12+4*5/2-13 = 9
posto 1 2 3 4 5 6 7 U=min{9,3}=3
27 Profª. Lisiane Selau
 Distribuição Assintótica: Decorrente do teorema central do limite,
a distribuição de probabilidade da estatística U se aproxima da
distribuição N (µU ; U2) quando n1 e n2 tendem a infinito, onde
n1  n2 n  n  n1  n2  1
μU  σU2  1 2
2 12
Como U é uma estatística que assume apenas valores discretos e a
distribuição normal é uma distribuição para variáveis contínuas é
aconselhável utilizar uma correção de continuidade. Neste caso
utiliza-se
Z
U  μU   0,5
σU
No caso de haver observações empatadas é necessário utilizar
uma correção para empates. Neste caso a variância será
 n1n2  N3  N 
σ  
2
U 
 NN  1  12
  T   T   t 3
t 

sendo t = número de observações empatadas em cada posto e


N=n1+n2. A correção para empates é necessária pois a distribuição
de U é determinada supondo não haver empates.
28 Profª. Lisiane Selau
• Estatística do Teste – Método W: a estatística do teste será
chamada de W e para seu cálculo considere n1 e n2 os
tamanhos das duas amostras onde n2  n1.
i) Colocar as observações das duas amostras, conjuntamente, em
ordem crescente. Atribua postos às observações em conjunto.
ii) Calcular W1: soma dos postos da amostra 1
ii) Calcular W2: soma dos postos da amostra 2
ii) Obter a ET: calcule W = min { W1 , W2 }
Exemplo: um novo treinamento para a execução de determinada tarefa
está sendo investigado. O tempo de execução da tarefa foi observado
em duas amostras: indivíduos treinados e indivíduos controle (que não
fizeram o treinamento.
tempos 6 8 9 10 11 13 15 W1= 3+5+7 = 15
W2 = 1+2+4+6 = 13
grupos C C T C T C T
W = min{15,13} = 13
29 postos 1 2 3 4 5 6 7 Profª. Lisiane Selau
Exercício: Cinco ratos foram treinados para imitar ratos líderes
em um labirinto. Foram treinados para seguir seus líderes
quando estivessem com fome, a fim de atingir o alimento. Em
seguida, os cincos ratos (um de cada vez) foram transferidos
para um labirinto com situações de choque. O rato que imitasse
o rato líder chegaria ao alimento evitando o choque. O
experimento foi repetido 10 vezes com cada rato. Para cada um
dos cinco ratos treinados foi observado o número de tentativas
total (nas 10 repetições) até chegar ao alimento sem levar
choque. O mesmo experimento foi realizado com 4 ratos
controle (que não foram treinados para seguir o líder). Os
dados são apresentados no quadro abaixo.

Ratos Experimentais 78 64 75 45 82
Ratos Controle 110 70 53 51

W=9 p-value = 0.9048


30 Profª. Lisiane Selau
Exercício: Deseja-se verificar se, na população de mulheres, a
presença de carcinoma invasor altera o Escore 1 A
(percentagem de células tipo 1 A). Participaram do estudo 9
mulheres sem carcinoma (grupo de controles) e 8 com
carcinoma (grupo de casos). O valor do escore 1ª é
apresentado na tabela abaixo. Utiliza =0,05.
Controles Casos (com carcinoma)
Pac.n° Escore1A Postos Pac.n° Escore1A Postos
1 7 6 10 0 1,5
2 8 7,5 11 0 1,5
3 12 9 12 1 3
4 13 10 13 2 4
5 20 13 14 6 5
6 23 14 15 8 7,5
7 25 15 16 14 11
8 34 16 17 19 12
9 36 17
n2 = 9 R2 = 107,5 n1 = 8 R1 = 45,5
md = 20 md = 4

31 W = 9.5 p-value = 0.01225 Profª. Lisiane Selau


Homens Mulheres
Exercício: os dados Grau
Posto
Grau
Posto
Ansiedade Ansiedade
apresentados na 13 17
12 16
tabela são 12 15
resultados de uma 10 15
10 15
pesquisa conduzida 10 14
10 14
para comparar o 9 14
8 13
grau de ansiedade 8 13
entre homens e 7 13
7 12
mulheres. O escore 7 12
7 12
utilizado indica que 7 12
6 11
quanta maior o valor 11
10
observado maior o 10
nível de ansiedade. 10
8
8
W = 64, p-value = 0.0005891 6
n1 =16 n2 = 23
32 Profª. Lisiane Selau
Exercício: Um grupo de 5 adolescentes, escolhidos ao acaso,
examina durante 10 minutos, uma relação de nomes de objetos
concretos. Em seguida, cada adolescente procura recompor, de
memória e por escrito, a relação original, com a única restrição de que
o tempo para essa tarefa seria igual para todos. Outro grupo,
composto de 4 adolescentes, também escolhidos aleatoriamente,
examina a mesma relação durante 5 minutos e tenta, a seguir, da
mesma forma que o primeiro grupo, reproduzir a lista de memória. A
este grupo foi dado o mesmo tempo que o primeiro.

Grupo 1 Grupo 2
(5 minutos) (10 minutos)
12 10
19 14
8 15
W = 8, p-value = 0.7302
25 9
18
33 Profª. Lisiane Selau
Exercício: Suponha que um sociólogo está interessado nas
atitudes de mulheres que possuem um emprego e mulheres
que não possuem um emprego fora de casa. Duas amostras de
cada tipo foram escolhidas e foi aplicado um teste de atitude.
Mulheres com Mulheres sem
emprego externo emprego externo
1 19 16
2 22 18
3 26 21
4 32 26
5 34 27
6 37 29
7 40 31
8 42 33
9 43 38
10 46 39

34
W = 28.5, p-value = 0.1123
Profª. Lisiane Selau
Exercício: Um professor aplicou o Tratamento A Tratamento B
(Chamados por (Chamados pelo
seguinte procedimento a uma classe você) nome)
de 30 alunos. Vinte e um deles 6,5 6,5
8,0 3,5
foram chamados pelo nome, durante 8,5 6,0
um semestre sempre que tivessem 10,0 7,5
8,5 6,0
que apresentar as tarefas de casa e 4,0 3,0
7,0 7,0
os restantes nove foram tratados por 6,0 5,5
você. Este professor estava 5,5 6,5
6,0
supondo que estimulado pelo 6,5
próprio nome o aluno seria capaz de 5,0
5,0
melhorar o seu desempenho 6,0
acadêmico, mensurado pela notas 3,5
6,5
médias semestrais. Teste ao nível 10,0
8,0
de 5% a hipótese do professor. 7,5
4,0
W = 57.5, p-value = 0.09661 5,0

35 Profª. Lisiane Selau


Exercício: Um psicólogo infantil quer investigar o
relacionamento entre o sexo de uma criança e o nível de
resposta a sinais de comunicação não-verbais (cues). O
psicólogo acredita que as meninas acertarão mais e desta
forma terão um escore menor, levando em consideração tanto a
acurácia quanto a profundidade da interpretação. Os resultados
abaixo foram obtidos testando dez meninos e dez meninas.
Use o teste U, a 5% de significância, para comprovar a
hipótese do pesquisador.
Menino Menina
1 10 7
2 13 8
3 15 9
4 16 11
W = 24, p-value = 0.05243 5 19 12
6 21 14
7 22 17
8 33 18
9 25 20
10 26 24
36 Profª. Lisiane Selau

Você também pode gostar