Delineamento de Experimentos 2012
Delineamento de Experimentos 2012
Delineamento de Experimentos 2012
\
|
= =
=
1
2
1
2
.
Para o entendimento da regra prtica considere um conjunto homogneo
de 20 animais e quatro dietas para a comparao das alteraes de pesos, cujos 5
animais de cada dieta foram escolhidos por processo randmico (sorteio). As dietas
estudadas foram:
A: dieta padro;
B: dieta padro suplementada com amendoim;
C: dieta padro suplementada com girassol;
D: dieta padro suplementada com abbora.
Os ganhos de peso(g) avaliados considerando a variao absoluta entre o
incio e o final do experimento, so apresentados na Tabela 2.1.
A Tabela 2.2 apresenta o resultado da estatstica descritiva dos dados:
Tabela 2.1 Ganhos de peso segundo dieta
Dieta A Dieta B Dieta C Dieta D
25 31 22 33
26 25 26 29
20 28 28 31
23 27 25 34
21 24 29 28
15
Delineamento de Experimentos
Tabela 2.2 Estatstica descritiva das dietas
Dieta A B C D
Mdia 23,0 27,0 26,0 31,0
Desvio padro 6,5 7,5 7,5 6,5
Portanto,
( ) ( ) 0 , 7 4 4 5 , 6 4 5 , 7 4 5 , 7 4 5 , 6 4
2
= + + + = =
pool
S QMRes .
Os resduos esto apresentados na Tabela 2.3.
Tabela 2.3 Resduos dos ganhos de peso segundo dieta
Resduo (e
ij
) Resduo Padronizado (z
ij
)
A B C D A B C D
2 4 -4 2 0,756 1,512 -1,512 0,756
3 -2 0 -2 1,134 -0,756 0,000 -0,756
-3 1 2 0 -1,134 0,378 0,756 0,000
0 0 -1 3 0,000 0,000 -0,378 1,134
-2 -3 3 -3 -0,756 -1,134 1,134 -1,134
O grfico bidimensional dos pares (ordem da observao; resduo
padronizado) est apresentado na Figura 2.1.
Em um estudo mais avanado de delineamento de experimentos,
recomenda-se aplicar o teste de Durbin-Watson.
2.4. Varincia Constante (Homocedasticidade)
Uma regra prtica indicada por DEAN & VOSS (1999) sugere pressupor
que os resultados de uma ANOVA sejam considerados vlidos desde que a maior
varincia no exceda em trs vezes a menor. BOX (1953) sugere que a maior varincia
no deva exceder em quatro vezes a menor. No nvel analtico, deciso mais objetiva
foram propostos diversos testes para a igualdade de varincias, destacando-se entre eles:
Cochran, Hartley, Bartlett e Levene. Em nosso caso, ser utilizado o teste de Hartley
16
Delineamento de Experimentos
que considera a razo entre a maior e a menor varincia, cuja estatstica do teste dada
pela distribuio F.
Ou seja,
H
0
: Varincias homogneas H
1
: Varincias Heterogneas
rejeio. h no cc ; H se - rejeita , Se : deciso de regra a com
min
max
0 ;
2 2
1
2 2
1
n) glnum;glde ( calc
en) (glnum;gld
k
k
F F
~ F
) ,...,S (S
) ,...,S (S
F
>
=
No exemplo:
. H rejeita se no portanto, ; 39 , 6 4 ento , 05 , 0
) 3 ( 15 , 1
6,5
7,5
) ,..., min(S
) ,..., max(S
0 ) 4 ; 4 ; 05 , 0 (
2
4
2
1
2
4
2
1
= = = =
< = = =
F
S
S
F
den num
o
2.5. Normalidade dos Erros
Um processo prtico consiste em fazer um grfico de probabilidades
normais (NORMAL PROBABILITY PLOT). O grfico de probabilidade normal
consiste em uma tcnica grfica que permite avaliar se existe ou no um conjunto de
dados que apresenta aderncia distribuio normal de probabilidades. Os dados so
plotados em um grfico cartesiano para verificar se os pontos formam uma reta
aproximada, levando-se em considerao que quanto mais afastados da reta situarem os
pontos, maior fuga da normalidade apresenta a situao. Os resduos padronizados (z
ij
)
so colocados no eixo das abscissas e os escores da distribuio normal padronizada
[valores esperados obtidos de ) (
i
F Z P s ] no eixo das ordenadas, para n i , , 1 = . A
cada i-simo resduo, associa-se a frequncia percentual acumulada emprica
n
i
F
i
) ( 100
2
1
) (
= %, em seguida calcula-se ) (
i
F Z P s .
Na presena da normalidade, os pontos ficaro em torno de uma reta que
passa pela origem e tem coeficiente angular 1. De maneira analtica, a hiptese de que a
distribuio dos erros normal pode ser colocada em teste utilizando-se os testes de
aderncia de: Kolmogorov-Smirnov(KS), Shapiro-Wilks(SW) e Qui-quadrado().
Em linhas gerais, o pesquisador no precisa preocupar-se com a no-
normalidade (o teste estatstico F bastante robusto, ou seja, pequenas transgresses
pressuposio de normalidade no afetam, substancialmente, o resultado da anlise de
varincia ANOVA, a menos que a distribuio dos erros tenha: i) curtose positiva; ii)
assimetria. Nesses dois casos, tm-se falsas rejeies (mais diferenas significantes do
que, na realidade, existem).
17
Delineamento de Experimentos
No exemplo, com 20 animais, tem-se ) 5 , 0 ( 5
20
) 5 , 0 ( 100
) (
=
= i
i
F
i
%,
fornecendo os seguintes resultados conforme Tabela 2.4.
Tabela 2.4 Resduos padronizados ordenados e escores esperados sob
normalidade (Distribuio Z)
Ordem ( i ) ij
Z (ordenado)
i
F (%) ( )
i
F Z P s
1 -1,512 2,5 -1,96
2 -1,134 7,5 -1,44
3 -1,134 12,5 -1,15
4 -1,134 17,5 -0,93
5 -0,756 22,5 -0,76
6 -0,756 27,5 -0,60
7 -0,756 32,5 -0,45
8 -0,378 37,5 -0,32
9 0,000 42,5 -0,19
10 0,000 47,5 -0,06
11 0,000 52,5 0,06
12 0,000 57,5 0,19
13 0,378 62,5 0,32
14 0,756 67,5 0,45
15 0,756 72,5 0,60
16 0,756 77,5 0,76
17 1,134 82,5 0,93
18 1,134 87,5 1,15
19 1,134 92,5 1,44
20 1,512 97,5 1,96
2.6. Tcnica da Anlise de Varincia (ANOVA)
Quando se tem um experimento completamente ao acaso com um fator
fixo (fonte de variao controlada em estudo), o interesse consiste em verificar a
influncia dos k nveis desse fator (k grupos ou k tratamentos) sobre uma varivel
dependente (resposta) biolgica Y em estudo. Uma maneira de verificar a existncia
18
Delineamento de Experimentos
dessa influncia do fator consiste em comparar as mdias populacionais da varivel Y
sob os nveis do fator (tratamento = agente causal).
Um teste estatstico para verificar a igualdade dessas k mdias relativas
aos nveis do fator consiste na tcnica da anlise de varincia (ANalysis Of VAriance,
ttulo em ingls que deriva a sigla ANOVA, utilizada na lngua inglesa e, muitas vezes
na lngua portuguesa). Embora o procedimento envolva o clculo de varincias, seu
objetivo fundamenta-se em comparar as mdias dos nveis do fator (tratamento).
A lgica da ANOVA para o delineamento inteiramente ao acaso muito
simples, ou seja, resume-se em fracionar a variabilidade total dos dados em duas fontes
de variao ortogonais entre si, sendo uma devido a variao entre os nveis do fator
(variao entre tratamentos) e outra, devido a variao dentro dos nveis (dentro de
tratamentos). Esta ltima tem a finalidade especfica de estimar a variao atribuda ao
acaso; enquanto a primeira, envolve a variao do acaso acumulada, devido aos nveis
de tratamento. Feito isso, determina-se a razo da variao entre os nveis e a variao
dentro dos nveis e, se o resultado obtido for muito grande a concluso estabelecida
a favor das diferenas entre as mdias dos nveis do fator (diferenas entre as mdias
dos tratamentos).
Deve ser considerado que para a utilizao da tcnica da ANOVA,
embora o entendimento da lgica seja muito fcil, algumas pressuposies devem estar
satisfeitas, quais sejam: independncia dos erros, normalidade dos dados e
homogeneidade de varincias; conforme ser mostrado a seguir a partir dos dados da
Tabela 2.5.
Considere um conjunto homogneo de 20 animais e quatro dietas para a
comparao das alteraes de pesos, cujos 5 animais de cada dieta foram escolhidos por
processo randmico (sorteio). As dietas estudadas foram:
A: dieta padro;
B: dieta padro suplementada com amendoim;
C: dieta padro suplementada com girassol;
D: dieta padro suplementada com abbora.
19
Delineamento de Experimentos
Tabela 2.5 Ganhos de peso segundo dieta
Dieta A Dieta B Dieta C Dieta D
25 31 22 33
26 25 26 29
20 28 28 31
23 27 25 34
21 24 29 28
23 (2,55)
(*)
27 (2,74) 26 (2,74) 31 (2,55)
(*)
mdia (desvio padro)
Cada ganho de peso uma resposta biolgica do modelo geral
ij i ij i ij
y c t c + + = + = , com k i ,..., 1 = (nmero de tratamentos) e r j ,..., 1 = (nmero
de repeties por tratamento), onde:
a mdia geral comum a todas as observaes definida como
=
=
k
i
i i
r
n
1
1
, sendo
i
a mdia populacional de Y no i-simo tratamento;
i
r o nmero de repeties no i-simo tratamento (no caso balanceado o valor comum
r para todos tratamentos);
i
t o efeito do i-simo nvel do fator na varivel dependente Y e mede o desvio da
mdia
i
em relao a , isto : t =
i i
;
ij
c o erro casual no observvel (em nosso estudo, varivel aleatrio independente e
identicamente distribuda como ( )
2
, 0 o N ).
Neste sentido, tem-se:
a) ( )
i i ij
Y E t = + =
b) ( )
2
o = =
ij
Y Var
c) ( )
2
, ~ o
i ij
N Y
Considerando satisfeitas as suposies de independncia dos erros,
normalidade dos dados e homogeneidade das varincias de tratamentos, a tcnica da
ANOVA consiste em comparar a variao devida aos tratamentos (entre tratamentos)
com a variao devida ao acaso (ou resduo, ou dentro de tratamentos).
Para o clculo das causas de variao so determinadas:
a) Graus de liberdade (GL)
( ) 1
1
onde , 1
= =
=
= =
r k k n Resduo
; k Tratamento
kr; n n Total
b) Somas de quadrados (SQ)
20
Delineamento de Experimentos
=
-
= = =
-
=
=
-
- -
=
-
=
- -
-
=
- - -
=
= =
- -
=
- -
= =
- -
=
= = =
=
= = =
= = =
k
i
i
r
j
ij
k
i
r
j
i ij
k
i
r
j
ij i
k
i
i
k
i
i
r
j
i
k
i
r
j
ij
k
i
r
j
ij
k
i
r
j
ij
k
i
SQTrat SQTot
r
y
y y y SQRes
y
r
y
y -n y r y n
r
y
y y SQTrat
y
n
y y n y y y SQTot
1
2
1
2
1 1
2
1
1
2
1
2
1
2
2
1
2
1
1 1 1
2 2
1 1
2
1
. ( ) (
;
1
onde ; ) (
;
1
onde ) (
c) Quadrados Mdios (QM)
) /(
) 1 /(
k n SQRes QMRes
k SQTrat QMTrat
=
=
d) Estatstica F
QMRes QMTrat F / =
As quantidades obtidas anteriormente so dispostas na Tabela 2.6,
denominada tabela de anlise de varincia.
O teste de hipteses relativo Tabela 2.6 consiste em:
:
0
H No existe efeito de tratamentos t t = = = = = =
k k
H H ... : 0 ... :
1 0 1 0
:
1
H Existe efeito de tratamentos ) ,..., 1 ( 0 Existe :
1
k i H
i
= = t
A regra de deciso a habitual, ou seja:
Se
) ; 1 ; ( k n k calc
F F
>
o
, rejeita-se H
0
. Caso contrrio no h rejeio.
No exemplo, tem-se:
4 = k (tratamentos) e 5 = r (repeties por tratamento);
75 , 26 20 / 535 logo, , 535 = = =
- - - -
y y
) 31 ( 155 ); 26 ( 130 ); 27 ( 135 ); 23 ( 115
4 4 3 3 2 2 1 1
= = = = = = = =
- - - - - - - -
y y y y y y y y
75 , 275 25 , 14311 00 , 14587 = = SQTot
75 , 163 25 , 14311 00 , 14475 = = SQTrat
00 , 112 75 , 163 75 , 275 = = SQRes
58 , 54 3 / 75 , 163 = = QMTrat
Tabela 2.6 Tabela geral de ANOVA de um DIC balanceado
Causa de variao GL SQ QM F
Tratamentos 1 k SQTrat QMTrat QMRes QMTrat/
Resduo k n SQRes QMRes
Total 1 n SQTot
21
Delineamento de Experimentos
00 , 7 16 / 00 , 112 = = QMRes
Os resultados encontrados esto dispostos na Tabela 2.7 da ANOVA:
Conclui-se, no nvel de significncia 5%, que existem diferenas entre as
mdias das alteraes de pesos segundo as dietas estudadas (rejeita-se
0 :
4 3 2 1 0
= = = = t t t t H ). Ou seja, os resultados experimentais (com base no p-
value) permitem rejeitar a hiptese de que as mdias de tratamentos so iguais, ao
nvel de significncia de 5%.
2.7. Coeficientes de Determinao e Variao de um Experimento
O coeficiente de determinao (
2
R ) de um experimento dado pela
razo entre a SQTrat (variao devida aos tratamentos) e a SQTot (variao total dos
valores observados), indicando a proporo da variao total explicada pela variao
devida aos tratamentos ( 1 0
2
s s R ).
O coeficiente de variao ( CV ) de um experimento dado pela razo
entre o desvio padro (na ANOVA, consiste na raiz quadrada positiva de SQRes ) e a
mdia geral dos dados (
- -
y ), indicando como os dados comportam-se (disperso) em
relao mdia geral. A grandeza inversa do CV remete idia da preciso dos dados
experimentais.
No exemplo anterior, tem-se
5938 , 0 75 , 275 / 75 , 163 / = = = SQTot SQTrat R
(59,38% da variao total explicada pela variao de tratamentos);
0989 , 0 75 , 26 / 00 , 7 / = = =
- -
y QMRes CV
(9,89% estabelece-se como a disperso relativa dos dados experimentais)
2.8. Comparaes Mltiplas
A tcnica da ANOVA permite ao pesquisador verificar se existe efeito
dos tratamentos, mas no como as mdias dos tratamentos diferem entre si. Portanto, se
constatar que existe efeito do fator em estudo, interessante complementar a anlise a
fim de localizar as diferenas entre as mdias dos tratamentos. A resposta
Tabela 2.7 ANOVA da alterao dos peso
Causa de variao GL SQ QM F
Dietas 3 163,75 54,58 7,80 (p < 0,005)
Resduo 16 112,00 7,00
Total 19 275,75
22
Delineamento de Experimentos
complementao da ANOVA pode ser concretizada (principalmente quando os nveis
do fator so quantitativos) com um teste de comparaes mltiplas de mdias.
Nessa linha de busca de uma resposta biolgica mais interessante e
informativa foram propostos diversos testes que, em geral, levam o nome do seu autor
(Tukey, Duncan, Dunnet, Bonferroni, Scheff, Newman-Keuls ou Student-Newman-
Keuls (SNK),...). No existe um teste aceito como o melhor deles; todos apresentam
vantagens e desvantagens e situao mais indicada para seu uso.
Os testes de comparaes mltiplas permitem testar hipteses do tipo:
0 ... :
1 1 0
= + +
k k
c c H versus 0 ... :
1 1 1
= + +
k k
c c H , com 0 ...
1
= + +
k
c c . Essa
combinao linear de mdias, que reflete uma situao de interesse biolgico,
denominada contraste de mdias.
Em nosso curso de graduao, o interesse consiste na comparao de
todas as diferenas entre mdias de dois tratamentos. Dentro dessa linha curiosidade a
opo ser pelo mtodo de Tukey.
O mtodo de Tukey baseia-se na diferena honestamente significante
(HSD=Honestly Significant Difference), cujo princpio encontrar a diferena
mnima significante que assegura a todas as comparaes um nvel comum de
significncia estabelecido a priori.
No experimento com dados balanceados o teste de Tukey exato com o
seguinte procedimento operacional:
. com , 0 : H e 0 : H
' 1 ' 0
i' i
i i i i
= = =
Calcula-se ( ) ( )
( )
r
QMRes
q HSD
k o
o o
; ;
= A = , onde
) ; ; ( o k
q o quantil de
ordem (1-/2) ) 1 (
2
o
da distribuio estatstica denominada studentized range com
parmetros (nmero de tratamentos) e (graus de liberdade do resduo). Os valores de
q, considerando =0,01 e =0,05, esto tabelados e so encontrados em diversos livros
de estatstica experimental.
A regra de deciso a habitual, ou seja:
Se ( ) o A >
- - ' i i
y y , rejeita-se H
0
. Caso contrrio, no h rejeio.
Similarmente, pode-se apresentar o intervalo de confiana ( )% 1 100 o
para a diferena de mdias, cujos limites so dados por:
( )
( )
r
QMRes
q y y LI
i i k o ; ; '
=
- -
23
Delineamento de Experimentos
( )
( )
r
QMRes
q y y LS
i i k o ; ; '
+ =
- -
No exemplo relativo Tabela 1, tem-se
( )
05 , 4
16 ; 4 ; 05 , 0
= q ; logo, ( ) ( ) 79 , 4
5
00 , 7
05 , 4 % 5 % 5 = = = A HSD .
Ou seja, o valor mnimo que expressa a diferena significante entre as
mdias dos ganhos de peso da ordem de 4,79 unidades de peso. Neste sentido, as
nicas diferenas encontradas aconteceram entre as dietas A e D (8,00>4,79) e C e D
(5,00>4,79).
Uma maneira elegante e redacional (textos cientficos e biolgicos) de
apresentar os resultados est disposta na Tabela 2.8.
2.9. Exerccios (DIC com dados balanceados)
1) Para testar duas drogas diferentes usando grupo controle, um farmacologista
pretende fazer um experimento com cobaias. Esto disponveis 24 cobaias,
bastante similares. Como voc planejaria o experimento?
2) Explique com detalhes o procedimento que voc faria para designar cinco
tratamentos (A, B, C, D, E) para 25 unidades experimentais (ratos) similares.
3) Num laboratrio de biofsica so usados quatro voltmetros diferentes. Para
verificar se os quatro voltmetros esto igualmente calibrados, mediu-se a
mesma fora constante de 100 volts cinco vezes cada voltmetro. Os dados esto
na tabela abaixo. Faa uma anlise de varincia e interprete o resultado
(considerar =0,05).
Voltagem segundo o voltmetro
Voltmetro
A B C D
117 115 118 125
120 110 123 121
114 116 119 123
119 115 122 118
115 114 118 118
4) Para detectar a presena de insetos daninhos nas plantaes, colocam-se
papeles untados com uma substncia pegajosa e examinam-se os insetos
capturados. Ao nvel de 5% de significncia, que cores atraem mais insetos? Os
Tabela 2.8 Mdia e desvio padro do ganho de peso segundo a dieta
Dieta
HSD
A B C D
23 (2,55)a
(1)
27 (2,74)ab 26 (2,74)a 31 (2,55)b 4,79
(1)
duas mdias seguidas de pelo menos uma mesma letra no diferem entre si
(p>0,05) pelo teste de Tukey
24
Delineamento de Experimentos
pesquisadores colocaram seus papeles de cada cor em posies aleatrias em
um campo de aveia, e contaram o nmero de insetos capturados.
Cor do papelo Insetos Capturados
Azul 16 11 20 21 14 17
Verde 37 32 20 29 37 32
Branco 21 12 14 17 13 20
Amarelo 45 59 48 46 38 47
Obs.: Como a varivel nmero de insetos (contagem) no apresenta
distribuio normal (varivel discreta), para a anlise dos dados considerar os
valores observados sob a transformao raiz quadrada.
5) Considere o seguinte quadro de ANOVA da PAM:
Fonte de
variao
Soma
Quadrados
GL QM F
Entre Grupos 800 3 ? ?
Intragrupos ? ? 33,33 -
Total 2000
a) Qual tipo de ANOVA est apresentado no quadro?
b) Qual a concluso no nvel de 5% de significncia?
c) Qual a redao cientfica mais adequada para a concluso sobre o resultado
do teste estatstico empregado?
6) Considere as seguintes dosimetrias de mercrio no sangue (ppb) de grupos
expostos em garimpos da Amaznia Legal (Ferrari et al., Revista de Sade
Ocupacional, v.20, n.75, p.54-60, 1992).
Grupo Dosimetria Hg
Garimpeiros 24 19 25 23 13
Ribeirinhos 16 8 10 7 15
ndios 28 30 19 23 22
Controle 12 6 8 7 9
Verificar, considerando o nvel de significncia 5%, as diferenas entre as
respostas mdias dos grupos.
2.10. Respostas dos Exerccios (DIC com dados balanceados)
1) Cada grupo ( Controle, Droga 1 e Droga 2 ) ser composto de oito cobaias
alocadas por processo aleatrio simples (casual ou randomizado ). A varivel
resposta ser comparada quanto s mdias dos grupos pela tcnica da ANOVA
complementada com o teste de comparaes mltiplas de Tukey, considerando o
nvel de 5% de significncia.
2) Os ratos so enumerados de 1 a 25 e, em uma urna so colocadas 25 etiquetas
idnticas quanto ao tamanho, forma e cor sendo cinco marcadas com a letra A,
cinco com B, cinco com C, cinco com D e, finalmente cinco com E. Em outra
urna, so colocadas outras etiquetas enumeradas de 1 a 25, correspondente aos
25 ratos da pesquisa. Procede-se com a realizao de sorteios em ambas as
25
Delineamento de Experimentos
urnas, formando 25 pares constitudos pelo tratamento sorteado na primeira urna
e o rato correspondente ao nmero sorteado na segunda.
3)
Tabela 1. ANOVA para a fora dos voltmetros
Causa de variao GL SQ QM F
Voltmetro 3 150,00 50,00 7,41 (p<0,005)
Resduo 16 108,00 6,75
Total 19 258,00
Tabela 2. Mdia (desvio padro) da fora segundo tipo de voltmetro
A B C D
117,00 (2,55) ab 114,00 (2,35) a 120,00 (2,35) b 121,00 (3,08) b
DHS (5%) = 4,71
4)
Tabela 1. ANOVA para a raiz quadrada do nmero de insetos capturados
Causa variao GL SQ QM F
Cor do papelo 3 33,72 11,24 43,57 (p<0,001)
Resduo 20 5,16 0,26
Total 23 38,88
Tabela 2. Mdia (desvio padro) do nmero de insetos capturados
(*)
segundo cor
Azul Verde Branco Amarelo
4,04 (0,47) a 5,56 (0,60) b 4,00 (0,47) a 6,85 (0,49) c
DHS (5%) = 0,82
(*)
Varivel sob a transformao raiz quadrada
5)
a) ANOVA para DIC balanceado (10 animais por grupo).
b) F= 266,67/33,33 = 8,00 (p < 0,001); portanto rejeita-se a hiptese de
ausncia de efeito de tratamentos.
c) No nvel de 5% de significncia conclui-se que existe diferena entre as
mdias da PAM nos grupos estudados.
6)
Tabela 1. ANOVA para a dosimetria de mercrio no sangue (ppb)
Causa variao GL SQ QM F
Grupo 3 871,20 290,40 17,47 (p<0,001)
Resduo 16 266,00 16,63
Total 19 1137,20
Tabela 2. Mdia (desvio padro) da dosimetria de mercrio no sangue segundo o grupo
Garimpeiros Ribeirinhos ndios Controle
20,80 (4,92) b 11,20 (4,09) a 24,40 (4,51) b 8,40 (2,30) a
DHS (5%) = 7,39
26
Delineamento de Experimentos
3. Delineamento Inteiramente Casualizado (DIC) com dados no
balanceados
3.1. Consideraes Gerais
Em algumas situaes, pode acontecer que o nmero de unidades
experimentais disponvel no seja mltiplo do nmero de tratamentos que se pretende
comparar ou, ainda, comear o experimento com dados balanceados e algumas
unidades, por algum motivo alheio vontade do pesquisador, tornarem-se perdidas para
o experimento. Nessas situaes, os tratamentos podem ficar com nmeros de
repeties total ou parcialmente diferentes, ou seja, experimento com nmero diferente
de repeties (dados no balanceados).
Talvez a primeira sugesto, com base no que j foi visto, seria descartar
utilizando critrios randmicos unidades experimentais para se ter os dados
balanceados nos tratamentos. Mesmo sendo, do ponto de vista da Estatstica
Experimental, melhor que todos os tratamentos apresentem o mesmo nmero de
parcelas (a anlise realizada por procedimento exato), a importncia biolgica das
informaes das unidades experimentais mais imperativa que a simplicidade dos
clculos matemticos do procedimento e, neste sentido, torna-se imprescindvel um
comportamento mais requintado para a situao.
Nessa situao, o caminho mais prximo s caractersticas da biologia
acaba sendo dado pelo procedimento anterior realizado com os dados balanceados,
adaptando-se as frmulas dos clculos aos experimentos com dados no-balanceados.
Esta nova maneira faz com que o processo exato seja direcionado forma aproximada.
Portanto, a teoria desenvolvida no DIC balanceado passa a ser
explicitada com pequenas modificaes nas somas de quadrados e no procedimento de
Tukey.
Tem-se:
= =
- -
=
k
i
r
j
ij
i
ny y SQTot
1 1
2 2
, onde
i
r consiste nas repeties do i-simo tratamento e
= =
- -
=
k
i
r
j
ij
i
y
n
y
1 1
1
2
1
2
- -
=
-
=
y n
r
y
SQTrat
k
i i
i
, onde
=
-
=
i
r
j
ij i
y y
1
27
Delineamento de Experimentos
= = =
= =
-
k
i
r
j
k
i
r
y
ij
i
i
i
SQRes SQTot y SQRes
1 1 1
2
2
.
O quadro da ANOVA permanece o mesmo do DIC para dados
balanceados.
Em relao ao teste de Tukey, calcula-se
( ) ( )
( )
|
|
.
|
\
|
+ = = A
'
; ; ' '
1 1
2
i i
ii ii
r r
QMRes
q HSD
res
k o
o o e
Se ( ) o
' ' ii i i
y y A >
- -
, rejeita-se a hiptese de igualdade de mdias. Caso
contrrio, no h rejeio.
A Tabela 3.1 mostra os ganhos de peso (kg) no final do experimento
realizado para comparar trs raes comerciais em um lote de animais (sunos)
homogneos (PADOVANI, 2002).
15 ; 5 ; 4 ; 6
3 2 1
= = = = n r r r
2973 , 7 ; 46 , 109 ; 26 , 34 ; 67 , 34 ; 53 , 40
3 2 1
= = = = =
- - - - - - -
y y y y y
6360 , 11 7588 , 798 3948 , 810 2973 , 7 15 3948 , 810
2
= = = SQTot
2731 , 10 7588 , 798 0319 , 809 7588 , 798
5
26 , 34
4
67 , 34
6
53 , 40
2 2 2
= = + + = SQTrat
A Tabela 3.2 apresenta os dados segundo a ANOVA.
Coeficiente de Variao: % 62 , 4 %
2973 , 7
1136 , 0
100 = = CV
Coeficiente de Determinao: %) 29 , 88 ( 8829 , 0
6360 , 11
2731 , 10
2
= = R
Teste de Tukey
Tabela 3.1 Ganho de peso (kg) segundo rao
Rao Ganho de Peso
A 7,12 6,91 6,30 6,72 6,68 6,80
B 8,15 8,45 8,92 9,15
C 6,58 7,04 6,46 7,12 7,06
Tabela 3.2 Quadro da ANOVA do ganho de peso
Causa
Variao
GL SQ QM F
Rao 2 10,2731 5,1366 42,22 (P<0,001)
Resduo 12 1,3629 0,1136
Total 14 11,6360
28
Delineamento de Experimentos
05 , 0 = o ; 3 = k (tratamentos); 12 = (graus de liberdade do resduo)
'
'
'
'
8985 , 0
1 1
2
1136 , 0
77 , 3
i i
i i
i i
ii
r r
r r
r r
+
=
|
|
.
|
\
|
+ = A
580 , 0
12
= A ; 544 , 0
13
= A ; 603 , 0
23
= A
( ) B A y y = A > = =
- -
9125 , 1 6675 , 8 755 , 6
12 2 1
( ) C A y y = A < = =
- -
097 , 0 852 , 6 755 , 6
13 3 1
( ) C B y y = A > = =
- -
8155 , 1 852 , 6 6675 , 8
23 3 2
A Tabela 3.3 mostra a mdia e o desvio padro da rao.
3.2. Exerccios (DIC no balanceado)
1) Para testar duas drogas diferentes usando grupo controle, um farmacologista
pretende fazer um experimento com cobaias. Esto disponveis 24 cobaias,
bastante similares. Discuta o uso de grupos com diferentes repeties.
2) Considere as seguintes dosimetrias de mercrio no sangue (ppb) de grupos
expostos em garimpos da Amaznia Legal (Ferrari et al., Revista de Sade
Ocupacional, v.20, n.75, p.54-60, 1992).
Verificar, considerando o nvel de significncia 5%, as diferenas entre as
respostas mdias dos grupos.
3) Considerar as seguintes avaliaes nasomtricas [(nasalncia(%)=100*(energia
acstica nasal)/(energia acstica nasal+energia otoacstica oral)] do vocbulo
papai isolado e inserido em frase (Di Ninno et al., Revista de Atualizao
Cientfica PR-FONO, v.13, n.1, p.71-77, 2001)
Considerando o nvel de significncia 5%, avaliar as diferenas entre as
respostas mdias das nasalncias.
Tabela 3.3 Mdia e desvio padro do ganho de peso segundo rao
Rao A Rao B Rao C
6,7550,273a
(1)
8,6680,452b 6,8520,307a
(1)
duas mdias seguidas de uma mesma letra no diferem (P>0,05) pelo teste de Tukey.
Grupo Dosimetria Hg
Garimpeiros 24 19 25 23 18
Ribeirinhos 13 10 12 8
ndios 28 30 24 26 25
Controle 10 6 8 9
Faixa Etria Nasalncia (%)
Criana 10,5 11,6 12,3 8,9 9,2 9,6 10,9 11,0
Adolescente 11,5 10,2 13,9 12,0 10,4 10,0 14,1
Adulto 18,5 16,6 20,2 17,8 21,8 17,4
29
Delineamento de Experimentos
3.3. Respostas dos Exerccios (DIC no balanceado)
1) Do ponto de vista biolgico, o grupo controle (animais que recebem o
placebo, ou seja, soro fisiolgico por exemplo) o referencial das
comparaes (padro de referncia para testar o efeito das drogas), logo deve
ser o grupo agraciado com mais animais. O restante dos animais pode ser
balanceado entre as duas drogas.
2)
Tabela 1. Quadro da ANOVA da dosimetria de Hg
Causa variao GL SQ QM F
Grupos 3 1030,50 343,50 56,22 (p<0,001)
Resduo 14 85,50 6,11
Total 17 1116,00
Tabela 2. Mdia (desvio padro) da dosimetria segundo grupo
Garimpeiro Ribeirinho ndio Controle
21,80 (3,11) b 10,75 (2,22) a 26,60 (2,41) c 8,25 (1,71) a
DHS (G x R) = 4,82 DHS (G x I) = 4,54 DHS (G x C) = 4,82
DHS (R x I) = 4,82 DHS (R x C) = 5,08 DHS (I x C) = 4,82
3)
Tabela 1. Quadro da ANOVA da nasalncia
Causa variao GL SQ QM F
Faixas Etrias 2 256,01 128,01 49,81 (p<0,001)
Resduo 18 46,28 2,57
Total 20 302,29
Tabela 2. Mdia (desvio padro) da nasalncia segundo faixa etria
Criana Adolescente Adulto
10,50 (1,19) a 11,73 (1,71) a 18,72 (1,94) b
DHS (Cr x Adol)=2,12 DHS (Cr x Adul)=2,21 DHS (Adol x Adul)=2,28
30
Delineamento de Experimentos
4. Delineamento em Blocos Completos Casualizados (DBCC)
4.1. Introduo
Quando o conjunto de unidades experimentais for relativamente heterogneo
(pequenos grupos de unidades similares, mas nenhum suficientemente grande para um
planejamento), o plano experimental inteiramente casualizado torna-se pouco preciso,
porque o erro experimental torna-se muito grande. A partir das informaes disponveis,
antes da realizao do experimento, possvel agrupar as unidades experimentais em
subconjuntos de unidades mais homogneas, denominados blocos. A alocao das
unidades experimentais entre os tratamentos obedece a uma restrio imposta pelos
blocos, ou seja, o procedimento de casualizao dos tratamentos s unidades
experimentais realizado dentro de cada bloco. Quando todos os tratamentos
aparecerem em todos os blocos uma nica vez, tem-se o Delineamento em Blocos
Completo. Deve ser observado, inclusive por possvel confuso de nome, que a
aleatorizao est sendo realizada nos tratamentos dentro dos blocos (restrio na
casualizao).
Na anlise estatstica de um experimento em blocos casualizados, ou como
normalmente se diz, um experimento em blocos, alm dos fatores de interesse, deve-se
levar em conta o fator de controle experimental, blocos, diminuindo desta maneira o
erro experimental. Quanto maior for a heterogeneidade entre blocos, maior ser a
eficincia deste plano experimental em relao ao completamente autorizado. O
delineamento em blocos tambm pode ser planejado com repeties dos tratamentos
dentro do bloco e tambm, de forma incompleta. A anlise estatstica do delineamento
em blocos completos ao acaso com repeties torna-se relativamente fcil quando o
nmero de unidades dentro de cada bloco mltiplo do nmero de tratamentos em
comparao.
O termo bloco (sua origem de fato agronmica, cujo objetivo referia-se a faixa
de terra de mesma fertilidade - fertilidade homognea) tem um sentido prtico
interessante na rea biolgica, ou seja, caracteriza-se como estrato e tem como
finalidade, o controle da homogeneidade dos animais quanto s variveis intervenientes.
No presente estudo os blocos so completos quanto aos tratamentos, isto , um
bloco possui todos os tratamentos de interesse do estudo, alocados por processo
aleatrio com uma repetio por bloco. A vantagem mais destacada dos experimentos
em blocos consiste em permitir o uso de unidades experimentais homogneas. Os
31
Delineamento de Experimentos
blocos controlam uma causa de variao e estabelecem uma restrio casualizao.
Essa restrio casualizao devido constituio dos blocos indica para a no
realizao do teste estatstico para a causa de variao blocos, ou seja, no faz sentido,
pois se trata de uma fonte de variao de controle e no de interesse para a comparao.
Se a fonte colocada como blocos est no interesse do pesquisador para comparao, o
esquema de fatores torna-se o procedimento adequado para a combinao dos nveis dos
dois fatores em estudo.
Em resumo, podem ser destacados:
a) A casualizao ocorre dentro dos blocos.
b) Os blocos so completos quanto aos tratamentos pesquisados.
c) essencial que os blocos renam unidades similares.
d) Quanto maior a heterogeneidade entre blocos maior a eficincia do
delineamento.
e) O tratamento aparece uma nica vez dentro de cada bloco.
f) Os experimentos em blocos so feitos, essencialmente, para comparar
tratamentos.
g) No deve ser feito o teste estatstico de blocos.
h) Fazer blocos significa impor uma restrio como controle s unidades
experimentais.
i) Exemplos biolgicos de blocos: posio na estufa, ninhada, faixa de idade, faixa
de peso, uma partida de animais (lote), entre outros.
4.2. Modelo do Experimento (Biolgico)
O modelo de DBCC com k tratamentos e b blocos dado por:
( ) b j k i y
i i ij j i ij
,..., 1 ; ,..., 1 ; = = + = + + = t c | ; onde:
a mdia geral comum a todas as observaes;
i
t o efeito do i-simo nvel do fator na varivel dependente Y ;
j
| o efeito do j-simo bloco experimental;
ij
c o erro casual no observvel (independente e identicamente distribuda
como ( )
2
, 0 o N ).
Neste sentido, para o modelo de efeitos fixos, tem-se:
a) ( )
j i ij
Y E | t + + = ;
b) ( )
2
o =
ij
Y Var ;
c) ( )
2
, ~ o | t
j i i ij
N Y + + .
32
Delineamento de Experimentos
4.3. Procedimento Estatstico: Anlise de Varincia
Todas as consideraes realizadas para o DIC so tambm vlidas para o
DBCC (independncia dos erros; varincias homogneas e normalidade dos dados).
Considere o seguinte conjunto de pesos de carcaas (kg) de coelhos
conforme Tabela 4.1, no acabamento segundo o tipo de dieta randomizada oferecida aos
animais.
Cada peso de carcaa (kg) uma resposta biolgica do sorteio de trs
dietas dentro dos conjuntos de trs animais tornados homogneos pelas raas, cujo
resultado biolgico responde ao modelo:
ij j i ij
y c | t + + + = , com k i ,..., 1 = (tratamentos) e b j ,..., 1 = (blocos).
Neste modelo, a tcnica da ANOVA consiste em fracionar a SQTotal
em trs fontes de variao: a primeira referente aos tratamentos ( SQTrat ), a segunda
relativa aos blocos ( SQBloco ) e, por fim, a expressa nas flutuaes casuais ( SQRes ).
Para o clculo das causas de variao so determinados:
a) Graus de liberdade (GL)
1 1 = = kb n Total , onde kb n = ;
1 = k Tratamento ;
1 = b Bloco ;
( )( ) 1 1 = k b Resduo .
b) Somas de quadrados (SQ)
( )
= =
- -
= =
- -
= =
k
i
b
j
ij
k
i
b
j
ij
y n y y y SQTot
1 1
2 2
1 1
2
; onde
= =
- -
=
k
i
b
j
ij
y
n
y
1 1
1
;
( )
- -
=
-
= =
- - -
= =
y n
b
y
y y SQTrat
k
i
i
k
i
b
j
i
1
2
1 1
2
; onde
=
-
=
b
j
ij i
y
b
y
1
1
;
( )
=
- -
-
= =
- - -
= =
b
j
j
k
i
b
j
j
y n
k
y
y y SQBloc
1
2
2
1 1
2
; onde
=
-
=
k
i
ij j
y
k
y
1
1
;
SQBloc SQTrat SQTot SQRes = .
c) Quadrados mdios (QM)
( ) 1 = k SQTrat QMTrat
( ) 1 = b SQBloco QMBloco
Tabela 4.1 Peso de carcaas (kg) de coelhos segundo dieta
Dieta
Raa
Norfolk Angor I Angor II
Nova
Zelndia I
Nova
Zelndia II
Padro 1,28 1,08 1,06 1,36 1,19
Padro+Rami 1,45 1,15 1,28 1,50 1,41
Padro+Alfafa 1,38 1,08 1,17 1,43 1,26
Padovani, C. R. (2002). Exerccios de Estatstica Bsica e Experimental. Depto.
Bioestatstica, IB/UNESP, Botucatu-SP, 40p.
33
Delineamento de Experimentos
( )( ) | | 1 1 = b k SQRes QMRes
d) Estatstica F
QMRes QMTrat F =
As quantidades obtidas so dispostas na Tabela 4.2 da ANOVA.
Tabela 4.2 Tabela geral de ANOVA de um DBCC
Causa de variao GL SQ QM F
Blocos 1 b SQBloc QMBloc -
Tratamentos 1 k SQTrat QMTrat QMRes QMTrat
Resduo ( )( ) 1 1 k b SQRes QMRes
Total 1 bk SQTot
O teste de hiptese relativo Tabela 4.2 consiste em:
t = = = = = =
k k
H H H ... : 0 ... : o tratament de efeito existe No :
1 0 1 0 0
( ) k i H H
i
,..., 1 0 Existe : o tratament de efeito Existe :
0 1
= = t
A regra de deciso a habitual, ou seja:
Se
( )( ) ( ) 1 1 ; 1 ;
>
k b k calc
F F
o
, rejeita-se H
0
. Caso contrrio, no h rejeio.
No exemplo, tem-se:
3 = k (tratamentos) e 5 = b (blocos);
08 , 19 =
- -
y , logo, 272 , 1 15 08 , 19 = =
- -
y ;
2980 , 0 2698 , 24 5678 , 24 = = SQTot ;
( ) 194 , 1 97 , 5
1 1
= =
- -
y y ; ( ) 358 , 1 79 , 6
2 2
= =
- -
y y ; ( ) 264 , 1 32 , 6
3 3
= =
- -
y y
0677 , 0 2698 , 24 3375 , 24 = = SQTrat
11 , 4
1
=
-
y ; 31 , 3
2
=
-
y ; 51 , 3
3
=
-
y ; 29 , 4
4
=
-
y ; 86 , 3
5
=
-
y ;
2209 , 0 2698 , 24 4907 , 24 = = SQBloc ;
0094 , 0 0677 , 0 2209 , 0 2980 , 0 = = SQRes
A Tabela 4.3 apresenta o resultado da ANOVA.
Conclui-se, no nvel de 5% de significncia, que existem diferenas entre
os pesos mdios de carcaas dos coelhos segundo as suplementaes estudadas.
4.4. Comparaes Mltiplas
O procedimento de comparaes mltiplas de Tukey para o DBCC
consiste nos seguintes passos:
0 :
' 0
=
i i
H e 0 :
' 1
=
i i
H , para ' i i = .
Tabela 4.3 Tabela ANOVA para o peso das carcaas
Causa Variao GL SQ QM F (valor p)
Blocos 4 0,2209 0,0552
Tratamentos 2 0,0677 0,0339 28,25 (p<0,01)
Resduo 8 0,0094 0,0012
Total 14 0,2980
34
Delineamento de Experimentos
Calcula-se ( ) ( )
( )( ) ( )
b
QMRes
q HSD
k b 1 1 ; ;
= A =
k o
o o , onde
( ) o ; ;k
q o
quantil de ordem (1-/2) da distribuio studentized range com parmetros
(nmeros de tratamentos) e (graus de liberdade do resduo).
A regra de deciso do teste de hipteses a habitual, ou seja:
Se ( ) o A >
- - ' i i
y y , rejeita-se H
0
. Caso contrrio, no h rejeio.
Similarmente, pode-se apresentar o intervalo de confiana de Tukey
100(1-)% para a diferena de mdias, cujos limites so dados por:
( )
( )
b
QMRes
q y y LI
i i k o ; ; '
=
- -
,
( )
( )
b
QMRes
q y y LS
i i k o ; ; '
+ =
- -
.
No exemplo relativo aos dados do peso das carcaas tem-se:
( )
04 , 4
8 ; 3 ; 05 , 0
= q ; logo, ( ) 063 , 0
5
0012 , 0
04 , 4 % 5 = = A .
Ou seja, o valor mnimo que expressa a diferena significante =0,05
entre os pesos mdios das carcaas 0,063kg. Os resultados das comparaes esto
expressos na Tabela 4.4.
Conclui-se, no nvel de 5% de significncia, que a suplementao
modifica o peso mdio da carcaa dos coelhos e que entre elas, a suplementao com
rami produz maior peso mdio.
4.5. Exerccios (DBCC)
1) Planeje um experimento para comparar dois testes de QI, usando dez pares de
gmeos. Considere cada par de gmeos como um bloco.
2) Faa a anlise de varincia dos dados apresentados na tabela a seguir,
considerando o nvel de 5% de significncia:
Dados de um experimento em blocos ao acaso
Bloco
Tratamento
A B C
I 74 53 58
II 90 68 78
III 78 54 64
IV 98 72 74
Tabela 4.4 Mdia e desvio padro dos pesos segundo dieta
Dieta Padro Padro Suplementao Rami Padro Suplementao Alfafa
1,1940,128a 1,3580,142c 1,2640,145b
35
Delineamento de Experimentos
3) Pretende-se verificar a durabilidade de trs marcas de tintas que tem preos de
custo bem diferentes. Para isso, foram selecionados seis muros, em que cada
tera parte foi pintada por uma marca sorteada nos teros. Aps um perodo de
dez meses, foi atribuda a cada parte uma nota, resultante de vrios quesitos. Os
resultados das notas so apresentados a seguir:
Marca Muro 1 Muro 2 Muro 3 Muro 4 Muro 5 Muro 6
A 8,5 8,9 8,8 8,2 8,6 8,9
B 9,1 9,4 9,1 9,6 9,0 9,3
C 7,3 7,6 7,8 7,5 6,1 7,2
Com esses dados, voc diria (=0,05) que uma das marcas melhor que as
outras?
4) Supondo que haja interesse em calcular F=QMBloco/QMRes em um
experimento, qual a interpretao biolgica que sugere o resultado significativo
(p<0,05)? E o no significativo (p>0,05)?
4.6. Respostas dos Exerccios (DBCC)
1) Considerando 10 pares de gmeos (G1, G2), para cada par ser efetuado o
sorteio dos dois testes de QI. Neste sentido, constitudos os pares por processo
randomizado dos testes de QI os dados coletados nos gmeos sero submetidos
tcnica da anlise de varincia para o modelo experimental em blocos
completamente casualizados (10 blocos no presente estudo) envolvendo dois
tratamentos independentes (dois testes de QI).
2)
Tabela 1. Tabela ANOVA
C. Variao GL SQ QM F
Blocos 3 977,58 325,86 -
Tratamentos 2 1189,50 594,75 50,15 (p<0,001)
Resduo 6 71,17 11,86
Total 11 2238,25
Tabela 2. Mdia (desvio padro) dos tratamentos
A B C
85,00 (11,02) b 61,75 (9,67) a 67,00 (11,61) a
DHS (5%)=7,47
3)
Tabela 1. ANOVA para a durabilidade
C. Variao GL SQ QM F
Blocos (Muro) 5 1,04 0,21 -
Tratamentos (Marca) 2 12,64 6,32 45,14 (p<0,001)
Resduo 10 1,41 0,14
Total 17 15,09
36
Delineamento de Experimentos
Tabela 2. Mdia (desvio padro) das marcas
A B C
8,65 (0,27) b 9,25 (0,23) c 7,25 (0,60) a
DHS (5%)=0,59
4) Se o resultado do teste estatstico for significativo (p < 0,05) existe comprovao
biolgica de heterogeneidade entre os blocos, corroborando com a suspeita do
pesquisador no controle fonte de variao bloqueada. Se o resultado do teste
estatstico for no significativo (p > 0,05) existe comprovao biolgica de
homogeneidade entre os blocos, contradizendo com a suspeita do pesquisador no
controle fonte de variao bloqueada.
37
Delineamento de Experimentos
5. Esquemas Fatoriais
5.1. Introduo
Existem situaes prticas na experimentao em que o interesse do
pesquisador envolve o estudo de dois ou mais fatores combinados, cujos cruzamentos
dos nveis dos fatores so os tratamentos empenhados nas comparaes. Em nosso
estudo, ser apenas enfocado o caso de dois fatores, ou seja, A e B. Ser admitido que o
fator A possui a nveis, e o fator B, b nveis.
Nos experimentos onde cada nvel de um fator est combinado com
todos os nveis do outro, diz-se que os fatores obedecem a uma classificao cruzada
(experimentos cruzados). As combinaes desses fatores resultam os tratamentos do
estudo, cuja configurao recebe o nome de esquema fatorial a*b (combinaes entre os
a nveis do fator A e b nveis do fator B).
O esquema de fatores mais simples consiste em considerar dois fatores A
e B, com dois nveis cada um, isto , o esquema fatorial 2*2. No esquema fatorial dois
por dois, Tabela 5.1, tem-se como resultado das combinaes quatro tratamentos,
conforme quadro a seguir:
Tabela 5.1 Esquema fatorial 2*2
Fator B
Fator A B
1
B
2
A
1
A
1
B
1
A
1
B
2
A
2
A
2
B
1
A
2
B
2
Outras combinaes dos fatores podem surgir medida que o nmero de
nveis dos fatores tornam-se maiores. Ademais, o nmero de nveis dos fatores no
precisa ter o mesmo valor, ou seja, os nveis a do fator A podem ser numericamente
diferente dos nveis b do fator B. Quando a=b, tem-se um arranjo quadrtico e, se ab, o
arranjo retangular. Uma notao interessante que se utiliza quando o nmero de nveis
igual para os dois fatores (a=b; arranjo quadrtico) e descrita por 2, 3, 4,... O
expoente indica o nmero de fatores do estudo e a base da potncia indica o nmero de
nveis dos fatores. Por exemplo, um fatorial 3 tem dois fatores em trs nveis.
Trs hipteses bsicas so avaliadas no esquema fatorial a*b, que so: i)
a interao (A*B) entre os fatores A e B; ii) o efeito do fator principal A e iii) o efeito
do fator principal B. Dependendo do resultado do teste de significncia da interao
A*B, duas novas hipteses podem ser avaliadas: i) efeito do fator A dentro de um nvel
fixo de B e ii) efeito do fator B dentro de um nvel fixo de A.
38
Delineamento de Experimentos
Como o esquema fatorial um arranjo dos nveis dos fatores
(combinaes de nveis) ele pode ser delineado em vrios tipos de experimentos. Em
nosso curso, o esquema fatorial a*b ser apresentado no Delineamento Inteiramente
Casualizado (DIC) e no Delineamento em Blocos Completos Casualizados (DBCC).
5.2. Esquema Fatorial a*b no DIC
Considere a Tabela 5.2, genrica de observaes
ijk
y de um esquema
fatorial a*b em um DIC com r repeties por tratamento.
Onde
ijk
y a k-sima repetio do i-simo nvel do fator A e j-simo
nvel do fator B ( r k b j a i , , 1 ; , , 1 ; , , 1 = = = ).
O modelo de resposta expresso por:
( )
ijk ij j i ijk
y c u u + + + + = ;
onde:
: efeito mdio comum;
i
: efeito do i-simo nvel de A;
j
: efeito do j-simo nvel de B;
()
ij
: efeito de interao entre os nveis i e j dos fatores A e B, respectivamente;
ijk
: erro casual independente, com distribuio ( )
2
, 0 o N .
Considerando os fatores A e B de efeitos fixos, tem-se a Tabela 5.3 da
ANOVA.
Tabela 5.2 Esquema fatorial a*b com r repeties
Fator A
Fator B
B
1
B
b
A
1
r
y
y
11
111
br
b
y
y
1
1 1
A
a
r a
a
y
y
1
11
abr
ab
y
y
1
39
Delineamento de Experimentos
Tabela 5.3 Tabela geral de ANOVA para um esquema fatorial no DIC
Causa de
variao
GL SQ QM F
Tratamentos 1 ab SQTrat QMTrat
Trat
F
A 1 a SQA QMA
A
F
Desmembramento
da
SQTratamentos
B 1 b SQB QMB
B
F
AxB ( )( ) 1 1 b a B SQA B QMA
B A
F
Resduo ( ) 1 r ab SQRes QMRes
Total 1 abr SQTot
Os clculos das somas de quadrados so estabelecidos por:
= = =
- - -
=
a
i
b
j
r
k
ijk
y n y SQTot
1 1 1
2 2
, onde
= = =
- - -
=
a
i
b
j
r
k
ijk
y
n
y
1 1 1
1
e abr n = ;
2
1 1
2
- - -
= =
-
=
y n
r
y
SQTrat
a
i
b
j
ij
, onde
=
-
=
r
k
ijk ij
y y
1
;
SQTrat SQTot SQRes =
2
1
2
- - -
=
- -
=
y n
br
y
SQA
a
i
i
, onde
= =
- -
=
b
j
r
k
ijk i
y y
1 1
;
2
1
2
- - -
=
- -
=
y n
ar
y
SQB
b
j
j
, onde
= =
- -
=
a
i
r
k
ijk j
y y
1 1
;
SQB SQA SQTrat SQAxB =
A obteno dos quadrados mdios realizada pela diviso entre a soma
de quadrados e os respectivos graus de liberdade.
Em relao aos testes de hipteses, que sero apresentados a seguir, duas
situaes interessantes para a discusso biolgica devem ser consideradas: a primeira
consiste no caso onde os efeitos dos fatores A e B na varivel resposta (dependente)
sero aditivos e, portanto, toda a informao biolgica pode ser obtida fazendo-se
inferncias apenas sobre as mdias
- i
e
j -
(mdias marginais); a segunda, onde
existe efeito da interao entre os fatores A e B; onde para avaliar os efeitos existentes
na varivel dependente, as inferncias devem ser feitas sobre todos os
ij
.
As hipteses gerais com os respectivos testes estatsticos acompanhados
das regras de deciso so estabelecidas conforme detalhes na sequncia.
0 A fator do efeito existe No :
2 1 0
= = = =
a
A
H u u u
Sob a veracidade de
A
H
0
a estatstica do teste dada por
40
Delineamento de Experimentos
( )
res
a A
F
QMRes
QMA
F
, 1
~
= , com a regra de deciso habitual (rejeita-se
A
H
0
quando
tab calc
F F > ).
0 B fator do efeito existe No :
2 1 0
= = = =
b
B
H
Sob a veracidade de
B
H
0
a estatstica do teste dada por
( )
res
b B
F
QMRes
QMB
F
, 1
~
= , com a regra de deciso habitual.
( ) ( ) 0 AxB interao de efeito existe No :
11 0
= = =
ab
AxB
H u u
Sob a veracidade de
AxB
H
0
a estatstica do teste dada por
( )( ) ( )
res
b a AxB
F
QMRes
QMAxB
F
; 1 1
~
= , com a regra de deciso habitual.
Toda vez que o resultado de algum teste de hipteses possibilitar a
rejeio da hiptese nula, para melhorar a qualidade da informao biolgica, torna-se
interessante complementar a tcnica da ANOVA com algum procedimento de
comparaes mltiplas para as mdias. Em nosso estudo, como j vem sendo rotina, a
continuidade tem sido realizada pelo teste de Tukey para os contrastes entre todos os
pares de mdias. Neste sentido, duas consideraes sero apresentadas; a primeira
normalmente utilizada quando o resultado do teste de interao entre os fatores A e B
mostrou-se no significante; a segunda, quando o resultado foi significante.
Teste de Tukey para o caso
AxB
F no significante ( ) o >
AxB
p
- -
=
' 0
:
i i
A
H ( ) = a i i ,..., 1 ' , no existe diferena entre as respostas mdias
dos nveis i e i do fator A.
Calcula-se ( ) ( )
( )
br
QMRes
q DMS
res
a A A o
o o
; ;
= A = e se ( ) o
A i i
y y A >
- - - - '
,
rejeita-se a hiptese
A
H
0
. Caso contrrio, no h rejeio.
' 0
:
j j
B
H
- -
= ( ) = b j j ,..., 1 ' , no existe diferena entre as respostas mdias
dos nveis j e j do fator B.
Calcula-se ( ) ( )
( )
ar
QMRes
q DMS
res
b B B o
o o
; ;
= A = e se ( ) o
B j j
y y A >
- - - - '
,
rejeita-se a hiptese
B
H
0
. Caso contrrio, no h rejeio.
Teste de Tukey para o caso
AxB
F significante ( ) o <
AxB
p
j i ij
j
B A
H
' 0
:
/
= ( ) = fixo e ,..., 1 ' , j a i i no existe diferena entre as respostas
mdias dos nveis i e i do fator A dentro do j-simo nvel do fator B.
41
Delineamento de Experimentos
Calcula-se ( ) ( )
( )
r
QMRes
q DMS
res
a B A B A o
o o
; ; / /
= A = e se
( ) o
B A j i ij
y y
/ '
A >
- -
, rejeita-se
j
B A
H
/
0
. Caso contrrio, no h rejeio.
' 0
:
/
ij ij
i
A B
H = ( ) = fixo e ,..., 1 ' , i b j j no existe diferena entre as respostas
mdias dos nveis j e j do fator B dentro do i-simo nvel do fator A.
Calcula-se ( ) ( )
( )
r
QMRes
q DMS
res
b A B A B o
o o
; ; / /
= A = e se ( ) o
A B ij ij
y y
/ '
A >
- -
,
rejeita-se
i
A B
H
/
0
. Caso contrrio, no h rejeio.
5.3. Exemplo de Fatorial a*b no DIC
Considere o seguinte conjunto de dados de um esquema fatorial 2x2 em
um delineamento inteiramente casualizado para avaliar o perfil cardiovascular de ratos
hipertensos submetidos a uma dieta hipercalrica (OLIVEIRA Jr, et al., 2007, Arquivos
Brasileiros de Cardiologia, v.89, Supl I, p.927).
Fator A(Dieta): A
1
(Normocalrica) e A
2
(Hipercalrica);
Fator B(Hipertenso): B
1
(WKY-Controle) e B
2
(SHR-Hipertenso);
Isto :
Dieta
Hipertenso
Ausente Presente
Normocalrica WKYC(A
1
B
1
) SHRC(A
1
B
2
)
Hipercalrica WKYOB(A
2
B
1
) SHROB(A
2
B
2
)
Presso arterial sistlica (mm Hg)
WKYC WKYOB SHRC SHROB
53 , 4 00 , 210
91 , 7 00 , 130
83 , 5 00 , 160
06 , 9 00 , 120
22
21
12
11
=
=
=
=
-
-
-
-
y
y
y
y
130 120 160 210
120 130 158 205
110 125 162 206
112 140 152 215
128 135 168 214
Quadro auxiliar
A
B Total
(Fator A)
00 , 155
20 ; 5 ; 2 ; 2
=
= = = =
- - -
y
n r b a
B
1
B
2
A
1
600 800 1400
A
2
650 1050 1700
Total
(Fator B)
1250 1850 3100
00 , 25296 00 , 480500 00 , 505796 00 , 155 20 214 130
2 2 2
= = + + = SQTot
00 , 24500 00 , 480500 00 , 505000 00 , 155 20
5
1050
5
650
5
800
5
600
2
2 2 2 2
= = + + + = SQTrat
00 , 796 00 , 24500 00 , 25296 = = SQRes
42
Delineamento de Experimentos
00 , 4500 00 , 480500 00 , 485000 00 , 155 20
5 2
1700
5 2
1400
2
2 2
= =
= SQA
00 , 18000 00 , 480500 00 , 498500 00 , 155 20
5 2
1850
5 2
1250
2
2 2
= =
= SQB
00 , 2000 = = SQB SQA SQTrat SQAxB
A Tabela 5.4 mostra o resultado da ANOVA.
Como o resultado do teste de interao entre os fatores A e B foi
significante (p<0,01), o procedimento de comparaes mltiplas ser efetuado
considerando o estudo do fator A fixado o nvel de B e vice-versa.
( ) ( )
( )
Hg mm 03 , 13
5
75 , 49
13 , 4
5
% 1 % 1
16 ; 2 %; 1 / /
= = = A =
QMRes
q DMS
j j
B A B A
( ) ( )
( )
Hg mm 03 , 13
5
75 , 49
13 , 4
5
% 1 % 1
16 ; 2 %; 1 / /
= = = A =
QMRes
q DMS
i i
A B A B
A Tabela 5.5 apresenta a mdia e o desvio padro da hipertenso segundo dieta.
Tabela 5.5 Mdia e desvio padro da PAS (mm Hg) segundo dieta e
hipertenso
Dieta
Hipertenso
Ausente Presente
Normocalrica 120,009,06 a
(1)
A
(2)
160,005,83 a B
Hipercalrica 130,007,91 a A 210,004,53 b B
(1)
duas mdias seguidas de uma mesma letra minscula no diferem (p>0,05) quanto s
respectivas dietas dentro da classe de hipertenso.
(2)
duas mdias seguidas de uma mesma letra maiscula no diferem (p>0,05) quanto s
classes de hipertenso dentro da dieta em considerao.
5.4. Esquema Fatorial a*b no DBCC
Considere a observao
ijk
y de um esquema com dois fatores A (com a
nveis) e B(com b nveis) com os tratamentos casualizados em r blocos completos (fator
fixo de controle).
O modelo de resposta expresso por:
( )
ijk k ij j i ijk
y c | u u + + + + + = ;
onde:
: efeito mdio comum;
Tabela 5.4 ANOVA para a PAS
Causa de
Variao
GL SQ QM F
Tratamento 3 24500,00 8166,67 164,15 (p<0,01)
A 1 4500,00 4500,00 90,45 (P<0,01)
B 1 18000,00 18000,00 361,81 (p<0,01)
AxB 1 2000,00 2000,00 40,20 (p<0,01)
Resduo 16 796,00 49,75
Total 19 25296,00
43
Delineamento de Experimentos
i
: efeito do i-simo nvel de A ( a i , , 1 = );
j
: efeito do j-simo nvel de B ( b j , , 1 = );
()
ij
: efeito de interao entre os nveis i e j dos fatores A e B, respectivamente;
k
: efeito do k-simo nvel de bloco ( r k , , 1 = );
ijk
: erro casual independente, com distribuio ( )
2
, 0 o N .
A disposio geral das observaes pode ser feita conforme Tabela 5.6 a
seguir:
Como anteriormente (DIC), considerando os fatores A e B fixos tem-se,
a seguir, na Tabela 5.7 ANOVA para o esquema fatorial a*b no DBCC.
Tabela 5.7 tabela geral de ANOVA para um esquema fatorial em DBCC
Causa de
Variao
GL SQ QM F
Blocos 1 r
SQBloc QMBloc
-
Tratamentos 1 ab SQTrat QMTrat
Trat
F
A 1 a SQA QMA
A
F
B 1 b SQB QMB
B
F
AxB ( )( ) 1 1 b a B SQA B QMA
B A
F
Resduo ( )( ) 1 1 r ab SQRes QMRes
Total 1 abr
SQTot
Os clculos das somas de quadrados so estabelecidos por:
= = =
- - -
=
a
i
b
j
r
k
ijk
y n y SQTot
1 1 1
2 2
, onde
= = =
- - -
=
a
i
b
j
r
k
ijk
y
n
y
1 1 1
1
e abr n = ;
2
1 1
2
- - -
= =
-
=
y n
r
y
SQTrat
a
i
b
j
ij
, onde
=
-
=
r
k
ijk ij
y y
1
;
2
1
2
- - -
=
- -
=
y n
ab
y
SQBloc
r
k
k
, onde
= =
- -
=
a
i
b
j
ijk k
y y
1 1
;
SQBloc SQTrat SQTot SQRes =
2
1
2
- - -
=
- -
=
y n
br
y
SQA
a
i
i
, onde
= =
- -
=
b
j
r
k
ijk i
y y
1 1
;
2
1
2
- - -
=
- -
=
y n
ar
y
SQB
b
j
j
, onde
= =
- -
=
a
i
r
k
ijk j
y y
1 1
;
SQB SQA SQTrat SQAxB =
Tabela 5.6 Quadro genrico de um experimento em BCC
Bloco
Tratamento
A
1
B
1
A
1
B
b
A
a
B
1
A
a
B
b
Bloco 1 Y
111
y
1b1
y
a11
y
ab1
Bloco 2 Y
112
y
1b2
y
a12
y
ab2
Bloco r Y
11r
y
1br
y
a1r
y
abr
44
Delineamento de Experimentos
A obteno dos quadrados mdios realizada pela diviso entre as somas
de quadrados e os respectivos graus de liberdade.
As ponderaes sobre os testes de hipteses so as mesmas realizadas no
DIC, cujas hipteses gerais so estabelecidas por:
0 A fator do efeito existe No :
2 1 0
= = = =
a
A
H u u u .
Sob a veracidade de
A
H
0
a estatstica do teste dada por
( )
res
a A
F
QMRes
QMA
F
; 1
~
= , com a regra de deciso habitual (rejeita-se
A
H
0
quando
tab calc
F F > ).
0 B fator do efeito existe No :
2 1 0
= = = =
b
B
H
Sob a veracidade de
B
H
0
a estatstica do teste dada por
( )
res
b B
F
QMRes
QMB
F
, 1
~
= , com a regra de deciso habitual.
( ) ( ) 0 AxB interao de efeito existe No :
11 0
= = =
ab
AxB
H u u
Sob a veracidade de
AxB
H
0
a estatstica do teste dada por
( )( ) ( )
res
b a AxB
F
QMRes
QMAxB
F
; 1 1
~
= , com a regra de deciso habitual.
semelhana do DIC, tm-se os dois casos para o teste de comparaes
mltiplas de Tukey.
Teste de Tukey para o caso
AxB
F no significante ( ) o >
AxB
p
- -
=
' 0
:
i i
A
H ( ) = a i i ,..., 1 ' , no existe diferena entre as respostas mdias
dos nveis i e i do fator A.
Calcula-se ( ) ( )
( )
r
QMRes
q DMS
res
a A A o
o o
; ;
= A = e se ( ) o
A i i
y y A >
- - - - '
, rejeita-se a
hiptese
A
H
0
. Caso contrrio, no h rejeio.
' 0
:
j j
B
H
- -
= ( ) = b j j ,..., 1 ' , no existe diferena entre as respostas mdias dos
nveis j e j do fator B.
Calcula-se ( ) ( )
( )
ar
QMRes
q DMS
res
b B B o
o o
; ;
= A = e se ( ) o
B j j
y y A >
- - - - '
, rejeita-se
B
H
0
. Caso contrrio, no h rejeio.
Teste de Tukey para o caso
AxB
F significante ( ) o <
AxB
p
45
Delineamento de Experimentos
j i ij
j
B A
H
' 0
:
/
= ( ) = fixo e ,..., 1 ' , j a i i no existe diferena entre as respostas mdias
dos nveis i e i do fator A dentro do j-simo nvel do fator B.
Calcula-se ( ) ( )
( )
r
QMRes
q DMS
res
a B A B A o
o o
; ; / /
= A = e se ( ) o
B A j i ij
y y
/ '
A >
- -
,
rejeita-se
j
B A
H
/
0
. Caso contrrio, no h rejeio.
' 0
:
/
ij ij
i
A B
H = ( ) = fixo e ,..., 1 ' , i b j j no existe diferena entre as respostas mdias
dos nveis j e j do fator B dentro do i-simo nvel do fator A.
Calcula-se ( ) ( )
( )
r
QMRes
q DMS
res
b A B A B o
o o
; ; / /
= A = e se ( ) o
A B ij ij
y y
/ '
A >
- -
, rejeita-
se
i
A B
H
/
0
. Caso contrrio, no h rejeio.
5.5. Exemplo de Fatorial a*b no DBCC
Considere o seguinte conjunto de dados de um fatorial 2x2 em um
delineamento em blocos completos casualizados para avaliar o efeito da inibio
prolongada de enzima de converso da angiotensina sobre o dimetro diastlico do
ventrculo esquerdo (DDVE), avaliado em mm, em ratos com sobrecarga pressrica
persistente (Bregagnollo et al.,2005, Arquivos Brasileiros de Cardiologia, v.84, n.3,
p.225-232).
Fator A (Droga): A
1
(bandagem artica (EA
0
)-no tratados) e A
2
(bandagem
artica (EA
0
)-tratados com lisinopril);
Fator B (Momento Sacrifcio): B
1
(6 semana) e B
2
(21 semana);
Blocos (Faixa de peso do animal): Bloco1(70|75g), Bloco2(75|80g),
Bloco3(80|85g), Bloco4(85|90g), Bloco5(90|95g) e Bloco6(95|100g).
O esquema de fatores pode ser apresentado como a seguir:
Droga
Momento Sacrifcio
6 Semana (B
1
) 21 Semana (B
2
)
Ausente (No tratada) (A
1
) A
1
B
1
A
1
B
2
Presente (Lisinopril) (A
2
) A
2
B
1
A
2
B
2
46
Delineamento de Experimentos
Dimetro Diastlico do Ventrculo Esquerdo (mm)
Faixa de peso
Tratamento
A
1
B
1
A
1
B
2
A
2
B
1
A
2
B
2
70 | 75g 7,8 9,8 8,0 8,6
75 | 80g 7,2 10,0 7,6 8,8
80 | 85g 8,4 9,9 8,3 8,5
85 | 90g 7,8 10,8 7,5 8,4
90 | 95g 8,0 9,6 8,6 8,9
95 | 100g 7,6 8,7 8,0 7,8
Mdia DP 7,80,40 9,800,68 8,000,42 8,500,39
285 , 19 215 , 1744 5 , 1763 525 , 8 24 8 , 7 8 , 7
2 2 2
= = + + = SQTot
565 , 14 215 , 1744 78 , 1758 525 , 8 24
6
0 , 51
6
0 , 48
6
8 , 58
6
8 , 46
2
2 2 2 2
= = + + + = SQTrat
815 , 1 215 , 1744 03 , 1746 525 , 8 24
6 2
0 , 99
6 2
6 , 105
2
2 2
= =
= SQA
375 , 9 215 , 1744 59 , 1753 525 , 8 24
6 2
0 , 99
6 2
8 , 94
2
2 2
= =
= SQB
375 , 3 375 , 9 815 , 1 565 , 14 = = SQAxB
Totais de blocos
2 , 34 6 , 8 0 , 8 8 , 9 8 , 7
1
= + + + =
- -
y
6 , 33 8 , 8 6 , 7 0 , 10 2 , 7
2
= + + + =
- -
y
1 , 35 5 , 8 3 , 8 9 , 9 4 , 8
3
= + + + =
- -
y
5 , 34 4 , 8 5 , 7 8 , 10 8 , 7
4
= + + + =
- -
y
1 , 35 9 , 8 6 , 8 6 , 9 0 , 8
5
= + + + =
- -
y
1 , 32 8 , 7 0 , 8 7 , 8 6 , 7
6
= + + + =
- -
y
605 , 1 215 , 1744 82 , 1745 525 , 8 24
2 2
1 , 32
2 2
6 , 33
2 2
2 , 34
2
2 2 2
= =
+ +
= SQBloc
115 , 3 565 , 14 605 , 1 285 , 19 = = SQRes
Quadro auxiliar
A
B Total
(Fator A)
525 , 8
24 ; 6 ; 2 ; 2
=
= = = =
- - -
y
n r b a
B
1
B
2
A
1
46,8 58,8 105,6
A
2
48,0 51,0 99,0
Total
(Fator B)
94,8 109,8 204,6
47
Delineamento de Experimentos
Tabela 5.5 ANOVA para o DDVE
Causa de
Variao
GL SQ QM F
Blocos 5 1,605 0,321 -
Tratamentos 3 14,565 4,855 23,34 (p<0,01)
A 1 1,815 1,815 8,73 (P<0,01)
B 1 9,375 9,375 45,07 (p<0,01)
AxB 1 3,375 3,375 16,23 (p<0,01)
Resduo 15 3,115 0,208
Total 23 19,285
O resultado do teste de interao entre os fatores A e B mostrou-se
significante (p<0,01), logo, o teste de Tukey deve ser feito no desmembramento da
interao.
Considere =0,05, ento tem-se:
( ) ( )
( )
mm 56 , 0
6
208 , 0
01 , 3
6
% 5 % 5
15 ; 2 %; 5 / /
= = = A =
QMRes
q DMS
j j
B A B A
( ) ( )
( )
mm 56 , 0
6
208 , 0
01 , 3
6
% 5 % 5
15 ; 2 %; 5 / /
= = = A =
QMRes
q DMS
i i
A B A B
Tabela 5.6 Mdia e desvio padro do DDVE (mm) segundo droga e
momento de sacrifcio
Droga (Grupo)
Momento de Sacrifcio
6 Semana 21 Semana
Ausente (Controle) 7,800,40 a
(1)
A
(2)
9,800,68 b B
Presente (Lisinopril) 8,000,42 a A 8,500,39 a A
1)
(1)
duas mdias seguidas de uma mesma letra minscula no diferem (p>0,05) quanto aos respectivos grupos,
fixada a semana de sacrifcio.
(2)
(2)
duas mdias seguidas de uma mesma letra maiscula no diferem (p>0,05) quanto aos respectivos
momentos de sacrifcio, dentro do grupo.
5.6. Exerccios (Esquemas Fatoriais: DIC e DBCC)
1) O consumo dirio de rao em kg/dia, no perodo de crescimento-acabamento de
sunos foi observado em um esquema envolvendo tipos de rao e formas de
arraoamento em um delineamento em blocos completos ao acaso.
Considerando =0,05 estudar o consumo mdio dirio em funo dos dois
fatores.
Rao Arraoamento
Bloco
A B C D E
Farelada Livre (Vontade) 2,63 2,68 2,74 2,84 2,76
Farelada Controlada 2,45 2,36 2,44 2,50 2,40
Granulada Livre (Vontade) 2,32 2,25 2,16 2,24 2,38
Granulada Controlada 2,44 2,50 2,42 2,55 2,54
2) Um experimento visando verificar o efeito do inseticida e do meio de cultura em
organismos biolgicos foi planejado utilizando-se drosfilas e observando a
longevidade (dias de sobrevida) destas moscas. Os tratamentos utilizados foram
os seguintes:
48
Delineamento de Experimentos
A
1
B
1
: atrazine e carncia de glicose;
A
1
B
2
: atrazine e carncia de hidrato de carbono;
A
2
B
1
: dalapon e carncia de glicose;
A
2
B
2
: dalapon e carncia de hidrato de carbono.
Tratamento Repetio
A
1
B
1
49 50 51 54
A
1
B
2
36 37 35 32
A
2
B
1
38 31 35 37
A
2
B
2
34 30 28 25
Considerando o nvel de significncia 5% e os dados sob a transformao raiz
quadrada avaliar a sobrevida mdia das moscas segundo os tipos de inseticida e
meios de cultura.
3) Organize os tratamentos de um esquema fatorial para estudar a interao de uma
droga administrada em trs condutas diferentes (manh, tarde, noite) com bebida
alcolica.
4) Verificar se existe interao significante (p<0,05) entre os fatores A e B
estudados em um delineamento em blocos completos casualizados.
Fator A Fator B
Bloco
I II III IV
A
1
B
1
16 17 19 12
A
1
B
2
24 23 27 22
A
2
B
1
22 21 23 22
A
2
B
2
33 35 35 32
5.7. Respostas dos Exerccios (Esquemas Fatoriais : DIC e DBCC)
1)
Tabela 1. ANOVA para o consumo de rao
C. Variao GL SQ QM F
Blocos 4 0,030 0,008 -
Tratamentos 3 0,546 0,182 45,50 (p<0,001)
Rao ( R ) 1 0,200 0,200 50,00 (p<0,001)
Arraoamento ( A) 1 0,008 0,008 2,00 (p>0,05)
A R 1 0,338 0,338 84,50 (p<0,001)
Resduo 12 0,048 0,004
Total 19 0,624
Tabela 2. Mdia (desvio padro) do consumo de rao segundo rao e arraoamento
Rao
Arraoamento
Livre Controlada
Farelada 2,730 (0,080) b B 2,430 (0,053) a A
Granulada 2,270 (0,084) a A 2,490 (0,058) a B
DHS (Rao/Arraoamento) = 0,087 (letras minsculas)
DHS (Arraoamento/Rao) = 0,087 (letras maisculas)
49
Delineamento de Experimentos
2)
Tabela 1. ANOVA para os dias de sobrevida
(*)
C. Variao GL SQ QM F
Tratamento 3 6,539 2,180 35,21 (p<0,001)
Inseticida ( I ) 1 2,967 2,967 47,86 (p<0,001)
Meio ( M ) 1 3,089 3,089 49,82 (p<0,001)
M I 1 0,483 0,483 7,79 (p<0,05)
Resduo 12 0,743 0,062
Total 15 7,282
(*)
Varivel sob a transformao raiz quadrada
Tabela 2. Mdia (desvio padro) da raiz quadrada da sobrevida segundo
inseticida e meio de cultura
Inseticida
Meio de cultura (carncia)
Glicose Hidrato de Carbono
Atrazine 7,140 (0,150) b B 5,914 (0,184) b A
Dalapon 5,933 (0,264) a B 5,400 (0,348) a A
DHS (Inseticida/Meio) = 0,384 (letras minsculas)
DHS (Meio/Inseticida) = 0,384 (letras maisculas)
3) Fator A (Bebida Alcolica): A1 (Ausente) e A2(Presente)
Fator B (Perodo de Administrao): B1(Manh), B2(Tarde) e B3(Noite)
Tratamentos: A1B1(Bebida Ausente e Perodo Manh)
A1B2(Bebida Ausente e Perodo Tarde)
A1B3(Bebida Ausente e Perodo Noite)
A2B1(Bebida Presente e Perodo Manh)
A2B2(Bebida Presente e Perodo Tarde)
A2B3(Bebida Presente e Perodo Noite)
4)
Tabela 1. ANOVA para a varivel estudada
C. Variao GL SQ QM F
Blocos 3 32,19 10,73 -
Tratamento 3 652,19 217,40 39,38 (p<0,001)
A 1 248,07 248,07 44,94 (p<0,001)
B 1 390,07 390,07 70,67 (p<0,001)
B A 1 14,05 14,05 2,55 (p>0,05)
Resduo 9 16,56 5,52
Total 15 700,94
) 05 , 0 ( 55 , 2 > = p F
INT
; ou seja, o resultado do teste da interao dos
fatores A e B no significante.
50
Delineamento de Experimentos
6. Anlise de Aderncia e Associao
6.1. Introduo
Consideremos o estudo de variveis aleatrias (que podem ser
qualitativas ou quantitativas) cujos elementos da amostra podem ser classificados em
categorias, ou intervalos, ou classes ou ainda atributos. Em particular, o estudo ser
aprofundado em tabelas de dupla entrada em que se apresenta a situao geral, em que
duas variveis aleatrias qualitativas X e Y foram classificadas em r categorias para X e
s categorias para Y.
6.2. Teste de Aderncia
Considere que se tem uma populao e que o objetivo proposto
consiste em verificar se ela segue uma distribuio especificada
0
, ou seja, testar a
hiptese H
0
: =
0
. Nesta situao, o teste estatstico comparar o nmero de casos
ocorridos (frequncias observadas) em caselas especificadas, com o nmero esperado
(frequncias esperadas) de casos, sob a veracidade da hiptese nula H
0
.
O procedimento consiste em considerar classes, segundo as quais a
varivel X, caracterstica em estudo da populao, pode ser classificada (a varivel X
pode ser qualitativa ou quantitativa).
A situao geral com r categorias pode ser apresentada conforme Tabela
6.1.
Tabela 6.1 Distribuio do nmero de casos segundo classe de X
Classe de X Nmero de casos
Classe 1 n
1
(fo
1
)
Classe 2 n
2
(fo
2
)
Classe r n
r
(fo
r
)
Total n (fo
)
Lembrar que:
n
1
+n
2
+...+n
r
=n, ou seja,
fo
1
+fo
2
+...+fo
r
=fo
(total de casos)
As hipteses so apresentadas como:
r
r
H
0 0 2 0 1 0
; ; :
2 1
t t t t t t = = = ; i H
i
algum para Existe :
i 0 1
t t = .
As frequncias esperadas (fe
i
) do modelo multinomial (r classes) so
obtidas sob a veracidade de H
0
, especificadas na expresso:
i
n fe
i 0
t = ; onde n o
nmero total de casos e
i
0
t , a proporo terica da classe i expressa em H
0
.
51
Delineamento de Experimentos
A estatstica do teste, sob veracidade de H
0
, dada por
( )
( )
2
1
1
2
2
~
=
=
r
r
i i
i i
fe
fe fo
_ _ , com a regra de deciso habitual (isto ,
( )
2
1 ;
2
>
r calc o
_ _ ,
rejeita-se H
0
. Caso contrrio, no h rejeio). Deve ser considerado a unilateralidade
direita do teste.
O emprego apropriado do teste recomenda sua utilizao somente
quando no existir mais de 20% das caselas com frequncias esperadas menores que 5.
A prtica biolgica permite a juno de classes adjacentes para contornar essa situao
sempre que possvel.
Exemplos
1) Um modelo gentico especifica que animais de certa populao devem estar
classificados em quatro categorias, nas propores 8:1:1:2. Numa amostra de
180 animais da populao encontra-se 116, 15, 20 e 29 animais de cada
categoria, respectivamente. Verificar, no nvel de significncia 5%, se os dados
esto de acordo com o modelo gentico especificado.
Categoria
Frequncia
Observada
C1 116
( ) 4 , 3 , 2 , 1 um menos pelo para , Existe :
12
2
;
12
1
;
12
1
;
12
8
2 : 1 : 1 : 8 do Especifica Modelo :
0 i 1
0 0 0 0
0
4 3 2 1
= =
= = = =
i i H
H
i
t t
t t t t
C2 15
C3 20
C4 29
Total 180
Frequncias Esperadas
Categoria 1 animais 120
12
8
180 = =
i
fe ,
Categoria 2 animais 15
12
1
180
2
= = fe ,
Categoria 3 animais 15
12
1
180
3
= = fe ,
Categoria 4 animais 30
12
2
180
4
= = fe .
Logo, tem-se
( ) ( ) ( ) ( )
833 , 1 033 , 0 667 , 1 000 , 0 133 , 0
30
30 29
15
15 20
15
15 15
120
120 116
2 2 2 2
2
= + + + =
= _
( )
( ) 05 , 0 833 , 1 81 , 7
4
05 , 0
2 2
3 ; 05 , 0
> = =
)
`
=
=
p
r
_ _
o
No h rejeio de H
0
no nvel de 5% de significncia. Ou seja, a amostra de
animais est em acordo com modelo gentico especificado.
52
Delineamento de Experimentos
H
0
: Equilbrio Hardy-Weinberg
Aa Aa
AA Aa aa
4
1
;
2
1
;
4
1
3 2 1
0 0
= = = t t t
o
H
1
: No h Eq HW na descendncia
2) Considerando-se uma amostra de 100 descendentes de uma populao, verificar
(nvel de 5% de significncia) a adequabilidade dos dados ao modelo gentico
Equilbrio Hardy-Weinberg.
Frequncia Esperada
Gentipo AA 25
4
1
100
1
= = fe
Gentipo Aa 50
2
1
100
2
= = fe
Gentipo aa 25
4
1
100
3
= = fe
Logo, tem-se
( ) ( ) ( )
18 , 1 64 , 0 50 , 0 04 , 0
25
25 29
50
50 45
25
25 26
2 2 2
2
= + + =
= _
( )
( ) 05 , 0 18 , 1 99 , 5
3
05 , 0
2 2
2 ; 05 , 0
> = =
)
`
=
=
p
r
_ _
o
Para =0,05, no h rejeio de H
0
, ou seja, a populao segue o equilbrio
Hardy-Weinberg.
6.3. Teste de Homogeneidade
Considere r populaes
1
,
2
,...,
r
distribudas em s categorias
mutuamente exclusivas. Objetiva-se verificar se as r populaes (
1
,...,
r
) podem ser
representadas por uma distribuio comum a todas ( )
r
H t t t = =
2 1 0
: contra a
alternativa em que pelo menos duas so distintas
( ) r i i i i H
i i
, , 1 ' , ; ' para Existe :
' 1
= = = t t .
Contemplando as r populaes em s categorias, as frequncias
observadas podem ser apresentadas na Tabela de dupla entrada rs (tabela de
contingncia rs)
Gentipo
Frequncia
Observada
AA 26
Aa 45
Aa 29
Total 100
53
Delineamento de Experimentos
Tabela 6.2 Resultados da categoria segundo populao
Populao
Categoria
Total
C
1
C
2
... C
s
P
1
fo
11
fo
12
... fo
1s
fo
1
P
2
fo
21
fo
22
... fo
2s
fo
2
P
r
fo
r1
fo
r2
... fo
rs
fo
r
Total fo
1
fo
2
... fo
s
fo
A hiptese de nulidade a ser testada estabelecida como:
= = =
= = =
= = =
rs s s
r
r
H
t t t
t t t
t t t
2 1
2 22 12
1 21 11
0
: , ou equivalentemente,
1
=
2
=...=
r
; contra a
alternativa
:
1
H pelo menos uma das igualdades no verificada.
As frequncias esperadas, considerando-se a hiptese H
0
verdade so
obtidas como:
s j r i
fo
fo fo
fo fe
j i
j i ij
,..., 1 e ,..., 1 para , = = = =
- -
- -
-
t
Sob a veracidade de H
0
, a estatstica do teste dada por:
( )
( )( )
2
1 1
1 1
2
2
~
= =
=
s r
r
i
s
j ij
ij ij
fe
fe fo
_ _ , com a regra de deciso habitual. Ou seja,
( )( ) ( )
2
1 1 ;
2
>
s r calc o
_ _ rejeita-se H
0
; caso contrrio, no h rejeio.
Exemplos
1) Duas novas drogas vo ser testadas em 200 pessoas portadoras de rinite alrgica.
Metade das pessoas recebe a droga A e a outra metade recebe a droga B.
Considerando os dados apresentados a seguir, teste a hiptese de que as duas
drogas so igualmente eficazes para tratar a doena (adotar =0,05).
Droga
Eficaz
Total
B Droga A Droga :
B Droga A Droga :
1
22 12
21 11
0
=
=
=
=
H
H
t t
t t
No Sim
A 25 75 100
B 32 68 100
Total 57 143 200
Frequncias Esperadas
5 , 28
200
100 57
11
=
= fe
5 , 71
200
100 143
12
=
= fe
54
Delineamento de Experimentos
5 , 28
200
100 57
21
=
= fe
5 , 71
200
100 143
22
=
= fe
( ) ( ) ( ) ( )
20 , 1 17 , 0 17 , 0 43 , 0 43 , 0
5 , 71
5 , 71 68
5 , 71
5 , 71 75
5 , 28
5 , 28 32
5 , 28
5 , 28 25
2 2 2 2
2
= + + + =
= _
( )
( ) 05 , 0 20 , 1 84 , 3
2
2
05 , 0
2 2
1 ; 05 , 0
> = =
=
=
=
p
s
r _ _
o
No nvel de 5% de significncia, no h rejeio de H
0
. Isto , as duas drogas so
igualmente eficazes, no nvel de 5% de significncia.
2) Foram consideradas as distribuies do tipo sanguneo do sistema MN em trs
populaes (grupos) de indivduos, conforme dados apresentados abaixo:
Grupo
Tipo Sanguneo
Total
MM MN NN Verificar, no nvel de 5% de
significncia, se h diferena
entre os grupos quanto a
distribuio do tipo sanguneo.
Controle 50 40 50 140
Gastrite 15 20 20 55
lcera 25 20 10 55
Total 90 80 80 250
H
0
: Controle = Gastrite = lcera
H
1
: Existe pelo menos uma diferena entre os grupos
A seguinte tabela de frequncias esperadas pode ser elaborada:
Grupo
Tipo Sanguneo
MM MN NN
Controle 50,4 44,8 44,8
Gastrite 19,8 17,6 17,6
lcera 19,8 17,6 17,6
( ) ( ) ( )
6 , 17
6 , 17 10
8 , 44
8 , 44 40
4 , 50
4 , 50 50
2 2 2
2
+ +
= _
2818 , 3 3273 , 0 3657 , 1 3273 , 0 3273 , 0 1636 , 1 6036 , 0 5143 , 0 0032 , 0
2
+ + + + + + + + = _
91 , 7
2
= _
( )
( ) 05 , 0 91 , 7 49 , 9
3
3
05 , 0
2 2
4 ; 05 , 0
> = =
=
=
=
p
s
r _ _
o
No h rejeio de H
0
, ou seja, no nvel de 5% de significncia os grupos no
diferem quanto a distribuio do tipo sanguneo.
6.4. Teste de Independncia
Uma situao muito interessante na rea biolgica consiste em
considerar duas caractersticas (variveis biolgicas) avaliadas numa amostra de
55
Delineamento de Experimentos
indivduos e, verificar se a probabilidade de um indivduo qualquer ser classificado nas
categorias ( ) ( ) s j j r i i ,..., 1 e ,..., 1 = = simultaneamente, pode ser obtido pelo produto das
probabilidades marginais. Ou seja, verificar se as duas caractersticas so
independentes.
Considerando a tabela de dupla entrada com r linhas e s colunas,
objetiva-se testar as hipteses:
j i ij
H
- -
= t t t :
0
para todo par ( j i, ) as caractersticas estudadas so
independentes;
j i ij
H
- -
= t t t :
1
para algum par ( j i, ) as caractersticas estudadas so
dependentes.
As frequncias esperadas, considerando-se H
0
verdade, so dadas por
- -
- -
=
fo
fo fo
fe
j i
ij
. Resultado idntico ao utilizado no teste de homogeneidade.
Sob a veracidade de H
0
, a estatstica do teste expressa como
( )
( )( )
2
1 1
1 1
2
2
~
= =
=
s r
r
i
s
j ij
ij ij
fe
fe fo
_ _ , com a regra de deciso habitual.
Exemplos
1) A tabela a seguir relaciona resultados de uma pesquisa obtidos de uma amostra
aleatria de vtimas de diferentes crimes. Utilizando =0,05, verificar se o tipo
de crime independente do fato do criminoso ser um estranho.
Criminoso
Crime
Total
Homicdio Roubo Assalto
Estranho 15 400 230 645
Conhecido 45 100 210 355
Total 60 500 440 1000
crime de tipo e estranho ser criminoso entre cia Independn :
1,2,3 j 1,2; i
todo para
0
|
|
.
|
\
|
=
= =
- - j i ij
H t t t
crime de tipo e estranho ser criminoso entre a Dependnci :
1,2,3 j 1,2; i
algum para
1
|
|
.
|
\
|
=
= =
- - j i ij
H t t t
Frequncias Esperadas
7 , 38
1000
645 60
11
=
= fe ; 5 , 322
1000
645 500
12
=
= fe ; 8 , 283
1000
645 440
13
=
= fe
3 , 21
1000
355 60
21
=
= fe ; 5 , 177
1000
355 500
22
=
= fe ; 2 , 156
1000
355 440
23
=
= fe .
( ) ( ) ( )
=
+ +
=
2 , 156
2 , 156 210
5 , 322
5 , 322 400
7 , 38
7 , 38 15
2 2 2
2
_
07 , 122 53 , 18 84 , 33 37 , 26 20 , 10 62 , 18 51 , 14
2
= + + + + + = _
56
Delineamento de Experimentos
( )
( ) 001 , 0 07 , 122 99 , 5
3
2
05 , 0
2 2
2 ; 05 , 0
< = =
=
=
=
p
s
r _ _
o
No nvel de 5% de significncia existe dependncia entre o tipo de crime
cometido e o fato do criminoso ser um estranho.
2) Os resultados da classificao de 100 pessoas segundo a cor dos olhos e do
cabelo foram os seguintes:
Cor do
Cabelo
Cor dos Olhos
Total
Castanhos Azuis Cinza No nvel de 5% de
significncia a cor dos
olhos est relacionada
com a cor do cabelo?
Claro 13 18 9 40
Escuro 37 12 11 60
Total 50 30 20 100
H
0
: H independncia entre a cor dos olhos e a cor do cabelo ( )
j i - -
= t t t
ij
H
1
: H dependncia entre a cor dos olhos e a cor do cabelo ( )
j i - -
= t t t
ij
Frequncias Esperadas
20
100
50 40
11
=
= fe ; 12
100
30 40
12
=
= fe ; 8
100
20 40
13
=
= fe
30
100
50 60
21
=
= fe ; 18
100
30 60
22
=
= fe ; 12
100
20 60
23
=
= fe .
( ) ( ) ( )
12
12 11
12
12 18
20
20 13
2 2 2
2
+ +
= _
29 , 9 08 , 0 00 , 2 63 , 1 13 , 0 00 , 3 45 , 2
2
= + + + + + = _
( )
( ) 01 , 0 29 , 9 99 , 5
3
2
05 , 0
2 2
2 ; 05 , 0
< = =
=
=
=
p
s
r _ _
o
No nvel de 5% de significncia rejeita-se H
0
, ou seja, existe dependncia
(relao) entre a cor dos olhos e a cor do cabelo.
6.5. Exerccios (Testes de Aderncia e Associao)
1) Suponha que um teste de aptido verbal tenha sido aplicado a um grupo de 120
adolescentes do gnero masculino e 100 do gnero feminino. Os resultados esto
a seguir. Qual a concluso a respeito da associao entre gnero e aptido verbal
no nvel de 5% de significncia?
Gnero
Nvel de Aptido
Total
Superior Mdio Inferior
Feminino 25 55 20 100
Masculino 20 80 20 120
Total 45 135 40 220
2) Desejando-se colocar prova a hiptese de que a idade da me tem certa
influncia sobre o nascimento de criana prematura, um pesquisador verificou
que, dentre 90 casos de prematuridade, 40 envolviam mes com idade inferior a
18 anos; 15 envolviam mes de 18 a 35 anos e 35 mes com idade acima de 35
57
Delineamento de Experimentos
anos. No nvel de 5% de significncia, isto leva o pesquisador a manter sua
hiptese?
3) Em um teste qui-quadrado, quanto maior a diferena entre frequncias esperadas
e observadas, maior chance temos de: a) aceitar (no rejeitar) H
0
ou b) rejeitar
H
0
? Explicar a resposta.
4) Considere o seguinte resultado quanto ao tabagismo dos pais e filhos
Pais
Filhos
Tabagistas
No
Tabagistas
Tabagistas 49 16
No Tabagistas 106 79
Verificar no nvel de 5% de significncia a associao entre pais e filhos quanto
ao tabagismo
5) Conforme a herana mendeliana, a descendncia de certo cruzamento deveria ser
vermelha, preta ou branca na seguinte proporo: 9:3:4. Se um experimento
mostrou 74, 32 e 38 descendentes nessas categorias, a teoria est confirmada,
sendo =0,05?
6) A seguir so apresentados dados sobre a presena (ou no) de anomalia em
recm-nascidos vivos segundo o sexo.
Sexo
Anomalia
Ausente Presente
Masculino 586 14
Feminino 674 26
Verifique, no nvel de significncia 5%, se a proporo de recm-nascidos vivos
portadores de anomalia a mesma nos dois sexos.
7) Com base nos dados apresentados a seguir, verificar se a condio de vivo ou
natimorto homognea nos dois sexos, considerando-se =0,01.
Sexo
Condio
Vivo Natimorto
Masculino 825 25
Feminino 960 40
8) Considere a distribuio de ervilhas do cruzamento de plantas de sementes lisas
e albume amarelo com plantas de sementes rugosas e albume verde.
Sementes Frequncia
Amarelo-lisas 380
Amarelo-rugosas 100
Verde-lisas 130
Verde-rugosas 30
No nvel de significncia de 5%, os resultados esto de acordo com a teoria
postulada por Mendel (9:3:3:1, para as classes de sementes).
58
Delineamento de Experimentos
9) Considere uma amostra do ms de nascimento de 200 polticos brasileiros.
Verificar (=0,05) a hiptese de que o ms de nascimento tem uma distribuio
uniforme nos polticos brasileiros.
Ms Jan Fev Mar Abr Maio Jun Jul Ago Set Out Nov Dez
Frequncia 16 18 13 15 16 12 20 20 18 14 18 20
10) Numa Universidade, os estudantes de dois programas de ps-graduao
diferentes so submetidos ao mesmo exame de conhecimentos de redao
cientfica. Os conceitos obtidos foram os seguintes:
Programa de PG
Conceito
Fraco Regular Bom Excelente
XY 16 8 20 9
WZ 18 12 26 22
No nvel de significncia 5%, a distribuio dos conceitos homognea nos dois
programas?
11) Numa pesquisa 120 pares de gmeos foram classificados segundo o sexo e a
ordem que ocorreu o nascimento.
Primeiro a nascer
Segundo a nascer
Masculino Feminino
Masculino 38 22
Feminino 26 34
No nvel de significncia 5% verificar se o sexo e a ordem de nascimento so
independentes.
12) Foram amostrados 120 pares de gmeos classificados de acordo com o sexo com
o seguinte resultado:
Verificar, no nvel de significncia 5%, se a classificao do sexo est em
acordo com o modelo binomial ( )
2
1
; 2 B .
6.6. Respostas dos Exerccios (Testes de Aderncia e Associao)
1) ) 05 , 0 ( 40 , 3
2
> = p _
2) ) 01 , 0 ( 67 , 11
2
> = p _
3) Quanto mais os valores observados se afastam dos esperados, tm-se maiores
desvios (sendo o numerador do clculo elevado ao quadrado) e, portanto,
aumenta a chance de rejeitar a hiptese de nulidade (H
0
).
4) ) 01 , 0 ( 68 , 6
2
< = p _
5) ) 05 , 0 ( 64 , 1
2
> = p _
6) ) 05 , 0 ( 07 , 2
2
> = p _
7) ) 05 , 0 ( 52 , 1
2
> = p _
8) ) 05 , 0 ( 78 , 7
2
> = p _
9) ) 05 , 0 ( 08 , 5
2
> = p _
Situao Dois meninos Duas meninas Um menino e Uma menina
Frequncia 34 38 48
59
Delineamento de Experimentos
10) ) 05 , 0 ( 47 , 2
2
> = p _
11) ) 05 , 0 ( 82 , 4
2
< = p _
12) ) 05 , 0 ( 07 , 5
2
> = p _
60
Delineamento de Experimentos
7. Correlao Linear Simples
7.1. Introduo
Nas reas biolgicas, no raras vezes, o pesquisador est interessado em
estudar a maneira como duas variveis X e Y esto associadas e, mais ainda, medir o
seu grau de associao. Alguns exemplos que podem esclarecer essa situao so
bastante comuns em nosso cotidiano, quais so: afirmar que a presso arterial aumenta
quando a idade avana; a altura de uma rvore est relacionada ao permetro do tronco;
o desempenho de um atleta melhora com o treinamento, e assim por diante.
Em todas as situaes esto sendo considerados, simultaneamente, os
valores de duas variveis aleatrias mensuradas num mesmo indivduo, isto ,
observaes pareadas. Como j descrito anteriormente, busca-se verificar qual o sentido
e a intensidade da associao entre as variveis, mas jamais utilizar essa busca como
uma relao de causa e efeito. Ou seja, a observao de que duas grandezas podem
variar simultaneamente no mesmo sentido ou em sentidos contrrios, no implica a
presena de um relacionamento causal entre elas.
Em nosso curso ser considerado que a associao entre as variveis
pode ser estudada por meio de uma relao linear, ou seja, os pares de pontos
distribudos na vizinhana de uma reta.
Para melhorar o entendimento entre correlao e causalidade, suponha,
por exemplo, uma associao positiva entre o consumo de lquido de uma cidade e o
nmero de internaes por desidratao. A falcia da causalidade poderia levar a
diminuio de ingesto de lquido para diminuir o nmero de internaes por
desidratao. Lgico, que neste caso, uma terceira ou mais variveis (temperatura,
umidade relativa do ar,...) podem estar causando a correlao entre consumo de lquido
e nmero de internaes. Essas variveis so denominadas de variveis intercorrentes
(no conhecidas) e a falsa correlao que elas fornecem chamada de correlao
espria.
7.2. Diagrama de Disperso
O diagrama de disperso consiste de um grfico bidimensional (sistema
de eixos cartesianos (X,Y) onde so alocados os n pares de observaes das variveis
aleatrias X e Y.
O objetivo do diagrama de disperso possibilitar a visualizao da
relao existente entre as variveis X e Y. Se os pontos estiverem localizados na
61
Delineamento de Experimentos
vizinhana de uma reta h indicao de correlao, se X e Y crescem no mesmo sentido,
a indicao no sentido de correlao positiva, caso a variao acontea no sentido
oposto (contrrio), existe correlao negativa entre as variveis. A Tabela 7.1 apresenta
o desempenho fsico e psicolgico de mulheres obesas submetidas aos testes relativos
qualidade de vida das participantes.
Tabela 7.1 Desempenho fsico e psicolgico de mulheres
obesas submetidas ao Deep water running and quality of life in
obese women (Arquivos Mdicos do ABC, v.32, p.5-10, 2007)
Mulher D. Fsico (%) D. Psicolgico (%)
M1 30 35
M2 40 50
M3 75 70
M4 50 50
M5 35 30
M6 60 65
M7 70 55
M8 55 55
20
30
40
50
60
70
80
20 30 40 50 60 70 80 90
D. Psicolgico
D. Fsico
Figura 7.1 Diagrama de Disperso dos Domnios
Fsico (%) e Psicolgico (%)
A inspeo visual, mostra de maneira subjetiva, a tendncia linear nas
observaes no sentido positivo, ou seja, as mulheres mostraram associao direta nas
respostas dos domnios fsico e psicolgico. A intensidade dessa associao pode ser
mensurada, objetivamente, pelo coeficiente de correlao linear de Pearson, sendo que a
intensidade ser tanto maior quanto menor for a disperso dos pontos em relao
tendncia linear.
7.3. Coeficiente de Correlao
A medida do grau (intensidade) de associao linear entre duas variveis
aleatrias quantitativas (numricas) pode ser estabelecida pelo coeficiente de correlao
de Pearson, representado por r e expresso para n pares (x
i
, y
i
) de uma amostra aleatria
das variveis X e Y como:
62
Delineamento de Experimentos
yy xx
xy
S S
S
r = , onde
( ) ( )( )
= =
= = =
n
i
i i
n
i
i i xy
y x n y x y y x x Y X SP S
1 1
, ;
( ) ( )
= =
= = =
n
i
i
n
i
i xx
x n x x x X SQ S
1
2 2
1
2
;
( ) ( )
2
1
2
1
2
y n y y y Y SQ S
n
i
i
n
i
i yy
= = =
= =
.
Algumas consideraes interessantes podem ser feitas a respeito do valor
de r:
a) 1 1 s s r ;
b) 1 + = r , correlao perfeita positiva (todos os pontos esto sobre uma linha reta
crescente);
c) 1 = r , correlao perfeita negativa (todos os pontos esto sobre uma linha reta
decrescente);
d) 0 = r ; correlao nula (ausncia de associao linear entre as variveis X e Y);
e) r adimensional.
Exemplos
1) Considerando os dados da Tabela 7.1, tem-se:
=
= + + =
8
1
415 55 30
i
i
x , portanto, 875 , 51 = x ;
23375 55 30
2 2
8
1
2
= + + =
=
i
i
x ;
( ) 875 , 1846 875 , 51 8 23375
2
= = = X SQ S
xx
;
410 55 35
8
1
= + + =
=
i
i
y , portanto, 25 , 51 = y ;
22300 55 35
2 2
8
1
2
= + + =
=
i
i
y ;
( ) 5 , 1287 25 , 51 8 22300
2
= = = Y SQ S
yy
;
22625 3025 2000 1050 55 55 50 40 35 30
8
1
= + + + = + + + =
=
i
i i
y x ;
( ) 25 , 1356 25 , 51 875 , 51 8 22625 , = = = Y X SP S
xy
;
logo 88 , 0 8795 , 0
0284 , 1542
25 , 1356
5 , 1287 875 , 1846
25 , 1356
~ = =
= r
A magnitude da associao linear entre as variveis da ordem de 0,88,
mostrando que as mulheres que tiveram maiores porcentagens no domnio fsico
so tambm as de maiores valores percentuais no domnio psicolgico.
2) Considere as seguintes notas em Bioestatstica e Biofsica de 11 alunos de
Cincias Biolgicas selecionados aleatoriamente entre todos os matriculados,
conforme Tabela 7.2
63
Delineamento de Experimentos
Tabela 7.2 Notas de 11 alunos em Bioestatstica e Biofsica
Aluno A B C D E F G H I J K
Bioestatstica (X) 6,7 8,1 6,5 4,2 5,3 4,0 7,1 6,4 6,0 6,8 4,9
Biofsica (Y) 9,2 6,5 8,1 7,5 8,5 7,8 7,7 7,9 8,1 8,2 8,5
0 , 66
11
1
=
= i
i
x , logo 0 , 6 = x ; 88
11
1
=
= i
i
y , logo 0 , 8 = y ;
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ; 1 , 16 1 , 1 8 , 0 0 , 0
4 , 0 1 , 1 0 , 2 7 , 0 8 , 1 5 , 0 1 , 2 7 , 0
2 2 2
2 2 2 2 2 2 2 2
11
1
2
= + + +
+ + + + + + + =
= i
i
x x
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ; 64 , 4 5 , 0 2 , 0 1 , 0 1 , 0
3 , 0 2 , 0 5 , 0 5 , 0 1 , 0 5 , 1 2 , 1
2 2 2 2
2 2 2 2 2 2 2
11
1
2
= + + + +
+ + + + + + =
= i
i
y y
( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ; 07 , 2 5 , 0 1 , 1 2 , 0 8 , 0 1 , 0 5 , 0 5 , 1 1 , 2 2 , 1 7 , 0
11
1
= + + + + + =
=
i
i i
y y x x
24 , 0
64 , 8
07 , 2
64 , 4 1 , 16
07 , 2
=
= r
O coeficiente de correlao negativo (-0,24) mostra que os alunos com
maiores notas em Bioestatstica esto com menores notas em Biofsica, e vice-
versa. Porm, deve ser observado que o valor 24 , 0 = r expressa uma fraca
correlao linear negativa entre as variveis.
7.4. Teste de Hiptese da Correlao
Considerando as variveis aleatrias ( )
2
, ~
x x
N X t e ( )
2
, ~
y y
N Y t , as
hipteses a respeito da ausncia ou presena de associao linear entre as variveis X e
Y podem ser estabelecidas como:
0 :
0
=
xy
H (ausncia de associao linear entre as variveis X e Y)
0 :
1
=
xy
H (presena de associao linear entre as variveis X e Y).
Sob a veracidade de H
0
a estatstica do teste dada por:
( ) 2
2
~
1
2
=
n
t
r
n r
t , com a regra de deciso habitual ( ou seja, se
( ) 2 ,
2
>
n
t t
o
, rejeita-se
a hiptese H
0
; caso contrrio, no h rejeio).
Alternativamente, o valor do resultado do coeficiente de correlao linear
de Spearman ( r ) pode ser comparado com os valores crticos da Tabela 7.2, com a
seguinte regra de deciso:
Se
crit calc
r r > , rejeita-se H
0
ao nvel (0,05 ou 0,01) de significncia
estabelecido. Caso contrrio, no h rejeio da hiptese nula (ausncia de
associao linear entre X e Y).
64
Delineamento de Experimentos
Exemplos
1) Considerando os dados da Tabela 7.1 e =0,05, tem-se
0 :
0
=
xy
H (ausncia de associao linear)
0 :
1
=
xy
H (presena de associao linear)
( ) 01 , 0 54 , 4
475 , 0
156 , 2
88 , 0 1
6 88 , 0
2
< = =
= p t
( )
45 , 2
6 2 8
05 , 0
6 ; 025 , 0
=
)
`
= =
=
t
o
; 45 , 2 > t , portanto, rejeita-se H
0
.
No nvel de significncia 5% existe associao linear entre os domnios fsico e
psicolgico.
2) Considerando os dados das notas de Bioestatstica e Biofsica da Tabela 7.2,
tem-se:
0 :
0
=
xy
H (ausncia de associao linear)
0 :
1
=
xy
H (presena de associao linear)
( )
( ) 05 , 0 74 , 0
97 , 0
72 , 0
24 , 0 1
9 24 , 0
2
> =
= p t
( )
26 , 2
9
05 , 0
9 ; 025 , 0
=
)
`
=
=
t
o
; 26 , 2 < t , no se rejeita H
0
.
No nvel de significncia 5%, no foi possvel mostrar associao linear entre as
notas de Bioestatstica e Biofsica nos alunos de Cincias Biolgicas.
7.5. Exerccios (Correlao Linear Simples)
1) Um antroplogo mediu a largura e o comprimento de 30 crnios amostrados de
uma populao, obtendo um coeficiente de correlao r=0,75. Supondo =0,05,
verificar se existe associao entre as variveis.
2) Os valores das variveis X e Y devem ser medidos na mesma unidade para que
se possa calcular o coeficiente de correlao linear?
3) Considere a idade gestacional (semanas) e o peso ao nascer (kg), de uma
amostra casual de 10 recm-nascidos no HC/UNESP-Botucatu(SP).
No nvel de significncia 5%, verificar se existe associao linear entre a idade
gestacional e o peso ao nascer.
4) Em um experimento com carneiros foram determinados os seguintes resultados
no plasma dos animais:
Recm-nascido RN1 RN2 RN3 RN4 RN5 RN6 RN7 RN8 RN9 RN10
Idade
Gestacional
34 35 37 32 42 40 41 39 28 38
Peso ao Nascer 1,60 1,70 2,00 1,55 4,30 3,00 3,40 3,30 1,25 2,35
65
Delineamento de Experimentos
Carneiro 1 2 3 4 5 6 7 8 9
Conc. Albumina (g%) 2,3 3,5 4,8 1,9 2,7 5,8 4,6 5,4 3,9
Horm. Crescimento
(mg/ml)
41,4 48,6 56,4 40,3 45,3 61,4 52,0 54,0 42,8
Verificar se existe associao linear (=0,05) entre a concentrao de albumina e
o hormnio de crescimento no plasma de carneiros.
5) Apresenta-se a seguir uma matriz de correlao para instruo (X), salrio (Y) e
idade (Z) de uma amostra de 50 indivduos.
Varivel
Varivel
Instruo Salrio Idade
Instruo 1,00 0,60 -0,40 Quais correlaes so
significantes no nvel
0,05?
Salrio 1,00 0,50
Idade 1,00
6) A correlao entre aptido matemtica e lnguas estrangeiras, baseada em testes
para medir aptides, est por volta de 0,40. Qual deve ser o tamanho de uma
amostra de estudantes para estarmos certos (nvel de significncia 5%) de que o
valor do r obtido refutaria a hiptese H
0
: =0?
7) Como deve ser afetado o valor do coeficiente de correlao r se trocarmos as
variveis X por Y e Y por X?
8) D um exemplo de duas variveis que, sem dvida, esto altamente relacionadas
mas para as quais o valor de r seria pequeno pelo fato de a relao no ser linear.
9) Considere os seguintes dados relativos a altura e peso de 10 estudantes de uma
sala de aula e verifique, no nvel de significncia 5%, se as variveis esto
associadas linearmente.
Estudante E
1
E
2
E
3
E
4
E
5
E
6
E
7
E
8
E
9
E
10
Altura 124 161 126 184 172 140 158 135 180 174
Peso 65 76 64 95 86 68 70 68 92 87
10) Indique o erro na concluso
Fato: H uma associao linear significante (p<0,05) entre a renda pessoal e o
nmero de anos de escolaridade.
Concluso: Mais instruo tem como resultado maior renda pessoal.
11) Como afetado o valor do coeficiente de correlao linear quando se adiciona a
mesma constante a cada valor da varivel X?
12) Com base em uma amostra de 38 pares de valores foi obtido o coeficiente de
correlao r=0,45. Teste (=0,05) a hiptese de que o coeficiente de correlao
das variveis zero.
13) Um coeficiente de correlao expressa em nico nmero:
a) a intensidade de uma associao.
b) a direo de uma associao.
c) a intensidade e a direo de uma associao.
66
Delineamento de Experimentos
14) Verificar se existe associao significativa (=0,05) entre horas de estudo e nota
da prova, segundo os dados abaixo:
Aluno A B C D E F G H I K L M
Horas de estudo 4 1 3 5 8 3 6 7 7 6 2 4
Nota da prova 5 2 4 7 9 5 7 10 8 6 3 3
15) Um coeficiente de correlao linear de Pearson, baseado em uma amostra de
tamanho 18, foi calculado como 0,45. Pode-se concluir, no nvel de 5% de
significncia, que h associao entre as variveis X e Y?
16) Para uma amostra de tamanho 11, determinar o valor mnimo do coeficiente de
correlao r, de modo que a hiptese de ausncia de associao linear entre X e
Y(H
0
) seja rejeitada ao nvel de confiana 99% (isto , sempre que
crit
r r > ).
17) Nas questes seguintes aprofunde a discusso no erro de conduo.
a) Fato: H uma correlao linear significativa entre a renda pessoal e o nmero
de anos de escolaridade.
Concluso: mais instruo tem como resultado maior renda pessoal.
b) Fato: Indivduos fazem um teste de habilidade verbal e um teste de destreza
manual; os pares de observao acusam um coeficiente de correlao linear
muito prximo de zero.
Concluso: No h qualquer relacionamento entre os escores dos dois testes.
18) Explique o que est errado na seguinte afirmao: Determinou-se uma
associao linear forte, expressa pelo valor r=1,16, entre a avaliao do ensino
ministrado pela universidade indicada pelos estudantes e outra feito por
membros externos instituio.
7.6. Respostas dos Exerccios (Correlao Linear Simples)
1) ) 001 , 0 ( 00 , 6 < = p t
2) No. Basta que sejam variveis quantitativas
3) 900 , 0 = r ; ) 001 , 0 ( 84 , 5 < = p t
4) 914 , 0 = r ; ) 001 , 0 ( 96 , 5 < = p t
5)
( )
) 001 , 0 ( 20 , 5 < =
p t
SAL INST
( )
) 01 , 0 ( 02 , 3 < =
p t
IDADE INST
( )
) 001 , 0 ( 00 , 4 < =
p t
IDADE SAL
6) No mnimo composta por 25 estudantes
7) O valor permanece inalterado
8) Quantidade de adubao no solo e produo
9) 949 , 0 = r ; ) 001 , 0 ( 52 , 8 < = p t
10) A concluso est fazendo uma relao de causa e efeito, quando na realidade existe
apenas uma associao linear
11) O valor permanece inalterado
12) ) 05 , 0 ( 70 , 2 < = p t
13) c) a intensidade e a direo de uma associao
14) 921 , 0 = r ; ) 01 , 0 ( 48 , 7 < = p t
67
Delineamento de Experimentos
15) ) 05 , 0 ( 02 , 2 > = p t
16) 7348 , 0 > r ; portanto 7348 , 0 = r
17) a) Relao de causa e efeito para um indicativo apenas de associao.
b) No h associao linear, fato que no exclui a possibilidade de outro tipo de
relao.
18) O valor de r no pode ser maior que a unidade.
68
Delineamento de Experimentos
8. Regresso Linear Simples
8.1. Introduo
Os fenmenos biolgicos, quase que na plenitude das situaes, podem
ser explicados por meio de modelos matemticos e estocsticos. Um modelo comum e
de fcil entendimento biolgico que tem sido utilizado para estudar a relao funcional
entre duas variveis consiste na funo linear simples ( ) bX a Y + = .
Neste modelo, a idia consiste em estudar a variao da varivel aleatria
contnua Y (varivel dependente, varivel resposta ou varivel exgena) em funo de
uma varivel fixa X, isto , determinstica (varivel independente, varivel explanatria
ou varivel endgena). Por exemplo, verificar as quedas na quantidade de acar no
sangue de coelhos submetidos a doses diferentes de insulina (doses controladas).
Para melhor entendimento, considere o seguinte experimento realizado
na rea de Bioqumica. Um bioqumico colocou plasma humano em cinco tubos de
ensaio e depois adicionou procana (quantidade fixa em cada tubo). Essa substncia
um anestsico local que se decompe por hidrlise. Para estudar a velocidade da
hidrlise, o pesquisador observou, em tempos definidos e diferentes (4 min., 8 min., 12
min., 16 min. e 20 min.), a quantidade (moles/litro) de procana hidrolisada em cada
tubo de ensaio.
Esquematicamente:
Considerando o tempo com varivel independente (X) e a quantidade de
procana hidrolisada, como a varivel dependente (Y), como estabelecer o modelo da
resposta linear de Y em funo de X?
8.2. Modelo de Regresso Linear Simples
A origem do termo regresso deve-se a Sir Francis Galton ( 1822-1911 ),
ingls de classe alta que estudou medicina em Cambridge e explorou a frica antes de
se dedicar ao estudo da hereditariedade. A data do pioneirismo do uso aconteceu por
69
Delineamento de Experimentos
volta de 1885, quando estava investigando relaes antropomtricas de sucessivas
geraes, em resposta a seguinte interrogativa que fazia: Se as alturas das pessoas esto
distribudas normalmente em cada gerao, e se a altura hereditria, qual a relao
entre as geraes?. Uma das constataes verificada por Galton apontava que cada
particularidade de um homem transmitida aos seus descendentes, mas, em mdia,
numa intensidade menor. Ou seja, embora pais com baixa estatura tendam a ter filhos
tambm com baixa estatura, os filhos tm altura mdia maior que seus pais. Fato
semelhante, em sentido reverso, ocorre com pais com estatura alta. Isto , os filhos
apresentam estatura alta, mas, em mdia, menor que seus pais. Galton chamou esse
fenmeno de regresso para a mediocridade.
Em sua anlise, Galton denominou esse fenmeno de a altura mover-se
em direo altura dos pais de regresso, e s vezes de reverso, expressado num artigo
de 1885, publicado no Journal of the Anthropological Institute (Bussab & Morettin,
2003).
No contexto matemtico, que no foi o caso de Galton, o ajuste de uma
linha reta a quaisquer dados de duas variveis quantitativas pode ser feito pelo mtodo
dos mnimos quadrados criado pelo matemtico francs Legendre, por volta de 1805,
cujo procedimento de obteno dos parmetros envolvidos no modelo linear ser objeto
de estudo no presente desenvolvimento do contedo programtico da disciplina em
curso.
Em relao ao experimento da procana, inicialmente, como anlise
exploratria, torna-se interessante representar os pares de pontos (
i i
y x , ) em um grfico
no sistema cartesiano para verificar se h uma tendncia linear nos dados. Caso exista a
tendncia, o passo seguinte consiste em estabelecer o modelo de resposta linear
bX a Y + = . Se no for verificada a tendncia, a alternativa seria procurar outros
modelos (no-lineares), cujo enfoque no ser abordado no presente texto.
Para o grfico considere a Tabela 8.1 de valores:
Tabela 8.1 Valores observados nos tubos de ensaio
Tempo (X) 4 8 12 16 20
Quantidade hidrolisada (Y) 6 16 23 33 41
70
Delineamento de Experimentos
0
10
20
30
40
0 4 8 12 16 20
Quantidade
Hidrolisada
(moles/litro)
Tempo (min)
Figura 8.1 Diagrama de disperso dos dados
Como pode ser visualizado existe uma tendncia linear nos valores
observados no experimento. Ento, indaga-se: como procurar a equao da reta que
melhor descreve a hidrlise da procana em funo do tempo que foi adicionado no
plasma? Ou seja, como proceder ao ajuste de uma regresso linear simples (RLS) ao
conjunto de dados?
Ajustar uma RLS aos dados significa encontrar a equao da reta que
melhor descreve o fenmeno biolgico. O procedimento matemtico que permite
encontrar esse modelo de resposta denomina-se (para nosso estudo) Mtodo de
Mnimos Quadrados (MQ), cujo objetivo consiste em minimizar a soma dos quadrados
dos erros (ou desvios).
Para o ajuste da RLS e, posteriormente, para os testes de hipteses as
seguintes pressuposies so bsicas:
i) A relao entre as duas variveis linear.
ii) Os valores de X so fixos, isto , X varivel determinstica.
iii) A variabilidade de Y, para qualquer valor dado de X, sempre a mesma.
iv) O erro de uma observao no est correlacionado com o erro de outra observao
(erros no correlacionados).
v) Para qualquer dado valor de X, Y tem distribuio condicional normal
( ( ) ( )
2
; t | o = + = x y Var x x y E ).
Como descrito anteriormente, encontrar os estimadores de mnimos
quadrados para os parmetros (, ) do modelo, consiste em considerar uma amostra
aleatria de n pares ( ) n i y x
i i
, , 1 , , = ; e minimizar a quantidade de informao perdida
pelo modelo, ou seja, a soma dos quadrados dos erros dada por:
( ) ( ) ( )
= =
+ = =
n
i
i i
n
i
i
x y e SQ
1
2
1
2
, | o | o , com
i
e sendo o i-simo erro entre o
valor observado
i
y e o proposto pelo modelo ( )
i i
x x y E | o + = .
71
Delineamento de Experimentos
Derivando ( ) | o, SQ em relao a e e igualando a zero, tem-se que as
solues o (ou a) e |
| o ;
= = =
= +
n
i
i i
n
i
i
n
i
i
y x x x
1 1
2
1
| o ;
as quais produzem as solues:
x y a | o
= = ;
xx
xy
S
S
b = = |
; onde ( )
= =
= =
n
i
i
n
i
i xx
x n x x x S
1
2 2
1
2
e
( )( )
= =
= =
n
i
i i
n
i
i i xy
y x n y x y y x x S
1 1
.
Portanto, o modelo de regresso ajustado dado como:
( ) x x b y bx a x y
i i i i
+ = + = + = | o
.
No experimento bioqumico, tem-se
5 = n ; ) tempo(min : X ; (moles/L) a hidrolisad quantidade : Y ;
60 20 16 12 8 4
5
1
= + + + + =
= i
i
x , logo 12 = x ;
=
= + + + + =
5
1
2 2 2 2 2 2
880 20 16 12 8 4
i
i
x ;
160 720 880 12 5 880
2
= = =
xx
S ;
=
= + + + + =
5
1
119 41 33 23 16 6
i
i
y , logo 8 , 23 = y ;
=
= + + + + =
5
1
1776 41 20 33 16 23 12 16 8 6 4
i
i i
y x ;
348 8 , 23 0 , 12 5 1776 = =
xy
S ;
175 , 2
160
348
= = =
xx
xy
S
S
b ;
3 , 2 12 175 , 2 8 , 23 = = = x b y a ;
logo,
i i
x y 175 , 2 3 , 2 + = , isto , tempo id H Qt 175 , 2 3 , 2
+ = .
O modelo
i i
x y 175 , 2 3 , 2 + = , constitui-se num preditor da quantidade
de procana hidrolisada para qualquer tempo considerado no intervalo de 4min a 20min.
Alm disso, o valor 2,175 (denominado coeficiente angular da regresso) indica a
variao da varivel Y por unidade de variao em X, ou seja, para cada minuto
decorrido a quantidade de procana hidrolisada tem um acrscimo de 2,175 moles/litro.
O modelo estimado pode ser representado no sistema cartesiano por
meio de uma reta correspondente relao linear encontrada entre as variveis.
72
Delineamento de Experimentos
Ento, considerando
i i
x y 175 , 2 3 , 2 + = , tem-se:
( ) 4 , 6 4 175 , 2 3 , 2 4 = + = =
i i
y x ;
( ) 2 , 41 20 175 , 2 3 , 2 20 = + = =
i i
y x .
0
10
20
30
40
Qtidade
Hidrolisada
Tempo
Figura 8.2 Modelo de regresso linear da quantidade
hidrolisada em funo do tempo
i i
x y 175 , 2 3 , 2 + =
8.3. Coeficiente de Determinao
O coeficiente de determinao (R) indica a proporo da variao de Y
que explicada pela reta de regresso, ou seja, uma medida de preciso do modelo.
Portanto, sendo uma proporo seu valor varia entre zero e um, inclusive ( ) 1 0
2
s s R .
Fica mais prtico interpretar quando seu valor expresso em porcentagem, sendo 0% o
caso extremo de impreciso do modelo e, opostamente, 100% a reteno de toda
informao do fenmeno biolgico explicada pelo modelo ajustado. Valores entre essas
porcentagens limites so to pouco ou mais representativos quanto aos prximos dos
extremos que se alinharem. O clculo do coeficiente de determinao (R) envolve a
relao entre a soma de quadrados devida regresso e a soma total de quadrados
expressa na seguinte frmula:
yy xx
xy
S S
S
SQTotal
o SQRegress
R
2
2
= = . Se no existisse qualquer
variao em torno da reta de regresso (todos os pontos observados estivessem sobre a
reta estimada), no haveria resduos (erros) e, portanto, a soma de quadrados devida
regresso coincidiria com a soma total de quadrados, resultando ( ) % 100 0 , 1
2
= R .
Dificilmente essa condio acontece em biologia, uma vez que existe sempre uma
componente aleatria nas respostas biolgicas.
No experimento bioqumico, tem-se:
60
5
1
=
= i
i
x , com 12 = x ;
=
=
5
1
119
i
i
y , com 8 , 23 = y ;
=
=
5
1
2
880
i
i
x ; 3591
5
1
2
=
= i
i
y ;
=
=
5
1
1776
i
i i
y x ; resultando,
160 =
xx
S ; 8 , 758 =
yy
S ; 348 =
xy
S .
73
Delineamento de Experimentos
Logo, ( ) % 75 , 99 9975 , 0
8 , 758 160
348
2
2
=
=
n
t
R
R n
t
|
, com a regra de deciso habitual (rejeita-se H
0
, quando
( ) 2 ; 2
>
n
t t
o
). Alternativamente o valor da estatstica pode ser obtido como:
( )
e
xx
S
S b
t =
|
, onde
( )
|
|
.
|
\
|
=
xx
xy
yy e
S
S
S
n
S
2
2
2
1
.
No experimento bioqumico, tem-se
0 :
0
= | H (ausncia de RLS da quantidade de procana hidrolisada sobre o
tempo)
0 :
1
= | H (presena de RLS da quantidade de procana hidrolisada sobre o
tempo).
5 = n e 9975 , 0
2
= R , ento
( )
( )
( ) 001 , 0 6 , 34
9975 , 0 1
9975 , 0 2 5
< =
= p t
|
;
05 , 0 = o e 3 2 = n , tem-se
( )
18 , 3
3 ; 025 , 0
= t , logo (
( ) 3 ; 025 , 0
t t > ) rejeita-se H
0
.
Alternativamente:
160 =
xx
S ; 8 , 758 =
yy
S ; 348 =
xy
S e 175 , 2 = b
6333 , 0
160
348
8 , 758
2 5
1
2
2
=
|
|
.
|
\
|
=
e
S , com 7958 , 0 =
e
S
( )
( ) 001 , 0 6 , 34
7958 , 0
160 175 , 2
< = = p t
|
.
Nesse sentido, conclui-se que existe regresso linear significativa
(p<0,001) da quantidade de procana hidrolisada em funo do tempo.
8.5. Exerccios (Regresso Linear Simples)
1) Um laboratrio est interessado em medir o efeito da temperatura sobre a
potncia de um antibitico. Oito amostras de 50 gramas foram armazenadas a
diferentes temperaturas, e aps uma semana mediu-se a potncia. Os resultados
esto descritos a seguir.
74
Delineamento de Experimentos
Temperatura (C) 30 38 46 54 62 70 78 86
Potncia 45 41 39 32 28 23 10 17
a) Faa a representao grfica dos dados.
b) Ajuste a regresso linear simples da potncia como funo da temperatura.
c) A que temperatura a potncia seria nula?
2) Sejam X (durao da viagem, em dias) e Y(despesa, em US$, com viagem). Para
uma amostra de 102 viagens, obteve-se:
= 510 x ;
= 7140 y ;
= 4150
2
x ;
= 740200
2
y e
= 54900 xy .
a) Qual a reta de regresso de Y em funo de X?
b) Uma viagem ir durar sete dias. Qual a estimativa de despesa para a viagem?
3) Para construir um modelo linear relacionando a quantidade de erros
datilogrficos (Y) e o tempo de experincia (X) em meses, constituiu-se uma
amostra casual de 10 funcionrios, obtendo-se os seguintes resultados
numricos:
10 = n ; 0 , 6 = x ; 0 , 17 = y ; 100 =
xx
S ; 644 =
yy
S e 993 , 0 = r .
a) Determine o modelo de regresso linear de Y em X.
b) No nvel de significncia 5%, faa o teste de hiptese da regresso.
c) Encontre o valor do coeficiente de determinao.
4) Os dados a seguir referem-se a precipitao anual (cm) e a produo de algodo
(kg/ha) de uma amostra de sete produtores de uma dada regio do estado:
Precipitao 160 140 130 100 70 50 40
Produo 620 510 450 280 140 80 30
No nvel de significncia de 5%, verificar se existe RLS da produo de algodo
em funo de precipitao anual.
5) Se os filhos fossem exatamente 3 cm mais altos do que seus pais, como ficaria a
reta de regresso que daria a altura dos filhos em funo da altura dos pais?
6) Considere os dados da idade (em dias) e o peso (em gramas) de ratos machos da
raa Wistar.
Idade 25 28 30 32 34 35 38 40 42 43 45 46 47 48 49 50
Peso 62 61 66 69 74 75 80 82 88 89 91 95 95 97 99 99
Considerando o modelo RLS para o peso em funo da idade, quanto deve ser o
peso estimado de um rato com 33 dias de idade?
7) Suponha que, com base em 16 pares de observaes, obteve-se as seguintes
informaes: 896 =
x ; 655 =
y ;
= 52300
2
x ;
= 29652
2
y ;
38368 =
+ =
b) ( ) 00 , 94 $ 7
U DIAS DESPESA Y =
3) a) X Y 52 , 2 12 , 32
=
b) ( ) 001 , 0 74 , 23 < = p t
c) 986 , 0
2
= R
4) PRECIP D O PR 900 , 4 528 , 181
+ = ; ( ) 001 , 0 01 , 27 < = p t
5) PAI ALT FILHO T AL + = 3
6) IDADE SO E P 661 , 1 011 , 17
+ = , 50 25 s s IDADE .
( ) gramas 824 , 71 33
= DIAS SO E P
7) 676 , 0
2
= R (67,6% da variabilidade total dos dados explicada pelo modelo).
8) 10 =
XX
S ; 2 , 77 =
YY
S ; 27 =
XY
S
9718 , 0 = r ; 7 , 2 = b ; 7 , 2 =
XX
YY
S
S
r
Ou seja, fica mostrado que
XX
YY
S
S
r b = .
9) a) X Y 33 , 1 01 , 6
+ = , 6 1 s s X
b) ( ) 05 , 0 67 , 2 > = p t .
10) X Y 986 , 0 757 , 6
= , 90 30 s sTEMP
c) C TEMP 43 , 132 =
12) Coeficiente de regresso linear ( b )
13) b) PPAI LHO I PF 482 , 0 479 , 35
+ = ; 70 62 s s PPAI
( ) 05 , 0 34 , 2 < = p t
14) a) X Y 7826 , 0 8856 , 2
+ =
b) % 54 , 46 4654 , 0
2
= = R
15) AUT ARMAS CRIM A TAX 0012 , 0 304 , 5
+ =
( ) % 304 , 17 10000
= CRIM A TAX
77
Delineamento de Experimentos
9. Bibliografia
BOX, G. E. P. Non-normality and tests on variances. Biometrika, v.20, p.318-335,
1953.
BUSSAB, W.O. Anlise de varincia e regresso. So Paulo: Atual, 1986.
BUSSAB, W.O.; MORETTIN, P.A. Estatstica bsica. 5. ed. So Paulo: Saraiva, 2003.
DEAN, A. M.; VOSS D. T. Design and analysis of experiments. New York: Springer-
Verlag, 1999.
DRAPER, N. R.; SMITH, H. Applied regression analysis. 3. ed. New York: John
Willey, 1998.
MLODINOW, L. O andar do bbado. Como o acaso determina nossas vidas. Rio de
Janeiro: Zahar, 2009.
MONTGOMERY, D.C. Design and analysis of experiment, 3. ed. New York: John
Willey, 1991.
MOORE,D. A estatstica bsica e sua prtica. Rio de Janeiro: LTC Editora,1995.
NORMAN, G.R.; STREINER, D.L. Biostatistics: the bare essentials. 3. ed. St. Louis:
Mosby, 2008.
PADOVANI, C.R. Exerccios de estatstica bsica e experimental. Botucatu: Depto de
Bioestatstica, 2002.
PADOVANI, C.R. Planejamento de experimentos. Botucatu: Depto de Bioestatstica,
2009.
PERES, C.A.; SALDIVA, C.D. Planejamento de experimentos. So Paulo: 5. SINAPE,
1982.
SALSBURG, D. Uma senhora toma ch como a estatstica revolucionou a cincia
no sculo XX. Rio de Janeiro: Zahar, 2009.
VIEIRA, S. Estatstica experimental. 2. ed. So Paulo: Atlas, 1999.
VIEIRA, S. Anlise de varincia (ANOVA). So Paulo: Atlas, 2006.
ZAR, J.H. Boestatistical analysis, 5. ed. New Jersey: Prentice-Hall, 2009.
78
Delineamento de Experimentos
10. Tabelas
Tabela 10.1 Distribuio t de Student ( ) | | o = < < 1
0 0
t t t P .................................... 79
Tabela 10.2 Distribuio Qui-quadrado ( ) | | o _ _ = >
2
0
2
P ........................................... 80
Tabela 10.3 Distribuio F ( ) | | 01 , 0
0
= > F F P ............................................................ 81
Tabela 10.4 Distribuio F ( ) | | 05 , 0
0
= > F F P ............................................................ 82
Tabela 10.5 Distribuio F ( ) | | 10 , 0
0
= > F F P ............................................................ 83
Tabela 10.6 Distribuio studentized range
( )
| | ( ) % 1 :
; 01 , 0
Tukey q
............................. 84
Tabela 10.7 Distribuio studentized range
( )
| | ( ) % 5 :
; 05 , 0
Tukey q
............................. 85
Tabela 10.8 Distribuio studentized range
( )
| | ( ) % 10 :
; 10 , 0
Tukey q
............................ 86
Tabela 10.9 Valores crticos do coeficiente de correlao linear de Pearson (teste
bilateral) ..................................................................................................................... 87
79
Delineamento de Experimentos
Tabela 10.1 Distribuio t de Student ( ) | | o = < < 1
0 0
t t t P
80
Delineamento de Experimentos
Tabela 10.2 Distribuio Qui-quadrado ( ) | | o _ _ = >
2
0
2
P
81
Delineamento de Experimentos
Tabela 10.3 Distribuio F ( ) | | 01 , 0
0
= > F F P
82
Delineamento de Experimentos
Tabela 10.4 Distribuio F ( ) | | 05 , 0
0
= > F F P
83
Delineamento de Experimentos
Tabela 10.5 Distribuio F ( ) | | 10 , 0
0
= > F F P
84
Delineamento de Experimentos
Tabela 10.6 Distribuio studentized range
( )
| | ( ) % 1 :
; 01 , 0
Tukey q
85
Delineamento de Experimentos
Tabela 10.7 Distribuio studentized range
( )
| | ( ) % 5 :
; 05 , 0
Tukey q
86
Delineamento de Experimentos
Tabela 10.8 Distribuio studentized range
( )
| | ( ) % 10 :
; 10 , 0
Tukey q
87
Delineamento de Experimentos
n =.05 =.01
4 0,950 0,990
5 0,878 0,959
6 0,811 0,917
7 0,754 0,874
8 0,707 0,834
9 0,666 0,798
10 0,632 0,765
11 0,602 0,735
12 0,576 0,708
13 0,553 0,684
14 0,532 0,661
15 0,514 0,641
16 0,497 0,623
17 0,482 0,606
18 0,468 0,590
19 0,456 0,575
20 0,444 0,561
21 0,433 0,549
22 0,423 0,537
23 0,413 0,526
24 0,404 0,515
25 0,396 0,505
26 0,388 0,496
27 0,381 0,487
28 0,374 0,478
29 0,367 0,470
30 0,361 0,463
35 0,335 0,430
40 0,312 0,402
45 0,294 0,378
50 0,279 0,361
60 0,254 0,330
70 0,236 0,305
80 0,220 0,286
90 0,207 0,269
100 0,196 0,256
Tabela 10.9 Valores crticos do coeficiente de correlao linear de Pearson (teste bilateral)