Delineamento de Experimentos 2012

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 87

DELINEAMENTO DE EXPERIMENTOS

MATERIAL DIDTICO PARA A DISCIPLINA DE DELINEAMENTO


DE EXPERIMENTOS OFERECIDA AOS ALUNOS DE
GRADUAO EM CINCIAS BIOLGICAS E DA SADE PELO
PROF. DR. CARLOS ROBERTO PADOVANI, DEPARTAMENTO
BIOESTATSTICA IB/UNESP.










Edio Revisada e Ampliada











BOTUCATU
2012
2
Delineamento de Experimentos
SUMRIO
Introduo ................................................................................................................. 4
1. Delineamento de Experimentos .......................................................................... 5
1.1. Introduo .............................................................................................. 5
1.2. Delineamento ou Planejamento ou Desenho (Design) do Experimento 7
1.3. Principais Delineamentos Experimentais (Estudados no Curso) ............ 11
1.4. Exemplos ............................................................................................. 11
2. Delineamento Inteiramente Casualizado (DIC) com dados balanceados ........... 13
2.1. Modelo do Experimento ....................................................................... 13
2.2. Procedimento Estatstico: Anlise de Varincia .................................... 13
2.3. Independncia dos Erros ....................................................................... 14
2.4. Varincia Constante (Homocedasticidade) ........................................... 15
2.5. Normalidade dos Erros ......................................................................... 16
2.6. Tcnica da Anlise de Varincia (ANOVA) ......................................... 17
2.7. Coeficientes de Determinao e Variao de um Experimento ............. 21
2.8. Comparaes Mltiplas ........................................................................ 21
2.9. Exerccios (DIC com dados balanceados) ............................................. 23
2.10. Respostas dos Exerccios (DIC com dados balanceados) ...................... 24
3. Delineamento Inteiramente Casualizado (DIC) com dados no balanceados ..... 26
3.1. Consideraes Gerais ........................................................................... 26
3.2. Exerccios (DIC no balanceado) ......................................................... 28
3.3. Respostas dos Exerccios (DIC no balanceado) ................................... 29
4. Delineamento em Blocos Completos Casualizados (DBCC) ............................. 30
4.1. Introduo ............................................................................................ 30
4.2. Modelo do Experimento (Biolgico) .................................................... 31
4.3. Procedimento Estatstico: Anlise de Varincia .................................... 32
4.4. Comparaes Mltiplas ........................................................................ 33
4.5. Exerccios (DBCC) .............................................................................. 34
4.6. Respostas dos Exerccios (DBCC) ........................................................ 35
5. Esquemas Fatoriais .......................................................................................... 37
5.1. Introduo ............................................................................................ 37
5.3. Exemplo de Fatorial a*b no DIC .......................................................... 41
5.4. Esquema Fatorial a*b no DBCC ........................................................... 42
5.5. Exemplo de Fatorial a*b no DBCC ...................................................... 45
3
Delineamento de Experimentos
5.6. Exerccios (Esquemas Fatoriais: DIC e DBCC) .................................... 47
5.7. Respostas dos Exerccios (Esquemas Fatoriais : DIC e DBCC)............. 48
6. Anlise de Aderncia e Associao .................................................................. 50
6.1. Introduo ............................................................................................ 50
6.2. Teste de Aderncia ............................................................................... 50
6.3. Teste de Homogeneidade...................................................................... 52
6.4. Teste de Independncia ........................................................................ 54
6.5. Exerccios (Testes de Aderncia e Associao)..................................... 56
6.6. Respostas dos Exerccios (Testes de Aderncia e Associao) .............. 58
7. Correlao Linear Simples ............................................................................... 60
7.1. Introduo ............................................................................................ 60
7.2. Diagrama de Disperso......................................................................... 60
7.3. Coeficiente de Correlao .................................................................... 61
7.4. Teste de Hiptese da Correlao ........................................................... 63
7.5. Exerccios (Correlao Linear Simples) ................................................ 64
7.6. Respostas dos Exerccios (Correlao Linear Simples) ......................... 66
8. Regresso Linear Simples ................................................................................ 68
8.1. Introduo ............................................................................................ 68
8.2. Modelo de Regresso Linear Simples ................................................... 68
8.3. Coeficiente de Determinao ................................................................ 72
8.4. Teste do Coeficiente (Angular) de Regresso ....................................... 73
8.5. Exerccios (Regresso Linear Simples) ................................................. 73
8.6. Respostas dos Exerccios (Regresso Linear Simples) .......................... 76
9. Bibliografia ...................................................................................................... 77
10. Tabelas ............................................................................................................ 78
4
Delineamento de Experimentos
Introduo
O conceito de Cincia consiste no aprendizado adquirido por meio da experimentao e
de dados observados, segundo o qual a procura das causas, das leis, traduz-se num
processo iterativo de observao do real, da realizao de experimentos confirmatrios e
da avaliao quantitativa dos fenmenos em estudo.
O paradigma da Estatstica Experimental, em particular nas reas de Cincias
Biolgicas e da Sade, consiste em construir o conjunto unificado de mtodos, tcnicas
de planejamento e anlise de dados para diferentes modelos experimentais e
observacionais.
O grande desafio que se torna imperativo diz respeito a como desenvolver as atividades
de ensino de Estatstica Experimental sob as exigncias de um modelo referencial de
conceitos matemticos e probabilsticos no cotidiano da formao da estrutura lgica de
raciocnio dos estudantes das reas biolgicas e da sade, e qual linguagem e motivao
devem ser colocadas em prtica para ministrar o contedo programtico?
Para abordar e entender os contedos dos textos, sem qualquer preconceito e posio
premeditada, o iniciante dever trabalhar sua atitude, a fim de evitar dois obstculos
preliminares: dramatizar as dificuldades e ter iluses por causa de facilidades aparentes.













Botucatu, Janeiro de 2012
Prof. Dr. Carlos Roberto Padovani
Prof. Titular de Bioestatstica




preciso que o professor se esforce no sentido de dar um carter concreto aos
problemas que apresenta aos estudantes (A. Huisman).
5
Delineamento de Experimentos
1. Delineamento de Experimentos
1.1. Introduo
Sir Ronald Aylmer Fisher (1890-1962) nasceu em Londres no dia 17 de
fevereiro de 1890 e bacharelou-se em Matemtica pela Universidade de Cambridge em
1912. Sua miopia exagerada salvou da convocao para o servio militar na 1 Guerra
Mundial, defeito que possibilitou desenvolver um treinamento matemtico de alta
abstrao (visualizao no plano imaginrio) o que deve ter contribudo para sua
preferncia pela apresentao hipergeomtrica, possibilitando assim a apresentar
solues singulares independentes de simbolismo algbrico.
No incio do sculo XX, em 1919, aps trabalhar dois anos como
estatstico e mais quatro como professor de matemtica e fsica em escolas pblicas
recebeu o convite para criar e chefiar um laboratrio de estatstica na Estao
Experimental de Agricultura de Rothamstead, Inglaterra, onde permaneceu at 1933.
Durante este perodo, unido a outros estatsticos e pelo contato dirio
com problemas da rea agrcola, Fisher desenvolveu os mtodos de anlise e os
delineamentos experimentais, conforme descreve SALSBURG(2009). Caracteriza-se
por delineamento do experimento ou delineamento experimental (experimental design,
em ingls, diseo experimental, em espanhol) o modo de dispor as parcelas no
experimento, ou seja, a maneira de designar os tratamentos s unidades experimentais
ou parcelas. A tcnica mais fisheriana trata-se de anlise de varincia. Juntamente com a
anlise de covarincia, tambm de sua autoria, constitui-se no instrumental bsico para
interpretao dos resultados dos experimentos planejados. Deve ser destacado que esses
mtodos procedentes do cotidiano agrcola se tornaram universais e aplicveis em todas
as reas de conhecimento: medicina, psicologia, engenharia, odontologia, biologia,
ecologia, entre outras.
Porm, como a formalizao dos procedimentos ocorreu em um
ambiente agrcola, a origem dos termos tcnicos da experimentao apresenta conotao
bem agronmica. Assim o termo parcela foi criado para designar a unidade de rea
usada no experimento. Essa unidade de rea era, originalmente, uma faixa de terra ou
um vaso. Hoje, parcela, tem um significado mais geral, pois, dependendo do
experimento pode ser um animal, uma pessoa, uma pea anatmica, um corpo de prova,
entre vrias outras possibilidades que podem ser utilizadas como unidades
experimentais. A terminologia mais utilizada, atualmente consiste em designar parcela
6
Delineamento de Experimentos
por unidade experimental, que consiste na unidade fsica ou biolgica para conduzir o
experimento.
De mesma maneira, o termo tratamento tambm foi introduzido pela rea
agrcola. Indicava o que estava em comparao: fertilizantes, inseticidas, variedades,
nutrientes. Hoje o termo tratamento tem um significado mais geral.
Muitos experimentos so feitos para comparar mtodos, grupos,
produtos, mquinas, materiais e, inclusive, combinaes destes. Mas o interesse, em
experimentao, nem sempre de comparar tratamentos. Muitas vezes, pretende-se
apenas saber se determinado tratamento produz efeito (nesse caso, compara-se um
grupo que recebeu tratamento - Grupo Tratado com um grupo que no recebeu o
tratamento Grupo Controle ou Testemunha).
A respeito do grupo controle duas consideraes quanto sua
constituio podem ser feitas: Controle Negativo e Controle Positivo. O grupo controle
negativo composto por unidades experimentais que no recebem tratamento (virgem
de tratamento), ou recebem apenas placebo (substncia inerte). No entanto, o grupo
controle positivo, constitui-se de unidades que recebem o tratamento padro ou
convencional. Na prtica, a terminologia grupo controle ou testemunha utilizada como
sinnimo de controle negativo.
Embora o uso de grupo controle j esteja consagrado em
experimentao, na rea mdica, torna-se fundamental discutir a tica de constituir o
grupo controle negativo. Neste sentido, a experimentao com seres humanos exige um
aprofundamento quanto s questes ticas do uso de placebo (controle negativo),
inclusive pelo fato de se caracterizar por omisso de tratamento.
A exequibilidade do experimento est subordinada ao princpio bsico da
repetio, segundo o qual indica que se deve ter repeties do experimento para que seja
possvel produzir uma medida de variabilidade que permitir a realizao dos testes de
hipteses sobre a presena de efeitos dos tratamentos ou estimao desses efeitos. O
nmero de unidades experimentais (parcelas ou repeties) para cada tratamento deve
ser determinado a partir de informaes sobre a variabilidade das parcelas em termos da
varivel resposta (dependente), custo e poder dos testes de significncia.
Em experimentao a proposta bsica que se formula consiste em
comparar grupos, no apenas unidades. As medidas experimentais do mesmo grupo
recebem o nome de repeties. Do ponto de vista estatstico sempre desejvel que os
experimentos tenham grande nmero de repeties por grupo. Na prtica, muitas vezes,
7
Delineamento de Experimentos
o nmero de repeties fica limitado aos recursos (fsicos, financeiros, materiais,...)
disponveis. Um dado importante que deve ser considerado para o tamanho dos grupos,
consiste em: quanto mais homogneo for o material - em termos de caractersticas que
possam interferir nas observaes ou medies que sero feitas - menor ser o nmero
de repeties necessrio para evidenciar o efeito significativo de tratamentos.
Definidos os fatores e seus respectivos nveis que sero objetos de
estudo, a unidade experimental (parcela) e a varivel dependente, torna-se necessrio
estabelecer qual o esquema de alocao dos tratamentos s unidades experimentais ser
utilizado, ou seja, como deve ser conduzido o delineamento experimental.
Para formar grupos to iguais quanto possvel fundamental que os
tratamentos sejam sorteados s unidades experimentais (casualizao). Ou seja, o que
importa entender que os tratamentos devem ser designados s unidades experimentais
por puro e simples sorteio. A casualizao teve incio em 1920 na rea agronmica,
porm, na pesquisa mdica, s comeou a ser aceita muito mais tarde. A idia de
sortear os pacientes que iro receber o tratamento pode levantar questes de tica. Os
que fazem objees ao uso de casualizao em experimentos mdicos usam o
argumento de que no tico sortear o tratamento para alguns pacientes e deixar
outros sem tratamento. Ora, essa objeo refere-se conduo do experimento e no
tcnica de casualizar.
No existem alternativas vlidas para a casualizao. O pesquisador que
escolhe as unidades por critrio prprio por melhores que sejam as intenes, introduz
tendenciosamente nos resultados.
O princpio da casualizao pode ser considerado como uma das maiores
contribuies dos procedimentos estatsticos cincia experimental, pois nele est
assegurada a fidedignidade das concluses. O efeito de proceder a casualizao
constitui-se na garantia que parcelas (unidades experimentais) com caractersticas
diferentes tenham igual probabilidade de serem designadas para todos os grupos.
1.2. Delineamento ou Planejamento ou Desenho (Design) do Experimento
O procedimento geral e comum na pesquisa cientfica consiste em
formular hipteses (afirmativas sob julgamento) e verific-las diretamente ou por suas
consequncias. Neste sentido, faz-se necessrio um conjunto de observaes e o
planejamento de experimentos ento imprescindvel para indicar o procedimento que
ser utilizado para verificar se as hipteses so verdadeiras ou falsas.
8
Delineamento de Experimentos
As hipteses so avaliadas por meio de mtodos de tomada de deciso
estatstica (teoria das probabilidades) cujos procedimentos quantitativos e anlises
objetivas (teoria estatstica) dependem da maneira sob a qual as observaes foram
obtidas. Procedimento bem distinto da matemtica onde para calcular a rea de uma
figura plana, por exemplo, de um tringulo, basta multiplicar sua base por sua altura e
dividir por dois que se obtm de maneira exata o valor numrico relativo rea
desejada.
Nas reas das cincias biolgicas a situao bem mais complexa,
surgem inmeras causas de variao de controle impossvel ou s parcialmente possvel
(variaes genticas, erros de medidas inerentes preciso dos aparelhos, efeitos
sazonais,...). Essas causas de variao, vrias e s vezes at desconhecidas ou mal
conhecidas, acumulam variaes nos dados observados que possibilitam alterar em
menor ou maior intensidade os resultados das unidades experimentais, cuja preciso
deve ser discutida em termos probabilsticos de quo provveis so os valores
encontrados. Neste contexto, troca-se a exatido da matemtica pela construo
probabilstica das possibilidades dos resultados encontrados nos dados (preciso das
informaes estatsticas). O planejamento experimental e a anlise estatstica dos
resultados esto interligados e, desta forma, devem ser considerados de maneira
sucessiva nas pesquisas cientficas de todas as reas de conhecimento.
Existe uma semelhana muito expressiva entre o mdico e o estatstico
(cuidador da sade dos nmeros).
O primeiro passo para o mdico o diagnstico (para o estatstico, o
planejamento); saber onde h necessidade de cura (qual o modelo para coleta de dados).
A primeira atitude dos mdicos examinar os sintomas se voc chegar ao mdico j
pedindo determinado remdio, no ser atendido; antes, preciso saber quais os
sintomas aparentes do problema, detectando os sintomas fsicos (material e mtodos) e
emocionais (imparcialidade e no vis de planejamento) para finalmente realizar a
prescrio.
Assim acontece com a estatstica, a anlise dos dados (prescrio de
remdio) deve acontecer aps o conhecimento dos sintomas (caractersticas da pesquisa
em estudo) para que se tenha o diagnstico (modelo do delineamento experimental).
Segundo Sir Ronald Aylmer Fisher, o arquiteto da estatstica
experimental: Chamar o especialista em estatstica depois que o experimento foi feito
9
Delineamento de Experimentos
pode ser o mesmo que pedir para ele fazer um exame post-mortem. Talvez ele consiga
dizer de que foi que o experimento morreu.
A melhor maneira para a visualizao sequencial destes aspectos consiste
em considerar a circularidade do mtodo cientfico.

Uma pesquisa cientfica estatisticamente planejada deve seguir a seguinte
sequncia de passos quanto ao planejamento e execuo:
1. Enunciado claro do problema e formulao das hipteses que sero estudadas.
2. Indicao dos fatores (variveis independentes variveis controladas pelo
pesquisador) do estudo.
3. Indicao da unidade experimental (parcela).
4. Indicao das variveis (variveis respostas) que sero medidas na unidade
experimental.
5. Indicao das regras e procedimentos pelos quais os diferentes tratamentos
(combinao de nveis de fatores) sero atribudos s unidades experimentais
(processo de casualizao).
6. Anlise estatstica dos dados do experimento.
7. Descrio dos resultados analticos com as medidas de preciso das estimativas
e o respectivo nvel de significncia nas interpretaes inferenciais.
Para melhor entendimento das caractersticas e as etapas do
planejamento experimental, suponha que o interesse de um pesquisador consista em
comparar duas dietas (normocalrica e hipercalrica) quanto ao desempenho ponderal
final de ratos Wistar-Kyoto submetidos aos tratamentos (dietas) por um perodo final de
12 semanas.
Observaes (2)
(Planejamento)
Formulao de
Hipteses (1)

(Planejamento)
Verificao das
Hipteses (3)

(Anlise)
Desenvolvimento
da Teoria (4)
10
Delineamento de Experimentos
Caracteriza-se que o experimento est planejado quando esto definidos:
i) a unidade experimental (animal rato Wistar);
ii) a varivel em anlise (resposta) e a forma como ser medida (variao
percentual do ganho de peso, medido pela diferena 100(PF-PI)/PI%);
iii) tratamentos em comparao (dieta normocalrica e dieta hipercalrica);
iv) forma de designar os tratamentos s unidades experimentais (por sorteio)
considerando que os animais so homogneos;
v) O nmero de ratos de cada dieta ser de 12 unidades.
Os itens iv e v formam os princpios bsicos da experimentao:
casualizao (fidedignidade) e a repetio (exequibilidade).
As hipteses de interesse da pesquisa so verificadas com a utilizao de
mtodos de anlise estatstica que dependem da maneira sob a qual as observaes
foram obtidas, ou seja, sob qual modelo de casualizao dos tratamentos s unidades
experimentais os dados foram coletados. Portanto, planejamento de experimentos e
anlise dos dados coletados sob o modelo operacional utilizado no podem ser
considerados isolados, pois a ordem dos acontecimentos est em uma sequncia dentro
do desenvolvimento nas pesquisas.
O procedimento estatstico exigido ao analisar dados experimentais ou
observacionais fundamenta-se em gerar modelos que explicitem as estruturas do
fenmeno biolgico, as quais continuamente esto misturadas com variaes casuais,
aleatrias ou acidentais. Quanto mais identificada e entendida forem essas estruturas,
maior conhecimento do fenmeno, assim como, melhores sero as informaes sobre os
possveis comportamentos do mesmo. Ou seja, tem-se uma aproximao consistente da
realidade biolgica expressa num modelo considerado.
A percepo biolgica e a identidade estatstica com o processo
estocstico ponderam admitir cada observao composta por duas partes: uma previsvel
(controlada) e outra aleatria (no previsvel).
Cada observao pode ser representada pelo modelo:
ALEATRIO PREVISVEL OBSERVAO + = , no caso aditivo, ou
ALEATRIO PREVISVEL OBSERVAO = , no caso multiplicativo.
A parte previsvel sistematiza o conhecimento que o pesquisador tem
sobre o fenmeno, normalmente expressada por uma funo matemtica envolvendo
11
Delineamento de Experimentos
parmetros desconhecidos. parte aleatria, dada sua caracterstica de no
previsibilidade, exige-se que esteja sujeita a algum modelo probabilstico.
A partir destas consideraes, seguindo o planejamento proposto para a
coleta de informaes (dados) nas unidades experimentais, o procedimento estatstico
consiste em estabelecer estimativas para os parmetros desconhecidos (propostos na
parte sistematizada |previsvel| segundo as hipteses e os objetivos do pesquisador),
baseando-se em amostras observadas.
1.3. Principais Delineamentos Experimentais (Estudados no Curso)
i. Delineamento Inteiramente Casualizado (DIC)
Consiste em alocar de maneira inteiramente ao acaso os tratamentos s unidades
experimentais. Para sua realizao, exigem-se unidades experimentais
homogneas (similares).
ii. Delineamento em Blocos Completos Casualizados (DBCC)
Consiste em considerar grupos similares (blocos) de unidades experimentais,
quando o conjunto heterogneo, e alocar casualmente os tratamentos s
unidades experimentais dentro dos blocos.
Na rea biomdica o termo bloco , geralmente, substitudo por estrato.
1.4. Exemplos
Para melhor entendimento de um planejamento experimental so
apresentados a seguir dois exemplos prticos.
1.4.1. Planeje um experimento para estudar (comparar) o uso de sobredoses
de vitamina B12 na diminuio de aterosclerose, em pacientes com a
doena.
Unidade experimental: paciente com a doena.
Varivel resposta: diminuio da aterosclerose (dimetro do calibre em mm).
Tratamentos em comparao: dose padro, sobredoses baixa, mdia e alta.
Designao dos tratamentos: por sorteio.
Nmero de repeties: oito doentes por tratamento.

1.4.2. Planeje um experimento para comparar quatro mtodos de ensino da
Linguagem Americana de Sinais em alunos de uma turma homognea
de 120 alunos.
Unidade experimental: aluno da turma.
12
Delineamento de Experimentos
Varivel resposta: nota de um teste padro de linguagem (0 a 100 pontos
inteiros).
Tratamentos em comparao: mtodos A, B, C, D.
Designao dos tratamentos: sorteio do aluno participante.
Nmero de repeties: 15 alunos por mtodo.
13
Delineamento de Experimentos
2. Delineamento Inteiramente Casualizado (DIC) com dados balanceados
2.1. Modelo do Experimento
Este delineamento consiste em designar os tratamentos s unidades
experimentais por puro e simples sorteio, isto , sem qualquer tipo de restrio
(equiprobabilidade para cada unidade experimental receber qualquer um dos
tratamentos). A operacionalizao do procedimento de alocao dos tratamentos fica
condicionada disponibilidade de parcelas similares no experimento (parcelas
homogneas). O entendimento de similaridade ou semelhana no deve ser confundido
com igualdade (igualdade conceito muito matemtico e nada provvel em biologia).
Esse plano experimental to mais eficiente quanto maior for o grau de
homogeneidade entre as unidades experimentais em termos da varivel dependente. Se
as unidades experimentais so heterogneas, o nmero n de parcelas necessrio para
uma boa preciso pode ser muito grande (na prtica deve-se procurar outros
planejamentos experimentais, tais como blocos ou utilizar variveis auxiliares
covariveis, pois estes podem reduzir o erro experimental).
Sob o aspecto dos procedimentos de testes estatsticos aconselhvel o
balanceamento das repeties (todos tratamentos com igual nmero de repeties),
embora nem sempre isso seja possvel (principalmente na pesquisa com seres humanos
quando o uso de grupo controle tem restries de natureza tica).
O modelo estocstico que indica a forma da resposta biolgica de uma
unidade experimental submetida a um dos tratamentos, isto :
lgico) Casual(Bio Erro Tratamento Mdia Biolgica Resposta + = , descrito como
,...,r) j ,...k (i y
ij i ij
1 e 1 = = + = c
2.2. Procedimento Estatstico: Anlise de Varincia
A anlise de varincia, embora exija o clculo de varincias, na verdade
compara as mdias dos tratamentos. Constitui-se numa extenso do teste t de Student
(que compara apenas duas e s duas mdias) para um nmero qualquer de mdias. A
estatstica do teste para a ANOVA calculada por meio do teste F (Fisher-Snedecor).
A lgica de uma anlise de varincia consiste em considerar a variao
total existente nos dados desmembrada em duas partes: uma variao devida aos
tratamentos e outra devida ao acaso (ou resduo). A idia comparar a variao devida
aos tratamentos com a variao devida ao acaso.
14
Delineamento de Experimentos
Algumas pressuposies bsicas precisam estar satisfeitas para o uso da
tcnica da anlise de varincia, que so: i) os erros so variveis aleatrias
independentes; ii) a varincia constante (homognea nos tratamentos); iii) a
distribuio dos erros normal ou aproximadamente normal.
2.3. Independncia dos Erros
Uma regra prtica consiste em utilizar um grfico de resduos
padronizados versus a ordem de coleta dos dados. Se a pressuposio de independncia
estiver satisfeita, os resduos devem ficar distribudos casualmente ao redor de zero, sem
um padro definido. Para a construo grfica devem ser consideradas as seguintes
definies:
i ij ij
y y e = Resduo ( resduo relativo j-sima observao do i-simo grupo ).
QMRes
e
z
ij
ij
= o padronizad Resduo (resduo padronizado relativo j-sima
observao do i-simo grupo ), onde QMRes significa Quadrado Mdio Residual e tem
seu valor dado por: ( ) ( ) k n S n S QMRes
k
i
i i pool
|
.
|

\
|
= =

=

1
2
1
2
.
Para o entendimento da regra prtica considere um conjunto homogneo
de 20 animais e quatro dietas para a comparao das alteraes de pesos, cujos 5
animais de cada dieta foram escolhidos por processo randmico (sorteio). As dietas
estudadas foram:
A: dieta padro;
B: dieta padro suplementada com amendoim;
C: dieta padro suplementada com girassol;
D: dieta padro suplementada com abbora.

Os ganhos de peso(g) avaliados considerando a variao absoluta entre o
incio e o final do experimento, so apresentados na Tabela 2.1.

A Tabela 2.2 apresenta o resultado da estatstica descritiva dos dados:
Tabela 2.1 Ganhos de peso segundo dieta
Dieta A Dieta B Dieta C Dieta D
25 31 22 33
26 25 26 29
20 28 28 31
23 27 25 34
21 24 29 28
15
Delineamento de Experimentos
Tabela 2.2 Estatstica descritiva das dietas
Dieta A B C D
Mdia 23,0 27,0 26,0 31,0
Desvio padro 6,5 7,5 7,5 6,5
Portanto,
( ) ( ) 0 , 7 4 4 5 , 6 4 5 , 7 4 5 , 7 4 5 , 6 4
2
= + + + = =
pool
S QMRes .
Os resduos esto apresentados na Tabela 2.3.
Tabela 2.3 Resduos dos ganhos de peso segundo dieta
Resduo (e
ij
) Resduo Padronizado (z
ij
)
A B C D A B C D
2 4 -4 2 0,756 1,512 -1,512 0,756
3 -2 0 -2 1,134 -0,756 0,000 -0,756
-3 1 2 0 -1,134 0,378 0,756 0,000
0 0 -1 3 0,000 0,000 -0,378 1,134
-2 -3 3 -3 -0,756 -1,134 1,134 -1,134
O grfico bidimensional dos pares (ordem da observao; resduo
padronizado) est apresentado na Figura 2.1.

Em um estudo mais avanado de delineamento de experimentos,
recomenda-se aplicar o teste de Durbin-Watson.
2.4. Varincia Constante (Homocedasticidade)
Uma regra prtica indicada por DEAN & VOSS (1999) sugere pressupor
que os resultados de uma ANOVA sejam considerados vlidos desde que a maior
varincia no exceda em trs vezes a menor. BOX (1953) sugere que a maior varincia
no deva exceder em quatro vezes a menor. No nvel analtico, deciso mais objetiva
foram propostos diversos testes para a igualdade de varincias, destacando-se entre eles:
Cochran, Hartley, Bartlett e Levene. Em nosso caso, ser utilizado o teste de Hartley
16
Delineamento de Experimentos
que considera a razo entre a maior e a menor varincia, cuja estatstica do teste dada
pela distribuio F.
Ou seja,
H
0
: Varincias homogneas H
1
: Varincias Heterogneas
rejeio. h no cc ; H se - rejeita , Se : deciso de regra a com

min
max
0 ;
2 2
1
2 2
1
n) glnum;glde ( calc
en) (glnum;gld
k
k
F F
~ F
) ,...,S (S
) ,...,S (S
F
>
=

No exemplo:
. H rejeita se no portanto, ; 39 , 6 4 ento , 05 , 0
) 3 ( 15 , 1
6,5
7,5

) ,..., min(S
) ,..., max(S
0 ) 4 ; 4 ; 05 , 0 (
2
4
2
1
2
4
2
1
= = = =
< = = =
F
S
S
F
den num
o

2.5. Normalidade dos Erros
Um processo prtico consiste em fazer um grfico de probabilidades
normais (NORMAL PROBABILITY PLOT). O grfico de probabilidade normal
consiste em uma tcnica grfica que permite avaliar se existe ou no um conjunto de
dados que apresenta aderncia distribuio normal de probabilidades. Os dados so
plotados em um grfico cartesiano para verificar se os pontos formam uma reta
aproximada, levando-se em considerao que quanto mais afastados da reta situarem os
pontos, maior fuga da normalidade apresenta a situao. Os resduos padronizados (z
ij
)
so colocados no eixo das abscissas e os escores da distribuio normal padronizada
[valores esperados obtidos de ) (
i
F Z P s ] no eixo das ordenadas, para n i , , 1 = . A
cada i-simo resduo, associa-se a frequncia percentual acumulada emprica
n
i
F
i
) ( 100
2
1
) (

= %, em seguida calcula-se ) (
i
F Z P s .
Na presena da normalidade, os pontos ficaro em torno de uma reta que
passa pela origem e tem coeficiente angular 1. De maneira analtica, a hiptese de que a
distribuio dos erros normal pode ser colocada em teste utilizando-se os testes de
aderncia de: Kolmogorov-Smirnov(KS), Shapiro-Wilks(SW) e Qui-quadrado().
Em linhas gerais, o pesquisador no precisa preocupar-se com a no-
normalidade (o teste estatstico F bastante robusto, ou seja, pequenas transgresses
pressuposio de normalidade no afetam, substancialmente, o resultado da anlise de
varincia ANOVA, a menos que a distribuio dos erros tenha: i) curtose positiva; ii)
assimetria. Nesses dois casos, tm-se falsas rejeies (mais diferenas significantes do
que, na realidade, existem).
17
Delineamento de Experimentos
No exemplo, com 20 animais, tem-se ) 5 , 0 ( 5
20
) 5 , 0 ( 100
) (
=

= i
i
F
i
%,
fornecendo os seguintes resultados conforme Tabela 2.4.
Tabela 2.4 Resduos padronizados ordenados e escores esperados sob
normalidade (Distribuio Z)
Ordem ( i ) ij
Z (ordenado)
i
F (%) ( )
i
F Z P s
1 -1,512 2,5 -1,96
2 -1,134 7,5 -1,44
3 -1,134 12,5 -1,15
4 -1,134 17,5 -0,93
5 -0,756 22,5 -0,76
6 -0,756 27,5 -0,60
7 -0,756 32,5 -0,45
8 -0,378 37,5 -0,32
9 0,000 42,5 -0,19
10 0,000 47,5 -0,06
11 0,000 52,5 0,06
12 0,000 57,5 0,19
13 0,378 62,5 0,32
14 0,756 67,5 0,45
15 0,756 72,5 0,60
16 0,756 77,5 0,76
17 1,134 82,5 0,93
18 1,134 87,5 1,15
19 1,134 92,5 1,44
20 1,512 97,5 1,96

2.6. Tcnica da Anlise de Varincia (ANOVA)
Quando se tem um experimento completamente ao acaso com um fator
fixo (fonte de variao controlada em estudo), o interesse consiste em verificar a
influncia dos k nveis desse fator (k grupos ou k tratamentos) sobre uma varivel
dependente (resposta) biolgica Y em estudo. Uma maneira de verificar a existncia
18
Delineamento de Experimentos
dessa influncia do fator consiste em comparar as mdias populacionais da varivel Y
sob os nveis do fator (tratamento = agente causal).
Um teste estatstico para verificar a igualdade dessas k mdias relativas
aos nveis do fator consiste na tcnica da anlise de varincia (ANalysis Of VAriance,
ttulo em ingls que deriva a sigla ANOVA, utilizada na lngua inglesa e, muitas vezes
na lngua portuguesa). Embora o procedimento envolva o clculo de varincias, seu
objetivo fundamenta-se em comparar as mdias dos nveis do fator (tratamento).
A lgica da ANOVA para o delineamento inteiramente ao acaso muito
simples, ou seja, resume-se em fracionar a variabilidade total dos dados em duas fontes
de variao ortogonais entre si, sendo uma devido a variao entre os nveis do fator
(variao entre tratamentos) e outra, devido a variao dentro dos nveis (dentro de
tratamentos). Esta ltima tem a finalidade especfica de estimar a variao atribuda ao
acaso; enquanto a primeira, envolve a variao do acaso acumulada, devido aos nveis
de tratamento. Feito isso, determina-se a razo da variao entre os nveis e a variao
dentro dos nveis e, se o resultado obtido for muito grande a concluso estabelecida
a favor das diferenas entre as mdias dos nveis do fator (diferenas entre as mdias
dos tratamentos).
Deve ser considerado que para a utilizao da tcnica da ANOVA,
embora o entendimento da lgica seja muito fcil, algumas pressuposies devem estar
satisfeitas, quais sejam: independncia dos erros, normalidade dos dados e
homogeneidade de varincias; conforme ser mostrado a seguir a partir dos dados da
Tabela 2.5.
Considere um conjunto homogneo de 20 animais e quatro dietas para a
comparao das alteraes de pesos, cujos 5 animais de cada dieta foram escolhidos por
processo randmico (sorteio). As dietas estudadas foram:
A: dieta padro;
B: dieta padro suplementada com amendoim;
C: dieta padro suplementada com girassol;
D: dieta padro suplementada com abbora.
19
Delineamento de Experimentos
Tabela 2.5 Ganhos de peso segundo dieta


Dieta A Dieta B Dieta C Dieta D
25 31 22 33
26 25 26 29
20 28 28 31
23 27 25 34
21 24 29 28
23 (2,55)
(*)
27 (2,74) 26 (2,74) 31 (2,55)
(*)
mdia (desvio padro)
Cada ganho de peso uma resposta biolgica do modelo geral
ij i ij i ij
y c t c + + = + = , com k i ,..., 1 = (nmero de tratamentos) e r j ,..., 1 = (nmero
de repeties por tratamento), onde:
a mdia geral comum a todas as observaes definida como

=
=
k
i
i i
r
n
1
1
, sendo
i
a mdia populacional de Y no i-simo tratamento;
i
r o nmero de repeties no i-simo tratamento (no caso balanceado o valor comum
r para todos tratamentos);
i
t o efeito do i-simo nvel do fator na varivel dependente Y e mede o desvio da
mdia
i
em relao a , isto : t =
i i
;
ij
c o erro casual no observvel (em nosso estudo, varivel aleatrio independente e
identicamente distribuda como ( )
2
, 0 o N ).
Neste sentido, tem-se:
a) ( )
i i ij
Y E t = + =
b) ( )
2
o = =
ij
Y Var
c) ( )
2
, ~ o
i ij
N Y
Considerando satisfeitas as suposies de independncia dos erros,
normalidade dos dados e homogeneidade das varincias de tratamentos, a tcnica da
ANOVA consiste em comparar a variao devida aos tratamentos (entre tratamentos)
com a variao devida ao acaso (ou resduo, ou dentro de tratamentos).
Para o clculo das causas de variao so determinadas:
a) Graus de liberdade (GL)
( ) 1
1
onde , 1
= =
=
= =
r k k n Resduo
; k Tratamento
kr; n n Total

b) Somas de quadrados (SQ)
20
Delineamento de Experimentos



=
-
= = =
-
=
=
-
- -
=
-
=
- -
-
=
- - -
=
= =
- -
=
- -
= =
- -
=
= = =
=
= = =
= = =
k
i
i
r
j
ij
k
i
r
j
i ij
k
i
r
j
ij i
k
i
i
k
i
i
r
j
i
k
i
r
j
ij
k
i
r
j
ij
k
i
r
j
ij
k
i
SQTrat SQTot
r
y
y y y SQRes
y
r
y
y -n y r y n
r
y
y y SQTrat
y
n
y y n y y y SQTot
1
2
1
2
1 1
2
1
1
2
1
2
1
2
2
1
2
1
1 1 1
2 2
1 1
2
1
. ( ) (
;
1
onde ; ) (
;
1
onde ) (

c) Quadrados Mdios (QM)
) /(
) 1 /(
k n SQRes QMRes
k SQTrat QMTrat
=
=

d) Estatstica F
QMRes QMTrat F / =
As quantidades obtidas anteriormente so dispostas na Tabela 2.6,
denominada tabela de anlise de varincia.
O teste de hipteses relativo Tabela 2.6 consiste em:
:
0
H No existe efeito de tratamentos t t = = = = = =
k k
H H ... : 0 ... :
1 0 1 0

:
1
H Existe efeito de tratamentos ) ,..., 1 ( 0 Existe :
1
k i H
i
= = t
A regra de deciso a habitual, ou seja:
Se
) ; 1 ; ( k n k calc
F F

>
o
, rejeita-se H
0
. Caso contrrio no h rejeio.
No exemplo, tem-se:
4 = k (tratamentos) e 5 = r (repeties por tratamento);
75 , 26 20 / 535 logo, , 535 = = =
- - - -
y y
) 31 ( 155 ); 26 ( 130 ); 27 ( 135 ); 23 ( 115
4 4 3 3 2 2 1 1
= = = = = = = =
- - - - - - - -
y y y y y y y y
75 , 275 25 , 14311 00 , 14587 = = SQTot
75 , 163 25 , 14311 00 , 14475 = = SQTrat
00 , 112 75 , 163 75 , 275 = = SQRes
58 , 54 3 / 75 , 163 = = QMTrat
Tabela 2.6 Tabela geral de ANOVA de um DIC balanceado
Causa de variao GL SQ QM F
Tratamentos 1 k SQTrat QMTrat QMRes QMTrat/
Resduo k n SQRes QMRes
Total 1 n SQTot
21
Delineamento de Experimentos
00 , 7 16 / 00 , 112 = = QMRes
Os resultados encontrados esto dispostos na Tabela 2.7 da ANOVA:

Conclui-se, no nvel de significncia 5%, que existem diferenas entre as
mdias das alteraes de pesos segundo as dietas estudadas (rejeita-se
0 :
4 3 2 1 0
= = = = t t t t H ). Ou seja, os resultados experimentais (com base no p-
value) permitem rejeitar a hiptese de que as mdias de tratamentos so iguais, ao
nvel de significncia de 5%.
2.7. Coeficientes de Determinao e Variao de um Experimento
O coeficiente de determinao (
2
R ) de um experimento dado pela
razo entre a SQTrat (variao devida aos tratamentos) e a SQTot (variao total dos
valores observados), indicando a proporo da variao total explicada pela variao
devida aos tratamentos ( 1 0
2
s s R ).
O coeficiente de variao ( CV ) de um experimento dado pela razo
entre o desvio padro (na ANOVA, consiste na raiz quadrada positiva de SQRes ) e a
mdia geral dos dados (
- -
y ), indicando como os dados comportam-se (disperso) em
relao mdia geral. A grandeza inversa do CV remete idia da preciso dos dados
experimentais.
No exemplo anterior, tem-se
5938 , 0 75 , 275 / 75 , 163 / = = = SQTot SQTrat R
(59,38% da variao total explicada pela variao de tratamentos);
0989 , 0 75 , 26 / 00 , 7 / = = =
- -
y QMRes CV
(9,89% estabelece-se como a disperso relativa dos dados experimentais)
2.8. Comparaes Mltiplas
A tcnica da ANOVA permite ao pesquisador verificar se existe efeito
dos tratamentos, mas no como as mdias dos tratamentos diferem entre si. Portanto, se
constatar que existe efeito do fator em estudo, interessante complementar a anlise a
fim de localizar as diferenas entre as mdias dos tratamentos. A resposta
Tabela 2.7 ANOVA da alterao dos peso
Causa de variao GL SQ QM F
Dietas 3 163,75 54,58 7,80 (p < 0,005)
Resduo 16 112,00 7,00
Total 19 275,75
22
Delineamento de Experimentos
complementao da ANOVA pode ser concretizada (principalmente quando os nveis
do fator so quantitativos) com um teste de comparaes mltiplas de mdias.
Nessa linha de busca de uma resposta biolgica mais interessante e
informativa foram propostos diversos testes que, em geral, levam o nome do seu autor
(Tukey, Duncan, Dunnet, Bonferroni, Scheff, Newman-Keuls ou Student-Newman-
Keuls (SNK),...). No existe um teste aceito como o melhor deles; todos apresentam
vantagens e desvantagens e situao mais indicada para seu uso.
Os testes de comparaes mltiplas permitem testar hipteses do tipo:
0 ... :
1 1 0
= + +
k k
c c H versus 0 ... :
1 1 1
= + +
k k
c c H , com 0 ...
1
= + +
k
c c . Essa
combinao linear de mdias, que reflete uma situao de interesse biolgico,
denominada contraste de mdias.
Em nosso curso de graduao, o interesse consiste na comparao de
todas as diferenas entre mdias de dois tratamentos. Dentro dessa linha curiosidade a
opo ser pelo mtodo de Tukey.
O mtodo de Tukey baseia-se na diferena honestamente significante
(HSD=Honestly Significant Difference), cujo princpio encontrar a diferena
mnima significante que assegura a todas as comparaes um nvel comum de
significncia estabelecido a priori.
No experimento com dados balanceados o teste de Tukey exato com o
seguinte procedimento operacional:
. com , 0 : H e 0 : H
' 1 ' 0
i' i
i i i i
= = =
Calcula-se ( ) ( )
( )
r
QMRes
q HSD
k o
o o
; ;
= A = , onde
) ; ; ( o k
q o quantil de
ordem (1-/2) ) 1 (
2
o
da distribuio estatstica denominada studentized range com
parmetros (nmero de tratamentos) e (graus de liberdade do resduo). Os valores de
q, considerando =0,01 e =0,05, esto tabelados e so encontrados em diversos livros
de estatstica experimental.
A regra de deciso a habitual, ou seja:
Se ( ) o A >
- - ' i i
y y , rejeita-se H
0
. Caso contrrio, no h rejeio.
Similarmente, pode-se apresentar o intervalo de confiana ( )% 1 100 o
para a diferena de mdias, cujos limites so dados por:
( )
( )
r
QMRes
q y y LI
i i k o ; ; '
=
- -

23
Delineamento de Experimentos
( )
( )
r
QMRes
q y y LS
i i k o ; ; '
+ =
- -

No exemplo relativo Tabela 1, tem-se
( )
05 , 4
16 ; 4 ; 05 , 0
= q ; logo, ( ) ( ) 79 , 4
5
00 , 7
05 , 4 % 5 % 5 = = = A HSD .
Ou seja, o valor mnimo que expressa a diferena significante entre as
mdias dos ganhos de peso da ordem de 4,79 unidades de peso. Neste sentido, as
nicas diferenas encontradas aconteceram entre as dietas A e D (8,00>4,79) e C e D
(5,00>4,79).
Uma maneira elegante e redacional (textos cientficos e biolgicos) de
apresentar os resultados est disposta na Tabela 2.8.
2.9. Exerccios (DIC com dados balanceados)
1) Para testar duas drogas diferentes usando grupo controle, um farmacologista
pretende fazer um experimento com cobaias. Esto disponveis 24 cobaias,
bastante similares. Como voc planejaria o experimento?

2) Explique com detalhes o procedimento que voc faria para designar cinco
tratamentos (A, B, C, D, E) para 25 unidades experimentais (ratos) similares.

3) Num laboratrio de biofsica so usados quatro voltmetros diferentes. Para
verificar se os quatro voltmetros esto igualmente calibrados, mediu-se a
mesma fora constante de 100 volts cinco vezes cada voltmetro. Os dados esto
na tabela abaixo. Faa uma anlise de varincia e interprete o resultado
(considerar =0,05).

Voltagem segundo o voltmetro
Voltmetro
A B C D
117 115 118 125
120 110 123 121
114 116 119 123
119 115 122 118
115 114 118 118

4) Para detectar a presena de insetos daninhos nas plantaes, colocam-se
papeles untados com uma substncia pegajosa e examinam-se os insetos
capturados. Ao nvel de 5% de significncia, que cores atraem mais insetos? Os
Tabela 2.8 Mdia e desvio padro do ganho de peso segundo a dieta
Dieta
HSD
A B C D
23 (2,55)a
(1)
27 (2,74)ab 26 (2,74)a 31 (2,55)b 4,79
(1)
duas mdias seguidas de pelo menos uma mesma letra no diferem entre si
(p>0,05) pelo teste de Tukey
24
Delineamento de Experimentos
pesquisadores colocaram seus papeles de cada cor em posies aleatrias em
um campo de aveia, e contaram o nmero de insetos capturados.

Cor do papelo Insetos Capturados
Azul 16 11 20 21 14 17
Verde 37 32 20 29 37 32
Branco 21 12 14 17 13 20
Amarelo 45 59 48 46 38 47
Obs.: Como a varivel nmero de insetos (contagem) no apresenta
distribuio normal (varivel discreta), para a anlise dos dados considerar os
valores observados sob a transformao raiz quadrada.

5) Considere o seguinte quadro de ANOVA da PAM:

Fonte de
variao
Soma
Quadrados
GL QM F
Entre Grupos 800 3 ? ?
Intragrupos ? ? 33,33 -
Total 2000

a) Qual tipo de ANOVA est apresentado no quadro?
b) Qual a concluso no nvel de 5% de significncia?
c) Qual a redao cientfica mais adequada para a concluso sobre o resultado
do teste estatstico empregado?

6) Considere as seguintes dosimetrias de mercrio no sangue (ppb) de grupos
expostos em garimpos da Amaznia Legal (Ferrari et al., Revista de Sade
Ocupacional, v.20, n.75, p.54-60, 1992).

Grupo Dosimetria Hg
Garimpeiros 24 19 25 23 13
Ribeirinhos 16 8 10 7 15
ndios 28 30 19 23 22
Controle 12 6 8 7 9

Verificar, considerando o nvel de significncia 5%, as diferenas entre as
respostas mdias dos grupos.
2.10. Respostas dos Exerccios (DIC com dados balanceados)
1) Cada grupo ( Controle, Droga 1 e Droga 2 ) ser composto de oito cobaias
alocadas por processo aleatrio simples (casual ou randomizado ). A varivel
resposta ser comparada quanto s mdias dos grupos pela tcnica da ANOVA
complementada com o teste de comparaes mltiplas de Tukey, considerando o
nvel de 5% de significncia.
2) Os ratos so enumerados de 1 a 25 e, em uma urna so colocadas 25 etiquetas
idnticas quanto ao tamanho, forma e cor sendo cinco marcadas com a letra A,
cinco com B, cinco com C, cinco com D e, finalmente cinco com E. Em outra
urna, so colocadas outras etiquetas enumeradas de 1 a 25, correspondente aos
25 ratos da pesquisa. Procede-se com a realizao de sorteios em ambas as
25
Delineamento de Experimentos
urnas, formando 25 pares constitudos pelo tratamento sorteado na primeira urna
e o rato correspondente ao nmero sorteado na segunda.
3)
Tabela 1. ANOVA para a fora dos voltmetros
Causa de variao GL SQ QM F
Voltmetro 3 150,00 50,00 7,41 (p<0,005)
Resduo 16 108,00 6,75
Total 19 258,00

Tabela 2. Mdia (desvio padro) da fora segundo tipo de voltmetro
A B C D
117,00 (2,55) ab 114,00 (2,35) a 120,00 (2,35) b 121,00 (3,08) b
DHS (5%) = 4,71
4)
Tabela 1. ANOVA para a raiz quadrada do nmero de insetos capturados
Causa variao GL SQ QM F
Cor do papelo 3 33,72 11,24 43,57 (p<0,001)
Resduo 20 5,16 0,26
Total 23 38,88

Tabela 2. Mdia (desvio padro) do nmero de insetos capturados
(*)
segundo cor
Azul Verde Branco Amarelo
4,04 (0,47) a 5,56 (0,60) b 4,00 (0,47) a 6,85 (0,49) c
DHS (5%) = 0,82
(*)
Varivel sob a transformao raiz quadrada

5)
a) ANOVA para DIC balanceado (10 animais por grupo).
b) F= 266,67/33,33 = 8,00 (p < 0,001); portanto rejeita-se a hiptese de
ausncia de efeito de tratamentos.
c) No nvel de 5% de significncia conclui-se que existe diferena entre as
mdias da PAM nos grupos estudados.
6)
Tabela 1. ANOVA para a dosimetria de mercrio no sangue (ppb)
Causa variao GL SQ QM F
Grupo 3 871,20 290,40 17,47 (p<0,001)
Resduo 16 266,00 16,63
Total 19 1137,20

Tabela 2. Mdia (desvio padro) da dosimetria de mercrio no sangue segundo o grupo
Garimpeiros Ribeirinhos ndios Controle
20,80 (4,92) b 11,20 (4,09) a 24,40 (4,51) b 8,40 (2,30) a
DHS (5%) = 7,39

26
Delineamento de Experimentos
3. Delineamento Inteiramente Casualizado (DIC) com dados no
balanceados
3.1. Consideraes Gerais
Em algumas situaes, pode acontecer que o nmero de unidades
experimentais disponvel no seja mltiplo do nmero de tratamentos que se pretende
comparar ou, ainda, comear o experimento com dados balanceados e algumas
unidades, por algum motivo alheio vontade do pesquisador, tornarem-se perdidas para
o experimento. Nessas situaes, os tratamentos podem ficar com nmeros de
repeties total ou parcialmente diferentes, ou seja, experimento com nmero diferente
de repeties (dados no balanceados).
Talvez a primeira sugesto, com base no que j foi visto, seria descartar
utilizando critrios randmicos unidades experimentais para se ter os dados
balanceados nos tratamentos. Mesmo sendo, do ponto de vista da Estatstica
Experimental, melhor que todos os tratamentos apresentem o mesmo nmero de
parcelas (a anlise realizada por procedimento exato), a importncia biolgica das
informaes das unidades experimentais mais imperativa que a simplicidade dos
clculos matemticos do procedimento e, neste sentido, torna-se imprescindvel um
comportamento mais requintado para a situao.
Nessa situao, o caminho mais prximo s caractersticas da biologia
acaba sendo dado pelo procedimento anterior realizado com os dados balanceados,
adaptando-se as frmulas dos clculos aos experimentos com dados no-balanceados.
Esta nova maneira faz com que o processo exato seja direcionado forma aproximada.
Portanto, a teoria desenvolvida no DIC balanceado passa a ser
explicitada com pequenas modificaes nas somas de quadrados e no procedimento de
Tukey.
Tem-se:

= =
- -
=
k
i
r
j
ij
i
ny y SQTot
1 1
2 2
, onde
i
r consiste nas repeties do i-simo tratamento e

= =
- -
=
k
i
r
j
ij
i
y
n
y
1 1
1

2
1
2
- -
=
-
=

y n
r
y
SQTrat
k
i i
i
, onde

=
-
=
i
r
j
ij i
y y
1

27
Delineamento de Experimentos

= = =
= =
-
k
i
r
j
k
i
r
y
ij
i
i
i
SQRes SQTot y SQRes
1 1 1
2
2
.
O quadro da ANOVA permanece o mesmo do DIC para dados
balanceados.
Em relao ao teste de Tukey, calcula-se
( ) ( )
( )
|
|
.
|

\
|
+ = = A
'
; ; ' '
1 1
2
i i
ii ii
r r
QMRes
q HSD
res
k o
o o e
Se ( ) o
' ' ii i i
y y A >
- -
, rejeita-se a hiptese de igualdade de mdias. Caso
contrrio, no h rejeio.
A Tabela 3.1 mostra os ganhos de peso (kg) no final do experimento
realizado para comparar trs raes comerciais em um lote de animais (sunos)
homogneos (PADOVANI, 2002).
15 ; 5 ; 4 ; 6
3 2 1
= = = = n r r r
2973 , 7 ; 46 , 109 ; 26 , 34 ; 67 , 34 ; 53 , 40
3 2 1
= = = = =
- - - - - - -
y y y y y
6360 , 11 7588 , 798 3948 , 810 2973 , 7 15 3948 , 810
2
= = = SQTot
2731 , 10 7588 , 798 0319 , 809 7588 , 798
5
26 , 34
4
67 , 34
6
53 , 40
2 2 2
= = + + = SQTrat
A Tabela 3.2 apresenta os dados segundo a ANOVA.
Coeficiente de Variao: % 62 , 4 %
2973 , 7
1136 , 0
100 = = CV
Coeficiente de Determinao: %) 29 , 88 ( 8829 , 0
6360 , 11
2731 , 10
2
= = R
Teste de Tukey
Tabela 3.1 Ganho de peso (kg) segundo rao
Rao Ganho de Peso
A 7,12 6,91 6,30 6,72 6,68 6,80
B 8,15 8,45 8,92 9,15
C 6,58 7,04 6,46 7,12 7,06
Tabela 3.2 Quadro da ANOVA do ganho de peso
Causa
Variao
GL SQ QM F
Rao 2 10,2731 5,1366 42,22 (P<0,001)
Resduo 12 1,3629 0,1136
Total 14 11,6360
28
Delineamento de Experimentos
05 , 0 = o ; 3 = k (tratamentos); 12 = (graus de liberdade do resduo)
'
'
'
'
8985 , 0
1 1
2
1136 , 0
77 , 3
i i
i i
i i
ii
r r
r r
r r
+
=
|
|
.
|

\
|
+ = A
580 , 0
12
= A ; 544 , 0
13
= A ; 603 , 0
23
= A
( ) B A y y = A > = =
- -
9125 , 1 6675 , 8 755 , 6
12 2 1

( ) C A y y = A < = =
- -
097 , 0 852 , 6 755 , 6
13 3 1

( ) C B y y = A > = =
- -
8155 , 1 852 , 6 6675 , 8
23 3 2

A Tabela 3.3 mostra a mdia e o desvio padro da rao.
3.2. Exerccios (DIC no balanceado)
1) Para testar duas drogas diferentes usando grupo controle, um farmacologista
pretende fazer um experimento com cobaias. Esto disponveis 24 cobaias,
bastante similares. Discuta o uso de grupos com diferentes repeties.

2) Considere as seguintes dosimetrias de mercrio no sangue (ppb) de grupos
expostos em garimpos da Amaznia Legal (Ferrari et al., Revista de Sade
Ocupacional, v.20, n.75, p.54-60, 1992).
Verificar, considerando o nvel de significncia 5%, as diferenas entre as
respostas mdias dos grupos.

3) Considerar as seguintes avaliaes nasomtricas [(nasalncia(%)=100*(energia
acstica nasal)/(energia acstica nasal+energia otoacstica oral)] do vocbulo
papai isolado e inserido em frase (Di Ninno et al., Revista de Atualizao
Cientfica PR-FONO, v.13, n.1, p.71-77, 2001)
Considerando o nvel de significncia 5%, avaliar as diferenas entre as
respostas mdias das nasalncias.
Tabela 3.3 Mdia e desvio padro do ganho de peso segundo rao
Rao A Rao B Rao C
6,7550,273a
(1)
8,6680,452b 6,8520,307a
(1)
duas mdias seguidas de uma mesma letra no diferem (P>0,05) pelo teste de Tukey.
Grupo Dosimetria Hg
Garimpeiros 24 19 25 23 18
Ribeirinhos 13 10 12 8
ndios 28 30 24 26 25
Controle 10 6 8 9
Faixa Etria Nasalncia (%)
Criana 10,5 11,6 12,3 8,9 9,2 9,6 10,9 11,0
Adolescente 11,5 10,2 13,9 12,0 10,4 10,0 14,1
Adulto 18,5 16,6 20,2 17,8 21,8 17,4
29
Delineamento de Experimentos
3.3. Respostas dos Exerccios (DIC no balanceado)
1) Do ponto de vista biolgico, o grupo controle (animais que recebem o
placebo, ou seja, soro fisiolgico por exemplo) o referencial das
comparaes (padro de referncia para testar o efeito das drogas), logo deve
ser o grupo agraciado com mais animais. O restante dos animais pode ser
balanceado entre as duas drogas.
2)
Tabela 1. Quadro da ANOVA da dosimetria de Hg
Causa variao GL SQ QM F
Grupos 3 1030,50 343,50 56,22 (p<0,001)
Resduo 14 85,50 6,11
Total 17 1116,00

Tabela 2. Mdia (desvio padro) da dosimetria segundo grupo
Garimpeiro Ribeirinho ndio Controle
21,80 (3,11) b 10,75 (2,22) a 26,60 (2,41) c 8,25 (1,71) a
DHS (G x R) = 4,82 DHS (G x I) = 4,54 DHS (G x C) = 4,82
DHS (R x I) = 4,82 DHS (R x C) = 5,08 DHS (I x C) = 4,82

3)
Tabela 1. Quadro da ANOVA da nasalncia
Causa variao GL SQ QM F
Faixas Etrias 2 256,01 128,01 49,81 (p<0,001)
Resduo 18 46,28 2,57
Total 20 302,29

Tabela 2. Mdia (desvio padro) da nasalncia segundo faixa etria
Criana Adolescente Adulto
10,50 (1,19) a 11,73 (1,71) a 18,72 (1,94) b
DHS (Cr x Adol)=2,12 DHS (Cr x Adul)=2,21 DHS (Adol x Adul)=2,28

30
Delineamento de Experimentos
4. Delineamento em Blocos Completos Casualizados (DBCC)
4.1. Introduo
Quando o conjunto de unidades experimentais for relativamente heterogneo
(pequenos grupos de unidades similares, mas nenhum suficientemente grande para um
planejamento), o plano experimental inteiramente casualizado torna-se pouco preciso,
porque o erro experimental torna-se muito grande. A partir das informaes disponveis,
antes da realizao do experimento, possvel agrupar as unidades experimentais em
subconjuntos de unidades mais homogneas, denominados blocos. A alocao das
unidades experimentais entre os tratamentos obedece a uma restrio imposta pelos
blocos, ou seja, o procedimento de casualizao dos tratamentos s unidades
experimentais realizado dentro de cada bloco. Quando todos os tratamentos
aparecerem em todos os blocos uma nica vez, tem-se o Delineamento em Blocos
Completo. Deve ser observado, inclusive por possvel confuso de nome, que a
aleatorizao est sendo realizada nos tratamentos dentro dos blocos (restrio na
casualizao).
Na anlise estatstica de um experimento em blocos casualizados, ou como
normalmente se diz, um experimento em blocos, alm dos fatores de interesse, deve-se
levar em conta o fator de controle experimental, blocos, diminuindo desta maneira o
erro experimental. Quanto maior for a heterogeneidade entre blocos, maior ser a
eficincia deste plano experimental em relao ao completamente autorizado. O
delineamento em blocos tambm pode ser planejado com repeties dos tratamentos
dentro do bloco e tambm, de forma incompleta. A anlise estatstica do delineamento
em blocos completos ao acaso com repeties torna-se relativamente fcil quando o
nmero de unidades dentro de cada bloco mltiplo do nmero de tratamentos em
comparao.
O termo bloco (sua origem de fato agronmica, cujo objetivo referia-se a faixa
de terra de mesma fertilidade - fertilidade homognea) tem um sentido prtico
interessante na rea biolgica, ou seja, caracteriza-se como estrato e tem como
finalidade, o controle da homogeneidade dos animais quanto s variveis intervenientes.
No presente estudo os blocos so completos quanto aos tratamentos, isto , um
bloco possui todos os tratamentos de interesse do estudo, alocados por processo
aleatrio com uma repetio por bloco. A vantagem mais destacada dos experimentos
em blocos consiste em permitir o uso de unidades experimentais homogneas. Os
31
Delineamento de Experimentos
blocos controlam uma causa de variao e estabelecem uma restrio casualizao.
Essa restrio casualizao devido constituio dos blocos indica para a no
realizao do teste estatstico para a causa de variao blocos, ou seja, no faz sentido,
pois se trata de uma fonte de variao de controle e no de interesse para a comparao.
Se a fonte colocada como blocos est no interesse do pesquisador para comparao, o
esquema de fatores torna-se o procedimento adequado para a combinao dos nveis dos
dois fatores em estudo.
Em resumo, podem ser destacados:
a) A casualizao ocorre dentro dos blocos.
b) Os blocos so completos quanto aos tratamentos pesquisados.
c) essencial que os blocos renam unidades similares.
d) Quanto maior a heterogeneidade entre blocos maior a eficincia do
delineamento.
e) O tratamento aparece uma nica vez dentro de cada bloco.
f) Os experimentos em blocos so feitos, essencialmente, para comparar
tratamentos.
g) No deve ser feito o teste estatstico de blocos.
h) Fazer blocos significa impor uma restrio como controle s unidades
experimentais.
i) Exemplos biolgicos de blocos: posio na estufa, ninhada, faixa de idade, faixa
de peso, uma partida de animais (lote), entre outros.
4.2. Modelo do Experimento (Biolgico)
O modelo de DBCC com k tratamentos e b blocos dado por:
( ) b j k i y
i i ij j i ij
,..., 1 ; ,..., 1 ; = = + = + + = t c | ; onde:
a mdia geral comum a todas as observaes;
i
t o efeito do i-simo nvel do fator na varivel dependente Y ;
j
| o efeito do j-simo bloco experimental;
ij
c o erro casual no observvel (independente e identicamente distribuda
como ( )
2
, 0 o N ).
Neste sentido, para o modelo de efeitos fixos, tem-se:
a) ( )
j i ij
Y E | t + + = ;
b) ( )
2
o =
ij
Y Var ;
c) ( )
2
, ~ o | t
j i i ij
N Y + + .
32
Delineamento de Experimentos
4.3. Procedimento Estatstico: Anlise de Varincia
Todas as consideraes realizadas para o DIC so tambm vlidas para o
DBCC (independncia dos erros; varincias homogneas e normalidade dos dados).
Considere o seguinte conjunto de pesos de carcaas (kg) de coelhos
conforme Tabela 4.1, no acabamento segundo o tipo de dieta randomizada oferecida aos
animais.
Cada peso de carcaa (kg) uma resposta biolgica do sorteio de trs
dietas dentro dos conjuntos de trs animais tornados homogneos pelas raas, cujo
resultado biolgico responde ao modelo:
ij j i ij
y c | t + + + = , com k i ,..., 1 = (tratamentos) e b j ,..., 1 = (blocos).
Neste modelo, a tcnica da ANOVA consiste em fracionar a SQTotal
em trs fontes de variao: a primeira referente aos tratamentos ( SQTrat ), a segunda
relativa aos blocos ( SQBloco ) e, por fim, a expressa nas flutuaes casuais ( SQRes ).
Para o clculo das causas de variao so determinados:
a) Graus de liberdade (GL)
1 1 = = kb n Total , onde kb n = ;
1 = k Tratamento ;
1 = b Bloco ;
( )( ) 1 1 = k b Resduo .
b) Somas de quadrados (SQ)
( )

= =
- -
= =
- -
= =
k
i
b
j
ij
k
i
b
j
ij
y n y y y SQTot
1 1
2 2
1 1
2
; onde

= =
- -
=
k
i
b
j
ij
y
n
y
1 1
1
;
( )
- -
=
-
= =
- - -
= =

y n
b
y
y y SQTrat
k
i
i
k
i
b
j
i
1
2
1 1
2
; onde

=
-
=
b
j
ij i
y
b
y
1
1
;
( )

=
- -
-
= =
- - -
= =
b
j
j
k
i
b
j
j
y n
k
y
y y SQBloc
1
2
2
1 1
2
; onde

=
-
=
k
i
ij j
y
k
y
1
1
;
SQBloc SQTrat SQTot SQRes = .
c) Quadrados mdios (QM)
( ) 1 = k SQTrat QMTrat
( ) 1 = b SQBloco QMBloco
Tabela 4.1 Peso de carcaas (kg) de coelhos segundo dieta
Dieta
Raa
Norfolk Angor I Angor II
Nova
Zelndia I
Nova
Zelndia II
Padro 1,28 1,08 1,06 1,36 1,19
Padro+Rami 1,45 1,15 1,28 1,50 1,41
Padro+Alfafa 1,38 1,08 1,17 1,43 1,26
Padovani, C. R. (2002). Exerccios de Estatstica Bsica e Experimental. Depto.
Bioestatstica, IB/UNESP, Botucatu-SP, 40p.
33
Delineamento de Experimentos
( )( ) | | 1 1 = b k SQRes QMRes
d) Estatstica F
QMRes QMTrat F =
As quantidades obtidas so dispostas na Tabela 4.2 da ANOVA.
Tabela 4.2 Tabela geral de ANOVA de um DBCC
Causa de variao GL SQ QM F
Blocos 1 b SQBloc QMBloc -
Tratamentos 1 k SQTrat QMTrat QMRes QMTrat
Resduo ( )( ) 1 1 k b SQRes QMRes
Total 1 bk SQTot
O teste de hiptese relativo Tabela 4.2 consiste em:
t = = = = = =
k k
H H H ... : 0 ... : o tratament de efeito existe No :
1 0 1 0 0
( ) k i H H
i
,..., 1 0 Existe : o tratament de efeito Existe :
0 1
= = t
A regra de deciso a habitual, ou seja:
Se
( )( ) ( ) 1 1 ; 1 ;
>
k b k calc
F F
o
, rejeita-se H
0
. Caso contrrio, no h rejeio.
No exemplo, tem-se:
3 = k (tratamentos) e 5 = b (blocos);
08 , 19 =
- -
y , logo, 272 , 1 15 08 , 19 = =
- -
y ;
2980 , 0 2698 , 24 5678 , 24 = = SQTot ;
( ) 194 , 1 97 , 5
1 1
= =
- -
y y ; ( ) 358 , 1 79 , 6
2 2
= =
- -
y y ; ( ) 264 , 1 32 , 6
3 3
= =
- -
y y
0677 , 0 2698 , 24 3375 , 24 = = SQTrat
11 , 4
1
=
-
y ; 31 , 3
2
=
-
y ; 51 , 3
3
=
-
y ; 29 , 4
4
=
-
y ; 86 , 3
5
=
-
y ;
2209 , 0 2698 , 24 4907 , 24 = = SQBloc ;
0094 , 0 0677 , 0 2209 , 0 2980 , 0 = = SQRes
A Tabela 4.3 apresenta o resultado da ANOVA.
Conclui-se, no nvel de 5% de significncia, que existem diferenas entre
os pesos mdios de carcaas dos coelhos segundo as suplementaes estudadas.
4.4. Comparaes Mltiplas
O procedimento de comparaes mltiplas de Tukey para o DBCC
consiste nos seguintes passos:
0 :
' 0
=
i i
H e 0 :
' 1
=
i i
H , para ' i i = .

Tabela 4.3 Tabela ANOVA para o peso das carcaas
Causa Variao GL SQ QM F (valor p)
Blocos 4 0,2209 0,0552
Tratamentos 2 0,0677 0,0339 28,25 (p<0,01)
Resduo 8 0,0094 0,0012
Total 14 0,2980
34
Delineamento de Experimentos
Calcula-se ( ) ( )
( )( ) ( )
b
QMRes
q HSD
k b 1 1 ; ;
= A =
k o
o o , onde
( ) o ; ;k
q o
quantil de ordem (1-/2) da distribuio studentized range com parmetros
(nmeros de tratamentos) e (graus de liberdade do resduo).
A regra de deciso do teste de hipteses a habitual, ou seja:
Se ( ) o A >
- - ' i i
y y , rejeita-se H
0
. Caso contrrio, no h rejeio.
Similarmente, pode-se apresentar o intervalo de confiana de Tukey
100(1-)% para a diferena de mdias, cujos limites so dados por:
( )
( )
b
QMRes
q y y LI
i i k o ; ; '
=
- -
,
( )
( )
b
QMRes
q y y LS
i i k o ; ; '
+ =
- -
.
No exemplo relativo aos dados do peso das carcaas tem-se:
( )
04 , 4
8 ; 3 ; 05 , 0
= q ; logo, ( ) 063 , 0
5
0012 , 0
04 , 4 % 5 = = A .
Ou seja, o valor mnimo que expressa a diferena significante =0,05
entre os pesos mdios das carcaas 0,063kg. Os resultados das comparaes esto
expressos na Tabela 4.4.
Conclui-se, no nvel de 5% de significncia, que a suplementao
modifica o peso mdio da carcaa dos coelhos e que entre elas, a suplementao com
rami produz maior peso mdio.
4.5. Exerccios (DBCC)
1) Planeje um experimento para comparar dois testes de QI, usando dez pares de
gmeos. Considere cada par de gmeos como um bloco.

2) Faa a anlise de varincia dos dados apresentados na tabela a seguir,
considerando o nvel de 5% de significncia:
Dados de um experimento em blocos ao acaso
Bloco
Tratamento
A B C
I 74 53 58
II 90 68 78
III 78 54 64
IV 98 72 74

Tabela 4.4 Mdia e desvio padro dos pesos segundo dieta
Dieta Padro Padro Suplementao Rami Padro Suplementao Alfafa
1,1940,128a 1,3580,142c 1,2640,145b
35
Delineamento de Experimentos
3) Pretende-se verificar a durabilidade de trs marcas de tintas que tem preos de
custo bem diferentes. Para isso, foram selecionados seis muros, em que cada
tera parte foi pintada por uma marca sorteada nos teros. Aps um perodo de
dez meses, foi atribuda a cada parte uma nota, resultante de vrios quesitos. Os
resultados das notas so apresentados a seguir:
Marca Muro 1 Muro 2 Muro 3 Muro 4 Muro 5 Muro 6
A 8,5 8,9 8,8 8,2 8,6 8,9
B 9,1 9,4 9,1 9,6 9,0 9,3
C 7,3 7,6 7,8 7,5 6,1 7,2
Com esses dados, voc diria (=0,05) que uma das marcas melhor que as
outras?

4) Supondo que haja interesse em calcular F=QMBloco/QMRes em um
experimento, qual a interpretao biolgica que sugere o resultado significativo
(p<0,05)? E o no significativo (p>0,05)?
4.6. Respostas dos Exerccios (DBCC)
1) Considerando 10 pares de gmeos (G1, G2), para cada par ser efetuado o
sorteio dos dois testes de QI. Neste sentido, constitudos os pares por processo
randomizado dos testes de QI os dados coletados nos gmeos sero submetidos
tcnica da anlise de varincia para o modelo experimental em blocos
completamente casualizados (10 blocos no presente estudo) envolvendo dois
tratamentos independentes (dois testes de QI).

2)
Tabela 1. Tabela ANOVA
C. Variao GL SQ QM F
Blocos 3 977,58 325,86 -
Tratamentos 2 1189,50 594,75 50,15 (p<0,001)
Resduo 6 71,17 11,86
Total 11 2238,25

Tabela 2. Mdia (desvio padro) dos tratamentos
A B C
85,00 (11,02) b 61,75 (9,67) a 67,00 (11,61) a
DHS (5%)=7,47

3)
Tabela 1. ANOVA para a durabilidade
C. Variao GL SQ QM F
Blocos (Muro) 5 1,04 0,21 -
Tratamentos (Marca) 2 12,64 6,32 45,14 (p<0,001)
Resduo 10 1,41 0,14
Total 17 15,09

36
Delineamento de Experimentos
Tabela 2. Mdia (desvio padro) das marcas
A B C
8,65 (0,27) b 9,25 (0,23) c 7,25 (0,60) a
DHS (5%)=0,59

4) Se o resultado do teste estatstico for significativo (p < 0,05) existe comprovao
biolgica de heterogeneidade entre os blocos, corroborando com a suspeita do
pesquisador no controle fonte de variao bloqueada. Se o resultado do teste
estatstico for no significativo (p > 0,05) existe comprovao biolgica de
homogeneidade entre os blocos, contradizendo com a suspeita do pesquisador no
controle fonte de variao bloqueada.
37
Delineamento de Experimentos
5. Esquemas Fatoriais
5.1. Introduo
Existem situaes prticas na experimentao em que o interesse do
pesquisador envolve o estudo de dois ou mais fatores combinados, cujos cruzamentos
dos nveis dos fatores so os tratamentos empenhados nas comparaes. Em nosso
estudo, ser apenas enfocado o caso de dois fatores, ou seja, A e B. Ser admitido que o
fator A possui a nveis, e o fator B, b nveis.
Nos experimentos onde cada nvel de um fator est combinado com
todos os nveis do outro, diz-se que os fatores obedecem a uma classificao cruzada
(experimentos cruzados). As combinaes desses fatores resultam os tratamentos do
estudo, cuja configurao recebe o nome de esquema fatorial a*b (combinaes entre os
a nveis do fator A e b nveis do fator B).
O esquema de fatores mais simples consiste em considerar dois fatores A
e B, com dois nveis cada um, isto , o esquema fatorial 2*2. No esquema fatorial dois
por dois, Tabela 5.1, tem-se como resultado das combinaes quatro tratamentos,
conforme quadro a seguir:
Tabela 5.1 Esquema fatorial 2*2
Fator B
Fator A B
1
B
2

A
1
A
1
B
1
A
1
B
2

A
2
A
2
B
1
A
2
B
2


Outras combinaes dos fatores podem surgir medida que o nmero de
nveis dos fatores tornam-se maiores. Ademais, o nmero de nveis dos fatores no
precisa ter o mesmo valor, ou seja, os nveis a do fator A podem ser numericamente
diferente dos nveis b do fator B. Quando a=b, tem-se um arranjo quadrtico e, se ab, o
arranjo retangular. Uma notao interessante que se utiliza quando o nmero de nveis
igual para os dois fatores (a=b; arranjo quadrtico) e descrita por 2, 3, 4,... O
expoente indica o nmero de fatores do estudo e a base da potncia indica o nmero de
nveis dos fatores. Por exemplo, um fatorial 3 tem dois fatores em trs nveis.
Trs hipteses bsicas so avaliadas no esquema fatorial a*b, que so: i)
a interao (A*B) entre os fatores A e B; ii) o efeito do fator principal A e iii) o efeito
do fator principal B. Dependendo do resultado do teste de significncia da interao
A*B, duas novas hipteses podem ser avaliadas: i) efeito do fator A dentro de um nvel
fixo de B e ii) efeito do fator B dentro de um nvel fixo de A.
38
Delineamento de Experimentos
Como o esquema fatorial um arranjo dos nveis dos fatores
(combinaes de nveis) ele pode ser delineado em vrios tipos de experimentos. Em
nosso curso, o esquema fatorial a*b ser apresentado no Delineamento Inteiramente
Casualizado (DIC) e no Delineamento em Blocos Completos Casualizados (DBCC).
5.2. Esquema Fatorial a*b no DIC
Considere a Tabela 5.2, genrica de observaes
ijk
y de um esquema
fatorial a*b em um DIC com r repeties por tratamento.
Onde
ijk
y a k-sima repetio do i-simo nvel do fator A e j-simo
nvel do fator B ( r k b j a i , , 1 ; , , 1 ; , , 1 = = = ).
O modelo de resposta expresso por:
( )
ijk ij j i ijk
y c u u + + + + = ;
onde:
: efeito mdio comum;

i
: efeito do i-simo nvel de A;

j
: efeito do j-simo nvel de B;
()
ij
: efeito de interao entre os nveis i e j dos fatores A e B, respectivamente;

ijk
: erro casual independente, com distribuio ( )
2
, 0 o N .
Considerando os fatores A e B de efeitos fixos, tem-se a Tabela 5.3 da
ANOVA.
Tabela 5.2 Esquema fatorial a*b com r repeties
Fator A
Fator B
B
1
B
b

A
1

r
y
y
11
111

br
b
y
y
1
1 1












A
a

r a
a
y
y
1
11




abr
ab
y
y

1

39
Delineamento de Experimentos
Tabela 5.3 Tabela geral de ANOVA para um esquema fatorial no DIC
Causa de
variao
GL SQ QM F
Tratamentos 1 ab SQTrat QMTrat
Trat
F
A 1 a SQA QMA
A
F
Desmembramento
da
SQTratamentos
B 1 b SQB QMB
B
F
AxB ( )( ) 1 1 b a B SQA B QMA
B A
F


Resduo ( ) 1 r ab SQRes QMRes
Total 1 abr SQTot
Os clculos das somas de quadrados so estabelecidos por:

= = =
- - -
=
a
i
b
j
r
k
ijk
y n y SQTot
1 1 1
2 2
, onde

= = =
- - -
=
a
i
b
j
r
k
ijk
y
n
y
1 1 1
1
e abr n = ;
2
1 1
2
- - -
= =
-
=

y n
r
y
SQTrat
a
i
b
j
ij
, onde

=
-
=
r
k
ijk ij
y y
1
;
SQTrat SQTot SQRes =
2
1
2
- - -
=
- -
=

y n
br
y
SQA
a
i
i
, onde

= =
- -
=
b
j
r
k
ijk i
y y
1 1
;
2
1
2
- - -
=
- -
=

y n
ar
y
SQB
b
j
j
, onde

= =
- -
=
a
i
r
k
ijk j
y y
1 1
;
SQB SQA SQTrat SQAxB =
A obteno dos quadrados mdios realizada pela diviso entre a soma
de quadrados e os respectivos graus de liberdade.
Em relao aos testes de hipteses, que sero apresentados a seguir, duas
situaes interessantes para a discusso biolgica devem ser consideradas: a primeira
consiste no caso onde os efeitos dos fatores A e B na varivel resposta (dependente)
sero aditivos e, portanto, toda a informao biolgica pode ser obtida fazendo-se
inferncias apenas sobre as mdias
- i
e
j -
(mdias marginais); a segunda, onde
existe efeito da interao entre os fatores A e B; onde para avaliar os efeitos existentes
na varivel dependente, as inferncias devem ser feitas sobre todos os
ij
.
As hipteses gerais com os respectivos testes estatsticos acompanhados
das regras de deciso so estabelecidas conforme detalhes na sequncia.
0 A fator do efeito existe No :
2 1 0
= = = =
a
A
H u u u
Sob a veracidade de
A
H
0
a estatstica do teste dada por
40
Delineamento de Experimentos
( )
res
a A
F
QMRes
QMA
F
, 1
~

= , com a regra de deciso habitual (rejeita-se
A
H
0
quando
tab calc
F F > ).
0 B fator do efeito existe No :
2 1 0
= = = =
b
B
H
Sob a veracidade de
B
H
0
a estatstica do teste dada por
( )
res
b B
F
QMRes
QMB
F
, 1
~

= , com a regra de deciso habitual.
( ) ( ) 0 AxB interao de efeito existe No :
11 0
= = =
ab
AxB
H u u
Sob a veracidade de
AxB
H
0
a estatstica do teste dada por
( )( ) ( )
res
b a AxB
F
QMRes
QMAxB
F
; 1 1
~

= , com a regra de deciso habitual.
Toda vez que o resultado de algum teste de hipteses possibilitar a
rejeio da hiptese nula, para melhorar a qualidade da informao biolgica, torna-se
interessante complementar a tcnica da ANOVA com algum procedimento de
comparaes mltiplas para as mdias. Em nosso estudo, como j vem sendo rotina, a
continuidade tem sido realizada pelo teste de Tukey para os contrastes entre todos os
pares de mdias. Neste sentido, duas consideraes sero apresentadas; a primeira
normalmente utilizada quando o resultado do teste de interao entre os fatores A e B
mostrou-se no significante; a segunda, quando o resultado foi significante.
Teste de Tukey para o caso
AxB
F no significante ( ) o >
AxB
p
- -
=
' 0
:
i i
A
H ( ) = a i i ,..., 1 ' , no existe diferena entre as respostas mdias
dos nveis i e i do fator A.
Calcula-se ( ) ( )
( )
br
QMRes
q DMS
res
a A A o
o o
; ;
= A = e se ( ) o
A i i
y y A >
- - - - '
,
rejeita-se a hiptese
A
H
0
. Caso contrrio, no h rejeio.
' 0
:
j j
B
H
- -
= ( ) = b j j ,..., 1 ' , no existe diferena entre as respostas mdias
dos nveis j e j do fator B.
Calcula-se ( ) ( )
( )
ar
QMRes
q DMS
res
b B B o
o o
; ;
= A = e se ( ) o
B j j
y y A >
- - - - '
,
rejeita-se a hiptese
B
H
0
. Caso contrrio, no h rejeio.
Teste de Tukey para o caso
AxB
F significante ( ) o <
AxB
p
j i ij
j
B A
H
' 0
:
/
= ( ) = fixo e ,..., 1 ' , j a i i no existe diferena entre as respostas
mdias dos nveis i e i do fator A dentro do j-simo nvel do fator B.
41
Delineamento de Experimentos
Calcula-se ( ) ( )
( )
r
QMRes
q DMS
res
a B A B A o
o o
; ; / /
= A = e se
( ) o
B A j i ij
y y
/ '
A >
- -
, rejeita-se
j
B A
H
/
0
. Caso contrrio, no h rejeio.
' 0
:
/
ij ij
i
A B
H = ( ) = fixo e ,..., 1 ' , i b j j no existe diferena entre as respostas
mdias dos nveis j e j do fator B dentro do i-simo nvel do fator A.
Calcula-se ( ) ( )
( )
r
QMRes
q DMS
res
b A B A B o
o o
; ; / /
= A = e se ( ) o
A B ij ij
y y
/ '
A >
- -
,
rejeita-se
i
A B
H
/
0
. Caso contrrio, no h rejeio.
5.3. Exemplo de Fatorial a*b no DIC
Considere o seguinte conjunto de dados de um esquema fatorial 2x2 em
um delineamento inteiramente casualizado para avaliar o perfil cardiovascular de ratos
hipertensos submetidos a uma dieta hipercalrica (OLIVEIRA Jr, et al., 2007, Arquivos
Brasileiros de Cardiologia, v.89, Supl I, p.927).
Fator A(Dieta): A
1
(Normocalrica) e A
2
(Hipercalrica);
Fator B(Hipertenso): B
1
(WKY-Controle) e B
2
(SHR-Hipertenso);
Isto :
Dieta
Hipertenso
Ausente Presente
Normocalrica WKYC(A
1
B
1
) SHRC(A
1
B
2
)
Hipercalrica WKYOB(A
2
B
1
) SHROB(A
2
B
2
)

Presso arterial sistlica (mm Hg)
WKYC WKYOB SHRC SHROB
53 , 4 00 , 210
91 , 7 00 , 130
83 , 5 00 , 160
06 , 9 00 , 120
22
21
12
11
=
=
=
=
-
-
-
-
y
y
y
y

130 120 160 210
120 130 158 205
110 125 162 206
112 140 152 215
128 135 168 214

Quadro auxiliar
A
B Total
(Fator A)
00 , 155
20 ; 5 ; 2 ; 2
=
= = = =
- - -
y
n r b a

B
1
B
2

A
1
600 800 1400
A
2
650 1050 1700
Total
(Fator B)
1250 1850 3100

00 , 25296 00 , 480500 00 , 505796 00 , 155 20 214 130
2 2 2
= = + + = SQTot
00 , 24500 00 , 480500 00 , 505000 00 , 155 20
5
1050
5
650
5
800
5
600
2
2 2 2 2
= = + + + = SQTrat
00 , 796 00 , 24500 00 , 25296 = = SQRes
42
Delineamento de Experimentos
00 , 4500 00 , 480500 00 , 485000 00 , 155 20
5 2
1700
5 2
1400
2
2 2
= =

= SQA
00 , 18000 00 , 480500 00 , 498500 00 , 155 20
5 2
1850
5 2
1250
2
2 2
= =

= SQB
00 , 2000 = = SQB SQA SQTrat SQAxB
A Tabela 5.4 mostra o resultado da ANOVA.
Como o resultado do teste de interao entre os fatores A e B foi
significante (p<0,01), o procedimento de comparaes mltiplas ser efetuado
considerando o estudo do fator A fixado o nvel de B e vice-versa.
( ) ( )
( )
Hg mm 03 , 13
5
75 , 49
13 , 4
5
% 1 % 1
16 ; 2 %; 1 / /
= = = A =
QMRes
q DMS
j j
B A B A

( ) ( )
( )
Hg mm 03 , 13
5
75 , 49
13 , 4
5
% 1 % 1
16 ; 2 %; 1 / /
= = = A =
QMRes
q DMS
i i
A B A B

A Tabela 5.5 apresenta a mdia e o desvio padro da hipertenso segundo dieta.
Tabela 5.5 Mdia e desvio padro da PAS (mm Hg) segundo dieta e
hipertenso
Dieta
Hipertenso
Ausente Presente
Normocalrica 120,009,06 a
(1)
A
(2)
160,005,83 a B
Hipercalrica 130,007,91 a A 210,004,53 b B
(1)
duas mdias seguidas de uma mesma letra minscula no diferem (p>0,05) quanto s
respectivas dietas dentro da classe de hipertenso.
(2)
duas mdias seguidas de uma mesma letra maiscula no diferem (p>0,05) quanto s
classes de hipertenso dentro da dieta em considerao.
5.4. Esquema Fatorial a*b no DBCC
Considere a observao
ijk
y de um esquema com dois fatores A (com a
nveis) e B(com b nveis) com os tratamentos casualizados em r blocos completos (fator
fixo de controle).
O modelo de resposta expresso por:
( )
ijk k ij j i ijk
y c | u u + + + + + = ;
onde:
: efeito mdio comum;
Tabela 5.4 ANOVA para a PAS
Causa de
Variao
GL SQ QM F
Tratamento 3 24500,00 8166,67 164,15 (p<0,01)
A 1 4500,00 4500,00 90,45 (P<0,01)
B 1 18000,00 18000,00 361,81 (p<0,01)
AxB 1 2000,00 2000,00 40,20 (p<0,01)
Resduo 16 796,00 49,75
Total 19 25296,00
43
Delineamento de Experimentos

i
: efeito do i-simo nvel de A ( a i , , 1 = );

j
: efeito do j-simo nvel de B ( b j , , 1 = );
()
ij
: efeito de interao entre os nveis i e j dos fatores A e B, respectivamente;

k
: efeito do k-simo nvel de bloco ( r k , , 1 = );

ijk
: erro casual independente, com distribuio ( )
2
, 0 o N .
A disposio geral das observaes pode ser feita conforme Tabela 5.6 a
seguir:
Como anteriormente (DIC), considerando os fatores A e B fixos tem-se,
a seguir, na Tabela 5.7 ANOVA para o esquema fatorial a*b no DBCC.
Tabela 5.7 tabela geral de ANOVA para um esquema fatorial em DBCC
Causa de
Variao
GL SQ QM F
Blocos 1 r
SQBloc QMBloc
-
Tratamentos 1 ab SQTrat QMTrat
Trat
F

A 1 a SQA QMA
A
F
B 1 b SQB QMB
B
F
AxB ( )( ) 1 1 b a B SQA B QMA
B A
F


Resduo ( )( ) 1 1 r ab SQRes QMRes
Total 1 abr
SQTot
Os clculos das somas de quadrados so estabelecidos por:

= = =
- - -
=
a
i
b
j
r
k
ijk
y n y SQTot
1 1 1
2 2
, onde

= = =
- - -
=
a
i
b
j
r
k
ijk
y
n
y
1 1 1
1
e abr n = ;
2
1 1
2
- - -
= =
-
=

y n
r
y
SQTrat
a
i
b
j
ij
, onde

=
-
=
r
k
ijk ij
y y
1
;
2
1
2
- - -
=
- -
=

y n
ab
y
SQBloc
r
k
k
, onde

= =
- -
=
a
i
b
j
ijk k
y y
1 1
;
SQBloc SQTrat SQTot SQRes =
2
1
2
- - -
=
- -
=

y n
br
y
SQA
a
i
i
, onde

= =
- -
=
b
j
r
k
ijk i
y y
1 1
;
2
1
2
- - -
=
- -
=

y n
ar
y
SQB
b
j
j
, onde

= =
- -
=
a
i
r
k
ijk j
y y
1 1
;
SQB SQA SQTrat SQAxB =
Tabela 5.6 Quadro genrico de um experimento em BCC
Bloco
Tratamento
A
1
B
1
A
1
B
b
A
a
B
1
A
a
B
b

Bloco 1 Y
111
y
1b1
y
a11
y
ab1

Bloco 2 Y
112
y
1b2
y
a12
y
ab2


Bloco r Y
11r
y
1br
y
a1r
y
abr

44
Delineamento de Experimentos
A obteno dos quadrados mdios realizada pela diviso entre as somas
de quadrados e os respectivos graus de liberdade.
As ponderaes sobre os testes de hipteses so as mesmas realizadas no
DIC, cujas hipteses gerais so estabelecidas por:
0 A fator do efeito existe No :
2 1 0
= = = =
a
A
H u u u .
Sob a veracidade de
A
H
0
a estatstica do teste dada por
( )
res
a A
F
QMRes
QMA
F
; 1
~

= , com a regra de deciso habitual (rejeita-se
A
H
0
quando
tab calc
F F > ).
0 B fator do efeito existe No :
2 1 0
= = = =
b
B
H
Sob a veracidade de
B
H
0
a estatstica do teste dada por
( )
res
b B
F
QMRes
QMB
F
, 1
~

= , com a regra de deciso habitual.
( ) ( ) 0 AxB interao de efeito existe No :
11 0
= = =
ab
AxB
H u u
Sob a veracidade de
AxB
H
0
a estatstica do teste dada por
( )( ) ( )
res
b a AxB
F
QMRes
QMAxB
F
; 1 1
~

= , com a regra de deciso habitual.
semelhana do DIC, tm-se os dois casos para o teste de comparaes
mltiplas de Tukey.
Teste de Tukey para o caso
AxB
F no significante ( ) o >
AxB
p
- -
=
' 0
:
i i
A
H ( ) = a i i ,..., 1 ' , no existe diferena entre as respostas mdias
dos nveis i e i do fator A.
Calcula-se ( ) ( )
( )
r
QMRes
q DMS
res
a A A o
o o
; ;
= A = e se ( ) o
A i i
y y A >
- - - - '
, rejeita-se a
hiptese
A
H
0
. Caso contrrio, no h rejeio.
' 0
:
j j
B
H
- -
= ( ) = b j j ,..., 1 ' , no existe diferena entre as respostas mdias dos
nveis j e j do fator B.
Calcula-se ( ) ( )
( )
ar
QMRes
q DMS
res
b B B o
o o
; ;
= A = e se ( ) o
B j j
y y A >
- - - - '
, rejeita-se
B
H
0
. Caso contrrio, no h rejeio.
Teste de Tukey para o caso
AxB
F significante ( ) o <
AxB
p
45
Delineamento de Experimentos
j i ij
j
B A
H
' 0
:
/
= ( ) = fixo e ,..., 1 ' , j a i i no existe diferena entre as respostas mdias
dos nveis i e i do fator A dentro do j-simo nvel do fator B.
Calcula-se ( ) ( )
( )
r
QMRes
q DMS
res
a B A B A o
o o
; ; / /
= A = e se ( ) o
B A j i ij
y y
/ '
A >
- -
,
rejeita-se
j
B A
H
/
0
. Caso contrrio, no h rejeio.
' 0
:
/
ij ij
i
A B
H = ( ) = fixo e ,..., 1 ' , i b j j no existe diferena entre as respostas mdias
dos nveis j e j do fator B dentro do i-simo nvel do fator A.
Calcula-se ( ) ( )
( )
r
QMRes
q DMS
res
b A B A B o
o o
; ; / /
= A = e se ( ) o
A B ij ij
y y
/ '
A >
- -
, rejeita-
se
i
A B
H
/
0
. Caso contrrio, no h rejeio.
5.5. Exemplo de Fatorial a*b no DBCC
Considere o seguinte conjunto de dados de um fatorial 2x2 em um
delineamento em blocos completos casualizados para avaliar o efeito da inibio
prolongada de enzima de converso da angiotensina sobre o dimetro diastlico do
ventrculo esquerdo (DDVE), avaliado em mm, em ratos com sobrecarga pressrica
persistente (Bregagnollo et al.,2005, Arquivos Brasileiros de Cardiologia, v.84, n.3,
p.225-232).
Fator A (Droga): A
1
(bandagem artica (EA
0
)-no tratados) e A
2
(bandagem
artica (EA
0
)-tratados com lisinopril);
Fator B (Momento Sacrifcio): B
1
(6 semana) e B
2
(21 semana);
Blocos (Faixa de peso do animal): Bloco1(70|75g), Bloco2(75|80g),
Bloco3(80|85g), Bloco4(85|90g), Bloco5(90|95g) e Bloco6(95|100g).
O esquema de fatores pode ser apresentado como a seguir:
Droga
Momento Sacrifcio
6 Semana (B
1
) 21 Semana (B
2
)
Ausente (No tratada) (A
1
) A
1
B
1
A
1
B
2

Presente (Lisinopril) (A
2
) A
2
B
1
A
2
B
2


46
Delineamento de Experimentos
Dimetro Diastlico do Ventrculo Esquerdo (mm)
Faixa de peso
Tratamento
A
1
B
1
A
1
B
2
A
2
B
1
A
2
B
2

70 | 75g 7,8 9,8 8,0 8,6
75 | 80g 7,2 10,0 7,6 8,8
80 | 85g 8,4 9,9 8,3 8,5
85 | 90g 7,8 10,8 7,5 8,4
90 | 95g 8,0 9,6 8,6 8,9
95 | 100g 7,6 8,7 8,0 7,8
Mdia DP 7,80,40 9,800,68 8,000,42 8,500,39

285 , 19 215 , 1744 5 , 1763 525 , 8 24 8 , 7 8 , 7
2 2 2
= = + + = SQTot
565 , 14 215 , 1744 78 , 1758 525 , 8 24
6
0 , 51
6
0 , 48
6
8 , 58
6
8 , 46
2
2 2 2 2
= = + + + = SQTrat
815 , 1 215 , 1744 03 , 1746 525 , 8 24
6 2
0 , 99
6 2
6 , 105
2
2 2
= =

= SQA
375 , 9 215 , 1744 59 , 1753 525 , 8 24
6 2
0 , 99
6 2
8 , 94
2
2 2
= =

= SQB
375 , 3 375 , 9 815 , 1 565 , 14 = = SQAxB
Totais de blocos
2 , 34 6 , 8 0 , 8 8 , 9 8 , 7
1
= + + + =
- -
y
6 , 33 8 , 8 6 , 7 0 , 10 2 , 7
2
= + + + =
- -
y
1 , 35 5 , 8 3 , 8 9 , 9 4 , 8
3
= + + + =
- -
y
5 , 34 4 , 8 5 , 7 8 , 10 8 , 7
4
= + + + =
- -
y
1 , 35 9 , 8 6 , 8 6 , 9 0 , 8
5
= + + + =
- -
y
1 , 32 8 , 7 0 , 8 7 , 8 6 , 7
6
= + + + =
- -
y
605 , 1 215 , 1744 82 , 1745 525 , 8 24
2 2
1 , 32
2 2
6 , 33
2 2
2 , 34
2
2 2 2
= =

+ +

= SQBloc
115 , 3 565 , 14 605 , 1 285 , 19 = = SQRes
Quadro auxiliar
A
B Total
(Fator A)
525 , 8
24 ; 6 ; 2 ; 2
=
= = = =
- - -
y
n r b a

B
1
B
2

A
1
46,8 58,8 105,6
A
2
48,0 51,0 99,0
Total
(Fator B)
94,8 109,8 204,6
47
Delineamento de Experimentos
Tabela 5.5 ANOVA para o DDVE
Causa de
Variao
GL SQ QM F
Blocos 5 1,605 0,321 -
Tratamentos 3 14,565 4,855 23,34 (p<0,01)
A 1 1,815 1,815 8,73 (P<0,01)
B 1 9,375 9,375 45,07 (p<0,01)
AxB 1 3,375 3,375 16,23 (p<0,01)
Resduo 15 3,115 0,208
Total 23 19,285
O resultado do teste de interao entre os fatores A e B mostrou-se
significante (p<0,01), logo, o teste de Tukey deve ser feito no desmembramento da
interao.
Considere =0,05, ento tem-se:
( ) ( )
( )
mm 56 , 0
6
208 , 0
01 , 3
6
% 5 % 5
15 ; 2 %; 5 / /
= = = A =
QMRes
q DMS
j j
B A B A

( ) ( )
( )
mm 56 , 0
6
208 , 0
01 , 3
6
% 5 % 5
15 ; 2 %; 5 / /
= = = A =
QMRes
q DMS
i i
A B A B

Tabela 5.6 Mdia e desvio padro do DDVE (mm) segundo droga e
momento de sacrifcio
Droga (Grupo)
Momento de Sacrifcio
6 Semana 21 Semana
Ausente (Controle) 7,800,40 a
(1)
A
(2)
9,800,68 b B
Presente (Lisinopril) 8,000,42 a A 8,500,39 a A
1)

(1)
duas mdias seguidas de uma mesma letra minscula no diferem (p>0,05) quanto aos respectivos grupos,
fixada a semana de sacrifcio.
(2)

(2)
duas mdias seguidas de uma mesma letra maiscula no diferem (p>0,05) quanto aos respectivos
momentos de sacrifcio, dentro do grupo.
5.6. Exerccios (Esquemas Fatoriais: DIC e DBCC)
1) O consumo dirio de rao em kg/dia, no perodo de crescimento-acabamento de
sunos foi observado em um esquema envolvendo tipos de rao e formas de
arraoamento em um delineamento em blocos completos ao acaso.
Considerando =0,05 estudar o consumo mdio dirio em funo dos dois
fatores.
Rao Arraoamento
Bloco
A B C D E
Farelada Livre (Vontade) 2,63 2,68 2,74 2,84 2,76
Farelada Controlada 2,45 2,36 2,44 2,50 2,40
Granulada Livre (Vontade) 2,32 2,25 2,16 2,24 2,38
Granulada Controlada 2,44 2,50 2,42 2,55 2,54

2) Um experimento visando verificar o efeito do inseticida e do meio de cultura em
organismos biolgicos foi planejado utilizando-se drosfilas e observando a
longevidade (dias de sobrevida) destas moscas. Os tratamentos utilizados foram
os seguintes:
48
Delineamento de Experimentos
A
1
B
1
: atrazine e carncia de glicose;
A
1
B
2
: atrazine e carncia de hidrato de carbono;
A
2
B
1
: dalapon e carncia de glicose;
A
2
B
2
: dalapon e carncia de hidrato de carbono.

Tratamento Repetio
A
1
B
1
49 50 51 54
A
1
B
2
36 37 35 32
A
2
B
1
38 31 35 37
A
2
B
2
34 30 28 25
Considerando o nvel de significncia 5% e os dados sob a transformao raiz
quadrada avaliar a sobrevida mdia das moscas segundo os tipos de inseticida e
meios de cultura.

3) Organize os tratamentos de um esquema fatorial para estudar a interao de uma
droga administrada em trs condutas diferentes (manh, tarde, noite) com bebida
alcolica.

4) Verificar se existe interao significante (p<0,05) entre os fatores A e B
estudados em um delineamento em blocos completos casualizados.

Fator A Fator B
Bloco
I II III IV
A
1
B
1
16 17 19 12
A
1
B
2
24 23 27 22
A
2
B
1
22 21 23 22
A
2
B
2
33 35 35 32
5.7. Respostas dos Exerccios (Esquemas Fatoriais : DIC e DBCC)
1)
Tabela 1. ANOVA para o consumo de rao
C. Variao GL SQ QM F
Blocos 4 0,030 0,008 -
Tratamentos 3 0,546 0,182 45,50 (p<0,001)
Rao ( R ) 1 0,200 0,200 50,00 (p<0,001)
Arraoamento ( A) 1 0,008 0,008 2,00 (p>0,05)
A R 1 0,338 0,338 84,50 (p<0,001)
Resduo 12 0,048 0,004
Total 19 0,624

Tabela 2. Mdia (desvio padro) do consumo de rao segundo rao e arraoamento
Rao
Arraoamento
Livre Controlada
Farelada 2,730 (0,080) b B 2,430 (0,053) a A
Granulada 2,270 (0,084) a A 2,490 (0,058) a B
DHS (Rao/Arraoamento) = 0,087 (letras minsculas)
DHS (Arraoamento/Rao) = 0,087 (letras maisculas)


49
Delineamento de Experimentos
2)
Tabela 1. ANOVA para os dias de sobrevida
(*)

C. Variao GL SQ QM F
Tratamento 3 6,539 2,180 35,21 (p<0,001)
Inseticida ( I ) 1 2,967 2,967 47,86 (p<0,001)
Meio ( M ) 1 3,089 3,089 49,82 (p<0,001)
M I 1 0,483 0,483 7,79 (p<0,05)
Resduo 12 0,743 0,062
Total 15 7,282
(*)
Varivel sob a transformao raiz quadrada

Tabela 2. Mdia (desvio padro) da raiz quadrada da sobrevida segundo
inseticida e meio de cultura
Inseticida
Meio de cultura (carncia)
Glicose Hidrato de Carbono
Atrazine 7,140 (0,150) b B 5,914 (0,184) b A
Dalapon 5,933 (0,264) a B 5,400 (0,348) a A
DHS (Inseticida/Meio) = 0,384 (letras minsculas)
DHS (Meio/Inseticida) = 0,384 (letras maisculas)

3) Fator A (Bebida Alcolica): A1 (Ausente) e A2(Presente)
Fator B (Perodo de Administrao): B1(Manh), B2(Tarde) e B3(Noite)
Tratamentos: A1B1(Bebida Ausente e Perodo Manh)
A1B2(Bebida Ausente e Perodo Tarde)
A1B3(Bebida Ausente e Perodo Noite)
A2B1(Bebida Presente e Perodo Manh)
A2B2(Bebida Presente e Perodo Tarde)
A2B3(Bebida Presente e Perodo Noite)

4)
Tabela 1. ANOVA para a varivel estudada
C. Variao GL SQ QM F
Blocos 3 32,19 10,73 -
Tratamento 3 652,19 217,40 39,38 (p<0,001)
A 1 248,07 248,07 44,94 (p<0,001)
B 1 390,07 390,07 70,67 (p<0,001)
B A 1 14,05 14,05 2,55 (p>0,05)
Resduo 9 16,56 5,52
Total 15 700,94
) 05 , 0 ( 55 , 2 > = p F
INT
; ou seja, o resultado do teste da interao dos
fatores A e B no significante.
50
Delineamento de Experimentos
6. Anlise de Aderncia e Associao
6.1. Introduo
Consideremos o estudo de variveis aleatrias (que podem ser
qualitativas ou quantitativas) cujos elementos da amostra podem ser classificados em
categorias, ou intervalos, ou classes ou ainda atributos. Em particular, o estudo ser
aprofundado em tabelas de dupla entrada em que se apresenta a situao geral, em que
duas variveis aleatrias qualitativas X e Y foram classificadas em r categorias para X e
s categorias para Y.
6.2. Teste de Aderncia
Considere que se tem uma populao e que o objetivo proposto
consiste em verificar se ela segue uma distribuio especificada
0
, ou seja, testar a
hiptese H
0
: =
0
. Nesta situao, o teste estatstico comparar o nmero de casos
ocorridos (frequncias observadas) em caselas especificadas, com o nmero esperado
(frequncias esperadas) de casos, sob a veracidade da hiptese nula H
0
.
O procedimento consiste em considerar classes, segundo as quais a
varivel X, caracterstica em estudo da populao, pode ser classificada (a varivel X
pode ser qualitativa ou quantitativa).
A situao geral com r categorias pode ser apresentada conforme Tabela
6.1.
Tabela 6.1 Distribuio do nmero de casos segundo classe de X
Classe de X Nmero de casos
Classe 1 n
1
(fo
1
)
Classe 2 n
2
(fo
2
)

Classe r n
r
(fo
r
)
Total n (fo

)
Lembrar que:
n
1
+n
2
+...+n
r
=n, ou seja,
fo
1
+fo
2
+...+fo
r
=fo

(total de casos)
As hipteses so apresentadas como:
r
r
H
0 0 2 0 1 0
; ; :
2 1
t t t t t t = = = ; i H
i
algum para Existe :
i 0 1
t t = .
As frequncias esperadas (fe
i
) do modelo multinomial (r classes) so
obtidas sob a veracidade de H
0
, especificadas na expresso:
i
n fe
i 0
t = ; onde n o
nmero total de casos e
i
0
t , a proporo terica da classe i expressa em H
0
.
51
Delineamento de Experimentos
A estatstica do teste, sob veracidade de H
0
, dada por
( )
( )
2
1
1
2
2
~

=


=
r
r
i i
i i
fe
fe fo
_ _ , com a regra de deciso habitual (isto ,
( )
2
1 ;
2

>
r calc o
_ _ ,
rejeita-se H
0
. Caso contrrio, no h rejeio). Deve ser considerado a unilateralidade
direita do teste.
O emprego apropriado do teste recomenda sua utilizao somente
quando no existir mais de 20% das caselas com frequncias esperadas menores que 5.
A prtica biolgica permite a juno de classes adjacentes para contornar essa situao
sempre que possvel.
Exemplos
1) Um modelo gentico especifica que animais de certa populao devem estar
classificados em quatro categorias, nas propores 8:1:1:2. Numa amostra de
180 animais da populao encontra-se 116, 15, 20 e 29 animais de cada
categoria, respectivamente. Verificar, no nvel de significncia 5%, se os dados
esto de acordo com o modelo gentico especificado.
Categoria
Frequncia
Observada

C1 116
( ) 4 , 3 , 2 , 1 um menos pelo para , Existe :
12
2
;
12
1
;
12
1
;
12
8
2 : 1 : 1 : 8 do Especifica Modelo :
0 i 1
0 0 0 0
0
4 3 2 1
= =
= = = =
i i H
H
i
t t
t t t t

C2 15
C3 20
C4 29
Total 180
Frequncias Esperadas
Categoria 1 animais 120
12
8
180 = =
i
fe ,
Categoria 2 animais 15
12
1
180
2
= = fe ,
Categoria 3 animais 15
12
1
180
3
= = fe ,
Categoria 4 animais 30
12
2
180
4
= = fe .
Logo, tem-se
( ) ( ) ( ) ( )
833 , 1 033 , 0 667 , 1 000 , 0 133 , 0
30
30 29
15
15 20
15
15 15
120
120 116
2 2 2 2
2
= + + + =

= _

( )
( ) 05 , 0 833 , 1 81 , 7
4
05 , 0
2 2
3 ; 05 , 0
> = =
)
`

=
=
p
r
_ _
o

No h rejeio de H
0
no nvel de 5% de significncia. Ou seja, a amostra de
animais est em acordo com modelo gentico especificado.
52
Delineamento de Experimentos

H
0
: Equilbrio Hardy-Weinberg
Aa Aa
AA Aa aa
4
1
;
2
1
;
4
1
3 2 1
0 0
= = = t t t
o
H
1
: No h Eq HW na descendncia


2) Considerando-se uma amostra de 100 descendentes de uma populao, verificar
(nvel de 5% de significncia) a adequabilidade dos dados ao modelo gentico
Equilbrio Hardy-Weinberg.




Frequncia Esperada
Gentipo AA 25
4
1
100
1
= = fe
Gentipo Aa 50
2
1
100
2
= = fe
Gentipo aa 25
4
1
100
3
= = fe
Logo, tem-se
( ) ( ) ( )
18 , 1 64 , 0 50 , 0 04 , 0
25
25 29
50
50 45
25
25 26
2 2 2
2
= + + =

= _
( )
( ) 05 , 0 18 , 1 99 , 5
3
05 , 0
2 2
2 ; 05 , 0
> = =
)
`

=
=
p
r
_ _
o

Para =0,05, no h rejeio de H
0
, ou seja, a populao segue o equilbrio
Hardy-Weinberg.
6.3. Teste de Homogeneidade
Considere r populaes
1
,
2
,...,
r
distribudas em s categorias
mutuamente exclusivas. Objetiva-se verificar se as r populaes (
1
,...,
r
) podem ser
representadas por uma distribuio comum a todas ( )
r
H t t t = =
2 1 0
: contra a
alternativa em que pelo menos duas so distintas
( ) r i i i i H
i i
, , 1 ' , ; ' para Existe :
' 1
= = = t t .
Contemplando as r populaes em s categorias, as frequncias
observadas podem ser apresentadas na Tabela de dupla entrada rs (tabela de
contingncia rs)
Gentipo
Frequncia
Observada
AA 26
Aa 45
Aa 29
Total 100
53
Delineamento de Experimentos
Tabela 6.2 Resultados da categoria segundo populao
Populao
Categoria
Total
C
1
C
2
... C
s

P
1
fo
11
fo
12
... fo
1s
fo
1

P
2
fo
21
fo
22
... fo
2s
fo
2


P
r
fo
r1
fo
r2
... fo
rs
fo
r

Total fo
1
fo
2
... fo
s
fo


A hiptese de nulidade a ser testada estabelecida como:

= = =
= = =
= = =
rs s s
r
r
H
t t t
t t t
t t t

2 1
2 22 12
1 21 11
0
: , ou equivalentemente,
1
=
2
=...=
r
; contra a
alternativa
:
1
H pelo menos uma das igualdades no verificada.
As frequncias esperadas, considerando-se a hiptese H
0
verdade so
obtidas como:
s j r i
fo
fo fo
fo fe
j i
j i ij
,..., 1 e ,..., 1 para , = = = =
- -
- -
-
t
Sob a veracidade de H
0
, a estatstica do teste dada por:
( )
( )( )
2
1 1
1 1
2
2
~

= =


=
s r
r
i
s
j ij
ij ij
fe
fe fo
_ _ , com a regra de deciso habitual. Ou seja,
( )( ) ( )
2
1 1 ;
2

>
s r calc o
_ _ rejeita-se H
0
; caso contrrio, no h rejeio.

Exemplos
1) Duas novas drogas vo ser testadas em 200 pessoas portadoras de rinite alrgica.
Metade das pessoas recebe a droga A e a outra metade recebe a droga B.
Considerando os dados apresentados a seguir, teste a hiptese de que as duas
drogas so igualmente eficazes para tratar a doena (adotar =0,05).
Droga
Eficaz
Total
B Droga A Droga :
B Droga A Droga :
1
22 12
21 11
0
=

=
=
=
H
H
t t
t t

No Sim
A 25 75 100
B 32 68 100
Total 57 143 200
Frequncias Esperadas
5 , 28
200
100 57
11
=

= fe
5 , 71
200
100 143
12
=

= fe
54
Delineamento de Experimentos
5 , 28
200
100 57
21
=

= fe
5 , 71
200
100 143
22
=

= fe
( ) ( ) ( ) ( )
20 , 1 17 , 0 17 , 0 43 , 0 43 , 0
5 , 71
5 , 71 68
5 , 71
5 , 71 75
5 , 28
5 , 28 32
5 , 28
5 , 28 25
2 2 2 2
2
= + + + =

= _

( )
( ) 05 , 0 20 , 1 84 , 3
2
2
05 , 0
2 2
1 ; 05 , 0
> = =

=
=
=
p
s
r _ _
o

No nvel de 5% de significncia, no h rejeio de H
0
. Isto , as duas drogas so
igualmente eficazes, no nvel de 5% de significncia.

2) Foram consideradas as distribuies do tipo sanguneo do sistema MN em trs
populaes (grupos) de indivduos, conforme dados apresentados abaixo:
Grupo
Tipo Sanguneo
Total

MM MN NN Verificar, no nvel de 5% de
significncia, se h diferena
entre os grupos quanto a
distribuio do tipo sanguneo.
Controle 50 40 50 140
Gastrite 15 20 20 55
lcera 25 20 10 55
Total 90 80 80 250
H
0
: Controle = Gastrite = lcera
H
1
: Existe pelo menos uma diferena entre os grupos
A seguinte tabela de frequncias esperadas pode ser elaborada:
Grupo
Tipo Sanguneo
MM MN NN
Controle 50,4 44,8 44,8
Gastrite 19,8 17,6 17,6
lcera 19,8 17,6 17,6
( ) ( ) ( )
6 , 17
6 , 17 10
8 , 44
8 , 44 40
4 , 50
4 , 50 50
2 2 2
2

+ +

= _
2818 , 3 3273 , 0 3657 , 1 3273 , 0 3273 , 0 1636 , 1 6036 , 0 5143 , 0 0032 , 0
2
+ + + + + + + + = _

91 , 7
2
= _
( )
( ) 05 , 0 91 , 7 49 , 9
3
3
05 , 0
2 2
4 ; 05 , 0
> = =

=
=
=
p
s
r _ _
o

No h rejeio de H
0
, ou seja, no nvel de 5% de significncia os grupos no
diferem quanto a distribuio do tipo sanguneo.
6.4. Teste de Independncia
Uma situao muito interessante na rea biolgica consiste em
considerar duas caractersticas (variveis biolgicas) avaliadas numa amostra de
55
Delineamento de Experimentos
indivduos e, verificar se a probabilidade de um indivduo qualquer ser classificado nas
categorias ( ) ( ) s j j r i i ,..., 1 e ,..., 1 = = simultaneamente, pode ser obtido pelo produto das
probabilidades marginais. Ou seja, verificar se as duas caractersticas so
independentes.
Considerando a tabela de dupla entrada com r linhas e s colunas,
objetiva-se testar as hipteses:
j i ij
H
- -
= t t t :
0
para todo par ( j i, ) as caractersticas estudadas so
independentes;
j i ij
H
- -
= t t t :
1
para algum par ( j i, ) as caractersticas estudadas so
dependentes.
As frequncias esperadas, considerando-se H
0
verdade, so dadas por
- -
- -
=
fo
fo fo
fe
j i
ij
. Resultado idntico ao utilizado no teste de homogeneidade.
Sob a veracidade de H
0
, a estatstica do teste expressa como
( )
( )( )
2
1 1
1 1
2
2
~

= =


=
s r
r
i
s
j ij
ij ij
fe
fe fo
_ _ , com a regra de deciso habitual.

Exemplos
1) A tabela a seguir relaciona resultados de uma pesquisa obtidos de uma amostra
aleatria de vtimas de diferentes crimes. Utilizando =0,05, verificar se o tipo
de crime independente do fato do criminoso ser um estranho.
Criminoso
Crime
Total
Homicdio Roubo Assalto
Estranho 15 400 230 645
Conhecido 45 100 210 355
Total 60 500 440 1000
crime de tipo e estranho ser criminoso entre cia Independn :
1,2,3 j 1,2; i
todo para
0

|
|
.
|

\
|
=
= =
- - j i ij
H t t t
crime de tipo e estranho ser criminoso entre a Dependnci :
1,2,3 j 1,2; i
algum para
1

|
|
.
|

\
|
=
= =
- - j i ij
H t t t

Frequncias Esperadas
7 , 38
1000
645 60
11
=

= fe ; 5 , 322
1000
645 500
12
=

= fe ; 8 , 283
1000
645 440
13
=

= fe
3 , 21
1000
355 60
21
=

= fe ; 5 , 177
1000
355 500
22
=

= fe ; 2 , 156
1000
355 440
23
=

= fe .
( ) ( ) ( )
=

+ +

=
2 , 156
2 , 156 210
5 , 322
5 , 322 400
7 , 38
7 , 38 15
2 2 2
2
_
07 , 122 53 , 18 84 , 33 37 , 26 20 , 10 62 , 18 51 , 14
2
= + + + + + = _
56
Delineamento de Experimentos
( )
( ) 001 , 0 07 , 122 99 , 5
3
2
05 , 0
2 2
2 ; 05 , 0
< = =

=
=
=
p
s
r _ _
o

No nvel de 5% de significncia existe dependncia entre o tipo de crime
cometido e o fato do criminoso ser um estranho.

2) Os resultados da classificao de 100 pessoas segundo a cor dos olhos e do
cabelo foram os seguintes:
Cor do
Cabelo
Cor dos Olhos
Total

Castanhos Azuis Cinza No nvel de 5% de
significncia a cor dos
olhos est relacionada
com a cor do cabelo?
Claro 13 18 9 40
Escuro 37 12 11 60
Total 50 30 20 100
H
0
: H independncia entre a cor dos olhos e a cor do cabelo ( )
j i - -
= t t t
ij

H
1
: H dependncia entre a cor dos olhos e a cor do cabelo ( )
j i - -
= t t t
ij

Frequncias Esperadas
20
100
50 40
11
=

= fe ; 12
100
30 40
12
=

= fe ; 8
100
20 40
13
=

= fe
30
100
50 60
21
=

= fe ; 18
100
30 60
22
=

= fe ; 12
100
20 60
23
=

= fe .
( ) ( ) ( )
12
12 11
12
12 18
20
20 13
2 2 2
2

+ +

= _
29 , 9 08 , 0 00 , 2 63 , 1 13 , 0 00 , 3 45 , 2
2
= + + + + + = _
( )
( ) 01 , 0 29 , 9 99 , 5
3
2
05 , 0
2 2
2 ; 05 , 0
< = =

=
=
=
p
s
r _ _
o

No nvel de 5% de significncia rejeita-se H
0
, ou seja, existe dependncia
(relao) entre a cor dos olhos e a cor do cabelo.
6.5. Exerccios (Testes de Aderncia e Associao)
1) Suponha que um teste de aptido verbal tenha sido aplicado a um grupo de 120
adolescentes do gnero masculino e 100 do gnero feminino. Os resultados esto
a seguir. Qual a concluso a respeito da associao entre gnero e aptido verbal
no nvel de 5% de significncia?
Gnero
Nvel de Aptido
Total
Superior Mdio Inferior
Feminino 25 55 20 100
Masculino 20 80 20 120
Total 45 135 40 220

2) Desejando-se colocar prova a hiptese de que a idade da me tem certa
influncia sobre o nascimento de criana prematura, um pesquisador verificou
que, dentre 90 casos de prematuridade, 40 envolviam mes com idade inferior a
18 anos; 15 envolviam mes de 18 a 35 anos e 35 mes com idade acima de 35
57
Delineamento de Experimentos
anos. No nvel de 5% de significncia, isto leva o pesquisador a manter sua
hiptese?

3) Em um teste qui-quadrado, quanto maior a diferena entre frequncias esperadas
e observadas, maior chance temos de: a) aceitar (no rejeitar) H
0
ou b) rejeitar
H
0
? Explicar a resposta.

4) Considere o seguinte resultado quanto ao tabagismo dos pais e filhos
Pais
Filhos
Tabagistas
No
Tabagistas
Tabagistas 49 16
No Tabagistas 106 79
Verificar no nvel de 5% de significncia a associao entre pais e filhos quanto
ao tabagismo

5) Conforme a herana mendeliana, a descendncia de certo cruzamento deveria ser
vermelha, preta ou branca na seguinte proporo: 9:3:4. Se um experimento
mostrou 74, 32 e 38 descendentes nessas categorias, a teoria est confirmada,
sendo =0,05?

6) A seguir so apresentados dados sobre a presena (ou no) de anomalia em
recm-nascidos vivos segundo o sexo.
Sexo
Anomalia
Ausente Presente
Masculino 586 14
Feminino 674 26

Verifique, no nvel de significncia 5%, se a proporo de recm-nascidos vivos
portadores de anomalia a mesma nos dois sexos.

7) Com base nos dados apresentados a seguir, verificar se a condio de vivo ou
natimorto homognea nos dois sexos, considerando-se =0,01.
Sexo
Condio
Vivo Natimorto
Masculino 825 25
Feminino 960 40

8) Considere a distribuio de ervilhas do cruzamento de plantas de sementes lisas
e albume amarelo com plantas de sementes rugosas e albume verde.
Sementes Frequncia
Amarelo-lisas 380
Amarelo-rugosas 100
Verde-lisas 130
Verde-rugosas 30
No nvel de significncia de 5%, os resultados esto de acordo com a teoria
postulada por Mendel (9:3:3:1, para as classes de sementes).

58
Delineamento de Experimentos
9) Considere uma amostra do ms de nascimento de 200 polticos brasileiros.
Verificar (=0,05) a hiptese de que o ms de nascimento tem uma distribuio
uniforme nos polticos brasileiros.
Ms Jan Fev Mar Abr Maio Jun Jul Ago Set Out Nov Dez
Frequncia 16 18 13 15 16 12 20 20 18 14 18 20

10) Numa Universidade, os estudantes de dois programas de ps-graduao
diferentes so submetidos ao mesmo exame de conhecimentos de redao
cientfica. Os conceitos obtidos foram os seguintes:
Programa de PG
Conceito
Fraco Regular Bom Excelente
XY 16 8 20 9
WZ 18 12 26 22
No nvel de significncia 5%, a distribuio dos conceitos homognea nos dois
programas?

11) Numa pesquisa 120 pares de gmeos foram classificados segundo o sexo e a
ordem que ocorreu o nascimento.
Primeiro a nascer
Segundo a nascer
Masculino Feminino
Masculino 38 22
Feminino 26 34
No nvel de significncia 5% verificar se o sexo e a ordem de nascimento so
independentes.

12) Foram amostrados 120 pares de gmeos classificados de acordo com o sexo com
o seguinte resultado:
Verificar, no nvel de significncia 5%, se a classificao do sexo est em
acordo com o modelo binomial ( )
2
1
; 2 B .
6.6. Respostas dos Exerccios (Testes de Aderncia e Associao)
1) ) 05 , 0 ( 40 , 3
2
> = p _
2) ) 01 , 0 ( 67 , 11
2
> = p _
3) Quanto mais os valores observados se afastam dos esperados, tm-se maiores
desvios (sendo o numerador do clculo elevado ao quadrado) e, portanto,
aumenta a chance de rejeitar a hiptese de nulidade (H
0
).
4) ) 01 , 0 ( 68 , 6
2
< = p _
5) ) 05 , 0 ( 64 , 1
2
> = p _
6) ) 05 , 0 ( 07 , 2
2
> = p _
7) ) 05 , 0 ( 52 , 1
2
> = p _
8) ) 05 , 0 ( 78 , 7
2
> = p _
9) ) 05 , 0 ( 08 , 5
2
> = p _
Situao Dois meninos Duas meninas Um menino e Uma menina
Frequncia 34 38 48
59
Delineamento de Experimentos
10) ) 05 , 0 ( 47 , 2
2
> = p _
11) ) 05 , 0 ( 82 , 4
2
< = p _
12) ) 05 , 0 ( 07 , 5
2
> = p _
60
Delineamento de Experimentos
7. Correlao Linear Simples
7.1. Introduo
Nas reas biolgicas, no raras vezes, o pesquisador est interessado em
estudar a maneira como duas variveis X e Y esto associadas e, mais ainda, medir o
seu grau de associao. Alguns exemplos que podem esclarecer essa situao so
bastante comuns em nosso cotidiano, quais so: afirmar que a presso arterial aumenta
quando a idade avana; a altura de uma rvore est relacionada ao permetro do tronco;
o desempenho de um atleta melhora com o treinamento, e assim por diante.
Em todas as situaes esto sendo considerados, simultaneamente, os
valores de duas variveis aleatrias mensuradas num mesmo indivduo, isto ,
observaes pareadas. Como j descrito anteriormente, busca-se verificar qual o sentido
e a intensidade da associao entre as variveis, mas jamais utilizar essa busca como
uma relao de causa e efeito. Ou seja, a observao de que duas grandezas podem
variar simultaneamente no mesmo sentido ou em sentidos contrrios, no implica a
presena de um relacionamento causal entre elas.
Em nosso curso ser considerado que a associao entre as variveis
pode ser estudada por meio de uma relao linear, ou seja, os pares de pontos
distribudos na vizinhana de uma reta.
Para melhorar o entendimento entre correlao e causalidade, suponha,
por exemplo, uma associao positiva entre o consumo de lquido de uma cidade e o
nmero de internaes por desidratao. A falcia da causalidade poderia levar a
diminuio de ingesto de lquido para diminuir o nmero de internaes por
desidratao. Lgico, que neste caso, uma terceira ou mais variveis (temperatura,
umidade relativa do ar,...) podem estar causando a correlao entre consumo de lquido
e nmero de internaes. Essas variveis so denominadas de variveis intercorrentes
(no conhecidas) e a falsa correlao que elas fornecem chamada de correlao
espria.
7.2. Diagrama de Disperso
O diagrama de disperso consiste de um grfico bidimensional (sistema
de eixos cartesianos (X,Y) onde so alocados os n pares de observaes das variveis
aleatrias X e Y.
O objetivo do diagrama de disperso possibilitar a visualizao da
relao existente entre as variveis X e Y. Se os pontos estiverem localizados na
61
Delineamento de Experimentos
vizinhana de uma reta h indicao de correlao, se X e Y crescem no mesmo sentido,
a indicao no sentido de correlao positiva, caso a variao acontea no sentido
oposto (contrrio), existe correlao negativa entre as variveis. A Tabela 7.1 apresenta
o desempenho fsico e psicolgico de mulheres obesas submetidas aos testes relativos
qualidade de vida das participantes.
Tabela 7.1 Desempenho fsico e psicolgico de mulheres
obesas submetidas ao Deep water running and quality of life in
obese women (Arquivos Mdicos do ABC, v.32, p.5-10, 2007)
Mulher D. Fsico (%) D. Psicolgico (%)
M1 30 35
M2 40 50
M3 75 70
M4 50 50
M5 35 30
M6 60 65
M7 70 55
M8 55 55

20
30
40
50
60
70
80
20 30 40 50 60 70 80 90
D. Psicolgico
D. Fsico
Figura 7.1 Diagrama de Disperso dos Domnios
Fsico (%) e Psicolgico (%)

A inspeo visual, mostra de maneira subjetiva, a tendncia linear nas
observaes no sentido positivo, ou seja, as mulheres mostraram associao direta nas
respostas dos domnios fsico e psicolgico. A intensidade dessa associao pode ser
mensurada, objetivamente, pelo coeficiente de correlao linear de Pearson, sendo que a
intensidade ser tanto maior quanto menor for a disperso dos pontos em relao
tendncia linear.
7.3. Coeficiente de Correlao
A medida do grau (intensidade) de associao linear entre duas variveis
aleatrias quantitativas (numricas) pode ser estabelecida pelo coeficiente de correlao
de Pearson, representado por r e expresso para n pares (x
i
, y
i
) de uma amostra aleatria
das variveis X e Y como:
62
Delineamento de Experimentos
yy xx
xy
S S
S
r = , onde
( ) ( )( )

= =
= = =
n
i
i i
n
i
i i xy
y x n y x y y x x Y X SP S
1 1
, ;
( ) ( )

= =
= = =
n
i
i
n
i
i xx
x n x x x X SQ S
1
2 2
1
2
;
( ) ( )
2
1
2
1
2
y n y y y Y SQ S
n
i
i
n
i
i yy
= = =

= =
.
Algumas consideraes interessantes podem ser feitas a respeito do valor
de r:
a) 1 1 s s r ;
b) 1 + = r , correlao perfeita positiva (todos os pontos esto sobre uma linha reta
crescente);
c) 1 = r , correlao perfeita negativa (todos os pontos esto sobre uma linha reta
decrescente);
d) 0 = r ; correlao nula (ausncia de associao linear entre as variveis X e Y);
e) r adimensional.

Exemplos
1) Considerando os dados da Tabela 7.1, tem-se:

=
= + + =
8
1
415 55 30
i
i
x , portanto, 875 , 51 = x ;
23375 55 30
2 2
8
1
2
= + + =

=

i
i
x ;
( ) 875 , 1846 875 , 51 8 23375
2
= = = X SQ S
xx
;
410 55 35
8
1
= + + =

=

i
i
y , portanto, 25 , 51 = y ;
22300 55 35
2 2
8
1
2
= + + =

=

i
i
y ;
( ) 5 , 1287 25 , 51 8 22300
2
= = = Y SQ S
yy
;
22625 3025 2000 1050 55 55 50 40 35 30
8
1
= + + + = + + + =

=

i
i i
y x ;
( ) 25 , 1356 25 , 51 875 , 51 8 22625 , = = = Y X SP S
xy
;
logo 88 , 0 8795 , 0
0284 , 1542
25 , 1356
5 , 1287 875 , 1846
25 , 1356
~ = =

= r
A magnitude da associao linear entre as variveis da ordem de 0,88,
mostrando que as mulheres que tiveram maiores porcentagens no domnio fsico
so tambm as de maiores valores percentuais no domnio psicolgico.
2) Considere as seguintes notas em Bioestatstica e Biofsica de 11 alunos de
Cincias Biolgicas selecionados aleatoriamente entre todos os matriculados,
conforme Tabela 7.2
63
Delineamento de Experimentos
Tabela 7.2 Notas de 11 alunos em Bioestatstica e Biofsica
Aluno A B C D E F G H I J K
Bioestatstica (X) 6,7 8,1 6,5 4,2 5,3 4,0 7,1 6,4 6,0 6,8 4,9
Biofsica (Y) 9,2 6,5 8,1 7,5 8,5 7,8 7,7 7,9 8,1 8,2 8,5
0 , 66
11
1
=

= i
i
x , logo 0 , 6 = x ; 88
11
1
=

= i
i
y , logo 0 , 8 = y ;
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ; 1 , 16 1 , 1 8 , 0 0 , 0
4 , 0 1 , 1 0 , 2 7 , 0 8 , 1 5 , 0 1 , 2 7 , 0
2 2 2
2 2 2 2 2 2 2 2
11
1
2
= + + +
+ + + + + + + =

= i
i
x x

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ; 64 , 4 5 , 0 2 , 0 1 , 0 1 , 0
3 , 0 2 , 0 5 , 0 5 , 0 1 , 0 5 , 1 2 , 1
2 2 2 2
2 2 2 2 2 2 2
11
1
2
= + + + +
+ + + + + + =

= i
i
y y

( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ; 07 , 2 5 , 0 1 , 1 2 , 0 8 , 0 1 , 0 5 , 0 5 , 1 1 , 2 2 , 1 7 , 0
11
1
= + + + + + =

=

i
i i
y y x x
24 , 0
64 , 8
07 , 2
64 , 4 1 , 16
07 , 2
=

= r
O coeficiente de correlao negativo (-0,24) mostra que os alunos com
maiores notas em Bioestatstica esto com menores notas em Biofsica, e vice-
versa. Porm, deve ser observado que o valor 24 , 0 = r expressa uma fraca
correlao linear negativa entre as variveis.
7.4. Teste de Hiptese da Correlao
Considerando as variveis aleatrias ( )
2
, ~
x x
N X t e ( )
2
, ~
y y
N Y t , as
hipteses a respeito da ausncia ou presena de associao linear entre as variveis X e
Y podem ser estabelecidas como:
0 :
0
=
xy
H (ausncia de associao linear entre as variveis X e Y)
0 :
1
=
xy
H (presena de associao linear entre as variveis X e Y).
Sob a veracidade de H
0
a estatstica do teste dada por:
( ) 2
2
~
1
2

=
n
t
r
n r
t , com a regra de deciso habitual ( ou seja, se
( ) 2 ,
2

>
n
t t
o
, rejeita-se
a hiptese H
0
; caso contrrio, no h rejeio).
Alternativamente, o valor do resultado do coeficiente de correlao linear
de Spearman ( r ) pode ser comparado com os valores crticos da Tabela 7.2, com a
seguinte regra de deciso:
Se
crit calc
r r > , rejeita-se H
0
ao nvel (0,05 ou 0,01) de significncia
estabelecido. Caso contrrio, no h rejeio da hiptese nula (ausncia de
associao linear entre X e Y).

64
Delineamento de Experimentos
Exemplos
1) Considerando os dados da Tabela 7.1 e =0,05, tem-se
0 :
0
=
xy
H (ausncia de associao linear)
0 :
1
=
xy
H (presena de associao linear)
( ) 01 , 0 54 , 4
475 , 0
156 , 2
88 , 0 1
6 88 , 0
2
< = =

= p t
( )
45 , 2
6 2 8
05 , 0
6 ; 025 , 0
=
)
`

= =
=
t

o
; 45 , 2 > t , portanto, rejeita-se H
0
.
No nvel de significncia 5% existe associao linear entre os domnios fsico e
psicolgico.
2) Considerando os dados das notas de Bioestatstica e Biofsica da Tabela 7.2,
tem-se:
0 :
0
=
xy
H (ausncia de associao linear)
0 :
1
=
xy
H (presena de associao linear)
( )
( ) 05 , 0 74 , 0
97 , 0
72 , 0
24 , 0 1
9 24 , 0
2
> =

= p t
( )
26 , 2
9
05 , 0
9 ; 025 , 0
=
)
`

=
=
t

o
; 26 , 2 < t , no se rejeita H
0
.
No nvel de significncia 5%, no foi possvel mostrar associao linear entre as
notas de Bioestatstica e Biofsica nos alunos de Cincias Biolgicas.
7.5. Exerccios (Correlao Linear Simples)
1) Um antroplogo mediu a largura e o comprimento de 30 crnios amostrados de
uma populao, obtendo um coeficiente de correlao r=0,75. Supondo =0,05,
verificar se existe associao entre as variveis.

2) Os valores das variveis X e Y devem ser medidos na mesma unidade para que
se possa calcular o coeficiente de correlao linear?

3) Considere a idade gestacional (semanas) e o peso ao nascer (kg), de uma
amostra casual de 10 recm-nascidos no HC/UNESP-Botucatu(SP).
No nvel de significncia 5%, verificar se existe associao linear entre a idade
gestacional e o peso ao nascer.

4) Em um experimento com carneiros foram determinados os seguintes resultados
no plasma dos animais:
Recm-nascido RN1 RN2 RN3 RN4 RN5 RN6 RN7 RN8 RN9 RN10
Idade
Gestacional
34 35 37 32 42 40 41 39 28 38
Peso ao Nascer 1,60 1,70 2,00 1,55 4,30 3,00 3,40 3,30 1,25 2,35
65
Delineamento de Experimentos
Carneiro 1 2 3 4 5 6 7 8 9
Conc. Albumina (g%) 2,3 3,5 4,8 1,9 2,7 5,8 4,6 5,4 3,9
Horm. Crescimento
(mg/ml)
41,4 48,6 56,4 40,3 45,3 61,4 52,0 54,0 42,8
Verificar se existe associao linear (=0,05) entre a concentrao de albumina e
o hormnio de crescimento no plasma de carneiros.

5) Apresenta-se a seguir uma matriz de correlao para instruo (X), salrio (Y) e
idade (Z) de uma amostra de 50 indivduos.
Varivel
Varivel
Instruo Salrio Idade

Instruo 1,00 0,60 -0,40 Quais correlaes so
significantes no nvel
0,05?
Salrio 1,00 0,50
Idade 1,00
6) A correlao entre aptido matemtica e lnguas estrangeiras, baseada em testes
para medir aptides, est por volta de 0,40. Qual deve ser o tamanho de uma
amostra de estudantes para estarmos certos (nvel de significncia 5%) de que o
valor do r obtido refutaria a hiptese H
0
: =0?

7) Como deve ser afetado o valor do coeficiente de correlao r se trocarmos as
variveis X por Y e Y por X?

8) D um exemplo de duas variveis que, sem dvida, esto altamente relacionadas
mas para as quais o valor de r seria pequeno pelo fato de a relao no ser linear.

9) Considere os seguintes dados relativos a altura e peso de 10 estudantes de uma
sala de aula e verifique, no nvel de significncia 5%, se as variveis esto
associadas linearmente.
Estudante E
1
E
2
E
3
E
4
E
5
E
6
E
7
E
8
E
9
E
10

Altura 124 161 126 184 172 140 158 135 180 174
Peso 65 76 64 95 86 68 70 68 92 87
10) Indique o erro na concluso
Fato: H uma associao linear significante (p<0,05) entre a renda pessoal e o
nmero de anos de escolaridade.
Concluso: Mais instruo tem como resultado maior renda pessoal.

11) Como afetado o valor do coeficiente de correlao linear quando se adiciona a
mesma constante a cada valor da varivel X?

12) Com base em uma amostra de 38 pares de valores foi obtido o coeficiente de
correlao r=0,45. Teste (=0,05) a hiptese de que o coeficiente de correlao
das variveis zero.

13) Um coeficiente de correlao expressa em nico nmero:
a) a intensidade de uma associao.
b) a direo de uma associao.
c) a intensidade e a direo de uma associao.
66
Delineamento de Experimentos

14) Verificar se existe associao significativa (=0,05) entre horas de estudo e nota
da prova, segundo os dados abaixo:
Aluno A B C D E F G H I K L M
Horas de estudo 4 1 3 5 8 3 6 7 7 6 2 4
Nota da prova 5 2 4 7 9 5 7 10 8 6 3 3
15) Um coeficiente de correlao linear de Pearson, baseado em uma amostra de
tamanho 18, foi calculado como 0,45. Pode-se concluir, no nvel de 5% de
significncia, que h associao entre as variveis X e Y?

16) Para uma amostra de tamanho 11, determinar o valor mnimo do coeficiente de
correlao r, de modo que a hiptese de ausncia de associao linear entre X e
Y(H
0
) seja rejeitada ao nvel de confiana 99% (isto , sempre que
crit
r r > ).

17) Nas questes seguintes aprofunde a discusso no erro de conduo.
a) Fato: H uma correlao linear significativa entre a renda pessoal e o nmero
de anos de escolaridade.
Concluso: mais instruo tem como resultado maior renda pessoal.
b) Fato: Indivduos fazem um teste de habilidade verbal e um teste de destreza
manual; os pares de observao acusam um coeficiente de correlao linear
muito prximo de zero.
Concluso: No h qualquer relacionamento entre os escores dos dois testes.

18) Explique o que est errado na seguinte afirmao: Determinou-se uma
associao linear forte, expressa pelo valor r=1,16, entre a avaliao do ensino
ministrado pela universidade indicada pelos estudantes e outra feito por
membros externos instituio.
7.6. Respostas dos Exerccios (Correlao Linear Simples)
1) ) 001 , 0 ( 00 , 6 < = p t
2) No. Basta que sejam variveis quantitativas
3) 900 , 0 = r ; ) 001 , 0 ( 84 , 5 < = p t
4) 914 , 0 = r ; ) 001 , 0 ( 96 , 5 < = p t
5)
( )
) 001 , 0 ( 20 , 5 < =

p t
SAL INST

( )
) 01 , 0 ( 02 , 3 < =

p t
IDADE INST

( )
) 001 , 0 ( 00 , 4 < =

p t
IDADE SAL

6) No mnimo composta por 25 estudantes
7) O valor permanece inalterado
8) Quantidade de adubao no solo e produo
9) 949 , 0 = r ; ) 001 , 0 ( 52 , 8 < = p t
10) A concluso est fazendo uma relao de causa e efeito, quando na realidade existe
apenas uma associao linear
11) O valor permanece inalterado
12) ) 05 , 0 ( 70 , 2 < = p t
13) c) a intensidade e a direo de uma associao
14) 921 , 0 = r ; ) 01 , 0 ( 48 , 7 < = p t
67
Delineamento de Experimentos
15) ) 05 , 0 ( 02 , 2 > = p t
16) 7348 , 0 > r ; portanto 7348 , 0 = r
17) a) Relao de causa e efeito para um indicativo apenas de associao.
b) No h associao linear, fato que no exclui a possibilidade de outro tipo de
relao.
18) O valor de r no pode ser maior que a unidade.
68
Delineamento de Experimentos
8. Regresso Linear Simples
8.1. Introduo
Os fenmenos biolgicos, quase que na plenitude das situaes, podem
ser explicados por meio de modelos matemticos e estocsticos. Um modelo comum e
de fcil entendimento biolgico que tem sido utilizado para estudar a relao funcional
entre duas variveis consiste na funo linear simples ( ) bX a Y + = .
Neste modelo, a idia consiste em estudar a variao da varivel aleatria
contnua Y (varivel dependente, varivel resposta ou varivel exgena) em funo de
uma varivel fixa X, isto , determinstica (varivel independente, varivel explanatria
ou varivel endgena). Por exemplo, verificar as quedas na quantidade de acar no
sangue de coelhos submetidos a doses diferentes de insulina (doses controladas).
Para melhor entendimento, considere o seguinte experimento realizado
na rea de Bioqumica. Um bioqumico colocou plasma humano em cinco tubos de
ensaio e depois adicionou procana (quantidade fixa em cada tubo). Essa substncia
um anestsico local que se decompe por hidrlise. Para estudar a velocidade da
hidrlise, o pesquisador observou, em tempos definidos e diferentes (4 min., 8 min., 12
min., 16 min. e 20 min.), a quantidade (moles/litro) de procana hidrolisada em cada
tubo de ensaio.
Esquematicamente:

Considerando o tempo com varivel independente (X) e a quantidade de
procana hidrolisada, como a varivel dependente (Y), como estabelecer o modelo da
resposta linear de Y em funo de X?
8.2. Modelo de Regresso Linear Simples
A origem do termo regresso deve-se a Sir Francis Galton ( 1822-1911 ),
ingls de classe alta que estudou medicina em Cambridge e explorou a frica antes de
se dedicar ao estudo da hereditariedade. A data do pioneirismo do uso aconteceu por
69
Delineamento de Experimentos
volta de 1885, quando estava investigando relaes antropomtricas de sucessivas
geraes, em resposta a seguinte interrogativa que fazia: Se as alturas das pessoas esto
distribudas normalmente em cada gerao, e se a altura hereditria, qual a relao
entre as geraes?. Uma das constataes verificada por Galton apontava que cada
particularidade de um homem transmitida aos seus descendentes, mas, em mdia,
numa intensidade menor. Ou seja, embora pais com baixa estatura tendam a ter filhos
tambm com baixa estatura, os filhos tm altura mdia maior que seus pais. Fato
semelhante, em sentido reverso, ocorre com pais com estatura alta. Isto , os filhos
apresentam estatura alta, mas, em mdia, menor que seus pais. Galton chamou esse
fenmeno de regresso para a mediocridade.
Em sua anlise, Galton denominou esse fenmeno de a altura mover-se
em direo altura dos pais de regresso, e s vezes de reverso, expressado num artigo
de 1885, publicado no Journal of the Anthropological Institute (Bussab & Morettin,
2003).
No contexto matemtico, que no foi o caso de Galton, o ajuste de uma
linha reta a quaisquer dados de duas variveis quantitativas pode ser feito pelo mtodo
dos mnimos quadrados criado pelo matemtico francs Legendre, por volta de 1805,
cujo procedimento de obteno dos parmetros envolvidos no modelo linear ser objeto
de estudo no presente desenvolvimento do contedo programtico da disciplina em
curso.
Em relao ao experimento da procana, inicialmente, como anlise
exploratria, torna-se interessante representar os pares de pontos (
i i
y x , ) em um grfico
no sistema cartesiano para verificar se h uma tendncia linear nos dados. Caso exista a
tendncia, o passo seguinte consiste em estabelecer o modelo de resposta linear
bX a Y + = . Se no for verificada a tendncia, a alternativa seria procurar outros
modelos (no-lineares), cujo enfoque no ser abordado no presente texto.
Para o grfico considere a Tabela 8.1 de valores:
Tabela 8.1 Valores observados nos tubos de ensaio
Tempo (X) 4 8 12 16 20
Quantidade hidrolisada (Y) 6 16 23 33 41

70
Delineamento de Experimentos
0
10
20
30
40
0 4 8 12 16 20
Quantidade
Hidrolisada
(moles/litro)
Tempo (min)
Figura 8.1 Diagrama de disperso dos dados

Como pode ser visualizado existe uma tendncia linear nos valores
observados no experimento. Ento, indaga-se: como procurar a equao da reta que
melhor descreve a hidrlise da procana em funo do tempo que foi adicionado no
plasma? Ou seja, como proceder ao ajuste de uma regresso linear simples (RLS) ao
conjunto de dados?
Ajustar uma RLS aos dados significa encontrar a equao da reta que
melhor descreve o fenmeno biolgico. O procedimento matemtico que permite
encontrar esse modelo de resposta denomina-se (para nosso estudo) Mtodo de
Mnimos Quadrados (MQ), cujo objetivo consiste em minimizar a soma dos quadrados
dos erros (ou desvios).
Para o ajuste da RLS e, posteriormente, para os testes de hipteses as
seguintes pressuposies so bsicas:
i) A relao entre as duas variveis linear.
ii) Os valores de X so fixos, isto , X varivel determinstica.
iii) A variabilidade de Y, para qualquer valor dado de X, sempre a mesma.
iv) O erro de uma observao no est correlacionado com o erro de outra observao
(erros no correlacionados).
v) Para qualquer dado valor de X, Y tem distribuio condicional normal
( ( ) ( )
2
; t | o = + = x y Var x x y E ).
Como descrito anteriormente, encontrar os estimadores de mnimos
quadrados para os parmetros (, ) do modelo, consiste em considerar uma amostra
aleatria de n pares ( ) n i y x
i i
, , 1 , , = ; e minimizar a quantidade de informao perdida
pelo modelo, ou seja, a soma dos quadrados dos erros dada por:
( ) ( ) ( )

= =
+ = =
n
i
i i
n
i
i
x y e SQ
1
2
1
2
, | o | o , com
i
e sendo o i-simo erro entre o
valor observado
i
y e o proposto pelo modelo ( )
i i
x x y E | o + = .
71
Delineamento de Experimentos
Derivando ( ) | o, SQ em relao a e e igualando a zero, tem-se que as
solues o (ou a) e |

(ou b) devem satisfazer:



= =
= +
n
i
i
n
i
i
y x n
1 1

| o ;

= = =
= +
n
i
i i
n
i
i
n
i
i
y x x x
1 1
2
1

| o ;
as quais produzem as solues:
x y a | o

= = ;
xx
xy
S
S
b = = |

; onde ( )

= =
= =
n
i
i
n
i
i xx
x n x x x S
1
2 2
1
2
e
( )( )

= =
= =
n
i
i i
n
i
i i xy
y x n y x y y x x S
1 1
.
Portanto, o modelo de regresso ajustado dado como:
( ) x x b y bx a x y
i i i i
+ = + = + = | o

.
No experimento bioqumico, tem-se
5 = n ; ) tempo(min : X ; (moles/L) a hidrolisad quantidade : Y ;
60 20 16 12 8 4
5
1
= + + + + =

= i
i
x , logo 12 = x ;

=
= + + + + =
5
1
2 2 2 2 2 2
880 20 16 12 8 4
i
i
x ;
160 720 880 12 5 880
2
= = =
xx
S ;

=
= + + + + =
5
1
119 41 33 23 16 6
i
i
y , logo 8 , 23 = y ;

=
= + + + + =
5
1
1776 41 20 33 16 23 12 16 8 6 4
i
i i
y x ;
348 8 , 23 0 , 12 5 1776 = =
xy
S ;
175 , 2
160
348
= = =
xx
xy
S
S
b ;
3 , 2 12 175 , 2 8 , 23 = = = x b y a ;
logo,
i i
x y 175 , 2 3 , 2 + = , isto , tempo id H Qt 175 , 2 3 , 2

+ = .
O modelo
i i
x y 175 , 2 3 , 2 + = , constitui-se num preditor da quantidade
de procana hidrolisada para qualquer tempo considerado no intervalo de 4min a 20min.
Alm disso, o valor 2,175 (denominado coeficiente angular da regresso) indica a
variao da varivel Y por unidade de variao em X, ou seja, para cada minuto
decorrido a quantidade de procana hidrolisada tem um acrscimo de 2,175 moles/litro.
O modelo estimado pode ser representado no sistema cartesiano por
meio de uma reta correspondente relao linear encontrada entre as variveis.
72
Delineamento de Experimentos
Ento, considerando
i i
x y 175 , 2 3 , 2 + = , tem-se:
( ) 4 , 6 4 175 , 2 3 , 2 4 = + = =
i i
y x ;
( ) 2 , 41 20 175 , 2 3 , 2 20 = + = =
i i
y x .
0
10
20
30
40
Qtidade
Hidrolisada
Tempo
Figura 8.2 Modelo de regresso linear da quantidade
hidrolisada em funo do tempo
i i
x y 175 , 2 3 , 2 + =


8.3. Coeficiente de Determinao
O coeficiente de determinao (R) indica a proporo da variao de Y
que explicada pela reta de regresso, ou seja, uma medida de preciso do modelo.
Portanto, sendo uma proporo seu valor varia entre zero e um, inclusive ( ) 1 0
2
s s R .
Fica mais prtico interpretar quando seu valor expresso em porcentagem, sendo 0% o
caso extremo de impreciso do modelo e, opostamente, 100% a reteno de toda
informao do fenmeno biolgico explicada pelo modelo ajustado. Valores entre essas
porcentagens limites so to pouco ou mais representativos quanto aos prximos dos
extremos que se alinharem. O clculo do coeficiente de determinao (R) envolve a
relao entre a soma de quadrados devida regresso e a soma total de quadrados
expressa na seguinte frmula:
yy xx
xy
S S
S
SQTotal
o SQRegress
R
2
2
= = . Se no existisse qualquer
variao em torno da reta de regresso (todos os pontos observados estivessem sobre a
reta estimada), no haveria resduos (erros) e, portanto, a soma de quadrados devida
regresso coincidiria com a soma total de quadrados, resultando ( ) % 100 0 , 1
2
= R .
Dificilmente essa condio acontece em biologia, uma vez que existe sempre uma
componente aleatria nas respostas biolgicas.
No experimento bioqumico, tem-se:
60
5
1
=

= i
i
x , com 12 = x ;

=
=
5
1
119
i
i
y , com 8 , 23 = y ;

=
=
5
1
2
880
i
i
x ; 3591
5
1
2
=

= i
i
y ;

=
=
5
1
1776
i
i i
y x ; resultando,
160 =
xx
S ; 8 , 758 =
yy
S ; 348 =
xy
S .
73
Delineamento de Experimentos
Logo, ( ) % 75 , 99 9975 , 0
8 , 758 160
348
2
2
=

= R , mostrando que o modelo


ajustado explica 99,75% da variao da quantidade de procana hidrolisada em funo
do tempo.
8.4. Teste do Coeficiente (Angular) de Regresso
0 :
0
= | H (no existe RLS de Y em X)
0 :
1
= | H (existe RLS de Y em X).
Sob a veracidade de H
0
, a estatstica do teste dada por
( )
( )
( ) 2 2
2
~
1
2

=
n
t
R
R n
t
|
, com a regra de deciso habitual (rejeita-se H
0
, quando
( ) 2 ; 2
>
n
t t
o
). Alternativamente o valor da estatstica pode ser obtido como:
( )
e
xx
S
S b
t =
|
, onde
( )
|
|
.
|

\
|

=
xx
xy
yy e
S
S
S
n
S
2
2
2
1
.
No experimento bioqumico, tem-se
0 :
0
= | H (ausncia de RLS da quantidade de procana hidrolisada sobre o
tempo)
0 :
1
= | H (presena de RLS da quantidade de procana hidrolisada sobre o
tempo).
5 = n e 9975 , 0
2
= R , ento
( )
( )
( ) 001 , 0 6 , 34
9975 , 0 1
9975 , 0 2 5
< =

= p t
|
;
05 , 0 = o e 3 2 = n , tem-se
( )
18 , 3
3 ; 025 , 0
= t , logo (
( ) 3 ; 025 , 0
t t > ) rejeita-se H
0
.
Alternativamente:
160 =
xx
S ; 8 , 758 =
yy
S ; 348 =
xy
S e 175 , 2 = b
6333 , 0
160
348
8 , 758
2 5
1
2
2
=
|
|
.
|

\
|

=
e
S , com 7958 , 0 =
e
S
( )
( ) 001 , 0 6 , 34
7958 , 0
160 175 , 2
< = = p t
|
.
Nesse sentido, conclui-se que existe regresso linear significativa
(p<0,001) da quantidade de procana hidrolisada em funo do tempo.
8.5. Exerccios (Regresso Linear Simples)
1) Um laboratrio est interessado em medir o efeito da temperatura sobre a
potncia de um antibitico. Oito amostras de 50 gramas foram armazenadas a
diferentes temperaturas, e aps uma semana mediu-se a potncia. Os resultados
esto descritos a seguir.
74
Delineamento de Experimentos
Temperatura (C) 30 38 46 54 62 70 78 86
Potncia 45 41 39 32 28 23 10 17
a) Faa a representao grfica dos dados.
b) Ajuste a regresso linear simples da potncia como funo da temperatura.
c) A que temperatura a potncia seria nula?

2) Sejam X (durao da viagem, em dias) e Y(despesa, em US$, com viagem). Para
uma amostra de 102 viagens, obteve-se:

= 510 x ;

= 7140 y ;

= 4150
2
x ;

= 740200
2
y e

= 54900 xy .
a) Qual a reta de regresso de Y em funo de X?
b) Uma viagem ir durar sete dias. Qual a estimativa de despesa para a viagem?

3) Para construir um modelo linear relacionando a quantidade de erros
datilogrficos (Y) e o tempo de experincia (X) em meses, constituiu-se uma
amostra casual de 10 funcionrios, obtendo-se os seguintes resultados
numricos:
10 = n ; 0 , 6 = x ; 0 , 17 = y ; 100 =
xx
S ; 644 =
yy
S e 993 , 0 = r .
a) Determine o modelo de regresso linear de Y em X.
b) No nvel de significncia 5%, faa o teste de hiptese da regresso.
c) Encontre o valor do coeficiente de determinao.

4) Os dados a seguir referem-se a precipitao anual (cm) e a produo de algodo
(kg/ha) de uma amostra de sete produtores de uma dada regio do estado:
Precipitao 160 140 130 100 70 50 40
Produo 620 510 450 280 140 80 30
No nvel de significncia de 5%, verificar se existe RLS da produo de algodo
em funo de precipitao anual.

5) Se os filhos fossem exatamente 3 cm mais altos do que seus pais, como ficaria a
reta de regresso que daria a altura dos filhos em funo da altura dos pais?

6) Considere os dados da idade (em dias) e o peso (em gramas) de ratos machos da
raa Wistar.
Idade 25 28 30 32 34 35 38 40 42 43 45 46 47 48 49 50
Peso 62 61 66 69 74 75 80 82 88 89 91 95 95 97 99 99

Considerando o modelo RLS para o peso em funo da idade, quanto deve ser o
peso estimado de um rato com 33 dias de idade?

7) Suponha que, com base em 16 pares de observaes, obteve-se as seguintes
informaes: 896 =

x ; 655 =

y ;

= 52300
2
x ;

= 29652
2
y ;
38368 =

xy . Qual a proporo da variabilidade total dos dados que pode ser


explicada pela regresso de Y em X?

8) Considere os valores de X e Y obtidos em uma amostra com cinco observaes.
75
Delineamento de Experimentos
X 1 2 3 4 5
Y 16 12 8 7 5
Mostre com os dados que
xx
yy
S
S
r b =

9) Numa anlise de RLS foram obtidos a partir de uma amostra de 6 pares de
valores X e Y, os seguintes resultados:
25
16
2
= R ; 3 =
x
s (desvio padro de X); 5 =
y
s (desvio padro de Y); 3 = x e
10 = y .
a) Qual a equao de RLS de Y em X?
b) No nvel de significncia 5%, teste as hipteses 0 : 0 :
1 0
= = | | H H .

10) Para os pares (1,6);(2,5);(3,3);(4,3);(6,1), determine a equao de RLS de Y em
X. Qual a variao de Y por unidade de variao de X?

11) Um laboratrio est interessado em medir a influncia da temperatura sobre a
potncia de um antibitico. Dez amostras de 50g cada foram guardadas a
diferentes temperaturas, e aps 15 dias mediu-se a potncia (quadro abaixo).
a) Faa a representao grfica dos dados.
b) Ajuste a reta da potncia como funo da temperatura.
c) A que temperatura a potncia seria nula?
Temperatura (C) Potncia
30 38 43
50 32 26 33
70 19 27 23
90 14 21

12) Qual o indicador estatstico que fornece o acrscimo ou decrscimo de Y
esperado para cada variao unitria de X, numa relao linear entre Y e X?

13) Considere os seguintes pesos de pais e filhos, em kg:
a) Construir o diagrama de disperso.
b) Estabelecer a regresso do peso do filho em funo do peso do pai. Verificar
a significncia considerando =0,05.

14) Suponha que, com base em 16 pares de observaes, obteve-se as seguintes
informaes:
38368 ; 29652 ; 52330 ; 655 ; 896
2 2
= = = = =

xy y x y x .
Utilizando essas informaes, responda as questes a seguir:
a) Determine a regresso linear de Y em X.
b) Qual a proporo da variabilidade total dos Y que pode ser explicada pela
regresso de Y em X?

Famlia F
1
F
2
F
3
F
4
F
5
F
6
F
7
F
8
F
9
F
10

Peso do Pai 65 63 67 64 68 62 70 66 68 67
Peso do Filho 68 66 68 65 69 66 68 65 71 67
76
Delineamento de Experimentos
15) Considere os seguintes resultados de uma pesquisa envolvendo registro de armas
automticas e taxa de criminalidade em oito estados.
Armas automticas 11800 8300 3600 1800 6900 2600 4200 5960
Taxa de criminalidade(%) 18,1 16,8 9,4 6,4 14,6 8,8 10,6 11,8
Qual a predio linear para a taxa de criminalidade (%) em um estado com
10000 armas automticas registradas?
8.6. Respostas dos Exerccios (Regresso Linear Simples)
1) b) A TEMPERATUR POTNCIA 600 , 0 158 , 64 = ; 86 30 s s TEMP
c) C A TEMPERATUR 93 , 106 =
2) a) ( ) ( ) DURAO X DESPESA Y 12 10

+ =
b) ( ) 00 , 94 $ 7

U DIAS DESPESA Y =
3) a) X Y 52 , 2 12 , 32

=
b) ( ) 001 , 0 74 , 23 < = p t
c) 986 , 0
2
= R
4) PRECIP D O PR 900 , 4 528 , 181

+ = ; ( ) 001 , 0 01 , 27 < = p t
5) PAI ALT FILHO T AL + = 3


6) IDADE SO E P 661 , 1 011 , 17

+ = , 50 25 s s IDADE .
( ) gramas 824 , 71 33

= DIAS SO E P
7) 676 , 0
2
= R (67,6% da variabilidade total dos dados explicada pelo modelo).
8) 10 =
XX
S ; 2 , 77 =
YY
S ; 27 =
XY
S
9718 , 0 = r ; 7 , 2 = b ; 7 , 2 =
XX
YY
S
S
r
Ou seja, fica mostrado que
XX
YY
S
S
r b = .
9) a) X Y 33 , 1 01 , 6

+ = , 6 1 s s X
b) ( ) 05 , 0 67 , 2 > = p t .
10) X Y 986 , 0 757 , 6

= ; ou seja, para cada unidade de X h uma decrscimo de


0,986 unidades em Y .
11) b) TEMP T O P 381 , 0 457 , 50

= , 90 30 s sTEMP
c) C TEMP 43 , 132 =
12) Coeficiente de regresso linear ( b )
13) b) PPAI LHO I PF 482 , 0 479 , 35

+ = ; 70 62 s s PPAI
( ) 05 , 0 34 , 2 < = p t
14) a) X Y 7826 , 0 8856 , 2

+ =
b) % 54 , 46 4654 , 0
2
= = R
15) AUT ARMAS CRIM A TAX 0012 , 0 304 , 5

+ =
( ) % 304 , 17 10000

= CRIM A TAX
77
Delineamento de Experimentos
9. Bibliografia
BOX, G. E. P. Non-normality and tests on variances. Biometrika, v.20, p.318-335,
1953.

BUSSAB, W.O. Anlise de varincia e regresso. So Paulo: Atual, 1986.

BUSSAB, W.O.; MORETTIN, P.A. Estatstica bsica. 5. ed. So Paulo: Saraiva, 2003.

DEAN, A. M.; VOSS D. T. Design and analysis of experiments. New York: Springer-
Verlag, 1999.

DRAPER, N. R.; SMITH, H. Applied regression analysis. 3. ed. New York: John
Willey, 1998.

MLODINOW, L. O andar do bbado. Como o acaso determina nossas vidas. Rio de
Janeiro: Zahar, 2009.

MONTGOMERY, D.C. Design and analysis of experiment, 3. ed. New York: John
Willey, 1991.

MOORE,D. A estatstica bsica e sua prtica. Rio de Janeiro: LTC Editora,1995.

NORMAN, G.R.; STREINER, D.L. Biostatistics: the bare essentials. 3. ed. St. Louis:
Mosby, 2008.

PADOVANI, C.R. Exerccios de estatstica bsica e experimental. Botucatu: Depto de
Bioestatstica, 2002.

PADOVANI, C.R. Planejamento de experimentos. Botucatu: Depto de Bioestatstica,
2009.

PERES, C.A.; SALDIVA, C.D. Planejamento de experimentos. So Paulo: 5. SINAPE,
1982.

SALSBURG, D. Uma senhora toma ch como a estatstica revolucionou a cincia
no sculo XX. Rio de Janeiro: Zahar, 2009.

VIEIRA, S. Estatstica experimental. 2. ed. So Paulo: Atlas, 1999.

VIEIRA, S. Anlise de varincia (ANOVA). So Paulo: Atlas, 2006.

ZAR, J.H. Boestatistical analysis, 5. ed. New Jersey: Prentice-Hall, 2009.

78
Delineamento de Experimentos
10. Tabelas
Tabela 10.1 Distribuio t de Student ( ) | | o = < < 1
0 0
t t t P .................................... 79
Tabela 10.2 Distribuio Qui-quadrado ( ) | | o _ _ = >
2
0
2
P ........................................... 80
Tabela 10.3 Distribuio F ( ) | | 01 , 0
0
= > F F P ............................................................ 81
Tabela 10.4 Distribuio F ( ) | | 05 , 0
0
= > F F P ............................................................ 82
Tabela 10.5 Distribuio F ( ) | | 10 , 0
0
= > F F P ............................................................ 83
Tabela 10.6 Distribuio studentized range
( )
| | ( ) % 1 :
; 01 , 0
Tukey q

............................. 84
Tabela 10.7 Distribuio studentized range
( )
| | ( ) % 5 :
; 05 , 0
Tukey q

............................. 85
Tabela 10.8 Distribuio studentized range
( )
| | ( ) % 10 :
; 10 , 0
Tukey q

............................ 86
Tabela 10.9 Valores crticos do coeficiente de correlao linear de Pearson (teste
bilateral) ..................................................................................................................... 87
79
Delineamento de Experimentos

Tabela 10.1 Distribuio t de Student ( ) | | o = < < 1
0 0
t t t P
80
Delineamento de Experimentos

Tabela 10.2 Distribuio Qui-quadrado ( ) | | o _ _ = >
2
0
2
P
81
Delineamento de Experimentos

Tabela 10.3 Distribuio F ( ) | | 01 , 0
0
= > F F P
82
Delineamento de Experimentos

Tabela 10.4 Distribuio F ( ) | | 05 , 0
0
= > F F P
83
Delineamento de Experimentos

Tabela 10.5 Distribuio F ( ) | | 10 , 0
0
= > F F P
84
Delineamento de Experimentos

Tabela 10.6 Distribuio studentized range
( )
| | ( ) % 1 :
; 01 , 0
Tukey q


85
Delineamento de Experimentos

Tabela 10.7 Distribuio studentized range
( )
| | ( ) % 5 :
; 05 , 0
Tukey q


86
Delineamento de Experimentos

Tabela 10.8 Distribuio studentized range
( )
| | ( ) % 10 :
; 10 , 0
Tukey q


87
Delineamento de Experimentos

n =.05 =.01
4 0,950 0,990
5 0,878 0,959
6 0,811 0,917
7 0,754 0,874
8 0,707 0,834
9 0,666 0,798
10 0,632 0,765
11 0,602 0,735
12 0,576 0,708
13 0,553 0,684
14 0,532 0,661
15 0,514 0,641
16 0,497 0,623
17 0,482 0,606
18 0,468 0,590
19 0,456 0,575
20 0,444 0,561
21 0,433 0,549
22 0,423 0,537
23 0,413 0,526
24 0,404 0,515
25 0,396 0,505
26 0,388 0,496
27 0,381 0,487
28 0,374 0,478
29 0,367 0,470
30 0,361 0,463
35 0,335 0,430
40 0,312 0,402
45 0,294 0,378
50 0,279 0,361
60 0,254 0,330
70 0,236 0,305
80 0,220 0,286
90 0,207 0,269
100 0,196 0,256
Tabela 10.9 Valores crticos do coeficiente de correlao linear de Pearson (teste bilateral)

Você também pode gostar