Apostila Estatística (1)

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 99

1

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


2

ÍNDICE

INTRODUÇÃO ............................................................................ 4

CAPÍTULO 1 ................................................................................ 6
PREAMBULO .......................................................................................................................... 6
INTRODUÇÃO ......................................................................................................................... 9
Tipos de erros ..................................................................................................................... 10
Erros aleatórios e sistemáticos em análises titrimétricas ................................................... 13
Manipulando erros sistemáticos ......................................................................................... 15

CAPÍTULO 2 .............................................................................. 19
A ESTATÍSTICA EM ANÁLISES CLÁSSICAS .................................................................. 19
Média e desvio padrão ........................................................................................................ 19
Distribuição de erros .......................................................................................................... 20
A distribuição de médias amostradas ................................................................................. 24
Limites de confiança da média ........................................................................................... 26
Apresentação dos resultados .............................................................................................. 30
Outros usos dos limites de confiança .................................................................................. 31
Propagação de erros aleatórios ......................................................................................... 32
Propagação de erros sistemáticos ...................................................................................... 36

CAPÍTULO 3 .............................................................................. 38
TESTES DE SIGNIFICÂNCIA .............................................................................................. 38
Comparação entre uma média experimental e um valor conhecido ................................... 38
Comparação das médias de duas amostras ........................................................................ 39
Teste t pareado ................................................................................................................... 41
TESTES MONO E BI-CAUDAIS .......................................................................................... 44
TESTES F PARA A COMPARAÇÃO DE DESVIOS PADRÕES ........................................ 45
PONTOS FORA DA CURVA (“OUTLIERS”) ...................................................................... 47
ANÁLISE DE VARIÂNCIA .................................................................................................. 51
Comparação de várias médias............................................................................................ 53
Variações dentro da amostra .............................................................................................. 54
Variação entre amostras ..................................................................................................... 55

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


3

A aritmética dos cálculos da ANOVA ................................................................................. 58


TESTE CHI-QUADRADO ..................................................................................................... 61
CONCLUSÕES SOBRE OS TESTES DE SIGNIFICÂNCIA ............................................... 63

CAPÍTULO 4 .............................................................................. 66
A QUALIDADE DAS MEDIDAS ANALÍTICAS ................................................................. 66
Amostragem ............................................................................................................................ 66
Separação e estimativa de variâncias usando ANOVA ...................................................... 68

CAPÍTULO 5 .............................................................................. 71
ERROS EM ANÁLISE INSTRUMENTAL: REGRESSÃO E CORRELAÇÃO ................... 71
COEFICIENTE DE CORRELAÇÃO PRODUTO-MOMENTO............................................ 73
A LINHA DE REGRESSÃO DE Y EM X ............................................................................. 78
ERROS NA TANGENTE E NO INTERCEPTO DA CURVA DE REGRESSÃO ................ 80
CÁLCULOS DE UMA CONCENTRAÇÃO .......................................................................... 84

CAPÍTULO 6 .............................................................................. 87
LIMITES DE DETECÇÃO ..................................................................................................... 87
O MÉTODO DAS ADIÇÕES PADRÃO ................................................................................ 91

ANEXO A: VALORES CRÍTICOS DE T .............................. 96

ANEXO B: VALORES CRÍTICOS DE F (P = 0,05) ............. 97

ANEXO C: VALORES CRÍTICOS DE GRUBB


(P = 0,05, BICAUDAL) .............................................................. 98

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


4

INTRODUÇÃO

A Química, assim como a Física, é uma ciência predominantemente


experimental. Todas as suas teorias, das mais complexas, como a Teoria Quântica,
às mais simples, como os modelos de gases, requerem, incondicionalmente, uma
constatação experimental.

Podemos postular a existência de uma partícula fundamental para definir os


elementos químicos, o átomo, porém, além de postular, precisamos medir o seu
tamanho, sua massa, seus componentes etc. Podemos observar a ocorrência de uma
reação química em um frasco de laboratório, porém, para caracterizá-la
convenientemente, necessitamos conhecer a velocidade da reação e, assim, medir
o tempo em que certa quantidade de reagente se transforma em produto.

Desta maneira, não é possível escapar da necessidade de se trabalhar com


números. É fundamental, para se trabalhar na área da Química, ler escalas
numéricas em diferentes instrumentos e associar os números mostrados com outras
quantidades. Este procedimento não é assim tão direto como pode parecer. Ao ler
os dígitos que informam o peso de uma dada amostra em uma balança analítica,
por exemplo, há que se saber interpretar os números mostrados, de acordo com a
sensibilidade do instrumento, os erros cometidos na leitura e na apresentação dos
números etc.

Da mesma maneira, ao se comparar os resultados obtidos com aqueles


mostrados na literatura, é necessário um conhecimento extra, para não se correr o
risco de comparar “bananas com maçãs”.

A estatística é a parte da matemática encarregada de coletar, organizar e


interpretar um conjunto de resultados numéricos e disponibilizar ferramentas
analíticas eficientes para comparar estes resultados com valores relacionados na

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


5

literatura, obtidos por outros pesquisadores, com técnicas experimentais


diferentes, de fontes diferentes etc., visando estabelecer a igualdade ou
desigualdade entre eles. Ela deve ser obrigatoriamente utilizada na interpretação
de resultados quantitativos para aumentar a credibilidade da análise efetuada e
servir como instrumento para a verificação da aplicação de leis e normas
regulamentadoras em análises ambientais, de alimentos, de fármacos etc.

Neste curso vamos discutir a aplicação de diferentes ferramentas estatísticas


na interpretação de resultados quantitativos obtidos na análise química de
diferentes origens. Devemos sempre estar cientes que o químico analítico deve
responder as dúvidas dos seus clientes. A variedade destas questões é enorme e,
assim, também deve ser a quantidade de medidas que podem ser requeridas para
obter aquelas respostas. Para responder as dúvidas de seus clientes de maneira
apropriada, o químico analítico deverá decidir itens como o número de amostras a
ser analisado, que comparações experimentais e numéricas devem ser feitas etc.
Estas decisões exigem o uso da estatística.

Usar a estatística é, efetivamente, uma parte importante de qualquer


trabalho analítico. Para qualquer decisão significativa, o analista deve planejar os
experimentos certos usando métodos de validação adequados, instrumentos
calibrados, adquirir os dados sob condições apropriadamente controladas, revisar
e conferir os resultados, apresentar os dados de maneira concisa e chegar a
conclusões objetivas baseadas nos dados experimentais. Cada uma destas etapas
deve ser validada pela estatística.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


6

CAPÍTULO 1

PREAMBULO

MEDIÇÕES

A química como todas as outras ciências, se baseia em resultados quantitativos


obtidos de medidas experimentais. Entretanto, poucos químicos, ou cientistas, podem dar
uma definição razoável do termo “medidas”, apesar de haver uma área da ciência
especializada na medição, chamada de Metrologia.

A definição de medidas usada neste curso é: “Um conjunto de operações com o objetivo
de se determinar o valor de uma quantidade”.

Para quê medir?

As medidas servem para se descobrir alguma característica de um objeto de


interesse. A sequência dos eventos que envolve uma medição química é: (1) Estabeleça
o problema real; (2) Decida qual tipo de medida química poderá ajudar a resolver o
problema; (3) Encontre um método que possibilitará a medição apropriada; (4) Faça as
medições e obtenha um resultado (valor e incerteza, incluindo as unidades adequadas);
(5) Encontre a solução do problema com base nos resultados das medidas.

É importante entender a relação entre o problema real e a medição proposta. A


medida química pode fornecer apenas parte da resposta, que não deve ser confundida com
a resposta em si. Na química analítica forense, encontrar uma correlação entre o DNA do
suspeito e o DNA encontrado na cena do crime não significa, necessariamente, que o
suspeito seja culpado.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


7

Na nossa de definição de medição (um conjunto de operações com o objetivo de


se determinar o valor de uma quantidade), é necessário compreender o significado do
termo “quantidade”. Uma quantidade é definida como “atributo de um fenômeno, corpo
ou substância que pode ser distinguida qualitativamente e determinada
quantitativamente”.

Como químicos, nós sempre medimos a concentração de um composto particular.


A substância da qual nós queremos saber a concentração deve ser declarada (ou seja,
distinguida qualitativamente). Isto pode ser óbvio para muitas medidas (por exemplo, a
concentração de sal na água do mar), porém pode ser mais difícil para outros tipos
(quantidade de extratos orgânicos solúveis em pH 8, por exemplo).

Determinar o valor de um fenômeno pode requerer atividades como medir a


constante de velocidade de uma reação ou a quantidade de energia solar que incide sobre
a Terra.

Finalmente, nós precisamos conhecer o significado de “valor”. Valor é a


“magnitude de uma quantidade particular, geralmente expresso como uma unidade de
medições multiplicada por um número”.

Com os resultados obtidos de medições, será necessário ainda executar uma


análise de dados.

Por que nós precisamos da análise dos dados?

A necessidade da análise dos dados obtidos em qualquer medição científica é uma


consequência da incerteza da medida.

Tendo feito nossas medições, e antes de tentarmos interpretar os resultados, uma


questão imediata é: “Quão confiável é o resultado?” As pessoas leigas estão acostumadas
a aceitar os valores isolados. Nós raramente contestamos o valor da quantidade de açúcar
declarado no pacote de supermercado. Entretanto, a perspectiva de se perder a licença de
motorista tem motivado algumas pessoas a contestar estes valores.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


8

No comércio, quando uma pequena diferença no peso pode resultar em


muito dinheiro a mais ou a menos, medições têm sido sempre analisadas. Nos tribunais,
os motoristas normalmente aceitam a evidência dos radares da polícia de que eles estavam
dirigindo em velocidade acima do permitido.

Quando importa, nos tornamos muito conscientes da importância de medições


precisas. Qualquer medição química que tenha importância suficiente para se fazer, é
muito relevante para a pessoa que a solicitou e a química analítica moderna deve prover
indicações da confiabilidade do resultado.

De fato, qualquer análise sem a informação adequada da sua confiabilidade é


inútil.

Os químicos analíticos modernos podem não estarem cientes da visão futurística


do químico suíço Berzelius quando ele escreveu, no século 19, sobre a missão do químico
analista: “não é obter resultados que são absolutamente exatos – o que eu considero
que possam ser obtidos apenas por acaso – mas sim se aproximar da exatidão máxima
que a análise química permita.”

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


9

INTRODUÇÃO

A Química Analítica moderna tem um caráter essencialmente quantitativo. Uma


resposta quantitativa, a qualquer análise executada é mais indicada do que uma
qualitativa. A pessoa que precisou da análise pode, com os resultados quantitativos em
mãos, julgar se a concentração do analito em uma determinada matriz (por exemplo, de
pesticidas em uma amostra de alimentos ou de água potável) é suficientemente elevada
para se tornar nocivo e exige alguma providência ou não. Em alguns casos, apenas uma
resposta quantitativa tem algum valor. Por exemplo, em uma análise de colesterol em
amostra de sangue. Virtualmente todo o soro sanguíneo humano tem colesterol, a dúvida
só poderia ser quanto. É importante considerar que, mesmo quando uma resposta
qualitativa é solicitada, métodos quantitativos têm de ser usados para obtê-la. Na
realidade, um químico analítico nunca pode dizer simplesmente que encontrou / não
encontrou boro numa amostra de água. Ele deve empregar um método quantitativo, capaz
de detectar, por exemplo, 1,0 µg mL-1 de boro. Se o teste tiver resultado negativo, ele
pode dizer apenas que “esta amostra contém menos que 1,0 µg mL-1 de boro”. Se o teste
for positivo, ele relatará que encontrou pelo menos 1,0 µg mL-1 de boro.

Procedimentos muito mais complexos podem ser necessários. Por exemplo: para
comparar as características de diferentes amostras de solo, ou de substratos de rios ou
lagos, as amostras podem sofrer, inicialmente, uma seleção de partículas, por exemplo,
por meio de separação em peneiras com 10 tamanhos de malhas diferentes. Cada amostra
deverá, então, ser caracterizada dentro dessas 10 distribuições. Procedimentos bastante
complexos de análises poderão então ser empregados para se obter uma conclusão
quantitativa sobre as similaridades das amostras e se estimar a probabilidade delas terem
uma origem comum.

Assim, os estudos quantitativos serão os determinantes nesse curso, e deve-se


aceitar que os erros que ocorrem nesses estudos são de extrema importância. Portanto,
deveremos ter sempre em mente um postulado da estatística aplicada à química:

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


10

“Nenhum resultado quantitativo tem qualquer valor, a menos que ele seja
acompanhado de alguma estimativa dos erros inerentes”.

Vejamos um exemplo: um químico sintetiza um reagente que acredita que seja


completamente novo. Ele o estuda com uma técnica de espectrometria e o
composto dá um valor de 104 (unidade arbitrária). Ao checar a literatura, ele
encontra que nenhum composto previamente descoberto deu sinal maior que 100,
quando estudado pelo mesmo método, nas mesmas condições experimentais. A
questão que surge naturalmente é: será que o químico citado descobriu mesmo
um composto inteiramente novo?

A resposta a esta pergunta está condicionada ao grau de confiança que se


pode depositar no valor encontrado, 104.

Quais erros são associados com ele?

Se novos estudos mostrarem que esse valor é correto dentro da faixa de duas
unidades, isso é o valor verdadeiro provavelmente se encontra na faixa de 104 ±
2, então um novo composto foi, provavelmente, sintetizado. Entretanto, se as
novas medidas mostrarem que o erro experimental é maior, talvez 10 unidades,
(104 ± 10), então o valor real pode ser menor que 100 e para se caracterizar um
novo composto ainda serão necessárias muitas análises adicionais.

Em outras palavras, pode-se dizer que um conhecimento dos erros


experimentais é crucial para a interpretação inequívoca dos resultados.

Tipos de erros
Um analista trabalhando em sua rotina diária, em um laboratório de química está,
normalmente, sujeito a três tipos de erros. Esses erros podem ser classificados como:
grosseiros, aleatórios e sistemáticos.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


11

Erros grosseiros são facilmente reconhecidos. Eles são erros tão sérios que não
deixam alternativas a não ser refazer todo o experimento. Exemplos incluem a quebra do
equipamento, contaminação de reagentes, erros na adição de alíquotas, etc.

Nesse curso serão discutidos apenas os erros aleatórios e sistemáticos. Para


definirmos esses tipos de erros, analisaremos o seguinte exemplo: quatro estagiários (A-
D) estão fazendo um teste para efetivação em um laboratório de análises. Para isto, eles
fizeram, cada um, uma análise na qual uma solução padrão contendo exatamente 10,00
mL de NaOH exatamente 0,1 mol L-1 é titulado com HCl exatamente 0,1 mol L-1. Cada
candidato executou cinco titulações repetidas. Os resultados são mostrados na Tabela 1.

Tabela 1. Erros sistemáticos e aleatórios.

Candidato Resultado (mL) Candidato Resultado (mL)


10,08 10,19
10,11 9,79
A 10,09 C 9,69
10,10 10,05
10,12 9,78
9,88 10,04
10,14 D 9,98
B 10,02 10,02
9,8 9,97
10,21 10,04

Os resultados obtidos pelo candidato A apresentam duas características


importantes. Primeiro, eles são todos muito próximos, todos estão entre 10,08 e 10,12
mL. Pode-se dizer que esses resultados são muito reprodutíveis. A segunda característica
é que todos eles são muito altos. Nesse experimento (de qualquer forma pouco usual),
sabe-se a resposta certa com antecedência, ou seja, 10,00 mL. É evidente que dois tipos
distintos de erros ocorreram com as titulações desse estudante. Primeiro, existem erros
aleatórios – que fazem com que cada resultado individual esteja ao redor do valor médio
(10,10 mL).

Os estatísticos dizem que erros aleatórios afetam a precisão ou a


reprodutibilidade de um experimento. No caso do candidato A é claro que os erros
aleatórios são pequenos, assim se diz que os resultados são precisos. Também existem

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


12

erros sistemáticos, que fazem com que todos os valores determinados sejam acima do
valor real.

Erros sistemáticos também são conhecidos como bias, que afetam a exatidão, isso
é, a proximidade do valor real.

Em muitos experimentos, os erros aleatórios e sistemáticos não são tão facilmente


distinguíveis pelos resultados, eles podem ter origens muito diferentes em termos de
técnicas experimentais e equipamentos.

O candidato B obteve resultados bastante distintos daqueles do A. A média dos


cinco valores (10,01 mL) é muito próxima do valor real, assim se pode caracterizar esse
conjunto de dados como exato, ou seja, sem erros sistemáticos consideráveis. A variação
dos resultados, entretanto, é muito grande, indicando uma pobre precisão e a presença de
erros aleatórios substanciais.

Uma comparação de ambos conjuntos de dados mostra que erros aleatórios e


sistemáticos ocorrem de maneira independente, uns dos outros. Esta conclusão é
reforçada pelos resultados obtidos pelos candidatos C e D. O trabalho do candidato C não
é preciso (intervalo entre 9,69 e 10,19 mL) nem exato (média de 9,90 mL). O candidato
D encontrou ambos, exatidão (média de 10,01 mL) e precisão (intervalo de 9,97 e 10,04
mL). Essas diferenças estão sintetizadas na Figura 1.

A Preciso e inexato
B Exato e sem precisão

C Sem exatidão e precisão

D Exato e preciso
9,70 10,00 10,30

Figura 1. Exatidão e precisão.

Uma observação muito importante é necessária. É preciso notar que, no contexto


desse curso, as palavras precisão e exatidão têm significados completamente diferentes
na teoria de erros.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


13

Por outro lado, elas são muitas vezes utilizadas indiscriminadamente na vida
cotidiana. Além disso, a convenção moderna exige uma distinção cuidadosa dos termos
reprodutibilidade e repetibilidade. A repetibilidade refere-se a experimentos feitos de
maneira consecutiva, em condições de laboratório idênticas e na mesma vidraria. Já
reprodutibilidade refere-se a experimentos feitos em dias diferentes, com outro conjunto
de vidraria e com condições ligeiramente diferentes. Não é surpresa que, no último caso,
os resultados apresentem uma dispersão de valores maior.

Erros aleatórios e sistemáticos em análises titrimétricas

Uma análise titrimétrica (titulação ácido-base) pode ser considerada como tendo
os seguintes passos:

i. Elaboração de uma solução padrão de um dos reagentes. (pesar, transferir


e dissolver);

ii. Transferir uma alíquota da solução padrão para o frasco de titulação, com
uma pipeta;

iii. Titular o líquido do frasco com uma outra solução, adicionada à bureta.

Mesmo uma análise elementar desse tipo envolve de 7 a 10 passos separados, que
devem ser repetidos várias vezes. Em princípio, deve-se examinar cada passo
separadamente, para determinar os erros sistemáticos e aleatórios envolvidos no processo.
Isso significa avaliar corretamente os erros aceitáveis em procedimentos de pesagem e de
calibração de vidraria volumétrica.

Valores para a tolerância de erros experimentais são publicados por organismos


como a British Standards Institution (BSI) e pela American Society for Testing and
Materials (ASTM).

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


14

A tolerância de uma pesagem com o maior grau de precisão, de 100 g, pode ser
tão baixa quanto ± 0,25 mg. Entretanto, para uma pesagem rotineira, ela pode ser até cerca
de quatro vezes maior. Similarmente, uma medida de alto grau de precisão para um
volume de 250 mL pode ser de ± 0,12 mL. Se uma balança analítica ou uma vidraria
volumétrica estiver dentro dos limites de tolerância, mas não no valor exato de pesagem
ou medida de volume, um erro sistemático surge na medida. Por exemplo, se um frasco
volumétrico apresentar um volume de 249,95 mL, esse erro terá reflexo nos resultados de
todos os experimentos que o utilizar. A repetição do experimento não revelará o erro, em
cada repetição o volume será assumido como 250 mL quando, de fato, será menor que
isso. Se os resultados desse experimento forem comparados com aqueles obtidos em
outros laboratórios, feitos com outros frascos, então os respectivos erros sistemáticos
serão evidentes.

Procedimentos de pesagem são, normalmente, associados com erros aleatórios


muito pequenos. A utilização de uma balança analítica de quatro casas, comum em
laboratórios de análises, implica em um erro menor que ± 0,0001 - 0,0002 g, ou seja, de
apenas 0,02%.

Erros sistemáticos em pesagens são numerosos e se originam de várias fontes bem


conhecidas. Entre elas, a adsorção de umidade pela amostra, falha em permitir que
recipientes com amostra em altas temperaturas se resfriem completamente, assim como a
influência do empuxo da atmosfera, na pesagem. Esse último efeito pode ser muito
significativo. Por exemplo, Skoog e West mostraram que uma amostra de um líquido
orgânico, com densidade de 0,92 g mL-1, que pesa 1,2100 g no ar, deveria pesar 1,2114 g
no vácuo, um erro maior que 0,1%.

Para sanar, em parte, esse tipo de erro sistemático, costuma-se efetuar o


procedimento de pesagem pela diferença entre duas massas (do recipiente com amostra
menos a do recipiente vazio), de tal forma que a subtração minimize os erros sistemáticos
inerentes. Com essas precauções sendo seguidas, os erros de pesagem durante o
procedimento de titulação serão, provavelmente, desprezíveis em relação àqueles
causados pela vidraria volumétrica. Assim, métodos gravimétricos são normalmente

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


15

utilizados para a calibração da vidraria volumétrica, pesando a água que esta vidraria
contém.

Finalmente, uma outra fonte importante de erro em análises volumétricas é aquela


associada ao indicador. Erros do indicador são bastante consideráveis – talvez maiores do
que os erros aleatórios numa análise titrimétrica típica. Por exemplo, na titulação de HCl
0,1 mol L-1 com NaOH 0,1 mol L-1 se espera que o ponto final seja indicado num pH de
7,0. Na prática, entretanto, pode-se, erroneamente, estimar o ponto de virada, usando-se
um indicador como o alaranjado de metila, que muda de coloração na faixa de pH entre
três e quatro. Assim, ao se adicionar base ao ácido, um ponto de virada aparente é
encontrado antes do ponto real. Se, por outro lado, a titulação acima for feito adicionando-
se ácido na base, o ponto de virada será indicado após o seu valor real.

Em quaisquer procedimentos analíticos, clássicos ou instrumentais, é possível


considerar e estimar as fontes de erros aleatórios e sistemáticos, relacionadas com cada
etapa do experimento.

Em muitas análises, o erro total na prática é relacionado com o erro em uma etapa
única: esse ponto será mais bem discutido no decorrer do curso.

Manipulando erros sistemáticos


Uma grande parte do curso será dedicada aos erros aleatórios, que podem ser
estudados com uma grande variedade de métodos estatísticos. Na maioria dos casos
dever-se-á assumir, por conveniência, que os erros sistemáticos estão ausentes (inclusive
métodos de testes de ocorrência de erros sistemáticos serão discutidos). Assim, antes de
os deixarmos de lado, é necessário discutir um pouco sobre os erros sistemáticos.

No exemplo da titulação, discutido anteriormente, mostrou-se que erros


sistemáticos podem fazer que o valor médio se afaste do valor real. Deve-se considerar
que, ao contrário dos erros aleatórios, os erros sistemáticos não podem ser revelados
meramente pela repetição dos experimentos. Além disso, a menos que o resultado real da
análise possa ser conhecido com antecedência (o que é muito raro), erros sistemáticos
relativamente muito grandes podem ocorrer, mas serem completamente não detectados.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


16

Uma classe de erro sistemático muito comum ocorre quando falsas suposições são
aceitas sobre a exatidão dos instrumentos analíticos. Por exemplo, analistas experientes
estão cansados de saber que os monocromadores dos espectrômetros fogem gradualmente
do ajuste e, assim, que erros de vários nanômetros nos comprimentos de onda não são
raros. Entretanto, muitas análises fotométricas são feitas sem que os aparelhos sejam
checados quanto à sua exatidão.

Muitos equipamentos simples como vidrarias volumétricas, cronômetros,


pHmetros e termômetros podem apresentar erros sistemáticos consideráveis, mas muitos
analistas usam regularmente esses instrumentos sem atentar se os mesmos se encontram
perfeitamente exatos.

Os erros sistemáticos não surgem apenas dos equipamentos, mas podem ser de
responsabilidade humana. Alguns experimentalistas podem sofrer de astigmatismo ou de
daltonismo, o que pode introduzir erros nas leituras dos instrumentos de medidas.

Muitos autores relatam uma série de outras bias em relação a números, por
exemplo, uma tendência a favorecer um número par sobre um ímpar, ou os dígitos zero e
cinco, no relatório dos resultados. Assim, isso aparenta que erros sistemáticos são um
risco constante, e muitas vezes ocultos, para os analistas, de forma que se deve tomar
cuidado para minimizá-los.

Muitas maneiras diferentes para solucionar esse problema estão disponíveis e


várias ou todas elas devem ser consideradas em cada procedimento analítico.

Uma linha de defesa importante contra erros sistemáticos é o planejamento


cuidadoso de cada passo do experimento. Já foi visto que pesar por diferenças minimiza
erros gravimétricos sistemáticos. Outro exemplo de planejamento experimental racional
é o das medidas de comprimento de onda pelo espectrômetro.

Se a concentração de uma substância simples deve ser determinada por


espectrometria de absorção, dois procedimentos são possíveis.

No primeiro, a amostra é analisada numa célula de 1,0 cm de caminho ótico, num


comprimento de onda definido, como 400 nm, e a concentração do analito é determinada
pela equação de Lambert-Beer:

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


17

A = εcl (1)

Onde A é a absorção,  o coeficiente de absortividade molar, c a concentração do


analito em solução e l o caminho ótico do feixe de luz.

Alguns erros sistemáticos podem se originar nesse procedimento.

O comprimento de onda pode estar deslocado, devido à falta de exatidão do


monocromador, para 405 nm, por exemplo, e assim o valor de ε utilizado é inadequado;
o valor de ε pode ser aproximado; a escala de absorbância do espectrômetro pode estar
deslocada; o caminho ótico da célula pode não ser exatamente 1,0 cm.

Alternativamente, o analista pode tomar uma série de soluções da substância teste,


de concentrações conhecidas, e medir a absorbância de cada uma em 400 nm (uma dessas
soluções de calibração deve ser um branco). Os resultados devem então ser utilizados
para construir uma curva de calibração, para ser utilizada na medida da solução teste,
exatamente nas mesmas condições experimentais. Esse procedimento muito importante,
para a análise instrumental, será detalhado durante o curso.

Quando esse segundo procedimento é utilizado, não se necessita do valor de ε, e


os erros devidos aos desvios no comprimento de onda, erros de absorbância e de caminho
ótico podem ser cancelados. A proteção mais eficiente contra erros sistemáticos consiste
no emprego de materiais e metodologia padrões de referência para a calibração prévia do
equipamento a ser utilizado. Antes de o experimento começar, cada parte do aparato
experimental é calibrado com um procedimento apropriado.

Apesar de se ter diferenciado cuidadosamente os erros sistemáticos dos erros


aleatórios, é aparente que, nas medidas analíticas cotidianas, esta diferenciação pode ser,
de certa maneira, nebulosa.

Sempre que um procedimento ou instrumento é checado para a presença de erros


sistemáticos, os próprios procedimentos de checagem podem ser sujeitos a erros
aleatórios e, assim, os erros sistemáticos podem não ser perfeitamente identificados e / ou

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


18

corrigidos. Essa combinação de erros tornou-se conhecida na literatura moderna como as


incertezas dos resultados analíticos.

Tem-se um complicado conceito para tratar; apesar de erros aleatórios terem uma
distribuição conhecida e de se combinarem numa maneira previsível num experimento de
múltiplos passos, o mesmo não é válido para os erros sistemáticos. Assim, dar uma
estimativa quantitativa para a incerteza total de um resultado está longe de ser uma tarefa
simples. Apesar desse problema, a importância do conceito de incerteza é clara, e justifica
o esforço que será desenvolvido durante o curso.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


19

CAPÍTULO 2

A ESTATÍSTICA EM ANÁLISES CLÁSSICAS

Média e desvio padrão


No capítulo anterior discutiram-se os vários tipos de erros, que foram ilustrados
pela análise dos resultados obtidos em cinco experimentos de titulação, feitos por quatro
estagiários (Tabela 1).

Foram utilizados dois critérios para se fazer uma análise comparativa desses
resultados, o valor médio e o grau de dispersão. O valor médio utilizado era a média
aritmética, x , que é normalmente abreviado para média, a soma de todos os valores
obtidos dividida pelo número de medidas.

∑ 𝒊 𝒙𝒊
̅=
𝒙 (2)
𝒏

A definição mais útil para a dispersão dos dados experimentais é o desvio padrão,
s. Ele é definido pela equação:

̅)𝟐
∑𝒊(𝒙𝒊 −𝒙
𝒔=√ (3)
𝒏−𝟏

Para os estagiários A, B, C e D (Tabela 1) o cálculo do desvio padrão de suas


respectivas medidas fornece um suporte quantitativo para o que foi discutido no capítulo
anterior. Os desvios padrões obtidos pelos alunos estão na Tabela 2.

O quadrado de s é uma grandeza estatística muito importante, chamada variância.


Sua importância será mais bem compreendida quando se discutir a propagação de erros.
Também frequentemente utilizado é o conceito de desvio padrão relativo (RSD), que é
dado por:

𝟏𝟎𝟎𝒔
𝑹𝑺𝑫 = ̅
(4)
𝒙

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


20

O RSD, cuja unidade é, obviamente, porcentagem, é um exemplo de erro relativo,


isso é, um erro estimado dividido por uma estimativa do valor absoluto da quantidade
medida. Erros relativos são frequentemente usados na comparação da precisão de
resultados que têm diferentes unidades ou magnitudes, e são também importantes no
estudo da propagação de erros.

Tabela 2. Valores de desvio padrão obtidos pelos estagiários A, B, C e D (do


exemplo).

Estudante Valor de s obtido


A 0,016
B 0,17
C 0,21
D 0,033

Distribuição de erros
O desvio padrão é uma medida da dispersão de um conjunto de resultados em
torno de um valor médio, entretanto, ele não indica a maneira como os valores estão
distribuídos.

Para ilustrar esta distribuição, necessita-se de um número bem maior de medidas,


como aquele mostrado na Tabela 3. Esses resultados são referentes a 50 repetições de
determinações do íon nitrato em uma amostra particular de água, dados com dois
algarismos significativos. Os valores podem ser agrupados, como mostrado na Tabela 4.

Tabela 3. Resultados de 50 determinações da concentração de nitrato (μg L-1)

0,51 0,51 0,51 0,50 0,51 0,49 0,52 0,53 0,50 0,47
0,51 0,52 0,53 0,48 0,49 0,50 0,52 0,49 0,49 0,50
0,49 0,48 0,46 0,49 0,49 0,48 0,49 0,49 0,51 0,47
0,51 0,51 0,51 0,48 0,50 0,47 0,50 0,51 0,49 0,48
0,51 0,50 0,50 0,49 0,52 0,52 0,50 0,50 0,51 0,51

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


21

Tabela 4. Frequência das medidas da concentração de nitrato

Concentração nitrato
Frequência
(μg L-1)
0,46 1
0,47 3
0,48 5
0,49 10
0,50 10
0,51 13
0,52 5
0,53 3

A Tabela 4 mostra que, na Tabela 3, o valor 0,46 µg L-1 aparece apenas uma vez,
o valor 0,47 µg L-1 aparece três vezes e assim adiante. O valor mais comum nestas
determinações é o 0,51 µg L-1. Com estes resultados, pode-se calcular o valor médio deste
conjunto como sendo 0,500 µg L-1 e o desvio padrão como 0,0165 µg L-1. A esses valores
foram atribuídos, de maneira arbitrária, três algarismos significativos. Uma discussão
sobre esse importante aspecto da apresentação dos resultados será feita posteriormente.
A distribuição desses resultados pode ser mais bem percebida, colocando-os em um
histograma, como mostrado na Figura 2.

14

12

10
freqüência

0
0,46 0,47 0,48 0,49 0,50 0,51 0,52 0,53

valores medidos

Figura 2. Histograma das medidas de concentração de nitrato.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


22

É evidente que a distribuição dos valores medidos é, grosso modo, simétrica em


relação à média, com os valores se agrupando na região central. Esse conjunto de 50
medidas é uma amostra de um número muito grande (teoricamente infinito) de medidas
de nitrato, que podem ser feitas. O conjunto de medidas possíveis é chamado de
população.

Se não houver erros sistemáticos, a média desta população, chamada de μ, é o


valor real da concentração de nitrato, na matriz de onde a amostra foi retirada. A média,
x , da amostra, dá uma estimativa de μ. Da mesma maneira, a população tem um desvio
padrão, denotado por σ. O valor do desvio padrão da amostra, s, dá uma estimativa de σ.
O uso da equação 3:

̅)𝟐
∑𝒊(𝒙𝒊 −𝒙
𝒔=√ (3)
𝒏−𝟏

fornece uma estimativa, sem erros sistemáticos, de σ.

As medidas de concentração de íon nitrato, dadas na Tabela 3, tem apenas certos


valores discretos, devido às limitações no método de análise. Na teoria, a concentração
pode assumir qualquer valor, assim para descrever a forma da população da qual a
amostra foi tomada, uma curva contínua é necessária. O modelo matemático usualmente
utilizado é a distribuição normal ou gaussiana, que é descrito pela equação:

−(𝒙−𝝁)𝟐
𝒆𝒙𝒑{ }
𝟐𝝈𝟐
𝒚= (5)
𝝈√𝟐𝝅

e sua forma é mostrada na Figura 3.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


23

 x

Figura 3. A distribuição normal. A média é indicada por μ.

A curva é simétrica em relação ao valor de µ, e quanto maior o valor de s, maior


a largura da curva (maior dispersão dos pontos), como mostrado na Figura 4.

y
s = 2

1 > 2

s = 

 x

Figura 4. Distribuições normais com o mesmo valor de média (μ), mas com valores
diferentes de desvio padrão (σ).

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


24

Uma análise mais detalhada mostra que, sejam quais forem os valores de µ e de s,
aproximadamente 68% da população situa-se entre ± 1 s da média, aproximadamente 95
% está entre ± 2 s e que aproximadamente 99,7 % situam-se entre ± 3 s da média.

Isso significa que, se as concentrações de nitrato dadas na Tabela 3 seguirem uma


distribuição normal, 33 dos 50 resultados (66 %) estarão entre 0,483 e 0,517, 49 (98 %)
estarão entre 0,467 e 0,533 e todos os resultados estarão entre 0,450 e 0,550, mostrando
uma excelente concordância com o modelo teórico.

A distribuição normal não é aplicada apenas a repetições de medidas da mesma


espécie. Ela também é frequentemente utilizada para resultados obtidos quando a mesma
espécie é medida em materiais diferentes, de fontes similares. Por exemplo, ao se medir
a concentração de albumina no soro sanguíneo de humanos adultos e saudáveis; será
encontrado que os resultados seguem, aproximadamente, uma distribuição normal.
Entretanto, quando se toma uma única medida de cada componente de uma população,
como por exemplo o conteúdo de chumbo em diferentes águas de abastecimento, outras
distribuições são comuns. Em particular, a assim chamada distribuição normal
logarítmica. Nessa distribuição, os logaritmos das concentrações (ou de outras
características), quando graficados em função da frequência dá uma curva de distribuição
normal.

A distribuição de médias amostradas


Já foi visto que a média de valores de uma amostra de medidas ( x ) fornece uma
estimativa do valor real, μ, da quantidade que se está tentando medir. Entretanto, como
as medidas individuais estão distribuídas em torno do valor real com certa dispersão, que
depende da precisão, é pouco provável que a média da amostra seja, exatamente, igual ao
valor real. Por esta razão, é mais útil estabelecer um intervalo de valores no qual nós
estamos quase certos de que se encontra o valor real. A amplitude desse intervalo depende
de dois fatores:

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


25

❖ O primeiro é a precisão das medidas individuais, que, por sua vez, depende
da variância da população.

❖ O segundo é o número de medidas na amostra.

O simples fato de que se repetiram as medidas implica em que se tem mais


confiança na média de vários valores do que nos valores individuais. Muitas pessoas
pensam que, quanto mais valores se têm, mais confiável é a estimativa de μ. Para explorar
esses conceitos, é necessário voltar nas medidas de concentração de dopamina. Na prática,
é muito pouco usual fazer 50 medidas repetidas. Um número de medidas mais comum é
cinco e será mostrado como as médias de amostras desse tamanho estão espalhadas em
torno de µ, tratando os resultados da Tabela 3 como dez amostras, cada uma contendo
cinco resultados.

Tomando cada coluna como uma amostra, os valores das médias serão: 0,506;
0,504; 0,502; 0,496; 0,502; 0,492; 0,506; 0,504; 0,500 e 0,486. É óbvio que esses valores
de média estão menos dispersos que os valores originais. Como as medidas originais são
uma amostra de uma população infinita de medidas possíveis esses valores de médias são
uma amostra das médias possíveis de amostras de cinco medidas tiradas de toda a
população. A distribuição desses valores de média é chamada de “distribuição de médias
amostradas”. O desvio padrão dessa amostra de médias é chamado de “erro padrão da
média” (s.e.m. – standard error of the mean).

Há uma relação matemática exata entre o desvio padrão, σ, da distribuição das


medidas individuais, e o s.e.m.:

𝜎
𝑠. 𝑒. 𝑚. = (6)
√𝑛

Como era intuitivamente esperado, quanto maior o n, menor a dispersão das


médias amostradas em relação ao μ. Esse termo universalmente utilizado, erro padrão da
média, pode dar origem a uma falsa interpretação, ao se pensar que 𝜎⁄√𝑛 possa estar

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


26

relacionado com a diferença entre 𝑥̅ e µ. Isso não é assim, o valor 𝜎⁄√𝑛 dá uma medida
da incerteza envolvida ao se estimar µ a partir de x , como será visto adiante.

Uma outra propriedade da distribuição das médias amostradas é que, mesmo se a


população original não for normal, a distribuição das médias amostradas tende a ser uma
distribuição normal quando n aumenta. Esse resultado é conhecido como o teorema do
limite central, de elevada importância porque muitos testes estatísticos são feitos na média
e assumem uma distribuição normal.

Limites de confiança da média


Agora que se conhece a forma da distribuição das médias amostradas, pode-se
retornar ao problema de se usar uma amostra para definir um intervalo dentro do qual se
pode razoavelmente assumir que contenha o valor real (é necessário que, ao se fazer isso,
assuma-se a ausência de qualquer erro sistemático). Tal intervalo é conhecido como
intervalo de confiança e os valores extremos desse limite são conhecidos como limites de
confiança. O termo “confiança” implica que se pode assegurar com um certo grau de
confiança, i.e., com certa probabilidade, que o intervalo de confiança inclui o valor real.

O tamanho do intervalo de confiança depende, obviamente, em quão certo de que


se quer que ele inclua o valor real. Quanto maior a certeza, maior o intervalo requerido.
A Figura 5 mostra uma distribuição normal de valores obtidos para amostra de tamanho
n.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


27

Frequência
95 %

 - 1,96 s x  + 1,96 s
Dados

Figura 5. A distribuição normal de dados, mostrando a variação dentro de 95%.

Assumindo, de agora em diante, esta distribuição normal, então 95% da


amostragem estará no intervalo dado por:

𝜎 𝜎
𝜇 − 1,96 ( 𝑛) < 𝑥̅ < 𝜇 + 1,96 ( 𝑛) (7)
√ √

O valor exato, 1,96, é usado nessa equação no lugar do valor dois, frequentemente
utilizado.

Na prática, entretanto, usualmente se tem uma média conhecida, e se quer um


intervalo para µ, o valor real. Assim, a equação acima pode ser rearranjada para:

𝜎 𝜎
𝑥̅ − 1,96 ( 𝑛) < 𝜇 < 𝑥̅ + 1,96 ( 𝑛)
√ √
(8)

Essas equações dão um limite de confiança de 95%. Similarmente, se for


requerido um limite de 99,7%, tem-se:

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


28

𝜎 𝜎
𝑥̅ − 2,97 ( 𝑛) < 𝜇 < 𝑥̅ + 2,97 ( 𝑛)
√ √
(9)

Ainda, um intervalo comumente usado é o de 99%, que é dado por:

𝜎 𝜎
𝑥̅ − 2,58 ( 𝑛) < 𝜇 < 𝑥̅ + 2,58 ( 𝑛)
√ √
(10)

A equação 8 pode ser usada para calcular a concentração dos íons nitrato com um
limite de confiança de 95%. Tem-se 𝑥̅ = 0,500 e n = 50. A única grandeza na equação,
que não se conhece é s. Para amostras grandes, como a do nitrato, s dá uma estimativa
suficientemente precisa de  e pode substituí-lo. Assim, para um intervalo de confiança
de 95% para a concentração de íons nitrato é:

𝟎, 𝟓𝟎𝟎 − 𝟏, 𝟗𝟔 ∗ 𝟎, 𝟎𝟏𝟔𝟓⁄√𝟓𝟎 < 𝝁 < 𝟎, 𝟓𝟎𝟎 + 𝟏, 𝟗𝟔 ∗ 𝟎, 𝟎𝟏𝟔𝟓⁄√𝟓𝟎 (11)

Resultando num limite de confiança de μ = 0,500 ± 0,0046 μg mL-1.

Quando o tamanho da amostra se torna menor, a incerteza introduzida ao se usar


s para estimar σ aumenta. Para considerar esse fato, a equação usada para calcular os
limites de confiança é modificada para:

𝜇 = 𝑥̅ ± 𝑡(𝑛−1) 𝑠⁄√𝑛 (12)

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


29

O valor apropriado de t depende de (n - 1), que é conhecido como número de graus


de liberdade (usualmente abreviado por υ) e do grau de confiança requerida.

O termo “graus de liberdade” refere-se ao número de desvios independentes (xi -


0) que é usado para calcular s. Nesse caso, o número é (n - 1) porque quando (n - 1)
desvios são conhecidos, o último pode ser deduzido usando a expressão óbvia:

∑𝑖(𝑥𝑖 − 𝑥̅ ) = 0 (13)

Os valores de t são dados em tabelas como a Tabela 5.

Tabela 5. Valores de t para intervalos de confiança 95 e 99%.

Graus de liberdade Valores de t no intervalo de confiança


95% 99%
1 12,71 63,66
2 4,30 9,92
3 3,18 5,84
4 2,78 4,60
5 2,57 4,03
10 2,23 3,17
20 2,09 2,85
30 2,04 2,75
50 2,01 2,68
100 1,98 2,63

Pode ser visto que para tamanhos de amostras maiores que 50, os valores de t são
muito próximos aos valores 1,96 e 2,58, usados nas equações acima. Isso confirma a
proposição usada para calcular os limites de confiança para a concentração de nitrato.

O uso dos dados dessa tabela pode ser ilustrado por meio de um exemplo: o
conteúdo de íons sódio de uma amostra de urina foi determinada usando um
eletrodo íon-seletivo. Os seguintes valores foram obtidos: 102, 97, 99, 98, 101 e
106 mmol L-1. Quais são os limites de confiança para 95% e 99% de confiança
da concentração dos íons sódio? A média e o desvio padrão desses valores são
100,5 mmol L-1 e 3,27 mmol L-1, respectivamente. Há seis medidas e, portanto,
cinco graus de liberdade. A partir da Tabela 5, o valor de t para calcular o limite
de confiança a 95% é 2,57 e a partir da equação:

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


30

Apresentação dos resultados

Como já foi comentado, nenhum resultado quantitativo experimental é de


qualquer valor, a menos que seja acompanhado por uma estimativa dos erros envolvidos
na sua medida.

Uma prática comum na literatura da química analítica é cotar a média como a


estimativa da quantidade medida e o desvio padrão como uma estimativa da precisão.
Menos frequentemente, o erro padrão da média é, às vezes, cotado, no lugar do desvio
padrão, ou o resultado é dado na forma de limites de confiança da média de 95%.

Um aspecto relacionado da apresentação de resultados é o arredondamento do


resultado. O princípio importante aqui é que o número de algarismos significativos
dá indicação da precisão do experimento. É um absurdo, por exemplo, dar o resultado
de uma análise titrimétrica como sendo 0,107846 mol L-1. Nenhum analista pode
encontrar a precisão implícita de 0,00001 em aproximadamente 0,1, isso é 0,001%. Na
prática, é usual contar como algarismos significativos todos os dígitos que são precisos,
mais o primeiro incerto. Por exemplo, a média dos valores 10,09; 10,11; 10,09 e 10,12;
que é 10,102 e o desvio padrão é 0,01304. Claramente é uma incerteza na segunda casa
decimal; os resultados são todos 10,1 mais uma casa decimal, mas são discordantes na
segunda casa. Usando o método sugerido, o resultado deve ser cotado como:

x = 10,10  0,01(n = 5) (14)

Se for observado um arredondamento inaceitável do desvio padrão, então o


resultado pode ser dado como:

x  s = 10,102  0,013 (n = 5) (15)

Onde o uso do subscrito indica que o digito dado é apenas para evitar a perda da
informação. O leitor deve decidir se ele é útil ou não. Da mesma maneira, quando os
limites de confiança são calculados, não há razão para dar o valor de t . s com mais de

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


31

duas casas significativas. O valor de x deve ser dado com o número correspondente de
casas decimais.

O número de algarismos significativos cotados é, algumas vezes, utilizado no


lugar de uma estimativa específica da precisão de um resultado. Por exemplo, 0,1046 mol
L-1 é usado para significar que os algarismos nas três primeiras casas decimais são
seguros, mas há dúvidas sobre o quarto. Entretanto, como a incerteza na última casa pode
ser qualquer coisa entre 0,00005 e 0,0005, esse método dá uma estimativa pobre da
precisão e não pode ser recomendado.

Algumas vezes a incerteza na última casa é enfatizada pela utilização das formas
0,1046 ou 0,1046 mol L-1, mas continua preferível dar uma estimativa específica da
precisão, como o desvio padrão.

Outro problema a ser considerado é se o número cinco deve ser arredondado para
cima ou para baixo. Por exemplo, se 9,65 deve ser arredondado para uma casa decimal,
ele se torna 9,7 ou 9,6? É evidente que os resultados serão supervalorizados se o cinco
for sempre arredondado para cima. Essa supervalorização pode ser evitada arredondando
o cinco para o número par mais próximo, dando, nesse caso 9,6. De maneira análoga, 4,75
deve ser arredondado para 4,8.

Outros usos dos limites de confiança

Os limites de confiança podem ser utilizados como um teste para erros


sistemáticos, como mostrados no exemplo seguinte:

A escala de absorbância de um espectrômetro é testada num comprimento de


onda particular com uma solução padrão que tem uma absorbância dada como
0,470. Dez medidas de absorbância com o espectrômetro resultaram em média
de 0,461 e s = 0,003. Encontra-se o intervalo de confiança a 95% para a
absorbância média e decide-se se um erro sistemático está presente.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


32

Propagação de erros aleatórios

No trabalho experimental, a quantidade a ser determinada é, frequentemente,


calculada a partir de uma combinação de quantidades observadas. Já foi visto, por
exemplo, que mesmo uma operação relativamente simples, como a análise titrimétrica,
envolve muitos passos, cada um sujeito aos seus próprios erros. O cálculo final pode
envolver uma operação de soma, diferença, produto ou quociente de duas ou mais
quantidades ou a elevação de uma quantidade medida a qualquer potência. É muito
importante observar que os procedimentos para combinar erros aleatórios e sistemáticos
são completamente diferentes. Isso ocorre, porque erros aleatórios, num certo grau,
cancelam-se uns aos outros, enquanto erros sistemáticos acumulam-se. Supõe-se, por
exemplo, que o resultado de um experimento, x, é dado por x = a + b. Se a e b tiverem,
cada um, um erro sistemático de + 1, é claro que o erro sistemático em x será + 2. Se,
entretanto, a e b tiverem um erro randômico de ± 1, o erro randômico em x não será ± 2.
Isso porque, em alguns casos, o erro em a será negativo enquanto o erro em b será positivo
e vice-versa.

Combinações lineares

Nesse caso, o valor final, y, é calculado a partir de uma combinação linear das
quantidades medidas a, b, c, etc. por:

𝒚 = 𝒂 + 𝒃 + 𝒄 + ⋯. (16)

A variância (definida como o quadrado do desvio padrão) apresenta uma


importante propriedade, ou seja, a variância de uma soma ou diferença de quantidades
independentes é igual à soma de suas variâncias. Pode-se mostrar que, se σa, σb, σc, etc.
são os desvios padrões de a, b, c, etc., o desvio padrão de y, σy, é dado por:

𝝈𝒚 = √(𝝈𝒂 )𝟐 +(𝝈𝒃 )𝟐 +(𝝈𝒄 )𝟐 + ⋯ (17)

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


33

Exemplo: numa titulação a leitura inicial da bureta é 3,51 mL e a leitura final é


15,67 mL, ambos com um desvio padrão de 0,02 mL. Qual é o volume do titulante e qual
é o seu desvio padrão?

Esse exemplo ilustra o ponto muito importante de que o desvio padrão para o
resultado é maior do que aqueles para as leituras individuais da bureta, mesmo quando o
volume é calculado por uma diferença, mas é menor que a soma dos desvios padrões.

Expressões multiplicativas

Se y é calculado de uma expressão do tipo:

𝒂𝒃
𝒚= (18)
𝒄𝒅

Onde a, b, c e d são quantidades medidas independentes, então há uma relação


entre os quadrados dos desvios padrão relativos:

y 2
     
2 2
=  a  +  b  +  c  + ... (19)
y  a   b   c 

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


34

Exemplo: o rendimento quântico de fluorescência, Φ, é calculado a partir


da equação:

If
= (20)
k  c  l  I0  

Onde as grandezas envolvidas são definidas abaixo, juntamente com uma


estimativa dos seus desvios padrões relativos (sendo k uma constante do
aparelho):

❖ Intensidade de luz incidente (I0) = 0,5%;

❖ Intensidade de fluorescência (If) = 2%;

❖ Absortividade molar (ε) = 1%;

❖ Concentração (c) = 0,2%;

❖ Caminho óptico (l) = 0,2%.

Calcule o desvio padrão do rendimento quântico de fluorescência.

Pode-se observar que o desvio padrão relativo no resultado final não é muito maior
que o maior dos desvios padrões utilizados no cálculo (isso é, 2% para If). Isso é uma
consequência maior da elevação ao quadrado dos desvios padrões relativo e ilustra um
ponto importante: qualquer esforço para melhorar a precisão do experimento deve ser
direcionado para a melhoria da precisão dos valores menos precisos. Como um corolário
para isso, não há qualquer vantagem em tentar aumentar a precisão dos valores mais
precisos. Isso não deve ser encarado como se erros pequenos não sejam importantes.
Pequenos erros em muitos passos da análise, como a análise titrimétrica discutida
anteriormente, produzirão um erro apreciável no resultado final.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


35

É importante ressaltar que, quando uma quantidade é elevada a uma potência, por
exemplo, b3, então o erro não é calculado como uma multiplicação, isso é, b  b  b, porque
as quantidades não são independentes. Se a equação for:

y = bn (21)

Então, o desvio padrão de y e b são relacionados por:

y n  b
= (22)
y b

Outras funções

Se y for uma função geral de x:

y = f (x) (23)

Então o desvio padrão de x e de y são relacionados por:

dy
y = x (24)
dx

Exemplo: a absorbância A, de uma solução é dada por:

A = − logT (25)

Onde T é a transmitância. Se o valor medido de T é 0,501, com um desvio


padrão de 0,001, calcule o seu desvio padrão.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


36

Propagação de erros sistemáticos

As normas para combinação de erros sistemáticos também podem ser divididas


em três grupos.

Combinações lineares

Se y é calculado para as quantidades medidas com o uso da equação:

𝒚=𝒂+𝒃+𝒄+⋯ (26)

E os erros sistemáticos em a, b, e, etc., são Δa, Δb e Δc, etc., então o erro


sistemático em y, Δy, é calculado a partir de:

∆𝒚 = ∆𝒂 + ∆𝒃 + ∆𝒄 + ⋯ (27)

É importante lembrar que os erros sistemáticos podem ser tanto positivos quanto
negativos e que esses sinais devem ser incluídos no cálculo de Δy.

Expressões multiplicativas

Se y é calculado, a partir de quantidades medidas, com a equação:

kab
y= (28)
cd

Então o erro sistemático relativo é:

 y    a    b    c    d 
  =  + + +  (29)
  
y a      
b c d 

Quando uma quantidade é elevada a alguma potência, então a equação:

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


37

 y n  b
= (30)
y b

É usada sem o módulo e com os desvios padrões substituídos pelos erros


sistemáticos.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


38

CAPÍTULO 3

TESTES DE SIGNIFICÂNCIA

Umas das propriedades mais importantes de um método analítico é que ele deve
ser isento de erros sistemáticos, isso é, o valor calculado pelo método deve ser o valor
real. Entretanto, erros aleatórios fazem com que o valor medido raramente seja
exatamente igual ao valor real. Para decidir se a diferença entre o valor medido e o valor
padrão pode ser atribuída a esses erros aleatórios, um teste estatístico, conhecido como
teste de significância, pode ser empregado.

Comparação entre uma média experimental e um valor conhecido

Ao se fazer um teste de significância, está se testando a validade de uma hipótese


conhecida como hipótese nula. Por exemplo: anteriormente adotou-se uma hipótese nula
de que um método analítico não deve conter erros sistemáticos. O termo nulo é utilizado
para significar que não há qualquer outra diferença entre o valor observado e conhecido,
a não ser aquela atribuída a erros aleatórios. Assumindo a validade dessa hipótese, uma
teoria estatística pode ser usada para calcular a probabilidade de que a diferença
observada entre a média da amostra, x , e o valor verdadeiro, µ, seja originada apenas de
erros aleatórios. Usualmente, a hipótese nula é rejeitada se a probabilidade de tal diferença
for menor que uma em 20 (ou seja, 0,05 ou 5%). Nesse caso, a diferença é dita significante
no nível de 0,05 (ou 5%).

Usando esse nível de significância, há uma probabilidade de uma em 20 de que


tenhamos que rejeitar uma em 20 a hipótese nula, quando de fato ela é verdadeira. Para
se ter maior certeza de se fazer a escolha correta, um nível mais elevado de significância
deve ser usado, usualmente 0,01 ou 0,001 (1% ou 0,1%).

O nível de significância é indicado por P (isso é, probabilidade) = 0,05 e 0,05, e


dá a probabilidade de se rejeitar uma hipótese nula verdadeira. Deve-se ressaltar que, se

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


39

a hipótese nula é mantida, não foi provado que ela seja verdadeira, apenas não se
demonstrou que ela seja falsa.

Adiante será discutida a probabilidade de se manter uma hipótese nula falsa.

Para se decidir quando a diferença entre µ e x é significante, a equação:

𝑠
𝜇 = 𝑥̅ ± 𝑡 ( 𝑛) (31)

É reescrita como:

√𝑛
𝑡 = (𝑥̅ − 𝜇) (32)
𝑠

E um valor de t é calculado. Se |t| exceder um certo valor crítico, então a hipótese


nula deverá ser rejeitada. O valor crítico de |t| para um nível de significância particular é
encontrado na Tabela de valores de t do Anexo.

Exemplo: em um método para determinar mercúrio por absorção atômica os


seguintes valores foram encontrados para um material de referência contendo
38,9% de mercúrio: 38,9%, 37,4% e 37,1%. Há alguma evidência de erro
sistemático?

Comparação das médias de duas amostras


Uma outra maneira na qual os resultados de uma nova metodologia analítica
podem ser testados é pela comparação com aqueles obtidos usando uma segunda
metodologia (talvez uma metodologia de referência). Nesse caso, têm-se duas médias
amostrais, x1 e x 2 . Tomando a hipótese nula, de que os dois métodos dão o mesmo
resultado, será preciso testar se ( x1 − x2 ) é significativamente diferente de zero ou não.

Se as duas amostras têm desvios padrões que não são significativamente


diferentes, uma estimativa associada do desvio padrão pode ser calculada a partir de dois
desvios padrões s1 e s2, usando a equação:

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


40

[(𝑛1 −1)𝑠12 +(𝑛2 −1)𝑠22 ]


𝑠2 = (𝑛1 +𝑛2 −2)
(33)

Pode-se então mostrar que t será dado por:

(𝑥̅1 −𝑥̅2 )
𝑡= 1 1
(34)
𝑠 √( + )
𝑛1 𝑛2

Onde t tem (n1 + n2 - 2) graus de liberdade.

Exemplo: numa comparação entre dois métodos para a determinação de boro


em amostras de plantas, os seguintes resultados foram obtidos em μg mL-1
(Tabela 6).

Tabela 6. Resultados de dois métodos na determinação de boro (do exemplo).

Método espectrofotométrico Método fluorimétrico


Média 28,0 Média 26,25
Desvio padrão 0,3 Desvio padrão 0,23

Dez determinações foram feitas para cada método. Há diferença nos


resultados obtidos pelos dois métodos?

Outra aplicação para esse teste é ilustrada no próximo exemplo, onde ele é usado
para decidir se uma mudança nas condições experimentais afeta o resultado.

Exemplo: numa série de experimentos para a determinação de estanho em


comidas enlatadas, as amostras eram fervidas com ácido hidroclorídrico sob refluxo
por tempos diferentes. Alguns resultados são apresentados na Tabela 7:

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


41

Tabela 7. Resultados na determinação de estanho em diferentes tempos de refluxo


(do exemplo).

Tempo de
refluxo Estanho (mg kg-1)
(min)
30 55 57 59 56 56 59
75 57 55 58 59 59 59

As médias encontradas de estanho diferem significativamente com o tempo de


fervura?

Exemplo: a Tabela 9 apresenta os resultados da concentração de tiol no sangue


de dois grupos de voluntários, o primeiro grupo sendo “normal” e o segundo sofrendo
de artrite reumatóide.

Tabela 9. Resultados da concentração de tiol no sangue de dois grupos de


voluntários.

Ensaios “Normal” Reumatóide


1 1,84 2,81
2 1,92 4,06
3 1,94 3,62
4 1,92 3,27
5 1,85 3,27
6 1,91 3,76
7 2,07 Não realizado
N 7 6
s 0,076 0,440
x 1,921 3,465

Teste t pareado

Quando se compara a eficiência de dois métodos analíticos distintos, pode não ser
possível gerar conjuntos de dados separados, para os dois métodos, para utilizar um dos
testes t descritos acima. Por exemplo, pode não ser prático obter mais de um resultado
para cada método testado, em cada amostra. Assim, não é possível obter duas médias

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


42

experimentais para comparar. Nestes casos, o teste t pareado é muito útil. Ele requer pares
de resultados obtidos da análise de diferentes amostras, como ilustrado na Figura 6
abaixo.

1
Amostras

2
d
C
3 1
d1

4 2
d2

5 3 d3
Método 1
6 Método 2 4 d4

Resultados 5 d5

B 6 d6
Metodologia

A
-2 0 2

B Diferenças

Resultados

Figura 6. Comparação usando amostras pareadas.

Na Figura 6A os pontos representam pares de resultados de seis diferentes


amostras. Em cada par, os círculos aberto e colorido representam os resultados obtidos
com diferentes métodos analíticos, A e B, para cada amostra. Como os dados em cada
conjunto de resultados, para cada método, variam devido aos erros aleatórios inevitáveis
e devido às diferenças entre cada método, seria errado utilizar os testes t discutidos acima,
para as duas médias. Uma possível diferença entre as médias poderia ser mascarada pela
grande variação dos dados em cada método. Entretanto, a diferença di=ai-bi, entre os
resultados ai e bi, em cada par, é devida unicamente aos erros aleatórios e a uma possível
diferença entre os métodos. As subtrações entre cada par de dados equivalentes nos dão
um novo conjunto de dados, mostrado na Figura 6C. Se não existir qualquer discrepância
entre os métodos, a média destas diferenças deverá ser igual a zero. Para se testar ser o

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


43

valor da média das diferenças obtido é significativamente diferente de zero, utiliza-se o


teste t pareado.

Exemplo: a Tabela 610 mostra concentrações de chumbo (µg mL-1)


determinadas por dois métodos diferentes para cada uma das quatro amostras.

Tabela 60. Concentrações de chumbo (µg mL-1) determinadas por dois métodos
diferentes (do exemplo).

Solução Oxidação úmida Extração direta


1 71 76
2 61 68
3 50 48
4 60 57

Os dois métodos dão valores médios de chumbo que variam de maneira


significativa?

Existem circunstâncias nas quais é necessário planejar um experimento no qual


cada analito é analisado por dois métodos e os resultados são naturalmente pareados.
Alguns exemplos:

i. A quantidade de qualquer uma das espécies-teste é suficiente para uma


única determinação por método.

ii. Os métodos serão comparados usando uma grande variedade de amostras


de diferentes fontes com diferentes concentrações.

iii. As espécies-teste podem ser de um longo intervalo de tempo e é necessário


remover os efeitos sazonais (temperatura, pressão, etc.).

Como os métodos analíticos têm, constantemente, que ser aplicados a uma faixa
grande de concentrações, qualquer novo método deve ser comparado a um método padrão
pela análise de amostras nas quais a concentração do analito pode variar em ordens de
grandeza. Nesse caso é inapropriado usar o teste-t pareado, pois sua validade depende da

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


44

afirmação que qualquer erro, aleatório ou sistemático, é independente da concentração.


Assim, em amplas faixas de concentrações, não se pode mais fazer tal afirmação.

TESTES MONO E BI-CAUDAIS

Os métodos descritos até aqui analisados foram desenvolvidos para testar as


diferenças entre dois valores de média em ambas as direções. Por exemplo, o método
descrito na seção 1 testa a existência de uma diferença significativa entre o resultado
experimental e o valor conhecido, independentemente do sinal da diferença. Na maioria
das situações desse tipo, o experimentador não tem qualquer ideia pré-concebida, antes
dos resultados experimentais, se uma diferença significante eventual entre as médias
experimentais e os valores de referência será positiva ou negativa. Ele, então, necessita
de um teste que cubra ambas as possibilidades. Tal teste é chamado bi-caudal (ou
bilateral). Entretanto, em poucos casos, um tipo específico de teste pode ser apropriado.

Considerar, por exemplo, um experimento no qual se espera um aumento na


velocidade da reação pela adição de um catalisador. Nesse caso, é claro, antes do
experimento, que apenas os resultados que indiquem um aumento no valor da constante
de velocidade em relação à anterior são de interesse. Assim, apenas um aumento deve ser
testado para a significância. Esse tipo de teste é chamado de mono-caudal (ou unilateral).
Para um dado valor de n e para um nível de probabilidade particular, o valor crítico para
um teste mono-caudal difere daquele para um teste bi-caudal. Em um teste mono-caudal
para um incremento, o valor crítico de t (no lugar de |t|) para P = 0,05 é aquele valor que
é excedido com uma probabilidade de 5%. Como a distribuição da amostra da média é
assumida ser simétrica, essa probabilidade é metade da probabilidade que é obtida num
teste bi-caudal. O valor apropriado para um teste mono-caudal é, assim, encontrado na
coluna P = 0,10 tabelado (Anexo B). De maneira similar, para um teste mono-caudal, com
P = 0,01, o valor da coluna P = 0,05 deverá ser utilizado.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


45

Para um teste mono-caudal onde se espera uma diminuição no valor da média, o


valor crítico de t será de igual magnitude, mas com um sinal negativo. Exemplo: suspeita-
se que um método titrimétrico ácido-base tem um erro significativo no indicador e, assim,
tende a resultar num erro sistemático positivo (isso é, numa bias positiva). Para verificar
esse fato, foi utilizada uma solução de ácido exatamente 0,1 mol L-1 para titular 25,00 mL
de uma solução alcalina exatamente 0,1 mol L-1, com os seguintes resultados (mL): 25,06
25,18 24,87 25,51 25,34 e 25,41. Para esses resultados tem-se: média = 25,228 mL e
desvio padrão = 0,238 mL. Adotando a hipótese nula de que não há bias, isso é, µ = 25,00
mL, e usando a equação de t:

(x − ) n
t=
s
(25,228 − 25,00) 6
t =  t = 2,35
0,238

O valor crítico de t para 5 graus de liberdade é 2,02 (P = 0,05, teste mono-caudal,


ver na Tabela de t acima). Como o valor de t observado é maior que o valor crítico, a
hipótese nula deve ser rejeitada e há evidências para bias positiva. É interessante notar
que se um teste bi-caudal for feito no exemplo acima, (|t| = 2,57), a hipótese nula não deve
ser rejeitada. Esta contradição aparente é explicada pelo fato da decisão de se fazer um
teste mono ou bi-caudal depender no grau de conhecimento prévio, nesse caso uma
suspeita de bias positiva.

TESTES F PARA A COMPARAÇÃO DE DESVIOS PADRÕES

Os testes de significância descritos anteriormente são usados para comparar


valores de médias, e assim detectar erros sistemáticos. Também é importante, em muitos
casos, comparar os desvios padrões, isso é, os erros aleatórios de dois conjuntos de dados.
Como nos testes com médias, esta comparação pode tomar duas formas. Tanto se pode
querer testar se o método A é mais preciso que o método B (isso é, um teste mono-caudal)
ou querer saber de quanto a precisão do método A difere da do método B (um teste bi-

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


46

caudal). Assim, se quiser saber se um método analítico novo é mais preciso que o método
padrão é necessário fazer um teste mono-caudal. Se desejar apenas saber de quanto à
precisão dos dois métodos difere, é necessário executar um teste bi-caudal.

O teste-F considera a relação de variâncias de duas amostras, isso é, a relação dos


quadrados dos desvios padrões. A quantidade calculada (F) é dada por:

s12
F= 2 (38)
s2

Onde os parâmetros são colocados na equação de tal forma que F é sempre maior
ou igual a um. A hipótese nula adotada é que as populações de onde as amostras são
tomadas são normais, e que as variâncias das populações são iguais.

Se a hipótese nula for verdadeira, então a relação de variâncias deve ser muito
perto de um. Diferenças de um ocorrem por causa das variações aleatórias, mas se a
diferença é muito grande, ela não pode mais ser atribuída a esta causa. Se o valor
calculado de F exceder um certo valor crítico (obtidos das Tabelas adequadas, no final da
apostila) então a hipótese nula deve ser rejeitada. Esse valor crítico de F depende do
tamanho de ambas as amostras, do nível de significância e do tipo de teste executado.

Exemplo: um método para determinar a demanda química de oxigênio em águas


residuárias foi comparado com um método padrão (sal de mercúrio). Os resultados
seguintes foram obtidos de uma alíquota de efluentes de esgotos (Tabela 71).

Tabela 71. Resultados de dois métodos para determinar a demanda química de


oxigênio em águas residuárias (do exemplo).

Método Média (mg L-1) Desvio padrão (mg L-1)


Padrão 72 3,31
Proposto 72 1,51

Para cada método, oito determinações foram feitas. A precisão do método


proposto é de maneira significativa maior que a do método padrão?

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


47

Outro exemplo: anteriormente, do cálculo de boro em plantas, foi assumido que


as variâncias não eram diferentes de maneira significativa. Esta proposição pode ser
testada agora. Os desvios padrões eram 0,3 e 0,23 (cada um obtido de dez medidas em
uma espécie particular de planta). Calculando o F de tal forma que ele seja maior que um,
tem-se:

0,32
𝐹= = 1,70
0,232

Nesse caso, entretanto, não se tem qualquer razão para supor, em antemão, que a
variância de um método deva ser maior que a do outro. Assim, um teste bi-caudal deve
ser apropriado. Os valores críticos da tabelados são aqueles que F excede, com uma
probabilidade de 0,05, assumindo que ele deve ser maior que um.

Num teste bi-caudal, a relação entre a primeira e a segunda variância pode ser
menor ou maior que um, mas se F for calculado como maior que um, a probabilidade que
ele exceda o valor tabelado deve ser dobrada. Assim, os valores críticos dados da Tabela
monocaudal não são apropriados para testes bi-caudais e a outra tabela deve ser utilizada
no lugar. Da Tabela para F bicaudal, no final da apostila, tomando o número de graus de
liberdade de ambos numerador e denominador como nove, o valor crítico para F é 4,026.
O valor calculado é menor que isso, assim não há diferença significante entre as duas
variâncias no nível de 5%.

PONTOS FORA DA CURVA (“OUTLIERS”)

Todos os experimentalistas são familiarizados com a situação em que um (ou


possivelmente vários) de um conjunto de resultados parece diferir dos outros dados do
conjunto, de uma maneira inexplicável. Tais medidas são conhecidas como “pontos fora
da curva” (outlier). Em alguns casos, os pontos fora da curva podem ser atribuídos a erros
humanos. Por exemplo: 12,2; 12,15; 12,13; 13,14 e 12,12 mL. Esses valores foram
obtidos para uma titulação. Nessa série, o quarto valor é, quase com certeza, um engano

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


48

na escrita do número, que deveria ser lido 12,14. Entretanto, mesmo quando esses erros
óbvios estão ausentes, valores que parecem estar fora ainda podem ocorrer. Eles devem
ser mantidos ou removidos?

Os valores calculados para a média e o desvio padrão dependerão da decisão de


rejeitar ou manter. Como a discussão sobre a precisão e a exatidão do método depende
desses valores finais, deve-se sempre precisar com clareza quando os pontos fora da curva
devem ser rejeitados e, se forem, por quê. Um dos vários testes disponíveis para avaliar
uma medida suspeita consiste em comparar a diferença entre o seu valor e o do vizinho
mais próximo com aquela obtida entre o valor máximo e o mínimo encontrado. A relação
entre essas diferenças (independente do sinal) é conhecida como Teste Q de Dixon.

valorsuspeito − valorvizinho
Q= (39)
valormaior − valormenor

Os valores críticos de Q para P = 0,05 e para P = 0,01 estão na Tabela 82. Se o


valor calculado de Q exceder o valor crítico, o suspeito deve ser rejeitado.

Os valores dados são para os testes bi-caudais, apropriados quando não se conhece
em que extremo um ponto fora da curva pode ocorrer.

Tabela 82. Valores críticos de Q (P = 0,05) para um teste bi-caudal.

Tamanho da amostra Valor crítico


4 0,831
5 0,717
6 0,621
7 0,570
8 0,524
9 0,492
10 0,464

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


49

Exemplo: os seguintes valores foram obtidos para a concentração de ácido nítrico


numa amostra de água de rio: 0,403 0,410 0,401 0,380; o último valor é suspeito. Ele
deve ser rejeitado?

Idealmente, mais medidas devem ser feitas, quando um valor suspeito é detectado,
particularmente quando poucas medidas foram tomadas inicialmente. Isso pode tornar
mais claro quando um valor suspeito deve ou não ser rejeitado. Mesmo se ele for mantido,
sua contribuição para o valor da média e desvio padrão será menor.

Exemplo: se três mais valores forem adicionados àqueles do exemplo anterior e


os resultados forem: 0,403 0,410 0,401 0,380 0,400 0,413 0,411 o resultado de 0,380 deve
ainda ser mantido?

Um outro teste para pontos fora da curva frequentemente utilizado é o teste de


Grubb, que compara o desvio de um valor suspeito da média da amostra com o valor do
desvio padrão desta amostra. Este teste é recomendado pela ISO em preferência ao teste
de Dixon.

Para se utilizar o teste de Grubb, que é testar a validade da hipótese nula,


todas as medidas vêm de uma mesma população e o parâmetro G é calculado como:

𝐺 = |𝑣𝑎𝑙𝑜𝑟 𝑠𝑢𝑠𝑝𝑒𝑖𝑡𝑜 − 𝑥̅ |/𝑠 (40)

onde s é calculado com o valor suspeito incluído. O teste assume que a população testada
é normal.

Os valores críticos de G para P=0,05 são dados na Tabela do Apêndice, no final


da apostila. Se o valor de G exceder o valor crítico, o valor suspeito deve ser rejeitado.

Exemplo: Aplique o teste de Grubb para os dados do exemplo anterior:

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


50

É importante atentar para o fato de que, num nível de significância de 5%, ainda
há uma chance de 5%, ou seja, um em 20, de se rejeitar de maneira incorreta um valor
suspeito. Isso pode ter uma influência considerável na estimativa da precisão de um
experimento. Por exemplo, para todos os sete valores de concentração de nitrito dados
acima, o desvio padrão é 0,011 mg L-1, mas quando o valor suspeito é rejeitado, o desvio
padrão torna-se 0,0056 mg L-1, isso é, a precisão do experimento parece ter aumentado
por um fator de dois. O exemplo acima ilustra a importância de se ater a critérios para
aceitar ou rejeitar um valor fora da curva.

Quando as medidas são repetidas apenas algumas vezes, (o que é comum no


trabalho analítico), a rejeição de um valor faz uma grande diferença nos valores da média
e do desvio padrão. Na prática, o procedimento de se obter três medidas e rejeitar aquela
que mais se afastar das outras deve ser evitado.

Se o conjunto de dados contém mais de um valor suspeito, mais complicado é


decidir sobre a rejeição ou não. A 7 mostra, na forma de “dot plots” dois exemplos de tais
dificuldades.

b
2 2,2 2,4 2,6 2,8 3 3,2

x1 xn

Figura 7. Dois exemplos a e b na forma de “dot plots”.

Na Figura 7 há dois resultados, 2,9 e 3,1, que são suspeitos quando comparados
com os outros. Entretanto, se calcular o valor de Q, obter-se-á:

3,1 − 2,9
Q=  Q = 0,18
3,1 − 2,0

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


51

Um valor que não é significante (P = 0,05). Claramente, o valor fora da curva 3,1
foi mascarado pelo outro valor suspeito 2,9, dando um valor baixo de Q.

Como resolver tais situações?

Uma das maneiras é considerá-los como um par (procedimento do bloco), com o


teste sendo feito pela sua média dividida pela média de todo o conjunto. O risco que se
corre com esta aproximação é que ambos devem (necessariamente) ser aceitos ou
rejeitados juntos em situações onde um dos dois poderia ser aceito. Como alternativa, em
um procedimento consecutivo, testamos primeiro, com a ajuda de uma estatística similar
ao teste Q, se o valor 2,9 pode ser rejeitado. Se for rejeitado, então o valor 3,1 também
será naturalmente rejeitado. Se o valor 2,9 for mantido, um teste separado é aplicado ao
valor 3,1.

Uma situação diferente ocorre com o exemplo b, onde os dois valores suspeitos
estão nas extremidades opostas do conjunto de dados.

Novamente, vários tipos de testes têm sido propostos, um deles sendo (xn - xi) / s,
sendo s o desvio padrão da amostra.

A discussão de erros até aqui tem assumido que as distribuições de medidas


repetidas são normais, ou quase. É importante entender que os testes de pontos descritos
fora da curva acima levam esta afirmação em conta. Um resultado que parece estar fora
da curva numa distribuição normal pode muito bem não ser suspeito numa distribuição
log-normal, por exemplo. Assim, os testes para pontos fora da curva não devem ser feitos
se existir dúvidas sobre a distribuição normal de pontos.

ANÁLISE DE VARIÂNCIA

Na aula anterior, foi discutido um método para se comparar os valores de duas


médias e concluir se eles diferem significantemente. No trabalho analítico há,
frequentemente, mais de dois valores de médias para serem comparados. Alguns
exemplos possíveis são: comparar a concentração média de proteínas em solução, a partir

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


52

de amostras armazenadas sob diferentes condições, comparar os resultados médios


obtidos para a concentração de um analito por diferentes métodos, etc. Nesses, e em
outros exemplos, há duas possíveis fontes de variações. A primeira, que está sempre
presente, são os erros aleatórios das medidas, que já foi discutido em detalhes, nos tópicos
anteriores. Essa é a fonte de resultados diferentes, cada vez que as medidas são feitas
utilizando as mesmas condições.

A segunda fonte de erro possível é devido ao que se conhece como um fator


controlado ou de efeito fixo.

Nos exemplos acima, os fatores fixos eram, respectivamente, as condições de


armazenamento das proteínas e as técnicas utilizadas.

A análise de variância – ANOVA (analysis of variance) é uma técnica estatística


muito poderosa que pode ser utilizada para separar e estimar as diferentes causas de
variações.

Nos exemplos anteriores, ela pode ser usada para separar qualquer variação
causada pelos fatores de controle da variação causada por erros aleatórios. Ela pode,
assim, testar se a mudança nos fatores de controle altera significativamente os valores das
médias calculadas.

ANOVA também pode ser usada em situações onde há mais de uma fonte de
variações aleatórias. Considere, por exemplo, o teste de pureza de um lote de frascos de
cloreto de sódio. As amostras são tiradas de várias partes do lote, escolhidas de maneira
aleatória e análises repetidas são feitas nessas amostras. Além do erro randômico na
medida das purezas, também pode haver variações na pureza de cada amostra, de
diferentes partes do lote. Como as amostras são tomadas aleatoriamente, os erros também
serão aleatórios e, assim, eles são chamados de fator de efeito aleatório.

Ambos os tipos de análise estatística descritos acima, isso é, onde há apenas um


fator, seja de controle ou aleatório, em adição ao erro randômico do experimento, são
conhecidos como ANOVA monomodal (one way).

Os procedimentos matemáticos utilizados são similares nos casos de fatores de


efeitos fixos ou fatores de efeito aleatórios. Isso será explorado por meio de exemplos. É

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


53

necessário explorar aqui os fatores de efeitos fixos e num próximo tópico os de efeitos
aleatórios. Para esse último caso deve-se, antes, discutir a amostragem com mais detalhes.

Mais adiante, será discutida também situação mais complexa, com dois ou mais
fatores, todos interagindo entre si.

Comparação de várias médias

A Tabela 93 mostra o resultado obtido de uma investigação da estabilidade de um


reagente fluorescente armazenado sob diferentes condições. Os valores dados são sinais
de fluorescência em unidades arbitrárias de soluções diluídas de iguais concentrações.

Três medidas repetidas foram feitas de cada amostra. A Tabela 93 mostra que os
valores das médias para cada amostra são diferentes.

Entretanto, sabe-se que, devido ao erro aleatório, mesmo se o valor verdadeiro que
se está tentando avaliar não mudasse, a média de cada amostra deverá variar.

ANOVA testa se a diferença entre os valores de médias é, ou não, muito grande


para ser explicada pelo erro aleatório. O problema pode ser generalizado para se
considerar h amostras, cada uma com n membros como na tabela, onde xij é a medida j
da amostra i.

Tabela 93. Sinal de fluorescência de soluções estocadas em diferentes condições


(do exemplo).

Ensaio Condições Medidas Média


A Preparado na hora 102, 100, 101. 101
B Estocada 1 h no escuro 101, 101, 104. 102
C Estocada 1 h à meia-luz 97, 95, 99. 97
D Estocada 1 h sob luminosidade 90, 92, 94. 92
Média total 98

Tabela 104. Generalização da Tabela 93.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


54

Amostra Medidas Médias


1 x11 x12 → x1n x1
2 x21 x22 → x2n x2
↓ ↓ ↓ ↓ ↓
i xi1 xi2 → xin xi
↓ ↓ ↓ ↓ ↓
h xh1 xh2 xhn xh
Média total x

As médias das amostras são x1 , x2 ,..., x n e a média para todos os valores agrupados

é x . A hipótese nula adotada é que todas as amostras foram tiradas de uma população
com média µ e variância σ02.

Com base nesta hipótese, σ02 pode ser estimado de duas maneiras, uma
envolvendo a variação dentro das amostras e outra a variação entre as amostras.

Variações dentro da amostra


Para cada amostra, a variância pode ser calculada usando a fórmula:

(x i − x )2
(41)
n −1

Usando os valores da Tabela 9, tem-se:

(102 − 101) 2 + (100 − 101) 2 + (101 − 101) 2


var a =  var a = 1
3 −1
(101 − 102) 2 + (101 − 102) 2 + (104 − 102) 2
var b =  var b = 3
3 −1
(97 − 97) 2 + (95 − 97) 2 + (99 − 97) 2
var c =  var c = 4
3 −1
(90 − 92) 2 + (92 − 92) 2 + (94 − 92) 2
var d =  var d = 4
3 −1

Fazendo a média dos valores de variância acima tem-se a estimativa de σ02 dentro
da amostra:

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


55

1+ 3 + 4 + 4
 02 = =3
4

Esta estimativa possui oito graus de liberdade; cada amostra tem dois graus de
liberdade e existem quatro amostras. É necessário observar que esta estimativa não
depende das médias das amostras; se, por exemplo, todas as medidas de A forem
acrescidas de, por exemplo, quatro, esta estimativa de σ02 permaneceria inalterada.

A equação geral para estimar σ02 dentro da amostra é:

( xij − xi ) 2
 02 =  (42)
i j h(n − 1)

A somatória em j e a divisão por (n - 1) dá a variância de cada amostra; a somatória


em I e a divisão por h dá a média dessas variâncias. A expressão na equação acima é a
média quadrada, desde que envolve a soma de termos quadráticos dividida pelo grau de
liberdade. Como o número de graus de liberdade é 8 e a média quadrada 3, a soma dos
termos quadráticos é 3  8 = 24 .

Variação entre amostras


Se as amostras forem retiradas de uma população que apresenta uma variância σ02,
então as suas médias vêm de uma população com variância σ02 (como foi visto na
distribuição de médias amostradas). Assim, se a hipótese nula é verdadeira, a variância
das médias das amostras dá uma estimativa de σ02 / n. Da Tabela 9:

(101 − 98) 2 + (102 − 98) 2 + (97 − 98) 2 + (92 − 98) 2 62


var x s =  var x s =
4 −1 3

Assim, a estimativa de amostras de σ02 é:

62
 02 =  3   02 = 62
3

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


56

Essa estimativa tem três graus de liberdade, desde que ela foi calculada de quatro
médias de amostras. Observe que esta estimativa de σ02 não depende da variabilidade
dentro de cada amostra, pois ela é calculada de médias de amostras. Entretanto, se, por
exemplo, a média da amostra D for mudada, a estimativa σ02 também mudará. Em geral
tem-se (para σ02 entre amostras):

( xi − x )2
 02 = n (43)
i h −1

Que é, novamente, uma média quadrada envolvendo a soma dos termos


quadráticos dividida pelo número de graus de liberdade. Nesse caso, o número de graus
de liberdade é três e a média quadrada é 62 e, assim, a soma dos termos quadráticos é
3  82 = 186 .

Sumarizando o que foi feito até agora:

❖ Média quadrada dentro das amostras → 3 com 8 graus de liberdade.

❖ Média quadrada entre as amostras → 62 com 3 graus de liberdade.

Se a hipótese nula for correta, essas duas estimativas de σ02 não devem diferir
significativamente. Se ela for incorreta, a estimativa de σ02 entre amostras será muito
maior que a de dentro da amostra por causa das variações entre as amostras.

Para se testar se o valor é significativamente maior, um teste F mono-caudal pode


ser utilizado:

s12 62
F = 2  F3,8 = = 20,7
s2 3

É bom lembrar que cada média quadrada é usada, assim não é necessário mais
elevar ao quadrado.

O valor crítico de F é 4,066 (página 97) para P = 0,05.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


57

Como o valor calculado é maior que o valor crítico, a hipótese nula é rejeitada e a
diferença entre as médias é significativa.

Um resultado significante numa ANOVA mono-modal pode surgir por diferentes


razões: uma média pode diferir de todas as outras, todas as médias podem diferir entre si,
as médias podem cair em dois grupos distintos, etc.

Uma maneira simples de se decidir a razão para um resultado significante é


ordenar as médias por valor e comparar a diferença entre valores adjacentes com uma
quantidade chamada menor diferença significante. Essa quantidade é dada por:

2
𝑀𝐷𝑆 = 𝑠√𝑛 . 𝑡ℎ(𝑛−1) (43)

Onde s é a estimativa dentro da amostra de σ02 e h(n - 1) é o número de graus de


liberdade desta estimativa. Para o exemplo acima, as médias amostradas podem ser
ordenadas em ordem crescente de valor como: média (D) = 92, média (C) = 97, média
(A) = 101 e média (B) = 102. E a menor diferença significativa é dada por:

2
3  2,306( P = 0,05) = 3,26
3

Comparando esse valor com as diferenças entre as médias fica evidente que média
(D) e média (C) diferem significantemente uma da outra e da média (A) e média (B), mas
essas duas não diferem entre si, isso é, a exposição à luz é que afeta a fluorescência.

O método das menores diferenças significantes descrito acima não é inteiramente


rigoroso: pode-se mostrar que ele leva a diferenças significativas em excesso. Entretanto
é uma aproximação a ser usada quando ANOVA indicou uma diferença significante das
médias.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


58

A aritmética dos cálculos da ANOVA

Ao se usar ANOVA para comparar diferenças entre valores de médias, se a


hipótese nula mostrar-se verdadeira, σ02 também pode ser calculado numa terceira forma,
tratando os dados como uma amostra grande. Isso pode envolver a somatória dos
quadrados dos desvios padrões de todas as médias:

 ( x
i j
ij − x ) 2 = 4 2 + 2 2 + 3 2 + ... = 210

E dividir pelo número de graus de liberdade, 12 - 1 = 11. Esse método para se


estimar σ02 não é usado em análises porque a estimativa depende tanto das variações
dentro das amostras como entre as amostras. Entretanto, existe uma relação algébrica
exata entre esta variação total e as fontes de variações, que, principalmente nos cálculos
mais complicados de ANOVA, leva a uma simplificação da aritmética envolvida. Esta
relação é ilustrada na Tabela 115.

Os valores das variâncias totais, dados na última linha da Tabela 11, são as somas
dos valores nas duas primeiras linhas, tanto para os quadrados dos desvios padrões como
para os graus de liberdade. Esta propriedade aditiva se mantém para toda a discussão de
ANOVA feita no curso. Assim como no cálculo da variância, existem fórmulas que
simplificam os cálculos das somas dos quadrados.

Tabela 115. Sumário das somas dos quadrados e graus de liberdade.

Fonte de variação Soma dos quadrados Graus de liberdade


Entre amostras n ( xi − x ) = 186 2
h −1 = 3
i

Dentro da amostra  ( x
i j
ij − xi ) 2 = 24 h(n − 1) = 3

Total  ( x
i j
ij − x) 2 = 210 hn − 1 = 11
Essas fórmulas estão sintetizadas na

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


59

Tabela 126, que utiliza as notações abaixo e introduz os símbolos:

❖ Número total de medidas = N = nh.

❖ Soma de medidas na i-ésima amostra = Ti.

❖ Soma de todas as medidas, gran total = T.

Tabela 126. Fórmulas para cálculos de ANOVA mono-modal.

Fonte de variação Soma dos quadrados Graus de liberdade


2 2
Ti T
Entre amostras  i n

N
h −1
Dentro da amostra Por subtração Por subtração
2
T
Total  x
i j
2
ij −
N
N −1

O uso das fórmulas na

Tabela 126 pode ser ilustrado repetindo-se os cálculos de ANOVA para os dados
da Tabela 93.

Os cálculos das médias quadráticas são feitos na Tabela 137 e na

Tabela 148. Todos os valores da Tabela 93 foram subtraídos por um valor de 100,
o que simplifica muito os cálculos.

Foram feitas certas suposições ao se fazer os cálculos na Tabela 137 e na

Tabela 148, de ANOVA. A primeira é que a variância do erro aleatório não é


afetada pelo tratamento usado. Esta suposição está implícita na extrapolação das
variâncias de dentro das amostras para calcular uma estimativa total do erro das
variâncias. Ao se fazer isso, assume-se o que se conhece por homogeneidade de
variâncias. Em particular, no exemplo anterior, onde todas as medidas são feitas da
mesma maneira, pode-se esperar a homogeneidade das variâncias. Uma segunda
suposição é que a variação não controlada é aleatória. Fatores não controlados como, por

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


60

exemplo, a temperatura, podem exercer um efeito sistemático nos dados experimentais.


Técnicas para se livrar de tais perturbações serão discutidas mais à frente.

Tabela 137. Cálculos do exemplo (I).

Ti Ti2
A 2 0 1 3 9
B 1 1 4 6 36
C -3 -5 -1 -9 81
D -10 -8 -6 -24 576

T = −24 T i
i
2
= 702

n = 3, h = 4, N = 12,   xij2 = 258


i j

Tabela 148. Cálculos do exemplo (II).

Fonte de variação Soma dos quadrados Graus de liberdade Média quadrada


702 (−24) 2
186
Entre amostras − = 186 3 = 62
3 12 3
24
Dentro da amostra Por subtração = 24 8 =3
8
(−24) 2
Total 258 − = 210 11
12

Será visto que uma parte importante da ANOVA é a aplicação dos testes-F. O uso
desses testes é limitado para a comparação da variância de duas amostras e depende de
que as amostras sejam retiradas de uma população normal. Entretanto, por sorte, os testes-
F quando aplicados em ANOVA, não são tão sensíveis para desvios da normalidade.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


61

TESTE CHI-QUADRADO

Os testes de significância descritos até aqui têm, em geral, testado se a média de


várias medidas difere significativamente do valor proposto pela hipótese nula.

Os dados usados foram tomados na forma de observações que, por algum tipo de
arredondamento, foram medidos numa escala contínua. Em contraste, nessa parte da aula
a preocupação será com a frequência, isso é, o número de vezes que um evento ocorre.
Por exemplo, a

Tabela 4 dá a frequência com que os diferentes valores obtidos para concentrações


do íon nitrato quando são feitas 50 medidas em uma amostra.

Como já discutido anteriormente, tais medidas são assumidas como tiradas de uma
população que está normalmente distribuída.

O teste chi-quadrado pode ser usado para verificar se as frequências observadas


diferem significativamente daquelas que são esperadas nesta hipótese nula.

Os princípios do método chi-quadrado podem ser mais facilmente entendidos com


o seguinte exemplo:

Exemplo: O número de quebras de vidrarias relatado por quatro técnicos de


laboratórios, para um dado período, é:

Número de quebras: 24, 17, 11, 9.

Há alguma evidência de que os técnicos diferem em suas habilidades?

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


62

A hipótese nula adotada é que não há diferença nas habilidades dos quatro
técnicos. Assumindo que eles utilizaram a vidraria por um intervalo de tempo igual,
espera-se, pela hipótese nula, que cada um quebrou o mesmo número de vidros. Como o
total de quebra foi 61, espera-se que cada técnico quebrou 61 / 4 = 15,25 vidros. A questão
a ser respondida é se a diferença entre as frequências observadas e esperada é tão grande
que a hipótese nula deva ser rejeitada. Se existe alguma diferença entre os dois conjuntos
de dados de frequências pode ser mais facilmente observado considerando-se uma
sequência de lançamentos de dados.

Ficaríamos surpresos se em 30 lançamentos ocorresse exatamente o mesmo


número de 1, 2, 3, etc. O cálculo de chi-quadrado, χ2, a quantidade usada para testar a
significância da diferença, é mostrada na Tabela 19:

Tabela 19. Cálculo do teste chi-quadrado (do exemplo).

Frequência observada (O) Frequência esperada (E) O-E (O – E)2 / E


24 15,25 8,75 5,020
17 15,25 1,75 0,201
11 15,25 -4,25 1,184
9 15,25 -6,25 2,561
0,00 χ2 = 8,966

Observe que o total da coluna O - E é sempre zero assim podendo ser usada para
checar os cálculos. Se χ2 exceder um certo valor crítico, a hipótese nula deve ser rejeitada.

O valor crítico depende, como nos outros testes de significância, no nível de


significância do teste e nos graus de liberdade. O número de graus de liberdade é, nesse
exemplo, um a menos que o número de dados relatados pelos técnicos, ou seja, 4 - 1 = 3,
nesse caso. Os valores críticos de χ2 para P = 0,05 são dados na Tabela 150. Para 3 graus
de liberdade, o valor crítico é 7,81. Como o valor calculado de χ2 é maior que esse valor
crítico, a hipótese nula deve ser rejeitada.

Tabela 150. Valores críticos de χ2 para P = 0,05.

Nº de graus de liberdade Valor crítico


1 3,84
2 5,99
3 7,81
4 9,49
5 11,07
6 12,59
7 14,07

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


63

8 15,51
9 16,92
10 18,31

Há evidências de que os técnicos diferem em suas habilidades.

Nesse cálculo de χ2, parece que o resultado significante foi obtido pelo alto
número de quebras reportado pelo técnico número um. Para aprofundar esse estudo, testes
chi-quadrado adicionais devem ser feitos. Um desses testes analisa se o segundo, terceiro
e quarto técnicos diferem significantemente: nesse caso, a frequência esperada para cada
um será: (17 + 11 + 9) / 3.

Observe que um teste T não pode ser aplicado aqui, pois está se trabalhando com
frequências e não com valores contínuos.

Um outro teste verifica se o primeiro difere significantemente dos outros, tomados


como um grupo. Nesse caso, há duas classes: as quebras do primeiro técnico com uma
frequência esperada de 15,25 e o total das outras quebras, com frequência esperada de
15,25  3 = 45,75. Nesse caso, onde há apenas duas classes e, assim, apenas um grau de
liberdade, um ajuste, conhecido como correção de Yates, deve ser feito. Isso envolve a
substituição de O - E por |O - E| - 0,5, por exemplo, -4,5 torna-se 4.

CONCLUSÕES SOBRE OS TESTES DE SIGNIFICÂNCIA

Essas últimas aulas foram concentradas em diferentes tipos de testes de


significância. Vamos agora analisar algumas conclusões a que se pode chegar após essas
discussões. Como já foi dito várias vezes, um teste de significância em nível de, por
exemplo, P = 0,05 envolve 5% de risco de uma hipótese nula ser rejeitada, mesmo se ela
for verdadeira. Esse tipo de erro é conhecido como erro tipo um: o risco desse tipo de erro
pode ser diminuído alterando o nível de significância para P = 0,01 ou mesmo P = 0,001.
Esse, entretanto, não é o único tipo de erro possível; também é possível reter uma hipótese
nula mesmo que ela seja falsa. Isso é chamado de erro tipo dois.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


64

Para se calcular a probabilidade de se cometer esse tipo de erro, é necessário


postular uma alternativa à hipótese nula, conhecida como uma hipótese alternativa.

Considere uma situação onde um certo produto químico deve conter 3% de fósforo
em massa. Suspeita-se que esta proporção aumentou e para testar isso sua composição
será analisada pelo método padrão com um desvio padrão conhecido de 0,03%. Suponha
que quatro medidas foram feitas e que um teste de significância foi conduzido em um
nível de P = 0,05. Foi necessário um teste mono-caudal, pois se estava interessado apenas
no aumento da concentração de fósforo. A hipótese nula considerada foi = μ = 3,0%.

A linha sólida na 8 mostra a distribuição de médias amostradas se a hipótese nula


for verdadeira. Esta distribuição de amostras tem média 3,0 e desvio padrão (isso é, erro
padrão da média) dado por:

Tipo 2 Tipo 1

x
3,00 3,05
xc

Figura 8. Erros tipo 1 e tipo 2.

Se a média da amostra cair acima do valor crítico indicado, x c , a hipótese nula é


rejeitada. Assim, a região preta, com área de 0,05, representa a probabilidade de um erro
tipo um.

Suponha que se toma uma hipótese alternativa μ = 3,05%.

A linha pontilhada da 8 mostra a distribuição da média amostrada se a hipótese


alternativa estiver correta. Mesmo nesse caso, a hipótese nula será mantida se o valor da
média for menor que x c .

A probabilidade desse erro tipo dois é representada pela área achurada. Essa figura
esclarece a inter dependência dos dois tipos de erros. Se, por exemplo, P for diminuído

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


65

para 0,01 para reduzir a chance do erro tipo um, x c aumentará e o risco de erro tipo dois

também. Da mesma maneira, a diminuição da probabilidade de erro tipo dois só pode ser
feita às custas de um aumento da probabilidade de erro tipo um.

A única maneira de diminuir ambos os riscos é pelo aumento da amostra.

O efeito de aumentar n para 9, por exemplo, é mostrado na Figura 9.

Tipo 2

Tipo 1

x
3,00 3,05
xc

Figura 9. Erros tipo um e tipo dois (2º exemplo).

A diminuição resultante no erro padrão das médias produz uma diminuição nos
dois tipos de erros, para um dado valor de x c . A probabilidade de uma hipótese nula falsa

ser rejeitada é conhecida como o poder de um teste. Isso é, o poder de um teste é (1 – a


probabilidade de um erro tipo dois). No exemplo acima, é uma função da média
especificada na hipótese alternativa, do tamanho da amostra, do nível de significância e
se o teste é mono ou bi-caudal.

Em algumas circunstâncias, quando são disponíveis dois ou mais testes para


avaliar a mesma hipótese, é útil comparar os poderes desses testes antes de escolher o
mais apropriado.

Erros do tipo um e dois são relevantes também quando testes de significância são
aplicados de maneira sequencial. Um exemplo dessa situação é a aplicação de teste-T
para a diferença entre duas médias, após se utilizar um teste-F para decidir se as variâncias
das amostras podem ser associadas.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


66

Ambos os tipos de erros um e dois podem surgir do teste-F e a ocorrência de


qualquer tipo significará que os valores adotados de significância para o teste-T
subseqüente são incorretos, já que a forma incorreta de teste-T foi aplicada.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


67

CAPÍTULO 4

A QUALIDADE DAS MEDIDAS ANALÍTICAS

Os testes estatísticos descritos até aqui foram aplicados em situações mais simples
do que as encontradas em muitos laboratórios de análises. Assim, assume-se que não
havia nenhuma dificuldade ou erro envolvido em conseguir as amostras utilizadas nas
análises. Na prática, a amostragem causa problemas diretos nas análises.

As análises para boro em amostras de plantas podem ser complicadas se o nível


de boro variar em diferentes partes da planta, ou de uma planta para outra. Dois outros
problemas devem ser ressaltados. Existe o problema que ocorre quando o mesmo método
é aplicado em amostras similares em laboratórios diferentes.

Esse o problema de se aplicar análise estatística para medidas repetidas em


amostras que apresentam características que variam com o tempo, como os itens
sucessivos numa linha de montagem. Nessas situações, métodos convencionais de
estatística (testes para pontos fora da curva, testes-T, ANOVA, etc.) são aplicados a
situações muito importantes no desenvolvimento e aplicação de métodos analíticos.

Amostragem

Esse tópico é de fundamental importância, pois, a menos que para a etapa de


amostragem seja dada atenção cuidadosa, os métodos estatísticos discutidos aqui podem
tornar-se inválidos para a discussão dos resultados.

Um analista deve lidar com amostra, pois, na maioria dos casos, é impraticável ou
impossível analisar todo o objeto sob consideração. Por exemplo, não é praticável analisar
um tanque cheio de leite para determinar o teor de gordura e é impossível analisar toda a

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


68

água de um rio para se determinar poluentes. Além disso, muitos procedimentos analíticos
são destrutivos e assim não podem ser aplicados a um objeto de valor.

Para ilustrar alguns aspectos da amostragem, vamos considerar a situação onde se


tem uma batelada de tabletes e quer-se obter uma estimativa para o peso médio de um
tablete. Em vez de pesar todos os tabletes, toma-se alguns deles (digamos dez) e pesa-se
um por um. Nesse exemplo a batelada de tabletes forma uma população e os tabletes
pesados formam uma amostra dessa população.

Se a amostra for usada para deduzir as propriedades da população, ela deve ser o
que é conhecido estatisticamente como uma amostra aleatória.

Essa é uma amostra tomada de uma maneira que todos os membros da população
têm a mesma chance de ser incluído. Apenas assim as equações utilizadas no tratamento
estatístico, por exemplo, para o cálculo do limite de confiança da média podem ser
utilizadas.

Apesar de, na prática o analista poder espalhar os tabletes na sua bancada e tentar
pegar uma amostra de dez ao acaso, esse método pode originar uma bias inconsciente. A
melhor maneira de se obter uma amostra aleatória é pelo uso de uma tabela de números
aleatórios.

A cada membro da população é dado um número, todos com o mesmo número de


dígitos, por exemplo, 001, 002, 003, etc. Números aleatórios são então lidos de uma tabela
de números aleatórios, começando em um valor arbitrário, por exemplo, 964, 173, etc.

A importância da aleatoriedade das amostras é evidente. No exemplo acima a


população é constituída de membros discretos, que são praticamente os mesmos, isso é,
tabletes. A amostragem de materiais que não são assim, como rochas, pós, gases e
líquidos é chamada de amostragem de volume (bulk).

Se o volume de material é perfeitamente homogêneo, então apenas uma pequena


porção, ou incremento de teste, é suficiente para definir suas propriedades.

Na prática, os volumes de materiais não são homogêneos por uma série de razões.
Materiais como minerais ou sedimentos consistem de partículas macroscópicas de várias

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


69

composições que não podem ser homogeneamente distribuídas no volume. Fluídos


podem ser não homogêneos numa escala molecular, devido a gradientes de concentração.

Tais não-homogeneidades só podem ser detectadas tomando-se uma amostra dos


incrementos de teste de diferentes partes do volume. Se possível isso deve ser feito de
forma aleatória, considerando o volume como uma coleção de pequenas células de igual
tamanho e usando uma tabela de números aleatórios como descrito acima. Da amostra
aleatória, a média, x , e a variância, s2, podem ser calculadas.

Há duas contribuições para s2: a variância da amostragem, σ12, devida às


diferenças entre os membros da amostra, por exemplo, peso dos tabletes e as variâncias
das medidas, σ02, devido aos erros aleatórios das pesagens de cada tablete. A seguir, se
descreverá como essas duas contribuições podem ser separadas e estimadas com a
ANOVA.

Para volumes a variância da amostra é dependente do tamanho do incremento


relativo à escala das não homogeneidades. Com o aumento do incremento, as não-
homogeneidades tendem a ser incluídas numa média e a variância diminui.

Separação e estimativa de variâncias usando ANOVA

Na aula passada o uso da ANOVA mono-modal foi descrito para testar a diferença
entre médias quando havia uma possível variação devido a um fator de efeito fixo. Agora
será considerada a situação onde existe um fator de efeito aleatório, ou seja, a variação da
amostragem.

A ANOVA mono-modal será utilizada não para testar se as médias variam


significativamente, mas para separar e estimar a diferença entre as fontes de variação. A
Tabela 161 mostra o resultado do teste de pureza do tambor de cloreto de sódio. Cinco
amostras de incrementos de teste, A - E, foram tomadas de diferentes partes do tambor,
escolhidas de modo aleatório e quatro análises foram feitas em cada amostra.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


70

Tabela 161. Teste de pureza de cloreto de sódio (do exemplo).

Amostra Pureza Média


A 98,8 98,7 98,9 98,8 98,8
B 99,3 98,7 98,8 99,2 99,0
C 98,3 98,5 98,8 98,8 98,6
D 98,0 97,7 97,4 97,3 97,6
E 99,3 99,4 99,9 99,4 99,5

Como já foi discutido, há duas possíveis fontes de variações: aquela devido aos
erros aleatórios nas medidas de pureza, dada pela variância calculada, σ02, e aquela devido
à variação real da pureza das amostras de cloreto de sódio em diferentes pontos do tambor,
dada pela variância das amostras, σ12.

Lembrar-se que média quadrada é igual a:

( xi − xi ) 2
 02 =  (47)
i j h(n − 1)

Como a média quadrada dentro das amostras não depende da média da amostra
(aula anterior), ela pode ser usada como uma estimativa de σ02. A média quadrada entre
as amostras não pode ser usada para estimar σ12 diretamente, pois a variação entre as
médias das amostras é causada por ambos, erros aleatórios de medidas e de pureza das
amostras. Entretanto, antes de uma estimativa da variância das médias quadradas das
amostras, σ12, for feita, é necessário conduzir um teste para verificar se ele difere
significativamente de zero. Isso é feito comparando-se as médias quadradas dentro e inter
amostras: se elas não diferirem significantemente, então σ12 = 0 e ambas médias
quadradas estimam σ02.

O cálculo das médias quadradas usando a fórmula dada na Tabela 16. Todos os
valores da Tabela 162 foram subtraídos de 98,5 para facilitar a aritmética (Tabela 173 e
Tabela 184). Como a média quadrada entre as amostras é maior que aquela dentro de cada
amostra, σ12 deve diferenciar significativamente de zero usando-se um teste-F para
comparar as duas médias quadradas tem-se:

1,96
F4,15 = = 30
0,0653

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


71

Tabela 173. Cálculos do exemplo (III).

Amostra Ti Ti2
A 0,3 0,2 0,4 0,3 1,2 1,44
B 0,8 0,2 0,3 0,7 2,0 4,00
C -0,2 0,0 0,3 0,3 0,4 0,16
D -0,5 -0,8 -1,1 -1,2 -3,6 12,96
E 0,8 0,9 1,4 0,9 4,0 16,00
T = 4,0 T  Ti 2 = 34,56
i

n=4
h=5
N = 20
 x
i j
2
ij = 9,62

Tabela 184. Cálculos do exemplo (IV).

Fonte de variação Soma dos quadrados Graus de liberdade Média quadrada


2
34,56 4,0 7,84
Entre amostras − = 7,84 4 = 1,96
4 20 4
0,98
Dentro da amostra Por subtração = 0,98 15 = 0,0653
15
4,0 2
Total 9,62 − = 8,82 19
20

O valor crítico de F, para P = 0,05 é 3,056. Como o valor calculado é muito maior,
σ12 difere significativamente de zero.

A média quadrada dentro das amostras dá 0,0653 como uma estimativa de σ02.
Como a média quadrada entre as amostras estima σ02 + nσ12 tem-se: estimativa de σ12 =
(médias quadradas entre amostras – dentro das amostras) / n = (1,96 - 0,0653) / 4 = 0,47,
que seria a variância das médias quadradas entre as amostras.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


72

CAPÍTULO 5

ERROS EM ANÁLISE INSTRUMENTAL: REGRESSÃO E


CORRELAÇÃO

A análise instrumental oferece a possibilidade de se experimentar um grande


intervalo de concentrações, ao invés de uma única amostra medida repetidas vezes. Isso
significa que os resultados obtidos são calculados e os erros aleatórios avaliados de uma
maneira diferente do que aqueles anteriormente discutidos. Vamos avaliar o
procedimento de obtenção de gráficos de calibração na análise instrumental.

O analista utiliza uma série de amostras (normalmente no mínimo três ou quatro,


mas frequentemente muito mais), nas quais a concentração do analito é conhecida. Esses
padrões de calibração são medidos no instrumento analítico sob as mesmas condições do
que aquelas a serem utilizadas para o teste da solução desconhecida. Uma vez que o
gráfico de calibração foi obtido, a concentração do analito em qualquer análise é obtida,
como mostrada na Figura 60, por interpolação.
Sinal

Concentração

Figura 60. Gráfico de calibração.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


73

Esse procedimento geral dá origem a uma série de importantes questões


estatísticas:

i. A curva de calibração é linear? Se ela for uma curva, qual é a sua forma?

ii. Considerando-se que cada ponto, na curva de calibração, é sujeito a erros,


qual é a melhor reta (ou curva) que passa por esses pontos?

iii. Assumindo que a curva de calibração é realmente linear, quais são os erros
estimados e os limites de confiança para a tangente e o intercepto desta
linha?

iv. Quando a curva de calibração for usada pelo analista numa determinação
de uma amostra, quais são os erros e limites de confiança para a
concentração encontrada?

v. Qual é o limite de detecção do método? Isto é, qual é a menor concentração


do analito que pode ser detectada com um nível de confiança pré-
determinado?

Antes de se dedicar a essas questões, é necessário considerar alguns aspectos de


se graficar curvas de calibração.

Inicialmente, é normalmente essencial que os padrões de calibração cubram todo


o intervalo de concentrações requerido para a análise posterior. Com a importante exceção
do “método de adição de padrão”, que será tratado separadamente mais adiante,
concentrações das amostras são normalmente determinadas por interpolação, e não por
extrapolação. Além disso, é de importância crucial incluir o valor para uma amostra do
branco na curva de calibração. O branco não contém qualquer quantidade de analito
deliberadamente adicionado, mas contém os mesmos solventes, reagentes, etc., do que as
outras amostras e é sujeito exatamente ao mesmo procedimento analítico que as amostras.

O sinal do instrumento lido para a amostra do branco muitas vezes não será zero.
Ele é, naturalmente, sujeito a erros, como todos os outros pontos da curva de calibração
sendo, portanto, errado, a princípio, subtrair o valor do branco dos outros valores dos
padrões, antes de plotar a curva de calibração. Finalmente, deve-se notar que a curva de

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


74

calibração deve ser plotada sempre com a resposta do instrumento na vertical (y) e com
as concentrações dos padrões na horizontal (x).

Isso é porque os procedimentos a serem descritos adiante assumem que todos os


erros estão na direção y e que as concentrações padrão (valores de x) estão livres de erros.

COEFICIENTE DE CORRELAÇÃO PRODUTO-MOMENTO

Nessa parte será discutido o primeiro dos problemas listados anteriormente – a


curva de calibração é linear? Será assumido que um gráfico linear satisfaz a equação
algébrica:

y = ax + b (44)

Onde b é a tangente da linha e a o intercepto no eixo y. Os pontos individuais nesta


linha serão chamados de (x1, y1), (normalmente a leitura do branco), (x2, y2), (x3, y3) →
(xi, yi) → (xn, yn), isso é, há n pontos juntos.

A média dos valores de x é, como usual, chamada x , e a média dos valores de y


é y , a posição ( x , y ) , é conhecida como o “centróide” de todos os pontos.

Para se estimar quão bem os pontos experimentais se ajustam em uma linha reta,
nós calculamos o coeficiente de correlação produto-momento, r.

Esse parâmetro estatístico é conhecido simplesmente como “coeficiente de


correlação” porque em ciências quantitativas ele é, de longe, o mais comum. Entretanto,
outros tipos de coeficiente de correlação serão vistos mais adiante.

O valor de r é dado por:

 ( x i − x )( yi − y )
r= i
1
(45)
 2  2 
2
   ( xi − x )    ( y i − y )  
 i  i 

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


75

Uma observação cuidadosa dessa equação mostra que r pode variar no intervalo
entre − 1  r  +1 . Como mostrado na Figura abaixo, um valor de r = -1 descreve uma
correlação negativa perfeita, isso é, todos os pontos experimentais caem numa linha reta
com tangente negativa.

r=1

r = -1

r=0

0 x

Figura 71. Correlações.

Da mesma maneira, quando r = + 1, tem-se uma perfeita correlação positiva, todos


os pontos sobre uma linha com tangente positiva.

Quando não há correlação entre x e y, o valor de r é zero. Na prática analítica,


gráficos de calibração dão, na maioria das vezes, valores de r maior que 0,99, sendo
incomum valores de r menores que 0,90.

Um exemplo típico de cálculo de r ilustra alguns pontos importantes: soluções


padrão aquosas de fluoresceína foram examinadas em um espectrômetro de fluorescência,
e as intensidades são dadas na Tabela 25.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


76

Tabela 25. Intensidade na fluorescência do composto fluoresceína (do exemplo).

Intensidade Concentração (pg mL-1)


0 2,1
2 5,0
4 9,0
6 12,6
8 17,3
10 21,0
12 24,7

Determinar o coeficiente de correlação r.

Na prática, esse cálculo será feito em uma calculadora programável ou um


computador, mas é ilustrativo examinar como fazê-lo na mão. Os dados são apresentados
na Tabela 26.

Tabela 26. Determinação do coeficiente de correlação r (cálculos do exemplo).

xi yi xi − x ( xi − x ) 2 yi − y ( yi − y ) 2 ( xi − x )( y i − y )
0 2,1 -6 36 -11,0 121,00 66,0
2 5,0 -4 16 -8,1 65,61 32,4
4 9,0 -2 4 -4,1 16,81 8,2
6 12,6 0 0 -0,5 0,25 0
8 17,3 2 4 4,2 17,64 8,4
10 21,0 4 16 7,9 62,41 31,6
12 24,7 6 36 11,6 134,56 69,6
42 91,7 0 112 0 418,56 212,2

42
x= =6
7
91,7
y= = 13,1
7

Os números da Tabela 26 representam as somas dos números nas respectivas


colunas. Observar que  (x
i
i − x) e (y
i
i − y ) são ambas iguais a zero.

Usando os totais juntamente com a equação anterior, tem-se:

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


77

216,2 216,2
r= = = 0,9989
(112 418,28) 2 1
216,44

Duas observações importantes desse exemplo. Como mostrado na Figura 8, apesar


de alguns pontos estarem visivelmente fora da melhor reta (que foi obtida com o
procedimento a ser discutido mais adiante), o valor de r é muito próximo de um.

A experiência mostra que mesmo curvas de calibração bem dispersa podem gerar
altos valores de r.

25

20
Fluorescência

15

10
média (x,y)

Y=A+B*X
5 A = 1,51786
B = 1,93036
R = 0,99888
0
0 2 4 6 8 10 12
-1
Concentração (pg mL )

Figura 82. Curva de calibração do composto fluoresceína (do exemplo).

Assim, é muito importante trabalhar com o número adequado de casas decimais.


No exemplo acima, se desprezar as casas depois da vírgula, obter-se-ia o obviamente
incorreto valor de r = 1.

Apesar do fato de que os coeficientes de correlação poderem ser facilmente


calculados, eles são ainda mais facilmente mal interpretados. Deve-se sempre lembrar
que o uso da equação acima originará valores de r mesmo se os dados forem obviamente
não lineares. A Figura mostra dois casos onde os cálculos de r foram tomados de forma

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


78

errônea. Na Figura 13 (A), os pontos da curva de calibração caem claramente em uma


curva.

y 5
A
4

1
r = 0,986
5
B r=0
4

0 1 2 3 4 5 x

Figura 13. Curvas de calibração.

Essa curva é suficientemente suave para originar um valor de r bastante elevado,


se utilizada a equação acima.

A lição a ser tirada desse exemplo é que a curva de calibração deve sempre ser
construída (ou num papel milimetrado ou no computador). De outra maneira, uma relação
linear pode ser assumida de maneira errônea com o resultado de r obtido simplesmente
da equação dada. A Figura 13 (B) mostra que um coeficiente de correlação zero não
significa que x e y não possuam qualquer relação, apenas que esta relação não é linear.

Como se pôde ver, valores de r obtidos na análise instrumental são normalmente


bastante elevados, assim um valor calculado, juntamente com o gráfico da curva de
calibração, é muitas vezes suficiente para assegurar ao analista que ele obteve uma relação
linear útil.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


79

Em algumas circunstâncias, entretanto, valores de r muito menores são obtidos.


Nesse caso, será necessário usar um teste estatístico adequado para ver se o coeficiente
de correlação ainda é significante, observando sempre o número de pares de pontos
obtidos na medida. O método mais simples para se fazer isso é calcular um valor de t, a
partir de um teste de t, usando a equação:

r (n − 2)
t=
(1 − r ) 2
(54)

O valor calculado de t é comparado com o valor tabelado no nível de significância


desejado, usando um teste t bi-caudal e (n - 2) graus de liberdade. A hipótese nula, nesse
caso, é de que não há correlação entre x e y.

Se o valor calculado de t for maior que o valor tabelado, a hipótese nula deve ser
rejeitada, isso é, conclui-se que, nesse caso, uma correlação significante existe.

A LINHA DE REGRESSÃO DE Y EM X

Assumindo que existe uma correlação linear entre o sinal analítico y e a


concentração x, e mostrar como calcular a melhor linha reta entre os pontos da curva de
calibração, cada um dos quais está sujeito a um erro experimental.

Como já foi assumido que todos os erros estão no eixo y, procura-se agora uma
reta que minimize os desvios na direção y entre os dados experimentais e a reta calculada.
Como alguns desses desvios (conhecidos tecnicamente como os resíduos y) serão
positivos e outros negativos, é conveniente tentar minimizar a soma dos quadrados desses
resíduos. Isso explica o uso frequente do termo “método dos mínimos quadrados” para
esse procedimento.

A linha reta requerida é calculada com base nesse princípio, assim, como
resultado, é encontrado que a linha deve passar através do “centróide” dos pontos ( x , y )
. Pode-se mostrar que:

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


80

 (x − x )( y − y )
i i
b= i

 (x − x )
i
i
2
(46)

a = y − bx

A linha calculada desta maneira é conhecida como curva de regressão de y em x,


isso é, a curva indicando como y varia quando x é colocado nos valores escolhidos.

É muito importante perceber que a curva de regressão de x em y não é a mesma


curva (exceto no altamente improvável caso em que todos os pontos estejam exatamente
sobre a reta e r = 1).

A linha de regressão de x em y (que também passa pelo centróide) assume que


todos os erros ocorrem na direção x.

Se mantivermos com rigidez a proposta que o sinal analítico deve ser plotado
sempre no eixo y e a concentração no eixo x, será sempre a curva de regressão de y em x
que será usada nos experimentos de calibração. Exemplo: calcule a tangente e o intercepto
da curva de regressão para os dados do exemplo anterior (Tabela 25 e Tabela 26).

No exemplo anterior calculou-se que, para esta curva de calibração:

 (x
i
i − x )( y i − y ) = 216,2

 (x − x ) = 112
2
i
i

x = 6; y = 13,1

Usando-se as equações acima se calcula que:

216,2
b= = 1,93
112
a = 13,1 − (1,93  6) = 13,1 − 11,58 = 1,52

Assim, a equação para a reta da regressão linear será:

y = 1,93x + 1,52

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


81

Os resultados dos cálculos de tangente e intercepto foram mostrados na Figura


813.

Novamente é importante enfatizar que essas equações não devem ser utilizadas
erroneamente. Elas apenas darão resultados úteis quando um estudo prévio (cálculo de r
e gráfico visual) tiver indicado que uma relação linear é realmente válida para o
experimento em questão. Métodos não paramétricos (isso é, métodos que não fazem
assunção prévia sobre a natureza da distribuição de erros) podem também ser utilizados
para calcular as curvas de regressão e serão discutidos em aulas futuras.

ERROS NA TANGENTE E NO INTERCEPTO DA CURVA DE REGRESSÃO

A curva de regressão calculada na secção anterior será utilizada, na prática, para


estimar as concentrações de amostras de teste por interpolações, e, às vezes, para estimar
o limite de detecção do procedimento analítico. Os erros aleatórios nos valores para a
tangente e intercepto são, assim, importantes e as equações usadas para calculá-los serão
consideradas. Deve-se inicialmente calcular a estatística sy/x que é dada por:

1
  ( yi − yˆ )2  2
 
sy = i  (47)
x
 n−2 
 

Esta equação utiliza os residuais de y, onde são os pontos na curva de regressão


calculada que correspondem aos valores individuais de x, isso é, os valores ajustados de
y. Esses pontos são mostrados na Figura 14.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


82

y x5 , y 5 x6 , yˆ 6
x5 , yˆ 5 x6 , y 6

x3 , y 3 x4 , yˆ 4
x3 , yˆ 3 x4 , y 4

x1 , y1 x2 , yˆ 2
x1 , yˆ1 x2 , y 2

Figura 14. Valores ajustados de y.

O valor de ŷ para um dado x é facilmente calculado com a equação da regressão.


A equação abaixo:

1
  ( yi − yˆ ) 2
 2
 
sy = i  (48)
x
 n−2 
 

É claramente semelhante em forma à equação para o desvio padrão de um


conjunto de medidas repetidas.

 (x − x ) i
2

s= i
(49)
n −1

Numa regressão linear, o número de graus de liberdade é (n - 2), o que reflete a


consideração óbvia de que apenas uma linha reta pode ser desenhada passando por dois
pontos.

Armado com um valor para sy/x pode-se agora calcular sb e sa, os desvios padrões
para a tangente (b) e o intercepto (a). Eles são dados por:

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


83

sy
sb = x
1
 2
 ( xi − x ) 
2

 i 
1


(50)
 xi2 2
 
sa = s y  i
2
x n  ( xi − x )
 
 i 

Os valores de sb e sa podem ser utilizados de maneira usual para estimar os limites


de confiança para a tangente e o intercepto. Assim, os limites de confiança para a tangente
são dados por:

b  t  sb (51)

Onde o valor de t é tomado no nível de confiança desejado e (n - 2) graus de


liberdade. De maneira similar, os limites de confiança para o intercepto são dados por:

a  t  sa (52)

Exemplo: calcular os desvios padrões e intervalos de confiança para a tangente e


intercepto da curva de regressão calculada anteriormente.

A partir da Tabela e usando as equações acima:

1
 0,9368 2
sy =   = 0,4329
x  5 
Anteriormente, já foi visto que:

 (x
i
i − x ) = 112
2

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


84

E, assim a equação:

sy
sb = x
1
(53)
 2
 ( xi − x ) 
2

 i 

Pode ser usada para mostrar que:

0,4329 0,4329
sb = = = 0,0409
112 10,58

O valor de t para (n - 2) = 5 e 95% de nível de confiança é 2,57 (valor tabelado).


Assim, para um nível de confiança de 95% os limites de confiança para b são:

b = 1,93  2,57  0,0409 = 1,93  0,11

A utilização da equação para o desvio padrão do intercepto:

1
 x  2 2
 
i
sa = s y  i
2
x n  ( xi − x )
(54)
 
 i 

Requer o conhecimento do valor de x i


2
i , 364. Assim:

364
s a = 0,4329 = 0,2950
784

E os limites de confiança são:

a = 1,52  2,57  0,2950 = 1,52  0,76

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


85

CÁLCULOS DE UMA CONCENTRAÇÃO


Uma vez que a tangente e o intercepto de uma curva de regressão tenham sido
determinados, é simples calcular um valor de x correspondente a qualquer valor medido
de y. Um problema mais complexo surge quando é necessário estimar o erro numa
concentração calculada com a curva de regressão.

O cálculo de qualquer valor de x envolve o uso tanto da tangente (b) como do


intercepto (a) e, como foi visto no item anterior, ambos são sujeitos a erros. Como
resultado, a determinação do erro no valor de x é extremamente complexa e muitos
analistas preferem usar uma fórmula aproximada:

sy   2

s xo = x  1 ( yo − y ) 
2

1 + + 
b  n b 2  ( xi − x )2 
(55)
 i 

Nessa equação, yo é o valor experimental de y, a partir do qual o valor de


concentração xo deverá ser determinado, sxo é o desvio padrão estimado de xo e os outros
símbolos retêm os seus significados normais.

No caso do analista ter que fazer várias leituras de yo, por exemplo, se houver m
leituras, então a equação acima deve ser modificada para:

sy  2
1 1 (y − y) 
s xo = x  + + 2 o
2


b  m n b  ( xi − x )2 
(56)
 i 

Como sempre, os limites de confiança podem ser calculados como: xo = t  s xo n

– 2 graus de liberdade. Exemplo: usando os dados extraídos dos exemplos acima,


determinar os valores de xo e sxo e os limites de confiança de xo para soluções com
intensidades de fluorescência de 2,9, 13,5 e 23,0 ua. Os valores de xo são facilmente
calculados utilizando a equação da regressão determinada anteriormente, y = 1,93x +
1,52. Substituindo os respectivos valores de yo, 2,9, 13,5 e 23,0, obtemos os valores de xo

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


86

como sendo: 0,72, 6,21 e 11,13 pg mL-1, respectivamente. Para obter os valores de sxo
correspondentes a esses valores de xo, usa-se a equação:

1
sy  
( yo − y ) 
2
x 
2
1
sxo = 1 + + 
b  n b 2  (xi − x )2  (57)
 i 

Recordando dos itens anteriores que n = 7, b = 1,93, sy/x = 0,4329, = 13,1 e também
que a  (x
i
i − x ) = 112 . Os valores de yo de 2,9; 13,5 e 23,0 geram os valores de sxo de
2

0,26; 0,24 e 0,26, respectivamente. Os intervalos de confiança correspondentes, a 95%, (t


= 2,57) são 0,72 ± 0,68; 6,21 ± 0,62 e 11,13 ± 0,68 pg mL-1, respectivamente.

Esse exemplo ilustra um ponto de importância. É aparente que os limites de


confiança são menores (isso é, melhores) para o resultado de yo = 13,5 do que para os
outros dois.

Uma análise da equação acima confirma que quando yo aproxima do valor médio
y , o terceiro termo dentro do colchete tende a zero, e sxo aproxima-se do valor mínimo.
A forma geral dos limites de confiança para uma concentração calculada é mostrada na
Figura 15.
Sinal

( x, y)

Concentração

Figura 15. Forma geral dos limites de confiança para uma concentração.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


87

Na prática, entretanto, um experimento de calibração desse tipo dará um resultado


mais preciso quando o sinal medido do instrumento corresponder a um ponto próximo do
centróide da curva de regressão.

Se for desejado melhorar, isto é estreitar, os limites de confiança nesse


experimento de calibração, as equações de sxo mostram, pelo menos, duas possibilidades.
Pode-se aumentar n, o número de pontos da curva de calibração e também se pode fazer
mais medidas de yo, e usar o valor médio de m tais medidas, no cálculo de xo.

O resultado desses procedimentos pode ser previsto ao examinar os três termos


dentro dos colchetes nas duas equações. No exemplo anterior, o termo dominante nos três
cálculos é o primeiro, unidade. Segue-se que, nesse caso (e em muitos outros), uma
melhoria na precisão pode ser feita fazendo-se várias medidas de yo e usando a equação
que contém m. Se, por exemplo, o valor de yo de 13,5 tivesse sido calculado como a média
de quatro determinações, então o valor de sxo e os limites de confiança teriam sido 0,14 e
6,21 ± 0,36, respectivamente, ambos resultados indicando uma substancial melhora na
precisão.

Naturalmente, fazer muitas medidas repetidas (assumindo que existam amostras


suficientes) gera uma grande quantidade de trabalho para um benefício apenas moderado:
pode-se verificar que se foram feitas oito medidas de yo, então um valor de sxo de 0,12 e
limite de confiança de 6,21 ± 0,30 serão encontrados. O efeito de n, o número de pontos
da curva de calibração, é mais complexo de se calcular, pois se deve levar em conta a
variação concomitante do valor de t.

Os inconvenientes de um grande valor de n são equivalentes aos apontados para


m. Por outro lado, pequenos valores de n não são permitidos: nesses casos, não apenas 1
/ n será maior, mas o número de graus de liberdade, (n - 2) se tornará muito pequeno,
necessitando-se do uso de valores muito grandes de t para calcular-se, de maneira
adequada, dos limites de confiança.

Em muitos experimentos, assim como no exemplo dado, seis ou mais pontos de


calibração deverão ser adequados, com o analista ganhando uma maior precisão, se
necessário, fazendo experimentos repetidos para se determinar yo.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


88

CAPÍTULO 6

LIMITES DE DETECÇÃO
Uma das principais vantagens em se utilizar métodos instrumentais de análise
consiste na possibilidade de se detectar quantidades muito menores de analito do que os
métodos clássicos. Essa característica implica na possibilidade de se estabelecer a
importância de concentrações em nível de traços de muitos materiais, por exemplo em
amostras biológicas e ambientais. Assim foram desenvolvidas várias metodologias nas
quais os baixos limites de detecção são o principal critério de aplicação bem sucedida.

Dessa maneira, é evidente que os métodos estatísticos para obter e comparar os


limites de detecção são importantes. Em termos gerais, o limite de detecção de um analito
pode ser descrito como aquela concentração que dá um sinal (y) no instrumento
significantemente diferente do sinal do “branco” ou da “linha de base”. Torna-se
imediatamente aparente que essa definição dá ao analista uma grande liberdade para
decidir a definição exata de limite de detecção, baseado na definição adequada da frase
“significantemente diferente”.

Uma definição comumente usada na literatura de Química Analítica é que o limite


de detecção é a concentração do analito que dá um sinal igual ao sinal do branco, yB, mais
duas vezes o desvio padrão do branco, sB. Normas recentes de órgãos públicos
(principalmente americanos) indicam que esse critério deve ser:

y − y B = 3S B (58)

O significado desta última definição é ilustrado, com mais detalhes, na Figura 16.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


89

Limite de Limite de
yB
decisão detecção

A B C

P Q

SB y

3SB

Figura 16. Limite de detecção.

Um analista que estuda as concentrações no nível de traços se confronta com dois


problemas: ele não quer reivindicar a presença de um analito que está ausente, mas ele
também não quer reportar a ausência do analito que, de fato, está presente. A possibilidade
de qualquer desses erros deve ser minimizada por uma definição precisa de limite de
detecção.

Na Figura 16, a curva A representa a distribuição normal dos valores medidos do


sinal do branco. É possível identificar um ponto, y = P, além do limite superior dessa
distribuição, e assumir que um sinal maior que esse é improvável que pertença ao branco,
enquanto que um sinal menor que P deve ser assumido como sendo do branco. Entretanto,
para uma amostra dando um sinal médio P, 50% do sinal observado será menor que P,
desde que o sinal tenha uma distribuição normal. A probabilidade de se concluir que essa
amostra não difere do branco, quando ela de fato difere, é, assim, 50%.

O ponto P, que tem sido chamado de limite de decisão é, assim, insatisfatório


como limite de detecção, pois ele pode resolver o primeiro dos problemas citados acima,
mas não o segundo.

Um ponto mais adequado situa-se em y = Q (Figura 16), pois Q está duas vezes
mais afastado de yB que P. Pode-se mostrar que, se yB - Q for 3,28 vezes o desvio padrão
do branco, sB, então a probabilidade de cada um dos dois erros acontecerem (indicada
pela área achurada da Figura 16) é de apenas 5%. Se, como sugerido na Figura 16, a

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


90

distância for de 3sB, a probabilidade de ambos os erros será de cerca de 7%. Muitos
analistas consideram esta como sendo uma boa definição de limite de detecção.

Deve ser enfatizado que essa definição é bastante arbitrária e que ainda está
inteiramente aberto para um analista propor uma outra definição alternativa para um
propósito particular. Por exemplo, pode haver ocasiões onde um analista está ansioso para
evitar, a todo custo, a possibilidade de reportar a ausência de um analito quando ele, de
fato, estiver presente, mas está relativamente despreocupado com o erro oposto.

Torna-se claro que, sempre que o termo limite de detecção for citado em um
artigo, a definição usada deve ser também citada.

Algumas tentativas foram feitas de se definir um limite posterior, chamado de


limite de quantificação (ou limite de determinação) como o menor limite para uma medida
quantitativa precisa, em oposição à detecção qualitativa.

Um valor de yB + 10 sB foi sugerido para esse limite, mas seu uso ainda é bastante
restrito na prática. Devem-se agora discutir como os termos yB e sB são obtidos na prática,
quando uma reta de regressão convencional for usada para a calibração, como descrito na
aula passada.

Um requisito fundamental do método de mínimos quadrados não ponderado que


se tem estudado é que cada ponto no gráfico (incluindo o ponto do branco) tem uma
variação de erros normalmente distribuída (apenas na direção y) com um desvio padrão
estimado como sy/x. Esta é a justificativa de termos desenhado curvas de distribuição
normal com a mesma largura na Figura 16. Assim, é apropriado utilizar sy/x ao invés de
sB na estimativa do limite de detecção.

Logicamente é possível fazer vários experimentos do branco e obter valores


independentes para o sB. Isso, entretanto, é um desperdício de tempo e o uso do yy/x é bem
adequado na prática.

O valor de a, o intercepto calculado pela regressão, pode ser utilizado como uma
estimativa do valor de yB, o sinal do branco, ele deve ser uma estimativa mais precisa de
yB do que o único valor medido do branco, y1.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


91

Exemplo: estimar o limite de detecção para a determinação da fluoresceína


estudada na aula anterior.

Usa-se a equação y - yB = 3 sB com o valor de yB (= a) e sB (= sy/x) calculado


previamente. O valor de y no limite de detecção é encontrado como sendo 1,52 + (3)
0,4329, isso é, 2,82.

Usando-se a equação da regressão calcula-se um limite de detecção de 0,67 pg


mL-1. A Figura 17 sumariza todos os procedimentos adotados no cálculo do limite de
detecção da fluoresceína.

sy/x = sb = 0,433
25
-1
LOD = 0,67 pg mL
sx0 = 0,25
20
Fluorescência

15

10
média (x,y)

Y=A+B*X
5 A = 1,51786
yB + 3sB
B = 1,93036
LOD
0
R = 0,99888
0 2 4 6 8 10 12
-1
Concentração (pg mL )

Figura 17. Gráfico de regressão mostrando o LOD da fluoresceína (do exemplo).

É muito importante evitar confundir o limite de detecção de uma técnica com sua
sensibilidade. Esta fonte de confusão muito comum se origina, provavelmente, do fato de
não haver uma palavra apropriada que demonstre que uma técnica tem um “baixo limite
de detecção”.

A palavra sensibilidade é usada nesse caso, gerando ambigüidade.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


92

A sensibilidade de uma técnica é corretamente definida como a tangente da curva


de calibração e, desde que a curva seja linear, pode ser medida em qualquer ponto dele.

O MÉTODO DAS ADIÇÕES PADRÃO

Suponha que um analista deseja determinar prata em amostras de resíduos de


revelação de filmes por absorção atômica. Usando os métodos discutidos anteriormente,
ele pode calibrar o espectrômetro com uma solução aquosa de um sal de prata puro e usar
a curva de calibração na determinação de prata nas amostras de teste. Entretanto, esse
método só será válido se a solução pura de sais de prata gerar o mesmo sinal de absorção
do que o resíduo fotográfico com a mesma concentração de prata. Em outras palavras,
usando soluções puras para estabelecer a curva de calibração, assume-se que não existe o
“efeito de matriz”, isso é, redução ou aumento do sinal obtido pelos outros componentes
da solução.

Em muitas áreas, esta proposição frequentemente não é válida. Efeitos de matriz


ocorrem até com métodos como espectrometria de plasma, que tem a reputação de ser
insensível para interferentes. Uma possível solução para esse problema é tomar uma
amostra do resíduo fotográfico que é similar à amostra teste, porém não contenha prata,
e adicionar quantidades conhecidas de sal de prata para fazer as soluções padrões. A curva
de calibração será então construída usando uma matriz aparentemente adequada. Em
muitos casos, entretanto, essa aproximação é impraticável. Ela não eliminará efeitos de
matriz que diferem em magnitude de uma amostra para outra, e pode ser impossível obter
uma amostra da matriz que não contenha o analito. Por exemplo, obter uma amostra de
resíduos fotográficos que não contenha prata é improvável. Segue-se que todas as
medidas analíticas, incluindo o estabelecimento da curva de calibração, devem ser feitos
com a própria amostra. Isso é feito na prática usando o método das adições padrão. Esse
método tem sido largamente utilizado em absorção atômica e espectrometria de emissão
e também tem sua utilidade em eletroanálises e outras áreas.

Volumes iguais de solução da amostra são tomados e todos, menos um são


“contaminados” separadamente com quantidades conhecidas e diferentes do analito, e

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


93

todos são, então, diluídos para o mesmo volume. Os sinais do instrumento analítico são,
então, determinados para todas essas soluções e os resultados graficados como mostrado
na Figura 18.

Como usual, os sinais obtidos são plotados no eixo y, nesse caso o eixo x é
graduado em termos de quantidades de analito adicionadas (tanto como pesos absolutos
como concentrações).

Sinal da
amostra

Quantidade de Quantidade
analito em adicionada
amostra teste

Figura 18. Método das adições padrão.

A curva de regressão é calculada da maneira usual, mas dessa vez é feita uma
extrapolação até o ponto no eixo x correspondendo a y = 0. É evidente que esse intercepto
negativo no eixo x corresponde à quantidade de analito na amostra teste.

A análise da Figura 18 mostra que esse valor é dado por a / b, a relação entre o
intercepto e a tangente da curva de regressão. Como ambos, a e b são sujeitos a erros, o
valor calculado é também sujeito a erro, do mesmo modo. Nesse caso, a quantidade não
é predita por um valor único medido de y, assim a fórmula para o desvio padrão, sxE, do
valor extrapolado xE, não é a mesma daquela vista anteriormente, mas sim:

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


94

s y  2
2

1 y
s xE = x + 2 
b  n b  (xi − x )2  (59)
 i 

Aumentando o valor de n melhora, novamente, a precisão do valor estimado: em


geral, pelo menos seis pontos são necessários para um experimento de adição de padrão.
Além do mais, a precisão é aumentada maximizando-se o termo quadrático  (x
i
i − x) ,
2

de tal forma que as soluções para a confecção da curva de calibração devem, se possível,
cobrir um amplo intervalo.

Os limites de confiança para xE podem, como costume, serem determinados como


xE ± tsxE.

Exemplo: a concentração de prata em uma amostra de resíduos fotográficos foi


determinada por espectroscopia de absorção atômica com o método de adição de padrões
(Tabela 27).

Tabela 27. Dados de absorbância em amostra de resíduos fotográficos (do


exemplo).

Ag adicionada (μg mL-1) Absorbância


0 0,32
5 0,41
10 0,52
15 0,60
20 0,70
25 0,77
30 0,89

Determinar a concentração de prata na amostra e obter os limites de confiança a


95% para a concentração calculada. As equações:

 (x − x )( y − y )
i i
b= i

 (x − x )
i
i
2
(60)

a = y − bx

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


95

Dão um valor de a = 0,3218 e b = 0,0186. A relação entre esses dois valores dá a


concentração de prata na amostra de teste de 17,3 µg mL-1.

Os limites de confiança para esse resultado podem ser determinados com a ajuda
da equação:

s y  2


2
1 y
s xE = x + 2 
b  n b  (xi − x )2  (61)
 i 

Aqui, os valores de sy/x é 0,01094, é 0,6014 e  (x


i
i − x ) é 700. Assim, o valor
2

de sxE é igual a 0,749 e os limites de confiança são 17,3 ± 2,57 x 0,749, isso é, 17,3 ± 1,9
µg mL-1. Apesar de ser uma aproximação elegante para o problema do efeito de matriz,
o método da adição de padrões tem a suas desvantagens.

É difícil de se automatizar e pode utilizar maior quantidade de amostra do que os


outros métodos.

Em termos estatísticos, sua desvantagem principal está relacionada ao fato dele


ser um método de extrapolação, menos preciso do que as técnicas de interpolação.

No exemplo acima, é fácil mostrar que, se uma quantidade desconhecida de prata


for adicionada à amostra teste e fornecer um valor de absorbância de 0,65, a concentração
adicionada seria de 17,6 µg mL-1 com limites de confiança dados por 17,6 ± 1,6 µg mL-
1
. Esse resultado mostra apenas uma ligeira melhora do limite de confiança, devido ao
ponto de absorção estar mais próximo do valor médio da curva de calibração.

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


96

ANEXOS

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


97

ANEXO A: VALORES CRÍTICOS DE t

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


98

ANEXO B: VALORES CRÍTICOS DE F (P = 0,05)

Teste Monocaudal
υ1
1 2 3 4 5 6 7 8 9 10 12 15 20
υ2
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45
3 10,13 9,552 9,277 9,117 9,013 8,941 8,887 8,845 8,812 8,786 8,745 8,703 8,660
4 7,709 6,944 6,591 6,388 6,256 6,163 6,094 6,041 5,999 5,964 5,912 5,858 5,803
5 6,608 5,786 5,409 5,192 5,050 4,950 4,876 4,818 4,772 4,735 4,678 4,619 4,558
6 5,987 5,143 4,757 4,534 4,387 4,284 4,207 4,147 4,099 4,060 4,000 3,938 3,874
7 5,591 4,737 4,347 4,120 3,972 3,866 3,787 3,726 3,677 3,637 3,575 3,511 3,445
8 5,318 4,459 4,066 3,838 3,687 3,581 3,500 3,438 3,388 3,347 3,284 3,218 3,150
9 5,117 4,256 3,863 3,633 3,482 3,374 3,293 3,230 3,179 3,137 3,073 3,006 2,936
10 4,965 4,103 3,708 3,478 3,326 3,217 3,135 3,072 3,020 2,978 2,913 2,845 2,774
11 4,844 3,982 3,587 3,357 3,204 3,095 3,012 2,948 2,896 2,854 2,788 2,719 2,646
12 4,747 3,885 3,490 3,259 3,106 2,996 2,913 2,849 2,796 2,753 2,687 2,617 2,544
13 4,667 3,806 3,411 3,179 3,025 2,915 2,832 2,767 2,714 2,671 2,604 2,533 2,459
14 4,600 3,739 3,344 3,112 2,958 2,848 2,764 2,699 2,646 2,602 2,534 2,463 2,388
15 4,543 3,682 3,287 3,056 2,901 2,790 2,707 2,641 2,588 2,544 2,475 2,403 2,328
16 4,494 3,634 3,239 3,007 2,852 2,741 2,657 2,591 2,538 2,494 2,425 2,352 2,276
17 4,451 3,592 3,197 2,965 2,810 2,699 3,614 2,548 2,494 2,450 2,381 2,308 2,230
18 4,414 3,555 3,160 2,928 2,773 2,661 2,577 2,510 2,456 2,412 2,342 2,269 2,191
19 4,381 3,522 3,127 2,895 2,740 2,628 2,544 2,477 2,423 2,378 2,308 2,234 2,155
20 4,351 3,493 3,098 2,866 2,711 2,599 2,514 2,447 2,393 2,348 2,278 2,203 2,124

Teste Bicaudal
υ1
1 2 3 4 5 6 7 8 9 10 12 15 20
υ2
1 647,8 799,5 864,2 899,6 921,8 937,1 948,2 956,7 963,3 968,6 976,7 984,9 993,1
2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,43 39,45
3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 14,17
4 12,22 10,65 9,979 9,605 9,364 9,197 9,074 8,980 8,905 8,844 8,751 8,657 8,560
5 10,01 8,434 7,764 7,388 7,146 6,978 6,853 6,757 6,681 6,619 6,525 6,428 6,329
6 8,813 7,260 6,599 6,227 5,988 5,820 5,695 5,600 5,523 5,461 5,366 5,269 5,168
7 8,073 6,542 5,890 5,523 5,285 5,119 4,995 4,899 4,823 4,761 4,666 4,568 4,467
8 7,571 6,059 5416 5,053 4,817 4,652 4,529 4,433 4,357 4,295 4,200 4,101 3,999
9 7,209 5,715 5,078 4,718 4,484 4,320 4,197 4,102 4,026 3,964 3,868 3,769 3,667
10 6,937 5,456 4,826 4,468 4,236 4,072 3,950 3,855 3,779 3,717 3,621 3,522 3,419
11 6,724 5,256 4,630 4,275 4,044 3,881 3,759 3,664 3,588 3,526 3,430 3,330 3,226
12 6,554 5,096 4,474 4,121 3,891 3,728 3,607 3,512 3,436 3,374 3,277 3,177 3,073
13 6,414 4,965 4,347 3,996 3,767 3,604 3,483 3,388 3,312 3,250 3,153 3,053 2,948
14 6,298 4,857 4,242 3,892 3,663 3,501 3,380 3,285 3,209 3,147 3,050 2,949 2,844
15 6,200 4,765 4,153 3,804 3,576 3,415 3,293 3,199 3,123 3,060 2,963 2,862 2,756
16 6,115 4,687 4,077 3,729 3,502 3,341 3,219 3,125 3,049 2,986 2,889 2,788 2,681
17 6,042 4,619 4,011 3,665 3,438 3,277 3,156 3,061 2,985 2,922 2,825 2,723 2,616
18 5,978 4,560 3,954 3,608 3,382 3,221 3,100 3,005 2,929 2,866 2,769 2,667 2,559
19 5,922 4,508 3,903 3,559 3,333 3,172 3,051 2,956 2,880 2,817 2,720 2,617 2,509
20 5,871 4,461 3,859 3,515 3,289 3,128 3,007 2,913 2,837 2,774 2,676 2,573 2,464

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA


99

ANEXO C: VALORES CRÍTICOS DE GRUBB


(P = 0,05, BICAUDAL)

MÉTODOS ESTATÍSTICOS PARA QUÍMICA ANALÍTICA

Você também pode gostar