QUI0610 - Parte 4
QUI0610 - Parte 4
QUI0610 - Parte 4
QUÍMICA
PARTE 4
# Emissão:
(0.002, 0.15, 0.249, 0.434, 0.57, 0.704)
I
# [Na](mg kg-1):
x=c(0,2,4,6,8,10)
# Absorbância:
y=c(0.002,0.15,0.249,0.434,0.57,0.704)
plot(x,y, main="Regressão Linear", xlab = "[Na](mg kg-1)",
ylab = “I“)
COVARIÂNCIA E CORRELAÇÃO
PODEMOS OBTER UMA MEDIDA NUMÉRICA DA COVARIÂNCIA A PARTIR DOS
RESULTADOS DOS DESVIOS:
( xi x)( yi y)
COVARIÂNCIA – QUANDO DUAS VARIÁVEIS ALEATÓRIAS APRESENTAM UMA
TENDÊNCIA DE SE DESVIAREM DE FORMA PARECIDA.
COVARIAR = VARIAR JUNTO
# Basta digitar:
N
1
Cov( x, y )
N 1 i 1
( xi x)( yi y )
cov(x,y)
# Resultado no R:
[1] 0.991
ONDE
(xi , yi) = Valores das observações individuais do elemento i
(x , y) = Médias amostrais
N = Número de elementos da amostra
COVARIÂNCIA E CORRELAÇÃO
O problema é que o valor da covariância depende da escala de x
e y, como em nosso exemplo:
[Na+] entre 2 e 10 mg kg-1
Intensidade (I) entre 0.15 e 0.704
r = +1 r + 0,80 r0
Relação
perfeita 30 30 Relação
25 25 perfeita
20 20
15 15
10 10
r - 0,80 5 5 r=-1
0 0
0 5 10 0 5 10
MODELO DE REGRESSÃO LINEAR
Significado dos parâmetros
Y E (Y) = 0 + 1Xi
•
y
• •
• • x=1 1 yx
• •
0 X
x x+1 Variável
independente
Variável Inclinação
Intercepto
dependente populacional
populacional
MODELANDO NOSSOS DADOS (BIODIESEL)
Concentração de padrões de sódio (mg kg-1):
x (0, 2, 4, 6, 8, 10)
Absorbância:
y (0.002, 0.15, 0.249, 0.434, 0.57, 0.704)
ei
Para isso, localiza-se a reta onde a
soma dos quadrados dos resíduos
seja mínima!
𝑛𝑏0 + 𝑏1 𝑥𝑖 = 𝑦𝑖 𝑏0 𝑥𝑖 + 𝑏1 𝑥𝑖 2 = 𝑥𝑖𝑦𝑖
Isolando b0:
𝑦𝑖 − 𝑏1 𝑥𝑖
𝑏0 = = 𝑦 − 𝑏1𝑥 𝑦 − 𝑏1 𝑥 𝑥𝑖 + 𝑏1 𝑥𝑖 2 = 𝑥𝑖𝑦𝑖
𝑛
Intercepto Substituindo
(𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦) 𝑆𝑥𝑦
Isolando b1 e resolvendo: 𝑏1 = =
(𝑥𝑖 − 𝑥)2 𝑆𝑥𝑥
Inclinação
AJUSTE POR MÍNIMOS QUADRADOS OU
ANÁLISE POR REGRESSÃO
A equação linear pode ser obtida no R por meio da função:
lm() - Serve para calcular a regressão linear simples.
# Dados do exercício:
# [Na](mg kg-1):
x=c(0,2,4,6,8,10)
# I:
y=c(0.002,0.15,0.249,0.434,0.57,0.704)
A = lm(y ~ x)
A
I
# Digitando A
Coefficients:
(Intercept) x
-0.002429 0.070786
E SE EU QUISER COMPARAR 2 VARIÁVEIS ALEATÓRIAS
(X1 E X2) COM UMA VARIÁVEL ALEATÓRIA (Y)?
Ou
1 1
𝑦= 𝑦= (𝑎1𝑥1 + 𝑎2𝑥2 )
𝑁 𝑁
Ou seja
𝑦 = 𝑎1𝑥1 + 𝑎2𝑥 2
1 N
s
2
(a1 x1 a2 x2 a1 x1 a2 x2 ) 2 1 N
N 1 i 1
y
s
2
[a1 ( x1 x1 ) a2 ( x2 x2 )]2
N 1 i 1
y
1 N 2
s 1 1 1
2 2 2 2 2
a ( x x ) a ( x x ) 2 a a ( x x )( x x )]
N 1 i 1
y 2 2 2 1 2 1 1 2 2
1 N 2 2 1
N
2 1 N 2
s a1 1 1 2 N 1
1 1 2 2
2 2
( x x ) a ( x x ) 2 a a
1 2 ( x x )( x x )]
N 1 i 1 N 1 i 1
y 2 2
i 1
variância Coeficiente de
correlação
s y2 a1 s1 a2 s2 2a1a2 s1s2 r ( x1 , x2 )
2 2 2 2
COMBINAÇÕES LINEARES DE
VARIÁVEIS ALEATÓRIAS
Para uma combinação linear de p variáveis,
calculamos a média amostral e sua variância:
s y2 ai si 2 ai a j si s j r ( xi , x j )
2 2
𝑦= 𝑎𝑖 𝑥𝑖 i i j i
𝑖
Parâmetros populacionais de uma combinação
linear de variáveis aleatórias:
𝑖 = 𝑎𝑖 𝑖 y2 ai 2 i 2 2 ai a j i j r ( xi , x j )
i i j i
𝑖
INTERVALO DE CONFIANÇA
É uma faixa de possíveis valores em torno da média amostral, e
a probabilidade de que esta faixa realmente contenha o valor
real da média da população
x z. x z.
N N
Aqui o Intervalo de Confiança depende de conhecer o desvio-padrão
populacional ()
Para grandes amostras isto não apresenta dificuldade especial, pois se
aplica o teorema do limite central.
INTERVALO DE CONFIANÇA
E quando o tamanho da amostra é menor que 30
(n<30) e o desvio padrão da população () é
desconhecido?
Distribuição t ou de Student
Em 1908, W.S. Gosset, um químico que trabalhava na
cervejaria Guinness e que usava o pseudônimo de
Student para assinar seus trabalhos, publicou a
dedução para isso
Distribuição t de
student com n = 3
s s
x t N 1. x t N 1.
N N
N 9,98
COMO DETERMINAR O TAMANHO DA AMOSTRA?
A partir de uma série histórica de extensão razoável, a diferença
entre a distribuição t e a distribuição normal deixa de ter importância
Situação comum em laboratórios
z.
2
N
L
Onde L é a precisão desejada, é o desvio-padrão e z é o ponto da
distribuição normal padrão para o nível de confiança escolhido.
N 8,64
COMO FAZER O CONTROLE ESTATÍSTICO DE
PROCESSOS
Após a implantação de um planta industrial, os operadores
continuam a acompanhar sistematicamente as características do
produto.
Ex: Fábrica de polímeros – Variável importante = VISCOSIDADE