Ajustando Datos Químicos Con Excel Un Tutorial
Ajustando Datos Químicos Con Excel Un Tutorial
Ajustando Datos Químicos Con Excel Un Tutorial
Qumica
educacin
www.educacionquimica.info
CMO SE CALCULA?
PALABRAS CLAVE
Excel;
Hojas de clculo;
Ajuste lineal;
Ajuste no lineal;
Estimacin de errores
KEYWORDS
Excel;
Spreadsheets;
Linear tting;
Nonlinear tting;
Error estimation
http://dx.doi.org/10.1016/j.eq.2015.09.009
0187-893X/Derechos Reservados 2015 Universidad Nacional Autnoma de Mxico, Facultad de Qumica. Este es un artculo de acceso
abierto distribuido bajo los trminos de la Licencia Creative Commons CC BY-NC-ND 4.0.
22
Introduccin
Metodologa y datos
En este tutorial se revisan las distintas opciones de clculo de regresin que ofrece Excel para la obtencin de
la ecuacin de ajuste mediante grcas, la herramienta
de regresin del men anlisis de datos, funciones del programa como estimacin lineal o logartmica y la herramienta
Solver. Adems, se indicar la forma de obtener los errores
de los parmetros estimados para este ltimo mtodo. El
tutorial se desarrolla a partir de los ejemplos propuestos en
la tabla 1:
S=
n
yi yi
2
(1)
Ejemplo 1. Calibracin con patrones para la determinacin directa de cobre en aguardientes de ans mediante
espectroscopia de absorcin atmica con atomizacin electrotrmica (Jurado, Martn, Pablos, Moreda y Bermejo,
2007). Estos datos se emplearn para revisar los procedimientos de ajuste mediante la macros de regresin lineal
de Excel y la funcin ESTIMACION.LINEAL.
Ejemplo 2. Datos de intensidad de uorescencia de rayos
X para la lnea K del hierro en muestras de acero recubiertas con distintos espesores de esta
no (Whiston, 1996).
Estos datos se pueden ajustar segn la ecuacin 2 y se usarn para revisar la funcin ESTIMACION.LOGARITMICA y el
ajuste denido por el usuario empleando Solver.
I = e
(2)
I = a 1 10bC
I=a
ln 10bC
(3)
(ln 10b)2 2 (ln 10b)3 3
C +
C
2!
3!
(4)
Vmax [S]
Km + [S]
(5)
Resultados
Procedimiento grco
El procedimiento grco de Excel permite realizar la representacin de los datos y, en algunos casos, ajustar un modelo
23
Ejemplo
Variable
Datos
1
Concentracin, C (g l )
Absorbancia, A
Espesor, (m)
Intensidad, I (cuentas s1 )
Concentracin, C (ng l1 )
Intensidad, I (u.r.l.)
Concentracin, [S] (mmol m3 )
Velocidad, V (nmol m2 s1 )
2
3
4
2.5, 5, 7.5, 10
0.03, 0.06, 0.086, 0.114
0.2, 0.5, 1.0, 2.0, 3.5, 5.0, 6.5, 8.5
155, 133, 109, 78, 49, 30, 18, 9
0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20
2.1, 5, 9, 12.6, 17.3, 21, 24.7, 28.4, 31, 32.9, 33.9
3.568, 7.213, 10.87, 14.44, 18.18, 21.93, 29.24, 36.65, 55.33, 109.8
1.42, 2.51, 3.51, 4.78, 5.4, 6.14, 7.72, 8.65, 9.96, 13.28
r2 = 1
yi yi
2
n
yi y
2
(6)
Opciones > Complementos, seleccionando la opcin Herramientas para anlisis. As se activa el complemento Anlisis
de datos del men Datos. Dicho complemento contiene,
entre otras herramientas, el anlisis de regresin, que es
aplicable solo a ajustes lineales. Al seleccionar Regresin,
se abre un formulario de entrada donde se introducen los
rangos en los que se encuentran los valores de x e y del
ejemplo 1. Este formulario presenta opciones adicionales
explicadas con detalle en una gua publicada en red por el
primer autor (Jurado, 2008), pero en este tutorial nos centramos en las opciones por defecto. Tras introducir los datos
y pulsar aceptar, se genera una hoja de resultados (g. 2)
con los valores del coeciente de correlacin, de determinacin y de correlacin ajustado, la varianza de residuales y
el nmero de puntos ajustados que se muestran en las celdas
B4, B5, B6, B7 y B8, respectivamente.
En el rango A10:F14 se tienen los resultados del
anlisis de varianza de regresin que calcula la probabilidad
(F12) de que la varianza de regresin (D12) sea estadsticamente mayor que la varianza de residuales (D13). Valores
bajos de probabilidad o muy altos de F (E12) implican un
mejor ajuste del modelo. Excel denomina a las varianzas
Promedio de los cuadrados. En las celdas B18 y B17 se
encuentran los valores de pendiente y ordenada en el origen,
con sus errores en las celdas C18 y C17, respectivamente.
Funcin ESTIMACION.LINEAL
Se trata de una herramienta muy potente para el anlisis de regresin lineal y polinmica. Es una frmula de las
denominadas matriciales, es decir, que ofrece sus resultados en un rango de celdas formado por las y columnas
adyacentes. Una vez obtenido el resultado de una frmula
matricial, no se puede cambiar una celda sin modicar
toda la matriz. Cualquier cambio en la frmula que afecte
a la matriz solo es efectivo si se pulsa al mismo tiempo
Ctrl + Shift + Enter.
Ajuste lineal
Para el ejemplo 1, partimos de una hoja con los valores
de concentracin en el rango A2:A5 y los de absorbancia
en B2:B5. Se selecciona el rango B12:C16, y desde el men
Frmulas se inserta la funcin ESTIMACION.LINEAL. En el formulario (g. 3) se introducen los rangos de entrada para y
(B2:B5) y para x (A2:A5). En el cuadro Constante se escribe
VERDADERO (o el nmero 1) para que la funcin calcule la
24
A 0,12
180
160
0,1
I, cuentas s1
140
A, u.a.
0,08
0,06
0,04
100
80
0,336x
y = 157,94e
R2 = 0,9993
60
40
y = 0,0111x + 0,003
R2 = 0,9993
0,02
120
20
0
0
10
12
C, g L1
40
35
10
14
12
V, nmol m2 s1
30
25
I, u.r.l.
, m
20
15
10
y = 0,0311x2 + 2,3285x + 0,8727
R2 = 0,9949
10
8
6
4
2
0
0
10
15
20
25
C, ng L1
20
40
60
80
100
120
[S], mmol m3
Figura 1 A) Ejemplo 1 ajustado a una lnea recta. B) Ejemplo 2 ajustado a una exponencial. C) Ejemplo 3 ajustado a un polinomio
de grado dos. D) Ejemplo 4. No admite ajustes adecuados con signicado qumico.
Figura 2
desviacin estndar de residuales (C14), valor del estadstico F (B15), grados de libertad (C15) y suma de cuadrados
de regresin (B16) y de residuales (C16).
Ajuste polinmico
Se emplean los datos del ejemplo 3, situando los valores
de intensidad uorescente en B2:B12 y las concentraciones en A2:A12. Se selecciona un rango de celdas vaco
de 5 las y 3 columnas, A16:C20, y se inserta la funcin
ESTIMACION.LINEAL. Para los valores de y se selecciona
Figura 3
Figura 4
25
Formulario de la funcin ESTIMACION.LINEAL y resultados para el ajuste a un polinomio de segundo grado (ejemplo 3).
26
Figura 5
en espa
nol (Espa
na) son siempre punto y coma, incluso para
los grados del polinomio.
Si se quisiese ajustar un polinomio de segundo grado
sin trmino de orden uno, para los valores de x se escribe
A2:A12{2}. De este modo se calcula solo el trmino cuadrtico y el independiente. Si se quiere obviar el trmino
independiente se introduce el valor FALSO, o nmero 0, en
el cuadro Constante.
Funcin ESTIMACION.LOGARITMICA
Esta funcin ajusta los datos a una funcin del tipo ecuacin 7, siendo aplicable solo para valores positivos de m
y b. Cualquier base m puede escribirse como el nmero e
elevado a una constante, con lo que puede aplicarse a los
datos del ejemplo 2 con y = I y x = . Se estima as el valor
e , obteniendo el valor de como ln(m).
y = b mx
(7)
yi para cada xi a partir de una funcin con unos parmetros de ajuste iniciales. Posteriormente se calculan los
residuales y su suma de cuadrados, y se emplea Solver para
minimizar esta suma variando los coecientes. Las versiones de Excel anteriores a 2010 disponen de 2 algoritmos
de optimizacin, el Simplex para problemas lineales y el
Generalized Reduced Gradient (GRG) para ajustes no lineales. La versin 2010 incluye un tercer mtodo, Evolutionary,
que permite trabajar con datos no suavizados en problemas no lineales (Billo, 2007). En este tutorial se emplea
GRG para resolver los ejemplos (2, 3 y 4) de regresin no
lineal.
La gura 6 muestra la hoja de clculo preparada para
ajustar la ecuacin 2 a los datos del ejemplo 2. Se disponen los datos de intensidad uorescente en el rango A2:A9
y el espesor de esta
no en B2:B9. En las celdas D19 y D20 se
introducen unos valores de partida para los parmetros y
, por ejemplo 155 y 0.4. Se escribe la frmula =$D$19*EXP
(-$D$20*A2) en la celda C2 y se copia en el rango C2:C9. El
smbolo $ se usa para que al copiar la frmula se mantengan
jas las celdas D19 y D20. En la celda D2 se calcula el residual
como =B2-C2 y se copia la frmula hasta la celda D9. En la
celda D14 introducimos la suma de cuadrados de residuales
(SCRes ) mediante la expresin =SUMA.CUADRADOS(D2:D9).
Finalmente se llama al complemento Solver desde el men
de datos.
Figura 6
27
Aspecto nal de la hoja de clculo para el ajuste de los datos del ejemplo 2 mediante Solver y clculo de errores.
i =
Pii1 SRes
(8)
SRes =
SCRes
Nk
(9)
N
f (xn ) f (xn )
n=1
ai
(10)
aj
(11)
2
n
f (x)
1
P=
n
f (x) f (x)
n
f (x) f (x)
f (x) 2
1
n
(12)
En la hoja de clculo la variacin de o se introduce en la celda E2. Debe utilizarse un valor peque
no, y
en principio el valor 106 parece razonable. En la columna
F se calculan los valores de I estimado para un valor
28
Tabla 2
Ejemplo
Parmetro
Solver
r2
a
b
r2
Vmax
Km
r2
160.8628
0.34995129
0.99708
63.2488
0.01759
0.99298
18.36381
42.98459
0.99699
Statistica
2.69121
0.0128590
8.7148
0.0033147
0.506229
2.336987
160.8630
0.34995144
0.99708
63.2490
0.01760
0.99298
18.36385
42.98462
0.99699
2.69118
0.0128586
8.7151
0.0033148
0.506231
2.336989
Conclusiones
En el presente tutorial se han revisado las herramientas
disponibles en Microsoft Excel para llevar a cabo clculos de regresin. Se ha demostrado que la herramienta
bsica Agregar lnea de tendencia est limitada a algunos tipos especcos de funciones, no permitiendo realizar
ajustes denidos por el usuario. Adems, las ecuaciones no
incorporan informacin sobre los errores de los parmetros
estimados. La herramienta Regresin es una macro que permite obtener informacin adicional, incluidos los errores de
Conicto de intereses
Los autores declaran no tener ningn conicto de
intereses.
29
Referencias
ANECA. Libro Blanco. Ttulo de Grado en Qumica. Agencia Nacional
de Evaluacin de la Calidad y Acreditacin (ANECA), 2004.
Asuero, A. G. y Bueno, J. M. (2011). Fitting straight lines with replicated observations by linear regression. IV. Transforming data.
Critical Reviews in Analytical Chemistry, 41, 36---69.
Billo, E. J. (2007). Excel for Scientist and Engineers. Numerical
methods. Hoboken, EE.UU.: John Wiley & Sons.
De Levie, R. (1999). Estimating parameter precision in nonlinear
least squares with Excels Solver. Journal of Chemical Education,
76, 1594---1598.
De Levie, R. (2000). Curve tting with least squares. Critical
Reviews in Analytical Chemistry, 30, 59---74.
Gil, S. (2012). Experimentos de Fsica. Usando las TIC y elementos
de bajo costo. Buenos Aires, Argentina: Alfaomega.
Harris, D. C. (1998). Nonlinear least-squares curve tting with
Microsoft Excel Solver. Journal of Chemical Education, 75,
119---121.
Harvey, D. (2000). Modern Analytical Chemistry. Boston, EE.UU.:
McGraw-Hill.
Jurado, J. M., Martn, M. J., Pablos, F., Moreda, A. y Bermejo, P.
(2007). Direct determination of copper, lead and cadmium in aniseed spirits by electrothermal atomic absorption spectrometry.
Food Chemistry, 101, 1296---1304.
Jurado JM. Aplicacin de Microsoft Excel a la Qumica Analtica: validacin de mtodos analticos, 2008 [consultado
24 Dic 2015]. Disponible en: http://personal.us.es/jmjurado/
docs/AQAEXCEL.pdf
Miller, N. M. y Miller, J. C. (2002). Estadstica y quimiometra para
na: Prentice Hall.
Qumica Analtica. Madrid, Espa
Moreira, M., Martins, F. y Elvas-Leito, R. (2006). Design of an Excel
spreadsheet to estimate rate constants, determine associated
errors, and choose curves extent. Journal of Chemical Education, 83, 1879---1883.
Ritchie, R. J. y Prvan, T. (1996). Current statistical methods for estimating Km and Vmax of Michaelis-Menten kinetics. Biochemical
Education, 24, 196---206.
Skoog, D. A. y Leary, J. J. (1994). Anlisis Instrumental (4.a ed.).
na: McGraw-Hill.
Madrid, Espa
Stone DC, Ellis J. Stats Tutorial ---- Instrumental analysis and
calibration, 2011 [consultado 18 Ene 2015]. Disponible en:
http://www.chem.utoronto.ca/coursenotes/analsci/stats/
Whiston, C. (1996). X-Ray methods. Analytical Chemistry by Open
Learning (ACOL). New York, NY: John Wiley & Sons.