Ajustando Datos Químicos Con Excel Un Tutorial

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 9

Educacin Qumica (2016) 27, 21---29

Qumica
educacin

www.educacionquimica.info

CMO SE CALCULA?

Ajustando datos qumicos con Excel: un tutorial


prctico
Jos Marcos Jurado a, , Roberto Mu
niz-Valencia b , Angela Alczar a ,
na c y Jorge Gonzlez b
Silvia Guillermina Ceballos-Maga
a

Departamento de Qumica Analtica, Universidad de Sevilla, Sevilla, Espa


na
Facultad de Ciencias Qumicas, Universidad de Colima, Colima, Mxico
c
Facultad de Ciencias, Universidad de Colima, Colima, Mxico
b

Recibido el 5 de abril de 2015; aceptado el 1 de septiembre de 2015


Disponible en Internet el 23 de octubre de 2015

PALABRAS CLAVE
Excel;
Hojas de clculo;
Ajuste lineal;
Ajuste no lineal;
Estimacin de errores

KEYWORDS
Excel;
Spreadsheets;
Linear tting;
Nonlinear tting;
Error estimation

Resumen Excel es un programa de hojas de clculo incluido en Microsoft Ofce utilizado en


un gran nmero de empresas pblicas y privadas en el mundo. Este programa permite realizar
muchas operaciones, como el ajuste de datos experimentales a funciones matemticas. Estas
tareas son comunes en los laboratorios qumicos, y parece razonable entrenar a los profesionales
en el uso de estas herramientas. En este trabajo se han estudiado 4 metodologas de ajuste
usando este programa, resolviendo algunos ejemplos prcticos de datos qumicos, considerando
sus ventajas y desventajas.
Derechos Reservados 2015 Universidad Nacional Autnoma de Mxico, Facultad de Qumica.
Este es un artculo de acceso abierto distribuido bajo los trminos de la Licencia Creative
Commons CC BY-NC-ND 4.0.

Fitting chemical data with Excel: A practical tutorial


Abstract Excel is spreadsheets software included in Microsoft Ofce that is used in a high number of public and private companies all over the world. This program allows carrying out many
operations such as tting experimental data to mathematical functions. These tasks are usually
performed in chemical laboratories and, accordingly, it seems reasonable to train professionals
in the use of these tools. In this work, four tting methodologies using this program have been
studied by solving some practical examples of chemical data, considering their advantages and
disadvantages.
All Rights Reserved 2015 Universidad Nacional Autnoma de Mxico, Facultad de Qumica.
This is an open access item distributed under the Creative Commons CC License BY-NC-ND 4.0.

Autor para correspondencia.


Correo electrnico: [email protected] (J.M. Jurado).
La revisin por pares es responsabilidad de la Universidad Nacional Autnoma de Mxico.

http://dx.doi.org/10.1016/j.eq.2015.09.009
0187-893X/Derechos Reservados 2015 Universidad Nacional Autnoma de Mxico, Facultad de Qumica. Este es un artculo de acceso
abierto distribuido bajo los trminos de la Licencia Creative Commons CC BY-NC-ND 4.0.

22

J.M. Jurado et al.

Introduccin

Metodologa y datos

La interpretacin de los resultados experimentales es una de


las etapas ms importantes de cualquier trabajo cientco.
El cientco debe habituarse a llevar a cabo representaciones grcas de los datos obtenidos en el laboratorio para
identicar tendencias y visualizar relaciones que le permitan proponer teoras o modelos, obteniendo relaciones
matemticas entre las variables dependientes, objeto de
la medida, y las independientes, controladas en el experimento (Gil, 2012). Para cualquier ajuste, el objetivo es
establecer una relacin entre variables dependientes e independientes calculando una serie de coecientes que pueden
obtenerse mediante la aplicacin del mtodo de mnimos
cuadrados. En el supuesto de una variable dependiente (y)
homocedstica y normalmente distribuida en cada nivel de
la variable independiente (x), el mtodo de mnimos cuadrados consiste en obtener los coecientes de la funcin
elegida de manera que minimicen la suma de cuadrados de
residuales:

En este tutorial se revisan las distintas opciones de clculo de regresin que ofrece Excel para la obtencin de
la ecuacin de ajuste mediante grcas, la herramienta
de regresin del men anlisis de datos, funciones del programa como estimacin lineal o logartmica y la herramienta
Solver. Adems, se indicar la forma de obtener los errores
de los parmetros estimados para este ltimo mtodo. El
tutorial se desarrolla a partir de los ejemplos propuestos en
la tabla 1:

S=

n



yi yi

2

(1)

siendo yi el valor real de la variable dependiente e


yi el
valor estimado por la funcin ajustada para cada valor de la
variable independiente xi .
Este mtodo resulta sencillo cuando se trabaja con relaciones lineales entre 2 variables (Harvey, 2000; Miller y
Miller, 2002). Las matemticas asociadas a ajustes no lineales pueden resultar algo ms complejas, dependiendo del
nivel de conocimiento del usuario (De Levie, 2000). En algunas ocasiones se trabaja directamente con funciones no
lineales, y en otras se tratan de linealizar mediante transformaciones adecuadas para que su tratamiento matemtico
sea ms sencillo (Asuero y Bueno, 2011). En cualquier caso,
no solo es importante calcular los coecientes de ajuste,
sino que puede ser til y necesario obtener su error asociado, mediante el empleo de macros (Billo, 2007, De Levie,
1999), procedimientos de remuestreo (Harris, 1998) u hojas
de clculo (Moreira, Martins y Elvas-Leito, 2006).
Los planes de estudio de qumica de numerosas universidades a nivel mundial incluyen asignaturas de informtica
y computacin. El manejo de herramientas informticas en
el mbito cientco es una competencia transversal bsica
y su desarrollo es preponderante para los futuros qumicos.
Por ejemplo, estas herramientas de ajuste tienen aplicacin
directa en el desarrollo de competencias relacionadas con
el anlisis de resultados experimentales. A nivel europeo,
esto se recoge en las recomendaciones de las distintas agencias de evaluacin de la calidad de la ense
nanza, indicando
que el ttulo debe proporcionar conocimientos adicionales
en fsica, matemticas e informtica (ANECA, 2004). Existen diversos programas de clculo y paquetes estadsticos
que incluyen herramientas de regresin, pero uno de los de
uso ms extendido es quiz Microsoft Excel. Desde un punto
de vista acadmico y profesional, parece razonable revisar
las capacidades de dicho programa en la resolucin de problemas de regresin, siendo este el objetivo del presente
tutorial.

Ejemplo 1. Calibracin con patrones para la determinacin directa de cobre en aguardientes de ans mediante
espectroscopia de absorcin atmica con atomizacin electrotrmica (Jurado, Martn, Pablos, Moreda y Bermejo,
2007). Estos datos se emplearn para revisar los procedimientos de ajuste mediante la macros de regresin lineal
de Excel y la funcin ESTIMACION.LINEAL.
Ejemplo 2. Datos de intensidad de uorescencia de rayos
X para la lnea K del hierro en muestras de acero recubiertas con distintos espesores de esta
no (Whiston, 1996).
Estos datos se pueden ajustar segn la ecuacin 2 y se usarn para revisar la funcin ESTIMACION.LOGARITMICA y el
ajuste denido por el usuario empleando Solver.
I = e

(2)

Ejemplo 3. Curva de calibracin de uorescena medida


mediante espectrouorimetra (Stone y Ellis, 2011). Estos
datos se ajustan a funciones del tipo de la ecuacin 3,
siendo necesario el uso de Solver. Por otro lado, la exponencial de base 10 se puede transformar en una exponencial
de base e que a su vez puede desarrollarse como una serie
de McLaurin (Skoog y Leary, 1994) y obtenerse la ecuacin
4. Para valores peque
nos de x se puede truncar la serie en
el trmino cuadrtico y ajustarse los datos a un polinomio
de segundo grado. Este supuesto ser resuelto mediante la
funcin ESTIMACION.LINEAL.

I = a 1 10bC

I=a

ln 10bC

(3)
(ln 10b)2 2 (ln 10b)3 3
C +
C
2!
3!


(4)

Ejemplo 4. Flujo de captacin (V) de un nutriente por


un alga en funcin de la concentracin de sustrato [S]
(Ritchie y Prvan, 1996). Estos datos se ajustan a la ecuacin
caracterstica de una cintica de tipo Michaelis-Menten
(ecuacin 5), y es necesario el uso de Solver.
V=

Vmax [S]
Km + [S]

(5)

Todos los ajustes realizados mediante la herramienta


Solver se comprobarn resolvindolos con el paquete estadstico Statistica 8.0 (StatSoft, Tulsa, EE.UU.).

Resultados
Procedimiento grco
El procedimiento grco de Excel permite realizar la representacin de los datos y, en algunos casos, ajustar un modelo

Ajustando datos qumicos con Excel: un tutorial prctico


Tabla 1

23

Ejemplos numricos empleados en los distintos ajustes

Ejemplo

Variable

Datos
1

Concentracin, C (g l )
Absorbancia, A
Espesor, (m)
Intensidad, I (cuentas s1 )
Concentracin, C (ng l1 )
Intensidad, I (u.r.l.)
Concentracin, [S] (mmol m3 )
Velocidad, V (nmol m2 s1 )

2
3
4

2.5, 5, 7.5, 10
0.03, 0.06, 0.086, 0.114
0.2, 0.5, 1.0, 2.0, 3.5, 5.0, 6.5, 8.5
155, 133, 109, 78, 49, 30, 18, 9
0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20
2.1, 5, 9, 12.6, 17.3, 21, 24.7, 28.4, 31, 32.9, 33.9
3.568, 7.213, 10.87, 14.44, 18.18, 21.93, 29.24, 36.65, 55.33, 109.8
1.42, 2.51, 3.51, 4.78, 5.4, 6.14, 7.72, 8.65, 9.96, 13.28

u.r.l.: unidades relativas de luminiscencia.

matemtico de forma rpida. Para su uso, simplemente hay


que disponer los datos en la hoja de clculo, obtener un
grco de dispersin y, colocando el puntero sobre uno de
los puntos, pulsar el botn derecho y seleccionar Agregar
lnea de tendencia. De este modo se puede seleccionar entre
varios tipos de funciones: exponencial, lineal, logartmica,
polinmica, potencial y de media mvil. Adems permite
hacer extrapolaciones, forzar el paso por un valor de y para
x = 0 y presentar en el grco la ecuacin de ajuste y el coeciente de determinacin r2 . Dicho coeciente (ecuacin 6)
es una medida de la bondad del ajuste, donde un valor prximo a la unidad implica un mejor ajuste de los datos al
modelo matemtico propuesto.
n



r2 = 1

yi yi

2

n



yi y

2

(6)

En la gura 1 se representan los datos de los ejemplos


propuestos, las ecuaciones ajustadas y el valor de r2 . La
ecuacin que propone Excel se escribe siempre de forma
general, siendo x la variable independiente e y la dependiente. En la gura 1A se observa un buen ajuste del modelo
lineal a los datos (r2 = 0.9993). Para el ejemplo 2 (g. 1B),
el ajuste exponencial parece ser adecuado (r2 = 0.9993). En
este caso, los ajustes logartmicos y polinmicos no son adecuados, pues presentan valores de r2 inferiores a 0.985. Un
problema del procedimiento grco en este tipo de ejemplos es que el ajuste exponencial es adecuado para funciones
del tipo ecuacin 5 si > 0, pero no es aplicable si < 0.
Esta limitacin se solventa realizando el ajuste con Solver.
En cuanto al ejemplo 3, se debe acudir a su resolucin con
Solver para ajustar los datos a la ecuacin 3 o agregar una
lnea de tendencia polinmica de segundo grado (g. 1C).
El tipo de ecuacin propuesto para los datos del ejemplo 4
tampoco es ajustable con el procedimiento grco de Excel
(g. 1D), y un ajuste polinmico carece de sentido qumico
en este caso. Otro de los inconvenientes de este procedimiento es que el programa se limita a ofrecer una ecuacin
sin incluir los errores de los coecientes ajustados.

Herramienta de anlisis de datos


La herramienta de anlisis de datos de Excel es un complemento que debe ser activado a travs de la ruta Archivo >

Opciones > Complementos, seleccionando la opcin Herramientas para anlisis. As se activa el complemento Anlisis
de datos del men Datos. Dicho complemento contiene,
entre otras herramientas, el anlisis de regresin, que es
aplicable solo a ajustes lineales. Al seleccionar Regresin,
se abre un formulario de entrada donde se introducen los
rangos en los que se encuentran los valores de x e y del
ejemplo 1. Este formulario presenta opciones adicionales
explicadas con detalle en una gua publicada en red por el
primer autor (Jurado, 2008), pero en este tutorial nos centramos en las opciones por defecto. Tras introducir los datos
y pulsar aceptar, se genera una hoja de resultados (g. 2)
con los valores del coeciente de correlacin, de determinacin y de correlacin ajustado, la varianza de residuales y
el nmero de puntos ajustados que se muestran en las celdas
B4, B5, B6, B7 y B8, respectivamente.
En el rango A10:F14 se tienen los resultados del
anlisis de varianza de regresin que calcula la probabilidad
(F12) de que la varianza de regresin (D12) sea estadsticamente mayor que la varianza de residuales (D13). Valores
bajos de probabilidad o muy altos de F (E12) implican un
mejor ajuste del modelo. Excel denomina a las varianzas
Promedio de los cuadrados. En las celdas B18 y B17 se
encuentran los valores de pendiente y ordenada en el origen,
con sus errores en las celdas C18 y C17, respectivamente.

Funcin ESTIMACION.LINEAL
Se trata de una herramienta muy potente para el anlisis de regresin lineal y polinmica. Es una frmula de las
denominadas matriciales, es decir, que ofrece sus resultados en un rango de celdas formado por las y columnas
adyacentes. Una vez obtenido el resultado de una frmula
matricial, no se puede cambiar una celda sin modicar
toda la matriz. Cualquier cambio en la frmula que afecte
a la matriz solo es efectivo si se pulsa al mismo tiempo
Ctrl + Shift + Enter.
Ajuste lineal
Para el ejemplo 1, partimos de una hoja con los valores
de concentracin en el rango A2:A5 y los de absorbancia
en B2:B5. Se selecciona el rango B12:C16, y desde el men
Frmulas se inserta la funcin ESTIMACION.LINEAL. En el formulario (g. 3) se introducen los rangos de entrada para y
(B2:B5) y para x (A2:A5). En el cuadro Constante se escribe
VERDADERO (o el nmero 1) para que la funcin calcule la

24

J.M. Jurado et al.

A 0,12

180
160

0,1

I, cuentas s1

140

A, u.a.

0,08
0,06
0,04

100
80
0,336x

y = 157,94e
R2 = 0,9993

60
40

y = 0,0111x + 0,003
R2 = 0,9993

0,02

120

20

0
0

10

12

C, g L1

40
35

10

14
12

V, nmol m2 s1

30
25

I, u.r.l.

, m

20
15
10
y = 0,0311x2 + 2,3285x + 0,8727
R2 = 0,9949

10
8
6
4
2

0
0

10

15

20

25

C, ng L1

20

40

60

80

100

120

[S], mmol m3

Figura 1 A) Ejemplo 1 ajustado a una lnea recta. B) Ejemplo 2 ajustado a una exponencial. C) Ejemplo 3 ajustado a un polinomio
de grado dos. D) Ejemplo 4. No admite ajustes adecuados con signicado qumico.

ordenada en el origen, o FALSO (nmero 0) para que la recta


pase por el origen de coordenadas. En el cuadro Estadstica, si el valor lgico es VERDADERO la funcin devuelve
la estadstica de regresin. Finalmente, se pulsa al mismo
tiempo Ctrl + Shift + Enter, obtenindose la matriz de
resultados de la parte inferior de la gura 3. Los caracteres escritos en las columnas A y D indican los datos que
se encuentran en cada una de las celdas de la matriz:
pendiente (B12) y su error (B13), ordenada en el origen
(C12) y su error (C13), coeciente de determinacin (B14),

Figura 2

desviacin estndar de residuales (C14), valor del estadstico F (B15), grados de libertad (C15) y suma de cuadrados
de regresin (B16) y de residuales (C16).
Ajuste polinmico
Se emplean los datos del ejemplo 3, situando los valores
de intensidad uorescente en B2:B12 y las concentraciones en A2:A12. Se selecciona un rango de celdas vaco
de 5 las y 3 columnas, A16:C20, y se inserta la funcin
ESTIMACION.LINEAL. Para los valores de y se selecciona

Resultado del anlisis de regresin de Excel (ejemplo 1).

Ajustando datos qumicos con Excel: un tutorial prctico

Figura 3

Formulario de la funcin ESTIMACION.LINEAL y matriz de resultados (ejemplo 1).

B2:B12, y para los de x se escribe A2:A12{1,2}. En los


otros 2 cuadros se introduce un 1 o el valor lgico VERDADERO. Una vez completado el formulario (g. 4), se pulsa
Ctrl + Shift + Enter. Los coecientes para el trmino
cuadrtico, de primer orden y el trmino independiente se
obtienen en las celdas A16, B16 y C16, respectivamente,
y sus errores en las celdas inmediatamente inferiores. En

Figura 4

25

el rango A18:C19 se encuentran el resto de estadsticas de


regresin.
Cuando se emplea una conguracin de idioma de
Windows en espa
nol (Mxico) la frmula completa es
=ESTIMACION.LINEAL(B2:B12,A2:A12{1,2},1,1). En espa
nol
(Espa
na), la frmula queda =ESTIMACION.LINEAL(B2:B12;A2:
A12{1\2};1;1). En la versin de Excel 2007 los separadores

Formulario de la funcin ESTIMACION.LINEAL y resultados para el ajuste a un polinomio de segundo grado (ejemplo 3).

26

J.M. Jurado et al.

Figura 5

Formulario de entrada de la funcin ESTIMACION.LOGARITMICA y matriz de resultados (ejemplo 2).

en espa
nol (Espa
na) son siempre punto y coma, incluso para
los grados del polinomio.
Si se quisiese ajustar un polinomio de segundo grado
sin trmino de orden uno, para los valores de x se escribe
A2:A12{2}. De este modo se calcula solo el trmino cuadrtico y el independiente. Si se quiere obviar el trmino
independiente se introduce el valor FALSO, o nmero 0, en
el cuadro Constante.

Funcin ESTIMACION.LOGARITMICA
Esta funcin ajusta los datos a una funcin del tipo ecuacin 7, siendo aplicable solo para valores positivos de m
y b. Cualquier base m puede escribirse como el nmero e
elevado a una constante, con lo que puede aplicarse a los
datos del ejemplo 2 con y = I y x = . Se estima as el valor
e , obteniendo el valor de como ln(m).
y = b mx

(7)

Se disponen los datos de x en A2:A9 y los de y en B2:B9,


seleccionando las celdas del rango de salida A12:B16, y se
inserta la funcin. En la gura 5 se observa el formulario
completado y los resultados. En este caso, si el valor del cuadro Constante es FALSO o 0, se calculara b = 1. El valor de m
(A12) y b (B12) se obtienen con sus errores en la la inmediatamente inferior. El resto de celdas en A14:B16 tienen el
mismo signicado que en ejemplos anteriores. A partir del
valor de m obtenido, 0.7147 0.0037, se calcula el valor de
, 0.3358 0.0052, donde el error de se obtiene aplicando
la ley de propagacin de errores a la ecuacin que relaciona
a ambos parmetros. Los resultados son similares a los obtenidos por el procedimiento grco (g. 1B), pero incluyendo
los errores de los parmetros de ajuste.

Estimaciones no lineales con Solver


Solver es un complemento incluido en Excel que permite
optimizar el valor de una celda objetivo hacia un valor
mximo, mnimo o especicado por el usuario, mediante la
variacin de los valores de una o varias celdas. En el caso
de la regresin el objetivo es minimizar la suma de cuadrados de residuales variando los coecientes de la funcin
propuesta. Por lo tanto, habr que calcular unos valores

yi para cada xi a partir de una funcin con unos parmetros de ajuste iniciales. Posteriormente se calculan los
residuales y su suma de cuadrados, y se emplea Solver para
minimizar esta suma variando los coecientes. Las versiones de Excel anteriores a 2010 disponen de 2 algoritmos
de optimizacin, el Simplex para problemas lineales y el
Generalized Reduced Gradient (GRG) para ajustes no lineales. La versin 2010 incluye un tercer mtodo, Evolutionary,
que permite trabajar con datos no suavizados en problemas no lineales (Billo, 2007). En este tutorial se emplea
GRG para resolver los ejemplos (2, 3 y 4) de regresin no
lineal.
La gura 6 muestra la hoja de clculo preparada para
ajustar la ecuacin 2 a los datos del ejemplo 2. Se disponen los datos de intensidad uorescente en el rango A2:A9
y el espesor de esta
no en B2:B9. En las celdas D19 y D20 se
introducen unos valores de partida para los parmetros y
, por ejemplo 155 y 0.4. Se escribe la frmula =$D$19*EXP
(-$D$20*A2) en la celda C2 y se copia en el rango C2:C9. El
smbolo $ se usa para que al copiar la frmula se mantengan
jas las celdas D19 y D20. En la celda D2 se calcula el residual
como =B2-C2 y se copia la frmula hasta la celda D9. En la
celda D14 introducimos la suma de cuadrados de residuales
(SCRes ) mediante la expresin =SUMA.CUADRADOS(D2:D9).
Finalmente se llama al complemento Solver desde el men
de datos.

Ajustando datos qumicos con Excel: un tutorial prctico

Figura 6

27

Aspecto nal de la hoja de clculo para el ajuste de los datos del ejemplo 2 mediante Solver y clculo de errores.

El formulario de entrada de Solver presenta un cuadro


Establecer objetivo, donde se escribe D14 (la suma de cuadrados), y en el cuadro Cambiando las celdas de variable se
introduce D19 y D20 (los valores iniciales de los parmetros
de ajuste). Se selecciona la opcin de minimizar el valor de
la celda objetivo y el mtodo GRG Nonlinear, pulsando posteriormente en Resolver. Es importante desactivar la opcin
Convertir variables sin restricciones en no negativas cuando
cualquiera de los parmetros a calcular en las celdas de
variable tenga valor negativo. Si no se hace, Solver fuerza el
clculo de manera que esas celdas toman valor cero. Tomada
esta precaucin, se acepta y aparece un cuadro de dilogo
que informa que Solver ha obtenido una solucin. En la hoja
de trabajo aparecern las soluciones de Solver en las celdas
donde estaban los valores iniciales.
El ajuste est solucionado, pero an se desconocen los
errores de los parmetros ajustados. Para obtenerlos se
puede emplear un procedimiento basado en la diferenciacin numrica de la funcin de ajuste respecto a cada uno
de los coecientes (Billo, 2007). Para una funcin general y = f(x) con k coecientes de ajuste ai (i = 1 a k), los
errores  i de los parmetros se obtienen de acuerdo a la
ecuacin 8.


i =

Pii1 SRes

(8)

donde SRes es la desviacin estndar de residuales obtenida


a partir de un conjunto de N puntos, como:


SRes =

SCRes
Nk

(9)

y Pii 1 es el elemento que ocupa la posicin ii en la matriz


inversa de la matriz de derivadas parciales P = (Pij ), formada
por k las y k columnas. Cada elemento Pij , donde i denota
la la y j la columna, se calcula como:
Pij =

N

f (xn ) f (xn )
n=1

ai

(10)

aj

Los trminos f(xn )/ai pueden calcularse para cada valor


xn mediante diferenciacin numrica. Para ello, el coeciente ai se vara en una peque
na cantidad ai manteniendo
constantes los dems coecientes aj . Con este nuevo valor
del coeciente ai el valor f(xn ) inicial se transforma en un
nuevo valor f(xn ), pudindose calcular para cada punto:
f  (xn ) f (xn )
f (xn )
=
ai
ai

(11)

A partir de estos trminos se obtienen los elementos Pij ,


se construye la matriz (Pij ) y se invierte. Se emplean los
trminos de la diagonal principal de la matriz inversa para,
mediante la ecuacin 8, calcular los errores de cada parmetro de ajuste. Para el ejemplo 2 la matriz P queda:

2
n 

f (x)

1
P=
n

f (x) f (x)

n

f (x) f (x)

 f (x) 2

1
n

(12)

En la hoja de clculo la variacin de o se introduce en la celda E2. Debe utilizarse un valor peque
no, y
en principio el valor 106 parece razonable. En la columna
F se calculan los valores de I estimado para un valor

28
Tabla 2

J.M. Jurado et al.


Comparacin de los resultados error de los parmetros ajustados mediante Solver y Statistica 8.0

Ejemplo

Parmetro

Solver

r2
a
b
r2
Vmax
Km
r2

160.8628
0.34995129
0.99708
63.2488
0.01759
0.99298
18.36381
42.98459
0.99699

de = ptimo + , manteniendo = ptimo . De este modo,


en la celda F2 se escribe =($D$19+$E$2)*EXP(-$D$20*A2)
y se copia en el rango F2:F9. En la columna G se hace
lo mismo con = ptimo +  y = ptimo , escribiendo en
G2 =($D$19)*EXP(($D$20+$E$2)*A2) y copiando en el resto
de la columna. En las columnas H, I y J se calculan los trminos de derivada parcial respecto a , a y el producto
cruzado, respectivamente. Por lo tanto, en la celdas H2, I2
y J2 se escriben las frmulas =(F2-C2)/$E$2, =(G2-C2)/$E$2
y =H2*I2, respectivamente, y se copian en el resto de la
columna.
La matriz P (ecuacin 12) se calcula en el rango
H14:I15. En la celda H14 se introduce la suma de cuadrados de las diferenciales respecto a mediante la
frmula =SUMA.CUADRADOS(H12:H9). La celda I15 contiene
la suma de cuadrados de los diferenciales respecto a
, =SUMA.CUADRADOS(I2:I9). En las celdas I14 y H15 se
introduce el sumatorio de los productos cruzados como
=SUMA(J2:J9). La matriz H14:I15 se invierte en el rango
H17:I18 seleccionando dicho rango, escribiendo la frmula
=MINVERSA(H14:I15) y pulsando Ctrl + Shift + Enter.
Para calcular la desviacin estndar de regresin
(ecuacin 9) en la celda D17 se escribe =RCUAD((D14)/
(CONTAR(A2:A9)CONTAR(D19:D20))). Se usa la funcin
CONTAR para introducir el nmero de puntos N y el nmero
de parmetros estimados, k, pero tambin podra introducirse numricamente. La frmula RCUAD, RAIZ, en Excel
2007 y anteriores, proporciona la raz cuadrada de la celda
seleccionada. Los errores de los coecientes y se calculan en las celdas D22 y D23 como =RCUAD(H17)*D21 y
=RCUAD(I18)*D21, respectivamente.
Para calcular el coeciente de determinacin es necesario conocer la suma de cuadrados totales de y respecto a
la media. Esto es lo mismo que multiplicar la varianza de
los valores y por los grados de libertad. En la celda D15 se
calcula la varianza de y como =VAR.S(B2:B9) y los grados de
libertad en D16 como =CONTAR(B2:B9)1. En la versiones
de 2007 y anteriores la frmula de la varianza de una muestra es VAR. La suma de cuadrados de y respecto a la media
se obtiene en la celda D17 como =D15*D16. Finalmente se
calcula el valor de r2 en la celda D24 como =1D14/D17.
Los resultados obtenidos son = 160.863 2.691 y
= 0.350 0.013, con r2 = 0.99708. Este resultado vara un
poco respecto al obtenido mediante el procedimiento grco (g. 1B). Esto se debe a que Excel, para el clculo de
la ecuacin de ajuste mediante el procedimiento grco,

Statistica
2.69121
0.0128590
8.7148
0.0033147
0.506229
2.336987

160.8630
0.34995144
0.99708
63.2490
0.01760
0.99298
18.36385
42.98462
0.99699

2.69118
0.0128586
8.7151
0.0033148
0.506231
2.336989

emplea realmente la funcin ESTIMACION.LOGARITMICA y


no un ajuste directo a una funcin exponencial del tipo
ecuacin 2.
Con nes comparativos, se realiza el ajuste aqu
propuesto mediante el paquete de software estadstico
comercial Statistica 8.0. En la tabla 2 se disponen los resultados obtenidos por ambos procedimientos con un nmero
alto de decimales para apreciar las diferencias. Como puede
observarse, se obtienen resultados muy similares para el
ejemplo 2.
Los 2 ejemplos restantes, 3 y 4, estn propuestos para
que el lector los lleve a cabo por s mismo. La resolucin
del ejemplo 3 es similar a la anterior, pero ajustando a una
funcin del tipo ecuacin 2. Se puede emplear la misma
distribucin de datos, coecientes y dems parmetros que
en la hoja propuesta para el ejemplo anterior, pero modicando las frmulas de acuerdo al ajuste requerido. En este
caso, en la celda C2 se escribe =$D$19*(1-10(-$D$20*A2)),
copindose hasta C12. Se minimiza la suma de cuadrados
de residuales con Solver con valores iniciales 40 y 0.02
para a y b, respectivamente. Los errores de los parmetros
se calculan como en el ejemplo 2, empleando las frmulas adecuadas en F2:G12. Los valores obtenidos en Excel,
a = 63.25 8.71, b = 0.018 0.003 y r2 = 0.99298, son muy
similares a los obtenidos con Statistica 8.0 (tabla 2). En el
caso del ejemplo 4 (ecuacin 5), la ecuacin de la celda
C2 debe ser =$D$19*A2/($D$20+A2) y debe copiarse hasta
C11. Se aplica Solver con unos valores iniciales de Vmax
y Km de 18 y 40, respectivamente. Los resultados nales,
Vmax = 18.5 0.5 y Km = 43.0 2.3 son muy similares a los
obtenidos con Statistica 8.0 (tabla 2). Una hoja de clculo
con la resolucin completa puede ser solicitada al primer
autor.

Conclusiones
En el presente tutorial se han revisado las herramientas
disponibles en Microsoft Excel para llevar a cabo clculos de regresin. Se ha demostrado que la herramienta
bsica Agregar lnea de tendencia est limitada a algunos tipos especcos de funciones, no permitiendo realizar
ajustes denidos por el usuario. Adems, las ecuaciones no
incorporan informacin sobre los errores de los parmetros
estimados. La herramienta Regresin es una macro que permite obtener informacin adicional, incluidos los errores de

Ajustando datos qumicos con Excel: un tutorial prctico


los parmetros estimados, pero solo se emplea en ajustes
lineales.
La funcin ESTIMACION.LINEAL permite obtener los
parmetros de regresin y sus errores y otros datos
de regresin. La principal ventaja respecto a la macro
Regresin es que se trata de una funcin y, como tal,
puede ser insertada en una hoja de clculo que ir
variando su resultado automticamente al variar los datos
de entrada. Esta funcin permite adems llevar a cabo
ajustes polinmicos de distinto grado. La funcin ESTIMACION.LOGARITMICA realiza el ajuste a funciones del tipo
exponencial de cualquier base m. Adems permite obtener los errores de los parmetros de ajuste y otros datos
de regresin. La funcin no es aplicable si alguno de los
coecientes es negativo, siendo este el principal inconveniente.
La herramienta Solver se puede usar para realizar cualquier tipo de ajuste lineal o no lineal. La gran ventaja es que
permite llevar a cabo la estimacin de parmetros de funciones denidas por el usuario. El principal inconveniente
es que no proporciona los errores de los parmetros de
ajuste, pero en el tutorial propuesto se incluye un posible mtodo para llevar a cabo dicha estimacin con buenos
resultados.
Desde el punto de vista docente, los alumnos de qumica deben adquirir destreza en el manejo de herramientas
informticas de cara a mejorar su perl laboral. Lo ideal
sera implantar asignaturas de informtica para qumicos,
aunque estas competencias tambin pueden ser desarrolladas en sesiones de prcticas de laboratorio, en seminarios
de clculo numrico o en prcticas en aula de informtica.
Otra opcin es la organizacin de cursos de formacin extracurriculares o la inclusin de tutoriales y prcticas resueltas
como material online de libre disposicin para los alumnos.
Se pretende que este tutorial sirva de material de apoyo en
este tipo de iniciativas.

Conicto de intereses
Los autores declaran no tener ningn conicto de
intereses.

29

Referencias
ANECA. Libro Blanco. Ttulo de Grado en Qumica. Agencia Nacional
de Evaluacin de la Calidad y Acreditacin (ANECA), 2004.
Asuero, A. G. y Bueno, J. M. (2011). Fitting straight lines with replicated observations by linear regression. IV. Transforming data.
Critical Reviews in Analytical Chemistry, 41, 36---69.
Billo, E. J. (2007). Excel for Scientist and Engineers. Numerical
methods. Hoboken, EE.UU.: John Wiley & Sons.
De Levie, R. (1999). Estimating parameter precision in nonlinear
least squares with Excels Solver. Journal of Chemical Education,
76, 1594---1598.
De Levie, R. (2000). Curve tting with least squares. Critical
Reviews in Analytical Chemistry, 30, 59---74.
Gil, S. (2012). Experimentos de Fsica. Usando las TIC y elementos
de bajo costo. Buenos Aires, Argentina: Alfaomega.
Harris, D. C. (1998). Nonlinear least-squares curve tting with
Microsoft Excel Solver. Journal of Chemical Education, 75,
119---121.
Harvey, D. (2000). Modern Analytical Chemistry. Boston, EE.UU.:
McGraw-Hill.
Jurado, J. M., Martn, M. J., Pablos, F., Moreda, A. y Bermejo, P.
(2007). Direct determination of copper, lead and cadmium in aniseed spirits by electrothermal atomic absorption spectrometry.
Food Chemistry, 101, 1296---1304.
Jurado JM. Aplicacin de Microsoft Excel a la Qumica Analtica: validacin de mtodos analticos, 2008 [consultado
24 Dic 2015]. Disponible en: http://personal.us.es/jmjurado/
docs/AQAEXCEL.pdf
Miller, N. M. y Miller, J. C. (2002). Estadstica y quimiometra para
na: Prentice Hall.
Qumica Analtica. Madrid, Espa
Moreira, M., Martins, F. y Elvas-Leito, R. (2006). Design of an Excel
spreadsheet to estimate rate constants, determine associated
errors, and choose curves extent. Journal of Chemical Education, 83, 1879---1883.
Ritchie, R. J. y Prvan, T. (1996). Current statistical methods for estimating Km and Vmax of Michaelis-Menten kinetics. Biochemical
Education, 24, 196---206.
Skoog, D. A. y Leary, J. J. (1994). Anlisis Instrumental (4.a ed.).
na: McGraw-Hill.
Madrid, Espa
Stone DC, Ellis J. Stats Tutorial ---- Instrumental analysis and
calibration, 2011 [consultado 18 Ene 2015]. Disponible en:
http://www.chem.utoronto.ca/coursenotes/analsci/stats/
Whiston, C. (1996). X-Ray methods. Analytical Chemistry by Open
Learning (ACOL). New York, NY: John Wiley & Sons.

También podría gustarte