Unidad 2.2
Unidad 2.2
Unidad 2.2
Objetivo: ........................................................................................................................ 3
Introducción: ................................................................................................................. 3
5. Bibliografía ......................................................................................................21
2
Ajuste de curvas: Mínimos Cuadrados
Introducción:
El método de regresión por mínimos cuadrados se utiliza cuando existen cierto tipo de
errores en los datos y se busca una curva que pase por la mayor cantidad de puntos, a
diferencia de la interpolación donde la curva pasa por todos los puntos.
Recordemos que en interpolación mientras más puntos se utilizan para hallar el
polinomio interpolado, mayor será el grado del polinomio y esto ocasiona grandes
oscilaciones.
A partir de un conjunto de puntos x,y con la gráfica de dispersión se puede determinar
el comportamiento de los datos, si existe una relación lineal, cuadrática, exponencial,
logarítmica, etc. En base a la inspección visual se puede determinar el tipo de curva
que mejor ajusta los datos, este ajuste luego será contrastado con el cálculo de valores
de coeficiente de regresión para determinar la confiabilidad del ajuste.
Grafica de dispersión x,y Ajuste de datos mediante Ajuste de datos con regresión
interpolación lineal
© Universidad Estatal de Milagro – UNEMI
La estrategia que se sigue para mejorar el ajuste de la recta a través de los valores (x,y)
provenientes de los datos, es la suma de los errores residuales, tal como se indica en la
ecuación 3 (Chapra & Canale, 2006).
n n
ei = ( yi − a0 − a1 xi )
i =1 i =1
(3)
Este criterio es inadecuado puesto que como se observa en la figura 2, los errores para
cada uno de los puntos son positivos si y está encima de la curva y negativo si está
debajo, al final, aunque estos valores sean grandes las sumas y restas podrían dar
valores cercanos a cero que daría un criterio incorrecto sobre la confiabilidad de la
estimación.
Otro criterio que se podría pensar para minimizar el error, es la suma de valores
absolutos del error residual, tal como se indica en la ecuación 4. (Sauer, 2012)
n n
e = y −a
i =1
i
i =1
i 0 − a1 xi (4)
Este criterio también es inadecuado porque toda recta que esté al interior de las líneas
segmentadas figura 3, hará que disminuya el valor absoluto de la suma del error,
ecuación 4.
Cada una de las sumatorias pueden ser escritas como: (Lara, 2019)
n n n n
S x = xi S y = yi S xy = xi yi S xx = xi2
i =1 i =1 i =1 i =1
S xx S y − S xy S x
a0 = (12)
nS xx − ( S x )
2
Ejercicio 1
Ajuste los datos siguientes mediante regresión lineal por mínimos cuadrados
© Universidad Estatal de Milagro – UNEMI
X 2 4 6 7 10 11 14 17 20
Y 1 2 5 2 8 7 6 9 12
n x y xy x^2 y^2
1 2 1 2 4 1
2 4 2 8 16 4
3 6 5 30 36 25
4 7 2 14 49 4
5 10 8 80 100 64
6 11 7 77 121 49
7 14 6 84 196 36
8 17 9 153 289 81
9 20 12 240 400 144
nS xy − S x S y 9(688) − (91)(52)
a1 = a1 = =0.55768
nS xx − ( S x ) 9(1211) − ( 91)
2 2
S xx S y − S xy S x (1211)(52) − (688)(91)
a0 = a0 = = 0.13904
nS xx − ( S x ) 9(1211) − ( 91)
2 2
y = a0 + a1 x
y = 0.13904 + 0.55768x
© Universidad Estatal de Milagro – UNEMI
Ejercicio 2
Mediante regresión lineal por mínimos cuadrados ajuste una recta a los datos, que
corresponden a un objeto que pasa por un túnel de viento, se realizan las mediciones
de fuerza y velocidad del viento y se registran en la siguiente tabla.
V(m/s) 10 20 30 40 50 60 70 80
nS xy − S x S y 8(312850) − (360)(5135)
a1 = a1 = =19,47
nS xx − ( S x ) 8(20400) − ( 360)
2 2
S xx S y − S xy S x (20400)(5135) − (312850)(360)
a0 = a0 = = −234, 286
nS xx − ( S x ) 8(20400) − ( 360 )
2 2
y = a0 + a1 x
y = −234, 286 + 19, 47 x
© Universidad Estatal de Milagro – UNEMI
Otra forma para determinar la relación lineal entro dos variables es el coeficiente de
correlación lineal de Pearson que se calcula mediante:
xy
rxy = , − 1 rxy 1 (16)
x y
xy =
xi yi
− x y (17)
n
x = x − ( x)
2
i
2
(18)
n
y = y − ( y)
2
i
2
(19)
n
© Universidad Estatal de Milagro – UNEMI
Para valores rxy positivos implica pendiente positiva y relación proporcional, para
valores rxy negativos implica pendiente negativa y relación inversamente proporcional.
Si rxy es cercano a cero, las variables no estarán relacionadas linealmente (Rodríguez,
2011). Este valor es igual al coeficiente de determinación, solo que se calcula de otra
forma, a partir de la covarianza (x,y) y las desviaciones estándar de x y de y.
Ejercicio 3
En base a los valores obtenidos en el ejercicio 1, calcule los coeficientes de
determinación, de correlación y de Pearson:
Coeficiente de determinación
2
(9)(688) − (91)(52)
r2 =
(9)(1211) − 91 2 (9)(408) − 52 2
( ) ( )
r 2 = 0.84113
Coeficiente de correlación
r = r 2 = 0.91713
Coeficiente de Pearson
xy 20.277
rxy = = = 0.9171
x y (6.030)(3.667)
Con estos valores determinamos que el modelo se ajusta al 84% de variabilidad de los
datos y que la relación lineal entre los valores x,y es de 0.9171.
Ejercicio 4
En base a los valores obtenidos en el ejercicio 2, calcule los coeficientes de
determinación, de correlación y de Pearson para el modelo:
Sx Sy Sxy Sxx Syy n
360 5135 312850 20400 5104325 8
Coeficiente de determinación
2
(8)(31285) − (360)(5135)
r2 =
(8)(20400) − 360 2 (8)(51044325) − 5135 2
( ) ( )
r 2 = 0.8805
Coeficiente de correlación
© Universidad Estatal de Milagro – UNEMI
r = r 2 = 0.9383
Coeficiente de Pearson
xy
rxy = = 0.9383
x y
Con estos valores determinamos que el modelo se ajusta al 88% de variabilidad de los
datos y que la relación lineal entre los valores x,y es de 0.9383.
S r = ei2 = ( yi − a0 − a1 xi − a2 xi2 )
n n 2
(20)
i =1 i =1
Al derivar Sr con respecto a cada uno de los parámetros a0, a1 y a2 e igualar a cero se
obtiene un sistema de 3 ecuaciones con las incógnitas dadas por los parámetros del
polinomio, al resolver este sistema de ecuaciones podremos encontrar los valores de
dichos parámetros.
na0 + ( xi ) a1 + ( xi2 ) a2 = yi
( x ) a + ( x ) a + ( x ) a = x y
i 0
2
i 1
3
i 2 i i (21)
( x ) a + ( x ) a + ( x ) a = x y
i
2
0
3
i 1
4
i 2 i
2
i
Se calcula cada una de las sumatorias en una tabla de excel y luego se resuelve el
sistema de ecuaciones.
( x ) a + ( x ) a + ( x ) a +
i 0
2
i 1
3
i 2 + ( xin +1 ) an = xi yi
( x ) a + ( x ) a + ( x ) a +
2 3 4
+ ( xin + 2 ) an = xi 2 yi
© Universidad Estatal de Milagro – UNEMI
i 0 i 1 i 2 (22)
( x ) a + ( x ) a + ( x ) a
i
n
0
n +1
i 1
n+2
i 2 + + ( xin + n ) an = xi n yi
Se deriva parcialmente con respecto a cada coeficiente a0, a1, a2 y a3, luego se iguala a
cero y se obtienen las ecuaciones:
na0 + ( ui ) a1 + ( vi ) a2 + ( zi ) a3 = yi
( u ) a + ( u ) a + (u v ) a + (u z ) a = u y
i 0
2
i 1 i i 2 i i 3 i i
(24)
( v ) a + ( v u ) a + ( v ) a + ( v z ) a = v y
i 0 i i 1 i
2
2 i i 3 i i
( z ) a + ( z u ) a + ( z v ) a + ( z ) a = z y
i 0 i i 1 i i 2 i
2
3 i i
Hay otros casos donde datos no tienen una tendencia lineal, sino más bien el ajuste se
realiza mediante una función exponencial, logarítmica, etc.
Para este tipo de casos es conveniente aplicar un procedimiento mediante funciones
inversas, a fin de linealizar los datos y aplicar regresión lineal por mínimos cuadrados.
A continuación, se presenta una tabla con algunas funciones que pueden ser
linealizadas a fin de aplicar el procedimiento de mínimos cuadrados.
Ejercicio 5
Emplee regresión no lineal para ajustar una parábola a los datos siguientes:
X 0.75 2 3 4 6 8 8.5
Y 1.2 1.95 2 2.4 2.4 2.7 2.6
na0 + ( xi ) a1 + ( xi2 ) a2 = yi
( x ) a + ( x ) a + ( x ) a = x y
i 0
2
i 1
3
i 2 i i (21)
( x ) a + ( x ) a + ( x ) a = x y
i
2
0
3
i 1
4
i 2 i
2
i
S r = ei2 = ( yi − a0 − a1 xi − a2 xi2 )
n n 2
(20)
i =1 i =1
(yi-p2)^2 (yi-ym)^2
0.01229627 0.957602041
0.03321347 0.052244898
0.00411984 0.031887755
0.0101546 0.049030612
0.03428241 0.049030612
0.00554581 0.271887755
7.5282E-06 0.177602041
Sr St
0.09961993 1.589285714
Tabla 5: Cálculo en Excel para hallar el coeficiente de determinación
Fuente: Elaboración propia
1.5892 − 0.09961
r2 = = 0.9373
1.5892
La gráfica de la estimación cuadrática es:
Ejercicio 6
La ecuación de corriente para un circuito de carga RL serie viene dada por:
I(t) = 1 − ⅇ−t∕τ
Solución
Primero se linealiza la función exponencial de acuerdo a lo que se indica en la tabla 1.
−t
ln( I ) = ln(1) − ln e
t
ln( I ) = ln ( e )
1
ln( I ) = t
y* = ln( I ), x = t
nS xy − S x S y 7(−2.67724) − (2.8)(−8.6197)
a1 = a1 = =2.7523
nS xx − ( S x ) 7(1.4) − ( 2.8)
2 2
Coeficiente de determinación
2
nS xy − S x S y
r =
2
nS xx − ( S x ) nS yy − ( S y )
2
2
r 2 = 0.8805
Del modelo m=a1
1
m = a1 =
1 1
= =
a1 2.7523
= 0.3633s
Ejercicio 7
En la tabla 8 se muestran los valores de volumen en pie3 y de presión en psi:
Puntos 1 2 3 4 5 6 7 8 9
v 26.43 22.40 19.08 16.31 14.04 12.12 10.51 9.15 8.00
p 14.70 17.53 20.80 24.54 28.83 33.71 39.25 45.49 52.52
Tabla 8: Datos de volumen y presión
Fuente: (Nieves & Dominguez, 2014).
nS xy − S x S y 9(79.2463) − (24.079)(30.1148)
a1 = a1 = =-1.1369
nS xx − ( S x ) 9(65.5883) − ( 24.0792 )
2 2
S xx S y − S xy S x (65.5883)(30.1148) − (79.2463)(24.0792)
a0 = a0 = = 6.3879
nS xx − ( S x ) 9(65.5883) − ( 24.0792 )
2 2
Modelo linealizado
y* = 6.3879 − 1.1369 x*
Se calculan los valores a y b del modelo no lineal
a 0 = ln(a), a1 = b
b = −1.1369
a = ea0 = e6.3879
a = 594.6426
p = 594.6426v −1.1369
© Universidad Estatal de Milagro – UNEMI
Coeficiente de determinación
2
nS xy − S x S y
r =
2
nS xx − ( S x ) nS yy − ( S y )
2
2
r 2 = 0.9917
© Universidad Estatal de Milagro – UNEMI
3. Preguntas de Comprension de la
Unidad
¿Cuándo se debe utilizar ajuste de curvas?
Cuando los datos x,y provienen de mediciones con error o incertidumbre, lo que se
busca con este método es obtener una curva que pase por la mayor cantidad de
puntos a diferencia de interpolación donde la curva pasa por todos los puntos.
4. Material Complementario
Los siguientes recursos complementarios son sugerencias para que se pueda ampliar la
información sobre el tema trabajado, como parte de su proceso de aprendizaje
autónomo:
Videos de apoyo:
Mínimos Cuadrados: https://bit.ly/3kb6YiN
Representación y ajuste de Datos: https://bit.ly/3eAs20W
Coeficiente de determinación: https://bit.ly/2IiS78Z
https://bit.ly/3laznqr
Ajuste con mínimos cuadrados: https://bit.ly/358EoKM
Ajuste de curva exponencial: https://bit.ly/36dWZEu
Mínimos Cuadrados para polinomios de cualquier grado: https://bit.ly/2U2XN9k
Bibliografía de apoyo:
▪ Burden, R., & Faires, D. (2011). Numerical Analysis. (BOOKS/COLE, Ed.) (Ninth).
Boston.
▪ Chapra, S., & Canale, R. (2006). Métodos numéricos para ingenieros. (McGrawHill,
Ed.) (Quinta). México
Links de apoyo:
Link de libros: https://bit.ly/34WB0Td
© Universidad Estatal de Milagro – UNEMI
5. Bibliografía