Apunte Teórico Algebra y Geometria Analitica PDF
Apunte Teórico Algebra y Geometria Analitica PDF
Apunte Teórico Algebra y Geometria Analitica PDF
ANÁLITICA
AÑO 2020
1
PROGRAMA ANALÍTICO
UNIDAD N°1: Números. Sistemas de coordenadas.
Números complejos. Operaciones. Suma. Resta. Producto. Cociente. Potencia. Raíz. Gráfico.
Formas binómicas y trigonométricas.
Sistemas de coordenadas sobre una recta, en el plano y en el espacio. Coordenadas cartesianas.
3
BIBLIOGRAFÍA
4
UNIDAD N°1: Números. Sistemas de coordenadas.
Coordenadas Cartesianas
En un sistema coordenado lineal, (sistema de una dimensión), cuyos puntos se hallan restringidos a estar
sobre una recta, “el eje”, es evidente que nos encontramos extremadamente limitados a efectuar una
investigación analítica de las propiedades geométricas. Por ejemplo, no es posible estudiar las propiedades
de los puntos de una circunferencia.
Para extender la utilidad del método analítico, consideremos ahora un sistema coordenado en el cual un
punto puede moverse en todas direcciones manteniéndose siempre en un plano (dos dimensiones). Este
sistema se llama “coordenado cartesiano” (en homenaje a Descartes-1596-1650) o también coordenado
bidimensional o sistema coordenado plano, o sistema coordenado rectangular.
Dicho sistema consta de dos rectas dirigidas x’x e y’y, llamadas ejes coordenados, que pueden ser
perpendiculares entre sí o no, y que nosotros usaremos ese caso particular.
La recta x’x se llama eje de las “x” o primer eje, o también eje de las abscisas; el otro eje, el eje y’y, se lo
conoce como eje de las “y” o segundo eje, o también como eje de las ordenadas. La intersección de ambos
ejes es el punto “O”, origen del sistema de coordenadas.
Estos ejes coordenados dividen al plano en cuatro regiones llamadas cuadrantes y numerados I, II, III y IV,
tal como se indica
La dirección positiva del eje de las “x” es del origen hacia la derecha; la dirección positiva del eje de las “y”
es desde el origen hacia arriba.
Todo punto “P” del plano puede localizarse por medio del sistema rectangular. Para ello se traza el segmento
̅̅̅̅
𝑃𝐴 perpendicular al eje de las “x” o paralelo al eje de las “y” y luego se traza el segmento ̅̅̅̅
𝑃𝐵 perpendicular
al eje “y” o paralelo al eje “x”.
La longitud del segmento dirigido ̅̅̅̅𝑂𝐴 se representa por “x” y se denomina abscisa del punto “P”; la longitud
del segmento dirigido 𝑂𝐵̅̅̅̅ se representa por “y” y se llama ordenada del punto “P”.
Los números reales, “x” e “y” se denominan coordenadas de “P” y se representan o indican por (x , y). Estos
valores deben ser escritos en forma “ordenada”, escribiendo primero el valor de la abscisa “x” y en segundo
lugar el valor de la ordenada “y”. Es por esta razón, que un par de coordenadas en el plano se denomina “par
ordenado de números reales”.
Es evidente entonces, que a cada punto “P” del plano coordenado le corresponde uno y solamente un par de
coordenadas “x ; y”. Recíprocamente, un par de coordenadas (x ; y) cualquiera determina uno y solamente
un punto en el plano coordenado.
Analicemos ahora un punto referido a un sistema de coordenadas rectangulares en el espacio tridimensional.
Consideremos para ello, tres planos mutuamente perpendiculares y que se cortan en un punto común “O”.
(ver figura)
5
El punto en el espacio tridimensional se localiza con relación a estos elementos. Dichos planos se
denominan planos coordenados y las rectas intersección de dichos planos se llaman ejes coordenados. El
punto “O” se señala como el origen del sistema de coordenadas rectangulares. Un convenio indica a los ejes
coordenados según lo mostrado y se denominan, respectivamente el eje “x”, el eje “y” y el eje “z”.
Estos ejes son rectas dirigidas, cuya dirección positiva está indicada en la figura y es conocido como sistema
coordenado de la mano derecha.
Cada plano coordenado se designa por los dos ejes coordenados que contiene; así, el plano coordenado que
contiene a los ejes “x” e “y” se denomina plano “xy”; tenemos entonces también los planos coordenados
“xz” e “yz”. Los tres planos coordenados dividen el espacio en ocho regiones llamadas octantes.
6
Números complejos
Aparece la necesidad de la creación de los números complejos para dar solución a ecuaciones del tipo:
𝒙𝟐 + 𝟏 = 𝟎
que no puede ser resuelta en el conjunto de los números reales, porque para que una suma de números reales
positivos sea igual a cero, uno de los números debe ser opuesto del otro; o sea x2 tiene que ser opuesto de 1 ,
es decir, debe ser negativo
𝒙𝟐 < 0
condición esta, que como dijimos no puede cumplir ningún número real.
Hace falta entonces, encontrar un número cuyo cuadrado sea igual a -1.
Considerando entonces la ecuación: 𝒙𝟐 + 𝟏 = 𝟎 , de donde resulta 𝒙𝟐 = −𝟏 . Si a esta última expresión le
sacamos la raíz cuadrada, tendremos:
√𝑥 2 = √−1 de donde: 𝑥 = √−1
valor éste último que se consideró como “unidad imaginaria”, y se identifico por la letra “i” latina
minúscula, es decir:
√−𝟏 = 𝒊
Definición de número complejo
Es todo par ordenado de números reales, o sea: C = ( a , b ) a R b R
Al número complejo definido por el par ordenado (a , b) lo indicamos como:
𝒁 = (𝒂, 𝒃) (1)
𝒁 = 𝒂 + 𝒃𝒊 (2).
Esta es entonces la expresión de un número complejo como par ordenado de números reales o en su forma
binómica.
Ejemplos:
𝑍1 = (−1 , 3) ó 𝑍1 = −1 + 3𝑖
1
𝑍2 = (1⁄2 , −4) ó 𝑍2 = − 4𝑖
2
𝑍3 = (5 , √5) ó 𝑍3 = 5 + √5 𝑖
𝒁𝟏 = 𝒁𝟐 ⇔ 𝒂 = 𝒄 ʌ 𝒃 = 𝒅
Observamos que según esta definición, una igualdad entre números complejos significa dos igualdades entre
números reales.0
Para que la expresión (1) ó (2) adquiera la categoría de “número complejo”, debemos introducir las
operaciones de adición y multiplicación.
Adición o suma:
Dados los complejos 𝑍1 = (𝑎 , 𝑏 ) = 𝑎 + 𝑏𝑖 𝑦 𝑍2 = (𝑐 , 𝑑) = 𝑐 + 𝑑𝑖 , la adición de los mismos se define
por:
𝒁𝟏 + 𝒁𝟐 = (𝒂 , 𝒃) + (𝒄 , 𝒅) = (𝒂 + 𝒄 , 𝒃 + 𝒅) = [(𝒂 + 𝒄) + (𝒃 + 𝒅)𝒊]
7
Ejemplo:
𝑍1 = (1 , −6) = 1 − 6𝑖 ; 𝑍2 = (−2 , 4) = −2 + 4𝑖
𝑍1 + 𝑍2 = (1, −6) + (−2 , 4) = (1 − 2 , −6 + 4) = (1 − 2) + (−6 + 4)𝑖 = (−1 , −2) = −1 − 2𝑖
Multiplicación:
La multiplicación de dos complejos dados como par ordenado ó en su forma binómica, se define como:
𝑍1 = (𝑎 , 𝑏 ) = 𝑎 + 𝑏𝑖 𝑦 𝑍2 = (𝑐 , 𝑑) = 𝑐 + 𝑑𝑖
Diferencia:
Dados los números complejos 𝑍1 = (𝑎 , 𝑏 ) = 𝑎 + 𝑏𝑖 𝑦 𝑍2 = (𝑐 , 𝑑) = 𝑐 + 𝑑𝑖 resulta que:
𝑍1 − 𝑍2 = 𝑍1 + (−𝑍2 )
es decir que podemos expresar la diferencia de dos números complejos como la suma de Z 1 con el inverso
aditivo de Z2.
En este caso, será entonces:
𝒁𝟏 − 𝒁𝟐 = (𝒂 , 𝒃) − (𝒄 , 𝒅) = (𝒂 , 𝒃) + (−𝒄 , −𝒅) = (𝒂 − 𝒄 , 𝒃 − 𝒅) ó
𝒁𝟏 − 𝒁𝟐 = (𝒂 + 𝒃𝒊) − (𝒄 + 𝒅𝒊) = (𝒂 + 𝒃𝒊) + (−𝒄 − 𝒅𝒊) = (𝒂 − 𝒄) + (𝒃 − 𝒅)𝒊
Conjugado:
Dado 𝑍 = (𝑎 , 𝑏 ) = 𝑎 + 𝑏𝑖 , llamamos conjugado de Z, que simbolizaremos por Z , al número complejo
𝑍̅ = (𝑎 , −𝑏 ) = 𝑎 − 𝑏𝑖
Es decir, un conjugado de un número complejo, es aquel complejo en el cual se cambia sólo el signo de la
parte imaginaria o segunda componente.
Ejemplo:
̅ = (−𝟑 , −𝟏) = −𝟑 − 𝟏𝒊
𝒔𝒊 𝒁 = (−𝟑 , 𝟏) = −𝟑 + 𝟏𝒊 𝒆𝒍 𝒄𝒐𝒏𝒋𝒖𝒈𝒂𝒅𝒐 𝒆𝒔 𝒁
Cociente:
Dados dos números complejos 𝑍1 = (𝑎 , 𝑏 ) = 𝑎 + 𝑏𝑖 𝑦 𝑍2 = (𝑐 , 𝑑) = 𝑐 + 𝑑𝑖, siendo Z2 un complejo no
nulo (𝑍2 ≠ (0 , 0) ≠ 0 + 0𝑖), definimos el cociente como el producto de Z1 por el inverso multiplicativo de
Z2.
𝑍1
Tendremos entonces: = 𝑍1 . (𝑍2 )−1 y aplicando lo anteriormente expuesto, resultará:
𝑍2
Z1 c d ac bd bc ad
a , b 2 ; 2 2 2 , 2 2 =
c d c d2 c d c d c d c d2
2 2 2 2
Z2
𝒁𝟏 𝒂𝒄 + 𝒃𝒅 𝒃𝒄 − 𝒂𝒅
=( 𝟐 , ) (𝟒)
𝒁𝟐 𝒄 + 𝒅𝟐 𝒄𝟐 + 𝒅𝟐
Al mismo resultado obtenido se llega multiplicando numerador y denominador de la fracción dada por el
conjugado del denominador:
8
Z1 Z Z2 ( a , b ) . ( c , -d )
1
Z2 Z2 Z 2 (c,d).(c,-d)
y resolviendo tendremos:
( a , b ) . ( c , -d ) ( ac + bd ; bc - ad )
( c , d ) . ( c , - d ) ( cc + dd + dc - cd )
resultando finalmente:
𝒁𝟏 𝒂𝒄 + 𝒃𝒅 𝒃𝒄 − 𝒂𝒅
=( 𝟐 , ) (𝟓)
𝒁𝟐 𝒄 + 𝒅𝟐 𝒄𝟐 + 𝒅𝟐
y si los complejos estuviesen dados en su forma binómica, tendríamos:
Z1 Z1 . Z 2 (a+bi).(c-di)
Z2 Z2 . Z 2 (c+di).(c-di)
y resolviendo tendremos:
( a + b i ) . ( c - d i ) ( ac + bd ) + ( bc - ad )i
(c+di).(c-di) ( cc + dd + dc - cd )
resultando finalmente:
𝒁𝟏 𝒂𝒄 + 𝒃𝒅 𝒃𝒄 − 𝒂𝒅
=( 𝟐 , ) (𝟓)
𝒁𝟐 𝒄 + 𝒅𝟐 𝒄𝟐 + 𝒅𝟐
y comparando las expresiones (4) y (5), observamos que las mismas son iguales.
La expresión del cos 𝜙 = 𝑎⁄|𝑍 | , de donde: 𝑎 = |𝑍 | cos 𝜙 y la del sen ϕ = b / Z , de donde: b = Z sen ϕ
Reemplazando los valores de a y b en el par ordenado o en la expresión binómica o cartesiana del número
complejo, tendremos
𝒁 = (𝒂 , 𝒃) = 𝒂 + 𝒃𝒊 = |𝒁| 𝐜𝐨𝐬 𝝓 + 𝒊 𝒔𝒆𝒏 𝝓 = |𝒁|(𝐜𝐨𝐬 𝝓 + 𝒊 𝒔𝒆𝒏 𝝓)
Entonces: Z = Z (cos ϕ + i sen ϕ) es la forma trigonométrica del número complejo Z = a + bi
La expresión polar es: Z = Z ϕ , en donde se destaca al igual que en la expresión trigonométrica el valor
del módulo del complejo Z y el valor del argumento (ángulo) ϕ.
La forma exponencial es: 𝒁 = |𝒁|𝒆𝒊𝝓 en donde también se resalta el valor del módulo y del argumento. Es
decir, son tres formas de escribir lo mismo.
en donde el término 2k significa: dos pi radianes o trescientos sesenta grados sexagesimales multiplicado
por el escalar “k”, siendo éste último (k) un número natural equivalente a la cantidad de giros.
Producto:
Dados los complejos: Z1 = (cos + i sen ) , y , Z2 = (cos + i sen ) , se define:
Cociente:
Dados los complejos: Z1 = (cos + i sen ) ,y, Z2 = (cos + i sen ) , con la condición que Z2
sea distinto de cero Z2 (0, 0).
10
Para resolver el cociente entre Z1/Z2, se procede en forma análoga al utilizado para la forma binómica o
cartesiana, multiplicando numerador y denominador por el conjugado del denominador, o sea:
𝑍1 𝜌(cos 𝛼 + 𝑖 𝑠𝑒𝑛 𝛼). 𝜎(cos 𝜔 − 𝑖 𝑠𝑒𝑛 𝜔) 𝜌[(cos 𝛼 cos 𝜔 + 𝑠𝑒𝑛 𝛼 𝑠𝑒𝑛 𝜔) + 𝑖(𝑠𝑒𝑛 𝛼 cos 𝜔 − cos 𝛼 𝑠𝑒𝑛 𝜔)]
= =
𝑍2 𝜎(cos 𝜔 + 𝑖 𝑠𝑒𝑛 𝜔). 𝜎(cos 𝜔 − 𝑖 𝑠𝑒𝑛 𝜔) 𝜎[(cos 𝜔 cos 𝜔 + 𝑠𝑒𝑛 𝜔 sen 𝜔) + 𝑖(𝑠𝑒𝑛𝜔 cos 𝜔 − cos 𝜔 𝑠𝑒𝑛 𝜔)]
y del denominador:
[(cos cos - i cos sen + i sen cos + sen sen )] = cos2 + sen2 = 1
o sea:
𝒁𝟏 𝝆
= [𝐜𝐨𝐬 (𝜶 − 𝝎) + 𝒊 𝒔𝒆𝒏 (𝜶 − 𝝎)]
𝒁𝟐 𝝈
Es decir, “El cociente de dos números complejos dados en forma trigonométrica, polar o exponencial,
siendo el denominador distinto de cero, es otro número complejo, cuyo módulo es el cociente de los
módulos dados y cuyo argumento es la diferencia entre los argumentos del dividendo y del divisor”.
valores estos que se repiten cíclicamente dándole a “k” los valores de: n , n+1 , n+2 , . . . ; pues para k = n,
por ejemplo, obtenemos:
𝜑 + 𝑛. 2𝜋 𝜑 𝑛 . 2𝜋𝑘 𝜑 𝜑
( ) =( )+( ) = + 2𝜋 =
𝑛 𝑛 𝑛 𝑛 𝑛
que como podemos observar es el mismo argumento que para k = 0, aumentado en 2, y así sucesivamente.
Luego: “Todo número complejo no nulo, [Z = ( )], tiene “n” raíces (obtenidas por la fórmula 12), de
módulo 𝑛√𝜌 y cuyos argumentos mínimos se obtienen de la expresión:
𝜑 2𝜋𝑘
𝜔= +
𝑛 𝑛
al dar a “k” valores desde 0 (cero) hasta n-1 ”.
Ejemplo:
Dado 𝑍 = −2 − 2√3 𝑖 , hallar y representar gráficamente Z1/4 .
Para expresar Z en forma trigonométrica o polar, necesitamos conocer su módulo y su argumento, o sea:
2
2
Z a 2 b2 2 3 4 4.3 4 12 16 4
2
El ángulo o argumento del complejo lo obtenemos como el arco tangente de la relación entre el valor de la
parte imaginaria sobre el valor de la parte real;
b
arc tan
a
En éste caso en particular, si graficáramos el complejo dado, tendríamos que el mismo estaría representado
en el tercer cuadrante, dado que tanto la parte real como la parte imaginaria son ambas negativas y el vector
representativo de dicho complejo está ubicado en el tercer cuadrante, es decir entre 180º y 270º grados
sexagesimales.
Efectuando el cálculo del ángulo, tendremos entonces:
2 3
arc tan arc tan 3 2400
2
y que como podemos observar “ ” ,pertenece al tercer cuadrante.
Aplicando la fórmula, obtenemos las raíces:
2400 2400 4
Para k = 0 Z0 4 4 cos i sen
4 cos 60 i sen 60
0 0
4 4
240 360
0 0
2400 3600 4
Para k = 1 Z1 4 cos
4
i sen
4 cos 150 i sen 150
0 0
4 4
240 720
0 0
240 720 4
0 0
Para k = 2 Z2 4 4 cos i sen
4 cos 240 i sen 240
0 0
4 4
240 1080
0 0
240 10800 4
0
Para k = 3 Z3 = 4 4 cos i sen
4 cos 330 i sen 330
0 0
4 4
12
Para representar gráficamente dichas raíces, debemos trazar una circunferencia con centro en el origen de un
4
sistema de coordenadas cartesianas ortogonales y radio 𝑛√𝜌 (en nuestro caso √4); a esta circunferencia
pertenecerán las imágenes de las “n” raíces.
Una de las imágenes (punto Z0) se determina considerando a partir del semieje positivo de las abscisas, el
valor de un ángulo medido en sentido antihorario igual /n (valor del argumento dividido por “n”) y las
restantes raíces diferirán de esta primera un valor angular de 360º dividido “n”.
Uniendo los extremos de los vectores que representan las “n” raíces, obtenemos un polígono regular de “n”
lados. En nuestro caso representará un cuadrado inscripto en la circunferencia de radio 𝑛√𝜌 .
Zo
y
Z1
4
Z1 Radio = 4
a
60º
O
x
Z3
Z2
13
UNIDAD N°2: Vectores libres en R2 y R3
Vectores
Magnitudes escalares y magnitudes vectoriales
Del conjunto de las magnitudes utilizadas distinguiremos dos grupos: las magnitudes escalares y las
magnitudes vectoriales.
Las primeras son aquellas que se expresan por un número y la unidad correspondiente, tales como:
volúmenes (3m3), masas (5 Kg masa), energías, cantidades de calor, potenciales eléctricos, etc. Dichas
magnitudes pueden ser representadas por segmentos tomados sobre una recta a partir de un origen y de
longitud igual al número real que indica su medida.
Para definir las magnitudes vectoriales debemos dar simultáneamente su módulo, su dirección y su
sentido.
Son magnitudes vectoriales: las fuerzas (7 Nw), velocidades (30 r.p.m. ó 140 Km/hora), campo eléctrico,
etc.
Un segmento de recta queda determinado por dos puntos extremos. Cuando dichos puntos están dados en
cierto orden, se dice que el segmento está orientado. Un vector es entonces un segmento orientado.
El primero de los puntos que lo determinan se llama origen o punto inicial y el segundo, extremo o punto
final del vector.
El módulo es un número que indica la intensidad de la magnitud que el vector representa y es un
valor siempre positivo.
La dirección es la de la recta soporte o sostén del vector ; de tal manera que todas las rectas
paralelas tienen la misma dirección, en cambio, rectas no paralelas tienen direcciones diferentes.
El sentido está dado por la punta del vector, pues cada dirección tiene dos sentidos y el mismo
queda determinado partiendo de su origen y dirigiéndose hacia su extremo.
Toda magnitud vectorial puede representarse entonces por un vector, cuya longitud sea proporcional a la
intensidad de la magnitud que representa y cuya dirección y sentido sean correspondientes a la magnitud
vectorial considerada.
E
Para indicar un vector se usa una letra minúscula a la cual se le
coloca encima una flecha o un trazo de la siguiente manera
𝑎̅ ⃗⃗⃗⃗⃗⃗ ̅̅̅̅
𝑎⃗ , 𝑎̅ 𝑜 𝑏𝑖𝑒𝑛 𝑂𝐸 ó 𝑂𝐸
O
Clases de vectores
Existen distintas clases de vectores.
Vectores axiales o deslizables: se llama así al vector cuyo sentido y recta de acción están fijados, no así
su punto de aplicación, pudiendo desplazarse sobre la recta de acción.
Vector ligado: vector axial o deslizable que además se da el punto de aplicación
Vector libre o equipolente: aquel que no tiene definidos ni el punto de aplicación ni la recta de acción y
se lo puede trasladar a cualquier punto del espacio.
En el cálculo vectorial lo que más interesa son los vectores libres, y las reglas de cálculo son las mismas
para todos los vectores, por lo cual prescindiremos en lo que sigue de hacer distinciones entre ellos y
sobreentenderemos que trabajamos con vectores libres.
14
Componentes de un vector
Vamos a referir nuestro estudio a un sistema de ejes coordenados cartesianos ortogonales en el espacio
tridimensional, de origen “O” y ejes “x”, “y”, “z”.
zF
az
az
zP F
P ay
ax
yP ay yF
o y
xP
ax
xF
x
(fig. 1)
Sean P (xP, yP, zP) y F(xF, yF, zF) el origen y el extremo de un vector dado ā, según lo indicado en la figura.
Se llaman componentes de un vector ā respecto al sistema de ejes coordenados (0, x, y, z), a las
proyecciones de ā sobre los ejes, o sea, a los números:
ax = xF – xP ; ay = yF – yP ; a z = zF - zP (1)
y en forma genérica, escribiremos: 𝑎̅ (ax ; ay ; az) para indicar que ax , ay, a z son las componentes del vector
𝑎̅.
Remarquemos que estas componentes son números que pueden ser positivos o negativos. Siempre debemos
tomarlos como se definen en (1), es decir, como diferencia entre las coordenadas del extremo o del punto
final (F) del vector y las coordenadas del origen o principio del vector (P).
De esta manera resulta que dos vectores opuestos (de igual módulo y de igual dirección, pero de sentidos
opuestos), tienen las componentes iguales en valor absoluto, pero de signos contrarios.
Al observar la figura 1, vemos que el vector ā es la diagonal de un paralelepípedo, cuyas aristas son: ax , ay ,
az .
El módulo del vector ā , verifica:
a ax2 a y2 az2
expresión que se toma siempre positiva y que nos da el módulo de un vector en función de sus componentes.
15
Cosenos directores de un vector
Si hacemos coincidir el origen de un vector v , con el origen de un sistema de ejes coordenados ortogonales,
observamos que dicho vector forma con los sentidos positivos de los ejes, los ángulos , y .
v
vZ
O
vY y
vX
x
(fig. 2)
Los ángulos hay que tomarlos entre 0º y 180º, de manera que los cosenos directores pueden ser positivos o
negativos.
Los cosenos de dichos ángulos se denominan cosenos directores.
De la expresión general del coseno, se deduce:
cat.adyacente
cos
hipotenusa
entonces resulta:
v vy v
cos x ; cos ; cos z (2) ,
v v v
de donde podemos despejar:
vx v cos ; v y v cos ; vz v cos (3),
que expresan que la proyección de un vector (o segmento orientado) sobre un eje; es igual a la longitud
del segmento (módulo) por el coseno del ángulo que el mismo forma con el eje.
Elevando al cuadrado la expresión (3) :
2 2 2
v2x = v cos2 ; v2y = v cos2 ; v2 z = v cos2 γ
y sumando miembro a miembro, se tiene:
2 2 2 2
v2 x + v2y + v2 z = v cos2 + v cos2 + v cos2 γ = v (cos2 + cos2 + cos2 γ ) (4)
y recordando que el valor del módulo de un vector puede ser expresado por :
v vx2 v y2 vz2
resulta (4) igual a :
𝒄𝒐𝒔𝟐 ∝ +𝒄𝒐𝒔𝟐 𝜷 + 𝒄𝒐𝒔𝟐 𝜸 = 𝟏
que es la relación fundamental que liga los cosenos directores de un vector.
De las expresiones (2) y (3), se deduce también que:
vx vy vz
cos ; cos ; cos
vx2 vy2 vz2 vx2 vy2 vz2 vx2 v y2 vz2
es decir, un vector queda completamente determinado (módulo, dirección y sentido) por sus
componentes.
16
Igualdad de vectores
Dos vectores se dicen iguales cuando tienen el mismo módulo, la misma dirección y el mismo sentido.
Así los vectores de la figura son iguales, lo cual se escribe:
𝑎̅ = 𝑏̅
𝑎̅ 𝑏̅ Esta definición de igualdad es admisible, pues ella cumple
las tres propiedades que se exigen a toda definición de
igualdad entre elementos de un conjunto, a saber:
(fig. 3)
Reflexiva 𝑎̅ = 𝑎̅
Simétrica 𝑠𝑖 𝑎̅ = 𝑏̅ , 𝑏̅ = 𝑎̅
Transitiva 𝑠𝑖 𝑎̅ = 𝑏̅ 𝑦 𝑏̅ = 𝑐̅ , 𝑒𝑠 𝑎̅ = 𝑐̅
El módulo de un vector es siempre un número positivo.
Del análisis y comparación de la definición de componentes de un vector y de la definición general de
igualdad de vectores se deduce: dos vectores iguales tienen las mismas componentes en cualquier
sistema de coordenadas.
aZ
zA a B
A
B2 B1
yA aY yB
y
xA
aX
xB
x (fig. 4)
Tomemos ahora sobre cada eje, vectores en su dirección y de módulo unitario. Todo vector de módulo
unitario se denomina versor.
Al versor correspondiente al eje “x” se lo designa 𝑖̅, al del eje “y” se lo designa 𝑗̅ y al del eje “z” se lo
nomina𝑘̅.
Considerando ahora las proyecciones del vector 𝑎̅ sobre los ejes como vectores; éstos serán: a x 𝑖̅; ay 𝑗̅; az 𝑘̅,
lo cual resulta de multiplicar los versores por las respectivas componentes del vector 𝑎̅
Trasladando los ejes al punto A es fácil ver que el vector ā resulta como suma geométrica (suma vectorial)
de los vectores proyección:
𝑎̅ = a x i + ay j + a z k
17
que es la expresión cartesiana del vector.
Diremos también que en R3 , las componentes de los versores son:
̅ (𝟎, 𝟎, 𝟏)
𝒊̅ (𝟏, 𝟎, 𝟎) , 𝒋̅ (𝟎, 𝟏, 𝟎) , 𝒌
Módulo de un vector
Si analizamos el triángulo AB1B2 (fig. 4), que es rectángulo en B2 , se obtiene por Pitágoras:
2 2 2
AB1 AB2 B2 B1
Del triángulo AB 1B , rectángulo en B1 , también por Pitágoras se obtiene:
2 2 2
AB AB1 B1 B ,
pero:
AB = ā ; AB2 = ax ; B2 B1 = ay ; B1 B = az ,
por lo tanto, reemplazando , resulta:
|𝑎| 2 = 𝑎𝑥 2 + 𝑎𝑦 2 + 𝑎𝑦 2
y despejando, se obtiene finalmente:
̅| = √𝒂𝒙 𝟐 + 𝒂𝒚 𝟐 + 𝒂𝒛 𝟐
|𝒂
Entonces como conclusión tenemos, que el módulo de un vector es igual a la raíz cuadrada de la suma de los
cuadrados de sus componentes.
Vectores paralelos
Si dos vectores ā (a x, ay, az) y b (bx, by, bz) son paralelos y del mismo sentido, tendrán los mismos cosenos
directores y por lo tanto, tendremos:
ax = ā cos ; ay = ā cos ; az = ā cos γ (1) Paralelos y del mismo
sentido.
bx = b cos ; by = b cos ; bz = b cos γ (2)
Si son paralelos y de sentidos contrarios, los ángulos que forman con los ejes coordenados difieren en 180º y
por lo tanto, los cosenos directores resultan iguales pero de signos opuestos; o sea que tendremos:
̅̅̅̅̅̅̅
𝑎+𝑏 P3
P1
𝑎̅ 𝑏̅
P2
O y
P2x
P3x
P1x
x
Se puede por tanto establecer: El vector suma de otros dos 𝑎̅ (𝑎𝑥 , 𝑎𝑦 , 𝑎𝑧 ) y 𝑏̅ (bx, by, bz) es el vector que
tiene por origen y extremo, respectivamente, el origen y el extremo de la poligonal obtenida llevando un
vector a continuación del otro. Las componentes del vector suma son las sumas de las componentes, o sea:
ax + bx ; ay + by ; az + bz y generalizando para más de dos vectores, diremos que las componentes del
vector suma son las sumas de las componentes homólogas de todos los vectores intervinientes.
1) Uniforme: ̅ ⇔ 𝑎̅ + 𝑏̅ = 𝑎′
𝑎̅ = 𝑎̅′ , 𝑏̅ = 𝑏′ ̅ + 𝑏′
̅
2) Asociativa: (𝑎̅ + 𝑏̅ ) + 𝑐̅ = 𝑎̅ + (𝑏̅ + 𝑐̅)
3) Conmutativa: 𝑎̅ + 𝑏̅ = 𝑏̅ + 𝑎̅
4) Del cero: existe un único vector, llamado el cero 0 (0, 0) , que sumado con cualquier otro vector no
lo altera: 0̅ + 𝑎̅ = 𝑎̅ + 0̅ = 𝑎̅
19
5) Del opuesto: dado un vector 𝑎̅ (a x, ay, a z), existe uno opuesto -𝑎̅ (-a x, -ay, -a z) (es decir el opuesto de
un vector es aquel que tiene las componentes con los signos opuestos o contrarios) que sumado con
aquel da por resultado el vector cero: 𝑎̅ + (-𝑎̅) = 0
En efecto, siendo λ 𝑎̅ y σ 𝑎̅ de la misma dirección que 𝑎̅ , su suma nos da un vector de la misma dirección,
cuyo módulo es el valor absoluto de la suma algebraica de dos segmentos cuyo sentido depende de los
signos de λ y σ y cuyos valores absolutos son λ ׀̅𝑎׀y σ ׀̅𝑎׀.
20
2) Es distributiva con respecto a la suma de vectores:
λ (𝑎̅ + b ) = λ 𝑎̅ + λ b
= 𝑎𝑥 𝑏𝑥 𝑖̅ . 𝑖̅ + 𝑎𝑥 𝑏𝑦 𝑖̅ . 𝑗̅ + 𝑎𝑥 𝑏𝑧 𝑖̅ . 𝑘̅ + 𝑎𝑦 𝑏𝑥 𝑗̅ . 𝑖̅ + 𝑎𝑦 𝑏𝑦 𝑗̅ . 𝑗̅ + 𝑎𝑦 𝑏𝑧 𝑗̅ . 𝑘̅ + 𝑎𝑧 𝑏𝑥 𝑘̅ . 𝑖̅ + 𝑎𝑧 𝑏𝑦 𝑘̅ . 𝑗̅ + 𝑎𝑧 𝑏𝑧 𝑘̅ . 𝑘̅
Consideremos en la expresión anterior, los productos escalares de los vectores unitarios o versores.
Recordemos que los versores coinciden con los ejes coordenados y estos son perpendiculares entre sí (90º).
Entonces tendremos:
𝑖̅ . 𝑖̅ = |𝑖̅||𝑖̅| cos 0° = 1 .1 .1 = 1 = 𝑖̅2
por igual razón:
𝑗̅ . 𝑗̅ = 1 = 𝑗̅2 𝑦 𝑘̅ . 𝑘̅ = 1 = 𝑘̅ 2
21
Otra forma de llegar al mismo resultado obtenido para el producto punto de dos vectores dados en su forma
canónica es: z
Sean 𝑢̅ = (ux, uy, uz) y 𝑣̅ = (vx, vy , vz) dos
P(uX;uY;u Z) vectores diferentes de cero. Si θ el ángulo
entre 𝑢̅ y 𝑣̅ (ver figura), entonces por la ley
de los cosenos resulta:
u
v Q(vX;vY ;vZ) ̅̅̅̅|2 = |𝑢̅ |2 + |𝑣̅ |2 − 2|𝑢̅ ||𝑣̅ | cos 𝜃
|𝑃𝑄
𝒖
̅ .𝒗
̅ = 𝒖𝒙 𝒗𝒙 + 𝒖𝒚 𝒗𝒚 + 𝒖𝒛 𝒗𝒛
El Producto Escalar goza de las siguientes propiedades:
a) Conmutativo: 𝑎̅ . 𝑏̅ = 𝑏̅ . 𝑎̅
b) Distributiva respecto a la suma de vectores: 𝑎̅ . (𝑏̅ + c ) = 𝑎̅. 𝑏̅ + 𝑎̅ . c
c) Si se multiplica uno de los vectores por un número, el producto escalar quedará multiplicado por
dicho número
( λ . 𝑎̅ ) . 𝑏̅ = λ (𝑎̅ . 𝑏̅ ) = (λ . 𝑏̅ ) . 𝑎̅ con la condición de que λ 0
2 ½
d) 𝑎̅ . 𝑎̅ = ; ׀̅𝑎׀es decir , ̅𝑎( = ׀̅𝑎׀. 𝑎̅ )
Demostración de d):
Supuesto que el ángulo θ entre 𝑎̅ y 𝑎̅ es cero, se tiene:
𝑎̅ . 𝑎̅ = ׀̅𝑎׀. ׀̅𝑎׀cos θ = ׀̅𝑎׀2 cos 0º = ׀̅𝑎׀2
(Tener presente que coseno de cero grado es igual a uno → cos 0º = 1)
De esta última expresión deducimos que si es nulo el producto escalar de dos vectores, no siéndolo
ninguno de ellos, podemos asegurar que los vectores son perpendiculares, o dicho de otra manera, la
22
condición necesaria y suficiente para que dos vectores sean perpendiculares es que su producto escalar
sea nulo, no siéndolo ninguno de los dos factores.
De la expresión del producto escalar 𝑎̅ . 𝑏̅ = a b cos θ , se puede despejar el valor de cos θ y a partir de
allí calcular θ , determinando para ello el valor del arc cos , o sea:
a .b
cos
a.b
pero habíamos visto que:
𝑎̅ . b = a x bx + ay by + a z bz
y también que:
a ax2 a y2 az2 y b b 2x by2 bz2
es decir que reemplazando se tiene:
ax bx a y by az bz ax bx a y by az bz
cos arc cos
ax2 a y2 az2 b 2x by2 bz2 ax2 a y2 az2 b 2x by2 bz2
También de la definición de producto escalar, 𝑎̅ . 𝑏̅ = |𝑎̅ |. |𝑏̅ | cos θ , se puede analizar la misma y considerar
del segundo miembro el producto de |𝑏̅ | cos θ. Dicho producto no es otra cosa que la proyección
P
̅
𝑏
del vector 𝑏̅ sobre el vector 𝑎̅. Si
observamos la figura, vemos que el vector
θ OP ' es la componente de 𝑏̅ en la
O 𝑏̅𝑎 P’ 𝑎̅ dirección de 𝑎̅, o sea:
a .b
OP ' b cos
a
Es útil, en algunas circunstancias “descomponer” un vector
en una suma de vectores perpendiculares. Si 𝑎̅ y 𝑏̅ son
vectores diferentes de cero en el espacio bidimensional o tridimensional, entonces es posible escribir al
vector 𝑎̅ como:
𝑎̅ = 𝑤 ̅̅̅1̅ +𝑤
̅̅̅̅2 w2
a
en donde ̅̅̅
𝑤1̅ es un múltiplo escalar del vector 𝑏 y ̅̅̅̅ ̅ 𝑤2 es perpendicular
̅
a 𝑏. w1 b
̅
El vector w1 recibe el nombre de proyección ortogonal de ā sobre 𝒃 y w2 es la componente de ā
ortogonal a 𝒃 ̅.
Los vectores w1 y w2 se pueden obtener de la forma siguiente.
Debido a que w1 es un múltiplo escalar del vector 𝑏̅ , entonces w1 puede ser expresado como:
w1 = k 𝑏̅
Por lo tanto: 𝑎̅ = w1 w2 = k 𝑏̅ + w2 (2)
̅
Si ahora efectuamos el producto escalar de los vectores 𝑎̅ y 𝑏 , considerando para ello el valor final del
vector 𝑎̅ dada por la expresión (2) , tendremos:
2
𝑎̅ . 𝑏̅ = ( k 𝑏̅ + w2 ) . 𝑏̅ = k b + w2 . 𝑏̅
Supuesto que w2 es perpendicular a b , se tiene entonces que: w2 . b = 0 , de modo que para esta
ecuación se llega a:
2
𝑎̅ . 𝑏̅ = k b
de donde se puede despejar el valor de k ; tenemos entonces:
23
a .b
k 2
b
y como habíamos expresado que w 1 = k 𝑏̅ se obtiene el valor de w 1 reemplazando el valor de k
últimamente determinado:
a .b
w1 k b 2
b
b
siendo entonces w 1 la proyección ortogonal del vector 𝑎̅ sobre el vector 𝑏̅ .
De la expresión 𝑎̅ = w 1 + w2 podemos despejar el valor de w2 y entonces tendremos: w2 = 𝑎̅ - w 1
expresión esta que queda:
a.b
w2 a 2
b siendo entonces w2 la componente del vector a ortogonal al vector b.
b
Producto vectorial
En algunas aplicaciones de ingeniería es útil poder realizar la construcción de un vector en el espacio
tridimensional que sea perpendicular a otros dos.
Este producto vectorial que a continuación desarrollaremos, nos da la solución de la inquietud planteada.
Se llama PRODUCTO VECTORIAL, PRODUCTO CRUZ ó PRODUCTO EXTERNO de dos vectores 𝑎̅
y 𝑏̅ , al vector o pseudo vector 𝑐̅ , que tiene:
El módulo igual al producto de los módulos de 𝑎̅ y 𝑏̅ por el seno del ángulo que forman dichos vectores; la
dirección es perpendicular al plano determinado por las direcciones de los vectores 𝑎̅ y
El módulo del vector o pseudo vector que representa el producto vectorial es igual al área del
paralelogramo construido con los vectores que intervienen en dicho producto vectorial.
i j k ; j i k o sea j i k
j k i ; k j i o sea k j i
k i j ; ik j o sea i k j
Propiedades:
1) a b ( b a ) No es conmutativo o es anticonmutativo.
2) 𝑎̅ ( b + c ) (𝑎̅ b ) + (𝑎̅ c ) Propiedad distributiva (por izquierda)
3) (𝑎̅ + b ) c (𝑎̅ c ) + ( b c ) Propiedad distributiva (por derecha)
4) 𝑎̅ b c 𝑎̅ b c No goza de la propiedad asociativa.
5) Siendo λ un escalar se verifica: λ (𝑎̅ b ) (λ𝑎̅ ) b 𝑎̅ (λ b )
6) 𝑎̅ ∧ 0̅ = 0̅ ∧ 𝑎̅ = 0̅
7) 𝑎̅ 𝑎̅ 0
𝑎̅ = 𝑎𝑥 𝑖̅ + 𝑎𝑦 𝑗̅ + 𝑏𝑧 𝑘̅
𝑎̅ 𝑏̅ = 𝑎𝑥 𝑏𝑥 𝑖̅2 + 𝑎𝑥 𝑏𝑦 𝑖̅ ʌ 𝑗̅ + 𝑎𝑥 𝑏𝑧 𝑖̅ ʌ 𝑘̅ + 𝑎𝑦 𝑏𝑥 𝑗̅ ʌ 𝑖̅ + 𝑎𝑦 𝑏𝑦 𝑗̅2 + 𝑎𝑦 𝑏𝑧 𝑗̅ ʌ 𝑘̅ + 𝑎𝑧 𝑏𝑥 𝑘̅ ʌ 𝑖̅ + 𝑎𝑧 𝑏𝑦 𝑘̅ ʌ 𝑗̅ + 𝑎𝑧 𝑏𝑧 𝑘̅ 2 =
= 𝑎𝑥 𝑏𝑦 𝑘̅ − 𝑎𝑥 𝑏𝑧 𝑗̅ − 𝑎𝑦 𝑏𝑥 𝑘̅ + 𝑎𝑦 𝑏𝑧 𝑖̅ + 𝑎𝑧 𝑏𝑥 𝑗̅ − 𝑎𝑧 𝑏𝑦 𝑖̅
siendo éste el resultado que nos da las componentes del vector producto vectorial.
Al mismo resultado se llega mediante la resolución de un determinante planteado de la siguiente manera:
25
Producto mixto de tres vectores
Se llama producto mixto de tres vectores 𝑎̅ , 𝑏̅ , 𝑐̅ y se representa por (𝑎̅ ˄ 𝑏̅ . 𝑐̅) al resultado del producto
vectorial de los vectores 𝑎̅ y 𝑏̅ multiplicado en forma escalar por el vector 𝑐̅.
por los vectores a y b y cuyo módulo representa el área del paralelogramo definido por dichos vectores
(base del paralelepípedo). Dicho Vector Producto Vectorial hace un ángulo γ con
el vector 𝑐̅ , con quien se debe multiplicar en forma escalar, resultando de ello que dicho producto representa
la altura del paralelepípedo (proyección del vector 𝑐̅ sobre el vector producto vectorial). (Recordemos que el
producto escalar de dos vectores me da como resultado un escalar).
Puede suceder que el valor del Volumen (solución del producto mixto) resulte negativo. Esto ocurrirá
cuando el ángulo sea mayor que un recto (en éste caso el cos γ es negativo, es decir, cuando γ toma valores
entre 90º y 180º).
26
Combinación lineal de vectores
Dependencia e independencia lineal de vectores
Sean 𝑒̅ , 𝑔̅ y ℎ̅ tres vectores no paralelos a un mismo
h plano y 𝑎̅ otro vector cualquiera. Proyectando el
vector 𝑎̅ sobre cada uno de los vectores 𝑒̅ , 𝑔̅ y ℎ̅
(considerados como ejes de referencia), paralelamente
al plano determinado por los otros dos y llamando a1 ,
a
a 2 y a 3 a los vectores obtenidos como proyección,
a3 resulta entonces: 𝑎̅ 𝑎̅1+ 𝑎̅2 + 𝑎̅3.Por otra parte,
siendo 𝑎̅1 un vector que tiene la dirección de 𝑒̅ , es:
a2 𝑎̅1 = p 𝑒̅, siendo p un escalar (igual al cociente entre
g los módulos de 𝑎̅1 y 𝑒̅ , con signo positivo (+) si estos
a1 tienen el mismo sentido y signo negativo (-) si tienen
sentidos opuestos). Análogamente es 𝑎̅2 = q 𝑔̅ y 𝑎̅3 =
r ℎ̅ , siendo q y r escalares.
e
Resulta así:
𝑎̅ = 𝑝𝑒̅ + 𝑞𝑔̅ + 𝑟ℎ̅ (1).
Entonces podemos concluir de esto, que:
Dados tres vectores 𝒆̅, 𝒈 ̅ , en R3 , no paralelos a un mismo plano, todo otro vector ā puede
̅ y 𝒉
escribirse en la forma indicada en (1), es decir, como una combinación lineal de ellos.
Recordando que el vector de longitud cero se denomina vector cero o vector nulo y el mismo se indica por
0 . El mismo no tiene dirección natural y por tal razón se le podrá asignar cualquier dirección que resulte
conveniente para el problema considerado.
Sean los vectores unitarios o versores 𝑖̅, 𝑗̅, 𝑘̅ . Deseamos hallar los posibles escalares d1 , d2 y d3 que
satisfagan:
0̅ = 𝑑1 𝑖̅ + 𝑑2 𝑗̅ + 𝑑3 𝑘̅
Expresado en función de sus componentes, resulta:
(0 , 0 , 0) = 𝑑1 (1 , 0 , 0) + 𝑑2 (0 , 1 , 0) + 𝑑3 (0 , 0 , 1)
(0 , 0 , 0) = (𝑑1 , 0 , 0) + (0 , 𝑑2 , 0) + (0 , 0 , 𝑑3 ) = (𝑑1 , 𝑑2 , 𝑑3 )
de donde:
𝑑1 = 0 , 𝑑2 = 0 , 𝑑3 = 0
Se trata pues de un sistema con solución única y la misma es nula.
En forma general:
0 = 0 v1 + 0 v2 + . . . . . . . + 0 vn
Resulta que en éste caso todos los escalares son nulos. Se trata pues de una combinación lineal trivial.
Consideremos ahora los vectores u = (1, 2, 3) y v = ( 2, 4, 6). Podemos expresar:
2 u + (-1) v = 0
es decir, se puede obtener el vector nulo como combinación lineal de los vectores u y v a través de los
escalares 2 y -1.
Tenemos entonces que aparte de la combinación lineal trivial, que siempre se puede formar, puede existir
otra combinación, en donde los escalares no sean todos nulos. Entonces podremos definir:
“Un conjunto de vectores ̅̅ 𝒖̅̅𝟏 , ̅̅
𝒖̅̅𝟐 , … , ̅̅̅̅
𝒖𝒏 se dice linealmente independiente cuando la única posibilidad
de expresar al vector nulo como combinación lineal de ellos es mediante escalares todos nulos
(combinación lineal trivial)”.
27
Por otra parte decimos que: “Si existe alguna combinación lineal con coeficientes no todos nulos, los
vectores se dicen linealmente dependientes”.
El significado geométrico de la definición anterior, es el siguiente: Si dos vectores u y v son linealmente
dependientes, indica que se puede escribir:
d1 u + d2 v = 0
d d
suponiendo que: d1 0 , tendremos: u = 2 v y llamando d = 2 , nos queda u = d v
d1 d1
es decir “ u ” es un múltiplo escalar de v ; dicho de otra manera, ambos vectores tiene la misma dirección
(son paralelos).
Cuando esto no ocurre, los vectores son linealmente independientes y tendrán direcciones distintas.
La condición necesaria y suficiente para que tres vectores sean coplanares, es que sean linealmente
dependientes. Si los vectores son linealmente independientes, los mismos tienen tres direcciones diferentes.
En otras palabras, tres vectores son linealmente dependientes sí y sólo sí su producto mixto es cero (es decir
no generan volumen).
Las propiedades de dependencia e independencia lineal nos permiten definir el concepto de base y
dimensión.
La dimensión de un espacio vectorial está dada por el número máximo de vectores independientes de dicho
espacio vectorial.
Por ejemplo, si la dimensión es tres (3), son necesarios tres vectores linealmente independientes para definir
dicha dimensión; y si la dimensión fuese “n” es necesario tener “n” vectores linealmente independientes.
El análisis del espacio de tres dimensiones (R3), nos da una idea general acerca de lo que se puede
considerar como una base.
Todo conjunto de tres vectores linealmente independientes en R3 definen una base de dicho espacio
vectorial. En cada espacio existe más de un conjunto linealmente independiente que permite definir una
base; es decir que para cada espacio vectorial “n” dimensional hay conjuntos de vectores distintos
linealmente independientes que conforman bases para dicho espacio vectorial.
Cambiar un vector “𝒗 ̅” de base en un espacio vectorial a otra base de dicho espacio vectorial, significa
cambiar el sistema de ejes coordenados, luego en este nuevo sistema (nueva base) el vector tendrá otras
componentes que lo identifiquen.
28
UNIDAD N°3: Matrices.
Se llama matriz a un cuadro ordenado, que puede contener en su interior números reales o complejos, letras
o números y letras; es decir elementos dispuestos en un cierto orden, distribuidos en “m” filas y “p”
columnas.
A los elementos de una matriz se los distingue con un doble subíndice; el primero indica el número de orden
de la fila contando de arriba hacia abajo; y el segundo, el número de orden de la columna contando de
izquierda a derecha. Por ejemplo, el elemento 𝑎ij ocupa la fila “i” y la columna “j”.
Se identifica a las matrices, encerrando el cuadro de elementos entre corchetes, [ ] , paréntesis gruesos, ( ) ,
o dobles barras .
Entonces una matriz que tenga “m” filas y “n” columnas, se dice que es de dimensión, de orden, de tamaño
o de tipo “m x n”.
Si la matriz tiene “m” filas y “m” columnas, decimos que la matriz es cuadrada de orden “m”.
A las matrices las identificamos con letras mayúsculas (A, B, C, . . . . , M) y se las escribe del siguiente
modo:
a11 a12 a13 ........ a1n
a
21 a22 a23 ........ a2 n
A . . . ........ .
. . . ........ .
am1 am 2 am3 ........ amn
Esta es la matriz “A” de orden “m x n” . En forma abreviada se expresan las matrices:𝐴 = ‖𝑎𝑖𝑗 ‖, en donde i
= 1, 2, 3, . . . . , m y j = 1, 2, 3, . . . . . , p .
Si se quiere poner en evidencia las dimensiones de la matriz, se escribe: A (mxp) = ‖𝑎𝑖𝑗 ‖. No usaremos la
notación [𝑎ij] ó (𝑎ij) ya que se puede pensar que los corchetes o los paréntesis encierran un único elemento
𝑎ij La matriz compuesta de una sola fila se llama matriz fila o vector fila y se conviene usar paréntesis para
indicar (encerrar) una matriz de una sola fila:
A = (𝑎1 𝑎2 𝑎3 . . . . . 𝑎p )
La matriz compuesta de una sola columna se llama matriz columna o vector columna y en este caso se usan
a1
a
2
los corchetes para designarla. A .
.
am
Para simplificar la escritura, en lugar de escribir en columna los elementos de la matriz columna, se los
puede escribir en fila, encerrando los mismos entre corchetes:
A = [𝑎1 𝑎2 . . . . . . . 𝑎m ]
Existe completa equivalencia entre vectores y matrices que tienen una sola fila o una sola columna. Cuando
estudiemos las operaciones con matrices, comprobaremos que la definición de igualdad, la adición y
multiplicación por un escalar coincide para vectores y para matrices filas o columnas. En muchas ocasiones
es conveniente representar las filas o columnas de una matriz como vectores. Entonces una matriz “A” puede
ser escrita como una fila de vectores columnas o bien como una columna de vectores fila.
29
a11 a12 a13 ...... a1n B1
a B
21 a22 a23 ...... a2 n 2
a a32 a33 ...... a3n B3
A 31 ( A1 A2 A3 . . . . Ap ) B1 B2 B3 . . . . Bm
. . . ...... . .
. . . ....... . .
am1 am 2 am3 ...... amn Bm
donde el vector correspondiente a la columna “j” es: Aj = [𝑎1j 𝑎2j 𝑎3j . . . . . 𝑎mj] y el vector
correspondiente a la fila “i” es: Bi = (𝑎i1 𝑎i2 𝑎i3 . . . . . . . 𝑎in )
Igualdad de Matrices:
Dos matrices son iguales sí y sólo sí tienen el mismo orden (es decir igual número de filas y de columnas) y
sus elementos correspondientes son iguales. (Se llaman elementos correspondientes a aquellos que
pertenecen a igual fila e igual columna).
Simbólicamente, dadas las matrices:
A = (𝑎ij ) y B = ( bij ) , resulta A = B 𝑎ij = bij
Adición o Suma de Matrices:
Es condición necesaria para que se puedan sumar dos matrices, que las mismas sean de igual orden, es decir
que tengan igual número de filas y de columnas entre sí. En este caso se dice que las matrices son
“sumables” o “conformables”.
Entonces, dadas las matrices A = (𝑎ij ) y B = ( bij ) definidas en el campo de los números reales y de orden
n x m, la suma es otra matriz “C = ( cij )”, que también pertenece al campo de los números reales y es
igualmente de orden n x m, y cuyos elementos son la suma de los elementos correspondientes de las
matrices dadas.
Es decir:
C = A + B ( cij ) = (𝑎ij ) + ( bij )
Ejemplo: Sean:
3 1 2 3 2 4
A y B
4 0 5 1 2 0
resulta:
3 (3) 1 2 (2) 4 0 3 2
C AB
(4) 1 0 (2) 5 0 3 2 5
fila i
Cij
o expresado de otra manera, diremos que multiplicamos el primer elemento de la fila “i” por el primer
elemento de la columna “j” a quien le sumamos el producto del segundo elemento de la fila “i” por el
segundo elemento de la columna “j”, más el producto del tercer elemento de la fila “i” por el tercer elemento
de la columna “j”, y así sucesivamente, hasta haber completado todos los elementos de dicha fila y columna.
b11 b12
b21 b22
b31 b32
En el producto A.B se dice que A multiplica a B por la izquierda (o que A premultiplica a B) y que B
multiplica a A por la derecha ( o que B posmultiplica a A).
Aclaración: Se ha efectuado en forma práctica (en números), el producto de la matriz “A” de orden dos por
tres (2x3) por la matriz “B” de orden tres por dos (3x2), obteniendo como resultado la matriz “C” de orden
dos por dos (2x2).
Podemos observar en este ejemplo que tanto en la matriz “A” (la matriz que premultiplica) como en la
Matriz “C” (matriz resultado), que existe en ambas una fila adicional (números encerrados en un cuadrito).
La fila adicional de la matriz “A” ha sido constituida sumando los elementos de dicha matriz por columnas,
o sea, de la primera columna: -2 + 5 = 3 ; de la segunda columna: 3 + 6 = 9 ; y de la tercera columna: 1 + 4 =
31
5. Una vez constituida dicha fila adicional en la matriz “A”, utilizo la misma como si se tratara de una fila
más de “A”, operando la misma en forma similar a las otras filas de “A”, lo cual me da por resultado la
tercer fila de la matriz “C”. Los números de esta tercer fila de la matriz resultado “C”, deben ser iguales a la
suma de los elementos de las columnas de dicha matriz “C”, o sea:
41 = 8 + 33 , y , -4 = -2 + (-2).
Esta operación adicional al producto de las matrices “A” y “B” nos permite comprobar la exactitud de los
resultados obtenidos; es decir se trata de una verificación del producto de las matrices “A” y “B”.
Esta proposición permite demostrar, (bajo la condición de que el número de columnas de la matriz que
premultiplica sea igual al número de filas de la matriz que posmultiplica), que el Producto de
Matrices goza de la Propiedad Asociativa.
El producto de las matrices A.B.C , ya citadas, me da como resultado otra matriz D de orden nxq . Esto
resulta que si multiplico las matrices A.B el resultado es una matriz F de orden nxp; la cual puedo
multiplicar por la matriz C de orden pxq y dicho resultado me da la matriz D de orden nxq. En esta
forma puedo continuar con el análisis y demostrar la Propiedad Asociativa.
3) Propiedad Distributiva: La operación ( A+B ).C = A.C + B.C , indica que el producto de matrices es
distributivo a derecha respecto a la suma de matrices.
También: C.( A+B ) = C.A + C.B , goza de la Propiedad Distributiva, pero en este caso decimos que
es distributiva a izquierda respecto de la suma de matrices.
4) Puede ocurrir también que como consecuencia del producto de dos matrices no nulas, obtengamos por
resultado una matriz NULA.
A 0
A. B 0
B 0
5) El producto de una matriz “A” por una matriz nula, ó el producto de una matriz nula por una matriz
“A”, da por resultado una matriz NULA
.A.0 = 0.A = 0
6) El producto de un escalar “” por el producto de dos matrices es igual al producto de dicho escalar por
una de ellas y este resultado luego multiplicado por la otra matriz, o sea:
( B.C ) = ( .B).C = B.( .C)
7) La transpuesta del resultado del producto de dos matrices es igual al producto de dichas transpuestas
pero en orden inverso:
( A.B ) t = B t.At
33
a11 a12 a13 . . . . . a1n
a
21 a22 a23 . . . . . a2 n
a a32 a33 . . . . . a3n
A 31
. . . ..... .
. . . ..... .
an1 an 2 an 3 . . . . . ann
los elementos 𝑎11, 𝑎22, 𝑎33, . . . ., 𝑎nn son los que constituyen la diagonal principal de la matriz A.
En cambio, si consideramos los elementos ubicados entre dos líneas paralelas imaginarias que se
extienden desde el ángulo inferior izquierdo al ángulo superior derecho, tendremos la diagonal secundaria
de dicha matriz “A”.
Traza de una Matriz: Se denomina traza de una matriz cuadrada a la suma de los elementos de su diagonal
principal.
Ejemplo:
5 2 3
A 1 0 2 es su traza entonces: 5 + 0 +3 = 8
4 1 3
Matriz Diagonal: Una matriz cuadrada cuyos elementos son todos nulos, excepto los de la diagonal
principal, se llama matriz diagonal. Es decir:
Anxn es diagonal i j 𝑎ij = 0
Ejemplo:
a11 0 0 2 0 0
A 0 a22 0 ; B 0 3 0
0 0 a33 0 0 5
Matriz Escalar: Se denomina matriz escalar a la matriz diagonal que tiene todos los elementos de la
diagonal iguales; es decir, Anxn es escalar, cuando:
Ejemplos:
0 0 3 0 0 𝑎ij = sí i = j
A 0 0 ; B 0 3 0
0 0 0 0 3 𝑎ij = 0 sí i j
Matriz Unidad o Matriz Identidad: Se llama matriz unidad o matriz identidad a la matriz escalar en la
cual todos los elementos de la diagonal principal son iguales a uno ( 1 ). Esta matriz se la señala como
matriz “I”.
En la matriz I nxn se cumple que: 𝑎ij = 1 sí i = j
Ejemplo:
1 aij0= 00 sí 0i j
0 1 0 0
0
I 0 1 0
1 0
I ;
0 0 1 0
0 0 1
0 0 0 1
y además se verifica que: A.I = I.A = A
2 1 1 0
I (2 x 2)
4
si A(2 x 2) e
3 0 1
entonces se cumple que
2 1 1 0 2 1
A. I I . A .
3 4 0 1 3 4
34
Matriz Simétrica: Una matriz cuadrada se denomina simétrica sí y sólo sí es igual a su transpuesta. Por lo
tanto, en una matriz simétrica los elementos simétricos con respecto a la diagonal principal son iguales; es
decir: Anxn es simétrica A = At 𝑎ij = 𝑎ji
Ejemplo:
La matriz
1 5 6 1 5 6
A 5 3 2 es simétrica, pues es igual a A 5 3 2
t
6 2 4 6 2 4
Matriz Antisimétrica: Una matriz cuadrada se denomina antisimétrica sí y sólo sí es igual a la opuesta de
su transpuesta. Por lo tanto en una matriz antisimétrica los elementos simétricos con respecto a ladiagonal
principal son opuestos. Es decir Anxn es antisimétrica sí y sólo sí A = - At 𝑎ij = - 𝑎ji
Ejemplo:
La matriz
0 5 6
A 5 0 2 es antisimétrica.
6 2 0
Nota: Los elementos de la diagonal principal de una matriz antisimétrica son nulos, pues para que 𝑎ii = - 𝑎 ii
sólo se puede verificar si 𝑎ii = 0.
Son válidas las siguientes Propiedades:
1) El producto de toda matriz por su transpuesta es una matriz simétrica, o sea A.At es simétrica (no
es necesario que la matriz considerada sea cuadrada).
2) La suma de toda matriz cuadrada y de su transpuesta es simétrica; o sea: A + At es simétrica
3) La diferencia de toda matriz cuadrada con su transpuesta es antisimétrica; o sea: A – At es
antisimétrica.
4) Toda matriz cuadrada es la suma de una matriz simétrica y de una matriz antisimétrica. Si “A” es
una matriz cuadrada de orden nxn, de las propiedades 2ª y 3ª resulta que: ½ (A+A t) es simétrica, y que
½ (A-At) es antisimétrica, por lo tanto: A = ½ (A+At) + ½ (A-At)
Matriz Triangular: Una matriz cuadrada se denomina “triangular” cuando los elementos ubicados por
encima o por debajo de la diagonal principal son ceros. Es decir, existen dos tipos de matrices
triangulares.
Matriz Triangular superior es aquella en la cual los elementos nulos son los que están por debajo de
la diagonal principal. Esto se expresa: Matriz Triangular superior i j 𝑎ij = 0
Ejemplo:
1 2 3
TS 0 6 4
0 0 8
Matriz Triangular inferior es aquella en la cual los elementos nulos se encuentran por encima de la
diagonal principal. Esto se expresa: Matriz Triangular inferior i j 𝑎ij = 0
Ejemplo:
2 0 0
TI 5 4 0
3 6 7
Matriz Escalonada: Se denomina matriz escalonada a una matriz no necesariamente cuadrada, que tiene la
forma similar a una matriz triangular superior, en la cual los renglones o filas cuyos elementos son todos
nulos aparecen en la parte inferior de la matriz; y además, en los renglones que no contienen solamente
ceros, el primer elemento no nulo en el renglón inferior ocurre más hacia la derecha que el primer
elemento no nulo del renglón superior.
35
Ejemplos de matrices escalonadas:
2 4 5 7 1 5 3 5 4 9 6 3 5 7
0 0 3 2 4 8 3 2 1 0 4 3 1 8
; 0 5 7 ; ; 0 2 0
0 0 0 6 2 9 0 0 0 9 6 0 0 6
0 0 9
0 0 0 0 4 7 0 0 0 0 0 0 0 0
Matriz Inversa: Decimos que una matriz cuadrada “A” es invertible, si es posible encontrar una matriz
cuadrada “B” del mismo orden que “A”, tal que:
A.B = B.A = I
Entonces la matriz “B” es la matriz inversa de “A” y viceversa.
La matriz inversa de “A” se la indica con el símbolo A -1.
Matriz Ortogonal: Una matriz cuadrada no singular se denomina ortogonal sí y sólo sí su inversa es igual
a su transpuesta; o sea A es ortogonal A-1 = At. O también, expresado de otra manera, una matriz
cuadrada es ortogonal, sí y sólo sí el producto de dicha matriz por su transpuesta da como resultado la
matriz unidad, o sea:
A es ortogonal A . At = At . A = I
Ejemplo: La matriz
1 3 1 3
A 2 2 es ortogonal, pues A T
2 2
3 1 3 1
2 2 2 2
y se cumple:
1 3 1 3
2 2 . 2 2 1 0
3 1 3 1 0 1
2 2 2 2
y además el producto escalar de los vectores filas o columnas debe ser igual a cero, es decir los vectores filas
o columnas deben ser perpendiculares entre sí.
36
Ejemplo de Operaciones Elementales:
Dada la matriz
2 1 0
A 3 1 1
0 2 1
1) Aplicar a la matriz “A”, primero e1(-2) ; después e13(2) y por último e32.
2 1 0 4 2 0 4 2 2 4 2 2
A 3 1 1 e1( 2) 3 1 1 e13(2) 3 1 1 e32 0 2 1
0 2 1 0 2 1 0 2 1 3 1 1
2) A la matriz “A” del ejercicio anterior, aplicar e32 ; e13(2) y e1(-2) sucesivamente: Compare este resultado
con el obtenido en el apartado anterior. Saque conclusiones.
2 1 0 2 1 0 8 3 2 16 6 4
A 3 1 1 e32 0 2 1 e13(2) 0 2 1 e1( 2) 0 2 1
0 2 1 3 1 1 3 1 1 3 1 1
3) Aplicar a la matriz “B”, la operación e12(3) y luego e12(-3). ¿Qué deduce de este resultado?
2 1 0 11 4 3 2 1 0
B 3 1 1 e12(3) 3 1 1 e12( 3) 3 1 1
0 2 1 0 2 1 0 2 1
1) Tiene forma escalonada, es decir, los primeros elementos no nulos de una fila, se encuentran a la
derecha de los de cualquier fila anterior. A dichos elementos no nulos se los denomina elementos
conductores.
2) Los elementos conductores suelen hacerse iguales a uno (para facilitar las operaciones).
3) En las columnas de los elementos conductores, los restantes elementos son ceros.
4) Las filas nulas (si existen), están debajo de las no nulas.
0 1 7 0 2
M 0 0 1 3 0 1
0 0 0 0 0
Para que la matriz “M” sea una matriz reducida por filas, de acuerdo a la definición, deberá ser = 0 y =
1 , ó , = 0.
¿Qué operación elemental debemos aplicar a la matriz “C” para que resulte una matriz reducida por filas?
37
1 3 0 0 3 1 3 0 0 3
C 0 0 1 1 1 e23( 1) 0 0 1 0 2
0 0 0 1 3 0 0 0 1 3
Toda matriz puede reducirse por filas mediante operaciones elementales. La matriz reducida es única. En
general, la técnica empleada consiste en eliminar los elementos inferiores de la primera columna usando la
primera fila, los de la segunda columna usando la segunda fila, etc. ( y así sucesivamente) hasta que la matriz
dada quede escalonada. Luego, se emplean los elementos conductores para eliminar los elementos que se
encuentran por encima de ellos.
Rango: Se define como rango o característica de una matriz a la cantidad de vectores filas o vectores
columnas linealmente independientes que constituyen dicha matriz.
Uno de los métodos para calcular el mismo, es a través de la obtención de la matriz escalonada de la matriz
dada, utilizando operaciones elementales sobre filas.
Los distintos autores identifican al rango o característica de una matriz, con la letra “r” o con la letra “h”.
En la matriz reducida, el rango o característica queda definido por la cantidad de filas no nulas que tiene
dicha matriz reducida.
Matriz Elemental:
Una matriz elemental de orden “n x n” se puede obtener a partir de una matriz identidad de orden “n”
realizando una sola operación elemental de filas sobre la misma.
El producto de la matriz elemental “E” por la matriz “A” es la misma matriz que resultaría de efectuar la
misma operación elemental sobre las filas de “A”.
Toda matriz elemental es invertible.
Ejemplo:
Dadas las matrices
4 2 1 1 0 0
A 5 3 2 ; I 0 1 0
3 2 1 0 0 1
1 0 0 0 1 0
I 0 1 0 e12 E 1 0 0
0 0 1 0 0 1
4 2 1 4 2 1
5 3 2 =A 5 3 2 e12
3 -2 1 3 -2 -1
0 1 0 5 3 2 5 3 2
E= 1 0 0 4 2 1 = E.A 4 2 1
0 0 1 3 -2 1 3 -2 -1
Matriz Inversa
Obtención de la Matriz Inversa mediante Operaciones Elementales
La condición necesaria y suficiente para que una matriz cuadrada admita inversa, es que todas las filas (o
columnas) de la misma sean linealmente independientes.
Se dispone de la siguiente manera: A In
eil eil
RA A-1 38
Se le realizan operaciones elementales de filas a la matriz “A” de forma tal de llegar a su reducida por filas,
que es la matriz identidad RA = I n .
Si en el transcurso de las operaciones (al obtener la matriz triangular) aparece un cero en la diagonal
principal, “A” no será invertible, puesto que dicho cero muestra la existencia de una combinación lineal
entre las filas de “A”.
Si simultáneamente aplicamos las mismas operaciones por filas a una matriz identidad, al obtenerse la
reducida por filas de “A”, de la matriz Identidad obtendremos la matriz inversa de la matriz dada “A”, o sea
A-1.
La justificación de este método es debido a que se pueden encontrar matrices elementales, tales que:
EK . . . . . . . E2.E1.A = I n
Si a esta expresión se la posmultiplica por la inversa de la matriz “A”, o sea por A-1 , tendremos:
EK . . . . . . . E2.E1.A.A-1 = I n . A-1
y finalmente queda:
EK . . . . . . . E2.E1.I n = A-1
39
UNIDAD N°4: Determinantes.
A toda matriz cuadrada viene asociado un número, un valor intrínseco, propio de cada matriz, que se
denomina determinante.
En esta unidad se estudiará la función determinante, que es una “función con valores reales de una variable
matricial” en el sentido que asocia un número real f(X) con una matriz X. El trabajo que se efectuará sobre
funciones determinantes tendrá importantes aplicaciones en la teoría de sistemas de ecuaciones lineales y
también conducirá a una fórmula explícita para calcular la inversa de una matriz invertible.
Definición:
Sea A una matriz cuadrada. La función determinante se simboliza por:
𝑎11 𝑎12
det A, ó det [𝑎 | |
21 𝑎22 ] ó simplemente como 𝐴
, es decir “A” encerrado entre simples barras, se define como la suma de los productos elementales con signo
de A. El número det A, se denomina determinante de A.
Por producto elemental de una matriz A n x n se entiende cualquier producto de n elementos de A, de los
cuales ningún par de elementos proviene del mismo renglón o de la misma columna.
Supuesta una matriz “A”, cuadrada, de orden n x n, es decir n filas y n columnas, o sea un total de n2
elementos, se obtiene el valor del determinante de “A”, formando la sumatoria de todos los productos
posibles de “n” elementos elegidos entre los n cuadrados (n 2) elementos de la matriz, con la condición que
en cada producto haya siempre un elemento de cada fila y uno de cada columna, anteponiendo a cada uno de
estos productos el signo más (+) o el signo menos (-) según que las permutaciones que indican las filas y las
columnas sean de clase par o impar respectivamente.
En la siguiente tabla podemos ver las permutaciones de {1, 2, 3} como se clasifican en par o impar:
Número de
Permutación Clasificación
inversiones
(1, 2, 3) 0 Par
(1, 3, 2) 1 Impar
(2, 1, 3) 1 Impar
(2, 3, 1) 2 Par
(3, 1, 2) 2 Par
(3, 2, 1) 3 impar
40
y el determinante asociado será, según lo dicho anteriormente:
𝑎11 𝑎12
det 𝐴 = det [𝑎 𝑎22 ] = 𝑎11 𝑎22 − 𝑎12 𝑎21
21
Si en lugar de ser una matriz de segundo orden (o sea de 2x2), se tratara de una matriz de 3x3, tendremos:
𝑎11 𝑎12 𝑎13
𝐵 = |𝑎21 𝑎22 𝑎23 |
𝑎31 𝑎32 𝑎33
= 𝑎11 𝑎22 𝑎33 + 𝑎12 𝑎23 𝑎31 + 𝑎13 𝑎21 𝑎32 − 𝑎11 𝑎23 𝑎32 − 𝑎12 𝑎21 𝑎33 − 𝑎13 𝑎22 𝑎31
Para no tener que memorizar estas expresiones difíciles de manejar, se sugiere usar técnicas mnemotécnicas
que se describen a continuación:
Para matrices de 2 x 2, como la matriz A de arriba, se obtiene al multiplicar los elementos de la flecha hacia
la derecha y restar el producto de los elementos de la flecha hacia la izquierda, según se ve en la figura
siguiente:
𝑎11 𝑎12
[𝑎 𝑎22 ]
21
Para matrices de 3 x 3, como la B de arriba, se conoce como “Regla de Sarrus” y consiste en agregar
debajo de la tercera fila, las dos primeras, o a continuación de la tercera columna, las dos primeras, y luego
realizar los productos cruzados como se muestra a continuación:
𝑎11 𝑎12 𝑎13
|𝑎21 𝑎22 𝑎23 | 𝑎11 𝑎12 𝑎13 𝑎11 𝑎12
𝑎31 𝑎32 𝑎33 ; |𝑎21 𝑎22 𝑎23 | 𝑎21 𝑎22
𝑎11 𝑎12 𝑎13 𝑎31 𝑎32 𝑎33 𝑎31 𝑎32
𝑎21 𝑎22 𝑎23
Estos productos que corresponden a la diagonal principal de la matriz (es decir la que va del extremo
superior izquierdo al extremo inferior derecho) y sus dos paralelas, salen a conformar la sumatoria con el
signo que tienen (positivo si todos sus términos son positivos ó negativo si alguno de sus términos es
negativo) que indicamos con el signo ( + ) y la que corresponde a la diagonal secundaria (la que va del
41
extremo inferior izquierdo al extremo superior derecho) y sus dos paralelas cambian su signo para con-
formar la sumatoria. Esto significa que si son positivos resultarán negativos y sí son negativos resultan
positivos. Esto está indicado con el signo ( - ).
Esta “Regla de Sarrus” sólo se utiliza para determinantes de hasta tercer orden. Para mayor orden, ya
veremos que se hace muy difícil su solución.
Si se tratara de un determinante de cuarto orden, el desarrollo del mismo sería:
det A = a11 a22 a33 a44 + a11 a23 a34 a42 + a11 a24 a32 a43 + a12 a21 a34 a43 +
𝑎11 𝑎12 𝑎13 𝑎14 a12 a23 a31 a44+a12 a24 a33 a41 + a13 a21 a32 a44 + a13 a22 a34 a41 + a13 a24 a31 a42
𝑎21 𝑎22 𝑎23 𝑎24 + a14 a21 a33 a42 +a14 a22 a31 a43 + a14 a23 a32 a41 – a11 a22 a34 a43 – a11 a23 a32
A = |𝑎 𝑎32 𝑎33 𝑎34 |
31 a44 – a11a24 a33 a42 –a12 a21 a33 a44 – a12 a23 a34 a41 – a12 a24 a31 a43 – a13 a21
𝑎41 𝑎42 𝑎43 𝑎44 a34 a42 – a13 a22 a31 a44 – a13 a24 a32 a41 – a14 a21 a32 a43 – a14 a22 a33 a41 –
a14 a23 a31 a42
Si observamos los desarrollos de los determinantes de segundo, de tercero y de cuarto orden aquí expuestos,
podemos ver como a medida que es mayor el orden del determinante, mayor es la cantidad de términos que
forman parte del desarrollo. Vemos que la cantidad de términos de cada desarrollo es igual a factorial de “n”,
o sea: n .
En el caso del de segundo orden (2 x 2) tenemos n = 2 n = 2 = 2.1 = 2 ; el de tercer orden (3 x 3) es n =
3 n = 3 3.2.1 = 6; el de cuarto orden (4 x 4) es: n = 4 n = 4 = 4.3.2.1 = 24 , y un determinante de
10 x 10 incluiría el cálculo de 10!= 3.628.800.
Por esta razón, cuando el determinante es mayor a tercer orden, se hace muy difícil resolverlo por este
método.
Una matriz cuadrada de orden “n” es regular o no singular, si el determinante asociado a ella es distinto de
cero |𝐴| ≠ 0. Esto indica que los “n” vectores filas o “n” vectores columnas que la conforman son
linealmente independientes; es decir, el rango de dicha matriz es “n”.
Por el contrario, decimos que una matriz cuadrada de orden “n” es singular, no regular o degenerada,
cuando el determinante asociado a ella es cero |𝐴| = 0 ; es decir que el rango de dicha matriz será menor
que “n” , lo que nos indica que algún vector fila o vector columna es combinación lineal de los otros.
Menor Complementario
Dada una matriz cuadrada de orden “n”, se denomina “menor complementario” de un elemento cualquiera
aij , al determinante asociado a la submatriz de orden “n-1”, que se obtiene después de suprimir la fila que
ocupa el lugar “i” y la columna del lugar “j”.
Dada la matriz “A” de orden 3x3, el menor complementario del elemento a23 , es:
Al menor complementario lo indicamos con la letra M con el doble subíndice que índica fila y columna del
elemento al cual pertenece el menor.
Adjunto o Cofactor
Se denomina adjunto o cofactor de un elemento aij, correspondiente a una matriz cuadrada, a su menor
complementario con signo más o signo menos, según que la suma de los subíndices que indicansu fila y su
columna sea par o impar respectivamente.
Al adjunto o cofactor lo denotamos con la letra “C” con doble subíndice que indica fila y columna del
elemento al cual pertenece dicho adjunto o cofactor.
42
En símbolos, esto es:
Cij = ( -1 )i+j Mij
a11 a12
Relacionado con el ejemplo anterior, el adjunto o cofactor del elemento a 23 , es: C23
a31 a32
Menor complementario
Cofactor Cofactor Cofactor
a22 a23 a a a a
a11 a12 21 23 a13 21 22 = a11C11 - a12C12 + a13C13
a32 a33 a31 a33 a31 a32
De la observación del desarrollo de un determinante por los elementos de una línea, nos permite aconsejar
tomar para ello la línea que tenga la mayor cantidad de ceros posibles, pues esto nos evitaría tener que
calcular el adjunto correspondiente, pues este producto sería nulo.
Como caso particular del desarrollo de un determinante por los elementos de una línea, diremos que: “Si en
un determinante todos los elementos de una línea son nulos, excepto uno, el determinante es igual al
producto de ese elemento no nulo por el adjunto del mismo”.
Todo término del primer determinante está formado por “n” elementos, uno de cada fila y uno de cada
columna, luego pertenece también al segundo determinante.
Las dos permutaciones que indican filas (columnas) en el segundo determinante, son las mismas que indican
columnas (filas) en el primero, luego el signo de dicho término en ambos determinantes es (+) ó ( - ) , según
que ambas permutaciones sean de clase par o impar respectivamente:
2 3 2 5
A 2 15 13 ; At 2 15 13
5 1 3 1
2ª Propiedad: “Si se permutan dos filas (o dos columnas) de una matriz, los correspondientes determinantes
son opuestos”, es decir, tienen el mismo valor absoluto pero distinto signo.
a11 a12 a13 a21 a22 a23
A1 a21 a22 a23 ; A2 a11 a12 a13
a31 a32 a33 a31 a32 a33
43
Intercambiar entre sí dos filas significa una transposición en los primeros índices, lo cual cambia la clase de
permutación y como la de los segundos índices correspondientes a las columnas no ha variado, habrá un
cambio de signo en cada término del determinante:
2 3 5 1
A1 2 15 13 ; A2 15 2 13
5 1 2 3
Consecuencia de la segundad propiedad: “El determinante de toda matriz que tenga dos filas (o dos
columnas) idénticas es nulo”.
a11 a12 a13
A a21 a22 a23
Si
a31 a32 a33
al permutar dos filas ( la primera y la segunda en este caso), y por lo expresado en la propiedad segunda, el
determinante será: A ; pero siendo idénticas dichas filas, el nuevo determinante es igual al anterior; es
decir:
0
A A , luego A A 0 2 A 0 A 0
2
1 3 5
A 2 4 1 1.4.5 2.3.5 1.3.(1) 1.4.5 2.3.5 1.3.(1) 20 30 3 20 30 3 0
1 3 5
3ª Propiedad: “Si se multiplican todos los elementos de una línea de una matriz por un mismo número , el
determinante correspondiente queda multiplicado por ”.
Si
a11 a12 a13
A a21 a22 a23
a31 a32 a33
Según el desarrollo de un determinante por los elementos de una línea, si multiplicamos por “” los
elementos de la primera fila, resulta:
a11 a12 a13
a a23 a a23 a a22
a21 a22 a23 a11 C11 a12 C12 a13 C13 a11 22 a12 21 a13 21 A
a32 a33 a31 a33 a31 a32
a31 a32 a33
Esta propiedad permite separar como factor del determinante un factor común a todos los elementos de una
línea cualquiera, simplificando ésta ; por ejemplo:
5 10 15
3 1 0 5.1.1 3.(1).15 2.0.10 2.1.15 3.10.1 5.(1).0 5 45 0 30 30 0 5 105 100
2 1 1
5 10 15 1 2 3
3 1 0 5 3 1 0 5 (1 9 0 6 6 0 ) 5 ( 20 ) 100
2 1 1 2 1 1
Consecuencia de la tercera propiedad: “El determinante de una matriz es nulo si los elementos de una
línea son proporcionales a los correspondientes de otra paralela a ella”.
De acuerdo a esto, si separamos el coeficiente de proporcionalidad como factor del determinante, queda otro
con dos líneas iguales y por lo tanto es nulo.
1 4 0
A 3 12 2
2 8 1
44
La segunda columna es combinación lineal de la primera, pues: 2ª Columna = 1ª Columna x 4 ; luego,
separando el factor de proporcionalidad, resulta:
1 1 0
A 43 3 2 4.0 0
2 2 1
4ª Propiedad: “La suma de los productos de los elementos de una fila (ó columna) de una matriz cuadrada
por los adjuntos de los elementos correspondientes de una fila (ó columna) paralela a ella es cero”.
Dado:
a11 a12 a13
A a21 a22 a23
a31 a32 a33
Resulta que si sumamos los productos de los elementos de la segunda fila por los adjuntos de la primera,
obtenemos:
a22 a23 a a23 a a22
a21 C11 a22 C12 a23 C13 a21 a22 21 a23 21
a32 a33 a31 a33 a31 a32
a21 a22 a33 a21 a23 a32 a21 a22 a33 a22 a23 a31 a21 a23 a32 a22 a23 a31 0
Esto es lo mismo que tener:
a21 a22 a23
a21 a22 a23
a31 a32 a33
Si observamos aquí, tenemos 1ª y 2ª fila iguales, o sea el valor del determinante es cero, según lo
anteriormente demostrado. Además si se desarrolla por la primera fila, tendremos el desarrollo efectuado
aquí, y esto sería igual a cero por tener dos filas iguales.
5ª Propiedad: “Si una línea de una matriz es el vector nulo, su determinante es nulo”. En efecto, según la 3ª
propiedad, separando como factor común del determinante, el elemento nulo, resultaría:
0 . A = 0
6ª Propiedad: “Si los elementos de una línea de una matriz son polinomios de “m” términos, puede
descomponerse el determinante correspondiente en suma de “m” determinantes , que tienen las mismas
restantes líneas y en lugar de aquella, la formada por los primeros sumandos, por los segundos, . . . . . . , y
por los m-ésimos respectivamente”.
Si los elementos de la primera fila son binomios, desarrollando por los elementos de la misma, resultará:
a11 b11 a12 b12 a13 b13
A a21 a22 a23 ( a11 b11 ) C11 ( a12 b12 ) C12 ( a13 b13 ) C13
a31 a32 a33
45
2 X 3Y X 2Y
B (2 X 3Y ).2 5.( X 2Y ) 4 X 6Y 5 X 10Y 9 X 4Y
5 2
2 X 3Y X 2Y 2X X 3Y 2Y
B 2 . 2 X 5.( X ) 2 . 3Y 5 . 2Y
5 2 5 2 5 2
4 X 5 X 6Y 10Y 9 X 4Y
Consecuencia de la sexta propiedad: “El determinante de una matriz no varía sí a una línea se le suma una
combinación lineal de otra o de otras”.
Dado:
a11 a12 a13
A a21 a22 a23
a31 a32 a33
Si a la primera fila le sumamos el producto de la segunda previamente multiplicada por cualquier escalar
0 , resulta:
a11 a21 a12 a22 a13 a23
A a21 a22 a23 ( segun la sexta propiedad )
a31 a32 a33
Esta consecuencia permite simplificar los determinantes, reduciendo a cero varios elementos de una misma
línea mediante adiciones y sustracciones convenientes. Cada elemento que se logre anular así, evita el
cálculo de un cofactor al desarrollar por elementos de esa línea.
3 2 3 2.4 2 2.(2)
A 6 8 14 ; a la 1ª fila le sumamos la 2ª previamente multiplicada por 2
4 2 4 2
38 24 11 2
22 8 14
4 2 4 2
7ª Propiedad: “Si una matriz es triangular, entonces el determinante asociado es igual al producto de los
elementos de la diagonal”.
a11 a12 a13
A 0 a22 a23 a11 a22 a33
0 0 a33
Esta propiedad permite el cálculo de cualquier determinante, ya que por medio de las propiedades anteriores
(1ª, 2ª, 3ª, 4ª, 5ª y 6ª) podemos triangular el determinante y así facilitar su cálculo. Tener en cuenta los
cambios que se producen en el valor del determinante al aplicar la 2ª y 3ª propiedad.
46
MÉTODO DE CHÍO (REGLA DE CHÍO)
Otro método para resolver determinantes lo constituye la Regla de Chío, que tiene como ventaja que en cada
paso que realiza reduce el orden del mismo en una unidad.
Considerando la consecuencia de sexta propiedad de los determinantes, que dice: “si a los elementos de una
línea se le suma una combinación lineal de otra o de otras, el determinante no varía”, podemos calcular el
determinante de una matriz reduciendo a uno de menor orden, para lo cual se transforma en cero a todos los
elementos de una línea cualquiera salvo uno de ellos que denominamos “pivote”, aplicando la propiedad
enunciada.
El elemento pivote es el que se utiliza para efectuar las combinaciones lineales a los fines de transformar en
cero los elementos de una fila o columna. Al respecto se debe tener en cuenta que si hay que transfor mar en
cero elementos de una columna, se trabaja con combinación lineal de filas, y si los elementos son de una fila,
a través de combinaciones lineales de columnas, considerando la fila o columna donde se encuentra el
“pivote”, denominada por este motivo fila o columna pivotal.
Dado un determinante de orden “n” :
a11 a12 . . . . a1 j . . . . . a1n
a21 a22 . . . . a2 j . . . . . a2 n
. . . .
. . . .
A
ai1 ai 2 . . . . aij . . . . . ain
. . . .
. . . .
an1 an 2 . . . . anj . . . . . ann
El procedimiento consiste en tomar un elemento no nulo como pivote, tal como a ij, extraerlo como factor
común de la fila “i”, obteniendo:
a11 a12 . . . . a1 j . . . . . a1n
a21 a22 . . . . a2 j . . . . . a2 n
. . . .
. . . .
A aij ai1 ai 2 ain
.... 1.....
aij aij ai j
. . . .
. . . .
an1 an 2 . . . . anj . . . . . ann
y luego reducir a cero los elementos restantes de la columna del pivote, (en nuestro caso la columna “j”),
restando a cada fila “h” , (con h i), la fila “i” multiplicada por ahj, obteniendo:
47
ai1 ai 2 ain
a11 a1 j a12 a1 j . . . . a1 j 1 a1 j . . . . . a1n a1 j
aij aij aij
ai1 ai 2 a
a21 a2 j a22 a2 j . . . . a2 j 1 a2 j . . . . . a2 n in a2 j
aij aij aij
. . . .
. . . .
A aij
ai1 ai 2 ain
.... 1.....
aij aij ai j
. . . .
. . . .
a ai 2 a
an1 i1 anj an 2 anj . . . . anj 1 anj . . . . . ann in anj
aij aij aij
O sea que resolviendo las operaciones indicadas en la columna “j”, tenemos:
ai1 ai 2 a
a11 a1 j a12 a1 j . . . . 0 . . . . . a1n in a1 j
aij aij aij
ai1 ai 2 a
a21 a2 j a22 a2 j . . . . 0 . . . . . a2 n in a2 j
aij aij aij
. . . .
. . . .
A aij
ai1 ai 2 ain
.... 1.....
aij aij ai j
. . . .
. . . .
a a a
an1 i1 anj an 2 i 2 anj . . . . 0 . . . . . ann in anj
aij aij aij
Finalmente, desarrollando por elementos de la columna “j”, obtenemos un determinante de orden “n-1”
multiplicado por (-1)i+j aij.
El procedimiento se reitera hasta obtener un determinante de segundo orden, que se resuelve fácilmente.
Ejemplo
Encuentre el determinante de la matriz A
1 2 −1 2
3 0 1 5
A= [ ]
1 −2 0 3
−2 −4 1 6
1 2 −1 2 𝑒 (−1) 0 4 −1 −1
13
|𝐴| = [ 3 0 1 5
] 𝑒23 (−3) |𝐴| = [0 6 1 −4
]
1 −2 0 3 1 −2 0 3
𝑒 (2)
−2 −4 1 6 43 0 −8 1 12
Pivote 1
48
Desarrollando por cofactores
4 −1 −1 𝑒 (1) 10 0 −5
1+3 [ 12
|𝐴| = (−1) 6 1 −4] |𝐴| = 1 [ 6 1 −4]
𝑒32 (−1)
−8 1 12 −14 0 16
Pivote 2
|𝐴| = (−1)2+2 . 1 [ 10 −5
] = 1.1{(10 . 16) − [(−5). (−14)]} = 1 .1(160 − 70) = 90
−14 16
49
UNIDAD N°5: Sistema de ecuaciones lineales.
Definimos como una ecuación lineal con incógnitas o variables x1, x2 , . . . , xn , una expresión que puede
escribirse en la forma: a1x1 + a2x2 + . . . . + a nxn = b (1) en donde a1, a2, . . . , an y b son constantes, siendo
los “ai” denominados coeficientes de las incógnitas y “ b ” es el término independiente de dicha ecuación.
Como podemos observar en todos los sumandos del primer miembro de la expresión (1), las variables o
incógnitas se encuentran elevadas a la potencia uno (dicha ecuación se asemeja a la ecuación de una recta: ax
+ by = c ; de allí el nombre de lineal); y el término que se encuentra en el segundo miembro (“ b ”) carece de
variable, razón por la cual recibe el nombre de término independiente. Un conjunto de este tipo de
ecuaciones constituye un sistema de ecuaciones lineales.
Entonces podemos considerar como un sistema de ecuaciones lineales al siguiente:
a11 x1 a12 x2 b1
a21 x1 a22 x2 b2
Para que el mismo tenga solución, deberá cumplir con lo exigido por el:
Teorema de Rouché-Frobenius:
“Es condición necesaria y suficiente para que un sistema de ecuaciones lineales admita solución, que
el rango de la matriz principal y el de la matriz ampliada sean iguales”
rMP = rMA .
La matriz principal de dicho sistema es aquella que está constituida por los coeficientes de las incógnitas, o
sea:
a a12
MP = 11
a21 a22
La matriz ampliada de dicho sistema es la que conformamos con los coeficientes de las incógnitas a quienes
les agregamos la columna de los términos independientes, es decir:
a a12 b1
MA 11
a21 a22 b2
De dichas matrices debemos obtener el valor de su rango o característica, o sea, determinar la cantidad de
vectores filas o columnas linealmente independientes que las mismas poseen.
El valor del rango, (según lo ya explicado en el tema Matrices y Determinantes), lo podemos obtener por
medio de la matriz reducida por filas ó mediante el cálculo del determinante asociado a dicha matriz. Para el
caso de la matriz principal (MP), que en este ejemplo es una matriz cuadrada (igual cantidad de filas que de
columnas), se lo puede obtener a través del cálculo del respectivo determinante; en cambio para la matriz
ampliada (MA), que no es cuadrada, pues tiene más columnas que filas, para obtener el rango utilizando
también determinantes, vamos a sustituir en dicha matriz, por ejemplo, la primera columna (columna que
corresponde a los coeficientes de la variable x1) por los términos independientes, es decir tendremos una
matriz ampliada que será en realidad una matriz sustituta de x1 , la cual quedará entonces conformada por:
b a12
MA M SX 1 1
b2 a22
Los sistemas de ecuaciones que vamos a estudiar pueden ser no homogéneos u homogéneos; y dentro de
estas dos posibilidades, los mismos pueden ser cuadrados o rectangulares. Los cuadrados son aquellos que
tienen el mismo número de ecuaciones que de incógnitas y dentro de los rectangulares los mismos pueden
ser de tipo horizontal, donde tengo más incógnitas que ecuaciones o pueden ser rectangulares de tipo
vertical, es decir que tenga más ecuaciones que incógnitas.
50
Análisis del Sistema No Homogéneo
Sistema cuadrado n x n (la misma cantidad de ecuaciones que de incógnitas)
a11 x1 a12 x2 . . . . . . a1n xn b1
a x a x . . . . . . a x b
21 1 22 2 2n n 2
. . ...... . .
. . ...... . .
an1 x1 an 2 x2 . . . . . . ann xn bn
Analizado este sistema de ecuaciones, si el rango de la matriz principal es igual al rango de la matriz
ampliada, el sistema tiene solución, es decir:
. . ...... . .
. . ...... . .
am1 x1 am 2 x2 . . . . . . amn xn bm
En éste caso, el número de ecuaciones es menor que el número de incógnitas, por lo tanto el rango de la
Matriz Principal no puede ser mayor que el número de ecuaciones r MP = m.
Si los rangos de la Matriz Principal y de la Matriz Ampliada son iguales el sistema de ecuaciones tendrá
solución. Pero como en éste caso el valor de dichos rangos es menor que el número de incógnitas (n), el
sistema tendrá infinitas soluciones.
Para resolver dicho sistema, paso al segundo miembro (n – m) incógnitas, obteniendo en éste caso un
sistema equivalente al dado, constituido por “m” ecuaciones y “m” incógnitas principales, teniendo en este
caso un nuevo sistema, cuadrado él, en donde el “r MP = rMA = m”, (que es menor al número de incógnitas
del sistema primitivo).
Si los rangos de la Matriz Principal y de la Matriz Ampliada no son iguales, el sistema de ecuaciones no
tendrá solución.
. . ...... . .
. . ...... . .
am1 x1 am 2 x2 . . . . . . amn xn bm
En éste caso, el número de ecuaciones es mayor que el número de incógnitas, por lo tanto el rango de la
Matriz Principal no puede ser mayor al número de incógnitas (n).
Este es entonces un sistema de más ecuaciones que incógnitas. Si en dicho sistema existen “n” ecuaciones
linealmente independientes, el sistema se puede reducir a:
Si las “m” ecuaciones son linealmente independientes, entonces el sistema no tiene solución.
51
Análisis del Sistema Homogéneo
Estos sistemas siempre tienen solución. La solución que poseen siempre es la conocida como solución
trivial, o sea, darle a cada una de las variables el valor cero, de tal manera que con dichos valores se verifican
las ecuaciones.
Sistema cuadrado n x n (misma cantidad de ecuaciones que de incógnitas)
a11 x1 a12 x2 . . . . . . a1n xn 0
a x a x . . . . . . a x 0
21 1 22 2 2n n
. . ...... . .
. . ...... . .
an1 x1 an 2 x2 . . . . . . ann xn 0
Si el rango de la Matriz de los Coeficientes es igual a “n” ( rMC = n ), el sistema sólo admite la solución
trivial; pues dicho sistema está conformado por “n” ecuaciones linealmente independientes.
Si el rango de la Matriz de los Coeficientes es menor que “n”, entonces el sistema además de la solución
trivial admite infinitas soluciones (pasa a ser un sistema compatible indeterminado). Para resolver dicho
sistema, paso al segundo miembro “n – r” incógnitas y también elimino “n – r” ecuaciones, obteniendo bajo
estas condiciones un sistema equivalente al dado, que es cuadrado, con “r” ecuaciones y “r” incógnitas
principales, teniendo dicho sistema “términos independientes” constituidos por las “n – r” incógnitas no
principales.
a11 x1 a12 x2 . . . . . . a1r xr ( a1r 1 xr 1 a1r 2 xr 2 . . . . . a1n xn )
a x a x . . . . . . a x ( a
21 1 22 2 2r r 2 r 1 xr 1 a2 r 2 xr 2 . . . . . a2 n xn )
. . ...... . . . ..... .
. . ...... . . . ..... .
ar1 x1 ar 2 x2 . . . . . . arr xr ( arr 1 xr 1 arr 2 xr 2 . . . . . arn xn )
. . . . . . . . . .
. . ...... . .
am1 x1 am 2 x2 . . . . . . amn xn 0
En éste caso el rango de la Matriz de los Coeficientes no puede ser mayor que el número de ecuaciones
“rMC = m”. El sistema admitirá infinitas soluciones, las cuales se obtendrán pasando al segundo miembro las
“n – m” incógnitas no principales. (caso similar al analizado en el punto anterior).
. . ...... . .
. . ...... . .
am1 x1 am 2 x2 . . . . . . amn xn 0
En éste caso el rango de la Matriz de los Coeficientes puede ser igual o menor que el número de incógnitas
“rMC = n”.
Si el rango de la Matriz de los Coeficientes es igual a “n”, entonces el sistema no tiene otra solución que la
trivial.
Si el rango de la Matriz de los Coeficientes es menor que “n”, entonces el sistema además de la solución
trivial admite infinitas soluciones (pasa a ser un sistema compatible indeterminado).
52
Métodos para resolver los sistemas de ecuaciones lineales
a) Método de Gauss
Este método es aplicable tanto a sistemas de ecuaciones homogéneos como no homogéneos. Sea un sistema
de ecuaciones lineales, por ejemplo, un sistema “n por n”:
a11 x1 a12 x2 a13 x3 . . . . . . a1n xn b1
a x a x a x . . . . . . a x b
21 1 22 2 23 3 2n n 2
. . . ...... . .
. . . ...... . .
an1 x1 an 2 x2 an3 x3 . . . . . . ann xn bn
del mismo tomamos la matriz ampliada:
a11 a12 a13 ..... a1n b1
a
21 a22 a23 ..... a2 n b2
. . . ..... . .
an1 an 2 an3 ..... ann bn
Aplicamos a dicha matriz ampliada las operaciones elementales de filas hasta obtener la matriz triangular; si
el rango de la matriz principal es igual al rango de la matriz ampliada e igual al número de incógnitas (
rMP = r MA = nº de incógnitas ), o hasta obtener la matriz escalonada si el rango de la matriz principal es igual
al rango de la matriz ampliada pero menor que el número de incógnitas (rMP = r MA nº de incógnitas).
En el primer caso, ( r MP = r MA = nº de incógnitas ), habiéndose operado sobre la matriz ampliada se llega a la
condición de que uno de los coeficientes de las incógnitas de la última ecuación es distinto de cero siendo
todos los demás nulos, pudiéndose despejar esa incógnita. Quedará entonces:
a11 a12 a13 . . . . . . . . . . . a1n b1
0 c22 c23 . . . . . . . . . . . c2 n
0 0 d33 . . . . . . . . . . . d3n
. . . . . . . . .. . . . . . .
. . . . . . . . .. . . . . . .
0 0 0 . . . . . . . . . . enn
enn xn = xn = /enn
Con ésta incógnita despejada, se pasa a la ecuación de la fila anterior, reemplazándose su valor en ella,
pudiendo en consecuencia despejar otra incógnita. Prosiguiendo de esta manera hasta llegar a la primera fila,
se podrá despejar todas las incógnitas.
En el segundo caso, es decir cuando el r MP = r MA nº de incógnitas, datos estos que obtenemos luego de
haber operado sobre la matriz ampliada, se llega al caso de que en la última fila de la matriz reducida, todos
los coeficientes son nulos, incluido el coeficiente correspondiente a la columna de los términos
independientes; y en la fila inmediata anterior todos los coeficientes son nulos con excepción de los dos
últimos de dicha fila y el correspondiente a la columna de los términos independientes, pudiéndose en éste
caso despejar una incógnita en función de otra o de otras.
Resulta entonces, luego de haber obtenido la matriz escalonada por las operaciones por filas:
a11 a12 a13 .... . ..... . a1n b1
0 c22 c23 .... . .. ... . c2 n
0 0 d33 .... . .... . . d 3n
. . . ..... .. . . . . . .
. . . ..... .. . . . . . .
. . . . .. . . . . . . . e( n 1)( n1) e( n 1) n
0 0
0 0 ..... . .. .. 0
- e(n-1)n x n
e(n-1)(n-1) x(n-1) + e(n-1)n xn = x (n-1) =
e(n-1)(n-1)
53
En el caso en que el sistema dado no sea cuadrado, sino que tenga más incógnitas que ecuaciones (sistema
rectangular horizontal):
a11 x1 a12 x2 a13 x3 . . . . . . . a1n xn b1
a x a x a x . . . . . . . a x b
21 1 22 2 23 3 2n n 2
. . . . . . . . . . . . .
. . . ........ . .
. . . ........ . .
am1 x1 am 2 x2 am3 x3 . . . . . . . amn xn bm
siendo el valor de “m” menor que “n” ( m n ) . “m” representa la cantidad de ecuaciones y “n” el
número de incógnitas.
Aquí debemos tener en cuenta que el rango de la matriz principal y el de la matriz ampliada no podrán
superar el valor de “m”, es decir el rango no podrá exceder en su valor a la cantidad de ecuaciones del
sistema y en éste caso, si el sistema tiene solución, siempre será un sistema compatible indeterminado con
infinitas soluciones, estando el valor de algunas de las incógnitas principales en función de otra o de otras
incógnitas, que en este caso son incógnitas secundarias.
a11 a12 a13 . . . . . . . a1( n 1) a1n b1
0 c22 c23 . . . . . . . c2( n 1) c2 n
0 0 d33 . . . . . . . d3( n 1) d3 n
. . . ....... . . .
. . . ....... . . .
0 0 0 . . . . . .. em ( n 1) emn
emn xn
em ( n 1) x( n 1) emn xn x( n 1)
em ( n 1)
Debemos tener presente que “(n-1)” es igual a “m”, o sea que el rango de la matriz principal y el de la matriz
ampliada son iguales a “m” que es menor que “n” y en éste caso lo hemos supuesto como si “m” fuese igual
a “(n-1)”.
Esquemáticamente podemos representar:
x x x x x x x x x
0 x x x Compatible det er min ado 0 x x x x Compatible in det er min ado
0 0 x x 0 0 x x x
x x x x x x x x x
0 x x x Incompatible 0 x x x x Incompatible
0 0 0 x 0 0 0 0 x
x x x x x x x x x
0 x x x Compatible In det er min ado 0 x x x x Compatible In det er min ado
0 0 0 0 0 0 0 0 0
1 0 0 x 1 0 0 x x
0 1 0 x Compatible det er min ado 0 1 0 x x Compatible in det er min ado
0 0 1 x 0 0 1 x x
1 0 0 x 1 0 x x x
0 1 0 x Incompatible 0 1 x x x Incompatible
0 0 0 x 0 0 0 0 x
1 0 x x 1 0 x x x
0 1 x x Compatible In det er min ado 0 1 x x x Compatible In det er min ado
0 0 0 0 0 0 0 0 0
55
𝐴11 𝐴21 𝐴𝑛1
𝑏1 + 𝑏2 + ⋯ + 𝑏
𝑥1 𝐴11 𝐴21 … 𝐴𝑛1 𝑏1 |𝐴| |𝐴| |𝐴| 𝑛
𝑥2 1 𝐴12 𝐴22 … 𝐴𝑛2 𝑏2 𝐴12 𝐴22 𝐴𝑛2
𝑋 = […] = [ ] [ ] = |𝐴| 𝑏1 + |𝐴| 𝑏2 + ⋯ + |𝐴| 𝑏𝑛
|𝐴| … … … … … …
𝑥𝑛 𝐴1𝑛 𝐴2𝑛 … 𝐴𝑛𝑛 𝑏𝑛 𝐴1𝑛 𝐴2𝑛 𝐴𝑛𝑛
𝑏1 + 𝑏2 + ⋯ + 𝑏
[ |𝐴| |𝐴| |𝐴| 𝑛 ]
Entonces, la primera incógnita x1 por igualdad de vectores queda
𝐴11 𝑏1 + 𝐴21 𝑏2 + ⋯ + 𝐴𝑛1 𝑏𝑛
𝑥1 =
|𝐴|
Se observa que el numerador representa el desarrollo por los elementos de la primera columna de un
determinante como el siguiente:
𝑏1 𝑎12 … 𝑎1𝑛
𝑏 𝑎22 … 𝑎2𝑛
𝐴11 𝑏1 + 𝐴21 𝑏2 + ⋯ + 𝐴𝑛1 𝑏𝑛 = [ 2 ]
… … … …
𝑏𝑛 𝑎𝑛2 … 𝑎𝑛𝑛
Es el determinante de la matriz de coeficientes en la cual se reemplazó la 1° por el vector de términos
independientes.
Podemos generalizar:
|𝐴𝑖 |
𝑥𝑖 =
|𝐴|
Donde |𝐴𝑖 | representa el determinante de la matriz de coeficientes en la cual se reemplazó la columna i-
ésima por el vector de términos independientes
Tipos de soluciones:
Si A-1 existe Solución única (sistema compatible determinado).
Infinitas soluciones (sistema compatible indeterminado).
Si A-1 no existe
No tiene solución (sistema incompatible).
Ejemplo:
Resolver el sistema siguiente:
2𝑥1 + 𝑥2 = 3
𝑥1 + 5𝑥2 = 6
Calculamos |A|
|𝐴| = |2 1| = 2 . 5 − 1 .1 = 9 ⇒ |𝐴| ≠ 0 ∴ 𝑟(𝐴) = 2
1 5
Lo que nos dice que la matriz A es “no singular”, por lo que el sistema tendrá una única solución que será
3 1
|𝐴1 | |6 5| 3 . 5 − 6 . 1 9
𝑥1 = = = = =1
|𝐴| 9 9 9
2 3
|𝐴2 | |1 6| 2 . 6 − 3 . 1 9
𝑥2 = = = = =1
|𝐴| 9 9 9
𝑥1 1
𝑥 = [𝑥 ] = [ ]
2 1
56
Ejemplo:
Resolver el siguiente sistema:
2𝑥1 + 𝑥2 = 3
4𝑥1 + 2𝑥2 = 5
Calculamos |A|
|𝐴| = |2 1| = 2 . 2 − 1 .4 = 0 ⇒ |𝐴| = 0
4 2
Vemos que los dos vectores son dependientes linealmente, pero sus términos independientes no, con la cual
tenemos:
𝑟𝑀𝑃 = 1 ≠ 𝑟𝑀𝐴 = 2 ⇒ 𝑛𝑜 𝑠𝑒 𝑐𝑢𝑚𝑝𝑙𝑒 𝑅𝑜𝑢𝑐ℎ𝑒 − 𝐹𝑟𝑜𝑏𝑒𝑛𝑖𝑢𝑠
Además
|𝐴1 | = |3 1| = 1 ; |𝐴2 | = |2 3
| = −2
5 2 4 5
Por lo tanto
1 −2
𝑥1 = ; 𝑥2 = ⇒ 𝑆𝑖𝑠𝑡𝑒𝑚𝑎 𝑖𝑛𝑐𝑜𝑚𝑝𝑎𝑡𝑖𝑏𝑙𝑒
0 0
Ejemplo:
Resolver el sistema
2𝑥1 + 𝑥2 = 3
4𝑥1 + 2𝑥2 = 6
Vemos que como en caso anterior |A| = 0, pero en este caso;
𝑟𝑀𝑃 = 1 = 𝑟𝑀𝐴 = 1 ⇒ 𝑠𝑒 𝑐𝑢𝑚𝑝𝑙𝑒 𝑅𝑜𝑢𝑐ℎ𝑒 − 𝐹𝑟𝑜𝑏𝑒𝑛𝑖𝑢𝑠
Vemos que
|𝐴1 | = |3 1
|=0 ; | 𝐴2 | = | 2 3 | = 0
6 2 4 6
Por lo tanto
0 0
𝑥1 = ; 𝑥2 = ⇒ 𝑆𝑖𝑠𝑡𝑒𝑚𝑎 𝑐𝑜𝑚𝑝𝑎𝑡𝑖𝑏𝑙𝑒 𝑖𝑛𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑑𝑜
0 0
Para encontrar las soluciones se debe utilizar el método de Gauss o Gauss-Jordan
57
UNIDAD N°6: Rectas y planos.
Generalidades:
La Geometría Analítica es la parte de la matemática que tiene por objeto el estudio y análisis de los lugares
geométricos en base a la deducción de las ecuaciones y construcción de las gráficas.
Lugar Geométrico: Recibe este nombre toda figura cuyos puntos cumplen con dos condiciones:
c) Dado un lugar geométrico o la condición que deben cumplir los puntos del mismo, determinar su
ecuación.
d) Dada una ecuación, construir la gráfica correspondiente.
La línea recta
Se define la Línea Recta como el lugar geométrico de todos los puntos, tales que, pasando por uno de
coordenadas conocidas, se encuentran sobre la misma dirección, dada por un vector también conocido.
58
OP x i y j
OP1 x1 i y1 j
a a1 i a2 j
Si ahora reemplazamos todos estos valores, en la expresión (1), tendremos:
x i y j x1 i y1 j a1 i a2 j
Para que dos vectores sean iguales, deben ser iguales sus componentes homólogas. Si agrupamos las
componentes homólogas obtendremos:
ecuaciones paramétricas de la línea recta en R2 donde λ es el parámetro variable.
𝒙 = 𝒙𝟏 + 𝝀𝒂𝟏
(2) Este parámetro puede tomar valores de - a + , dando las infinitas posiciones que
𝒚 = 𝒚𝟏 + 𝝀𝒂𝟐 puede tener el punto genérico “P”.
Si en lugar de un espacio de dos dimensiones se hubiese trabajado en tres dimensiones, tendríamos:
𝒙 = 𝒙𝟏 + 𝝀𝒂𝟏
𝒚 = 𝒚𝟏 + 𝝀𝒂𝟐 (3) Siendo en éste caso “𝑎3 ” la tercer componente del vector dirección “𝑎̅”.
𝒛 = 𝒛𝟏 + 𝝀𝒂𝟑
resulta entonces:
𝑥 − 𝑥1 = 𝜆𝑎1 ⇒ 𝑥 − 𝑥1 = 𝜆𝑎̅ cos 𝛼
(5)
𝑦 − 𝑦1 = 𝜆𝑎2 ⇒ 𝑦 − 𝑦1 = 𝜆𝑎̅ cos 𝛽
En donde las componentes del vector 𝑎̅ (𝑎1 , 𝑎2 , 𝑎3 ) son los llamados números de dirección ó números
directores de la recta orientada y son los valores que ubican al vector ā en el espacio.
Partiendo de las ecuaciones (4), obtenemos:
x x1
a1 x x1 y y1
(7)
y y1 a1 a2
a2
La ecuación (7) es la llamada Forma Simétrica de la línea recta en R2.
Si ahora analizáramos (6), tendríamos:
x x1 y y1 z z1 x x1 y y1 z z1
; ; 8
a1 a2 a3 a1 a2 a3
La expresión (8) es similar a la expresión (7), es decir, la Forma Simétrica de la ecuación de la recta en R3 .
59
De la expresión (7), podemos obtener:
a2
y y1 x x1 9
a1
que es la ecuación de la Línea Recta que pasa por el punto P1(x1 ,y1) y tiene la dirección del vector 𝑎̅
A la relación de los números directores 𝑎2 y 𝑎1 se la llama coeficiente angular de la recta no paralela al eje
“y” y se lo designa con: y
𝑠𝑒𝑛 𝛼 𝑎2
𝑚 = tan 𝛼 = =
cos 𝛼 𝑎1
𝑎̅ α 𝑎2
𝑦 − 𝑦1 = 𝑚 (𝑥 − 𝑥1 ) (10)
𝑦 = 𝑚𝑥 − 𝑚𝑥1 + 𝑦1
y haciendo: 𝑚𝑥1 + 𝑦1 = 𝑏 , podemos escribir: 𝑦 = 𝑚𝑥 + 𝑏
𝑦 = 𝑚𝑥 + 𝑏 (11)
x
conocida como Forma Explícita de la ecuación de la recta en R . Se puede comprobar que “b” es la
2
magnitud comprendida desde el origen del sistema de coordenadas al punto en que la recta corta al eje de
ordenadas (eje “y”), recibiendo por esta razón el nombre “ordenada al origen”. Esto se obtiene haciendo
x=0 en la ecuación (11).
Ahora, si en dicha ecuación (11) agrupamos todos los términos en el primer miembro, es decir igualamos a
cero:
−𝑚𝑥 + 𝑦 − 𝑏 = 0
y multiplicando ambos miembros de dicha expresión por B, siendo “B” una constante real y arbitraria,
resulta:
−𝐵𝑚𝑥 + 𝐵𝑦 − 𝐵𝑏 = 0
𝑨𝒙 + 𝑩𝒚 + 𝒄 = 𝟎 (12)
conocida como Forma General o Implícita de la Línea Recta, en donde “A” y “C” también son constantes
reales y arbitrarias.
60
Si C = 0 con A y B 0 A x + B y = 0 (15), obtenemos la ecuación de la recta que pasa por el origen
del sistema de coordenadas, por cuanto la expresión (15) se verifica para los valores de x = 0 e y = 0.
Si son A = 0 y C = 0 y B 0 B y = 0. Como B 0 , debe ser y = 0 entonces resulta la ecuación del
eje “X”.
Si B = 0 y C = 0 con A 0 A x = 0 . Como A 0, debe ser x = 0, resultando entonces la ecuación
del eje “Y”.
En la ecuación (12), si A, B y C son distintos de cero, su representación gráfica resulta ser una recta que
no pasa por el origen y que no es paralela a ningún eje coordenado.
Ejemplo 1:
Hallar la ecuación de la recta que pasa por el punto M (-3; 1) y tiene la dirección del vector 𝑎̅ (5; 4). Exprese
la misma en sus formas vectorial, paramétrica, simétrica, general o implícita, explícita y segmentaría.
Solución:
La ecuación de la recta en su forma vectorial está dada por: 𝑂𝑃̅̅̅̅ = 𝑂𝑀
̅̅̅̅̅ + 𝜆𝑎̅, en donde el vector 𝑂𝑃̅̅̅̅ está
definido por las coordenadas del origen del sistema de coordenadas cartesianas (0, 0) y el punto genérico
“P” de coordenadas (x ; y) y el vector ̅̅̅̅̅
𝑂𝑀 por las coordenadas del origen del sistema (0 , 0) y las
coordenadas del punto M(-3; 1), y el vector “𝑎̅ ” por sus componentes ( 𝑎1 ; 𝑎2 ) = (5 ; 4), o sea determinando
los vectores:
x x0 x 0 x xM x0 3 0 3
OP ; OM
y y0 y 0 y yM y0 1 0 1
y sustituyendo en la ecuación dada en su forma vectorial resulta:
(𝑥, 𝑦) = (−3,1) + 𝐶 (5,4)
a ésta última expresión podemos también escribirla:
𝑥 − 𝑥0 = (𝑥𝑀 − 𝑥0 ) − a1 x = 𝑥𝑀 − a1 x = −3 + 5
de donde resulta la ecuación de la recta en su forma paramétrica. y esta última expresión también puede ser
escrita como:
61
x 3
x 3 5 5
x 3 y 1
Forma simétrica
y 1 4 y 1 5 4
4
si ahora tomamos la última ecuación y la escribimos:
4(𝑥 + 3) = 5(𝑦 − 1) ⇒ 4𝑥 + 12 = 5𝑦 − 5 ⇒ 4𝑥 − 5𝑦 + 12 − 5 = 0
de donde resulta
4𝑥 − 5𝑦 + 17 = 0 𝑓𝑜𝑟𝑚𝑎 𝑮𝒆𝒏𝒆𝒓𝒂𝒍 𝒐 𝒊𝒎𝒑𝒍í𝒄𝒊𝒕𝒂
y de esta última fórmula:
4 17
4𝑥 + 17 = 5𝑦 ⇒ 𝑦 = 𝑥 + 𝐹𝑜𝑟𝑚𝑎 𝒆𝒙𝒑𝒍í𝒄𝒊𝒕𝒂
5 5
17
si en esta última igualdad hacemos x = 0 , resulta: 𝑦 = que es la ordenada al origen, si en cambio
5
17
es: y = 0 resulta 𝑥 = − que es la abscisa al origen y con estos dos valores de ordenada y abscisa
4
al origen, podemos escribir:
x y x y
1 1 que es la Ecuación en su Forma Segmentaría
a b 17 17
4 5
Ejemplo 2:
Hallar la ecuación de la recta que pasa por el punto M(5; -2; 3) y tiene la dirección del vector ā (-9; 5; 4).
Exprese la misma en todas sus formas posibles.
Solución:
La resolución de éste ejercicio es similar al anterior, la variación que existe es que los datos están dados en
R3, es decir que tenemos la ecuación de una recta en un espacio de tres dimensiones.
Tendremos entonces, que la ecuación de la recta en su forma vectorial está dada por:
OP OM a
En donde el vector 𝑂𝑃 ̅̅̅̅ esta definido por las coordenadas del origen del sistema de coordenadas cartesianas
(0, 0, 0) y el punto genérico “P” de coordenadas (x; y, z) y el vector ̅̅̅̅̅
𝑂𝑀 por las coordenadas del origen del
sistema (0, 0, 0) y las coordenadas del punto M(5; -2; 3), y el vector “ ā ” por sus componentes (a1; a2; a3)
= (-9; 5; 4), o sea determinando los vectores:
x x0 x 0 x xM x0 5 0 5
OP y y0 y 0 y ; OM yM y0 2 0 2
z z z 0 z
0 z M z0 3 0 3
y sustituyendo en la ecuación dada en su forma vectorial resulta:
(𝑥, 𝑦, 𝑧 ) = (5 , −2 , 3) + (−9 , 5 , 4)
a ésta última expresión podemos también escribirla:
𝑥 − 𝑥0 = (𝑥𝑀 − 𝑥0 ) − a1 x = 𝑥𝑀 − a1 x = 5 − 9
𝑦 − 𝑦0 = (𝑦𝑀 − 𝑦0 ) − a2 y = 𝑦𝑀 − a2 y = −2 + 5
𝑧 − 𝑧0 = (𝑧𝑀 − 𝑧0 ) − a3 z = 𝑧𝑀 − a3 z = 3 + 4
0 x1 x2 x x
x i y j x1 x2 x1 i y1 y2 y1 j
Recordando que dos vectores iguales, tienen iguales sus componentes homólogas:
x = [x1 + λ ( x2 – x1)] Ecuaciones Cartesianas Paramétricas de la Línea Recta que contiene dos
(18)
y = [y1 + λ ( y2 – y1)] puntos dados en el espacio de dos dimensiones (R 2).
Si se hiciese el mismo análisis para el espacio tridimensional, tendríamos:
x = [x1 + λ ( x2 – x1)]
y = [y1 + λ ( y2 – y1)] (19)
z = [z1 + λ ( z2 - z1)]
x x1 y y1 x x1 y y1 x x1 y y1
; 20
x2 x1 y2 y1 x2 x1 y2 y1 x2 x1 y2 y1
La expresión (20) se conoce como ecuación simétrica de la línea recta por dos puntos en el espacio
bidimensional.
63
Aquí podemos observar que los números directores de la recta orientada están dados por la diferencia de las
coordenadas homólogas de los puntos dados (comparar con ecuación (7)).
De la ecuación (20) podemos obtener:
y y1
y y1 2 x x1 21
x2 x1
y aquí obtenemos el coeficiente angular como la relación
y2 y1
m
x2 x1
Si por el contrario, se trabajase con la ecuación (19), tendríamos:
x x1 y y1 z z1
22
x2 x1 y2 y1 z2 z1
x y 1
x1 y1 1 0
x2 y2 1
Al mismo resultado podemos llegar (ecuación de una recta que pasa por dos puntos dados conocidos P1(x1 ,
y1) y P2(x2, y2) ), considerando la ecuación general ó implícita de la recta (expresión 12) ya vista:
Ax+By+C=0 (12)
Como los puntos P1 y P2 están sobre la recta, sus coordenadas deben satisfacer dicha ecuación (12),
tendremos entonces:
A x1 + B y1 + C = 0 (24)
A x2 + B y2 + C = 0 (25)
Como la ecuación buscada es de la forma de (12), debemos considerar los coeficientes A, B y C como
incógnitas. Sus valores, además, deben ser los mismos en las ecuaciones (24) y (25) si la recta pasa por los
puntos P1 y P2.
Podemos considerar entonces las ecuaciones (12), (24) y (25) como un sistema de tres ecuaciones lineales
homogéneas con tres incógnitas (A, B y C). Por álgebra sabemos que para que un sistema de éste tipo tenga
solución, es necesario y suficiente que el determinante de la matriz de los coeficientes se anule, es decir:
x y 1
x1 y1 1 0
x2 y2 1
Ejemplo 3:
Hallar la ecuación de la recta que contiene los puntos M(2; 1) y Q(3; 4). Expresar la misma en sus formas
vectorial, paramétrica, simétrica, general o implícita, explícita y segmentaría.
Solución:
La resolución de éste ejercicio es similar al ejemplo nº 1. La variación que existe es que el vector dirección
de la recta hay que determinarlo en función de las coordenadas de los puntos M y Q .
Tendremos entonces, que la ecuación de la recta en su forma vectorial está dada por:
64
OP OM MQ
̅̅̅̅ está definido por las coordenadas del origen del sistema de coordenadas cartesianas
En donde el vector 𝑂𝑃
(0, 0) y el punto genérico “P” de coordenadas (x; y) y el vector ̅̅̅̅̅
𝑂𝑀 por las coordenadas del origen del
sistema (0, 0) y las coordenadas del punto M(2; 1), y las componentes (a 1; a2) del vector “ ā ” como las
diferencias de coordenadas de los puntos “M” y “Q”:
x x0 x 0 x xM x0 2 0 2 a1 xQ xM 3 2 1
OP ; OM ; a a 1 ; 3
y y0 y 0 y yM y0 1 0 1
a2 yQ y M 4 1 3
y reemplazando todos estos valores en la forma vectorial, obtenemos:
(x ; y) = (2 ; 1) + (1 ; 3)
que es la ecuación vectorial de la línea recta por dos puntos de acuerdo a lo ya visto en el ejemplo 1.
Pasaremos ahora a las otras formas pedidas.
Entonces a ésta última expresión podemos también escribirla:
x – x0 = (xM – x0) + a1 x = xM + a1 x = 2 + 1
y – y0 = (yM – y0) + a2 y = yM + a2 y = 1 + 3
de donde resulta la ecuación de la recta en su forma paramétrica, expresión ésta que también podemos
escribir
x 2
x 2 1 1
x 2 y 1 Forma simétrica
y 1 3 y 1 1 3
3
si ahora tomamos la última ecuación y efectuamos la siguientes operaciones:
3(x - 2) = 1(y - 1) 3x - 6 = y – 1 3x – y - 6 + 1 = 0
de donde resulta:
3x – y - 5 = 0 que es la forma General o Implícita,
65
x y 1
2 1 1 (1 − 4)𝑥 − (2 − 3)𝑦 + (8 − 3) 1 = −3𝑥 + 1𝑦 + 5 = 0
3 4 1
expresión esta última que multiplicada por menos uno (-1), nos queda:
3x – y – 5 = 0
Ejemplo 4:
Dados los puntos M(1; -5; 4) y N(0; 3; -2), hallar la ecuación de la recta que pasa por ellos. Exprese dichas
ecuaciones en sus formas vectorial, paramétrica y simétrica.
Solución:
La resolución de éste ejercicio es similar a lo visto para el ejemplo 2, es decir debemos trabajar en el
espacio vectorial R3 , y tendremos como solución una recta en un espacio de tres dimensiones. Aplicamos
también los conceptos utilizados en el ejemplo 3, pues son dos puntos los que definen el vector dirección de
la recta.
Tendremos entonces, que la ecuación de la recta en su forma vectorial está dada por:
OP OM MN
x – x0 = (xM – x0) + a1 x = xM + a1 x = 1 - 1
y – y0 = (yM – y0) + a2 y = yM + a2 y = -5 + 8
y – z0 = (zM – z0) + a3 z = zM + a3 z = 4 - 6
de donde resulta la ecuación de la recta en su forma paramétrica.
A la fórmula paramétrica la podemos también escribir
x 1
x 1 1
1
y 5 x 1 y 5 z 4
y 5 8 Forma Simetrica
8 1 8 6
z4
z 46
6
66
Ángulo de dos rectas
Consideremos las rectas r1 (a1;b1) y r2(a2;b2) definidas en el
y espacio vectorial bidimensional R2 .Al ángulo que forman
las dos rectas lo obtenemos aplicando el concepto de producto
r2 escalar de dos vectores:
r1 r1 . r2 r1 . r2 cos
r1 . r2
cos
r1 . r2
0 x
Tomando en cuenta que el producto escalar de dos vectores es igual a la suma de los productos de las
componentes homólogas o números directores homólogos, resulta:
a1 a2 b1 b2
cos (26)
a1 b1 . a2 b2
2 2 2 2
Solución:
Las rectas dadas en forma explícita tienen por ecuación y = mx + b , siendo
y m a y a2
m
x ax a1 ,
correspondiendo los valores de a 1 y a2 a las componentes del vector dirección de la recta ā (a1; a2).
En el caso de 𝑟̅1 dicho vector dirección será: ā (a 1; a2) ā (3; 1) y para 𝑟̅
2 𝑏̅ (b1; b2 ) 𝑏̅ (2; 5).
Con las componentes de los vectores dirección y a través del producto escalar puedo encontrar el valor del
ángulo “ ”, o sea:
a.b
a . b a . b cos arc cos
a .b
67
3. 2 1. 5
arc cos arc cos
11
490 46'30''
3 1 . 2 5
2 2 2 2
290
Otra forma de calcular “ α ” podría ser a través de la expresión:
m m1
arc tan 2
1 m1 . m2
5 1
arc tan 2 3 arc tan 13 arc tan 1,181818 490 46'30''
1 5 11
1 .
3 2
Condiciones de Perpendicularidad de dos Rectas
Para que r1 sea perpendicular a r2 , deberá ser:
1 + 𝑚1 𝑚2 1
𝑟̅1 ⊥ 𝑟̅2 ⇒ 𝛼 = 90° ⇒ 𝑐𝑜𝑡𝑎𝑛 90° = 0 ⇒ = 0 ⇒ 1 + 𝑚1 𝑚2 = 0 ⇒ 𝑚1 = − (27)
𝑚1 − 𝑚2 𝑚2
Es decir, que para que dos rectas cumplan la condición de perpendicularidad, el coeficiente angular de una
de ellas debe ser igual a la inversa del otro con el signo (cambiado) opuesto.
A un resultado similar podemos llegar, considerando el producto escalar de los vectores dirección de ambas
rectas:
a1 . b1 a2 . b2
900 cos 0
a1 a2 b1 b2
2 2 2 2
Es decir que cuando la suma de los productos de las componentes homólogas de los vectores dirección de
las rectas (o la suma de los productos de los números directores homólogos de las rectas) es igual a cero,
dichas rectas son perpendiculares.
Ejemplo 6:
Verificar si los siguientes pares de rectas son perpendiculares:
r1: 4x + 2y – 13 = 0 r 3: 2x – y + 4=0
a) b)
Solución:
Para que dos rectas sean perpendiculares debe cumplirse que el coeficiente angular de una de ellas debe ser
igual a la inversa del otro con el signo cambiado, o sea:
1
m1
m2
Para el caso a) tendremos:
4 13 4
r1 2 y 4 x 13 y x m1 2
2 2 2
3 3 3
r2 7 y 3x 3 y x m2
7 7 7
1
es evidente que: 𝑚1 ≠ − por lo tanto 𝑟̅1 no es perpendicular a 𝑟̅2
𝑚2
68
Para el apartado b)
de 𝑟̅3 y = 2 x + 4 m3 = 2
34 187 1 187 1
de 𝑟̅4 - 68 y = 34 x – 187 𝑦 = 𝑥− ⟹𝑦=− 𝑥+ ⟹ 𝑚4 = −
−68 −68 2 68 2
de donde se verifica que:
1 1
𝑚3 = − ⟹2=− 𝑙𝑜 𝑞𝑢𝑒 𝑐𝑜𝑚𝑝𝑟𝑢𝑒𝑏𝑎 𝑞𝑢𝑒 𝑟̅3 ⊥ 𝑟̅4
𝑚4 2
Ejemplo 7:
Compruebe si los siguientes pares de rectas son paralelos
r1 : 7 x 2 y 0 r3 : 6 x 2 y 11 0
a) b)
r2 : 4 x y 1 0 ; r4 : 3 x y 5 0
Solución:
Si dos rectas son paralelas sus coeficientes angulares deben ser iguales o también que uno de ellos sea
proporcional del otro; o sea:
a2 b a b a a
𝑚1 = 𝑚2 ó 𝑚1 = 𝜆𝑚2 ó m1 ; m2 2 ; 2 2 2 1 a1 . b2 a2 . b1 0
a1 b1 a1 b1 b2 b1
Para el caso a)
7 7
r1 : 2 y 7 x y x m1
2 2
⟹ 𝑚1 ≠ 𝑚2
r2 : y 4 x 1 m2 4
o también:
7 y a2
m1 a (a1 ; a2 ) a ( 2 ; 7 )
2 x a1
a1 a2 2 7
b1 b2 1 4
4 y b2
m2 4 m2 b ( b1 ; b2 ) b (1 ; 4 )
1 x b1
a1 . b2 – a2 . b1 = 0 2 . 4 – 1 . 7 0
todo lo expuesto indica que este par de rectas analizadas, no son paralelas.
69
Para el caso b)
6 x 11 6
r3 : 2 y 6 x 11 y 2
m3 m3 3
2
m3 m4
r4 : y 3 x 5 m4 3
o también:
6
m3 2 a (a1 ; a2 ) a (2 ; 6)
a1 a 2 6
2
b1 b2 1 3
3
m4 3 m4 b (b1 ; b2 ) b (1 ; 3)
1
a1 . b2 – a2 . b1 = 0 2 . 3 – 6 . 1 = 0
lo aquí analizado indica que para este caso b) las rectas son paralelas, es decir: 𝑟̅3 ∥ 𝑟̅.
4
n . P1 P 0 n Ai B j ; P1 P x x1 i y y1 j
y reemplazando, resulta:
Ai B j . x x i y y j 0
1 1
71
entonces nos queda:
A B C
x y 0 (34)
A B
2 2
A B
2 2
A B2
2
Ejemplo 8:
La ecuación de una recta es: 5x – 7y – 11 = 0 . Reducir su ecuación a la forma normal y hallar los valores
de “ p ” y de “ ”.
Solución:
En la ecuación dada es: A = 5 ; B = -7 y C = -11. El módulo del vector 𝑛̅ , será:
n A2 B 2 52 7 25 49 74
2
Para determinar la forma normal de la ecuación dada en su modo general o implícita, vamos a dividir dicha
ecuación por el módulo del vector “𝑛̅ ” o sea en éste caso por ±√74 , valor que toma-remos con el signo
positivo dado que el término independiente “c” de la ecuación propuesta es negativo, y tendremos entonces:
5 7 11
x y 0
74 74 74
que es la forma normal pedida; en donde
5 7 11
cos ; sen , y , " p"
74 74 74
Aquí podemos observar que el valor del coseno es positivo y el del seno es negativo, razón por la cual
podemos asegurar que el ángulo que la recta forma con el semieje positivo de las “x” está en el cuarto
cuadrante, es decir:
7
sen 7 7
tan 74 tan arc tan 3050 32 '
cos 5 5 5
74
Ejemplo 9:
Calcule la distancia desde la recta: 3x – 4y + 5 = 0 al punto P(2; 1), utilizando la forma normal de la
ecuación de la recta. Analice además el signo de la distancia y explique el porqué del mismo.
Solución:
3𝑥 − 4𝑦 + 5 = 0 ⟹ |𝑛̅ | = ±√𝑎2 + 𝑏 2 = ±√32 + (−4)2 = ±√9 + 16 = ±√25 = ±5
Como el término independiente de la ecuación de la recta dada es positivo, tomo el valor de la normal del
vector “𝑛̅” con signo negativo o sea “𝑛̅ = - 5” y resulta:
3 4 5 3 4
x y 0 x y 1 0
5 5 5 5 5
y reemplazando en ésta última ecuación los valores de “x” y de “y” por las coordenadas del punto “P”,
tendremos la distancia “d” buscada:
3 4 6 4 7
. 2 .1 1 d d 1 d
5 5 5 5 5
72
el valor del signo de la distancia ( - ) indica que el punto P y el origen del sistema de coordenadas se
encuentran del mismo lado respecto a la recta estudiada, es decir, ambos están en el mismo semiplano
respecto de la recta.
Familia o haz de rectas
Tomemos la ecuación de la recta:
Ax+By+C=0
Los coeficientes son constantes reales y arbitrarias, es decir, pueden tomar cualquier valor real, siempre que
A y B no sean simultáneamente nulos.
Uno podría decir que esas tres constantes son independientes, pero en realidad sólo dos de ellas son
independientes. En efecto, uno, cuando menos, de los coeficientes A y B deben ser diferentes de cero. Por lo
tanto si A 0, podemos dividir toda la ecuación por “A” de manera que tome la forma:
B C
x y 0
A A
de donde resulta que hay sólo dos constantes independientes que son las razones arbitrarias
B C
,y,
A A
Para calcular estas constantes se necesitan dos ecuaciones independientes que las contengan, y cada una de
estas ecuaciones se obtiene a partir de una condición independiente.
Entonces, analíticamente, la ecuación de una recta queda perfectamente determinada por dos condiciones
independientes.
Geométricamente, una recta queda determinada por dos condiciones independientes, es decir una recta está
completamente determinada si se conocen dos de sus puntos, ó uno de sus puntos y su dirección.
Por lo tanto una recta que satisface una sola condición no es una recta única.
Hay muchas rectas que cumplen una única condición y cada uno de estos grupos tiene la propiedad común
asociada con esa única condición. De acuerdo con ello podemos formular la siguiente definición:
“La totalidad de las rectas que satisfacen una única condición geométrica se llama Familia o Haz de
Rectas”.
Rectas Paralelas: Son aquellas que tienen un mismo coeficiente angular o pendiente y varían en su
término independiente.
Su ecuación es de la forma:
y = mx+k
en donde “m” (pendiente de la recta) es un valor conocido igual para todas las rectas y donde “k” es una
constante arbitraria que puede tomar todos los valores reales.
Rectas Concurrentes: Responden a esta característica todas las rectas que pasan por un mismo punto,
teniendo diferentes pendientes o coeficientes angulares. La fórmula que las agrupa, es la siguiente:
y – y1 = k (x – x1)
en donde x1 e y1 son las coordenadas de un punto “P” por el cual pasan todas las rectas que conforman el
haz y “k” que representa al coeficiente angular o pendiente de la recta es una constante que puede tomar
todos los valores reales.
Familia o Haz de Rectas que pasan por la intersección de otras dos rectas dadas:
Constituye un caso particular de familia de rectas.
Dadas las rectas:
𝑟̅1 : A1x + B1 y + C1 = 0 (35)
𝑟̅2 : A2 x + B 2y + C2 = 0 (36)
y supongamos que las mismas se cortan en un punto, o sea que deberá ser:
A1 B
1
A2 B2
(es decir no son paralelas); y sea entonces P(x1, y1) su punto de intersección. La familia de rectas que pasan
por la intersección de las rectas 𝑟̅1 y 𝑟̅2 responden a la ecuación:
73
k1 (A1 x + B1 y + C1) + k2 (A2 x + B2 y + C2) = 0 (37)
en donde k1 y k2 son constantes arbitrarias que pueden tomar todos los valores reales, con excepción del
caso en que ambas sean simultáneamente nulas (cero).
Vamos a demostrar que la ecuación (37) representa la familia de rectas que pasan por el punto “P”.
Como k1 y k2 son constantes, la ecuación (37) es lineal en las variables “x” e “y”, y por lo tanto representa
una línea recta.
Además, como el punto P(x1, y1) está sobre ambas rectas (punto de corte de las mismas), sus coordenadas
satisfacen sus ecuaciones. Si ahora hacemos en (37),
x = x1 e y = y1
hallamos:
k1 . 0 + k2 . 0 = 0
que es verdadera para todos los valores de k 1 y k2 ; de donde se deduce que la ecuación (37) representa todas
las rectas que pasan por P(x1 , y1), punto de intersección de (35) y (36).
En particular, si en (37) hacemos k 1 0 y k2 = 0 , obtenemos la recta (35) . Si en cambio es k 1 = 0 y k2
0 , obtenemos la recta (36).
Podemos, por ejemplo, especificar que k 1 puede tomar todos los valores reales excepto cero. Bajo esta
hipótesis podemos dividir la ecuación (37) por k 1 y si reemplazamos la constante k 2/k1 por “k”, la expresión
(37) toma la forma más simple:
A1 x + B1y + C1 + k (A2 x + B 2y + C2) = 0 (38)
en donde el parámetro “k” puede tomar todos los valores reales.
Esta última ecuación representa la familia de rectas que pasan por la intersección de las rectas (35) y (36).
Lo más importante de ella es que nos permite obtener la ecuación de una recta que pasa por la intersección
de otras dos sin tener que calcular el punto de intersección.
Si a la expresión (38) le damos la forma general o implícita, nos quedará:
(A1 + k A2) x + (B1 + k B2 ) y + C1 + k C2 = 0 (39)
en la cual, el coeficiente angular es:
A k A2
m= 1
B1 k B2
y la ordenada al origen es:
C k C2
b = 1
B1 k B2
La importancia de la ecuación (38) o de su equivalente (39) radica en que es posible determinar la ecuación
de cualquier recta que pase por el punto de intersección de otras dos sin necesidad de conocer dicho punto
de intersección.
Ejemplo 10:
Dadas las rectas 𝑟̅1 : 4x + 2y – 13 = 0 y 𝑟̅:
2 3x – 7y + 3 = 0 , se pide determinar la ecuación de la recta que
pasando por el punto de intersección de 𝑟̅1 y 𝑟̅2 sea perpendicular a la recta 𝑟̅3 : 2x – y + 4 = 0 , utilizando
familias de rectas.
Solución:
La familia de rectas determinada por 𝑟̅1 y 𝑟̅2 esta dada por una ecuación de la forma:
𝑟̅1 + 𝑟̅2 = 0 4x + 2y – 13 + (3x – 7y + 3) = 0
4x + 2y – 13 + 3x -7y + 3 = 0 (4 + 3)x + (2 - 7)y – 13 + 3 = 0
y llamando a esta última ecuación
4 (4 + 3)x + (2 - 7)y – 13 + 3 = 0
𝑟̅:
vemos que la misma representa la familia de rectas que pasan por la intersección de 𝑟̅1 y 𝑟̅2 . Esta ecuación
(𝑟̅)
4 tiene como vector dirección:
a (a1; a2) a [(2-7); (4+3)]
y la recta 𝑟̅,
3 como vector dirección
b (b1, b2) b (-1; 2).
74
Recordar que si dos rectas son perpendiculares, el producto escalar de sus vectores dirección tiene que ser
igual a cero, o sea: 𝑎̅ . 𝑏̅ = a1.b1 + a2.b2 = 0
(2 - 7) (-1) + (4 + 3) . 2 = -2 + 7 + 8 + 6 = 0 13 + 6 = 0 13 = - 6
6
13
valor éste que reemplazamos en la ecuación de 𝑟̅4 y nos queda:
6 6 6
4 3 13 x 2 7 13 y 13 3 13 0
18 42 18 34 68 187
4 x 2 y 13 0 x y 0
13 13 13 13 13 13
y multiplicando todo por 13 resulta finalmente:
34 x + 68 y - 187 = 0
PLANO
Ecuación Vectorial del Plano determinada por un Punto P1 y la dirección de su Normal
que es la ecuación cartesiana del plano, llamada forma general o implícita, en donde A, B y C son las
componentes del vector “𝑛̅”, es decir los números directores de su normal y que fijan su dirección.
A su vez, , y son los ángulos que forma el vector “𝑛̅ ” con cada uno de los ejes coordenados,
recibiendo el nombre de “ángulos directores de la normal del plano”. Como consecuencia de ello: cos ,
cos y cos son los cósenos directores de la normal “𝑛̅ ”.
Ejemplo 1:
75
Halle la ecuación del plano que pasa por el punto M(-2; -1; 5) y es perpendicular a la recta “ l ” determinada
por los puntos Q(2; -1; 2) y R(-3; 1; -2).
Solución:
La recta “l” tiene por números directores a la diferencia de las coordenadas homólogas de los puntos Q y R.
Como dicha recta es perpendicular al plano buscado, sus números directores constituyen, a su vez, la normal
del plano pedido.
Entonces una vez hallados dichos números directores, podremos confeccionar la ecuación del plano que
pasa por un punto M de coordenadas conocidas y tiene su normal “𝑛̅ ” definida.
Los números directores de la ecuación de la recta serán entonces:
l [xQ – xR ; yQ – yR ; zQ – zR] l [2 – (-3); -1 –1 ; 2 – (-2)] l [5; -2; 4]
y de acuerdo a lo dicho, los números directores de la recta son los números directores de la normal del plano
𝑛̅ [A, B, C] 𝑛̅ [5; -2; 4].
Considerando ahora el punto M(-2; -1; 5) y un punto genérico P(x; y; z) podemos determinar el vector
̅̅̅̅̅ [ x-(-2); y-(-1); z-5] (x+2; y+1; z-5)
𝑃𝑀
y con ambos vectores, 𝑃𝑀 y 𝑛̅ determinar la ecuación vectorial del plano, o sea: 𝑛̅. ̅̅̅̅̅
̅̅̅̅̅ 𝑃𝑀 = 0 y
reemplazando valores:
[5; -2; 4] . (x+2; y+1; z-5) = 0
y resolviendo, nos queda:
5 (x + 2) – 2 (y + 1) + 4 (z – 5) = 0 5x – 2y + 4z + 10 – 2 – 20 = 0
5x – 2y + 4z – 12 = 0
z
Si A = 0 y D = 0 B y + C z = 0 (7). Ecuación del plano que
pasa por el origen del sistema de coordenadas y contiene al eje
“x” (eje de la variable que falta) y es perpendicular al plano
y
coordenado “yz”
x
76
Si B = 0 y D = 0 A x + C z = 0 (8). Ecuación del plano que z
pasa por el origen del sistema de coordenadas y contiene al eje
“y” (eje de la variable que falta) y es perpendicular al plano
coordenado “xz”. y
x
z
Si C = 0 y D = 0 A x + B y = 0 (9). Ecuación del plano que
pasa por el origen del sistema de coordenadas y contiene al eje
“z” (eje de la variable que falta) y es perpendicular al plano y
coordenado “xy”.
x z
Si A = 0 y B = 0 C z + D = 0 z = - D/C = cte. (10),
plano paralelo al plano coordenado “xy”; es decir que es
y
paralelo al plano definido por las dos variables que faltan y
perpendicular al eje “z”
x
z
Si B = 0 y C = 0 A x + D = 0 x = - D/A = cte. (11). Plano
paralelo al plano coordenado “yz”; es decir que es paralelo al
plano definido por las dos variables que faltan y perpendicular al
eje “x”.
y
x z
Ejemplo 2:
Hallar la ecuación del plano perpendicular al plano coordenado “xy” y que pasa por los puntos R(1; 5; -3) y
Q(-5; -4; 11).
Solución:
Como el plano buscado es perpendicular al plano coordenado “xy”, su ecuación es de la forma:
Ax + By + D = 0
y como éste plano debe pasar por los puntos “R” y “Q”, las coordenadas de dichos puntos deben satisfacer a
la ecuación del plano; entonces tendremos:
1A + 5B + D = 0
- 5A - 4B + D = 0
La solución de este sistema (por cualquiera de los métodos conocidos) para “A” y “B” en términos de “D”,
resulta:
77
3 2
A= D ; B D
7 7
y sustituyendo estos valores en la ecuación Ax + By + D = 0 y dividiendo todo por “D”, tendremos:
3 2 3 2
Dx Dy D 0 x y 1 0
7 7 7 7
y multiplicando todo por “7” para eliminar denominadores, nos queda finalmente:
3 x- 2 y+7=0
S(0 , 0 ,c)
Si: y = 0 z = 0 Ax + D = 0 x = - D/A = a (11)
punto M(a, 0, 0)
Si: x = 0 z = 0 By + D = 0 y = - D/B = b (12)
punto R(0, b, 0)
Si: x = 0 y = 0 Cz + D = 0 z = - D/C = c (10) R (0 , b , 0) y
punto S(0, 0, c)
M (a , 0 ,0)
x
Volviendo a la ecuación general implícita: Ax + By + Cz + D = 0 y dividiendo ambos miembros por - D, se
tiene:
A B C D
x y z 0
D D D D
operando
x y z
1 0
D D D
A B C
y sustituyendo (10), (11), y (12) y pasando el término independiente al otro miembro, se tiene:
𝑥 𝑦 𝑧
+ + =1 (13)
𝑎 𝑏 𝑐
llamada Ecuación Segmentaría
La ecuación segmentaría del plano, recibe este nombre porque se encuentran explicitados los valores a, b y
c, que son las distancias desde el origen del sistema de coordenadas a las intersecciones del plano con cada
uno de los ejes coordenados, o sea es la medida de los segmentos correspondientes.
Ejemplo 3:
Dado el plano de ecuación: x + 2y + 2z – 4 = 0 ; se pide hallar la ecuación segmentaría del mismo.
Representar gráficamente.
Solución:
Considerando la ecuación del plano dado x + 2y + 2z – 4 = 0 , en la cual pasamos al segundo miembro el
término independiente del mismo x + 2y + 2z = 4 y dividiendo todo por “ 4 ”, resulta:
x 2 y 2z 4 x y z
y operando 1
4 4 4 4 4 4 4
1 2 2
78
z
de donde resulta
𝑥 𝑦 𝑧
+ +
4 2 2
Este plano corta al eje coordenado “x” en el punto (4; 0; 2
0); al eje coordenado “y” en el punto (0; 2; 0) y al eje
coordenado “z” en el punto (0; 0; 2); es decir los
denominadores de dicha ecuación son los segmentos que 2 y
el plano determina sobre los respectivos ejes 4
coordenados.
x
Ejemplo 4:
Hallar el ángulo formado por el plano: 5x + 4y – z + 8 = 0 y el plano coordenado “xy”.
Solución:
El cálculo del ángulo entre dos planos se realiza considerando el ángulo que hacen sus respectivas normales.
El mismo se mide utilizando el producto escalar entre vectores.
Plano: 5 x 4 y z 8 0 n1 (5; 4;-1)
n1 .n 2 = n1 . n 2 cos
Plano coordenado '' xy '' n 2 (0;0;1)
n1 .n 2 n1 .n 2 5.0 4.0 (1).1
cos arc cos arc cos
n1 . n 2 n1 . n 2 52 42 (1)2 . 12
1
arc cos 810 7 '
42
79
Condición de Perpendicularidad
Π1
Si los planos 1 y 2 son perpendiculares, implica que el ángulo que
𝑛
̅̅̅1
hacen ambos es igual a 90º = 90º o sea que cos = 0. En
este caso, de la expresión (14), se tiene:
Π2
A1 A2 + B1B2 + C1C2 = 0 (15) 𝑛2
̅̅̅
Condición de Paralelismo
Si los planos 1 y 2 son paralelos, significa que sus vectores
normales ̅̅̅
𝑛1 𝑦 ̅̅̅
𝑛2 también lo son. De acuerdo a lo que sabemos de 𝑛̅
vectores, podemos expresar a uno de ellos como combinación lineal
del otro, o sea: Π2
n1 = n 2 A1 i B1 j C1 k ( A2 i B2 j C2 k )
A1 i B1 j C1 k A2 i B2 j C2 k
Π1
y si existe igualdad de dos vectores, deberán ser iguales las
componentes homólogas:
A1 = A2
𝐴1 𝐵 𝐶
B1 = B2 = 1 = 1 (16)
𝐴2 𝐵2 𝐶2
C1 = C2
Aa Bb C c
cos sen (17)
A2 B 2 C 2 . a 2 b 2 c 2
Ejemplo 5:
𝑥+2 𝑦 𝑧−4
Hallar el ángulo que forman la recta “𝑟̅ ”: = = y el plano “ ”: 2x + 3y – z + 11 = 0
3 −1 2
Solución:
La recta tiene como vector dirección: 𝑎̅ (3; -1; 2) y el plano tiene como normal 𝑛̅ (2; 3; -1). Aplicando el
producto escalar entre el vector “𝑎̅ ” de la recta y la normal “𝑛̅ ” del plano , y recordando que los ángulos
“” y “φ” son complementarios, tendremos:
Aa Bb C c Aa Bb C c
cos sen arc sen
A2 B 2 C 2 . a 2 b 2 c 2 A2 B 2 C 2 . a 2 b 2 c 2
80
Ecuación Vectorial del Plano determinado por tres puntos
z Sabemos que por tres puntos no alineados pasa un plano y
sólo uno, y que por lo tanto se necesitan tres condiciones
P1 P para definirlo. Así el plano queda definido por los
P2 puntos P1 , P2 y P3 . Supongamos que existen entonces estos
π P3 tres puntos y además, como en todos los casos, el punto
genérico “P” de coordenadas x, y, z. Podemos formar los
y
tres vectores indicados: ̅̅̅̅̅
𝑃1 𝑃 , ̅̅̅̅̅̅ ̅̅̅̅̅̅
𝑃1 𝑃2 , 𝑃1 𝑃3 y teniendo en
cuenta lo ya visto para vectores, “que si tres vectores son
x coplanares, el producto mixto es nulo”, debe cumplirse
que:
P1P.(P1P2 x P1P3 ) = 0
y esta última expresión no es otra cosa que la ecuación vectorial del plano que pasa por tres puntos.
Como el resultado del producto vectorial: 𝑃 ̅̅̅̅̅̅ ̅̅̅̅̅̅
1 𝑃2 𝑥 𝑃1 𝑃3 es igual a 𝑛̅, es decir un vector perpendicular al
plano determinado por dichos dos vectores, y como estos pertenecen al plano por construcción, es decir “𝑛̅”
resulta perpendicular al plano , entonces el producto escalar de:
̅̅̅̅̅
𝑃1 𝑃. 𝑛̅ = 0
es la ecuación del plano ya vista anteriormente, es decir, es la ecuación vectorial del plano determinado por
un punto y la dirección de su normal.
Estando los puntos: P, P1, P2 y P3 definidos por sus coordenadas: P(x,y,z); P 1(x1 ,y1 ,z1); P2 (x2 ,y2 ,z2);
P3(x3,y3,z3) resulta que el producto mixto lo podemos expresar entonces, en función de las componentes de
los vectores como:
x x1 y y1 z z1
P1P . (P1P2 x P1P3 ) = x2 x1 y2 y1 z2 z1 0
x3 x1 y3 y1 z3 z1
Este determinante igualado a cero pasa a ser la ecuación cartesiana del plano determinado por tres puntos.
Ejemplo 6:
Hallar la ecuación del plano determinado por los puntos: P 1(3; -1; 2) ; P2(1; -1; 4); y ; P3(-2; 0; 5).
Solución:
Considerando un punto “P” genérico, de coordenadas (x,y,z) y los puntos dados, podemos formar los
siguientes vectores:
𝑃1 𝑃 = (x-3) 𝑖̅ + (y+1) 𝑗̅ + (z-2) 𝑘̅
̅̅̅̅̅
̅̅̅̅̅̅
𝑃 ̅ ̅
1 𝑃2 = (1-3) 𝑖̅ + (-1+1) 𝑗̅ + (4-2) 𝑘 = -2 𝑖̅ + 0 𝑗̅ + 2 𝑘
𝑃̅̅̅̅̅̅ ̅ ̅
1 𝑃3 = (-2-3) 𝑖̅ + (0+1) 𝑗̅ + (5-2) 𝑘 = -5 𝑖̅ + 1 𝑗̅ + 3 𝑘
Lo cual permite expresar el producto mixto como:
x 3 y 1 z 2
P1P.(P1P2 x P1P3 ) = 2 0 2 0
5 1 3
el cual podemos desarrollar por los elementos de la primera fila o también por Sarrus, tendremos:
0 2 2 2 2 0
( x 3) ( y 1) ( z 2)
1 3 5 3 5 1
=(x-3)(-2) – (y+1)(-6+10) + (z-2)(-2)=-2x + 6 – 4y – 4 – 2z + 4 =-2x - 4y - 2z + 6 = 0 2x + 4y + 2z – 6= 0
ó su equivalente que es:
x + 2y + z – 3 = 0
81
Familia o Haz de Planos
Según lo ya visto, un plano cualquiera Ax + By + Cz + D = 0 queda definido mediante tres condiciones. No
obstante tener cuatro parámetros, siempre es posible la división por uno cualquiera de ellos tal como el caso
de la obtención de la forma segmentaría. El plano que satisfaga menos de tres condiciones no está
determinado, no es único, y se dice en tal caso que representa una familia de planos.
en donde el parámetro “K” puede adquirir todos los valores reales. La ecuación representa a la familia de
planos que son paralelos al plano dado por mantenerse constantes las componentes del vector normal al
plano [𝑛̅ (A, B, C)] ; o dicho de otra forma, para cada valor de “K” se tiene un plano paralelo al dado por
cuanto la normal es la misma para todos.
y suponiendo que permanece fija la posición de P1 y que varían los parámetros A, B y C, los que en tal caso,
pueden adquirir el valor de cualquier número real.
Entonces podemos escribir:
K1(x-x1) + K2(y-y1) + K3(z-z1) = 0
Esta ecuación representa lo que se llama una radiación de planos, teniendo el punto P1 como vértice de la
radiación, debiendo cumplirse que no más de dos de los parámetros sean simultáneamente ceros.
Familia de Planos que pasan por la intersección de otros dos (Planos concurrentes en una recta).
Dados los planos:
A1 x + B1y + C1 z + D 1 = 0 (18)
A2 x + B2y + C2 z + D 2 = 0 (19)
que cumplen la condición de no ser paralelos, es decir que: A1/A2 B1/B2 o que B1 /B2 C1 /C2 , o que C1/C2
A1/A2 ; dichos planos se cortan según una recta y por lo tanto, cualquier punto que satisfaga
simultáneamente las ecuaciones (18) y (19) está sobre la recta de intersección. Es evidente que las
coordenadas de dichos puntos satisfacen también la ecuación:
A1 x + B1y + C1 z + D 1 + k(A2 x + B2 y + C2 z + D2) = 0 (20)
Donde el escalar “k”, puede tomar cualquier valor real distinto de cero.
La ecuación (20) que es combinación lineal de las ecuaciones de los dos planos constituye lo que se llama
ecuación del haz de planos y la recta común recibe el nombre de eje o arista del haz.
Las ecuaciones de los dos planos constituyen un sistema de ecuaciones lineales con tres incógnitas que para
el caso planteado, es un sistema compatible indeterminado y las infinitas soluciones constituyen los infinitos
planos que pasan por la arista del haz.
Como consecuencia decimos que dos planos no paralelos definen una línea recta en el espacio de tres
dimensiones. De tal manera las ecuaciones de los planos son las llamadas ecuaciones de la recta dada por la
intersección de dos planos.
Ejemplo 7:
Hallar la ecuación del plano que pasa por el punto P(2; 5; -1) y por la recta intersección de los planos 1 : 4x
– y – 2z – 8 = 0 y 2: 3x – y + 4z – 4 = 0 , utilizando familia de planos.
Solución:
La familia de planos definida por 1 y 2 es de la forma: 1 +2 = 0 y con los datos aportados resulta:
4x – y – 2z – 8 + (3x – y + 4z – 4 ) = 0 (1)
82
y como el plano buscado debe pasar por el punto P(2; 5; -1), las coordenadas de dicho punto deben verificar
la ecuación pedida y que pertenece a la familia; entonces:
[4 . 2 – 1 . 5 – 2 . (-1) – 8] + [3 . 2 – 1 . 5 + 4 . (-1) – 4] = 0
3
(8 – 5 + 2 – 8) + (6 – 5 – 4 – 4) = 0 - 3 + (-7) = 0 -7 - 3 = 0 -7 = 3 = −
7
y sustituyendo el valor de “” en la ecuación (1), tendremos:
-3 9 3 12 12
(4x - y - 2z - 8) + (3x - y + 4z - 4)= 0 = 4x - x - y + y - 2z - z-8+ =0
7 7 7 7 7
19 4 26 44
x- y- z- =0
7 7 7 7
19 x – 4 y – 26 z – 44 = 0
Ejemplo 8:
Dados los planos no paralelos:
7x + 6y – 7z – 14 = 0
x + y – 2z + 1 = 0
Determinar:
1) Las ecuaciones reducidas de la línea recta intersección de dichos planos;
2) Las coordenadas de los puntos de intersección de la recta con los planos coordenados;
3) Forma simétrica de la ecuación de esa recta.
83
Solución:
1) Sabemos que el haz de planos que pasan por la recta intersección de ambos planos es:
7x + 6y – 7z – 14 + ( x + y – 2z + 1) = 0
desarrollando y agrupando:
7x + 6y – 7z – 14 + x + y – 2z + = 0
(7 + ) x + (6 + ) y – (7 + 2) z – 14 + = 0
La ecuación del plano proyectante paralelo al eje coordenado “z” la obtenemos haciendo el término de “z”
de la ecuación general igual a cero, o sea:
7
( 7 + 2 ) = 0 𝜆=−
2
el cual reemplazo en la ecuación combinación lineal y resulta:
7 7 7 7 5 35
(7 ) x (6 ) y 14 0 x y 0
2 2 2 2 2 2
7x + 5y – 35 = 0
Haciendo ahora el coeficiente del término en “y” igual a cero, tendremos la ecuación del plano proyectante
paralelo al eje coordenado “y”, y será entonces:
6+=0 =-6
y reemplazando, resulta:
(7 – 6) x – [7 + 2(-6)] z – 14 – 6 = 0
1x + 5z – 20 = 0
y finalmente, anulando el coeficiente del término en “x”, resulta la ecuación del plano proyectante paralelo
al eje “x”:
7+=0 =-7
y reemplazando es:
(6 – 7) y – [7 + 2(-7)] z – 14 – 7 = 0
- 1y + 7z – 21 = 0 y – 7z + 21 = 0
2) Para obtener las coordenadas de los puntos de intersección de la recta con los planos coordenados,
resolvemos el sistema formado por las dos ecuaciones de los planos dados, cuya intersección determina la
recta en cuestión, o sea:
7x + 6y - 7z - 14 = 0
x + y - 2z + 1 = 0
haciendo previamente cero alguna de las variables para así hallar la intersección sobre el plano delimitado o
definido por las otras dos.
Vamos a comenzar resolviendo el sistema anulando primeramente la variable “y”; tendremos entonces:
7x - 7z - 14 = 0
si: y = 0
x - 2z + 1 = 0
Resolviendo por Cramer, nos da:
x=5 ; z=3
Haciendo ahora:
6y - 7z = 14
x=0 de donde resulta: y = 7 ; z = 4
y - 2z = -1
El punto P2 (0; 7; 4) es la intersección de la recta con el plano coordenado “yz”.
84
y finalmente haciendo ahora:
7x + 6y = 14
z=0 sistema que resuelto nos da:
x + y = -1
x = 20 ; y = -21.
El punto buscado es en éste caso: P3(20; -21; 0) que es la intersección de la recta con el plano coordenado
“xy”.
3) Utilizando, por ejemplo, los puntos P1 y P2 formaremos las ecuaciones simétricas de la recta en el espacio
R3:
Recordemos que: 𝑛̅ = A 𝑖̅ + B 𝑗̅ + C 𝑘̅; y si a éste vector lo dividimos por el módulo de él mismo, obtenemos
un vector de módulo unitario o versor, normal al plano:
n A B C
i j k i cos j cos k cos
n n n n
Podemos observar aquí que las componentes del vector unitario normal al plano son los cosenos directores
de ese vector.
85
y que el producto escalar de:
n n
OP1 . OP1 . . cos
n n
y como:
n
1
n
resulta:
𝑛̅
̅̅̅̅̅ 𝑂𝑃1 | 𝑐𝑜𝑠𝜑 = (𝑥1 𝑖̅ + 𝑦1 𝑗̅ + 𝑧1 𝑘̅)(𝑖̅ 𝑐𝑜𝑠 𝛼 + 𝑗̅ cos 𝛽 + 𝑘̅ cos 𝛾) = 𝑥1 cos 𝛼 + 𝑦1 cos 𝛽 +
𝑂𝑃1 . |𝑛̅| = |̅̅̅̅̅
+𝑧1 cos 𝛾 = 𝑝
Vemos que “p” es la proyección del vector posición de cualquier punto del plano sobre la normal al mismo y
que pasa por el origen del sistema de coordenadas, es decir, se trata de la distancia desde el origen al
plano.
Finalmente, la ecuación (25) que estábamos desarrollando queda:
x cos + y cos + z cos - p = 0
que es la forma normal o hessiana del plano.
El sentido del vector normal se elige de modo que “p” resulte positivo. Por convención el sentido es desde el
origen del sistema de coordenadas hacia el plano.
Recordando que la ecuación del plano definido por un punto P 1(x1, y1 , z1) y su normal 𝑛̅ (A, B, C), es:
A (x-x1) + B (y-y1 ) + C (z-z1 ) = 0
y si a dicha ecuación la dividimos por el módulo de la normal, resulta:
A B C
( x x1 ) ( y y1 ) ( z z1 ) 0
n n n
y como conclusión podemos escribir:
n
. P1P 0
n
que es la ecuación vectorial hessiana del plano dada por un punto y la dirección de su normal.
Ejemplo 9:
Determinar la forma normal de la ecuación del plano, que es paralelo al plano de ecuación:
4 x + y – 8 z + 11 = 0
y que pasa por el punto M(3; -2; -1).
Solución:
El plano buscado es paralelo al plano 4x + y – 8z + 11 = 0 y por lo tanto tendrá su misma normal
𝑛̅ (4; 1; -8).
Debo entonces confeccionar la ecuación de un plano que tiene una normal “𝑛̅” y que pasa por el punto “M”.
Dicha ecuación es de la forma: 𝑛̅ . ̅̅̅̅̅
𝑃𝑀 = 0, donde “P” es un punto genérico de coordenadas (x, y, z);
entonces dicha expresión puede ser escrita como:
[4; 1; -8] . [(x - 3); (y + 2) ; (z + 1)] = 0
de donde resulta:
4 (x – 3) + 1 (y + 2) – 8 (z + 1) = 0 4x + 1y – 8z – 12 + 2 – 8 = 0
obteniendo entonces, la ecuación general del plano:
4x + 1y – 8z – 18 = 0 (1)
86
Para obtener la forma normal del plano (x cos + y cos + z cos - p =0), debemos dividir la ecuación (1)
por el módulo del vector normal de dicho plano, es decir por
n A2 B 2 C 2 42 12 (8) 2 81 9
del cual tomaremos el valor + 9 dado que el término independiente de la ecuación del plano es negativo (-
D); y entonces resulta:
4 1 8 18 4 1 8
x y z 0 x y z20
9 9 9 9 9 9 9
4 1 8
que es la ecuación normal del plano, donde cos está representado por ; el cos por y el cos por − .
9 9 9
“El plano dado divide al espacio en dos subespacios o semiespacios, uno de los cuales contiene al origen del
sistema de coordenadas. Si el punto dado (P0) está ubicado en el semiespacio que no contiene al origen, “d”
será positivo o dicho de otra manera, si el plano dado está entre el origen y el punto, “d” es positivo, en
caso contrario “d” será negativo.
Ejemplo 10:
Hallar la distancia del punto P(-3; -4; 2) al plano de ecuación: 3 x + 12 y – 4 z – 39 = 0. Interpretar el signo
de dicha distancia.
Solución:
La distancia entre un punto y un plano se calcula mediante la fórmula:
A x 0 + B y0 + C z 0 + D
d=
A2 B 2 C 2
87
es decir hay que reemplazar las variables x, y , z de la ecuación del plano por las coordenadas del punto y
dividir todo por el módulo del vector normal del plano.
Un análisis más detenido de dicha fórmula nos permite determinar que en realidad estamos trabajando con la
ecuación del plano en su forma normal:
Pasaje de la Ecuación General Implícita del Plano a la forma Normal o Hessiana del mismo
Dado el plano: Ax + By + Cz + D = 0 , que tiene como normal a “ n ” definida por los números directores
A, B, y C n (A,B,C). Si dividimos la ecuación general implícita del plano por el módulo de “ n ”, nos
quedará:
A B C D
x y z 0
2 2 2 2 2 2 2 2 2
A +B +C A +B +C A +B +C 2
A +B2 +C2
ya hemos expresado que el valor de “p” de la ecuación normal, mide la distancia del origen del sistema de
coordenadas al plano y como tal, es un valor positivo; pero en la forma de la ecuación normal o hessiana del
𝐷
plano, “p” figura con valor negativo; (recordar que: 𝑝 = ), por lo tanto, para que la misma se
√𝐴2 +𝐵 2 +𝐶 2
transforme en la ecuación normal o hessiana , “D” deberá ser negativo; si por el contrario “D” es positivo,
habrá que multiplicar toda la ecuación por menos uno (-1) para que dicho valor sea negativo y de tal manera
corresponda a la forma normal de la ecuación del plano.
88
Distancia entre dos Rectas Paralelas en R 3
z Las dos rectas tienen la misma dirección
definida por el vector “𝑎̅”. Una de las rectas
pasará por el punto P1(x1, y1 , z1) conocido y
P2 la otra recta pasará por el punto P2 (x2 , y2,
P1 z2), no perteneciente a la primera y también
d conocido. A semejanza del caso anterior:
A P1 P2 a
y d
𝑎̅ a
x
𝑎̅
𝑟̅1 P2
𝑎1
̅̅̅ B
𝑟̅2 P1
̅̅̅2
𝑎
Se trata del caso de dos rectas no paralelas en el espacio tridimensional y que no pertenecen al mismo
plano.
La distancia entre ambas rectas se mide y también se manifiesta, sobre la única recta perpendicular a ambas.
La normal a ambas rectas alabeadas la obtenemos mediante el vector “𝑎̅”, resultado del producto vectorial:
𝑎1 ∧ 𝑎
̅̅̅ ̅̅̅2 = 𝑎̅ en donde el vector ̅̅̅ 𝑎1 fija la dirección de la recta 𝑟̅1 y el vector 𝑎̅̅̅2 indica la dirección de la
recta ̅̅̅.
𝒓𝟐
Consideremos un punto P 1(x1 , y1, z1 ) perteneciente a “𝑟̅” 1 y un punto P2 (x2 , y2, z2) perteneciente a “𝑟̅”.
2
La proyección de ̅̅̅̅̅̅
𝑃1 𝑃2 sobre el vector “𝑎̅” daría la distancia “d” buscada. Esta proyección se hace en base a
la proyección de ambos puntos sobre la normal. Si proyectamos el punto P1 sobre el vector “𝑎̅” (que lo
suponemos coincidente con “d”) y como “𝑟̅”es 1 perpendicular al vector “𝑎̅”, obtenemos el punto “A”.
Algo similar ocurre con la proyección de P2, obteniéndose el punto “B”.
El segmento ̅̅̅̅
𝑨𝑩 daría la distancia buscada “d”.
Por lo tanto:
(a1 a 2 ).P1P2 (a1 a 2 ) . P1P2 . cos
y como:
P1P2 . cos d
me quedaría entonces:
(a1 a 2 ).P1P2 (a1 a 2 ) . d
89
de donde, despejando el valor de “d”, resulta:
(a1 a 2 ).P1P2
d=
(a1 a 2 )
Ejemplo 11:
𝑥−2 𝑦+3 𝑧−5
Dadas las rectas 𝑟̅1 = = = y 𝑟̅2 , cuyo vector dirección es: 𝑎
̅̅̅2 (- 4; 0; 5) y que pasa por el punto
1 −2 3
M (- 4; 5; 6); se pide calcular la distancia entre ambas rectas. Decir también si las rectas son paralelas o
alabeadas.
Solución:
La distancia pedida se calcula en función de la fórmula:
(a1 a 2 ).PM
d=
(a1 a 2 )
donde ̅̅̅
𝑎1 y 𝑎
̅̅̅2 son los vectores dirección de 𝑟̅1 y 𝑟̅2 respectivamente; P es el punto de coordenadas (2; -3; 5)
por donde pasa 𝑟̅1 y tiene como vector dirección ̅̅̅𝑎1 (1; - 2; 3) y M (- 4; 5; 6) es el punto por donde pasa 𝑟̅.
2
̅̅̅̅̅ definido por los puntos “P” y “M”.
Habría que calcular el vector 𝑃𝑀
xM xP 4 2 6
PM yM yP 5 ( 3) 8
z z 6 5 1
M P
El numerador correspondiente a la expresión del cálculo de la distancia “d”, no es otra cosa que un producto
mixto de vectores (vectorial, escalar), mientras que el denominador de dicha expresión es un producto
vectorial; entonces aplicando la fórmula resulta:
1 2 3
4 0 5
6 8 1 96 60 40 8 84 84
d=
i j k 10 i 17 j 8 k (10) 2 (17) 2 ( 8) 2 453
1 2 3
4 0 5
84
d= d = 3,95
21, 284
Las rectas no son paralelas, pues sus vectores dirección no son iguales ni tampoco proporcionales.
90
UNIDAD N°7: Cónicas y Cuádricas.
Cónicas
Introducción:
La Geometría Analítica estudia todos los lugares geométricos, entre ellos los que se obtienen como
intersección de un plano con una superficie cónica.
La superficie cónica está generada por la rotación de una línea recta (llamada generatriz) que se mueve de tal
manera que pasa siempre por una curva fija (llamada directriz) y por un punto fijo “o” (llamado vértice del
cono). Dicho vértice está determinado por la intersección con una segunda recta llamada “eje”, alrededor de
la cual gira la primera. Todo punto de la generatriz describe circunferencias con centro en el eje del cono.
Las figuras o lugares geométricos que constituyen nuestro principal objetivo de estudio (cónicas), se
obtienen considerando las distintas posiciones relativas de un plano con el eje o con la generatriz de la
superficie cónica.
Si el plano es perpendicular al eje se obtiene la circunferencia
Si el plano está inclinado respecto al eje sin ser paralelo a éste y
a ninguna generatriz, se obtiene la elipse.
Si el plano es paralelo a una generatriz, cortará a la superficie
cónica dando por resultado una parábola
Si el plano es paralelo al eje, sin contener a éste, el resultado es
una hipérbola.
Ahora bien, si el plano pasa por el vértice, tendremos una
circunferencia de radio cero o una elipse de ejes principales nulos.
En cambio, si el plano contiene una generatriz, el resultado es una
recta de tangencia, si en cambio el plano contiene al eje de la
superficie cónica, obtenemos dos rectas que se cortan.
directriz eje Si el vértice del cono está en el infinito, el resultado es una
superficie cilíndrica, obteniendo como caso particular, si el plano
es paralelo al eje, dos rectas paralelas.
Todas las cónicas mencionadas responden a la ecuación general de
segundo grado con dos variables:
Ax2 + Cy2 + Dx + Ey + F = 0
que es la ecuación de segundo grado con dos variables, sin el
término rectangular.
El término rectangular Bxy, mencionado también como término
de segundo grado en las variables “x” e “y”, representa una cónica
que no está vinculada a los ejes coordenados rectangulares
habitualmente utilizados, sino que se halla asociada a ejes
coordenados que se encuentran girados un determinado ángulo
respecto de dichos ejes.
A medida que desarrollemos los distintos tipos de cónicas,
veremos que los valores relativos de los coeficientes determinan el
tipo de curva que la ecuación representa.
91
Circunferencia
Definición:
Circunferencia es el lugar geométrico de los puntos de un plano que se encuentran siempre a una distancia
constante de un punto fijo de ese plano.
El punto fijo se llama centro de la circunferencia y la distancia constante se denomina radio.
(x – h)2 + (y – k)2 = r2
Vamos a demostrar esto, suponiendo un punto P(x, y)
cualquiera de la circunferencia de centro C(h, k) y radio “r”.
Por definición de circunferencia, el punto “P” debe
satisfacer la condición geométrica:
k
CP r (1)
Vamos a expresar la distancia “r” entre los puntos “P”
(punto genérico) y “C” (centro de la circunferencia). Si por
los puntos “C” y “P” trazamos perpendiculares a los ejes
coordenados, obtenemos un triángulo rectángulo, al cual
h puede hallársele el valor de su hipotenusa mediante la
aplicación del Teorema de Pitágoras, el cual puede
expresarse analíticamente, por la ecuación:
(x - h) 2 + (y - k) 2 = r
de donde
(𝒙 − 𝒉)𝟐 + (𝒚 − 𝒌)𝟐 = 𝒓𝟐 (2)
Recíprocamente, si P1(x1, y1) es un punto cualquiera de la circunferencia, sus coordenadas satisfacen la
ecuación (2), de manera que se verifica la igualdad:
(x1 – h)2 + (y1 – k)2 = r 2
y extrayendo la raíz cuadrada de ésta última igualdad, tendremos:
(x1 - h) 2 + (y1 - k) 2 = r
𝒙 𝟐 + 𝒚𝟐 = 𝒓𝟐 (3)
La expresión (2) se conoce como ecuación ordinaria o forma ordinaria de la ecuación de la circunferencia.
En general se designa como forma ordinaria a aquella ecuación que nos permite obtener en forma rápida y
fácil sus características más importantes. Así por ejemplo, en la expresión (2) podemos obtener
inmediatamente las coordenadas del centro y el valor del radio.
El tipo más simple de la ecuación ordinaria de una curva se denomina “forma canónica”. Por lo tanto, la
ecuación (3) es la forma canónica de la ecuación de una circunferencia.
92
De acuerdo a lo expresado por el teorema 1, si se conocen las coordenadas del centro y el valor del radio, la
ecuación puede escribirse inmediatamente.
Forma general de la ecuación de la circunferencia
Si desarrollamos la ecuación ordinaria:
(x – h)2 + (y – k)2 = r2
obtenemos:
x2 + y2 – 2hx – 2ky + h2 + k2 – r2 = 0
la cual puede escribirse de la forma:
𝒙𝟐 + 𝒚𝟐 + 𝑫𝒙 + 𝑬𝒚 + 𝑭 = 𝟎 (4)
en donde:
D = -2h ; E = -2k ; F = h2 + k2 – r2
Se deduce entonces que la ecuación de la circunferencia puede escribirse también en la forma (4), llamada
forma general de la ecuación de la circunferencia.
Ahora debemos hacer la demostración recíproca, es decir, si una ecuación de la forma general (4) representa
una circunferencia. Para ello debemos pasar de la citada forma general (4) a la forma ordinaria (2),
utilizando el método de completar cuadrados.
Si ordenamos de acuerdo a las variables, los términos de la ecuación general, resulta:
(x2 + Dx) + (y2 + Ey) = - F
D2 E2
y sumando a ambos miembros y , obtenemos:
4 4
D2 E2 D2 E 2
2
x + Dx + y + Ey +
2
= -F + +
4 4 4 4
de donde resulta:
D2 E 2 4F
2 2
D E
x y (5)
2 2 4
y si comparamos las ecuaciones (2) y (5), vemos que depende del valor del segundo miembro de (5) el que
dicha ecuación represente o no una circunferencia.
Hay tres posibles casos por considerar:
a) Si D2 + E2 – 4F > 0 , la ecuación (5) representa una circunferencia de centro en el punto
D E 1
y radio igual a: 2 D E 4 F
2 2
;
2 2
93
Teorema 2:
La ecuación
x2 + y2 + Dx + Ey + F = 0
D2 + E2 – 4F > 0
Las coordenadas del centro son:
D E 1
; y el radio es: D2 E 2 4F
2 2 2
Si comparamos ahora, dicha ecuación con la forma general de la ecuación de segundo grado:
Ax2 + Bxy + Cy2 + Dx + Ey + F = 0
podemos observar que:
A = C = 1 ; B = 0 ; D = -2h ; E = -2k y F = h2 + k2 – r2
Recordar que cuando consideramos la intersección del plano con la superficie cónica, habíamos
mencionado que dicha ecuación general de segundo grado representaría una cónica distinta en
función de los valores que tuvieran sus coeficientes. Este es el caso de la circunferencia, donde A, B, C,
D, E y F toman los valores mencionados.
94
Parábola
Definición:
Una parábola es el lugar geométrico de un punto que se mueve en un plano de tal manera que su distancia a
una recta fija, situada en el plano, es siempre igual a su distancia a un punto fijo del plano y que no
pertenece a la recta.
El punto fijo se llama foco (F) y la recta fija directriz (ld) de la parábola.
La definición excluye el caso en que el foco está sobre la directriz.
Ecuación de la Parábola
ld y Vamos a comenzar analizando el caso de que la directriz
sea perpendicular al eje coordenado “x” (ó paralela al eje
D y coordenado “y”) y que el punto de intersección con el eje
P(x,y) coordenado “x” sea: A (-p ; 0) y el foco “F” esté ubicado
en F (p ; 0).
De esta manera la ecuación de la parábola toma su forma
a x
más simple.
A(-p,0) V x F(p,0) Por definición de parábola, la ecuación de la línea
directriz (ld) es: x = -p.
Sea P(x, y) un punto genérico cualquiera de la parábola.
Por “P” tracemos el segmento 𝑃𝐷 ̅̅̅̅ perpendicular a la
Línea Directriz ld . Entonces, por la definición de la
parábola, el punto “P” debe satisfacer la condición
geométrica:
̅̅̅̅| = |𝑃𝐷
|𝑃𝐹 ̅̅̅̅ | (1)
Pero la distancia entre dos puntos como “P” y “F”, por Pitágoras, es:
PF p x y2
2
y por la distancia de un punto “P(x,y)” a una recta “x = - p”, (recordar que la distancia de una recta
as bt c
ax+by+c=0 a un punto M(s,t), es: ), resulta:
a 2 b2
x+p
PD = =x+p
12
Geométricamente se observa que la abscisa del punto “P” es “x” y la del punto “D” es “-p”; pero como se
debe tomar distancia, por eso se coloca la expresión “x + p” entre barras, como valor absoluto).
Por lo tanto, la condición (1) está expresada analíticamente por la ecuación:
p- x
2
+ y2 = x + p
si elevamos al cuadrado ambos miembros de esta ecuación y simplificamos, obtendremos:
2
p - x = x p
2 2 2
+y
(p – x)2 + y2 (x + p) 2
p2 – 2px + x2 + y2 = x2 + 2px + p2
y2 = 4px y = 4 px 2 px y 2 px (2)
Esta curva sólo corta al eje en un punto y es simétrica con respecto al eje “x”.
De la ecuación (2), se deduce que para valores de la ordenada “y” reales y diferentes de cero, los valores de
“p” y “x” deben ser del mismo signo. De acuerdo con esto, podemos considerar dos casos:“p 0” ó “p 0”.
Si “p 0”, deben excluirse todos los valores negativos de “x”, y todo el lugar geométrico se encuentra a la
derecha del eje “y”.
95
De esta forma o análisis, podemos decir que el lugar geométrico es una curva abierta que se extiende
indefinidamente hacia la derecha del eje de ordenadas (eje y) y hacia arriba y abajo del eje “x”.
Ocurre lo inverso cuando “p 0”; la curva se extiende a la izquierda del eje “y” y arriba y abajo del eje “x”.
Según la ecuación (2), hay dos puntos sobre la parábola que tienen abscisa igual a “p”; uno tiene la ordenada
“2p” y el otro “-2p”. Como la abscisa del foco es “p”, la longitud del Lado Recto (Lr) es “4p”.
Si el eje de la parábola es el eje “y” y el vértice esta en el origen, se demuestra, análogament e, que la
ecuación de la parábola es:
x2 = 4py
Ecuación de la Parábola de eje paralelo a uno de los ejes coordenados y vértice en un punto de
coordenadas (h , k)
Para el análisis y deducción de la correspondiente ecuación, consideremos la siguiente figura:
De acuerdo a esto, y observando la parábola de la figura,
y ld y’ que tiene eje paralelo al eje “x” y vértice en el punto de
coordenadas (h , k); resulta, que si los ejes coordenados
son trasladados de tal manera que el nuevo origen O’
coincide con el vértice (h , k), se obtiene la ecuación de
O’ la parábola referida a los nuevos ejes “x’ e y’” de
I acuerdo a lo determinado para la ecuación de la parábola
V(h,k) F(h+p,k) x’ de vértice en el origen de coordenadas y eje coincidente
k con uno de los ejes coordenados:
y’2 = 4px’ (3)
(y – k)2 = 4p (x – h) (4)
siendo “ p ” la longitud del segmento del eje de la parábola (en este caso coincidente con el eje coordenado
x’) comprendido entre el foco y el vértice”.
Si “p 0”, la parábola se abre hacia la derecha; si “p 0”, la parábola se abre hacia la izquierda.
Si el vértice es el punto (h , k) y el eje de la parábola es paralelo al eje coordenado “y”, su ecuación es de la
forma:
(x – h)2 = 4p (y – k) (5)
F(h+p , k)
tener presente que en la primera ecuación ordinaria era F(p , 0) y ahora están relacionados los ejes
coordenados viejos con los nuevos a través de:
x = x’ + h ; y = y’ + k
y la ecuación de la directriz será en éste caso:
x=h–p
Si tomamos como ejemplo, la ecuación de la parábola de eje paralelo al de abscisas, de vértice: o’(1 , 3) y
parámetro: 4p = 8 , la misma es:
(y – 3)2 = 8 (x – 1)
Las coordenadas del foco son entonces:
F(h+p , k) F(1+2 , 3), es decir: F(3 , 3).
La ecuación de la directriz, es en éste caso:
x = h – p x = 1 – 2 , o sea: x = -1
Si en la ecuación (4) efectuamos las operaciones indicadas:
(y – k)2 = 4p (x – h) y2 – 2ky + k2 = 4px – 4ph y2 – 4px – 2ky + k2 + 4ph = 0
ecuación que es de la forma:
Cy2 + Dx + Ey + F = 0 (6)
y que constituye un caso particular de la ecuación general de segundo grado en “x” e “y”, cuya expresión es:
Cy2 + Ey + F = 0 (7)
es decir, a una ecuación de segundo grado en “y”. Si sus raíces “y 1” e “y2” son reales y distintas, la
expresión (7) puede ser escrita como:
C (y – y1 ) (y – y2) = 0 (y – y1 ) = 0 , e , (y – y2 ) = 0 ; o sea: y = y1 e y = y2
97
La ecuación (7) tiene entonces, como gráfica, dos rectas paralelas al eje “x”.
Si sus raíces son reales e iguales, la gráfica la constituye una recta única paralela al eje “x”, a una
distancia: y = y1 = y2 .
Si sus raíces son números complejos, la ecuación (7) no tiene gráfica en el campo de los números reales.
Si ahora considerásemos la ecuación (5): (x – h)2 = 4p (y – k) , la ecuación de la directriz será:
y=k–p
y las coordenadas del foco:
F(h , k+p)
Ax2 + Dx + F = 0 (9)
ecuación de segundo grado en “x”.
Análogamente a lo establecido anteriormente para la ecuación (7), la ecuación (9) tiene como gráfica un par
de rectas paralelas al eje coordenado “y”, una sola recta paralela al eje “y”, o no tiene gráfica, según que su
discriminante (cantidad subradical de la ecuación de segundo grado) sea mayor, igual o menor que cero.
En este caso, si “ p 0 ” las parábolas se abren hacia arriba y si “ p 0 ”, las mismas se abren hacia abajo.
98
Elipse
Definición:
Una elipse es el lugar geométrico de un punto que se mueve en un plano de tal manera que la suma de sus
distancias a dos puntos fijos de ese plano es siempre igual a una constante, mayor que la distancia entre los
dos puntos.
Los dos puntos fijos se llaman focos de la elipse (F y F’).
La definición de la elipse excluye el caso en que el punto móvil esté sobre el segmento que une los focos.
L’ PF F ' P 2a (1)
B’ en donde “a” es una constante positiva mayor que
E’ M’ D’ “c”. Desarrollando matemáticamente, finalmente
Figura 1 se obtiene:
𝒙𝟐 𝒚𝟐
+ =𝟏 (2)
𝒂𝟐 𝒃𝟐
Analicemos ahora la ecuación (2). Si en la misma le damos a “x” el valor +a ó -a podemos observar que la
ordenada “y” es igual a cero, o sea que estos valores hacen que se anule el valor de la ordenada y son
entonces los puntos en que la curva corta al eje de las “x”, es decir, estos valores me sirven para determinar
las coordenadas de lo que llamaremos vértices: V(a , 0) y V’(-a , 0). La longitud del eje comprendida entre
los vértices, se denomina eje mayor y es igual a “2a”, siendo “a” la constante que se menciona en la
definición de la elipse.
Si ahora en la misma ecuación (2) le diésemos a “y” el valor “b”, observamos que “x” en ese caso se hace
cero. Esto nos dice que la curva corta al otro eje (eje normal), en los puntos “M” y “M’ ” que tienen como
coordenadas M(0 , b) y M’(0 , -b); y la distancia entre estos dos puntos es lo que denominamos eje menor.
Como a c y a b, 2a es la distancia de V a V’ y por lo tanto será el eje mayor y 2b la distancia de M a M’
será el eje menor.
Del análisis de la ecuación (2) podemos deducir que la elipse es una curva simétrica con respecto a ambos
ejes coordenados y al origen.
Si de dicha ecuación despejamos el valor de la ordenada, o sea “y”, obtenemos:
b
y a2 x2 (3)
a
Del análisis de la ecuación (3) podemos observar que se obtienen valores reales de “y” sólo para valores de
“x” interiores al intervalo:
-a xa (4)
Si en lugar del valor de la ordenada, despejamos el valor de la abscisa, o sea “x”, de la misma ecuación (3),
se obtiene:
a 2
x b y2 (5)
b
de manera que resultan valores reales de “x”, solamente para valores de “y” dentro del intervalo:
-byb (6)
99
de las expresiones (4) y (6) se deduce que la elipse está limitada por el rectángulo cuyos lados son las rectas:
x= a ; yb
Por ende, la elipse es una curva cerrada; carece de asíntotas verticales y horizontales.
Observando la figura 1, podemos determinar los nombres particulares que reciben algunos segmentos que
unen dos puntos cualesquiera de la elipse; por ejemplo, un segmento tal como el BB ' que une dos puntos
diferentes cualesquiera de la elipse se llama cuerda. Una cuerda que pasa por uno de los focos se llama
cuerda focal, tal como la EE ' . Una cuerda focal que es perpendicular al eje focal se llama lado recto (Lr),
tal como LL ' . Una elipse, como tiene dos focos, tiene dos lados rectos. Una cuerda que pasa por el centro
“O”, se llama diámetro ( DD ' ).Los segmentos que unen los focos con un punto cualquiera se llaman radio
vector, tal como el PF ' o PF .
La abscisa del foco “F” es “c”. Si en la ecuación (3), sustituimos a la variable “x” por éste valor “c”, se
obtienen las ordenadas correspondientes, que son:
b 2
y a c2
a
de donde, por la relación: b2 = a2 – c2 , se tienen como ordenadas del foco:
b2 b2
y ; y
a a
b2
por lo tanto, la longitud del lado recto (Lr) para el foco F es: 2 . El mismo valor corresponde al foco F’.
a
c
Un elemento importante de la elipse es su excentricidad, que se define como la razón: y se representa por
a
la letra “e”.
c a b
2 2
puede deducirse la ecuación de la elipse de centro en el punto (h , k) y ejes paralelos a los ejes coordenados
referida a los ejes “x” e “y”. O sea que sustituyendo los valores de x’ e y’ en la ecuación (7), resulta:
x h y k
2 2
1 (8)
a2 b2
que es la ecuación de la elipse referida a los ejes “x” e “y”.
Análogamente, se puede demostrar que la elipse cuyo centro es el punto (h , k) y cuyo eje focal es paralelo
al eje coordenado “y”, tiene por ecuación:
x h y k
2 2
1 (9)
b2 a2
Las ecuaciones (8) y (9 se llaman generalmente, la segunda ecuación ordinaria de la elipse.
De los resultados obtenidos podemos enunciar el siguiente
Teorema:
“La ecuación de la elipse de centro el punto (h , k) y eje focal paralelo al eje “x”, está dada por la segunda
forma ordinaria:
x h y k
2 2
1
a2 b2
Si el eje focal es paralelo al eje coordenado “y”, su ecuación está dada por la segunda forma ordinaria:
x h y k
2 2
1 (10)
b2 a2
Para cada elipse, “a” es la longitud del semieje mayor, “b” es la longitud del semieje menor, “c” es la
distancia del centro a cada foco y “a”, “b” y “c” están ligadas por la relación:
a2 = b2 + c2
También, para cada elipse, la longitud de cada uno de sus lados rectos es:
b2
2
a
y la excentricidad “e” está dada por la relación:
c a 2 b2
e < 1
a a
Consideremos ahora la ecuación de la elipse en la forma:
x h y k
2 2
1 (12)
a2 b2
Si en la misma quitamos denominadores, multiplicando por: a2b2 , tendremos:
b2 (x – h)2 + a2 (y – k)2 = a2 b2
y desarrollando:
b2x2 – 2b2 hx + b2 h2 + a2 y2 – 2a2ky + a2k2 – a2 b2 = 0
y ordenando:
b2x2 + a2 y2 – 2b2 hx – 2a2ky + b2 h2 + a2k2 – a2 b2 = 0 (14)
la cual puede escribirse:
Ax2 + Cy2 + Dx + Ey + F = 0 (15)
en donde:
A = b2 ; C = a2 ; D = -2b2 h ; E = -2a2k ; F = b2 h2 + a2k2 – a2 b2
Evidentemente los coeficientes “A” y “C” deben ser del mismo signo.
101
Hipérbola
Definición:
Una hipérbola es el lugar geométrico de un punto que se mueve en un plano de tal manera que el valor
absoluto de la diferencia de sus distancias a dos puntos fijos del plano, llamados focos, es siempre igual a
una cantidad constante, positiva y menor que la distancia entre los focos.
La definición de la hipérbola excluye el caso en que el punto móvil se mueva sobre la recta que pasa por los
focos. Los focos y el punto medio de este segmento no pueden pertenecer al lugar geométrico.
102
Según esto, las ecuaciones (3) y (4), juntas con la simetría del lugar geométrico, muestran que la hipérbola
no es una curva cerrada sino que consta de dos ramas diferentes, una de las cuales se extiende
indefinidamente hacia la derecha, arriba y abajo del eje “x” y la otra se extiende indefinidamente hacia la
izquierda, por arriba y por debajo del eje “x”.
y B y
E L
A P(x,y)
D
V’ V C
F’(-c,0) C F(c,0) x F’ V’ V F x
D’
A’
E’ L’
B’
Asíntotas de la hipérbola
Si de la forma canónica de la ecuación de la hipérbola:
x2 y2
1
a 2 b2
la multiplicamos por a2 b2, obtendremos:
b2x2 – a2y2 = a2b2 (8)
104
Como la ecuación (10) representa las rectas:
b b
y= x ;e; y= x
a a
esto nos conduce a inferir, que la hipérbola es asintótica a estas dos rectas.
Vamos a demostrar lo que acabamos de enunciar. Sea P1(x1;y1) un punto cualquiera de la parte superior de la
rama derecha de la hipérbola de la ecuación (8), como se indica en la figura 1.
b
La ecuación de la recta y = x puede escribirse de la forma:
a
bx – ay = 0 (11)
Ahora bien, la distancia “d” entre la recta bx – ay = 0 y el punto P1(x1;y1) está dada por la expresión:
b x1 a y1
d= (12)
b2 a 2
Si multiplicamos numerador y denominador del segundo miembro de la ecuación (12) por: bx1 + ay1 ,
obtenemos:
b 2 x1 a 2 y1
2 2
d= (13)
b 2 a 2 b x1 a y1
Pero como P1 está sobre la hipérbola de ecuación (8),
b2x12 – a2 y12 = a2b2
de manera que la ecuación (13) puede escribirse en la forma:
a 2 b2
d= (14)
b 2 a 2 b x1 a y1
Si P1 se mueve hacia la derecha a lo largo de la curva y se aleja indefinidamente del origen, sus coordenadas,
x1 e y1 , aumentan ambas de valor sin límite, de manera que, por la ecuación (14), “d” decrece continuamente
y se aproxima a cero. Se sigue, de acuerdo con esto, que la recta (11) es una asíntota de la rama derecha de
la hipérbola (8).
Si P1 está sobre la parte inferior de la rama izquierda de la hipérbola (8) y se mueve hacia la izquierda, a lo
largo de la curva, alejándose indefinidamente del origen, entonces sus coordenadas x1 e y1 aumentan de
valor ambas sin límite en la dirección negativa.
La ecuación (14) muestra entonces que “d” decrece continuamente y tiende a cero, de donde se sigue que la
recta (11) es también asíntota de la rama izquierda de la hipérbola (8).
Quedan dos casos por considerar, que son, cuando P 1 está sobre la parte superior de la rama izquierda y
cuando P1 está sobre la parte inferior de la rama derecha.
Utilizando el mismo razonamiento que en los dos párrafos anteriores, podemos demostrar que la recta: bx +
ay = 0 , es una asíntota de ambas ramas de la hipérbola (8).
Estos resultados se resumen en lo siguiente:
Teorema:
“La hipérbola de ecuación:
b2x2–a2y2 = a2 b2
tiene por asíntotas las rectas
bx – ay = 0 y bx + ay = 0 .”
Nota: Si la ecuación de una hipérbola está en su forma canónica, las ecuaciones de sus asíntotas pueden
obtenerse reemplazando el término constante por cero y factorizando el primer miembro; así, por ejemplo,
para la hipérbola 9x2 – 4y2 = 36 , tenemos:
9x2 – 4y2 = 0 , de donde: (3x + 2y) (3x – 2y) = 0, y las ecuaciones de las asíntotas son respectivamente:
3x + 2y = 0 y 3x – 2y = 0
105
Segunda ecuación ordinaria de la hipérbola
Si el centro de una hipérbola no está en el origen del sistema de coordenadas, pero sus ejes son paralel os a
los ejes coordenados, sus ecuaciones pueden obtenerse tal como se determinaron ambas formas de la
segunda ecuación ordinaria de la elipse.
Y P(x,y) y’ Para éste caso, supongamos que el eje focal de la
hipérbola es paralelo al eje coordenado “x” y que
su centro se encuentra en el punto o’, centro de un
sistema de ejes coordenados x’o’y’, paralelo a los
O’ ejes coordenados xoy, según lo que se muestra en
la figura. Recordando que la ecuación de ésta
F’(-c,0) V’ V F(c,0) x’
hipérbola referida a los ejes coordenados x’o’y’
es:
k 𝑥′2 𝑦′2
− =1 (15)
𝑎2 𝑏 2
- = 1 (18)
a2 b2
Si quitamos denominadores, multiplicando por a2 b2 toda la ecuación:
x - h 2 y - k 2
a b
2 2
2
- = 1
a b2
obtenemos:
b2 (x – h)2 – a2 (y – k)2 = a2b2
y desarrollando esta última expresión, nos queda:
b2 x2 – 2 b2 h x + b2 h2 – a2 y2 + 2 a2 k y – a2 k2 = a2 b2
106
y ordenando:
b2x2 – a2y2 – 2b2 hx + 2a2ky + b2 h2 – a2k2 – a2 b2 = 0
y sacando factor común a los coeficientes “A” y “C” de los respectivos paréntesis, tendremos:
D E
A x2 x C y 2 y F 0
A C
y completando cuadrados:
2 D D D
2 2
2 E E E
2 2
A x x C y y F 0
A 2 A 2 A
C 2C 2C
2 2
D E D2 E2
A x C y F
2A 2C 4 A 4C
CD 2 AE 2 4 ACF
2 2
D E
A x C y
2A 2C 4 AC
1
y multiplicando todo por , tendremos:
AC
2 2
D E
x y CD 2 AE 2 4 ACF
2A
2C
(22) (20)
C A 4 A2 C 2
y haciendo:
CD2 - AE 2 - 4ACF
=M (23) (21)
4 A 2 C2
tendremos:
2 2
D E
x - y -
2A
-
2C
= M (24) (22)
C A
Si M 0, la ecuación (24) puede ser escrita, dividiendo ambos miembros por M, de la siguiente manera:
2 2
D E
x - y -
2A
-
2C
= 1 (25) (23)
MC MA
que es la ecuación ordinaria de la hipérbola.
Recordemos que “A” y “C” deben ser de signos opuestos. Por lo tanto, si (19) debe representar una
hipérbola, la ecuación (23) demuestra que “M” debe ser positivo. El denominador “ 4A 2C2 ” de “M” es
positivo; por tanto, el signo de “M” depende del signo de su numerador CD2 – AE2 – 4ACF , al que
designaremos por “N”.
De acuerdo con esto, comparando las ecuaciones (20) y (23), vemos que si N 0 , la ecuación (21)
representa una hipérbola; de la expresión (20), si N = 0, (19) representa el punto único (D/2A ; E/2C),
107
llamado usualmente una hipérbola punto; y si N 0, la ecuación (20) muestra que la expresión (19) no
representa ningún lugar geométrico real.
Una discusión semejante se aplica a la otra forma de la segunda ecuación ordinaria de la hipérbola. Por lo
tanto, tenemos el siguiente teorema:
“Si los coeficientes “A” y “C” son de distintos signos, la ecuación:
Ax2 - Cy2 + Dx +Ey + F = 0
representa una hipérbola de ejes paralelos a los ejes coordenados, o bien un punto, o no representa ningún
lugar geométrico real”.
Hipérbolas conjugadas
Si dos hipérbolas son tales que el eje transverso de cada una de ellas es idéntico al eje conjugado de la otra,
se llaman hipérbolas conjugadas.
Cada hipérbola es entonces la hipérbola conjugada de la otra.
Si la ecuación de una hipérbola es:
x2 y2
1 (25)
a 2 b2
entonces, de acuerdo a la definición, la hipérbola conjugada de (25) tiene por ecuación:
y2 x 2
- =1 (26)
b2 a 2
Es evidente que la ecuación (26) puede obtenerse de la ecuación (25), cambiando simplemente el signo de
uno de los miembros de (25). Por ejemplo, si la ecuación de una hipérbola es:
2 x 2 7 y2 = 18
7y2 – 2x2 = 18
Es fácil comprobar que un par de hipérbolas conjugadas tienen un centro común, un par común de asíntotas
y todos sus focos equidistan del centro.
108
Superficies cuádricas
Las superficies definidas por una ecuación de segundo grado en las variables “x”, “y”, “z”, reciben el
nombre de cuádricas.
Del estudio y análisis de la ecuación general de segundo grado con tres variables, cuya expresión es:
en donde uno por lo menos de los seis coeficientes A, B, C, D, E, F es diferente de cero; es decir, es una
ecuación de segundo grado que representa una superficie y a la cual suele llamársele superficie cuádrica o
simplemente una cuádrica.
La ecuación general de una cuádrica (1), ocupa, entre las superficies en Geometría Analítica del espacio de
tres dimensiones, un lugar análogo al ocupado entre las curvas planas, en Geometría Analítica de dos
dimensiones, la ecuación:
que es la expresión analítica de una sección cónica. Es decir que las cuádricas son la generalización al
espacio de tres dimensiones, de las cónicas.
En el plano se ha visto cómo mediante una conveniente rotación de ejes, puede eliminarse el término
cuadrado en las dos variables, o sea el término “xy” de la ecuación de una cónica y como mediante una
traslación de ejes coordenados, o completando cuadrados, se podía encontrar la forma canónica de la curva.
Lo mismo puede hacerse en el espacio de tres dimensiones, con la ecuación general de las cuádricas.
Entonces, de acuerdo a lo expresado, en la ecuación (1) puede efectuarse una rotación de ejes y también
traslación de ejes o completando cuadrados, para obtener como resultado una de estas formas:
Elipsoide
(Todo el desarrollo de la parte teórica puede ser seguido en el apunte de la parte práctica, a fin de aclarar
ideas).
Su ecuación canónica es:
x2 y 2 z 2
1 (5)
a 2 b2 c2
Vamos a deducir mediante la discusión de esta expresión, las principales propiedades morfológicas de la
superficie.
Simetría
Los tres términos del primer miembro de la expresión (5) son de segundo grado. Ocurre entonces, que si se
cambia el signo de una sola variable, de dos, o de las tres, la ecuación no varía. El elipsoide es por esta
condición, simétrico con respecto a cada uno de los planos coordenados, con respecto a cada uno de los ejes
coordenados y con respecto al origen del sistema coordenado.
110
x2 y 2 c2 k 2
; zk
a 2 b2 c2
y después de dividir todo por el segundo miembro tenemos:
x2 y2
1 ; z k
a2 2 b2 2
c2
c k c2 c k
2 2
Las otras dos secciones del elipsoide, que resultan de planos paralelos a los planos coordenados “XZ” e
“YZ” son también elipses, dentro de los límites de la superficie que es cerrada y está contenida en su
totalidad dentro del paralelepípedo que tiene por caras los planos: x a ; y b ; z c
Si dos cualesquiera de los coeficientes de la ecuación (5) son iguales, por ejemplo a b , la ecuación (6) se
transforma en una circunferencia real para valores de “k” comprendidos entre -c y +c. Se tiene entonces un
elipsoide de revolución.
En particular, si a > b y c = b , tenemos el elipsoide alargado, una superficie de revolución que se
obtiene haciendo girar la elipse
x2 y 2
1 , z 0
a 2 b2
en torno de su eje mayor.
También, si “a > b” y “c = a”, tenemos el elipsoide achatado o esferoide, que es una superficie de
revolución que se obtiene haciendo girar la elipse de ecuación:
x2 y 2
1 , z 0
a 2 b2
en torno de su eje menor.
Si: a = b = c , la superficie (4) es una esfera de radio “a” ; es decir, la superficie esférica es un caso
especial del elipsoide.
Figura 1 Figura 2
111
Hiperboloide de una hoja
(Todo el desarrollo de la parte teórica puede ser seguido en el apunte de la parte práctica, a fin de aclarar
ideas).
Una forma canónica de la ecuación del hiperboloide de una hoja es:
x2 y 2 z 2
1 (7)
a 2 b2 c2
y las otras dos formas canónicas son:
x2 y 2 z 2 x2 y 2 z 2
1 (8) ; y ; 1 (9)
a 2 b2 c 2 a 2 b2 c 2
La discusión de la primera de ellas servirá para las otras dos formas, ya que las superficies difieren
solamente en sus posiciones con relación a los ejes coordenados. El eje de rotación corresponde a la variable
del término negativo de la ecuación analizada.
Efectuemos entonces, como en el caso del elipsoide, la discusión de esta ecuación:
x2 y 2 z 2
1 (7)
a 2 b2 c2
Análisis de simetría: La simple observación de la ecuación, donde los tres términos del primer miembro
son de segundo grado, por lo cual, si se cambia el signo de una sola de las tres variables, o de dos, o de
las tres, la ecuación no varía; el hiperboloide de una hoja es por tanto simétrico con respecto a cada
uno de los planos coordenados, con respecto a cada uno de los ejes coordenados y con respecto al
origen del sistema de coordenadas.
Intersección con los ejes coordenados: Si se resuelven los sucesivos sistemas determinados al considerar
conjuntamente con la ecuación (7), las ecuaciones de cada uno de los ejes coordenados, es decir, resulta que
la intersección con el eje coordenado “x” es:
x2 y 2 z 2 y 0
2 2 1 x2 a2 x a
a 2
b c z 0
y los puntos de intersección con el eje coordenado “X” son entonces:
A1 ( a, 0, 0 ) y A2 ( -a, 0, 0 )
la intersección con el eje coordenado “y” es:
x2 y 2 z 2 x 0
1 y 2 b2 y b
z 0
2 2 2
a b c
y son los puntos:
B1 ( 0, b, 0 ) y B2 ( 0, -b, 0 )
la intersección con el eje coordenado “z” es:
x2 y 2 z 2 x 0
2 2 1 z 2 c2
a 2
b c y 0
y en éste caso no hay intersección con el eje coordenado z , pues, esta ecuación no tiene solución real.
Los puntos A1, A2, B1, y B 2 se llaman vértices del hiperboloide de una hoja.
112
x2 y 2 z 2
1 ; y 0
a 2 b2 c2
de donde resulta la hipérbola
x2 z 2
1
a2 c2
en la cual, su eje transverso coincide con el eje coordenada “X” y el conjugado coincide con el eje
“Z”. Sus vértices reales coinciden con los vértices A1 y A2 de la superficie.
c) Intersección con el Plano Coordenado “YZ”: Se obtiene resolviendo el sistema
x2 y 2 z 2
1 ; x 0
a 2 b2 c 2
de donde obtenemos la hipérbola
y2 z2
1
b2 c2
en la cual, su eje transverso coincide con el eje coordenado “Y” y el conjugado coincide con el eje “Z”,
siendo en esta ocasión, los vértices reales B1 y B2 .
Las curvas de intersección del hiperboloide de una hoja con los planos coordenados se llaman trazas de la
superficie.
113
Figura 3
Cómo conclusión diremos, que cualquier hiperboloide de una hoja se extiende a lo largo del eje coordenado
correspondiente a la variable cuyo coeficiente es negativo en la forma canónica de la ecuación.
Las intersecciones del hiperboloide de una hoja con planos paralelos al plano coordenado “XZ”, de ecuación
y h por ejemplo, la obtenemos resolviendo el sistema
x2 z 2 h2
1 ; y h 11
a2 c2 b2
expresión que también puede ser escrita como:
x2 z 2 b2 h2
; yh ,
a2 c2 b2
de donde resultan las curvas de intersección:
x2 z2
1 ; y h
a2 2 a2 2
b2
b h b2 b h
2 2
y en éste caso, para el valor absoluto de “h” menor que “b” (h < b), la ecuación representa una hipérbola de
eje transverso paralelo al eje coordenado “x”; en cambio, si |h| > b , se trata de una hipérbola de eje
transverso paralelo al eje “z”.
Si h = b, por la ecuación (11) de la intersección, se tiene:
x2 z 2
0 ; yb
a2 c2
que se puede expresar, dado que es una diferencia de cuadrados, como:
x z x z
0 ; y b
a c a c
que representan las siguientes dos rectas reales:
x z x z
0 , yb ; 0 , yb
a c a c
que se cortan en el vértice B1(0,b,0) de la superficie. (ver figura 3).
114
Si h = - b, la intersección es dada por las rectas:
x z x z
0 , y b ; 0 , y b
a c a c
cuyo punto de encuentro, es el vértice B2 (0, -b, 0). (ver figura 3).
Por lo expuesto, los planos: y b son, por definición, tangentes al hiperboloide de una hoja, en los
puntos B1 y B2, respectivamente.
Secciones análogas se obtienen mediante planos paralelos al plano coordenado “YZ”.
Como caso particular, si en la ecuación (7)
x2 y 2 z 2
2 2 2 1 ,
a b c
se hace: a = b , es decir se tiene:
x2 y 2 z 2
1
a2 a2 c2
y la superficie obtenida es un hiperboloide de revolución de una hoja.
En este último caso la elipse de garganta se reduce a una circunferencia de radio igual a: “a”.
Son también circunferencias todas las secciones producidas por planos paralelos al plano coordenado “XY”.
Hemos visto, que por cada uno de los vértices A1 , A2, B1 ó B2 de la elipse de garganta pasan dos rectas
situadas íntegramente en el hiperboloide.
Ahora demostraremos en forma general, que cualquiera sea el punto “P” del hiperboloide, siempre pasan por
él dos rectas contenidas íntegramente en su superficie y solamente dos.
x2 y 2 z 2 x2 z 2 y2
Si a la ecuación (7) 2 2 2 1 , la escribimos de la forma: 2 2 1 2 (12)
a b c a c b
y descomponiendo los dos miembros de ésta última ecuación en factores, tendremos:
x z x z y y
1 1 13 , pero esta última ecuación es equivalente a cualquiera de los
a c a c b b
sistemas siguientes:
x z y x z y
a c 1 b a c 1 b
14 ; 15
x z 1 1 y x z 1 1 y
a c b a c b
pues, multiplicando miembro a miembro las dos ecuaciones de los sistemas (14) ó (15), cualquiera sea el
valor de λ ó de μ , se obtiene la ecuación (13), dado que como consecuencia de dicho producto se elimina el
parámetro “λ” o el parámetro “”.
Si tomamos el sistema (14), al variar λ , cada una de estas ecuaciones representa un haz de planos y sus
intersecciones son rectas situadas en la superficie definida por la ecuación (12), puesto que dicha ecuación
(12) se satisface para soluciones comunes del sistema definido por (14), ya que es el producto de ambas.
Resulta entonces, que todas las ternas de números x ; y ; z que verifican el sistema (14), verifican también
la ecuación (13), que es independiente de λ. Expresado de otro modo, todos los puntos de las rectas dadas
por el sistema (14) son también puntos de la superficie dada por (13). Este conjunto de infinitas rectas
situadas en el hiperboloide se llama haz alabeado de segundo orden.
Análogamente, como la ecuación (12) es el producto de las ecuaciones del sistema (15), resulta otro haz
alabeado sobre la superficie.
En consecuencia, el hiperboloide de una hoja es una superficie reglada, que contiene dos sistemas de
generatrices rectilíneas.
Por cada punto del hiperboloide pasa una sola recta del sistema (14) y una sola del sistema (15). Las dos
generatrices determinan un plano que, por definición es el plano tangente a la superficie en ese punto.
115
Hiperboloide de dos hojas
(Todo el desarrollo de la parte teórica puede ser seguido en el apunte de la parte práctica, a fin de aclarar
ideas).
x2 y 2 z 2
Una forma canónica del hiperboloide de dos hojas es: 2 2 2 1 16 , existiendo además las otras
a b c
x2 y 2 z 2 x2 y 2 z 2
dos formas canónicas: 2 2 2 1 17 , y , 2 2 2 1 18 .
a b c a b c
La discusión de esta ecuación (16), es representativa de todas las formas, ya que las superficies difieren
solamente en sus posiciones con relación a los ejes coordenados.
Análisis de simetría
Por las mismas razones expuestas en la cuádrica anterior (hiperboloide de una hoja), el hiperboloide de dos
hojas es simétrico con respecto a cada plano coordenado, con respecto a cada eje coordenado y con respecto
al origen del sistema de coordenadas.
Intersección con el Plano Coordenado “XZ”: Este caso es similar a lo detallado en el punto anterior, para
la intersección con el plano coordenado “XY”.
x2 y 2 z 2
Como resultado de la intersección de la superficie 2 2 2 1 , y el plano “XZ” y 0 , obtenemos
a b c
2 2
x z
la hipérbola: 2 2 1 , y 0 ; cuyo eje transverso coincide con el eje coordenado “x”, y sus vértices son
a c
en este caso también, A1 y A2 de la superficie.
Intersección con el Plano Coordenado “YZ”: En este caso no hay intersección real con el plano
x2 y 2 z 2
coordenado “YZ”, dado que el sistema conformado por la ecuación de la superficie 2 2 2 1 y el
a b c
116
y2 z2
plano x 0 (YZ) , nos da por resultado: 1 , x 0; valor este no lógico, que como podemos
b2 c2
observar, la suma de dos números negativos es igual al número uno positivo.
Figura 4
son hipérbolas.
Aquí podemos observar que la distancia focal aumenta a medida que aumenta el valor absoluto del
parámetro “k”.
demuestra también, que las secciones paralelas al plano coordenado “XZ” son hipérbolas con la misma
característica del apartado anterior.
117
Intersección con planos paralelos al Plano Coordenado “YZ” (X = k)
x2 y 2 z 2
En este caso también debemos hallar la intersección de la superficie 2 2 2 1 y el plano x k , de
a b c
2 2 2 2 2 2
y z x y z k
donde resulta: 2 2 1 2 2 2 1 2 ; x k y multiplicando toda la ecuación por
b c a b c a
2 2 2
y z k
menos uno (-1), obtenemos: 2 2 2 1 ; x k , expresión esta que puede ser escrita como:
b c a
y 2
z 2
k a
2 2
k 2 a2
; x k , y dividiendo toda la ecuación por , resulta finalmente
b2 c 2 a2 a2
y2 z2
1 ; x k
b2 2 c2 2
a2
k a a2 k a
2 2
Tratase de una elipse real para valores absolutos de “k” mayores que “a” ( k > a ).
Si k = ± a, la sección cónica se reduce a dos puntos: A1(a, 0, 0) y A2(-a, 0, 0) , es decir los vértices de
dicha superficie cónica. Para valores de k < a, no hay puntos de intersección.
Si el valor absoluto de “k” a partir del valor “a”, crece indefinidamente, también las longitudes de los ejes de
la elipse crecen indefinidamente; resulta entonces que la superficie (el hiperboloide de dos hojas) consta de
dos ramas u hojas que se prolongan indefinidamente. Se dice entonces, que el hiperboloide se extiende a lo
largo del eje coordenado “x”, es decir a lo largo del eje correspondiente a la variable que aparece con
coeficiente positivo (recordar la ecuación del hiperboloide de dos hojas dado al comienzo del tratamiento del
tema).
x2 y 2 z 2
Si en la ecuación: 2 2 2 1 se hace b = c, la superficie es un hiperboloide de revolución de dos
a b c
x2 y 2
hojas que se obtiene haciendo girar la hipérbola: 2 2 1 ; z 0 , en torno al eje coordenado “x”; o
a b
2 2
x z
bien la hipérbola: 2 2 1 ; y 0 , en torno al eje coordenado “x”;
a b
CUÁDRICAS SIN CENTRO
Aquí consideraremos las cuádricas sin centro representadas por la ecuación:
Mx2 + Ny2 = Sz
en donde todos los coeficientes son distintos de cero.
x2 y 2
Podemos escribir esta ecuación también como: 2 2 c z 18 , llamada forma ordinaria o canónica
a b
de una superficie cuádrica sin centro.
La discusión de esta última expresión, (18), establece las siguientes propiedades:
Como dicha expresión carece de término independiente, la superficie pasa por el origen del sistema de
coordenadas; único punto común con los ejes coordenados y en consecuencia único vértice.
Valores contrarios de “x” e “y” no cambian la ecuación. Es por ello que la superficie tiene dos planos de
simetría (los planos coordenados “YZ” y “XZ”), llamados planos principales, y un eje de simetría (el
eje “z”), intersección de los planos de simetría. Este eje se denomina eje principal. Esta cuádrica no
tiene centro de simetría.
Atendiendo a las diversas combinaciones posibles de signos en la ecuación (18), se deduce que existen
solamente dos tipos diferentes de superficies:
Paraboloides elípticos: Aquellos en que los coeficientes de los términos de segundo grado son del mismo
signo.
Paraboloides Hiperbólicos: Aquellos en que los coeficientes de los términos de segundo grado son de
signos contrarios.
118
Paraboloide elíptico
(Todo el desarrollo de la parte teórica puede ser seguido en el apunte de la parte práctica, a fin de aclarar
ideas).
x2 y 2
Una forma canónica de la ecuación del paraboloide elíptico es: 2 2 c z 19 , y las otras dos formas
a b
x2 z 2 y2 z2
canónicas son: 2 2 c y 20 , y , c x 21
a b a 2 b2
Para cada forma podemos tener dos variaciones, según sea “c” positivo o negativo.
Analizaremos la ecuación (19) y este estudio será representativo de todas las formas.
Intersección con los Ejes Coordenados:
La superficie pasa por el origen del sistema de ejes coordenados. No hay otras intersecciones con los ejes
coordenados.
Trazas sobre los Planos Coordenados:
La traza sobre el plano coordenado “XY” es el origen del sistema de coordenadas, sobre el plano
x2
coordenado “XZ” es la parábola de ecuación 2 c z , y 0 (22) ; y sobre el plano coordenado “YZ”
a
2
y
es la parábola de ecuación: c z ; x 0 (23)
a2
Simetría:
La superficie es simétrica con respecto a los planos coordenados “YZ” y “XZ” y también con respecto al
eje coordenado “z”(eje principal).
b2 a b ca ca
119
iguales a la parábola principal producida por el plano coordenado “YZ”, pues todas tienen el mismo
k2
parámetro b c . Sus vértices k , ó , 2 se alejan continuamente de los planos coordenados “YZ” y
2
ca
“XY” a medida que aumenta el valor de “k”.
Una porción de superficie, en el caso de ser “c” positivo, es la siguiente:
Figura 5
Si “c” es negativo, la superficie está en su totalidad por debajo del plano coordenado “XY”.
Se dice que cada superficie se extiende a lo largo del eje coordenado “z”.
Cualquier paraboloide elíptico se extiende a lo largo del eje coordenado correspondiente a la variable de
primer grado en la forma canónica de su ecuación.
Si en la ecuación (19), es a = b , la superficie es un paraboloide de revolución que puede engendrarse
y2
haciendo girar la parábola: 2 c z , x 0 en torno del eje “z”.
b
120
UNIDAD N°8: Espacios Vectoriales.
Los conjuntos en R2 (vectores en el plano) y en R3 (vectores en el espacio tridimensional), tienen varias
propiedades interesantes.
Si se suman dos vectores en R2, lo que se obtiene es otro vector en R2 .
Ante la adición, los vectores conmutan
a b b a
y también obedecen la Ley de Asociatividad respecto a la suma de vectores
a b c a b c
Además, si ā pertenece a R (ā R ), entonces: ā + ō = ā (Existencia del elemento neutro); y también que:
2 2
Definición:
“Un espacio vectorial “V” es un conjunto de objetos, denominados vectores, junto con dos operaciones
llamadas adición o suma y multiplicación por un escalar y que satisfacen los diez axiomas que se enuncian
seguidamente:
1) Si “u” y “v” son objetos que pertenecen al espacio vectorial “V”, entonces “u + v” también pertenece a
“V”. (Propiedad de cerradura ante la adición vectorial).
2) Si “u” y “v” son objetos que pertenecen al espacio vectorial “V”, entonces “u + v” = “v + u”; es decir que
gozan de la Ley de la Conmutatividad de la adición vectorial.
3) Si “u”, “v” y “w” son objetos cualesquiera que pertenecen al espacio vectorial “V”, entonces: (u + v) + w
= u + (v + w); es decir que gozan de la Ley de Asociatividad de la adición vectorial.
4) Existe un vector 0̅ (vector cero) que pertenece al espacio vectorial “V”, tal que para todo “u” que también
pertenece al espacio vectorial “V”, se cumple: (u + 0̅)=( 0̅ + u) = u se demuestra entonces el
cumplimiento de la Ley de identidad aditiva o elemento neutro.
5) Para cada vector “u” que pertenece al espacio vectorial “V”, existe un vector “–u” que también pertenece
a “V”, tal que: u + ( -u ) = ( -u) + u = 0̅ . “–u” recibe el nombre de elemento opuesto de “u” y se cumple
con la Ley de inverso aditivo.
6) Si “u” es un vector que pertenece al espacio vectorial “V” y “k” es un escalar, entonces ku también
pertenece al espacio vectorial “V”; es decir cumple con la Ley de Cerradura ante la multiplicación
por un escalar.
7) Si “u” y “v” pertenecen al espacio vectorial “V” y “k” es un escalar, entonces k(u+v) = ku + kv también
pertenece al espacio vectorial “V”, es decir, se demuestra aquí que los vectores gozan de la primera Ley
de Distribución o Ley de Distribución respecto a la suma de vectores.
121
8) Si “u” es un vector que pertenece al espacio vectorial “V” y “k” y “l” son escalares, entonces:( k + l ) u =
k u + l u, es decir se demuestra la Propiedad Distributiva respecto a la suma de escalares ó también
podemos decir goza de la segunda Ley de Distribución.
9) Si “u” es un vector que pertenece al espacio vectorial “V” y “k” y “l” son escalares, entonces k (l u) = (k
l) u , es decir se demuestra la propiedad asociativa respecto al producto de escalares ó también la Ley
de la Asociatividad de la multiplicación por un escalar.
10) Para todo vector “u” que pertenece al espacio vectorial “V”, se cumple: 1u = u , es decir se demuestra la
existencia del elemento neutro respecto al producto por un escalar o de la Ley de la identidad
multiplicativa.
Muy Importante:
Debemos tener presente que, al definir el Espacio Vectorial, no se especifica la naturaleza de los
vectores ni la de las operaciones. Cualquier clase de objetos que se desee puede servir como vectores;
todo lo que se requiere es que se satisfagan los axiomas de los espacios vectoriales.
Como consecuencia de lo expresado en el párrafo anterior, podemos asegurar que hemos generalizado
la idea de vector.
Subespacios
Definición:
Un subconjunto no vacío “W” de un espacio vectorial “V”, es un subespacio de “V” sí “W” es un espacio
vectorial bajo las operaciones de adición y multiplicación por un escalar definidas sobre “V”.
En general, se deben verificar los diez axiomas de los espacios vectoriales para demostrar que un conjunto
“W”, con las operaciones de adición y multiplicación por un escalar forma un espacio vectorial.
Sin embargo, si “W” es parte de un conjunto mayor “V” del que ya se sabe que es un espacio vectorial,
entonces no es necesario verificar ciertos axiomas para “W” porque se heredan de “V”.
Por lo tanto, al decir de algunos autores, para demostrar que un conjunto “W” es un subespacio de un espacio
vectorial “V”, sólo es necesario verificar los axiomas 1º, 4º, 5º y 6º.
Ejemplos:
-7 -1 5
Combinación Lineal en R . 3
En R 3 7 es una combinación lineal de 2 y -3 ya que:
7 4 1
-7 1 5
7 2 2 1 3
7 4 1
3 2 8 1 0 4 0 1 2
Combinación Lineal en M23. En M23 , 1 9 3 3 1 1 5 2 2 3 6
122
3 2 8 1 0 4 0 1 2
lo que demuestra que: es una combinación lineal de y 2 3 6
1 9 3 1 1 5
Combinaciones Lineales en P n. En “Pn” todo polinomio se puede expresar como una combi-
nación lineal de los monomios xº, x1 , x2, . . . . , xn.
Cualquier otra terna que esté definida en R 3 y que sea linealmente independiente, genera a R 3. Es posible
entonces expresar respecto de esta nueva terna a los vectores “u” ó “v” ó cualquier otro vector definido en
dicho espacio como combinación lineal de la misma.
Base
Definición:
Si “V” es cualquier espacio vectorial y “S = v1, v2, . . . . , vn ” es un conjunto finito de vectores en dicho
espacio vectorial “V”, entonces “S” se denomina base para “V” sí:
a) S = v1, v2 , . . . . , vn es linealmente independiente.
b) S = v1, v2 , . . . . , vn genera a “V”.
Es decir que todo conjunto de “n” vectores linealmente independientes en Rn genera a Rn ; por lo tanto:
Ejemplo:
En R n se define un conjunto “S” formado por S = e1, e2 , e3, . . . . , en ; siendo:
es decir entonces que el conjunto “S” genera a R n y por lo tanto es una base para R n. Esta base se conoce
como base canónica ó estándar para R n.
123
Ejemplo:
Sean v1= (1, 2, 1) ; v2 = (2, 9, 0) y v3 = (3, 3, 4). Demostrar que el conjunto S = v1, v2, v3 es una base
para R3.
Para ello es necesario demostrar que cualquier vector arbitrario que pertenezca a R 3, tal como: b = (b1, b2 , b3)
se puede expresar como combinación lineal de los vectores de la base “S”, o sea:
b = k1 v1 + k2 v2 + k3 v3
y reemplazando en términos de las componentes, tendremos:
(b1, b2 , b3) = k1(1, 2, 1) + k2(2, 9, 0) + k3(3, 3, 4)
de donde resulta:
b1 1k1 2k2 3k3 b1 1k1 2k2 3k3
b 2k 9k 3k b 2k 9k 3k
2 1 2 3 2 1 2 3
esta combinación lineal se ha transformado en un sistema de ecuaciones lineales con tres incógnitas, que si
tiene solución demuestra que el conjunto “S” genera el espacio vectorial “V”.
Para probar que el conjunto “S” es linealmente independiente, una de las formas es determinar los valores de
k1, k2 y k3 que satisfagan el sistema de ecuaciones lineales no homogéneo o demostrar que la única solución
de:
k1v1 + k2v2 + k3v3 = 0 , es , k1=k2=k3= 0
lo que se reduce a demostrar que el sistema homogéneo:
1k1 + 2k 2 + 3k 3 = 0
2k1 + 9k 2 + 3k 3 = 0
1k + 0k + 4k = 0
1 2 3
Teorema 1:
Si S = v1, v2, . . . . , vn es una base para un espacio vectorial “V”, entonces todo conjunto con más de “n”
vectores es “Linealmente Dependiente”.
Teorema 2:
Dos bases cualesquiera para un espacio vectorial “V” de dimensión finita, tienen el mismo número de
vectores.
Aclaración: La “dimensión” de un espacio vectorial de dimensión finita “V”, se define como el número de
vectores en una base para “V”, lo que implica que los vectores son Linealmente Independientes.
Teorema 3:
a) Si S = v1, v2, . . . . , vn es un conjunto de “n” vectores Linealmente Independientes en un espacio
“V” de dimensión “n”, entonces “S” es una base para “V”.
b) Si S = v1, v2, . . . . , vn es un conjunto de “n” vectores que genera un espacio de dimensión “n”,
entonces “S” es una base para “V”.
c) Si S = v1, v2, . . . . , vr es un conjunto “Linealmente Independiente” en un espacio “V” de
dimensión “n” y “ r n ”, entonces se puede agrandar “S” hasta formar una base para “V” , es decir,
existen los vectores vr+1 , vr+2, . . . . , vn tales que v1, v2 , . . . . , vr, vr+1, vr+2, . . . . ,vn es una base para
“V”.
124
Espacio de Renglones y Columnas de una Matriz
A continuación estudiaremos los “espacios vectoriales” asociados con las matrices.
Los resultados nos darán un procedimiento sencillo para encontrar vectores que constituyan una base. Para
ello consideremos una matriz de orden “m x n”.
a11 a12 . . . . . . a1n
a a22 . . . . . . a2 n
21
A . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
am1 am 2 . . . . . . amn
Los vectores:
Teorema 4:
“Las operaciones elementales sobre renglones no cambian el espacio de renglones de una matriz”.
Supongamos que los vectores filas o renglón de una matriz “A” son: r 1 , r 2, . . . . , r m y que se obtiene una
matriz “B” a partir de la matriz “A”, efectuando una operación elemental sobre las filas o renglones de “A”.
Consideremos las posibilidades que ofrecen dichas operaciones:
1) Supongamos que la operación sobre las filas o renglones que realizamos es un intercambio entre dos de
ellas. Entonces “B” y “A” tienen los mismos vectores renglón y como consecuencia el mismo espacio
de renglones (o de filas).
2) Si la operación sobre los renglones (o filas) es la multiplicación de uno de ellos por un escalar, o la
adición de un múltiplo de uno de los renglones a otro (multiplicación de una fila por un escalar y luego
sumarla a otra fila), entonces los vectores renglón r’ 1 ; r’2 ; . . . ; r’ m de la matriz “B” son combinaciones
125
lineales de r1 ; r2 ; . . . ; r m (renglones de A), por consiguiente estarán en el espacio de renglones de la
matriz .
Dado que un espacio vectorial es cerrado bajo la adición y la multiplicación por un escalar, todas las
combinaciones lineales r’1 ; r’ 2 ; . . . . . ; r’ m también estarán en el espacio de renglones de la matriz “A”.
Supuesto que la matriz “B” se obtiene a partir de la matriz “A” al efectuar una operación sobre las filas o
renglones; se puede obtener la matriz “A” a partir de la matriz “B”, efectuando la operación inversa.
Por consiguiente, deducimos, que el espacio de renglones de “A” está contenido en el espacio de renglones
de “B”.
Como conclusión diremos que el espacio de renglones de una matriz “A” permanece inalterado al reducirla
hasta una forma escalonada en los renglones (reducida por filas).
Los vectores fila o renglón diferentes de cero de una matriz en la forma escalonada en los renglones siempre
son linealmente independientes, de modo que estos vectores renglón o fila diferentes de cero forman o
constituyen una base para el espacio de renglones.
Entonces podemos enunciar el siguiente:
Teorema 5:
“Los vectores fila o renglón diferentes de cero en una forma escalonada en los renglones de una matriz “A”,
forman una base para el espacio de renglones de “A””.
Debemos hacer notar que hemos escrito los vectores renglón de una matriz en notación horizontal y los
vectores columna en notación vertical (matricial) y es así como está escrito en las matrices y es lo más
natural. Pero no existe razón alguna para que puedan ser escritos los vectores renglón en notación vertical y
los vectores columna en notación horizontal.
Cuando realizamos esto, evidentemente hemos escrito la matriz transpuesta de la matriz dada. Esto nos
quiere decir que el espacio de columnas de una matriz es el mismo que el espacio de renglones de su
transpuesta.
Entonces si uno desea encontrar una base para el espacio de columnas de una matriz “A”, puede encontrar
una base para el espacio de filas o renglones de la matriz “A” transpuesta AT. Esto se indica a través del
siguiente:
Teorema 6:
“Si “A” es una matriz cualquiera, entonces el espacio de renglones y el espacio de columnas de “A” tienen la
misma dimensión”.
Definición:
“La dimensión del espacio de renglones y/o columnas de una matriz “A” se conoce como Rango de “A””.
Teorema7:
“Si “A” es una matriz de orden “n” por “n” y tiene rango “n”, entonces las siguientes proposiciones son
equivalentes:
a) “A” es inversible;
b) Ax = 0 tiene únicamente la solución trivial;
c) “A” es equivalente, respecto de los renglones, a In;
d) Ax = b es compatible para toda matriz “b” de orden “n por uno” n x 1;
e) det (A) 0 ;
f) “A” tiene rango “n”;
g) Los vectores renglón de “A” son linealmente independientes;
h) Los vectores columna de “A” son linealmente independientes.
126
Cambio de Base – Coordenadas
Existe una directa relación entre la noción o concepto de base y la de sistema de coordenadas.
En geometría analítica plana, se asocia un par de coordenadas (a, b) con un punto “P” del plano, utilizando
dos ejes perpendiculares de coordenadas.
También es posible introducir coordenadas sin hacer referencia a
𝑏. ̅̅̅
𝑣2 los ejes, utilizando vectores. Por ejemplo, consideremos dos
P(a,b) vectores perpendiculares𝑣 ̅̅̅1 y ̅̅̅
𝑣2 cada uno de longitud uno, y con
el mismo punto de origen.
𝑣2
̅̅̅ Al bajar perpendiculares desde un punto “P” hacia las rectas
determinadas por ̅̅̅
𝑣1 y ̅̅̅,
𝑣2 se obtienen los vectores 𝑎. ̅̅̅
𝑣1 y 𝑏. ̅̅̅,
𝑣2
tales que:
0 𝑣1
̅̅̅ 𝑎. ̅̅̅
𝑣1
̅̅̅̅
𝑂𝑃 = 𝑎𝑣
̅̅̅1 + 𝑏𝑣
̅̅̅2
De esta manera hemos expresado el vector 𝑂𝑃 ̅̅̅̅ como una combinación lineal de los vectores ̅̅̅
𝑣1 y ̅̅̅
𝑣2 a través
de los escalares “a” y “b”.
Pero también podemos decir que los números “a” y “b”, que son las coordenadas del punto “P”, me han
permitido expresar el vector ̅̅̅̅
𝑂𝑃 en términos de los vectores base ̅̅̅
𝑣1 y ̅̅̅.
𝑣2
𝑤
̅
A(a,b,c) Pero para asociar coordenadas a los puntos (en el espacio bi o
tridimensional) no es necesario que los vectores base sean
perpendiculares o tengan longitud uno; basta cualquier base. Por
ejemplo, utilizando los vectores base 𝑢̅, 𝑣̅ y 𝑤
̅ se puede asociar
O 𝑣̅ una terna de coordenadas a un punto “A”, proyectando “A”
paralelo a los vectores base 𝑢̅, 𝑣̅ y 𝑤 ̅̅̅̅ sea la
̅, para hacer que 𝑂𝐴
diagonal del paralelepípedo así determinado y
𝑢̅
OA = a u + b v + c w
Es posible considerar (a,b,c) como las coordenadas de “A”, relativas a la base {𝑢̅, 𝑣̅ , 𝑤 ̅} .
Esta noción de coordenadas en forma más generalizada resulta importante, pues permite extender a espacios
vectoriales más generales y también nos permite expresar al vector OA como una combinación lineal de los
̅" a través de las coordenadas “a”, “b” y “c”.
vectores base u̅", "v̅", "𝑤
Generalizando el tema, supongamos que sea “S” un conjunto determinado por los vectores: ̅̅̅, 𝑣1 ̅̅̅,
𝑣2 … , 𝑣̅̅̅
𝑛 y
que el mismo constituye una base para un espacio vectorial “V” de dimensión finita “n”.
Dado que el conjunto “S” genera al espacio vectorial “V”, todo otro vector del espacio vectorial “V” y que
no pertenezca a la base “S”, se puede expresar como una combinación lineal de los vectores de “S”.
Es más, la independencia lineal de los vectores que constituyen el conjunto “S” aseguran que hay una
manera única para expresar un vector como combinación lineal de los vectores en “S”.
Supongamos que un vector "u " se puede escribir como:
u = c1 v1 + c 2 v 2 + . . . . . + c n v n
y también como:
u = k1 v1 + k2 v 2 + . . . . . + kn v n
Restemos la segunda ecuación de la primera y tendremos:
0 = (c1 - k1 )v1 + (c2 - k 2 )v 2 + . . . . + (cn - k n )vn
Dado que el segundo miembro de esta ecuación es una combinación lineal de los vectores en “S”, la
independencia lineal de los vectores que constituyen el conjunto “S”, implica que:
c1 – k1 = 0 ; c2 – k2 = 0 ; . . . . ; cn – kn = 0
es decir:
c1 = k1 ; c2 = k2 ; . . . . . . ; cn = k n
de lo cual podemos obtener la siguiente conclusión:
127
Teorema:
“Si S = {̅̅̅,
𝑣1 ̅̅̅, 𝑣𝑛 } es una base para un espacio vectorial “V”, entonces todo vector "u " en dicho espacio
𝑣2 … , ̅̅̅
vectorial “V” se puede expresar en la forma:
u = c1 v1 + c 2 v 2 + . . . . . + cn v n
exactamente de una sola manera”.
Si
S = {̅̅̅,
𝑣1 ̅̅̅, 𝑣𝑛 }
𝑣2 … , ̅̅̅
es una base para un espacio vectorial “V” de dimensión finita y:
u = c1 v1 + c 2 v 2 + . . . . . + c n v n
es la expresión para "u " en función de la base “S”, entonces los escalares c1 , c2 , . . . . , cn se denominan
coordenadas de "u " relativas a la base “S”.
El vector de coordenadas de "u " relativo a “S” se indica por: ( u ) S y es el vector en Rn definido por:
( u ) S = (c1 , c2 , . . . . , cn)
La matriz de coordenadas de "u " relativa a “S” se denota por [u]S y es la matriz n x 1 definida por:
𝑐1
𝑐2
[ … ].
𝑐𝑛
Ejemplo:
Dados los vectores v1 = (1, 2, 1) , v 2 = (2, 9, 0) y v3 = (3, 3, 4) que constituyen una base “S” para un
espacio vectorial R 3, encuéntrese:
a) El vector de coordenadas y la matriz de coordenadas de u = (5, -1, 9) con respecto a S.
b) El vector “ w ” en R 3 cuyo vector de coordenadas con respecto a “S” sea w = (-1,3,2). S
Resolución:
a) Es necesario encontrar los escalares c 1 , c2 , c3 tales que:
u = c1 v1 + c2 v 2 + c3 v3
que en términos de componentes , resultan:
(5, -1, 9) = c1 (1, 2, 1) + c2 (2, 9, 0) + c3 (3, 3, 4)
y si igualamos componentes, nos queda:
1c1 2c2 3c3 5
2c1 9c2 3c3 1
1c 0c 4c 9
1 2 3
a c
P
b d
cuyas columnas son las coordenadas de los vectores base iniciales, con relación a la nueva base. De tal
manera podemos enunciar como:
129
Solución del Problema del Cambio de Base
“Si se cambia la base para un espacio vectorial “V”, de cierta base dada B = u1 , u 2 , . . . . , u n hacia otra
nueva base B’ = w1 , w 2 , . . . . , w n , entonces la matriz de coordenadas inicial, v , de un vector “ v ”
B
está relacionada con la nueva matriz de coordenadas [v]B' por medio de la ecuación:
[v]B' = P v
B
en donde las columnas de “P” son las matrices de coordenadas de los vectores base iniciales con relación a la
nueva base, es decir los vectores columnas de “P” son:
[u1 ]B' ; [u 2 ]B' , . . . . , [u n ]B'
B’ = w1 , w 2 .
Nos preguntamos ahora si es posible hallar una matriz para efectuar la transición de B’ a B.
Para obtener esta matriz, simplemente se cambia el punto de vista y se considera a “ B’ ” como la base
inicial y a “ B ” como la base nueva.
Como ya está demostrado, las columnas de la matriz de transición serán las coordenadas de los vectores base
iniciales con relación a la nueva base.
Bajo estas condiciones, obtendremos entonces una nueva matriz “ Q ”, que me permitirá realizar la
transición de B’ a B.
Ahora bien, si se multiplica la matriz de transición de B a B’, (“P”), que se obtuvo en el primer desarrollo,
por la matriz de transición de B’ a B, (“Q”), que se acaba de indicar, se encuentra:
P . Q = I , lo cual indica que: Q = P -1
Como resumen, si “P” es la matriz de transición desde una base “ B ” hacia una base “ B’ ”, entonces, para
todo vector “v” , se tiene:
[v]B' = P v
B
-1
[v]B = P [v]B'
Ejemplo:
Considere las bases B = u1 , u 2
y B’ = v1 , v 2 para R2, en donde:
1 0 1 2
u1 = , y , u 2 = y v1 = y v2 =
0 1 1 1
a) Halle la matriz de transición de “B” hacia “ B’ ”;
7
b) Halle el vector “ w ” en la base nueva B’ (w) B' = ? si w = , usando la expresión
2
(w) B' = P . (w) B .
Solución:
Lo primero que debo encontrar son las matrices de coordenadas para los vectores base iniciales u1 y u 2 en
relación a la nueva base “ B’ ” . Es decir debo efectuar:
130
u1 = c1 v1 + c 2 v 2 (1)
u 2 = c3 v1 + c 4 v 2 (2)
y reemplazando los valores u1 , v1 y v 2 en (1) se obtiene:
1 1c 2 c2 1c 2 c2 1 (3)
(1, 0) = c1 (1, 1) + c2 (2, 1) 1 1
0 1c1 1c2 1c1 1c2 0 (4)
De (4) c1 = - c2 reemplazando en (3) - c2 + 2 c2 = 1 c2 = 1
c -1
Si c2 = 1 c1 = -1 de modo que: [u1 ]B' = 1 =
c2 1
Partiendo ahora de (2), y reemplazando por las componentes:
0 1c 2 c4 1c 2 c4 0 (5)
(0, 1) = c3 (1, 1) + c4 (2, 1) 3 3
1 1c3 1c4 1c3 1c4 1 (6)
De (5) c3 = - 2 c4 (7) ; y reemplazando (7) en (6) , resulta:
- 2 c4 + 1 c4 = 1 - c4 = 1 (8)
y volviendo ahora con el valor de (8) a (7), obtenemos:
c 2
c3 = (-2) . (-1) c3 = 2 [u 2 ]B' = 3 =
c4 -1
siendo entonces la matriz de transición:
-1 2
P=
1 1
b) Para resolver este apartado, debemos asociar primero el vector “ w ” a la base “B” (base vieja o primitiva)
para después hallar su valor en la nueva base “B’”.
7 1 0
w = u1 u 2 w 1 , 0 0 , 1
2 0 1
7 1 0 1 0 7 7 7
w
2 0 1 0 1 2 2 B 2
1 2 7 3
w P . w w w
1 2
B' B .
B'
1 B'
5
131
UNIDAD N°9: Aplicaciones o transformaciones lineales.
Estudiaremos ahora las funciones con valor vectorial de una variable vectorial, es decir, funciones que tienen
la forma w = F(v), en donde la variable independiente “v” y la variable dependiente “w”, son vectores.
y Como ejemplo o ilustración, supongamos que en R 2 la función “F” o “T” se
define mediante:
x x
T
x y y
y Desde el punto de vista geométrico, “T” ó “F” toma un vector en R2 y lo
refleja con respecto al eje coordenado “x”.
Cuando hayamos dado la definición básica, veremos que “T” ó “F” es una
x transformación lineal de R 2 en R2.
En particular, nuestro estudio recaerá en una clase especial de funciones
vectoriales conocidas como
x x
T Transformaciones Lineales. Estas funciones son de aplicación en las
y y matemáticas, ingeniería, física, etc.
Si “V” y “W” son espacios vectoriales y “F” ó “T” es una función que asocia un vector único en “W” con
cada vector en “V”, se dice que “F” ó “T” aplica o mapea “V” en “W” y ello se escribe como:F: V W.
Además, si “F” ó “T” asocia el vector w al vector v, se escribe w = F(v) y se dice que w es la imagen de v
bajo “F”.
Ejemplo 1:
Podemos decir que si v = (x, y) es un vector en R 2 , entonces la fórmula: F(v) = ( x ; x+y ; x-y ) (1) define la
función que aplica R 2 en R3. En particular, si v = (1,1), es decir x = 1 e y = 1, de modo que la imagen de
“v” bajo F es: F(v) = (1,2,0).
Definición:
Si la expresión F:VW es una función del espacio vectorial “V” hacia el espacio vectorial “W”, entonces
“F” es una transformación lineal si se cumple:
1) F(u + v) = F(u) + F(v) para todos los vectores u y v V;
2) F(ku) = kF(u) para todos los vectores u en V y todos los escalares “k”.
Demostración:
Supongamos que sea F:R2 R 3 la función definida en (1).
Si u=(x1, y1) y v =(x2, y2), entonces: u + v = (x1+x2 ; y1+y2), de modo que:
F(u + v) = [(x1+x2); (x1+x2) + (y1+y2); (x1+x2) – (y1+y2)] =
= (x1; x1+y1 ; x1-y1) + (x2; x2+y2 ; x2 -y2) = F(u) + F(v)
Si F:VW es una transformación lineal, entonces para v1 y v2 cualesquiera en “V” y cualesquiera escalares
k1 y k2, se tiene:
F(k1v1 + k2v2) = F(k1 v1) + F(k2 v2) = k1 F(v1 ) + k2F(v2)
Análogamente, si v1 , v2, . . . , vn son vectores en “V” y k1, k2, . . . . , k n son escalares, entonces:
Recordemos que si “x” es una matriz de orden “nx1” y “A” era de orden “mxn”, entonces el producto “Ax”
es una matriz de “mx1”; es decir que “T” aplica R n en R m. Además, “T” es lineal; para comprobarlo, sean
“u” y “v” matrices de orden “nx1” y “k” un escalar.
Aplicando las propiedades de la multiplicación de matrices, se obtiene:
A(u + v) = Au + Av , y , A(ku) = k (Au)
o de modo equivalente:
T(u + v) = T(u) + T(v) , y , T(ku) = k(Tu)
A las Transformaciones Lineales de este tipo se las conoce o denomina como Transformaciones Matriciales.
Transformación Cero: Sean “V” y “W” dos espacios vectoriales cualesquiera. La aplicación T:VW
tal que T(v) = 0 para todo vector “v” que pertenece al espacio vectorial “V” es una transformación lineal
que se conoce como transformación cero. A fin de ver que “T” es lineal, obsérvese que:
T(u + v) = 0 ; T(u) = 0 ; T(v) = 0 ; y T(ku) = 0
Por lo tanto,
T(u + v) = T(u) + T(v) ; y ; T(ku) = kT(u)
Transformación Identidad: Sea “V” cualquier espacio vectorial. La aplicación T:VV definida por
“T(v) = v” se conoce como transformación identidad sobre “V”.
Si T:VV es una transformación lineal de un espacio vectorial “V” en sí mismo, entonces “T” es un
operador lineal sobre “V”.
Sea “V” cualquier espacio vectorial y “k” cualquier escalar fijo. La función “T: VV” definida por:
T(v) = kv
es un operador lineal sobre “V”.
Si “k 1” , “T” es una dilatación de “V” y si “0 k 1” , entonces “T” es una contracción de “V”.
Geométricamente, una dilatación “estira” cada vector que está en “V” en un factor “k” y una contracción de
“V” “comprime” cada vector en un factor “k”.
Núcleo
Definición: Si la expresión T:VW representa una transformación lineal, entonces el conjunto de vectores
en “V” que “T” aplica hacia 0 (cero) se conoce como núcleo, kernel o espacio nulo de “T”. Este espacio se
indica por ker(T) ó se denota por N(T).
Rn Rm
0 ker(T) = x tal que Ax = 0
Otra manera distinta de definir el núcleo, es: “Dados los espacios vectoriales “V” y “W” y sea F:VW una
aplicación lineal. El conjunto de elementos “v” que pertenecen al espacio vectorial “V”, tales que F(v) = 0 w,
se conoce como núcleo, kernel o espacio nulo de F.”
Demostración:
Como F(0) = 0 , vemos que 0 está en el núcleo. Supongamos que “v” y “w” están en el núcleo; entonces F(v
+ w) = F(v) + F(w) = 0 + 0 = 0 , de manera que “v+w” está en el núcleo. Si “c” es un número (escalar),
entonces F(cv) = c F(v) = 0 , por lo que “cv” también está en el núcleo. En consecuencia, el núcleo es un
subespacio.
133
Imagen o Recorrido
Definición: Si la expresión T:VW representa una transformación lineal, entonces el conjunto de todos los
vectores en “W” que son imágenes bajo “T” de al menos algún vector que pertenece a “V”, se conoce como
imagen o recorrido de “T”. Este conjunto se indica por R(T).
Ax = 0
x Rn Rm ker(T) = x
tal que Ax = 0
Rn Rm R(T) = b
x tal que Ax = b
Ax = b es compatible
Analicemos ahora el ejemplo siguiente. Sea T:R nRm la multiplicación por la matriz
x1 x1 0
x x 0
2 2
vectores: x . que son solucion del sistema hom ogneo : A . .
. . .
xn xn 0
El recorrido o imagen de la transformación “T” consta de todos los vectores:
b1 x1 b1
b x b
2 2 2
b . tales que el sistema A . .
. . .
bn xn bn
sea compatible o consistente, o sea que tenga solución; por consiguiente el recorrido o imagen de “T” es el
espacio de columnas de la matriz “A”. (Recordemos que para que un sistema de ecuaciones lineales tenga
solución, el rango de la matriz principal debía ser igual al rango de la matriz ampliada –Teorema de Roche
134
Frobenius -). Entonces podemos decir que un sistema de ecuaciones lineales Ax = b es compatible sí y sólo
sí “b” esta en el espacio de columnas de “A”.
Teorema 1:
Si la expresión T:VW es una transformación lineal, entonces:
a) T(0) = 0
b) T(-v) = -T(v) para todos los vectores “v V”.
c) T(v – w) = T(v) – T(w) para todos los vectores “v” y “w” que pertenecen a “V”.
Demostraremos ahora las propiedades de este teorema. Sea “v” cualquier vector en “V”.
Debido a que 0v = 0, se tiene:
T(0) = T(0v) = 0 lo cual prueba a).
También:
T(-v) = T[(-1)v] = (-1) T(v) = - T(v) lo que prueba b).
Por último:
v – w = v + (-1) w ;
por lo tanto: T(v – w) = T[v + (-1)w]
= T(v) + (-1) T(w)
= T(v) – T(w) lo que prueba c).
Teorema 2:
Si la expresión T:VW es una transformación lineal, entonces:
a) El núcleo de “T” es un subespacio de “V”;
b) El recorrido de “T” es un subespacio de “W”.
Ejemplo:
Supongamos que la expresión T: RnRm es la multiplicación por una matriz “A” de orden “m x n” . Por lo
expresado en el ejemplo anterior, el núcleo de “T” consta de todas las soluciones del sistema Ax = 0, por lo
tanto, el núcleo es el espacio de soluciones de ese sistema.
También, el recorrido de “T” consta de todos los vectores “b” tales que Ax = b es un sistema compatible.
Por consiguiente, el recorrido de “T” es el espacio de columnas de la matriz “A”. (Recordar que un sistema
de ecuaciones lineales Ax = b es compatible sí y sólo sí, “b” está en el espacio de columnas de la matriz
“A”).
Definición: Si la expresión T: VW es una transformación lineal, entonces la dimensión del recorrido de
“T” se conoce como “rango de T” y la dimensión del núcleo, se denomina “nulidad de T”.
Ejemplo:
Sea la expresión T:R nRm la multiplicación por la matriz “A” de orden “m x n”. En el ejemplo dado a
continuación del teorema nº 2, se observó que el recorrido de “T” es el espacio de columnas de la matriz
“A”. Por lo tanto, el rango de “T” es la dimensión del espacio de columnas de la matriz “A”, el cual es
precisamente el rango de “A”, o sea:
rango (T) = rango (A)
También se observó que el núcleo de “T” es el espacio de soluciones del sistema homogéneo (AX = 0), por
consiguiente, la “nulidad de T” es la dimensión de este espacio de soluciones.
Teorema de la Dimensión:
Si la expresión T:VW es una transformación lineal desde un espacio vectorial “V” con una dimensión “ n
” hacia un espacio vectorial “W”, entonces:
(rango de T) + (nulidad de T) = n
135
En el caso del ejemplo anterior, este teorema conduce a:
(nulidad de T) = n – (rango de T)
Sin embargo, se había hecho notar que, la nulidad de “T” es la dimensión del espacio de soluciones de AX =
0 , y que el rango de “T” es el rango de la matriz “A”, por consiguiente, la expresión anterior conduce a:
Teorema 3:
Si “A” es una matriz de orden “m x n”, entonces la dimensión del espacio de soluciones de AX = 0 es:
n – rango de A .
Ejemplo:
Dado el siguiente sistema de ecuaciones lineales homogéneo:
2x1 + 2x 2 - x 3 +......... x5 0
x x 2 x 3x x 0
1 2 3 4 5
x1 x2 2 x3 ......... x5 0
..................x3 x4 x5 0
el cual se puede resolver a través de las operaciones elementales por filas (Método de Gauss-Jordan), resulta:
cc
2 2 1 0 1 4
1 1 2 3 1 2
1 1 2 0 1 1
0 0 1 1 1 3
1 1 0 0 1 3 1x1 1x2 1x5 0 x1 x2 x5
0 0 1 0 1 2 1x3 1x5 0 x3 x5
0 0 0 1 0 1 1x4 0 x4 0
0 0 0 0 0 0
y haciendo x2 = s y x5 = t , resulta el conjunto solución:
x1 x2 x5 s t 1 1
x x s 1 0
2 2
X x3 x5 t 0 s 1 t
x4 x4 0 0 0
x5 x5 t 0 1
lo que demuestra que los vectores:
1 1
1 0
v1 0 ; v 2 1
0 0
0 1
generan el espacio de soluciones. Como estos vectores son linealmente independientes, el conjunto {v1 , v 2 }
es una base y el espacio de soluciones es bidimensional. Este espacio de soluciones del sistema homogéneo
analizado (AX = 0) constituye el núcleo de la transformación. (El núcleo es el “espacio de soluciones” del
sistema homogéneo).
136
Dijimos también que el conjunto solución tiene dos vectores, es decir que es bidimensional, por lo tanto, la
dimensión del núcleo es dos (2) y por ende la nulidad de la transformación es dos (2). (Recordar quela
dimensión del núcleo se denomina “nulidad”).
Debido a que la matriz de los coeficientes del sistema analizado tiene cinco (5) columnas (5 incógnitas)
n = 5 ; por el teorema que expresa:
Rango de T + Nulidad de T = nº de columnas del sistema ó número de columnas de “A”
y además:
rango de T = rango de A
entonces tendremos:
rango de A + Nulidad de T = nº de columnas de la transformación ( n )
de donde se puede expresar:
rango de A = n – Nulidad de T ,
o sea:
rango de A = 5 – 2 rango de A = 3
lo que también se puede observar en la matriz reducida por filas, la cual posee tres (3) filas no nulas rango
de A = 3.
Otra forma de escribir y demostrar el Teorema de la Dimensión es mediante:
entonces podemos decir que: una transformación lineal, está completamente determinada por sus “valores”
en una base.
Ejemplo:
Consideremos la base S = {v1, v2 , v3} para R3, donde: v1 = (1; 1; 1) ; v2 = (1; 1; 0) ; v3 = (1; 0; 0) y sea
T:R3R2 una transformación lineal tal que:
T(v1) = (1; 0) ; T(v2) = (2; -1) ; T(v3) = (4; 3) ,
encuentrese T(2 ; -3 ; 5)
es decir nos piden hallar la imagen [T(v)] del vector (2 ; -3 ; 5).
Solución:
Lo primero que encontraremos será el vector v = (2 ; -3 ; 5) como combinación lineal de los vectores de la
base, o sea de v1 , v2 y v3.
v = k1 v1 + k2 v2 + k3 v3 (2 ; -3 ; 5) = k1 (1; 1; 1) + k2 (1; 1; 0) + k3 (1; 0; 0)
de donde tendremos:
(2 ; -3 ; 5) = 5 v1 – 8 v2 + 5 v3
137
T(2 ; -3 ; 5) = 5 Tv1 – 8 Tv2 + 5 Tv3
como sus vectores columnas. Por ejemplo, si la transformación T:R 2 R2 está dada por:
x x 2 x2
T 1 1
x 2 x1 x2
entonces:
1 1 0 2
T(e1 ) = T y T(e 2 ) = T
0 1 1 1
y resulta:
1 2
A
1 1
T(e1) T(e2)
Y de forma más general, si:
a11 a12 a1n
a a a
21 22 2n
a a a
T(e1 ) = 31 ; T(e 2 ) = 32 ; . . . ; T(e n ) = 3n
. . .
. . .
a m1 a m2 a mn
entonces es:
a11 a12 . . . . . . a1n
a a22 . . . . . a2 n
21
A= . . ..... .
. . ..... .
am1 am 2 . . . . . amn
T(e1) T(e2) T(en)
Se puede demostrar entonces que la transformación lineal T:RnR m es la multiplicación por “A”.
x1
x
2
Para ello, obsérvese que si: X = . x e x e ...... x e
1 1 2 2 n n
.
x n
Por lo tanto, por la linealidad de la transformación “T”, tendremos:
138
Por otra parte:
a11 a12 . . . . . . a1n x1 a11 x1 a12 x2 ........ a1n xn
a a22 . . . . . a2 n x 2 a21 x1 a22 x2 ........ a2 n xn
21
AX= . . ..... . . . . . ........ .
. . ..... . . . . ........ .
am1 am 2 . . . . . amn x n am1 x1 am 2 x2 ........ amn xn
a11 a12 a1n
a a a
21 22 2n
x1 . x2 . .......... xn . x1 T (e1 ) x2 T (e2 ) ........ xn T (en ) (2)
. . .
am1 am 2 amn
Si se comparan las expresiones (1) y (2), se llega a la conclusión de que T(X) = AX , es decir, la
transformación “T” es la multiplicación por la matriz “A”.
A esta matriz “A” se la llama “matriz estándar” para la transformación “T”.
Nota: En las transformaciones matriciales, la matriz estándar es la propia matriz por la que se multiplica
para realizar la transformación.
Ejemplo:
Hallar la matriz estándar para la transformación lineal T:R 3R4, definida por:
x1 x2
x1
x2
T x 2 1
x
x3
x 3
x1
Solución:
1 1 0
1 0 0
1
T(e1 ) = T 0 ; T(e 2 ) = T 1 T(e3 ) = T 0
1 0
;
0 0 1
0 0 1
1 0 0
y utilizando a T(e1), T(e2) y T(e3) como vectores columnas, se obtiene:
1 1 0
1 1 0
A
0 0 1
1 0 0
como verificación, obsérvese que:
x1 x2 1 1 0 x1 x2
x1 1 x1
x2 1 0 x x1 x2
A x 2 1
x
2 x
x3 0 0 1
x 3 x3 3
x1 1 0 0 x1
es decir, que el producto de la matriz “A” por la matriz “X” da por resultado la transformación definida
o pedida, que como vemos concuerda con la fórmula dada para “T”.
Ejemplo:
Sea T:R nR m la multiplicación por la matriz
a11 a12 .......... a1n
a a22 .......... a2 n
21
A . . ........... .
. . .......... .
am1 am 2 amn
..........
Encuéntrese la matriz estándar para dicha transformación “T”.
139
Solución:
Los vectores T(e1), T(e2), . . . . , T(en) son los vectores columnas sucesivas de la matriz “A”; por ejemplo:
a11 a12 .......... a1n 1 a11
a a 22 .......... a 2n 0 a
21 21
T(e1 ) = A e1 = . . ........... . . . = .
. . .......... . . .
a m1 a m2 a mn 0 a m1
..........
así entonces, la matriz estándar para la transformación “T” es:
Como conclusión, podemos decir que: “la matriz estándar para una transformación matricial es la
propia matriz de la transformación”.
(x;y) (x; y)
O x O x
T aplica vectores a vectores T aplica puntos a puntos
A continuación consideraremos las siguientes transformaciones lineales en el plano como aplicaciones
de puntos hacia puntos.
Reflexiones: Las reflexiones se definen respecto a cualquier recta del plano. En este caso en particular,
estudiaremos aquellas que estén vinculadas a una recta que atraviesa el origen del sistema de coordenadas,
como por ejemplo los ejes coordenados “x” e “y” y la recta diagonal:
y=x
y
Consideraremos en primer lugar la reflexión respecto al eje coordenado “y”:
x x 1 1
(-x,y) (x,y) T T
y y 0 0
0 0 1 0
T MT
1 1 0 1
0 x
140
y (x,y) Reflexión respecto al eje coordenado “x”
x x 1 1
T T 0
o x y y 0
0 0 1 0
T MT
(x,-y) 1 1 0 1
y
(x,y) Aquí podemos agregar otra reflexión particular, como ser, un
punto definido por un par de coordenadas que se refleja
respecto al origen del sistema de coordenadas:
𝑥 −𝑥 1 −1 0 0 −1 0
o x 𝑇 [𝑦] = [−𝑦] ⟹ 𝑇 [ ] = [ ] ; 𝑇 [ ] = [ ] ⟹ 𝑀𝑇 = [ ]
0 0 1 −1 0 −1
Esta última reflexión es equivalente a producir una rotación de
(-x,-y) 180º en torno al origen
Rotaciones: Otro tipo común de transformaciones en el plano es la rotación o giro en torno a cualquier
punto del plano. Interesan principalmente las rotaciones en torno al origen del sistema de coordenadas.
Supongamos una transformación matricial y sea “” un ángulo fijo. Consideremos que T: R2R2 es la
multiplicación por la matriz
cos sen
A
sen cos
x
y si “v” es el vector: v entonces T(x) = Ax y en nuestro caso será:
y
cos sen x x cos y sen x '
T (v) Av . y x sen y cos y '
sen cos
Geométricamente, T(v) es el vector que se obtiene al hacer girar “v” hasta describir un ángulo “”.
141
Solución:
y De acuerdo con la figura, OB es la rotación de OA un ángulo “”.
Resulta entonces
x = r cos ; y = r sen
y’ B(x’,y’) = T() (x;y) x' = r cos ( +) ; y' = r sen (+)
y mediante las relaciones trigonométricas se llega a:
y A(x,y)
θ r α x' = r cos cos - r sen sen ; y' = r sen cos + r cos sen
x' = x cos - y sen ; y' = y cos + x sen
0 x’ x x
por consiguiente:
demuestra que T() es una rotación de “” radianes ó “” grados en torno al origen
El siguiente cuadro muestra cuales son las matrices estándar en función del valor del ángulo:
Operador de Rotación
1 0
0º 0 1
2 2
2 2
45º
2 2
2 2
0 1
90º 1 0
1 0
180º 0 1
0 1
270º 1 0
Expansiones: Una expansión a lo largo de los ejes coordenados “x” ó “y” es una transformación lineal que
multiplica la coordenada “x” ó la coordenada “y” de un vector en R 2 por una constante positiva “k”, siendo
“k 1” . La transformación de este tipo se expresa como:
y y 𝑥 𝑘𝑥
𝑇 (𝑥 ) | 𝑦 | = | | ⇒
𝑦
1 𝑘 0 0
𝑇| | = | |;𝑇| | = | | ⇒
0 0 1 1
𝑘 0
(x;y) (2x;y) 𝑀𝑇 = | |
0 1
Resultando la matriz estándar para una
expansión según el eje coordenado “x”
o 4 x o 8 x
Figura inicial Figura final con una expansión k = 2
143
y
𝑥 𝑥
y 6 (x ; 2y) 𝑇 (𝑥 ) |𝑦| = |𝑘𝑦| ⇒
1 1 0 0
𝑇| | = | |;𝑇| | = | | ⇒
0 0 1 𝑘
1 0
3 (x ; y) 𝑀𝑇 = | |
0 𝑘
Resultando la matriz estándar para una
o 2 x o 2 x expansión según el eje coordenado “y”
Figura inicial Figura final con una expansión k = 2
x x ky 1 1 0 k 1 k
T ( x) T ; T MT
y y 0 0 1 1 0 1
Resultando entonces la matriz estándar para un deslizamiento cortante según el eje coordenado “x”. Tener
presente que “k” es una constante que puede ser positiva o negativa.
y y y
(x;y) (x+ky ; y) (x+ky ; y)
o x o x o x
Figura inicial Deslizamiento cortante Deslizamiento cortante
según el eje “x” con “k” positivo con “k” negativo
Un deslizamiento cortante en la dirección de “y”, con factor “k”, es una transformación que mueve cada
punto (x, y) paralelo al eje coordenado “y”, en una cantidad “kx” hacia la nueva posición (x; y+kx). Bajo
una transformación lineal de este tipo, los puntos que están sobre el eje “y” no se mueven puesto que en ese
caso es “x=0”; sin embargo, conforme se avanza alejándose del eje “y”, la magnitud de “x” aumenta, y
aquellos puntos más alejados del eje “y” se mueven una distancia mayor que los que se encuentran más
cercanos de dicho eje. La transformación de este tipo se expresa como:
x x 1 1 0 0 1 0
T ( y) T ; T MT
y y kx 0 k 1 1 k 1
Resultando entonces la matriz estándar para un deslizamiento cortante según el eje coordenado “y”.
Tener presente que “k” es una constante que puede ser positiva o negativa.
y y y
(x ; y+kx)
(x;y)
(x ; y+kx)
o x o x o x
Figura inicial Deslizamiento cortante Deslizamiento cortante
según eje “y” con k 0 con k 0
144
Observaciones:
1) La multiplicación por la matriz identidad de orden 2 por 2 aplica cada punto en sí mismo. A esta
transformación se la denomina transformación identidad. Recordemos que cuando analizamos las
transformaciones de R n a R m demostramos que era posible encontrar una matriz “A” de orden m x n tal
que la transformación fuese el producto por dicha matriz; aquí se está mencionando una matriz identidad
de orden dos por dos que es la que efectúa la transformación.
2) Si se efectúan en sucesión un número muy grande, pero finito, de transformaciones lineales de R n a R n,
entonces es posible obtener el mismo resultado mediante una sola transformación matricial.
Ejemplo 1:
Hallar una transformación matricial de R 2 hacia R2 que primero lleve a cabo un deslizamiento cortante en un
factor de 2 en la dirección de “x” ; y a continuación, realice una reflexión respecto a la recta “y = x”;
Solución:
La matriz estándar para el deslizamiento cortante es:
1 2
A1
0 1
y para la reflexión es:
0 1
A2
1 0
de modo que la matriz estándar para el deslizamiento cortante seguido por la reflexión es:
0 1 1 2 0 1
A2 . A1
1 0 0 1 1 2
La expresión A2.A1 nos da por resultado una nueva matriz, la cual representa simultáneamente las
operaciones de deslizamiento cortante seguido de la reflexión. La lectura de la expresión A = A 2 .A1 leída
de derecha a izquierda indica el orden en que ambas operaciones fueron definidas.
Si analizáramos la expresión siguiente: A = A1.A2 que corresponde a la solución de la segunda parte del
ejercicio, podemos ver que aquí primero se efectúa la reflexión seguida por el deslizamiento cortante.
Es decir entonces, que para obtener una única matriz para llevar a cabo todas las operaciones indicadas, debo
realizar el producto de la matriz correspondiente a la ultima transformación solicitada por la matriz de la
penúltima transformación y luego por la antepenúltima, hasta llegar a la matriz de la primera transformación
solicitada: A = Ak .Ak-1 .Ak-2 . . . . A3 .A2.A1
(1;4)
y y y
(2;1) (4;1)
o x o x o x
fig.1 fig.2 fig.3
Figura inicial Deslizamiento cortante en Reflexión alrededor
la dirección de “x” con k=2 de y = x
Ejemplo 2:
Encuentre ahora una transformación matricial de R 2 hacia R2 que primero realice una reflexión respecto a la
recta “y = x” y a continuación, un deslizamiento cortante en un factor de 2, en la dirección de “x”. Notamos
aquí que el planteo del apartado 1º es de orden inverso al planteo del punto 2º.
145
Solución:
La reflexión seguida por el deslizamiento cortante se representa por medio de:
1 2 0 1 2 1
A1 . A2 .
0 1 1 0 1 0
Notemos que A1 A2 A2 A1 , de manera que el efecto de realizar un deslizamiento cortante y a continuación
una reflexión es diferente de realizar la reflexión y a continuación el deslizamiento cortante. En la siguiente
figura se ilustra geométricamente este hecho; en ella se muestra el efecto de las transformaciones sobre un
rectángulo.
Podemos observar en estos dos ejemplos propuestos, que haciendo el producto de las matrices
correspondientes a las transformaciones pedidas pero en orden inverso al solicitado, se obtiene una única
matriz que permite realizar las transformaciones solicitadas mediante una sola operación.
y y y
(1;2)
(5;2)
(2;1)
o x o x o x
fig.1 fig.2 fig.3
Figura inicial Reflexión alrededor Deslizamiento cortante en
de y = x la dirección de “x” con k=2
Transformaciones inversas
Sea T:R2 R2 la multiplicación por una matriz invertible “A” y supóngase que la transformación “T” aplica
el punto (x, y) hacia el punto (x' ,y'). Entonces:
x x ' x ' x
A. ; A1 .
y y ' y ' y
A partir de estas ecuaciones se deduce que si la multiplicación por “A” aplica (x, y) hacia (x', y'), entonces la
multiplicación por “A-1” regresa (x', y') hacia su posición original (x, y). Es por esta razón que se dice que la
multiplicación por “A” y la multiplicación por “A-1” son transformaciones inversas.
Ejemplo:
Si la transformación T:R2R2 comprime el plano en un factor de ½ en la dirección del eje “y”, entonces es
evidente que, para regresar cada punto a su posición original se debe dilatar el plano en un factor de “2” en la
dirección del eje “y”. O sea, la matriz:
1 0
A
0 1/ 2
representa una compresión de factor ½ en la dirección del eje “y” y la matriz:
1 0
A1
0 2
es una expansión de factor “2” en la dirección “y”.
Teorema:
Si T:R2 R2 es la multiplicación por una matriz invertible “A”, entonces el efecto geométrico de la
transformación “T” es el mismo que el producido por una sucesión apropiada de deslizamientos cortantes,
compresiones, expansiones y reflexiones.
Demostración: Supuesto que la matriz “A” es una matriz invertible, se puede reducir la misma hasta la
matriz identidad por medio de operaciones elementales sobre las filas.
146
Dichas operaciones elementales pueden ser efectuadas sobre los renglones de la matriz “A” multiplicando
desde la izquierda por una matriz elemental, y en consecuencia, existen las matrices elementales E 1 , E2, . . . .
, Ek, tales que:
Ek . . . E2 E1 A = I
y al despejar “A”, da:
A = E1-1 E2 -1 . . . Ek-1 I
o lo que es equivalente:
A = E1 -1 E2-1 . . . Ek-1 (1)
En esta última ecuación se expresa a la matriz “A” como un producto de matrices elementales (recordar que
la inversa de una matriz elemental, también es elemental).
Nota: Se define como matriz elemental de orden “n por n” a aquella matriz que se obtiene de efectuar
una única operación elemental sobre la matriz identidad de orden “n por n”.
Ejemplo:
Exprésese la matriz
1 2
A
3 4
como producto de matrices elementales y a continuación, descríbase el efecto geométrico de la
multiplicación por la matriz “A”, en términos de deslizamientos cortantes, compresiones, expansiones y
reflexiones.
Solución:
Se puede reducir la matriz “A” hasta la matriz Identidad (I) por medio de operaciones elementales, de
acuerdo a lo indicado seguidamente:
e21(- 3) e2 ( -1/2) e12 ( -2)
1 2 1 2 1 2 1 0
3 4 0 2 0 1 0 1
Se pueden efectuar las tres operaciones sucesivas sobre los renglones, multiplicando desde la izquierda
sucesivamente por las matrices elementales E 1, E2 y E3. Recordar que estas matrices elementales se
obtienen de efectuar sobre la matriz identidad una única operación elemental, por ejemplo:
e21 ( -3) e2 ( - 1/2) e12 ( -2)
1 0 1 0 1 0 1 0 1 0 1 2
0 1 3 1 = E1 ; 0 1 0 1/ 2 = E2 ; 0 1 0 1 = E3
Al invertir estas matrices y aplicar la expresión (1) vista anteriormente (A = E 1-1 E2 -1 . . . Ek -1) se obtiene:
1 0 1 0 1 2
A = E1 -1 E2-1 . . . Ek-1 =
1 0 2 0 1
. .
3
Observando que:
1 0 1 0 1 0
0 2 0 1 0 2
. ;
resulta finalmente:
1 0 1 0 1 0 1 2
A = E1-1 E2 -1 E3-1 E4-1 = . . .
3 1 0 1 0 2 0 1
y leyendo de derecha a izquierda, se concluye que el efecto de multiplicar por la matriz “A” equivale a:
1) Realizar un deslizamiento cortante por un factor “2” en la dirección del eje “x”;
2) A continuación expandir por un factor “2” en la dirección del eje “y”;
3) Seguidamente reflejar respecto al eje coordenado “x”;
4) y finalmente realizar un deslizamiento cortante por un factor “3” en la dirección del eje “y”.
147
Teorema:
Si T:R2 R2 es la multiplicación por una matriz invertible, entonces:
a) La imagen de una recta es una recta;
b) La imagen de una recta que pasa por el origen es una recta que pasa por el origen;
c) Las imágenes de rectas paralelas son rectas paralelas;
d) La imagen del segmento rectilíneo que une los puntos “P” y “Q” es el segmento rectilíneo que une
las imágenes de “P” y “Q”;
e) Las imágenes de tres puntos están sobre una recta sí y sólo sí los puntos también lo están.
Ejemplo:
Dados los puntos P1(0, 0); P2(1, 0); P3 (0, 1) y P4(1, 1), cuya gráfica es un cuadrado; halle bajo la
multiplicación por la matriz
1 2
A
2 1
su imagen; luego grafique.
la imagen es un paralelogramo con vértices (0, 0); (-1, 2); (2, -1) y (1, 1) (ver figura).
y y
(-1; 2)
148
o lo que es equivalente resolviendo lo planteado:
y' = 4/5x' + 1/5
Por lo tanto (x', y') satisfacen:
y = 4/5x + 1/5
que es la ecuación de la recta pedida.
y y = 2x + 1
y = 4/5 x + 1/5
o x
A[x] B = [T(x)]B'
Si de alguna manera, es posible encontrar la matriz “A”, entonces, como se muestra en la figura, se puede
calcular la transformada de x [T(x)] en tres pasos, por medio del procedimiento indirecto siguiente:
Cálculo directo
1) Calcular la matriz de coordenadas [x]B ;
x - - - - - - - - - - - - - - - T(x)
2); Multiplicar [x] B desde la izquierda por la matriz “A” , para
(1) (3) producir [T(x)]B'
Multiplíquese por A 3) Reconstruir T(x), a partir de su matriz de coordenadas
[x]B - - - - - - - - - - - - - [T(x)] B' [T(x)]B' .
(2)
Este procedimiento indirecto es importante por dos razones. Primero suministra una manera eficiente de
llevar a cabo las transformaciones lineales a través de una computadora y la segunda razón es teórica, pero
con importantes consecuencias prácticas.
La matriz “A” depende de las bases “B” y “ B' ”. Por lo general se eligen las bases “B” y “ B' ” a fin de hacer
que el cálculo de las matrices de coordenadas sea lo más fácil posible. Otras veces, en lugar de ello, se puede
intentar elegir las bases “B” y “ B' ” para hacer que la matriz “A” sea lo más sencilla posible, por ejemplo,
con grupos de elementos iguales a cero.
Cuando se hace esto en forma correcta, la matriz “A” puede proporcionar información importante acerca de
la transformación lineal “T”.
Consideremos ahora el problema de encontrar una matriz “A” que satisfaga:
149
A[x] B = [T(x)]B' (1)
Supóngase que “V” es un espacio de “n” dimensión con base B = {u 1, u2, . . . , un} y que W es un espacio de
“m” dimensión con base B' = {v 1, v2, . . . , vm} .
Se necesita encontrar una matriz de orden “m x n”
a11 a12 . . . . . a1n
a
21 a 22 . . . . . a 2n
A= . . . . . . . .
. . . . . . . .
a m1 a m2 . . . . . a mn
tal que se cumpla la relación (1), para todos los vectores “x” que pertenecen al espacio vectorial “V”.
En particular, cuando “x” es el vector base “u 1”, se desea que:
A[u1] B = [T(u1)] B' (2)
Pero:
1 a11 a12 . . . . . a1n 1 a11
0 a
21 a 22 . . . . . a 2n 0 a 21
[u1 ]B = 0 de modo que: A.[u1 ]B = . . . . . . . . . 0 .
. . . . . . . . . . .
0 a m1 a m2 . . . . . a mn 0 a m1
Por lo tanto, la expresión (2) implica que:
a11
a
21
. = [T(u1 )]B'
.
a m1
Es decir, la primera columna de “A” es la matriz de coordenadas para el vector T(u 1), con respecto a la base
B'.
De manera análoga, si se hace que el vector x sea igual a u 2 ( x = u2) en (2), se obtiene:
A[u2] B = [T(u2)] B'
pero:
0 a11 a12 . . . . . a1n 0 a12
1 a
21 a 22 . . . . . a 2n 1 a 22
[u 2 ]B = 0 de modo que: A.[u 2 ]B = . . . . . . . . . 0 .
. . . . . . . . . . .
0 a m1 a m2 . . . . . a mn 0 a m2
por lo tanto:
a12
a
22
. = [T(u 2 )]B'
.
a m2
es decir, la segunda columna de “A” es la matriz de coordenadas para el vector T(u 2) con respecto a la base
B'.
150
Continuando de esta manera, se encuentra que la j-esima columna de la matriz “A” es la matriz de
coordenadas para el vector T(u j), con respecto a la base B' .
La matriz única “A” que se obtiene de esta manera se conoce como matriz de la transformación “T”
con respecto a las bases B y B'.
Ejemplo:
Sea T: p1 p2 la transformación lineal definida por: T(p(x)) = x p(x). Encuéntrese la matriz para la
transformación “T” , con respecto a las bases B={u 1; u2} y B'={u1 '; u2 '; u3'} , en donde: u 1 = 1 ; u2 = x ; u1'
= 1 ; u2' = x ; u3 ' = x2 .
Nota: Si la expresión T:R nR m es una transformación lineal y sí B y B' son las bases estándar para R n y R m
respectivamente, entonces la matriz para la transformación “T” con respecto a las bases B y B' es
precisamente, la matriz estándar para dicha transformación “T”. En el caso especial en el que los espacios
vectoriales V y W sean iguales (V=W) (de modo que: T:VV es un operador lineal), es común tomar B =
151
B' al construir la matriz para la transformación “T”. La matriz resultante se conoce como matriz de “T” con
respecto a la base “B”.
Ejemplo:
Si B = {u1, u2, . . . . . , u n} es cualquier base para un espacio vectorial “V” de dimensión finita y la expresión
I:VV es el operador identidad sobre el espacio vectorial “V” , entonces:
I(u1) = u1; I(u2)=u2; . . . . . ; I(u n) = un .
Por lo tanto:
1 0 0
0 1 0
0 0 0
[I(u1 )]B = ; [I(u 2 )]B = ; . . . . . . ; [I(u n )]B =
. . .
. . .
0 0 1
Así entonces:
1 0 . . . . . . . 0
0 1 . . . . . . 0
0 0 . . . . . . 0
[ I ]B =
. . . . . . . . .
. . . . . . . . .
0 0 . . . . . . 1
Como consecuencia diremos, que la matriz del operador identidad con respecto a cualquier base, es la matriz
identidad de orden “n x n”.
Ejemplo:
Sea la expresión T:R2 R2 el operador lineal definido por:
x x x
T 1 1 2
x 2 2 x1 4 x2
Encuéntrese la matriz de la transformación “T” con respecto a la base B = {u 1, u2} , en donde:
1 1
u1 = ; u 2 =
1 2
Solución: A partir de la expresión de la transformación “T”, se tiene:
2 3
T(u1 ) = = 2u1 y T(u 2 ) = = 3u 2
2 6
y considerando la base B = {u 1, u2}, tendremos entonces:
1+1 =2
1+2 =2
y resolviendo el sistema, nos queda:
=2 y =0 ; y
entonces tendremos:
2
[T(u1 )]B =
0
y ahora:
152
1 + 1 = 3
T(u2) = u1 + u2 (3; 6) = (1, 1) + (1, 2)
1 + 2 = 6
y resolviendo el sistema resulta:
= 0 y = 3
lo que nos da:
0
[T(u 2 )]B =
3
como consecuencia, la matriz de la transformación “T” con respecto a la base “B” es:
2 0
A=
0 3
Semejanza (similaridad)
La matriz de un operador lineal T:VV depende de la base seleccionada para el espacio vectorial “V”.
Uno de los problemas fundamentales del álgebra lineal es elegir una base para el espacio vectorial “V” que
haga que la matriz de la transformación “T” sea tan sencilla como se pueda. Frecuentemente este problema
se ataca encontrando primero una matriz para la transformación “T”, con relación a una base “sencilla”,
como por ejemplo una base estándar.
Por lo común, esta selección no conduce a la matriz más sencilla para la transformación “T”, de modo que
entonces se busca una manera de cambiar la base a fin de simplificar la matriz.
Para dirigir un problema como éste, es necesario saber en qué forma un cambio de base afecta la matriz de
un operador lineal. Estudiaremos ahora ese problema. Para ello analicemos el siguiente teorema, cuyo
resultado es clave.
Teorema:
Sea la expresión T: VV un operador lineal sobre un espacio vectorial de dimensión finita “V”. Si “A” es la
matriz de la transformación “T” con respecto a una base “B”, y “A' ” es la matriz de la misma
transformación “T” con respecto a una base “B' ”, entonces:
A' = P-1.A.P
Ejemplo:
Supóngase que la transformación T:R2 R2 se define por medio de:
x x x
T 1 1 2
x2 2 x1 4 x2
Hállese la matriz estándar para la transformación “T”, es decir, la matriz para la transformación “T” con
relación a la base B={e1, e2}, en donde:
1 0
e1 = ; e2 =
0 1
y a continuación, aplíquese el teorema anterior para transformar esta matriz, en la matriz para la
transformación “T” con relación a la base B' = {u 1, u2}, en donde:
u1= [1 , 1] y u2= [1 , 2] (cuidado, u1 y u2 son vectores columnas)
153
1 1
A=
2 4
Ahora se necesita la matriz de transición de la base “B'” hacia la base “B”. Para esta matriz de transición se
necesitan las matrices de coordenadas para los vectores de la base “B'” con relación a la base “B”.
Por cálculo:
1 1 0 𝑘1 = 1
𝑢1 = 𝑘1 𝑒1 + 𝑘2 𝑒2 ⟹ [ ] = 𝑘1 [ ] + 𝑘2 [ ] ⟹
1 0 1 𝑘2 = 1
1 1 0 𝑘3 = 1
𝑢2 = 𝑘3 𝑒1 + 𝑘4 𝑒2 ⟹ [ ] = 𝑘3 [ ] + 𝑘4 [ ] ⟹
2 0 1 𝑘4 = 2
de modo que:
k 1 k3 1 1 1
[u1 ]B = 1 ; [u 2 ]B = P u1 B ; u2 B P
k2 1 k4 2 1 2
2 1 1 1 1 1 2 0
P-1 .A.P =
. 2 4 . 1 2 0 3
1 1
En este ejemplo se ilustra que la base estándar para un espacio vectorial dado, no necesariamente produce la
matriz más sencilla para un operador lineal; podemos ver que la matriz estándar:
1 1
A=
2 4
no fue tan sencilla en estructura como la matriz
2 0
0 3
con relación a la base “B'”.
Esta última matriz es una matriz diagonal; esto es, una matriz cuadrada en la que todos los elementos que no
están en la diagonal principal son ceros.
Las matrices diagonales tienen muchas propiedades convenientes; por ejemplo, la “k-esima” potencia de una
matriz diagonal es:
d1 0 . . . . . . . 0 d1k 0 ...... 0
0 d ...... k
0 0 d . . . . . . 0
D= 2 k
D = 2
. . ...... . . . ...... .
0 0 . . . . . . d n 0 0 . . . . . . d n
k
Así entonces, para elevar una matriz diagonal a la “k-esima” potencia, sólo se necesita elevar cada elemento
de la diagonal a la “k-esima” potencia. Para una matriz no diagonal se requieren muchos más cálculos para
obtener la “k-esima” potencia de la misma.
Del análisis de lo desarrollado, obtenemos la siguiente conclusión: “Si “A” y “B” son matrices cuadradas, se
dice que la matriz “B” es semejante a la matriz “A”, si existe una matriz inversible “P”, tal que:
B = P-1.A.P
Nótese que la ecuación B = P -1.A.P se puede escribir también como: A = P.B.P -1 o bien, como:
A = (P-1)-1 .B.P-1
154
Si ahora hacemos: Q = P -1 , se obtiene: A = Q-1.B.Q con lo que se afirma que la matriz “A” es
semejante a la matriz “B”.
Por lo tanto, la matriz “B” es semejante a la matriz “A” sí y sólo sí, la matriz “A” es semejante a la
matriz “B”. En general, simplemente diremos que las matrices “A” y “B” son semejantes. Con ésta
terminología, se afirma que dos matrices que representan el mismo operador lineal ( T:VV ) con
respecto a bases diferentes son semejantes.
Ejemplo:
Si la transformación lineal T:R2 R2 se define por medio de
x x 2 x2
T 1 1
x 2 x2
y B={u1, u2} y B'={v1, v2} , en donde: u1=[1 0] ; u2=[0 1] ; v1=[2 1] , y , v2=[-3 4] , (siendo u1, u2 ,
v1, y v2 vectores columnas), halle la matriz de la transformación “T” con respecto a la base “B” y aplicando
el teorema, encuentre la matriz de la transformación “T” con respecto a la base “B'”.
Solución:
1 -2 1 2
T(u1 ) = ; T(u 2 ) = A =
0 -1 0 1
matriz de la transformación “T” con respecto a la base “B”
1 + 0 = 2 = 2
(2,1) = (1, 0) + (0,1)
0 1 1 1
2 3
P= 1 4
1 0 3 3
(3, 4) (1, 0) (0,1)
0 1 4 4
Halle la matriz de la transformación “T” con respecto a la base “B” y luego calcule dicha matriz con
respecto a la base “B'”, (aplicando el teorema).
Solución:
16 -3 16 3
T(u1 ) = ; T(u 2 ) = A
-2 16 2 16
matriz de la transformación “T” con respecto a la base “B”
155
16 3 = 1 = 1/10
(1,3) = (16, 2) + (-3,16)
2 16 3 1/ 5
1/10 19 / 250
P= 1/ 5 9 /125
16 3 1 19 / 250
(1, 1) (16, 2) (3,16)
2 16 1 9 /125
156
UNIDAD N° 10: Valores y vectores propios.
Suponga que F: V ⇒ V es una transformación lineal.
Más de una vez es útil hallar un vector “𝑣̅ ” que pertenezca al espacio vectorial V y tal que “F(𝑣̅ )” y “𝑣̅ ” sean
paralelos; es decir que la transformación lineal del vector y el vector mismo sean paralelos o más
concretamente, que el vector obtenido por la transformación sea un múltiplo del vector “ 𝑣̅ ”.
Para ello debemos buscar un vector “𝑣̅ ” y un escalar tales que:
̅) = 𝒗
F (𝒗 ̅ (1)
Si 𝑣̅ 0 y satisfacen la ecuación (1), se dice que “” es un valor característico (valor propio, autovalor o
eigenvalor) de la transformación F, y a “𝑣̅ ” se le llama vector característico (vector propio, autovector o
eigenvector) de la transformación F correspondiente al valor característico .
Si el espacio vectorial V es de dimensión finita, entonces la transformación F se puede representar mediante
una matriz AF.
Es entonces por ésta razón que analizaremos los valores y los vectores característicos de las matrices de
orden n x n.
̅ = 𝒗
A𝒗 ̅
Se dice que el vector 𝑣̅ , distinto de cero, (es decir 𝑣̅ es un vector no nulo), es un vector característico de la
matriz “A” correspondiente al valor característico “” .
Comentario: Puede ocurrir que una matriz con componentes reales puede tener valores y vectores
característicos complejos. Es por ésta razón que en la definición se ha considerado al vector 𝑣̅ como
perteneciente al conjunto de los números complejos (C n → Reales + Imaginarios).
A 𝑣̅ = I 𝑣̅ = 𝑣̅
Por lo tanto en éste caso, el único valor característico de A es el uno (1) y todo vector “𝑣̅ 0” que pertenece
al conjunto numérico (Cn) es un vector característico de la matriz identidad.
Sea “A” una matriz cualquiera de orden n x n , veamos como calcular los autovalores y autovectores.
Por lo visto:
A 𝑣̅ = I 𝑣̅
(A - I) 𝑣̅ = 0 (2)
La ecuación (2) representa un sistema homogéneo de “n” ecuaciones con las “n” incógnitas.
Para que el sistema tenga soluciones no triviales, se llega a la conclusión de que:
det (A - I) = 0
157
Recíprocamente, si det ( A - I ) = 0 , entonces la ecuación (2) tiene soluciones no triviales y es un valor
característico de A.
Teorema:
Sea A una matriz de orden n x n . Entonces es un valor característico de la matriz “A”, sí y sólo sí :
p ( ) = det (A - I) = 0 (3)
La ecuación (3) recibe el nombre de ecuación característica de la matriz “A”; además a “p ()” se le llama
polinomio característico de dicha matriz “A”.
Importante: Toda matriz de orden n x n tiene exactamente “n” valores característicos, incluyendo las
multiplicidades.
Volviendo a la expresión A 𝑣̅ = I 𝑣̅ , analicemos el siguiente ejemplo:
1
x =
2
es un auto vector de la matriz
3 0
A =
8 1
correspondiente al auto valor = 3
debido a que:
3 0 1 3 1
Ax= . 3
8 1 2 6 2
La ecuación (3)
p ( ) = det (A - I) = 0
tendrá una solución diferente de cero sí y sólo sí d
det (A - I) = 0.
1
1 = 2
3 9- 4.2 3 1
2) de donde: =
2 2
2= 1
158
2) Con el auto valor 1 = 2, sustituimos el mismo en la matriz
3 2 3 2 2 1 2
1 1 2 1 2
1 2 x1 0 1x1 2 x2 0 x1 2 x2 1
1 2 . x 0 x2 x1
2 1x1 2 x2 0 x1 2 x2 2
x t 1
x1 1 1
x 1 si x1 t x 1 1 t u1 = 1 ,
x2 x1 t 2
2 2 2
Para cada valor de “t” obtenemos los infinitos autovectores asociados a 1.
Si ahora trabajamos con el autovalor 2 = 1, obtenemos:
3 2 3 1 2 2 2
1 1 1 1 1
siendo esta última la matriz correspondiente al polinomio característico
2 2 x1 0 2 x1 2 x2 0 2 x1 2 x2 x1 x2
1 1 . x 0 1x 1x 0 x 1 x x x
2 1 2 1 2 1 2
x x - t 1
x 1 2 si x2 t x t u 2 = 1 , 1
x2 x2 t 1
Teorema:
Si “A” es una matriz de orden n x n, entonces las siguientes proposiciones son equivalentes:
a) es un autovalor de “A”;
b) El sistema de ecuaciones (I – A) 𝑥̅ = 0 tiene soluciones no triviales;
c) Existe un vector 𝑥̅ diferente de cero en R n, tal que A 𝑥̅ = 𝑥̅ ;
d) es una solución de la ecuación característica det (I – A) = 0.
Cada vector o grupo de vectores correspondiente a un valor de constituye un autoespacio de dicho valor
propio .
Ejemplo: Dada la matriz
3 5
A=
1 1
se pide determinar sus autovalores y autovectores.
159
Solución: Calculamos
3 - 5
det(A - I) = = (3-)(-1-) - 1 (-5) = -3 -3 + + 2 + 5 = 0
1 1
2 (2) 2 4.1.2 2 4 8 2 4 2 2 i 1 i
- 2 + 2 = 0
2
1
2.1 2 2 2 2 1 i
Calculamos ahora:
3 (1 i) 5 x1 0
[A - 1I] x = 0 [A – (1+i)I] x = 0
1 (1 i) x2 0
.
1
2 i 5 x1 0 (2 i) x1 5 x2 0
.
1 2 i x2 0 1 x1 ( 2 i) x2 0
y resolviendo el sistema
x ( 2 i )
x1 ( 2 i ) x2 x1 ( 2 i ) x2 v1 1 x2
x2 1
Calculamos ahora:
3 (1 i) 5 x1 0
[A - 2I] x = 0 [A – (1-i) I] x = 0
1 (1 i) x2 0
.
1
2 i 5 x1 0 (2 i) x1 5 x2 0
1 2 i x 0
.
2 1 x1 ( 2 i) x2 0
y resolviendo el sistema
x ( 2 i )
x1 ( 2 i ) x2 x1 ( 2 i ) x2 v2 1 x2
x2 1
Diagonalización
Definición: Se dice que una matriz cuadrada “A” es diagonizable si hay una matriz inversible “P” tal que:
En éste caso se dice que la matriz cuadrada “P” diagonaliza a la matriz “A”.
En el siguiente teorema se muestra la técnica para diagonalizar una matriz.
Teorema 1:
Si “A” es una matriz de orden n x n, entonces las siguientes proposiciones son equivalentes:
a) A es diagonizable;
b) A tiene “n” autovectores linealmente independientes.
160
Por ejemplo:
P-1 A P = D
en donde. . . . .
1 0 ...... 0
0 2 . . . . . . 0
D = . . ...... .
. . ...... .
0 0 . . . . . . n
.
y teniendo presente que:
P P-1 A P = P D
y siendo
P P-1 = I
resulta:
AP = PD
es decir:
Si indicáramos ahora los vectores columnas de la matriz “P” por p1, p2, . . . . ., pn, entonces las columnas
sucesivas de PD son:
1p1 ; 2p2 ; . . . . . ; npn
Así entonces se debe tener:
Ap1 = 1p1 ; Ap2 = 2p2 ; . . . . . . . . . ; Ap n = npn
Supuesto que la matriz “P” es invertible, sus vectores columnas no son ceros, por lo tanto 1, 2, . . . . , n
son autovalores de “A” y p1, p2, . . . . , pn son los autovectores correspondientes.
Ya que la matriz “P” es invertible, sus vectores p1, p2, . . . ., pn son linealmente independientes. Por lo tanto
la matriz “A” tiene “n” autovectores linealmente independientes.
De acuerdo a lo visto, podemos indicar un procedimiento para diagonalizar una matriz “A” de orden n x n.
161
Solución:
1) p() = det (A - I) = 0
3 2 0 0 0
det 2 3 0 0
0 0
0 0 5 0 0
3 2 0
det 2 3 0 = 0
0 0 5
(3-)(3-)(5-) – (-2)(-2)(5-) = 0
nos quedo ahora el polinomio de segundo grado: 12 - 6 + 5 = 0 el cual pude resolverse aplicando
la fórmula para dichas ecuaciones:
6 36 20 6 16 6 4 5
2
2 2 2 3 1
resultando finalmente las raíces del polinomio p(): 1=2= 5 y 3= 1 (valores característicos).
3) Utilizando = 5 en la expresión:
3 2 0 x 0
2 3 0 . y 0
0 0 5 z 0
tendremos
2 2 0 x 0 2 x 2 y 0 z 0
2 2 0 . y 0 2 x 2 y 0 z 0 2 x 2 y 0 z 0
0 0 0 z 0
0 x 0 y 0 z 0
2
2x 2 y 0z x y 0z x y 0z
2
y haciendo y = s ; z = t , resulta:
x 1s 1 0
x y 1s 1 s 0 t
z 1t 0 1
162
A pesar de que “z = 0”, se toma z = t para que aparezca el vector [0 0 1] que sería de alguna
manera quien representaría al vector propio correspondiente al doble valor (dos veces) del valor
propio 1=2 = 5. Además nuestro sistema de ecuaciones lineales tiene tres ecuaciones con tres
incógnitas que son x, y, z.
Si ahora utilizamos = 1, tendremos:
3 2 0 x 0
2 3 0 . y 0
0 0 5 z 0
2 2 0 x 0 2x 2 y 0z 0
2 2 0 . y 0 2 x 2 y 0 z 0 2 x 2 y 0 z 0 2 x 2 y x y
0x 0 y 4z 0 z0
0 0 4 z 0 0 x 0 y 4 z 0
5) Debemos resolver ahora: P -1. A .P para obtener D. Para ello es necesario hallar P-1.
Entonces por cualquiera de los métodos conocidos (matriz cofactor o adjunta ó matriz reducida por
filas) calculamos la inversa de “P”, resultando:
1 1 0
2 2
P -1 0 0 1
1 2 1 2 0
y ahora podemos efectuar:
P-1. A . P D
3 -2 0 -1 0 1
-2 3 0 1 0 1
0 0 5 0 1 0
- ½ ½ 0 -5/2 5/2 0 5 0 0
0 0 1 0 0 5 0 5 0
½ ½ 0 ½ ½ 0 0 0 1
resultando:
5 0 0
D 0 5 0
0 0 1
Teorema:
Si ̅̅̅,
𝑣1 ̅̅̅, 𝑣𝑛 son vectores propios de la matriz “A” correspondientes a valores propios distintos 1, 2, . . .
𝑣2 … , ̅̅̅
. , n, entonces { ̅̅̅,
𝑣1 ̅̅̅,
𝑣2 … , 𝑣
̅̅̅
𝑛 } es un conjunto linealmente independiente.
Teorema:
Si una matriz “A” de orden n x n, tiene “n” autovalores distintos, entonces la matriz “A” es diagonalizable.
2 1 0 0 0 2 1 0
det(A - I) = 0 3 2
0 0 det 2 0
0 3
0 0 4
0 0
0 0 4
3 - 82 + 17 - 4 = 0
164
Aplicando Regla de Ruffini se determina que “4” es una raíz de dicho polinomio y luego aplicando la
fórmula para resolver la ecuación de segundo grado resultante obtenemos las dos raíces faltantes. Las raíces
son entonces:
𝜆1 = 4 , 𝜆2 = 2 + √3 , 𝜆3 = 2 − √3
4 0 0
−1
𝑃 𝐴𝑃 = [0 2 + √3 0 ]
0 0 2 − √3
para alguna matriz “P”.
Teorema:
Sea “A” una matriz de orden n x n. Un escalar “” es un valor propio de dicha matriz “A”, sí y sólo sí “”
es una raíz del polinomio característico de dicha matriz “A”.
Teorema:
Un operador lineal T:V V puede representarse por una matriz diagonal “B”, sí y sólo sí, el espacio
vectorial “V” tiene una base formada por vectores propios de dicha transformación “T”. En éste caso, los
elementos de la diagonal de la matriz “B”, son los autovalores correspondientes a dichos autovectores.
Una forma equivalente de expresar el anterior teorema es:
Una matriz cuadrada “A” de orden “n x n” es similar a una matriz diagonal “B”, sí y sólo sí, la matriz “A”
tiene “n” vectores propios linealmente independientes y en este caso los elementos de la diagonal de la
matriz “B” son los valores propios correspondientes a dichos vectores propios.
Teorema de Cayley-Hamilton:
Toda matriz es un cero de su polinomio característico.
det 0 1 2 1 2
det
0 3 2 3 2
= ( - 1) ( - 2) – 6 = 2 - 2 - 1 + 2 – 6 = 2 - 3 - 4 = det ()
El teorema de Cayley-Hamilton asegura que la matriz “B” es un cero del polinomio característico
p() det () = 2 - 3 - 4.
Entonces tendremos:
p () = 2 - 3 - 4 = B2 – 3B – 4I=
1 2 1 2 1 2 1 0
3 2 . 3 2 3 3 2 4 0 1
7 6 3 6 4 0 7 3 4 6 6 0 0 0
9 10 9 6 0 4 9 9 0 10 6 4 0 0
165
Espacios de productos interiores
En ésta sección se introduce la noción de un producto interior sobre un espacio vectorial arbitrario.
Un caso de producto interior lo constituye el producto punto o producto escalar.
Como consecuencia de lo que se exponga, se podrá definir con mayor claridad y amplitud todo el significado
sobre las nociones de ángulo, longitud y distancia en espacios vectoriales más generales.
Recordando el teorema ya visto que expresa:
“Si u, v y w son vectores en R n y k es un escalar cualquiera, entonces:
a) u.v = v.u
b) ( u + v ) . w = u . w + v . w
c) ( k u ) . v = k ( u . v )
d) v . v 0 . Además, v . v = 0 sí y sólo sí v = 0 "
Mediante dicho teorema se reunieron las propiedades más importantes del producto euclidiano interior.
En un espacio vectorial general, un producto interior se define automáticamente aplicando estas propiedades
como axiomas.
Definición:
Un producto interior sobre un espacio vectorial “V” es una función que asocia un número real u, v con
cada pareja de vectores u y v en V, de tal manera que se satisfacen los axiomas siguientes para todos los
vectores u, v y w que pertenecen a V y todos los escalares k .
1) < u , v > = < v , u > (axioma de simetría)
2) < u + v , w > = < u, w > + < v, w > (axioma de aditividad)
3) < k u, v > = k < u, v > (axioma de homogeneidad)
4) < v, v > 0 y < v, v > = 0 sí y sólo sí v = 0 (axioma de positividad)
Un espacio vectorial con un producto interior se conoce como espacio de productos interiores.
Las siguientes propiedades adicionales se deducen inmediatamente a partir de los cuatro axiomas enunciados
para los productos interiores:
1) < 0, v > = < v, 0 > = 0
2) < u. v + w > = < u, v > + < u, w >
3) < u, k v > = k < u, v >
166
Longitud y Ángulo en los Espacios de Productos Interiores
Mediante la aplicación de la Desigualdad de Cauchy-Schwarz podemos desarrollar las nociones de longitud,
distancia y ángulo en los espacios de productos interiores generales.
Definición:
Si V es un espacio de productos interiores, entonces la norma (módulo o longitud) de un vector “𝑢̅” se
denota por 𝑢̅ y se define por:
|| u || u , u 1/2
Además la distancia entre dos puntos (vectores) 𝑢̅y 𝑣̅ se indica por d(𝑢̅, 𝑣̅ ) y se define por:
d ( u , v ) = || u – v ||
Ejemplo:
Si 𝑢̅ = (u1, u2, . . . . . . , u n) y 𝑣̅ = ( v1 , v2, . . . . , vn) son vectores en R n con el Producto Euclidiano Interior,
entonces:
|| u || u , u 1/2 = 2 2
u1 + u 2 + . . . . . . + u n
2
y la distancia:
d( u , v ) = || u – v || = u – v , u – v 1/2 = ( u1 - v1 ) 2 + ( u 2 - v 2 ) 2 + . . . . . . + ( u n - v n ) 2
y como podemos observar, estas fórmulas son precisamente las utilizadas para módulo o norma y distancia
entre dos puntos o vectores.
Ejemplo:
Supóngase que R 2 tiene el producto interior 𝑢̅, 𝑣̅ = 3 u1 v1 + 2 u2 v2 .
Si 𝑢̅ = ( 1, 0 ) y 𝑣̅ = ( 0 , 1 ) , entonces:
|| u || u , u 1/2 = 3 ( 1 ) ( 1 ) + 2 ( 0 ) ( 0 )1/2 = 3
y
d ( u , v ) = || u – v || = ( 1, -1) , (1, -1) 1/2 = 3 (1) (1) + 2 (-1)(-1)1/2 = 5
Es importante tener presente que la norma y la distancia dependen del producto interior que se esté usando.
Si se cambia el producto interior, entonces cambian la norma y la distancia entre vectores.
Por ejemplo, si R2 tiene el producto euclidiano interior, entonces la norma del vector 𝑢̅ del ejemplo
precedente es uno ( 1 ) y la distancia entre 𝑢̅ y 𝑣̅ es √2 .
El siguiente teorema justifica las definiciones que se dan a continuación de norma (módulo o longitud) y
distancia en los espacios de productos interiores.
Teorema 2:
Si V es un espacio de productos interiores, entonces la norma || u || u , u 1/2 y la distancia d( u , v ) = ||
u – v || satisfacen todas las propiedades que se listan a continuación:
Propiedades Básicas
de la longitud de la distancia
1) || u || 0 1) d ( u , v ) 0
2) || u || = 0 u = 0 2) d ( u , v ) = 0 u = v
3) ||k u || = k || u || 3) d ( u , v ) = d ( v , u )
4) || u + v || || u || || v || 4) d ( u , v ) d ( u , w ) + d ( w , v )
(desigualdad del triángulo) (desigualdad del triángulo)
La desigualdad de Cauchy-Schwartz u , v 2 u , u v , v se puede escribir de varias formas alternativas.
167
Puesto que:
|| u ||2 = < u , u > y que || v ||2 = < v , v >
resulta:
< u , v >2 || u ||2 || v ||2
o bien después de tomar las raíces cuadradas, queda:
|< u , v >| || u || || v ||
Supongamos ahora que tanto “ u ” como “ v ” son vectores diferentes de cero en un espacio de productos
interiores “V”. La desigualdad de Cauchy-Schwarz,
< u , v >2 ≤ || u ||2 || v ||2
se puede escribir como:
2
u,v
1
u.v
o de modo equivalente:
u,v
1 1
u .v
y del análisis de éste resultado, sacamos como conclusión, que existe un ángulo único “θ” tal que:
u, v
cos θ = y 0θπ
u.v
Se define a “θ” como el ángulo entre los vectores “ u ” y “ v ”.
En R2 o R3 con el producto euclidiano interior, esta última expresión concuerda con lo desarrollado para
producto escalar común.
Ejemplo:
Encuentre el coseno del ángulo θ entre los vectores 𝑢̅ = (4; 3; 1; -2) y 𝑣̅ = (-2; 1; 2; 3), en donde el espacio
vectorial es R4 , con el producto euclidiano interior (escalar).
Solución:
|| u || = 30 , || v || = 18 y < u , v > = -9
de modo que:
-9
cos = 0,387
30 . 18
Ejemplo:
Calcule el coseno del ángulo entre los vectores 𝑢̅ y 𝑣̅ , siendo dichos vectores matrices de 2x2.
1 0 0 2
u ; v
1 1 0 0
u.v 1(0) 0(2) 1(0) 1(0)
cos 0
u . v 3. 2
esto quiere decir que = π/2, o sea que los vectores son perpendiculares entre sí.
Definición:
En un espacio de productos interiores, se dice que dos vectores 𝑢̅ y 𝑣̅ son ortogonales si <𝑢̅, 𝑣̅ > = 0 .
Además, si “𝑢̅” es ortogonal a cada vector en un conjunto W, se dice que “𝑢̅” es ortogonal a W.
Conviene destacar que la ortogonalidad depende de la selección del producto interior. Dos vectores pueden
ser ortogonales con respecto a un producto interior pero no con respecto a otro.
168
Teorema 3 – Teorema de Pitágoras generalizado
Si u y v son vectores ortogonales en un espacio de productos interiores, entonces
|| u + v ||2 = || u ||2 +|| v ||2
Demostración:
|| u + v ||2 = <( u + v ), ( u + v )> = || u ||2 + 2< u , v > + || v ||2
y en esta última expresión, el sumando correspondiente al producto interior de 𝑢̅ y 𝑣̅ es cero por ser los
vectores ortogonales (perpendiculares), o sea: 2<𝑢̅, 𝑣̅ > = 0, de donde resulta finalmente:
Debemos hacer notar, que en R2 o R3, con el producto euclidiano interior, este teorema se reduce al teorema
ordinario de Pitágoras.
u
Bases ortonormales – proceso de gram-schmidt
En muchos problemas referentes a espacios vectoriales, la selección de una base para el espacio se hace
según convenga al que lo resuelve. La mejor estrategia es elegir la base a fin de simplificar la solución del
problema.
En los espacios de productos interiores, el mejor procedimiento es elegir una base en la que todos los
vectores sean ortogonales entre sí.
Definición:
Se dice que un conjunto de vectores en un espacio de productos interiores es un conjunto ortogonal si todas
las parejas de vectores distintos en el conjunto son ortogonales.
Un conjunto ortogonal en el que cada vector tiene norma 1 se conoce como ortonormal.
Ejemplo:
Dados los vectores
v1 = (0, 1, 0) ; v 2 = (1/ 2; 0; 1/ 2) y v3 = (1/ 2; 0; -1/ 2) .
El conjunto
S={ v1 , v 2 , v3 }
es ortonormal si R3 tiene el producto euclidiano interior, ya que
u = k1 v1 + k2 v 2 + . . . . + k n v n
se completa la demostración probando que k i = < u , v i> para i = 1, 2, . . . ,n.
Entonces para cada vector v i que pertenece al conjunto S , se tiene:
< u , v i> = <k1 v 1 + k2 v 2 + . . . . + k n v n , v i> = k1 < v 1 , v i> + k2 < v 2 , v i> + . . . . + kn < v n , v i>
< u , v i> = ki
Ejemplo:
Sean 𝑣̅ 1= (0, 1, 0) ; 𝑣̅ 2= (-4/5, 0, 3/5) ; 𝑣̅ 3= (3/5, 0, 4/5) un conjunto de vectores S = {𝑣̅ 1, 𝑣̅ 2, 𝑣̅ 3} que
constituye una base ortonormal para R3 con el producto euclidiano interior (escalar). Exprese el vector 𝑢̅ =
(1, 1, 1) como combinación lineal de los vectores de S.
Solución:
< u , v 1> = 1 ; < u , v 2> = -1/5 ; < u , v 3> = 7/5
de donde resulta, por la aplicación del último teorema visto (Teorema 4) =>
Para cada vector 𝑣̅ i que pertenece al conjunto S y teniendo presente la expresión (1), resulta:
Dado que hemos supuesto que los vectores en S son diferentes de cero y por el axioma de positividad para
los productos interiores, resulta <𝑣̅ i , 𝑣̅ i> 0 . Por lo tanto k i = 0 . Ya que el subíndice “i” es arbitrario, se
tiene k1 = k2 = . . . . . = k n = 0 , por lo tanto, el conjunto “S” es linealmente independiente.
Teorema 6:
Sea “V” un espacio de productos interiores y {𝑣̅ 1, 𝑣̅ 2, . . . , 𝑣̅ r} un conjunto ortonormal de vectores en “V”. Si
“W” indica el espacio generado por los vectores 𝑣̅ 1, 𝑣̅ 2, . . ., 𝑣̅ r, entonces todo vector “𝑢̅” que pertenezca a
“V” se puede expresar en la forma: 𝑢̅ = 𝑤
̅1 + 𝑤̅ 2 en donde 𝑤 ̅ 1 está en “W” y 𝑤 ̅ 2 es ortogonal a “W”.
Siendo entonces:
𝑤̅ 1 = < 𝑢̅, 𝑣̅ 1>𝑣̅ 1 + < 𝑢̅, 𝑣̅ 2>𝑣̅ 2 + . . . . + < 𝑢̅, 𝑣̅ r>𝑣̅ r
y
u w2
𝑤
̅ 2 = 𝑢̅ - < 𝑢̅, 𝑣̅ 1>𝑣̅ 1 - < 𝑢̅, 𝑣̅ 2>𝑣̅ 2 - . . . . - < 𝑢̅, 𝑣̅ r>𝑣̅ r
De la observación de la figura, podemos decir que a 𝑤 ̅ 1 se le da el
w1 nombre de proyección ortogonal de 𝑢̅ sobre W y esto se indica por
W proyw 𝑢̅. El vector 𝑤 ̅ 2 = 𝑢̅ – proyw 𝑢̅ se conoce como componente de
u ortogonal a W.
Ejemplo:
Supongamos que R3 tiene un producto euclidiano interior y que W es el subespacio generado por los
vectores ortonormales 𝑣̅ 1 = (0, 1, 0) y 𝑣̅ 2 = (- 4/5, 0, 3/5). La proyección ortogonal de 𝑢̅ = (1, 1, 1) sobre W
es:
proyw u = < u , v 1> v 1 + < u , v 2> v 2
y recordando que
< u , v 1> = 1 y < u , v 2> = -1/5
tendremos entonces
proyw u = (1)(0, 1, 0) + (-1/5)(-4/5, 0, 3/5) = (4/25, 1, -3/25)
El componente de u ortogonal a W es:
u - proyw u = (1, 1, 1) – (4/25, 1, -3/25) = (21/25, 0, 28/25)
Del resultado obtenido, podemos observar que la componente 𝑢̅- proyw 𝑢̅ es ortogonal tanto a 𝑣̅ 1 como a ̅̅̅,
𝑣2
de manera que este vector es ortogonal a cada vector del espacio W (generado por 𝑣̅ 1 y 𝑣̅ 2).
Proceso de Gram-Schmidt
Contamos ahora con todos los elementos necesarios para desarrollar el siguiente teorema:
Teorema 7:
Todo espacio de productos interiores diferente de cero y de dimensión finita tiene una base ortonormal.
Demostración:
Sea “V” cualquier espacio de productos interiores diferente de cero y con dimensión “n” y supóngase que
S={𝑢̅ 1, 𝑢̅ 2, . . . . . . , 𝑢̅ n} es cualquier base para “V”. La sucesión siguiente de pasos produce una base
ortonormal {𝑣̅ 1, 𝑣̅ 2, . . . , 𝑣̅ n} para “V”.
171
Paso 1º - Sea 𝑣̅ 1 = 𝑢̅ 1/||𝑢̅ 1 || . El vector 𝑣̅ 1 tiene norma igual a 1.
Paso 2º - Para construir un vector 𝑣̅ 2 de norma uno y que además sea ortogonal a 𝑣̅ 1, se calcula la
componente de 𝑢̅ 2 ortogonal al espacio W1 generado por 𝑣̅ 1 y a continuación se normaliza, es decir:
u 2 proyw1 u 2 u 2 u 2 , v1 v1
v2
u 2 proyw1 u 2 u2 u 2 proyw1 u 2 u 2 u 2 , v1 v1
v2 Si u 2 - <u 2 , v1 >v1 = 0 , no se puede llevar a cabo la
normalización. Pero esto no puede suceder ya que entonces
v1 proyw1 u 2 se tendría:
<u 2 , v1 >u1
u 2 = <u 2 , v1 >v1 =
u1
lo cual afirma que u 2 es un múltiplo de u1 , y contradice la independencia lineal de la base
S = { u1 , u 2 , . . . . . . , u n }.
Paso 3º - Para construir un vector v3 de norma uno y que sea ortogonal tanto a v1 como a v 2 , se calcula
la componente de 𝑢̅ 3 ortogonal al espacio W2 generado por los vectores v1 y v 2 y luego se normaliza,
es decir:
u 3 proyw 2 u 3 u 3 u 3 , v1 v1 u 3 , v 2 v 2
v3 =
u 3 proyw 2 u 3 u 3 u 3 , v1 v1 u 3 , v 2 v 2
Al igual que en el paso 2º, la independencia lineal de { u1 , u 2 , . . . . . . , u n } asegura que u 3 - < u 3 ,
v1 > v1 - < u 3 , v 2 > v 2 0 , de modo que siempre se puede efectuar la normalización.
u3 - proyw2 u3
u3
v3 v2
v1
proyw2 u3
W2
Paso 4º - Para determinar un vector v 4 de norma uno que sea ortogonal a v1 , v2 y v3 , se calcula la
componente de u 4 ortogonal al espacio W3 generado por v1 , v2 y v3 y se normaliza; por lo tanto:
172
Ejemplo:
Consideremos el espacio vectorial R3 con el producto euclidiano interior. Apliquemos el proceso de Gram-
Schmidt para transformar la base u1 = (1, 1, 1); u 2 = (0, 1, 1); u 3 = (0, 0, 1) en una base ortonormal.
Solución:
u1 ( 1 , 1 , 1) 1 , 1, 1 1 1 1
Paso 1º) v1 = = = = , ,
u1 12 +12 +12 3 3 3 3
1 1 1 1 1 1 2 1 1 2 1 1
= (0, 0, 1) - (0, 0, 1) , , , , - (0, 0, 1) - , , , , =
3 3 3 3 3 3 6 6 6 6 6 6
1 1 1 1 1 2 1 1 1 1
= (0, 0, 1) - , , - - , , = 0 , - ,
3 3 3 3 6 6 6 6 2 2
Ahora encontramos el módulo de esta última expresión, o sea el valor del denominador para determinar v3 :
1 1 1 1 2 1 1 1
(0)2 + (- ) 2 + ( ) 2 = = = = =
2 2 4 4 4 2 2 2
de donde resulta finalmente
(0, -1/2 , 1/2) 2 2
v3 = = 0, - ,
1/ 2 2 2
siendo los vectores:
1 1 1 2 1 1 2 2
v1 = , , ; v2 = - , , ; v 3 = 0, - ,
3 3 3 6 6 6 2 2
173
una base ortonormal para R3 .
Considerando el Proceso de Gram-Schmidt se puede llegar a apreciar las múltiples aplicaciones del mismo.
Algunas de las mismas las desarrollamos seguidamente:
Teorema 8:
Si “P” es la matriz de transición desde una base ortonormal hacia otra base ortonormal, para un espacio de
productos interiores, entonces:
P-1 = PT
Para ilustrar este resultado, considere la matriz de transición:
1 1 0
2 2
A 0 0 1
1 1 0
2 2
Los vectores renglón de “A” son:
r1 1 ; 1 ;0 ; r2 0;0;1 ; r3 1 ; 1 ;0
2 2 2 2
Con relación al producto euclidiano interior se tiene:
r1 = r2 = r3 = 1 y r1 . r2 = r 2 . r 3 = r 1 . r 3 = 0
de modo que los vectores renglón de la matriz “A” forman un conjunto ortonormal en R 3. Por lo tanto, “A”
es una matriz ortogonal y resulta:
1 0 1
2 2
A1 AT 1 0 _1
2 2
0 1 0
Como conclusión de esta igualdad (A = A ) y recordando que A. A-1 = I , resulta: A . AT = I (esto se
-1 T
Teorema 9:
Si “A” es una matriz de orden “n x n”, entonces las proposiciones que siguen son equivalentes:
a) La matriz “A” es ortogonal.
b) Los vectores renglón de la matriz “A” forman un conjunto ortonormal en R n, con el producto
euclidiano interior.
c) Los vectores columna de la matriz “A” forman un conjunto ortonormal en R n, con el producto
euclidiano interior.
Diagonalización ortogonal
El tema de la diagonalización trata por ejemplo el siguiente problema:
Dado un operador lineal T:V→V sobre un espacio de productos interiores, de dimensión finita. ¿Hay una
base ortonormal para “V” con respecto a la cual la matriz de T sea diagonal?
Si “V” es un espacio de productos interiores y las bases son ortonormales, entonces por el teorema que
expresa: “ Si P es la matriz de transición desde una base ortonormal hacia otra base ortonormal, para un
espacio de productos interiores, entonces P -1 = P T ”, entonces la matriz “P” será ortogonal.
Por lo tanto, se llega al siguiente planteamiento matricial del problema:
Dada una matriz cuadrada “A”, ¿hay una matriz ortogonal “P” tal que P -1 .A.P( = PT.A.P) sea diagonal?”
174
El estudio de éste problema conducirá a una clase importante de matrices conocidas como matrices
simétricas.
En todo este tema, por ortogonal, se entenderá ortogonal con respecto al producto escalar sobre R n.
El análisis del problema sugiere la siguiente
Definición:
Se dice que una matriz cuadrada A es “ortogonalmente diagonizable” si existe una matriz ortogonal “P” tal
que P-1.A.P ( = PT.A.P) sea diagonal. En este caso se dice que la matriz P diagonaliza ortogonalmente a la
matriz “A”.
Se deben considerar dos interrogantes:
a) ¿Cuáles matrices son ortogonalmente diagonizables?
b) ¿Cómo se encuentra una matriz P para llevar a cabo la diagonalización ortogonal de una matriz
ortogonalmente diagonizable?.
La primera pregunta es respondida por el siguiente
Teorema:
Si “A” es una matriz n x n, entonces las proposiciones que siguen son equivalentes:
a) La matriz “A” es ortogonalmente diagonizable;
b) La matriz “A” tiene un conjunto ortonormal de “n” autovectores.
Teorema:
Si “A” es una matriz de orden “n x n”, entonces las proposiciones siguientes son equivalentes:
a) “A” es ortogonalmente diagonizable;
b) “A” es simétrica.
175
Ejemplo:
La matriz
1 4 5
A = 4 3 0
5 0 7
es simétrica, puesto que A = AT
Ahora veremos el problema de encontrar una matriz ortogonal “P” para diagonalizar una matriz simétrica. El
teorema siguiente nos da la clave para dicha solución.
Teorema:
Si “A” es una matriz simétrica, entonces los vectores propios de espacios propios diferentes, son
ortogonales.
Como consecuencia de este teorema, se obtiene el procedimiento para diagonalizar ortogonalmente una
matriz simétrica.
Paso 2º - Aplicar el proceso de Gram-Schmidt a cada una de estas bases a fin de obtener una base ortonormal
para cada espacio propio;
Paso 3º - Armar la matriz “P” cuyas columnas sean los vectores base construidos en el paso 2º; esta matriz
diagonaliza ortogonalmente a la matriz “A”.
Justificación de este procedimiento: En el teorema se afirma que los vectores propios de espacios propios
distintos son ortogonales, en tanto que la aplicación del proceso de Gram-Schmidt asegura que los vectores
propios obtenidos dentro del mismo autoespacio son ortonormales. Por lo cual, el conjunto completo de
autovectores obtenidos por este procedimiento es ortonormal.
Ejemplo:
Hallar una matriz ortogonal “P” que diagonalice a la matriz
4 2 2
A = 2 4 2
2 2 4
Solución:
La ecuación característica de “A” es
4 2 2
4 2 =
Det ( λI – A) = det 2
2 2 4
de donde resultan los valores: λ1= λ2 = 2 y λ3 = 8, que son los autovalores de la matriz “A”.
Dichos autovalores darán lugar a sus correspondientes autovectores, los cuales pueden obtenerse
aplicando a la matriz :
4 2 2
2 4 2
2 2 4
primero el valor de = 2 y luego el valor de = 8.
Con λ = 2 , resulta:
176
2 4 2 2 x1 0 2 2 2 x1 0
2 24
2 . x2 0 2 2 2 . x2 0
2 2 2 4 x3 0 2 2 2 x3 0
de donde: -
x1 x2 x3
2x1–2x2–2x3= 0 - x1–x2–x3= 0 x1 = -x2 - x3 x x2 x2
x3 x3
x2 x3 1 1
x2 0 1 x2 0 x3
0 x3 0 1
en donde los autovectores:
1 -1
u1 = 1 y u 2 = 0
0 1
constituyen una base para el autoespacio correspondiente al autovalor λ=2 y aplicando a los mismos el
proceso de Gram-Schmidt, nos quedan:
u1 1 , 1 , 0 1 1 2 2
v1 ; ; 0 v1 ; ; 0
1 12 2 2 2 2
2
u1
u 2 u 2 .v1 v1 1 , 0 , 1 1 , 0 , 1 . 1/
2 , 1/ 2 , 0 1/ 2 , 1/ 2 , 0
v2
u 2 u 2 .v1 v1 1 , 0 , 1 1 , 0 , 1 . 1/ 2 , 1/ 2 , 0 1/ 2 , 1/ 2 , 0
el cual resolviendo nos termina dando:
1 1 2 6 6 6
v2 ; ; v
6 ; ; 2
6
2
6 6 6 6
con el autovalor λ= 8, obtenemos:
8-4 -2 -2 x1 0 4 2 2 x1 0
-2 8-4 -2
. x2 0 . 2 4 2 . x2 0
2 2 8 4 x3 0 2 2 4 x3 0
2 6 3
2 6 3
2 6 3
4 2 2
2 6 3
2 4 2 2 6 3
0
2 2 4 6 3
2 2 2 2 2 2 2 0 0
0 0
2 2 2 2
6 6 2 6 2 6 2 6 4 6 0 2 0
6 6 6 6 6 6
3 3 3 8 3 8 3 8 3 0 0 8
3 3 3 3 3 3
Concluimos este análisis enunciando dos propiedades importantes de las matrices simétricas,
definidas en el siguiente teorema:
Teorema:
a) La ecuación característica de una matriz simétrica “A” sólo tiene raíces reales.
b) Si un valor propio “λ” de una matriz simétrica “A” se repite “k” veces como una raíz de la ecuación
característica, entonces el espacio propio correspondiente a “λ” tiene “k” dimensiones.
Ejemplo: Dada la matriz simétrica
3 1 0 0 0
1 3 0 0 0
A = 0 0 2 1 1
0 0 1 2 1
0 0 1 1 2
la ecuación característica de la misma es:
-3 1 0 0 0
1 3 0 0 0
det (λI – A) = 0 0 2 1 1
0 0 1 2 1
0 0 1 1 2
y el polinomio característico es:
Por lo tanto, los espacios propios correspondientes a: λ = 4 y λ = 1 son bidimensionales y el auto espacio
que corresponde a λ = 2 es unidimensional.
Ax 2 By 2 Cz 2 D xy E xz F yz Gx Hy Iz J 0
Si en la ecuación de la cónica, además de los términos x2 e y2 aparecen términos en “x” ó términos en “y” o
ambos, significa que tal cónica sigue siendo no degenerada, pero su centro se encuentra trasladado,
manteniendo sus ejes paralelos a los ejes coordenados.
La presencia de un término en “xy” (conocido como término de producto cruzado) en una cónica, indica que
se trata de una cónica con los ejes girados respecto a los ejes coordenados tradicionales.
179
Considerando la ecuación: Ax2 + Bxy + Cy2 + Dx + Ey + F = 0, la misma se puede escribir en la forma
matricial
A B x
2 D E x F 0
x y
B C y y
2
o bien:
xT M x + k x + F = 0 (1) e
n donde:
x A B
x= ; M= ; k = [D E]
y B C
y de acuerdo a esta forma de escritura, la forma cuadrática asociada con (1) es:
xT M x
La matriz simétrica “M” se denomina matriz de la forma cuadrática x T M x.
Ejemplo:
Las matrices de las formas cuadráticas
3x2 + 5xy + 7y2 ó 8x 2 – 4y2
son.
3 5 / 2 8 0
5 / 2 7 0 4
Consideremos ahora una cónica “C” con la ecuación:
xT M x + k x + F = 0 (1)
Se demostrará que es posible hacer girar los ejes de coordenadas de modo que la ecuación de la cónica, en el
nuevo sistema de ejes coordenados x’ y’, no tenga más el término de producto cruzado (xy).
p11 p12
Paso 1º) Se debe hallar una matriz P = que diagonalice ortogonalmente a la matriz “M”.
p21 p22
Paso 2º) De ser necesario se intercambian las columnas de la matriz “P”, para hacer que el det P = 1. Esto
asegura que la transformación ortogonal de coordenadas:
x = P . x’
es decir
x x '
y P y ' (2)
es una rotación.
Paso 3º) A fin de obtener la ecuación de la cónica “C” en el sistema x’y’, se sustituye (2) en (1). Esto
conduce a:
(P . x’)T M (P . x’) + k (P . x’) + F = 0
180
1 0
PT . M . P = D =
0 2
en donde 1 y 2 son autovalores o eigenvalores de la matriz “M”. Por lo tanto la expresión (3) se
puede volver a escribir como:
0 x ' p p x '
x ' y ' . 01 . D E . p11 p12 . F 0
2 y ' 21 22 y '
o bien:
1 x’2 + 2 y’2 + D’ x’ + E’ y’ + F = 0
Ejemplo:
Determine la cónica cuya ecuación es: 5x2 – 4xy + 8y2 – 36 = 0 . Dé su ecuación en la forma canónica u
ordinaria.
= ( - 5)( - 8) – 2 . 2 = 0 2 - 8 - 5 + 40 – 4 = 0 2 - 13 + 36 = 0
de donde resulta:
1 = 9 y 2 = 4
1
5 2 9 5 2 4 2 x1 0 1 x
2 . x1 x2 x 2 2
8 2 9 8 2 1 x2 0 2
x2
1/ 2
x x2 .
1
El auto vector correspondiente al auto valor = 9 es:
181
1
2
1
A la matriz “P” la armamos teniendo presente que el determinante de “P” debe ser igual a uno (1).
2 / 5 1/ 5
P = [v2 v1] P =
1/ 5 2 / 5
2 / 5 1/ 5 5 2 2 / 5 1/ 5 20 / 5 0 4 0
y : PT M P = . .
1/ 5 2 / 5 2 8 1/ 5 2 / 5 0 45 / 5 0 9
182
Ejercicio – Modelo resuelto:
Dada la ecuación
20 80
5x 2 - 4xy + 8y2 + y+4=0 x-
5 5
determine de qué cónica se trata y dé su ecuación en la forma ordinaria.
1 0 5 2 0 5 2 5 2
det (I – M) = det 0 1 2 8 det 0 2 8 det 2
8
= ( - 5)( - 8) – 2 . 2 = 0 2 - 8 - 5 + 40 – 4 = 0 2 - 13 + 36 = 0 1 = 9 ; 2 = 4
5 2 9 5 2 4 2 x1 0 1/ 2
2 . x1 1/ 2 x2 x 1/ 2 x2 ; x2 x2
8 2 9 8 2 1 x2 0 1
1
-
Siendo entonces el auto vector correspondiente al auto valor = 9 2
1
Si considero ahora el segundo auto valor de 2 = 4, resulta:
5 2 4 5 2 1 2 x1 0 2
2
8 2 4 8
2 4 . x 0 x1 2 x2 x 2 x2 ; x2 1 x2
2
2
y el auto vector corresponde al auto valor = 4
1
1
- 2
Dichos auto vectores 2 y deben ser normalizados para confeccionar la matriz “P”
1
1
2 v2 2 ;1 2 1
v2 ;
1 v2 2 12
5 2
5
Para armar la matriz “P”, debemos tener presente que su determinante debe ser igual a uno (1), que es lo que
garantiza que se trata de una rotación.
183
2 1
5 5
P = [v2 v1] P =
1 2
5
5
Aclaración: Para completar el cuadrado en una expresión de la forma: x 2 + px, se suma y se resta la
constante (p/2)2, para obtener:
x2 + px = x2 + px + (p/2)2 – (p/2)2 = (x + p/2)2 – (p/2)2
4[(x’2 – 2x’ + (- 2/2)2) - (- 2/2)2] + 9[(y’2 – 4y’ + (- 4/2)2) - (- 4/2)2)] = - 4
1
9 4
Si ahora consideramos las ecuaciones correspondientes a las variables “x”, “y”, “z” del tipo ya mencionado:
184
Ecuación cuádrica Forma cuádrica asociada
7 x 7 y 10 z 2 2 xy 4 xz 4 yz 12 x 12 y 60 z 24
2 2
7 x 7 y 2 10 z 2 2 xy 4 xz 4 yz
2
144 x 2 100 y 2 81z 2 - 216 xz - 540 x - 720 z 0 144 x 2 100 y 2 81z 2 - 216 xz
x2 y 2 z 2 6x 2 y 0 x2 y 2 z 2
2 x 2 4 y 2 3 z 2 24 0 2 x 2 4 y 2 3z 2
La ecuación de dicha cuádrica (9) se puede escribir en la forma matricial de la siguiente manera:
A D E
2 2 x x
x y z D 2 B F 2 y G H I y J 0 (10)
E z z
F C
2 2
o bien: xT . M . x K . x J 0 (10) , en donde:
A D E
x 2 2
x y ; M D B F ; K G H I
2 2
z E
2
F C
2
185