AyG Apuntes

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 251

Apuntes de Algebra y Geometrı́a I y II

Departamento de Matemáticas
Facultad de Ciencias
Universidad de Chile

Diciembre 2022
Índice general

I Álgebra y Geometrı́a I 4
1. Lógica y conjuntos 5
1.1. Lenguaje lógico-matemático . . . . . . . . . . . . . . . . . . . . . . 5
1.2. Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3. Relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4. Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2. Aritmética y combinatoria 33
2.1. Números Naturales y Principio de Inducción. . . . . . . . . . . . . . 33
2.2. Progresiones geométricas y aritméticas . . . . . . . . . . . . . . . . 41
2.3. Principio de Inducción Completa . . . . . . . . . . . . . . . . . . . 42
2.4. Observación sobre el Principio de Inducción Completa . . . . . . . . 45
2.5. Cuatro ejercicios de Números Naturales. . . . . . . . . . . . . . . . 47
2.6. Sumatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.7. Factoriales y Binomio de Newton . . . . . . . . . . . . . . . . . . . 54
2.7.1. El arte de contar. . . . . . . . . . . . . . . . . . . . . . . . . 55
2.7.2. Triángulo de Pascal . . . . . . . . . . . . . . . . . . . . . . . 58
2.7.3. Teorema del Binomio . . . . . . . . . . . . . . . . . . . . . . 61

3. Polinomios 66
3.1. Polinomios con coeficientes reales . . . . . . . . . . . . . . . . . . . 66
3.2. Algoritmo de división para polinomios. . . . . . . . . . . . . . . . . 68
3.3. Divisibilidad y máximo común divisor de dos polinomios. . . . . . . 70
3.3.1. Método de Euclides para encontrar MCD de polinomios . . . 72
3.4. Raı́ces de polinomios. . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.5. Polinomios irreducibles y factorización única. . . . . . . . . . . . . . 77
3.6. Funciones racionales (o fracciones polinomiales) y descomposición
en fracciones parciales . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.6.1. Introducción. . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.6.2. Descomposición en fracciones parciales . . . . . . . . . . . . 82

1
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

4. Números complejos 91
4.1. Definiciones y propiedades básicas . . . . . . . . . . . . . . . . . . . 91
4.1.1. ¿Por qué surgen los números complejos? . . . . . . . . . . . 94
4.1.2. El plano complejo. . . . . . . . . . . . . . . . . . . . . . . . 96
4.2. Trigonometrı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.2.1. Ángulos en radianes y funciones seno y coseno . . . . . . . . 100
4.2.2. Más funciones trigonométricas . . . . . . . . . . . . . . . . . 103
4.2.3. Identidades trigonométricas . . . . . . . . . . . . . . . . . . 106
4.2.4. Triángulos rectángulos . . . . . . . . . . . . . . . . . . . . . 107
4.3. Trigonometrı́a y números complejos . . . . . . . . . . . . . . . . . . 110
4.3.1. La representación polar de un número complejo . . . . . . . 110
4.3.2. Potencias de números complejos. . . . . . . . . . . . . . . . 114
4.3.3. Raı́ces de un número complejo. . . . . . . . . . . . . . . . . 115
4.4. Polinomios en C[x] y aplicaciones del Teorema Fundamental del Al-
gebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
4.5. Ecuaciones trigonométricas . . . . . . . . . . . . . . . . . . . . . . . 119
4.6. Funciones trigonométricas inversas . . . . . . . . . . . . . . . . . . 121
4.7. Aplicación a complejos . . . . . . . . . . . . . . . . . . . . . . . . . 124

II Álgebra y Geometrı́a II 127


5. Secciones cónicas 128
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.1.1. Lugares geométricos. Rectas. . . . . . . . . . . . . . . . . . . 128
5.2. Secciones cónicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
5.2.1. Cónicas como lugares geométricos. . . . . . . . . . . . . . . 131
5.2.2. Circunferencia . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.2.3. Elipse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5.2.4. Hipérbola . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
5.2.5. Parábola . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
5.3. Ecuación general de segundo grado. Traslaciones y rotaciones . . . . 144
5.3.1. Traslación del sistema de coordenadas. . . . . . . . . . . . . 145
5.3.2. Rotación de los ejes de coordenadas en un ángulo α . . . . . 146
5.4. Clasificación de cuádricas planas según el discriminante B 2 − 4AC: 149

6. Matrices 153
6.1. Introducción a las Matrices . . . . . . . . . . . . . . . . . . . . . . . 153
6.1.1. Matrices escalonadas y eliminación gaussiana . . . . . . . . . 157
6.1.2. Matrices inversas . . . . . . . . . . . . . . . . . . . . . . . . 159
6.1.3. Sistemas de Ecuaciones lineales . . . . . . . . . . . . . . . . 165

2
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

6.1.4. Rango de una matriz, número de soluciones de un sistema


de ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 167
6.2. Espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
6.2.1. Dependencia e Independencia lineal . . . . . . . . . . . . . 176
6.2.2. Transformaciones lineales . . . . . . . . . . . . . . . . . . . . 178
6.3. Sobre invertibilidad de matrices . . . . . . . . . . . . . . . . . . . . 181
6.3.1. Sobre inversas por la izquierda y derecha . . . . . . . . . . . 184
6.4. Determinante de una matriz . . . . . . . . . . . . . . . . . . . . . . 186
6.4.1. Aplicación al cálculo de inversas . . . . . . . . . . . . . . . . 198

7. Geometrı́a en el plano y espacios afines 200


7.1. Usando coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . 202
7.2. Ecuación vectorial de la recta en Rn . . . . . . . . . . . . . . . . . . 202
7.2.1. Rectas en el plano R2 . . . . . . . . . . . . . . . . . . . . . . 203
7.2.2. Rectas en el espacio R3 . . . . . . . . . . . . . . . . . . . . . 204
7.2.3. Aplicación: División de un segmento . . . . . . . . . . . . . 205
7.3. Ecuación vectorial de un plano . . . . . . . . . . . . . . . . . . . . . 209
7.3.1. Planos en el espacio R3 . . . . . . . . . . . . . . . . . . . . . 210
7.4. Posiciones relativas de objetos. . . . . . . . . . . . . . . . . . . . . . 211
7.4.1. Posiciones relativas de rectas en R2 . . . . . . . . . . . . . . 211
7.4.2. Posiciones relativas de dos rectas en el espacio. . . . . . . . . 212
7.4.3. Posiciones relativas de dos planos en el espacio. . . . . . . . 214
7.4.4. Posiciones relativas de tres planos en el espacio. . . . . . . . 217
7.4.5. Posiciones relativas de un plano y una recta en el espacio. . 219
7.5. Producto punto o escalar en R3 . . . . . . . . . . . . . . . . . . . . . 220
7.5.1. Aplicación 1: Vector normal de un plano. . . . . . . . . . . . 225
7.5.2. Aplicación 2: Proyección escalar y ortogonal (vectorial). . . . 226
7.5.3. Aplicación 3: Distancia entre un punto y una recta. . . . . . 228
7.5.4. Aplicación 4: Distancia de un punto a un plano. . . . . . . . 229
7.5.5. Aplicación 5: Distancia entre una recta y un plano. . . . . . 229
7.5.6. Aplicación 6: Distancia entre dos rectas. . . . . . . . . . . . 230
7.5.7. Aplicación 7: Distancia entre dos planos. . . . . . . . . . . . 231
7.6. Producto cruz o vectorial en R3 . . . . . . . . . . . . . . . . . . . . . 231

8. Anexo: Representación matricial de transformaciones lineales. 237


8.1. Núcleo e Imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
8.2. Transformaciones lineales y matrices . . . . . . . . . . . . . . . . . 240
8.2.1. Cambio de base . . . . . . . . . . . . . . . . . . . . . . . . . 246
8.3. Algunos ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248

3
Parte I

Álgebra y Geometrı́a I

4
Capı́tulo 1

Lógica y conjuntos

1.1. Lenguaje lógico-matemático


En matemáticas, como en cualquier área del conocimiento, para expresar los
objetos bajo estudio y sus propiedades, se requiere un lenguaje preciso, claro y
eficiente. Por preciso, nos referimos a que carezca de ambigüedades, es decir, es
importante que lo que se diga no tenga múltiples interpretaciones. Por claro, nos
referimos a que el lector, con el entrenamiento apropiado, pueda entender lo que
se dice sin un esfuerzo exagerado. Por eficiente, nos referimos a la necesidad de
transmitir una cierta cantidad de información con un texto de largo moderado.
Para conseguir estos objetivos, el matemático hace uso de un lenguage propio de
la disciplina, llamado el lenguage matemático. Éste se basa en el lenguage común
de nuestra experiencia, español, inglés, o el que corresponda, al cual se le agregan
sı́mbolos y frases reservadas que tienen una interpretación no ambigua. Frases como
“si y sólo si” tienen, para el matemático, un significado preciso cuya comprensión
es esencial para seguir un razonamiento. A este lenguage debemos agregar el méto-
do axiomático, en el que todo razonamiento debe seguir, de acuerdo a las leyes de
la lógica, a partir de afirmaciones básicas o axiomas, las que el matemático admite
como verdades incuestionables, en cierto contexto, en las cuales basa su trabajo
posterior. Sin perjuicio de lo anterior, muchas teorı́as matemáticas están motivadas
fuertemente por fenómenos o experimentos concretos, por ejemplo, por simulacio-
nes computacionales. En este caso, el matemático escoge sus frases reservadas, sus
sı́mbolos y sus axiomas, a fin de modelar de la manera más fiel posible el objeto
de estudio. Si un modelo dado no resulta satisfactorio, el matemático vuelve al
principio y crea una nueva teorı́a, con otros axiomas, con la esperanza de que esta
última se ajuste mejor al fenómeno de interés. De otro modo, toda la información
que el matemático extrae de su modelo es consecuencia lógica directa de los axio-
mas. La intuición puede servir de guı́a, pero toda afirmación que el matemático
realiza, sobre un modelo dado, debe contar con una deducción meticulosa a partir

5
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

de los axiomas. A esto último se le llama una demostración.


La necesidad de tener una demostración para cada afirmación nos lleva a otra
caracterı́stica importante de un sistema axiomático, la consistencia. Como, en una
teorı́a, las afirmaciones demostradas son consideradas “verdades”, es importante
que no sea posible demostrar, en la misma teorı́a, una afirmación y, simultaneamen-
te, su negación. En este sentido se pide que los axiomas sean consistentes. Saber si
una determinada teorı́a es o no consistente, no es posible en la practica, salvo en
términos de una teorı́a pre-existente. Por esta razón, el problema de la consistencia
es, para el matemático, a menudo un acto de fe. Por otro lado, si el matemático en-
cuentra contradicciones en una teorı́a determinada, debe abandonarla y etiquetarla
de inconsistente.
Un enunciado (también se dice proposición, aunque esta palabra se usará des-
pués para enunciados que son verdaderos) es una frase que tiene un valor de verdad:
Verdadera o Falsa.1 Ejemplos de esto son las frases

“Dos es par” o “1 + 2 = 4”.

Algunas frases que no son ejemplos de un enunciado serı́an

“2 + 3” o “¿es 3 impar?”.

El propósito de una teorı́a matemática es determinar qué enunciados son verdade-


ros y cuáles no. No existe un procedimiento universal para conseguir esto. De hecho,
no puede existir tal procedimiento, por razones que están más allá del propósito de
este apunte. Por esta razón, el trabajo del matemático es, en gran medida, encon-
trar métodos para determinar qué afirmaciones son ciertas y cuáles no, en casos
particulares de interés. Saber qué problemas son de interés y qué procedimientos
pueden llevarnos a encontrar una demostración es, para el matemático, el trabajo
de toda una vida.

Conectivos
Los primeros sı́mbolos o frases reservadas que debemos mencionar son los co-
nectivos. Un enunciado puede estar formado por dos o más enunciados, conectados
mediante una palabra o frase especial. Esta palabra o frase especial suele tener un
sı́mbolo con el que se puede enfatizar su uso como conectivo lógico. Suponiendo
que p y q representan dos enunciados, los más usados son:
1
Un axioma de la lógica matemática, llamado el principio del tercero excluido, dice que éstos
son los únicos valores de verdad. Por ende una afirmación que no es falsa, tiene que ser verdadera.
Si bien existen sistemas lógicos en donde uno admite la posibilidad de otros valores de verdad, la
matemática clásica siempre trabaja con este axioma.

6
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Negación: (¬p), se lee “no p”, y representa el enunciado que niega a p, siendo
verdadera cuando p es falsa, y falsa cuando p es verdadera. Por ejemplo, “3
no es un entero” es la negación de “3 es un entero”. La segunda afirmación
es verdadera por lo que la primera es falsa.

Bicondicional: (p ⇔ q), se lee “p si y sólo si q” (usualmente abreviado como


“p ssi q”), y representa a la afirmación “p y q son ambas verdaderas, o ambas
falsas” y es verdad en tal caso. Es falsa si p y q no tienen igual valor de verdad.
También se lee como “p es equivalente a q”, o “q exactamente cuando p”. Por
ejemplo “3 es un entero si y sólo si 32 es un entero” es una afirmación falsa.

Conjunción: (p ∧ q), se lee “p y q”, y representa a la afirmación “p y q son


ambas verdaderas” y es verdad en tal caso, siendo falsa si cualquiera de ellas
es falsa. Es decir, (p ∧ q) es verdadera si y solo si ambas son verdaderas. Por
ejemplo “3 es un entero y 32 es un entero” es una afirmación falsa.

Disyunción: (p ∨ q), se lee “p o q”, y representa a la afirmación “algunas de


las afirmaciones p y q es verdadera” y es verdad en tal caso, siendo falsa solo
si ambas son falsas. Es decir, (p ∨ q) es verdadera si y solo si al menos una de
ellas lo es. Por ejemplo “3 es un entero o 23 es un entero” es una afirmación
verdadera.

(p ⇒ q), se lee “p implica q”(o también “si p entonces q”, o “q cuando p”), y
representa a la afirmación “la verdad de p obliga a la verdad de q” y es verdad
en tal caso, siendo falsa solo si p es verdadera pero q falsa. Por ejemplo “Si
3 es un entero, entonces 32 es un entero” es una afirmación falsa. Note que si
p es falsa, automáticamente p ⇒ q es verdadera. En ese caso se dice que es
trivialmente verdadera. Por ejemplo “Si 23 es un entero, entonces 52 es un
entero” es trivialmente verdadera. Lo mismo ocurre con “Si 32 es un entero,
entonces 5 es un entero”.

Observación 1.1.1. Las definiciones de los conectivos se pueden resumir en la


siguiente tabla de verdad:

p q ¬p p ∧ q p ∨ q p ⇒ q p ⇔ q
V V F V V V V
V F F F V F F
F V V F V V F
F F V F F V V
3
Por ejemplo, para evaluar “Si 2
es un entero, entonces 5 es un entero” escribimos

p para “ 32 es un entero” y q para “5 es un entero”. Ası́, p es falso y q verdadero, por

7
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

lo que miramos la columna de p ⇒ q en la fila que corresponde a p = F y q = V ,


la que pone V , por lo que la afirmación es verdadera.

Ejemplo 1.1.2. En el conjunto de los números naturales, veamos el valor de verdad


de las siguientes proposiciones (o enunciados)

1. (2 > 4) ∨ (1 < 2) es verdadera.

2. (2 > 4) ∧ (1 < 2) es falsa.

3. (2 > 4) ⇒ (1 < 2) es trivialmente verdadera.

4. (2 > 4) ⇒ (1 = 2) es trivialmente verdadera.

5. (2 < 4) ⇒ (1 < 2) es verdadera.

6. (2 < 4) ⇒ (1 = 2) es falsa.

7. (2 > 4) ⇔ (1 < 2) es falsa.

8. (2 < 4) ⇔ (1 < 2) es verdadera.

Tautologı́as.
Se llama tautologı́a a una combinación de proposiciones simples, como p y q
arriba, que es siempre verdadera, independiente del valor de verdad de las proposi-
ciones que la componen. El primer ejemplo de tautologı́a es p∨(¬p). Las tautologı́as
son muy útiles para encontrar proposiciones lógicamente equivalentes, lo que re-
sulta esencial al estructurar un razonamiento lógico. Nótese que una expresión del
tipo x = x no es realmente una tautologı́a. En lógica esto se denomina una fórmula
válida. No profundizaremos esta distinción aquı́.

Definición 1.1.3. Dos proposiciones compuestas p y q son equivalentes si tienen


el mismo valor de verdad, independiente del valor de verdad de las proposiciones
que las componen. En otras palabras, p y q son equivalentes si y sólo si p ⇔ q es
una tautologı́a. En este caso se usa la notación p ≡ q.

La lógica proposicional es una teorı́a extensa que no intentaremos cubrir en este


curso. Sin embargo, incluimos aquı́ una lista de equivalencias que serán útiles en
capı́tulos posteriores:

Proposición 1.1.4. Sean p, q dos proposiciones, entonces se tienen las siguientes


equivalencias:

(1) Conmutatividad: p ∨ q ≡ q ∨ p, p ∧ q ≡ q ∧ p.

8
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

(2) Doble negación: ¬(¬p) ≡ p.

(3) Contrarrecı́proco: p ⇒ q ≡ ¬q ⇒ ¬p.

(4) Equivalencia y doble implicación: p ⇔ q ≡ (p ⇒ q ∧ q ⇒ p).

(5) Equivalencia de la implicación: p ⇒ q ≡ ¬p ∨ q.

(6) Negación de la conjunción y disjunción (también llamadas Leyes de comple-


mentación o Leyes de De Morgan): ¬(p ∧ q) ≡ ¬p ∨ ¬q, ¬(p ∨ q) ≡ ¬p ∧ ¬q.

(7) Negación de la implicación: ¬(p ⇒ q) ≡ p ∧ ¬q.

La primera afirmación nos dice que (p ∨ q) ⇔ (q ∨ p) es una tautologı́a. Lo


mismo vale para las restantes.
Demostración. Para probar (2) procedemos como sigue: Si p es verdadero, entonces
al negarla tendremos una proposición falsa. Al negarla nuevamente, será verdade-
ra. En el otro caso, si p es falsa, entonces al negarla tendremos una proposición
verdadera. Al negarla nuevamente, será falsa. Es decir, la proposición ¬(¬p) tiene
el mismo valor de verdad de p. Por ello, la proposición p ⇔ ¬(¬p) es siempre ver-
dadera, o sea: una tautologı́a. Por eso se anota p ≡ ¬(¬p), como querı́amos probar.
El argumento anterior se puede resumir en una tabla de verdad
p ¬p ¬(¬p) p ⇔ ¬(¬p)
V F V V
F V F V
El hecho que la última columna sea siempre verdadera, indica que es una tautologı́a.
Las afirmaciones (1) y (3) – (6) son similares y se dejan como ejercicio.
Para probar (7) procedemos como sigue: De (5) se tiene p ⇒ q ≡ ¬p ∨ q.
Negando estas afirmaciones se concluye ¬(p ⇒ q) ≡ ¬(¬p ∨ q). Ahora usamos (6)
y (2) para concluir

¬(p ⇒ q) ≡ ¬(¬p ∨ q) ≡ (¬(¬p) ∧ ¬q) ≡ (p ∧ ¬q).

Predicados
Dado un enunciado p podemos reemplazar algunos de los objetos que involucra
por variables, denotadas por letras x, y, z, u, etc. Con ello dejan de ser un enunciado
(o proposición), pues carece de valor de verdad. Al momento en el que asigne un
valor a las variables, el predicado tendrá un valor de verdad. Se usa entonces la
notación p(x) o p(y), pues es un enunciado que depende del valor que se asigne a la

9
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

variable x (o y, o cualquier otra según sea el caso). Estas frases se llaman predicados
o funciones proposicionales. Por ejemplo, “x es par” es un predicado. También se
puede combinar dos o más predicados usando los conectivos anteriores. Por ejemplo,
si p(x) denota el predicado “x es par”, tendremos
  que p(2) es verdadera, mientras
que p(1) es falsa. En tanto que p(x) ⇔ ¬ ¬p(x) es cierta para cualquier valor de
la variable x, dado que p ⇔ ¬(¬p) es una tautologı́a.

Cuantificadores
Si se tiene un predicado, con una variable, se convierte en enunciado al ante-
ponerle una frase especial llamada cuantificador. Los más usados son:

Universal: Anteponer la frase “ para todo”. Es falsa en caso de haber uno o


más elementos x que hagan falsa a p(x). Se usa también el sı́mbolo ∀.

Existencial: Anteponer la frase“existe”. Es falsa en caso de no haber elemen-


tos x que hagan verdadera a p(x). Se usa también el sı́mbolo ∃.

Existe un único: Es falsa en caso de no haber elementos x en A que hagan


verdadera a p(x) o que haya más de uno que la haga verdadera. Se usa
también el sı́mbolo ∃!

Por ejemplo, si estamos en el conjunto de los números naturales y tenemos el


predicado “p(x) : x es par”. Al anteponer los diferentes cuantificadores el valor de
verdad de la proposición resultante cambia:

Universal: Para todo x número natural, x es par. Esto es falso.

Existencial: Existe x número natural, x es par. Esto es verdadero.

Existe un único x número natural, x es par. Es falso.

Observación 1.1.5. Negación de cuantificadores:

¬(∀x ∈ A, p(x)) ≡ ∃x ∈ A, ¬p(x)

¬(∃x ∈ A, p(x)) ≡ ∀x ∈ A, ¬p(x)

Sobre demostraciones
Note que comprobar los valores de verdad afirmados arriba requiere de una
demostración. Esto es, un argumento convincente, claro, preciso de la veracidad
de lo afirmado. En el ejemplo anterior:

10
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Universal: Para todo x número natural, x es par. Esto es falso. Demostración:


El número 3 es un natural que no es par. Luego no todo número natural es
par.

Existencial: Existe x número natural, x es par. Esto es verdadero. Demostra-


ción: El número 2 es un natural que es par. Se muestra ası́ que existe un tal
número.

Existe un único x número natural, x es par. Es falso. Demostración: El núme-


ro 2 es un natural que es par, lo mismo el 4. Entonces no hay sólo un único
número natural par.

El trabajo o investigación en matemática abstracta es diferente al trabajo


en otras ciencias. En matemática abstracta, usamos lo que se llama el método
axiomático; es decir, tomamos una colección de objetos S y suponemos ciertas
reglas sobre su estructura. Estas reglas se llaman axiomas. Usando los axiomas
para S, queremos deducir otra información sobre S usando argumentos lógicos.
Se requiere que los axiomas sean consistentes; es decir, no debiesen contradecirse
entre ellos. También se suele pedir que no haya demasiados axiomas. Si un sistema
de axiomas es demasiado restrictivo, habrá muy pocos ejemplos de la estructura
matemática que ellos determinan.
Hay distintas estrategias para demostrar siguiendo el método axiomático. Es
algo que se aprende con la práctica, leyendo demostraciones de otros, compartiendo
las propias, etc. Algunas estrategias usuales son

Para demostrar que una proposición del tipo “para todo” no es verdadera, es
dar un contraejemplo. Es decir, un ejemplo que contradiga lo afirmado “para
todo”.

Si se quiere mostrar que un objeto existe y es único. Primero se muestra que


el objeto existe. Luego, para demostrar que es único, se supone que hay dos
tales objetos, y se muestra que son iguales.

En enunciados del tipo “Si p, entonces q”, donde p y q son a su vez enunciados,
p se llama hipótesis y q se conoce como conclusión. En este caso, el enunciado
no dice nada sobre si la hipótesis p es verdadera o no. Lo que sucede es que,
si el enunciado completo es verdadero y podemos mostrar que p es verdadera,
entonces la conclusión q debe ser verdadera.

A veces es más fácil demostrar el contrapositivo de una proposición. Demos-


trar la proposición “Si p, entonces q” es exactamente lo mismo que demostrar
la proposición “Si no q, entonces no p”.

11
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Otras veces podemos demostrar una proposición p por contradicción. Es de-


cir, suponemos que p es falsa, desarrollamos un argumento que lleve nece-
sariamente a deducir que un segundo enunciado es falso, pero que sabemos
que es verdadero en nuestro sistema. Como nuestro sistema se supone que
es consistente, concluimos que esta situación es imposible y por lo tanto la
proposición p es verdadera

Para demostrar enunciados del tipo “si p o q entonces r”, puede hacerse una
demostración por casos. Esto significa seguir los pasos siguientes:

• Suponer p y, bajo esa hipótesis, probar r.


• Suponer q y, bajo esa hipótesis, probar r.

Ejemplo 1.1.6. Para ilustrar una demostración por casos, probaremos que (p ⇒
q) ⇒ (¬q ⇒ ¬p). Para esto, asumimos p ⇒ q y debemos probar ¬q ⇒ ¬p. Para
esto, recordamos que p ⇒ q es equivalente a ¬p ∨ q. Esto nos deja dos casos.
Suponemos primero ¬p. En este caso ¬q ⇒ ¬p es cierto, dado que la conclusión es
cierta. Suponemos ahora q. En este caso ¬q es falso, por lo que ¬q ⇒ ¬p es cierto
dado que su hipótesis es falsa. Hemos demostrado, en cada caso, la conclusión
¬q ⇒ ¬p, por lo que concluı́mos que ¬p ∨ q implica ¬q ⇒ ¬p. Como ¬p ∨ q es
equivalente a p ⇒ q, concluimos que p ⇒ q implica ¬q ⇒ ¬p.

Ejemplo 1.1.7. Demuestre: Para todo x ∈ Z, si x2 es par, entonces x es par.


Demostración. Luego de intentarlo vemos que es más fácil demostrar el contrapo-
sitivo: Para todo x ∈ Z. Si x es impar, entonces x2 es impar.

Ejemplo 1.1.8. Demuestre que el siguiente sistema de ecuaciones sobre los reales
no tiene solución: (
x+y =3
2x + 2y = 1

Demostración. Vemos que es más fácil utilizar el método de contradicción: Suponga


que hay solución al sistema, esto es: Sean x = a, y = b con a, b ∈ R, que satisfacen
ambas ecuaciones. Esto implica que

a + b = 3 y 2a + 2b = 1.

Tomamos la segunda expresión y tenemos que 2(a + b) = 1. Allı́ reemplazamos


la primera expresión obteniendo 2 · 3 = 1, lo que es una contradicción. Luego el
supuesto hay solución al sistema es falso.

12
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Algo del lenguaje


Ya hemos dicho que si un enunciado es verdadero, entonces el enunciado se
llama Proposición. Una proposición de mayor importancia en el contexto en que
está recibe el nombre de Teorema. Una proposición técnica, que su valor principal
radica en ser útil para demostrar otra proposición más significativa, o incluso un
teorema, se llama Lema. Es usual demostrar varios lemas y descansar en ellos
para demostrar un Teorema. Otro nombre usado para proposiciones, o enunciados
verdaderos, es Corolario. Este se usa en caso que la proposición sea consecuencia
de una más importante, o más general.

1.2. Conjuntos
Un conjunto es una colección bien definida de objetos; es decir, está definida
de manera que, para un objeto x cualquiera, podamos determinar si x pertenece
o no al conjunto. Los objetos que pertenecen al conjunto se llaman elementos.
Usualmente los conjuntos se denotan por letras mayúsculas, tales como A o X; si
a es un elemento del conjunto A, escribimos en sı́mbolos a ∈ A y decimos que a
pertenece a A. Hay dos formas en las que usualmente escribir un conjunto:

X = {x1 , x2 , ..., xn } para un conjunto que contiene exactamente los elementos


x1 , x2 , ..., xn , lo que solemos llamar escritura por extensión; o

X = {x : x satisface P }, si un elemento x pertenece a X si y solamente si


satisface cierta propiedad P , lo que llamamos escritura por comprensión.

Por ejemplo, si T es el conjunto de enteros pares positivos, podemos describir T


como
T = {z : z es un entero par y z > 0}.
Anotamos, por ejemplo, 2 ∈ T , −2 6∈ T , 3 6∈ T .
En ocasiones trabajaremos con un conjunto fijo U que llamaremos el conjunto
universal, y los elementos con los cuales estaremos trabajando se tomarán de allı́.
Este conjunto puede ser, por ejemplo, los números reales, enteros u otro conjunto
de objetos que estemos estudiando en ese momento.

Operaciones
Podemos encontrar relaciones entre conjuntos y realizar operaciones entre con-
juntos.

Definición 1.2.1. Decimos que un conjunto A es un subconjunto de B, y lo


denotamos por A ⊆ B, si todo elemento de A también es un elemento de B.

13
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Por ejemplo, {1, 2, 3} ⊆ Z. Para demostrar que dados dos conjuntos X, Y se


cumple que X ⊆ Y , hay que demostrar que todo elemento de X está en Y . Note
que trivialmente se tiene que todo conjunto es subconjunto de si mismo y que la
definición de A subconjunto de B se anota

A ⊆ B ⇔ [∀x, x ∈ A ⇒ x ∈ B].

Definición 1.2.2. Se dice que A es subconjunto propio de B, si y sólo si A ⊆ B


y A 6= B. Se dice que A es igual a B, A = B, si y sólo si contienen los mismos
elementos.

A veces en la literatura existente, A subconjunto propio de B se denota por


A ⊂ B o A ( B. Siempre hay que revisar la simbologı́a del texto que se está
leyendo para entender la notación que usa. En estos apuntes usaremos la notación
A ( B para denotar que A es un subconjunto propio de B.
Note que A = B es equivalente a A ⊆ B y B ⊆ A. Esto será usado bastante en
el futuro. En sı́mbolos, la igualdad de conjuntos corresponde a:

A = B ⇔ (∀x ∈ U, x ∈ A ⇔ x ∈ B)

Definición 1.2.3. El conjunto sin elementos se llama conjunto vacı́o. Se denota


por ∅.

A partir de dos conjuntos A, B podemos construir nuevos conjuntos:

La unión de A y B es A ∪ B := {x : x ∈ A ∨ x ∈ B}.

La intersección de A y B es A ∩ B := {x : x ∈ A ∧ x ∈ B}.

La diferencia de A con B es A − B := {x : x ∈ A ∧ x ∈ / B}. Es decir,


está formado por los elementos que están en A y no están en B. También se
denota A r B.

Observación 1.2.4. El sı́mbolo := denota una definición. Por ejemplo, si escribi-


mos “Sea A := {1, 2, 3}”, estamos definiendo A como el conjunto {1, 2, 3}.

Note que usando sı́mbolos las definiciones anteriores corresponden a lo siguiente


(respectivamente):

Unión:
∀x ∈ U, x ∈ A ∪ B ⇔ x ∈ A ∨ x ∈ B.

Intersección:
∀x ∈ U, x ∈ A ∩ B ⇔ x ∈ A ∧ x ∈ B.

14
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Diferencia:
∀x ∈ U, x ∈ A r B ⇔ x ∈ A ∧ x ∈
/ B.

Cuando dos conjuntos no tienen elementos en común, se dice que son disjuntos.
Dos conjuntos A y B son disjuntos precisamente cuando A ∩ B = ∅. A menudo es
común ver la notación A t B o A ∪˙ B (léase A unión disjunta B) para denotar la
unión entre A y B cuando A y B son disjuntos.
Recordar que en ocasiones trabajaremos con un conjunto fijo U , llamado con-
junto universal. Para cualquier conjunto A ⊆ U , podemos definir el complemento
de A, como el conjunto

Ac = {x ∈ U : x ∈
/ A}.

Proposición 1.2.5. Sean A, B y C conjuntos. Entonces:

(1) A ∩ A = A

(2) A ∪ A = A

(3) A ∪ B = B ∪ A

(4) A ∩ B = B ∩ A

(5) A ∪ (B ∪ C) = (A ∪ B) ∪ C

(6) A ∩ (B ∩ C) = (A ∩ B) ∩ C

(7) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)

(8) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)

(9) A − A = ∅

(10) Si A ⊆ B y B ⊆ C, entonces A ⊆ C

(11) A ⊆ B ∧ B ⊆ A si y sólo si A = B

(12) A ⊆ B si y sólo si A ∩ B = A si y sólo si A ∪ B = B

(13) A ⊆ B si y sólo si A − B = ∅

(14) A − (B ∪ C) = (A − B) ∩ (A − C)

(15) A − (B ∩ C) = (A − B) ∪ (A − C)

15
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración. Demostraremos las propiedades (1), (2) y (5), las otras se dejan
como ejercicio.
(1) Observe que A ∩ A = {x : x ∈ A ∧ x ∈ A} = {x : x ∈ A} = A.
(2) Observe que A ∪ A = {x : x ∈ A ∨ x ∈ A} = {x : x ∈ A} = A.
(5) Observe que

A ∪ (B ∪ C) = A ∪ {x : x ∈ B ∨ x ∈ C} = {x : x ∈ A ∨ x ∈ B ∨ x ∈ C}.

La última expresión corresponde a {x : x ∈ A ∨ x ∈ B} ∪ C = (A ∪ B) ∪ C.

Dado un conjunto A, se define el conjunto de las partes de A o conjunto potencia


de A, y se denota por P(A), como el conjunto de todos los subconjuntos de A. Esto
es,
P(A) = {X : X ⊆ A}.
Note que P(A) es un conjunto cuyos elementos son conjuntos, y también que
∅ ∈ P(A) y A ∈ P(A).

Ejercicio 1.2.6. Si A = {a, b, c}, escriba P(A) por extensión.

Conjuntos finitos e infinitos


Un conjunto finito es un conjunto que tiene un número finito de elementos.
En caso contrario, se dice que el conjunto es infinito. El conjunto A = {a, b, c},
por ejemplo, es finito, mientras que el conjunto de los números naturales N =
{1, 2, 3, . . . } es infinito.
Dado un conjunto finito A, se define el cardinal (o la cardinalidad ) de A como
el número de elementos de A. Se denota por |A|, #A o card(A). Note que |∅| = 0.

Ejercicio 1.2.7. Resuelva:

1. Construya algunos conjuntos finitos y calcule la cardinalidad de su conjunto


potencia.

2. Demuestre que si A y B son conjuntos finitos, entonces

|A ∪ B| = |A| + |B| − |A ∩ B|.

Para el caso de conjuntos infinitos, el concepto de cardinalidad se complica ya


que hay infinitos de distinto tipo. Estudiaremos esto en más detalle más adelante.
Como ejemplo, parece claro que R tiene más elementos que N, pero ¿cómo se
compara la cardinalidad de Z con la de N?

16
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Producto cartesiano
El concepto de conjunto no distingue ningún orden entre sus elementos. Por
ejemplo, se tiene {a, b, c} = {b, c, a}, {a, a} = {a}. Se introduce el concepto de
tupla, que recupera la noción intuitiva de orden.

Definición 1.2.8. Dados dos objetos a y b, el par ordenado (a, b) es una lista
ordenada de esos objetos; a se encuentra en la primera coordenada, y b en la
segunda. Diremos que dos pares ordenados (a, b), (c, d) son iguales si a = b y
c = d.
En general, si se tienen n objetos a1 , a2 , . . . , an se define una n-tupla como una
lista ordenada de ellos
(a1 , a2 , . . . , an ).
Dos n-tuplas (a1 , a2 , . . . , an ) y (b1 , b2 , . . . , bn ) son iguales si y sólo si ai = bi para
todo i = 1, . . . , n.

Por ejemplo, si se tiene el conjunto A = {0, 1} ¿cuántas 3-tuplas se pueden


formar con elementos de A? Tenemos los siguientes elementos:

(0, 0, 0), (0, 0, 1), (0, 1, 0), (1, 0, 0), (1, 1, 0), (1, 0, 1), (0, 1, 1), (1, 1, 1).

Dados dos conjuntos arbitrarios A y B, la colección de todos los pares ordenados


de primera coordenada en A y segunda coordenada en B se llama el producto
cartesiano de A y B, denotado por A × B. Usando el lenguaje de conjuntos:

A × B := {(x, y) : x ∈ A ∧ y ∈ B}.

Se generaliza de manera natural

A1 × A2 × · · · × An := {(a1 , a2 , . . . , an ) : ai ∈ Ai , 1 ≤ i ≤ n}.

Este último conjunto también se denota como ni=1 Ai . Si todos los factores son
Q
el mismo conjunto A, denotamos el producto cartesiano con n factores como An .
Note que A × B 6= B × A (dé un contraejemplo para la igualdad).

Ejercicio 1.2.9. Demuestre que si A y B son conjuntos finitos, entonces |A×B| =


|A| · |B|.

1.3. Relaciones
Hay una noción intuitiva de qué es una relación entre dos objetos. Por ejemplo,
es natural pensar que las afirmaciones 2 es menor que 3, 5 no es menor que 3, 4 y
6 son divisibles por 2, etc., son ejemplos de relaciones entre dos elementos.

17
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Definición 1.3.1. Dados dos conjuntos A y B, una relación binaria R de A en B


es un subconjunto no vacı́o de A×B. Es decir, es un conjunto que consiste de pares
ordenados. Si (a, b) ∈ R, se dice que a está relacionado con b. Se anota también
aRb, a ∼R b ó a ∼ b.
Como siempre estaremos estudiando relaciones binarias, omitiremos la palabra
binaria y hablaremos simplemente de relaciones. El concepto de relación aparece
en muchos contextos distintos en Matemáticas. Por ejemplo, en los números reales
se define la relación ser menor que:

R1 := {(x, y) ∈ R × R : x < y}.

En este ejemplo, los pares (1, 2), (−3, 5/2) pertenecen a la relación. Otra forma de
decir esto es que 1 está relacionado con 2, y −3 está relacionado con 5/2.
También, por ejemplo, podrı́amos definir en R × R la relación

R2 := {(0, 1), (−2, π), (24, 10)}.

Aquı́ 0 está relacionado con 1, −2 está relacionado con π, y 24 está relacionado


con 10.
Definición 1.3.2. Sea R ⊆ A × B una relación. Se definen el dominio y la imagen
de R como sigue:

Dom(R) := {x ∈ A : existe y ∈ B tal que (x, y) ∈ R},


Im(R) := {y ∈ B : existe x ∈ A tal que (x, y) ∈ R}.
Es decir, el dominio de una relación de A en B corresponde a los elementos
de A que están relacionados con algún elemento de B. Análogamente, la imagen
corresponde a los elementos de B para los cuales hay un elemento en A que está
relacionado con él. En algunos textos a la imagen se le llama recorrido. Note que
el dominio está contenido en A y la imagen en B.

Caracterización de relaciones
Consideraremos ahora relaciones definidas sobre un mismo conjunto. Esto es,
R ⊆ A × A y nombraremos sólo tres propiedades que pueden tener las relaciones.
Hay muchas más. Por ejemplo, en el curso de Cálculo seguramente se verán otras.
Definición 1.3.3. Sea R ⊆ A × A una relación en A. Se dice que

R es reflexiva ⇔ ∀x ∈ A : (x, x) ∈ R

R es simétrica ⇔ ∀x, y ∈ A : (x, y) ∈ R ⇒ (y, x) ∈ R

18
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

R es transitiva ⇔ ∀x, y, z ∈ A : (x, y) ∈ R ∧ (y, z) ∈ R ⇒ (x, z) ∈ R


Ejemplo 1.3.4. Algunos ejemplos de relaciones y sus caracterı́sticas:
(1) En R la relación x ∼ y ⇔ x ≤ y es reflexiva y transitiva pero no simétrica.
(2) Por otra parte, la relación en R definida por x ∼ y ⇔ x − y ∈ Z es reflexiva,
simétrica y transitiva.
(3) En Z la relación x ∼ y ⇔ x − y es divisible por 2 es reflexiva, transitiva y
simétrica.

Relaciones de equivalencia
Definición 1.3.5. Una relación de A en A que es reflexiva, simétrica y transitiva
se llama relación de equivalencia.
Ejemplo 1.3.6. La relaciones de los puntos (2) y (3) del Ejemplo 1.3.4 son de
equivalencia.
Las relaciones de equivalencia son las relaciones más fundamentales en la ma-
temática, aparecen en muchos contextos distintos, y son importantes porque, entre
otras cosas, permiten clasificar objetos ya que generalizan la idea de igualdad.
Definición 1.3.7. Sea R una relación de equivalencia en A y x ∈ A. Se define
la clase de equivalencia de x como el conjunto de todos los elementos de A que
están relacionados con x. Se puede anotar x, [x]R , o sencillamente [x]. En sı́mbolos,
[x] := {y ∈ A : yRx}.
Las clases de equivalencia particionan el conjunto A. Es decir, A es la unión
disjunta de clases de equivalencia. La demostración de esto es como sigue:
Como R es reflexiva, se tiene que para todo x ∈ A, x pertenece a [x]. O sea,
las clases son conjuntos no vacı́os. Es claro entonces que
[
A= [x].
x∈A

Lo que debemos probar es que en la unión anterior hay subconjuntos “ repetidos”,


para poder eliminarlos. Más precisamente, debemos demostrar que para x, y ∈ A
se tiene que [x] = [y] o [x] ∩ [y] = ∅. Para ello , suponga que existe z ∈ [x] ∩ [y].
Esto quiere decir que z ∼ x y z ∼ y. Usamos la simetrı́a para la primera afirmación
y tenemos que x ∼ z y z ∼ y. Ahora, por transitividad x ∼ y. Demostramos ası́
que [x] ⊆ [y]. De forma análoga se demuestra que [y] ⊆ [x], y luego [x] = [y].
Concluimos entonces que dos clases de equivalencia o bien son disjuntas o bien son
la misma.
La Figura 1.1, muestra una relación de equivalencia que se puede visualizar.
Ejercicio 1.3.8. Describa las clases de equivalencia en las relaciones de equiva-
lencia del Ejemplo 1.3.4.

19
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Figura 1.1: Visualización de una relación de equivalencia

Ejemplo importante: congruencias módulo n


Introduciremos la notación de congruencias, que es un ejemplo de relación de
equivalencia que resulta ser de mucha utilidad para tratar problemas de divisibili-
dad. Esta relación es fundamental en el Álgebra y la Teorı́a de Números.

Definición 1.3.9. Sean a, b ∈ Z, n ∈ N. Se dice que a y b son congruentes módulo


n y se escribe a ≡ b (mód n) si y sólo si n | (a − b)

Dejaremos como ejercicio probar que esta relación es una relación de equiva-
lencia en Z.

Ejemplo 1.3.10. 5 ≡ −1 (mód 6), 15 ≡ 0 (mód 3).

Ejercicio 1.3.11.

1. Si c ≡ 1 (mód 4), calcule un valor de t tal que 6c + 5 ≡ t (mód 4).

2. Demuestre que a ≡ b (mód n) ⇒ a2 + b2 ≡ 2ab (mód n2 ).

Teorema 1.3.12. Sean a, b, c, d ∈ Z y n ∈ N. Si a ≡ b (mód n) y c ≡ d (mód n),


entonces

1. a + c ≡ b + d (mód n).

2. ac ≡ bd (mód n).

Demostración. Se tiene que

a ≡ b (mód n) ⇔ n | (a − b) ⇔ ∃k ∈ Z, a − b = nk (∗)

20
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

y
c ≡ d (mód n) ⇔ n | (c − d) ⇔ ∃t ∈ Z, c − d = nt (∗∗)
Para demostrar 1., usando (∗) y (∗∗), se tiene que
(a + c) − (b + d) = (a − b) + (c − d) = nk + nt = n(t + k),
para ciertos t, k ∈ Z. Luego, n | ((a + c) − [b + d]) y ası́ a + c ≡ b + d (mód n).
Para la parte 2., usando (∗) y (∗∗) se tiene que a − b = nk y c − d = nt para
ciertos t, k ∈ Z. Multiplicando la primera ecuación por c y la segunda por b queda
ac − bc = (nk)c y cb − db = (nt)b. Sumando ambas ecuaciones tenemos que
ac − bd = (nk)c + (nt)b = n(kc) + n(tb) = n(kc + tb) con kc + tb ∈ Z.
Luego n | (ac − bd) y ac ≡ bd (mód n).
Una propiedad que hace que sea más fácil ver las clases de equivalencia definidas
por la congruencia módulo n (o incluso que se trata de una verdadera relación de
equivalencia) es la siguiente:
Proposición 1.3.13. Sean a, b ∈ Z, n ∈ N. Entonces, a ≡ b (mód n) sı́ y sólo sı́
a y b tienen el mismo resto al ser divididos por n.
Demostración. Apliquemos el algoritmo de división a a y n y a b y n. Existen
únicos q, q 0 , r, r0 ∈ Z tales que
a = nq + r b = nq 0 + r0 , ()
con 0 ≤ r, r0 ≤ n. Probaremos que a ≡ b (mód n) ⇔ r = r0 .

(⇐) Supongamos que r = r0 . Entonces a − b = nq 0 − nq = n(q 0 − q) ∧ n | (a − b),


pues q 0 − q ∈ Z, es decir, a ≡ b (mód n).

(⇒) Supongamos que a ≡ b (mód n). Usando () tenemos que


a − b = n(q − q 0 ) + r − r0
Si r ≥ r0 , entonces 0 ≤ r − r0 < n es el resto y q − q 0 es el cociente de la división
de a − b por n. Como n | (a − b) se tiene que r − r0 = 0 y entonces r = r0 .
Si r0 ≥ r, tenemos una demostración similar pues b ≡ a (mód n).
Definición 1.3.14. Para cada a ∈ Z, definimos la clase de a módulo n como el
conjunto [a]n = {c ∈ Z |c ≡ a (mód n)} y formamos el conjunto de los enteros
módulo n como Z/nZ := {[a]n |a ∈ Z}.
Otra forma de denotar el conjunto Z/nZ (se lee “Z módulo nZ”) es Zn . Además,
frecuentemente se usará la notación [a] en lugar de [a]n cuando sea claro cuál es el
n.

21
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Directamente de la definición (de congruencia y de clase de equivalencia) se


tiene lo siguiente:

Observación 1.3.15. Sean a ∈ Z y n ∈ N entonces

1. [a]n = {a + nk|k ∈ Z},

2. a ∈ [a]n ,

3. [a]n = [b]n ⇔ a ≡ b (mód n).

Por la Proposición 1.3.13 existen tantas clases módulo n como restos de la


división por n. Por lo tanto, los restos son 0, 1, · · · , n − 1. De esta forma hay
exactamente n clases en Z/nZ y

Z/nZ = {[0]n , [1]n , · · · , [n − 1]n }.

Observación 1.3.16. Notemos que cada clase módulo n es infinita, pero el número
de clases es finito. La unión de todas las clases módulo n es igual a Z.

En el conjunto Z/nZ de las clases de enteros módulo n podemos definir una


suma y un producto. Sean [a]n , [b]n dos elementos cualesquiera de Z/nZ. Definamos
dos operaciones

[a]n + [b]n := [a + b]n = [r]n , donde r es el resto de la división de a + b por n;

[a]n · [b]n := [ab]n = [r0 ]n , donde r es el resto de la división de ab por n.

Ası́, para n = 4, las tablas de suma y producto son:

+ [0] [1] [2] [3] · [0] [1] [2] [3]


[0] [0] [1] [2] [3] [0] [0] [0] [0] [0]
[1] [1] [2] [3] [0] [1] [0] [1] [2] [3]
[2] [2] [3] [0] [1] [2] [0] [2] [0] [2]
[3] [3] [0] [1] [2] [3] [0] [3] [2] [1]

Del Teorema 1.3.12 y de la Observación 1.3.15 obtenemos que estas operaciones


están bien definidas. Es decir:

Teorema 1.3.17. Sean [a]n , [b]n , [a0 ]n , [b0 ]n , elementos de Z/nZ, tales que [a]n =
[a0 ]n , y [b]n , [b0 ]n , entonces

1. [a + b]n = [a0 + b0 ]n ,

2. [ab]n = [a0 b0 ]n .

22
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Es decir, la suma y la multiplicación ası́ definidas corresponden a funciones de


Z/nZ × Z/nZ en Z/nZ.

Observación 1.3.18. Es importante recalcar que una verificación como ésta es


necesaria a la hora de definir ciertas funciones. En efecto, en ciertos conjuntos,
como Z/nZ, puede haber más de un sı́mbolo para referirse al mismo elemento (por
ejemplo [3]4 y [7]4 en Z/4Z). Si la función que estamos definiendo utiliza de alguna
manera el sı́mbolo escogido, debemos asegurarnos entonces que, cuando cambiamos
el sı́mbolo, definimos la misma imagen. Esto ocurrirá siempre que definamos fun-
ciones cuyo dominio sea el conjunto de clases de equivalencia con respecto a alguna
relación de equivalencia. Pero también puede ocurrir en conjuntos bien conocidos,
como Q, donde sabemos que una fracción tiene más de una forma de escribirse.

Ejercicio 1.3.19. Sean a, b, c ∈ Z, n ∈ N. Demuestre que

1. [a]n + [b]n ∈ Z/nZ. La suma es una operación cerrada.

2. [a]n + ([b]n + [c]n ) = ([a]n + [b]n ) + [c]n . La suma es asociativa.

3. [a]n + [b]n = [b]n + [a]n . La suma es conmutativa.

4. [a]n + [0]n = [a]n = [0]n + [a]n . Existe un neutro para la suma y es [0]n .

5. Para cada a ∈ Z, existe el inverso aditivo = [−a]n ∈ Z/nZ que satisface


[a]n + [−a]n = [0]n .

6. [a]n · [b]n ∈ Z/nZ. El producto es una operación cerrada.


   
7. [a]n · [b]n · [c]n = [a]n · [b]n · [c]n . El producto es asociativo.

8. [a]n · [b]n = [b]n · [a]n . El producto es conmutativo.

9. [a]n · [1]n = [a]n = [1]n · [a]n . Existe un elemento neutro para el producto y es
[1]n .
   
10. [a]n · [b]n +[c]n = [a]n ·[b]n +[a]n ·[c]n ∧ [a]n +[b]n ·[c]n = [a]n ·[c]n +[b]n ·[c]n .
Las operaciones suma y producto distribuyen.

Este ejercicio dice que Z/nZ, provisto de las dos operaciones anteriores, es un anillo
conmutativo con unidad.

¿Qué pasa con los inversos multiplicativos ?

23
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Definición 1.3.20. Sea [a]n 6= [0]n ∈ Z/nZ. Se dice que [a]n es invertible en Z/nZ
si y sólo si existe [b]n 6= [0]n ∈ Z/nZ tal que [a]n · [b]n = [1]n . La clase [b]n se llama
el inverso multiplicativo de [a]n .
Observación 1.3.21. Se puede probar que [a]n ∈ Z/nZ r {[0]n } tiene inverso
mutiplicativo sı́ y sólo sı́ (a, n) = 1. En particular, si n = p es un primo, todo
elemento no nulo de Z/pZ es invertible y por ende Z/pZ cumple con la definición
matemática de cuerpo.

1.4. Funciones
Ası́ como las relaciones de equivalencia son un caso especial de relaciones. Las
funciones son también un tipo especial de relaciones.
Definición 1.4.1. Sea R ⊆ A × B una relación. Decimos que R es función si y
sólo si

∀x ∈ A ∃! y ∈ B : x R y.
Reflexionemos unos minutos en la definición anterior. Una función de A en B
es entonces una asignación f que lleva cada punto x ∈ A a un único punto en
B, llamado imagen de x bajo f y denotado f (x). Ası́, f es una correspondencia
x 7→ f (x) para cada x ∈ A. Se escribe f : A → B e y = f (x). También se usa

f : A → B
x 7 → y = f (x)

Note que como f es función, a cada x ∈ A le corresponde un único valor y en


B. Por eso se dice la imagen. Igual que para relaciones, A es el dominio de f y
el conjunto de valores {f (x)|x ∈ A} es el recorrido o imagen de f . También se
define el codominio de f como el conjunto “de llegada” B. Note que el conjunto de
imagenes de f está contenido en B. Es decir, la imagen podrı́a ser un subconjunto
propio del codominio.
Las funciones de variable real; es decir, f : A ⊆ R → R son materia central del
curso de Cálculo. Aquı́ veremos funciones desde el punto de vista del Álgebra.
Definición 1.4.2. Dadas dos funciones f : A → B y g : C → D se dice que f = g
si y sólo si

A = C,

B=Dy

Para todo x ∈ A se tiene que f (x) = g(x).

24
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Funciones y conjuntos
Nos interesará encontrar la imagen y preimagen de conjuntos bajo una función.
Sean f : X → Y una función, A ⊆ X y B ⊆ Y . Se definen:

La imagen de A por f como el conjunto de elementos y de Y para los cuales


existe un elemento en A cuya imagen es y. Se denota por f [A]. En sı́mbolos

f [A] := {y ∈ Y : ∃a ∈ A , y = f (a)} = {f (x) : x ∈ A}.

La preimagen de B por f como el conjunto de elementos en X tales que su


imagen pertenece a B. Se denota por f −1 [B]. En sı́mbolos

f −1 [B] = {x ∈ X : f (x) ∈ B}.

Ejemplo 1.4.3. Para f : R → R dada por f (x) = x2 . Tenemos que su dominio es


R y su recorrido o imagen es R≥0 = {x ∈ R : x ≥ 0}. Para A = {1, 4} se tiene que
f −1 [A] = {1, −1, 2, −2} y f [A] = {1, 16}. Note que

f [f −1 [A]] = f [{1, −1, 2, −2}] = {1, 4} = A,

y que
f −1 [f [A]] = f −1 [{1, 16}] = {1, −1, 4, −4} ⊇ A.

Gráfica de funciones
El plano cartesiano es el conjunto R2 = R × R definido por

R × R := (x, y) | x ∈ R ∧ y ∈ R .

El plano cartesiano se puede describir mediante un sistema coordenado usando


2
R como conjunto de coordenadas. Se fijan dos copias de R de igual escala entre sı́
como dos rectas ortogonales (perpendiculares) llamadas ejes coordenados, de modo
que uno de ellos, el eje X, es horizontal y sus valores crecen a la derecha, mientras
que el otro, el eje Y, es vertical y sus valores crecen hacia arriba. Ambos ejes se
intersectan en el punto que en cada recta corresponde al 0. A ese punto de inter-
sección se le llama el origen del sistema y se le asignan las coordenadas (0, 0). Para
asignar la posición de cualquier otro punto P del plano se construye un rectángulo
que tenga lados adyacentes a los ejes coordenados y que en vértices opuestos tenga
a (0, 0) y a P ; entonces uno de los otros vértices marca en el eje X un número,
x, y el vértice que queda marca en el eje Y un número, y, y le asignamos a P las
coordenadas (x, y). Vea la Figura 1.2.

25
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Figura 1.2: Plano cartesiano

Dada f : A ⊂ R → R, el gráfico de f se define como el conjunto de puntos


Γf = {(x, f (x)) ∈ R2 : x ∈ A},
dibujados en el plano cartesiano. Para un ejemplo, vea la Figura 1.3.

Figura 1.3: Gráfico de f (x) = x2

Por ahora nuestros gráficos serán bosquejos referenciales. En el curso de Cálcu-


lo aprenderán herramientas para graficar mejor. Cuando estudien pueden utilizar
programas online para graficar, aunque siempre piensen si el gráfico tiene senti-
do, reflexionen por qué quedó ası́, etc., para ası́ ir adquiriendo intuición. Algunos
programas online gratuitos son los siguientes (y hacen mucho más que graficar):

26
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

https://www.geogebra.org/

https://www.wolframalpha.com/

Clasificación de funciones
Hay propiedades útiles que tienen las funciones. Aquı́ veremos tres que también
destacarán y utilizarán en Cálculo.

Definición 1.4.4. Sea f : A → B una función, se dice que

f es epiyectiva (o sobreyectiva) si y sólo si f [A] = B. Es decir,

∀ y ∈ B, ∃ x ∈ A : f (x) = y.

f es inyectiva (o 1-1) si y sólo si para todo y ∈ f [A] existe un único x ∈ A


tal que f (x) = y. Equivalentemente,

∀ x1 , x2 ∈ A (f (x1 ) = f (x2 ) ⇒ x1 = x2 ).

f es biyectiva si y sólo si es inyectiva y sobreyectiva. Es decir,

∀ y ∈ B, ∃! x ∈ A : f (x) = y.

Note la diferencia entre B y f [A], reflexione sobre la unicidad que se pide en la


propiedad de inyectividad, etc.

Ejemplo 1.4.5. Sea A = {1, 2, 3} y considere las siguientes funciones definidas en


subconjuntos de A.
f1 f2 f3 f4
A / A A / A {2, 3} /A A / {1, 2}

1 /1 1 / /;
?1 2 1 1 1


2 /2 2 2 3 / 2 2 2
;

3 /3 3 /3 3 3

Se tiene que f1 y f2 son biyecciones de A en A. Mientras que f3 : {2, 3} → A es


inyectiva y f4 : A → {1, 2} es sobreyectiva.

27
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejemplo 1.4.6. La función f : N → N dada por f (n) = 2n es inyectiva pero no


sobreyectiva. Esto pues,
f (n) = f (m) ⇔ 2n = 2m ⇔ n = m,
lo que prueba la inyectividad. Para demostrar que no es epiyectiva basta encontrar
un contraejemplo. Esto es, basta encontrar m ∈ N que no tenga preimagen (o que
su preimagen sea el conjunto vacı́o). El número 3 ∈ N basta, por ejemplo.
Entre conjuntos infinitos podemos construir funciones que desafı́an nuestra in-
tuición.
Ejemplo 1.4.7. Sea f : Z → N ∪ {0} definida como sigue

2n − 1,
 n>0
f (n) = 0, n=0

−2n, n<0

Es decir,
Z: 0 1 −1 2 −2 3 −3 4 −4 ...

        
N: 0 1 2 3 4 5 6 7 8 ...
“Vemos” que f es biyectiva, lo que desafı́a nuestra intuición pues N es un sub-
conjunto propio de Z, por lo que “se siente” más chico. Aquı́ ayuda formalizar
los conceptos. Primero, “vemos” no es suficiente. Debemos demostrar que f es
biyectiva.
f es epiyectiva. Sea m ∈ N, debemos encontrar n ∈ Z tal que f (n) = m.
Veamos por casos:
- Si m = 0, se tiene que n = 0 satisface lo deseado.
- Si m es par, tenemos que existe p ∈ N tal que m = 2p. Entonces, se tiene
que n = −p satisface lo deseado.
- Si m es impar, tenemos que existe p ∈ N tal que m = 2p − 1. Entonces, se
tiene que n = p satisface lo deseado.
f es inyectiva. Supongamos que f (n1 ) = f (n2 ). Por como está definida f ,
se tiene que n1 y n2 son ambos positivos, ambos negativos o ambos 0. Si es
este último caso, entonces n1 = n2 = 0. Si el caso es que ambos son negativos,
tenemos f (n1 ) = −2n1 y f (n2 ) = −2n2 . Entonces,
f (n1 ) = f (n2 ) ⇒ −2n1 = −2n2 ⇒ n1 = n2 .
Falta el caso si ambos son positivos, el cual se deja al lector. Una vez probados
los tres casos, vemos que f es inyectiva.

28
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ahora que está demostrado, sabemos que se trata de una proposición vedadera:
Z está en biyección con N, aunque N ( Z. Este tipo de fenómenos no ocurre entre
conjuntos finitos.

Funciones entre conjuntos finitos


Sean A y B conjuntos finitos de cardinalidades m y n respectivamente. Sea
f : A → B. Si m < n la función NO puede ser sobreyectiva. Esta afirmación, que
parece obvia, se puede demostrar por ejemplo por inducción sobre m, partiendo
del caso en que m = 0 (que es “aún más obvia”). De la misma manera, si m > n,
la función NO puede ser inyectiva. En combinatoria, esto último se conoce como el

Principio del palomar : Se tienen n nidos y m > n palomas, entonces


dos palomas comparten nido.

Proposición 1.4.8. Sean A y B conjuntos finitos de cardinalidades m y n respec-


tivamente. Sea f : A → B una función. Se satisfacen las siguientes proposiciones

(1) Si f biyectiva, entonces m = n.

(2) Si m = n, entonces
f epiyectiva ⇔ f inyectiva.

Demostración. La afirmación (1) sale directamente de las consideraciones anterio-


res.
Para (2), primero suponga que f es epiyectiva, entonces para todo y ∈ B hay
un x ∈ A tal que f (x) = y. Si no fuese inyectiva, quiere decir que hay x1 y x2
en A cuya imagen es y. Como m = n y f es función, quiere decir que hay algún
elemento de B que no tiene preimagen (principio del palomar), lo que contradice
la epiyectividad.
Podemos usar biyecciones para determinar si dos conjuntos finitos tienen la
misma cardinalidad, sin necesidad de saber cuántos elementos tienen. Es una buena
forma de contar.

Ejercicio 1.4.9. Cuente cuántas funciones hay de A = {a, b} a B = {1, 2, 3, 4}.

Generalizando la pregunta anterior: Sea A de cardinalidad m y B de cardinali-


dad n. Denote por F(A, B) el conjunto de todas las funciones de A a B. Para contar
cuántos elementos tiene F(A, B) construimos una biyección a algún conjunto cuya
cardinalidad conozcamos. Para ello anotemos

A = {a1 , a2 , . . . , am },

29
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

y construyamos la siguiente función:

ϕ : F(A, B) → B m ,
f 7→ (f (a1 ), f (a2 ), . . . , f (am )).

Verifique que ϕ es biyectiva, con lo que se puede concluir que |F(A, B)| = nm .
Ejercicio 1.4.10. Para los conjuntos en el Ejercicio 1.4.9, calcule ahora la cantidad
de funciones inyectivas.
Para generalizar esta pregunta, primero debemos tener que |A| ≤ |B|. En ese
caso, la imagen de un primer elemento de A tiene n (que es |B|) opciones diferentes.
Luego el siguiente tendrá n − 1. Ası́, el m-ésimo elemento de A tendrá n − m + 1
opciones. Concluimos que la cantidad de funciones inyectivas de A en B es

n(n − 1)(n − 2) · · · (n − m + 1).

Breve disgresión al infinito


Usando la idea de biyección, se generaliza la noción de igual cardinalidad a
conjuntos infinitos como sigue.
Definición 1.4.11. Sean A, B dos conjuntos no necesariamente finitos. Se dice
que tienen igual cardinalidad si y sólo si existe una biyeccón f : A → B.
La definición anterior se reduce a cantidad de elementos, para el caso de con-
juntos finitos. Para el caso de conjuntos infinitos, el tema es más interesante. Vea
el Ejemplo 1.4.7 y el que sigue.
Ejemplo 1.4.12. Sea f : N → P una función de los naturales a los naturales pares,
dada por n 7→ 2n. Es claro que es una biyección (¡demuéstrelo usted!). Se tiene ası́
que N y P tienen el mismo tipo de cardinalidad infinita. Lo mismo que Z, como
se mostró en el Ejemplo 1.4.7.
Se dice que un conjunto es numerable si es finito o tiene el cardinal de N, el
cual se denota por ℵ0 (“Aleph cero”). Es un teorema, probado por Cantor y que
ahora lleva su nombre, que R no es numerable. La demostración usa un método
ahora llamado método de diagonalización de Cantor.

Función inversa
Dada una función f : A → B, podemos definir la relación inversa R ⊆ B × A,
donde cada elemento de B está relacionado con los elementos de A de su preima-
gen. Note que decimos relación inversa pues no siempre será una función. Nos
interesará por ahora el caso donde es función.

30
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Recordemos que f : A → B es biyectiva si y sólo si


∀ y ∈ B, ∃! x ∈ A : f (x) = y.
Luego podemos invertir la función y seguirá siendo función (cada elemento de B
tendrá asociado un único elemento de A). Esta nueva función se llama la función
inversa de f y se denota
f −1 : B → A
b 7→ f −1 (b)
donde f −1 (b) = x ⇔ f (x) = b.
Ejercicio 1.4.13. Demuestre que f −1 también es biyectiva y que es única. Además,
pruebe que (f −1 )−1 = f .

Composición de funciones
Dadas dos funciones f : A → B y g : B → C, se puede construir una tercera
función h : A → C que resulta de aplicar primero f (y ası́ llegar a elementos
en B) y luego, desde allı́, usar g para llegar a C. Esa tercera función h se llama
la composición de f con g. Se anota h = g ◦ f , o bien h(x) = g(f (x)), y se
lee g compuesto con f . Note que la composición funciona aplicando de derecha a
izquierda. Ası́ (g ◦ f )(x) corresponde a:
f g
x 7→ f (x) 7→ g(f (x)).
La composición h es efectivamente una función. Recordemos que h es función si
cumple que, si h(x) = a y h(x) = b, entonces a = b. Veamos, como h = g◦f tenemos
g(f (x)) = a y g(f (x)) = b. Como f (x) es un elemento únicamente definido (ya que
f es una función), podemos escribir y = f (x). Ası́ tenemos g(y) = a y g(y) = b.
Como g es función, se tiene a = b.
Note que, en general, para poder definir la composición g ◦ f de una función g
con otra función f , se necesita verificar que la imagen de f , i.e. f [A], esté contenida
en el dominio de g.
Observación 1.4.14. A veces se deben modificar el dominio o recorrido de las
funciones para poder realizar la composición. Por ejemplo, tome f : R → R definida
como f (x) = x − 1 y g : R r {0} → R definida por g(x) = 1/x.
Si queremos hacer h = f ◦ g, entonces tomamos x ∈ R r {0} y aplicamos g.
Obtenemos y = 1/x, a ello le aplicamos f y obtenemos

1 1−x
h(x) =−1= ,
x x
que es una función de dominio R r {0} a R.

31
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Si queremos hacer h = g ◦ f , entonces tomamos x ∈ R , que es el dominio


de f , aplicamos f y obtenemos y = x − 1. Sin embargo, después debemos
aplicar g que no puede aplicarse a 0. Entonces debemos excluir la preimagen
por f de 0; es decir, 1. Corregimos entonces, primero tomamos x ∈ R r {1}
y aplicamos f . Obtenemos y = x − 1. Luego aplicamos g y obtenemos

1
h(x) = ,
x−1
que es una función de dominio R r {1} a R.

Se deja como ejercicio determinar el conjunto de imágenes en ambos casos.

Una función simple, pero importante, es la llamada función identidad

idA : A → A
a 7→ a.

Al componer f con la identidad, obtenemos la misma función f .

Ejercicio 1.4.15. Demuestre que la composición es asociativa. Es decir que si


f : A → B, g : B → C y h : C → D son funciones, entonces h ◦ (g ◦ f ) = (h ◦ g) ◦ f .
Además, demuestre que si f y g son inyectivas, entonces g ◦ f también. Lo mismo
para epiyectiva.

32
Capı́tulo 2

Aritmética y combinatoria

2.1. Números Naturales y Principio de Induc-


ción.

En el conjunto N = {1, 2, 3 · · · } de números naturales tenemos los siguiente


hechos:

1. Hay una suma + que es conmutativa, es decir, ∀ m, n ∈ N, m + n = n + m


y asociativa, es decir, ∀ m, n, p ∈ N, (m + n) + p = m + (n + p).

2. Hay una multiplicación · que es conmutativa , es decir, ∀ m, n ∈ N, m · n =


n · m y asociativa, es decir, ∀ m, n, p ∈ N, (m · n) · p = m · (n · p).
Suponga conocidos los siguientes hechos “ evidentes”:

Si n ∈ N entonces no existe p ∈ N tal que n + p = n


n+p=m+p⇒n=m
Si n 6= 1 entonces existe m ∈ N tal que m + 1 = n, m + 1 se llama
el sucesor de m.
n + 1 6= 1 para todo n ∈ N.

3. Existe la siguiente relación de orden:

n≤m ⇔ n=m ó existe p∈N tal que n + p = m.

En el siguiente ejercicio se pide probar que efectivamente la relación ≤ definida


anteriormente es de orden.
Ejercicio 2.1.1. Demuestre que para todo n, m, p ∈ N:

33
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

i) n ≤ n.

ii) n ≤ m ∧ m ≤ n ⇒ n = m.

iii) n ≤ m ∧ m ≤ p ⇒ n ≤ p.

Además este orden es total, es decir, ∀ m, n ∈ N, n ≤ m ∨ m ≤ n.


Anotamos ∀ m, n ∈ N, n < m ⇔ existe p ∈ N tal que n + p = m.
Observación 2.1.2. 0 ∈
/ N.

Propiedad importante: Principio del Buen orden Todo subconjunto no


vacı́o A de números naturales tiene un elemento mı́nimo, es decir, un elemento que
es menor o igual a todo elemento en A. En sı́mbolos

∀ A ⊆ N, A 6= ∅ ∃ m ∈ A, m ≤ x ∀ x ∈ A.

Ejemplo 2.1.3. 1. {2, 4, 6, · · · , } el conjunto de números pares, que son aque-


llos naturales de la forma 2k, con k ∈ N tiene a 2 como mı́nimo.

2. {1, 3, 5, · · · , } el conjunto de números impares, que son aquellos naturales de


la forma 2k + 1, o 2k − 1 con k ∈ N tiene a 1 como mı́nimo.
Ejercicio 2.1.4. Reflexione por qué el Principio del Buen Orden no se satisface
en el conjunto de racionales positivos

Q+ = {q ∈ Q : q > 0}.
Ni tampoco en Q+ ∪ {0}, a pesar que este último si tiene un elemento mı́nimo.
¿Se satisface en N ∪ {0}?
Observación 2.1.5. Se usará tı́picamente ası́: Dado X ⊆ N que sabemos que es
NO vacı́o, decimos sea r el elemento mı́nimo de X.
Usaremos el Principio del Buen orden para probar el siguiente resultado:
Teorema 2.1.6. Principio de Inducción: Sea S ⊆ N, 1 ∈ S y si n ∈ S entonces
n + 1 también está en S. Entonces S = N.
Demostración. Consideremos el conjunto S c = {x ∈ N | x ∈ / S} ⊆ N. Se llama el
complemento de S en N. Probaremos que S c = ∅.
Supongamos que S c 6= ∅. Entonces por el Principio del Buen orden, S c tiene
un elemento mı́nimo t ∈ S c . Como 1 ∈ S tenemos que t 6= 1, ası́ t > 1 y t − 1 ∈ N.
Como t es el mı́nimo de S c tenemos que t − 1 ∈ / S c y ası́ t − 1 ∈ S. Por las
propiedades de S, si t − 1 ∈ S entonces t ∈ S. Esto contradice el hecho de que
t ∈ S c . Por lo tanto, S c = ∅ y S = N.

34
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

¿ Cómo usar el Principio de Inducción?


Suponga que se tiene una afirmación que se quiere probar que es satisfecha por
todo número natural n. Denotémosla por p(n). Consideremos el conjunto

S = {n ∈ N | p(n) es verdadera}

Verifiquemos que

1) 1 ∈ S,

2) Supongamos que para n ∈ N, n ∈ S y demostremos que n + 1 ∈ S.

Entonces concluimos que S = N y ası́ p(n) se verifica ∀ n ∈ N.

Observación 2.1.7. Otra forma de escribir el Principio de Inducción:


Sea p(n) una afirmación que involucra números naturales para n ∈ N. Si

i) p(1) se satisface

ii) Siempre que para n ∈ N se satisface p(n) también lo hace p(n + 1)

Entonces p(n) se satisface ∀ n ∈ N.


Para la parte ii) se coloca:
Hipótesis de inducción: Supongamos que para n ∈ N, p(n) es verdadera.
Tesis: Por demostrar que p(n + 1) es verdadera.
Luego viene la demostración de la Tesis.

Observación 2.1.8. Una buena metáfora para entender el Principio de Inducción.

(2) (1)
Ejemplo 2.1.9.
 Pruebe por inducción la siguiente afirmación:

1 1 1 n
∀ n∈N + + ··· + = .
1·2 2·3 n · (n + 1) n+1
Solución:

35
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

1 1 1 n
Sea p(n) : + + ··· + =
1·2 2·3 n · (n + 1) n+1
n = 1, veamos que p(1) es verdadera.
1 1 1 1
Se tiene, = y = . Luego p(1) es verdadera.
1·2 2 1+1 2
Hipótesis de inducción: Supongamos que para n ∈ N, p(n) es verdadera, es
decir,
1 1 1 n
+ + ··· + =
1·2 2·3 n · (n + 1) n+1
Tesis: Por demostrar que p(n + 1) es verdadera, es decir, por demostrar que
1 1 1 n+1
+ + ··· + =
1·2 2·3 (n + 1) · (n + 2) n+2
Demostración:
1 1 1
+ + ··· +
1·2 2·3 (n + 1) · (n + 2)
1 1 1 1
= + + ··· + +
1·2 2·3 n · (n + 1) (n + 1) · (n + 2)
n 1
= + (∗)
n + 1 (n + 1) · (n + 2)
(*) es por hipótesis de inducción

n(n + 2) + 1 (n + 1)2 n+1


= = =
(n + 1) · (n + 2) (n + 1) · (n + 2) n+2
1 1 1 n+1
Luego + +···+ = y p(n + 1) es verdadera. Por lo
1·2 2·3 (n + 1) · (n + 2) n + 2 
1 1 1 n
tanto, por principio de Inducción, ∀n ∈ N + +· · ·+ = .
1·2 2·3 n · (n + 1) n+1
Ejemplo 2.1.10. En el conjunto de los números naturales, demuestre que el Prin-
cipio de Inducción implica el Principio del Buen Orden. Es decir, asuma verdadero
el principio de inducción y demuestre que:
Para todo A ⊆ N, A 6= ∅ existe m ∈ A tal que m ≤ x para todo x ∈ A.

Demostración. Supongamos que A no tiene elemento mı́nimo. Consideremos el


subconjunto S de N tal que 1, 2, · · · , k ∈
/ A. Tenemos que 1 ∈ S, de otra manera
1 ∈ A, y ası́ 1 es el elemento mı́nimo de A. Contradicción.
Hipótesis de inducción: Supongamos que para n ∈ N, n ∈ S.
Tesis: Por demostrar que n + 1 ∈ S.

36
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración: Si n + 1 ∈
/ S entonces n + 1 es el elemento mı́nimo de A. Con-
tradicción.
Luego S = N y ası́ A = ∅. Contradicción.

Observación 2.1.11. El ejemplo anterior junto con el Teorema 2.1.6 nos dicen
que los Principios de Inducción y de Buen Orden en los números naturales son
equivalentes.

Ejercicio 2.1.12.
 Pruebe por inducción la siguiente afirmación:

1 1 1 n
∀ n∈N + + ··· + = .
1·5 5·9 (4n − 3)(4n + 1) 4n + 1
Ejemplo 2.1.13. Sea a ∈ R, a ≥ −1. Pruebe que para todo n ∈ N, (1 + a)n ≥
1 + na. Desigualdad de Bernoulli.

Solución:
Sea p(n) : (1 + a)n ≥ 1 + na
n = 1, veamos que p(1) es verdadera.
Se tiene que (1 + a)1 = 1 + a y 1 + 1a = 1 + a. Luego p(1) es verdadera.
Hipótesis de inducción: Supongamos que para n ∈ N, p(n) es verdadera, es
decir, (1 + a)n ≥ 1 + na
Tesis: Por demostrar que p(n + 1) es verdadera, es decir, por demostrar que
(1 + a)n+1 ≥ 1 + (n + 1)a
Demostración:

(1 + a)n+1 = (1 + a)n (1 + a) ≥ (1 + na)(1 + a) =

1 + an + a + a2 n = 1 + a(n + 1) + a2 n ≥ 1 + a(n + 1)
pues a2 n ≥ 0. Luego (1 + a)n+1 ≥ 1 + (n + 1)a y p(n + 1) es verdadera. Por lo
tanto, por principio de Inducción, ∀n ∈ N (1 + a)n ≥ 1 + na.

Ejercicio 2.1.14. Pruebe que para todo n ∈ N, 4n − 1 es múltiplo de 3.

Observación 2.1.15. Hay fórmulas que son válidas a partir de n1 ∈ N, n1 6= 1. En


este caso se usa el Principio de inducción, considerando p(n1 ) verdadera en lugar
de p(1) verdadera. El siguiente ejercicio es válido a partir de 4.

Ejercicio 2.1.16. Demuestre que para todo n ∈ N, n ≥ 4, se tiene que 2n <


1 · 2 · 3 · · · n.

37
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejemplo 2.1.17. Demuestre que para todo n ∈ N, n ≥ 3, se tiene que 2n + 1 <


2n .

Solución:
Sea n ≥ 3, y sea p(n) : 2n + 1 < 2n .
n = 3, veamos que p(3) es verdadera.
Tenemos que 2 · 3 + 1 = 7, 23 = 8 y 7 < 8 luego p(3) es verdadera.
Hipótesis de inducción: Supongamos que para n ∈ N, p(n) es verdadera, es
decir, 2n + 1 < 2n .
Tesis: Por demostrar que p(n + 1) es verdadera, es decir, por demostrar que
2n + 3 < 2n+1 .
Demostración: 2n + 3 = 2n + 1 + 2 < 2n + 1 + 2n pues como n ≥ 3, 2 < 2n .
Además por Hipótesis de Inducción 2n + 1 < 2n . De donde reemplazando se
tiene 2n + 3 < 2n + 2n = 2 · 2n = 2n+1 , y 2n + 3 < 2n+1 . Luego p(n + 1) es
verdadera. Por lo tanto, por principio de Inducción, ∀n ∈ N n ≥ 3, se tiene que
2n + 1 < 2n .

Ejemplo 2.1.18. 52(n+1) − 24n − 25 es divisible por 576.

Solución:
Sea p(n) : 52(n+1) − 24n − 25 es divisible por 576.
Para p(1) tenemos 54 − 24 − 25 = 625 − 24 − 25 = 576 es divisible por 576.
Hipótesis de inducción: Supongamos que para n ∈ N, p(n) es verdadera, es
decir,
Supongamos que 52(n+1) − 24n − 25 es divisible por 576.
Tesis: Por demostrar que p(n + 1) es verdadera, es decir, por demostrar que
2(n+2)
5 − 24(n + 1) − 25 es divisible por 576.
Demostración:

52(n+2) − 24(n + 1) − 25 = 25 · 52(n+1) − 24n − 24 − 25


= 25(52(n+1) − 24n − 25) + 25(24n + 25) − 24n − 25 − 24
= 25(52(n+1) − 24n − 25) + 24(24n + 25) − 24
= 25(52(n+1) − 24n − 25) + 24(24n + 24)
= 25(52(n+1) − 24n − 25) + 576(n + 1)

Por hipótesis de inducción 52(n+1) −24n−25 es divisible por 576. Además 576(n+1)
es divisible por 576. En consecuencia la suma es divisible por 576. Luego p(n + 1)
es verdadera.
Por lo tanto, por principio de Inducción, ∀n ∈ N, 52(n+1) − 24n − 25 es divisible
por 576. .

38
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejemplo 2.1.19. 24 divide a n(n2 − 1) cuando n es impar.


Solución: Si n es impar, podemos escribir n = 2m−1 con m un entero positivo.
Sea p(m) : 24 divide a (2m − 1)((2m − 1)2 − 1)
Cuando m = 1 tenemos que 24 divide a 0. Luego p(1) es verdadera.
Hipótesis de inducción: Supongamos que para m ∈ N, p(m) es verdadera, es
decir, supongamos que 24 divide a (2m − 1)((2m − 1)2 − 1).
Tesis: Por demostrar que p(m + 1) es verdadera, es decir, por demostrar que 24
divide a (2m + 1)((2m + 1)2 − 1).
Demostración:

(2m + 1)((2m + 1)2 − 1) = (2m − 1)(4m2 + 4m + 1 − 1) + 2(4m2 + 4m)


= (2m − 1)(4m2 − 4m + 1 − 1) + 8m(2m − 1) + 8m2 + 8m)
= (2m − 1)((2m − 1)2 − 1) + 8m(2m − 1 + m + 1)
= (2m − 1)((2m − 1)2 − 1) + 24m2

Por hipótesis de inducción 24 divide a (2m − 1)((2m − 1)2 − 1) y claramente 24


divide a 24m2 por lo que 24 divide a la suma. Luego p(n + 1) es verdadera.
Por lo tanto, por principio de Inducción, ∀m ∈ N, 24 divide a (2m − 1)((2m −
1) − 1), es decir, ∀n ∈ N, 24 divide a n(n2 − 1) cuando n es impar.
2

Definición 2.1.20. Una definición por recurrencia o recursiva, se obtiene al dar


un elemento base y luego dar una fórmula para definir los siguente números.
Ejemplo 2.1.21. Factoriales. Para cada n ∈ N ∪ {0}, se define n! y se lee n
factorial a: (
0! = 1
n! = (n − 1)!n ∀ n ∈ N, n ≥ 1
Observación 2.1.22. Con esta notación el ejercicio 2.1.16 queda para todo n ∈
N, n ≥ 4, se tiene que 2n < n!.
Ejemplo 2.1.23. Potencias de un número real positivo. Sea a ∈ R, a > 0.
Para cada n ∈ N ∪ {0}, se define

0
a = 1

a1 = a

 n+1
a = an a ∀ n ∈ N, n ≥ 1

Observación 2.1.24. ¿ Cómo se procede si hay una afirmación que depende de


más de un número natural ?
Ejercicio 2.1.25. Sean a, b reales positivos. Demuestre que

39
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

1. ∀ m, n ∈ N, an+m = an am .

2. ∀ m ∈ N, (ba)m = bm am .

3. ∀ m, n ∈ N, (an )m = anm .

Solución: Para la parte 1. se usa inducción sobre m. Sea p(m) : ∀ n ∈


N, an+m = an am .
m = 1, veamos que p(1) es verdadera.
Se tiene, ∀ n ∈ N, an+1 = an a. Por otro lado an am = an a. Luego p(1) es
verdadera.
Hipótesis de inducción: Supongamos que para m ∈ N, p(m) es verdadera, es
decir,
∀ n ∈ N, an+m = an am
Tesis: Por demostrar que p(m + 1) es verdadera, es decir, por demostrar que
∀ n ∈ N, an+(m+1) = an am+1
Demostración: ∀ n ∈ N, an+(m+1) = a(n+m)+1 = an+m a por definición de
potencia.
= (an am )a = an (am a) por asociatividad del producto en R.
= an am+1 por definición de potencia.
Por lo tanto, ∀ n ∈ N, an+(m+1) = an am+1 y ası́ p(m + 1) es verdadera.
Por lo tanto, por principio de Inducción, ∀m ∈ N ∀ n ∈ N, an+m = an am .
Para la parte 2. se usa inducción sobre m. (Hacerlo).
3. Para esta parte usaremos indución sobre n. Sea p(n) : ∀ m ∈ N, (an )m =
anm .
n = 1, veamos que p(1) es verdadera.
Se tiene, ∀ m ∈ N, (a1 )m = am ∧ a1m = am . Luego p(1) es verdadera.
Hipótesis de inducción: Supongamos que para n ∈ N, p(n) es verdadera, es
decir,
∀ m ∈ N, (an )m = anm
Tesis: Por demostrar que p(n + 1) es verdadera, es decir, por demostrar que
∀ m ∈ N, (an+1 )m = a(n+1)m
Demostración: ∀ m ∈ N, (an+1 )m = (an a)m = (an )m (am ) = anm am por
parte 2. y por Hipótesis de inducción. Luego usando la parte 1. se tiene ∀ m ∈
N, (an+1 )m = anm am = anm+m = a(n+1)m , y p(n + 1) es verdadera. Por lo tanto,
por principio de Inducción, ∀n ∈ N ∀ m ∈ N, (am )n = amn .

Observación 2.1.26. En la demostración del ejercicio anterior, se puede hacer


indución sobre m o sobre n.

40
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejercicio 2.1.27. Considere la siguiente colección de números reales



A1 = 2
An+1 = (An + 4) ∀ n ∈ N
2
Demuestre que ∀n ∈ N, An ≤ 4 y que ∀n ∈ N, An < An+1 .

2.2. Progresiones geométricas y aritméticas


Definición 2.2.1. Una sucesión de números reales es una función f : N → R tal
que f (i) = ai , ∀ i ∈ N. Anotaremos esta función f como {an | n ∈ N} o también
{a1 , a2 , · · · , an , · · · } o (an )n∈N o {an }n∈N . Los números reales a1 , a2 , · · · , an , · · · se
llaman términos de la sucesión.
Definición 2.2.2. Sea a ∈ R−{0}, r ∈ R−{0}. Se define la progresión Geométrica
de primer término a y razón r como la sucesión {an | n ∈ N} tal que
(
a1 = a
an+1 = an · r ∀ n ∈ N, n ≥ 1

Observación 2.2.3. Considere una progresión Geométrica de primer término a y


razón r. Entonces
a, ar, ar2 , · · · , · · · son los términos de dicha progresión

El cociente de dos términos consecutivos es r.

El término general n-ésimo está dado por an = a · rn−1 , ∀ n ∈ N.


Ejercicio 2.2.4. ¿ Cómo sumar los n primeros términos a + ar + · · · + arn−1 de
una Progresión Geométrica ? Pruebe que si r 6= 1 se cumple
a − arn
 
n−1
∀ n ∈ N a + ar + · · · + ar =
1−r
Definición 2.2.5. Sean a y b dos números reales positivos. Se dice que m ∈ R, m 6=
0 es la media geométrica de a y b si a, m, b están en progresión geométrica.
Ejercicio
√ 2.2.6. Si m ∈ R, m 6= 0 es la media geométrica de a y b, pruebe que
m = ab.
Ejemplo 2.2.7. Dados a y b dos números reales positivos. Interpolar entre ellos
n números tales que formen una progresión geométrica

41
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Solución: Sean a1 = a, a2 , · · · , an+2 = b los números. Entonces b = an+2 =


q k−1
!
q
arn+1 . Luego r = n+1 ab y ak = a n+1 ab ∀ k = 1, · · · , n + 2.

Definición 2.2.8. Sea a ∈ R, d ∈ R. Se define la progresión Aritmética de primer


término a y diferencia d como la sucesión {an | n ∈ N} tal que
(
a1 = a
an+1 = an + d ∀ n ∈ N, n ≥ 1

Observación 2.2.9. Considere una progresión Aritmética de primer término a y


diferencia d. Entonces

a, a + d, a + 2d, · · · , · · · son los términos de dicha progresión.

La diferencia de dos términos consecutivos es d.

El término general es an = a + (n − 1)d, ∀ n ∈ N.

Ejercicio 2.2.10. ¿ Cómo sumar los n primeros términos a + (a + d) + · · · + a +


(n − 1)d de una Progresión Aritmética ? Pruebe que
!
n
∀ n ∈ N a + (a + d) + · · · + (a + (n − 1)d) = (2a + (n − 1)d)
2

Definición 2.2.11. Sean a, b ∈ R. Se dice que m ∈ R es la media aritmética de a


y b si a, m, b están en progresión Aritmética.
a+b
Ejercicio 2.2.12. Si m ∈ R es la media aritmética de a y b, pruebe que m = 2
.

Ejemplo 2.2.13. Dados a y b dos números reales. Interpolar entre ellos n números
tales que formen una progresión Aritmética.

Solución: Sean a1 = a, a2 , · · · , an+2 = b los números.


! Entonces b = an+2 =
b−a b−a
a + (n + 1)d. Luego d = n+1
y ak = a + (k − 1) n+1
∀ k = 1, · · · , n + 2.

2.3. Principio de Inducción Completa


Observación 2.3.1. Principio de Inducción Completa: Sea p(n) una afirmación
que involucra números naturales para n ∈ N. Si

i) p(n1 ) se satisface para n1 ∈ N.

42
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

ii) Sea n ∈ N. Siempre que para ∀ t, t ∈ N, n1 ≤ t ≤ n se satisface p(t) también


lo hace p(t + 1)
Entonces p(n) se satisface ∀ n ∈ N, n ≥ n1 .
Ejemplo 2.3.2. Considere la siguiente sucesión de números reales:

A1 = 5

A2 = 11

An+1 = 7An − 12An−1 ∀ n ∈ N, n ≥ 2

Demuestre que para todo n ∈ N, An = 3n+1 − 4n .


Solución: Usaremos el principio de inducción completo.
Sea p(n) : An = 3n+1 − 4n .
n = 1, veamos que p(1) es verdadera. Tenemos que 31+1 − 41 = 9 − 4 = 5 = A1 .
Luego p(1) es verdadera.
Como se requieren los valores de An y de An−1 para calcular el valor de An+1 ,
verificamos también p(2) (de lo contrario, no podremos asegurar que se cumpla
desde n = 3 en adelante)
Para ver que p(2) es verdadera, calculamos: 32+1 − 42 = 27 − 16 = 11 y como
A2 = 11, se cumple p(2)
Hipótesis de inducción: Supongamos que para n ∈ N, p(n − 1) y p(n) son ver-
daderas 1 , es decir,
An−1 = 3n − 4n−1 , An = 3n+1 − 4n .
Tesis: Por demostrar que p(n + 1) es verdadera, es decir, An+1 = 3n+2 − 4n+1 .
Demostración: An+1 = 7An − 12An−1 = 7(3n+1 − 4n ) − 12(3n − 4n−1 ) = 7 · 3n+1 −
7 · 4n − 4 · 3n+1 + 34n = 3n+1 (7 − 4) − 4 · 4n = 3n+2 − 4n+1 . Luego, An+1 = 3n+2− 4n+1
y p(n + 1) es verdadera. Por principio de Inducción completo, ∀n ∈ N An =

3n+1 − 4n .

Ejercicio 2.3.3. Sucesión de Fibonacci (descubierta por Leonardo de Pisa, 1170-


1240): {Fn }n∈N∪{0} donde

F0 = 0

F1 = 1

Fn+1 = Fn + Fn−1 ∀ n ∈ N, n ≥ 1

Algunos términos son: 0, 1, 1, 2, 3, 5, 8, · · · ,


1
En rigor, suponemos que se cumplen p(1), p(2), . . . , p(k − 1), p(k), pero en este caso basta con
p(n − 1) y p(n)

43
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Pruebe que
" √ !n √ !n #
1 1+ 5 1− 5
∀ n ∈ N ∪ {0}, Fn = √ −
5 2 2

Ejercicio 2.3.4. Sucesión de Lucas (descubierta por Anatole Lucas, 1842-1891):


{Ln }n∈N∪{0} donde

L 0 = 2

L1 = 1

Ln+1 = Ln + Ln−1 ∀ n ∈ N, n ≥ 1

algunos términos son: 2, 1, 3, 4, 7, 11, 18, 29, 47 · · · ,


Pruebe que:
1.
∀ n ∈ N ∪ {0}, L0 + L1 + · · · + Ln = Ln+2 − 1.

2.
Ln + Ln+2
∀ n ∈ N, Fn+1 = .
5
Ejemplo 2.3.5. Encuentre una forma general para la sucesión de números reales
{(an ) | n ∈ N ∪ {0}} definida a continuación y luego demuéstrela.

a0 = 0

a1 = 1

an = 5an−1 − 6an−2 ∀ n ∈ N, n ≥ 2

Solución: Veremos un procedimiento que sirve solamente para este tipo de


sucesiones. Sea an = rn , con r a determinar. Como an = 5an−1 − 6an−2 , se tiene
1
rn = 5rn−1 − 6rn−2 . Multiplicando la ecuación anterior por rn−2 queda la ecuación
de segundo grado r2 − 5r + 6 = 0, que tiene dos raı́ces reales r = 2 y r = 3.
Tenemos ası́ an = 2n o an = 3n . La solución general será an = x2n + y3n con x, y a
determinar. Usando que a0 = 0 y a1 = 1 tenemos 0 = x20 + y30 , de donde x = −y
y 1 = x2 + y3. Luego, usando que x = −y tenemos y = 1, luego x = −1. Por lo
tanto, an = 3n − 2n . Probaremos que an = 3n − 2n , ∀ n ∈ N ∪ {0}
Usemos principio de inducción completo. Para n = 0 tenemos por definición
a0 = 0, y por la fórmula queda a0 = 30 − 20 = 1 − 1 = 0. Para n = 1 tenemos
a1 = 1 por definición y por la fórmula a1 = 31 − 21 = 1. Luego la fórmula vale para
n = 0 y para n = 1.
Hipótesis de Inducción: Sea n ∈ N tal que an−1 = 3n−1 − 2n−1 y an = 3n − 2n .
Tesis. Por demostrar que an+1 = 3n+1 − 2n+1 .

44
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración: Por definición tenemos que an+1 = 5an − 6an−1 = 5(3n − 2n ) −


6(3 − 2n−1 ) = 5 · 3n − 5 · 2n−1 − 6 · 3n−1 + 6 · 2n−1 = 3n−1 (15 − 6) + 2n−1 (−10 + 6) =
n−1

3n−1 32 + 2n−1 (−22 ) = 3n+1 − 2n+1 .


Por lo tanto la fórmula vale para n+1. Luego por principio inducción completo,
se tiene que an = 3n − 2n , ∀ n ∈ N ∪ {0}.

2.4. Observación sobre el Principio de Inducción


Completa
Discutimos aquı́ un error común a la hora de utilizar el Principio de Inducción
Completa. En el libro Calculus de Michael Spivak, y en muchos libros, éste se
enuncia como se ve en la figura 2.1.

Figura 2.1: Principio de inducción completa en Spivak

Cuidado con cómo se lee (y usa). Como se muestra en el ejemplo:


Ejemplo Considere la sucesión definida como

u1 = 1

u2 = 3

un+1 = 4un − 4un−1 ∀n ∈ N

Demuestre que un = n2n−1 ∀n ∈ N

Solución.

1. Caso base: Según la fórmula propuesta u1 = 1 · 21−1 = 1. Luego se satisface.

2. Paso inductivo: La hipótesis de inducción es que la fórmula se satisface para


t ∈ N tal que 1 ≤ t ≤ n. Debemos demostrar la tesis inductiva, es decir que
un+1 = (n + 1)2n .

45
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

3. Demostración del paso inductivo:


Por definición un+1 = 4un + 4un−1 . Por la H.I. tenemos

un = n2n−1 y un−1 = (n − 1)2n−2 .


Reemplazamos en la definición de un+1 y tenemos

un+1 = 4n2n−1 −4(n−1)2n−2 = 2n2n −(n−1)2n = 2n (2n−n+1) = 2n (n+1).

4. Conclusión: Por el principio de inducción completa, la fórmula general para


esta sucesión queda demostrada.
¿Detecta algún error?

46
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Calculemos algunos elementos de la sucesión: {1, 3, 11, 32, . . . }. Calculemos


algunos con la fórmula: {1, 4, 12, . . . }. ¿Donde está el error?
El error es no haber verificado la fórmula para n = 2. Dado que la definición
usa el valor en n y en n−1, se usará el principio de inducción completa, luego
se debe verificar que se cumple la afirmación para todos los que usará para
su hipótesis inductiva. Es decir, el paso inductivo es demostrar P (n + 1) si
se supone P (1), P (2), ...., P (n), como la definición es particular para n = 1 y
n = 2, se deben probar esos casos. En efecto 3 6= 2 · 22−1 , por eso falla. Si la
colección hubiera sido

u1 = 1

u2 = 4

un+1 = 4un − 4un−1 ∀n ∈ N

habrı́a estado correcto.

2.5. Cuatro ejercicios de Números Naturales.


Lo escrito a continuación está referido a las clases del 20 y 22 de Mayo de 2020.
Lo mismo al apuntes y guı́a entregados. Estos ejercicios fueron discutidos en tales
clases y las notas (a mano) se encuentran en u-cursos.

El Principio del Buen Orden no se satisface en Q≥0


Primero se discutió qué quiere decir tal afirmación. No es que Q≥0 no tenga
mı́nimo, pues de hecho lo tiene, lo que se afirma es que en Q≥0 NO se satisface que
todo subconjunto no vacı́o de él tenga mı́nimo.
Luego hay que construir un conjunto A ⊆ Q≥0 que no tenga mı́nimo. Después
de discutir brevemente se llega al siguiente conjunto
1
A={: n ∈ N}.
n
Tenemos que A ⊂ Q, luego debemos demotrar que A no tiene mı́nimo. Proce-
deremos por contradicción:
Sea m ∈ A un elemento mı́nimo. Entonces existe n0 ∈ N tal que
1
m= .
n0
1
Tome n0 + 1, es un natural, luego n0 +1
∈ A. Como

47
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

1 1
< ,
n0 + 1 n0
se llega a una contradicción con el hecho que m era el mı́nimo de A.
Aquı́ aprovechamos para unirlo con cálculo pues para afirmar que (*) n01+1 < n10 ,
se debe usar el orden en Q, que es el orden en R visto en cálculo. A saber,
En R se tiene el conjunto P de los elementos positivos, se dice a < b si y sólo si
b − a ∈ P . Entonces se demuestra que para a, b reales positivos
1 1
a<b⇒ < .
b a
Esto pues,
1 1 b−a
− = .
a b ab
Como a y b son positivos, se tiene que ab es positivo, y de la hipótesis a < b se
tiene b − a positivo.
Esto es justo lo que necesitábamos para (*).
Concluimos ası́ que A no tiene elemento mı́nimo, demostrando que el principio
del Buen Orden no se satisface en Q≥0 .

Demuestre que todo subconjunto no vacı́o de N, acotado superiormente


tiene un elemento máximo
Primero se recuerdan las definiciones: Sea A un subconjunto de N no vacı́o.

1. N ∈ N se dice cota superior de A si y sólo si x ≤ N para todo x ∈ A.

2. M ∈ A se dice máximo de A si y sólo si x ≤ M para todo x ∈ A.

Luego se reflexiona sobre las diferencias entre ambos conceptos: N no es ele-


mento de A necesariamente. De hecho N no es único, pueden haber muchas cotas
superiores. M es único, pues suponga que hay dos M1 y M2 máximos, entonces
x ≤ M1 para todo x ∈ A y x ≤ M2 para todo x ∈ A. Como M1 y M2 son elementos
de A se tiene

M1 ≤ M2 y M2 ≤ M1 .
Ya habı́amos demostrado que eso implica que M1 = M2 .
Ahora que ya entendemos los conceptos involucrados procedemos a la demos-
tración pedida.
Sea N una cota superior de A, tome T = N + 1. Como x ≤ N para todo x ∈ A,
se tiene que x < T para todo x ∈ A (esto también se demostró usando lo elemental

48
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

en N). Entonces T − x > 0 para todo x ∈ A. Luego el siguiente conjunto está


contenido en N:

B = {T − x : x ∈ A}.
Veamos hechos sobre tal conjunto B.

1. B ⊆ N, ya dicho.

2. B 6= ∅ pues A 6= ∅ y los elementos de B son T − x con x ∈ A.

3. B tiene elemento mı́nimo m, pues el Principio del Buen Orden se satisface


en los naturales.

Tal elemento mı́nimo de B debe ser de la forma m = T − x0 , con x0 algún


elemento de A. Buscamos probar que ese x0 es el máximo de A.
Se tiene m ≤ b para todo b ∈ B. Luego T − x0 < T − x para todo x ∈ A.
Reordenando se tiene x ≤ x0 para todo x ∈ A.

Ejercicio: Sea C ⊆ N, C no vacı́o. Demuestre que si N es cota superior


de C, entonces C ⊆ {1, 2, . . . , N }.
Copiamos las definiciones:

1. N cota superior de C quiere decir que x ≤ N para todo x ∈ C.

2. C ⊆ {1, 2, . . . , N } quiere decir que para todo c ∈ C se tiene que c ∈


{1, 2, . . . , N }.

Hay que demostrar 2. usando 1.


Para demostrar 2. Tomamos un c ∈ C y debemos demostrar que c ∈ {1, 2, . . . , N }.
Como c ∈ C , y para C se tiene la afirmación 1., sabemos que c ≤ N . Además sabe-
mos que C es subconjunto de los naturales, entonces 1 ≤ c. Conclusión: 1 ≤ c ≤ N
para todo c ∈ C como se deseaba probar.

El Principio del Buen Orden implica el Principio de Inducción


Primero entender qué se está afirmando: Debemos usar el Principio del Buen
Orden para demostrar el Principio de Inducción. Escriba AMBOS principios. Ahora
vamos a la demostración:
Sea A ⊆ N un subconjunto que cumple

1∈Ay

n∈A⇒n+1∈A

49
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Queremos demostrar, usando el Principio del Buen Orden, que A = N.


Sea B ⊆ N el conjunto de los elementos que no están en A. Debemos demostrar
que B = ∅. Para ello supongamos que B no es vacı́o y busquemos una contradic-
ción.
Por el principio del buen orden, B tiene un elemento minimal m. Como m 6= 1
(pues 1 ∈ A) y m − 1 < m, tenemos m − 1 6∈ B (porque m era el mı́nimo de B) y
por lo tanto m − 1 ∈ A. Pero por hipótesis m − 1 ∈ A ⇒ m ∈ A, lo que contradice
la suposición de que m ∈ B. Concluimos que B = ∅ y por lo tanto A = N.

50
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

2.6. Sumatorias
La suma de los cubos de los n primeros números naturales se escribe
1 + 2 3 + · · · + n3
Observe que el término general de esta suma es de la forma i3 y se obtiene cada
sumando dando a i los valores 1, 2, 3, · · · , n. Existe un sı́mbolo que permite escribir
sumas Pen forma abreviada, llamado sı́mbolo de sumatoria que consiste en la letra
griega Usando este sı́mbolo la suma anterior se escribe
n
X
i3
i=1

se lee suma de i3 desde 1 hasta n


PnEs claro
3
Pque en lugar
n 3
Pn de 3la letra i se puede usar otra letra cualesquiera.
k=1 k = i=1 i = j=1 j . Las letras i, j, k que se usan para tal efecto se
llaman ı́ndices.
Más en general, cuando se desea formar la suma de los números reales a1 , a2 , · · · , an :
a1 + a2 + · · · + an usando el sı́mbolo de sumatoria se escribe
n
X
ai
i=1

A veces es conveniente empezar la suma por el 0, por ejemplo


n
X
2 n
1 + 2 + 2 + ··· + 2 = 2i
i=0

Otras formas de usar la sumatoria:


6
X
2i−1 = 1 + 2 + · · · + 25
i=1

Observación 2.6.1. Usando el sı́mbolo de sumatoria las partes (a), (b) y (c) del
Ejercicio 3 de la guı́a 3., quedan
n
X n(n + 1)
i= .
i=1
2
n
X n(n + 1)(2n + 1)
i2 = .
i=1
6
n
X n(n + 1) 2
i3 = ( ).
i=1
2

51
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Propiedades 2.6.2. Sean ai , bj números reales entonces:


1
X
1. ai = a1 ,
i=1

n
X n
X
2. 1 = n, 1 = n + 1,
i=1 i=0

n
X t
X n
X
3. Sea 1 ≤ t < n, entonces ai = ai + ai .
i=1 i=1 i=t+1
n
X n
X n−1
X
En particular, ai = a1 + ai = ai + an ,
i=1 i=2 i=1

n
X n
X n
X
4. (ai + bi ) = ai + bi ,
i=1 i=1 i=1

n
X n
X
5. (cai ) = c ai , ∀ c ∈ R,
i=1 i=1

n−1
X a − arn
6. Si r 6= 1 entonces ari = , (suma geométrica)
i=0
1−r
n
X n
7. (a + (i − 1)d) = (2a + (n − 1)d), (suma aritmética)
i=1
2

n n+p
X X
+
8. Para todo p ∈ Z ai = ai−p , (desplazamiento de ı́ndices)
i=1 i=1+p

Propiedades 2.6.3. Propiedad telescópica: Sean ai , i = 1, · · · , n números


n
X
reales entonces: (ai − ai−1 ) = an − a0 .
i=1

Ejercicio 2.6.4. Use propiedades para demostrar


n
X
(2i − 1) = n2 . Sugerencia 2i − 1 = i2 − (i − 1)2 .
i=1

¿ Hay alguna otra forma de demostrar la fórmula anterior ?

52
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Pn n(n+1)(n+2)
Ejercicio 2.6.5. Demuestre que ∀ n ∈ N, k=1 k(k + 1) = 3
.

Ejercicio 2.6.6. ¿ Cuánto vale kn=1 n?


P

Ejercicio 2.6.7. Estudie las siguientes sumatorias:


Pn n(n+1)
1. k=1 k = 2
,
Pn n(n+1)(n+2)
2. k=1 k(k + 1) = 3
Pn n(n+1)(n+2)(n+3)
3. k=1 k(k + 1)(k + 2) = 4
Pn
Conjeture que ∀ n, m ∈ N, k=1 k(k + 1) · · · (k + m) = n(n+1)(n+2)···(n+m)(n+m+1)
m+2
.
Ayuda: Demuestre laPconjetura usando inducción sobre n y considerando
p(n) : ∀ m ∈ N, nk=1 k(k + 1) · · · (k + m) = n(n+1)(n+2)···(n+m)(n+m+1)
m+2
.

Ejercicio 2.6.8. Pruebe que para todo n ∈ N,


n
X 1 n
=
j=1
(2j − 1)(2j + 1) 2n + 1

1 −1 1
Ayuda: use que (2j−1)(2j+1)
= 2(2j+1)
+ 2(2j−1)
.

Ejercicio 2.6.9. Sobre sumas dobles. Considere la siguiente Suma (que depende
de n)
n X
X n
S(n) = (k + j).
j=1 k=j

1. Escriba la expresión extendida correspondiente a S(3); es decir, todos los


sumandos.

2. Calcule la suma anterior, es decir S(3).

3. Calcule S(n).

Solución

1. Aquı́ se pide escribir S(3) = 3j=1 3k=j (k + j) de forma extendida. Para ello
P P
expandimos primero la suma de la izquierda (variando el ı́ndice j):

3
X 3
X 3
X
(k+1)+ (k+2)+ (k+3) = [(1+1)+(2+1)+(3+1)]+[(2+2)+(3+2)]+[3+3].
k=1 k=2 k=3

53
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

2. Aquı́ puedo sumar pues tengo la suma extendida del item anterior:

[(1 + 1) + (2 + 1) + (3 + 1)] + [(2 + 2) + (3 + 2)] + [3 + 3] = 24.

3. Resuelvo primero la suma interior (de ı́ndice k) y luego la exterior (de ı́ndice
j). Uso sumas conocidas: la de los primeros n naturales y la suma de sus
cuadrados.
n   
X n(n + 1) j(j − 1)
= − + j(n − j + 1)
j=1
2 2
n
X −3j 2 + 2jn + n2 + 3j + n
=
j=1
2
 
1 n(n + 1)(2n + 1) n(n + 1) 2
= −3 + (2n + 3) + (n + n)n
2 6 2
n3 + 2n2 + n
=
2

2.7. Factoriales y Binomio de Newton


Recordemos que para cada n ∈ N ∪ {0}, se define n factorial como n! =
(
0! = 1
n! = (n − 1)!n ∀ n ∈ N, n ≥ 1

Ejercicio 2.7.1. Demuestre por inducción:

(2n)!
a)∀n ∈ N = 2n [1 · 3 · 5 · · · (2n − 1)].
n!
n
j · 2j 2n+1
X 
b)∀n ∈ N =1−
j=1
(j + 2)! (n + 2)!

Ejemplo 2.7.2. Demuestre por inducción:


n
X 
2
∀n ∈ N (j + 1) · j! = n(n + 1)! .
j=1

Solución. Sea p(n) : nj=1 (j 2 + 1) · j! = n(n + 1)!


P

n = 1, veamos que p(1) es verdadera. Tenemos que 1j=1 (j 2 +1)·j! = (1+1)·1! =


P
2. Por otro lado, 1(1 + 1) = 2.

54
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Luego p(1) es verdadera.


Hipótesis de inducción: Supongamos que para n ∈ N, p(n) es verdadera, es
decir,
Pn 2
j=1 (j + 1) · j! = n(n + 1)!
Tesis: Por demostrar que p(n + 1) es verdadera, es decir, por demostrar que
Pn+1 2
j=1 (j + 1) · j! = (n + 1)(n + 2)!

Demostración: n+1
P 2
Pn 2 2
j=1 (j + 1) · j! = j=1 (j + 1) · j! + ((n + 1) + 1)) · (n + 1)! =
2
n(n + 1)! + ((n + 1) + 1)) · (n + 1)! por Hipótesis de Inducción
2
= (n+1)![n+(n+1)P +1] = (n+1)![(n+1)(n+1+1)] = (n+1)!(n+2)(n+1) =
(n + 2)!(n + 1). Luego, n+1 2
j=1 (j + 1) · j! = (n + 1)(n + 2)! y p(n + 1) es verdadera.
Ası́ usando el principio de Inducción hemos probado que
X n 
2
∀n ∈ N (j + 1) · j! = n(n + 1)! .
j=1

Ahora exploremos, sean a, b ∈ R. Entonces


(a + b)1 = a + b.
(a + b)2 = a2 + 2ab + b2 .
(a + b)3 = a3 + 3a2 b + 3ab2 + b3 .
(a + b)4 = (a + b)3 (a + b) = a4 + 4a3 b + 6a2 b2 + 4ab3 + b4
Queremos encontrar un expresión para (a + b)n para cualquier n ∈ N.
De lo anterior podemos inferir que

(a + b)n = an + C1n an−1 b + C2n an−2 b2 + · · · + Cn−1


n
abn−1 + bn ,

con los coeficientes Ckn a determinar.

2.7.1. El arte de contar.


Respondamos a las siguientes preguntas.

1. ¿ De cuántas maneras se pueden ordenar 3 libros diferentes en un estante?

L1 L2 L3 , L1 L3 L2 , . . .

2. ¿ De cuántas maneras puede elegirse un comité de 2 personas dado un grupo


de 7 personas?
P1 P2 , P1 , P3 , P1 P4 , . . . , P1 P7 , o sea conteniendo a la persona P1 hay 6 comités
diferentes. Ahora, sin contener a P1 tenemos P2 P3 , P2 P4 , . . . , P2 P7 , o sea 5
comités diferentes. Seguimos la cuenta: Sin contener a P1 ni a P2 hay 4, sin

55
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

P1 , P2 ni P3 hay 3, luego 2 y finalmente P6 P7 que es una sola opción. Tenemos


entonces

6 + 5 + 4 + 3 + 2 + 1 = 21
comités diferentes formados de la manera dicha.
¿Cómo serı́a la cuenta si decimos que en el comité habrá un presidente y un
secretario? Note que en ese caso un conjunto formado por las mismas dos
personas da origen a dos comités diferentes.

Ahora generalizaremos las cuentas anteriores, hasta cierto punto.

1. Permutaciones de n−objetos. Se tienen {a1 , a2 , . . . , an } objetos diferentes,


cuántas n−tuplas ordenadas se pueden formar. Es equivalente a tener n ca-
sillas que llenar con esos n objetos. La primera casilla se puede llenar con
n objetos. Una vez elegida esta, para la casilla siguiente quedan n − 1 y ası́
sucesivamente hasta que a la casilla n−ésima sólo le queda un objeto posible.
Ası́ la respuesta es n!.

2. r−permutaciones de n−objetos. La pregunta es si se tienen {a1 , a2 , . . . , an }


objetos diferentes, cuántas r−tuplas ordenadas se pueden formar (sin repe-
tir). Ojo que r ≤ n para que la pregunta tenga sentido. Es equivalente a
tener ahora r casillas que llenar con esos n objetos. La cuenta es análoga a la
anterior: Tenemos n objetos para la primera casilla, n − 1 para la segunda, y
ası́. Sólo que ahora las casillas se terminan antes que los objetos. Luego para
la última casilla (de las r que tengo) hay n-r+1 posibles objetos. Se concluye
entonces que se pueden formar

n!
n · (n − 1) · . . . (n − r + 1) = .
(n − r)!
Obs.: A esto también le llaman Variaciones y lo anotan Vrn .

3. r−combinaciones de n−objetos. Aquı́ la pregunta es leve pero profundamen-


te, diferente. Si se tienen {a1 , a2 , . . . , an } objetos diferentes, cuantos conjun-
tos de r elementos se pueden formar. La diferencia crucial con lo anterior es
que

ANTES: abc 6= bac


AQUÍ: abc = bac

56
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Para resolver, se tiene que combinar las dos cuentas anteriores. Si importara
el orden la cantidad serı́a

n!
,
(n − r)!
pero como son conjuntos lo que nos interesa contar ahora, de las r−tuplas
contadas antes, cada permutación de sus elementos corresponde al mismo
conjunto. Entonces tenemos que r! de ellas cuentan sólo como un conjunto.
Finalmente concluimos que la respuesta es

n!
.
(n − r)!r!
Obs.: A esto también le llaman la combinatoria de n sobre r y lo anotan Crn .
Aunque lo más usado es
 
n
.
r

Nos interesamos en este último objeto en lo que sigue.

Definición 2.7.3. Sean n ∈ N, k ∈ N ∪ {0}, 0 ≤ k ≤ n. Se define


 
n n n!
Ck = =
k k!(n − k)!

Obs.: Si k > n, entonces Ckn se puede definir como 0.

Ejercicio 2.7.4. Sabiendo que


   
14 14
1. = , calcule, si es posible, k.
k k−1
 
2n
3
2.   = 44 3
, calcule n.
n
2
   
n n
Ejercicio 2.7.5. Demuestre que n > 11 =⇒ >
6 5

57
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

2.7.2. Triángulo de Pascal


 
n
Podemos construir la tabla de todos los valores de los coeficientes del
k
Binomio de Newton para 0 ≤ k ≤ n conocida como Triángulo de Pascal.

k 0 1 2 3 4 5
n
0 1
1 1 1
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
Por ejemplo:
     
4 3 3
= + = 3 + 3 = 6.
2 1 2
     
5 4 4
= + = 6 + 4 = 10.
3 2 3

Mirando el triángulo de Pascal se tienen las siguientes propiedades (demuéstre-


las como ejercicio calculándolas y también comparando lo que cuentan).
Proposición 2.7.6. Propiedades de los coeficientes binomiales. Sea 0 ≤
k ≤ n, entonces
   
n n
1. = 1, = 1.
0 n
   
n n
2. = .
k n−k
     
n+1 n n
3. = + .
k k−1 k
 
n n(n − 1) · · · (n − k + 1)
Ejemplo 2.7.7. Sea 0 < k < n, entonces = . Observe
k k!
que tanto en el numerador como en el denominador hay k factores.

Solución. Tenemos que


 
n n! n(n − 1)(n − 2) · · · (n − k + 1)(n − k)(n − k − 1) · · · 3 · 2 · 1
= = =
k k!(n − k)! k!(n − k)!

58
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

n(n − 1)(n − 2) · · · (n − k + 1)(n − k)! n(n − 1)(n − 2) · · · (n − k + 1)


=
k!(n − k)! k!
 
n n(n − 1) · · · (n − k + 1)
Luego, = .
k k!
 Por 
ejemplo
 usando Propiedades 2.7.6 2. y el ejemplo anterior tenemos que
8 8
= = 8·7
1·2
= 4 · 7 = 28.
6 2
Observación 2.7.8. Al observar el triángulo de Pascal podemos notar lo siguiente:

1. Al sumar por filas se tiene para n = 0, la suma es 1, para n = 1, la suma es


2, para n = 2, la suma es 4, para n = 3, la suma es 8, para n = 4, la suma
es 16, de esta manera tenemos
Pn n
 Pn n n−k k

k=0 k = k=0 k 1 1 = (1 + 1)n = 2n .

2. Al sumar las columnas se obtiene:


n   n   n
X k X k X n(n + 1)
i) = n + 1, ii) = k=
k=0
0 k=1
1 k=1
2
n   n
X k X k(k − 1) n(n2 − 1)
iii) = =
k=2
2 k=2
2 6
n    
X k n+1
Ejemplo 2.7.9. Pruebe que ∀ n ∈ N n ≥ j, = .
k=j
j j+1

Solución: Usaremosninducción sobre n.


X k  n + 1
p(n) : Para n ≥ j, = .
k=j
j j+1
j    
X k j
= 1 y j+1

p(j) : = j+1
= 1. Luego p(j) es verdadera.
k=j
j j
n    
X k n+1
Hipótesis de inducción: Para n ∈ N, n ≥ j, = .
k=j
j j+1
n+1    
X k n+2
Tesis: = .
k=j
j j+1
n+1   n    
X k X k n+1
Demostración: = + propiedad de sumatoria
j j j
n+1
 n+1
k=j k=j
= j+1 + j hipótesis de inducción

59
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

n+1    
(n+1)+1
 n+2
 X k n+2
= j+1
propiedades 2.7.6 3. = j+1
. Luego = y p(n+1)
k=j
j j + 1
es verdadera.
Luego por Principio de inducción ∀ n ∈ N n ≥ j, p(n) es verdadera, es decir,
n    
X k n+1
∀ n ∈ N n ≥ j, = .
k=j
j j + 1

Observación 2.7.10. Usando el ejemplo anterior y Propiedades 2.7.6 tenemos


5        
X k 5+1 6 6 6·5
que = = = = = 15. Verifique con el triángulo
k=3
3 3 + 1 4 2 1 · 2
de Pascal.

Ejemplo 2.7.11. Sea t ∈ N. Pruebe por inducción que


n    
X t+k−1 n+t
∀ n ∈ N, = .
k=1
t t+1

Solución: Usaremos inducción sobre n y la siguiente propiedad de los coefi-


cientes binomiales nt + t+1 n
= n+1
 
.
n   t+1 
X t+k−1 n+t
Sea p(n) : = .
k=1
t t+1
1   
X t+k−1 t
= 1 y 1+t

i) p(1) : = t+1
= 1.
k=1
t t
Luego, p(1) es verdadera.
Hipótesis de inducción: Sea n ∈ N, tal que p(n) verdadera, es decir,
n    
X t+k−1 n+t
= .
k=1
t t+1
Tesis: p(n + 1) verdadera, es decir,
n+1    
X t+k−1 n+1+t
= .
k=1
t t + 1
n+1  
X t+k−1
Demostración:
k=1
t
n    
X t+k−1 t+n+1−1
= +
k=1
t t
= n+1+t + n+t
 
t+1  t+1
por hipótesis de inducción
n+t+1
= t+1 , por propiedad de coeficientes binomiales

60
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

n+1    
X t+k−1 n+t+1
Luego, = y p(n + 1) es verdadera.
k=1
t t + 1
Por lo tanto, por principio de inducción, p(n) es verdadera para todo ∈ N, o
bien,
n    
X t+k−1 n+t
∀ n ∈ N, = .
k=1
t t+1

Ejercicio 2.7.12. Pruebe las siguientes afirmaciones:


     X n  
n n n n
1. ∀ n ∈ N, 2 = + ··· + =
0 n k=0
k
n
X   
k n
2. ∀ n ∈ N, (−1) =0
k=0
k
   
n n−k n
3. ∀ n ∈ N, = , 0≤k<n
k+1 k+1 k
n  
X 1 n
Ejemplo 2.7.13. Calcule .
k=0
k+1 k

1 n 1 n! 1 n!(n+1) 1 (n+1)!

Solución: Por definición k+1 k
= k+1 k!(n−k)!
= n+1 k!(k+1)(n−k)!
= n+1 (k+1)!(n−k)!
=
1 n+1

n+1 k+1
.
1 n 1 n+1
 
Por lo tanto, k+1 k
= n+1 k+1
. Reemplazando tenemos
n   n   n+1  
X 1 n 1 X n+1 1 X n+1
= = por desplazamiento de ı́ndices
k=0
k + 1 k n + 1 k=0
k + 1 n + 1 k=1
k
Xn+1    
1 n+1 n+1
= n+1 − se suma y resta un término
k=0
k 0
 
1 n+1
= n+1 2 − 1 por ejercicio anterior parte 1.

2.7.3. Teorema del Binomio


Usando las propiedades de la sumatoria y de los coeficientes binomiales, pro-
baremos por inducción el Binomio de Newton.

Teorema 2.7.14. Sean a, b ∈ R, n ∈ N. Entonces


n  
n
X n n−k k
(a + b) = a b
k=0
k

61
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Obs.: Note que estamos decretando que 00 = 1.


 
n
Pn n n−k k
Demostración. Sea p(n) : (a + b) = k=0 a b
    k 

P1 1 1−k k 1 1 0
Para n = 1, k=0 a b = ab0 + a b = a + b,
k 0 1
luego la fórmula p(n) vale para n = 1.
Hipótesis de inducción: Sea n ∈ N tal que p(n) es verdadera, es decir,
n  
n
X n n−k k
(a + b) = a b
k=0
k

Tesis: Por demostrar que p(n + 1) es verdadera, decir, por demostrar que
n+1  
n+1
X n + 1 n+1−k k
(a + b) = a b
k=0
k

Demostración:
n  
!
X n n−k k
(a + b)n+1 = (a + b)n (a + b) = a b (a + b) usando la hipótesis
k=0
k
n   n  
X n n+1−k k X n n−k k+1
= a b + a b al distribuir
k=0
k k=0
k
n   n−1  
n+1
X n n+1−k k
X n n−k k+1
=a + a b + a b + bn+1
k=1
k k=0
k
al separar el 1er término de la primera sumatoria y el último de la segunda
n   n  
n+1
X n n+1−k k X n
=a + a b + an−(k−1) bk + bn+1
k=1
k k=1
k−1

al hacer cambio de ı́ndices en la segunda sumatoria


n    
n+1
X n n
=a + + an+1−k bk + bn+1 al juntar ambas sumatorias
k=1
k k−1
n  
n+1
X n+1
=a + an+1−k bk + bn+1 al usar Propiedades 2.7.6 3.
k=1
k
n+1  
X n + 1 n+1−k k
= a b incluyendo los dos términos de los extremos
k=0
k

62
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

  de inducción p(n) vale para todo n ∈ N,


Luego p(n + 1) es verdadera. Por Principio
n n−k k
es decir, ∀ n ∈ N, (a + b)n = nk=0
P
a b .
k
Observación 2.7.15. Note que en el desarrollo de (a + b)n hay n + 1 términos.

Corolario: Sean a, b ∈ R, entonces


n  
n
X n
(a − b) = (−1)k an−k bk
k=0
k

Ejercicio2.7.16. Encuentre,
12 si existe, el término independiente de x en el desa-
rrollo de 2x2 − x−1 .

Ejemplo2.7.17. Sea a ∈ R. Encuentre el coeficiente de x20 en el desarrollo de


 16
2 5a
x − x2 .

 16 16  
X 16 5a
Solución: Tenemos que x2 − 5a
x2
= (x2 )16−k (−1)k ( 2 )k
k=1
k x
16   16  
X 16 X 16
= (−1)k x32−2k (5a)k x−2k = (−1)k (5a)k x32−4k .
k=1
k k=1
k
Primero, queremos encontrar el valor de k de manera que 32 −4k = 20. Lue-
16
20 2 5a
go k = 3. Por lo tanto, el coeficiente de x en el desarrollo de x − x2 es
16
(−1)3 (5a)3 = − 16·15·14

3 1·2·3
125 a3 = −16 · 35 · 125 a3 .
24
Ejercicio 2.7.18. Sea a ∈ R. Encuentre el coeficiente 16de x y el término inde-
pendiente de x, si existe, en el desarrollo de x2 − x5a2 .

Ejemplo 2.7.19. Encuentre el coeficiente de x6 en el desarrollo de


 40
7
(2x + 3) x −
x
 40 40  
X 40 40−k 7
7
Solución: (2x + 3) x − x = (2x + 3) x (−1)k ( )k
k=0
k x
40
X 40  40
X 40  
= (2x + 3) (−1)k 7k x40−k x−k = (2x + 3) (−1)k 7k x40−2k
k=0
k k=0
k

63
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

40   40  
X 40 k k 41−2k
X 40
=2 (−1) 7 x +3 (−1)k 7k x40−2k .
k=0
k k=0
k
Estamos buscando el coeficiente de x6 . De la primera sumatoria necesitamos
que 41 − 2k = 6, luego k = 35 2

/ N. De la segunda sumatoria necesitamos que
40 − 2k = 6, luego k = 17. Por lo tanto, solo tenemos el coeficiente en la segunda
sumatoria.
Por lo tanto, el coeficiente de x6 es
40 40

3 17 (−1)17 517 = −3 17 717
 40·39·38···(40−17+1)
Pero 4017
= 1·2·3···17
= 40·39·38···(24)
1·2·3···17
.
Finalmente, el coeficiente de x6 es
−3 · 40·39·38···24
1·2·3···17
· 717 .
Ejercicio 2.7.20. Encuentre el coeficiente del término central en el desarrollo de
(3 + 7x)18 .
Ejercicio 2.7.21. Encuentre, si existen, dos términos consecutivos de igual coefi-
ciente en el desarrollo de (7x + 3)21 .
Ejercicio 2.7.22. Encuentre, si existe, el coeficiente de xt en el desarrollo de
(x2 + x13 )n . Analice su respuesta.
Ejemplo 2.7.23. Sean x, y ∈ R. Pruebe por inducción que
n
X
n n
∀ n ∈ N, x − y = (x − y) xn−k y k−1 .
k=1

Solución: n
X
n n
Sea p(n) : x − y = (x − y) xn−k y k−1 .
k=1
1
X
i) p(1) : x1 − y 1 = x − y(x − y) xn−k y k−1 = (x − y)x1−1 y 1−1 = (x − y).
k=1
Luego, p(1) es verdadera.
Hipótesis de inducción: Sea n ∈ N, tal que p(n) verdadera, es decir,
Xn
n n
x − y = (x − y) xn−k y k−1 .
k=1
Tesis: p(n + 1) verdadera, es decir,
n+1
X
x n+1
−y n+1
= (x − y) xn+1−k y k−1 .
k=1

Demostración: xn+1 − y n+1


= xn x − y n y = xn x − xn y + xn y − y n y = xn (x − y) + (xn − y n )y

64
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

n
X
n
= x (x − y) + [(x − y) xn−k y k−1 ]y. por hipótesis de inducción
k=1
n
X n
X
n−k k n
n
= x (x − y) + (x − y) x y = (x − y)[x + xn−k y k ]
k=1 k=1
n
X
= (x − y) xn−k y k , pues xn es el término para k = 0 de la sumatoria
k=0
n+1
X
= (x−y) xn−(k−1) y k−1 , por propiedad de desplazamiento de ı́ndice en la sumatoria
k=1
n+1
X
= (x − y) xn−k+1 y k−1
k=1
n+1
X
Luego, x n+1
−y n+1
= (x − y) xn+1−k y k−1 y p(n + 1) es verdadera.
k=1
Por lo tanto, por principio de inducción, p(n) es verdadera para todo ∈ N, o
bien,
Xn
n n
∀ n ∈ N, x − y = (x − y) xn−k y k−1 .
k=1

Observación 2.7.24. Sean x, y ∈ R. Entonces


n
X
n n
∀ n ∈ N, x − y = (x − y) xn−k y k−1 = (x − y)[xn−1 + xn−2 y + · · · xy n−2 + y n−1 ]
k=1

65
Capı́tulo 3

Polinomios

3.1. Polinomios con coeficientes reales


Consideremos el cuerpo R de los números reales. 1

Definición 3.1.1. Una expresión de la forma ni=0 ai xi con ai ∈ R y n entero


P
no negativo, se llama un polinomio con coeficientes en R, en la indeterminada x.

Observación 3.1.2. Se tiene:

1. Para cada a ∈ R, ax = xa.

2. ∀ n, t ∈ N, xn xt = xn+t .

3. x0 se entiende como 1. Es decir; a0 x0 = a0 .



Ejemplo 3.1.3. Las expresiones 3 + 6x3 − πx5 , (−3)x3 + 2x20 son polinomios
con coeficientes reales en la indeterminada x.

Observación 3.1.4. Se tiene:


1
1. Las expresiones x3 + 5x−1 , −5x4 + 8x2 − 5x + 2x 2 no son polinomios pues
−1, 21 ∈
/ N ∪ {0}.

2. Dos polinomios
Pn son iguales
Pt si sus coeficientes son iguales, es decir, si n ≤ t,
i i
entonces i=0 ai x = i=0 bi x ⇔ aj = bj ∀ j ≤ n y bj = 0 ∀ j > n.

3. Existe el polinomio uno 1 = 1 + 0x + 0x2 + · · · y el polinomio cero 0 =


0 + 0x + 0x2 + · · ·
1
Lo que veremos será muy similar si en lugar de R tomamos otros cuerpos como por ejemplo
Z/pZ, con p primo. Es un buen ejercicio pensar qué cambia, o falla, si los coeficientes se toman
en Z o en Z/nZ con n no primo.

66
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Denotaremos R[x] al conjunto formado por los polinomios con coeficientes reales
en la indeterminada x. Utilizaremos los sı́mbolos p(x), q(x), r(x), z(x), f (x), g(x), · · · ,
para denotar los elementos de R[x].
Cuando un polinomio p(x) ∈ R[x] tenga todos sus coeficientes en algún subcon-
junto de R como Q o Z, escribiremos p(x) ∈ Q[x] o p(x) ∈ Z[x] según corresponda.

En R[x] definamos una suma y un producto.


Sean p(x) = ni=0 ai xi , q(x) = ti=0 bi xi dos elementos cualesquiera de R[x] y
P P
definamos dos operaciones
n
X t
X n
X
i i
p(x) + q(x) = ai x + bi x = (ai + bi )xi + bn+1 xn+1 + · · · + bt xt , si n ≤ t y
i=0 i=0 i=0

Xn Xt n+t
X
i i n+t
p(x)q(x) = ( ai x )( bi x ) = a0 b0 + (a0 b1 + a1 b0 )x + · · · + an bt x = ci x i ,
i=0 i=0 i=0
Pk
donde ck = i=0 ai bk−i .

Ejercicio 3.1.5. Sean p(x), q(x), z(x) ∈ R[x]. Entonces2

1. p(x) + q(x) ∈ R[x]. La suma es una operación cerrada.

2. p(x) + (q(x) + z(x)) = (p(x) + q(x)) + z(x). Asociatividad de la suma.

3. p(x) + q(x) = q(x) + p(x). Conmutatividad de la suma.

4. p(x) + 0 = p(x) = 0 + p(x). Existe neutro para la suma y es el polinomio 0.

5. Para cadaPpolinomio p(x) = ni=0 ai xi ∈ R[x], existe el polinomio opuesto


P
−p(x) = ni=0 (−ai )xi ∈ R[x] tal que p(x) + (−p(x)) = 0.

6. p(x)q(x) ∈ R[x]. El producto es una operación cerrada.


   
7. p(x) · q(x) · z(x) = p(x) · q(x) · z(x). Asociatividad del producto.

8. p(x) · q(x) = q(x) · p(x). Conmutatividad del producto.

9. p(x) · 1 = p(x) = 1 · p(x). Existe elemento uno para el producto y es el


polinomio 1.
2
Este ejercicio dice que R[x], provisto de las dos operaciones anteriores es un anillo conmutativo
con unidad el polinomio 1 = 1 + 0x + 0x2 + · · ·

67
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

   
10. p(x) · q(x) + z(x) = p(x) · q(x) + p(x) · z(x) ∧ p(x) + q(x) · z(x) =
p(x) · q(x) + q(x) · z(x). Leyes distributivas.

¿ Qué pasa con los inversos multiplicativos ? Previamente definiremos la noción


de grado de un polinomio.

Definición 3.1.6. Sea p(x) = ni=0 ai xi ∈ R[x] con an 6= 0. Entonces an se llama


P
coeficiente supremo de p(x) o coeficiente lı́der y se llama grado de p(x) al número
n. En otras palabras, grado de p(x) = n ⇔ n es el mayor entero no negativo tal
que an 6= 0. Un polinomio de coeficiente supremo 1 se dice mónico.

Notación: gr(p(x)) o bien deg(p(x)).

Observación 3.1.7. Se tiene:

1. Al polinomio cero no se le asocia el grado.

2. Polinomios de grado 0 : las constantes en R r {0}.

3. Polinomios lineales o de grado 1 : p(x) = a + bx ∈ R[x], b 6= 0.

4. Polinomios cuadráticos o de grado 2 : p(x) = a + bx + cx2 ∈ R[x], c 6= 0.

5. Polinomios cúbicos o de grado 3 : p(x) = a + bx + cx2 + dx3 ∈ R[x], d 6= 0.

Usando las definiciones de grado de un polinomio, de la suma y multiplicación


de polinomios se prueba el siguiente Teorema.

Teorema 3.1.8. Sean p(x), q(x) ∈ R[x], de grados n y t respectivamente. Entonces

1. Si p(x) + q(x) 6= 0 entonces gr(p(x) + q(x)) ≤ max{gr(p(x)), gr(q(x))}

2. gr(p(x)q(x)) = gr(p(x)) + gr(q(x)).

Observación 3.1.9. Usando lo anterior podemos probar que

(R[x])∗ = {p(x) ∈ R[x] | p(x) es invertible en R[x]} = {a ∈ R | a 6= 0}.

3.2. Algoritmo de división para polinomios.


Teorema 3.2.1. Sean p(x), h(x) ∈ R[x], con p(x) 6= 0. Entonces existen únicos
polinomios q(x), r(x) ∈ R[x] tales que h(x) = p(x)q(x) + r(x) con r(x) = 0 ∨
gr(r(x)) < gr(p(x)). El polinomio r(x) se llama resto y q(x) el cuociente de la
división de h(x) por p(x).

68
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración. Si h(x) = 0, o gr(h(x)) < gr(p(x)) tomando q(x) = 0 y r(x) =


h(x) se tiene el algoritmo.
Sea h(x) 6= 0 y gr(h(x) ≥ gr(p(x). La demostración la haremos por inducción
completa sobre el grado de h(x).
Si gr(h(x)) = 0, entonces gr(p(x)) = 0. Sea h(x) = a, p(x) = b, a 6= 0, b 6= 0.
Como R es cuerpo entonces existe b−1 ∈ R y se tiene a = b(b−1 a) + 0.
Hipótesis de inducción: Supongamos que el algoritmo de división es válido para
polinomios de grado < n.
Tesis: Sea h(x) polinomio de grado n y veamos que para él y para p(x) vale el
algoritmo.
Sea h(x) = ni=0 ai xi con an 6= 0 y p(x) = ti=0 bi xi , con bt 6= 0 y t ≤ n.
P P
Note que
h(x) − an b−1
t x
n−t
p(x)
es un polinomio de grado menor que n y por hipótesis de inducción, existen únicos
q1 (x), r1 (x) ∈ R[x] tales que

h(x) − an bt−1 xn−t p(x) = p(x)q1 (x) + r1 (x), r1 (x) = 0 ∨ gr(r1 (x)) < gr(p(x)).

Sea q2 (x) = an bt−1 xn−t +q1 (x), r2 (x) = r1 (x) y se tiene que h(x) = p(x)q2 (x)+r2 (x)
con r2 (x) = 0 o bien gr(r2 (x)) < gr(p(x)), es decir, el algoritmo de división vale
para h(x).
Luego por principio de inducción completa el algoritmo de división vale para
polinomios de grado n, n ∈ N ∪ {0}.
Veamos ahora que los polinomios encontrados antes son únicos. Sean

h(x) = p(x)q(x) + r(x), r(x) = 0 ∨ gr(r(x)) < gr(p(x)),

h(x) = p(x)q1 (x) + r1 (x), r1 (x) = 0 ∨ gr(r1 (x)) < gr(p(x)).


Supongamos que q1 (x) 6= q(x). Entonces:
p(x)[q1 (x) − q(x)] = r(x) − r1 (x) con gr((r(x) − r1 (x)) < gr(p(x)).
Tenemos entonces que gr(p(x)[q1 (x) − q(x)]) = gr((r(x) − r1 (x)) < gr(p(x)).
Por otro lado gr(p(x)[q1 (x) − q(x)]) = gr(p(x) + gr(q1 (x) − q(x)) ≥ gr(p(x)).
Contradicción. Luego q1 (x) = q(x) y ası́ r(x) = r1 (x).

Ejercicio 3.2.2. Sean h(x) = x5 − 2x4 + x3 + x2 − x + 3, p(x) = x3 + 1. Encuentre


el cuociente y el resto de dividir h(x) por p(x).

Ejercicio 3.2.3. Encuentre el cuociente y el resto de dividir: h(x) = 3x3 − x2 −


2x + 6 por p(x) = x2 + 2.

69
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Observación 3.2.4. Si el divisor p(x) es de la forma x − c (de grado uno) la


división se hace con un método conocido como Método de Ruffini: Se escriben
los coeficientes de h(x) en orden decreciente llenando con 0 si no aparece xi .
Ejemplo 3.2.5. Por ejemplo divida x4 + 3x3 − 2x2 + 3 por x + 2.
Solución:
1 3 −2 0 3
−2 −2 −2 8 −16
1 1 −4 8 −13 = resto
Luego r(x) = −13 y q(x) = 8 − 4x + x2 + x3 .

3.3. Divisibilidad y máximo común divisor de


dos polinomios.
Definición 3.3.1. Sean p(x), h(x) ∈ R[x], p(x) 6= 0. Se dice que p(x) es un divisor
de h(x) o que p(x) divide a h(x) o que h(x) es divisible por p(x) si existe un
polinomio q(x) ∈ R[x], tal que h(x) = p(x)q(x) y se anota p(x) | h(x).

Ejemplo 3.3.2. (x − 3) | (x2 − 3), (x − 1) | (x3 − 1).

Ejercicio 3.3.3. Para pensar, buscar ejemplos, contraejemplos, etc. Sean p(x), h(x), g(x) ∈
R[x].
1. Si p(x) | h(x)g(x), ¿ es cierto que p(x) | h(x) ∨ p(x) | g(x)?

2. Si p(x) | h(x) + g(x), ¿ es cierto que p(x) | h(x) ∨ p(x) | g(x)?


Definición 3.3.4. Sean p(x), h(x) ∈ R[x], polinomios no nulos. Un polinomio
d(x) ∈ R[x] se dice un máximo común divisor de p(x) y de h(x) sı́ y sólo sı́
1. d(x) | p(x) ∧ d(x) | h(x) y

2. Para todo c(x) ∈ R[x] tal que c(x) | p(x) ∧ c(x) | h(x) se tiene que
c(x) | d(x).
Observación 3.3.5. Hay muchos polinomios que satisfacen la definición de máxi-
mo común divisor de p(x) y de h(x), es decir no es único, pues si d(x) lo es, entonces
a · d(x), a ∈ R, a 6= 0 también es un máximo común divisor de p(x) y de h(x). Por
eso, de entre todos los polinomios que satisfacen la definición de máximo común
divisor, se escoge aquel polinomio mónico para nombrarlo EL máximo común divi-
sor de p(x) y h(X). De esa forma tenemos una única respuesta y podemos hablar
de el M CD(p(x), h(x)).

70
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejercicio 3.3.6. Sean p(x) = 3x2 + x − 2 y q(x) = 3x2 − 5x + 2 dos polinomios


en R[X]. Entonces UN MCD de p y q es el polinomio d(x) = 3x − 2. Verifique que
satisface la Definición 3.3.4. También lo es el polinomio t(x) = x − (2/3) (verifique
lo mismo anterior).
Entonces, el acuerdo es que EL MCD(p(x),q(x)) es t(x).
Ahora que tenemos una deficinión satisfactoria, hay que demostrar que todo
par de polinomios tendrá un MCD. Es decir, que existe un polinomio que satisface
la Deficinión 3.3.4, para todo par de polinomios p(x) y h(x).
Teorema 3.3.7 (Bézout para polinomios). Dados dos polinomios p(x) y de h(x)
en R[x] no nulos, entonces existe un máximo común divisor d(x) de p(x) y de h(x).
Además existen polinomios (no necesariamente únicos) u(x), v(x) en R[x] tales que

d(x) = p(x)u(x) + h(x)v(x).

Demostración. Sea S = {p(x)u(x) + h(x)v(x) | u(x), v(x) ∈ R[x]} = 6 ∅, por ejem-


plo p(x) ∈ S. Tomamos el conjunto de los grados de los polinomios en S, es un
conjunto no vacı́o de números naturales, por axioma del Buen Orden, tiene un
elemento mı́nimo.
Sea f (x) ∈ R[x] un polinomio de grado mı́nimo en S. Luego, existen polinomios
u1 (x), v1 (x) ∈ R[x], f (x) = p(x)u1 (x) + h(x)v1 (x).
Probemos que f (x) es un máximo común divisor de p(x) y de h(x).
1. Demostremos que f (x) | p(x). Por algoritmo de división, existen únicos
q(x), r(x) tales que

p(x) = f (x)q(x) + r(x), r(x) = 0 ∨ gr(r(x)) < gr(f (x)).

Si r(x) 6= 0, gr(r(x)) < gr(t(x)). Tenemos que

r(x) = p(x) − f (x)q(x) = p(x) − [p(x)u1 (x) + h(x)v1 (x)]q(x)

= p(x)[1 − u1 (x)q(x)] + h(x)[−v1 (x)q(x)]


Ası́ r(x) ∈ S con gr(r(x)) < gr(t(x)). Contradicción pues f (x) es un polinomio de
grado mı́nimo en S. Luego, r(x) = 0, p(x) = f (x)q(x) y f (x) | p(x).
De forma similar se prueba que f (x) | h(x).
2. Sea c(x) ∈ R[x] tal que c(x) | p(x) ∧ c(x) | h(x). Luego existen polinomios
q1 (x), q2 (x) tales que p(x) = c(x)q1 (x) y h(x) = c(x)q2 (x).
Por lo tanto, f (x) = p(x)u1 (x)+h(x)v1 (x) = [c(x)q1 (x)]u1 (x)+[c(x)q2 (x)]v1 (x) =
c(x)[q1 (x)u1 (x) + q2 (x)]v1 (x)] = c(x)q3 (x), con q3 (x) = q1 (x)u1 (x) + q2 (x)]v1 (x) ∈
R[x]. Ası́ c(x) | f (x).
De 1. y 2. se tiene que f (x) es un máximo común divisor de p(x) y de h(x).

71
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Al igual que vimos con los enteros tenemos el siguiente resultado para poli-
nomios. Es fundamental para entender el Algoritmo de Euclides para encontrar
MCD.

Lema 3.3.8. Sean h(x), p(x), q(x), r(x) ∈ R[x] r {0} y h(x) = p(x)q(x) + r(x).
Entonces (h(x), p(x)) = (p(x), r(x)).

Demostración. Sea d(x) = (h(x), p(x)). Probemos que d(x) = (p(x), r(x)). Te-
nemos que d(x) | h(x) ∧ d(x) | p(x). Es decir, existen s(x), t(x) ∈ R[x] tales
que h(x) = d(x)s(x) ∧ p(x) = d(x)t(x). Luego r(x) = h(x) − p(x)q(x) =
d(x)s(x) − (d(x)t(x))q(x) = d(x)(s(x) − t(x)q(x)) con s(x) − t(x)q(x) ∈ R[x]. Por
lo tanto d(x) | r(x).
Sea ahora d0 (x) | p(x) y d0 (x) | r(x). Probaremos que d0 (x) | d(x) y se tiene que
d(x) = (p(x), r(x)).
Como d0 (x) | p(x) ∧ d0 (x) | r(x) se tiene p(x) = d0 (x)u(x) ∧ r(x) = d0 (x)v(x).
Luego h(x) = p(x)q(x) + r(x) = (d0 (x)u(x))q(x) + d0 (x)v(x) = d0 (x)(u(x)q(x) +
v(x)), con u(x)q(x) + v(x) ∈ R[x]. Por lo tanto d0 (x) | h(x). Como d0 (x) | p(x) y
d(x) = (h(x), p(x)) se tiene que d0 (x) | d(x).

3.3.1. Método de Euclides para encontrar MCD de polino-


mios
Al igual que vimos con los enteros usamos el Algoritmo de División para encon-
trar un máximo común divisor de dos polinomios. Por Lema 3.3.8, será el último
resto no nulo. En efecto, por algorimo de división tenemos:
h(x) = q0 (x)p(x) + r0 (x) con r0 (x) = 0 ∨ gr(r0 (x)) < gr(p(x)
p(x) = q1 (x)r0 (x) + r1 (x) con r1 (x) = 0 ∨ gr(r1 (x)) < gr(r0 (x))
r0 (x) = q2 (x)r1 (x) + r2 (x) con r2 (x) = 0 ∨ gr(r2 (x)) < gr(r1 (x))
r1 (x) = q3 (x)r2 (x) + r3 (x) con r3 (x) = 0 ∨ gr(r1 (x)) < gr(r2 (x))
Este proceso termina cuando un resto es 0. Esto ocurre después de un número
finito de pasos, pues los grados disminuyen en cada paso y finalmente se llegará a
grado 0. Es decir, a un resto que es un polinomio constante. En el siguiente paso se
tendrá resto 0. Supongamos que ocurre en el paso t + 1, para un entero. Entonces
el resto anterior (es decir el último resto no nulo) es un MCD de los polinomios
dados.
rt−2 (x) = qt (x)rt−1 (x) + rt (x) con gr(rt (x)) < gr(rt−1 (x))
rt−1 (x) = qt+1 (x)rt (x) + 0

72
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Recuerde que el acuerdo es que EL MCD de los polinomios dados será el polino-
mio mónico asociado. Es decir, si rn ∈ R r {0} es el coeficiente lı́der del polinomio
rt (x), entonces EL MCD será rn−1 rt (x).
Ejercicio 3.3.9. Encuentre un máximo común divisor entre x5 − 4x4 − 3x3 − 5x2 +
10x − 10 y x3 − 9 y escrı́balo como suma de múltiplos de ellos, en R[x].
Ejercicio 3.3.10. Encuentre un máximo común divisor entre x4 − x3 − x2 + 2 y
x3 − 1 y escrı́balo como suma de múltiplos de ellos, en R[x].
Ejercicio 3.3.11. Encuentre un máximo común divisor entre 2x4 +2x5 +3x2 −2x+1
y x3 + 2x2 + 2x + 1y escrı́balo como suma de múltiplos de ellos, en R[x].

3.4. Raı́ces de polinomios.


Todo polinomio p(X) = an xn + an−1 xn−1 + · · · + a1 x + a0 ∈ R[x], define una
función polinomial, que está asociada a p(x):

p : R → R, u 7→ p(u).
Por ejemplo, p(x) = x2 tiene asociada la función cuadrática p : R → R, x 7→ x2 ,
que por ejemplo toma los valores p(2) = p(−2) = 4. Podemos determinar su
dominio e imagen, graficarla, etc.
Observación 3.4.1. Es importante tener clara la diferencia entre el polinomio y
la función asociada. Por ejemplo, para polinomios con coeficientes en Z/2Z, hay
sólo cuatro funciones de Z/2Z a Z/2Z, pero infinitos polinomios en Z/2Z[x]. Aquı́
el polinomio p(x) = x2 + x no es el polinomio nulo pero tiene asociada a la función
nula.
Definición 3.4.2. Sea f (x) un polinomio de grado ≥ 1 con coeficientes en R y α
un número tal que f (α) = 0, entonces se dice que α es una raı́z de f (x).
Teorema 3.4.3. (Teorema del factor) Sea f (x) un polinomio de grado ≥ 1 con
coeficientes en R y α ∈ R. Entonces α es una raı́z de f (x) sı́ y sólo sı́ existe un
polinomio q(x) en R[x] tal que f (x) = (x − α)q(x).
Demostración. Por el algoritmo de Euclides, sabemos que existen polinomios q(x) y
r(x) tales que f (x) = (x−α)q(x)+r(x) donde r(x) = 0 o gr(r(x)) < gr(x−α) = 1.
Ası́ r(x) = 0 o gr(r(x)) = 0, lo cual implica que r(x) = a0 ∈ R. Como α es una
raı́z de f (x), tenemos que 0 = f (α) = (α − α)q(α) + r(α) = r(α). Por lo tanto
a0 = 0 y f (x) = (x − α)q(x).
Recı́procamente, tenemos que f (α) = (α − α)q(α) = 0 · q(α) = 0. Por lo tanto
α es raı́z de f (x).

73
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Observación 3.4.4. Otra forma de llegar al Teorema del Factor 3.4.3, es por
medio del Teorema del Resto, enunciado a continuación.

Teorema 3.4.5. (Teorema del resto) Sean p ∈ R[x], a ∈ R. Entonces, el resto


de la división de p(x) por x − a es p(a).

Demostración. p = (x − a)q + r con r = 0 ó r ∈ R, pues deg(r) < 1 = deg(x − a).


Luego p(a) = (a − a)q(a) + r(a) = 0 + r. Ası́ r = p(a).
Note que la demostración es similar a la del Teorema del Factor 3.4.3, el cual
de hecho se deduce de éste.
1
Ejercicio 3.4.6. Sabiendo que −1 y 3
son raı́ces de f (x) = 3x4 −10x3 −3x2 +8x−2
encuentre las otras dos raı́ces.

Ejercicio 3.4.7. Para pensar, buscar ejemplos, contraejempos, etc. Sea f (x) ∈
R[x]. Si α y β son raı́ces de f (x).

1. ¿ es cierto que α + β es raı́z de f (x)?

2. ¿ es cierto que αβ es raı́z de f (x)?

Observación 3.4.8. Sea f (x) = ax2 + bx + c ∈ R[x], a 6= 0 un polinomio de grado


2. Entonces

2 −b ± b2 − 4ac
α es raı́z de f (x) ⇐⇒ f (α) = 0 ⇐⇒ aα + bα + c = 0 ⇐⇒ α =
2a
Sea ∆ = b2 − 4ac, entonces

1. f (x) tiene una sóla raı́z real ⇐⇒ ∆ = 0.

2. f (x) tiene dos raı́ces reales y distintas ⇐⇒ ∆ ≥ 0.

3. f (x) no tiene raı́ces reales ⇐⇒ ∆ < 0.

Note que el cálculo para la fórmula para las raı́ces de una ecuación cuadrática
sale de lo siguiente
 
2 2 b c
0 = aα + bα + c ⇔ 0 = a α + α + .
a a
Completando cuadrado de binomio al lado derecho se tiene

b2 b2
 
2 b c
0=a α + α+ + − ;
a (2a)2 a (2a)2
es decir,

74
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

4ac − b2
  
b 2
0 = a (α + ) + .
2a 4a2
Como a 6= 0, podemos simplificarlo en la expresión y reordenar. Se tiene
2
b2 − 4ac

b
α+ = .
2a 4a2
De donde se sigue,
  √
b b2 − 4ac
α+ =± .
2a 2a
La fórmula se deduce claramente de allı́.
Ejemplo 3.4.9. Encuentre todas las raı́ces reales de f (x) = x4 − 9.

√ Solución: Se tiene que f (x) = x4 − 9 = (x2 − 3)(x2 + 3) = (x − 3)(x +
3)(x2 + 3).
Usando la Observación anterior vemos que x2 + 3 no tiene raı́ces reales pues
2 4
√=0 −
∆ √ 12 = −12 < 0. Por lo tanto las únicas raı́ces reales de f (x) = x − 9 son
3 y − 3.
Teorema 3.4.10. Si p(x) ∈ R[x] tiene n raı́ces distintas α1 , α2 , · · · , αn entonces

p(x) = (x − α1 )(x − α2 ) · · · (x − αn )q(x)

Demostración. Haremos inducción sobre el número n de raı́ces.


Si n = 1, por Teorema 3.4.3, p(x) = (x − α1 )q(x).
Hipótesis de inducción: El teorema es válido cuando p(x) tiene n − 1 raı́ces
distintas, es decir, p(x) = (x − α1 )(x − α2 ) · · · (x − αn−1 )q(x)
Tesis: el teorema es válido cuando p(x) tiene n raı́ces distintas.
Demostración. Sea αn otra raı́z de p(x). Luego,

0 = p(αn ) = (αn − α1 )(αn − α2 ) · · · (αn − αn−1 )q(αn )

Como las raı́ces son todas distintas, se tiene αn − αi 6= 0, ∀ i = 1, · · · , n − 1 y


q(αn ) = 0, es decir, αn es raı́z de q(x). Luego por Teorema 3.4.3, existe q1 (x) ∈
R[x], q(x) = (x−αn )q1 (x). Por lo tanto, p(x) = (x−α1 )(x−α2 ) · · · (x−αn−1 )q(x) =
(x−α1 )(x−α2 ) · · · (x−αn−1 )(x−αn )q1 (x), y el Teorema vale para n raı́ces distintas.
Por principio de Inducción, el Teorema vale para n raı́ces distintas, n ≥ 1.
Corolario 3.4.11. Un polinomio de grado n, tiene a lo más n raı́ces.

75
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración. Se deduce directamente del Teorema 3.4.10, comparando el grado


del polinomio con el grado del producto al lado derecho de la igualdad.
Ejercicio 3.4.12. Sabiendo que −2 y −2 3
son raı́ces de f (x) = 3x4 + 14x3 + 14x2 −
8x − 8 encuentre las otras dos raı́ces de f (x), si las hay.
Lema 3.4.13. Sea p(x) = a0 + a1 x + · · · + an xn ∈ Z[x]. Si r 6= 0, y el número
racional rs (sin divisores comunes, es decir, (r, s) = 1), es raı́z de p(x) entonces
r | a0 y s | an .
r
Demostración. Sea s
raı́z de p(x). Luego
 n
r r
a0 + a1 + · · · + an = 0.
s s
Multiplicando por sn tenemos

a0 sn + a1 rsn−1 + · · · + an rn = 0,

es decir,  
n−1 n−1
r a1 s + · · · + an r = −a0 sn ,

o sea r | a0 sn y como (r, s) = 1 se tiene que r | a0 .


Análogamente,
 
n−1 n−2 n−1
s a0 s + a1 rs + · · · an−1 r = −an rn ,

es decir, s | an rn y como (r, s) = 1 se tiene que s | an .

Ejercicio 3.4.14. Encuentre todas las raı́ces racionales de h(x) = 2x3 + 3x + 5 si


las hay.
Ejemplo 3.4.15. Encuentre todas las raı́ces racionales de f (x) = 8x3 +22x2 −7x−3
si las hay.
Solución: Si rs es una raı́z racional de f (x) entonces r | −3 y s | 8. Luego las
posibilidades de r, s son r = 1, −1, 3, −3, s = 1, −1, 2, −2, 4, −4, 8, −8
r
Ası́ las posibilidades para s
son
1 −1 1 −1 1 −1 3 −3 3 −3 3 −3
1, −1, , , , , , , 3, −3, , , , , ,
2 2 4 4 8 8 2 2 4 4 8 8
Usando el método de Ruffini, verificamos que 21 , −1 4
, −3 son raı́ces de f (x) y como
gr(f (x)) = 3, se tiene que 12 , −1
4
, −3 son todas las raı́ces de f (x).

76
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Definición 3.4.16. Se dice que α es raı́z de multiplicidad m ≥ 1 de p(x) sı́ y sólo


sı́ existe q(x) ∈ R[x], p(x) = (x − α)m q(x) con q(α) 6= 0.

Ejemplo 3.4.17. Si f (x) = 5(x + 3)3 (4x + 23)2 (x + 11), entonces −3, − 23
4
y −11
son raı́ces de f (x) de multiplicidad 3, 2 y 1 respectivamente.

Ejercicio 3.4.18. Sea p(x) = an xn + . . . + a0 ∈ R[X].

Se llama polinomio derivado de p al polinomio

p0 (x) = nan xn−1 + (n − 1)an−1 xn−2 + . . . + a1 ∈ R[X]


De hecho p0 (x) es la derivada de la función polinomial asociada a p(x).
Según las reglas del cálculo, es válida la relación (p(x)q(x))0 = p(x) · q 0 (x) +
p0 (x) · q(x), para p(x), q(x) ∈ R[X]. En particular, si p(x) = (x − a)n q(x) ∈ R[X],
con q(a) 6= 0; es decir, a es raiz de multiplicidad n de p. Tenemos

p0 (x) = n(x − a)n−1 q(x) + (x − a)n · q 0 (x) = (x − a)n−1 (nq(x) + (x − a)q 0 (x)).

Por lo tanto a es raiz de multiplicidad n − 1 de p0 (x) pues x − a no es divisor


de nq(x) + (x − a)q 0 (x).

3.5. Polinomios irreducibles y factorización úni-


ca.
Definición 3.5.1. Un polinomio h(x) ∈ R[x] no constante se dice irreducible
en R[x] si cada vez que h(x) = p(x)q(x), entonces uno de los dos polinomios,
p(x) ∈ R[x] o q(x) ∈ R[x] es una constante no nula. En el caso en que existan poli-
nomios no constantes p(x), q(x) ∈ R[x], tales que h(x) = p(x)q(x), 1 ≤ gr(p(x)) <
gr(h(x)), 1 ≤ gr(q(x)) < gr(h(x)) se dice que h(x) es reducible en R[x].

Ejercicio 3.5.2. Todo polinomio p(x) ∈ R[x], de grado 1 es irreducible en R[x].

Proposición 3.5.3. Sea p(x) irreducible en R[x]. Si p(x) | f (x)g(x) entonces


p(x) | f (x) ∨ p(x) | g(x).

Demostración. Supongamos que p(x) - f (x). Probaremos que p(x) | g(x).


Como p(x) es irreducible en R[x] se tiene que (p(x), f (x)) = a ∈ R, a 6= 0. Por
lo tanto, existen polinomios q1 (x), q2 (x) ∈ R[x] tales que

a = p(x)q1 (x) + f (x)q2 (x) =⇒ 1 = a−1 p(x)q1 (x) + a−1 f (x)q2 (x)

77
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

=⇒ g(x) = g(x)a−1 p(x)q1 (x)+g(x)a−1 f (x)q2 (x) = a−1 p(x)g(x)q1 (x)+a−1 g(x)f (x)q2 (x)
Como p(x) | f (x)g(x), entonces existe un polinomio q3 (x) ∈ R[x] tal que f (x)g(x) =
p(x)q3 (x). Reemplazando se tiene:

g(x) = a−1 p(x)g(x)q1 (x)+a−1 p(x)q3 (x)q2 (x) = p(x)[a−1 g(x)q1 (x)+a−1 q3 (x)q2 (x)],

De donde, p(x) | g(x).

Ejercicio 3.5.4. Suponga que p(x) y f (x) son polinomios “ relativamente primos”;
es decir el M CD(p(x), f (x)) = 1. Demuestre que si p(x) divide a f (x)g(x), entonces
p(x) divide a g(x), donde g(x) ∈ R[x].

De la Proposición 3.5.3 se tiene el siguiente resultado, el cual se puede demostrar


por inducción en la cantidad de factores.

Corolario 3.5.5. Sea p(x) irreducible en R[x]. Si p(x) | f1 (x) · · · ft (x) entonces
p(x) | fi (x) algún i = 1, · · · , t.

Definición 3.5.6. Se dice que dos polinomios f (x), g(x) son asociados sı́ y sólo sı́
f (x) = cg(x), c ∈ R, c 6= 0.

Observación 3.5.7. Con esta definición podemos decir que los todos los polino-
mios que satisfacen las condiciones de ser máximo común divisor de dos polinomios
dados, son asociados.

Al igual que en el Teorema Fundamental de la Aritmética, donde se menciona


la descomposición de enteros en primos, para los polinomios tenemos un resultado
similar, que es la descomposición en polinomios irreducibles.

Teorema 3.5.8. Teorema de factorización de polinomios en irreducibles:

1. Cada polinomio no constante f (x) ∈ R[x], tiene una factorización como pro-
ducto de polinomios irreducibles en R[x], es decir, f (x) = p1 (x) · · · pt (x), con
pi (x) polinomios irreducibles en R[x], cada i.

2. Esta factorización es única, en el sentido siguiente:


Si f (x) = p1 (x) · · · pt (x) = q1 (x) · · · qm (x) donde cada pi (x), qj (x) es un po-
linomio irreducible en R[x], entonces t = m y pi (x) es asociado con qji (x),
o bien después de reordenar y renombrar los q(x)0 s se tiene que pi (x) es
asociado con qi (x).

78
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración. Consideremos el siguiente subconjunto de R[x] : S = {h(x) ∈


R[x] | gr(h(x)) ≥ 1, h(x) no es irreducible ni es producto de irreducibles }. Pro-
baremos que S = ∅.
Supongamos que S 6= ∅ y tomemos un polinomio s(x) de grado mı́nimo en S.
Como s(x) ∈ S, s(x) no es irreducible ni es producto de irreducibles en R[x].
Luego s(x) = k(x)t(x), con k(x), t(x) ∈ R[x], 1 ≤ gr(k(x)) < gr(s(x)) y 1 ≤
gr(t(x)) < gr(s(x)). Por lo tanto k(x) y t(x) no están en S, recuerde que s(x) era
de grado mı́nimo en S.
Sea k(x) = p1 (x) · · · pr (x), t(x) = q1 (x) · · · qm (x) con pi (x), qj (x) polinomios
irreducibles en R[x]. Luego, s(x) = k(x)t(x) = p1 (x) · · · pr (x)q1 (x) · · · qm (x) con
pi (x), qj (x) polinomios irreducibles en R[x] y s(x) ∈ / S. Contradicción. Luego, S =
∅.

2. Queremos probar que t = m. Supongamos que t > m, es decir, hay más


pi (x)0 s.
Tenemos que p1 (x)·(p2 (x) · · · pt (x)) = q1 (x) · · · qm (x). Luego, p1 (x) | q1 (x) · · · qm (x).
Por Corolario 3.5.5 tenemos que p1 (x) | qj1 (x) para algún j1 ∈ {1, · · · , m}. Como
ambos son irreducibles en R[x], se tiene que p1 (x) = c1 qj1 (x), c1 6= 0, es decir, p1 (x)
y qj1 (x) son asociados.
Luego c1 qj1 (x) · (p2 (x) · · · pt (x)) = q1 (x) · · · qj1 (x) · · · qm (x).
Cancelando queda

p2 (x) · (c1 p3 (x) · · · pt (x)) = q1 (x) · · · q\


j1 (x) · · · qm (x),

donde q\
j1 (x) significa que se sacó el término qj1 (x).

Tenemos ahora que p2 (x) · (c1 p3 (x) · · · pt (x)) = q1 (x) · · · q\


j1 (x) · · · qm (x), luego
por Corolario 3.5.5 p2 (x) | qj2 (x) para algún j2 ∈ {1, · · · , m} r {j1 }. Como ambos
son irreducibles en R[x], ellos son asociados, es decir, p2 (x) = c2 qj2 (x), c2 6= 0.
Cancelando por qj2 (x) queda

p3 (x) · (c1 c2 p4 (x) · · · pt (c)) = q1 (x) · · · q\ \


j1 (x) · · · qj2 (x) · · · qm (x).

Después de m pasos los qi (x) serán eliminados y queda


c1 c2 · · · cm pm+1 (x)pm+2 (x) · · · pt (x) = 1. Contradicción, pues los pi (x) son irre-
ducibles.
En forma similar si se supone t < m, es decir, hay más qi (x)0 s. Se van eliminando
los pj (x)0 s y se llega a contradicción.
Luego t = m. Por la demostración se ve que pi (x) y qji (x) son asociados, es
decir, pi (x) = ci qji (x) ∀ i = 1, · · · , t.

79
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejemplo 3.5.9. Sea p(x) ∈ R[x], de grado 2 o 3. Entonces p(x) es irreducible en


R[x] sı́ y sólo sı́ p(x) no tiene una raı́z en R.

Demostración. (=⇒) Esta dirección de la afirmación es equivalente a demostrar


que si tiene una raı́z, entonces es reducible. Supongamos que p(x) tiene una raı́z
α ∈ R[x], entonces por Teorema 3.4.3 existe q(x) ∈ R[x] tal que p(x) = (x−α)q(x).
Además gr(x − α) = 1 y gr(q(x)) = gr(p(x)) − 1, luego p(x) no es irreducible.
(⇐=) También la haremos por contrapositivo como la anterior. Supongamos
que p(x) no es irreducible en R[x], luego existen polinomios q(x), f (x) ∈ R[x] tal
que p(x) = q(x))f (x). Luego gr(q(x)) + gr(f (x)) ≤ 3. Por lo tanto, uno de los dos
polinomios q(x), f (x) tiene grado 1. Si f (x) = ax + b, a 6= 0, entonces − ab es una
raı́z de f (x) y también de p(x).

Observación 3.5.10. Veremos más adelante que estos son los únicos polinomios
irreducibles en R[x].

El siguiente criterio se probará en un curso superior pero puede usarse aquı́.

Lema 3.5.11. Criterio de irreducibilidad de Eisenstein. Sea h(x) = a0 +· · ·+


an xn ∈ Z[x] de grado ≥ 1. Sea p primo tal que p | ai ∀ i, 0 ≤ i ≤ n − 1, p - an
y p2 - a0 . Entonces h(x) es irreducible en Q[x], es decir, no se puede escribir
h(x) = q(x)r(x) con q(x), r(x) ∈ Q[x] de grado ≥ 1.

Note que el polinomio en cuestión sı́ puede ser reducible en R[x], aún siendo
irreducible en Q[x].

Ejercicio 3.5.12. Sea f (x) = 2x10 −14x−21 ∈ Z[x]. Pruebe que f (x) es irreducible
en Q[x].

Ejemplo 3.5.13. El polinomio xn − 2 es irreducible en Q[x] para todo n ∈ N, pues


aplicamos el Lema de Eisenstein para el primo 2. Tenemos ası́ que para el anillo de
polinomios con coeficientes racionales, existen polinomios irreducibles de cualquier
grado. En lo que es diferente a R[x] (ver la Observación 3.5.10).

Ejemplo 3.5.14. Descomponga en polinomios irreducibles el polinomio h(x) =


2x4 + x3 − 21x2 − 14x + 12, sabiendo que 12 y −3 son raı́ces de h(x).

Solución: Como 21 y −3 son raı́ces de h(x), por Teorema 3.4.10 h(x) = (x −


1
2
)(x
+ 3)q(x), donde debemos determinar q(x).
Tenemos que (x − 21 )(x + 3) = x2 + 25 x − 23 . Dividamos h(x) por x2 + 52 x − 32 .
Nos da como cuociente q(x) = 2x2 − 4x − 8 = 2(x2 − 2x − 4), de donde h(x) =
(x − 12 )(x + 3)q(x) = (x − 12 )(x + 3)2(x2 − 2x − 4).

80
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Veamos si x2 − 2x − 4 tiene raı́ces reales. ∆ = b2 − 4ac = 4 − 4(−4) = 20 > 0,


luego hay dos raı́ces reales y distintas, a saber
√ √
2 + 20 √ 2 − 20 √
=1+ 5 y =1− 5
2 2
Por lo tanto la descomposición de h(x) en polinomios irreducibles (son todos de
grado uno) en R[x] es
1 √ √
h(x) = 2(x − )(x + 3)(x − (1 + 5))(x − (1 − 5))
2
Ejercicio 3.5.15. Descomponga en polinomios irreducibles el polinomio h(x) =
x5 − x4 − 5x3 + 9x2 − 24x + 36, sabiendo que 2 y −3 son raı́ces de h(x).

3.6. Funciones racionales (o fracciones polinomia-


les) y descomposición en fracciones parciales
3.6.1. Introducción.
El conjunto R[x] de los polinomios con coeficientes reales, provisto de la adi-
ción y multiplicación que ya conocemos, es un anillo conmutativo con elemento
unidad. Es decir, ambas operaciones son conmutativas, asociativas y poseen ele-
mento neutro: el cero y el uno, respectivamente. En la adición , cada elemento tiene
un opuesto aditivo, lo que significa que para cada p(x) ∈ R[x], existe q(x) ∈ R[x]
tal que p(x) + q(x) = 0 (sabemos q(x) = −p(x)). Por último, la multiplicación es
distributiva respecto de la adición.
Todas estas propiedades son las mismas que ocurren en el caso del conjunto
de los números enteros Z, con sus respectivas adición y multiplicación. En el caso
de Z, la ausencia de inversos multiplicativos se resuelve con la construcción de los
números racionales Q, que contiene los elementos de la forma ab , con a, b ∈ Z, b 6= 0
y consideramos Z ⊆ Q.
Ası́ Q es un cuerpo, es decir, un anillo conmutativo donde todo elemento distinto
de cero es invertible para la multiplicación.
Para el caso de R[x] se procede de un modo similar. Si p(x), q(x) ∈ R[x], q(x) 6=
0, se llama una fracción polinomial a un elemento de la forma p(x) q(x)
. También se
le llama fracción racional o, dado que naturalmente tiene asociado una función de
R, función racional.
Es importante considerar la siguiente definición de igualdad entre fracciones
racionales, tal como en el caso en Q :

p(x) p̃(x)
= ⇔ p(x)q̃(x) = q(x)p̃(x), p(x), p̃(x), q(x), q̃(x) ∈ R[x], q(x) 6= 0, q̃(x) 6= 0.
q(x) q̃(x)

81
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

El conjunto de todas las fracciones racionales se designará en por R(x) (parénte-


sis redondos). Se considerará R[x] ⊆ R(x).
En R(x) se define una adición y una multiplicación de la misma forma como se
han definido esas mismas operaciones en Q y las propiedades de estas operaciones
coinciden con lo ya dicho para Q. Es decir, R(x) resulta ser un cuerpo.

Ejemplos de fracciones racionales son:

3x3 − 2x + 1 1 x−1
2
, , , 5x3 − 2x + 3, 1003
x +1 x 2x2 − 3
En lo que sigue, nos preocuparemos sólo de un aspecto referente a fracciones
racionales: su descomposición. Esto es, dada una fracción racional, se quiere encon-
trar una descomposición de ella como suma de fracciones racionales más simples,
en algún sentido. Ello, porque estas descomposiciones facilitan algunos aspectos
del Cálculo Integral, como cuando se requiere la integración de funciones reales
provenientes de funciones racionales, por ejemplo.

3.6.2. Descomposición en fracciones parciales


Definición 3.6.1. Sea r(x) = p(x)
q(x)
, p(x), q(x) ∈ R[x], q(x) 6= 0. Se puede probar
que
p(x)
r(x) = = h(x) + F1 (x) + · · · + Ft (x),
q(x)
donde el sumando h(x) ∈ R[x] es un polinomio, y cada Fi (x) es de la forma
A
(ax+b)n
, con A, a, b ∈ R, a 6= 0, n ∈ N o
Ax+B
(ax2 +bx+c)t
, con A, B, a, b, c ∈ R, a 6= 0, b2 − 4ac < 0, t ∈ N.

Esta descomposición de r(x) se denomina descomposición en fracciones parcia-


les

La descomposición en fracciones parciales tiene muchas aplicaciones en resolu-


ción de integrales y sumatorias, por ejemplo.
El resultado anterior se basa en que todo polinomio no nulo q(x) se factoriza
en R[x] como q(x) = ap1 (x)n1 · · · pt (x)nt donde a ∈ R y cada pi (x) es irreducible
en R[x]. Además, según la Observación 3.5.10, los polinomios irreducibles son de
la forma pi (x) = ai x + bi , ai 6= 0 o pi (x) = ai x2 + bi x + ci , ai 6= 0, b2i − 4ai ci < 0.
Veamos primero cómo surge esta útil descomposición, y luego cómo se encuen-
tra.

82
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración
Consideremos p(x)
q(x)
∈ R(x). Si deg p(x) ≥ deg q(x), por el Algoritmo de división,
sabemos que existen únicos d(x), r(x) ∈ R[x] tales que

p(x) = d(x)q(x) + r(x), con r = 0 ó deg r(x) < deg q(x)


De donde

p(x) r(x)
= d(x) + , deg r(x) < deg q(x) (3.1)
q(x) q(x)
Es decir, se puede descomponer una fracción racional en la suma de un polino-
mio (digamos su “ parte entera”) y una fracción en que el grado de su numerador es
inferior al grado del denominador. En lo sucesivo nos preocuparemos de fracciones
con esta última condición.
Sea p(x)
q(x)
∈ R(x), con deg p(x) < deg q(x). Supongamos, además, que q(x) =
q1 (x) · q2 (x), con q1 (x) y q2 (x) relativamente primos.
Luego existen h1 (x), h2 (x) ∈ R[x] tales que

1 = q1 (x)h1 (x) + q2 (x)h2 (x)

p(x) = p(x)q1 (x)h1 (x) + p(x)q2 (x)h2 (x) (∗∗)

Dividiendo por q(x)

p(x) p(x) p(x)h1 (x) p(x)h2 (x)


= = +
q(x) q1 (x) · q2 (x) q2 (x) q1 (x)
Recordemos que nos interesa encontrar una descomposición tal que cada su-
mando tenga un numerador de grado inferior a su denominador. Para ello veamos
qué pasa antes de dividir por q(x) en la expresión (∗∗).
Dividiendo p(x)h1 (x) por q2 (x) y p(x)h2 (x) por q1 (x) se obtiene

p(x)h1 (x) = q2 (x)d2 (x) + r2 (x), con r2 = 0 o gr r2 (x) < gr q2 (x)

p(x)h2 (x) = q1 (x)d1 (x) + r1 (x), con r1 = 0 o gr r1 (x) < gr q1 (x)


Entonces, reemplazando en (∗∗) y omitiendo (x) por comodidad de lectura

p = q1 (q2 d2 + r2 ) + q2 (q1 d1 + r1 )

p = q1 q2 d2 + q1 r2 + q2 q1 d1 + q2 r1

p = q(d1 + d2 ) + q1 r2 + q2 r1

83
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Como gr(q1 r2 ) < gr q y gr(q2 r1 ) < gr q, tendrı́a que ser gr p = gr(q(d1 +


d2 )). Pero gr p < gr q por hipótesis, por lo que la última igualdad no puede
ocurrir, salvo que d1 + d2 = 0.
De lo anterior,

p = q 1 r2 + q 2 r1

p p r2 r1
= = + con gr ri < gr qi
q q1 q2 q2 q1
Por otra parte, supongamos que hemos encontrado dos descomposiciones

p r1 r2 r0 r0
= + = 1+ 2 con gr ri < gr qi , gr ri0 < gr qi .
q q 1 q2 q1 q2
De aquı́,

r1 r10 r0 r2
− = 2−
q 1 q1 q 2 q2

(r1 − r10 )q2 = (r20 − r2 )q1


y como q2 es primo con q1 , luego q2 | (r20 − r2 ). Pero gr(r20 − r2 ) < gr q2 , por
lo que debe ser r20 − r2 = 0. Del mismo modo r1 = r10 . Todo esto nos asegura la
unicidad de la descomposición en estas condiciones.

En definitiva, hemos demostrado la siguiente:

Proposición:
p
Si ∈ R(x), gr p < gr q, q = q1 q2 con q1 y q2 relativamente primos, en-
q
tonces se

puede escribir, de una única manera


p r1 r2
= + , con gr ri < gr qi (3.2)
q q1 q 2
Corolario 3.6.2. Usando la proposición anterior reiterativamente, se obtiene
p p1 p2 pk
= + + ... + , gr pi < gr qi (3.3)
q1 q 2 . . . qk q 1 q2 qk
siendo qi relativamente primo con qj , todo i 6= j.

Hasta aquı́ tenemos que los polinomios del numerador son de grado menor que el
del denominador que le corresponde. Recordemos que el propoósito es descomponer

84
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

como se dijo en la Definición 3.6.1. Eso es un poco más de lo que llevamos hasta
el Coroloario 3.6.2
Como los polinomios irreducibles en R[x] son sólo polinomios de grado 1 ó
grado 2 de discriminante negativo (ver Observación 3.5.10), consideremos ahora
fracciones racionales cuyo denominador es una potencia de dicho tipo de polino-
mios. Es decir, tenemos una fracción racional r(x) = p(x)
q(x)
∈ R(x).

1. Sea q = (x − a)n , a ∈ R, p ∈ R[x] con gr p < n.

Dividiendo p por (x − a) se tiene p(x) = d(x)(x − a) + a1 , con a1 ∈ R


y d(x) ∈ R[x] de grado menor que n − 1. Entonces

p(x) d(x) a1
n
= n−1
+ .
(x − a) (x − a) (x − a)n
Del mismo modo

d(x) d1 (x) a2
= + , gr d1 (x) < n − 2, a2 ∈ R
(x − a)n−1 (x − a)n−2 (x − a)n−1
Se reitera el procedimiento hasta obtener

p(x) a1 a2 an
n
= n
+ n−1
+ ... + , ai ∈ R (3.4)
(x − a) (x − a) (x − a) (x − a)
Ahora si tiene la forma dicha en la Definición 3.6.1. Es decir, constantes en
el numerador y potencias de factor lineal en el denominador.

2. Consideremos ahora el caso q(x) = (ax2 + bx + c)n , donde ax2 + bx + c ∈


R(X) es irreducible, es decir de discriminante negativo.
Dividiendo p(x) por ax2 + bx + c, resulta

p(x) = d(x)(ax2 + bx + c) + (a1 x + b1 ), con a1 , b1 ∈ R


y ası́

p(x) d(x) a1 x + b 1
= +
(ax2 + bx + c)n 2
(ax + bx + c)n−1 (ax + bx + c)n
2

d(x)
Se reitera el procedimiento, con (ax2 +bx+c)n−1
y asi sucesivamente, hasta que
resulta finalmente

85
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

p(x) a1 x + b1 a2 x + b2
= +
(ax2 + bx + c)n 2
(ax + bx + c) n (ax + bx + c)n−1
2

an x + bn
+... + , ai , bi ∈ R. (3.5)
(ax2 + bx + c)

Que tiene la forma deseada: numerador de grado 1 y denominador potencias


de un polinomio irreducible de grado 2.

Método
Resumimos la sección anterior en forma de método para descomponer en frac-
ciones parciales. Recordemos que si el numerador es de grado mayor que el deno-
minador, primero se divide.
Sea pq(x)
1 (x)
, p1 (x), q(x) R[x], q(x) 6= 0, gr(p1 (x)) < gr((q(x)).
Caso 1. q(x) = (ax + b)n , entonces

p1 (x) A1 A2 An
n
= + 2
+ ··· +
(ax + b) ax + b (ax + b) (ax + b)n

Caso 2. q(x) = (ax + b)n (cx + d)t , entonces

p1 (x) A1 An B1 Bt
n t
= + ··· + n
+ + ··· +
(ax + b) (cx + d) ax + b (ax + b) cx + d (cx + d)t

Ası́ sucesivamente con más factores lineales.


Caso 3. q(x) = (ax2 + bx + c)n , b2 − 4ac < 0 entonces

p1 (x)
(ax2 + bx + c)n

A1 x + B1 A2 x + B2 An x + Bn
= 2
+ 2 2
+ ··· +
ax + bx + c (ax + bx + c) (ax2 + bx + c)n

Caso 4. q(x) = (ax2 + bx + c)n (dx + e)t , b2 − 4ac < 0 entonces

p1 (x) A1 x + B1 An x + Bn
= 2 + ··· +
(ax2 n
+ bx + c) (dx + e)t ax + bx + c (ax2 + bx + c)n

C1 Ct
+ + ··· +
dx + e (dx + e)t

86
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ası́ sucesivamente con más factores cuadráticos y lineales.


Caso 5. q(x) = (ax2 + bx + c)n (dx2 + ex + f )t , b2 − 4ac < 0, e2 − 4df < 0
entonces
p1 (x) A1 x + B1 An x + Bn
= 2 + ··· +
(ax2 n 2
+ bx + c) (dx + ex + f )t ax + bx + c (ax2 + bx + c)n

C1 x + D1 Ct x + Dt
+ 2
+ ··· +
dx + ex + f (dx2 + ex + f )t

Ası́ sucesivamente con más factores cuadráticos.

Ejemplo 3.6.3. Descomponga en fracciones parciales

x2 + x + 2 4x2 + 5x + 3
i) r(x) = , ii) r(x) = .
x(x − 1)2 x2 (x2 + 1)

Solución:
i)

x2 + x + 2 A1 B1 C1 A1 (x − 1)2 + B1 x(x − 1) + C1 x
r(x) = = + + =
x(x − 1)2 x x − 1 (x − 1)2 x(x − 1)2

Luego, x2 + x + 2 = A1 (x − 1)2 + B1 x(x − 1) + C1 x = (A1 + B1 )x2 + (−2A1 +


C1 − B1 )x + A1 . Para calcular A1 , B1 , C1 , por definición de igualdad de polinomios,
se igualan los coeficientes de ambos. Tenemos el sistema

 A1 + B1 = 1 (Eq. 1)
−2A1 + C1 − B1 = 1 (Eq. 2)
A1 = 2 (Eq. 3)

De (Eq. 3) se tiene de inmediato que A1 = 2.


(Eq. 1) =⇒ B1 = 1 − A1 = 1 − 2 = −1, y B1 = −1.
(Eq. 2) =⇒ C1 = 1 + 2A1 + B1 = 1 + 4 − 1 = 4, Y C1 = 4.
Luego la descomposición en fracciones parciales de r(x) es:

x2 + x + 2 2 1 4
r(x) = 2
= − + .
x(x − 1) x x − 1 (x − 1)2

ii)
4x2 + 5x + 3 A1 A2 B1 x + C1
r(x) = 2 2
= + 2 +
x (x + 1) x x x2 + 1

87
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

A1 x(x2 + 1) + A2 (x2 + 1) + (B1 x + C1 )x2


= .
x2 (x2 + 1)
De donde,
4x2 + 5x + 3 = A1 x(x2 + 1) + A2 (x2 + 1) + (B1 x + C1 )x2
= (A1 + B1 )x3 + (A2 + C1 )x2 + A1 x + A2 .
Para calcular A1 , A2 , B1 , C1 , por definición de igualdad de polinomios, se igualan
los coeficientes de ambos. Tenemos el sistema

 A1 + B1 = 0 (Eq. 1)

A2 + C1 = 4 (Eq. 2)


 A1 = 5 (Eq. 3)
A2 = 3 (Eq. 4)

De (Eq. 3) y (Eq. 4) se tiene de inmediato que A1 = 5, y A2 = 3.


(Eq. 1) =⇒ B1 = −A1 = −5, y B1 = −5.
(Eq. 2) =⇒ C1 = 4 − A2 = 4 − 3 = 1, y C1 = 1.
Luego la descomposición en fracciones parciales de r(x) es:
4x2 + 5x + 3 A1 A2 B1 x + C1 5 3 −5x + 1
r(x) = 2 2
= + 2 + 2
= + 2+ 2 .
x (x + 1) x x x +1 x x x +1
Ejemplo 3.6.4. Se incluye aquı́ ejemplos de diferentes tipos.
2x − 3
a) Descomponer la fracción racional ∈ R(x).
x2 − 3x + 2

Aquı́ x2 − 3x + 2 = (x − 2)(x − 1) es reducible. Por lo tanto

2x − 3 a b a(x − 1) + b(x − 2)
= + =
(x − 2)(x − 1) x−2 x−1 (x − 2)(x − 1)

(a + b)x − (a + 2b)
=
(x − 2)(x − 1)
Comparando coeficientes: a + 2b = 3, a + b = 2. También, si se quiere:

x = 1 ⇒ −1 = −b
x=2 ⇒ 1=a
Finalmente,

2x − 3 1 1
= +
x2 − 3x + 2 x−2 x−1

88
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

1
b) Descomponer ∈ R(x). Note que (x2 + x + 1) es irreducible
x(x2 + x + 1)2
en R[x].

La forma de la descomposición deberá ser:

1 a bx + c dx + e
= + 2 + 2
x(x2 + x + 1) 2 x (x + x + 1) 2 x +x+1

a(x2 + x + 1)2 + x(bx + c) + (dx + e)(x2 + x + 1)x


=
x(x2 + x + 1)2
Entonces:
x=0⇒a=1
El coeficiente de x4 en el numerador de la derecha es a + d y como debe
ser a + d = 0, entonces d = −1.
El coeficiente de x3 es 2a + d + e = 0 ⇒ e = −1
x = −1 ⇒ a + b − c + d − e = 1 ⇒ b = c.
Si z ∈ C es tal que z 2 + z + 1 = 0, entonces z 2 b + zc = 1, de donde
z 2 b + zb = b(z 2 + z) = 1 ⇒ b(−1) = 1 ⇒ b = −1 = c.

Un procedimiento más natural consiste en ordenar el polinomio del nume-


rador de la derecha respecto a las potencias de x y luego comparar sus
coeficientes con el polinomio del numerador de la izquierda. Esto lleva a un
sistema de ecuaciones, que en este caso es de cinco incógnitas y cinco ecua-
ciones. En todo caso

1 1 x+1 x+1
= − 2 − 2
x(x2 + x + 1) x (x + x + 1) 2 (x + x + 1)
2x2 + x + 1
iii) Descomponer la fracción racional ∈ R(x).
(x − 1)3

La descomposición será de la forma

2x2 + x + 1 a b c
3
= 3
+ 2
+ , con a, b, c ∈ R
(x − 1) (x − 1) (x − 1) (x − 1)

a + b(x − 1) + c(x − 1)2


=
(x − 1)3

89
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Si ponemos y = x − 1, es decir, x = y + 1, resulta

2x2 + x + 1 = 2(y + 1)2 + (y + 1) + 1 = 2y 2 + 4y + 2 + y + 2 = 2y 2 + 5y + 4

Igualando los numeradores de la fracción, se tiene

2y 2 + 5 + 4 = a + by + cy 2 ,
de donde

a = 4, b = 5, c=2
y por lo tanto

2x2 + x + 1 4 5 2
2
= 3
+ 2
+
(x − 1) (x − 1) (x − 1) (x − 1)
Lo anterior es equivalente a desarrollar el numerador de la derecha como
polinomio en x a igualar coeficientes con el numerador de la izquierda.

Mostramos una aplicación en el contexto de sumatorias. Resuelva,


n  
X 83
i=1
(2i − 1)(2i + 1)
Usaremos descomposición en fracciones parciales
 
83 83 1 1
= −
(2i − 1)(2i + 1) 2 2i − 1 2i + 1

Ahora podemos simplificar la suma usando la propiedad telescópica:


n    
83 X 1 1 83 1
− = 1−
2 i=1 2i − 1 2i + 1 2 2n + 1

90
Capı́tulo 4

Números complejos

4.1. Definiciones y propiedades básicas


La teorı́a desarrollada para los polinomios con coeficientes reales es útil, pero
deficiente. En efecto, una de las caracterı́sticas principales de los polinomios son sus
raı́ces, y resulta ser que hay polinomios con coeficientes reales que no tienen raı́ces
reales. Este problema se soluciona si agrandamos el cuerpo de los números reales
para formar un nuevo cuerpo que sı́ contiene todas las raı́ces de los polinomios.
Este cuerpo se llama el cuerpo de los números complejos, y es lo que estudiaremos
en este capı́tulo.
Partiremos definiendo este nuevo cuerpo:
Definición 4.1.1. El cuerpo de los números complejos, denotado por C, es el
conjunto R2 con la suma (o adición) y multiplicación (o producto) definidos por

(a, b) + (c, d) := (a + c, b + d)
(a, b) · (c, d) := (ac − bd, ad + bc)
Resulta rutinario verificar que la suma y multiplicación ası́ definidas son aso-
ciativas y conmutativas y que la multiplicación es distributiva con respecto de la
adición.
Para la adición, el elemento (0, 0) es tal que (a, b) + (0, 0) = (a, b) para todo
(a, b) ∈ R2 y para cada (a, b) se tiene (a, b) + (−a, −b) = (0, 0). Es decir, el inverso
aditivo de (a, b), denotado por −(a, b), corresponde a (−a, −b).
Para la multiplicación, el elemento (1, 0) es tal que (1, 0)(a, b) = (a, b) para
todo (a, b) ∈ R2 .

Si (a, b) 6= (0, 0), la ecuación (a, b)(x, y) = (1, 0) tiene solución. En efecto,
tenemos que (a, b)(x, y) = (1, 0), si y sólo si (ax − by, bx + ay) = (1, 0), y si esto
ocurre entonces

91
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

 
ax − by = 1 a2 x − aby = a a −b
⇒ ⇒ x= , y=
bx + ay = 0 b2 x + aby = 0 a2 +b2 a2 +b2

Luego podemos ver que


 
a −b
(a, b) , 2 = (1, 0),
b + b a + b2
2 2

lo que quiere decir que (a, b) es invertible y su inverso (multiplicativo) es


 
−1 a −b
(a, b) = , .
a2 + b 2 a2 + b 2

Notamos también que si α ∈ R es un número real y (a, b) ∈ C es complejo,


podemos definir el producto de α con (a, b) como

α · (a, b) := (αa, αb).

Es fácil ver que este producto también distribuye tanto con la suma de los números
reales como con la suma de los complejos.
Para los elementos de la forma (a, 0) ∈ C se tiene

(a, 0) + (b, 0) = (a + b, 0)

(a, 0)(b, 0) = (ab, 0)


Entonces, el conjunto {(a, 0)|a ∈ R} ⊆ R2 posee una adición y una multiplica-
ción que replican las operaciones de los números reales. Esto nos permite identificar
a cada elemento (a, 0) con el número real a. Usando palabras técnicas, se dice que
el conjunto de números complejos de la forma (a, 0) es isomorfo al cuerpo de los
números reales.
Miremos ahora el polinomio real f (x) = x2 + 1; observamos que no tiene raı́ces
reales ya que x2 + 1 ≥ 1 para todo x ∈ R. Sin embargo, si identificamos 1 con el
número complejo (1, 0), observamos que

f ((0, 1)) = (0, 1)2 + (1, 0) = (−1, 0) + (1, 0) = (0, 0),

y entonces ¡f sı́ tiene una raı́z en los números complejos! En particular C es un


cuerpo donde algunos de los polinomios con coeficientes reales que no tienen raı́ces
reales sı́ tienen raı́ces complejas. Hablaremos de esto en detalle más adelante.
Se observa, nuevamente, que

(0, 1)2 = (0, 1)(0, 1) = (−1, 0) = −(1, 0),

92
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

y entonces el elemento (0, 1) se puede entender como una “raı́z cuadrada de −1”.

Ahora introduciremos una nueva notación para los números complejos que es
menos incómoda para trabajar en la práctica. Primero, definiremos

i := (0, 1)

1 := (1, 0).
Ası́, podemos escribir

(a, b) = (a, 0) + (0, b) = a(1, 0) + b(0, 1) = a1 + bi,

y este último número lo escribiremos simplemente como a + bi. Por lo tanto, po-
demos ver los números complejos como el conjunto

C := {a + bi : a, b ∈ R},

junto con las operaciones antes definidas. Con esta notación, observamos que

i2 = −1.

Además, queda más evidente que el cuerpo de los números reales es un subcuerpo
de C ya que para todo a ∈ R, a = a + 0 · i ∈ C.
Definición 4.1.2. Si z = a + bi ∈ C, a se llama la parte real z y se escribe
Re(z) = a. El elemento b ∈ R se llama la parte imaginaria de z y se escribe
Im(z) = b.
Recordemos que R posee una relación de orden total denotada por ≤ que cumple

1. a ≤ b, 0 ≤ c ⇒ ac ≤ bc , y

2. a ≤ b ⇒ a + c ≤ b + c para todo c ∈ R.

Examinaremos ahora si podemos extender dicha relación de orden a C, con


propiedades similares. Es decir, queremos ver si esta relación de orden se puede
extender de manera compatible con las operaciones de suma y multiplicación.
Si se quiere una relación de orden total, al tomar por ejemplo el elemento i ∈ C
deberı́a ocurrir que i < 0 o 0 < i.
Si 0 < i, usando 1. se tiene 0 · i < i · i. Es decir, 0 < −1 que es lo mismo que
1 < 0. Sin embargo, si usamos 1. nuevamente, tenemos 0 · −1 < −1 · −1, que es
0 < 1. Es una contradicción pues no podemos tener ambos resultados.
Por otro lado, si i < 0, usamos 2. sumando −i y tenemos 0 < −i. Usando 1.
nuevamente, obtenemos que 0(−i) < (−i)(−i), o sea, 0 < i2 = −1, lo que lleva
nuevamente a una contradicción.

93
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Por lo tanto no podemos encontrar una relación de orden total en C que sea
compatible con la adición y multiplicación en C. Más directamente, vimos que las
condiciones impuestas a la relación de orden en R significaban que todo cuadrado
de un real deberı́a ser no negativo. Aquı́ en C esto es evidentemente imposible,
pues i2 = −1 < 0.

Al construir los números complejos hemos logrado solucionar un cierto proble-


ma: encontrar una solución para la ecuación x2 + 1 = 0, por ejemplo. Pero por
otra parte hemos perdido, para C, una cualidad que tenı́an los números reales: la
relación de orden compatible con sus operaciones. No será la última ocasión en que
ganar la solución a un problema represente una pérdida en algún otro sentido.

4.1.1. ¿Por qué surgen los números complejos?


Se cree que emergieron en el contexto de resolución de ecuaciones de tercer
grado, en el conjunto de números reales. Esto es, emergieron en la búsqueda de
soluciones reales a ecuaciones de la forma

ax3 + bx2 + cx + d = 0,

de la misma forma que ya se conocı́a para ecuaciones cuadráticas. El registro más


antiguo que se conoce de un método algebraico para resolverlas es un libro del
matemático italiano Cardano (1501-1576). Pero hay historiadores que lo atribuyen
en realidad a otros matemáticos italianos (anteriores): Del Ferro (1465-1526) y
Niccolò Fontana (1500-1557, conocido como Tartaglia). Se conoce que del Ferro
sabı́a resolver ecuaciones del tipo x3 + ax = b, y que Tartaglia lo amplió a cualquier
tipo de ecuación cúbica.
El método es como sigue:

1. Dada una ecuación cúbica general; i.e., ax3 + bx2 + cx + d = 0, se realizan


una serie de operaciones para dejarla de la forma x3 + px = q. Primero se
divide por a, quedando
b c d
x3 + x2 + x + = 0.
a a a
Luego se realiza el cambio de x por x−b/(3a), con lo que queda otra ecuación
cúbica de la forma x3 + px + q = 0, con

3ac − b2
p= ,
3a2
2b3 bc d
q= 3
− 2+ .
27a 3a a

94
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

2. Del Ferro sugirió que para encontrar una raı́z real hay que usar x = u + v y
tomar la expresión
(u + v)3 + p(u + v) + q = 0 ⇔ (u3 + v 3 ) + (u + v)(3uv + p) = −q,
como un sistema de ecuaciones
(
u3 + v 3 = −q
3uv = −p

3. Una vez encontrados u y v, se obtiene x. Finalmente se deshacen los reem-


plazos hechos y se resuelve ası́ la ecuación original.
El método funcionaba bien salvo en algunos casos. Por ejemplo, si intentamos
resolver x3 − 15x − 4 = 0, hacemos el cambio de variable x = u + v y quedamos
con u3 + v 3 + (u + v)(3uv − 15) = 4. Esto da el sistema
(
u3 + v 3 = 4
3uv = 15 ⇒ u = v5

Reemplazamos la segunda expresión en la primera y tenemos


v 6 − 4v 3 + 125 = 0.
Podemos hacer el reemplazo w = v 3 y tenemos una cuadrática
w2 − 4w + 125 = 0,
la que podemos resolver usando la conocida fórmula
√ √
4 ± 42 − 4 · 125 −484
w= =2± .
2 2
Sin embargo, ¿qué es este último número? No es un número real ya que −484 no
tiene raı́z cuadrada real. ¿Se concluye entonces que no hay solución? ¡De ninguna
manera! Podemos darnos cuenta que x = 4 es solución, y además, usando lo que
sabemos de polinomios, determinamos que las otras dos raı́ces son
√ √
−2 + 3 y − 2 − 3.

√ ¿Será que el método falla? Veamos qué ocurre si imaginamos por un rato que
−484 = 22i, donde i es el número complejo introducido arriba. Entonces la
ecuación cuadrática sı́ tiene solución imaginaria
w = 2 ± 11i.
¿Cómo se sigue?

95
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

4.1.2. El plano complejo.


Pensar en los números complejos como pares ordenados de números reales está
muy relacionado con la interpretación geométrica de los complejos, lo que tiene una
infinidad de aplicaciones. A cada número complejo z = a+bi le asociamos un punto
(a, b) en el plano cartesiano. Esta idea fue introducida por Argand (1768-1822) y
Gauss (1777-1855).
Definición 4.1.3. Un complejo de la forma a + 0i para a ∈ R se llama un real
puro (o simplemente real), y corresponde a un punto en el eje x del plano complejo,
llamado eje real. Un complejo de la forma 0 + bi con b ∈ R se llama un imaginario
puro y corresponde a un punto en el eje Y , llamado eje imaginario.
Definición 4.1.4. Dado z = a + bi, se definen el conjugado de z como el complejo
z = a√− bi y el módulo (o valor absoluto) de z como el número real no negativo
|z| = a2 + b2 .
Observación 4.1.5. z = z ⇔ z es un real puro.
Observación 4.1.6. La función f : C −→ C, definida por f (z) = z es biyectiva
y se llama conjugación. Geométricamente, se trata de una reflexión del plano R2
respecto del eje X, como muestra la figura 4.1.

Figura 4.1: Conjugación compleja.


Observación 4.1.7. Respecto al módulo de z ∈ C, |z| = a2 + b2 ≥ 0. Se observa
que |z|2 = z z̄. Gráficamente, el número |z| representa en el plano la distancia entre
z y el origen del sistema de coordenadas, como se ve en la figura 4.2.

96
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Figura 4.2: Módulo de un complejo

En la figura 4.2 es fácil notar que Re(z) ≤ |z| e Im(z) ≤ |z|.



Si en particular z = a es un número real, |z| = a2 . Pero esto coincide con el
valor absoluto del número real a, lo que quiere decir que el concepto de módulo de
un complejo extiende el concepto de valor absoluto de los reales a los complejos.

Proposición 4.1.8. Para todo z, z 0 ∈ C, se tienen las propiedades siguientes:

1. |z| ≥ 0, y |z| = 0 ⇔ z = 0.

2. |z|2 = zz, |z| = |z|.

3. z = z, z + z = 2Re(z), z − z = 2iIm(z), Re(z) ≤ |z|.

4. z + z 0 = z + z 0 .

5. zz 0 = zz 0 , |zz 0 | = |z||z 0 |,

6. |z + z 0 | ≤ |z| + |z 0 | (Desigualdad Triangular o Desigualdad de Minkowski).

Demostración. Resolvamos 2. y 6. y los demás items quedan de ejercicio.


Para el número 2., sea z = a+bi. Luego su conjugado se escribe como z = a−bi,
y
zz = (a + bi)(a − bi) = a2 + b2 = |z|2 .
Para el número 6., si z = 0 o z 0 = 0, se cumple de inmediato la propiedad.
Supongamos entonces que z, z 0 6= 0. Usando 2. y la distributividad, se tiene que

|z + z 0 |2 = (z + z 0 )(z + z 0 )
= (z + z 0 )(z + z 0 )
= zz + zz 0 + z 0 z + z 0 z 0
= |z|2 + zz 0 + z 0 z + |z 0 |2 .

97
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Usando las propiedades 5. y 3. se tiene que zz 0 = zz 0 = z 0 z. Luego,

zz 0 + z 0 z = 2Re(zz 0 ) ≤ 2|zz 0 | = 2|z||z 0 | = 2|z||z 0 |.

Reemplazando esto en la expresión anterior, se obtiene

|z + z 0 |2 ≤ |z|2 + 2|z||z 0 | + |z 0 |2 = (|z| + |z 0 |)2 .

Como z, z 0 6= 0, |z + z 0 | > 0 y también |z| + |z 0 | > 0, podemos sacar raı́z cuadrada


a esta desigualdad y obtenemos que |z + z 0 | ≤ |z| + |z 0 |.

Como corolario, podemos encontrar de manera fácil la inversa multiplicativa de


un número complejo:

Corolario 4.1.9. Si z 6= 0, entonces z −1 = z


|z|2
.
3−2i
Ejemplo 4.1.10. Escriba en la forma cartesiana a + bi el complejo 4+5i
.

Solución: De la misma manera que se hace para racionalizar el denominador


cuando uno tiene una raı́z en el denominador de una fracción real, debemos sacar
el 4 + 5i del denominador. Como zz ∈ R para todo z ∈ C, multiplicaremos el
complejo arriba y abajo por el conjugado de 4 + 5i:

3 − 2i 3 − 2i 4 − 5i 12 − 8i − 15i + 10i2 2 − 23i 2 23


= · = = = − i.
4 + 5i 4 + 5i 4 − 5i 16 + 25 41 41 41
2 23 3−2i
Luego 41
− 41
i es la forma cartesiana de 4+5i
.

Ejercicio 4.1.11. Escriba en la forma cartesiana a + bi los siguientes complejos:

2 − 3i i(−5i − 3)
, .
(1 − 4i)(2 − i) (8 − 2i)(−3 + 4i)
Ejercicio 4.1.12. Pruebe que para todo zi ∈ C y para todo n ∈ N, se tiene

|z1 + · · · zn | ≤ |z1 | + · · · |zn |

Ejemplo 4.1.13. Sean z, z 0 ∈ C entonces

1. |z − z 0 | ≥ ||z| − ||z 0 ||.

2. Si z, z 0 6= 0, entonces |z + z 0 | = |z| + |z 0 | ⇔ ∃r ∈ R con r > 0 tal que z = rz 0 .

98
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Solución: 1. Tenemos que z = z − z 0 + z 0 , y usando la Desigualdad Triangular


tenemos que |z| ≤ |z − z 0 | + |z 0 |. Por lo tanto,

|z| − |z 0 | ≤ |z − z 0 |.

Como |z − z 0 | = |z 0 − z|, se tiene análogamente que |z 0 | − |z| ≤ |z 0 − z|., o en otras


palabras
−|z 0 − z| ≤ |z| − |z 0 |.
Estas dos desigualdades implican que

−|z 0 − z| ≤ |z| − |z 0 | ≤ |z − z 0 |,

de donde |z − z 0 | ≥ ||z| − ||z 0 ||.

2. Es claro que si z = rz 0 con r real positivo, entonces

|z + z 0 | = |rz 0 + z 0 | = |(r + 1)z 0 | = (r + 1)|z 0 | = r|z 0 | + |z 0 | = |z| + |z 0 |.

Sea ahora z 0 6= 0 y probaremos que z/z 0 ∈ R. Como |z + z 0 | = |z| + |z 0 |, se tiene


que
z z
1+ 0 =1+ 0 .
z z
0
Si llamamos w = z/z , tenemos que |1 + w| = 1 + |w|. Debemos probar que w = w.
Para esto, como |1 + w| = 1 + |w| entonces |1 + w|2 = (1 + |w|)2 y luego
(1 + w)(1 + w) = 1 + 2|w| + |w|2 . Por lo tanto, 1 + (w + w) + |w|2 = 1 + 2|w| + |w|2 .
De aquı́ sigue que w + w = 2|w|. Elevando ambos lados al cuadrado, obtenemos
que w2 + 2|w|2 + w2 = 4|w|2 , es decir,

0 = w2 − 2|w|2 + w2 = (w − w)2 ,

lo que implica que w = w y w es real.

Observación 4.1.14. En el ejercicio anterior se necesita que r sea positivo, pues


en C no hay √ orden y si se toma √ z = −4 − 2i y z 0 = 2 + i entonces z = −2z 0 , pero
|z + z 0 | = 5 y |z| + |z 0 | = 3 5.

Lo que queremos hacer en lo que sigue es ver una forma conveniente de repre-
sentar los números complejos no nulos. Para esto necesitamos desarrollar algunos
preliminares de funciones trigonométricas.

99
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

4.2. Trigonometrı́a
4.2.1. Ángulos en radianes y funciones seno y coseno
En una circunferencia de centro O y radio r, la medida de un ángulo central es
proporcional a la medida del arco que sustenta. Definimos entonces la medida en
radianes del ángulo como el cociente l/r donde l es la medida del arco sustentado
por el ángulo. Ello permite que la medida del ángulo en radianes sea independiente
del radio de la circunferencia.
De ese modo, como un ángulo recto sustenta un arco que es la cuarta parte
del perı́metro de la circunferencia, su medida en radianes será (2πr/4)/r = π/2.
Asimismo, la medida en radianes de un ángulo extendido es π, ya que sustenta un
arco que es la mitad del perı́metro. El valor 2π es el cociente entre el perı́metro
de la circunferencia y su radio (es lo que permite definir π) y mide en radianes al
ángulo máximo visible, un giro completo.
Ángulos en radianes de medida mayor que 2π representan una superposición
de ángulos, en que se realiza un giro completo (o más de uno) y algún ángulo más.
Desde el punto de vista de arco, se trata de un arco que mide la longitud de una
trayectoria superior al perı́metro de la circunferencia.
Consideraremos las funciones trigonométricas con dominios los números reales.
Para ello usaremos que cada número real t está en correspondencia uno a uno con
un ángulo que mide t radianes. Para visualizar esta correspondencia usaremos una
circunferencia centrada en (0,0) y de radio 1, llamada la circunferencia unitaria,
la cual denotaremos por S 1 . Podemos escribirla en sı́mbolos como

S 1 := {(x, y) ∈ R2 : x2 + y 2 = 1}

o también como el conjunto de todos los números complejos z tales que |z| = 1.
En particular, la medida en radianes de un ángulo central en S 1 coincide con
la medida del arco sustentado.
Definición 4.2.1. Sea P : R → S 1 la función definida por:
1. P (0) := (1, 0) (punto inicial)
2. Si t ∈ R+ , sea P (t) el punto de S 1 obtenido al recorrer una longitud t desde
P (0), como arco en S 1 , y en sentido antihorario.
3. Si t ∈ R− , sea P (t) el punto de S 1 obtenido al recorrer una longitud |t| desde
P (0), como arco en S 1 , y en sentido horario.
Definición 4.2.2. Se definen las funciones seno, denotada sen : R → R, y coseno,
denotada cos : R → R, como las funciones que cumplen

P (t) = (cos(t), sen(t))

100
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

De la definición y de los cuadrantes se obtiene de inmediato:

Propiedades 4.2.3 (Signos). Para todo t ∈ R se cumple:

1. 0 < t < π2 ⇒ sen(t) > 0 ∧ cos(t) > 0




2. π2 < t < π ⇒ sen(t) > 0 ∧ cos(t) < 0




3. π < t < 3π

2
⇒ sen(t) < 0 ∧ cos(t) < 0

4. 3π

2
< t < 2π ⇒ sen(t) < 0 ∧ cos(t) > 0

Propiedades 4.2.4. Tenemos las siguientes identidades:

1. Identidad Pitagórica: ∀ t ∈ R sen2 (t) + cos2 (t) = 1, donde cosk (t) abrevia a
(cos(t))k , y senk (t) abrevia a (sen(t))k .

2. ∀t ∈ R − 1 ≤ sen(t) ≤ 1 ∧ −1 ≤ cos(t) ≤ 1 .

3. cos(0) = 1 y sen(0) = 0.

4. cos( π2 ) = 0 y sen( π2 ) = 1.

5. cos(π) = −1 y sen(π) = 0.

6. cos( 3π
2
) = 0 y sen( 3π
2
) = −1.

7. cos(2π) = 1 y sen(2π) = 0.

101
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración. Las propiedades 1 y 2 son consecuencia directa de que P (t) ∈ S 1


para todo t ∈ R. Las otras propiedades las dejamos como ejercicio.
π  π 
Ejemplo 4.2.5. Pruebe que sen = cos = √12 .
4 4
Solución: Dibuje B = P ( π4 ) en la circunferencia unitaria. Por B trace una paralela
al eje Y que corta en C al eje X. El triángulo OCB es isósceles,  donde O = (0, 0)
π π
es el centro de la circunferencia. Luego OC = CB, es decir, sen = cos .
π  π  4  π 4
Usando la identidad Pitagórica sen2 +cos2 = 1, se tiene que 2 sen2 =
π  4 4 4
1, luego, sen = √12 , pues el ángulo que mide π4 radianes está en el primer
4 π  π 
cuadrante. Por lo tanto, sen = cos = √12 .
4 4

Propiedades 4.2.6. 1. ∀x ∈ R sen(−x) = − sen(x) ∧ cos(−x) = cos(x)

2. ∀x, y ∈ R cos(x − y) = cos(x) cos(y) + sen(x) sen(y)

3. ∀x, y ∈ R cos(x + y) = cos(x) cos(y) − sen(x) sen(y)

4. ∀y ∈ R cos π2 − y = sen(y) ∧ sen π2 − y = cos(y)
 


5. ∀x, y ∈ R sen(x + y) = sen(x) cos(y) + cos(x) sen(y)

6. ∀x, y ∈ R sen(x − y) = sen(x)cos(y) − cos(x) sen(y)

7. ∀ x ∈ R sen(2x) = 2 sen(x) cos(x).

8. ∀ x ∈ R cos(2x) = cos2 (x) − sen2 (x).

Demostración. Demostraremos en clases 1 y 2, y a partir de ellas se deducen las


demás afirmaciones; lo que se deja como ejercicio.
 √
Ejercicio 4.2.7. Pruebe que sen( π6 ) = cos( π3 ) = 21 y que cos π6 = sen π3 = 23


Teorema 4.2.8 (Periodicidad). Para todos x ∈ R y k ∈ Z se cumplen cos(x +


2kπ) = cos(x) y sen(x + 2kπ) = sen(x).

Demostración. Sean x ∈ R y k ∈ Z. Entonces

cos(x + 2kπ) = cos(x) cos(2kπ) − sen(x) sen(2kπ)


sen(x + 2kπ) = cos(x) sen(2kπ) + sen(x) cos(2kπ)

102
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Pero P (2kπ) = P (0) = (1, 0) dado que 2kπ es |k| veces el perı́metro de la circun-
ferencia unitaria S 1 , por lo cual

cos(x + 2kπ) = cos(x) · 1 − sen(x) · 0 = cos(x)


sen(x + 2kπ) = cos(x) · 0 + sen(x) · 1 = sen(x)

Función seno

Función coseno

4.2.2. Más funciones trigonométricas


En esta sección veremos algunas funciones más que se pueden derivar de seno
y coseno.
sin(x)
Definición 4.2.9. 1. Definimos la función tangente como tan(x) := cos(x)
; no-
tamos que su dominio es {x ∈ R| cos(x) 6= 0}.

103
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

1
2. Definimos la función secante por sec(x) := cos(x)
; tiene el mismo dominio que
tan(x).

1
3. Definimos la función cosecante por cosec(x) := sen(x)
; su dominio es el con-
junto {x ∈ R| sin(x) 6= 0}.

104
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

cos(x)
4. Definimos la función cotangente por cot(x) := sen(x)
; tiene el mismo dominio
que cosec(x).

Ejercicio 4.2.10. Sean x, y ∈ R tales que cos(x) 6= 0 y cos(y) 6= 0. Pruebe que


1. (cos(x + y) = 0 ⇔ 1 − tan(x) tan(y) = 0).
 tan(x) + tan(y) 
2. cos(x + y) 6= 0 ⇒ tan(x + y) = .
1 − tan(x) tan(y)

105
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

4.2.3. Identidades trigonométricas


Definición 4.2.11. Una identidad trigonométrica es una igualdad que involu-
cra funciones trigonométricas y que es una expresión válida para todo número que
pertenezca a la intersección de los dominios de las funciones involucradas.

En lo que sigue, haremos uso extensivo de las siguientes identidades polinomia-


les:

Observación 4.2.12. Para todo x, y ∈ R, se tiene que

1. x2 − y 2 = (x + y)(x − y).

2. x3 + y 3 = (x + y)(x2 − xy + y 2 ).

3. x3 − y 3 = (x − y)(x2 + xy + y 2 ).

Ejemplo 4.2.13. La igualdad 1+tan2 (x) = sec2 (x) es una identidad trigonométri-
ca, ya que se cumple

∀x ∈ R cos(x) 6= 0 ⇒ 1 + tan2 (x) = sec2 (x) .




Demostración: Sea x ∈ R tal que cos(x) 6= 0. La Identidad Pitagórica establece


que sen2 (x) + cos2 (x) = 1, y dividiendo por cos2 (x), que no es nulo, se obtiene
 2  2
sen(x) 1
+1= . Es decir, tan2 (x) + 1 = sec2 (x).
cos(x) cos(x)
Ejercicio 4.2.14. Averigue si las siguientes iguladades son identidades trigo-
nométricas:
2
1. sen(t) + cos(t) = 1.
   
sen(x+h)−sen(x) sen(h) cos(h)−1
2. ∀h ∈ R, h 6= 0, h
= cos(x) h
+ sen(x) h
.

2 tan(x)
3. tan(2x) = 2−sec2 (x)
.
 
3
4. sen(4x) = 4 cos(x) sen(x) − 2 sen (x) .

5. cos(2x) = cos4 (x) − sen4 (x).

Ejercicio 4.2.15. Encuentre una igualdad similar al ejercicio anterior, Parte 2.,
para la función coseno.

Ejemplo 4.2.16. Demuestre que ∀x ∈ R 1 − cos4 (x) = sen2 (x)(2 − sen2 (x))

106
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Solución: Para x ∈ R arbitrario se tiene

1 − cos4 (x) =(1 − cos2 (x))(1 + cos2 (x)) = sen2 (x)(1 + (1 − sen2 (x))
= sen2 (x)(2 − sen2 (x))

Ejemplo 4.2.17. Demuestre que


 cos3 (x) + sen3 (x) 
∀x ∈ R cos(x) + sen(x) 6= 0 ⇒ = 1 − sen(x) cos(x)
cos(x) + sen(x)

Solución: Sea x ∈ R tal que cos(x)+sen(x) 6= 0. Como a3 +b3 = (a+b)(a2 −ab+b2 )


se cumple para todos a, b ∈ R, entonces
 
cos3 (x) + sen3 (x) cos(x) + sen(x) cos2 (x) − cos(x) sen(x) + sen2 (x)
=
cos(x) + sen(x) cos(x) + sen(x)
2 2
= cos (x) + sen (x) − cos(x) sen(x) = 1 − cos(x) sen(x)

Ejercicio 4.2.18. Demuestre las siguientes identidades trigonométricas:



1. ∀x ∈ R cos(x) sen(x) 6= 0 ⇒ sec2 (x) + cosec2 (x) = sec2 (x) cosec2 (x)
 sen(x) + tan(x) 
2. ∀x ∈ R cos(x) ∈/ {0, −1} ⇒ = tan(x)
1 + cos(x)
 x + y   x − y 
3. ∀x, y ∈ R sen(x) + sen(y) = 2 sen cos
2 2
 x + y   x − y 
4. ∀x, y ∈ R sen(x) − sen(y) = 2 cos sen
2 2
 x + y   x − y 
5. ∀x, y ∈ R cos(x) + cos(y) = 2 cos cos
2 2
 x + y   x − y 
6. ∀x, y ∈ R cos(x) − cos(y) = −2 sen sen
2 2

4.2.4. Triángulos rectángulos


Sea A, B, C triángulo rectángulo en B, de lados a, b, c y ángulos α, β, γ.
Dibuje un sistema coordenado de tal forma que el triángulo dado tenga el vértice
A coincidente con el origen O = (0, 0) y lado c coincidente con eje X, como muestra
la figura 4.3.
Ahora, en A trace una circunferencia unitaria que corta al lado b en el punto T.
Como α es agudo hay x, 0 ≤ x ≤ π2 tal que T = P (x) midiendo α en x radianes.
Por T trace una paralela al eje Y que corta al eje X en el punto M . Ver figura 4.4.

107
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Figura 4.3: Triángulo rectángulo

Figura 4.4: Triángulo rectángulo y trigonometrı́a

108
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

MT BC
El triángulo A, M, T es semejante al triángulo A, B, C. Luego AT
= AC
, es
decir, T 1M = BC
AC
, o bien T M = BC
AC
. Por lo tanto,
BC cateto opuesto al ángulo α
sen(x) = = = sen(α)
AC hipotenusa del triángulo A, B, C
Ası́, sen(x) = sen(α), donde x es la medida en radianes del ángulo α.
De igual manera se prueba que
AB cateto adyacente al ángulo α
cos(x) = = = cos(α)
AC hipotenusa del triángulo A, B, C
Ası́, cos(x) = cos(α), donde x es la medida en radianes delángulo α.
Observación 4.2.19. Note que si las medidas del triángulo dado hacen que quede
inscrito en la circunferencia, puede prolongar los lados del triángulo y obtendrá
las mismas conclusiones. El reconocer que las funciones trigonométricas estudia-
das corresponden a estas proporciones dentro de un trángulo rectángulo, abre la
oportunidad de usar esto para problemas concretos los que llevan a lo que se llama
Resolución de triángulos. En este contexto hay dos teoremas que son de utilidad y
conviene conocer aunque aquı́ no los profundizaremos.
Teorema 4.2.20. Teorema del seno: Sea A, B, C triángulo cualesquiera, de lados
a, b, c y ángulos α, β, γ, entonces
sen(α) sen(β) sen(γ)
= =
a b c
Demostración. Trace la altura hc desde el vértice C hasta el lado c del triángulo,
que corta al lado c en M. Se forman dos triángulos rectángulos AM C y BM C.
Se tiene que sen(α) = hbc , luego hc = b sen(α). Por otro lado sen(β) = hac , luego
hc = a sen(β). Por lo tanto b sen(α) = a sen(β). Ası́

sen(α) sen(β)
= . (4.1)
a b
En forma similar usando la altura ha se demuestra que

sen(β) sen(γ)
= . (4.2)
b c
Usando (4.1) y (4.2) se tiene el Teorema del seno.
Teorema 4.2.21. Teorema del coseno: Sea A, B, C triángulo cualesquiera, de lados
a, b, c y ángulos α, β, γ, entonces
a2 = b2 + c2 − 2bc cos(α)
b2 = a2 + c2 − 2ac cos(β)
c2 = a2 + b2 − 2ab cos(γ)

109
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración. Sea A, B, C triángulo cualesquiera de lados a, b, c y ángulos α, β, γ,


dibuje un sistema coordenado de forma de tener el triángulo dado con el vértice
A coincidente con el origen O = (0, 0) y lado c coincidente con eje X. Luego
B = (c, 0). Trace la altura hc desde el vértice C hasta el lado c del triángulo, que
corta al lado c en M.
Ası́ cos(α) = AMb
y sen(α) = hbc . Entonces C = (b cos(α), b sen(α)). Por lo tanto
p
a = distancia entre C y B = (c − b cos(α))2 + (b sen(α))2 .
Luego a2 = (c − b cos(α))2 + (b sen(α))2 = c2 − 2bc cos(α) + b2 cos2 (α) +
b sen2 (α) = c2 + b2 − 2bc cos(α). Luego
2

a2 = b2 + c2 − 2bc cos(α)

Ahora, dibuje un sistema coordenado de forma de tener el triángulo dado con


el vértice B coincidente con el origen O = (0, 0) y lado a coincidente con eje X.
Luego C = (a, 0). Se usa que b = distancia entre A y C y se demuestra que

b2 = a2 + c2 − 2ac cos(β)

Finalmente, dibuje un sistema coordenado de forma de tener el triángulo dado


con el vértice C coincidente con el origen O = (0, 0) y lado b coincidente con eje
X. Luego A = (b, 0). Se usa que c = distancia entre B y A y se demuestra que

c2 = a2 + b2 − 2ab cos(γ)

4.3. Trigonometrı́a y números complejos


4.3.1. La representación polar de un número complejo
Sea z = a + bi ∈ C un número complejo no nulo, y sea θ ∈ [0, 2π) el ángulo
que forma el semieje positivo X con la recta que une (0, 0) con (a, b) medido en
sentido contrario a los punteros del reloj. Entonces
a a b b
cos(θ) = √ = , sen(θ) = √ = ,
a2 + b2 |z| a2 + b 2 |z|

y por lo tanto
z = |z|[cos(θ) + isen(θ)].
Esta manera de escribir z es llamada la forma polar o trigonométrica de z, y
el ángulo θ se llama el argumento de z y se denota por Arg(z). Observe que el
argumento de 0 no está bien definido.

110
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Observación 4.3.1. También se usa la notación [cos(θ) + i sen(θ)] =: cis(θ).


Ejemplo 4.3.2. 1 = 1(cos(0) + i sen(0)), i = 1(cos( π2 ) + i sen( π2 )).

Ejemplo 4.3.3. Encuentre la forma polar del complejo z = 1 − 3i.
√ q √
Solución: Sea z = 1 − 3i. Entonces |z| = 12 + (− 3)2 = 2. Además sen(θ) =

− 23 , cos(θ) = 12 y θ está en el cuarto cuadrante. Luego Arg(z) = θ = 2π − π3 = 5π
,
√ 3
y entonces la forma polar de z = 1 − 3i es z = 2[cos( 5π 3
) + isen( 5π
3
)].
Ejercicio 4.3.4. Encuentre la forma polar de z = 1 − i
Ejemplo 4.3.5. Encuentre la forma cartesiana del complejo z = 8(cos( 7π
6
)+

i sen( 6 )).

Solución: cos( 7π ) = cos(π + π6 ) = − cos( π6 ) = − 23 y sen( 7π ) = sen(π + π6 ) =
6 √ 6
− sen( π6 ) = − 12 . Luego la forma cartesiana de z es z = −4 3 − 4i.
Observación 4.3.6. a) Si z = 0, entonces su notación polar es por definición 0.
b) Si z 6= 0, entonces su notación polar es r(cos(θ) + i sen(θ), con r = |z| >
0. Por ejemplo, −2(cos( π4 ) + i sen( π
√ 4 √
) no está en√forma√ polar, su forma polar es
2(cos(


4
) + i sen( 4 )).√ Pues −2( 2 + i 22 ) = 2(− 22 − i 22 ) y θ es tal que cos(θ) =
5π 2

− 22 ∧ sen(θ) = − 22 , luego θ en el tercer cuadrante y θ = π + π4 = 5π 4


.
Observación 4.3.7. Dado un número complejo z = a + ib, las coordenadas
(a, b) de z se llaman coordenadas cartesianas. Si escribimos la forma polar de
z = |z| [cos(θ) + isen(θ)], tenemos las coordenadas polares de z y son (|z|, Arg(z)).

111
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejemplo 4.3.8. Dado z = r[cos(θ) + isen(θ)], escriba z en coordenadas polares.

Solución: z = r[cos(θ) + isen(θ)], r = |z|. Luego, z = r(cos(θ) − isen(θ)) =


r(cos(2π − θ) + isen(2π − θ)), ası́, |z| = |z| y Arg(z) = 2π− Arg(z). Por lo tanto,
las coordenadas polares de z son (r, 2π − Arg(z)).
Demuestre las siguientes propiedades:

Proposición 4.3.9. Dados los siguientes números complejos z = |z|[cos(θ) +


isen(θ)], z 0 = |z 0 |[cos(θ0 ) + isen(θ0 )] ∈ C, pruebe que

1. zz 0 = |zz 0 |[cos(θ + θ0 ) + isen(θ + θ0 )].


|z|
2. z
z0
= |z 0 |
[cos(θ − θ0 ) + isen(θ − θ0 )].

3. z −1 = |z|−1 [cos(2π − θ) + isen(2π − θ)], si z 6= 0.

Demostración. Sea z = |z|[cos(θ) + isen(θ)], z 0 = |z 0 |[cos(θ0 ) + isen(θ0 )] ∈ C,


entonces

1.

zz 0 = |z||z 0 |[cos(θ) + isen(θ)][cos(θ0 ) + isen(θ0 )] = |z||z 0 |[cos(θ)cos(θ0 )+

icos(θ)sen(θ0 ) + isen(θ)cos(θ0 ) − sen(θ)sen(θ0 )]


= |z||z 0 |[cos(θ)cos(θ0 ) − sen(θ)sen(θ0 ) + i(cos(θ)sen(θ0 ) + sen(θ)cos(θ0 ))
= |zz 0 |[cos(θ + θ0 ) + isen(θ + θ0 )]

2.
z |z| [cos(θ) + isen(θ)] |z| [cos(θ) + isen(θ)][cos(θ0 ) − isen(θ0 )]
= =
z0 |z 0 | [cos(θ0 ) + isen(θ0 )] |z 0 | [cos(θ0 ) + isen(θ0 )][cos(θ0 ) − isen(θ0 )]

|z| cos(θ)cos(θ0 ) + sen(θ)sen(θ0 ) − icos(θ)sen(θ0 ) + isen(θ)cos(θ0 )


=
|z 0 | cos2 (θ0 ) + sen2 (θ0
|z|
= [cos(θ − θ0 ) + isen(θ − θ0 )].
|z 0 |
Por lo tanto,
z |z|
0
= 0 [cos(θ − θ0 ) + isen(θ − θ0 )].
z |z |

3. Se obtiene usando 2., junto con las identidades 1 = cos(0) + isen(0) y


cos(−θ) = cos(2π − θ) y sen(−θ) = sen(2π − θ).

112
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Observación 4.3.10. Recuerde que Arg(z) ∈ [0, 2π), ası́ que si el ángulo no
cumple esto debe reducirlo sumándole un múltiplo entero de 2π. Notar que la
Proposición 4.3.9 nos dice que
1. Arg(zz 0 ) = Arg(z)+ Arg(z 0 ),
2. Arg( zz0 ) =Arg(z)− Arg(z 0 )
3. Arg (z −1 ) = 2π− Arg(z).

Figura 4.5: Producto de complejos

Ejercicio 4.3.11. Encuentre la forma polar de los complejos


1−i
z = (1 − i)(3 + 3i) ∧ z = .
3 + 3i
Ejemplo 4.3.12. Escriba en la forma cartesiana a + bi el complejo zz0 , donde
    
5π 5π 1h π   π i
z = 4 cos + isen , z0 = cos + isen .
12 12 2 4 4

Solución: Sean θ = 5π
12
, θ0 = π4 , entonces por la Proposición 4.3.9 parte b. tenemos
que
    
z |z| 0 0 4 5π π 5π π
= 0 [cos(θ − θ ) + isen(θ − θ )] = 1 cos − + isen − =
z0 |z | 2
12 4 12 4
"√ #
h π   π i 3 1 √
8 cos + isen =8 + i = 4 3 + 4i.
6 6 2 2

113
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

4.3.2. Potencias de números complejos.


Usando la forma polar de un número complejo, es bastante sencillo elevar un
complejo a cualquier potencia natural.

Teorema 4.3.13. (Teorema de de Moivre) Sea z = |z| [cos(θ) + isen(θ)] ∈ C


un número complejo no nulo. Entonces
z n = |z|n [cos(nθ) + isen(nθ)] ∀ n ∈ N.
Demostración. Usaremos inducción sobre n. Para n = 1, el resultado es evidente.
Supongamos entonces que para n ∈ N se tiene z n = |z|n [cos(nθ) + isen(nθ)];
demostraremos que z n+1 = |z|n+1 [cos((n + 1)θ) + isen((n + 1)θ)].
Usando la definición de potencia y la hipótesis de inducción se tiene:
z n+1 = z n z = |z|n [cos(nθ) + isen(nθ)]|z| [cos(θ) + isen(θ)]
= |z|n |z|(cos(nθ)cos(θ) − sen(nθ)sen(θ) + i(sen(nθ)cos(θ) + cos(nθ)sen(θ))
= |z|n+1 [(cos(nθ + θ) + isen(nθ + θ)] = |z|n+1 [(cos((n + 1)θ) + isen((n + 1)θ)].
Luego,
z n+1 = |z|n+1 [cos((n + 1)θ) + isen((n + 1)θ)]
y por el Principio de Inducción
z n = |z|n [cos(nθ) + isen(nθ)] ∀n ∈ N.

Ejemplo 4.3.14. Probar que:


1. Si z ∈ C, entonces z n z k = z n+k , ∀n, k ∈ N.
2. i3 = −i, i4 = 1, i4k+n = in ∀ n, k ∈ N.

Solución: 1. Si z = 0 entonces el resultado es evidente. Si z 6= 0, podemos escribir


z = cos(θ) + isen(θ), y luego el Teorema de de Moivre nos asegura que z n =
|z|n [cos(nθ) + isen(nθ)], z k = |z|k [cos(kθ) + isen(kθ)], ∀ n, k ∈ N. Luego por
Proposición 4.3.9 parte a) se tiene:

z n z k = |z|n |z|k [cos((n+k)θ)+isen((n+k)θ)] = |z|n+k [cos((n+k)θ)+isen((n+k)θ)] = z n+k


para todo n, k ∈ N.
2. Ejercicio.

Ejercicio 4.3.15. Escriba en la forma cartesiana a + bi el complejo (2 3 + 2i)12 .
Ejemplo 4.3.16. Encuentre todas las soluciones de las ecuaciones x3 − 1 = 0 y
(x + 3)3 = x3 .

114
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

4.3.3. Raı́ces de un número complejo.


Dado z = |z| [cos(θ) + isen(θ)] ∈ C, queremos encontrar las raı́ces n-ésimas de
z, n ∈ N. Es decir, queremos encontrar todos los números complejos w ∈ C tales
que wn = z.
Si w = |w|[cos(Φ) + isen(Φ)], entonces wn = z sı́ y sólo sı́ |w|n [cos(Φ) +
isen(Φ)] = |z| [cos(θ)+isen(θ)], sı́ y sólo sı́ |w|n [cos(nΦ)+isen(nΦ)] = |z| [cos(θ)+
isen(θ)] sı́ y sólo sı́

|w|n = |z|, sen(nΦ) = sen(θ), cos(nΦ) = cos(θ).

Por lo tanto,
1
|w| = |z| n , nΦ = θ + 2kπ, k ∈ Z.
Luego,
1 θ + 2kπ
|w| = |z| n , Φ = , k ∈ Z.
n
Con esto para θ medido en radianes y para cada k = 0, 1, · · · , n−1, los números
complejos     
1 θ + 2kπ θ + 2kπ
wk = |z| n cos + isen
n n
son todas las raı́ces n-ésimas distintas de z.

Ejemplo 4.3.17. Encuentre las raı́ces cúbicas de z = i y expréselas en la forma


a + bi.

Solución: |z| = 1 y θ = π2 . Luego


    
1 π/2 + 2kπ π/2 + 2kπ
wk = 1 3 cos + isen , k = 0, 1, 2.
3 3
Luego, las tres raı́ces cúbicas de i son:
π  √
π  3 1
k = 0, w0 = cos + isen = + i
6 6 2 2
        √
π 2π π 2π 5π 5π − 3 1
k = 1, w1 = cos + +isen + = cos +isen = + i
6 3 6 3 6 6 2 2
       
π 4π π 4π 3π 3π
k = 2, w2 = cos + + isen + = cos + isen =−i
6 3 6 3 2 2
Ejemplo 4.3.18. Encuentre las raı́ces cúbicas de z = 1 y expréselas en la forma
a + bi.

115
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Solución: |z| = 1 y θ = 0. Luego


    
1 2kπ 2kπ
wk = 1 3 cos + isen , k = 0, 1, 2.
3 3

Luego, las tres raı́ces cúbicas de 1 son:

k = 0, w0 = cos(0) + isen(0) = 1 + 0 i

  √ 
2π 1 3 2π
k = 1, w1 = cos + isen =− + i
3 2 2 3
    √
4π 4π 1 3
k = 2, w2 = cos + isen =− − i
3 3 2 2

Observación 4.3.19. Como usted lo observó en el dibujo anterior, las tres raı́ces
cúbicas de 1 están espaciadas equitativamente alrededor de la circunferencia de ra-
dio 1, centrada en el origen. Corresponden a los vértices de un triángulo inscrito en
dicha circunferencia. Son los vértices de un polı́gono regular. En general, las raı́ces
n-ésimas de un número complejo z, z 6= 0, están distibuidas proporcionalmente en
1
la circunferencia de radio |z| n con centro en el origen.

Ejercicio 4.3.20. Encuentre las raı́ces cúbicas de z = 4 3 + 1.

Ejercicio 4.3.21. Encuentre las raı́ces cuartas de z = 1 y de z = −1.

Ejercicio 4.3.22. Encuentre las raı́ces quintas de la unidad y dibújelas en el plano


cartesiano.

116
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Observación 4.3.23. El conjunto de raı́ces n−ésimas de la unidad Ωn = {w ∈


C : wn = 1} forma un grupo con la multiplicación. De hecho es un grupo cı́clico.
Todos los elementos que son generadores se llaman raı́ces primitivas. Puede fijar
un n y encontrar todas las raı́ces primitivas. También buscar los subgrupos que
contiene Ωn .

4.4. Polinomios en C[x] y aplicaciones del Teore-


ma Fundamental del Algebra
En C[x] valen todas las propiedades que vimos para R[x].

Ejercicio 4.4.1. Encuentre el cuociente y el resto de dividir


1
a) h(x) = ix4 + 1+i x2 − 2x + 1 por p(x) = x2 − 1.
b) h(x) = ix4 + 2ix2 − 2x + 3 por p(x) = x2 − i.

Ejercicio 4.4.2. Encuentre el máximo común divisor entre


a) x4 − i y x2 − 1.
b) x3 − i + 1 y x2 + 1.

Hay un resultado muy importante cuya demostración depende de análisis y/o


teorı́a de funciones complejas. Ası́ que no lo podemos demostrar aquı́ pero si po-
demos ver algunas de sus aplicaciones.

Teorema 4.4.3. Teorema Fundamental del Algebra. Si f (x) es un polinomio


de grado ≥ 1 con coeficientes en el cuerpo de los números complejos, entonces f (x)
tiene a lo menos una raı́z en C.

Corolario 4.4.4. Un polinomio es irreducible en C[x] ⇐⇒ tiene grado 1 en C[x].

Demostración. =⇒ Sea f (x) ∈ C[x] polinomio no constante de grado ≥ 2. Por


Teorema 4.4.3 f (x) tiene una raı́z en C, luego por teorema del factor hay a ∈
C, f (x) = (x − a)q(x), es decir, f (x) es reducible en C[x]. Luego todo polinomio
irreducible en C[x] tiene grado 1.
⇐= Sea f (x) ∈ C[x] de grado 1. Si f (x) = g(x)h(x), entonces gr(f (x)) =
gr(g(x)) + gr(h(x)) y como gr(f (x)) = 1, gr(g(x)) = 0 ∨ gr(h(x)) = 0. Luego
f (x) es irreducible en C[x].

Corolario 4.4.5. Sea f (x) ∈ C[x] polinomio no constante de grado n. Entonces


f (x) = c(x−d1 )(x−d2 ) · · · (x−dn ) para algún c, d1 , · · · , dn ∈ C. Esta factorización
es única salvo el orden de los factores.

117
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración. Por Teorema sobre descomposición en polinomios irreducibles se


tiene que f (x) es producto de irreducibles en C[x] y por Corolario 4.4.4 cada uno
de los irreducibles tiene grado uno y hay exactamente n. Luego,
f (x) = (a1 x1 + b1 )(a2 x2 + b2 ) · · · (an xn + bn ) ai , bi ∈ C, ai 6= 0, ∀ i
= a1 (x−(−a−1 −1 −1
1 b1 ))a2 (x−(−a2 b2 )) · · · an (x−(−an bn )) = c(x−d1 )(x−d2 ) · · · (x−dn )

con c = a1 a2 · · · an y di = −a−1
i bi , ∀ i. La unicidad sale del Teorema sobre descom-
posición en polinomios irreducibles.

Volvamos a polinomios en R[x]. Usando propiedades de números complejos se


puede demostrar fácilmente el siguiente resultado
Lema 4.4.6. Sea f (x) ∈ R[x] y z = a + bi ∈ C una raı́z de f (x) entonces su
conjugado z = a − bi es también una raı́z de f (x). Con esto las raı́ces complejas
aparecen de a pares.
Teorema 4.4.7. Un polinomio f (x) ∈ R[x]) es irreducible en R[x] ⇐⇒ f (x) tiene
grado 1 o f (x) = ax2 + bx + c, a 6= 0 y ∆ = b2 − 4ac < 0.
Demostración. =⇒ Suponga que f (x) tiene grado ≥ 2 y es irreducible en R[x].
Entonces por Teorema Fundamental del Algebra f (x) tiene una raı́z w ∈ C y por
Lema 4.4.6 w es también una raı́z de f (x). Además w 6= w, de otra manera w serı́a
una raı́z real de f (x), contradicción. Por teorema del factor
f (x) = (x − w)(x − w)h(x)
descomposición en C[x]. Sea g(x) = (x−w)(x−w), entonces f (x) = g(x)h(x) ∈
C[x]. Además si w = r + si, r, s ∈ R, entonces
g(x) = (x − w)(x − w) = (x − (r + si))(x − (r − si)) = x2 − 2rx + (r2 + s2 ).
Por lo tanto, g(x) ∈ R[x] y tiene grado 2. Probemos que h(x) ∈ R[x]. Por algoritmo
de División hay polinomios q(x), r(x) ∈ R[x], tales que
f (x) = g(x)q(x) + r(x), r(x) = 0 ∨ gr(r(x)) < gr(g(x)).
En C[x], tenemos que f (x) = g(x)h(x) + 0. Ya que q(x), r(x) pueden ser consi-
derados como polinomios en C[x], la unicidad del Algoritmo de la división nos
dice que q(x) = h(x) y r(x) = 0. Como f (x) = g(x)h(x) y f (x) es irreducible en
R[x] y grado de g(x) = 2, h(x) debe ser una constante d ∈ R, d 6= 0. Consecuen-
temente, f (x) = dg(x) es un polinomio cuadrático en R[x] y ası́ tiene la forma
f (x) = ax2 + bx + c, a, b, c ∈ R, a 6= 0. Como f (x) no tine raı́ces reales se tiene que
∆ = b2 − 4ac < 0.
⇐= Si f (x) es de grado 1, entonces es irreducible en R[x]. Si f (x) = ax2 + bx +
c, a 6= 0 y ∆ = b2 − 4ac < 0, entonces sus reaı́ces no son reales luego por Ejemplo
sobre irreductibilidad de polinomios de grado 2 y 3, f (x) es irreducible en R[x]. De
esta forma h(x) = q(x) ∈ R[x].

118
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Observación 4.4.8. Este Teorema se usó en la descomposición en fracciones par-


ciales.

En lo que sigue daremos una demostración de un resultado que se prueba ge-


neralmente en el curso de cálculo.

Corolario 4.4.9. Cada polinomio f (x) ∈ R[x] de grado impar tiene una raı́z real.

Demostración. Por Teorema sobre descomposición en polinomios irreducibles se


tiene que f (x) es producto de irreducibles en R[x], es decir, f (x) = p1 (x)p2 (x) · · · pk (x),
con pi (x) irreducibles en R[x]. Por Teorema cada pi (x) de grado 1 o 2. Además,

gr(f (x)) = gr(p1 (x)) + gr(p2 (x)) + · · · + gr(pk (x)).

Como f (x) tiene grado impar, al menos uno de los pi (x) debe tener grado 1. Luego
f (x) tiene una raı́z real.

Ejemplo 4.4.10. Explique por que no existe un polinomio de grado 3 que tenga
coeficientes reales y raı́ces 1, 2, i.

Solución: Por Lema 4.4.6 sabemos que si i es raı́z de f (x) entonces i es también
raı́z de f (x), luego f (x) tiene cuatro raı́ces y luego gr(f (x)) 6= 3.

Ejercicio 4.4.11. Sabiendo que 1+2i es raı́z de p(x) = x3 +2x2 −3x+20 encuentre
todas las otras raı́ces.

Ejercicio 4.4.12. Encuentre un polinomio p(x) ∈ R[x] de grado 3 tal que p(0) =
2, p(1) = 0 p(−i) = 0.

Ejercicio 4.4.13. Factorice el polinomio p(x) = x4 + 7x2 − 8 sabiendo que −2i 2
es raı́z de p(x).

4.5. Ecuaciones trigonométricas


No se profundizará en este tema, pero al buscar las coordenadas de un complejo
hemos tenido que resolver ecuaciones trigonométricas. Es decir, encontrar valor(es)
de x que satisfagan alguna expresión que involucre funciones trigonométricas. Tales
expresiones pueden sofisticarse mucho, aquı́ sólo daremos una rápida revisión a lo
que es pertinente en el context de complejos.

Ejemplo 4.5.1.
√ Encuentre todas las soluciones de la ecuación trigonométrica
2
cos(x) = − .
2

119
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Solución: Se tiene


√ que el coseno es negativo en el segundo y tercer cuadrante
y además cos π4 = 22 , de modo que podemos obtener soluciones en dichos cua-
drantes al tomar π − π4 = 3π 4
y π + π4 = 5π4
ya que 3π 4
está en segundo cuadrante

y 3 en tercer cuadrante. Esas soluciones son independientes una de la otra por
periodicidad 1 , ya que 5π4
− 3π4
= π2 < 2π. El perı́odo de coseno es 2π por lo que
la solución general (conjunto de todas las soluciones) es



 + 2kπ con k ∈ Z
4

 5π + 2kπ con k ∈ Z


4
que es la forma habitual de expresar las soluciones, aunque la manera formal es
  [ 
3π 5π
+ 2kπ k ∈ Z + 2k π k ∈ Z
4 4
Ejercicio 4.5.2. Pruebe que
1. sen(x) = sen(y) ⇐⇒ x = y + 2kπ, k ∈ Z ∨ x = (π − y) + 2kπ, k ∈ Z
Solución: Usaremos la identidad
   
x+y x−y
sen(x) − sen(y) = 2 cos sen
2 2
Ası́ tenemos
 
 
x−y
x+y
sen(x) = sen(y) ⇔ 2 cos sen =0
2 2
   
x+y x−y
⇔ cos = 0 o sen =0
2 2
Analizando cada condición separadamente tenemos:
   
x+y x+y π
cos =0⇔ = + kπ, k ∈ Z
2 2 2
   
x−y x−y
sen =0⇔ = kπ, k ∈ Z
2 2
De donde se sigue lo afirmado.
2. cos(x) = cos(y) ⇐⇒ x = y + 2kπ, k ∈ Z ∨ x = (2π − y) + 2kπ, k ∈ Z
3. tan(x) = tan(y) ⇐⇒ x = y + kπ, k ∈ Z
1
no se obtiene una de la otra por periodicidad

120
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

4.6. Funciones trigonométricas inversas


Se puede definir la relación inversa para cada función trigonométrica. Se usan los
nombres arco-trigonométrica según corresponda. Se abrevia arcsen, arccos, arctg,
etc. Note que se usa la primera letra minúscula.
Con restricciones de dominio y codominio, obtenemos funciones biyectivas a
partir de las funciones trigonométricas, con las que se definen funciones trigo-
nométricas inversas. Para diferenciarla de las relaciones inversas se usa mayúscula
en la primera letra.
Proposición 4.6.1. La función f : − π2 , π2 → [−1, 1] dada por f (x) = sen(x) es
 

biyectiva.
Definimos la inversa de esta función:
Definición 4.6.2. La función Arcoseno
 (inversa principal de la función seno) se
π π
define por Arcsen : [−1, 1] → − 2 , 2 dada por
 
π π
y = Arcsen(x) ⇐⇒ x ∈ [−1, 1] ∧ y ∈ − , ∧ x = sen(y)
2 2

1. Arcsen 21 = π6 ya que 21 ∈ [−1, 1], π6 ∈ − π2 , π2 , sen π6 =


   
Ejemplo 4.6.3.
1
2
 
2. Arcsen sen 3π π π 3π π
  
4
= − 4
ya que sen − 4
= sen 4
= sen π − 4
y
− π4 ∈ − π2 , π2
 

De forma análoga tenemos:


Definición 4.6.4. 1. La función Arcocoseno (inversa principal de la función
coseno) se define por Arccos : [−1, 1] → [0, π] dada por

y = Arccos(x) ⇐⇒ x ∈ [−1, 1] ∧ y ∈ [0, π] ∧ x = cos(y)

2. La función Arcotangente (inversa principal de la función tangente) se define


por Arctan : R → − π2 , π2 dada por


 
π π
y = Arctan(x) ⇐⇒ x ∈ R ∧ y ∈ − , ∧ x = tan(y)
2 2
Ejercicio 4.6.5. De la definición se tiene que:
1. Arcsen(sen(t)) = t ⇐⇒ t ∈ [− π2 , π2 ].

2. sen(Arcsen(x) = x ∀ x ∈ [−1, 1]

121
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

3. Arccos(cos(t)) = t ⇐⇒ t ∈ [0, π]

4. cos(Arcos(x) = x ∀ x ∈ [−1, 1]

5. Arctan(tan(t)) = t ⇐⇒ t ∈ (− π2 , π2 ).

6. tan(Arctan(x) = x ∀ x ∈ R.

Proposición 4.6.6. 1. Para todo |x| ≤ 1 se tiene Arcsen(x) + Arccos(x) = π2 .



2. Para todo |x| ≤ 1 se tiene cos(Arcsen(x)) = + 1 − x2 .

3. Para todo |x| ≤ 1 se tiene sen(Arccos(x)) = + 1 − x2 .

4. Para todo |x| ≤ 1 se tiene Arcsen(x) = Arctan √ x ).


1−x2

Demostración. Resolvamos 2. y los demás ı́tems de ejercicio. Sea x ∈ [−1, 1] y sea


y = Arcsen(x). Por definición se tiene:
π π
y = Arcsen(x) ⇐⇒ y ∈ [− , ] ∧ x = sen(y)
2 2

Además cos√2 (y) = 1 − sen2 (y) = 1 − x2 . Por lo tanto, cos(y) = + 1 − x2 ∨
cos(y) = − 1 − x2 . √
Como y ∈ [− π2 , π2 ], se tiene que cos(y) > 0, luego, cos(y) = + 1 − x2 y ası́

cos(Arcsen(x)) = + 1 − x2 .

Ejemplo 4.6.7. Demuestre que cos(Arcsen( 35 )) = 45 .

Solución: Sea x = Arcsen 53 y x ∈ [− π2 , π2 ]. Necesitamos calcular cos(x).



9
Tenemos que cos2 (x) = 1 − 25 = 16
25
. Luego cos(x) = 45 ∨ −4
5
, como x ∈ [− π2 , π2 ], se
4 3 4
tiene que cos(x) = 5 . De donde cos(Arcsen( 5 )) = 5 .

Ejercicio 4.6.8. Demuestre que


i) Arcsen( 53 ) + Arcsen( 17
8
) = Arcsen( 77
85
).
Solución: Aquı́ cuidado con “aplicar sen ”a ambos lados de la igualdad. Ello
puede llevar a conclusiones falsas como puede comprobar al analizar la siguiente
afirmación

1 3
Arcsen(1) + Arcsen( ) = Arcsen( ).
2 2
La cual es falsa pero si “aplica sen”a ambos lados llega a algo verdadero. Esto
sucede pues

122
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile


π 2π 3
sen( ) = sen( ) = .
3 3 2

La suma Arcsen(1) + Arcsen( 12 ) no corresponde a Arcsen( 23 ) que por defi-
nición, al escoger la rama principal, es π/3.
Volviendo a la pregunta, procedemos de la siguiente forma. Sean
3 3 π π
a = Arcsen( ) ⇔ sen(a) = y a ∈ [− , ]
5 5 2 2
8 8 π π
b = Arcsen( ) ⇔ sen(b) = y a ∈ [− , ]
17 17 2 2
77
Lo que se quiere demostrar es que a + b = Arcsen( 85 ). Para ello veamos sen(a +
b). Note que como a y b pertenecen al intervalo [− π2 , π2 ], se tiene que su coseno es
positivo. Entonces:
p 4
cos(a) = 1 − sen2 (a) =
5
p 15
cos(b) = 1 − sen2 (b) =
17
Ası́
3 15 4 8 77
sen(a + b) = sen(a) cos(b) + cos(a) sen(b) = · + · = .
5 17 5 17 85
Vamos bien pero hay que resistir la tentación de saltar a la conclusión que a + b =
77
Arcsen( 85 ) pues hay muchos números reales cuyo sen es 7785
. Primero determinamos
π π
que, dado que a y b pertenecen al intervalo [− 2 , 2 ], tenemos que a + b ∈ [−π, π].
Estamos mejor, pero de todas formas en ese intervalo hay dos números reales
cuyo sen es 77/85. Ambos son positivos y se diferencian pues uno es menor que π/2
y el otro mayor. El que es menor que π/2 es el que corresponde a Arcsen(77/85).
Entonces la pregunta es cómo asegurar que a+b < π/2. Ello pasarı́a si, por ejemplo,
puedo acotar el intervalo de pertenencia de a y b a [0, π4 ].
Ya sabemos que a ∈ [0, π2 ] en realidad, pues a ∈ [− π2 , π2 ] y sen(a) > 0. Anali-
zando más finamente,
3 1 π
sen(a) = < √ ⇒a< .
5 2 4
Lo mismo tenemos para b. Entonces, hemos determinado que a + b < π/2 y
sen(a + b) = 77/85, entonces a + b = Arcsen(77/85).

ii) Arccos( 45 ) + Arccos( 12


13
33
) = Arccos( 65 ).

123
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

iii) Arctan( 35 ) + Arcsen( 53 ) = Arctan( 27


11
).
iv) Arcsen( √15 ) + Arcsen( √25 ) = π2

Ejercicio 4.6.9. Calcule

1. tan(Arcsen(x)), ∀ x ∈ (−1, 1),

2. tan(Arccos(x)), ∀ x ∈ [−1, 0) ∪ (0, 1],

3. cos(Arctan(x)) ∧ sen(Arctan(x)) ∀ x ∈ R.

Trabajaremos con las tres funciones trigonométricas inversas ya definidas. Para


mayor información se tienen además otras tres funciones trigonométricas inversas.

Definición 4.6.10. 1. La función Arcosecante (inversaprincipal de la función


secante) se define por Arcsec : (−∞, −1] ∪ [1, ∞) → 0, π2 ∪ π2 , π dada por


   
π π
y = Arcsec(x) ⇐⇒ |x| ≥ 1 ∧ y ∈ 0, ∪ , π ∧ x = sec(y)
2 2

2. La función Arcocosecante (inversa principal


 π de  la función
 cosecante) se define
π
por Arccosec : (−∞, −1] ∪ [1, ∞) → − 2 , 0 ∪ 0, 2 dada por
   
π π
y = Arccosec(x) ⇐⇒ |x| ≥ 1 ∧ y ∈ − , 0 ∪ 0, , π ∧ x = cosec(y)
2 2

3. La función Arcocotangente (inversa principal de la función cotangente) se


define por Arcocotan : R → (0, π) dada por

y = Arcocotan(x) ⇐⇒ x ∈ R ∧ y ∈ (0, π) ∧ x = cotan(y)

4.7. Aplicación a complejos


La notación polar ofrece una relación entre números complejos y funciones
trigonométricas (directas e inversas). A saber, comparando la notación polar y
cartesiana para z ∈ C tenemos

z = a + ib = r(cos(α) + i sen(α)).
Luego

r cos(α) = a y r sen(α) = b.

124
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ası́, si a 6= 0 se tiene que


b
tg(α) = .
a
Si a = 0, entonces z es imaginario puro su argumento α es pi2 o 3π2
, según si b > 0
o b < 0 respectivamente. En ambos casos la tangente se indetermina.
Podrı́a pensarse que α = Arctg( ab ). Sin embargo, y nuevamente producto de la
elección de rama principal que se hace para la definición de Arctg hay que tener
cuidado con saltar a conclusiones. Veamos la siguiente tabla de valores

z = a + ib b/a Arctg(b/a) α = Arg(z)


1+i 1 π/4 π/4
−1 + i −1 −π/4 3π/4
−1 − i 1 π/4 5π/4
1−i −1 −π/4 7π/4 (o −π/4 que es equivalente)
El problema está con complejos en los cuadrantes II y III, esto pues

Arctg(x) ∈] − π/2, π/2[;

es decir, en los cuadrantes I y IV. Entonces, para complejos en los cuadrantes II y


III, su argumento corresponderá a
b
π + Arctg( ).
a
Ejemplo 4.7.1. Considere el complejo z = −2 − 3i expréselo en notación polar,
usando Arctg, y luego desde la expresión polar recupere la cartesiana original.
Primero obtenemos su módulo |z| y su argumento Arg(z):
p √
|z| = (−2)2 + (−3)2 = 13

−3 3
Arg(z) = Arctg( ) + π = Arctg( ) + π
−2 2
Luego, en coordenadas polares queda

 
3 3
z = 13 cos(Arctg( ) + π) + i sen(Arctg( ) + π) (4.3)
2 2
Ahora, recuperemos la expresión cartesiana para z desde la en polares. Primero,
recordar que

cos(α + π) = − cos(α) y sen(α + π) = − sen(α)


Ası́

125
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile


 
3 3
z = 13 − cos(Arctg( )) − i sen(Arctg( )) .
2 2
Necesitamos determinar
3 3
cos(Arctg( )) y sen(Arctg( )).
2 2
Para ello necesitamos sen(x) y cos(x) en términos de tg(x). Usando las identi-
dades trigonométricas:

sen2 (x)
tg2 (x) = , sen2 (x) + cos2 (x) = 1
cos2 (x)
se tiene

1 tg2 (x)
cos2 (x) = y sen2
(x) =
1 + tg2 (x) 1 + tg2 (x)
Volviendo a nuestro caso,
3 π π 3
β = Arctg( ) ⇔ β ∈] − , [ y tg(β) = .
2 2 2 2
Entonces,
4 9
cos2 (β) = y sen2 (x) = .
13 13
π
Como tg(β) > 0, tenemos β ∈]0, 2 [. Luego, sen(β) > 0, cos(β) > 0. Ası́,
3 2 3 3
cos(Arctg( ) = √ y sen(Arctg( ) = √ .
2 13 2 13
Volviendo a la expersión polar de z en (4.3) y reemplazando estos valores tenemos

√ √
   
3 3 2 3
z= 13 cos(Arctg( ) + π) + i sen(Arctg( ) + π) = 13 − √ − i √ = −2−3i.
2 2 13 13

126
Parte II

Álgebra y Geometrı́a II

127
Capı́tulo 5

Secciones cónicas

5.1. Introducción
Trabajaremos ahora en el plano cartesiano. Recordemos que se puede descri-
bir mediante un sistema coordenado usando R2 como conjunto de coordenadas.
Se fijan dos copias de igual escala entre sı́ de R como dos rectas, llamados ejes
coordenados, que son ortogonales (perpendiculares) de modo que uno de ellos, el
eje X, es horizontal y sus valores crecen a la derecha, mientras que el otro, eje Y, es
vertical y sus valores crecen hacia arriba; ambos ejes se intersectan en el punto que
en cada recta corresponde al 0. A ese punto de intersección se le llama el origen del
sistema y se le asignan las coordenadas (0, 0). Para asignar la posición de cualquier
otro punto P del plano se construye un rectángulo que tenga lados adyacentes a
los ejes coordenados y que en vértices opuestos tenga a (0, 0) y a P ; entonces uno
de los otros vértices marca en el eje X un número, x, y el vértice que queda marca
en el eje Y un número, y, y le asignamos a P las coordenadas (x, y).

Definición 5.1.1. (Distancia entre dos puntos en el plano)


Sean A = (x1 , y1 ), B = (x2 , y2 ) dos puntos en el plano cartesiano. La distancia
entre ellos se anota d(A, B) y corresponde a
p
d(A, B) = + (x1 − x2 )2 + (y1 − y2 )2 .

5.1.1. Lugares geométricos. Rectas.


En este capı́tulo veremos lugares geométricos. Es decir, el conjunto de puntos
que satisfacen una condición geométrica común. Ejemplos de ello son:

Ejemplo 5.1.2. Encuentre el (los) punto(s) equidistante(s) de A(3, 2), B(−2, 4)


y C(2, −1).

128
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Solución. Se requiere un punto (x, y) que satisfaga

(x − 3)2 + (y − 2)2 = (x + 2)2 + (y − 4)2 = (x − 2)2 + (y + 1)2

Desarrollando estas dos ecuaciones (podemos tratarlas como dos ecuaciones sepa-
radas), obtenemos un sistema de ecuaciones lineales:

−6x + 9 − 4y + 4 = 4x + 4 − 8y + 16
−6x + 9 − 4y + 4 = −4x + 4 + 2y + 1
5 47
La solución de este sistema es x = − 34 ,y = 34
por lo que el punto buscado es
5 47
(− 34 , 34 ).
Ejemplo 5.1.3. Dados A(−1, −1) y B(1, 1), describa el lugar geométrico de puntos
equidistantes a A y B.
Solución. Aquı́ se requiere un punto (x, y) que satisfaga

(x + 1)2 + (y + 1)2 = (x − 1)2 + (y − 1)2 .


Resolvemos y se encuentra que y = −x. Es decir, corresponde a

L = {(x, y) ∈ R2 : y = −x}.
Esta recta se llama simetral entre A y B.(Figura 5.1)

Figura 5.1:

129
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Veamos ahora la distancia de un punto P1 = (x1 , y1 ) a la recta L, donde P1 no


es un punto de L. Sea d = d(P1 , L).
Demuestre que si L : Ax + By + C = 0, entonces la distancia de P1 = (x1 , y1 )
a la recta L es
|Ax1 + By1 + C|
d= √ .
A2 + B 2
Ejemplo 5.1.4. Encuentre ecuaciones para las bisectrices de los ángulos formados
por las rectas 3x + 4y + 8 = 0 y 5x + 12y − 15 = 0.

Solución. Las bisectrices forman el conjunto de los puntos equidistantes de las


dos rectas, es decir los (x, y) que satisfacen

|3x + 4y + 8| |5x + 12y − 15|


=
5 13
Expresado sin valores absolutos, esto quiere decir

39x + 52y + 104 = ±(25x + 60y − 75)

Las ecuaciones de las rectas son:

14x − 8y + 179 = 0
64x + 112y + 29 = 0

Ejemplo 5.1.5. Encuentre los puntos de la recta 3x − 2y + 4 = 0 que están a


distancia 7 del punto (1, 1)

Solución. Debemos encontrar los puntos (x, y) que satisfacen (x − 1)2 + (y −


1)2 = 49 y 3x − 2y + 4 = 0. Para ello podemos despejar y = 23 x + 2 de la segunda
ecuación y reemplazar en la primera:
9
x2 − 2x + 1 + x2 + 3x + 1 − 49 = 0
4
Amplificando, tenemos:
13x2 + 4x − 4 · 47 = 0
Usamos la fórmula de la ecuación cuadrática para obtener los posibles valores de
x: √ √
−4 ± 16 + 16 · 47 · 13 −2 ± 12 17
x= =
26 13
Los correspondientes valores de y se obtienen reemplazando x en y = 32 x + 2.

Ejercicio 5.1.6. Calcular la distancia entre las rectas paralelas de ecuaciones


generales x + 3y − 6 = 0 y x + 3y + 14 = 0.

130
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

5.2. Secciones cónicas.


En este capı́tulo nos centraremos en las Secciones cónicas. Su origen se remonta
a Grecia en la época de Platón, ellos consideraban y estudiaban las curvas que
aparecı́an al intersectar un cono con diferentes planos (ver Fig. 5.2)

Figura 5.2: Origen de las secciones cónicas

Actualmente se describen utilizando el álgebra y la introducción del Plano


Cartesiano. Es decir, una cónica es el conjunto de puntos (x, y) ∈ R2 que anulan
una ecuación algebraica de segundo grado con coeficiantes reales:

Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0
A continuación estudiaremos los distintos tipos de cónicas y desarrollaremos
tanto su aspecto geométrico como algebraico.

5.2.1. Cónicas como lugares geométricos.


Comenzamos su estudio y exploración desde un punto de vista más moderno;
es decir, dejamos la visión puramente geométrica de los griegos y la sustituimos
por una que incorpora los conceptos de coordenadas y distancia estudiados en la
sección anterior.
Aprenderemos que al graficarlas con una orientación adecuada en el plano car-
tesiano, se obtienen sus ecuaciones canónicas.
El objetivo básico a lograr en esta sección es establecer la correspondencia entre
cada una de tales ecuaciones con la gráfica de su respectiva cónica, en particular
con los elementos principales de tal cónica.

131
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

5.2.2. Circunferencia
Se llama circunferencia al lugar geométrico de los puntos del plano que están
a una distancia fija (radio) de un punto fijo (centro).

Proposición 5.2.1. La ecuación de una circunferencia de centro (h, k) y radio


r > 0 es (x − h)2 + (y − k)2 = r2 .

Su demostración sale de inmediato de que r = d((x, y), (h, k)).

Ejemplo 5.2.2. Encuentre la ecuación de la circunferencia que pasa por (7, −5) y
el centro es el punto de intersección de las rectas 7x−9y −10 = 0 y 2x−5y +2 = 0.

Solución. Sea (x−h)2 +(y −k)2 = r2 la ecuación de la circunferencia. Sabemos


que 7h − 9k − 10 = 0 y que 2h − 5k + 2 = 0. Resolviendo el sistema obtenemos
h = 4, k = 2 Luego tenemos (x − 4)2 + (y − 2)2 = r2 . Sabemos que (7, −5) está en
la circunferencia, luego (7 − 4)2 + (−5 − 2)2 = r2 . Por lo tanto 9 + 49 = r2 , y la
ecuación de la circunferencia es (x − 4)2 + (y − 2)2 = 58.

Ejercicio 5.2.3. Encuentre el centro y radio de la circunferencia de ecuación


i) x2 + y 2 − 3x + 5y − 15 = 0.
ii) x2 + y 2 + 2x − 32 y − 83 = 0.

Ejercicio 5.2.4. Encuentre la ecuación de la circunferencia que pasa por los puntos
(−8, 3), (4, −5) y su centro está sobre la recta de ecuación 2x − 3y − 14 = 0.

Ejemplo 5.2.5. i) Demuestre que la pendiente de la recta que pasa por los puntos
(x1 , y1 ) y (x2 , y2 ) es xy22 −y1
−x1
, si x1 6= x2 .
ii) Demuestre que cualquier ángulo inscrito en una semicircunferencia es recto.

132
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Solución. i) de ejercicio.
ii) Consideremos el punto (a, b) en la semicircunferencia x2 + y 2 = r2 con y > 0.
b
La recta que pasa por (a, b) y (−r, 0) tiene pendiente a+r y la recta que pasa por
2
(a, b) y (r, 0) tiene pendiente a−r . El producto de las pendientes es a2b−r2 = −1
b

pues a2 + b2 = r2 .

Ejemplo 5.2.6. Dada la circunferencia x2 + y 2 = 5, determine los valores de m


para que las rectas x − 2y + m = 0 cumplan, respectivamente:

1. cortan a la circunferencia en dos puntos distintos;

2. la corta en un único punto;

3. no cortan a la circunferencia.

Solución. De la ecuación de la recta podemos despejar x = 2y − m. Reempla-


zando en la ecuación de la circunferencia tenemos

5y 2 − 4my + m2 − 5 = 0

El discriminante de esta ecuación es:

∆ = 16m2 − 20m2 + 100 = −4m2 + 100

Si m2 < 25, entonces ∆ > 0 y la ecuación tiene dos soluciones, es decir la recta
corta a la circunferencia en dos puntos diferentes. Si m2 = 25, entonces ∆ = 0 y la
ecuación tiene una solución única, es decir la recta es tangente a la circunferencia.
Si m2 > 25, entonces ∆ < 0 y la ecuación no tiene solución real, es decir la recta
no corta a la circunferencia.

Ejercicio 5.2.7. Dada la circunferencia (x − 1)2 + y 2 = 24, determine los valores


de m para que las rectas y = mx + 5 cumplan, respectivamente:

1. cortan a la circunferencia en dos puntos distintos;

2. la corta en un único punto;

3. no cortan a la circunferencia.

Ejercicio 5.2.8. Demuestre que toda recta cuya distancia al centro de una cir-
cunferencia es igual al radio, es tangente a ella, es decir, la intersecta en un sólo
punto.

133
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

5.2.3. Elipse
Se llama elipse al lugar geométrico de los puntos (x, y) del plano cuya suma de
distancias a dos puntos fijos llamados focos, es constante e igual a 2a, con a > 0.
El centro de la elipse se define como el punto medio del segmento de recta que une
los focos.
La recta que une los focos se llama eje focal. Las intersecciones del eje focal
con la propia elipse se llaman vértices mayores, situados simétricamente respecto
del centro. El segmento que une los vértices mayores se conoce como eje mayor, y
mide 2a, de modo que a es la distancia entre cada vértice mayor y el centro.
Los vértices menores de la elipse son los puntos de intersección de la elipse con
la recta perpendicular al eje focal y que pasa por el centro.
Sea c > 0 la mitad de la distancia entre los focos. Claramente a > c, y definiendo
b > 0 tal que b2 = a2 − c2 se tiene que:
Proposición 5.2.9. i) La ecuación de una elipse de centro (h, k) y eje focal
horizontal, es
(x − h)2 (y − k)2
+ = 1, donde a > b
a2 b2
Los focos son F1 = (h + c, k), F2 = (h − c, k), los vértices mayores V1 =
(h+a, k), V2 = (h−a, k) y los vértices menores V10 = (h, k+b), V20 = (h, k−b)

ii) La ecuación de una elipse de centro (h, k) y eje focal vertical, es

(x − h)2 (y − k)2
+ = 1, donde a > b
b2 a2

134
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Los focos son F1 = (h, k + c), F2 = (h, k − c), los vértices mayores V1 =
(h, k+a), V2 = (h, k−a) y los vértices menores V10 = (h+b, k), V20 = (h−b, k)

Demostración. i) Tenemos que los focos de la elipse son los puntos F1 = (h, k +
c), F2 = (h, k − c), sea P = (x, y) un punto en la elipse y veamos su ecuación.
Por definición se tiene que d(P, F1 ) + d(P, F2 ) = 2a, donde a > c.
p p
(x − h − c)2 + (y − k)2 + (x − h + c)2 + (y − k)2 = 2a
p p
(x − h + c)2 + (y − k)2 = 2a − (x − h − c)2 + (y − k)2 elevemos al cuadrado
p
(x−h+c)2 +(y−k)2 = 4a2 −4a (x − h − c)2 + (y − k)2 +(x−h−c)2 +(y−k)2 . De donde
p
(x−h)2 +2(x−h)c+c2 = 4a2 −4a (x − h − c)2 + (y − k)2 +(x−h)2 −2(x−h)c+c2 simplificando
p
xc − hc − a2 = a (x − h − c)2 + (y − k)2 elevemos nuevamente al cuadrado
(x−h)2 c2 −2a2 (x−h)c+a4 = a2 [(x−h)2 −2(x−h)c+c2 +(y−k)2 ]simplificando queda
(x − h)2 (a2 − c2 ) + a2 (y − k)2 = a2 (a2 − c2 )
1
Como a2 (a2 − c2 ) 6= 0, multipliquemos por a2 (a2 −c2 )
y queda

(x − h)2 (y − k)2
+ 2 =1
a2 a − c2

135
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Si ponemos b2 = a2 − c2 se tiene que


(x − h)2 (y − k)2
+ =1
a2 b2
ii) Para obtener esta nueva ecuación usamos el mismo método anterior. Vemos
que los focos son los puntos F1 = (h, k + c), F2 = (h, k − c) y si P = (x, y) un
punto en la elipse usemos que d(P, F1 ) + d(P, F2 ) = 2a, donde a > c.

Ejemplo 5.2.10. Encuentre centro, focos y vértices de la elipse de ecuación 3x2 +


5y 2 − 12x + 30y + 42 = 0.
Solución. Tenemos 3(x2 − 4x) + 5(y 2 + 6y) = −42. Completando cuadrados
queda 3[(x − 2)2 − 4] + 5[(y + 3)2 − 9] = −42, luego queda 3(x − 2)2 + 5(y + 3)2 = 15,
2 2
de donde la ecuación de la elipse es (x−2) + (y+3) = 1.
5 3 √ √
Es√ una elipse de eje focal horizontal
√ de centro (2, −3), a = 5, b = √ 3. Luego
c = 2, focos (h±c, k) = (2± 2, −3)) y √ vértices mayores (h±a, k) = (2± 5, −3),
y vértices menores (h, k ± b) = (2, −3 ± 3).
Definición 5.2.11. La excentricidad e de una elipse es un valor que determina la
forma de la elipse, en el sentido de si es mas redondeada o si se aproxima a un
segmento. Se define como e = ac y 0 ≤ e ≤ 1.
Ejercicio 5.2.12. Encuentre centro, focos y vértices de la elipse de ecuación 9x2 +
4y 2 + 36x − 24y + 36 = 0.
Ejercicio 5.2.13. Encuentre la ecuación de la elipse de centro (0, 0), con un foco
(2, 0) y con un vértice (3, 0)
x2 y2
Ejemplo 5.2.14. Considere el punto (6, 4) en la elipse + = 1. Pruebe que
102 52
la recta 3x + 8y = 50 intersecta a la elipse en un único punto (6, 4).
50 − 3x
Solución. Si reemplazamos y = en la ecuación de la elipse, tenemos
8
x2 2500 − 300x + 9x2
+ =1
102 82 52
Amplificando por 82 52 = 1600 tenemos
16x2 + 2500 − 300x + 9x2 − 1600 = 0
Factorizando:
25x2 − 300x + 900 = 25(x2 − 12x + 36) = 25(x − 6)2
La única solución es x = 6 y el único punto de intersección es (6, 4) como se pedı́a.

136
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejercicio 5.2.15. Encuentre la ecuación de la elipse vertical de centro (2, −1)


sabiendo que las longitud de su eje mayor es 6 y la de su eje menor es 3.

Ejercicio 5.2.16. Encuentre la ecuación de la elipse y y todos su elementos


√ sa-
biendo que sus vértices mayores son (4, 1) y (−4, 1). Además el punto (2 3, 2) está
en la elipse.

5.2.4. Hipérbola
Se llama hipérbola al lugar geométrico de los puntos (x, y) del plano cuya
diferencia de distancias a dos puntos fijos llamados focos, es una constante 2a > 0.
El punto medio del segmento de recta que une los focos se llama centro de la
hipérbola. La recta que une los focos se llama eje focal y su intersección con la
propia hipérbola se llaman vértices. El segmento de recta que une los vértices se
llama eje transverso.
Sea c > 0 la√distancia entre cada foco y el centro. Entonces c > a y definimos
b > 0 por b = c2 − a2 . El segmento de recta perpendicular al eje focal que pasa
por el centro y es dividido por él en dos partes iguales, y que mide 2b, se llama eje
conjugado.

Proposición 5.2.17. i) La ecuación de la hipérbola de centro (h, k), eje focal


horizontal, vértices (h ± a, k), focos (h ± c, k), y donde b > 0 cumple c2 =
a2 + b2 , es:
(x − h)2 (y − k)2
− =1
a2 b2
Las ecuaciones de sus ası́ntotas son
b
y − k = ± (x − h)
a

137
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

ii) La ecuación de la hipérbola de centro (h, k), eje focal vertical, vértices (h, k ±
a), focos (h, k ± c), y donde b > 0 cumple c2 = a2 + b2 , es:

(y − k)2 (x − h)2
− =1
a2 b2

La ecuaciones de sus ası́ntotas son


a
y − k = ± (x − h)
b

Demostración. Probaremos ii) pues i) es muy similar. Tenemos que F1 = (h, k +


c), F2 = (h, k − c) y por definición de hipérbola

d((x, y), (h, k + c)) − d((x, y), (h, k − c)) = 2a


p p
(x − h)2 + (y − k − c)2 = 2a + (x − y)2 + (y − k + c)2 elevemos al cuadrado
p
(x−h)2 +(y−k−c)2 = 4a2 +4a (x − y)2 + (y − k + c)2 +(x−h)2 +(y−k+c)2 . De donde
p
x−h)2 +(y−k)2 +2(y−k)c+c2 = 4a2 +4a (x − y)2 + (y − k + c)2 +(x−h)2 +(y−k+c)2 simplificando
p
(y − k)c + a2 = −a (x − y)2 + (y − k + c)2 elevemos nuevamente al cuadrado
(y−k)2 c2 +2a2 (y−k)c+a4 = a2 (x−h)2 +a2 (y−k)2 +a2 c+ 2a2 (y−k)c simplificando queda
(y − k)2 (c2 − a2 ) − a2 (x − h)2 = −a2 (a2 − c2 ) = a2 (c2 − a2 )
1
Como a2 (c2 − a2 ) 6= 0, multipliquemos por a2 (c2 −a2 )
y queda

(x − h)2 (y − k)2
+ 2 =1
a2 a − c2

138
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Si ponemos b2 = a2 − c2 se tiene que

(y − k)2 (x − h)2
− =1
a2 b2
Veamos ahora las ecuaciones de las ası́ntotas. De la ecuación de la hipérbola
tenemos
b2 (y − k)2 − a2 (x − h)2 = a2 b2
b2 (y − k)2 = a2 (x − h)2 + a2 b2
a2
(y − k)2 = 2 (x − h)2 + a2
b
r
a2
y−k =± [(x − h)2 + b2 ]
b2
s
a b2
y−k =± (x − h)2 [1 + ]
b (x − h)2
b2
Al tomar el lı́mite cuando x tiende a ± infinito se tiene 1 − (x−h)2
tiende a 1 y

a
y − k = ± (x − h)
b

Observación 5.2.18. Estudiaremos sobre las ası́ntotas de una hipérbola, en su


forma canónica (ver Fig. 5.3).
Consideremos la ecuación C : b2 x2 − a2 y 2 = a2 b2 de una hipérbola.

b2 x2 − a2 b2 b2 2 2 b2 2
y2 = = (x − a ) < x
a2 a2 a2
r
b√ 2 b a2
y = ± x − a2 = ± x 1 − 2
a a x
Si x crece indefinidamente, entonces la raı́z se aproxima al valor 1 y la
ecuación tiende a la forma
b
y = ± x.
a
b b b
Consideremos las rectas y = ± x, es decir L : y = x y L0 : y = − x
a a a

139
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Figura 5.3: Ası́ntotas.

Si (x1 , y1 ) ∈ C, tal como en la figura, la distancia d(x1 , y1 ) a L es

|bx1 − ay1 | |(bx1 − ay1 )|(bx1 + ay1 )| |b2 x21 − a2 y1 )| a2 b 2


d= √ = √ =√ =√
a2 + b 2 a2 + b2 |(bx1 + ay1 )| a2 + b2 |(bx1 + ay1 )| a2 + b2 |(bx1 + ay1 )|

Si x e y crecen indefinidamente, entonces d se acerca a cero.

Las rectas L y L0 son las ası́ntotas de la hipérbola, y sus ecuaciones se


pueden escribir bx − ay = 0 y bx + ay = 0 respectivamente

Observación 5.2.19. Sobre las ası́ntotas de la hipérbola.


Vimos que:
1.- La ecuación de la hipérbola de centro (h, k), eje focal horizontal, vértices
(h ± a, k), focos (h ± c, k), y donde b > 0 cumple c2 = a2 + b2 , es:

(x − h)2 (y − k)2
− =1
a2 b2
Probamos que las ecuaciones de sus ası́ntotas son
b
y − k = ± (x − h)
a

140
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Si usted observa estas ecuaciones, entonces se da cuenta de que salen de despejar


y − k de
(x − h)2 (y − k)2
− =0
a2 b2
Lo mismo en el otro caso
2.- La ecuación de la hipérbola de centro (h, k), eje focal vertical, vértices (h, k±
a), focos (h, k ± c), y donde b > 0 cumple c2 = a2 + b2 , es:
(y − k)2 (x − h)2
− =1
a2 b2
La ecuaciones de sus ası́ntotas son
a
y − k = ± (x − h)
b
Nuevamente si usted observa estas ecuaciones, entonces se da cuenta de que salen
de despejar y − k de
(y − k)2 (x − h)2
− =0
a2 b2
Ejemplo 5.2.20. Determine centro, vértices, focosy ası́ntotas de la hipérbola de
ecuación 9x2 − 4y 2 − 36x + 8y = 4.
Solución. Completando cuadrados se llega a 9(x − 2)2 − 4(y − 1)2 = 36, luego
se tiene la ecuación:
(x − 2)2 (y − 1)2
− =1
4 9
Luego la ecuación representa a una hipérbola
√ de centro (2, 1) y eje focal horizontal.
Como a = 2,√ b = 3 se tiene√que c = 13. Luego los vértices son (0, 1) y (4, 1) y
sus focos (2 + 13, 1) y (2 − 13, 1).
Sus ası́ntotas son las rectas que se obtienen de
(x − 2)2 (y − 1)2
  
x−2 y−1 x−2 y−1
− = 0 ⇐⇒ − − =0
22 32 2 3 2 3
de donde las ecuaciones de las ası́ntotas son
x−2 y−1 x−2 y−1
− =0 y − =0
2 3 2 3
es decir,
3x 3x
y= −2 e y =− +4
2 2
Ejercicio 5.2.21. Determine centro, vértices, focos y ası́ntotas de la hipérbola de
ecuación 4x2 − y 2 − 8x − 4y = 4.

141
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejercicio 5.2.22. Encuentre la ecuación de la hipérbola de vértices (0, 2) y (6, 2)


y ası́ntotas de ecuaciones y = 23 x e y = 4 − 32 x.
Ejercicio 5.2.23. Encuentre la ecuación de la hipérbola y todos sus elementos
sabiendo
√ que su centro es (−1, 3) un vértice es (−1, 4) y pasa por el punto (−5, 3 +
5).

5.2.5. Parábola
Se llama parábola al lugar geométrico de los puntos (x, y) del plano que equi-
distan de un punto fijo llamado foco y de una recta fija llamada directriz.
El punto medio entre el foco y la directriz se llama vértice y la recta que pasa
por el foco y el vértice se llama eje focal, o eje de simetrı́a, o simplemente eje
de la parábola (ya que sólo tiene un eje). El eje es perpendicular a la directriz.
Consideramos acá sólo los casos en que el eje es vertical u horizontal.
Sea p 6= 0 la distancia entre el vértice y el foco.
Proposición 5.2.24. i) La parábola horizontal de vértice (h, k), foco F = (h +
p, k), y directriz D de ecuación x = h − p es

(y − k)2 = 4p(x − h)

Si p > 0, la parábola se abre hacia la derecha y si p < 0, la parábola se abre


hacia la izquierda.

ii) La parábola vertical de vértice (h, k), foco F = (h, k + p), y directriz D de
ecuación y = k − p es
(x − h)2 = 4p(y − k)

142
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Si p > 0, la parábola se abre hacia arriba y si p < 0, la parábola se abre hacia


abajo.

Demostración. Probaremos ii) pues i) es muy similar. Tenemos que F = (h, k + p)


y ecuación D : y = k − p es la de la directriz. Por definición de parábola si (x, y)
es un punto de ella tenemos que

d((x, y), (h, k + p)) = d((x, y), D)


p
(x − h)2 + (y − k − p)2 = y − k + p elevando al cuadrado
(x − h)2 + (y − k − p)2 = (y − k + p)2
(x − h)2 + (y − k)2 − 2p(y − k) + p2 = (y − k)2 + 2p(y − k) + p2 simplificando
(x − h)2 = 4p(y − k)
que es la ecuación buscada.

Proposición 5.2.25. Demuestre que en una parábola, el punto más cercano al


foco es el vértice.

Demostración. Sin pérdida de generalidad sea y 2 = 4px, p > 0, F = (p, 0) y


vértice (0, 0), la ecuación de la parábola. Sea (x, y) punto de la parábola. Se tiene
p p
d(f, (x, y)) = (p − x)2 + y 2 = (p − x)2 + 4px

pues (x, y) está en la parábola. Luego,


p p p
d(f, (x, y)) = p2 − 2px + x2 + 4px = p2 + 2px + x2 = (x + p)2 = |x + p|

Como x ≥ 0, d(f, (x, y)) será mı́nima cuando x = 0 y en este caso y = 0 y tenemos
que el punto que está a distancia mı́nima del foco es (0, 0) que es el vértice.

143
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejemplo 5.2.26. Encuentre todos los elementos de la parábola de ecuación y =


− 21 x2 − x + 12 .

Solución. Se tiene que 2y = −x2 − 2x + 1 o bien x2 + 2x = −2y + 1. Luego,


completando cuadrados se tiene (x+1)2 −1 = −2y+1, es decir (x+1)2 = −2(y−1).
Por lo tanto se trata de una parábola vertical con vértice (h, k) = (−1, 1) y p =
− 12 < 0, y que se abre hacia abajo. Entonces el foco es (h, k + p) = −1, 21 y su
directriz es D : y = k − p, es decir, y = 32 .

Ejercicio 5.2.27. Encuentre el vértice, el foco y la ecuación de la directriz de las


parábolas de ecuaciones
a) 2x2 + 8x − y + 8 = 0.
b) 4x + 2y 2 + 8 = 0.
c) y 2 = 3x + 2y − 4 + 8.

Ejercicio 5.2.28. Encuentre la ecuación de la parábola de eje vertical, que pasa


por los puntos (0, 3), (3, 4) y (1, 0).

Ejemplo 5.2.29. El faro delantero de un automóvil se diseña de manera que el


corte transversal a su eje sea una parábola y la fuente de luz sea colocada en el
foco. Si el faro delantero mide 16 cm y 6 cm de profundidad, encuentre la ubicación
de la fuente de luz.

Solución. Consideremos una parábola de ecuación y 2 = 4px, necesitamos en-


contrar el foco de ella. Como el faro mide 16 cm y 6 cm de profundidad se tiene
que los punto (6, 8) y (6, −8) están en la parábola. Luego 82 = 4p6, o sea 64 = 24p,
de donde p = 38 . Luego el foco es F = (0, 83 ). Es decir la fuente de luz está a 38 cm.
del vértice (0, 0) de la parábola.

5.3. Ecuación general de segundo grado. Trasla-


ciones y rotaciones
Como vimos en la sección anterior, los distintos lugares geométricos estudiados
fueron descritos por ecuaciones en dos variables, x e y, de grado 2 (con coeficientes
reales). Las preguntas ahora son:

si consideramos una expresión general, ¿cómo podemos saber a qué lugar


geométrico describe?

¿pueden aparecerán otros?. Podemos explorar posibilidades variando el plano


considerado en la Figura 5.2.

144
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Consideraremos, entonces, ecuaciones del tipo siguiente, donde los coeficientes


A, B, C, D, E y F son números reales:

C : Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0
Nos interesan los conjuntos C de puntos (x, y) del plano R2 que satisfacen ecua-
ciones de esa forma y particularmente algunas propiedades geométricas de dichos
conjuntos. Usaremos la letra C indistintamente para designar tanto al conjunto de
puntos o lugar geométrico, como a la ecuación que lo representa.
Si la cónica se pueden escribe de la forma Ax2 + Cy 2 + Dx + Ey + F = 0 con A
y C no cero a la vez. Notamos que si A = C se tratará, del género circunferencia,
si AC > 0 será del género elipse y si AC < 0 será del género hipérbola, mientras
que si A = 0 o C = 0 (no ambos cero) se tratarı́a del género parábola.
Consideremos una ecuación algebraica general de segundo grado con coeficiantes
reales:
Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0
Cuando se quiere estudiar las propiedades de un lugar geométrico representado
por una ecuación de segundo grado en dos variables, conviene que dicha ecuación
sea lo más simple posible. Se puede lograr una simplificación de estas si el sistema
de coordenadas tiene una ubicación adecuada con respecto al lugar geométrico
que interesa. Examinaremos dos tipos de cambios en el sistema de coordenadas:
traslación y rotación.

5.3.1. Traslación del sistema de coordenadas.


Si partimos con un sistema de origen O y ejes XY, se trata de trasladar
paralelamente los ejes XY a un nuevo sistema X 0 Y 0 cuyo origen O0 será el
punto (h, k) del sistema primitivo.
En tal caso, como lo muestra la Figura 5.4, la relación entre las coordenadas
de un punto en uno u otro sistema, estará dada por
(
x = x0 + h
y = y0 + k
Si la ecuación de C en el sistema XY es

C : Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0
la ecuación en el nuevo sistema X 0 Y 0 se obtiene reemplazando x e y por sus
nuevos valores, resultando
A(x0 + k)2 + B(x0 + h)(y 0 + k) + C(y 0 + h)2 + D(x0 + h) + E(y 0 + k) + F = 0

145
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Figura 5.4: Traslación del sistema de coordenadas.

Efectuando las correspondientes operaciones y ordenando, resulta:


Ax02 + Bx0 y 0 + Cy 02 + (2Ah + Bk + D)x0 + (Bh + 2Ck + E)y 0 +
(Ah2 + Bhk + Ck 2 + Dh + Ek + F ) = 0

5.3.2. Rotación de los ejes de coordenadas en un ángulo α


A veces es conveniente tomar otros ejes coordenados, rotados respecto del ori-
ginal.
De la figura 5.5 resulta de inmediato la siguiente relación entre ambos sistemas
x = rcos(α + β) x0 = rcos(β)
y = rsen(α + β) y 0 = rsen(β)
luego: x = r(cos(α)cos(β) − sen(α)sen(β)) de donde
x = x0 cos(α) − y 0 sen(α).

146
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Figura 5.5: Rotación del sistema de coordenadas.

Del mismo modo

y = r(sen(α) cos(β) + cos(α) sen(β))

y = x0 sen(α) + y 0 cos(α)
es decir, la relación entre las coordenadas de un punto en uno u otro sistema, estará
dada por (
x = x0 cos(α) − y 0 sen(α)
y = x0 sen(α) + y 0 cos(α)
Usando notación matricial tenemos
 
cos(α) −sen(α)
Rα =  
sen(α) cos(α)

147
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

la matriz de una rotación en un ángulo α. Con esto la relación entre ambos sistemas
se escribe     
x cos(α) −sen(α) x0
 =   0
y sen(α) cos(α) y

Si C : Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0, para obtener la ecuación respecto


de X 0 Y 0 , se reemplaza x e y por sus nuevos valores:

A(x0 cos(α) − y 0 sen(α))2 + B(x0 cos(α) − y 0 sen(α))(x0 sen(α) + y 0 cos(α))

+C(x0 sen(α)+y 0 cos(α))2 +D(x0 cos(α)−y 0 sen(α))+E(x0 sen(α)+y 0 cos(α))+F = 0


Reordenando se obtiene
(A cos2 (α) + B sen(α) cos(α) + Csen2 (α))x02 + (−2A sen(α) cos(α) + B(cos2 (α)

+− sen2 (α)) + 2Csen(α) cos(α))x0 y 0 + (A sen2 (α) − B sen(α) cos(α) + Ccos2 (α))y 02 +

+ (D cos(α) + E sen(α))x0 + (E cos(α) − D sen(α))y 0 + F = 0

Proposición 5.3.1. Consideremos la curva de ecuación Ax2 + Bxy + Cy 2 + Dx +


Ey + F = 0. Al rotar los ejes en un ángulo α, 0 < α < π2 tal que

B π
tan(2 α) = , si A 6= C ∨ α = , si A = C
A−C 4
se elimina el término en xy.
Demostración. Tenemos que

B 0 = −2A sen(α) cos(α) + B(cos2 , (α) − sen2 (α)) + 2C sen(α) cos(α)

= −A sen(2 α) + B cos(2 α) + C sen(2 α)

Luego, si queremos que B 0 = 0, obtenemos al dividir por cos(2α) 6= 0 :

B 0 = 0 = −A tan(2 α) + B + C tan(2 α)
B
De donde tan(2 α) = A−C
, si A 6= 0.

Notemos que en este caso siempre cos(2α) 6= 0, pues si cos(2α) = 0, entonces


como B 0 = 0, se tendrı́a sen(2α) = cos(2α) = 0 ∨ A = C Contradicción.
π
Si A = C, de la condición inicial queda B cos(2α) = 0 luego α = 4
. En
este caso basta rotar los ejes en un ángulo α = π4 .

148
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Observación 5.3.2. Una relación importante se mantiene entre coeficientes de la


nueva ecuación con respecto al coeficiente de la ecuación primitiva, luego de una
rotación.
B 2 − 4AC = B 02 − 4A0 C 0 .
Tenemos:
B 0 = 2(C − A)sen(α) cos(α) + B(cos2 (α) − sen2 (α))
A0 = Acos2 (α) + B sen(α) cos(α) + Csen2 (α)
C 0 = Asen2 (α) − B sen(α) cos(α) + C cos2 (α)
De donde:
B 02 = 4(C 2 + A2 − 2AC)sen2 (α) cos2 (α) + B 2 (cos2 (α) − sen2 (α))+

+ 2(C − A)B sen(α) cos(α)(cos2 (α) − sen2 (α))

4A0 C 0 = 4(C 2 cos2 (α) sen2 (α) − AB cos2 (α) sen(α) cos(α) + AC cos4 (α)+

+ AB sen2 (α) sen(α) cos(α) − B 2 sen2 (α) cos2 (α)+

+ BC cos2 (α) sen(α) cos(α) + AC sen4 (α) − BC sen2 (α) cos(α)+

+ C 2 sen2 (α) cos2 (α))


Entonces:

B 02 − 4A0 C 0 = B 2 ((cos2 (α) − sen2 (α))2 + 4 sen2 (α) cos2 (α))

− 4AC(sen2 (α) cos2 (α) + cos4 (α) + sen4 (α))

= B 2 (cos2 (α) + sen2 (α))2 − 4AC(sen2 (α) + cos2 (α))2

= B 2 − 4AC

5.4. Clasificación de cuádricas planas según el


discriminante B 2 − 4AC:

Si recordamos, que A, B y C no cambian en el caso de la traslación del sis-


tema de coordenadas, entonces el indicador o discriminante I = B 2 − 4AC
permanece invariante, tanto por traslación o rotación o combinaciones de éstas.

149
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Si rotamos en un ángulo adecuado tenemos que B 0 = 0, y ası́ I = −4A0 C 0


La relación entre I (discriminante), y los lugares ya conocidos se resume en la
siguiente tabla:
I = 0, género Parábola

I > 0, género Hipérbola

I < 0, género Elipse


Es importante recalcar que en cada caso pueden haber degeneraciones; esto es,
lugares geométricos que no se grafiquen.
El caso de la circunferencia, se tiene una ecuación de la forma Ax2 + Ay 2 +
Dx + Ey + F = 0. Aquı́ I = B 2 − 4AC = −4A2 < 0, por lo que se asimila este
caso al género Elipse.
Ejemplo 5.4.1. Identifique la curva x2 + 3xy + 5y 2 = 4, luego encuentre el ángulo
α necesario para eliminar el término en xy.
Solución. Se tiene A = 1, B = 3, C = 5, luego I = B 2 − 4AC = 9 − 4 · 5 =
9 − 20 < 0, luego la curva es del género elipse. Además como A 6= C, se tiene que
B 3 3
tan(2α) = A−C = 1−5 = −4 = − 43 . Luego 2α en el segundo cuadrante es decir
cos(2α) < 0. Además cos2 (2α) = 1+tan12 (2α) = 25
16
, por lo tanto, cos(2α) = − 45 . Por
trigonometrı́a sabemos que
r
1 + cos(2α) 1
cos(α) = =√
2 10
r
1 − cos(2α) 3
sen(α) = =√
2 10
y la matriz de rotación es
 
cos(α) −sen(α)
Rα =  
sen(α) cos(α)

o sea,  
√1 − √310
Rα =  310
√1


10 10

Con esto la relación entre ambos sistemas se escribe


    
x √1
10
− √3
10
x0
 = 3   0
y √ √1 y
10 10

150
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

de donde x = √110 x0 − √310 y 0 = √110 [x0 − 3y 0 ], y = √310 x0 + √110 y 0 = √1 [3x0


10
+ y0]
Haciendo el reemplazo en la ecuación x2 + 3xy + 5y 2 = 4, se llega a
1 0 1
x2 = [x − 3y 0 ]2 = [x02 + 6x0 y 0 + 9y 02 ]
10 10
3 1
3xy = [3x02 − 8x0 y 0 − 3y 02 ] = [9x02 − 24x0 y 0 − 9y 02
10 10
1 1
y 2 = [3x0 + y 0 ]2 = [9x02 + 6x0 y 0 + y 02 ]
10 10
Sumando da
1 02
[x + 6x0 y 0 + 9y 02 + 9x02 − 24x0 y 0 − 9y 02 + 9x02 + 6x0 y 0 + y 02 ] = 4
10
es decir,
1
[10x02 + y 02 ] = 4.
10
De donde, la ecuación es
10x02 + y 02 = 40
Finalmente la ecuación de la curva es,
x02 x02
+ = 1.
4 40

Ejemplo 5.4.2. Identifique la curva 7x2 − 6 3xy + 13y 2 = 4, luego encuentre el
ángulo α necesario para eliminar el término en xy.

Solución. Se tiene A = 7, B = −6 3, C = 13, luego I = B 2 − 4AC =
108 − 4 · 91 = 108 − 364 < 0, luego la curva
√ es
√ del género elipse. Además como
−6 3
A 6= C, se tiene que tan(2α) = A−C = 7−13 = 3. Luego 2α = 3 , es decir α = π6 ,
B π

3
y sen(α) = 12 , cos(α) = 2
y la matriz de rotación es
√ 
3
2
− 12
Rα =  1 √3 
2 2

Con esto la relación entre ambos sistemas se escribe


!  √3 1


!
x 2 2 x0
=  1 √3  0
y 2 2 y
√ √
de donde x = 23 x0 − 12 y 0 , y = 12 x0 + 23 y 0 . Haciendo el reemplazo en la ecuación

7x2 − 6 3xy + 13y 2 = 16, se llega a la ecuación
x02 + 4y 02 = 4.

151
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejercicio 5.4.3. Identifique la curva de ecuación 3x2 −2xy+3y 2 −2x−10y+9 = 0,,


haga una traslación a ejes X’ Y’ para eliminar los términos en x y en y, y luego
una rotación a ejes X 00 Y 00 para eliminar el término x0 y 0 .

152
Capı́tulo 6

Matrices

6.1. Introducción a las Matrices


Un primer objeto fundamental en Álgebra Lineal, y que tiene muchı́simas apli-
caciones en diferentes áreas de la Ciencia, es una matriz.

Definición 6.1.1. Se llama matriz de tamaño m × n con coeficientes en el cuerpo


K, y se anota A ∈ Mm×n (K), al siguiente arreglo de elementos en el cuerpo K con
m filas y n columnas.  
a11 a12 . . . a1n
 
 a21 a22 . . . a2n 
A= .
 
 .. .
.. .
.. . 
.. 
 
am1 am2 . . . amn

Se abrevia A = (aij )1≤i≤m,1≤j≤n ∈ Mm×n (K) o A = (aij ) ∈ Mm×n (K) o simple-


mente A ∈ Mm×n (K). En el caso que en m = n usaremos la notación A ∈ Mn (K),
en lugar de A ∈ Mn×n (K)
Los elementos aij se llaman las entradas de la matriz A. Usualmente usaremos
K = R.

Definición 6.1.2. Sean A = (aij ), B = (bij ) ∈ Mm×n (K). Entonces

A = B ⇐⇒ aij = bij ∀i, ∀j

Por ejemplo,   

4 0 2+2 0
 = 
−3 1 1−4 1

153
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Definición 6.1.3. Sean A = (aij ) ∈ Mm×n (K), B = (bij ) ∈ Mn×p (K) entonces se
define el producto como la matriz
n
X
C = (cij ) ∈ Mm×p (K) donde cik = aij bjk ∀ i = 1, · · · , m, ∀ k = 1, · · · , p
j=1

Observación 6.1.4. Si queremos multiplicar las matrices A por B las columnas


de la matriz A deben ser iguales a las filas de la matriz B.
 
 1
Ejemplo 6.1.5. Sean A = 1 i y B = dos matrices complejas. Multi-
i
plique AB y BA. Note que en este caso se puede hacer ambos productos.

AB = (1 · 1 + i · i) = (0) ∈ M1 (C).
Por otro lado
 
1 i
BA = ∈ M2 (C).
i −1
Ejemplo 6.1.6. Calculemos AB y BA, donde A y B son las siguientes matrices
reales
   
1 0 1 1
A= ,B= .
1 1 0 2
Veamos primero AB:
   
1·1+0·0 1·1+0·2 1 1
= .
1·1+1·0 1·1+1·2 1 3
Mientras que BA es
   
1·1+1·1 1·0+1·1 2 1
=
0·1+2·1 0·0+2·2 2 2
Con ambos ejemplos demostramos que el producto de matrices no es conmuta-
tivo, aunque sea entre matrices cuadradas.

Ejercicio 6.1.7. Sean A, B, C matrices con coeficientes reales. Calcule el producto


de ellas cuando sea posible.
   
  4 2 6 3 1 4 0
2 0 1
 , B = 0 1 2 1 , C = 2 1 3  ,
   
A=
1 5 0    
2 6 0 3 3 2 −2

154
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Definición 6.1.8. Denotemos por In = (δij ) ∈ Mn (R), donde


(
1 i=j
δij =
0 i 6= j
In se llama la matriz identidad.

Observación 6.1.9. Observe que δij es una función en dos variables, se llama
Delta de Kronecker, y aparece en muchos contextos distintos.

La matriz identidad es el neutro multiplicativo. Veamos, primero que In A = A


para todo A ∈ Mn×n (R). Esto pues el coeficiente ij del producto In A es
n
X
(In A)ij = δik akj = aij .
k=1

Análogamente se demuestra que AIn = A.


Note que si está trabajando con matrices con entradas en un cuerpo K, entonces
la matriz identidad es la misma sólo que 1 se entiende como el neutro del producto
en K.

Ejemplo 6.1.10. Sea ek el vector canónico de K n que tiene un 1 en la posición k


y cero en las otras. Note que corresponde a una matriz de 1 × n, donde su entrada
α1j es δjk , esto para j = 1, . . . , n y k = 1, . . . , n. Es decir,

ek = (α11 α12 . . . α1k . . . α1n ) = (0 0 . . . 1 . . . 0) ∈ M1×n (K),


donde el 1 está en el lugar k−ésimo.
Sea A ∈ Mn (K), entonces B = ek A es una matriz de 1 × n que corresponde a
la fila k de A. En efecto, el coeficiente b1j del producto ek A es
n
X n
X
b1j = α1i aij = δik aij = akj , para j = 1, . . . , n.
i=1 i=1

Ejercicio 6.1.11. Sean A = (aij ) ∈ Mm×n (R), B = (bij ) ∈ Mn×k (R), C = (cij ) ∈
Mk×p (R). Entonces A(BC) = (AB)C. Para ello, compare el coeficiente ij de cada
uno de los productos. Debe demostrar que son iguales para todo i y todo j.

Ejercicio 6.1.12. Sea a ∈ R. Demuestre que para todo n ∈ N, se cumple


 n  
1 a 1 na
= .
0 1 0 1
Entendiendo que si A ∈ Mn (R), entonces A1 := A y An := An−1 · A para todo
n ∈ N, n > 1.

155
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ası́ como definimos el producto de matrices, veamos otras dos operaciones.


Definición 6.1.13. Sean A = (aij ) ∈ Mm×n (K), B = (bij ) ∈ Mm×n (K) entonces
se define la suma y la mutiplicación por un escalar α ∈ K como las matrices

C = A + B = (aij ) + (bij ) ∈ Mm×n (K), D = αB = (αbij ) ∈ Mm×n (K)
respectivamente.
0m×n es una matriz cuyas entradas son todas iguales a 0 y se llama la matriz
cero.
Ejercicio 6.1.14. Sean A = (aij ), B = (bij ), C = (cij ) ∈ Mm×n (K) entonces
i) A + B = B + A
ii) A + 0m×n = A = 0m×n + A.
iii) A + (−A) = 0m×n = (−A) + A.
iv) A + (B + C) = (A + B) + C.
Ejercicio 6.1.15. Sean A = (aij ), B = (bij ) ∈ Mm×n (K), C = (cij ) ∈ Mn×k (K)
entonces
i) (A + B)C = AC + BC.
ii) ∀ α ∈ K, α(BC) = (αB)C = B(αC).
Ejercicio 6.1.16. Denotemos por εij = (xij ) ∈ Mn (R) la matriz tal que

xrs = 1 si r = iys = j
xrs = 0 en todo otro caso
Demuestre que se tienen las siguientes propiedades:
1. εij εkr = 0 ∀j 6= k
2. εij εjr = εir ∀i, j, r ∈ {1, . . . , n}
3. Toda matriz A = (aij ) se escribe como suma (doble) de múltiplos de estas
matrices εij
X
A= aij εij
i,j

Observación 6.1.17. Se pueden definir igualmente las matrices εij ∈ Mm×n (R)
y se tiene igualmente la última propiedad. Debe tenerse cuidado con el producto.
Estas matrices jugarán un rol importante más adelante, al ver bases de espacios
vectoriales reales.
Definición 6.1.18. Sea A = (aij ) ∈ Mn×m (K), con K un cuerpo, se define la
matriz traspuesta de A, denotada At como la matriz de entradas bij , donde bij :=
aji .
Note que At ∈ Mm×n (K). Si A es una matriz cuadrada, entonces la trasposición
define una operación en Mn (K).

156
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

6.1.1. Matrices escalonadas y eliminación gaussiana


Definición 6.1.19. Partiremos con una matriz A y haremos cambios en sus filas,
hasta llegar a la forma escalonada por filas de ella:
(i) Todas las filas cuyos elementos son todos ceros aparecen en la parte inferior
de la matriz.
(ii) Para cada fila no nula , el primer elemento no cero es 1 y se le llama 1
principal o pivote.
(iii) En dos filas consecutivas diferentes de cero, el 1 principal de la fila superior
aparece a la izquierda del 1 principal de la fila inmediatamente inferior.

   
1 2 1 1 0 2 1 7
 0 1 −1 6  es escalonada,  0 0 0 0  no es escalonada.
0 0 1 2 1 1 2 6

Observación 6.1.20. Se llama forma escalonada reducida. si las columnas que


contienen los pivotes son vectores canónicos. Por ejemplo,
 
1 0 2 4
 0 1 −2 1  .
0 0 0 0
Para obtener la forma escalonada por filas de una matriz se pueden hacer las
siguientes operaciones elementales (fila).

Definición 6.1.21. Las siguientes operaciones se llaman operaciones elementales


fila

1. Intercambiar dos filas de la matriz (tipo I).

2. Multiplicar una fila de la matriz por una constante no nula (tipo II).

3. Sumar a una fila un mútiplo no nulo de otra fila (tipo III).

Ejemplo 6.1.22. Encuentre la forma escalonada por filas de la matriz


 
1 2 1
A =  4 −2 −1  ,
2 −1 3

157
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Solución. Veamos las operaciones para llegar a un matriz escalonada por filas
 
1 2 1
F2 → F2 + (−4)F1  0 −10 −5 
2 −1 3
 
1 2 1
F3 → F3 + (−2)F1  0 −10 −5 
0 −5 1
 
1 2 1
−1
F3 → F3 + ( )F2  0 −10 −5 
2 7
0 0 2
 
1 2 1
−1
F2 → ( )F2  0 1 12 
10
0 0 72
 
1 2 1
2
F3 → ( )F3  0 1 12 
7
0 0 1
que es una matriz escalonada por filas.

Ejercicio 6.1.23. Encuentre la forma escalonada por filas de la matriz


 
3 2 1
A =  1 3 −1  ,
−2 1 4

Ejercicio 6.1.24. Encuentre la forma escalonada por filas de la matriz


 
0 −3 −6 4 9
 −1 −2 −1 3 1 
A=  −2 −3 0
,
3 −1 
1 4 5 −9 −7

Observación 6.1.25. Las operaciones elementales también las puede hacer en las
columnas, para obtener una matriz escalonada por filas (Definición 6.1.19).

Veremos dos aplicaciones de las matrices escalonadas: En la solución de sistemas


de ecuaciones lineales y en el cálculo de la matriz inversa, si existe .

158
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

6.1.2. Matrices inversas


Definición 6.1.26. Sea A ∈ Mn (R). Se dice que A es invertible si existe una matiz
B ∈ Mn (R) tal que AB = In = BA. La matriz B se anota A−1 .

Observación 6.1.27. Se probará que una matriz será invertible si su forma es-
calonada por filas es la matriz identidad. ¿ Cómo calcular dicha inversa? Primero
mostraremos el método y luego probaremos por qué funciona.

La matriz del ejemplo 6.1.22


 
1 2 1
A =  4 −2 −1  ,
2 −1 3

es invertible pues su matriz escalonada por filas es


 
1 2 1
 0 1 1 
2
0 0 1

Veamos  
1 0 0
F1 → F1 − 2F2  0 1 12 
0 0 1
 
1 0 0
1
F2 → F2 − F3  0 1 0 
2
0 0 1
Luego la matriz A es invertible.
El método es el siguiente: Considere una matriz ampliada
 
1 2 1 1 0 0
 4 −2 −1 0 1 0 
2 −1 3 0 0 1

Veamos las operaciones para llegar a un matriz I3 y la correspondiente matriz


inversa.  
1 2 1 1 0 0
F2 → F2 + (−4)F1  0 −10 −5 −4 1 0 
2 −1 3 0 0 1
 
1 2 1 1 0 0
F3 → F3 + (−2)F1  0 −10 −5 −4 1 0 
0 −5 1 −2 0 1

159
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

 
1 2 1 1 0 0
1
F3 → F3 + (− )F2  0 −10 −5 −4 1 0 
2 7
0 0 2
0 − 12 1
 
1 2 1 1 0 0
1
F2 → (− )F2  0 1 12 25 − 10 1
0 
10 7 1
0 0 2 0 −2 1
 
1 2 1 1 0 0
2
F3 → ( )F3  0 1 12 25 − 10
1
0 
7
0 0 1 0 − 7 27
1

1 0 0 15 1
 
5
0
F1 → F1 − 2F2  0 1 12 25 − 101
0 
0 0 1 0 − 7 27
1

1 0 0 15 1
 
0
1 5
F2 → F2 − F3  0 1 0 25 − 35 1
− 17 
2 1 2
0 0 1 0 −7 7
Luego la inversa de la matriz
 
1 2 1
A =  4 −2 −1  ,
2 −1 3
es
1 1
 
5 5
0
A−1 =  2
5
1
− 35 − 17 
0 − 17 2
7

¿Por qué este método funciona?


Ahora que sabemos encontrar inversas, veamos los fundamentos. Recordemos
que A ∈ Mn (K) es invertible si existe una matiz B ∈ Mn (R) tal que AB = In =
BA.
Primero veamos una serie de resultados respecto a inversas.
Proposición 6.1.28. Las matrices consideradas a continuación pertenecen a Mn (K),
para un cuerpo K.
1. Si A es invertible, la matriz B tal que AB = BA = In es única.

Demostración. Suponga que existe C tal que AC = CA = In , entonces


B = B · In = B · (AC) = (BA)C = In C = C,
donde se usa que In es el neutro, y usamos que BA = In .

160
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

2. Si A tiene una fila o columna nula, entonces no es invertible.

Demostración. Si A tiene la fila i nula, entonces todo producto AB tendrá


la fila i nula. La matriz identidad no tiene filas nulas, luego no existe matriz
B tal que AB sea la identidad. Análogamente, si A tiene la columna j nula,
entonces todo producto BA tendrá la columna j nula. Se conluye lo mismo
anterior.

3. Si A1 , A2 , . . . , Ap son matrices invertibles, entonces A1 · A2 · · · · · Ap también


es invertible y

(A1 · A2 · · · · · Ap )−1 = A−1 −1 −1 −1


p · Ap−1 · · · · · A2 · A1 .

Demostración. Como la inversa es única, basta probar que la presentada


aquı́ funciona. Para ello recuerde que el producto es asociativo. Se deja como
ejercicio.

Ahora recordemos que el método para encontrar la matriz inversa de A ∈


Mn (K), consiste en escribir la matriz ampliada (A | In ) y hacer operaciones fila
para que quede escalonada. Es decir, (In |B), y la conclusión es que B es la inversa
de A.
Hay en lo anterior varias afirmaciones que pasamos a demostrar.

Proposición 6.1.29. Toda matriz A ∈ Mm×n (K) no nula se transforma usando


operaciones elementales fila, Def. 6.1.21, en una matriz escalonada.

Demostración. Hemos visto un método. Es decir la demostración de esta afirmación


es la presentación del método con el cual se logra escalonar una matriz.

1. Elija una fila i tal que ai1 6= 0, si no hay, pase a la segunda columna. Es
decir, busque ai2 6= 0. En alguna columna hay un elemento no nulo pues si
no la matriz es nula. Note que si A es invertible tiene que haber una fila i con
ai1 6= 0, en caso contrario tendrı́a una columna nula y, por la Prop. 6.1.28, la
matriz no serı́a invertible.

2. Intercambie la fila i que encontró en el paso anterior con la fila 1

3. Multiplique la (nueva) fila 1 por λ = a−1


i1 ∈ K. Tiene ası́ el pivote de esa fila.

4. Haga 0 los coeficientes de la primera columna, abajo del 1 que quedó de


la operación anterior. Para ello sume a la fila correspondiente un múltiplo
apropiado de la fila 1. Es decir, con operaciones del tipo III.

161
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

5. Vuelva al primer paso pero para la columna siguiente. Es decir, busque ai2 6=
0. Repita hasta tener escalonado.

Note que con operaciones del tipo III, puede limpiar la columna del pivote
para que quede el vector canónico en esa columna. Es decir, sólo el pivote como
entrada no nula en esa columna. Queda ası́ la matriz escalonada reducida.
Con esto ya creemos que siempre podremos cambiar (A | In ) a (Im | B), pero
¿por qué en el caso de A invertible queda que B es la inversa de A? Para ello
necesitamos una definición.

Definición 6.1.30. La matriz que resulta de aplicar una operación elemental fila,
Def. 6.1.21, a la matriz A, se anota Ef (A).
Una matriz que resulta de aplicar una operación elemental fila a la matriz
identidad In , se llama matriz elemental fila. Se anota Ef (In ).

Note que las matrices elementales son invertibles, por lo tanto un producto de
ellas también lo es.

Proposición 6.1.31. Realizar operaciones elementales fila a una matriz A ∈


Mm×n (K), es equivalente a multiplicarla por la izquierda por la matriz que resulta
de realizar las mismas operaciones fila a la matriz identidad. Es decir, usando la
notación en la Def. 6.1.30,

Ef (A) = Ef (Im ) · A.

Demostración. La demostración consiste en comprobar el resultado para cada una


de las operaciones elementales fila en la Definición 6.1.21. Haremos sólo la demos-
tración para el intercambio de filas. El resto se deja como ejercicio. Sea
 
a11 a12 . . . a1n
 
 a21 a22 . . . a2n 
A= .
 
 .. .
.. .
.. . 
.. 
 
am1 am2 . . . amn

Si se intercambió la fila i por la fila j, digamos que i < j y anota Ef dicha


operación, se tiene que A queda

162
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

 
a11 a12 ... a1n
 
 a21 a22 . . . a2n 
 
 . .. .. .. 
 .. . . . 
 
a
 j1 aj2 . . . ajn  
Ef (A) = 
 .. .. .. .. 

 . . . . 
 
 ai1 ai2 . . . ain 
 
 . .. .. .. 
 .. . . . 
 
am1 am2 . . . amn

Por otro lado la matriz Im queda de la siguiente forma si le hacemos la misma


operación
 
e1
 e2 
 .. 
 
 . 
 ej 
 
Ef (Im ) = 
 ... 

 
 e 
 i 
 . 
 .. 
em
donde ek es el vector canónico, o matriz de 1 × m, que tiene todas las coordenadas
0, salvo la en la posición k (o en la posición 1k si la tomamos como matriz). Ahora,
al multiplicar ek · A se obtiene una matriz de 1 × n que corresponde a la fila k de
la matriz A. Entonces al hacer el producto Ef (Im )A se obtiene Ef (A).
Finalmente note que si E correponde a hacer varias operaciones elementales
fila, se tiene

E(A) = Ef2 (Ef1 (A)) = Ef2 (Ef1 (Im )A) = Ef2 (Im )Ef1 (Im )A = E(Im )A.

Estamos ya casi listos para creer que el método funciona siempre.

Proposición 6.1.32. Sea A ∈ Mn (K) y su denote por M una matriz escalonada


equivalente por filas a A. Entonces, los coeficientes de la diagonal de M son no
nulos si y sólo si A es invertible.

163
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración. Denote M = E(A), donde E captura las operaciones fila que hizo
para llegar a M . Entonces, por la proposición anterior, E(I)A = M . Vamos con la
demostración

⇐) Sabemos que E(I) es invertible, como por hipótesis A es invertible, conclui-


mos (usando la Prop. 6.1.28) que M es invertible. Entonces, por la Prop.
6.1.28, M no tiene filas nulas. Como M es escalonada, tenemos que los coefi-
cientes de su diagonal son no nulos, pues si algún coeficiente de la diagonal
es cero, entonces la última fila serı́a nula.

⇒) Si M es una matriz cuadrada de tamaño n con los coeficientes de la diagonal


no nulos, entonces por operaciones fila puede llevarse a la identidad. Es decir
Ef (M ) = In , es decir Ef (In )M = In . Tenemos entonces

In = Ef (In )M = Ef (In )E(A) = Ef (In )E(In )A,


y ası́ B = Ef (In )E(In ) = Ẽ(In ) es la inversa de A, donde Ẽ es el conjunto
de operaciones fila que hace que A sea la Identidad.

Conclusión: Por eso el método es: haga operaciones fila a A de tal forma
que llegue a la Identidad, la inversa de A será la matriz que resulte de hacer
las mismas operaciones a la Identidad. Ası́ es que se toma mejor la matriz
ampliada (A | In ) y se hacen las operaciones a la identidad al mismo tiempo
que a A.

Observación 6.1.33. Si se hicieron operaciones columna a A ∈ Mn (K), el resul-


tado es válido pero la multiplicación con la correspondiente matriz elemental es
por la derecha. Es decir, denotando por EC (∗) la matriz que resulta de hacer ope-
raciones columna a ∗ se tiene EC (A) = AEC (In ). Luego podemos hacer el método
del pivote y encontrar con operaciones columna la matriz escalonada (reducida)
equivalente a A. Si ésta es la identidad tenemos

EC (A) = In = AEC (In ).


Ası́ A tiene una inversa por la derecha. Note que tiene Ef (In )A = In = AEC (In ).
Entonces puede hacer lo siguiente

Ef (In ) = Ef (In )In = Ef (In )(AEC (In )) = (Ef (In )A)EC (In ) = In EC (In ) = EC (In ).

Luego, de cualquier forma, encuentra la inversa de A que es Ef (In ) (o EC (In )).

164
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

6.1.3. Sistemas de Ecuaciones lineales


Considere un sistema de m ecuaciones lineales y n incógnitas x1 , · · · , xn . a

a11 x1 + · · · + a1n xn = b1
a21 x1 + · · · + a2n xn = b2
(6.1)
:
am1 x1 + · · · + amn xn = bm

Definición 6.1.34. La matriz y la matriz ampliada nuestro sistema son, respec-


tivamente,
 
a11 a12 · · · a1n
 a21 a22 · · · a2n 
A :=   ∈ Mm×n (K)
 : 
am1 am2 · · · amn
 
a11 a12 · · · a1n b1
 a21 a22 · · · a2n b2 
(A|B) :=   ∈ Mm×(n+1) (K)
 : 
am1 am2 · · · amn bm
Una solución de un sistema de m ecuaciones lineales y n incógnitas es una
n-upla x1 , · · · , xn de elementos en el cuerpo K que satisfacen cada ecuación del
sistema.

En el caso de un sistema real de m = 2, n = 2 cada ecuación es una recta en el


plano R2 . Hay 3 casos posibles para las gráficas de las ecuaciones

1. Las rectas se intersectan en un sólo punto. Hay una única solución del sistema.

2. Las ecuaciones describen las misma recta. Hay infinitas soluciones del sistema.

3. Las dos rectas son paralelas. No hay solución del sistema.

En el caso de de un sistema de m = 3 y n = 3 cada ecuación es un plano en el


espacio. En general un sistema de m ecuaciones lineales y n incógnitas puede tener
exactamente una solución, infinitas soluciones o no tener solución. Para resolver
un sistema de ecuaciones se pueden hacer las siguientes operaciones:

1. Intercambiar dos ecuaciones.

2. Multiplicar una ecuación por una constante no nula.

3. Sumar a una ecuación un múltiplo no nulo de otra.

165
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejemplo 6.1.35. Encuentre las soluciones del sistema, si las hay:

x +2y +z = −6
4x −2y −z = −4
2x −y +3z = 19

Solución. Multiplicando la primera ecuación por −4, sumándole el resultado


a la segunda, multiplicando la primera ecuación por −2 y sumándole el resultado
a la tercera, se elimina x de estas dos ecuaciones y tenemos el sistema:

x +2y +z = −6
−10y −5z = 20
−5y +z = 31

En el sistema anterior, si la segunda ecuación se multiplica por −1


2
y se le suma
a la tercera ecuación, eliminamos y de la tercera ecuación y se obtiene un sistema
equivalente el anterior
x +2y +z = −6
−10y −5z = 20
7
2
z = 21
−1 2
Al multiplicar la segunda fila por 10
y la tercera fila por 7
llegamos al siguiente
sistema, equivalente al original.

x +2y +z = −6
y + 21 z = −2
z = 6

Observando este último sistema se ve que z = 6. Usando este valor en la segunda


ecuación obtenemos que y = −2 − 21 z = −2 − 3 = −5. Para obtener el valor de x
usamos la primera ecuación y que y = −5, z = 6. Luego x = −2y − z − 6 = −2.
Por consiguiente la solución del sistema original es única y es x = −2, y =
−5, z = 6.

Ejercicio 6.1.36. Encuentre las soluciones del sistema, si las hay:

x −2y +z = 0
2y −8z = 8
−4x +5y +9z = −9

Observación 6.1.37. La solución de un sistema de ecuaciones lineales depende


solamente de los números aij y bk , que aparecen en el sistema. Usaremos por ello
las matrices asociadas al sistema.

166
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

6.1.4. Rango de una matriz, número de soluciones de un


sistema de ecuaciones
Definición 6.1.38. Se llama rango de una matriz A ∈ Mm×n (R) al número de
filas no nulas de la matriz escalonada por filas. Dicho rango es ≤ m = número de
filas de la matriz.

Recordemos que la matriz y la matriz ampliada nuestro sistema son


 
a11 a12 · · · a1n
 a21 a22 · · · a2n 
A :=  :
,

am1 am2 · · · amn
 
a11 a12 · · · a1n b1
 a21 a22 · · · a2n b2 
(A|B) := 
 :


am1 am2 · · · amn bm
Note que si anotamos X := (x1 x2 . . . xn )t ∈ Mn×1 (K) al vector de solucio-
nes, y B := (b1 b2 . . . bn )t ∈ Mn×1 (K) al vector formado por los valores libres de
incógnitas en el sistema, podemos anotar el sistema como

A · X = B,
usaremos esta abreviación para el sistema.

Definición 6.1.39. Se dice que dos sistemas son equivalentes, si tienen el mismo
conjunto de soluciones.

Proposición 6.1.40. Sea A · X = B un sistema lineal con A ∈ Mm×n (K) y


B = Mm×1 (K), donde X es el vector de incógnitas. Sea C ∈ Mm (K) una matriz
invertible. Entonces los siguientes sistemas son equivalentes

(S1) A · X = B y (S2) (CA) · X = (CB).

Demostración. Si x0 ∈ Mm×1 (K) es solución de (S1), entonces A · x0 = B, mul-


tiplicamos a ambos lados por C y se tiene CA · x0 = CB. Ası́ es solución de
(S2).
Recı́procamente, si x0 ∈ Mm×1 (K) es solución de (S2), entonces CA · x0 = CB,
multiplicamos a ambos lados por C −1 , usando la asociatividad del producto, se
concluye lo deseado.

167
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Note que como C es invertible, se tiene que es producto de matrices elemen-


tales fila. Por eso se pueden hacer operaciones fila a la matriz aumentada (A|B)
para llegar a un sistema más simple que tendrá las mismas soluciones. Se tiene el
siguiente resultado.

Proposición 6.1.41. Para un sistema de m ecuaciones lineales con n incógnitas


se tiene:

1. Si rango(A) = rango (A|B) = n entonces el sistema tiene única solución.

2. Si rango(A) = rango (A|B) < n entonces el sistema tiene infinitas soluciones.

3. Si rango(A) < rango (A|B) entonces el sistema no tiene solución.

Demostración. Si rango(A) < rango (A|B) , al escalonar la matriz ampliada, se


quedará con filas de ceros salvo en el último coeficiente. Esas son ecuaciones del
tipo 0 = b, con b ∈ K r 0. Ello es inconsistente.
Si rango(A) = rango (A|B) = n , al escalonar la matriz ampliada, se quedará con
la última fila xn = b, reemplazando hacia arriba, se obtendrán las otras soluciones.
Tiene ası́ el sistema solución única.
Finalmente si rango(A) = rango (A|B) < n, se tendrán menos ecuaciones que
incógnitas, por lo que algunas de las incógnitas quedarán en términos de otras. De
hecho, hay n−rango(A) variables independientes y rango(A) dependientes.
Ahora sólo queda practicar.

Ejercicio 6.1.42. Encuentre las soluciones del sistema, si las hay:

x −4z = 8
2x −3y +2z = 1
5x −8y +7z = 1

Ejemplo 6.1.43. Encuentre el valor de k ∈ R, de modo que el sistema de ecua-


ciones lineales tengan única, ninguna o infintas soluciones:

x +y +kz = 3
x +ky +z = 2
kx +y +z = 1

Solución. Matriz ampliada


 
1 1 k 3
(A|B) = 1 k 1 2
k 1 1 1

168
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

 
1 1 k 3
F2 → F2 + (−1)F1  0 k − 1 1 − k −1
k 1 1 1
 
1 1 k 3
Si k 6= 0, F3 → F3 + (−k)F1  0 k − 1 1 − k −1 
0 1 − k 1 − kk 1 − 3k
 
1 1 k 3
F3 → F3 + F2  0 k − 1 1−k −1 
0 0 (−k − 2)(k − 1) −3k
 
  1 1 k 3
1 1 
Si k 6= 1, F2 → F2  0 1 −1 k−1
k−1
0 0 −(k + 2)(k − 1) −3k
 
  1 1 k 3
−1 1
Si k 6= 1, −2, F3 → F3  0 1 −1 k−1

(k + 2)(k − 1) 0 0 1 3k
(k+2)(k−1)

Por lo tanto, si k 6= 0, k 6= 1, k 6= −2, el sistema tiene única solución pues


rango(A) = rango (A|B) = número de incógnitas = 3. Está dada por

3k 1 3k 1
z= , y=z− = − ,
(k + 2)(k − 1) k−1 (k + 2)(k − 1) k − 1

3k 1 3k
x = −y − kz + 3 = − + −k + 3.
(k + 2)(k − 1) k − 1 (k + 2)(k − 1)

Falta analizar los casos k = 0 y k = 1, k = −2.


Caso k = 0. El sistema es
x +y = 3
x +z = 2
y +z = 1
 
1 1 0 3
(A|B) =  1 0 1 2
0 1 1 1
 
1 1 0 3
F2 → F2 + (−1)F1 0
 −1 1 −1
0 1 1 1

169
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

 
1 1 k 3
F2 → (−1)F2  0 1 −1 1
0 1 1 1
 
1 1 0 3
F3 → F3 + (−1)F2  0 1 −1 1
0 0 2 0
En este caso hay única solución pues rango(A) = rango (A|B) = número de
incógnitas = 3. Está dada por z = 0, y = z + 1 = 1, x = −y + 3 = 2.
Caso k = 1. El sistema es
x +y +z = 3
x +y +z = 2
x +y +z = 1
 
1 1 1 3
(A|B) =  1 1 1 2
1 1 1 1
 
1 1 1 3
F2 → F2 + (−1)F1  0 0 0 −1
1 1 1 1
 
1 1 1 3
F3 → F3 + (−k)F1 0 0 0
 −1
0 0 0 −2
En este caso no hay solución pues rango (A) = 2 < rango (A|B) = 3.
Caso k = −2. El sistema es
x +y −2z = 3
x −2y +z = 2
−2x +y +z = 1
 
1 1 −2 3
(A|B) =  1 −2 1 2
−2 1 1 1
 
1 1 −2 3
F2 → F2 + (−1)F1  0 −3 3 −1
−2 1 1 1
 
1 1 −2 3
F3 → F3 + 2F1 0 −3 3 −1
0 3 −3 7

170
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

 
1 1 −2 3
−1
F2 → F2  0 1 −1 13 
3
0 3 −3 7
 
1 1 −2 3
F3 → F3 − 3F2  0 1 −1 13 
0 0 0 7
En este caso no hay solución pues rango(A) = 2 < rango (A|B) = 3.
Finalmente, la respuesta es
(i) El sistema no tiene solución si k = 1, k = −2.
(ii) El sistema tiene única solución si k 6= 1, k 6= −2,
(iii) El sistema no puede tener infinitas soluciones pues nunca rango (A) =rango
(A|B) < 3.

Ejercicio 6.1.44. Encuentre el valor de k ∈ R, de modo que los sistemas de


ecuaciones lineales tengan única, ninguna o infintas soluciones:

1. 2.
x −y +2z = 8
−x +y −z = 4 x +2y +kz = 6
x +ky +z = −4 3x +6y +8z = 5

171
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

6.2. Espacios vectoriales


Se pueden definir sobre cualquier cuerpo conmutativo K pero en este curso
trabajaremos con K = R.

Definición 6.2.1. Un R-espacio vectorial V o un espacio vectorial real es un


conjunto no vacio provisto de dos leyes de composición + V × V −→ V y una
multiplicacón escalar R × V −→ V, denotada por λx para cada λ ∈ R y cada
x ∈ V que satisface:

1. ∀ x, y, z ∈ V x + (y + z) = (x + y) + z. (Asociatividad)

2. ∀ x, y ∈ V x + y = y + x. (Conmutatividad)

3. Existe en V un elemento denotado 0V tal que ∀ x ∈ V 0 + v = v + 0 = v.

4. ∀ x ∈ V, ∃ x0 ∈ V, tal que x + x0 = x0 + x = 0.

5. ∀ α, β ∈ R, ∀ x ∈ V, (α + β)x = αx + βx

6. ∀ α, β ∈ R, ∀ x ∈ V, (αβ)x = α(βx)

7. ∀ α ∈ R, ∀ x, y ∈ V, α(x + y) = αx + αy

8. ∀ x ∈ V, 1R x = x

Observación 6.2.2. El elemento 0 es único y se llama neutro para la suma


Para cada x ∈ V, el elemento x0 es único y se llama opuesto de x y se anota
−x.

Ejemplos:

1. El conjunto Rn [x] de los polinomios con coeficientes reales de grado ≤ n, con


suma y multiplicación por escalar.

2. C con la suma de complejos y multiplicación escalar α(a + bi) = αa + αbi.

3. Mn×m (R) con suma y producto por escalar usuales.

4. Rn como suma y producto por escalar componente a componente.

5. Sea X conjunto no vacio, entonces RX = {f : X −→ R | f función} con


(f + g)(x) = f (x) + g(x) ∀ f, g ∈ RX ,
(αf )(x) = αf (x) ∀ f ∈ RX , ∀ α ∈ R.

Observación 6.2.3. Sea V espacio vectorial sobre R. Entonces

172
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

1. ∀ α ∈ R, α0V = 0V .

2. ∀ v ∈ V, 0v = 0V .

3. ∀ α ∈ R, α0V = 0V .

4. ∀ v ∈ V, (−1)v = −v.

5. Sea α ∈ R, v ∈ V entonces αv = 0V ⇐⇒ α = 0 ∨ v = 0V

Definición 6.2.4. Sea V un espacio vectorial real. Un subconjunto S de V es un


subespacio de V si y sólo si S es un espacio vectorial real con las mismas operaciones
de V

Lema 6.2.5. Sea V un espacio vectorial real. Un subconjunto no vacio S de V es


un subespacio de V sı́ y sólo sı́

1. ∀ x, y ∈ V, x + y ∈ S,

2. ∀α ∈ R, ∀ y ∈ V, αy ∈ S.

Observación 6.2.6. Sea V un espacio vectorial real. Un subconjunto no vacio S


de V es un subespacio de V sı́ y sólo sı́ x + λy ∈ S ∀λ ∈ R, ∀ x, y ∈ V.

Notación. Usaremos S ≤ V para decir que S es un subespacio de V.

Observación 6.2.7. 1.- V y {0} son subespacios triviales de un R-espacio vectorial


V.
2.- Para todo subespacio vectorial S de V se tiene que 0V ∈ S.

Observación 6.2.8. Sean S1 , S2 subespacios de V, entonces no necesariamente


S1 ∪ S2 no es necesariamente un subespacio de V. Tomemos por ejemplo V =
R2 , S1 = {(x, y) ∈ R2 |x − y = 0 }, S2 = {(x, y) ∈ R2 |y − 2x = 0 } entonces S1 y
S2 son subespacios de R2 . Sin embargo, (1, 1) ∈ S1 , (1, 2) ∈ S2 pero (1, 1) + (1, 2) =
(2, 3) no está en S1 ∪ S2 .

Definición 6.2.9. Sea V un espacio vectorial real y sean W1 , W2 subespacios


vectoriales de V. Se define la suma W1 + W2 = {x1 + x2 | xi ∈ Wi , i = 1, 2}. Se
tiene que W1 + W2 es un subespacio de V.

Ejemplo 6.2.10. Sean I conjunto no necesariamente finito, Si ≤ V, ∀ i ∈ I.


Entonces ∩i∈I Si ≤ V.

173
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Observación 6.2.11. Sea S subconjunto de un espacio vectorial real V. Conside-


remos la colección C de subespacios de V que contienen a S, es decir, C = {W ≤
V | S ⊆ W}. Entonces C es no vacio pues V está en C, ∩W∈C W es un subespacio
de V y es el menor subespacio de V que contiene a S en el sentido de que para
cualquier M tal que S ⊆ M ≤ V entonces ∩W ∈C ⊆ M. ∩W ∈C W se denotará por
< S > y ası́
< S > = ∩W ∈C W = ∩W ≤V, S⊆W W

Observación 6.2.12. < ∅ > = {OV }.

¿Cómo caracterizar < S > ?

Lema 6.2.13. Sean V un espacio vectorial real y S subconjunto no vacio de V


entonces  X 
<S>= λi si | si ∈ S, λi ∈ R
finita
 
P
Demostración. Sea D = finita λi si | si ∈ S, λi ∈ R . Entonces D es un
subespacio de V y S ⊆ D pues ∀ s ∈ S, s = 1R s. Luego < S >⊆ D.
Sea ahora d = Σti=1 λi si . Pero S ⊆< S > que es subespacio luego λi si es un
elemento de < S > y d = Σti=1 λi si ∈ S. Como era cualquier elemento de D se tiene
que D ⊆< S > . Por lo tanto D = < S > .

Definición 6.2.14. Sean V un espacio


P vectorial real y S subconjunto de V en-
tonces toda expresión de la forma finita λi si con si ∈ S, λi ∈ R} se llama una
combinación lineal de los elementos si ∈ S.

Observación 6.2.15. Dado V un espacio vectorial real, nos interesan subconjun-


tos S de V tales que < S > = V. Se dice que S es un conjunto generador de
V.

Ejemplo 6.2.16. Ejemplos.

1. Sea V = R3 , S = {(1, 0, 0), (0, 1, 0), (0, 0, 1)}, entonces < S > = R3 .

2. Sea V = Rn , S = {e1 = (1, 0, · · · , 0), e2 = (0, 1, 0, · · · , 0), en = (0, · · · , 1)},


entonces < S > = Rn .

3. Sea V = M2×3 (R), S = {ε11 , ε12 , ε13 , ε21 , ε2,2 , ε2,3 }, entonces < S > =
M2×3 (R).

Ejercicio 6.2.17. Sea V = R3 , encuentre < S >, para S = {(1, 0, 2), (0, 0, 1)}.

174
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejercicio 6.2.18. Pruebe que < S > = R2 [x], donde S = {1, 1 + x, 1 + x2 }.

Ejemplo 6.2.19. Pruebe que < S > = R2 [x], donde S = {1 − x + x2 , x + x2 , 2 −


x + x2 }.

Solución. Sabemos que < S > ⊆ R2 [x], falta probar que R2 [x] ⊆ < S > . Sea
p(x) = a + bx + cx2 ∈ R2 [x]. Por encontrar α, β, γ, ∈ R tal que a + bx + cx2 =
α(1 − x + x2 ) + β(x + x2 ) + γ(2 − x + x2 ) = α + 2γ + (−α + β − γ)x + (α + β + γ)x2 .
Usando igualdad de polinomios se tiene un sistema de 3 ecuaciones y 3 incógnitas

α +2γ = a
−α +β −γ = b
α +β +γ = c
 
1 0 2 a
(A|B) =  −1 1 −1 b 
1 1 1 c
 
1 0 2 a
F2 → F2 + F1  0 1 1 b + a 
1 1 1 c
 
1 0 2 a
F3 → F3 + (−1)F1  0 1 1 b + a 
0 1 −1 c − a
 
1 0 2 a
F3 → F3 + (−1)F2  0 1 1 b+a 
0 0 −2 c − b − 2a
 
1 0 2 a
1
F3 → − F3  0 1 1 b + a 
2
0 0 1 2a+b−c
2

Como rango(A) = rango(A|B) = 3 = número de incógnitas se tiene que el


sistema tiene única solución. Tenemos que γ = 2a+b−c
2
, como β +γ = b+a, entonces
2a+b−c b+c
β = b + a − 2 = 2 . Finalmente, como α + 2γ = a, α = a − (2a + b − c) =
−a − b + c.
Tomando α = −a − b + c, β = b+c 2
, γ = 2a+b−c
2
, se tiene que p(x) ∈ < S > de
donde, R2 [x] ⊆ < S >, y ası́, S = {1 − x + x2 , x + x2 , 2 − x + x2 } es un conjunto
generador de R2 [x].

Ejemplo 6.2.20. Sean V = R3 , entonces S = {x(1, 0, 0) + y(0, 0, 1) | x, y ∈ R} =


{(x, 0, y) | x, y ∈ R} es el plano XZ.

175
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

6.2.1. Dependencia e Independencia lineal


Definición 6.2.21. Sea V un espacio vectorial real y sea S = {v1 , · · · , vn } ⊆ V.
Diremos que S o los vectores v1 , · · · , vn son linealmente dependientes
Pn sobre R si y
P nulos λ1 , · · · , λn ∈ R tales que i=1 λi vi = 0V .
sólo si existen escalares no todos
En caso contrario, es decir, ni=1 λi vi = 0V =⇒ λi = 0, ∀ i = 1, · · · , n entonces
diremos que S o los vectores v1 , · · · , vn son linealmente independientes sobre R .

Proposición 6.2.22. Sea V un espacio vectorial real y sea S = {v1 , · · · , vn } ⊆ V.


Entonces

1. Si 0V ∈ S entonces S es linealmente dependiente sobre R .

2. Si S es linealmente dependiente sobre R entonces al agregar vectores de V el


conjunto resultante seguirá siendo linealmente dependiente sobre R.

3. Si S es linealmente independiente sobre R entonces al quitar vectores de S el


conjunto resultante seguirá siendo linealmente independiente sobre R.

4. S es linealmente dependiente sobre R si y sólo si existe v ∈ S, tal que v es


combinación lineal de elementos en S − {v}.

Observación 6.2.23. Sea V un espacio vectorial real. Si S es linealmente indepen-


diente sobre R entonces cualquier subconjunto de S es linealmente independiente
sobre R.

Definición 6.2.24. Sea V un espacio vectorial real. Una base de V sobre R es un


subconjunto S de V tal que
i) V = < S > .
ii) S es linealmente independiente sobre R.

Ejemplo 6.2.25. Ejemplos

1. S = {(1, 0, 0), (0, 1, 0), (0, 0, 1)}, es una base de R3 .

2. S = {e1 = (1, 0, · · · , 0), e2 = (0, 1, 0, · · · , 0), en = (0, · · · , 1)}, es una base de


Rn .

3. S = {ε11 , ε12 , ε13 , ε21 , ε2,2 , ε2,3 }, es una base de M2×3 (R).

Definición 6.2.26. Sea V un espacio vectorial real. Se dice que V es finitamente


generado si hay S conjunto finito de V tal que V =< S > .

Teorema 6.2.27. Sea V un espacio vectorial real, finitamente generado V =<


S >, S = {v1 , · · · , vn }. Si S1 = {w1 , · · · , wm } e linealmente independiente sobre
R entonces m ≤ n.

176
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración. Supongamos que n < m. Sea w1 ∈ S1 , luego w1 ∈ V y w1 =


P n
i=1 λi vi , con algún λi P6= 0. Suppongamos sin pérdida de P generalidad que λ1 6= 0,
entonces w1 = λ1 v1 + i=2 λi vi . Luego v1 = λ1 w1 + ni=2 (−λ−1
n −1
1 λiP)vi . Luego
G1 = {w1 , v2 · · · , vn } genera V. Sea w2 ∈ S1 , luego w2 inV y w2 = α1 w1 + ni=2 αi vi ,
con algún αi 6= 0, i = 2, · · · n. Si no w2 = α1 w1 y {w1 , w2 } ⊆ S1 es linealmente
dependiente sobre R. Contradicción. Suppongamos sin pérdida de generalidad que
α2 6= 0, y se llega a que G2 = {w1 , w2 , v3 · · · , vn } genera V. Ası́ tenemos que
Gn = {w1 , w2 , w3 · · · , wn } genera V. Como n < m, hay wn+1 ∈ S1 , que es combi-
nación lineal de w1 , w2 , w3 · · · , wn es decir, w1 , w2 , w3 · · · , wn , wn+1 es linealmen-
te dependiente sobre R y {w1 , w2 , w3 · · · , wn , wn+1 } ⊆ S1 . Contradicción. Luego
m ≤ n.

Observación 6.2.28. Sea V un espacio vectorial real, finitamente generado V =<


S >, S = {v1 , · · · , vn }. Si S1 = {w1 , · · · , wm } es linealmente independiente sobre
R entonces m ≤ n.

Corolario 6.2.29. Sea V un espacio vectorial real, finitamente generado. Si V


posee una base B entonces toda otra base de V tiene el mismo número de elementos
de B.

Definición 6.2.30. Sea V un espacio vectorial real, finitamente generado. Se llama


dimensión de V y se anota dimR (V ) al número de elementos de cualquier base de
V.

Ejemplo 6.2.31. dimR (R3 ) = 3, dimR (Rn ) = n, dimR (M2×3 (R)) = 6, dimR (R2 [x]) =
3.

Lema 6.2.32. Sea V un espacio vectorial real finitamente generado. Sea S =


{v1 , · · · , vn } ⊆ V conjunto linealmente independiente sobre R y sea v ∈ V − < S >
entonces S ∪ {v} es linealmente independiente sobre R.

Demostración. SP∪ {v} = {v, v1 , · · · , vn }. Sea α0 v + ni=1 αi vi = 0. Si α0 6= 0


P
entonces
Pn v = − ni=1 (α0−1 α) vi ∈ {v1 , · · · , vn } = S. Contradicción. Luego α0 = 0
y i=1 αi vi = 0 como S es linealmente independiente sobre R se tiene que αi =
0, ∀ i = 1, 2 · · · , n. Luego S ∪ {v} = {v, v1 , · · · , vn } es linealmente independiente
sobre R

Proposición 6.2.33. Sea V =< S > con S finito. Sea S1 ⊆ V subconjunto


linealmente independiente sobre R entonces hay base B de V tal que S1 ⊆ B ⊆ S.

Demostración. Si V =< S1 > entonces B = S1 es base de V.


Sea < S1 > ⊂ V, entonces hay v1 ∈ V, v1 ∈ / < S1 > . Luego por lema anterior
S2 = S1 ∪ {v1 } es linealmente independiente sobre R.

177
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Si V =< S2 > entonces B = S2 es base de V. Si no hay v2 ∈ V, v2 ∈ / < S2 > .


Luego por lema anterior S3 = S2 ∪ {v2 } es linealmente independiente sobre R.
Este proceso termina pues S es finito.

Corolario 6.2.34. Sea V un espacio vectorial real finitamente generado. Entonces


todo subconjunto S de V linealmente independiente sobre R se puede completar a
una base de V.

Ejercicio 6.2.35. Sea V un espacio vectorial real, finitamente generado, dimR (V ) =


n. Entonces todo conjunto con más de n elementos es linealmente dependiente sobre
R.

Ejercicio 6.2.36. Sean W1 = < (1, 0, 1, 4) >, W2 = {(x, y, z, t) ∈ R4 | x+2y +z +


t = 0 ∧ x − z = 0}. Encuentre una base para W2 , describa W1 + W2 y encuentre
una base para W1 + W2 .

6.2.2. Transformaciones lineales


Definición 6.2.37. Sean V y W dos espacios vectoriales reales y sea T : V −→ W
función. Se dice que T es una transformación lineal si y sólo si

1. ∀ x, y ∈ V, T (x + y) = T (x) + T (y),

2. ∀ x ∈ V, ∀β ∈ R, T (βx) = βT (x).

Lema 6.2.38. Sean V y W dos espacios vectoriales reales y sea T : V −→ W


transformación lineal entonces

1. T (0V ) = 0W ,

2. ∀ x ∈ V, T (−x) = −T (x).

Demostración. 1. Sea x ∈ V, entonces T (0V ) = T (0x) = 0T (x) = 0W .


2. ∀ x ∈ V, T (−x) = T (−1)x) = (−1)T (x) = −T (x).

Observación 6.2.39. T : R2 −→ R2 , definida por T (x, y) = (x + 1, y + 1) no es


lineal pues T (0, 0) 6= (0, 0).

Ejemplo 6.2.40. Veamos algunos ejemplos.

1. Sea λ ∈ R, λ 6= 0. y V espacio vectorial real. La función T : V −→ V, definida


por T (x) = λx, es lineal y se llama homotecia de razón λ sobre V

2. D : Rn [x] −→ Rn−1 [x], definida por D(p(x)) = p0 (x), el polinomio derivado


de p(x) es lineal.

178
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

3. Si B = {v1 , · · · , vn ) es una base de V sobre R. Como cada v = ni=1 λi vi


P
únicos λi ∈ R, estos escalares se llaman coordenadas de v en la base B, Se
anota [v]B = (λ1 , λ2 , · · · , λn ). Definamos T : V −→ Rn , por T (v) = [v]B .
Entonces T es lineal.
4. T : R2 −→ R2 , definida por T (x, y) = (6x + 2y, −x + 3y) es lineal.
Proposición 6.2.41. Sean V y W dos espacios vectoriales reales con B = {v1 , · · · , vn )
es una base de V sobre R y {w1 , · · · , wn ) elementos de W. Entonces existe una úni-
ca transformación lineal T : V −→ W tal que T (vi ) = wi para cada i = 1, · · · , n.
Pn
Demostración. Existencia. Sea Pn v ∈ V, entonces v = i=1 λi vi únicos λi ∈ R,
definamos entonces T (v) = i=1 λi wi . T es función al ser los escalares λi únicos.
Veamos que T es lineal.
Probaremos que ∀ x, y ∈ V, T (x + y) = T (x) + T (y) y ∀ x ∈ V, δ ∈ R, T (δx) =
δT (x). P
x = ni=1 λi vi luegoP T (x) = ni=1 λi wi y y = ni=1 βi vi . luegoPT (y) = ni=1 βi wi ,
P P P
n n
PnAdemás, P x+y =
n
i=1 (λi + βi )vi de donde T (x + y) = i=1 (λi + βi )wi =
i=1 λi wi + i=1 βi wi = T (x) + T (y).
En forma similar se prueba que ∀ x ∈ V, δ ∈ R, T (δx) = δT (x). Luego, T es
lineal.
Unicidad. Sean T1 , T2 : V −→ W transformaciones lineales tales que T1 (vi ) =
wi , para cada i = 1, · · · , n.
wi , T2 (vi ) = P
n
únicos λi ∈ R, entonces T1 (v) = ni=1 λi wi = ni=1 λi T1 (vi ) =
P P
PnSea v = i=1 λi vi P n
i=1 λi T2 (vi ) = T2 ( i=1 λi vi ) = T2 (v). Luego ∀ v ∈ V, T1 (v) = T2 (v), y
T1 = T2 .
Ejercicio 6.2.42. Encuentre T : R3 −→ R4 , lineal tal que

Im(T ) = < (1, 2, 0, −4), (2, 0, −1, −3) > .


Definición 6.2.43. Sean V y W dos espacios vectoriales reales T : V −→ W
transformación lineal. Se definen
1.- Ker(T ) = {v ∈ V | T (v) = 0W }. Se llama núcleo de T.
2.- Im(T ) = T (V ) = {w ∈ W | ∃ v ∈ V con T (v) = w}. Se llama imagen de T.
Proposición 6.2.44. Sean V y W dos espacios vectoriales reales T : V −→ W
transformación lineal. Entonces Ker(T ) ≤ V e Im(T ) ≤ W.
Demostración. 1.- Ker(T ) es no vacı́o pues 0V ∈ Ker(T ). Sean x, y ∈ Ker(T ), β ∈
R. Probaremos que x + βy ∈Ker(T ).
∀ x, y ∈Ker(T ), β ∈ R =⇒ T (x) = 0W , T (y) = 0V luego, T (x + βy) =
T (x) + βT (y) = 0W + β0W = 0W . Luego ∀ x, y ∈ Ker(T ), β ∈ R se tiene que
x + βy ∈ Ker(T ) y Ker(T ) ≤ V.

179
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

2.- Im(T ) es no vacı́o pues 0W = T (0V ) ∈ Im(T ). Sean x, y ∈ Im(T ), β ∈ R.


Probaremos que x + βy ∈Im(T ).
∀ x, y ∈Im(T ), β ∈ R se tiene que existen v1 , v2 ∈ V, tales que T (v1 ) =
x, T (v2 ) = y luego, x + βy = T (v1 ) + βT (v2 ) = T (v1 ) + T (βv2 ) = T (v1 + βv2 ).
Luego, ∀ x, y ∈ Im(T ), β ∈ R se tiene que x + βy ∈ Im(T ) e Im(T ) ≤ W.
Ejercicio 6.2.45. Sean V y W dos espacios vectoriales reales T : V −→ W
transformación lineal. Pruebe que T inyectiva ⇐⇒ Ker(T ) = {0V }
Ejercicio 6.2.46. Sea V un espacio vectorial real.
1. Pruebe que toda homotecia de razón λ sobre V es biyectiva.
2. Sea T homotecia de razón λ sobre V. Pruebe que T (W ) = W para todo
subespacio W de V de dimensión 1.
Proposición 6.2.47. Sean V y W dos espacios vectoriales reales finitamente ge-
nerados T : V −→ W transformación lineal. Entonces dimR (V ) = dimR Ker (T ) +
dimR Im(T ).
Demostración. Sea {v1 , · · · , vk } una base de Ker(T ). Completemos esta base a una
base B = {v1 , · · · , vk , vk+1 , · · · , vn } de V. Probemos que B1 = {T (vk+1 ), · · · , T (vn )}
es una base de Im(T ).
Con esto probaremos que dimR (V ) = dimR Ker (T ) + dimR Im(T Pn ).
i) Veamos que B1 es linealmente independientePsobre R. Sea i=k+1 λi T (vi ) =
n
0PW entonces como T es lineal se tiene que T ( i=k+1 λi (vi )) = 0W ,P es decir,
n n
i=k+1 λi (vi ) ∈ Ker(T ). Como {v1 , · · · , vk } una base de Ker(T ) entonces i=k+1 λi (vi ) =
Pk Pn Pk
i=1 βi (vi ), luego i=k+1 λi (vi )− i=1 βi (vi ) = 0V . Pero B = {v1 , · · · , vk , vk+1 , · · · , vn }
es linealmente independiente sobre R luego λi = 0 para i = k + 1, · · · , n y βi = 0
para i = 1, · · · , k. Luego B1 es linealmente independiente sobre R.
ii) Por demostrar que Im(T ) = < T (vk+1 ), · · · , T (vn ) > . Sea wP ∈ Im(T ), luego
n
w = T (v) para Pn v ∈ V. Como Pn B es base de V tenemos que v = i=1 δi vi , luego
w = T (v) = i=1 δi T (vi ) = i=k+1 δi T (vi ), pues {v1 , · · · , vk } una base de Ker(T ).
Ası́ Im(T ) ⊆< T (vk+1 ), · · · , T (vn ) >.
Por i) y ii) B1 = {T (vk+1 ), · · · , T (vn )} es una base de Im(T ).
Ejemplo 6.2.48. Sea T : R3 −→ R3 , definida por T (x, y, z) = (x − y, −x + y, 2x −
2y + z). Encuentre una base para Im(T ) ¿ Cuál es la dimensión de Ker(T )?
Solución. Im(T ) = {w ∈ R3 | ∃ v = (x, y, z) ∈ R3 con T (x, y, z) = w}.
w = T (x, y, z) = (x − y, −x + y, 2x − 2y + z) = (x, −x, 2x) + (−y, y, −2y) +
(0, −0, z) = x(1, −1, 2) + y(−1, 1, −2) + z(0, −0, 1).
Luego Im(T ) = < (1, −1, 2), (−1, 1, −2), (0, −0, 1) >. Como (−1, 1, −2) =
−(1, −1, 2) se tiene que {(1, −1, 2), (0, −0, 1)} es una base para Im(T ). Como
dimR (R3 ) = dimR Ker (T ) + 2 se tiene que dimR Ker (T ) = 1. Además Ker (T ) =
< (1, 1, 0) > .

180
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejercicio 6.2.49. Sea T : R3 −→ R4 , definida por T (x, y, z) = (x + z, y − z, x +


y, x − y + 2z).T es lineal. Encuentre una base para Im(T ) y una base para Ker(T ).

Ejercicio 6.2.50. En cada uno de los siguientes casos encuentre una transforma-
ción lineal T : R3 −→ R3 .

1. (1, 1, 0) ∈ Ker(T ) y dimR (Im(T )) = 1.

2. Ker(T )∩ Im(T ) = < (1, 1, 2) > .

3. T 6= 0 y Ker(T ) ⊆ Im(T ).

4. Ker(T ) 6= {0}, Im(T ) 6= {0} y Ker(T )∩ Im(T ) = {0}.

6.3. Sobre invertibilidad de matrices


Veremos algunos conceptos y resultados generales que aplicaremos sobre ma-
trices, y que servirán en cursos superiores también. El propósito es caracterizar la
invertibilidad de una matriz de diferentes formas.
Recordemos, revise las secciones anteriores correspondientes si es necesario,
los conceptos (y axiomas) de espacio vectorial, subespacio vectorial, combinación
lineal, independencia y dependencia lineal, subespacio generado, base y dimensión.
Queremos llevar estos resultados al contexto de matrices.

Definición 6.3.1. Sea A ∈ Mn×m (K), se define

1. El subespacio de filas FA de A, como el subespacio de K m generado por las


filas de A.

2. El subespacio de columnas CA de A, como el subespacio de K n generado por


las columnas de A.

Usaremos denotar las filas de A por A1 , . . . , An y a sus columnas por A1 , . . . , Am .


Éstos son vectores en K m y K n respectivamente. Ası́ tenemos

FA = h{A1 , . . . , An }i ≤ K m
CA = h{A1 , . . . , Am }i ≤ K n .

Ejemplo 6.3.2. Sea A = In la matriz identidad de tamaño n. Entonces FA =


CA = K n .

Proposición 6.3.3. Sea A ∈ Mn×m (K) y M una matriz escalonada y equivalente


por filas a A. Entonces FA = FM .

181
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración. Para llegar a M se hacen operaciones fila, estas son cambios de


orden o combinaciones lineales de filas de A. Entonces, cada fila de M es combina-
ción lineal de las filas de A. Revirtiendo las operaciones fila, llegamos de M a A.
Entonces, cada fila de A es combiación lineal de filas de M . Concluimos que todo
vector que es combinación lineal de filas de A, lo será de filas de M y viceversa.
Entonces los espacios generados son los mismos.

Teorema 6.3.4. (Caracterización de invertibilidad). Sea A ∈ Mn (K) es invertible


si y sólo si FA = K n .

Demostración. Recordemos que A es invertible si y sólo si es equivalente fila a la


identidad In . Además el, espacio de filas de In es K n . Por la Proposición 6.3.3,
ambos espacios coinciden.

Sea A ∈ Mn (K), de filas A1 , . . . , An y columnas A1 , . . . , An (vectores en K n ).


Nos podemos preguntar si son l.d. o no. Ello captura parte de la “ naturaleza” de
A.

Ejemplo 6.3.5. La matriz identidad In es tal que el conjunto de sus vectores fila
es l.i., lo mismo
 el conjunto
 de sus vectores columna.
1 2
Sea A = , sus filas forman un conjunto l.i, lo mismo sus columnas.
3 4
Veamos las filas: Sea S = {(1, 2), (3, 4)}, buscamos a, b ∈ R tales que

a(1, 2) + b(3, 4) = (0, 0).


Entonces,

(
a + 3b = 0
⇒ 2(−3b) + 4b = 0 ⇒ −2b = 0 ⇒ b = 0 ⇒ a = 0.
2a + 4b = 0

Se deja como ejercicios demostrar que el conjunto de vectores columna también


es l.i.

Se llega ası́ a otra caracterización de invertibilidad.

Teorema 6.3.6. (Caracterización de invertibilidad). Una matriz A ∈ Mn (K) es


invertible si y sólo si el conjunto de vectores fila es l.i.

Demostración. Por el Teorema 6.3.4, se tiene que A es invertible si y sólo si FA es


K n . Se tiene que dimK FA = n. Como FA es generado por las n filas de A, para
tener dimensión n deben ser todas las filas l.i.

182
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Corolario 6.3.7. (Caracterización de invertibilidad). Una matriz A ∈ Mn (K) es


invertible si y sólo si la dimensión del espacio de filas es n.
Recordemos que el rango de una matriz A ∈ Mn×m (K) es el número de filas no
nulas de una matriz escalonada equivalente por filas a A. A la luz de lo aquı́ dicho,
el rango de A es la dimensión de su espacio de filas.
¿Qué se puede decir del espacio generado por las columnas de una matriz?
Proposición 6.3.8. La dimensión del espacio de filas de A ∈ Mn×m (K) es igual
a la dimensión del espacio de columnas de A.
Demostración. Note que FA ≤ K m y CA ≤ K n , entonces son espacios diferentes.
Los elementos de FA son m−tuplas y ,os de CA son n−tuplas. Lo que dice esta
proposición es que su dimensión es la misma. Lo demostraremos. Suponga que el
rango de A es R. Es decir, tiene R filas l.i. Digamos que las R primeras son l.i. Es
decir BF = {A1 , . . . , AR } es l.i y las filas AR+1 , . . . , An son combinación lineal de
BF . Se tiene para todo i = R + 1, . . . , n,

Ai = αi1 A1 + αi2 A2 + · · · + αR AR .

Si anotamos, usando esto, cada coeficiente de la fila Ai como aij con j = 1, . . . , m


se tiene
R
X
aij = αik akj , (6.2)
k=1

para j = 1, . . . , m, i = R + 1, . . . , n. Veamos cómo se ven las columnas en estos


términos. Anotaremos las columnas hacia el lado, usando la notación Aj para la
columna j para j = 1, . . . , m

Aj = (a1j , a2j , . . . , anj ),


reemplazando la expresión (6.2) en las coordenadas que corresponde tenemos para
j = 1, . . . , m
R
X R
X
j
A = (a1j , a2j , . . . , aRj , αR+1,k akj , . . . , αnk akj ).
k=1 k=1

Podemos ahora deshacer la multiplicación por escalar y mostrar Aj como combi-


nación lineal de R vectores

Aj = a1j (1, 0, 0, . . . , 0, αr+1,1 , αr+2,1 , . . . , αn1 )+a2j (0, 1, 0, . . . , 0, αr+1,2 , αr+2,2 , . . . , αn2 )+

+ · · · + aRj (0, 0, 0, . . . , 1, αr+1,R , αr+2,R , . . . , αnR ).

183
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Es decir, cada columna de A es combinación lineal de los R vectores

{v1 = (1, 0, 0, . . . , 0, αr+1,1 , αr+2,1 , . . . , αn1 ), . . . , vR = (0, 0, 0, . . . , 1, αr+1,R , αr+2,R , . . . , αnR )}.

Ası́ las caracterizaciones hechas para filas, se satisfacen para columnas también.
Corolario 6.3.9. Sea A ∈ Mn (K). Entonces las siguientes condiciones son equi-
valentes
1. A es invertible.
2. La dimensión de CA es n
3. El espacio CA es K n
4. El conjunto de columnas de A es l.i.
5. La matriz At es invertible.

6.3.1. Sobre inversas por la izquierda y derecha


Como ha surgido de la lectura del apunte, veremos el tema de inversas para
matrices no necesariamente cuadradas.
Definición 6.3.10. Sea A ∈ Mm×n (K). Entonces una matriz X ∈ Mn×m (K)
se dice inversa a izquierda de A si cumple XA = In . Analogamente, una matriz
Y ∈ Mn×m (K) se dice inversa a derecha de A si cumple AY = Im .
Ejemplo 6.3.11. Sea A ∈ M4×2 (R) la matriz
 
1 1
 4 3 
A=  3 4 .

0 0
Considere para a, b ∈ R la matriz
 
−3 1 0 a
Xa,b = ∈ M2×4 (R).
−3 0 1 b
Haciendo la multiplicacicón puede demostrar que Xa,b A = I2 para todo a, b ∈
R. Entonces A tiene infinitas inversas a izquierda. Sin embargo no tiene ninguna
inversa a derecha pues al tener la cuarta fila nula, cada vez que multiplique a la
derecha por Y ∈ M2×4 (R) se tendrá la fila 4 nula, entonces no es posible que sea
igual a I4 .

184
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Teorema 6.3.12. Sea A ∈ Mm×n (K). Entonces

1. A tiene inversa a derecha si y sólo si el rango de A es m (i.e. # filas).

2. A tiene inversa a izquierda si y sólo si el rango de A es n (i.e. # columnas).

Demostración. Para probar (1), suponga que X ∈ Mn×m (K) tal que AX = Im .
Denotando por Xi la columna i de X y ei a la columna i de Im , tenemos para cada
i = 1, . . . , m un sistema lineal de m ecuaciones y n incógnitas

A · Xi = e i .
Tenemos ası́ m sistemas de ecuaciones, cada uno de m ecuaciones y n incógnitas.
Como existe la inversa X. Todos estos sistemas tienen solución. Sabemos que ello
sucede si el rango de A es igual al rango de la ampliada (A | ei ) para todo i =
1, . . . m. Entonces

rk(A) = rk(A | ei ) = rk(A | e1 | e2 ) = · · · = rk(A | e1 | e2 | . . . | em ) = rk(A | Im ) = m.

Recı́procamente, como rk(A) = m entonces n ≥ m. Sea M la forma escalonada


reducida de At . Recuerde que At es de tamaño n×m, o sea más filas que columnas.
Además rk(A) = rk(At ), entonces M es
 
Im
M= .
0n−m,m
Recordemos que Ef (At ) = M quiere decir que existe Y ∈ Mn (K) producto de
matrices elementales tal que Y At = M . Es decir
 
t Im
YA = .
0n−m,m
Tomando traspuesta a ambos lados

A · (Y t ) =

Im 0m,n−m .
Sea Z la matriz de las primeras m columnas de Y t . Entonces Z ∈ Mn×m (K) es tal
que AZ = Im .
Para probar (2), recordamos que (AB)t = B t At . Por lo tanto A tiene inverso a
la izquierda si y sólo si At lo tiene a la derecha. Entonces aplicamos la parte (1) a
At y listo.

185
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejercicio 6.3.13. Demuestre que la siguiente matriz no tiene inversa ni a derecha


ni a izquierda.
 
1 3 4 7
A= 2 3 5 8 
1 4 5 9
Teorema 6.3.14. Si A es una matriz que tiene inversa a la izquierda X e inversa
a la derecha Y . Entonces
1. A es cuadrada, y

2. X = Y .
Demostración. 1. Suponga que A es de tamaño m×n. Entonces la existencia de
inversa izquierda dice que rk(A) = n y la de inversa a la derecha rk(A) = m.
Entonces n = m y A es cuadrada.

2. Suponga que A es cuadrada de tamaño p, entonces XA = Ip = AY , entonces

X = XIp = X(AY ) = (XA)Y = Ip Y = Y.

6.4. Determinante de una matriz


NOTA: Todas las matrices aquı́ consideradas son con entradas en K, con K
el cuerpo Q, R o C.
Quizá ya conocemos la fórmula del determinante de una matriz de 2×2, incluso
la de una matriz de 3 × 3, pero qué captura el determinante, cómo se generaliza a
matrices de mayor tamaño, etc. Son preguntas que surgen de forma natural. Este
capı́tulo pretende ser una introducción al tema, tiene por objetivo prepararles para
calcular determinantes y dar los primeros pasos hacia entenderlos.
Para ello veamos primero dos problemas concretos

1. Encuentre condiciones necesarias y suficientes para que el sistema siguiente


tenga solución única (las incógnitas son x e y).

a1 x + b 1 y = c 1
a2 x + b 2 y = c 2

Solución.

186
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Para encontrar condiciones necesarias, supongamos que el sistema tiene solu-


ción única. Si fuera a1 = a2 = 0, el sistema tendrı́a infinitas soluciones pues
el valor de x serı́a arbitrario. Supongamos entonces que a1 6= 0 y dividamos
la primera fila de la matriz aumentada por a1 :

1 ab11 | ac11
 

a2 b 2 | c 2

restando a2 veces la primera fila de la segunda, tenemos:


 b1 c1 
1 a1
| a1
0 a1 b2a−a
1
2 b1
| a1 c2a−a
1
2 c1

Como estamos suponiendo que la solución es única, se tiene que a1 b2 − a2 b1 6=


0. El caso cuando a2 6= 0 es similar pues podemos intercambiar las filas de la
matriz antes de seguir la reducción. Concluimos que a1 b2 − a2 b1 6= 0 es una
condición necesaria para que el sistema tenga solución única.
Veamos ahora que la misma condición también es suficiente. Si a1 b2 −a2 b1 6= 0,
no puede ocurrir que a1 = a2 = 0 por lo que nuevamente supondremos que
a1 6= 0. Podemos obtener la misma matriz escalonada y concluimos que el
sistema tiene solución única por lo que la condición es suficiente.
Tenemos ası́ que el número ∆2 = a1 b2 − a2 b1 , que depende sólo de los co-
eficientes de la matriz del sistema determina si el sistema tiene solución
única o no. Ese número es lo que se llama determinante de la matriz A, para
A ∈ M2 (K).
Escribimos ∆2 (A) para A ∈ M2 (K) escrita de forma estándar
 
a11 a12
A= ,
a21 a22
entonces

∆2 (A) = a11 a22 − a12 a21 .

Observación 6.4.1. Recuerde que para A ∈ M2×2 (K), tenemos una fórmula
para su inversa
 
−1 1 a22 −a12
A = .
a11 a22 − a12 a21 −a21 a11
Es decir, A será invertible si y sólo si ∆2 (A) 6= 0.

187
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

2. Repita el ejercicio anterior para un sistema de 3 × 3.


Solución.
La matriz aumentada de un sistema de 3 × 3 es
 
a1 b 1 c1 | d1
 a2 b 2 c2 | d2 
a3 b 3 c3 | d3

Si a1 = a2 = a3 = 0, el sistemo no puede tener solución única. Supongamos


que a1 6= 0 (cambiamos el orden de las filas si fuera necesario). Dividimos la
primera fila de la matriz por a1 :

1 ab11 ac11 ad11


 
 a2 b2 c2 d2 
a3 b3 c3 d3

Ahora restamos a2 por la primera fila de la segunda y a3 por la primera fila


de la tercera:
 b1 c1 d1 
1 a1 a1 a1
 0 − a2 b1 −a1 b2 − a2 c1 −a1 c2 − a2 d1 −a1 d2 
a1 a1 a1
0 − a3 b1a−a
1
1 b3
− a3 c1 −a1 c3
a1
− a3 d1 −a1 d3
a1

Si a2 b1 − a1 b2 = a3 b1 − a1 b3 = 0 el sistema no puede tener solución única.


Supongamos que a2 b1 −a1 b2 6= 0 (el otro caso es similar). Podemos multiplicar
la segunda fila por − a2 b1a−a
1
1 b2
:
 b1 c1 d1 
1 a1 a1 a1
 0 a2 c1 −a1 c2 a2 d1 −a1 d2 
1 a2 b1 −a1 b2 a2 b1 −a1 b2
0 − a3 b1a−a
1
1 b3
− a3 c1 −a1 c3
a1
− a3 d1 −a1 d3
a1

Sumamos un múltiplo de la segunda fila a la tercera:


b1 c1 d1
 
1 a1 a1 a1
a2 c1 −a1 c2 a2 d1 −a1 d2
 
 0 1
 
a2 b1 −a1 b2 a2 b1 −a1 b2 
a3 b2 c1 −a2 b3 c1 −a3 b1 c2 +a1 b3 c2 +a2 b1 c3 −a1 b2 c3 a3 b2 d1 −a2 b3 d1 −a3 b1 d2 +a1 b3 d2 +a2 b1 d3 −a1 b2 d3
 
0 0 a2 b1 −a1 b2 a2 b1 −a1 b2

Resulta entonces que el sistema tiene solución única si y solo si

∆3 (A) = a3 b2 c1 − a2 b3 c1 − a3 b1 c2 + a1 b3 c2 + a2 b1 c3 − a1 b2 c3 6= 0

Nuevamente hay un número, ∆3 (A), asociado a la matriz A del sistema, que


captura si éste tiene solución única o no. Veremos que determina también si
A es invertible o no.

188
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Escribimos ∆3 (A) para A ∈ M3 (K) escrita de forma estándar


 
a11 a12 a13
A =  a21 a22 a23  ,
a31 a32 a33
entonces

∆3 (A) = a11 a22 a33 + a12 a23 + a31 a13 a21 a32 − a11 a23 a32 − a12 a21 a33 − a13 a22 a31 .

Veamos qué tienen similar ambas expresiones:

∆2 (A) = a11 a22 − a12 a21 , A ∈ M2 (K).


∆3 (A) = a11 a22 a33 +a12 a23 a31 +a13 a21 a32 −a11 a23 a32 −a12 a21 a33 −a13 a22 a31 , A ∈ M3 (K).

Para n = 2 tiene 4 sumandos, para n = 3 tiene 6 sumandos.

Los sumandos son de la forma ±a1p a2q , o ±a1p a2q a3r , pero en cualquier caso
tiene todas las permutaciones posibles de {1, 2}, o {1, 2, 3}. Por eso tiene dos,
o seis, sumandos: 2! o 3!.

Ello hace conjeturar que para A ∈ M4 (K), la matriz tendrá 4! = 24 sumandos


y, en general, para Mn (K) tendrá n! sumandos. Aún debemos explorar cómo se
determina el signo de cada sumando.
Veamos ahora qué propiedades querrı́amos generalizar:

Como dos sistemas tienen las mismas soluciones si son equivalentes por ope-
raciones fila, queremos que el determinante de una matriz no cambie mucho
después de esas operaciones. Por ejemplo, ∆n (A) si no es nulo, queremos que
∆n (E(A)) siga no nulo (para E(A) la matriz que resulta de hacer operaciones
fila a A).

Lo mismo se concluye pensando que queremos que capture si la matriz es


invertible o no.

Calculamos ∆2 (I2 ) = 1 y ∆3 (I3 ) = 1.

Experimentemos haciendo operaciones elementales fila a A ∈ M2 (K), y vea-


mos qué cambia en ∆2 :

1. Intercambio de filas F1 ↔ F2 , entonces ∆2 (EI (A)) = −∆2 (A).


2. Escalar una fila Fi 7→ λFi , entonces ∆2 (EII (A)) = λ∆2 (A).

189
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

3. Sumar a una fila un múltiplo de otra Fi 7→ Fi +λFj , entonces ∆2 (EIII (A)) =


∆2 (A).

Ahora que ya tenemos una idea de qué tenemos y qué buscamos, se formaliza.

Definición 6.4.2. Determinante es una función Det : Mn (R) → R, se anota


Det(A) o bien |A|, tal que

(A1) |I| = 1

(A2) Si EI A = B → −|A| = |B|

(A3) Si EII A = B → λ|A| = |B|

(A4) Si EIII A = B → |A| = |B|

Para n = 2 y n = 3 ya tenemos una función determinante. A saber, ∆2 y ∆3


respectivamente.

Proposición 6.4.3. Sea A ∈ Mn (K). Entonces

Si A tiene una fila nula, entonces |A| = 0.

Demostración. Usaremos el axioma (A3), pues la fila nula de A permite es-


cribir

a11 a12 . . . a1n a11 a12 ... a1n a11 a12 . . . a1n
a21 a22 . . . a2n a21 a22 . . . a2n a21 a22 . . . a2n
.. .. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . . . .
= = 0· =0
0 0 ... 0 0 · 0 0 · 0 ... 0·0 0 0 ... 0
.. .. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . . . .
an1 an2 . . . ann an1 an2 . . . ann an1 an2 . . . ann

Si A tiene dos filas iguales, entonces |A| = 0.

190
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración. Sin pérdida de generalidad, suponga que A tiene sus dos pri-
meras filas iguales. Esto pues el cambio será a lo más un signo, que no afecta
pues queremos demostrar que es 0.
Entonces,

a11 a12 . . . a1n


a11 a12 . . . a1n
|A| = .. .. .. ..
. . . .
an1 an2 . . . ann

Su determinante no cambia si F1 7→ F1 + (−1) · F2 , por el axioma (A4).


Entonces

a11 − a11 a12 − a12 . . . a1n − a1n 0 0 ... 0


a11 a12 ... a1n a11 a12 . . . a1n
|A| = .. .. .. .. =· .. .. .. .. =0
. . . . . . . .
an1 an2 ... ann an1 an2 . . . ann

Si A es triangular o diagonal (con diagonal no nula), entonces |A| = Πai,i .

Demostración. En este caso se tiene


 
a11 a12 . . . a1n
 
 0 a22 . . . a2n 
A= .
 
.. .. .. ..

 . . . . 

0 0 ... ann

Haciendo operaciones fila se tiene que A es equivalente por filas a la Identidad.


Las primeras operaciones para ello fueron

   
a11 a12 . . . a1n 1 a12 /a11 . . . a1n /a11
   
 0 a22 . . . a2n   0 a22 ... a2n 
A=  7→ a11   7→
   
.. .. .. .. .. .. .. ..

 . . . . 


 . . . . 

0 0 ... ann 0 0 ... ann

191
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

   
1 a12 /a11 . . . a1n /a11 1 a12 /a11 . . . a1n /a11
   
 0 1 ... a2n /a22   0 1 ... a2n /a22 
a11 a22   7→ a11 a22 . . . ann   =: B.
   
.. .. .. .. .. .. .. ..

 . . . . 


 . . . . 

0 0 ... ann 0 0 ... 1

Por el axioma (A3) se tiene que |A| = a11 a22 . . . ann |B|. Luego, para llegar a
la identidad se hicieron operaciones que por el axioma (A4) no cambian el
determinante.

Note que toda matriz A ∈ Mn (K) se puede escalonar. Entonces se puede cal-
cular su determinante haciendo operaciones fila para escalonar y recordando cómo
cambió el determinante (usando los axiomas). De hecho, si su equivalente fila queda
con filas nulas, entonces su determinante es 0.
Ejemplo 6.4.4. Para M2 (K), es directo demostrar que hay una única función
que satisface la Definición 6.4.2. Es decir, hay un único determinante. Veamos,
supongamos que a11 6= 0. Haciendo operaciones fila se tiene

a11 a12 1 a12 /a11 1 a12 /a11


|A| = = a11 = a11 ,
a21 a22 a21 a22 0 a22 − (a12 a21 )/a11
reordenando

1 a12 /a11 1 a12 /a11


a11 = (a22 a11 −a12 a21 ) = (a22 a11 −a12 a21 ).
0 (a22 a11 − a12 a21 )/a11 0 1
Lo cierto es que para todo n, hay una única función determinante.
Observación 6.4.5. Recuerde que las matrices elementales son invertibles. Usa-
remos la notación para matrices elementales de la Proposición 6.4.6, y diremos que
la operación es de Tipo I si es intercambio de filas, de Tipo II si es escalamiento
de fila y de Tipo III si es combinación lineal de filas. La siguiente tabla resume
las matrices elementales, sus inversas y sus tipos:
tipo matriz operación inversa operación

I EI Fi ↔ Fj EI Fi ↔ Fj

II EII Fi → λFi E
gII Fi → 1/λFi

III EIII Fi → Fi + αFj E Fi → Fi − αFj


g
III
g

192
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Además, recuerde que toda matriz invertible es producto de matrices elemen-


tales.
Veamos cómo se comporta el determinante para matrices elementales.
Proposición 6.4.6. Denote por EI la matriz elemental que resulta de hacer in-
tercambio de filas a la matriz identidad, EII al escalamiento de fila y EIII a com-
binación lineal de filas. Entonces
|EI | = −1
|EII | = λ
|EIII | = 1
Más aún, si E es una matriz elemental, entonces |E · A| = |E| · |A|.
Demostración. Sabemos que Det(I) = 1 . Se tiene directo de los axiomas el compor-
tamiento del determinante de las matrices elementales. Para la última afirmación,
recordemos que EA corresponde a la matriz que resulta de aplicar la operación
fila de E a la matriz A. Entonces el determinante cambia justo como el producto
|E| · |A|.

Corolario 6.4.7. El determinante de un producto de matrices elementales es el


producto de los determinantes de cada matriz.
Demostración. Es directa aplicación de la Proposición 6.4.6, para A = In .
Teorema 6.4.8. (Caracterización de invertibilidad). Sea A una matriz de cuadra-
da. Entonces A es invertible si y sólo si |A| =
6 0.
Demostración. Si A no es invertible, entonces es equivalente por filas a una matriz
B que tiene una (o más) filas nulas, entonces el determinante de B es |B| = 0. Como
hicimos operaciones fila, el determinante de A es un múltiplo del determinante de
B. Entonces también es 0.
Si A es invertible, entonces es producto de matrices elementales, A = E1 . . . Er .
Por el corolario anterior, tenemos que el determinante de A es el producto de los
determinantes de las elementales, que son todos no nulos.
Teorema 6.4.9. Sean A y B matrices cuadradas del mismo tamaño. Entonces
|AB| = |A| · |B|.
Demostración. Recordemos que A y B son invertibles si y sólo si AB es invertible.
Si A no es invertible, entonces su determinante es 0. Además, en ese caso AB
tampoco es invertible, luego su determinante también es 0. Ası́ se satisface que
|A| · |B| = 0 · |B| = 0 = |AB|. Si A es invertible, entonces es producto de matrices
elementales, por la Proposición 6.4.6, se cumple lo buscado.

193
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejercicio 6.4.10. Demuestre (comparando la entrada ij) que

(AB)t = B t At .
Note que (At )−1 = (A−1 )t , pues por definición B = (At )−1 es una matriz tal que
B · At = I, luego

(A−1 )t · At = (A · A−1 )t = I t = I
Proposición 6.4.11. Sea A una matriz de cuadrada. Entonces
|At | = |A|

Demostración. Si A no es invertible, entonces |A| = 0. Además, At no es


invertible y su determinante también es 0. Si A es invertible, entonces es
producto de elementales. Para las elementales se tiene que EIt = EI , EII t
=
t
EII y EIII es una matriz elemental de tipo III también. Luego, para toda
matriz elemental E se tiene |E t | = |E|. Usando el Corolario 6.4.7, concluimos
que |At | = |A|.

Si A es invertible, entonces |A−1 | = 1/|A|

Demostración. Se tiene A · A−1 = I, usando el Teorema 6.4.9, se tiene que

|A| · |A−1 | = 1,
como A es invertible, |A| =
6 0.

Definición 6.4.12. Sea A ∈ Mn (K). Se llama

Menor i, j de A, y se denota Mij al determinante de la matriz de tamaño


n − 1 que resulta de eliminar de A la fila i y la columna j.

Cofactor i, j de A, denotado por Cij , al número Ci,j = (−1)i+j Mij


 
1 0 2
Ejemplo 6.4.13. Sea A =  −1 3 0 . Calcule M12 , M23 , C12 , C23 .
0 1 0
Solución. Para M12 , se elimina la fila 1 y la columna 2 de A. Entonces

−1 0
M12 = = 0,
0 0

194
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

luego C12 = (−1)1+2 · 0 = 0.


Para M23 , se elimina la fila 2 y la columna 3 de A. Entonces

1 0
M23 = = 1,
0 1
luego C23 = (−1)2+3 · 1 = −1.

Se tiene una construcción inductiva del determinante:

1. Para n = 1, Det(a) = a.
 
a11 a12
2. Para n = 2, Det = a11 a22 − a12 a21
a21 a22
3. Para n = 3, tome A con las entradas en notación estándar

a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a11 a23 a32 − a12 a21 a33 − a13 a22 a31

Reordenando

a11 (a22 a33 − a23 a32 ) − a12 (a21 a33 − a23 a31 ) + a13 (a21 a32 − a22 a31 ).
Usando las definiciones de Mij y Cij tenemos

|A| = a11 C11 + a12 C12 + a13 C13 .

En efecto, es un resultado general

Teorema 6.4.14. Sea n ∈ N, n > 2, el determinante de A ∈ Mn (K) es el número


en K que verifica para cualquier i = 1, . . . , n

Desarrollo por fila i−ésima

n
X
|A| = ai1 Ci1 + . . . + ain Cin = (−1)i+j aij Mij .
j=1

Desarrollo por columna i−ésima

n
X
|A| = a1i C1i + . . . + ani Cni = (−1)i+j aji Mji .
j=1

195
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Observación 6.4.15. Omitiremos la demostración, puede consultarla por ejemplo


en las páginas 88 y 89 del libro Álgebra Lineal de Juan De Burgos. Si es impor-
tante que sepa calcularlo, desarrollándolo por cualquier fila o columna, según la
conveniencia
(
ai1 Ci1 + . . . + ain Cin , para todo i = 1, . . . , n
Det(A) =
ai1 Ci1 + . . . + ain Cin , para todo i = 1, . . . , n
Hemos dado dos formas de calcular determinante, se recomienda usar el que sea
más conveniente según el problema.

Escalonando y llegando a una matriz diagonal.

Método de cofactores

Veamos ejemplos.

Ejemplo 6.4.16. Calcule el siguiente determinante desarrollando primero por la


fila 1 y después por la columna 1:

1 0 0 0
0 1 1 0
.
1 0 0 1
0 1 0 1
Solución:

Desarrollo por fila 1

1 0 0 0
1 1 0  
0 1 1 0 0 1 0 1
=1· 0 0 1 =1· 1· −1· = −1.
1 0 0 1 0 1 1 1
1 0 1
0 1 0 1

Desarrollo por columna 1

1 0 0 0
1 1 0 0 0 0
0 1 1 0
=1· 0 0 1 +1· 1 1 0 = −1 + 0 = −1.
1 0 0 1
1 0 1 1 0 1
0 1 0 1

196
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejemplo 6.4.17. Sea a ∈ R, calcule el determinante de la siguiente matriz de


n×n  
a 1 1 ··· 1 1
 1 a 1 ···  1 1

 1 1 a ··· 
 1 1
 .. ..  ..
 . .  .
1 1 1 ··· a 1
 
1 1 1 ··· 1 a
Solución:

Si a = 1, quedan todas las filas iguales y entonces el determinante es 0.

Si a 6= 1, haciendo las operaciones: Fi → Fi − Fi+1 , para i = 1, . . . , n − 1 (que


no cambia el valor del determinante) queda:

a−1 1−a 0 ··· 0 0


0 a−1 1−a ··· 0 0
0 0 a−1 ··· 0 0
= .. .. .. .
. . .
0 0 0 ··· a−1 1−a
1 1 1 ··· 1 a
Haciendo las operaciones: Fi → (1/(a − 1))Fi , para i = 1, . . . , n − 1 queda:

1 −1 0 ··· 0 0
0 1 −1 · · · 0 0
0 0 1 ··· 0 0
= (a − 1)n−1 .. .. .. .
. . .
0 0 0 ··· 1 −1
1 1 1 ··· 1 a
Haciendo las operaciones: Fn → Fn − F1 , . . ., Fn → Fn − Fn−1 queda:

1 −1 0 ··· 0 0
0 1 −1 · · · 0 0
0 0 1 ··· 0 0
= (a − 1)n−1 .. .. .. .
. . .
0 0 0 ··· 1 −1
0 0 0 ··· 0 a+n−1
Queda una matriz diagonal, entonces el determinante pedido es:

(a − 1)n−1 (a + n − 1).

197
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

6.4.1. Aplicación al cálculo de inversas


El Teorema 6.4.14 tiene consecuencias muy útiles.
Lema 6.4.18. Sea A ∈ Mn (K), entonces si i 6= k

ai1 Ck1 + . . . + ain Ckn = 0, y


a1i C1k + . . . + ani Cnk = 0.
Demostración. Use una matriz B que sea igual a A, pero que la fila k de B sea la
fila i de A. Tendrá ası́ B dos filas iguales, luego |B| = 0. Note que los cofactores
Ckj de A y B son iguales. El desarrollo de |B| por la fila k es

0 = |B| = bk1 Ck1 + bk2 Ck2 + · · · + bkn Ckn = ai1 Ck1 + ai1 Ck1 + · · · + ai1 Ck1 .

La segunda afirmación se prueba de forma análoga.

El Lema 6.4.18 dice que si se combina el cofactor con la fila que no le correspon-
de, la suma da 0. La misma suma que, si se considera la combinación fila-cofactor
correcta, da el determinante de la matriz. Se tiene entonces el siguiente corolario.
Lema 6.4.19. Sea A ∈ Mn (K). Entonces

ai1 Ck1 + . . . + ain Ckn = Det(A)δik


a1i C1k + . . . + ani Cnk = Det(A)δik .
La suma del lado izquierdo de las igualdades en el Lema 6.4.19, parecen el
coeficiente ik de un producto matricial. Mientras que el término del lado derecho
parece el coeficiente ik de la matriz Det(A) · In . Ello motiva la siguiente definición.
Definición 6.4.20. Sea A ∈ Mn (K). Se define la matriz adjunta de A como

Adj(A) = (Cij )t ,
donde Cij es el cofactor ij La matriz (Cij ) se llama matriz de cofactores.
Los Lemas 6.4.18 y 6.4.19 permiten demostrar el siguiente teorema.
Teorema 6.4.21. Sea A ∈ Mn (K). Entonces

El producto A · Adj(A) satisface

A · Adj(A) = Adj(A) · A = |A| I

198
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Además la inversa de A verifica

1
A−1 = Adj(A)
|A|

Demostración. Lo dicho, si escribimos el coeficiente ij del producto A · Adj(A),


obtenemos las expresiones en el Lema 6.4.19, que corresponde al coeficiente ij de
|A| · In .
 
0 0 −1
Ejemplo 6.4.22. Para encontrar la inversa de A =  1 0 −1 , calculamos
0 1 −1
los cofactores

0 −1 0 −1
C11 = = 1, C21 = − = −1, C31 = 0
1 −1 1 −1
1 −1
C12 = − = 1, C22 = 0, C32 = −1
0 −1
1 0 0 0
C13 = = 1, C23 = − = 0, C33 = 0
0 1 0 1
Además |A| = −1. Luego
 
−1 1 0
A−1 =  −1 0 1  .
−1 0 0

199
Capı́tulo 7

Geometrı́a en el plano y espacios


afines

Partiremos esta sección con una definición de vector en el plano.

Definición 7.0.1. Sean A y B dos puntos en Rn . Un vector geométrico (o simple-


−→
mente vector ) AB es un segmento dirigido que se distingue por:

1. Un origen o punto inicial A.

2. Un extremo o punto final B.

3. Una dirección que corresponde a la de la recta que lo contiene.

4. Un sentido, indicado por una punta de flecha en B.


−→
5. Una magnitud, ||AB||, que indica la longitud del segmento.

−→ −→
Observamos, por ejemplo, que AB 6= BA, dado que aunque sı́ tienen la misma
dirección y magnitud, no tienen el mismo origen, extremo ni dirección.

Definición 7.0.2. Dos vectores que difieren uno del otro por una traslación para-
lela se dirán equivalentes.

Ahora sea O ∈ Rn un punto distinguido (que suele ser el punto (0, . . . , 0), pero
−→ −→ −→
no necesariamente). Diremos que el vector OO es el vector nulo. Sean OP , OQ dos
vectores con punto inicial O. Definimos las siguientes operaciones:

200
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

−→ −→
Suma. Si OP y OQ tienen distintas direcciones, consideramos el paralelógramo
−→ −→ −→
formado por ambos vectores y definimos la suma de OP y OQ como el vector OR,
−→ −→
donde R es el vértice del paralelógramo opuesto a O. Si OP y OQ tienen la misma
−→ −→ −→
dirección, entonces definimos OP + OQ como el vector OR, donde R es el punto
final del vector que tiene punto inicial P , y la misma dirección, sentido y magnitud
−→
que el vector OQ. En otras palabras, en este caso la suma es el vector cuyo sentido
es igual al sentido del vector de mayor magnitud, y su magnitud es la diferencia
−→ −→
de las magnitudes de OP y OQ.

Multiplicación por un escalar. Sea α ∈ R. Si α > 0, entonces definimos el


−→ −→
vector α · OP como el vector cuya magnitud es α||OP ||, y que tiene la misma di-
−→ −→
rección y sentido que OP . Si α < 0, definimos α · OP como el vector de magnitud
−→ −→
|α|||OP || y que tiene la misma dirección pero sentido opuesto al de OP .

Proposición 7.0.3. Sea O ∈ Rn , y sea V el conjunto de todos los vectores


geométricos con punto inicial O. Entonces la suma y multiplicación por escalar
definidas arriba satisfacen las siguientes propiedades:
−→ −→ −→ −→ −→ −→
1. ∀ OP , OQ ∈ V, OP + OQ = OQ + OP .
−→ −→ −→ −→ −→ −→ −→ −→ −→
2. ∀ OP , OQ, OS ∈ V, (OP + OQ) + OS = OP + (OQ + OS).
−→ −→ −→ −→ −→ −→ −→
3. El vector OO satisface la propiedad ∀ OP ∈ V, OP + OO = OP = OO + OP .
−→ −→ −→ −→ −→ −→ −→
4. ∀ OP ∈ V, existe −OP tal que OP + (−OP ) = OO = (−OP ) + OP .
−→ −→ −→
5. ∀ OP ∈ V, se tiene que 1 · OP = OP .
−→ −→ −→
6. ∀ OP ∈ V, ∀ λ, µ ∈ R se tiene (λµ)OP = λ(µOP ).
−→ −→ −→ −→
7. ∀ OP ∈ V, ∀ λ, µ ∈ R se tiene (λ + µ)OP = λOP + µOP .
−→ −→ −→ −→ −→ −→
8. ∀ OP , OQ ∈ V, ∀ λ ∈ R se tiene λ(OP + OQ) = λOP + λOQ.
Observación 7.0.4. Si tenemos un punto distinguido O, a menudo los vectores
−→ −→ −→
OP , OQ, OR se denotarán por p~, ~q, ~r.
Observación 7.0.5. Sea Rn [x] = {a0 + a1 x + · · · + an xn | ai ∈ R} el conjunto de
polinomios con coeficientes reales de grado ≤ n unión el polinomio cero. Considere
la suma de polinomios y multiplicación por un escalar. Entonces Rn [x] cumple las
ocho propiedades anteriores. Lo mismo pasa si toma Mm×n (R) con la suma de
matrices y la multiplicación por escalar. Estos son ejemplos de espacios vectoriales
(abstractos), algo que estudiaremos en más detalle más adelante.

201
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

7.1. Usando coordenadas


Ya vimos que si se tiene un punto distinguido en Rn llamado O, podemos formar
vectores con punto inicial O. Si queremos usar coordenadas, podemos poner el
−→
punto distinguido O como el origen (0, 0, ..., 0). Además, a cada flecha AB se le
asocia una tupla Q que corresponde a la resta de las coordenadas del punto final
−→
B menos las del punto inicial A. Esto pues el vector OQ es equivalente al vector
−→ −→
AB (e igual a AB si y sólo si A = O).
Reciprocamente, dada una tupla P ∈ Rn se le asocia el vector → −p que tiene
punto inicial 0 y final P .
Más aún, no es difı́cil ver que las operaciones de vectores geométricos corres-
ponden a las operaciones de tuplas.
La siguiente figura muestra vectores en el plano real R2 .

Ejercicio 7.1.1. Considere los puntos A(2, 2), B(4, 3), C(−1, −1), D(−4, −3) y de-
−→ − −−→
fina los vectores →

u = AB, → v = CD. Determine → −u +→ −v de dos formas: usando
coordenadas y flechas.

7.2. Ecuación vectorial de la recta en Rn.


Intuitivamente, para tener una recta L necesitamos una dirección y un punto
por el que pase la recta L. Sea entonces ~v ∈ Rn un vector no nulo (el cual indica
la dirección de L) y A ∈ Rn un punto cualquiera.

Definición 7.2.1. La ecuación vectorial de la recta L que pasa por A y con direc-
−→ −→
ción ~v se define como L := {P ∈ Rn |∃t ∈ R : OP = OA + t~v }. Los puntos de L se
obtienen dando distintos valores a t. Esta recta se denota por LA,~v y se dice que ~v
es un vector director de LA,~v .

Observación 7.2.2. Se tienen los siguientes resultados inmediatos:

202
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

1. Sea B ∈ Rn . Entonces B ∈ LA,~v ⇐⇒ LA,~v = LB,~v .


2. Sea A ∈ Rn . Entonces LA,~v = LA,w~ ⇐⇒ ∃ λ ∈ R − {0} tal que w
~ = λ~v .
Es decir, los vectores directores de una misma recta son los múltiplos no nulos
de un vector director dado.
3. Sean A, B ∈ Rn con A 6= B. Entonces por A y B pasa una única recta. En
−−→ −→
efecto, esta recta es la recta que pasa por A y de vector director ~v = OB− OA.

7.2.1. Rectas en el plano R2


Recuperemos lo que conocemos de rectas en el lenguaje cartesiano, a partir de
la formulación vectorial vista. Para ello tomaremos n = 2.
Sea L la recta que pasa por A(a, b) con vector director d~ = (d1 , d2 ). Denote por
P (x, y) un punto arbitrario en L. Entonces existe t ∈ R tal que
(x, y) = (a, b) + t(d1 , d2 ).
Comparando coordenadas se encuentra una ecuación paramétrica
(
x = a + td1 , t ∈ R
y = a + td2
Suponiendo que d1 , d2 6= 0, se despeja t y se obtiene la ecuación simétrica de la
recta
x−a y−b
t= = .
d1 d2
Reordenando tenemos
d2
y= (x − a) + b,
d1
que corresponde a la expresión de la forma conocida y = mx + n, donde
d2 d2
m= y n = b − a.
d1 d1
El número m se llama la pendiente de la recta. Ahora si conocemos que L pasa
por A(a, b) y B(c, d), entonces podemos tomar d~ = (c − a, d − b), y la ecuación de
la recta queda
d−b
y= (x − a) + b,
c−a
la cual es la ecuación más conocida de la recta.
Se deja como ejercicio al lector ver qué ocurre para vectores directores con una
coordenada nula.

203
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Observación 7.2.3. Dos rectas, de vector director ~v = (v1 , v2 ) y w~ = (w1 , w2 )


(con v1 , w1 6= 0), se dicen paralelas si tienen la misma pendiente. En el lenguaje
vectorial, es fácil demostrar que dos rectas son paralelas si y solamente si existe
λ ∈ R r {0} tal que ~v = λw. ~
Ejemplo 7.2.4. Verifique los siguientes resultados.

1. Determine si las rectas L y L0 , son paralelas.



0 x = 2 − 2λ
L : 3x + y + 9 = 0 L :
y = −1 + 6λ

Solución: Una ecuación implı́cita de la recta L0 se obtiene eliminando el


parámero λ; queda la ecuación 3x + y = 5, de manera que las rectas sı́ son
paralelas.
2. Encuentre la recta L0 que contiene al punto (3, −1) y es paralela a L : 2x −
5y + 4 = 0
Solución: Una ecuación para la recta pedida es 2x − 5y − 11 = 0.
3. Encuentre la ecuación de la recta L0 que contiene al punto (2, 3) y es paralela
a la recta L que pasa por los puntos A = (−6, 1) y B = (1, −4).
5
Solución: La pendiente de la recta que pasa por A y B es − por lo que
7
una ecuación para la recta pedida es 5(x − 2) + 7(y − 3) = 0.

7.2.2. Rectas en el espacio R3


En esta sección estudiaremos rectas en R3 . Consideremos una recta
−→ −→
LA,~v = {P ∈ R3 | OP = OA + t~v , t ∈ R},

donde A = (a1 , a2 , a3 ) y ~v = (v1 , v2 , v3 ). Sea P = (x, y, z) ∈ LA,~v , entonces existe


t ∈ R tal que (x, y, z) = (a1 , a2 , a3 ) + t(v1 , v2 , v3 ). De esta manera, obtenemos las
ecuaciones paramétricas de la recta LA,~v :

x = a1 + tv1

y = a2 + tv2 .

z = a3 + tv3 , t ∈ R

Si vi 6= 0, ∀ i = 1, 2, 3 entonces se puede despejar el parámetro t y quedan las


ecuaciones
x − a1 y − a2 z − a3
= =
v1 v2 v3

204
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

que describen la recta LA,~v .


Si vi 6= 0, ∀ i = 1, 2 y v3 = 0, entonces se puede despejar el parámetro t en las
dos primeras y quedan las ecuaciones
x − a1 y − a2
= , z = a3 .
v1 v2
Por último si hay solamente un vi 6= 0, digamos v2 6= 0, entonces las ecuaciones
quedan de la forma
x = a1 , y = −a2 + tv2 , z = a3 .
Estas ecuaciones se llaman las ecuaciones simétricas de la recta LA,~v .

Ejemplo 7.2.5. Encuentre una ecuación paramétrica de la recta en R3 que con-


tiene a los puntos A = (2, −1, 3) y B = (6, 5, −1).

Solución. Usando lo conversado arriba, llegamos a que una ecuación paramétrica


de la recta es

x = 2 + 4t
y = −1 + 6t
z = 3 − 4t

Ejercicio 7.2.6. Encuentre las ecuaciones paramétricas y simétricas de la recta


que pasa por A = (1, 3, 5) y B = (−1, 2, 3).
Ejercicio 7.2.7. Encuentre m, n de manera que A = (7, −1, m), B = (8, 4, 3), C =
(10, n, 9) estén en una misma recta.

7.2.3. Aplicación: División de un segmento


Sean A, B dos puntos en el plano (o espacio) y P un punto en el segmento de
recta que los une de modo que divide al segmento en razón r ∈ R. Si conocemos
r, buscamos conocer las coordenadas de P en términos de las de A y B. Para ello
usamos vectores, es decir, consideramos el segmento dirigido de A y B. Ello se
captura en la expresión
−→ −−→
AP = rP B,
que se suele anotar
−→
AP
−−→ = r.
PB

205
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

−→ −−→ −→
Usando la notación ~a = OA, ~b = OB, p~ = OP , ver la Figura 7.1, la ecuación
vectorial para p~ es
1
p~ − ~a = r(~b − p~) ⇔ p~ = (~a + r~b),
1+r
con r 6= −1. De la ecuación vectorial se determina que si r = −1, se tiene A = B
y ese caso no tiene sentido.
El caso particular en que P es el punto medio del segmento AB, corresponde a
r = 1. Para el caso de vectores en el plano R2 y A(x1 , y1 ), B(x2 , y2 ) resulta P (x, y)
con
x1 + x2 y1 + y2
x= , y=
2 2
Note que si r < 0, el punto P es externo al segmento AB. Si r = 0, entonces
P = A, y a medida que r crece, P se acerca a B.

Figura 7.1: División de un segmento

Observación 7.2.8. Cuidado con memorizar la fórmula pues depende de cómo


enunciemos la división del segmento. Dados A, B, podemos preguntar por P que
divide al segmento AB de forma que AP es αAB. Para ello usamos vectores (ver
la Figura 7.1)
−→ −→
AP = αAB.
Nuevamente usamos la notación vectorial

p~ − ~a = α(~b − ~a) ⇔ p~ = (1 − α)~a + α~b.

206
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Aquı́ se tiene que para α ∈ R se tienen todos los puntos de la recta por A y B. El
1
punto medio del segmento AB corresponde ahora al parámetro α = . Finalmente
2
para α ∈ [0, 1] se tienen los puntos en el segmento AB.
Ejemplo 7.2.9. Determine las coordenadas de los puntos P, Q que trisectan el
segmento AB. Para ello veamos la Figura 7.2

Figura 7.2: Trisección de un segmento

Usaremos la notación vectorial de la Figura 7.2:

~b − ~a 2~a + ~b
p~ = ~a + = , y
3 3
~b − ~a 2~a + ~b ~b − ~a ~a + 2~b
~q = p~ + = − = .
3 3 3 3
3
Ejercicio 7.2.10. Considere el triángulo de vértices A(1, 1), B(3, 2), C( , 5). De-
2
termine
1. Las coordenadas de los puntos medios de sus lados. Resp. (2, 3/2), (9/4, 7/2), (5/4, 3).

2. Las coordenadas del centro de gravedad (intersección de las transversales de


gravedad: rectas que unen un vértice con el punto medio del lado opuesto).
Resp. (11/6, 8/3), verifique que corresponde a

~a + ~b + ~c
.
3

207
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejemplo 7.2.11. Probar que el segmento que une los puntos medios de dos lados
opuestos en un triángulo es paralelo al otro lado y mide la mitad de éste.
En la Figura 7.3 vemos la notación vectorial que usaremos. En ese contexto lo
que buscamos demostrar es que

~b
~ = .
m
2

Figura 7.3: Mediana

Para ello usaremos el vector auxiliar ~v , tenemos las siguientes relaciones entre
los vectores:
1
~c + m
~ = ~v ,
2
~b − ~v = 1 (~b − ~c).
2
Resolvemos,
 
1 1 1
~ = ~b − (~b − ~c) − ~c = ~b.
m
2 2 2
Ejercicio 7.2.12. Resuelva.
1. Considere el trángulo de vértices A(4, 0, 0), B(0, 2, 0), C(0, 0, 2). Determinar
las coordenadas de los puntos medios de los lados y las ecuaciones de sus
transversales de gravedad, también el centro de gravedad.

208
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

2. Probar que el centro de gravedad en un triángulo ABC cualquiera tiene el


vector posición

~a + ~b + ~c
,
3
donde ~a, ~b, ~c son los vectores posición de A, B, C respectivamente.

7.3. Ecuación vectorial de un plano


~ dos vectores no nulos linealmente independientes y sea A ∈ Rn .
Sean ~v , w,
Usando nuestra intuición vemos que por A pasan dos rectas distintas L1 = LA,~v y
L2 = LA,w~ , con direcciónes determinadas por ~v y w,
~ que están contenidas en un
mismo plano Π.

Definición 7.3.1. La ecuación vectorial del plano Π es


−→ −→
Π = {P ∈ Rn | OP = OA + t~v + k w,
~ t, k ∈ R}
con P un punto cualquiera de Π. Los puntos de Π se obtiene dando valores a t y
a k. Se anota ΠA,~v,w~ y dice que ~v y w
~ son los vectores directores de ΠA,~v,w~ .

Ejercicio 7.3.2. Sea B ∈ Rn . Entonces


B ∈ ΠA,~v,w~ ⇐⇒ ΠA,~v,w~ = ΠB,~v,w~ .

Figura 7.4: Plano

209
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Sean A, B, C ∈ Rn tres puntos no colineales. Entonces por A, B y C pasa un


único plano de ecuación vectorial

~ t, k ∈ R,
p~ = ~a + t~v + k w,
−→ −→ −→ −→
donde ~a = OA, ~v = AB, w~ = AC, y p~ = OP con P (x, y, z) punto arbitrario en el
plano.
−−→
Observación 7.3.3. El plano que pasa por A y de vectores directores ~v = OB −
−→ −→ −→ −→
OA, w ~ = OC − OA, el plano que pasa por B y de vectores directores ~v = OA −
−−→ −→ −−→
OB, w ~ = OC − OB, y el plano que pasa por C y de vectores directores ~v =
−→ −→ −−→ −→
OA − OC, w ~ = OB − OC corresponden al mismo conjunto de puntos en Rn . Es
decir son el mismo plano.
Observación 7.3.4. Con lo anterior, la recta que pasa por A y B es LA,−→ . El
AB
plano que pasa por A, B, C no colineales es ΠA,−→ −→ .
AB,AC

7.3.1. Planos en el espacio R3


Veamos ahora un plano en el espacio.
−→ −→
ΠA,~v,w~ = {P ∈ Rn | OP = OA + t~v + sw,
~ t, s ∈ R}
Sea P = (x, y, z) ∈ ΠA,~v,w~ , entonces hay t, s ∈ R tal que (x, y, z) = (a1 , a2 , a3 ) +
t(v1 , v2 , v3 ) + s(w1 , w2 , w3 ).
De esta manera 
x = a1 + tv1 + sw1

y = a2 + tv2 + sw2

z = a3 + tv3 + sw3 , t, s ∈ R

se llaman las ecuaciones paramétricas del plano ΠA,~v,w~ .


Observación 7.3.5. Despejando t y s en las ecuaciones paramétricas del plano
ΠA,~v,w~ se obtiene la ecuación cartesiana o implı́cita de ΠA,~v,w~ a saber,

Ax + By + Cz + D = 0
donde A, B, C, D ∈ R, con A, B o C no nulos.
Ejemplo 7.3.6. El plano Π que pasa por A = (0, 1, 0) y tiene por vectores direc-
~ = (0, −1, 1) tiene por ecuaciones paramétricas
tores ~v = (−1, 1, 0), w

x = −t

y = 1+t−s

z = s, t, s ∈ R

210
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Su ecuación implı́cita es y = 1 − x − z, es decir , x + y + z − 1 = 0.

Ejercicio 7.3.7. Encuentre las ecuaciones paramétricas e implı́cita del plano Π


que pasa por A = (2, 3, 5), B = (1, 1, 2), C = (3, 6, 0). Vea primero que A, B, C no
son colineales.

7.4. Posiciones relativas de objetos.


En esta sección se clasifican las configuraciones geométricas que se pueden tener
de rectas y planos en el espacio. Sin embargo comenzaremos estudiando posiciones
relativas de rectas en el plano, para despertar la intuición.

7.4.1. Posiciones relativas de rectas en R2


Aquı́ se verifica lo siguiente:

Proposición 7.4.1. Dadas dos rectas de ecuaciones generales

r : a1 x + a2 y + a0 = 0 y s : b1 x + b2 y + b0 = 0.
Defina las matrices del sistema lineal asociado
   
a1 a2 a1 a2 −a0
A= , Ã = .
b1 b2 b1 b2 −b0
Entonces

1. Si rk(A) = 2, entonces r ∩ s consta de un sólo punto.

2. Si rk(A) = 1 y rk(Ã) = 2, entonces r ∩ s = ∅.

3. Si rk(A) = 1 y rk(Ã) = 1, entonces r = s.

Observación 7.4.2. En el caso (1) se dice que son rectas secantes, en (2) que son
paralelas y en (3) que son rectas coincidentes.

Demostración. La conclusión es inmediata de lo desarrollado para Sistemas linea-


les, pues r y s se intersectan si hay solución al sistema
(
a1 x + a2 y + a0 = 0
b1 x + b2 y + b0 = 0

211
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejercicio 7.4.3. Haga el mismo análisis para la posición relativa de 3 rectas en el


plano:

a1 x + a2 y + a0 = 0

b1 x + b2 y + b0 = 0

c1 x + c2 y + c0 = 0

Construya la matriz M del sistema, y M̃ la matriz ampliada. Los diferentes casos


los encuentra en la Figura 7.5, tomada del libro “Algebra Lineal”, de Juan De
Burgos.

Figura 7.5: Posiciones relativas de 3 rectas en el plano

En particular, estudie la posición relativa de las siguientes tres rectas

r : x + y = 1 ; s : 2x + 3y = 1 ; t : 3x + αy = 2
en términos del parámetro α.

7.4.2. Posiciones relativas de dos rectas en el espacio.


Recuerde que la rectas LA,~v y L2 = LB,w~ se dicen paralelas si los vectores
directores ~v y w
~ son proporcionales. Si ambas son la misma recta, también serı́an
paralelas con esta definición. Por ello se dice paralelas no coincidentes, cuando se
quiere excluir el caso de igualdad. A veces se dice paralelas y se entiende que no
son coincidentes.
Si usamos nuestra imaginación determinamos que dadas L1 , L2 dos rectas en el
espacio. Entonces se presentan cuatro casos:

1. L1 y L2 son coincidentes, es decir, tienen la misma dirección y un punto en


común, luego corresponden al mismo conjunto de puntos.
2. L1 es paralela (no coincidente) a L2 , es decir, tienen la misma dirección y
ningún punto en común.

212
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

3. L1 y L2 son secantes, es decir, se cortan. Tienen distinta dirección y un punto


en común.

4. L1 y L2 se cruzan, es decir, tienen distinta dirección y ningún punto en común.

La siguiente proposición demuestra lo que nuestra imaginación nos dice.

Proposición 7.4.4. Sean L1 = LA,~v : ~a + t~v , t ∈ R y L2 = LB,w~ : ~b + sw,


~ s∈R
−→
~ ∈ M3×2 (R) y (M | AB) ∈ M3 (R) la
dos rectas en el espacio. Sean M = (~v , w)
matriz ampliada.
Entonces,
−→
1. Si rk(M ) = 2 y rk(M |AB) = 3 entonces L1 y L2 se cruzan (no se cortan y
no son paralelas)..
−→
2. Si rk(M ) = rk(M |AB) = 2 entonces L1 y L2 se cortan en un único punto.
−→
3. Si rk(M ) = 1 y rk(M |AB) = 2 entonces L1 ∩ L2 = ∅. Es decir, son paralelas
(no coincidentes).
−→
4. Si rk(M |AB) = 1 entonces L1 = L2 ; es decir, coinciden.

La demostración se deja como ejercicios pues es similar a la realizada para


dimensión 2: se debe analizar el sistema lineal asociado a la pregunta.

Ejemplo 7.4.5. Estudie la posición relativa de las rectas L1 y L2 para L1 la recta


que pasa por A = (5, 1, −2) y de vector director ~v = (−1, 1, 3) y

x = 3 + 3t

L2 : y = 1 + t

z = 1 − t, t ∈ R

Solución. Sea L2 = LB,w~ , donde B = (3, 1, 1) y w ~ = (3, 1, −1). Como los


vectores directores no son proporcionales las rectas no son paralelas.
 Veamossi se
−1 3 −2
−→ −→
cortan o si se cruzan. Tenemos AB = (−2, 0, 3) y (M |AB) =  1 1 0
3 −1 3
Tenemos  
−1 3 −2
1 1 0
3 −1 3

213
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

 
1 1 0
F1 ←→ F2 −1
 3 2
3 −1 3
 
1 1 0
F2 → F2 + F1 0
 4 −2
3 −1 3
 
1 1 0
F3 → F3 + (−3)F1 0 4 −2
0 −4 3
 
1 1 0
1
F2 → (− )F2 0 1 − 12 
4
0 −4 3
 
1 1 0
F3 → F3 + 4F2 0 1 − 12 
0 0 1
−→
Tenemos entonces que rango(M ) = 2 y rango (M |AB) = 3. Por lo tanto, L1 y L2
son dos rectas que se cruzan.

Ejercicio 7.4.6. Estudie la posición relativa de las rectas L1 y L2 para L1 la recta


que pasa por A = (1, 3, −5) y de vector director ~v = (0, 1, 2) y
3−x y−2 z−1
L2 : = = .
−1 2 5
Ejercicio 7.4.7. Estudie la posición relativa de las rectas L y M en términos de
los parámetros α y β, donde

L : (x, y, z) = (1, α, 2) + t(1, 1, β), t ∈ R ; M : (x, y, z) = µ(1, 1, 1), µ ∈ R.

7.4.3. Posiciones relativas de dos planos en el espacio.


Primero definamos paralelismo de planos

Definición 7.4.8. Dos planos ΠA,v~1 ,w~1 , ΠB,v~2 ,w~2 se dicen paralelos si tienen el mismo
espacio director. Es decir si h{v1 , v2 }i = h{v2 , w2 }i.

Note que si se conocen sus ecuaciones implı́citas se tiene:

214
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Proposición 7.4.9. Sean Π1 y Π2 planos dados por

Π1 : A1 x + B1 y + C1 z = D1 , Π2 : A2 x + B2 y + C2 z = D2 .
Entonces son paralelos si y sólo si
A1 B1 C1
= = .
A2 B2 C2
Demostración. Supongamos que todos los coeficientes, para ambos planos, son no
nulos. Despejemos z en cada plano:
D1 A1 B1
Π1 : z = − x− y
C1 C1 C1
D2 A2 B2
Π2 : z = − x− y
C2 C2 C2
Entonces, para cada plano, se tiene que

−Aj −Bj Dj
P = (x, y, z) ∈ Πj ⇔ P = x(1, 0, ) + y(0, 1, ) + (0, 0, ), j = 1, 2.
Cj Cj Cj
Ası́ el subespacio director de Π1 es h{(1, 0, −A
C1
1
), (0, 1, −B
C1
1
)}i, y el de Π2 es
−A2 −B2
h{(1, 0, C2 ), (0, 1, C2 )}i. La igualdad deseada se sigue de aquı́.
Si algún coeficientes es nulo, se analiza.

Sean Π1 , Π2 dos planos en el espacio. De nuevo imaginemos las opciones y vemos


que se presentan tres casos:
1. Π1 Π2 son coincidentes
2. Π1 y Π2 son paralelos
3. Π1 y Π2 se intersectan en una recta.

Sean Π1 : A1 x + B1 y + C1 z = D1 , Π2 : A2 x + B2 y + C2 z = D2 las ecuaciones


implı́citas de dos planos en el espacio. Se trata de un sistema de ecuaciones de 2
ecuaciones y 3 incógnitas.
!
A1 B1 C1
Consideremos la matriz M = ∈ M2×3 (R) y la matriz ampliada
A2 B2 C2
!
A1 B1 C1 D1
∈ M2×4 (R)
A2 B2 C2 D2
Denotemos por (M |D) la matriz ampliada.

215
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Proposición 7.4.10. Sean Π1 : A1 x+B1 y +C1 z = D1 , Π2 : A2 x+B2 y +C2 z = D2


las ecuaciones implı́citas de dos planos en el espacio. Consideremos las matrices
M y la matriz ampliada (M |D)

1. Si rango(M ) = rango (M |D) = 1 entonces Π1 y Π2 coinciden.

2. Si rango(M ) = 1 y rango (M |D) = 2 entonces Π1 y Π2 son paralelos.

3. Si rango(M ) = 2 y rango (M |D) = 2 entonces Π1 y Π2 se intersectan en una


recta.

La demostración se deja como ejercicio pues nuevamente se trata del análisis


del sistema lineal asociado. Note que (3) corresponde a una nueva forma de definir
una recta: como intersección de dos planos.

Ejemplo 7.4.11. Estudie la posición relativa de los planos Π1 y Π2 donde Π1 :


3x − 2y + 4z = 2, Π2 : 2x + 3y − 5z = −8.

Definición 7.4.12. Dada una recta


(
A1 x + B1 y + C1 z = D1
L=
A2 x + B2 y + C2 z = D2

Se define el haz de planos que pasa por L como α(A1 x + B1 y + C1 z − D1 ) + β(A2 x +


B2 y + C2 z − D2 ) = 0, con α, β escalares no ambos nulos.

Ejemplo 7.4.13. Encuentre la ecuación del plano Π que pasa por el punto A =
(−2, 3, 5) y contiene a la recta
(
2x − 3y + 5z = 1
L=
x + 2y − 5z = 3

Solución. El haz de planos que contiene a L es

α(2x − 3y + 5z − 1) + β(x + 2y − 5z − 3) = 0, (α, β) 6= (0, 0) (∗)

Como A = (−2, 3, 5) pertenece a este haz, se tiene α(2(−2) − 3(3) + 5(5) − 1) +


24
β(−2 + 2(3) − 5(5) − 3) = 0. Es decir, 11α − 24β = 0, o bien α = 11 β. Tomando
β = 11, nos queda α = 24, y el plano pedido al reemplazar estos valores en (*) es
Π : 59x − 50y + 65z = 9.

216
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

7.4.4. Posiciones relativas de tres planos en el espacio.


Sean Π1 : A1 x + B1 y + C1 z = D1 , Π2 : A2 x + B2 y + C2 z = D2 , Π3 : A3 x +
B3 y + C3 z = D3 las ecuaciones implı́citas de tres planos en el espacio. Se trata de
resolver un sistema de 3 ecuaciones y 3 incógnitas.
 
A1 B1 C1
Consideremos la matriz M = A2 B2 C2  ∈ M3×3 (R) y la matriz ampliada
 
A3 B3 C3
 
A1 B1 C1 D1
A2 B2 C2 D2  ∈ M3×4 (R)
 
A3 B3 C3 D3
Denotemos por (M |D) la matriz ampliada.

Proposición 7.4.14. Sean Π1 : A1 x + B1 y + C1 z = D1 , Π2 : A2 x + B2 y + C2 z =


D2 , Π3 : A3 x + B3 y + C3 z = D3 las ecuaciones implı́citas de tres planos en el
espacio. Consideremos las matrices M y la matriz ampliada (M |D)

1. Si rango(M ) = rango (M |D) = 1 entonces los tres planos coinciden.

2. Si rango(M ) = 1 y rango (M |D) = 2 entonces los tres planos son paralelos.

3. Si rango(M ) = 2 y rango (M |D) = 2 entonces se trata de un haz de planos,


pudiendo haber dos coincidentes. Tienen una recta en común.

4. Si rango(M ) = 2 y rango (M |D) = 3 entonces los tres planos no tienen


puntos en comuún, pueden ser dos paralelos que intersectan respectivamente
al otro, o bien, se intersectan dos a dos en sus respectivas rectas.

5. Si rango(M ) = 3 y rango (M |D) = 3 entonces los tres planos tienen un


punto en común.

La demostración es análoga a las anteriores. Incluimos la Figura 7.6, del libro


de Juan De Burgos, donde se ilustran las 5 opciones.

Ejemplo 7.4.15. Averigue la posición de los planos respectivos

Π1 : 2x + 5y − 3z = 1, Π2 : x − y + z = 2, Π3 : x + 2y + 3z = 1.

217
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Figura 7.6: Posiciones relativas de 3 planos en el espacio

Solución. Se trata de unsistema de tresecuaciones y tres incógnitas. Consi-


2 5 −3 1
deremos la matriz (M |D) = 1 −1 1 2 Entonces
 
1 2 3 1
 
2 5 −3 1
 
1 −1 1 2
1 2 3 1
 
1 2 3 1
F1 ←→ F3 1 −1 1 2
 
2 5 −3 1
 
1 2 3 1
F2 −→ F2 + (−1)F1 0 −3 −2 1
 
2 5 −3 1
 
1 2 3 1
F3 −→ F3 + (−2)F1 0 −3 −2 2 
 
0 1 −9 −1

218
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

 
1 2 3 1
F2 ←→ F3 0 1 −9 −1
 
0 −3 −2 1
 
1 2 3 1
F3 −→ F3 + 3F2 0 1 −9 −1
 
0 0 −29 −2
 
1 2 3 1
1
F3 −→ − F3 0 1 −9 −1
 
29 2
0 0 1 29

Luego rango(M ) = 3 = rango(M |D) y los planos tiene un punto en común.

7.4.5. Posiciones relativas de un plano y una recta en el


espacio.
Sean L, Π una recta y un plano en el espacio. Entonces se presentan tres casos:
1. L y Π son paralelos
2. L ⊆ Π
3. L y Π se intersectan en un punto.
Observación 7.4.16. En el caso de que L esté dada como intersección de dos
planos se procede en forma muy similar a tener 3 planos en el espacio. Pero si L
está definida por sus ecuaciones paramétricas se reemplaza en la ecuación del plano
y se analiza la situación.
Ejemplo 7.4.17. Averigue la posición relativa de la recta L y el plano Π, donde
2−x y z+3
L: = = , Π : x − 2y + z − 4 = 0.
3 2 1
x−2 y z+3
Solución. La ecuación simétrica de L es −3
= 2
= 1
, y su ecuación pa-
ramétrica es 
x =
 2 − 3t
y= 2t

z= −3 + t, t ∈ R

Reemplazando en la ecuación del plano queda (2 − 3t) − 2(2t) + (−3 + t) − 4 = 0.


Desarrollando tenemos −8t + 1 = 0, de donde t = 81 . Luego la recta corta al plano
en un punto, a saber P = (2 − 3( 81 ), 2( 81 ), −3 + ( 18 )) = ( 85 , 14 , − 23
8
).

219
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejercicio 7.4.18. Sean L1 , L2 rectas en el espacio.


( (
2x − y = m x+y = 2
L1 : , L2 : .
2y + z = 3 x − 4z = −3

i) Encuentre el valor de m para que las dos rectas se corten.


ii) Para ese valor de m encuentre la ecuación del plano Π que las contiene.

7.5. Producto punto o escalar en R3.


El producto punto (o producto escalar) de dos vectores es un número (también
llamado escalar) que nos permite definir las nociones de norma de un vector y el
ángulo entre dos vectores.

Definición 7.5.1. Si A = (a1 , a2 , a3 ), B = (b1 , b2 , b3 ) ∈ R3 , definimos el producto


punto de A y B (o también el producto escalar de A y B) como
3
X
A · B := ai b i .
i=1

Se anota también como hA, Bi, pero esta notación se usa más frecuentemente para
generalizaciones del producto punto que se verá en cursos más avanzados.

Tenemos entonces una función · : R3 × R3 → R definida por (A, B) → A · B.

Proposición 7.5.2. Se tienen las siguientes propiedades:

1. Simetrı́a: ∀ A, B ∈ R3 , A · B = B · A.

2. Distributividad: ∀ A, A0 , B, B 0 ∈ R3 ,

(A + A0 ) · B = A · B + A0 · B,

A · (B + B 0 ) = A · B + A · B 0 .

3. Homogeneidad: ∀ α ∈ R, ∀ A, B ∈ R3 ,

(αA) · B = α(A · B) = A · (αB).

4. Positividad: ∀ A ∈ R3 ,
A·A≥0
A · A = 0 ⇔ A = 0.

220
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración. La demostración queda de ejercicio.


Vamos a usar el producto punto para definir la norma de un vector, y poste-
riormente la distancia entre dos vectores.
Definición 7.5.3. Si A ∈ R3 , se define la norma de A como

||A|| := A · A.

Se tiene una función || || : R3 −→ R, definida por A 7→ ||A||

Proposición 7.5.4. Se tienen las siguientes propiedades:


1. ∀ A ∈ R3 , ||A|| ≥ 0 ∧ ||A|| = 0 ⇔ A = 0,
A
2. ∀ A ∈ R3 , A 6= 0, ||A||
es un vector unitario (es decir, tiene norma 1).

3. ∀ α ∈ R, ∀ A ∈ R3 , ||αA|| = |α|||A||.
4. ∀ A, B ∈ R3 , |A · B| ≤ ||A||||B||, desigualdad de Cauchy-Schwarz
5. ∀ A, B ∈ R3 , ||A+B|| ≤ ||A||+||B||, desigualdad triangular o de Minkowski.
Demostración. La demostración de 1. y 2. queda de ejercicio. Veamos 4 y 5.

4. Si A = 0 ∨ B = 0, la desigualdad se cumple. Supongamos entonces que A 6= 0


y B 6= 0.
Consideremos la función ϕ : R −→ R, definida por ϕ(t) = ||tA − B||. Entonces
ϕ(t) ≥ 0 ∀ t ∈ R. Si B no es múltiplo de A entonces ϕ(t) > 0 ∀ t ∈ R. Ahora
bien,

ϕ(t) = ||tA − B|| = (tA − B) · (tA − B) = t2 (A · A) − 2t(A · B) + B · B

= t2 ||A||2 − 2t(A · B) + ||B||2 ,


de donde
ϕ(t) = t2 ||A||2 − 2t(A · B) + ||B||2
Sean a = ||A||2 , b = −2(A · B) y c = ||B||2 , entonces tenemos una ecuación de
segundo grado en t. Además ϕ(t) ≥ 0 ∀ t ∈ R. Luego ∆ = b2 − 4ac ≤ 0, es decir
4(A · B)2 − 4||A||2 ||B||2 ≤ 0, de donde obtenemos (A · B)2 ≤ ||A||2 ||B||2 , es decir
|A · B| ≤ ||A||||B||.

5. Usaremos la desigualdad de Cauchy-Schwarz

||A+B||2 = (A+B)·(A+B) = A·A+2(A·B)+B·B = ||A||2 +2(A·B)+||B||2 ≤ ||A||2 +2||A||||B||+||B||2 =

221
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Definición 7.5.5. Sean A, B ∈ R3 , se define la distancia entre A y B y se anota


d(A, B) = ||B − A||.

Observación 7.5.6. Sea A 6= 0 y B 6= 0. Entonces de la desigualdad de Cauchy-


Schwarz se obtiene
< A, B >
−1 ≤ ≤1
||A||||B||
Definición 7.5.7. Sean A, B ∈ R3 , se define el ángulo entre ellos como θ ∈ [0, π]
<A,B>
tal que cos(θ) = ||A||||B|| .

Definición 7.5.8. Dadas las rectas LA,~v y LB,w~ . Se define el ángulo entre ellas
como el ángulo entre sus vectores directores.

Ejemplo 7.5.9. Sean A = (0, 0, 2), ~v = (2, 1, −2), B = (0, 2, 0), w


~ = (2, −2, 1).
Encuentre al ángulo entre LA,~v y LB,w~ .
Solución. Primero encontramos las ecuaciones de las rectas dadas

LA,~v : p~ = (0, 0, 2) + t(2, 1, −2), t ∈ R

LB,w~ : p~ = (0, 2, 0) + s(2, −2, 1), s ∈ R


Debemos calcular el ángulo β entre los vectores directores, para ello

h(2, 1, −2), (2, −2, 1)i 4−2−2


cos(β) = = √ √ = 0.
||(2, 1, −2)|| ||(2, −2, 1)|| 9 9
π
Luego β = .
2
1
Note que las rectas se intersectan en (4, 2, 2).
3
Definición 7.5.10. Sean A, B ∈ R3 , se dice que A y B son ortogonales y se
anota A ⊥ B si y sólo si < A, B >= 0.

Ejercicio 7.5.11. Dados A y B en R3 , encuentre x ∈ R de manera que A ⊥ B.

1. A = (x, 0, 3), B = (1, x, 3).

2. A = (x, x, 4), B = (4, x, 1).

3. A = (x + 1, 1, 2), B = (x − 1, −1, −2).

4. A = (x, −1, 4), B = (x, −3, 1).


<A,B>
Ejercicio 7.5.12. Sean A, B ∈ R3 , B 6= 0, k = ||B||2
. Pruebe que A − kB ⊥ B.

222
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejercicio 7.5.13. Determine el valor de m tal que A ⊥ B, para que los vectores
A = (1, m + 1, m) y B = (m − 1, m, m + 1) sean ortogonales.
Observación 7.5.14. En el espacio no es lo mismo decir rectas ortogonales que
rectas perpendiculares.
Definición 7.5.15. Dos rectas LA,~v y LB,w~ son ortogonales si y sólo si ~v ⊥ w.
~ Si
además se cortan en un punto se dice que son perpendiculares.
Ejemplo 7.5.16. Verifique si las rectas L1 , L2 son ortogonales, en caso afirmativo
vea si son también perpendiculares. L1 pasa por A = (1, 1, 1) y tiene vector director
~v = (2, 1, −3) y L2 pasa por B = (0, 1, 0) y tiene vector director w~ = (−1, 2, 0).
~ > = < (2, 1, −3), (−1, 2, 0) >= 2(−1) + 1 · 2 + (−3) ·
Solución. Veamos < ~v , w
0 = 0. Las rectas son ortogonales. Veamos si se cortan o si se cruzan. Tenemos
−→
AB = (−1, 0, −1) y Tenemos entonces
 
2 −1 −1
1 2 0
−3 0 −1
 
1 2 0
F1 ←→ F2 2 −1 −1
3 0 −1
 
1 2 0
F2 → F2 + (−2)F1 0 −5 −1
3 0 −1
 
1 2 0
F3 → F3 + 3F1 0 −5 −1
0 6 −1
 
1 2 0
F3 → F3 + F2 0 −5 −1
0 1 −2
 
1 2 0
F2 ←→ F3 0 1 −2
0 −5 −1
 
1 2 0
F3 → F3 + 5F2 0 1 −2 
0 0 −11
−→
Tenemos entonces que rango(M ) = 2 y rango (M |AB) = 3. Por lo tanto, L1 y L2
son dos rectas que se cruzan luego no son perpendiculares.

223
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejemplo 7.5.17. Encuentre las ecuaciones paramétricas de la recta L2 que pasa


por (−1, 3, 1) y es perpendicular a la recta L1 de ecuación
x−1 y−1
L1 : = =z
2 3
Solución. Ambas rectas deben cortarse. Necesitamos un punto Q común a
ambas. La ecuación paramétrica de L1 es

x = 1 + 2t

L1 = y = 1 + 3t

z = t, t ∈ R

Como Q pertenece a L1 , Q = (1 + 2t, 1 + 3t, t) para algún t ∈ R. Por lo tanto


−→
P Q = (2+2t, −2+3t, t−1). Como ~v = (2, 3, 1) es un vector director de L1 debemos
−→
tener que P Q ⊥ ~v .
−→
Luego 0 =< P Q, ~v > =< (2+2t, −2+3t, t−1), (2, 3, 1) > = 4+4t−6+9t+t−1.
3 −→ −→
De donde t = 14 y el vector P Q es P Q = ( 34
14
, − 19
14
11
, − 14 . Por lo tanto las ecuaciones
paramétricas de la recta L2 que pasa por (−1, 3, 1) y es perpendicular a la recta
L1 es 
x = −1 + 34k

L2 = y = 3 − 19k

z = 1 − 11k, k ∈ R

Ejemplo 7.5.18. Recuperemos resultados conocidos del plano. Sean L : y =


m1 x + n1 y M : y = m2 x + n2 dos rectas en el plano. Vectorialmente

L : (x, y) = t(1, m1 ) + (0, n1 ), t ∈ R,

M : (x, y) = s(1, m2 ) + (0, n2 ), s ∈ R.


El ángulo β entre L y M es tal que

h(1, m1 ), (1, m2 )i 1 + m1 m2
cos(β) = =p .
||(1, m1 )|| ||(1, m2 )|| (1 + m21 )(1 + m22 )
Entonces,
π
L es perpendicular a M si y sólo si β = si y sólo si cos(β) = 0 si y sólo si
2
m1 m2 = −1.

224
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

L es paralela a M si y sólo si β = 0 si y sólo si cos(β) = 1 si y sólo si

1 + m1 m2
1= p ,
(1 + m21 )(1 + m22 )
reordenando se obtiene m1 = m2 .

Observación 7.5.19. La Proposición 7.5.2 sirve como definición de un producto


interno en un espacio vectorial abstracto. Por ejemplo en V = Rn [x] se define
Z 1
hp(x), q(x)i = p(x)q(x)dx,
0
el cual es un producto interno. Luego se puede definir la norma de un polinomio y
el ángulo entre polinomios.

7.5.1. Aplicación 1: Vector normal de un plano.


Veamos ahora un vector ~n que siempre es ortogonal al plano Π : Ax+By+Cz =
D.
Proposición 7.5.20. Sea Π : Ax + By + Cz = D la ecuación implı́cita del plano
Π. Entonces ~n = (A, B, C) ⊥ Π. Es decir, es ortogonal a cualquier vector contenido
en el plano, ver la Figura 7.7.

Figura 7.7: Vector normal a un plano

Demostración. Sean P1 , P2 dos puntos en el plano. Sea P1 = (x1 , y1 , z1 ), P2 =


(x2 , y2 , z2 ).
P1 ∈ Π =⇒ Ax1 + By1 + Cz1 = D

225
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

P2 ∈ Π =⇒ Ax2 + By2 + Cz2 = D


Restando ambas ecuaciones queda

A(x1 − x2 ) + B(y1 − y2 ) + C(z1 − z2 ) = 0.


−−→
Por otro lado calculemos el producto punto entre ~n = (A, B, C) y el vector P1 P2 =
p~2 − p~1 contenido en el plano. Tenemos: < ~n, (x1 − x2 , y1 − y2 , z1 − z2 ) >= A(x1 −
−−→ −−→
x2 ) + B(y1 − y2 ) + C(x1 − x2 ). Por lo tanto < ~n, P1 P2 >= 0 y P1 P2 es un vector
cualquiera contenido en el plano. Luego, ~n = (A, B, C) ⊥ Π.

Observación 7.5.21. Sea Π : Ax + By + Cz = D ecuación general de un plano.


Sea N vector normal del plano. Sea L recta que pasa por P y de vector director ~v .
Entonces se tiene las siguientes posiciones relativas de Π y L.
i) ~v ⊥ N y P ∈ Π =⇒ L ⊆ Π.
ii) ~v ⊥ N y P ∈/ Π =⇒ L paralela a Π.
iii) Si ~v no es ortogonal a N entonces Π ∩ L es un punto. Además L será
perpendicular a Π si ~v es proporcional a N.
x−1 y−2
Ejercicio 7.5.22. Determine el valor de b para que la recta L : 3
= b
= z6 ,
no corte al plano Π : 2x − 4y + 5z = 0.

Ejercicio 7.5.23. Dada la recta L : x1 = y−2


−1
= z2 , y el plano Π : x + y + mz = n.
i) Calcular m y n para que el plano Π contenga a la recta L.
ii) Calcular m y n para que el plano Π sea paralelo a la recta L.

Ejercicio 7.5.24. Averigue la posición de L y Π para


 

 x = k x =
 3 + 6t + 9k
L= y = 1+k , Π= y= 4 + 7t + 10k ,
 
z = 3k, k ∈ R z= 5 + 8t + 11k, t, k ∈ R
 

7.5.2. Aplicación 2: Proyección escalar y ortogonal (vecto-


rial).
La proyección escalar de un vector sobre la dirección de otro vector, es el cuo-
ciente entre el producto escalar de los vectores y la norma del vector sobre el que
proyectamos ortogonalmente.
Tenemos ası́ que la proyección escalar del vector A sobre la dirección del vector
B es:
< A, B >
proy escB A =
||B||

226
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Si α es el ángulo entre A y B entonces


proy escB A
cos(θ) =
||A||
<A,B>
Sabemos además que cos(α) = ||A||||B||
. Luego,

< A, B >
proy escB A = .
||B||

Figura 7.8: Proyección

−→
Esto viene de (ver Figura 7.8) buscar t ∈ R tal que hP A, ~bi = 0. Esto es

h~a − p~, ~bi = 0 ⇔ h~a, ~bi = h~p, ~bi ⇔ h~a, ~bi = ht~b, ~bi = th~b, ~bi.
Entonces

h~a, ~bi
t= .
||b||2
Ası́ la proyección ortogonal de ~a sobre ~b es
!
h~a, ~bi~ h~a, ~bi ~b
π~b (~a) = b= .
||b||2 ||b|| ||b||

El escalar real que multiplica a la dirección de ~b capturada por el vector unitario


~b
||b||
(de norma 1), es lo que se denominta proyección escalar de A en B
< A, B >
proy escB A = .
||B||

227
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejemplo 7.5.25. Determine la proyección ortogonal de A = (1, 0, −2) sobre B =


(1, 1, 1).

h(1, 0, −2), (1, 1, 1)i 1 1 1


πB (A) = 2
(1, 1, 1) = (− , − , − )
||(1, 1, 1)|| 3 3 3
Observación 7.5.26. Note que si fija B ∈ Rn , la proyección ortogonal sobre B es
una función:

πB : Rn → Rn
< x, B >
x 7→ B.
||B||2
−−→
La imagen de πB es el subespacio hBi ≤ Rn , que es la recta con dirección OB = ~b
que pasa por el origen.
Observación 7.5.27. Finalmente, note que se tiene que la proyección ortogonal
−−→ −→
de A en B es el vector en la dirección de OB que mejor aproxima al vector OA.
Demostración. Sea ~u = λ~b y π~b (~a) = <a,b>
||b||2
b Por demostrar ||a − u|| ≥ ||a − πb (a)||.
Para ello considere

||a−u||2 = ||a−πb (a)+πb (a)−u||2 = h(a−πb (a))+(πb (a)−u), (a−πb (a))+(πb (a)−u)i.
Desarrolle y obtiene

||a − u||2 = ||a − πb (a)||2 + ||πb (a) − u||2 + 2ha − πb (a), πb (a) − ui.
Nos concentramos en el producto interno de la derecha, último sumando en la
derecha de la igualdad:
< a, b > < a, b >
ha − b, b − λbi = 0.
||b||2 ||b||2
Luego ||a − u||2 = ||a − πb (a)||2 + ||πb (a) − u||2 ≥ ||a − πb (a)||2 , pues son sumando
positivos.

7.5.3. Aplicación 3: Distancia entre un punto y una recta.


Sea P punto en el espacio y L = LQ,~v recta por Q y vector director ~v . Entonces
−→
s
2
−→ 2 −→ 2 −→ 2
q
< P Q, ~v >
d(L, P ) = ||P Q|| − (proy esc~v (P Q)) = ||P Q|| −
||~v ||
Esto resulta inmediato de la proyección ortogonal, vea la Figura 7.8.

228
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejemplo 7.5.28. Determine la distancia de P (1, 2, −1) y la recta L que une


(0, 0, 0) con (−1, 0, 2). Buscamos

h(1, 2, −1), (−1, 0, 2)i 3


π~v (P ) = 2
(−1, 0, 2) = − (−1, 0, 2).
||(−1, 0, 2)|| 5
Finalmente r
21
d=
5
Ejercicio 7.5.29. Encuentre la distacia del punto P = (1, 3, −5) a la recta L2 .
3−x y−2 z−1
L2 : = = .
−1 2 5

7.5.4. Aplicación 4: Distancia de un punto a un plano.


Distancia entre un punto y un plano. Sea P = (x1 , y1 , z1 ) punto en R3 y Π
plano con vector normal N y que contiene a un punto Q. Entonces la distancia
entre P y Π está dada por
−→
−→ | < N, QP > | |Ax1 + By1 + Cz1 + D|
d(P, Π) = proy escN QP = = √
||N || A2 + B 2 + C 2
Ejercicio 7.5.30. Encuentre la distacia del punto P y el plano Π para
i) P = (1, 1, 15
6
), Π : 4x − 6y + 12z + 21 = 0.
ii) P = (0, 0, −6), Π : x − 2y − 2z − 6 = 0

7.5.5. Aplicación 5: Distancia entre una recta y un plano.


Para calcular la distancia entre una recta L = LP,~v y un plano Π con vector
normal N = (A, B, C) y un punto Q en Π, debemos primero ver la posición relativa
entre ambos.
a) Si L ⊆ Π, entonces d(L, Π) = 0.
b) Si L y Π se cortan entonces d(L, Π) = 0.
c) Si L y Π son paralelos, entonces
−→
−→ | < N, QP > | |Ax1 + By1 + Cz1 + D|
d(L, Π) = d(P, Π) = proy escN QP = = √
||N || A2 + B 2 + C 2
Ejemplo 7.5.31. Encuentre la ecuación del plano paralelo a Π : 3x+2y−6z+7 = 0
y que diste 4 unidades de la recta

x = 1 − 2t

L = y = −1 + t

z = −t, t ∈ R

229
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Solución. Veamos primero la posición relativa entre ambos. Reemplazando


x = 1 − 2t, y = −1 + t, z = −t en la ecuación del plano tenemos 3(1 − 2t) + 2(−1 +
t) + 6t + 7 = 0, de donde, 3 − 6t − 2 + 2t + 6t + 7 = 0, es decir 2t = −8, y t = −4.
Luego Π y L se cortan en el punto (9, −5, 4) y su distancia no puede ser 4. Luego
no hay plano paralelo a Π cuya distancia a L sea de 4 unidades.

7.5.6. Aplicación 6: Distancia entre dos rectas.


Para estudiar la distancia entre L1 , L2 , debemos primero ver la posición relativa
entre ambas.
i) Si las dos rectas se cortan o son coincidentes, entonces d(L1 , L2 ) = 0.
ii) Si las dos rectas son paralelas, entonces d(L1 , L2 ) es igual a la distancia de
cualquier punto de una de las rectas a la otra, ya visto.
iii) Si las dos rectas se cruzan el procedimiento a seguir es el siguiente: se
encuentra un plano Π que contenga a la recta L1 y sea paralelo a L2 . Entonces la
distancia entre las dos rectas es la misma que d(L2 , Π), es decir, la distancia entre
un punto de la recta L2 y el plano Π. Si Q es un punto de L2 , P es un punto de
L1 , y N vector normal de Π entonces
−→
−→ | < QP , N > |
d(L1 , L2 ) = d(L2 , Π) = d(Q, Π) = proy escN QP = .
||N ||
y−3
Ejercicio 7.5.32. Calcular la distancia entre las rectas L1 : x = 2
= z − 2, L2 :
x − 3 = y+1
2
= z − 2.
Ejemplo 7.5.33. Encuentre la distancia entre la recta L1 que pasa por P =
(2, 0, −1) y con vector director ~v = (3, 2, −2) y la recta L2 : x1 = y−1
−3
= z2 .
Solución. Veamos primero la posición relativa entre ambas rectas. Tenemos que
L1 = LP,~v , donde P = (2, 0, −1) y ~v = (3, 2, −2). Además L2 = LQ,w~ , donde Q =
−→
~ = (1, −3, 2). P Q = (−2, 1, 1). Si M = (~v , w)
(0, 1, 0) y w ~ entonces rango(M ) = 2
−→
y rango(M |P Q) = 3, luego las rectas se cruzan. Por lo tanto, debemos encontrar
plano Π que contenga a la recta L1 y sea paralelo a L2 , y si N es el vector normal
de Π −→
| < P Q, N > |
d(L1 , L2 ) = d(L2 , Π) = d(Q, Π) = .
||N ||
Como L1 ⊆ Π, tenemos que P está en Π y ~v es uno de sus vectores directores.
Como queremos que Π sea paralelo a L2 tomemos a w ~ como el otro vector director.
Ası́ la ecuación paramétrica del plano Π es

x = 2 + 3t + k

Π = y = 2t − 3k

z = −1 − 2t + 2k, t, k ∈ R

230
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Necesitamos la ecuación implı́cita del plano. Debemos eliminar los parámetros


t y k en el sistema
(1) x = 2 +3t +k
(2) y = +2t −3k
(3) z = −1 −2t +2k
Sumando las ecuaciones (2) y (3) obtenemos la ecuación
(4) y + z = −1 − k
Mutiplicando la ecuación (1) por 2 y la (3) por 3 y sumándolas obtenemos la
ecuación
(5) 2x + 3z = 1 + 8k
Multiplicando la ecuación (4) por 8 y sumándola a la ecuación (5) tenemos 2x +
8y + 11z = −7, que es la ecuación implı́cita de Π. Ası́ N = (2, 8, 11) y
−→
| < P Q, N > | | < (−2, 1, 1), (2, 8, 11) > | 15
d(L1 , L2 ) = d(L2 , Π) = d((0, 1, 0), Π) = = =√ .
||N || ||(2, 8, 11)|| 189

7.5.7. Aplicación 7: Distancia entre dos planos.


Para estudiar la distancia entre Π1 , Π2 , debemos primero ver la posición relativa
entre ambos. Distinguimos dos casos
i) Si los dos planos se cortan o son el mismo, entonces d(Π1 , Π2 ) = 0.
ii) Si los dos planos son paralelos, entonces d(Π1 , Π2 ) = d(P, Π2 ) = d(Q, Π1 )
donde P es un punto de Π1 y Q es un punto de Π2 .

Ejercicio 7.5.34. Encuentre la distacia entre los planos Π1 y Π2 para


i) Π1 : 2x− y + 2z + 9 = 0, Π2 : 4x − 2y + 4z − 21 = 0.
x = 2 − t − k

ii) Π1 = y = k , Π2 : x + y + z = 25 .

z = t, t, k ∈ R

7.6. Producto cruz o vectorial en R3.


El producto cruz de dos vectores es un nuevo vector que será ortogonal a ambos
y por lo tanto al plano que los contiene. Veremos su aplicación en el cálculo de áreas
de paralelógramos y de triángulos.
Consideremos los vectores canónicos ~i = (1, 0, 0), ~j = (0, 1, 0), ~k = (0, 0, 1) en
3
R . Tienen las siguientes propiedades

1. Son unitarios, es decir, ||~t|| = 1 ∀ t = i, j, k.

2. ∀ i 6= j, ~i ⊥ ~j.

231
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

3. Son generadores de R3 , es decir, ∀ (x, y, z) ∈ R3 , (x, y, z) = x~i + y~j + z~k.


Además esta expresión es única, en el sentido x~i + y~j + z~k = a~i + b~j + c~k =⇒
x = a, y = b, z = c. Por cumplir ambas propiedades se dice que {~i, ~j, ~k} es
una base del espacio vectorial R3 , se le llama también base canónica de R3 .
a b
Dados a, b, c, d ∈ R usaremos la notación = ad − bc ∈ R, con esto
c d
definiremos el producto cruz de dos vectores.

Definición 7.6.1. Sean A = (a1 , a2 , a3 ), B = (b1 , b2 , b3 ) dos vectores en R3 . Se


define el producto cruz o vectorial de A y B como
~i ~j ~k
a2 a3 ~ a1 a3 ~ a1 a2 ~
A×B = a1 a2 a3 = i− j+ k
b2 b3 b1 b3 b1 b2
b1 b 2 b3

Es decir el producto cruz de A y B es el vector


 
a2 a3 a1 a3 a1 a2
A×B = ,− ,
b2 b3 b1 b3 b1 b2

= (a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 ) ∈ R3 .

Ejercicio 7.6.2. Calcule el producto vectorial de A = (1, 4, −2) y B = (0, 2, 5) y


compruebe que A × B ⊥ A, A × B ⊥ B.

Ejercicio 7.6.3. Demuetre


~i × ~j = ~k, ~j × ~k = ~i, ~k × ~i, ~j.

Ası́ hemos definido una función × : R3 × R3 −→ R3 , (A, B) ⇒ A × B

Proposición 7.6.4. Se tienen las siguientes propiedades:

1. ∀ A, B ∈ R3 , A × B ⊥ A, A × B ⊥ B.

2. ∀ A, B ∈ R3 , A × B = −B × A, anticonmutatividad.

3. ∀ A ∈ R3 , A × A = 0.

4. ∀ α ∈ R, ∀ A, B ∈ R3 , α(A × B) = (αA) × B = A × (αB).

5. ∀ A, B, C ∈ R3 , A × (B + C) = A × B + A × C, (A + B) × C = A × C + B × C.

Ejercicio 7.6.5. Encuentre la ecuación del plano que pasa por los puntos P =
(2, 2, 1), Q = (6, 1, −1) y R = (0, −2, −1). Use producto cruz.

232
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Ejercicio 7.6.6. Encuentre la ecuación


 del plano Π que pasa por el punto P =
x = 3 − t

(1, 3, 2) y es paralelo a la recta L : y = 2 + t

z = −2 − 3t, t ∈ R,

Ejercicio 7.6.7. Dados P = (3, 5, −1) y la recta L : x−12


= y+2
1
= z+1
4
, encuentre
−→
un punto Q ∈ L talque el vector P Q es paralelo al plano Π : 3x − 2y + z + 5 = 0.
−→
Solución. Sea N = (3, −2, 1) vector normal del plano Π. Para que P Q sea
−→
paralelo al plano Π, P Q ⊥ N. Queremos entonces t tal que Q = (1 + 2t, −2 +
−→ −→
t, −1 + 4t), P Q = (−2 + 2t, −7 + t, 4t) ⊥ (3, −2, 1). Tenemos entonces P Q ⊥ N
−→
luego, 0 = < P Q, N >= (−2 + 2t)3 + (−7 + t)(−2) + (4t) = 8 + 8t. De donde
t = −1 y el punto buscado es Q = (1 − 2, −2 − 1, −1 − 4) = (−1, −3, −5).
Ejercicio 7.6.8. Dadas las rectas

x = 3 − 5t
( 
x−y−z+3= 0
L1 = , L2 = y = −2t
4x − z + 1 = 0 
z = t − 2, t ∈ R.

i) Encontrar los planos Π1 , Π2 paralelos entre sı́ tales que Π1 contenga a L1 y


Π2 contenga a L2 .
ii) Calcular d(Π1 , Π2 ).
(
Π1 : A1 x + B1 y + C1 z + D1 = 0
Observación 7.6.9. Si la recta se expresa como L =
Π2 : A2 x + B2 y + C2 z + D2 = 0
entonces podemos tomar su vector director ~v = N1 × N2 pues como L ⊆ Π1 y
L ⊆ Π2 entonces ~v ⊥ N1 y ~v ⊥ N2 .
Ejemplo 7.6.10. Encuentre la ecuación paramétrica de la recta
(
2x − y + 2z − 3 = 0
L=
x + y + 3z + 5 = 0
Solución. Sea Π1 : 2x − y + 2z − 3 = 0, Π2 : x + y + 3z + 5 = 0. Tenemos que
~v = N1 × N2 = donde N1 = (2, −1, 2), N2 = (1, 1, 3). Luego
 
−1 2 2 2 2 −1
N1 × N2 = ,− , = (−5, −4, 3)
1 3 1 3 1 1
Nos falta un punto de la recta. Encontremos un punto en la intersección de los
planos.
2x −y +2z −3 = 0
x +y +3z +5 = 0

233
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Sumando ambas ecuaciones nos queda 3x + 5z + 2 = 0. Si hacemos x = 0, tenemos


z = − 25 . Usando la segunda ecuación nos queda y = −x − 3z + 5 = 56 + 5 = 31
5
.
31 2
Ası́, P = (0, 5 , − 5 ). Entonces la ecuación paramétrica de L es

x = −5t

L = y = 31
5
− 4t
 2
z = − 5 + 3t, t ∈ R

Ejercicio 7.6.11. ∀ A, B, C ∈ R3 , pruebe que A × (B × C) + B × (C × A) + C ×


(A × B) = 0. Se llama identidad de Jacobi.

Ejercicio 7.6.12. Pruebe que ∀ A, B ∈ R3 se tiene la siguiente identidad:

< A, B >2 +||A × B||2 = ||A||2 ||B||2 .

Proposición 7.6.13. ∀ A, B ∈ R3 , ||A × B|| = ||A||||B|| sen(θ) donde θ es el


ángulo entre los vectores A y B.

Demostración. Como θ es el ángulo entre los vectores A y B, 0 ≤ θ ≤ π, cos(θ) =


<A,B>
||A||||B||
. Usando esto de la identidad anterior se tiene que ||A×B||2 = ||A||2 ||B||2 − <
A, B >2 = ||A||2 ||B||2 − ||A||2 ||B||2 cos2 (θ) = ||A||2 ||B||2 sen2 (θ). Luego ||A × B|| =
||A||||B||| sen(θ)|, pero 0 ≤ θ ≤ π, luego ||A × B|| = ||A||||B|| sen(θ.
Propiedades geométricas del producto cruz.

Proposición 7.6.14. 1. Sean A, B ∈ R3 − {0} vectores no proporcionales. En-


tonces al área del paralelógramo que ellos definen es ||A × B|| unidades cua-
dradas.

2. Sean A, B, C ∈ R3 − {0} vectores no coplanares con el origen, es decir no


existe un plano que pase por el origen y que contenga a los tres vectores.
Entonces al volumen del paralelepı́pedo que ellos definen es | < A × B, C > |
unidades cúbicas.

Demostración. 1. Sea θ el ángulo entre los vectores A y B. Sea O punto común.

234
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

El área del paralelógramo formado por A y B es dos veces el área del triángulo
OAB. Luego, área del paralelógramo = 2 · 12 · base · altura = ||B|| · h =
||B||||A|| sen(θ) = ||A × B||. Luego el área pedida es ||A × B|| unidades cuadradas.
2. El volumen de un paralelepı́pedo es V = área de la base · altura.

Sabemos que A × B es un vector ortogonal a A y a B y por la parte 1. el


área de la base es ||A × B||. Sea H la altura del paralelepı́pedo. Si llamamos ϕ
<A×B,C>
el ángulo entre A × B y C entonces H = |proy escA×B C| = ||A×B||
. Luego

<A×B,C>
V = ||A × B|| · H = ||A × B|| ||A×B||
= | < A × B, C > |. Luego, el volumen es
V = | < A × B, C > | unidades cúbicas.

Observación 7.6.15. Para calcular la distancia de un punto P a una recta L =


−−→
LQ,~v podemos usar el producto cruz. En efecto, d(P, L) = ||~v×||~vP||Q||

Definición 7.6.16. Se llama producto mixto o producto triple o producto caja de


A, B, C ∈ R3 al escalar [A, B, C] = < A × B, C > .

Proposición 7.6.17. Se tienen las siguientes propiedades:

1. ∀ A, B, C ∈ R3 , [A, B, C] =< A, B × C > .

2. ∀ A, B ∈ R3 , [A, A, B] = [A, B, A] = [B, A, A].

Demostración. Veamos 1.
 
a2 a3 a1 a3 a1 a2
[A, B, C] =< A×B, C >=< ,− , , (c1 , c2 , c3 ) >
b2 b3 b1 b3 b1 b2

a2 a3 a1 a3 a1 a2
= c− c+ c = a2 b3 c1 −a3 b2 c1 −a1 b3 c2 +a3 b1 c2 +a1 b2 c3 −a2 b1 c3
b2 b3 1 b1 b3 2 b1 b2 3
= a1 b2 c3 −a1 b3 c2 −a2 b1 c3 +a2 b3 c1 +a3 b1 c2 −a3 b2 c1 = a1 (b2 c3 −b3 c2 )−a2 (b1 c3 −b3 c2 )+a3 (b1 c2 −b2 c1 )

235
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

 
b2 b 3 b1 b3 b1 b2
=< (a1 , a2 , a3 ), ,− , =< A, B × C > .
c2 c3 c1 c3 c1 c2
2.- [A, A, B] = 0 se obtiene de la definición y del hecho que A × A = 0.
[A, B, A] = < A × B, A >= 0 pues A × B ⊥ A.
Usando 1. [B, A, A] =< B, A × A >= 0, pues A × A = 0.

Observación 7.6.18. ∀ A, B, C ∈ R3 , se tiene que

< A × B, C > = < A, B × C > .

Ejercicio 7.6.19. Pruebe que ∀ A, A0 B, C ∈ R3 , α, β ∈ R, se tiene

1. [αA + βA0 , B, C] = α[A, B, C] + β[A0 , B, C].

2. [A, αB + βA0 , C] = α[A, B, C] + β[A, A0 , C]

3. [A, B, αC + βA0 ] = α[A, B, C] + β[A, B, A0 ]

Ejercicio 7.6.20. ∀ A, B, C ∈ R3 , pruebe que


i) [A, B, C] = [B, C, A] = [C, A, B]. El producto mixto es cı́clico.
ii )[A, B, C] = −[B, A, C] = −[C, B, A] = −[A, C, B]. Si se permutan dos
vectores el producto mixto cambia de signo.

Ejercicio 7.6.21. Se conocen tres vértices A, B, C de un paralelepı́pedo. Calcular


el vértice que falta. ¿Cuántas soluciones hay?

Ejercicio 7.6.22. Hallar el volumen del paralelepı́pedo sabiendo que A = (8, 0, 0), B =
(0, 8, 0), C = (0, 0, 8) y E = (8, 8, 8). Calcule los demás vértices.

Definición 7.6.23. En un paralelepı́pedo se pueden formar 6 tetraedros (pirámides


de bases triangulares). El volumen de un tetraedro es un sexto del volumen de un
paralelepı́pedo

Ejercicio 7.6.24. Hallar el volumen del tetraedro de vértices A = (1, 1, 1), B =


(1, 2, 3), C = (2, 3, 1), D = (3, 1, 2).

236
Capı́tulo 8

Anexo: Representación matricial


de transformaciones lineales.

Este capı́tulo trata de la introducción de coordenadas en un espacio vectorial


de dimensión finita. Incluye temas tomados de los apuntes de álgebra lineal de G.
Lucchini. Recordemos primero algunas cosas de transformaciones lineales.

8.1. Núcleo e Imagen


La utilidad de las transformaciones lineales es que nos permiten comparar dis-
tintos espacios vectoriales. Para lograr una comparación refinada, las nociones de
núcleo e imagen de una transformación lineal son esenciales.
Definición 8.1.1. Sean V, W K-espacios vectoriales y sea T : V → W una trans-
formacı́on K-lineal. Definimos el núcleo de T y denotamos por Ker T el conjunto

Ker T = {v ∈ V | T (v) = 0}.

Definimos la imagen de T y denotamos por Im T o T (V ) el conjunto

Im T = {w ∈ W | ∃ v ∈ V, T (v) = w}.

Veamos ante todo que se trata de subespacios y no tan solo de subconjuntos:


Proposición 8.1.2. Sean V, W K-espacios vectoriales y sea T : V → W una
transformaciı́on K-lineal. Entonces Ker T ≤ V e Im T ≤ V .
Demostración. Notemos ante todo que tanto Ker T como Im T son no vacı́os ya
que T (0V ) = 0W y por ende 0V ∈ Ker T y 0W ∈ Im T .
Sean ahora x, y ∈ Ker T y sea α ∈ K. Entonces

T (αx + y) = αT (x) + T (y) = α · 0 + 0 = 0,

237
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

por lo que αx + y ∈ Ker T .


Por último, sean x, y ∈ Im T y sea α ∈ K. Entonces existen x0 , y 0 ∈ V tales que
T (x0 ) = x y T (y 0 ) = y. De esto deducimos que

T (αx0 + y 0 ) = αT (x0 ) + T (y 0 ) = αx + y,

por lo que αx + y ∈ Im T ya que αx0 + y 0 ∈ V .


El núcleo nos permite saber por ejemplo si una función es inyectiva. En efecto,
Ker T no es más que la preimagen del 0, por lo que alguna relación tiene con la
inyectividad. Es la linealidad la que hace que esta información sea suficiente.

Proposición 8.1.3. Sean V, W K-espacios vectoriales y sea T : V → W una


transformacı́on K-lineal. Entonces T es inyectiva si y sólo si Ker T = {0}.

Demostración. Supongamos que T es inyectiva. Entonces 0W puede tener tan sólo


una preimagen, lo que implica que Ker T posee tan sólo un elemento. Pero ya
sabemos que 0V ∈ Ker T , por lo que {0V } = Ker T .
Supongamos ahora que Ker T = {0}. Sean entonces x, y ∈ V tales que T (x) =
T (y). Usando la linealidad de T tenemos que

0 = T (x) − T (y) = T (x − y).

En otras palabras, x − y ∈ Ker T . Pero como Ker T = {0}, tenemos que x − y = 0,


es decir x = y, lo que prueba la inyectividad de T .
Veamos ahora qué nos pueden decir estos subespacios sobre la dimensión de V
y W:

Teorema 8.1.4 (Teorema del rango). Sean V, W K-espacios vectoriales de dimen-


sión finita y sea T : V → W una transformaciı́on K-lineal. Entonces

dimK V = dimK Ker T + dimK Im T.

Observación 8.1.5. Para hacer intervenir la dimensión de W en alguna fórmula,


se necesita la noción de co-núcleo, pero no la estudiaremos por ahora.

Demostración. Sea {v1 , . . . , vn } una base de Ker T . Podemos completar esta base
a una base
B1 = {v1 , . . . , vn , vn+1 , . . . , vm } de V.
Para probar la fórmula, bastará con probar que Im T admite una base con m − n
elementos. Afirmamos pues que el conjunto

B2 = {T (vn+1 ), . . . , T (vm )},

238
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

es una base de Im T .
Demostremos primero que Im T = hB2 i. Sea x ∈ Im T y sea entonces x0 ∈ V
tal que T (x0 ) = x. Como B1 es una base de V , podemos escribir
m
X
0
x = αi vi ,
i=1

por lo que !
m
X m
X
0
x = T (x ) = T αi vi = αi T (vi ).
i=1 i=1

Pero como v1 , . . . , vn ∈ Ker T , tenemos que T (vi ) = 0 para 1 ≤ i ≤ n, por lo que


finalmente tenemos m
X
x= αi T (vi ),
i=n+1

lo que prueba que x ∈ hB2 i y por lo tanto Im T = hB2 i.


Probemos ahora que B2 es LI. Consideremos una combinación lineal
m
X
αi T (vi ) = 0.
i=n+1

Tenemos entonces !
m
X m
X
T αi v i = αi T (vi ) = 0,
i=n+1 i=n+1

por lo que m
P
i=n+1 αi vi ∈ Ker T . Ahora, sabiendo que {v1 , . . . , vn } es una base de
Ker T , tenemos que existen βi ∈ K tales que
m
X n
X
αi vi = βi vi ,
i=n+1 i=1

o bien n m
X X
(−βi )vi + αi vi = 0.
i=1 i=n+1

Pero esto es una combinación lineal de los vectores de B1 , que es un conjunto LI.
Vemos pues que todos los αi (y los βi ) son nulos. Esto prueba que B2 es LI.
Este resultado nos lleva a la definición de rango de una transformación lineal,
el cual debe ser interpretado como el alcance que tiene ésta. En otras palabras, el
rango mide el tamaño de la imagen.

239
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Definición 8.1.6. Sean V, W K-espacios vectoriales y sea T : V → W una trans-


formaciı́on K-lineal. Llamamos rango de T al entero rg T := dimK (Im T ). Llama-
mos nulidad de T al entero nulT := dimK (Ker T ).
De esta manera, el Teorema 8.1.4 nos dice que, para toda transformaciı́on K-
lineal T : V → W ,
dimK V = rg T + nulT.

8.2. Transformaciones lineales y matrices


Las matrices aparecen de forma natural como una manera de condensar la in-
formación oculta en una transformación lineal, de la misma manera que las bases
condensan la información de un espacio vectorial. En esta sección veremos en deta-
lle esta relación. Notemos que, para todo n ∈ N existe una forma natural de ver K n
como vectores columna. En otras palabras, podemos identificar K n con Mn×1 (K).
haremos esto en todo lo que sigue.

Sea A = (aij ) ∈ Mm×n (K) una matriz y sea F (A) el subespacio de K n generado
por las filas de A, es decir

F (A) = hF1 , . . . , Fm i, con Fi = (ai1 , . . . , ain ).

Sea C(A) el subespacio de K m generado por las columnas de A, es decir:

C(A) = hC1 , . . . , Cn i, con Ci = (a1i , . . . , ami ).

A la matriz A le podemos asociar una transformación lineal T : K n → K m y estos


subespacios serán útiles para su estudio.
Definimos T de la siguiente manera: Si x = (x1 , . . . , xn ) ∈ K n , entonces

T (x) := Ax
(viendo a x y a Ax como vectores columna).
Veamos primero el núcleo de esta transformación. Se trata de

Ker T = {x = (x1 , . . . , xn ) ∈ K n | Ax = 0},

y esto es el espacio de soluciones del sistema de ecuaciones homogéneo

a11 x1 + a12 x2 + · · · + a1n xn = 0,


a21 x1 + a22 x2 + · · · + a2n xn = 0,
..
.
am1 x1 + am2 x2 + · · · + amn xn = 0,

240
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

el cual denotamos por S. Recordemos ahora el siguiente resultado (que ya deberı́a


ser fácil de demostrar a estas alturas del curso ^):
¨

Ejercicio 8.2.1. Sea V un K-espacio vectorial y sean v1 , . . . , vn ∈ V vectores no


nulos. Pruebe que, para todo α1 , . . . , αn ∈ K con α1 6= 0,
* n +
X
hv1 , . . . , vn i = αi vi , v2 , . . . , vn .
i=1

Este ejercicio deberı́a recordarnos como se resuelven los sistemas como el de


más arriba. En efecto, lo único que hacemos en el proceso de pivoteo es reempla-
zar una fila de A por una combinación lineal de éstas, pero a la fila original la
multiplicamos por un coeficiente no nulo (usualmente el inverso del número que
queremos transformar en un pivote). En otras palabras, el ejercicio nos dice que el
subespacio F (A) = hF1 , . . . , Fm i es igual al subespacio generado por las filas de la
matriz escalonada. Recordemos ahora que:

Definición 8.2.2. Sea A = (aij ) ∈ Mm×n (K) como acá arriba. El rango de la
matriz A es el número rg A de filas no nulas en su matriz escalonada.

Ya demostramos que la dimensión del espacio generado por las filas es igual a la
dimensión del generado por las columnas de A. entonces el rango de A corresponde
a la dimensión de la imagen de la transformación lineal asociada.

Teorema 8.2.3. El rango de A es igual al rango de T y al rango de las filas y de


las columnas de A.

Vemos entonces que las nomenclaturas coinciden (y esto no es para nada una
coincidencia). Para probar el teorema, recordemos de antemano otro resultado (que
también deberı́a ser fácil de demostrar a estas alturas ^):
¨
Demostración. Sea r el rango de A. Ya recordamos quer corresponde al número de
filas no nulas de la matriz escalonada asociada. Usando uno de los ejercicios de más
arriba, vemos que la dimensión del espacio generado por estas filas es precisamente
r ya que son LI. Pero ya notamos más arriba también que este espacio no es más
que F (A), por lo que dimK F (A) = r y por lo tanto el rango de las filas de A es r
también.
Ahora, usando el tercer ejercicio de más arriba, vemos que la dimensión del
espacio solución S del sistema homogéneo asociado a A es n − r. Pero este espacio
solución no es más que el núcleo de T , como ya vimos. Tenemos entonces que
dimK Ker T = n − r. Usando finalmente el teorema del rango vemos entonces que

n = dimK K n = dimK Ker T + rg T = n − r + rg T,

241
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

por lo que el rango de T es r también.


Falta tan sólo el rango de las columnas de A. Para ver este último caso, notemos
que los vectores C1 , . . . , Cn corresponden a las imágenes de los vectores e1 , . . . , en
de la base canónica de K n (esto se ve de inmediato mutiplicando explı́citamente A
por ei ). Ahora, ya sabemos que dimK Im T = rg T = r. Pero también tenemos que
Im T = hC1 , . . . , Cn i, ya que si v ∈ Im T , entonces v = T (x) para x = (x1 , . . . , xn ) ∈
K n y por lo tanto

v = T (x) = T (x1 e1 + · · · + xn en ) = x1 T (e1 ) + · · · xn T (en ) = x1 C1 + · · · xn Cn .

Vemos entonces que dimK T es también el máximo de vectores LI entre las columnas
de la matriz A. En otras palabras, el rango de las columnas de A es igual a dimK T =
r.

La matriz asociada a una transformación lineal Ya vimos como asociar una


transformación lineal T : K n → K m a una matriz A ∈ Mm×n (K). La matriz con-
densaba información de la siguiente manera: en sus columnas tenı́amos escritas las
imágenes de la base canónica de K n , siendo estas columnas vistas como vectores en
K m . La coordenada aij de la matriz a, que correponde a la i-ésima fila y la j-ésima
columna, nos dice entonces precisamente cual es la coordenada i-ésima (en la base
canónica de K m ) de la imagen del j-ésimo vector de la base canónica de K n . Esta
observación se generaliza sin problemas a espacios vectoriales de dimensión finita
con una base arbitraria, como veremos ahora.

Sean V, W K-espacios vectoriales de dimensión finita y sea T : V → W una


transformaciı́on K-lineal. Sean n = dimK V , m = dimK W y sean

BV = {v1 , . . . , vn } y BW = {w1 , . . . , wm },

bases respectivas de V y W . Como T (vj ) ∈ W para cada P j y BW es una base de


W , tenemos que existen únicos aij ∈ K tales que T (vj ) = ni=1 aij wi .

Definición 8.2.4. La matriz


 
a11 a12 · · · a1n
A =  ... .. .. ..  ∈ M
m×n (K),

. . . 
am1 am2 · · · amn

se llama la matriz asociada a T con respecto a las bases BV y BW y se anota [T ]B


BV .
W

242
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Pn
Nótese que, si x ∈ V , entonces x = i=1 αj vj con αj ∈ K. Por lo tanto

n
! n n m
!
X X X X
T (x) = T αj vj = αj T (vj ) = αj aij wi
j=1 j=1 j=1 i=1
n
XXm m X
X n
= αj aij wi = (αj aij )wi .
j=1 i=1 i=1 j=1

En particular, para x = vj , recuperamos T (vj ) = ni=1 aij wi , lo que nos dice que
P
las columnas de A corresponden a las coordenadas de los T (vj ) en la base BW , es
decir, lo mismo que tenı́amos en la construcción anterior.
Definición 8.2.5. Sea B = {v1 , . . . , vn } una base de V y v ∈ V tal que v =
x1 v1 + . . . xn vn . El vector coordenado de v en la base B es:
 
x1
[v]B =  ... 
 
xn

Lo dicho antes, se escribirán generalmente como vectores fila, pero se entenderá


que son columna cuando sea necesario y según el contexto.
Ejemplo 8.2.6.  El vector coordenado de 10 + 3t − 5t2 ∈ R2 [t] en la base {1, 1 +
2
2
t, 1 − t } es  3 . Pero en la base {1, t, t2 } es (10, 3, −5)t .
5
Ejercicio 8.2.7. Sean u, v ∈ V y B una base de V . Demuestre

[u + v]B = [u]B + [v]B .

[αu]B = α[u]B .

{u1 , . . . , um } es L.I. si y sólo si {[u1 ]B , . . . , [um ]B } es L.I. como subconjunto


de K n con n = dimV .

u ∈ h{u1 , . . . , um }i si y sólo si [u] ∈ h{[u1 ]B , . . . , [um ]B }i.

Ejemplo 8.2.8. Consideremos la transformación lineal T : R3 → R2 definida por

T (x, y, z) = (x + y, 2z − x) ∀ x, y, z ∈ R,

y las bases
B1 la base canónica de R3 ;

243
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

B2 la base canónica de R2 ;
B10 = {v1 , v2 , v3 } con v1 = (1, 0, −1), v2 = (1, 1, 1), v3 = (1, 0, 0);
B20 = {w1 , w2 } con w1 = (0, 1), w2 = (1, −1).
Entonces (el ejercicio es que verifique esto que sigue ^):
¨
 
B2 1 1 0
[T ]B1 = ,
−1 0 2
 
1 2 1
[T ]B
B10 =
2
,
−3 1 −1
 
B0 −2 3 0
[T ]B20 = .
1 1 2 1
B0
Además verifique que [T (v)]B20 = [T ]B20 · [v]B10 , y todas las combinaciones de
1
bases y coordenadas que se le ocurran.

La relación entre transformaciones lineales y matrices es, como vemos, muy


estrecha. En efecto, las transformaciones lineales, como las matrices, tienen una
estructura natural de espacio vectorial.
Definición 8.2.9. Sean V, W K-espacios vectoriales. Definimos:
HomK (V, W ) := {T : V → W | T K-lineal}.
Se trata de un K-espacio vectorial para la suma y mutiplicación por escalar natural
¨ es decir, para T1 , T2 ∈ HomK (V, W ) y α ∈ K:
de funciones (¡ejercicio! ^),
(T1 + T2 )(v) = T1 (v) + T2 (v) para todo v ∈ V ;
(αT1 )(v) = α · T1 (v) para todo v ∈ V .
También definimos EndK (V ) como HomK (V, V ). A estas transformaciones lineales
se les suele llamar endomorfismos.
El hecho de que las matrices codifican completamente a las transformaciones
lineales como acabamos de verificar queda plasmado en el siguiente resultado.
Proposición 8.2.10. Sean V, W K-espacios vectoriales de dimensiones respectivas
n y m y sean BV y BW bases respectivas de V y W . Entonces la aplicación
ϕ : HomK (V, W ) → Mm×n (K)
T 7→ [T ]B
BV ,
W

es K-lineal y biyectiva.

244
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

La demostración no es complicada, es más bien técnica. La dejaremos para


álgebra lineal.

Ejercicio 8.2.11. Sea T : R2 → R3 la transformación R-lineal definida por la


matriz  
−1 5
A =  2 −3 ∈ M3×2 (R),
1 4
respecto de las bases canónicas de R2 y R3 .

1. Encuentre T (x, y) para todo (x, y) ∈ R2 .

2. Describa Ker T e Im T .

Ejercicio 8.2.12. Considere las transformaciones R-lineales U : R2 → R2 :


(x, y) 7→ (y, x) y T : R3 → R2 : (x, y, z) 7→ (2x, y + z).

1. Encuentre (U ◦ T )(x, y, z) para todo (x, y, z) ∈ R3 .

2. Calcule [U ◦ T ]B
B1 , donde B1 = {(1, 1, 1), (−1, 0, 1), (0, 0, 2)} es una base de
2

R y B2 es la base canónica de R2 .
3

3. Calcule [U ]B B2 B2
B2 · [T ]B1 . ¿Cuál es la relación con [U ◦ T ]B1 ?
2

Este último ejercicio nos insinúa que la biyección no sólo respeta la suma y la
multiplicación por escalar, sino que también un segundo tipo de multiplicación:

Proposición 8.2.13. Sean V, W, X K-espacios vectoriales de dimensión finita y


sean BV , BW , BX bases respectivas. Sean T : V → W y U : W → X transforma-
ciones K-lineales. Sean A = [T ]B BX
BV y B = [U ]BW . Sea U ◦ T la composición de
W

funciones, i.e. (U ◦ T )(v) = U (T (v)) ∀ v ∈ V . Entonces U ◦ T : V → X es una


transformación K-lineal y
[U ◦ T ]B
BV = B · A,
X

donde B · A es el producto matricial clásico.

Es decir, la composición de transformaciones se traduce en la multiplicación de


las matrices correspondientes. Cuidado con las bases usadas. Nuevamente, dejare-
mos la demostración para álgerba lineal. Si alguien quiere verla, favor consultar.
Aquı́ queremos saber ocupar estos resultados para tener soltura con los ejemplos.
Una aplicación inmediata de esta proposición es el siguiente resultado:

Corolario 8.2.14. Sea V un K-espacio vectorial de dimensión n, B una base de


V y sea T : V → V una transformación K-lineal. Entonces T es invertible si y
sólo si la matriz [T ]B
B es invertible.

245
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Recordemos que una función f : V → V se dice invertible si existe una segunda


función g : V → V tal que f ◦g = g ◦f = idV . En el caso de las transformaciones li-
neales, esto corresponde a un isomorfismo. Por otro lado, una matriz A ∈ Mn×n (K)
es invertible si existe una segunda matriz B ∈ Mn×n (K) tal que A · B = B · A = I,
donde In representa la matriz identidad n × n.
Demostración. Basta con usar la Proposición 8.2.13 con V = W = X y B = BV =
BW = BX para ver que, para toda transformación lineal U : V → V ,

[U ◦ T ]B B B
B = [U ]B · [T ]B y [T ◦ U ]B B B
B = [T ]B · [U ]B .

Por otra parte, es un ejercicio fácil ver que, para toda base B de V ,

[idV ]B
B = In .

Entonces, si T es invertible, existe U : V → V K-lineal tal que T ◦ U = U ◦ T =


idV , por lo que [T ]B B B B B
B · [U ]B = [U ]B · [T ]B = In , probando que [T ]B es invertible.
B
Si por el contrario asumimos que [T ]B es invertible, entonces existe una matriz
A ∈ Mn×n tal que [T ]B B
B · A = A · [T ]B = In . Usando la biyección ϕ entre matrices
y transformaciones lineales, sabemos que existe U : V → V K-lineal tal que
[U ]B B B
B = A. Vemos entonces inmediatamente que [U ◦ T ]B = [T ◦ U ]B = In , lo que
prueba que U ◦ T = T ◦ U = idV por inyectividad de ϕ.

8.2.1. Cambio de base


Acabamos de ver como las matrices nos ayudan a entender las transformaciones
lineales T : V → W . Sin embargo, para lograr esto, tuvimos que fijar bases de V
y W . Cabe preguntarse entonces sobre lo que ocurre cuando cambiamos alguna de
estas bases (o ambas). De esto se trata esta sección.
Durante toda la sección asumiremos que los espacios vectoriales son de dimen-
sión finita.

Comencemos con una transformación lineal T : V → V en un K-espacio vec-


torial V de dimensión n. Sean

B = {v1 , . . . , vn } y B 0 = {v10 , . . . , vn0 },


0
dos bases de V . Nos gustarı́a relacionar [T ]B B
B y [T ]B 0 . Consideremos pues la escritura
de los vj0 ∈ B 0 en la base B:
n
X
vj0 = pij vi , ∀ 1 ≤ j ≤ n.
i=1

246
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Definición 8.2.15. Definimos la matriz de cambio de base de B 0 a B como la


matriz P := (pij ).
0
Observación 8.2.16. Nótese que P = [idV ]B B 0 . En efecto, la imagen de vj con
respecto a idV es precisamente vj0 . Pero este vector, escrito en la base B, tiene por
coordenadas los pij por definición. Esto justifica el nombre de la matriz P : ella “no
le hace nada a V ”, pero cambia la base.
Un corolario natural de esta observación es que la matriz P es invertible, ya
0
que idV lo es. En efecto, su inversa es P −1 = [idV ]B B , ya que
0 0
[idV ]B B B
B [idV ]B 0 = [idV ]B 0 = In .

Ejemplo 8.2.17. Retome el ejemplo 8.2.6 en R2 [t] con bases B1 = {1, 1 + t, 1 − t2 }


y B2 = {1, t, t2 }. La matriz cambio de base es
 
1 1 1
PBB12 =  0 1 0 
0 0 −1
Se verifica que
     
1 1 1 2 10
 0 1 0 · 3 = 3 
0 0 −1 5 −5
Esto es, tanto (2, 3, 5) como (10, 3, −5) son las coordenadas del mismo elemento
10 + 3t − 5t2 ∈ R2 [t] sólo que en las bases B1 y B2 respectivamente. Por eso se
relacionan via P . ¿Quien es el elemento de R2 [t] correspondiente a (10, 3, −5) en
base B1 ? ¿y a (2, 3, 5) en base B2 ?
Note que
 
1 −1 1
P −1 =  0 1 0 
0 0 −1
transforma de coordenadas en la base B2 a la base B1 . Compruebe sus respuestas
a las 2 preguntas anteriores usando esta matriz.
Usando las matrices de cambio de base, podemos llegar a la relación que
querı́amos.
Teorema 8.2.18. Sea T : V → V una transformación K-lineal de un K-espacio
vectorial V de dimensión n y sean B y B 0 bases de V . Sea P la matriz de cambio
de base de B 0 a B. Entonces
0 −1
[T ]B
B0 = P [T ]B
B P.

247
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Demostración. La hicimos en clases. Con lo dicho antes, es una mera aplicación de


−1 0
la Proposición 8.2.13. En efecto, si recordamos que P = [idV ]B
B 0 y que P = [idV ]B
B ,
tenemos
0 0 0 0
P −1 [T ]B B B B B B B B
B P = [idV ]B [T ]B [idV ]B 0 = [idV ◦ T ]B [idV ]B 0 = [idV ◦ T ◦ idV ]B 0 = [T ]B 0 .

0
Vemos entonces que las matrices [T ]B B
B y [T ]B 0 están bastante relacionadas. Esto
es natural cuando uno recuerda que, esencialmente, están describiendo a la misma
transformación lineal. Esto nos lleva a la siguiente definición en el mundo de las
matrices.
Definición 8.2.19. Sean A, B ∈ Mn×n (K). Decimos que B es semejante (o simi-
lar ) a A si existe una matriz invertible P ∈ Mn×n (K) tal que B = P −1 AP .
En otras palabras, dos matrices son similares si, bajo bases bien escogidas, ellas
describen a la misma transformación lineal.
Ejercicio 8.2.20. Consideremos las siguientes bases de R3 :

B = {e1 , e2 , e3 } y B 0 = {(1, 1, 1), (1, 1, 0), (1, 0, 0)}.

1. Encuentre la matriz P de cambio de base de B 0 a B.

2. Encuentre la matriz Q de cambio de base de B a B 0 y compruebe que Q =


P −1 .

3. Considere la transformación lineal T : R3 → R3 dada por

T (x, y, z) = (2y + z, x − 4y, 3x).


0
−1
Compruebe que [T ]B
B0 = P [T ]B
BP .

8.3. Algunos ejercicios


Aquı́n incluyo algunos ejercicios/ejemplos.

1. Sea T : R3 [x] → R2 [x] una transformación lineal dada por


T (p(x)) = p00 (1) + p0 (1)x + p(1)x2
Calcule bases para Ker (T ) e Im (T ).

Solución:

248
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

Del enunciado, T (a+bx+cx2 +dx3 ) = (2c+6d)+(b+2c+3d)x+(a+b+c+d)x2 .

Luego, si se considera las bases canónicas, la siguientes matriz es tal que para
todo p(x) ∈ R3 [x] se cumple que [T (p(x)] = A[p(x)]:
 
0 0 2 6
A= 0 1 2 3 
1 1 1 1
 
1 0 0 1
∼  0 1 0 −3 
0 0 1 3

Luego Ker (T ) = h{1 − 3x + 3x2 − x3 }i.

Dado que es un polinomio, se tiene que {1 − 3x + 3x2 − x3 } es L.I. y por lo


tanto una base de Ker (T ).

Im (T ) = h{x, x + x2 , 2 + 2x + x2 }i.

De las columnas pivote de la matriz anterior, se tiene que {x, x+x2 , 2+2x+x2 }
es L.I. y por lo tanto una base de Im (T ).

(Otra manera es decir que como el Ker tiene dimensión 1 y R3 [x] tiene dimen-
sión 4, entonces por teorema, Im (T ) tiene dimensión 3, y como es subespacio
de R2 [x] de dimensión 3, entonces R2 [x] = Im (T ) y por lo tanto una base es
{1, x, x2 }).

" #
1 1 −1 1
2. Sea A = 2 1 0 1 . Defina la transformación lineal, que llamaremos
3 −1 1 3
también A como A : R4 → R3 dada por multiplicación por la izquierda. Es
decir, para x = (x1 , x2 , x3 , x4 ) ∈ R4 se define A(x) := A · (x1 , x2 , x3 , x4 )t .

a) Escriba A(x). Solución:


A(x1 , x2 , x3 , x4 ) = (x1 + x2 − x3 + x4 , 2x1 + x2 + x4 , 3x1 − x2 + x3 + 3x4 )
b) Calcule el Ker (A) y la Im (A).

Solución:

249
Álgebra y Geometrı́a Dep. Matemáticas/Fac. Ciencias/U. Chile

" # " # " #


1 1 −1 1 1 0 1 0 1 0 0 1
A∼ 0 −1 2 −1 ∼ 0 1 −2 1 ∼ 0 1 0 −1
0 −4 4 0 0 0 −4 4 0 0 1 −1
 
−1
1
Entonces se tiene que Ker (A) = h{ }i
 
1
1
" # " # " #
1 1 −1
y se tiene que Im (A) = h{ 2 , 1 , 0 }i
3 −1 1

c) Decida (justificadamente) si A es inyectiva y/o sobre.

Solución:

Dado que el rango de A es 3 que es el mismo que el número de filas de


la matriz, se tiene que A es sobre.

Dado que el rango de A es 3 que es el mayor que el número de columnas


de la matriz, se tiene que A no es inyectiva.

250

También podría gustarte