Análisis Tensorial 2

Departamento de Fı́sica, Facultad de Ciencias, Universidad de Chile.
Las Palmeras 3425, Ñuñoa. Casilla 653, Correo 1, Santiago

fono: 562 978 7276 fax: 562 271 2973
e-mail: [email protected]
Apuntes de un curso de
FÍSICA MATEMÁTICA
Tercera edición, revisión 080424-10
José Rogan C.
Vı́ctor Muñoz G.
Índice
I Análisis Tensorial 3
1. Una breve revisión de álgebra lineal. 5
1.1. Notación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2. Operaciones vectoriales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.1. Rotación de vectores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.2. Productos vectoriales. . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.3. Cálculos usando notación de Einstein. . . . . . . . . . . . . . . . . . . . 15
2. Operadores en campos escalares y vectoriales. 19

2.1. Dibujando campos escalares y vectoriales. . . . . . . . . . . . . . . . . . . . . 19
2.1.1. Dibujando campos escalares. . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1.2. Dibujando campos vectoriales. . . . . . . . . . . . . . . . . . . . . . . . 20
2.2. Operadores vectoriales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.1. Notación del operador integral. . . . . . . . . . . . . . . . . . . . . . . 21
2.2.2. Integrales de lı́nea. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.3. Integrales de superficie. . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.4. Integrales de volumen. . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3. Operadores diferenciales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3.1. Vista fı́sica del gradiente. . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.2. Vista fı́sica de la divergencia. . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.3. Vista fı́sica del rotor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3.4. Identidades con operadores diferenciales. . . . . . . . . . . . . . . . . . 33
2.4. Definiciones integrales de los operadores diferenciales. . . . . . . . . . . . . . . 34
2.5. Los teoremas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.5.1. Teorema de Gauss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.5.2. Teorema de Green. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.5.3. Teorema de Stokes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.5.4. Teorema de Helmholtz. . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3. Sistemas de Coordenadas Curvilı́neos. 41

3.1. El vector posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2. El sistema cilı́ndrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3. Sistema esférico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.4. Sistemas curvilı́neos generales . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.4.1. Coordenadas, vectores base y factores de escala . . . . . . . . . . . . . 47
iii
iv ÍNDICE
3.4.2. Geometrı́a diferencial. . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.4.3. El vector desplazamiento . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.4.4. Producto de vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.4.5. La integral de lı́nea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.4.6. Integral de superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.4.7. La integral de volumen . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.4.8. El gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.4.9. La divergencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.4.10. El rotor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.5. Gradiente, divergencia y rotor en sistemas cilı́ndricos y esféricos . . . . . . . . 56
3.5.1. Operaciones cilı́ndricas . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.5.2. Operaciones esféricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4. Introducción a tensores. 59
4.1. El tensor de conductividad y la ley de Ohm. . . . . . . . . . . . . . . . . . . . 59
4.2. Notación tensorial general y terminologı́a. . . . . . . . . . . . . . . . . . . . . 62
4.3. Transformaciones entre sistemas de coordenadas. . . . . . . . . . . . . . . . . . 63
4.3.1. Transformaciones vectoriales entre sistemas cartesianos. . . . . . . . . . 63
4.3.2. La matriz de transformación. . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.3. Resumen de transformaciones de coordenadas. . . . . . . . . . . . . . . 67
4.3.4. Transformaciones tensoriales. . . . . . . . . . . . . . . . . . . . . . . . 68
4.4. Diagonalización de tensores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.4.1. Diagonalización y problema de valores propios. . . . . . . . . . . . . . . 70
4.5. Transformaciones tensoriales en sistemas de coordenadas curvilı́neos. . . . . . 76
4.6. Pseudo-objetos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.6.1. Pseudo-vectores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.6.2. Pseudo-escalares. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.6.3. Pseudo-tensores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5. Sistema de coordenadas no ortogonales. 85

5.1. Breve recuerdo de transformaciones tensoriales. . . . . . . . . . . . . . . . . . 85
5.2. Sistemas de coordenadas no ortogonales. . . . . . . . . . . . . . . . . . . . . . 87
5.2.1. Un sistema de coordenadas inclinado. . . . . . . . . . . . . . . . . . . . 88
5.2.2. Covarianza, contravarianza y métrica. . . . . . . . . . . . . . . . . . . . 90
5.2.3. Transformaciones de componentes vectoriales contravariantes. . . . . . 92
5.2.4. Notación de subı́ndices y superı́ndices. . . . . . . . . . . . . . . . . . . 95
5.2.5. Transformaciones de componentes vectoriales covariantes. . . . . . . . . 98
5.2.6. Covarianza y contravarianza en tensores. . . . . . . . . . . . . . . . . . 101
5.2.7. Contravarianza y covarianza de derivadas parciales. . . . . . . . . . . . 103
6. Determinantes y matrices. 107

6.1. Determinantes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.2. Matrices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
6.3. Matrices ortogonales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
6.4. Matrices Hermı́ticas, matrices unitarias. . . . . . . . . . . . . . . . . . . . . . 129
ÍNDICE v
6.5. Diagonalización de matrices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

6.6. Matrices normales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
7. Teorı́a de grupo. 145

7.1. Introducción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
7.2. Generadores de grupos continuos. . . . . . . . . . . . . . . . . . . . . . . . . . 149
7.3. Momento angular orbital. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
7.4. Grupo homogéneo de Lorentz. . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
7.5. Covarianza de Lorentz de las ecuaciones de Maxwell. . . . . . . . . . . . . . . 168
8. Series infinitas. 175

8.1. Conceptos fundamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
8.2. Pruebas de Convergencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
8.2.1. Pruebas de comparación. . . . . . . . . . . . . . . . . . . . . . . . . . . 178
8.2.2. Prueba de la raı́z de Cauchy. . . . . . . . . . . . . . . . . . . . . . . . . 179
8.2.3. Prueba de la razón de D’ Alembert o Cauchy. . . . . . . . . . . . . . . 180
8.2.4. Prueba integral de Cauchy o Maclaurin. . . . . . . . . . . . . . . . . . 181
8.2.5. Prueba de Kummer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
8.2.6. Prueba de Raabe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
8.2.7. Prueba de Gauss. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
8.2.8. Mejoramiento de convergencia. . . . . . . . . . . . . . . . . . . . . . . 185
8.3. Series alternadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
8.3.1. Criterio de Leibniz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
8.3.2. Convergencia absoluta. . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
8.4. Álgebra de series. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
8.4.1. Mejoramiento de la convergencia, aproximaciones racionales. . . . . . . 189
8.4.2. Reordenamiento de series dobles. . . . . . . . . . . . . . . . . . . . . . 190
8.5. Series de funciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
8.5.1. Convergencia uniforme. . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
8.5.2. Prueba M de Weierstrass. . . . . . . . . . . . . . . . . . . . . . . . . . 193
8.5.3. Prueba de Abel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
8.6. Expansión de Taylor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
8.6.1. Teorema de Maclaurin. . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
8.6.2. Teorema Binomial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
8.6.3. Expansión de Taylor de más de una variable. . . . . . . . . . . . . . . . 201
8.7. Series de potencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
8.7.1. Convergencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
8.8. Convergencia uniforme y absoluta. . . . . . . . . . . . . . . . . . . . . . . . . 202
8.8.1. Continuidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
8.8.2. Diferenciación e integración. . . . . . . . . . . . . . . . . . . . . . . . . 202
8.8.3. Teorema de unicidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
8.8.4. Inversión de series de potencia. . . . . . . . . . . . . . . . . . . . . . . 204
8.9. Integrales elı́pticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
8.9.1. Definiciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
8.9.2. Expansión de series. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
vi ÍNDICE
8.9.3. Valores lı́mites. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208

8.10. Números de Bernoulli. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
8.10.1. Funciones de Bernoulli. . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
8.10.2. Fórmula de integración de Euler-Maclaurin. . . . . . . . . . . . . . . . 212
8.11. Función zeta de Riemann. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
8.11.1. Mejoramiento de la convergencia. . . . . . . . . . . . . . . . . . . . . . 216
8.12. Series asintóticas o semi-convergentes. . . . . . . . . . . . . . . . . . . . . . . . 216
8.12.1. Función gama incompleta. . . . . . . . . . . . . . . . . . . . . . . . . . 217
8.12.2. Integrales coseno y seno. . . . . . . . . . . . . . . . . . . . . . . . . . . 219
8.12.3. Definición de series asintóticas. . . . . . . . . . . . . . . . . . . . . . . 220
8.12.4. Aplicaciones a cálculo numérico. . . . . . . . . . . . . . . . . . . . . . . 221
8.13. Productos infinitos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
8.13.1. Convergencia de un producto infinito. . . . . . . . . . . . . . . . . . . . 222
8.13.2. Funciones seno, coseno y gama. . . . . . . . . . . . . . . . . . . . . . . 223
9. Ecuaciones diferenciales. 225

9.1. Ecuaciones diferenciales parciales . . . . . . . . . . . . . . . . . . . . . . . . . 225
9.1.1. Ejemplos de PDE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
9.1.2. Clases de PDE y caracterı́stica. . . . . . . . . . . . . . . . . . . . . . . 228
9.1.3. Las PDE no lineales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
9.1.4. Condiciones de borde. . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
9.2. Ecuaciones diferenciales de primer orden. . . . . . . . . . . . . . . . . . . . . . 231
9.2.1. Variables separables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
9.2.2. Ecuaciones diferenciales exactas. . . . . . . . . . . . . . . . . . . . . . . 233
9.2.3. Ecuaciones diferenciales ordinarias de primer orden lineales. . . . . . . 234
9.2.4. Conversión a una ecuación integral. . . . . . . . . . . . . . . . . . . . . 236
9.3. Separación de variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
9.3.1. Coordenadas cartesianas. . . . . . . . . . . . . . . . . . . . . . . . . . . 237
9.3.2. Coordenadas cilı́ndricas circulares. . . . . . . . . . . . . . . . . . . . . 238
9.3.3. Coordenadas polares esféricas. . . . . . . . . . . . . . . . . . . . . . . . 240
Índice de figuras
1.1. El sistema Cartesiano estandard . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.2. Geometrı́a para la rotación vectorial . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3. El producto punto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4. El producto cruz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.5. El arreglo de 3 × 3 × 3 de Levi-Civita . . . . . . . . . . . . . . . . . . . . . . . 15
2.1. Equipotenciales y lı́neas de campo eléctrico de dos lı́neas paralelas de carga. . 20

2.2. La integral de lı́nea. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3. Integrales de superficie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4. Superficies de Φ = −xy constante. . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5. Lı́neas de campo para Φ = −xy. . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6. Volumen diferencial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.7. Flujo a través de las caras superior e inferior. . . . . . . . . . . . . . . . . . . 28
2.8. Campos vectoriales circulantes y no circulantes. . . . . . . . . . . . . . . . . . 30
2.9. Camino cerrado para la integral del rotor. . . . . . . . . . . . . . . . . . . . . 31
2.10. Campos con rotor cero, figura (a) y distinto de cero, figura (b). . . . . . . . . . 32
2.11. La suma de dos volúmenes diferenciales. . . . . . . . . . . . . . . . . . . . . . 36
2.12. La suma de dos volúmenes diferenciales. . . . . . . . . . . . . . . . . . . . . . 36
2.13. La suma de dos superficies diferenciales. . . . . . . . . . . . . . . . . . . . . . 37
2.14. El Teorema de Stokes implica un potencial escalar. . . . . . . . . . . . . . . . 38
3.1. El vector posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.2. El sistema cilı́ndrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.3. El vector posición en el sistema cilı́ndrico . . . . . . . . . . . . . . . . . . . . . 44
3.4. El sistema polar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.5. Componentes polares de un vector . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.6. El sistema esférico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.7. El vector posición en coordenadas esféricas . . . . . . . . . . . . . . . . . . . . 47
3.8. Coordenadas curvilı́neas y vectores bases . . . . . . . . . . . . . . . . . . . . . 48
3.9. Volumen diferencial de un sistema de coordenadas curvilı́neas . . . . . . . . . 50
3.10. Orientación de la superficie para la integración curvilı́nea del rotor . . . . . . . 54
3.11. Geometrı́a diferencial para integración curvilı́nea del rotor . . . . . . . . . . . 55
4.1. Sistemas rotados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.2. Componentes del vector. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3. Vectores base en el sistema primado. . . . . . . . . . . . . . . . . . . . . . . . 74
vii
viii ÍNDICE DE FIGURAS
4.4. Sistema de la mano derecha. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

4.5. Vectores en el sistema de la mano derecha. . . . . . . . . . . . . . . . . . . . . 78
4.6. Sistema de la mano izquierda. . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.7. Vectores en el sistema de la mano izquierda. . . . . . . . . . . . . . . . . . . . 80
4.8. El paralelogramo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5.1. Los sistemas de coordenadas de la Relatividad Especial. . . . . . . . . . . . . . 88

5.2. Un sistema de coordenadas de la Relatividad General. . . . . . . . . . . . . . . 88
5.3. Un sistema de coordenadas ortonormal y otro inclinado. . . . . . . . . . . . . 89
5.4. Dos sistemas de coordenadas inclinados. . . . . . . . . . . . . . . . . . . . . . 93
5.5. Determinación de la base de vectores contravariante. . . . . . . . . . . . . . . 99
5.6. Componentes covariantes y contravariantes proyectadas de un vector. . . . . . 100
6.1. Sistemas de coordenadas cartesianos. . . . . . . . . . . . . . . . . . . . . . . . 121

6.2. Sistemas de coordenadas rotados en dos dimensiones. . . . . . . . . . . . . . . 124
6.3. (a) Rotación respecto al eje x3 en un ángulo α; (b) Rotación respecto a un eje
x02 en un ángulo β; (c) Rotación respecto a un eje x003 en un ángulo γ. . . . . . 127
6.4. Vector fijo con coordenadas rotadas. . . . . . . . . . . . . . . . . . . . . . . . . 128
6.5. Elipsoide del momento de inercia. . . . . . . . . . . . . . . . . . . . . . . . . . 134
6.6. Vector fijo con coordenadas rotada. . . . . . . . . . . . . . . . . . . . . . . . . 142
7.1. Ilustración de la ecuación (7.13). . . . . . . . . . . . . . . . . . . . . . . . . . . 150

7.2. Ilustración de M0 = UMU† ecuación (7.42). . . . . . . . . . . . . . . . . . . . . 155
7.3. Octeto bariónico diagrama de peso para SU(3). . . . . . . . . . . . . . . . . . 159
7.4. Separación de masa bariónica. . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
7.5. Separación de masa bariónica. . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
8.1. Prueba de comparación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

8.2. Comparación de integral con suma de bloques . . . . . . . . . . . . . . . . . . 181
8.3. Rearreglo de serie armónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
8.4. Series dobles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
8.5. Series dobles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
8.6. Series dobles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
8.7. Convergencia uniforme. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
8.8. Péndulo simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
8.9. Integrales elı́pticas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
8.10. Función zeta de Riemann. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
8.11. Sumas parciales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
ÍNDICE DE FIGURAS 1
1
2 ÍNDICE DE FIGURAS
Parte I
Análisis Tensorial
3
Capı́tulo 1
Una breve revisión de álgebra lineal.

versión final 1.0-0804151
Este capı́tulo presenta una rápida revisión del álgebra de vectores y de matrices. No
intentamos cubrir por completo estos tópicos sino más bien usarlos como introducción a
la notación con subı́ndices y la convención de suma de Einstein. Estas herramientas nos
simplificarán la a menudo complicada manipulación del álgebra lineal.
1.1. Notación.
Una notación estandard y consistente es un hábito muy importante a formar en matemáti-
cas. Una buena notación no sólo facilita los cálculos sino que permite análisis dimensional y
ayuda a encontrar y corregir errores. Ası́ comenzamos por explicitar la notación que usaremos
a través de los apuntes.
Sı́mbolo Cantidad
vi Una componente de un vector
Mi···j Un elemento de una matriz o tensor
[M ] la matriz completa
~v Un vector
êi Un vector base
↔
T Tensor
L Un operador
Cuadro 1.1: Notación
Un vector tridimensional ~v puede ser expresado como
~v = vx êx + vy êy + vz êz , (1.1)
donde las componentes (vx , vy , vz ) son llamadas las componentes Cartesianas de ~v y (êx , êy , êz )
son los vectores bases del sistema de coordenadas. La notación puede ser más eficiente aún si
1
Este capı́tulo está basado en el primer capı́tulo del libro: Mathematical Physics de Brusse Kusse & Erik
Westwig, editorial John Wiley & Sons, Inc..
5
6 CAPÍTULO 1. UNA BREVE REVISIÓN DE ÁLGEBRA LINEAL.
reemplazamos los subı́ndices con letras (x,y,z), en las componentes, por subı́ndices numéricos
(1,2,3). Con esto, definimos:
ê1 = êx v1 = vx
ê2 = êy v2 = vy
(1.2)
ê3 = êz v3 = vz
La ecuación (1.1) se transforma en
~v = v1 ê1 + v2 ê2 + v3 ê3 , (1.3)
o más sucintamente
3
X
~v = vi êi . (1.4)
i=1
La figura (1.1) muestra esta modificación notacional sobre un tı́pico sistema de coordenadas
Cartesiano.
Aunque la notación de subı́ndices puede ser usada en diferentes tipos de sistemas de coor-
denadas, en este capı́tulo limitaremos nuestra discusión al sistema Cartesiano. Los vectores
bases Cartesianos son ortonormales y posición independientes. Ortonormal significa que la
magnitud de cada vector es unitaria y que ellos son perpendiculares entre ellos. Independiente
de la posición significa que los vectores bases no cambian su orientación cuando los movemos
a través del espacio. Sistema de coordenadas no-Cartesianos son cubiertos en detalle en el
capı́tulo 3.
La ecuación (1.4) puede ser compactada aún más introduciendo la convención de suma
de Einstein la cual supone que se suma cada vez que se repiten los subı́ndices en el mismo
término. Por lo tanto
X3
~v = vi êi = vi êi . (1.5)
i=1
z 3
y 2
ez ey e3 e2
x 1
ex e1
Figura 1.1: El sistema Cartesiano estandard
Nos referimos a la combinación de los subı́ndices y la convención de suma como la notación

de Einstein.
1.1. NOTACIÓN. 7
Imaginemos ahora que queremos escribir una simple relación vectorial

~c = ~a + ~b . (1.6)
Esta ecuación está escrita en lo que se conoce como notación vectorial. Notemos que no de-
pende de la elección de un sistema de coordenadas. En un particular sistema de coordenadas,
nosotros podemos escribir la relación entre estos vectores en términos de sus componentes:
c1 = a1 + b1
c2 = a2 + b2 (1.7)
c3 = a3 + b3
Con la notación de subı́ndices estas tres ecuaciones pueden ser escritas en una sola lı́nea,
ci = ai + bi , (1.8)
donde el subı́ndice i se puede reemplazar por cualquiera de los tres valores(1,2,3). Como
veremos más adelante el uso de la notación de Einstein puede simplificar drásticamente la
derivación de muchas relaciones matemáticas y fı́sicas. Sin embargo, los resultados escritos
en esta notación están amarrados a un particular sistema de coordenadas, lo que a menudo
dificulta la interpretación. Por esta razón convertiremos nuestros resultados finales de vuelta
a una notación vectorial cuando sea posible.
Una matriz es un arreglo dos dimensional de cantidades que puede o no estar asociada
con un particular sistema de coordenadas. Las matrices pueden ser expresadas usando dife-
rentes tipos de notación. Si deseamos hablar sobre una matriz como un todo, sin especificar
explı́citamente todos sus elementos, la escribimos en notación matricial como [M ]. Si, por el
contrario necesitamos listar todos los elementos de [M ], podemos escribirla como un arreglo
rectangular entre un par de paréntesis:
 
M11 M12 · · · M1c
M21 M22 · · · M2c 
[M ] =  .. ..  . (1.9)
 
.. ..
 . . ., . 
Mr1 Mr2 · · · Mrc
Llamaremos a esta notación de arreglos matriciales El elemento individual de la tercera fila
segunda columna de [M ] es escrito como M23 . Notemos que la fila de un elemento corresponde
al primer ı́ndice y la columna al segundo. No todos los arreglos son cuadrados, esto significa
que en la ecuación (1.9) r no es necesariamente igual a c.
La multiplicación entre dos matrices es sólo posible si el número de columnas en el pre-
multiplicador es igual al número de filas del postmultiplicador. El resultado de tal forma de
multiplicación es otra matriz con el mismo número de columnas que el premultiplicador y
el mismo número de columnas que el postmultiplicador. Por ejemplo, el producto entre una
matriz 3 × 2 [M ] y una matriz 2 × 3 [N ] forma una matriz de 3 × 3 [P ], con los elementos
dados por:
   
M11 M12 M11 N11 + M12 N21 M11 N12 + M12 N22 M11 N13 + M12 N23
M21 M22  N11 N12 N13 = M21 N11 + M22 N21 M21 N12 + M22 N22 M21 N13 + M22 N23  .
N N N23
M31 M32 | 21 {z22 } M31 N11 + M32 N21 M31 N12 + M32 N22 M31 N13 + M32 N23
| {z } [N ] | {z }
[M ] [P ]
(1.10)
La multiplicación de la ecuación (1.10) puede ser escrita, en la notación matricial abreviada,

como
[M ] [N ] = [P ] . (1.11)
También podemos usar la notación de Einstein para escribir el mismo producto como
Mij Njk = Pik , (1.12)
con una suma implı́cita sobre el ı́ndice j. notemos que j está en la segunda posición de el
término Mij y en la primera posición de el término Njk , tal que la sumatoria es sobre las
columnas de [M ] y sobre las filas de [N ], tal como era en la ecuación (1.10). La ecuación
(1.12) es una expresión para el elemento ik-ésimo de la matriz [P ].
La notación de arreglos matriciales es conveniente para hacer cálculos numéricos, es-
pecialmente cuando se usan computadores. Cuando derivamos las relaciones entre diversas
cantidades en fı́sica es a menudo inadecuada porque carece de un mecanismo para mantener
la pista de la geometrı́a del sistema de coordenadas. Por ejemplo, en un particular sistema
de coordenadas , el vector ~v , puede ser escrito como
~v = 1ê1 + 3ê2 + 2ê3 . (1.13)
Cuando realizamos los cálculos es a veces conveniente usar una representación matricial del
vector escribiendo  
1
~v → [v] = 3 .
 (1.14)
2
El problema con esta notación es que no hay una manera conveniente para incorporar los
vectores bases en la matriz. Esta es la razón de que fuimos cuidadosos y usamos una flecha
(→) en la ecuación (1.14) en vez del signo igual (=). En estos apuntes un signo igual entre
dos cantidades significa que ellas son perfectamente equivalente en todas sus formas. Una
cantidad puede ser subtituidas por la otra en cualquier expresión. Por ejemplo, la ecuación
(1.13) implica que la cantidad 1ê1 + 3ê2 + 2ê3 puede reemplazar a ~v en cualquier expresión
matemática y vice-versa. En contraste la flecha en (1.14) implica que [v] puede representar
a ~v y que los cálculos pueden ser realizados usándolo, pero debemos ser cuidadoso no son
directamente substituibles uno por otro sin especificar los vectores bases asociados con las
componentes de [v].
1.2. Operaciones vectoriales.

En esta sección veremos varias de las operaciones vectoriales. Usaremos todas las diferentes
formas de notación discutidas en la sección previa para ilustrar sus diferencias. Inicialmente,
nos concentraremos en la notación matricial y de arreglo matricial. Cuando progresemos
usaremos la notación de Einstein más frecuentemente.
Como discutimos anteriormente un vector tridimensional ~v puede ser representada usando
una matriz. Hay realmente dos maneras de escribir esta matriz. Una puede escribirla como
1.2. OPERACIONES VECTORIALES. 9
una matriz columna (3 × 1) o una matriz fila (1 × 3), cuyos elementos son las componentes
de el vector en alguna base Cartesiana:
 
v1
~v → [v]† = v1 v2 v3 .

~v → [v] = v2  o (1.15)
v3
la notación estandard [v]† es usada para indicar la traspuesta de [v], indicando un intercambio
de filas por columnas. Recordemos que el vector ~v puede tener un número infinito de diferentes
representaciones de arreglos matriciales, cada una escrita con respecto a una diferente base
coordenada.
1.2.1. Rotación de vectores.

Consideremos la rotación simple de un vector en un sistema de coordenadas Cartesiano.
Este ejemplo será trabajado, sin pérdida de generalidad, en dos dimensiones.
Partimos con el vector ~a, el cual está orientado en un ángulo θ respecto al eje-1, como
muestra la figura 1.2. Este vector puede ser escrito en términos de sus componentes Carte-
sianas como
~a = a1 ê1 + a2 ê2 . (1.16)
donde
a1 = a cos θ a2 = a sen θ . (1.17)
2 2 a’
a
φ
θ θ
1 1
Figura 1.2: Geometrı́a para la rotación vectorial
p
En esta expresión a = |~a| = a21 + a22 es la magnitud del vector ~a. El vector ~a 0 es
generado por rotar el vector ~a en el sentido contrario a los punteros del reloj en un ángulo φ.
Esto cambia la orientación del vector pero no su magnitud. Por lo tanto, podemos escribir
~a 0 = a cos(θ + φ) ê1 + a sen(θ + φ) ê2 . (1.18)

| {z } | {z }
a01 a02
Las componentes a01 y a02 pueden ser reescritas usando las identidades trigonométricas
para seno y el coseno de la suma de ángulos
a01 = a cos(θ + φ) = a {z θ} cos φ − a
| cos | sen
{z θ} sen φ
a1 a2
(1.19)
a02 = a sen(θ + φ) = a
| cos
{z θ} sen φ + a
| sen
{z θ} cos φ
a1 a2
Si nosotros representamos a ~a y ~a 0 como matrices columna.

0
a1 0 0 a
~a → [a] = ~a → [a ] = 10 . (1.20)
a2 a2
La ecuación (1.19) puede ser puesta en forma de arreglo matricial

0
a1 cos φ − sen φ a1
= . (1.21)
a02 sen φ cos φ a2
En notación matricial abreviada, la podemos escribir como
[a0 ] = [R(φ)] [a] . (1.22)
En esta última expresión [R(φ)]es llamada la matriz de rotación y está claramente definida
como
cos φ − sen φ
[R(φ)] = . (1.23)
sen φ cos φ
Notemos que para que la ecuación (1.22) sea la misma que la ecuación (1.19), y para que
la multiplicación de matrices tenga sentido, las matrices [a] y [a0 ] deben ser matrices columnas
y [R(φ)] debe premultiplicar a [a]. El resultado de la ecuación (1.19) también puede escribirse
usando una representación fila para [a] y [a0 ]. En este caso, las transpuestas de [R(φ)], [a] y
[a0 ] deben ser usadas, y [R(φ)]† debe postmultiplicar a [a]† :
†
[a0 ] = [a]† [R(φ)]† . (1.24)
Escritos usando arreglos de matrices, estas expresiones llegan a ser

0 0
cos φ sen φ
a1 a2 = a1 a2 . (1.25)
− sen φ cos φ
Es fácil ver que la ecuación (1.25) es enteramente equivalente a la ecuación (1.21).

Estas mismas manipulaciones pueden ser logradas usando la notación de Einstein. Por
ejemplo, la ecuación (1.19) puede ser expresada como
a0i = Rij aj . (1.26)
La multiplicación de matrices en la ecuación (1.22) suma es sobre las columnas de los elemen-
tos de [R(φ)]. Esto se logra en la ecuación (1.26) por la suma implı́cita sobre j. A diferencia
de la notación matricial en la notación de Einstein el orden de aj y Rij no es ya importante,
porque
Rij aj = aj Rij . (1.27)
El vector ~a 0 puede ser escrito usando la notación de Einstein combinada con la ecuación
(1.26) con los vectores bases
~a 0 = Rij aj êi . (1.28)
Esta expresión demuestra una propiedad de “contabilidad notacional” de la notación de
Einstein. La suma sobre un subı́ndice remueve la dependencia en expresión, de la misma
manera que cuando uno integra sobre una variable. Por esta razón, el proceso de sumar
ı́ndices es a menudo llamado contracción sobre un ı́ndice. Hay dos sumas en el lado derecho
(LD) de la ecuación (1.28), una sobre i y la otra sobre j. Después de la contracción sobre
ambos subı́ndices, no permanecen subı́ndices en LD. Esto es consistente con el hecho de que
no hay subı́ndices en el lado izquierdo (LI) de la ecuación. La única notación sobre el LD es
una flecha sobre ~a 0 indicando que es un vector, lo cual también existe al LI con el vector
unitario êi . Esta suerte de análisis notacional puede ser aplicado a todas las ecuaciones. La
notación sobre el LI de un signo igual debe estar siempre de acuerdo con la notación en el
LD. Este hecho puede ser usado para chequear las ecuaciones. Por ejemplo,
~a 0 6= Rij aj , (1.29)
porque el subı́ndice i permanece sobre el LD después de contraer sobre j, mientras en el LI

no hay subı́ndices. Adicionalmente, la notación indican que el LI es un cantidad vectorial,
mientras el LD no le es.
1.2.2. Productos vectoriales.

Ahora consideraremos los productos punto y cruz de dos vectores usando la notación de
Einstein. Este tipo de producto están presente en la fı́sica a todo nivel. El producto punto es
usualmente encontrado primero cuando calculamos el trabajo W hecho por una fuerza F~ en
la integral de lı́nea Z
W = d~r · F~ . (1.30)
En esta ecuación, d~r es un vector desplazamiento diferencial. El producto cruz puede ser
usado para encontrar la fuerza sobre una partı́cula de carga q moviéndose con velocidad ~v en
un campo magnético externo B ~
q
F~ = (~v × B)
~ , (1.31)
c
doden c es la velocidad de la luz en el vacı́o.
El producto punto
~yB
El producto punto o interno entre dos vectores A ~ es un escalar definido por
~·B
A ~ = |A||
~ B|~ cos θ , (1.32)
donde θ es el ángulo entre los dos vectores, como muestra la figura (1.3. Si nosotros tomamos
el producto punto de un vector con si mismo tendremos la magnitud al cuadrado de dicho
vector
A~·A ~ = |A|
~2. (1.33)
En notación de Einstein la ecuación (1.32) se escribe como
~·B
A ~ = Ai êi · Bj êj . (1.34)
Notemos que hemos ocupados dos ı́ndices en A ~ y B,

~ esto es necesario para mantener las sumas
independientes de la manipulación que sigue. La contabilidad notacional está trabajando aquı́,
porque no hay subı́ndices en el LD, y ninguno en el LI después de las contracciones sobre

ambos i y j. Sólo los vectores bases están involucrados en el producto punto, tal que la
ecuación (1.34) puede ser reescrita como
~·B
A ~ = Ai Bj (êi · êj ) . (1.35)
Como hemos restringido nuestra atención a sistemas cartesianos donde los vectores bases son
ortogonales, tenemos (
1 i=j
êi · êj = . (1.36)
0 i 6= j
2
A
B
θ
1
Figura 1.3: El producto punto.
La delta de Kronecker (
1 i=j
δij = , (1.37)
6 j
0 i=
facilita los cálculos que involucran productos puntos. Usándola, podemos escribir êi · êj = δij ,
en la ecuación (1.35) se transforma en
~·B
A ~ = Ai Bj δij . (1.38)
La ecuación (1.38) puede ser expandida haciendo explı́citas las sumas sobre ambos ı́ndices
~·B
A ~ = A1 B1 δ11 + A1 B2 δ12 + A1 B3 δ13 + A2 B1 δ11 + . . . . (1.39)
Ya que la delta de Kronecker es cero a menos que los subı́ndices sean iguales. La ecuación
(1.39) se reduce a sólo tres términos.
~·B
A ~ = A1 B1 + A2 B2 + A3 B3 = Ai Bi . (1.40)
Cuando nos familiaricemos con la notación de Einstein y la delta de Kronecker, estos

últimos pasos serán hechos en forma automática. En cualquier momento que aparezca en un
término una delta de Kronecker, con uno de sus subı́ndices repetidos en cualquier otra parte
del mismo término, la delta de Kronecker puede ser removida, y cada instancia del subı́ndice
repetido cambiado por el otro subı́ndice de la delta de Kronecker. Por ejemplo
Ai δij = Aj . (1.41)
En la ecuación (1.38) la delta de Kronecker puede ser agrupada con el factor Bj ,y contraı́da
sobre j para dar
Ai (Bj δij ) = Ai Bi . (1.42)
De la misma manera podemos agruparla con el factor Ai , y sumar sobre i para dar un
resultado equivalente
Bj (Ai δij ) = Bj Aj . (1.43)
Esto es cierto para expresiones más complicadas. Por ejemplo,
Mij (Ak δik ) = Mij Ai

o (1.44)
Bi Tjk (êm δjm ) = Bi Tjk êj .
Esta flexibilidad es una de las cosas que hace los cálculos realizados con notación de Einstein
más fácil que trabajar con notación de matrices.
Deberı́amos precisar que la delta de Kronecker también puede ser vista como una matriz
o arreglo matricial. En tres dimensiones esta representación llega a ser
 
1 0 0
δij → [1] = 0 1 0 . (1.45)
0 0 1
Esta matriz puede ser usada para escribir la ecuación (1.38) en notación matricial. Note-
mos que la contracción sobre el ı́ndice i suma sobre las filas de la matriz [1], mientras que la
contracción sobre j suma sobre las columnas. Ası́, la ecuación (1.38) en notación matricial es
  
1 0 0 B1
~·B~ → [A]† [1] [B] = A1 A2 A3 0 1 0 B2 

A
0 0 1 B3
= [A]† [B] . (1.46)
El producto cruz
~ yB
El producto cruz o producto vectorial entre dos vectores A ~ forma un tercer vector
~ el cual puede ser escrito como
C,
C~ =A ~×B ~ . (1.47)
~ es
La magnitud del vector C
~ = |A||
|C| ~ B|~ sen θ , (1.48)
donde θ es el ángulo entre los dos vectores, como muestra la figura (1.4). la dirección de
~ depende de que el sistema de coordenadas sea derecho. Por convención, los sistemas de
C
coordenadas tridimensionales en fı́sica son usualmente derechos. Extendiendo los dedos de la
manos derecha tal que ellos queden alineados con el vector base ê1 . Ahora, enrollemoslos hacia
el vector base ê2 . Si el pulgar apunta a lo largo del vector base ê3 el sistema de coordenadas
es derecho. Cuando un sistema de coordenadas está dispuesto de esta manera la dirección del
producto cruz sigue una regla similar. Para determinar de C ~ en la ecuación (1.47), apunte
~ y enrollelos apuntando hacia B,

los dedos a lo largo de A, ~ el pulgar apuntará la dirección de
~ Esta definición es a menudo llamada regla de la mano derecha. Notemos que la dirección
C.
de C~ es siempre perpendicular al plano formado por A ~ y B.
~ Si por alguna razón, usaremos
un sistema zurdo, la definición del producto cruz cambia y deberı́amos usar la regla de la
mano izquierda. Por que la definición del producto cruz cambia levemente cuando movemos
la mano del sistema de coordenadas, el producto cruz no es exactamente un vector sino más
bien un pseudovector. Discutiremos esta distinción más adelante. Por ahora, limitaremos
nuestra discusión a sistema de coordenadas derecho, y trataremos el producto cruz como un
vector ordinario.
θ A
Figura 1.4: El producto cruz.
Otra manera de expresar el producto cruz es usando el determinante de una matriz, donde
algunos de sus elementos son los vectores bases:

ê1 ê2 ê3
~×B ~ = A1 A2 A3

A . (1.49)
B1 B2 B3
det
Expandiendo el determinante de la ecuación (1.49) tenemos
~×B
A ~ = (A2 B3 − A3 B2 )ê1 + (A3 B1 − A1 B3 )ê2 + (A1 B2 − A2 B1 )ê3 . (1.50)
Esta última expresión puede ser escrita usando la notación de Einstein, con la presentación
del sı́mbolo de Levi-Civita ijk :
~×B
A ~ = Ai Bj êk ijk , (1.51)
donde ijk es definido como


+1 para (i, j, k) = a una permutación par de (1,2,3)

ijk = −1 para (i, j, k) = a una permutación impar de (1,2,3) . (1.52)

0 si dos o más de los subı́ndices son iguales

Una permutación impar de (1,2,3) es cualquier rearreglo de estos tres números que pueda
ser realizado con un número impar de intercambio de pares. Ası́, las permutaciones impares
de (1,2,3) son (2,1,3),(1,3,2) y (3,2,1). Similarmente las permutaciones pares de (1,2,3) son
(1,2,3),(2,3,1) y (3,1,2). Ya que los subı́ndices i, j y k pueden tomar independientemente los
valores (1,2,3), una manera de visualizar el sı́mbolo de Levi-Civita es como un arreglo de
3 × 3 × 3 como lo muestra la figura (1.5)
k ε 313
i
j ε 111
ε ijk
ε 331
Figura 1.5: El arreglo de 3 × 3 × 3 de Levi-Civita
El producto cruz, escrito usando notación de Einstein en la ecuación (1.51), y el producto

punto, escrito en la forma de la ecuación (1.38) son muy útiles para el cálculo manual y lo
veremos en los siguientes ejemplos
1.2.3. Cálculos usando notación de Einstein.

Ahora veremos algunos ejemplos para mostrar el uso de la notación de Einstein. El primer
ejemplo muestra que la magnitud de un vector no es afectada por rotaciones. El objetivo
primario de este ejemplo es mostrar como una derivación que es realizada enteramente con
notación matricial también puede ser realizada usando notación de subı́ndices. El segundo
ejemplo deriva una identidad vectorial conocida. Este ejemplo muestra como la notación de
subı́ndices es una poderosa herramienta para derivar complicadas relaciones vectoriales.
Ejemplo 1
~A
Volvamos a la figura de la rotación (1.2), y consideremos el producto A· ~yA ~ 0 ·A
~ 0 , primero
usando notación matricial y luego usando notación de Einstein. Ya que A ~ 0 es generada por
~ sabemos que estos dos productos puntos, los cuales representan la
una rotación simple de A
magnitud al cuadrado de los vectores, deberı́a ser iguales.
Usando matrices:
~·A
A ~ = [A]† [A] (1.53)
A ~ 0 = [A0 ]† [A0 ] .
~ 0·A (1.54)
Pero [A0 ] y [A0 ]† pueden ser expresadas en términos de [A] y [A]† como
†
[A0 ] = [R(φ)] [A] [A0 ] = [A]† [R(φ)]† , (1.55)
donde R(φ) es la matriz de rotación definida en la ecuación (1.23). Si estas dos ecuaciones
son reemplazadas en la ecuación (1.54), tenemos
A ~ 0 = [A]† [R(φ)]† [R(φ)] [A] .

~ 0·A (1.56)
El producto entre las dos matrices de rotación puede realizarse

† cos φ sen φ cos φ − sen φ 1 0
[R(φ)] [R(φ)] = = , (1.57)
− sen φ cos φ sen φ cos φ 0 1
y la ecuación (1.56) llega a ser
A ~ 0 = [A]† [1] [A] = [A0 ]† [A] → A

~ 0·A ~·A
~. (1.58)
Nuestra conclusión final es que

~ 0·A
A ~0=A
~·A
~ . (1.59)
Para llegar a este resultado usando matrices, tuvimos cuidado en hacer las operaciones de
matrices en el orden correcto.
Ahora repitamos la derivación usando notación de Einstein. La ecuación (1.40) nos permite
escribir
~·A
A ~ = Ai Ai (1.60)
~ 0·A
A ~ 0 = A0j A0j . (1.61)
Notemos que debemos ser cuidadosos en usar diferentes subı́ndices para las dos sumas en las
ecuaciones (1.60) y (1.61). Esto asegura mantenerlas independientes cuando ellas sean mani-
puladas en los siguientes pasos. Las componentes primas pueden ser expresadas en términos
de las componentes sin primas como
A0i = Rij Aj , (1.62)
donde Rij es el ij-ésimo elemento de la matriz de rotación R(φ). Insertando esta expresión
en la ecuación (1.61) obtenemos
~ 0·A
A ~ 0 = Rru Au Rrv Av , (1.63)
donde nuevamente hemos sido cuidadosos en usar diferentes subı́ndices u y v. Esta ecuación
tiene tres sumas implı́citas, sobre los ı́ndices r, u y v.
Un la notación con subı́ndices, a diferencia de la notación de matrices, el orden de los
términos no es importante, ası́ podemos rearreglar la ecuación (1.63) tal que quede
~ 0·A
A ~ 0 = Au Av Rru Rrv . (1.64)
Ahora nos concentramos en la suma sobre r, la cual sólo involucra los elementos de matriz
de [R] en el producto Rru Rrv . ¿Qué significa este producto? Al comparar con las operaciones
discutidas previas. En la ecuación (1.12) precisamos la expresión en subı́ndices Mij Njk repre-
senta el producto regular de matrices [M ] [N ] porque el ı́ndice sumado j está en la segunda
posición de la matriz [M ] y en la primera posición en la matriz [N ]. La expresión Rru Rrv ,
sin embargo, tiene una contracción sobre el primer ı́ndice en ambas matrices. Para que este
producto tenga sentido, escribimos la primera instancia de [R] usando la transpuesta:
Rru Rrv → [R]† [R] . (1.65)
De la ecuación (1.57)
Rru Rrv = δuv . (1.66)
Substituyendo este resultado en la ecuación (1.64) nos da
~ 0·A
A ~ 0 = Au Av δuv = Au Av = A
~·A
~. (1.67)
Obviamente, este ejemplo es muy fácil. No quedo demostrada ninguna ventaja entre la nota-
ción de Einstein y la notación de matrices. Sin embargo, se destaca su equivalencia. En el
siguiente ejemplo la notación de Einstein probará ser más indispensable
Ejemplo 2
La notación de Einstein permite la derivación de identidades vectoriales que parecen
imposibles usando otra manera. El ejemplo que trabajaremos será la derivación de la identidad
del doble producto cruz entre tres vectores A ~ × (B ~ × C).
~ Este ejemplo muestra la mayorı́a
de las operaciones comunes que ocurren en este tipo de manipulaciones.
~ B
La expresión A×( ~ × C)
~ está escrita en notación vectorial y es válida en cualquier sistema
de coordenadas. Para derivar nuestra identidad, convertiremos esta expresión en notación
de Einstein en un sistema de coordenadas Cartesiano. Al final retornaremos a la notación
vectorial para obtener un resultado que no dependa de ningún sistema de coordenadas. En
este ejemplo, necesitaremos usar la forma de subı́ndices de un vector
V~ = Vi êi , (1.68)
Para el producto punto entre dos vectores
~·B
A ~ = Ai Bi , (1.69)
y para el producto cruz

~×B
A ~ = Ai Bj êk ijk . (1.70)
Para comenzar, sea
~ =B
D ~ ×C
~ , (1.71)
lo cual escribimos usando el sı́mbolo de Levi-Civita como
~ = Bi Cj êk ijk .
D (1.72)
~ B×
Substituyendo la ecuación (1.71) en la expresión A×( ~ C)
~ y usando Levi-Civita nuevamente
~ × (B
A ~ × C)
~ = Ar Ds êt rst . (1.73)
La s-ésima componente de D ~ es obtenida aplicando el producto punto con ês a ambos lados
de la ecuación (1.72) como sigue
~ = ês · Bi Cj êk ijk
Ds = ês · D
Bi Cj ijk (ês · êk )
. (1.74)
Bi Cj ijk δsk
Bi Cj ijs
Sustituyendo el resultado de la ecuación (1.74) en la ecuación (1.73) da

~ × (B
A ~ × C)
~ = Ar Bi Cj ijs êt rst , (1.75)
lo cual puede ser levemente arreglado para leer

~ × (B
A ~ × C)
~ = Ar Bi Cj êt ijs rst . (1.76)
Para proceder, necesitamos desarrollar algunas de las propiedades del sı́mbolo de Levi-
Civita. Primero, de acuerdo a la definición dada en la ecuación (1.52) es claro que intercambiar
cualquier par de ı́ndices sólo cambia el signo, i.e
ijk = −ikj = jki . (1.77)
la segunda propiedad involucra el producto de dos sı́mbolos de Levi-Civita que tienen el

último ı́ndice en común
ijk mnk = δim δjn − δin δjm . (1.78)
Con una considerable cantidad de esfuerzo se puede mostrar que el LD de la ecuación (1.78)
tiene todas las propiedades descrita para el producto de dos sı́mbolos de Levi-Civita en LI.
Con las ecuaciones (1.77) y (1.78) podemos volver a la ecuación (1.76), que ahora puede
ser reescrita como
~ × (B
A ~ × C)
~ = Ar Bi Cj êt (δrj δti − δri δtj ) . (1.79)
Después de remover las deltas de Kronecker obtenemos
~ × (B
A ~ × C)
~ = Aj Bi Cj êi − Ai Bi Cj êj . (1.80)
En este punto uno puede realmente ver la utilidad de la notación de Einstein. Los factores en
los dos términos del LD de la ecuación (1.80) pueden ser arreglados, agrupados de acuerdo a
las sumas, y volver a la notación vectorial ¡en sólo dos lı́neas! El procedimiento es
~ × (B
A ~ × C)
~ = (Aj Cj )(Bi êi ) − (Ai Bi )(Cj êj ) (1.81)
~ · C)
= (A ~ B~ − (A ~ · B)
~ C~ . (1.82)
La ecuación (1.81) es válida sólo en un sistema Cartesiano. Como la ecuación (1.82) está en
notación vectorial, esta es válida en cualquier sistema de coordenadas.
Capı́tulo 2
Operadores en campos escalares y

vectoriales.
Un campo es una función que depende del espacio y algunas veces también del tiempo. El
potencial eléctrico, la densidad de carga, la temperatura y la presión son sólo una magnitud,
y están descritos por campos escalares. En cambio, el campo eléctrico, el campo magnético,
la gravedad, la densidad de corriente o la velocidad de un fluido tienen magnitud y dirección
y son descritos por campos vectoriales.
Los operadores diferenciales e integrales en campos escalares y vectoriales pueden ser
expresados de forma unı́voca usando la notación y el formalismo de operadores, los cuales
veremos en este capı́tulo.
2.1. Dibujando campos escalares y vectoriales.

2.1.1. Dibujando campos escalares.
Los dibujos de los campos escalares son mucho más fáciles de construir que los campos
vectoriales, ya que los campos escalares están caracterizados por un valor único en cada punto
del espacio y del tiempo. Consideremos un ejemplo: el potencial eléctrico Φ producido por
dos lı́neas uniformes con carga ±λ0 , las cuales están ubicadas en (x = ±1, y = 0). Para este
caso, sabemos que
(x + 1)2 + y 2

Φ = λ0 ln . (2.1)
(x − 1)2 + y 2
Usualmente queremos construir las superficies donde Φ es constante, usualmente llamadas
equipotenciales, contornos o geodésicas, las cuales para este caso son cilindros alrededor de las
lı́neas de carga. Ya que hay simetrı́a en la dirección z, estas superficies pueden ser dibujadas
en dos dimensiones como se ve en la figura 2.1. Los centros de estos cı́rculos están ubicados
a lo largo del eje x desde 1 < x < ∞ para los valores positivos de Φ, y desde −∞ < x < −1
para los valores negativos de Φ. Φ = 0 se encuentra a lo largo del eje y.
1
Este capı́tulo está basado en el segundo capı́tulo del libro: Mathematical Physics de Brusse Kusse & Erik
19
20 CAPÍTULO 2. OPERADORES EN CAMPOS ESCALARES Y VECTORIALES.
Figura 2.1: Equipotenciales y lı́neas de campo eléctrico de dos lı́neas paralelas de carga.
2.1.2. Dibujando campos vectoriales.

Como los vectores poseen magnitud y dirección, los dibujos de los campos que componen
son más complicados que los campos vectoriales. Por ejemplo, las componentes cartesianas
del campo eléctrico del ejemplo de la sección anterior son
x2 − y 2 − 1

∂Φ
Ex = − = 4λ0 (2.2)
∂x [(x − 1)2 + y 2 ][(x + 1)2 + y 2 ]

∂Φ 2xy
Ey = − = 4λ0 . (2.3)
∂y [(x − 1)2 + y 2 ][(x + 1)2 + y 2 ]
Un campo vectorial es dibujado tı́picamente construyendo lı́neas tangentes al campo vec-

torial en cada punto del espacio. Por convención, la densidad de estas lı́neas de campo indican
la magnitud del campo, y flechas muestran su dirección. Si suponemos que las lı́neas de cam-
po eléctrico que expresan las ecuaciones (2.2) y (2.3) está dada por la ecuación y = y(x),
entonces
dy(x) Ey 2xy
= = 2 . (2.4)
dx Ex x − y2 − 1
Con un poco de álgebra, la ecuación (2.4) puede ser integrada, obteniendo
x2 + (y − c)2 = 1 + c2 , (2.5)
donde c es una constante de integración. Esta constante puede ser variada desde −∞ a ∞
para generar la familia de lı́neas de √
campo. Para este caso, estas lı́neas son cı́rculos centrados
en y = c con un radio dado por 1 + c2 . Estas son mostradas como lı́neas sólidas en la
figura 2.1. Las flechas indican como el campo apunta desde la carga positiva a la negativa.
Recordemos que donde las lı́neas están más densamente pobladas (entre las dos cargas) es
donde el campo eléctrico es más fuerte.
2.2. OPERADORES VECTORIALES. 21
2.2. Operadores vectoriales.

2.2.1. Notación del operador integral.
El gradiente, la divergencia y el rotor están descritos naturalmente por su forma de ope-
rador. Esto es, que ellos son representados por un sı́mbolo que opera sobre otra cantidad.
~
Por ejemplo, el gradiente de Φ es escrito por ∇Φ. ~ el cual actúa sobre
Aquı́ el operador es ∇,
el operando Φ, lo cual resulta en el gradiente.
En cambio, la integral no es generalmente escrito en su forma de operador. La integral de
f (x) sobre x es escrita de la siguiente forma
Z
f (x) dx , (2.6)
la cual no está escrita en su forma de operador ya que la integral y el operando f (x) están
mezclados. Sin embargo, podemos poner la ecuación (2.6) en forma de operador reorganizando
los términos en la ecuación, como sigue
Z
dx f (x) . (2.7)
R
Ahora el operador dx actúa sobre f (x) para formar la integral, tal como el operador
~ actúa sobre Φ para formar el gradiente. En la práctica, el operador integral es colocado
∇
en la derecha, pasando a través de todos los términos del integrando que no dependen de la
variable de integración. Por ejemplo,
Z Z
2 2 2
dx x (x + y)y = y dx x2 (x + y) . (2.8)
2.2.2. Integrales de lı́nea.

El proceso de tomar una integral a lo largo de un camino es llamado integral de lı́nea y es
una operación común en todas las ramas de la Fı́sica. Por ejemplo, el trabajo que una fuerza
F~ realiza cuando se mueve a través de un camino C es
Z
W = d~r · F~ . (2.9)
C
Aquı́ el operador integral de lı́nea C d~r actúa sobre la fuerza F~ . El vector de desplazamiento
R
diferencial d~r es tangencial a cada punto a lo largo de C, como es mostrado en la figura 2.2.
Si C se cierra sobre sı́ mismo, escribimos el operador con un cı́rculo sobre el signo de integral,
I
d~r . (2.10)
c
Ya que la ecuación (2.9) está escrita en notación vectorial, es válido en cualquier sistema
de coordenadas. En el sistema de coordenadas Cartesiano, d~r = dxi êi y la ecuación (2.9) se
convierte en
dr
C
r
Figura 2.2: La integral de lı́nea.
Z Z
W = d~r · F~ = dxi Fi . (2.11)
C C
Notemos que la cantidad producida por esta integración es un escalar, ya que el subı́ndice i
está sumado implı́citamente.
Hay otras operaciones integrales, las cuales son poco comunes. Por ejemplo, el operador
Z Z
d~r Φ = êi dxi Φ (2.12)
C C
actúa sobre el escalar Φ para producir un vector. Otro ejemplo,
Z Z
d~r × ~v = êk dxi ijk vj , (2.13)
C C
genera un vector usando el producto cruz. Notemos que todas las expresiones con subı́ndices
están escritas en el sistema Cartesiano donde la base de vectores es ortonormal e indepen-
dientes de la posición.
2.2.3. Integrales de superficie.

Las integrales de superficie son representadas por su operador integral
Z
d~σ , (2.14)
S
donde d~σ es un vector que representa un área diferencial. Este vector tiene una magnitud
igual a un área diferencial de S, y una dirección perpendicular a la superficie. Si escribimos
el diferencial de área como dσ y el vector unitario normal n̂, el vector de área diferencial
puede ser reescrito como d~σ = n̂ dσ. Como la superficie tiene dos lados, hay un problema
para definir n̂. Para una superficie simple y cerrada, como por ejemplo la que se muestra
en la figura 2.3(a), definimos n̂ para que siempre apunte hacia afuera. Si la superficie no es
cerrada, es decir, no encierra un volumen, la dirección de n̂ es definida por el camino cerrado
C que define los bordes de la superficie, y la regla de la mano derecha, como se muestra en
la figura 2.3(b).
Frecuentemente, el operador integral de superficie actúa sobre una cantidad vectorial
mediante el producto punto
2.2. OPERADORES VECTORIALES. 23
z z
y y
000000
111111
1111111111111111111
0000000000000000000
000000
111111 1111111111111111111
0000000000000000000
C
0000000000000000000
1111111111111111111
000000
111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
000000
111111
0000000000000000000
1111111111111111111 0000000000000000000
1111111111111111111
000000
111111
0000000000000000000
1111111111111111111 0000000000000000000
1111111111111111111
000000
111111
0000000000000000000
1111111111111111111 dσ 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
000000
111111
0000000000000000000
1111111111111111111 0000000000000000000
1111111111111111111
000000
111111
0000000000000000000
1111111111111111111
000000
111111
0000000000000000000
1111111111111111111 0000000000000000000
1111111111111111111
000000
111111
0000000000000000000
1111111111111111111
00000000000000
11111111111111000000
111111 0000000000000000000
1111111111111111111
00000000000000
11111111111111000000
111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000000
11111111111111
00000000000000111111
11111111111111000000
000000
111111 dσ
x x
(a) (b)
Figura 2.3: Integrales de superficie.
Z
d~σ · ~v . (2.15)
S
En coordenadas cartesianas,
d~σ = dσi êi , (2.16)
donde dσi es positivo ó negativo dependiendo del signo de n̂· êi , como se discutió en el párrafo
anterior. Esta integral de superficie se transforma en
Z Z
d~σ · ~v = dσi vi . (2.17)
S S
Hay integrales de superficie poco comunes, como
Z Z
d~σ Φ = êi dσi Φ , (2.18)
S S
la cual es una operación sobre un escalar, la cual produce un vector, y
Z Z
d~σ × ~v = êk dσi ijk vj (2.19)
S S
la cual también produce un vector.
2.2.4. Integrales de volumen.

Las integrales de volumen son los operadores integrales más sencillos, ya que las variables
de integración son escalares. Son escritas
Z
dτ , (2.20)
V
donde dτ es un volumen diferencial, y V representa el volumen total de integración. La
integral de volumen más común actúa sobre una cantidad escalar y, como resultado, produce
un escalar
Z
dτ Φ . (2.21)
V
En coordenadas cartesianas, esto es escrito como
Z
dx1 dx2 dx3 Φ . (2.22)
V
Las integrales de volumen de cantidades vectoriales también son posibles,

Z Z
dτ ~v = dx1 dx2 dx3 ~v . (2.23)
V V
2.3. Operadores diferenciales.

Por su definición, los campos son funciones de la posición. Análogamente a cómo cambia
una función de una variable, lo cual está descrito por su derivada, la dependencia de la
posición de un campo escalar puede ser descrito por su gradiente, y la dependencia de la
posición de un campo vectorial puede ser descrito por su rotor y su divergencia. El operador
nabla ∇~ es usado para describir estas tres operaciones fundamentales.
El operador ∇ ~ está escrito en una notación independiente del sistema de coordenadas.
Este puede ser expresado con notación de Einstein en el sistema cartesiano como
~ = êi ∂ .
∇ (2.24)
∂xi
Esta expresión será vista en otros sistemas de coordenadas en el capı́tulo siguiente.
Cuando opera sobre un campo escalar, el operador ∇ ~ produce un vector llamado el gra-
diente
~ ∂Φ(x1 , x2 , x3 )
∇Φ(x 1 , x2 , x3 ) = êi . (2.25)
∂xi
Por ejemplo, en electroestática el campo eléctrico es igual a menos el gradiente del potencial
eléctrico
E~ = −∇Φ~ = −êi ∂Φ(x1 , x2 , x3 ) . (2.26)

∂xi
El operador nabla también actúa sobre campos vectoriales vı́a el producto punto o el producto
cruz. La divergencia de un campo vectorial es una cantidad escalar creada usando el producto
punto
~ ·A
∇ ~ = êi ∂ · Aj êj = ∂Ai . (2.27)
∂xi ∂xi
La densidad de carga ρ en una región del espacio puede ser calculada usando la divergencia
de la relación
~ ·E
∇ ~ = 4πρ . (2.28)
2.3. OPERADORES DIFERENCIALES. 25
En cambio, si utilizamos el producto cruz, generamos una cantidad vectorial llamada el

rotor

~ ~ ∂ ∂
∇ × A = êi × Aj êj = Aj ijk êk , (2.29)
∂xi ∂xi
donde hemos utilizado el sı́mbolo de Levi-Civita para expresar el producto cruz en notación
de Einstein. Una de las ecuaciones de Maxwell relaciona el campo eléctrico con la tasa de
cambio del campo magnético usando el rotor,
~
∇ ~ = − 1 ∂B .
~ ×E (2.30)
c ∂t
2.3.1. Vista fı́sica del gradiente.

El gradiente de un campo escalar es un vector que describe, en cada punto, cómo el campo
cambia con la posición. Aplicando producto punto a ambos lados de la ecuación (2.25) con
d~r = dxi êi obtenemos
~ = dxi êi · êj ∂Φ .

d~r · ∇Φ (2.31)
∂xj
Haciendo un poco de álgebra en el lado derecho de la ecuación, obtenemos
~ = ∂Φ dxi .
d~r · ∇Φ (2.32)
∂xi
El lado derecho de esta expresión puede ser reorganizado como la diferencia total de carga
de Φ debido al cambio diferencial de posición d~r. El resultado puede ser escrito en notación
vectorial como sigue
~ · d~r .
dΦ = ∇Φ (2.33)
De la ecuación (2.33), es claro que el valor máximo de dΦ ocurre cuando d~r apunta en la
~
misma dirección que ∇Φ. Por otra parte, un desplazamiento perpendicular a ∇Φ ~ no produce
cambio en Φ, ya que dΦ = 0. Esto significa que el gradiente siempre apuntará perpendicular
a las superficies donde Φ es constante.
Al comienzo de este capı́tulo discutimos la función potencial eléctrico generado por dos
lı́neas de carga. El campo eléctrico fue generado tomando el gradiente de este potencial
escalar, y fue dibujado en la figura 2.1. Pudimos haber usado este ejemplo como modelo para
desarrollar una vista Fı́sica del operador gradiente, pero es un poco complicado. En cambio,
observaremos una función de dos dimensiones mucho más simple
Φ = −xy . (2.34)
Un dibujo de las lı́neas equipotenciales en el plano x−y es mostrado en la figura 2.4. Haciendo
la operación gradiente obtenemos un vector de campo
~ = −yêx − xêy .
∇Φ (2.35)
Figura 2.4: Superficies de Φ = −xy constante.
Ahora imaginemos que estamos en el punto (1, 2) y nos movemos a la derecha una cantidad
infinitesimal dr a lo largo del eje x positivo. El cambio correspondiente en Φ puede ser
determinado calculando
~ · d~r
dΦ = ∇Φ
= (−2êx − 1êy ) · (drêx ) (2.36)
= −2dr .
Esto dice que Φ disminuye en 2 unidades por cada paso infinitesimal en esa dirección. En
cambio, si estamos sentados en el punto (3, 4) y nos movemos una cantidad infinitesimal dr,
con un ángulo de 45◦ con respecto al eje x, Φ cambia de la siguiente forma
~ · d~r
dΦ = ∇Φ
dr
= (−4êx − 3êy ) · √ (êx + êy ) (2.37)
2
7
= − √ dr .
2
Notemos que estos cambios son por pasos infinitesimales. Para calcular el cambio de Φ
sobre un camino finito, donde el gradiente cambia mientras nos vamos moviendo punto a
punto, necesitamos usar la integral de lı́nea
Z
∆Φ = ~ .
d~r · ∇Φ (2.38)
C
Cuando utilizamos el gradiente para generar un campo vectorial, usualmente se añade un
signo negativo en la definición. Por ejemplo, el campo eléctrico es generado desde el potencial
electrostático por
~ = −∇Φ
E ~ . (2.39)
Usando esta convención, si nos movemos en contra de las lı́neas de campo Φ aumenta. Para
el potencial de la ecuación (2.34), el gradiente negativo es
~ = yêx + xêy .
− ∇Φ (2.40)
Las lı́neas de campo para esta función pueden ser determinadas como sigue
dy x
=
dx y
dy y = dx x
y2 = x2 + c
x2 − y 2 =c. (2.41)
Estas lı́neas son perpendiculares a las lineas donde Φ es constante, como es mostrado en
la figura 2.5. Notemos cómo la densidad de las lı́neas del campo vectorial muestran que la
magnitud del campo aumenta a medida que nos movemos al origen.
Figura 2.5: Lı́neas de campo para Φ = −xy.
En resumen, el gradiente de una función escalar Φ genera un campo vectorial el cual, en

cada punto indica la dirección de crecimiento de Φ y yacen perpendiculares a las lı́neas o su-
perficies donde Φ es constante. El ejemplo discutido anteriormente ha sido puesto en práctica
en dos dimensiones, pero el proceso también puede ser visualizado en tres dimensiones, donde
Φ = constante generan superficies, y el gradiente es siempre normal a estas superficies. Salvo
esta visualización, no hay lı́mites en el número de dimensiones para el operador gradiente.
2.3.2. Vista fı́sica de la divergencia.

El operador divergencia será descrito fı́sicamente desarrollando la ecuación de continuidad,
la cual describe el campo en la densidad local de una partı́cula en un fluido como función
del tiempo. Sea ρ(x, y, z, t) el número de partı́culas por unidad de volumen y ~v (x, y, z, t) la
velocidad de estas partı́culas ubicadas en el punto (x, y, z) y en el tiempo t. Consideremos
un volumen diferencial dτ = dx dy dz localizado en (x0 , y0 , z0 ) como se muestra en la figura
2.6. La ecuación de continuidad es obtenida haciendo la suposición que las partı́culas pueden
entrar ó salir de este volumen, y después equiparar el flujo neto de partı́culas con cuántas
partı́culas salieron o entraron con el consecuente cambio en ρ. Si llamamos N ≡ ρ dτ al
número total de partı́culas en el volumen infinitesimal, tenemos
∂N ∂ρ(x0 , y0 , z0 , t)
= dx dy dz . (2.42)
∂t ∂t
1111111111111111111111
0000000000000000000000
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
dz
1111111111111111111111
0000000000000000000000
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000000
1111111111111111111111
dy
0000000000000000000000
1111111111111111111111
x y z
( 0 , 0 , 0) 0000000000000000000000
1111111111111111111111
dx
Figura 2.6: Volumen diferencial.
La tasa de cambio de N en la ecuación (2.42) la tomaremos midiendo el flujo de partı́culas

que pasa a través de las seis caras del volumen diferencial dτ . Consideremos la superficie
achurada inferior de la figura 2.6. El flujo a través de esta superficie puede ser determinado
con la ayuda de la figura 2.7(a). El número total de partı́culas que entran al volumen en un
tiempo dt a través de esta superficie es igual al número de partı́culas en la región sombreada
dx dy vz dt. Notemos que una velocidad positiva vz agrega partı́culas a este volumen, mientras
que si es negativa sucederá lo contrario. Luego, la contribución inferior a ∂N/∂t es
∂Ninferior
= ρ(x0 , y0 , z0 , t) vz (x0 , y0 , z0 , t) dx dy . (2.43)
∂t
vz
vz ( x 0 , y0 , z 0 + dz ) dt
dz
dz
vz
vz ( x 0 , y0 , z 0 ) dt
( x 0 , y0 ,z 0 ) dy dy
( x 0 , y0 ,z 0 )
dx dx
(a) (b)
Figura 2.7: Flujo a través de las caras superior e inferior.
Notemos que tanto como ρ y vz están evaluados en (x0 , y0 , z0 ) en la última ecuación.

Definamos el vector densidad de corriente como J~ = ρ~v . La ecuación (2.43) puede ser escrita
de forma más compacta,
∂Ninferior
= Jz (x0 , y0 , z0 , t) dx dy . (2.44)
∂t
El mismo tipo de cálculo se hace de forma análoga para la cara superior mostrada en la
figura 2.6. La figura 2.7(b) muestra que ahora vz positivo acarrea el número de partı́culas en
la región sombreada del volumen. Este lado contribuye
∂Nsuperior
= −Jz (x0 , y0 , z0 + dz, t) dx dy (2.45)
∂t
al cambio total ∂N/∂t. Notemos que en este caso, evaluamos Jz en el punto (x0 , y0 , z0 + dz).
Combinando las ecuaciones (2.44) y (2.45) obtenemos
∂Ninferior ∂Nsuperior
+ = [Jz (x0 , y0 , z0 , t) − Jz (x0 , y0 , z0 + dz, t)] dx dy . (2.46)
∂t ∂t
Esta expresión puede ser escrita en términos de la derivada de Jz , ya que en el lı́mite diferencial
tenemos

∂Jz
Jz (x0 , y0 , z0 + dz, t) = Jz (x0 , y0 , z0 , t) + dz . (2.47)
∂z (x0 ,y0 ,z0 )
Substituyendo la ecuación (2.47) en (2.46) obtenemos

∂Ninferior ∂Nsuperior ∂Jz
+ =− dx dy dz . (2.48)
∂t ∂t ∂z (x0 ,y0 ,z0 )
Realizando el proceso análogo para las otras cuatro superficies se obtienen resultados simila-
res. Por tanto, el flujo total en el volumen diferencial es
" #
∂N ∂Jx ∂Jy ∂Jz
= − − − dx dy dz . (2.49)
∂t ∂x (x0 ,y0 ,z0 ) ∂y (x0 ,y0 ,z0 ) ∂z (x0 ,y0 ,z0 )
Lo cual es reconocido como −∇~ · J~ por dτ . Combinando este resultado con la ecuación (2.42),
obtenemos la ecuación de continuidad
∂ρ ~ · J~ .
= −∇ (2.50)
∂t
Para una cantidad positiva de la divergencia de J, ~ más partı́culas están dejando la región
que entrando en ella, por tanto ∂ρ/∂t es negativo.
Este ejercicio nos provee la interpretación fı́sica de la divergencia. Si la divergencia de un
campo vectorial es positiva en una región, la región es una fuente. Las lı́neas de campo “nacen”
en las regiones tipo fuente. Por otra parte, si la divergencia en una región es negativa, la región
es considerada un sumidero. Las lı́neas de campo “mueren” en las regiones tipo sumidero. Si
la divergencia de un campo vectorial es cero en una región, todas las lı́neas de campo que
entran deben salir de esa región.
2.3.3. Vista fı́sica del rotor.

El rotor de un campo vectorial es un vector, el cual describe en una escala local la
circulación del campo. De la palabra rotor parece razonable concluir que si un campo vectorial
tiene rotor distinto de cero las lı́neas de campo deben ser “curvadas”, mientras que si un
campo vectorial tiene rotor cero las lı́neas de campo debiesen ser “rectas”. Esta concepción
está errada. Es posible que las lı́neas de un campo vectorial aparezcan como es mostrado en
la figura 2.8(a), describiendo una situación “curvada” y tener rotor igual a cero. También
las lı́neas de campo mostradas en la figura 2.8(b) las cuales son “rectas” pueden tener rotor
distinto de cero. Para resolver esta confusión, debemos mirar el rotor en una escala distinta.
(a) (b)
Figura 2.8: Campos vectoriales circulantes y no circulantes.
Consideremos un campo vectorial ~v que sólo es función de x e y. El rotor de este campo

apunta en la dirección z, y de acuerdo a la ecuación (2.29) está dado por

~ ∂vy ∂vx
∇ × ~v = − êz (2.51)
∂x ∂y
para un sistema de coordenadas Cartesiano.
Consideremos la integral de lı́nea del campo vectorial ~v alrededor de un camino cerrado,
tal como se muestra en la figura 2.9,
I
d~r · ~v . (2.52)
C
El punto de comienzo para la integración es (x0 , y0 ). En esta derivación, necesitamos
tener un poco más de cuidado con las cantidades infinitesimales, en contraste con la sección
anterior. Por esta razón, imponemos que las dimensiones del camino cerrado sean ∆x y ∆y,
como es mostrado en la figura. Luego comprimiremos estas cantidades a infinitesimales para
obtener el resultado final.
La integral a lo largo de C puede ser dividida en cuatro partes. Consideremos la integración
a lo largo de C1 , donde y = y0 y x varı́a desde x0 a ∆x
Z Z x0 +∆x
d~r · ~v = dx vx . (2.53)
C1 x0
C3
C4 C C2
∆y
C1
11
00
00
11
00
11
00
11
(x0 , y0)
∆x
Figura 2.9: Camino cerrado para la integral del rotor.
A lo largo de este segmento podemos expandir vx (x, y0 ) en serie de Taylor, reteniendo el

término lineal en x

∂vx
vx (x, y0 ) ≈ vx (x0 , y0 ) + (x − x0 ) . (2.54)
∂x (x0 ,y0 )
No mantendremos los términos de más alto orden, ya que no harán ninguna diferencia signifi-
cativa en los resultados. Sustituyendo la ecuación (2.54) en (2.53) y realizando la integración,
obtenemos
Z
1 ∂vx
d~r · ~v ≈ vx (x0 , y0 )∆x + (∆x)2 . (2.55)
C1 2 ∂x
(x0 ,y0 )
La próxima integración la realizaremos a lo largo de C3 , la sección superior del camino. A

lo largo de este camino, mantendremos fijo y = y0 + ∆y, mientras que x varı́a desde x0 a
x0 + ∆x. Por tanto,
Z Z x0
d~r · ~v = dx vx . (2.56)
C3 x0 +∆x
Nuevamente, expandimos en Taylor vx (x, y0 + ∆y) a primer orden

∂vx ∂vx
vx (x, y0 + ∆y) ≈ vx (x0 , y0 ) + (x − x0 ) + ∆y . (2.57)
∂x (x0 ,y0 ) ∂y (x0 ,y0 )
Reemplazando (2.57) en (2.56) y realizando la integral, obtenemos
Z
1 ∂vx 2 ∂vx
d~r · ~v ≈ −vx (x0 , y0 )∆x − (∆x) − ∆x∆y . (2.58)
C3 2 ∂x (x0 ,y0 ) ∂y (x0 ,y0 )
Combinando las ecuaciones (2.55) y (2.58) obtenemos

Z Z
∂vx
d~r · ~v + d~r · ~v ≈ − ∆x∆y . (2.59)
C1 C3 ∂y (x0 ,y0 )
Si hacemos el proceso análogo para los caminos C2 y C4 , podemos combinar todos los resul-
tados, obteniendo
I !
∂vy ∂vx
d~r · ~v ≈ − ∆x∆y . (2.60)
C ∂x (x0 ,y0 ) ∂y (x0 ,y0 )
El error de la ecuación (2.60) desaparece cuando las dimensiones del camino disminuyen
a dimensiones infinitesimales, es decir cuando ∆x → 0 y ∆y → 0. Además, utilizando la
ecuación (2.51), el término entre paréntesis del lado derecho de la ecuación (2.60) puede ser
identificado como la componente z de ∇ × ~v . Por tanto, podemos escribir
I Z
lı́m ~
d~r · ~v = êz · (∇ × ~v ) lı́m dσz , (2.61)
C→0 C s→0 S
donde C es el contorno que encierra a S y dσz = dx dy es el área diferencial de esta superficie.

¿Qué nos dice esto acerca del rotor? El resultado en la ecuación (2.61) puede ser reescrito
como
H
~ × ~v ) = lı́m RC d~r · ~v .
êz · (∇ (2.62)
C,S→0
S
dσ z
Esto nos dice que la componente z de ∇ ~ × ~v en un punto es la integral de lı́nea de ~v en

un camino alrededor de este punto, dividido por el área del camino, en el lı́mite cuando el
camino se vuelve muy pequeño. Por tanto, el rotor no nos dice nada acerca de la circulación
en una escala macroscópica.
Por tanto, ahora podemos entender las situaciones de la figura 2.8. Si el campo “curvado”
mostrado en la figura 2.10(a) tiene una magnitud que decae como 1/r, exactamente suficiente
como para compensar el crecimiento en el camino mientras que r aumenta, luego la integral
alrededor del camino diferencial cerrado mostrado en la figura es cero. Por tanto, el rotor en
este punto también es cero. Si la magnitud del campo vectorial “recto” mostrado en la figura
2.10(b) varı́a como indican las lı́neas de densidad, la integral alrededor del camino cerrado
mostrado no puede ser cero y, por tanto, el rotor también tendrá un valor distinto de cero.
000000
111111
111111
000000
000000
111111
000000
111111
000000
111111 C
000000
111111
0000000
1111111
1111111
0000000
0000000
1111111
0000000
1111111
0000000
1111111
0000000
1111111
0000000
1111111 C
(a) (b)
Figura 2.10: Campos con rotor cero, figura (a) y distinto de cero, figura (b).
Hemos derivado la ecuación (2.61) en dos dimensiones y sólo escogimos la componente z

del rotor. La generalización de este resultado a tres dimensiones y cualquier orientación del
camino diferencial viene dada por
I Z
lı́m ~ × ~v ) · lı́m
d~r · ~v = (∇ d~σ . (2.63)
C→0 C s→0 S
2.3.4. Identidades con operadores diferenciales.

La notación de Einstein facilita mucho el trabajo al tener que demostrar igualdades con
los operadores diferenciales. Las relaciones presentadas en esta sección son similares a las
identidades vectoriales discutidas en el capı́tulo anterior, excepto que ahora debemos con-
siderar las reglas del cálculo diferencial. Como las identidades vectoriales, utilizaremos el
sistema de coordenadas cartesiano, pero los resultados finales están expresados en notación
vectorial independiente del sistema de coordenadas.
Ejemplo 1: Consideremos la expresión de operadores ∇·(~ ∇Φ).
~ Escribamos esta expresión
en notación de Einstein, hagamos la sustitución
~ = êi ∂ .
∇ (2.64)
∂xi
~ en la expresión original debe ser escrita usando ı́ndices independientes
Los dos operadores ∇

~ · (∇Φ)
~ ∂ ∂
∇ = êi · êj Φ . (2.65)
∂xi ∂xj
Como los vectores base en el sistema cartesiano son independientes de la posición, ∂êj /∂xi =
0, y la ecuación (2.65) queda

~ ~ ∂ ∂
∇ · (∇Φ) = (êi · êj ) Φ
∂xi ∂xj

∂ ∂
= δij Φ
∂xi ∂xj

∂ ∂
= Φ
∂xi ∂xi
2
∂2 ∂2

∂
= + + Φ. (2.66)
∂x21 ∂x22 ∂x23
En la última lı́nea hemos escrito la suma explı́citamente para hacer notar cómo se trabaja
con la notación para este caso. La ecuación (2.66) puede ser escrita en notación vectorial
definiendo el operador laplaciano ∇2 como
2 2 2

2 ~ ·∇~ = ∂ ∂ ∂ ∂ ∂
∇ =∇ Φ = + + Φ, (2.67)
∂xi ∂xi ∂x21 ∂x22 ∂x23
por tanto
~ · (∇Φ)
∇ ~ = ∇2 Φ (2.68)
Ejemplo 2: Consideremos la expresión ∇ ~ ×∇ ~ × ~v , la cual es el rotor del rotor de ~v . Esta
identidad será útil cuando desarrollemos la ecuación de las ondas electromagnéticas desde las
ecuaciones de Maxwell. Para escribir esto en notación de Einstein, usaremos los sı́mbolos de
Levi-Civita,

~ ~ ∂ ∂
∇ × ∇ × ~v = vs rsj ijk êk . (2.69)
∂xi ∂xr
El álgebra para encontrar la relación es como sigue

~ ~ ∂ ∂vs
∇ × ∇ × ~v = rsj ijk êk
∂xi ∂xr

∂ ∂vs
=− rsj ikj êk
∂xi ∂xr

∂ ∂vs
=− (δri δsk − δrk δsi ) êk
∂xi ∂xr

∂ ∂vi ∂ ∂vk
= êk − êk
∂xi ∂xk ∂xi ∂xi

∂ ∂vi ∂ ∂(vk êk )
= êk − . (2.70)
∂xk ∂xi ∂xi ∂xi
Ası́, el lado derecho de la ecuación (2.70) es convertida a notación vectorial para obtener la
igualdad

∇~ ×∇ ~ × ~v = ∇~ ∇ ~ · ~v − ∇2~v . (2.71)
Notemos que el operador Laplaciano puede actuar tanto en campos escalares como vecto-
riales. En la ecuación (2.68) el Laplaciano opera en un campo escalar, obteniendo un escalar.
En cambio, en la ecuación (2.71) opera sobre un campo vectorial, obteniendo un vector.
2.4. Definiciones integrales de los operadores diferen-

ciales.
En las ecuaciones (2.25), (2.27) y (2.29) se muestran relaciones para hacer cálculos con la
divergencia, el gradiente y el rotor. Cada una de estas relaciones son válidas sólo en un sistema
de coordenadas cartesianas y están en términos de las derivadas espaciales de los campos.
Las definiciones integrales de cada operador también existen. Ya derivamos la expresión para
el rotor en la ecuación (2.63). En esta sección, presentamos definiciones similares para el
gradiente y la divergencia. Sus derivaciones, las cuales son similares a la ecuación (2.63)
están en los textos de cálculo. Sólo presentaremos los resultados.
El gradiente de un campo escalar en un punto particular puede ser generado por
H
~ = lı́m RS Φ d~s ,
∇Φ (2.72)
S,V →0
V
dτ
donde V es el volumen que incluye el punto de interés y S es la superficie cerrada que encierra
a V . Tanto V como S deben ser reducidas a tamaño infinitesimal para que esta relación se
cumpla.
2.5. LOS TEOREMAS. 35
Para obtener la divergencia de un campo vectorial en un punto, debemos integrar el

campo vectorial sobre una superficie infinitesimal S que encierre al punto, y dividimos por
el volumen infinitesimal,
~
H
~ ·A
∇ ~ = lı́m SRd~σ · A . (2.73)
S,V →0
V
dτ
Ya habı́amos obtenido la definición integral para el rotor,
I Z
lı́m ~
d~r · ~v = ∇ × ~v · lı́m d~s . (2.74)
C→0 C S→0 S
Esta definición es un poco torpe, ya que requiere el cálculo de tres integrales diferentes,
cada una con diferentes orientaciones de S, para obtener las tres componentes del rotor. La
definición integral que daremos a continuación no tiene este problema, pero usa una forma
poco común de integral de superficie
~
H
~ ×A
∇ ~ = lı́m S Rd~σ × A . (2.75)
S,V →0
V
dτ
2.5. Los teoremas.

Los operadores diferenciales nos proveen información acerca de la variación de campos
escalares y vectoriales en una escala infinitesimal. Para aplicarlos en escala macroscópica ne-
cesitamos introducir cuatro teoremas importantes. Estos son el Teorema de Gauss, el Teorema
de Green, el Teorema de Stokes y el Teorema de Helmholtz, los cuales pueden ser directa-
mente derivados de las definiciones integrales de los operadores. Damos especial atención en
la demostración y discusión del Teorema de Helmholtz ya que no es cubierto adecuadamente
en muchos textos.
2.5.1. Teorema de Gauss.

El teorema de Gauss lo podemos deducir de la ecuación (2.73), escribiéndola de una
manera ligeramente distinta
I
~ ~ ~.
∇ · A dτ = lı́m d~σ · A (2.76)
S→0 S
En esta ecuación, la superficie cerrada S rodea completamente el volumen dτ , el cual ha sido

escrito infinitesimalmente.
La ecuación (2.76) puede ser aplicada en dos volúmenes adyacentes dτ1 y dτ2 que tienen
una superficie en común, como se muestra en la figura 2.11
I I
~ ~ ~ ~
∇ · A dτ1 + ∇ · A dτ2 = ~
d~σ · A + ~.
d~σ · A (2.77)
S1 S2
Las contribuciones a la integral de superficie de las superficies comunes se cancelan como se

ve en la figura, por lo que la ecuación (2.77) puede ser escrita como
d σ1
1111111111
0000000000
0000000000
1111111111
0000000000
1111111111 1111111111
0000000000
0000000000
1111111111 0000000000
1111111111
0000000000
1111111111
0000000000
1111111111
0000000000
1111111111
dτ 2 0000000000
1111111111
0000000000
1111111111
0000000000
1111111111
0000000000
1111111111 0000000000
1111111111
0000000000
1111111111
0000000000
1111111111
0000000000
1111111111 0000000000
1111111111
0000000000
1111111111 0000000000
1111111111
0000000000
1111111111
0000000000
1111111111
0000000000
1111111111 0000000000
1111111111
0000000000
1111111111 0000000000
1111111111
0000000000
1111111111
0000000000
1111111111 0000000000
1111111111
0000000000
1111111111 0000000000
1111111111
0000000000
1111111111 0000000000
1111111111
0000000000
1111111111 0000000000
1111111111
0000000000
1111111111
0000000000
1111111111 0000000000
1111111111
0000000000
1111111111
0000000000
1111111111
d τ1
dσ2
A . dσ1 + A . dσ2 = 0
Figura 2.11: La suma de dos volúmenes diferenciales.
I
∇ ~ dτ1 + ∇
~ ·A ~ ·A
~ dτ2 = ~,
d~σ · A (2.78)
S1+2
donde S1+2 es la superficie exterior que encierra tanto como a dτ1 como dτ2 , como es mostrado
en la figura 2.12. Podemos continuar este proceso sumando volúmenes diferenciales contiguos
para formar un volumen arbitrario V encerrado por una superficie cerrada S. El resultado es
llamado el Teorema de Gauss
Z I
~ ~
dτ ∇ · A = ~.
d~σ · A (2.79)
V S
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
11111111111111111111
00000000000000000000
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
S 1+2
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
00000000000000000000
11111111111111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
d τ1 + dτ 2 0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
0000000000
1111111111
00000000000
11111111111
Figura 2.12: La suma de dos volúmenes diferenciales.
2.5.2. Teorema de Green.

El teorema de Green puede ser escrito de dos formas y se puede derivar directamente
usando el Teorema de Gauss y algunas manipulaciones algebraicas. Comencemos conside-
~ · (u∇v),
rando la expresión ∇ ~ donde u y v son campos escalares. Usando una identidad de
operadores, la cual puede ser demostrada fácilmente, podemos escribir
~ · (u∇v)
∇ ~ = ∇u
~ · ∇v
~ + u∇2 v . (2.80)
Cambiando u con v, tenemos
~ · (v ∇u)
∇ ~ = ∇v
~ · ∇u
~ + v∇2 u . (2.81)
Restando la ecuación (2.80) con (2.81), tenemos
~ · (u∇v)
∇ ~ −∇~ · (v ∇u)
~ = u∇2 v − v∇2 u . (2.82)
Finalmente, integramos ambos lados en la ecuación (2.82) sobre un volumen V , y aplicando
el Teorema de Gauss, obtenemos una forma del Teorema de Green
I Z
~ ~
d~σ · (u∇v − v ∇u) = dτ [u∇2 v − v∇2 u] . (2.83)
S V
En esta expresión, la superficie cerrada S rodea el volumen V . El mismo proceso es aplicado
directamente en la ecuación (2.80), con lo cual obtenemos una segunda forma del Teorema
de Green
I Z
~
d~σ · (u∇v) = ~ · ∇v
dτ [∇u ~ + u∇2 v] . (2.84)
S V
2.5.3. Teorema de Stokes.

El teorema de Stokes se deriva de la ecuación (2.74)
I
~ ~
(∇ × A) · d~σ = lı́m ~,
d~r · A (2.85)
C→0 C
donde C es el camino que encierra la superficie diferencial d~σ .
La deducción del Teorema de Stokes se sigue de forma similar que para el Teorema de
Gauss. La ecuación (2.85) es aplicada a dos superficies diferenciales adyacentes que tienen
un borde en común, como es mostrado en la figura 2.13. El resultado es
I
~ × A)
(∇ ~ · d~σ1 + (∇
~ × A)
~ · d~σ2 = ~
d~r · A (2.86)
C1+2
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
11111111111
00000000000 0000000000000000000
1111111111111111111
1111111111111111111
0000000000000000000
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
C2
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
C1+2
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111
11111111111 C1
00000000000
11111111111
00000000000
00000000000
11111111111
00000000000
11111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
dσ2 00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
dσ1 + dσ2
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
dσ1
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
00000000000
11111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
00000000000
11111111111 0000000000000000000
1111111111111111111
Figura 2.13: La suma de dos superficies diferenciales.
donde el camino C1+2 es el camino cerrado por dσ1 y dσ2 . Las integrales de lı́nea a lo largo
de los bordes C1 y C2 se cancelan. Cualquier número de éstas áreas diferenciales pueden ser
sumadas para formar una superficie S arbitraria y el contorno cerrado C el cual rodea a S.
El resultado es el Teorema de Stokes
Z I
~ ~
d~σ · (∇ × A) = ~.
d~r · A (2.87)
S C
Hay una consecuencia importante del Teorema de Stokes para los campos vectoriales que
tienen rotor cero. Tales campos pueden ser siempre derivados desde un potencial escalar. Es
~ A
decir, si ∇× ~ = 0 en todo el espacio, existe una función escalar Φ(~r) tal que A
~ = −∇Φ.
~ Para
ver esto, consideremos los puntos 1 y 2 y dos caminos A y B arbitrarios entre ellos, como se
muestra en la figura 2.14. Una integral de lı́nea cerrada puede ser formada combinando los
caminos A y el contrario del camino B. Si ∇ ~ ×A ~ = 0 en todos lados, la ecuación (2.87) nos
permite escribir
Z Z I
~
d~r · A − ~
d~r · A = d~r · A ~=0, (2.88)
A B
ó
Z Z
~=
d~r · A ~.
d~r · A (2.89)
A B
~ entre los dos puntos es independiente

La ecuación (2.89) nos dice que la integral de lı́nea de A
del camino que se elija. Esto significa que es posible definir una función escalar de la posición
Φ(~r) tal que su diferencial total esté dado por
~.
dΦ = −d~r · A (2.90)
Es convencional poner el signo negativo tal que Φ aumente cuando se mueve en contra de
~ Reemplazando la ecuación (2.90) en las integrales de lı́nea (2.89)
las lı́neas de campo de A.
muestra que estas integrales de lı́nea son iguales a
Z 2
−dΦ = Φ(1) − Φ(2) . (2.91)
1
Recordando la ecuación (2.33), es claro que la condición de la ecuación (2.90) puede ser
reescrito como
Punto 2
Camino A
Camino B
Punto 1
Figura 2.14: El Teorema de Stokes implica un potencial escalar.

~ = −∇Φ
A ~ . (2.92)
En resumen, si el rotor de un campo vectorial es cero, el campo es derivable desde un campo
escalar. Las integrales de lı́nea de este tipo de campos vectoriales es siempre independiente
del camino tomado. Estos tipos de campo son llamados campos conservativos.
2.5.4. Teorema de Helmholtz.

El Teorema de Helmholtz se enuncia de la siguiente manera:
Un campo vectorial, si existe, es determinado en forma única especificando su

divergencia y rotor en cualquier punto dentro de una región y su componente
normal en la superficie cerrada que rodea esta región.
Hay dos partes muy importantes en este enunciado. Por una parte, dice que si tenemos un
campo ~v que estamos tratando de determinar, y conocemos los valores de ∇ ~ · ~v y ∇
~ × ~v en
todos los puntos en algún volumen más la componente normal de ~v en la superficie de este
volumen, hay un sólo ~v que hará todo el trabajo. Por otra parte, hemos hecho la aclaración “si
es que existe”. Esta calificación es necesaria ya que es enteramente posible especificar valores
para la divergencia, el gradiente, el rotor y la componente normal de un campo vectorial que
no pueden ser satisfechas por cualquier campo.
Para probar el Teorema de Helmholtz supondremos dos campos vectoriales ~v1 y ~v2 que
poseen los mismos valores de la divergencia, el gradiente, el rotor y la componente normal.
Luego, mostraremos que si se da este caso, las dos soluciones deben ser iguales. Además, sea
~ = ~v1 − ~v2 . Ya que la divergencia, el rotor y el producto punto son operadores lineales, w
w ~
debe cumplir las siguientes propiedades
~ ·w
∇ ~ = 0 en la región
~ ×w
∇ ~ = 0 en la región (2.93)
n̂ · w
~ = 0 en la superficie.
~ ×w
Ya que ∇ ~ = 0, w
~ puede ser derivado de un potencial escalar
w ~ .
~ = −∇Φ (2.94)
Ahora aplicamos el Teorema de Green, en la forma de la ecuación (2.84), con u = v = Φ,
obteniendo
I Z h i
~
d~σ · Φ(∇Φ) = dτ Φ∇ ~ · (∇Φ)
~ ~ · ∇Φ
+ ∇Φ ~ . (2.95)
S V
Reemplazando en la ecuación (2.95), obtenemos

I Z
d~σ · Φw
~= ~ ·w
dτ (Φ∇ ~ −w
~ · w)
~ . (2.96)
S V
Usando la ecuación (2.93), que la integral de superficie en el lado izquierdo de la ecuación y

la integral de volumen de Φ∇ ~ ·w
~ son ambas cero y que se cumple
Z Z
~ ·w
dτ w ~= ~ 2=0.
dτ |w| (2.97)
V V
2
Ya que |w|
~ es siempre una cantidad positiva, la única manera de que se satisfaga la ecuación
(2.97) es que se cumpla w~ = 0 en todo el espacio. Por tanto, ~v1 = ~v2 y hemos probado el
Teorema de Helmholtz.
El Teorema de Helmholtz es útil para separar los campos vectoriales en dos partes, una
con rotor cero y otra con divergencia cero. Esta discusión se apoya en dos identidades
~ · (∇
∇ ~ × A)
~ =0 (2.98)
~ × ∇Φ
∇ ~ =0, (2.99)
lo cual puede ser probado fácilmente. Escribimos ~v como
~v = ∇ ~ − ∇Φ
~ ×A ~ . (2.100)
Luego, podemos escribir
~ · ~v = −∇2 Φ
∇
~ × ~v = ∇
∇ ~ ×∇ ~ ×A~
~ ×A
n̂ · ~v = n̂ · (∇ ~ − ∇Φ)
~ , (2.101)
~ y Φ están fijos,
ya que la divergencia, el rotor y la componente normal están todas fijas si A
el Teorema de Helmholtz dice que ~v es único. Notemos que la contribución a ~v que viene
de A~ no tiene divergencia, ya que ∇ ~ · (∇
~ × A)
~ = 0. Esto es llamado el rotacional o la parte
solenoidal del campo y A ~ es llamado el potencial vector. La porción de ~v que viene de Φ
~
no tiene rotor, ya que ∇ × ∇Φ~ = 0. Esto es llamado la parte irrotacional del campo y Φ es
llamado el potencial escalar.
Capı́tulo 3
Sistemas de Coordenadas Curvilı́neos.

Hasta este punto, nuestra discusión de operadores vectoriales, diferenciales e integrales ha

estado limitada a sistemas de coordenadas cartesianas. Aunque conceptualmente son simples,
estos sistemas a menudo no utilizan la simetrı́a natural de ciertos problemas. Considere el
vector campo eléctrico creado por una carga puntual q ubicada en el origen de un sistema
cartesiano. Usando una base cartesiana de vectores, este campo es
~ = q xx̂ + y ŷ + z ẑ .
E (3.1)
(x2 + y 2 + z 2 )3/2
En contraste, un sistema esférico, descrito por las coordenadas (r, θ, φ), explota completa-
mente la simetrı́a de éste campo y simplifica la ecuación (3.1) a
~ = q r̂ ,
E (3.2)
r2
El sistema esférico pertenece a la clase de sistema de coordenadas curvilı́neas. Los vectores

base de un sistema curvilı́neo son ortonormales, tal como los de un sistema cartesiano, pero
sus direcciones pueden ser funciones de la posición.
Este capı́tulo generaliza los conceptos de los capı́tulos previos para incluir sistemas de
coordenadas curvilı́neos. Los dos sistemas más comunes, esféricos y cilı́ndricos son descritos
primero con el fin de proporcionar un marco para una discusión más abstracta de coordenadas
curvilı́neas generalizadas que sigue.
3.1. El vector posición

El vector posición ~r(P ) asociado con un punto P describe el desplazamiento desde el
origen del sistema de coordenadas. Este tiene una magnitud igual a la distancia desde el
origen hasta P y una dirección que apunta desde el origen a este punto.
1
Este capı́tulo está basado en el tercer capı́tulo del libro: Mathematical Physics de Brusse Kusse & Erik
41
42 CAPÍTULO 3. SISTEMAS DE COORDENADAS CURVILÍNEOS.
e1 e1 r (P)
P P
11
00
00
11 11
00
00
11
00
11 00
11
r (P) e2 e2
Figura 3.1: El vector posición
Parece natural dibujar el vector posición entre el origen y P como muestra la figura
3.1a. Aunque esto está bien para sistemas de coordenadas cartesianas, esto puede acarrear
dificultades en sistemas curvilı́neos. Los problemas surgen debido a la dependencia de la
posición de los vectores base del sistema curvilı́neo. Cuando dibujamos un vector, debemos ser
cuidadosos de dónde está ubicado. Si no lo hacemos, podrı́a no ser claro como descomponer
el vector en términos de su base. A pesar de esta dificultad, el vector y su base podrı́an
ser dibujados partiendo desde un mismo punto. Las componentes del vector curvilı́neo son
entonces fácilmente obtenidas proyectando el vector en sus bases. Consecuentemente, para
determinar las componentes del vector posición, es mejor dibujarlo, ası́ como sus vectores
base, emanando desde P . Esto es mostrado en la figura 3.1b. Hay situaciones, sin embargo,
en que es mejor dibujar el vector posición desde el origen. Por ejemplo, integrales de lı́nea,
como la mostrada en la figura 2.2 son mejor descritas de esta forma, porque la punta del
vector posición sigue el camino de integración. Nosotros ubicaremos el vector posición como
se muestra en la figura 3.1, dependiendo de cuál es la más apropiada para la situación dada.
En coordenadas cartesianas, la expresión para el vector posición es intuitiva y simple:
~r = ri êi = xi eˆi (3.3)
Las componentes (r1 , r2 , r3 ) son fácilmente identificadas como las coordenadas cartesianas
(x1 , x2 , x3 ). Formalmente, r1 es obtenida haciendo el producto punto entre el vector base eˆ1
y el vector posición ~r:
r1 = ê1 · ~r = x1 (3.4)
Si bien esto puede parecer exagerada, esta técnica puede ser usada para encontrar las com-
ponentes de un vector en cualquier sistema de coordenadas ortogonales.
3.2. El sistema cilı́ndrico

Las coordenadas de un punto P descrito en un sistema cilı́ndrico son (ρ, φ, z). Las ecua-
ciones
3.2. EL SISTEMA CILÍNDRICO 43
x = ρ cos φ
y = ρ sen φ (3.5)
z=z
y las correspondientes ecuaciones inversas
p
ρ = x2 + y 2
φ = tan−1 (y/x) (3.6)
z=z
gobiernan la relación entre coordenadas cilı́ndricas y las coordenadas de un superimpuesto

sistema cartesiano, como muestra la figura 3.2a.
Los vectores base unitarios para el sistema cilı́ndrico son mostrados en la figura 3.2b. Cada
vector base apunta en la dirección en que P se mueve cuando el correspondiente valor de la
coordenada es incrementado. Por ejemplo, la dirección de êρ se encuentra observando como P
se mueve al incrementar ρ. Este método puede ser utilizado para determinar la dirección de
los vectores base de cualquier conjunto de coordenadas. A diferencia del sistema cartesiano,
los vectores base cilı́ndricos no están fijos. Como el punto P se mueve, las direcciones de êρ y
êφ cambian. Notemos también que si P se encuentra exactamente en el eje z, es decir, ρ = 0,
las direcciones de êρ y êφ se indefinen.
Las coordenadas cilı́ndricas, tomadas en el orden (ρ, φ, z), forman un sistema de la mano
derecha. Si usted alı́nea su mano derecha a través de êρ , y entonces rotar sus dedos apuntando
en la dirección de êφ , su pulgar apuntará en la dirección de êz . Los vectores base son también
ası́
êρ · êφ = êρ · êz = êz · êφ = 0

êρ · êρ = êφ · êφ = êz · êz = 1 (3.7)
El vector posición expresado en coordenadas cilı́ndricas es
~r = (~r · êρ ) êρ + (~r · êφ ) êφ + (~r · êz ) êz (3.8)
z z
ez
000
111
111
000
000
111 e
z 000
111
000
111
φ
P P 000
111
000
111
1
0 000
111
1
0
000
111
000
111
000
111
000
111
111
000
111
000
000
111
000
111
eρ
φ
y y
ρ
x x
Figura 3.2: El sistema cilı́ndrico
z
ez
1111
0000
0000
1111 e
0000
1111
0000
1111
φ
000000
1111110000
1111
000
111 111111
000000 r
000000
1111110000
1111
1
0
000
111 000000
111111
000000
111111
000000
111111000
111
000
111 ez 000000
111111
000000
111111
000000
111111
000000111
111111000
000
111 000000
111111
000000
111111
000000
111111
000000111
r
111111000
000
111 000000
111111
000000
111111
000000
111111
000000
111111000 ρ
111 e 000000
111111
000000
111111
000000
111111
000000
111111 000000
111111
000000
111111
000000
111111 0000
1111
000000
111111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
y 0000
1111
eρ
x
Figura 3.3: El vector posición en el sistema cilı́ndrico
Notemos que êφ está siempre perpendicular a ~r, como se muestra en la figura 3.3, por lo
tanto la ecuación (3.8) se reduce a
~r = rρ êρ + rz êz (3.9)

La versión bidimensional del sistema cilı́ndrico, con sólo las coordenadas (ρ, φ), es llamado
un sistema polar plano. Este sistema, mostrado en la figura 3.4a, tiene vectores base êρ y êφ .
El vector posición, mostrado en la figura 3.4b, tiene sólo una componente ρ y es expresado
como
~r = ρ êρ (3.10)
3.3. SISTEMA ESFÉRICO 45
Recuerde que un vector arbitrario ~v , a diferencia del vector posición, puede tener ambas
componentes (ρ y φ), como se muestra en la figura 3.5.
y y
eφ r
eρ eφ
11
00
00
11 11
00
00
11
00
11 00
11 eρ
P P
φ
x x
Figura 3.4: El sistema polar
v
y
rφ
eφ rρ
11
00
00
11
00
11 eρ
P
x
Figura 3.5: Componentes polares de un vector
3.3. Sistema esférico

Las tres coordenadas (r, θ, φ) describen un punto en un sistema de coordenadas polares
esféricas. Su relación con un conjunto de coordenadas cartesianas se muestra en la figura 3.6.
Las ecuaciones
x = r sen θ cos φ
y = r sen θ sen φ (3.11)
z = r cos θ
y las inversas
p
r= x2 + y 2 + z 2
!
x
φ = cos−1 p
x2 + y 2 (3.12)
!
z
θ = cos−1 p
x2 + y 2 + z 2
permiten una conversión entre los dos sistemas de coordenadas.

La base de vectores unitarios para el sistema esférico se muestra en la figura 3.6b. Como
con las coordenadas cilı́ndricas, obtenemos la dirección de cada vector base incrementando la
coordenada asociada y observando como se mueve P . Note como los vectores base cambian
con la posición de el punto P . Si P se encuentra en el eje z las direcciones para êθ y êφ no
están definidas. Si P se encuentra en el origen êr tampoco está definido.
El sistema esférico, con las coordenadas en el orden (r, θ, φ), es un sistema de la mano
derecha, tal como en el sistema Cartesiano y en el sistema cilı́ndrico. También es un sistema
ortonormal porque
êr · êθ = êr · êφ = êθ · êφ = 0

êr · êr = êθ · êθ = êφ · êφ = 1 (3.13)
z z
e
111 r
000
000
111
000
111
000
111
00000
11111
000
111
00000
11111
000
111
00000
11111
000
111
0000
1111 e
θ 1
0 P 1
0
00000
11111
000 φ
111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
r eθ
φ
y y
x x
Figura 3.6: El sistema esférico

3.4. SISTEMAS CURVILÍNEOS GENERALES 47
er
r
1
0
eφ
r er
eθ 11
00
eφ
eθ
y
x
Figura 3.7: El vector posición en coordenadas esféricas
El vector posición, mostrado en la figura 3.7, está expresado en el sistema esférico como
~r = (~r · êρ ) êρ + (~r · êθ ) êθ + (~r · êφ ) êφ (3.14)
Como ~r es siempre perpendicular a êθ y a êφ , la ecuación (3.14) se simplifica a
~r = rêr (3.15)
3.4. Sistemas curvilı́neos generales

Aunque los más comunes, el sistema de coordenadas cilı́ndricas y el sistema de coorde-
nadas polares esféricas son sólo dos ejemplos de una gran familia de sistemas curvilı́neos.
Un sistema es clasificado como curvilı́neo si este tiene vectores base ortonormales, pero no
necesariamente constantes. Otros sistemas curvilı́neos menos comunes son el toroidal, el hi-
perbólico y el elı́ptico. En lugar de trabajar individualmente con las operaciones vectoriales
del capı́tulo anterior para cada uno de estos sistemas, se presenta un enfoque general que
pueda abordar cualquier geometrı́a curvilı́nea.
3.4.1. Coordenadas, vectores base y factores de escala

Las coordenadas (q1 , q2 , q3 ) y los correspondientes vectores base q̂1 , q̂2 y q̂3 serán usados
para representar cualquier sistema curvilı́neo genérico como se ve en la figura 3.8. Debido
a que estos vectores base son funciones de posición, deberı́amos siempre tener el cuidado
de dibujarlos saliendo desde un punto particular, como se mencionó anteriormente en este
capı́tulo.
q1
11
00
00
11
q2
P (q1 ,q2 ,q3)
q3
x
Figura 3.8: Coordenadas curvilı́neas y vectores bases
En el sistema de coordenadas cilı́ndrico y esférico existı́a un conjunto de ecuaciones que

relacionaban sus coordenadas con un conjunto “standard” de coordenadas cartesianas. Para
el caso general, escribimos estas ecuaciones como
xi = xi (q1 , q2 , q3 ) (3.16)
qi = qi (x1 , x2 , x3 ) , (3.17)
Donde el subı́ndice de la notación se ha arrastrado para mantener las cosas concisas. En

estas dos ecuaciones, el subı́ndice i toma los valores (1, 2, 3). Las variables xi siempre repre-
sentan coordenadas Cartesianas, mientras que los qi son coordenadas curvilı́neas generales.
Una expresión para q̂i , el vector base unitario asociado con la coordenada qi , puede ser
construida incrementando qi , observando como el vector posición cambia y entonces norma-
lizando:
∂~r/∂qi
q̂i = (3.18)
hi
donde hi = |∂~r/∂qi |. Esta ecuación es un poco confusa porque no hay una suma sobre el
ı́ndice i en el lado derecho, aunque el ı́ndice aparece dos veces. Esto está sutilmente implı́cito
en la notación, porque hay un subı́ndice i al lado izquierdo. Los hi , los cuales a veces son
llamados factores de escala, obligan a los vectores base a tener largo unitario. Ellos pueden ser
escritos en términos de las coordenadas curvilı́neas. Para ver esto, escriba el vector posición
en términos de sus componentes Cartesianas, que a su vez se escriben como función de las
coordenadas curvilı́neas:
~r = xj (q1 , q2 , q3 ) êj (3.19)

Para ello,
∂~r ∂xj (q1 , q2 , q3 )

= êj (3.20)
∂qi ∂qi
s 2 2 2
∂~r ∂x1 ∂x2 ∂x3
hi = =
+ + (3.21)
∂qi ∂qi ∂qi ∂qi
La interpretación fı́sica de los factores de escala es simple. Para un cambio dq1 de la

coordenada q1 , el vector posición cambia una distancia |dq1 h1 |. Para ello, usando la ecuación
(3.18), el vector desplazamiento puede ser escrito en el sistema curvilı́neo como
∂~r
d~r = dqi
∂qi
= dqi hi (q1 , q2 , q3 ) q̂i (3.22)
donde ahora hay una suma sobre el ı́ndice i en el lado derecho ya que no hay subı́ndice
en el lado izquierdo. Ya que los factores hi pueden cambiar con la posición, un elemento
de volumen diferencial en un sistema curvilı́neo, no es necesariamente un cubo como en el
sistema Cartesiano. Como veremos en la próxima sección, los lados de un volumen diferencial
en un sistema curvilı́neo varı́an en largo y pueden tener curvatura.
3.4.2. Geometrı́a diferencial.
La figura 3.9 representa una superficie diferencial encerrando en volumen infinitesimal en

un sistema curvilı́neo. Esta figura será la base para la derivación, en coordenadas curvilı́neas
generales, de la divergencia y el rotor, ası́ como de integrales de superficie y de volumen.
q3
11111111111111111111111
00000000000000000000000
00000000000000000000000
11111111111111111111111
q2
)d
00000000000000000000000
11111111111111111111111
00000000000000000000000
11111111111111111111111
d q 3
00000000000000000000000
11111111111111111111111
+
,q 3
00000000000000000000000
11111111111111111111111
,q 2
00000000000000000000000
11111111111111111111111
h11111111111111111111111
00000000000000000000000
( q1
00000000000000000000000
11111111111111111111111
2
00
11
( q , q2 ,q + dq 1100000000000000000000000
11111111111111111111111
) 11111111111111111111111
00
00000000000000000000000
311
00
00000000000000000000000
11111111111111111111111
1 3
h1111111111111111111
0000000000000000000
00000000000000000000000
11111111111111111111111
0000000000000000000
1111111111111111111
( q , q ,q +
00000000000000000000000
11111111111111111111111
0000000000000000000
1111111111111111111
1
1
dq ) q2
2
0000000000000000000
1111111111111111111
3
3 dq
0000000000000000000
1111111111111111111
0000000000000000000
1111111111111111111
1
h3 (q1 ,q2 ,q3 ) d q3
0000000000000000000
1111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000000
1111111111111111111111 q1
0000000000000000000
1111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000
1111111111111111111
0000000000000000000000
1111111111111111111111
dq
2
0000000000000000000
1111111111111111111
0000000000000000000000
1111111111111111111111
,q )
0000000000000000000
1111111111111111111
0000000000000000000000
1111111111111111111111
3
0000000000000000000
1111111111111111111
0000000000000000000000
1111111111111111111111
,q
2
0000000000000000000
1111111111111111111
0000000000000000000000
1111111111111111111111
(q
1
0000000000000000000
1111111111111111111
0000000000000000000000
1111111111111111111111
0000000000000000000
1111111111111111111
2
0000000000000000000000
1111111111111111111111
h
0000000000000000000
1111111111111111111
0000000000000000000000
1111111111111111111111
q ) dq
0000000000000000000
1111111111111111111
0000000000000000000000
1111111111111111111111
,q
0000000000000000000
1111111111111111111
, 3
1
(q ,q ,q1111111111111111111111
0000000000000000000000
(q 2
1
1 2
) h 3
1
Figura 3.9: Volumen diferencial de un sistema de coordenadas curvilı́neas
El volumen está formado escogiendo un punto de partida (q1 , q2 , q3 ) y luego construyendo

otros siete vértices moviéndose desde este punto con pequeños cambios de coordenadas dq1 ,dq2
y dq3 . En el lı́mite diferencial, la longitud a lo largo de cada borde del cubo deformado
está dado por el correspondiente dqi veces su factor de escala. El factor de escala se evalúa en
un conjunto de coordenadas que corresponde a su valor inicial en el borde. Si la coordenada
qi es igual a qi + dqi todos a lo largo de un borde, éste se fija en qi + dqi . Si la coordenada qi va
desde qi hasta qi + dqi en un borde, éste se fija en qi . Esta es una manera un poco arrogante
de tratar la dependencia de la posición de estos factores, aunque se den todos los resultados
correctos para nuestras derivaciones. Un acercamiento más riguroso, en el cual evalúa el valor
medio del factor de escala en cada borde puede ser hecha explı́citamente.
Siguiendo este acercamiento, un elemento diferencial de volumen es simplemente
dτ = dq1 dq2 dq3 h1 h2 h3 |(q1 ,q2 ,q3 ) , (3.23)

donde los hi están evaluados en el punto (q1 , q2 , q3 ). La superficie diferencial de la cara som-
breada inferior es
d~σinferior = − dq1 dq2 h1 h2 q̂3 |(q1 ,q2 ,q3 ) , (3.24)

donde el signo menos es debido a que la superficie normal es antiparalela a q̂3 . Por el contrario,
la superficie diferencial de la cara sombreada superior es
d~σsuperior = dq1 dq2 h1 h2 q̂3 |(q1 ,q2 ,q3 +dq3 ) , (3.25)

El signo menos no aparece porque ahora la superficie es paralela a q̂3 . En este caso h1 , h2 y
el vector base q̂3 están evaluados en el punto (q1 , q2 , q3 + dq3 ).
3.4.3. El vector desplazamiento

El vector desplazamiento d~r juega un rol central en las matemáticas de sistemas cur-
vilı́neos. Una vez que la forma de d~r es conocida, las ecuaciones para la mayorı́a de las
operaciones vectoriales puede ser fácilmente determinada. Según el cálculo diferencial multi-
variable, d~r puede ser escrito
∂~r
d~r = dqi . (3.26)
∂qi
Como mostramos en la ecuación (3.22), este puede ser escrito usando los factores de escala
como
d~r = dqi hi q̂i , (3.27)

En un sistema Cartesiano qi = xi , q̂i = êi y hi = 1, ası́ la ecuación (3.27) se convierte en
la familiar
d~r = dxi êi . (3.28)

En coordenadas cilı́ndricas, h1 = hρ = 1, h2 = hφ = ρ y h3 = hz = 1 ası́
d~r = dq1 q̂1 + ρdq2 q̂2 + dq3 qˆ3

= dρêρ + ρdφêφ + dzêz . (3.29)
3.4.4. Producto de vectores

Como los sistemas curvilı́neos son ortonormales, tenemos que
q̂i · q̂j = δij . (3.30)

~ y B,
Esto significa que el producto punto de dos vectores, A ~ tienen la misma forma que
en un sistema Cartesiano:
~·B
A ~ = Ai q̂i · Bj q̂j = Ai Bj δij = Ai Bi . (3.31)
Aquı́ Ai y Bi son las componentes curvilı́neas de los vectores, las cuales pueden ser
obtenidas tomando las proyecciones a los ejes paralelos de los vectores en los vectores base:
~ · q̂i .
Ai = A (3.32)
Con el orden correcto, siempre podemos arreglar nuestras tres coordenadas curvilı́neas
para ser un sistema de la mano derecha. Entonces, la forma del producto cruz es también
~ yB
la misma como en un sistema Cartesiano. El producto cruz de A ~ expresado usando los
sı́mbolos de Levi-Civita es
~×B
A ~ = Ai q̂i × Bj q̂j = Ai Bj q̂k ijk . (3.33)
3.4.5. La integral de lı́nea

Usando la expresión para el vector desplazamiento en la ecuación (3.27), la integral de
lı́nea en sistemas curvilı́neos es sencillamente
Z Z
d~r · ~v = dqj hj q̂j · vi q̂i . (3.34)
C
En el lado derecho de la ecuación hay una suma sobre i y j. Ya que la base de vectores
curvilı́neos es ortonormal, la integral de lı́nea se transforma en
Z Z
d~r · ~v = dqj hj vj . (3.35)
C
3.4.6. Integral de superficie

Las integrales de superficies curvilı́neas son un poco más complicadas debido a que se debe
considerar la orientación de la superficie. Recordando la figura 3.9 y las ecuaciones (3.24) y
(3.25), la integral de superficie de un vector V~ es
Z Z
~
d~σ · V = ±dq1 dq2 h1 h2 V3 ± dq2 dq3 h2 h3 V1 ± dq1 dq3 h1 h3 V2 , (3.36)
C S
donde cada signo más o menos debe ser elegido dependiendo del signo de d~σ · q̂i .
3.4.7. La integral de volumen

La geometrı́a de la figura 3.9 puede ser usada para derivar la forma de integrales de lı́nea en
sistemas curvilı́neos. El elemento de volumen en el lı́mite infinitesimal, es simplemente dτ =
dq1 dq2 dq3 h1 h2 h3 ρ(q1 , q2 , q3 ). Para ello la integral de una función ρ(~r) sobre algún volumen V
es expresada como
Z Z
dτ ρ(~r) = dq1 dq2 dq3 h1 h2 h3 ρ(q1 , q2 , q3 ) . (3.37)
V V
3.4.8. El gradiente
En el capı́tulo 2, mostramos como el gradiente de una función escalar Φ se define como
~ · d~r .
dΦ = ∇Φ (3.38)
Usando la ecuación (3.27) para d~r tenemos que
~ · dqj hj q̂j .
dΦ = ∇Φ (3.39)
El cálculo diferencial implica que dΦ = (∂Φ/∂qi )dqi , ası́
∂Φ ~ · dqj hj q̂j .
dqi = ∇Φ (3.40)
∂qi
La única forma de que se cumpla la ecuación (3.40) es que

~ = 1 ∂Φ
∇Φ q̂i . (3.41)
hi ∂qi
3.4.9. La divergencia
La operación divergencia en un sistema curvilı́neo es más complicada que el gradiente y
debe ser obtenida desde la definición de integral
~
H
~ ·A
~ = lı́m SR
d~σ · A
∇ (3.42)
S,V →0
V
dτ
donde S es la superficie cerrada que encierra al volumen V .
Consideremos nuevamente el volumen diferencial de la figura 3.9. El denominador de la

ecuación (3.42) para este volumen en el lı́mite infinitesimal es sencillo
Z
dτ = dq1 dq2 dq3 h1 h2 h3 . (3.43)
V
Para evaluar el numerador, la integración sobre las seis superficies de V debe ser desa-
rrollada. Primero, consideremos las dos caras sombreadas de la figura 3.9, con las normales
alineadas paralela o antiparalelamente a q̂3 . La integral sobre la superficie interior es
Z
~ = − dq1 dq2 (h1 h2 A3 )|
d~σ · A (q1 ,q2 ,q3 ) . (3.44)
inferior
El signo menos surge porque en esta superficie d~σ y q̂3 están antiparalelas. Note también
que A3 , h1 y h2 son todas funciones de las coordenadas curvilı́neas y están evaluadas en
(q1 , q2 , q3 ), el valor inicial de las coordenadas en esta superficie. La integral sobre la superficie
superior es
Z
~ = dq1 dq2 (h1 h2 A3 )|
d~σ · A (q1 ,q2 ,q3 +dq3 ) . (3.45)
superior
En este caso no hay signo menos porque la superficie normal está orientada paralela a q̂3 .
El valor inicial de la coordenada q3 ha cambiado en dq3 comparado con la superficie inferior
y por lo tanto A3 , h1 y h2 deben ser evaluados en el punto (q1 , q2 , q3 + dq3 ). En el lı́mite
diferencial

∂(h1 , h2 A3 )
(h1 , h2 A3 )|(q1 ,q2 ,q3 +dq3 ) = (h1 , h2 A3 )|(q1 ,q2 ,q3 ) + , (3.46)
∂q3
(q1 ,q2 ,q3 )
ası́ la suma de las ecuaciones (3.44) y (3.45) es

Z
~ = ∂(h1 h2 A3 ) dq1 dq2 dq3 .
d~σ · A (3.47)
ambas ∂q3
Combinando este resultado con integraciones similares sobre las restantes cuatro superfi-
cies
Z
~= ∂(h2 h3 A 1 ) ∂(h1 h3 A 2 ) ∂(h1 h2 A 3 )
d~σ · A + + dq1 dq2 dq3 . (3.48)
S ∂q1 ∂q2 ∂q3
Sustituyendo las ecuaciones (3.43) y (3.48) en la ecuación (3.42) obtenemos el resultado

~ ·A~= 1 ∂(h2 h3 A 1 ) ∂(h1 h3 A 2 ) ∂(h1 h2 A 3 )
∇ + + . (3.49)
h1 h2 h3 ∂q1 ∂q2 ∂q3
3.4.10. El rotor
El rotor para un sistema de coordenadas curvilı́neas también puede ser derivada desde la
definición de integral:
Z I
~ ~
∇ × A · lı́m d~σ = lı́m ~,
d~r · A (3.50)
S→0 S C→0 C
donde C es un camino cerrado que encierra a la superficie S y la dirección de d~σ es definida

vı́a C y por la convención de la mano derecha.
2
C
q1
Figura 3.10: Orientación de la superficie para la integración curvilı́nea del rotor
Una componente del rotor puede ser escogida orientando d~σ en la dirección de un vector
base. Consideremos la figura 3.10, donde d~σ está orientado para elegir la componente qˆ1 , en
este caso d~σ = h2 q2 h3 dq3 q̂1 , ası́ el lado izquierdo de la ecuación (3.50) en el lı́mite diferencial
se convierte en
Z h i
~ ×A
∇ ~ · lı́m d~σ = dq2 dq3 h2 h3 q̂1 · ∇~ ×A ~ ,
S→0 S
h i (3.51)
= dq2 dq3 h2 h3 ∇ ~ ×A ~ .
1
La integral de lı́nea en el lado derecho de la ecuación (3.50) naturalmente divide en cuatro

partes a lo largo de Ca , Cb , Cc y Cd , como se muestra en la figura 3.11. La integral completa
es entonces dada por
I Z Z Z Z
~=
d~r · A dq2 h2 A2 + dq3 h3 A3 + dq2 h2 A2 + dq3 h3 A3 . (3.52)
C Ca Cb Cc Cd
111111111111111
000000000000000
000000000000000
111111111111111
2
000000000000000
111111111111111 q
000000000000000
111111111111111
000000000000000
111111111111111 )d
3 ,q
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111
q
000000000000000
111111111111111
2 ,
000000000000000
111111111111111
000000000000000
111111111111111
3 1 (q
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111
h
000000000000000
111111111111111
2
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111
C
000000000000000
111111111111111
000000000000000
111111111111111
e
000000000000000
111111111111111
(q1 ,q2 ,q3 + dq )11
00
00
11 2
3 11
00
Cb
Cd
111111111111111
000000000000000
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111
C
000000000000000
111111111111111
000000000000000
111111111111111
a
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111 q
2
000000000000000
111111111111111
000000000000000
111111111111111 )d
000000000000000
111111111111111
3
000000000000000
111111111111111
000000000000000
111111111111111
000000000000000
111111111111111q ,q
2 ,
000000000000000
111111111111111
11
00 1 (q
000000000000000
111111111111111
000000000000000
111111111111111
11
00
000000000000000
111111111111111
(q1 ,q2 ,q3) 2 h
000000000000000
111111111111111
000000000000000
111111111111111
Figura 3.11: Geometrı́a diferencial para integración curvilı́nea del rotor
En el lı́mite diferencial, la integral a través de Ca vale

Z
dq2 h2 A2 = (h2 A2 )|(q1 ,q2 ,q3 ) dq2 , (3.53)
Ca
donde evaluamos A2 y h2 en el punto (q1 , q2 , q3 ). Igualmente, la contribución a lo largo de

Cc es
Z
dq2 h2 A2 = − (h2 A2 )|(q1 ,q2 ,q3 +dq3 ) dq2 (3.54)
Cc
donde ahora evaluamos A2 Y h2 en (q1 , q2 , q3 + dq3 ). En el lı́mite diferencial,

∂(h2 A2 )
(h2 A2 )|(q1 ,q2 ,q3 +dq3 ) = (h2 A2 )|(q1 ,q2 ,q3 ) + dq3 , (3.55)
∂q3 (q1 ,q2 ,q3 )
lo cual permite que las integrales a lo largo de Cb y Cd se combinen para dar

Z
~=− ∂(h2 A 2 )
d~r · A dq2 dq3 . (3.56)
Ca +Cc ∂q3 (q1 ,q2 ,q3 )
Integraciones similares pueden ser desarrolladas a lo largo de Cb y Cd . La combinación de
las cuatro partes lleva a
I
~ ∂(h3 A3 ) ∂(h2 A2 )
lı́m A · d~r = − dq2 dq3 . (3.57)
C→0 C ∂q2 ∂q3
Sustituyendo las ecuaciones (3.57) y (3.51) en la ecuación (3.50) tenemos la 1-componente
~
del rotor de A:

h
~ ×A
i
~ = 1 ∂(h3 A 3 ) ∂(h2 A 2 )
∇ − . (3.58)
1 h2 h3 ∂q2 ∂q3
Las otras componentes de ∇×~ A ~ pueden ser obtenidas reorientando la superficie mostrada
en la figura 3.10. Los resultados son

h
~ ×A
~ =
i 1 ∂(h1 A 1 ) ∂(h3 A 3 )
∇ − (3.59)
2 h1 h3 ∂q3 ∂q1

h
~ ×A
i
~ = 1 ∂(h2 A 2 ) ∂(h1 A 1 )
∇ − , (3.60)
3 h1 h2 ∂q1 ∂q2
Las ecuaciones (3.58)-(3.60) pueden ser usadas más compactamente usando un determi-
nante,

h1 q̂1 h2 q̂2 h3 q̂3
~ ×A ~= 1
∇ ∂/∂q1 ∂/∂q2 ∂/∂q3 , (3.61)
h1 h2 h3
h1 A1 h2 A2 h3 A3
o usando los sı́mbolos de Levi-Civita y la notación de Einstein,
∇ ~ = ijk ∂(hk Ak ) q̂i .

~ ×A (3.62)
hj hk ∂qj
3.5. Gradiente, divergencia y rotor en sistemas cilı́ndri-

cos y esféricos
3.5.1. Operaciones cilı́ndricas
En el sistema cilı́ndrico h1 ≡ hρ = 1, h2 ≡ hφ = ρ y h3 ≡ hz = 1. El gradiente, la
divergencia y el rotor se convierten en
~ = ∂Φ q̂ρ + 1 ∂Φ q̂φ + ∂Φ q̂z

∇Φ (3.63)
∂ρ ρ ∂φ ∂z
3.5. GRADIENTE, DIVERGENCIA Y ROTOR EN SISTEMAS CILÍNDRICOS Y ESFÉRICOS57
∇ ~ = 1 ∂(ρAρ ) + 1 ∂Aφ + ∂Az

~ ·A (3.64)
ρ ∂ρ ρ ∂φ ∂z

~ ×A
~= 1 ∂A z ∂A φ ∂A ρ ∂A z 1 ∂(ρA φ ) ∂A ρ
∇ − q̂ρ + − q̂φ + − q̂z . (3.65)
ρ ∂φ ∂z ∂z ∂ρ ρ ∂ρ ∂φ
3.5.2. Operaciones esféricas

En el sistema esférico h1 ≡ hr = 1, h2 ≡ hθ = r y h3 ≡ hφ = r sen θ. El gradiente , la
divergencia y el rotor se convierten en
~ = ∂Φ q̂r + 1 ∂Φ q̂θ + 1 ∂Φ q̂φ

∇Φ (3.66)
∂r r ∂θ r sen θ ∂φ
2
∇ ~ = 1 ∂(r Ar ) + 1 ∂ sen θAθ + 1 ∂Aφ
~ ·A (3.67)
r2 ∂r r sen θ ∂θ r sen θ ∂φ

~ ×A
~= 1 ∂(sen θAθ ) ∂Aθ
∇ − q̂r +
r sen θ ∂θ ∂φ

1 1 ∂Ar ∂(rAφ ) 1 ∂(rAθ ) ∂Ar
− q̂θ + − q̂φ . (3.68)
r sen θ ∂φ ∂r r ∂r ∂θ
Capı́tulo 4
Introducción a tensores.
Los tensores se encuentran en todas las ramas de la Fı́sica. En mecánica, el tensor de

inercia es usado para describir la rotación de un cuerpos rı́gidos, y el tensor de stress-tensión
describe la deformación de cuerpos rı́gidos. En electromagnetismo, el tensor de conductividad
extiende la ley de Ohm para manejar flujos de corriente en un medio anisotrópico, y el tensor
de stress de Maxwell es la forma más elegante para tratar las fuerzas electromagnéticas. El
tensor de métrica de la mecánica relativista describe la extraña geometrı́a del espacio y el
tiempo.
Este capı́tulo presenta una introducción a tensores y sus manipulaciones, donde la forma
de proceder es la siguiente: primero trataremos sólo con coordenadas cartesianas, para des-
pués generalizar a coordenadas curvilı́neas. Sólo nos limitaremos a sistemas de coordenadas
ortonormales. Al final de este capı́tulo, introduciremos unos objetos que se les suele llamar
“pseudo”-objetos, los cuales surgirán de considerar las transformaciones entre sistemas de
coordenadas que cumplen la ley de la mano derecha y de la izquierda.
4.1. El tensor de conductividad y la ley de Ohm.

La necesidad de tensores pueden ser fácilmente demostradas considerando la ley de Ohm.
En una resistencia ideal, la ley de Ohm relaciona la corriente con el voltaje usando la expresión
lineal
V
I= . (4.1)
R
En esta ecuación, I es la corriente que circula a través de la resistencia y V es el voltaje
aplicado. Usando unidades MKS, I es medido en Àmperes, V en Volts y R en Ohms.
La ecuación (4.1) describe el flujo de corriente a través de un elemento discreto. Para
aplicar la ley de Ohm a un medio distribuido, como un sólido cristalino, una forma alternativa
de esta ecuación debe ser utilizada
J~ = σ E
~ . (4.2)
1
Este capı́tulo está basado en el cuarto capı́tulo del libro: Mathematical Physics de Brusse Kusse & Erik
59
60 CAPÍTULO 4. INTRODUCCIÓN A TENSORES.
Aquı́ J~ es la densidad de corriente, E ~ es el campo eléctrico y σ es la conductividad del

material. En unidades MKS, J~ es medido en Àmperes por unidad de área, E ~ en Volts por
metro y σ en Ohm-metros a la menos uno.
La ecuación (4.2) describe una simple dependencia fı́sica entre la densidad de corriente
y el campo eléctrico, ya que la conductividad ha sido expresada como un escalar. Con una
conductividad escalar, la cantidad de flujo de corriente es gobernado únicamente por las
magnitudes σ y E, ~ mientras que la dirección del flujo es siempre paralela a E. ~ Pero en
algunos materiales, esto no es ası́. Muchos sólidos cristalinos permiten que el flujo de corriente
se desplace por una dirección más que por otra. Estos materiales anisotrópicos deben tener
distintas conductividades en distintas direcciones. Además, estos cristales pueden inclusive
presentar flujo de corriente de forma perpendicular a un campo eléctrico aplicado. Claramente
la ecuación (4.2), con una conductividad escalar, no podrá manejar este tipo de situaciones.
Una solución es construir un arreglo de elementos de conductividad y expresar la ley de
Ohm usando la notación matricial
    
J1 σ11 σ12 σ13 E1
J2  = σ21 σ22 σ23  E2  . (4.3)
J3 σ31 σ32 σ33 E3
En la ecuación (4.3), la densidad de corriente y el campo eléctrico son representados como
vectores columna de un campo vectorial y la conductividad es ahora una matriz cuadrada.
Esta ecuación puede ser escrita en una notación matricial más compacta
[J] = [σ][E] (4.4)

o, en notación de Einstein
Ji = σij Ej . (4.5)
Todas estas expresiones producen el resultado deseado. Cualquier relación lineal entre J~ y
E~ puede ser descrita. Por ejemplo, la componente 1 de la densidad de corriente está relacio-
nada con la componente 1 del campo eléctrico por σ11 , mientras que la componente 2 de la
densidad de corriente está relacionada con la componente 2 del campo eléctrico por σ22 . Los
flujos perpendiculares están descritos por los elementos fuera de la diagonal. Por ejemplo, el
elemento σ12 describe el flujo en la dirección 1 debido a un campo aplicado en la dirección 2.
Sin embargo, la representación matricial de la conductividad anisotrópica tiene un pro-
blema fundamental. Los elementos matriciales deben depender del sistema de coordenadas.
Tal como sucede con las componentes de un vector, si reorientamos nuestro sistema de coor-
denadas, los valores especı́ficos en el arreglo matricial deben cambiar. Lamentablemente, el
arreglo matricial en sı́ no tiene la información sobre el sistema de coordenadas elegido. La
manera de resolver este problema para las cantidades vectoriales fue incorporar los vectores
base directamente en la notación. La misma aproximación puede ser usada para mejorar
la notación para la conductividad anisotrópica. Definimos un nuevo objeto, llamado el ten-
↔
sor de conductividad, que notaremos σ. Este objeto incluye tanto los elementos de matriz
de la matriz de conductividad como la base de vectores en el sistema de coordenadas en
cual estos elementos son válidos. Como esta notación está motivada en la notación vectorial,
comenzaremos con una pequeña revisión de conceptos.
4.1. EL TENSOR DE CONDUCTIVIDAD Y LA LEY DE OHM. 61
Recordemos que una cantidad vectorial, tal como el campo eléctrico, puede ser represen-
tado como un vector columna
 
E1
~
E → E2  .
 (4.6)
E3
El vector y las cantidades matriciales no son iguales, ya que la matriz no puede reemplazar
~ en una ecuación vectorial y viceversa. Más aún, la base de vectores del sistema
al vector E
coordenado en la cual el vector está expresado debe ser incluida para formar una expresión
equivalente
~ = Ei êi .
E (4.7)
↔
El tensor de conductividad anisotrópico σ puede ser tratado de manera similar. Puede ser
representado por un arreglo matricial
 
σ11 σ12 σ13
↔
σ → σ21
 σ22 σ23  , (4.8)
σ31 σ32 σ33
pero el arreglo matricial y el tensor no son equivalentes, ya que el arreglo matricial no contiene
la información sobre el sistema de coordenadas. Siguiendo el patrón usado para los vectores y
la expresión para un vector dada en la ecuación (4.7), expresamos el tensor de conductividad
como
↔
σ = σij êi êj . (4.9)
La discusión que sigue mostrará que esta es una notación muy poderosa. Soporta toda la ma-
nipulación algebraica que la notación de matrices y también podemos manejar con facilidad
las transformaciones entre sistemas de coordenadas.
La expresión para el tensor de conductividad en el lado derecho de la ecuación (4.9)
contiene los elementos de la matriz de conductividad y dos bases de vectores del sistema
de coordenadas donde los elementos tienen validez. No hay operación entre estas bases de
vectores. Ellos sirven como “cajones” en donde los elementos σij son colocados. Hay una doble
suma sobre los ı́ndices i e j, por tanto, para un sistema tridimensional, habrán 9 términos
en esta suma, cada uno conteniendo dos de los vectores base. En otras palabras, podemos
expandir la conductividad como
↔
XX
σ= σij êi êj = σ11 ê1 ê1 + σ12 ê1 ê2 + σ21 ê2 ê1 + · · · . (4.10)
i j
Análogamente a cómo expandı́amos un vector en términos de la base,

X
~v = vi êi = v1 ê1 + v2 ê2 + v3 ê3 . (4.11)
i
Veamos como manejamos la ley de Ohm en esta nueva notación. Usando el tensor de con-
ductividad, podemos escribir en un sistema de coordenadas independiente y usando notación
“vector/tensor”
J~ = σ · E
~ .
↔
(4.12)
Notemos que usamos el producto punto entre el tensor de conductividad y el vector del campo
eléctrico en el lado derecho de esta expresión. Podemos utilizar la notación de Einstein, y
escribir
Js ês = (σjk êj êk ) · (El êl ) . (4.13)

Por convención, el producto punto en la ecuación (4.13) opera entre la segunda base vectorial
↔
~ Podemos manipular la ecuación (4.13) como sigue
de σ y la base del vector E.
Js ês = σjk El êj êk · êl (4.14)

Js ês = σjk El êj δkl (4.15)
Js ês = σjk Ek êj . (4.16)
Las cantidades en la ecuación (4.16) son vectores. Las componentes i-ésimas de estos vectores
pueden ser obtenidos aplicando producto punto con êi a ambos lados de la ecuación (4.16),
obteniendo
Ji = σik Ek , (4.17)
lo cual es idéntico a las ecuaciones (4.3)-(4.5). Mantengamos en mente que hay una diferencia
↔
~ yE
entre σ · E ~ ·↔σ. El orden en los términos importan, ya que en general
êj êk · êl 6= êl · êj êk , (4.18)

Las bases de vectores en esta notación cumplen variadas funciones
1. Establecen cajones para separar las componentes tensoriales.
2. Emparejan a las componentes con un sistema de coordenadas.
3. Establecen el formalismo para operaciones algebraicas entre tensores.
4. Como es mostrado en este capı́tulo, simplifican el formalismo para las transformaciones

entre sistemas de coordenadas.
Ahora que hemos motivado nuestra investigación sobre los tensores con un ejemplo es-
pecı́fico, procedemos a mirar algunas de sus propiedades formales.
4.2. Notación tensorial general y terminologı́a.

El tensor de conductividad es un ejemplo especı́fico de un tensor que usa dos bases vec-
toriales y cuyos elementos tienen dos subı́ndices. En general, un tensor puede tener una can-
tidad finita de subı́ndices, pero el número de subı́ndices deben ser siempre igual al número
de vectores base. Por tanto, en general
4.3. TRANSFORMACIONES ENTRE SISTEMAS DE COORDENADAS. 63
↔
T = Tijk... êi êj êk . . . . (4.19)
El número de vectores base determina el rango del tensor. Notemos como la notación tensorial
es una generalización de la notación vectorial usada en los capı́tulos previos. Los vectores son
simplemente tensores de rango uno. Los escalares pueden ser considerados como tensores de
rango cero. Mantengamos en mente el rango del tensor con el número de vectores base en
el lado derecho de la ecuación (4.19), mientras que la dimensión del sistema de coordenadas
determina el número de valores diferentes que un ı́ndice en particular puede tomar. Para un
sistema tridimensional, los ı́ndices (i, j, k, etc.) pueden tomar los valores (1,2,3) cada uno.
Esta notación introduce la posibilidad de una nueva operación entre los vectores, llamada
el producto diadico. Este producto es escrito tanto como A ~ : B ~ o simplemente A ~ B.
~ El
producto diadico entre dos vectores crea un tensor de rango dos
~B
A ~ = Ai êi Bj êj = Ai Bj êi êj . (4.20)
Este tipo de operación puede ser extendida para combinar dos tensores de un rango arbi-
trario. El resultado es un tensor con un rango igual a la suma de los rangos de los tensores
involucrados en el producto. Usualmente esta operación es llamada un producto externo, lo
cual es opuesto al producto punto, el cual es llamado producto interno.
4.3. Transformaciones entre sistemas de coordenadas.

La nueva notación tensorial de la ecuación (4.19) hace más fácil la tarea de transformar
vectores entre distintos sistemas de coordenadas. De hecho, muchos textos definen formalmen-
te un tensor como “un objeto que transforma como un tensor”. Esto parece no tener mucho
sentido, como será visto en esta sección, pero es la definición correcta.
En este capı́tulo sólo las transformaciones entre sistemas ortonormales son considerados.
Primero sólo veremos las tranformaciones entre sistemas cartesianos, para luego generalizar
estos resultados a sistemas curvilı́neos.
4.3.1. Transformaciones vectoriales entre sistemas cartesianos.

Comenzaremos viendo las transformaciones de componentes entre dos sistemas cartesianos
muy sencillos. Un sistema prima es rotado un ángulo θ0 con respecto a un sistema sin primas,
como es mostrado en la figura 4.1. Un vector ~v puede ser expresado en componentes como
~v = vi êi = vi0 ê0i . (4.21)

De la geometrı́a de la figura 4.1, podemos ver que las componentes vectoriales en el sistema
primado están relacionadas con las componentes vectoriales del sistema no primado por las
ecuaciones
v10 = v1 cos θ0 + v2 sen θ0

(4.22)
v20 = −v1 sen θ0 + v2 cos θ0 .
2
2’
1’
e2
e’1
e’2 θ0 1
e1
Figura 4.1: Sistemas rotados.
Estas ecuaciones pueden ser escritas en notación matricial
[v 0 ] = [a][v] , (4.23)
donde [v 0 ] y [v] son matrices columna que representan el vector ~v con las componentes primas
y no primas, y [a] es la matriz cuadrada

cos θ0 sen θ0
[a] = . (4.24)
− sen θ0 cos θ0
4.3.2. La matriz de transformación.

En general, cualquier transformación lineal de coordenadas de un vector puede ser escrita
usando la notación de Einstein
vi0 = aij vj , (4.25)

donde [a] es llamada la matriz de transformación. En la discusión que sigue, dos suposiciones
simples son presentadas para determinar los elementos de [a]. La primera supone que los dos
sistemas tienen vectores base conocidos. La segunda supone el conocimiento de las ecuacio-
nes que relacionan las coordenadas. En este ejemplo utilizaremos el sistema de coordenadas
cartesiano, sin embargo no es difı́cil generalizar a cualquier sistema de coordenadas.
Determinando [a] desde la base de vectores.

Si la base de vectores de ambos sistemas coordenados son conocidos, es bastante simple
determinar las componentes de [a]. Consideremos un vector ~v expresado por componentes en
2 2
2’
v2 v v 1’
v’2
1 v’1 1
v1
Figura 4.2: Componentes del vector.

dos sistemas cartesianos diferentes
~v = vk êk = vi0 ê0i . (4.26)
Sustituyendo la expresión para vi0 dada en la ecuación (4.25) en (4.26), tenemos
vk êk = aij vj ê0i . (4.27)
Esto es verdad para cualquier ~v . En particular, sea ~v = êm uno de los vectores base del
sistema no primado (en otras palabras, vk6=m = 0 y vk=m = 1), obtenemos
êm = alm ê0i . (4.28)
Aplicando producto punto por ê0n en ambos lados, obtenemos
anm = (ê0n · êm ) . (4.29)
Notemos que los elementos de [a] son sólo cosenos directores entre todos los pares de vectores
base entre los sistemas primado y no primado.
Determinando [a] desde las ecuaciones de coordenadas.

Si la base de vectores no es conocida explı́citamente, las ecuaciones que relacionan los
dos sistemas proveen el método más rápido para determinar la matriz de transformación.
Comencemos considerando las expresiones para el vector desplazamiento en los dos sistemas.
Como los sistemas son cartesianos,
d~r = dxi êi = dx0i ê0i , (4.30)
donde dxi y dx0i son los diferenciales totales de las coordenadas. Como la ecuación (4.25)
representan las componentes de cualquier vector, incluı́do el vector de desplazamiento
dx0i = aij dxj . (4.31)
La ecuación (4.31) provee un método general para obtener los elementos de matriz de [a]
usando las coordenadas primas y no primas. Trabajando en tres dimensiones, asumamos que
estas ecuaciones son
x01 = x01 (x1 , x2 , x3 )
x02 = x02 (x1 , x2 , x3 ) (4.32)
0 0
x3 = x3 (x1 , x2 , x3 ) ,
o en forma compacta
x0i = x0i (x1 , x2 , x3 ) . (4.33)
Expandiendo los diferenciales totales de la ecuación (4.32), tenemos

∂x01 (x1 , x2 , x3 ) ∂x0 (x1 , x2 , x3 ) ∂x0 (x1 , x2 , x3 )

dx01 = dx1 + 1 dx2 + 1 dx3
∂x1 ∂x2 ∂x3
0 ∂x02 (x1 , x2 , x3 ) ∂x02 (x1 , x2 , x3 ) ∂x02 (x1 , x2 , x3 )
dx2 = dx1 + dx2 + dx3
∂x1 ∂x2 ∂x3
∂x03 (x1 , x2 , x3 ) ∂x0 (x1 , x2 , x3 ) ∂x0 (x1 , x2 , x3 )
dx03 = dx1 + 3 dx2 + 3 dx3 .
∂x1 ∂x2 ∂x3
Nuevamente, usando la notación de Einstein, podemos escribir lo anterior como
∂x0i (x1 , x2 , x3 )
dx0i = dxj . (4.34)
∂xj
Comparando las ecuaciones (4.31) y (4.34), podemos identificar los elementos de [a]
∂x0i (x1 , x2 , x3 )
aij = . (4.35)
∂xj
Propiedad ortonormal de [a].

Si el sistema de coordenadas original y el primado son ambos ortonormales, podemos
escribir una útil relacion entre los elementos de [a]. Se puede derivar fácilmente aplicando
producto punto con êk en la ecuación (4.28)
êj = aij ê0i

êj · êk = aij (ê0i · êk ) (4.36)
δjk = aij aik .
La ecuación (4.36) escrita en forma matricial queda
[a][a]† = [1] , (4.37)

donde [a]† es la notación para la transpuesta conjugada de [a], y la matriz [1] es una matriz
cuadrada, con 1 en la diagonal y 0 fuera de ella.
La inversa de [a].
La matriz [a] genera las componentes de los vectores en el sistema primado desde las
componentes sin primas, como es indicado en la ecuación (4.25). Esta expresión puede ser
invertida con la inversa de [a], la cual es escrita como [a]−1 , y está definida por
[a][a]−1 = [a]−1 [a] = [1] , (4.38)

o en notación de Einstein
a−1 −1
ij ajk = aij ajk = δik . (4.39)
Con la notación de Einstein, manejamos fácilmente la inversión
vi0 = aij vj
a−1
ki vi
0
= a−1
ki aij vj
(4.40)
a−1
ki vi
0
= δkj vj
a−1
ki vi
0
= vk .
Las matrices de transformación que obedecen la condición de ortonormalidad son simples de

invertir. Comparando la ecuación (4.37) y (4.38) muestra que
[a]−1 = [a]† , (4.41)

o en notación de Einstein
a−1
ij = aji . (4.42)
La relación de inversión se convierte en
vi = aji vj0 . (4.43)
Transformaciones de vectores base.

Los vectores base no primados fueron relacionados con la base del sistema primado por
la ecuación (4.28)
êi = aji ê0j . (4.44)

Usando el hecho que la inversa de la matriz [a] es su transpuesta, esta expresión puede ser
invertida para obtener la base de vectores primada en términos de los no primados
ê0j = aij êi . (4.45)

Recordemos que estas expresiones son sólo válidas para transformaciones si ambos sistemas
son ortonormales.
4.3.3. Resumen de transformaciones de coordenadas.

El siguiente cuadro resume las ecuaciones de las transformaciones entre dos sistemas
cartesianos
vi0 = aij vj ê0i = aij êj

vi = aji vj0 êi = aji ê0j
aij = (ê0i · êj ) = ∂x0i (x1 , x2 , x3 )/∂xj
Las funciones x0i = x0i (x1 , x2 , x3 ) relacionan el sistema de coordenadas cartesiano primado
con el sistema cartesiano no primado. Para mantener las cosas ordenadas, notemos que hay
un patrón para estas ecuaciones de transformación. Cada vez que convertimos del sistema no
primado con el sistema primado, estamos tratando con una base vectorial o las componentes
de algún vector, sumamos sobre el segundo ı́ndice aij . Por el contrario, las conversiones desde
el sistema primado al sistema no primado siempre se sumará sobre el primer ı́ndice.
4.3.4. Transformaciones tensoriales.

Para entender por qué los elementos de un tensor deben cambiar de valor cuando son
expresados en distintos sistemas de coordenadas, consideremos el tensor de conductividad. Si
fijamos el set de coordenadas y la corriente fluye más facilmente en la dirección 1 que en la
dirección 2, entonces σ11 > σ22 . Si observamos la misma situación fı́sica en un nuevo sistema
de coordenadas donde la dirección 10 es equivalente a la dirección 2 y la dirección 20 es la
0 0
misma que la dirección 1 original, entonces deberı́amos tener que σ11 < σ22 . Claramente los
elementos del tensor de conductividad deben tomar diferentes valores en los dos sistemas,
aún cuando describen la misma situación Fı́sica. Esto es cierto también para una cantidad
vectorial, el mismo vector velocidad tienen diferentes componentes en diferentes sistemas de
coordenadas.
Las transformaciones tensoriales siguen el mismo patrón que las tranformaciones vecto-
riales. Un vector expresado en un sistema primado y no primado seguirá siendo el mismo
vector,
~v = vi êi = vj0 ê0j . (4.46)

De la misma forma, siguiendo la notación de la ecuación (4.19), las expresiones para un tensor
de segundo rango en los dos sistemas deben obedecer
↔
0 0 0
T = Tij êi êj = Trs êr ês . (4.47)
0
Aquı́ yace la belleza de la notación. La relación entre los elementos Tij y Trs es construı́da
desde la ecuación (4.47) y es fácilmente obtenida aplicando dos veces producto punto en
ambos lados. Del primer producto punto obtenemos
0 0 0
êl · Tij êi êj = êl · Trs êr ês
Tij (êl · êi )êj = Trs (êl · ê0r )ê0s
0
(4.48)
0
Tij δli êj = Trs arl ê0s
0
Tlj êj = Trs arl ê0s .
Aplicando un segundo producto punto y realizando el proceso análogo obtenemos
0
Tlm = Trs arl asm . (4.49)
Para invertir la ecuación (4.49) usamos la matriz inversa [a]−1 dos veces, y recordando que
para sistemas de coordenadas ortonormales se cumple que a−1 ij = aji , obtenemos
0
Tlm = Trs alr ams . (4.50)
En general, las transformaciones tensoriales requieren un factor aij para cada subı́ndice
en el tensor. En otras palabras, un rensor de rango r necesita r diferentes factores aij . Si
4.4. DIAGONALIZACIÓN DE TENSORES. 69
la transformación va desde el sistema sin prima al sistema prima, todos los factores aij
son sumadas sobre el segundo subı́ndice. Para la transformación inversa, desde el sistema
primado al sistema no primado, las sumas son sobre el primer subı́ndice. Las transformaciones
tensoriales, para tensores de rango arbitrario, pueden ser resumidas como siguen
0
Tijk... = Trst... air ajs akt . . .
0
Tijk... = Trst... ari asj atk . . .
donde los elementos de la matriz [a] están dados por la ecuación (4.35).
Hay otro asunto importante en la notación tensorial de la ecuación (4.19). Al contrario
de la ecuación matricial, donde todos los términos deben estar en la misma base, la notación
tensorial/vectorial permite que las ecuaciones estén en bases distintas. Imaginemos que los
elementos de la ecuación de Ohm expresados en los sistemas primados y no primados sean
los siguientes
J~ = Ji êi = Ji0 ê0i

~ = Ei êi = Ei0 ê0i
E (4.51)
↔
σ = σij êi êj = σij0 ê0i ê0j .
La ley de Ohm queda
~ ,
J~ = σ · E
↔
(4.52)
y cualquier combinación de las representaciones de la ecuación (4.51) pueden ser usados en
la evaluación. Por ejemplo,
0 0 0 0
Ji êi = (σjk êj êk ) · (El êl ) = σjk El ê0j (ê0k · êl ) = σjk
0
El ê0j akl . (4.53)
↔
El hecho que los elementos de σ del sistema primado sean combinados con las componentes
de E~ del sistema no primado no representa un problema. El producto punto de las bases de
los vectores toma en cuenta las representaciones mezcladas, siempre y cuando el orden de las
bases de los vectores sea preservado. Esto es acompañado en la ecuación (4.53) por el hecho
que ê0k · êl 6= δkl . Este tipo de operación no puede ser hecho con la notación matricial sin antes
convertir todo a una misma base.
Con esto deberı́a quedar claro el valor de expresar un tensor de la forma como se ve en
(4.19). Además de poder manejar las manipulaciones algebraicas como una matriz, también
contiene toda la información necesaria para transformar los elementos de un sistema de
coordenadas al otro. Por tanto, un tensor es de coordenadas independientes, y un objeto
geométrico, tal como un lo vector es.
4.4. Diagonalización de tensores.

En problemas de Fı́sica a menudo necesitamos diagonalizar un tensor. Esto significa que
necesitamos encontrar un sistema de coordenadas particular en el cual la representación
matricial de un tensor sólo tenga elementos distintos de cero en su diagonal. Por ejemplo, un
cuerpo rı́gido no experimentará vibraciones cuando es rotado alrededor de cualquiera de tres

ejes en un sistema de ejes donde el tensor de inercia sea diagonal. El proceso de balancear una
rueda de un automóvil usa este hecho. Y cuando los ejes no coinciden con los ejes requeridos,
se colocan pequeños trozos de metal en la llanta para que esto sı́ suceda.
Muchos estudiantes se pierden en el proceso matemático de la diagonalización y se olvidan
que, en realidad, es sólo una transformación de coordenadas. En esta sección, derivamos los
elementos de la matriz de transformación [a] que diagonaliza un tensor dado. Comenzaremos
con un tratamiento absolutamente teórico del tema. Luego veremos dos ejemplos numéricos,
uno no degenerado y otro degenerado.
4.4.1. Diagonalización y problema de valores propios.

↔
Basado en la discusión de la sección anterior, un tensor σ escrito en un sistema no primado
debe ser equivalente a uno escrito en un sistema primado
↔ 0 0 0
σ = σij êi êj = σst ês êt . (4.54)
Estamos interesados en un sistema prima muy especial, un sistema en el cual todos los
↔
elementos no diagonales de σ son cero. En este caso, la ecuación (4.54) queda
↔ 0 0 0
σ = σij êi êj = σss ês ês . (4.55)
En esta última ecuación suponemos conocidos los elementos tensoriales y la base vectorial del
sistema no prima. El problema es encontrar los elementos del tensor en el sistema primado
0
σss y los elementos de la base ê0s , de tal manera que se satisfaga la ecuación (4.55). Para
realizar esto, aplicamos producto punto a la ecuación (4.55) con el primer elemento de la
base del sistema primado, ê01 , con lo cual obtenemos
↔
σ · ê01 = σss
0 0 0
ês ês · ê01
0 0
= σss ês δs1 (4.56)
0 0
= σ11 ê1 .
La ecuación (4.56) revela una propiedad importante de la base de vectores donde el tensor
es diagonal. No cambian de dirección cuando es aplicado el producto punto por el tensor. Sin
0
embargo, ellos pueden cambiar de magnitud. Si definimos λ1 = σ11 , la ecuación (4.56) queda
↔
σ · ê01 = λ1 ê01 . (4.57)
↔
El factor λ1 es llamado el autovalor de σ. Un autovalor aparece cuando una operación sobre
un objeto produce una constante, el autovalor, por el objeto original. El vector base del
sistema primado es llamado un autovector.↔
Ahora introducimos el tensor unitario 1, el cual es definido por
↔
1 = δij êi êj (4.58)
que cumple
↔
1 · ~v = ~v . (4.59)
Representado como matriz, el tensor unitario es
 
↔
1 0 0
1 → [1] = 0 1 0 . (4.60)
0 0 1
Usando el tensor unitario, la ecuación (4.57) puede ser escrita como
↔

↔
σ − λ1 1 · ê01 = 0 . (4.61)
↔
Expresando σ en el sistema no primado, la ecuación (4.61) puede ser reescrita en notación
de Einstein
(σij − λ1 δij ) êi êj · ê01 = 0 . (4.62)

Usando la ecuación (4.29) y alguna manipulación algebraica, obtenemos
êi (σij − λ1 δij )a1j = 0 , (4.63)

donde el elemento a1j es uno de los tres elementos desconocidos de la matriz transformación
↔
entre el sistema original de coordenadas y el sistema donde σ es diagonal.
El lado izquierdo de la ecuación (4.63) es un vector, y para que sea cero, cada componente
debe ser cero. Cada componente involucra una suma sobre el ı́ndice j. Por tanto, la ecuación
(4.63) se convierte en tres ecuaciones, las cuales pueden ser anotadas en notación matricial
    
σ11 − λ1 σ12 σ13 a11 0
 σ21 σ22 − λ1 σ23   a12 = 0 .
  (4.64)
σ31 σ32 σ33 − λ1 a13 0
Para que este set de ecuaciones lineales y homogéneas tengan solución, el determinante de
los coeficientes debe ser cero

σ11 − λ1 σ12 σ13

σ21
σ22 − λ1 σ23 = 0 . (4.65)
σ31 σ32 σ33 − λ1
Resulta una ecuación de tercer orden para λ1 , las cuales generarán tres autovalores. De estos
tres autovalores, seleccionaremos uno, el cual será llamado λ1 , y los otros dos los usaremos
luego. Reemplazando este valor en la ecuación (4.64) encontraremos una solución para a11 , a12
y a13 con una constante arbitraria. Estos son tres elementos de la matriz de transformación
entre los sistemas primados y no primados, lo cual estamos buscando. Estos tres elementos
también permitirán determinar la base vectorial ê01 con una constante arbitraria
ê01 = a1j êj . (4.66)

Imponiendo que ê01 sea un vector unitario, obtenemos una condición para las constantes
arbitrarias asociadas con a11 , a12 y a13
(a11 )2 + (a12 )2 + (a13 )2 = 1 . (4.67)

Exceptuando un signo arbitrario global y la situación degenerada, la cual discutiremos luego,
hemos determinado en forma única ê01 .
En forma análoga encontramos los otros elementos de la base y los elementos de la matriz
de transformación. El segundo vector base del sistema primado es determinado aplicando el
producto punto en la ecuación (4.56) y usando ê02 . Podemos escribir ecuaciones matriciales
análogas a (4.64) para a21 , a22 y a23 . Las ecuaciones (4.65) que escribimos mediante deter-
minante resultan idénticas para λ2 . Seleccionamos uno de los dos autovalores restantes, y lo
llamamos λ2 , el cual usamos para determinar a21 , a22 , a23 y ê02 . Análogamente, obtenemos
los elementos a31 , a32 , a33 y ê03 .
↔
El sistema de coordenadas primado, donde σ es diagonal, es definido por la base vectorial
↔
ê01 , ê02 y ê03 . Los elementos de σ en este sistema son los autovalores que determinamos desde
la ecuación (4.65)
 
λ1 0 0
[σ 0 ] =  0 λ2 0  . (4.68)
0 0 λ3
Las matrices de interés en Fı́sica son Hermitianas. Si dejamos la posibilidad de elementos
de matriz complejos, una matriz se dice Hermitiana si es igual a su transpuesta conjugada.
Esto es, σij† = σij∗ . Hay dos propiedades muy importantes en este tipo de matrices. Uno, los
valores propios son números reales. Segundo, sus autovectores son siempre ortonormales. La
prueba de este hecho es dejado como ejercicio.
La única complicación que puede surgir en el proceso de diagonalización es una situación
degenerada, la cual ocurre cuando dos o más autovalores son idénticos. Consideremos el caso
cuando λ1 6= λ2 = λ3 . El autovalor λ1 determina a11 , a12 , a13 y ê01 , como ya lo vimos. Sin
embargo, los autovalores degenerados no especificarán en forma única sus autovectores. Estos
autovectores pueden ser elegidos de manera infinita. Un ejemplo con este tipo de degeneración
es discutido en uno de los ejemplos que a continuación siguen.
Ejemplo 1
Como un ejemplo del proceso de diagonalización, consideremos el tensor de conductividad
expresado en coordenadas cartesianas
↔
σ = σij êi êj . (4.69)
Sea su representación matricial (ignorando las unidades)
 
10 0 0
[σ] =  0 10 1  . (4.70)
0 1 10
Esta matriz es Hermitiana, por tanto podemos esperar que sus valores propios sean reales
y sus autovectores ortonormales. Los autovalores para la diagonalización son generados desde
la ecuación determinante

10 − λ 0 0

0
10 − λ 1 = 0 . (4.71)
0 1 10 − λ
La expansión del determinante nos arroja una ecuación polinomial de tercer orden
(10 − λ) (10 − λ)2 − 1 = 0 ,

(4.72)
la cual tiene tres soluciones, λ1 = 9, λ2 = 11 y λ3 = 10.
Los elementos a1j son determinados reemplazando el valor de λ1 en la ecuación (4.64),
obtenemos
    
1 0 0 a11 0
0 1 1 a12  = 0 . (4.73)
0 1 1 a13 0
Esta ecuación requiere que se cumpla a12 = −a13 y a11 = 0. La condición de normalización
impone el contreñimiento adicional (a12 )2 + (a13 )2 = 1, de donde obtenemos
   
a11 0
a12  = √1  1  . (4.74)
a13 2 −1
El primer autovector asociado con el sistema primado es
√ √
0
ê1 = 1/ 2 ê2 − 1/ 2 ê3 . (4.75)
Las otras componentes de [a] pueden ser determinadas en forma análoga. La matriz de
transformación completa es
 
0 1 −1
1
[a] = √ √0 1 1  . (4.76)
2 2 0 0
Los otros dos autovectores no primados son
√ √
ê02 = 1/ 2 ê2 + 1/ 2 ê3 (4.77)
ê03 = ê1 . (4.78)
Podemos notar que hay una ambigüedad de orden con los autovalores y en los signos asociados
con cada autovector. Estas ambigüedades nos permiten fijar el sistema primado como de mano
derecha. El orden y las elecciones de signo hechas en este ejemplo dan la base primada que
se muestra en la figura 4.3.
Los elementos del tensor de conductividad expresados en el nuevo sistema diagonal son
1
e’3
3
e’2
e’1 2
Figura 4.3: Vectores base en el sistema primado.
 
9 0 0
[σ 0 ] = 0 11 0  (4.79)
0 0 10
Ejemplo 2
Este ejemplo demuestra el proceso de diagonalización cuando dos autovectores son dege-
nerados. Consideremos nuevamente un tensor de conductividad en coordenadas cartesianas
(nuevamente, ignoramos las unidades)
 
11 −1 0
[σ] = −1 11 0  . (4.80)
0 0 10
Esta es una matriz Hermitiana, por tanto esperamos valores propios reales y vectores
ortonormales. La condición del determinante queda

11 − λ −1 0

−1 11 − λ 0 = 0 , (4.81)

0 0 10 − λ
lo cual lleva a una ecuación polinomial de tercer orden
(10 − λ) (11 − λ)2 − 1 .

(4.82)
Esta ecuación de tercer orden posee tres raı́ces, pero sólo dos distintas, λ1 = 12 y λ2 =
λ3 = 10. La raı́z λ1 puede ser tratada como antes. Cuando es sustituı́da en la ecuación (4.64),
la relación matricial se convierte en
    
−1 −1 0 a11 0
−1 −1 0  a12  = 0 . (4.83)
0 0 −2 a13 0
Cuando utilizamos esto más la condición de normalización, obtenemos
   
a11 1
a12  = √1 −1 . (4.84)
a13 2 0
Estos elementos de la matriz transformación nos permiten definir el primer autovector
√ √
ê01 = 1/ 2 ê1 − 1/ 2 ê2 . (4.85)
Ahora consideremos los valores propios degenerados. Cuando sustituı́mos λ2 = 10 en la
ecuación (4.64), obtenemos
    
1 −1 0 a21 0
−1 1 0 a22  = 0 . (4.86)
0 0 0 a23 0
Si sustituı́mos λ3 obtenemos una ecuación muy parecida
    
1 −1 0 a31 0
−1 1 0 a32  = 0 . (4.87)
0 0 0 a33 0
La ecuación (4.86) nos requiere a21 = a22 , pero deja libre el factor a23 . La condición de
normalización nos exige que se cumpla a221 + a222 + a223 = 1. Estas condiciones pueden ser
satisfechas por muchos autovectores. Como a23 es arbitrario, lo fijamos igual a cero. Ahora,
si el segundo autovector debe ser ortonormal a ê01 , tenemos
   
a21 1
a22  = √1 1 . (4.88)
a 2 0
23
Con esto, escribimos el segundo autovector

√ √
ê02 = 1/ 2 ê1 + 1/ 2 ê2 . (4.89)
El autovector asociado con λ3 está dado por la ecuación (4.87) y tiene las mismas condi-
ciones que el autovector asociado a λ2 , es decir, a31 = a32 y a33 es arbitrario. Sin embargo,
si queremos que los autovectores sean ortonormales, ê03 debe ser perpendicular a ê01 y ê02 . Los
vectores base ê01 y ê02 están en el plano 1-2 de los vectores originales, por tanto si queremos
que ê03 perpendicular a estos dos vectores, debe estar en la dirección 3. Por tanto,
  
a31 0
a32  0 , (4.90)
a33 1
y para el tercer autovector
ê03 = ê3 . (4.91)

Un chequeo rápido demostrará que estos tres autovectores son ortonormales y que definen
un sistema derecho de coordendas, en el cual los elementos del tensor de conductividad están
diagonalizados.
4.5. Transformaciones tensoriales en sistemas de coor-

denadas curvilı́neos.
Las transformaciones de las secciones previas pueden ser fácilmente generalizadas a un
sistema de coordenadas curvilı́neas. Consideremos el problema intermedio de una transfor-
mación entre un sistema cartesiano y uno curvilı́neo.
El sistema cartesiano tendrá las coordenadas primadas (x01 , x02 , x03 ) y los vectores base
(ê01 , ê02 , ê03 ). Por otra parte, el sistema curvilı́neo tiene las coordenadas (q1 , q2 , q3 ), los vectores
base (q̂1 , q̂2 , q̂3 ) y los factores de escala (h1 , h2 , h3 ). El set de ecuaciones que relacionan las
coordenadas de los dos sistemas pueden ser escritas por
x01 = x01 (q1 , q2 , q3 )

x02 = x02 (q1 , q2 , q3 ) (4.92)
x03 = x03 (q1 , q2 , q3 ) .
Por ejemplo, las ecuaciones que relacionan el sistema de coordenadas cilı́ndrico con el carte-
siano son
x01 = x0 = ρ cos θ
x02 = y 0 = ρ sen θ (4.93)
x03 = z 0 = z .
La matriz de transformación [a] realiza la misma función como antes. Esto es, toma las com-
ponentes del sistema curvilı́neo no primado de un vector y genera las coordenadas cartesianas
en el sistema primado
vi0 = aij vj . (4.94)

Recordando del capı́tulo anterior que el vector desplazamiento para los dos sistemas puede
ser escrito como
d~r = dx0i ê0i = hj dqj q̂j . (4.95)

Las componentes del vector desplazamiento en el sistema curvilı́neo no primado están da-
dos por hj dqj , mientras que sus componentes en el sistema cartesiano primado están dados
por dx0i . Estas componentes deben estar relacionadas por la matriz transformación [a]. En
notación de Einstein
dx0i = aij hj dqj . (4.96)

El diferencial total dx0i puede ser formado desde la ecuación (4.92), de donde obtenemos
∂x0i (q1 , q2 , q3 )
dx0i = dqj . (4.97)
∂qj
4.6. PSEUDO-OBJETOS. 77
La ecuación (4.97) puede ser colocada en la forma de la ecuación (4.96) multiplicando el lado
derecho de la ecuación (4.97) por hj /hj
∂x0i (q1 , q2 , q3 ) hj ∂x0i (q1 , q2 , q3 )

dx0i = dqj = hj dqj . (4.98)
∂qj hj hj ∂qj
Comparando las ecuaciones (4.98) y (4.96) obtenemos
∂x0i (q1 , q2 , q3 )
aij = [Curvilı́neo a Cartesiano] . (4.99)
hj ∂qj
La generalización para la transformación entre dos sistemas curvilı́neos se sigue de una
manera análoga. Los elementos para la matriz transformación [a] en este caso son
h0j ∂x0i (q1 , q2 , q3 )

aij = [Curvilı́neo a Curvilı́neo] . (4.100)
hj ∂qj
Notemos que no hay suma sobre i ó j en el lado derecho de la ecuación (4.100) ya que ambos
subı́ndices aparecen en el lado izquierdo de la expresión.
La ecuación (4.100) es la forma más general para los elementos de la matriz transformación
entre dos sistemas curvilı́neos. Es simplificada a la ecuación (4.99) si el sistema primado es
cartesiano, ya que para este caso h0j → 1. Además se degenera a la ecuación (4.35) cuando
los dos sistemas son cartesianos, ya que para este caso hj → 1.
Como antes, la matriz de tranformación puede ser determinada también desde la base
vectorial de los dos sistemas de coordenadas. Para el caso curvilı́neo general, los elementos
de [a] son
aij = (q̂i0 · q̂j ) . (4.101)

La manipulación algebraica es fácil utilizando la notación de Einstein. Puede ser un
ejercicio útil realizar los mismos pasos usando sólo matrices para que se convenza que es más
útil.
4.6. Pseudo-objetos.
Si consideramos sólo las transformaciones que involucran traslaciones o rotaciones rı́gidas,
no hay forma de cambiar un sistema de orientación derecha a uno de orientación izquierda, o
viceversa. Para cambiar esto necesitamos una reflexión. Las transformaciones que involucran
reflexiones requieren la introducción de los llamados “pseudo”-objetos. Los pseudoescalares,
pseudovectores y pseudotensores son muy similares a sus contrapartes “regulares”, excepto
por su comportamiento cuando son reflejados. Una forma fácil de demostrar la diferencia es
examinando el producto cruz de dos vectores regulares en los sistemas derechos e izquierdos.
4.6.1. Pseudo-vectores.
Consideremos el sistema de coordenadas cartesiana derecho mostrado en la figura 4.4. La
figura muestra dos vectores regulares en este sistema, orientado a lo largo de dos vectores de
la base
2
e3
e2
1
e1
Figura 4.4: Sistema de la mano derecha.
~ = A0 ê1
A (4.102)
~ = B0 ê2 .
B (4.103)
Por “regulares” nos referimos que las componentes de estos vectores obedecen la ecuación
(4.25) cuando transformamos las coordenadas.
~yB
El producto cruz entre A ~ puede ser escrito usando el determinante

ê1 ê2 ê3
~×B ~ = A0 0 0 = A0 B0 ê3 ,

A (4.104)
0 B0 0
o, usando el tensor de Levi-Civita
~×B
A ~ = Ai Bj ijk êk = A0 B0 ê3 . (4.105)
El vector resultante es mostrado en la figura 4.5. Notemos como la dirección de A ~×B ~

está dada por la regla de la mano derecha. Si apuntamos los dedos de la mano en la dirección
de A~ y los rotamos en la dirección de B,
~ el pulgar apuntará en la dirección del resultado.
Mantengamos en mente que el producto cruz no es conmutativo. Si el orden de la operación
es invertido, es decir, si hacemos B~ × A,
~ el resultado apunta exactamente en la dirección
opuesta.
A xB
2
B
1
A
Figura 4.5: Vectores en el sistema de la mano derecha.

Consideremos ahora el sistema orientado a la izquierda, mostrado en la figura 4.6, con

la base de vectores marcada con primas para direfenciarla de las coordenadas y la base del
sistema de la mano derecha. Este sistema resulta de una inversión simple del eje 1 del sistema
no primado. También puede ser visto como una reflexión del sistema derecho sobre el plano
x2 x3 . Las ecuaciones que relacionan los sistemas son
x01 = −x1
x02 = +x2 (4.106)
x03 = +x3
3’
e’3 2’
e’2
1’
e’1
Figura 4.6: Sistema de la mano izquierda.
por tanto, la matriz transformación es
 
−1 0 0
[a] =  0 1 0 . (4.107)
0 0 1
~yB
Los vectores regulares A ~ en el sistema prima son simplemente
~ = −A0 ê01
A (4.108)
~ = B0 ê02 .
B (4.109)
Sólo escribimos estos resultados porque son obvios. Recordemos que formalmente estos son
obtenidos aplicando [a] a las componentes de los vectores no primados. De la multiplicación
matricial obtenemos
A01
      
−1 0 0 A0 −A0
A02  =  0 1 0  0  =  0  (4.110)
A03 0 0 1 0 0
y
B10
      
−1 0 0 0 0
B20  =  0 1 0 B0  = B0  . (4.111)
B30 0 0 1 0 0
Es importante recordar que los vectores son los mismos objetos fı́sicos en ambos sistemas de
coordenadas. Están expresados en términos de distintas componentes y bases vectoriales.
Ahora formemos el producto cruz A ~×B ~ en el sistema izquierdo. Para esto usaremos la
relación de determinante
0 0

0
ê1 ê2 ê3
~×B ~ = −A0 0 0 = −A0 B0 ê03 ,

A (4.112)
0 B0 0
o, usando el tensor de Levi-Civita
~×B
A ~ = A0i Bj0 ijk ê0k = A01 B10 123 ê03 = −A0 B0 ê03 . (4.113)
Los vectores A,~ B ~ y el producto cruz A ~×B ~ para el sistema izquierdo son mostrados en
la figura 4.7. Notemos como la regla de la mano derecha ya no nos sirve para encontrar
la dirección del producto cruz. Si definimos el producto cruz usando el determinante en la
ecuación (4.112), entonces debemos usar la regla de la mano izquierda si estamos en el sistema
de coordenadas izquierdo.
2’
B
3’ 1’
A
A xB
Figura 4.7: Vectores en el sistema de la mano izquierda.
Notemos algo peculiar. Comparando las figuras 4.7 y 4.5 observamos que, mientras A ~ y
~
B apuntan en las mismas direcciones, sus productos cruces no apuntan en las mismas direc-
ciones. Cambiando la orientación del sistema de coordenadas, hemos cambiado la dirección
del vector A~ × B.
~
Miremos el producto cruz desde otro punto de vista. Si las componentes del vector A ~ ×B~
en el sistema no primado, dado por la ecuación (4.104), son transformados al sistema primado
usando usando la matriz [a], como lo hacemos para las componentes de los vectores regulares,
obtenemos
    
−1 0 0 0 0
 0 1 0  0  =  0  . (4.114)
0 0 1 A0 B0 A0 B0
Combinando estas componentes con la base de vectores apropiada, obtenemos para el vector
resultante del producto cruz
A0 B0 ê03 . (4.115)
Este resultado difiere de la ecuación (4.112) por un signo menos. Para sortear esta dificultad,
la cantidad formada por el producto cruz de dos vectores regulares es llamado un pseudo-
vector. Los Pseudovectores también son llamados vectores axiales, mientras que los vectores
regulares son llamados vectores polares. Si ~v es un vector regular transforma de acuerdo a la
ecuación (4.25). Por otra parte, si ~v es un pseudovector, sus componentes tranforman como
vr0 = |a|vi ari . (4.116)

De esta forma, la ecuación (4.114) se convierte en
 ~ ~ 0     
(A × B)1 −1 0 0 0 0
~ × B)
(A ~ 02  = −  0 1 0  0  =  0  (4.117)
~ × B)
(A ~ 03 0 0 1 A0 B0 −A0 B0
de donde resulta
~×B
A ~ = −A0 B0 ê03 , (4.118)
de acuerdo con las ecuaciones (4.112) y (4.113).
En resumen, si ~v es un vector regular sus componentes transforman como
vr0 = vi ari . (4.119)

En cambio, si es un pseudovector, sus componentes transforman como
vr0 = |a|vi ari . (4.120)

Si la orientación del sistema de dos sistemas de coordenadas ortonormales son el mismo, una
transformación entre ellos tendrá |a| = 1, y los vectores y pseudovectores transformarán nor-
malmente. Si los sistemas tienen orientación opuesta, |a| = −1 y los vectores transformarán
normalmente, mientras que los pseudovectores cambiarán su dirección. Un vector generado
por el producto cruz de dos vectores regulares es un pseudovector.
Es tentador pensar que toda esta parafernalia es un sutil error de signo embebidos en la
definición de producto cruz. En algunos casos esto es correcto. Por ejemplo, cuando definimos
la dirección del vector que define el campo magnético, que resulta ser un pseudovector, hemos
elegido implı́citamente el sentido del sistema de coordenadas que debe ser tratada de manera
consistente. Otro ejemplo es el vector momento angular, el cual es definido por un producto
cruz. Aunque se puede achacar este problema de pseudovectores de estos dos ejemplos es
sólo un problema de definición, hay casos en que simplemente no se puede olvidar esta
propiedad. Es posible diseñar una situación en la cual un experimento y su imagen especular
no producen los resultados esperados, los cuales son simplemente la imagen especular una de
otra. De hecho, el premio Nobel fue adjudicado a Lee y Yang por analizar estas violaciones
a la conservación de paridad, lo cual va en contra de la lógica común. El experimento fue
realizado por primera vez por Wu, quien mostró este efecto con la emisión de partı́culas beta
desde el Cobalto 60, bajo la influencia de interacciones débiles.
4.6.2. Pseudo-escalares.
Las ideas que nos dejaron los pseudovectores se aplican también a los escalares. Un escalar
es invariante ante cualquier cambio del sistema de coordenadas. En cambio, un pseudoescalar
cambia de signo si la orientación del sistema cambia. Un pseudoescalar involucrado en una
transformación, governado por una matriz de transformación [a], obedecerá
S 0 = |a|S . (4.121)
Un buen ejemplo de pseudoescalar se puede derivar del comportamiento del producto

cruz. El volumen de un paralelógramo tridimensional, mostrado en la figura 4.8, puede ser
escrito por
~ × B)
Volumen = (A ~ ·C
~ . (4.122)
C
B
A
Figura 4.8: El paralelogramo.
~×B
En un sistema de coordenadas derecho, el vector formado por A ~ apuntará hacia arriba.
Por tanto, en un sistema derecho,
~ × B)
(A ~ ·C
~ >0. (4.123)
Pero en un sistema de coordenadas izquierdo, apunta hacia abajo, por tanto
~ × B)
(A ~ ·C
~ <0. (4.124)
Interpretado de esta forma, el volumen de un paralelogramo es un pseudoescalar.

4.6.3. Pseudo-tensores.
Los pseudotensores están definidos como uno espera. Bajo una transformación, las com-
ponentes de un pseutensor obedecen
0
Trst... = |a|Tijk... ari asj atk . . . , (4.125)
la cual es igual a lo que obedece un tensor regular, salvo por el término |a|.
Nuevamente utilizamos el producto cruz como ejemplo. Consideremos dos sistemas de
coordenadas. El sistema primado es un sistema derecho, y el otro, con el sistema no primado,
es izquierdo. Usando el sı́mbolo de Levy-Civita en los dos sistemas para generar el producto
cruz A~×B ~ obtenemos
Ai Bj ijk êk = −A0r Bs0 0rst êt . (4.126)

El signo menos aparece porque como fue mostrado antes, la dirección fı́sica del producto cruz
es diferente en los dos sistemas de coordenadas. Ahora, las transformaciones de coordena-
das de vectores regulares pueden ser usadas para encontrar la relación entre ijk y 0rst . Ya
que todos los vectores involucrados son regulares, es decir, A,~ B~ y los vectores base, estos
transforman de acuerdo a la ecuación (4.25). Escribiendo las componentes primadas de estos
vectores en términos de los no primados, la ecuación (4.126) se convierte en
Ai Bj ijk êk = −Ai Bj ari asj atk 0rst êk . (4.127)

~yB
Esta última expresión es cierta para A ~ arbitrarios, por tanto obtenemos
ijk = −ari asj atk 0rst . (4.128)

Tengamos en mente que esto se aplica sólo cuando dos sistemas tienen orientaciones
distintas. Si ambos sistemas tienen la misma orientación, el signo menos desaparece. Por
tanto, para el caso general de una transformación arbitraria entre dos sistemas ortonormales,
el sı́mbolo de Levy-Civita obedece
ijk = |a|ari asj atk 0rst . (4.129)

Por tanto, el sı́mbolo de Levy-Civita es un pseudotensor.
Capı́tulo 5
Sistema de coordenadas no
ortogonales.
5.1. Breve recuerdo de transformaciones tensoriales.

Ya discutimos cómo un tensor es definido por su comportamiento bajo transformaciones
de coordenadas. Con una cuota de sarcasmo, la definición que dimos fue “un tensor es una
cantidad que transforma como tensor”. Lo que esto significa es que las reglas de transfor-
mación son suficientes como para caracterizar a los tensores con sus propiedades especiales.
Si un objeto transforma entre sistemas de coordenadas usando las reglas de transformación
tensorial, podemos decir legı́timamente que el objeto es un tensor.
Recordemos, los elementos de un tensor pueden transformar usando una matriz de trans-
formaciones, cuyos elementos pueden ser obtenidos de las ecuaciones que relacionan las coor-
denadas de los dos sistemas. Para transformaciones entre sistemas cartesianos, los elementos
de esta matriz de transformación [a] están dados por
∂x0i
aij = (ê0i · êj ) = . (5.1)
∂xj
En esta ecuación, el sistema original tiene coordenadas xi y vectores base êi . El sistema
es transformado al sistema primado, el cual tiene coordenadas x0i y vectores base ê0i . Para
sistemas de coordenadas ortonormales, la inversa de esta matriz de transformación es siempre
su transpuesta
a−1
ij = aji . (5.2)
Un tensor arbitrario de rango n puede ser expresado tanto en el sistema primado como
en el no primado por
↔
0
T = Tijk... êi êj êk . . . = Trst... ê0r ê0s ê0t . . . , (5.3)
1
Este capı́tulo está basado en el décimo cuarto capı́tulo del libro: Mathematical Physics de Brusse Kusse
& Erik Westwig, editorial John Wiley & Sons, Inc..
85
86 CAPÍTULO 5. SISTEMA DE COORDENADAS NO ORTOGONALES.
0
donde hay n subı́ndices y n vectores base en cada término. Tijk... y Trst... son los elementos
del tensor en el sistema de coordenadas no primado y primado, respectivamente. Los dos
conjuntos de elementos están relacionados por la ecuación matricial de transformación
0
Trst... = Tijk... ari asj atk . . . , (5.4)
donde la matriz [a] aparece n veces. La transformación inversa es
0
Trst... = Tijk... air ajs akt . . . . (5.5)
Nuestra propuesta fundamental es que cualquier cantidad que transforma en la manera des-
crita por la ecuación (5.4) es por definición un tensor.
Como un vector es un tensor de primer rango, las transformaciones de las componentes
son descritas por las ecuaciones (5.4) y (5.5). Si escribimos un vector en dos sistemas de
coordenadas como
~v = vi êi = vr0 ê0r , (5.6)

la relación entre las componentes está dado por
vr0 = vi ari , (5.7)

y la inversa
vr = vi0 air . (5.8)

Los escalares son invariantes ante una transformación de coordenadas. Podemos pensar
que un escalar es un tensor de rango cero. El único elemento de un tensor de rango cero no
tiene subı́ndices y no está combinado con una base vectorial. La ecuación (5.4) se reduce a
S = S0 (5.9)
donde S (o S 0 ) en el único elemento del escalar.
Ejemplo
Como un ejemplo del uso de las propiedades de las transformaciones para identificar a un
objeto como tensor, consideremos la delta de Kronecker. Recordemos que este sı́mbolo fue
introducido para formar el producto punto en sistemas de coordenadas ortonormales. El pro-
~yB
ducto punto entre dos vectores, A ~ escrito en dos sistemas ortonormales de coordenadas,
uno primado y otro primado, puede ser escrito por
~·B
A ~ = Ai Bj δij = A0r Bs0 δrs
0
. (5.10)
0
Ahora, sabemos que tanto δij como δrs pueden ser escritos como matrices unitarias, tal
como [1]. Sin embargo, para los propósitos de esta discusión, observemos las consecuencias
de imponer que las dos expresiones para el producto punto en la ecuación (5.10) sean iguales,
y que Ai y Bi son componentes vectoriales, y por tanto, transforma de acuerdo a la ecuación
(5.7). Sustituyendo en la ecuación (5.10), tenemos para A0r y Bs0
5.2. SISTEMAS DE COORDENADAS NO ORTOGONALES. 87
0
Ai Bj δij = ari Ai asj Bj δrs .
0
= Ai Bj ari asj δrs . (5.11)
~ y B,
Como esta expresión debe ser verdadera para cualquier A ~ podemos escribir
0
δij = ari asj δrs . (5.12)
Invirtiendo esta expresión, obtenemos
δij0 = air ajs δrs . (5.13)

Comparando las ecuaciones (5.12) y (5.13) con las ecuaciones (5.4) y (5.5), se observa que los
elementos de la delta de Kronecker transforman como los elementos de un tensor de segundo
rango. Por tanto, el sı́mbolo de la delta de Kronecker es un tensor de segundo rango, el cual
puede ser expresado con una base vectorial como
↔
δ = δij êi êj = δij0 ê0i ê0j . (5.14)
5.2. Sistemas de coordenadas no ortogonales.

Hasta este punto, hemos tratado sólo con sistemas de coordenadas ortonormales. En
sistemas cartesianos, los vectores base êi son independientes de la posición y ortonormales,
por lo tanto êi · êj = δij . En sistemas curvilı́neos, los vectores base q̂i no son independientes de
la posición, pero aún son ortonormales, por tanto q̂i · q̂j = δij . Ahora consideraremos sistemas
no ortonormales. Para distinguir estos sistemas, escribiremos los vectores base de sistemas
de coordenadas no ortonormales como ĝi , y la condición de no ortonormalidad se convierte
en ĝi · ĝj 6= δij . Para mantener esta discusión y las derivaciones de la forma más simple, nos
limitaremos a sistemas de coordenadas donde las bases vectoriales no varı́en con la posición.
Obviamente esto no es el caso más general de sistemas de coordenadas no ortogonales, pero
es suficiente para demostrar las ideas de covarianza, contravarianza y métrica.
En fı́sica, los sistemas de coordenadas no ortonormales aparecen, por ejemplo, en relati-
vidad (tanto especial como general). El postulado básico de la relatividad especial es que la
velocidad de la luz c es la misma para todos los sistemas de referencia. Como consecuencia
de este postulado, la posición y el tiempo de algún fenómeno fı́sico (un “evento”) cambia tal
como cambie el sistema de referencia. Es muy similar a cómo las componentes de un vector
cambian cuando transformamos los ejes coordenados. Si restringimos el movimiento a una
coordenada espacial, un evento puede ser descrito por dos coordenadas, una coordenada es-
pacial y una temporal. Como será mostrado, la observación de un evento en dos sistemas de
coordenadas distintos, uno primado y otro no primado, puede ser dibujado como un punto
usando el conjunto de ejes combinados, como es mostrado en la figura 5.1. Tomando sus
componentes con respecto a ambos ejes coordenados, podemos obtener todas las relaciones
impuestas por la relatividad especial. Notemos cómo los ejes x y ct se intersectan en ángulos
rectos, pero los ejes x0 y ct0 no lo hacen. Mientras el sistema no primado parece ser ortogonal,
el sistema primado parece ser un sistema no ortogonal e inclinado.
ct ct’
Un evento
x’
x
Figura 5.1: Los sistemas de coordenadas de la Relatividad Especial.
El postulado básico de la relatividad general es que la gravedad y la aceleración son equi-

valentes. Los eventos observados en un campo gravitacional aparecen como si estos estuviesen
siendo observados en un sistema de coordenadas acelerado. Esto implica que la luz propa-
gandose a través del campo gravitacional de un objeto masivo, como una estrella, se deberı́a
doblar, como es mostrado en la figura 5.2. Esto podrı́a causar que la posición aparente de
una estrella se desvı́a de su posición actual. Este fenómeno fue observado por primera vez
por Arthur Eddington, el cual midió la pequeña deflexión de las estrellas provocadas por el
Sol durante el eclipse total de 1919. Los caminos que siguen los rayos de luz a través del
espacio son llamados geodésicas. Una elección natural para las lı́neas de la grilla de un sis-
tema de coordenadas localizado, siguen estas geodésicas, como es mostrado en la figura 5.2.
No discutiremos ejemplos de este tipo de sistemas, pero si nos restringiremos a discutir los
sistemas inclinados, donde las bases vectoriales no son ortonormales, pero son espacialmente
invariantes.
Sistema de coordenadas
local no ortogonal
Estrella Aparente
Mo
Estrella
Figura 5.2: Un sistema de coordenadas de la Relatividad General.
5.2.1. Un sistema de coordenadas inclinado.

Consideremos un sistema de coordenadas cartesiano (x1 , x2 ) y el sistema primado no
ortonormal (x01 , x02 ), como es mostrado en la figura 5.3. También son representados en la
figura dos pares de vectores base y un vector arbitrario ~v . La base vectorial de sistema no
primado es ortonormal
êi · êj = δij . (5.15)
2 2’
V2 V
1’
V’2
g’2 V’1
e2 g’1 1
e1 V1
Figura 5.3: Un sistema de coordenadas ortonormal y otro inclinado.
La base vectorial del sistema inclinado son elegidos para que sean vectores unitarios,
ĝ10 · ĝ10 = ĝ20 · ĝ20 = 1 , (5.16)

pero no son ortonormales
ĝi0 · ĝj0 6= δij . (5.17)

Como podemos ver, el formalismo que es desarrollado permite que los vectores base no sean
unitarios. Sin embargo, para comenzar el tratamiento de la manera más sencilla, suponemos
que la base vectorial del sistema inclinado satisface la ecuación (5.16).
En el sistema ortonormal, el vector ~v puede ser expresado como la suma de sus compo-
nentes proyectadas de forma paralela en los ejes, como es mostrado en la figura 5.3, junto a
la correspondiente base vectorial
~v = v1 ê1 + v2 ê2 . (5.18)

Estas componentes vectoriales son sólo los tamaños proyectados de ~v a lo largo de los ejes del
sistema no primado y pueden ser determinados con trigonometrı́a o siguiendo la manipulación
vectorial correspondiente. Una componente particular es obtenida haciendo el producto punto
entre ~v y el correspondiente vector base. Por ejemplo, para encontrar v1
~v · ê1 = (v1 ê1 + v2 ê2 ) · ê1

= v1 (ê1 · ê1 ) + v2 (ê2 · ê1 )
= v1 δ11 + v2 δ21
= v1 . (5.19)
Esto resulta bello sólo por la ortogonalidad de los vectores base.

En el sistema primado, el mismo vector puede ser escrito en términos de las componentes
proyectadas de forma paralela en los ejes y los vectores base prima, como es mostrado en la
figura 5.3,
~v = v10 ĝ10 + v20 ĝ20 . (5.20)

Estas componentes también pueden ser determinadas por trigonometrı́a, pero como tenemos
una geometrı́a inclinada, no es tan sencillo como lo es en el sistema ortogonal. Como la base
de vectores primados no son ortogonales, un intento por aislar una componente particular
por una manipulación vectorial, similar a la desarrollada en la ecuación (5.19) falla
~v · ĝ10 = (v10 ĝ10 + v20 ĝ20 ) · ĝ10

= v10 (ĝ10 · ĝ10 ) + v20 (ĝ20 · ĝ10 )
= v10 + v20 (ĝ20 · ĝ10 )
6= v1 . (5.21)
Al parecer, las manipulaciones vectoriales en sistemas de coordenadas no ortogonales son
mucho más difı́ciles que en los sistemas ortonormales. Afortunadamente, hay algunas técnicas
formales que simplifican el proceso. En la próxima sección, introduciremos los conceptos de
covarianza, contravarianza, y el tensor métrico. Usando estas herramientas, el producto punto
entre dos vectores tienen la misma forma tanto en un sistema ortogonal como en un sistema
no ortogonal.
5.2.2. Covarianza, contravarianza y métrica.

La complicación básica introducida por un sistema de coordenadas no-ortogonal es evi-
dentemente en la operación producto punto. En un sistema ortonormal de dos dimensiones
descrito anteriormente, el producto interno entre dos vectores es dado por
~·B
A ~ = Ai êi · Bj êj
= Ai Bj δij
= A1 B1 + A2 B2 . (5.22)
Si este mismo producto interno es realizado en el sistema no-ortogonal de la figura 5.3 el
resultado contiene algunos términos extras:
~·B
A ~ = A0i ĝi0 · Bj0 ĝj0
= A0i Bj0 (ĝi0 · ĝj0 )
= A01 B10 + A02 B20 + (A01 B20 + A02 B10 )(ĝ10 · ĝ20 ) . (5.23)
El producto interno evaluado en el sistema no-ortonormal, expresado en (5.23), puede ser
puesto en la forma de la ecuación (5.22) rearreglandolo como sigue:
~·B
A ~ = A01 (B10 + B20 (ĝ10 · ĝ20 )) + A02 (B10 (ĝ10 · ĝ20 ) + B20 ) . (5.24)
~ como
Ahora definamos un nuevo conjunto de componentes para B
B̃10 = B10 + B20 (ĝ10 · ĝ20 )

(5.25)
B̃20 = B10 (ĝ10 · ĝ20 ) + B20 .
Estas cantidades son llamadas las componentes covariantes de B, ~ mientras que las com-
ponentes originales son llamadas contravariantes. Claramente, el vector B ~ no puede ser
expresado por la combinación de estas nuevas componentes covariantes con los vectores ba-
ses ĝ10 y ĝ20 :
B~ 6= B̃10 ĝ10 + B̃20 ĝ20 . (5.26)
Sin embargo, con estas componentes el producto evaluado en el sistema inclinado puede ser
puesto en una forma simple
~·B
A ~ = A0i B̃i0
= A01 B̃10 + A02 B̃20 . (5.27)
Notemos que el producto interno también puede ser escrito como

~·B
A ~ = Ã0i Bi0 , (5.28)
~ definidas como
con las componentes covariantes de A
Ã01 = A01 + A02 (ĝ10 · ĝ20 )

Ã02 = A01 (ĝ10 · ĝ20 ) + A02 . (5.29)
El producto interno necesita estar formado con una mezcla de componentes covariantes y
contravariantes, pero no importa que vector es expresado en que tipo de componentes.
Estos argumentos pueden ser extendidos a sistemas no-ortogonales de dimensión arbitra-
ria. La restricción que los vectores bases estén normalizados a la unidad puede ser levantada.
Las componentes covariantes pueden ser generadas a partir de las componentes contravarian-
tes usando la expresión general
Ã0i = A0j (ĝi0 · ĝj0 ) . (5.30)
Hemos usado convención de Einstein, lo cual implica suma sobre j. Para un sistema de
coordenada n-dimensional en cada suma habrı́a n términos. Notemos que si el sistema de coor-
denadas es ortonormal la ecuación (5.30) se reduce a Ã0i = A0i y las componentes covariante
y contravariantes son iguales. En este caso, ambas ecuaciones (5.27) y (5.28) se revierten a
la ecuación (5.22). Esto es importante, porque implica que esta nueva notación es suficien-
temente general para manejar todos nuestros previos sistemas de coordenadas Cartesianos y
curvilı́neos, tanto como los nuevos no-ortogonales.
Existe otra manera de expresar el producto interno entre dos vectores en un sistema no-
ortogonal que hace uso de una cantidad llamada la métrica. Como veremos más tarde, la
métrica es un tensor de rango dos. Los elementos de la métrica, en un sistema sin primas,
están definidos como
Mij = ĝi · ĝj . (5.31)
Notemos que esta definición implica que la métrica es simétrico:
Mij = Mji . (5.32)
Usando la métrica la ecuación (5.30) puede ser escrita como
Ãi = Aj Mij . (5.33)
La métrica convierte las componentes contravariantes en componentes covariantes.

Ahora el producto interno entre A~yB ~ pueden ser reescrito
~·B
A ~ = Ai Bj Mij . (5.34)
La suma sobre ambos i y j está indicada en el lado derecho de la ecuación. Si realizamos la

suma sobre i primero, la ecuación (5.34) se convierte en
~·B
A ~ = Ãj Bj . (5.35)
Cuando la suma sobre j es realizada primero, la ecuación (5.34) se convierte en
~·B
A ~ = Ai B̃i . (5.36)
Cuando la ecuación (5.34) es usada para el producto interno, las componentes vectoriales no
se mezclan. Las componentes contravariantes son usadas para ambos vectores. Si el sistema es
ortonormal Mij = δij , resultando el producto interno standard para un sistema ortonormal.
Notemos que la métrica es determinada solamente por los vectores bases del sistema de
coordenadas. Esto se volverá un hecho importante y nos permitirá identificar a la métrica
como un tensor de rango dos.
En resumen, hay dos maneras de realizar el producto interno entre dos vectores en un
sistema no-ortogonal. Una manera es usar las componentes covariantes y contravariantes,
como fue hecho en las ecuaciones (5.27) y (5.28). Un método completamente equivalente es
usar la métrica y las componentes regulares contravariantes del vector, como demostramos en
la ecuación (5.34). Estos argumentos pueden ser naturalmente extendidos al producto interno
entre cantidades tensoriales, pero esta generalización será pospuesta hasta que las ecuaciones
de transformación para sistema no-ortogonales sean trabajadas.
5.2.3. Transformaciones de componentes vectoriales contravarian-

tes.
Imaginemos dos sistemas de coordenadas inclinados diferentes, como es mostrado en la
figura 5.4. Queremos encontrar como la componentes contravariantes de un vector expresadas
en el primer sistema pueden ser transformadas al segundo sistema. El primer sistema tiene
las coordenadas no primadas xi y vectores base ĝi , mientras que el segundo sistema usa las
coordenadas primadas x0i y vectores base ĝi0 . Recordemos que estamos limitados a sistemas
de coordenadas con vectores base constantes. Sean las ecuaciones generales que relacionan
los dos conjuntos de coordenadas
2 2’
V2 V
1’
V’2
g’2 V’1
e2 g’1 1
e1 V1
Figura 5.4: Dos sistemas de coordenadas inclinados.
x0i = x0i (x1 , x2 , x3 )

xi = xi (x01 , x02 , x03 ) . (5.37)
Habrán sólo un par de ecuaciones para cada dimensión de los sistemas.
En nuestro trabajo previo tratando con transformaciones entre sistemas de coordenadas
ortonormales, fuimos capaces de relacionar las componentes vectoriales de un sistema con el
otro vı́a la matriz de transformación [a],
vi0 = aij vj . (5.38)

La restricción para sistemas ortonormales nos permitió invertir esta expresión de forma tri-
vial, ya que se transformó en a−1
ij = aji . Podemos escribir una relación similar para la ecuación
(5.38) para las transformaciones entre sistemas no ortonormales, pero necesitamos tener más
cuidado, ya que la inversa de la matriz transformación no es su transpuesta. Para no perder
la pista entre las transformaciones que aceptan esta inversión simple y las que no, reser-
varemos la matriz [a] para las transformaciones entre sistemas ortonormales. La matriz [t]
representará las transformaciones entre las coordenadas no primadas y las primadas, donde
los sistemas pueden ser no ortonormales
vi0 = tij vj . (5.39)

La operación en reversa, una transformación entre las coordenadas primadas y las coordena-
das no primadas, usaremos la matriz [g],
vi = gij vj0 , (5.40)

donde gij = t−1ij 6= tji . Por su definición, se sigue que tij gjk = δik . Discutiremos detalladamente
la relación entre las matrices [t] y [g] más adelante. En ambas expresiones, las componentes
vectoriales son componentes contravariantes regulares de ~v , no las componentes covariantes
que presentamos.
Todos los vectores en un punto dado transforman usando la misma matriz [t]. Para de-
terminar los elementos tij , es más fácil considerar el vector desplazamiento d~r, el cual en los
dos sistemas de coordenadas está dado por
d~r = dxi ĝi = dx0i ĝi0 . (5.41)

Aplicando esta igualdad a la ecuación (5.39), tenemos
dx0i = tij dxj . (5.42)

Refiriéndose a las ecuaciones (5.37), obtenemos la relación
∂x0i
dx0i = dxj , (5.43)
∂xj
y los elementos de la matriz transformación pueden ser escritos como
∂x0i
tij = . (5.44)
∂xj
Hasta ahora, estos resultados se parecen mucho a las transformaciones cartesianas que ya
habı́amos visto. De hecho, la ecuación para las componentes de [t] dadas en la ecuación (5.44)
es el mismo resultado obtenido para la matriz [a] entre sistemas cartesianos. Las complica-
ciones aparecen cuando tratamos de invertir estas ecuaciones. Como ya hemos mencionado,
la inversión de [t] no es simplemente calcular la traspuesta. Una forma general de obtener
[t]−1 , la cual estamos llamando [g], es utilizar la expresión
cji
gij = t−1
ij = , (5.45)
|tij |
donde cji es el cofactor ji de la matriz tij . Del álgebra de matrices, este cofactor es definido
como (−1)i+j por el determinante de la matriz tij , con la columna j-ésima y la columna i-
ésima removida. La matriz [g] puede también ser obtenida desde las ecuaciones que relacionan
las coordenadas, exactamente de la misma manera que se llega a la ecuación (5.44)
∂xi
gij = t−1
ij = . (5.46)
∂x0j
Las matrices [t] y [g] pueden también ser usadas para relacionar una base vectorial con
la otra. Usando las componentes contravariantes, cualquier vector ~v puede ser expresado en
el sistema primado o el no primado como
~v = vj ĝj = vi0 ĝi0 . (5.47)

Sustituyendo la ecuación (5.39) en la ecuación (5.47) obtenemos
~v = vj ĝj = vj tij ĝi0 . (5.48)

Como esta expresión es válida para cualquier ~v , se debe cumplir
ĝj = tij ĝi0 . (5.49)

Haciendo el proceso análogo, pero usando [g] en vez de [t], obtenemos
ĝj0 = gij ĝi . (5.50)

Notemos que las componentes vectoriales contravariantes son transformadas por contraccio-
nes sobre el segundo subı́ndice de tij o gij , mientras que las bases vectoriales son transformados
contrayendo sobre el primer subı́ndice.
Para resumir los resultados de esta sección, la transformación entre los dos sistemas de
coordenadas no ortonormales es gobernada por las relaciones
tij = ∂x0i /∂xj gij = ∂xi /∂x0j

vi0 = tij vj vi = gij vj0
ĝj = tij ĝi0 ĝj0 = gij ĝi .
5.2.4. Notación de subı́ndices y superı́ndices.

Antes de proceder con una discusión de cómo las componentes de un vector covariantes
transforman, resulta conveniente introducir una notación nueva. La notación con tilde (ṽi )
que hemos usado para las componentes de los vectores covariantes es engorrosa. No es obvio
que las siguientes convenciones son mucho mejores, pero proveen un mecanismo valioso para
mantener la pista de cuál tipo de componentes (contravariantes o covariantes) deben ser
usados en una expresión. Las componentes vectoriales proyectadas en forma paralela, las
cuales hemos llamado las componentes contravariantes, serán anotadas con un superı́ndice,
mientras que para las nuevas componentes covariantes se usará un subı́ndice en vez de un tilde.
Por ejemplo, las componentes contravariantes del vector ~v son v i , mientras las componentes
covariantes serán vi .
Una ventaja de esta nueva notación es evidente viendo la forma del producto interno.
Con la convención ya propuesta, podemos escribir el producto punto de A ~yB ~ como
~·B
A ~ = Ai Bi = Ai B i . (5.51)
Notemos que el ı́ndice sobre el cual sumamos aparece una vez como subı́ndice y otra como
superı́ndice. Esto es, por supuesto, lo mismo que decir que la suma es hecha sobre can-
tidades covariantes y contravariantes mezcladas. Este proceso de mezclar subı́ndices y su-
perı́ndices persistirá sobre casi todas las contracciones sobre un ı́ndice repetido. También
funcionará cuando queramos formar un vector desde sus componentes con la interpretación
adecuada de los vectores base. Sabemos que el vector puede ser formado con las componentes
contravariantes y la base vectorial
~v = v i ĝi . (5.52)
Para ser consistentes con la convención de subı́ndices y superı́ndices, las bases vectoriales
deben ser escritas con subı́ndices y ser consideradas covariantes. Veremos en la próxima
sección, que esta conclusión es consistente con la forma en que estas bases transforman.
Esta convención también previene que accidentalmente formemos un vector combinando
sus componentes covariantes con la base vectorial ĝi
~v 6= vi ĝi . (5.53)
La notación nos advierte que esto no es correcto ya que ambos ı́ndices aparecen como subı́ndi-
ces.
En la sección anterior generamos varias relaciones, las cuales describieron cómo las com-
ponentes contravariantes del vector ~v transforman entre dos sistemas inclinados. ¿Cómo de-
biesen ser modificados la presentación de estos resultados para ser consistente con la nueva
convención? En la sección anterior escribimos
vi0 = tij vj . (5.54)

Ahora estas componentes vectoriales deben ser escritas de manera correcta. Para ser consis-
tentes con esta nueva notación, uno de los ı́ndices de la matriz transformación necesita ser
un subı́ndice y otra con superı́ndice,
v 0i = tij v j , (5.55)
donde
∂x0i
tij = . (5.56)
∂xj
De manera similar, la inversión de la ecuación (5.55) se convierte en
v i = g ij v 0j , (5.57)
donde
∂xi
g ij = . (5.58)
∂x0j
Notemos cómo en las ecuaciones (5.56) y (5.58) la componente con superı́ndice en el deno-
minador de la derivada parcial resulta en un subı́ndice en el lado izquierdo de esta expresión.
Esta es una propiedad general de las derivadas parciales con respecto a cantidades covariantes
y contravariantes. Una derivada parcial con respecto a una cantidad contravariante produ-
ce un resultado covariante, mientras que una derivada parcial con respecto a una cantidad
covariante da como resultado una cantidad contravariante. Probaremos este hecho más tarde
en este capı́tulo.
Estas matrices de transformación tienen lo que es llamado una combinación de propie-
dades contravariantes/covariantes. Ellas son contravariantes con respecto a un ı́ndice, pero
covariantes con respecto al otro.
Con la notación que usábamos hasta comenzar esta sección, la naturaleza recı́proca de [t]
y [g] era indicada por la ecuación tij gjk = δik . Pero ahora, para ser consistentes con la nueva
notación, anotaremos
tij gkj = δ ik . (5.59)

La delta de Kronecker, escrita de esta manera, también presenta la forma mezclada de cova-
riante y contravariante.
Las ecuaciones (5.49) y (5.50), las cuales indican cómo transforman las bases vectoriales,
son escritas usando la notación de subı́ndices/superı́ndices por
ĝj = tij ĝi0

ĝj0 = g ij ĝi . (5.60)
Notemos la importancia de las posiciones horizontales de los ı́ndices de la matriz transfor-

mación. En las ecuaciones (5.55) y (5.57) la suma era sobre el segundo ı́ndice de la matriz,
mientras que estas sumas son sobre el primer ı́ndice. Esto previene de escribir los elementos
de la matriz [t] como tij , ya que esto podrı́a indicar cuál ı́ndice viene primero.
Deberı́amos también reescribir las relaciones que involucran la métrica usando la nue-
va notación. Nuestra definición previa de la métrica fue en términos de una base vectorial
covariante. Por tanto, la ecuación (5.31) se mantiene
Mij = ĝi · ĝj , (5.61)

y ambos ı́ndices permanecen como subı́ndices. De esta manera, los elementos de la métrica
son puramente covariantes, ya que ambos ı́ndices son subı́ndices. La métrica convierte las
componentes contravariantes de un vector a sus componentes covariantes, dentro del mismo
sistema de coordenadas. Esta operación puede ser escrita, usando la notación de subı́ndi-
ces/superı́ndices
vi = Mij v j . (5.62)
Notemos cómo la convención de sumas continúa su trabajo. La misma operación para un
sistema primado, usando una métrica primada, queda
Mij0 = ĝi0 · ĝj0 , (5.63)

y puede ser escrito como
vi0 = Mij0 v 0j . (5.64)

En resumen, las ecuaciones que gobiernan las transformaciones de las componentes contra-
variantes de un vector ~v pueden ser escritas usando la nueva notación de subı́ndices/superı́ndi-
ces
tij = ∂x0i /∂xj g ij = ∂xi /∂x0j

vi0 = tij v j v i = g ij v 0j
ĝj = tij ĝi0 ĝj0 = g ij ĝi .
Las componentes covariantes de ~v puede ser obtenida desde las componentes contravariantes
usando la métrica
Mij = ĝi · ĝj vi = Mij v j

Mij0 = ĝi0 · ĝj0 vi0 = Mij0 v 0j .
Claramente hay algunos hoyos en estos cuadros. Primero, está la pregunta de cómo las
componentes covariantes de un vector transforman. Segundo, decimos que los vectores base
ĝi son covariantes por naturaleza. Necesitamos probar esto. Finalmente, ¿podemos definir
bases vectoriales contravariantes? Estos tópicos están ı́ntimamente relacionados unos con los
otros, y apuntamos a esa dirección.
5.2.5. Transformaciones de componentes vectoriales covariantes.

Retornemos al par de sistemas coordenados inclinados descritos en la figura 5.4. Las
componentes vectoriales covariantes del vector ~v transformarán de acuerdo a alguna relación
lineal
vi0 = [?] vj . (5.65)

Para determinar [?] de esta expresión, consideremos dos formas equivalentes del producto
interno de dos vectores, uno en el sistema primado y otro en el sistema no primado
~·B
A ~ = Ai Bi = A0j Bj0 . (5.66)
~ transforman de acuerdo a las reglas ya determinadas
Las componentes contravariantes de A
A0j = tj i Ai . (5.67)
Sustituyendo esta expresión en el lado derecho de la ecuación (5.66), tenemos
Ai Bi = tj i Ai Bj0 . (5.68)
~ se debe tener
Como esta ecuación debe ser válida para cualquier A,
Bi = tj i Bj0 . (5.69)
Esta expresión puede ser fácilmente invertida, para obtener
Bi0 = g ji Bj . (5.70)
Notemos la similaridad entre las ecuaciones (5.60), (5.69) y (5.70). Esto soporta nuestra
conclusión que la base del eje paralelo es covariante.
Ahora somos capaces de combinar las componentes de los vectores base contravariantes,
ĝ i , las cuales pueden ser determinados con la componente del vector covariante para formar
el mismo vector. Esto es,
~v = v i ĝi . (5.71)
Serı́a mas bonito construir un nuevo conjunto de vectores base contravariantes, ĝ i , los cuales
pudiesen ser combinados con las componentes covariantes para formar el mismo vector. Esto
es,
~v = vi ĝ i . (5.72)
De hecho, podemos usar esta expresión para definir las bases de vectores contravariantes, y
ver las consecuencias.
Las propiedades básicas de las bases de vectores contravariantes pueden ser deducidas
considerando nuevamente el producto interno entre dos vectores, A ~ y B.
~ Si A~ es expresado
usando la base de vectores covariantes y las componentes contravariantes, mientras B ~ es
escrito con vectores base contravariantes y componentes vectoriales covariantes, el producto
interno se convierte en
~·B
A ~ = Ai ĝi · Bj ĝ j
= Ai Bj ĝi · ĝ j . (5.73)
De acuerdo a la ecuación (5.51), esta expresión debe ser igual a Ai Bi , por tanto
(
1 i=j
ĝi · ĝ j = , (5.74)
0 i 6= j
o en términos de la delta de Kronecker,
ĝi · ĝ j = δi j . (5.75)
Esta última condición permite determinar tanto la magnitud como la dirección de la base
de vectores contravariante, si la base de vectores covariante es conocida. Trabajando en dos
dimensiones, ĝ 1 · ĝ2 = 0 y ĝ 1 · ĝ1 = 1. En palabras, ĝ 1 debe ser perpendicular a ĝ2 , mientras
que su proyección a lo largo del eje 1, paralelo a ĝ 1 , debe ser uno. Esta unicidad determina
ĝ 1 y, por argumentos similares, ĝ2 . Las condiciones de la ecuación (5.75) pueden ser vistas
gráficamente como es mostrado en la figura 5.5. Las construcciones en esta figura fueron
hechas suponiendo que |ĝi | = 1.
g2
g2
1
g1
g1
Figura 5.5: Determinación de la base de vectores contravariante.
Las componentes de los vectores covariantes y contravariantes también pueden ser in-
terpretadas gráficamente, como es mostrado en la figura 5.6. Nuevamente, en esta figura se
ha supuesto que |ĝi | = 1. Las componentes de los vectores contravariantes son simplemente
las magnitudes de las proyecciones paralelas a los ejes del vector sobre los ejes inclinados
definidos por la base covariante de vectores. Las componentes covariantes son las magnitudes
de las proyecciones del vector en el mismo eje coordenado, pero siguiendo las lı́neas paralelas
a las nuevas base de vectores contravariante. Esto hace que las lı́neas de proyección para
las componentes vectoriales covariantes perpendiculares a los ejes, como es mostrado en la
figura. La geometrı́a asegura que
~v = v i ĝi = vi ĝ i . (5.76)
V2
V
V2
1
V1
V1
Figura 5.6: Componentes covariantes y contravariantes proyectadas de un vector.
Si la base vectorial covariante no son vectores unitarios, las construcciones de las figuras 5.5
y 5.6 deben ser ajustadas apropiadamente, siguiendo los requerimientos de las ecuaciones
(5.75) y (5.76).
Las transformaciones para la base vectorial contravariante se siguen directamente de la
ecuación (5.76) usando las técnicas que hemos aplicado ya varias veces
ĝ 0i = tij ĝ j (5.77)
i
ĝ = g ij ĝ 0j . (5.78)
Esto confirma nuestra clasificación de esta nueva base vectorial como contravariante, ya que
transforma exactamente como las componentes contravariantes de un vector.
El conjunto completo de reglas de transformación para componentes vectoriales contra-
variantes y covariantes pueden ser resumidas por el conjunto simétrico de relaciones
v 0i = tij v j ĝ 0i = tij ĝ j
v i = g ij v 0j ĝ i = g ij ĝ 0j
vi0 = g ji vj ĝi0 = g ji ĝj

vi = tj i vj0 ĝi = tj i ĝj0
con
tij = ∂x0i /∂xj g ij = ∂xi /∂x0j .
Notemos que las cantidades contravariantes siempre transforman por una suma sobre el
segundo ı́ndice tanto de tij y g ij , mientras las cantidades covariantes transforman sobre
el primer ı́ndice. Para cantidades contravariantes, tij es usado para ir desde el sistema no
primado al sistema primado, mientras que g ij es usado para ir desde el sistema primado al
sistema no primado. Para cantidades covariantes, los roles de tij y g ij son los contrarios.
La nueva base de vectores contravariantes nos permiten construir otra versión del tensor
métrico, esta vez con superı́ndices
M ij = ĝ i · ĝ j . (5.79)
La aplicación de esta forma de la métrica convierte cantidades covariantes en cantidades
contravariantes. Por ejemplo,
v i = M ij vj . (5.80)
Veremos en la próxima sección que las dos métricas distintas, Mij y M ij son simplemente
representaciones del mismo objeto, el tensor métrico.
5.2.6. Covarianza y contravarianza en tensores.

Las propiedades covariantes y contravariantes discutidas en la sección anterior pueden ser
fácilmente extendidas a tensores. Tal como un vector puede ser expresado con componentes
contravariantes o covariantes,
~v = v i ĝi = vi ĝ i , (5.81)
un tensor puede ser expresando usando solamente componentes contravariantes o covariantes
↔
T = T ijk ĝi ĝj ĝk = Tijk ĝ i ĝ j ĝ k . (5.82)
Sin embargo, los tensores de más alto rango son más flexibles que los vectores, ya que
pueden ser expresados en una forma mixta, con ı́ndices contravariantes y covariantes. Por
ejemplo,
↔
T = T ij k ĝi ĝ j ĝk (5.83)
↔
la cual es una representación equivalente de T .
Todas las expresiones tensoriales de las ecuaciones (5.82) y (5.83) son equivalentes, aun-
que los valores especı́ficos de las componentes serán diferentes en cada caso. Ası́ como las
componentes covariantes y contravariantes
↔
de un vector están relacionadas con la métrica,
las diferentes representaciones de T pueden ser obtenidas ↔
desde una hacia otra usando la
misma métrica. Por ejemplo, si las dos expresiones para T en la ecuación (5.82) son iguales,
podemos escribir
T ijk = M il M jm M kn Tlmn . (5.84)

La expresión en la ecuación (5.83) nos arroja el mismo tensor cuando
T ij k = Mjm T imk . (5.85)

Para convertir un conjunto de componentes tensoriales desde la forma puramente covariante
a la forma puramente contravariante, es necesaria operación de métrica para cada ı́ndice.
Las transformaciones de sistemas de coordenadas para tensores siguen las mismas con-
ductas que establecimos para las transformaciones vectoriales. Una matriz de transformación
del tipo apropiado es usada para cada ı́ndice. Por ejemplo, podrı́amos escribir
T 0i jk = g li tj m g nk Tl mn (5.86)
Ti jk = tli g jm tnk T 0l mn (5.87)
Ejemplo
Hemos dicho que el tensor métrico es un tensor, pero no lo hemos probado. La demos-
tración es directa. Consideremos los elementos de la métrica, expresado en forma covariante
pura,
Mij = ĝi · ĝj . (5.88)

El producto interno entre dos vectores, expresados en dos sistemas de coordenadas distintos,
puede ser escrito como
~·B
A ~ = Ai B j Mij = A0m B 0m Mmn
0
, (5.89)
0 0
donde Mmn = ĝm · ĝn0 . Las ecuaciones de transformación pueden ser usadas para expresar las
componentes del vector en el sistema primado en términos de las componentes no primados.
Esto resulta ser,
Ai B j Mij = Ai B j tmi tnj Mmn

0
. (5.90)
~ y B,
Como la expresión debe ser válida para cualquier A ~ tenemos
Mij = tmi tnj Mmn

0
, (5.91)
lo cual es fácilmente invertido, obteniendo
Mij0 = g mi g nj Mmn . (5.92)

Pero esto es exactamente como transforman los elementos de un tensor de segundo rango.
Por tanto, el tensor métrico es por definición un tensor. Esto implica que podemos escribir
↔
M = Mij ĝ i ĝ j . (5.93)
Como la métrica es un tensor, podemos modificar su naturaleza covariante o contravarian-
te como lo harı́amos para cualquier tensor. Aunque puede parecer un poco extraña utilizar la
misma métrica para modificarla, podemos cambiar una métrica puramente covariante a una
métrica puramente contravariante aplicando la métrica dos veces
M ij = M im M jn Mmn . (5.94)
También podemos escribir la métrica en una forma mezclada escribiendo
M ij = M im Mmj . (5.95)
Usando las ecuaciones de transformación, se puede demostrar fácilmente que
M ij = ĝ i · ĝj = δ ij . (5.96)
Esto implica que el tensor métrico es realmente sólo una generalización del tensor Delta de
Kronecker.
5.2.7. Contravarianza y covarianza de derivadas parciales.

Cuando las derivadas parciales son tomadas con respecto a las coordenadas contrava-
riantes, el resultado es una cantidad covariante. Para ver esto, sean xi y x0i las coordenadas
contravariantes en un par arbitrario de sistemas de coordenadas. Las reglas del cálculo re-
quieren que se cumpla
∂ ∂xj ∂
= , (5.97)
∂x0i ∂x0i ∂xj
donde hay una suma implı́cita sobre el ı́ndice j. Pero notemos que el término ∂xj /∂x0i es
exactamente la definición de g ji . Esto nos permite escribir
∂ ∂
0i
= g ji j . (5.98)
∂x ∂x
Comparando esta expresión con la ecuación (5.70) vemos que la operación derivada parcial
transforma como una cantidad covariante. En ese caso, encontramos que
∂ ∂xj ∂
0
= (5.99)
∂xi ∂x0i ∂xj
∂
= tj i , (5.100)
∂xj
lo cual nos dice que esta derivada parcial actúa como una cantidad contravariante. Para ser
consistentes con nuestra notación, imponemos la regla que un superı́ndice en el “denomi-
nador” de la operación derivada actúa como un subı́ndice, mientras que un subı́ndice en el
denominador actúa como un superı́ndice. Esta idea fue discutida brevemente en la conexión
con las matrices de transformación en las ecuaciones (5.56) y (5.58).
Ejemplo
Un campo eléctrico estático es calculado usualmente tomando el gradiente de un potencial
escalar
~ = −∇ϕ
E ~ . (5.101)
En un capı́tulo anterior, definimos el operador gradiente por la relación
~ · d~r .
dϕ = ∇ϕ (5.102)
Como el vector desplazamiento puede ser descrito por
d~r = dxi ĝi , (5.103)

donde dxi es una cantidad contravariante, es claro que el gradiente de ϕ puede ser escrito
por
~ = ∂ϕ ĝ i .
∇ϕ (5.104)
dxi
Podemos chequear la validez de esta expresión, reemplazando las ecuaciones (5.104) y (5.103)
en el lado derecho de la ecuación (5.102), de donde obtenemos
~ · d~r = ∂ϕ ĝ i · dxj ĝj

∇ϕ
dxi
∂ϕ
= i dxj δ ij (5.105)
dx
∂ϕ
= i dxi
dx
= dϕ (5.106)
Luego, escribimos las componentes del campo eléctrico por
∂ϕ
Ei = − , (5.107)
∂xi
las cuales son covariantes y deben transformar según la relación
Ei0 = g ji Ej . (5.108)
Otro ejemplo
~ puede ser calculado usando la ley de Àmpere
Un campo magnético estático B
I
~ = 4π I .
d~r · B (5.109)
C c
En esta expresión, I es la corriente total que fluye a través del camino cerrado C. Tomando
d~r como el vector diferencial con componentes contravariantes, como está dado en la ecuación
(5.103), las componentes del campo magnético usadas en esta integración deben ser escritas
en forma covariante, por tanto
I
4π
dxi Bi = I . (5.110)
C c
Capı́tulo 6
Determinantes y matrices.
6.1. Determinantes.
Comenzamos el estudio de matrices resolviendo ecuaciones lineales las cuales nos llevan
a determinantes y matrices. El concepto de determinante y su notación fueron introducidos
por Leibniz.
Ecuaciones lineales homogeneas.

Una de las mayores aplicaciones de los determinantes está en el establecimiento de una
condición para la existencia de una solución no trivial de un conjunto de ecuaciones algebrai-
cas lineales homógeneas. Supongamos que tenemos tres incógnitas x1 , x2 , x3 (o n ecuaciones
con n incógnitas).
a1 x1 + a2 x2 + a3 x3 = 0 ,
b1 x 1 + b2 x 2 + b3 x 3 = 0 , (6.1)
c1 x1 + c2 x2 + c3 x3 = 0 .
El problema es: ¿en qué condiciones hay alguna solución, aparte de la solución trivial x1 = 0,
x2 = 0, x3 = 0? Si usamos notación vectorial ~x = (x1 , x2 , x3 ) para la solución y tres filas
~a = (a1 , a2 , a3 ), ~b = (b1 , b2 , b3 ), ~c = (c1 , c2 , c3 ) para los coeficientes, tenemos que las tres
ecuaciones, ecuación (6.1), se convirten en
~a · ~x = 0 , ~b · ~x = 0 , ~c · ~x = 0 . (6.2)
Estas tres ecuaciones vectoriales tienen la interpretación geométrica obvia que ~x es ortogonal
a ~a, ~b, ~c. Si el volumen sustentado por ~a, ~b, ~c dado por el determinante (o el producto escalar
triple)
a1 a2 a3
D3 = (~a × ~b) · ~c = det(~a, ~b, ~c) = b1 b2 b3 ,

(6.3)
c1 c2 c3
1
Este capı́tulo está basado en el tercer capı́tulo del libro: Mathematical Methods for Physicists, fourth
edition de George B. Arfken & Hans J. Weber, editorial Academic Press.
107
108 CAPÍTULO 6. DETERMINANTES Y MATRICES.
no es cero, claramente sólo existe la solución trivial ~x = 0.

Vice-versa, si el anterior determinante de coeficientes se anula, luego uno de los vectores
columna es una combinación lineal de otros dos. Supongamos que ~c está en el plano que
sustenta ~a, ~b, i.e., la tercera ecuación es una combinación lineal de las primeras dos y no es
independiente. Luego ~x es ortogonal a ese plano tal que ~x ∼ ~a × ~b. Ya que las ecuaciones
homogéneas pueden ser multiplicadas por números arbitrarios, solamente las relaciones de xi
son relevantes, para lo cual obtenemos razones de determinantes de 2 × 2
x1 (a2 b3 − a3 b2 )
= ,
x3 (a1 b2 − a2 b1 )
(6.4)
x2 (a1 b3 − a3 b1 )
=− ,
x3 (a1 b2 − a2 b1 )
a partir de los componentes del producto cruz ~a × ~b.
Ecuaciones lineales no homogéneas.

El caso más simple es de dos ecuaciones con dos incógnitas
a1 x1 + a2 x2 = a3 ,
(6.5)
b1 x 1 + b2 x 2 = b3 ,
puede ser reducido al caso previo embebiéndolo en un espacio tridimensional con una solución
vectorial ~x = (x1 , x2 , −1) y el vector fila ~a = (a1 , a2 , a3 ), ~b = (b1 , b2 , b3 ). Como antes, ecuación
(6.5) en notación vectorial, ~a · ~x = 0 y ~b · ~x = 0, implica que ~x ∼ ~a × ~b tal que el análogo de la
ecuación (6.4) se mantiene. Para que esto se aplique la tercera componente de ~a × ~b debiera
ser distinta de cero, i.e., a1 b2 − a2 b1 6= 0, ya que la tecera componente de ~x es −1 6= 0. Esto
produce que los xi tengan la forma

a3 a2

(a3 b2 − a2 b3 ) b3 b2
x1 = = (6.6a)
(a1 b2 − a2 b1 ) a1 a2

b1 b2

a1 a3

(a1 b3 − a3 b1 ) b1 b3
x2 = = . (6.6b)
(a1 b2 − a2 b1 ) a1 a2

b1 b2
El determinante
en el numerador de x1 (x2 ) es obtenido a partir del determinante de
los
a1 a2 a3
coeficientes reemplazando el primer vector columna (segundo) por el vector
b1 b2 b3
del lado inhomogéneo de la ecuación (6.5).
Estas soluciones de ecuación lineal en términos de determinantes pueden ser generalizados
a n dimensiones. El determinante es un arreglo cuadrado

a1 a2 . . . an

b1 b2 . . . b n
Dn = , (6.7)
c1 c2 . . . cn

· · ... ·
6.1. DETERMINANTES. 109
de números (o funciones), los coeficientes de n ecuaciones lineales en nuestro caso. El número

n de columnas (y de filas) en el arreglo es llamado algunas veces el orden del determinante.
La generalización de la expansión del producto escalar triple (de vectores fila de las tres
ecuaciones lineales) tiende al siguiente valor del determinante Dn en n dimensiones,
X
Dn = εijk... ai bj ck . . . , (6.8)
i,j,k,...
donde εijk . . . ., análogo al sı́mbolo de Levi-Civita de la ecuación (1.52), es +1 para permu-

taciones pares (ijk . . .) de (123 . . . n), −1 para permutaciones impares, y cero si algún ı́ndice
es repetido.
Especı́ficamente, para el determinante de orden tres D3 de las ecuaciones (6.3) y (6.8)
tenemos
D3 = +a1 b2 c3 − a1 b3 c2 − a2 b1 c3 + a2 b3 c1 + a3 b1 c2 − a3 b2 c1 . (6.9)
El determinante de orden tres, entonces, es esta particular combinación lineal de produc-
tos. Cada producto contiene uno y sólo un elemento de cada fila y de cada columna. Cada
producto es sumado si las columnas (los ı́ndices) representan una permutación par de (123) y
restando si corresponde a una permutación impar. La ecuación (6.3) puede ser considerada en
notación abreviada de la ecuación (6.9). El número de términos en la suma (ecuación (6.8))
es 24 para un determinante de cuarto orden, en general n! para un determinante de orden
n. A causa de la aparición de signos negativos en la ecuación (6.9) pueden haber cancelacio-
nes. Debido a ésto es muy posible que un determinante de elementos grandes tenga un valor
pequeño.
Algunas propiedades útiles de los determinantes de n-ésimo orden siguen de la ecuación
(6.8). De nuevo, para ser especı́fico, la ecuación (6.9) para determinantes de orden tres es
usada para ilustrar estas propiedades.
Desarrollo laplaciano por las menores.

La ecuación (6.9) puede ser reescrita
D3 = a1 (b2 c3 − b3 c2 ) − a2 (b1 c3 − b3 c1 ) + a3 (b1 c2 − b2 c1 )

b2 b3 b1 b3 b1 b2 (6.10)
= a1 − a2
c1 c3 + a3 c1 c2 .

c2 c3
En general, el determinante de orden n-ésimo puede ser expandido como una combinación
lineal de productos de elementos de alguna fila (o columna) por determinantes de orden
(n − 1) formados suprimiendo la fila y la columna del determinante original en el cual aparece
el elemento. Este arreglo reducido (2 × 2 en el ejemplo especı́fico) es llamado una menor. Si
el elemento está en la i-ésima fila y en la j-ésima columna, el signo asociado con el producto
es (−1)i+j . La menor con este signo es llamada el cofactor. Si Mij es usado para designar
la menor formado omitiendo la fila i y la columna j y cij es el cofactor correspondiente, la
ecuación (6.10) se convierte en
3
X 3
X
j+1
D3 = (−1) aj M1j = aj c1j . (6.11)
j=1 j=1
En este caso, expandiendo a lo largo de la primera fila, tenemos i = 1 y la suma es sobre j,

las columnas.
Esta expansión de Laplace puede ser usada para sacar ventaja en la evaluación de de-
terminantes de alto orden en el cual muchos de los elementos son nulos. Por ejemplo, para
encontrar el valor de el determinante

0 1 0 0

−1 0 0 0
D= , (6.12)
0 0 0 1

0 0 −1 0
expandimos a través de la fila superior para obtener

−1 0 0

D = (−1)1+2 · (1) 0 0 1 . (6.13)
0 −1 0
Nuevamente, expandimos a través de la fila superior para obtener

1+1
0 1
D = (−1) · (−1) · (−1)

−1 0
(6.14)
0 1
= =1.
−1 0
Este determinante D (ecuación (6.12)) está formado de una de las matrices de Dirac que
aparecen en la teorı́a relativista del electrón de Dirac.
Antisimetrı́a.
El determinante cambia de signo si cualquier par de filas son intercambiadas o si cualquier
par de columnas son intercambiadas. Esto deriva del carácter par-impar del Levi-Civita ε en
la ecuación (6.8) o explı́citamente de la forma de las ecuaciones (6.9) y (6.10).
Esta propiedad es frecuentemente usada en Mecánica Cuántica para la construcción de
una función de onda de muchas partı́culas que, en concordancia con el principio de exclusión
de Pauli, será antisimétrica bajo el intercambio de cualquier par de partı́culas idénticas con
spin 1/2 (electrones, protones, neutrones, etc).
Como un caso especial de antisimetrı́a, cualquier determinante con dos filas iguales o dos
columnas iguales es nulo.
Si cada elemento en una fila o de una columna es cero el determinante completo es nulo.
Si cada elemento en una fila o de una columna es multiplicado por una constante, el
determinante completo es multiplicado por esa constante.
El valor de un determinante es inalterado si un múltiplo de una fila es añadido (columna
por columna) a otra fila o si un múltiplo de una columna es añadido (fila por fila) a otra
columna. Tenemos
a1 a2 a3 a1 + ka2 a2 a3

b1 b2 b3 = b1 + kb2 b2 b3 . (6.15)

c1 c2 c3 c1 + kc2 c2 c3
Usando el desarrollo de Laplace sobre el lado derecho, obtenemos

a1 + ka2 a2 a3 a1 a2 a3 a2 a2 a3

b1 + kb2 b2 b3 = b1 b2 b3 + k b2 b2 b3 , (6.16)

c1 + kc2 c2 c3 c1 c2 c3 c2 c2 c3
entonces por la propiedad de antisimetrı́a el segundo determinante del lado derecho se anula,
verificando la ecuación (6.15).
Un caso especial, un determinante es igual a cero, si cualquier par de filas o columnas son
proporcionales.
Volviendo a las ecuaciones homogéneas (6.1) y multiplicando el determinante de los coe-
ficientes por x1 , y luego sumando x2 veces la segunda columna y x3 veces la tercera columna,
podemos establecer directamente la condición para la presencia de una solución no trivial
para la ecuación (6.1):

a1 a2 a3 x1 a1 a2 a3 a1 x1 + a2 x2 + a3 x3 a2 a3 0 a2 a3

x1 b1 b2 b3 = x1 b1 b2 b3 = b1 x1 + b2 x2 + b3 x3 b2 b3 = 0 b2 b3 = 0 . (6.17)
c1 c2 c3 x1 c1 c2 c3 c1 x1 + c2 x2 + c3 x3 c2 c3 0 c2 c3
Por lo tanto x1 (x2 y x3 ) deberı́an ser cero a menos que el determinante de los coeficientes
sea nulo. Podemos mostrar que si el determinante de los coeficientes es nulo, existe realmente
una solución no trivial.
Si nuestras ecuaciones lineales son inhomogéneas, esto es, como en la ecuación (6.5) o si
los ceros en el lado derecho de la ecuación (6.1) fueran reemplazados por a4 , b4 , c4 respecti-
vamente, luego de la ecuación (6.17) obtenemos,

a4 a2 a3

b4 b2 b3

c4 c2 c3
x1 = , (6.18)
a1 a2 a3

b1 b2 b3

c1 c2 c3
la cual generaliza la ecuación (6.6a) a la dimensión n = 3. Si el determinante de los coeficientes

se anula, el conjunto de ecuaciones no homogéneas no tiene solución a menos que el numerador
también se anule. En este caso las soluciones pueden existir pero ellas no son únicas.
Para el trabajo numérico, esta solución del determinante, ecuación (6.18), es enormemente
difı́cil de manejar. El determinante puede involucrar grandes números con signos alternados,
y en la resta de dos números grandes el error relativo podrı́a remontarse al punto que hace
que el resultado no tenga valor. También, aunque el método del determinante es ilustrado
aquı́ con tres ecuaciones y tres incógnitas, podrı́amos fácilmente tener 200 ecuaciones con
200 incógnitas las cuales, involucran sobre 200! términos por determinante, lo que pone un
desafı́o muy alto a la velocidad computacional. Deberı́a haber una mejor manera. En efecto,
hay una mejor manera. Una de las mejores es un proceso a menudo llamado eliminación de
Gauss. Para ilustrar esta técnica, consideremos el siguiente conjunto de ecuaciones.
Resolvamos
3x + 2y + z = 11
2x + 3y + z = 13 (6.19)
x + y + 4z = 12 .
El determinante de la ecuación lineal no homogénea ecuación (6.19) es 18, por lo tanto existe
una solución.
Por conveniencia y para una óptima precisión numérica, las ecuaciones son reordenadas
tal que los coeficientes mayores corran a lo largo de la diagonal principal (superior izquierda
a inferior derecha). Esto ha sido hecho en el conjunto anterior.
La técnica de Gauss es usar la primera ecuación para eliminar la primera incógnita x de
las ecuaciones restantes. Entonces la (nueva) segunda ecuación es usada para eliminar y de la
última ecuación. En general, descendemos poco a poco a través del conjunto de ecuaciones,
y luego, con una incógnita determinada, avanzamos gradualmente para resolver cada una de
las otras incógnitas en sucesión.
Dividiendo cada fila por su coeficiente inicial, vemos que las ecuaciones (6.19) se convierten
en
2 1 11
x+ y+ z =
3 3 3
3 1 13 (6.20)
x+ y+ z =
2 2 2
x + y + 4z = 12 .
Ahora, usando la primera ecuación, eliminamos x de la segunda y la tercera:
2 1 11
x+ y+ z =
3 3 3
5 1 17
y+ z= (6.21)
6 6 6
1 11 25
y+ z= ,
3 3 3
y
2 1 11
x+ y+ z =
3 3 3
1 17 (6.22)
y+ z=
5 5
y + 11z = 25 .
Repitiendo la técnica, usamos la segunda ecuación para eliminar y a partir de la tercera
ecuación:
2 1 11
x+ y+ z =
3 3 3
1 17 (6.23)
y+ z=
5 5
54z = 108 ,
o
z=2.
Finalmente, al reemplazar obtenemos
1 17
y+ ×2= ,
5 5
o
y=3.
Luego con z e y determinados,
2 1 11
x+ ×3+ ×2= ,
3 3 3
y
x=1.
La técnica podrı́a parecer no tan elegante como la ecuación (6.17), pero está bien adaptada
a los computadores modernos y es más rápida que el tiempo gastado con los determinantes.
Esta técnica de Gauss puede ser usada para convertir un determinante en una forma
triángular:
a1 b1 c1

D = 0 b2 c2 ,
0 0 c3
para un determinante de tercer orden cuyos elementos no deben ser confundidos con aquellos
en la ecuación (6.3). De esta forma D = a1 b2 c3 . Para un determinante de n-ésimo orden la
evaluación de una forma triangular requiere solamente n − 1 multiplicaciones comparadas
con las n! requeridas para el caso general.
Una variación de esta eliminación progresiva es conocida como eliminación de Gauss-
Jordan. Comenzamos como si fuera el procedimiento de Gauss, pero cada nueva ecuación
considerada es usada para eliminar una variable de todas las “otras” ecuaciones, no sólo
de aquellas bajo ella. Si hemos usado esta eliminación de Gauss-Jordan, la ecuación (6.23)
llegarı́a a ser
1 7
x+ z =
5 5
1 17 (6.24)
y+ z=
5 5
z=2,
usando la segunda ecuación de la ecuación (6.22) para eliminar y de ambas, la primera y

tercera ecuaciones. Entonces la tercera ecuación de la ecuación (6.24) es usada para eliminar
z de la primera y segunda ecuaciones, dando
x=1
y=3 (6.25)
z=2,
Volveremos a la técnica de Guass-Jordan cuando invertamos matrices.

Otra técnica disponible para el uso computacional es la técnica de Gauss-Seidel. Cada
técnica tiene sus ventajas y desventajas. Los métodos de Gauss y Gauss-Jordan pueden tener
problemas de precisión para un determinante grande. Esto también es un problema para la
inversión de matrices. El método de Gauss-Seidel, como un método iterativo, puede tener
problemas de convergencia.
6.2. Matrices.
El análisis matricial pertenece al álgebra lineal ya que las matrices son operadores o
mapas lineales tales como rotaciones. Supongamos, por ejemplo, que rotamos las coordenadas
cartesianas de una espacio bidimensional tal que, en notación vectorial,
0
x1 x1 cos ϕ x2 sen ϕ P
0 = = j aij xj . (6.26)
x2 −x2 sin ϕ x1 cos ϕ
Etiquetamos el arreglo de elementos aij por la matriz A de 2 × 2 consistente de dos filas y

dos columnas, además, consideramos los vectores x, x0 como matrices de 2 × 1. Tomemos la
suma de productos de la ecuación (6.26) como una definición de la multiplicación matricial
que involucra el producto escalar de cada uno de los vectores fila de A con el vector columna
x. Ası́ en notación matricial la ecuación (6.26) se convierte en
x0 = Ax . (6.27)
Para extender esta definición de multiplicación de una matriz por un vector columna a el
producto de dos matrices de 2 × 2, consideremos la rotación de coordenada seguida por una
segunda rotación dada por la matriz B tal que
x00 = Bx 0 . (6.28)
Por componentes
!
X X X X X
x00i = bij x0j = bij ajk xk = bij ajk xk . (6.29)
j j k k j
La suma sobre j es la multiplicación matricial definiendo una matriz C = BA tal que

X
x00i = cik xk , (6.30)
k
o x00 = Cx en notación matricial. Nuevamente, esta definición involucra el producto escalar

de vectores filas de B con vectores columnas de A. Esta definición de multiplicación matricial
se puede generalizar a matrices de m × n y es útil, realmente “su utilidad es la justificación de
su existencia”. La interpretación fı́sica es que el producto matricial de dos matrices, BA, es la
rotación que conduce del sistema sin prima directamente al sistema de coordenadas con doble
prima. Antes de pasar a la definición formal, podemos notar que el operador A está descrito
6.2. MATRICES. 115
por sus efectos sobre las coordenadas o vectores base. Los elementos de matriz aij constituyen
una ŕepresentación del operador, una representación que depende de la elección de una base.
El caso especial donde una matriz tiene una columna y n filas es llamada un vector
columna, |xi, con componentes xi , i = 1, 2, . . . ., n. Si A es una matriz de n × n, |xi es un
vector columna de n componentes, A|xi está definida como en la ecuación (6.27) y (6.26).
Similarmente, si una matriz tiene una fila y n columnas, es llamada un vector fila, hx| con
componentes xi , i = 1, 2, . . . .n. Claramente, hx| resulta de |x > por el intercambio de filas
y columnas, una operación matricial llamada transposición, y pora cualquier matriz A, Ã
es llamada 2 la transpuesta de A con elementos de matriz (Ã)ik = Aik . Transponiendo un
producto de matrices AB se invierte el orden y da BA; similarmente, A|xi se transpone como
hx|A. El producto escalar toma la forma hx|yi.
Definiciones básicas.
Una matriz puede ser definida como una arreglo cuadrado o rectangular de números
o funciones que obedecen ciertas leyes. Esto es una extensión perfectamente lógica de los
conceptos matemáticos familiares. En aritmética tratamos con números simples. En la teorı́a
de variable compleja tratamos con pares ordenados de números, (1, 2) = 1 + 2i, en el cual
el orden es importante. Ahora consideremos números (o funciones) ordenados en un arreglo
cuadrados o rectangular. Por conveniencia en el trabajo posterior los números son distinguidos
por dos subı́ndices, el primero indica la fila (horizontal) y el segundo indica la columna
(vertical) en la cual aparecen los números. Por ejemplo, a13 es el elemento de matriz en la
primera fila y tercera columna. De este modo, si A es una matriz con m filas y n columnas,
 
a11 a12 · · · a1n
 a21 a22 · · · a2n 
A =  .. ..  . (6.31)
 
.. ..
 . . . . 
am1 am2 · · · amn
Quizás el hecho más importante a notar es que los elementos aij no están combinados unos
con otros. Una matriz no es un determinante. Es un arreglo ordenado de números, no un
simple número.
La matriz A hasta ahora de sólo es un arreglo de números que tiene las propiedades
que le asignamos. Literalmente, esto significa construir una nueva forma de matemáticas.
Postulamos que las matrices A, B y C, con elementos aij , bij y cij , respectivamente, combinan
de acuerdo a las siguientes reglas.
Igualdad.
Matriz A= Matriz B si y sólo si aij = bij para todos los valores de i y j. Esto, por su
puesto, require que A y B sean cada uno arreglos de m × n (m filas y n columnas).
2
Algunos textos denotan A transpuesta por AT .
Suma.
A + B = C si y sólo si aij + bij = cij para todos los valores de i y j, los elementos se
combinan de acuerdo a las leyes del álgebra lineal (o aritmética si hay números simples). Esto
significa que A + B = B + A, la conmutación. También, se satisface la ley de asociatividad
(A + B) + C = A + (B + C). Si todos los elementos son cero, la matriz es llamada matriz nula
y se denota por 0. Para todo A,
A+0=0+A=A ,
con  
0 0 ··· 0
0 0 ··· 0
0 =  .. ..  . (6.32)
 
.. . .
. . . .
0 0 ··· 0
Tal que las matrices de m × n forman un espacio lineal con respecto a la suma y la resta.
Multiplicación (por un escalar).

La multiplicación de la matriz A por una cantidad escalar α está definida como
αA = (αA) , (6.33)
en la cual los elementos de αA son αaij ; esto es, cada elemento de la matriz A es multiplicado
por el factor escalar. Esto contrasta con el comportamiento de los determinantes en el cual el
factor α multiplica solamente una columna o una fila y no cada elemento del determinante.
Una consecuencia de esta multiplicación por escalar es que
αA = Aα , conmutación. (6.34)
Multiplicación (multiplicación matricial) producto interno.
X
AB = C si y solo si cij = aik bkj . (6.35)
k
Los elementos i y j de C están formados como un producto escalar de la i-ésima fila de A con
el j-ésima columna de B (el cual demanda que A tenga el mismo número de columnas como
B tiene de filas). El ı́ndice mudo k toma los valores 1, 2, . . . , n en sucesión, esto es,
cij = ai1 b1j + ai2 b2j + ai3 b3j , (6.36)
para n = 3. Obviamente, el ı́ndice mudo k pude ser reemplazado por algún otro sı́mbolo
que no esté en uso sin alterar la ecuación (6.35). Quizás la situación puede ser aclarada
afirmando que la ecuación (6.35) defina el método de combinar ciertas matrices. Este método
de combinación, es llamado multiplicación matricial. Para ilustrar, consideremos dos matrices
(matrices de Pauli)
0 1 1 0
σ1 = y . (6.37)
1 0 0 −1
6.2. MATRICES. 117
El elemento 11 del producto, (σ1 σ3 )11 está dado por la suma de productos de elementos de la
primera fila de σ1 con el correspondiente elemento de la primera columna de σ3 : Aquı́
(σ1 σ3 )ij = σ1i1 σ31j + σ1i2 σ32j .
Una aplicación directa de la multiplicación de matrices muestra que

0 1
σ3 σ1 = (6.38)
−1 0
y por la ecuación (6.35)

σ1 σ3 = −σ1 σ3 . (6.39)
Excepto en casos especiales, la multiplicación de matrices no es conmutativa.3
AB 6= BA . (6.40)
Sin embargo, de la definición de multiplicación de matrices podemos mostrar que se mantiene

una ley de asosiatividad, (AB)C = A(BC). También se satisface una ley de distributividad,
A(B + C) = AB + AC. La matriz unidad tiene elementos δij , la delta de Kronecker, y la
propiedad de que 1A = A1 = A para toda A,
 
1 0 ··· 0
0 1 · · · 0
1 =  .. .. . . ..  . (6.41)
 
. . . .
0 0 ··· 1
Notamos que es posible que el producto de dos matrices sea una matriz nula sin ser ninguna
de ellas una matriz nula. Por ejemplo, si

1 1 1 0
A= y B= .
0 0 −1 0
AB = 0. Esto difiere de la multiplicación de números reales o complejos los cuales forman un

campo, mientras que las estructura aditiva y multiplicativa de las matrices es llamada anillo
por los matemáticos.
Si A en una matriz de n × n con determinante |A| = 6 0, luego tiene una unica inversa A−1
tal que AA−1 = A−1 A = 1. Si B es también una matriz de n × n con inversa B−1 , luego el
producto de AB tiene la inversa
(AB)−1 = B−1 A−1 , (6.42)
ya que ABB−1 A−1 = 1 = B−1 A−1 AB.
El teorema del producto el cual dice que el determinante de un producto, |AB|, de dos
matrices de n × n A y B es igual al producto de los determinantes, |AkB|, uniendo matrices
con determinantes. El anterior teorema puede ser fácilmente probado.
3
La perdida de la propiedad conmutativa es descrita por el conmutador [A, B] = AB − BA. La no conmu-
tatividad se expresa por [A, B] 6= 0.
Producto directo.
Un segundo procedimiento para multiplicar matrices, conocido como el tensor producto

directo o de Kronecker. Si A es una matriz de m × m y B una matriz de n × n, luego el
producto directo es
A⊗B=C . (6.43)
C es uan matriz de mn × mn con elementos
Cαβ = Aij Bkl , (6.44)
con
α = n(i − 1) + k , β = n(j − 1) + l .
Por ejemplo, si A y B ambas son matrices de 2 × 2,

a11 B a12 B
A⊗B=
a21 B a22 B
 
a11 b11 a11 b12 a12 b11 a12 b12 (6.45)
a11 b21 a11 b22 a12 b21 a12 b22 
=a21 b11 a21 b12
 .
a22 b11 a22 b12 
a21 b21 a21 b22 a22 b21 a22 b22
El producto directo es asociativo pero no conmutativo. Como un ejemplo de producto

directo, las matrices de Dirac pueden ser desarrolladas como productos directos de las ma-
trices de Pauli y de la matriz unidad. Otros ejemplos aparecen en la construcción de grupos
en teorı́a de grupos y en espacios de Hilbert en teorı́a cuántica.
El producto directo definido aquı́ es algunas veces llamado la forma standard y es de-
notado por ⊗. Otros tres tipos de producto directo de matrices existe como posibilidades o
curiosidades matemáticas pero tienen muy poca o ninguna aplicación en fı́sica matemática.
Matrices diagonales.
Un tipo especial muy importante de matrices es la matriz cuadrada en la cual todos los
elementos no diagonales son cero. Espacı́ficamente, si una matriz A de 3 × 3 es diagonal,
 
a11 0 0
A =  0 a22 0  .
0 0 a33
Una interpretación fı́sica de tales matrices diagonales y el método de reducir matrices a esta
forma diagonal son considerados en la sección 6.5. Aquı́ nos limitamos a notar la importante
propiedad de que la multiplicación de matrices es conmutativa, AB = BA, si A y B son cada
una diagonales.
6.2. MATRICES. 119
Traza.
En cualquiera matriz cuadrada la suma de los elementos diagonales es llamada la traza.
Claramente la traza es una operación lineal:
traza(A − B) = traza(A) − traza(B) .
Una de sus interesantes y útiles propiedades es que la traza de un producto de dos matrices
A y B es independiente del orden de la multiplicación:
X XX
traza(AB) = (AB)ii = aij bji
i i j
XX X
= bji aij = (BA)jj (6.46)
i j j
= traza(BA) .
Esto se mantiene aún cuando AB 6= BA. La ecuación (6.46) significa que la traza de cualquier
conmutador, [A, B] = AB − BA, es cero. De la ecuación (6.46) obtenemos
traza(ABC) = traza(BCA) = traza(CAB) ,
lo cual muestra que la traza es invariante bajo permutaciuones cı́clicas de la matriz en un

producto.
Para una matriz simétrica o una matriz Hermı́tica compleja la traza es la suma, y el
determinante el producto, de sus autovalores, y ambos son coeficientes del polinomio carac-
terı́stico. La traza servirá una función similar para las matrices como la ortogonalidad sirve
para los vectores y funciones.
En términos de tensores la traza es una contracción y como el tensor de segundo orden
contraı́do es un escalar (invariante).
Las matrices son usadas ampliamente para representar los elementos de grupos. La traza
de las matrices representando los elementos de grupo es conocido en teorı́a de grupos como
el carácter. La razón de este nombre especial y espacial atención es que mientras las matrices
pueden variar la traza o carácter se mantiene inavariante.
Inversión de matriz.
Al comienzo de esta sección la matriz A fue presentada como la representación de un
operador que (linealmente) transforma los ejes de coordenadas. Una rotación podrı́a ser un
ejemplo de tal transformación lineal. Ahora buscaremos la transformación inversa A−1 que
restablecerá los ejes de coordenadas originales. Esto significa, ya sea como una ecuación
matricial o de operador4 ,
AA−1 = A−1 A = 1 . (6.47)
Podemos probar (ejercicio) que
Cji
a−1
ij = , (6.48)
|A|
4
Aquı́ y a través de todo el capı́tulo nuestras matrices tienen rango finito.
con la suposición que el determinante de A (|A|) 6= 0. Si es cero, etiquetaremos a A como sin-

gular. No existe la inversa. Como fue explicado en la sección 6.1 esta forma con determinante
es totalmente inapropiado para el trabajo numérico con grandes matrices.
Hay una amplia variedad de técnicas alternativas. Una de las mejores y más comúnmente
usada es la técnica de inversión de matrices de Gauss-Jordan. La teorı́a está basada en los
resultados que muestran que existen matrices ML tal que el producto ML A será A pero con
a. una fila multiplicada por una constante, o
b. una fila reemplazada por la fila original menos un múltiplo de otra fila, o
c. filas intercambiadas.
Otras matrices MR operando sobre la derecha de (AMR ) puede llevar a las mismas ope-
raciones sobre las columnas de A.
Esto significa que las filas y las columnas de la matriz pueden ser alteradas (por multipli-
cación de matrices) como si estuviéramos tratando con determinantes, ası́ podemos aplicar
las técnicas de eliminación de Gauss-Jordan a los elementos de matriz. Por tanto existe una
matriz ML (o MR ) tal que5
ML A = 1 . (6.49)
La ML = A−1 . Determinamos ML realizando las operaciones de eliminación idénticas sobre
la matriz unidad. Luego
ML 1 = ML . (6.50)
Para clarificar ésto consideremos un ejemplo especı́fico.
Deseamos invertir la matriz  
3 2 1
A = 2 3 1 . (6.51)
1 1 4
Por conveniencia escribimos A y 1 lado a lado realizando operaciones idénticas sobre cada
una de ellas    
3 2 1 1 0 0
2 3 1 0 1 0 . (6.52)
1 1 4 0 0 1
Para ser sistemáticos, multiplicamos cada fila para obtener ak1 = 1,
 2 1 1 
1 3 3 3
0 0
 3 1  1 
1 2 2   0 2 0 . (6.53)
1 1 4 0 0 1
Restando la primera fila de la segunda y tercera, obtenemos

 2 1  1 
1 3 3 3
0 0
 5 1  1 1 
0 6 6  − 3 2 0 . (6.54)
0 31 11
3
− 13 0 1
5
Recordemos que det(A) 6= 0.
6.3. MATRICES ORTOGONALES. 121
Entonces dividimos la segunda fila (de ambas matrices) por 5/6 y sustrayéndola 2/3 veces
de la primera fila, y 1/3 veces de la tercera fila. Los resultados para ambas matrices son
 
1
 3

1 0 5 5
− 25 0
1   2 3
0 1 − 5 0 . (6.55)
 
5  5
18
0 0 5
− 15 − 15 1
Dividimos la tercera fila (de ambas matrices) por 18/5. Luego como último paso 1/5 veces
la tercera fila es sustraı́da de cada una de las dos primeras filas (de ambas martices). Nuestro
par final es
   11 7 1

1 0 0 8
− 18
− 18
 7 11 1 
0 1 0 − 18 18 − 18  . (6.56)
 
1 1 5
0 0 1 − 18 − 18 18
El chequeo es multiplicar la original A por la calculada A−1 para ver si realmente obtuvimos
la matriz unidad 1.
Como con la solución de Gauss-Jordan de ecuaciones algebraicas simultáneas, esta técnica
está bien adaptada para computadores.
6.3. Matrices ortogonales.

El espacio de tres dimensiones ordinario puede ser descrito con las coordenadas cartesianas
(x1 , x2 , x3 ). Consideremos un segundo conjunto de coordenadas cartesianas (x01 , x02 , x03 ) cuyo
origen y sentido coinciden con el primero pero su orientación es diferente (figura 6.1). Podemos
x3 x’2
x’3
x2
∧
x1 ∧
x1’
x1
x’1
Figura 6.1: Sistemas de coordenadas cartesianos.
decir que el sistema de ejes prima ha sido rotado respecto al inicial sistema de coordenadas
sin prima. Ya que esta rotación es una operación lineal, esperamos una ecuación matricial
que relaciones la base con primas con la sin primas.
Cosenos directores.
Un vector unitario a lo largo del eje x01 (x̂1 0 ) puede ser resuelto en sus componentes a lo
largo de los ejes x1 , x2 y x3 por las usuales técnicas de proyección.
x̂1 0 = x̂1 cos(x01 , x1 ) + x̂2 cos(x02 , x2 ) + x̂3 cos(x03 , x3 ) . (6.57)
Por conveniencia estos cosenos, los cuales son los cosenos directores, son etiquetados
cos(x01 , x1 ) = x̂1 0 · x̂1 = a11 ,
cos(x01 , x2 ) = x̂1 0 · x̂2 = a12 , (6.58)
cos(x01 , x3 ) = x̂1 0 · x̂3 = a13 .
Continuando, tenemos
cos(x02 , x1 ) = x̂2 0 · x̂1 = a21 , (a21 6= a12 ) ,
(6.59)
cos(x02 , x2 ) = x̂2 0 · x̂2 = a22 , y ası́ sucesivamente.
Ahora la ecuación (6.57) puede ser reescrita como
x̂1 0 = x̂1 a11 + x̂2 a12 + x̂3 a13
y también
x̂2 0 = x̂1 a21 + x̂2 a22 + x̂3 a23
(6.60)
x̂3 0 = x̂1 a31 + x̂2 a32 + x̂3 a33 .
También podemos ir de la otra manera resolviendo x̂1 , x̂2 y x̂3 en sus componentes en el
sistema con primas. Entonces
x̂1 = x̂1 0 a11 + x̂2 0 a21 + x̂3 0 a31
x̂2 = x̂1 0 a12 + x̂2 0 a22 + x̂3 0 a32 (6.61)
x̂3 = x̂1 0 a13 + x̂2 0 a23 + x̂3 0 a33 .
Aplicaciones a vectores.
Si consideramos un vector cuyas componentes son funciones de la posición, entonces
V~ (x1 , x2 , x3 ) = x̂1 V1 + x̂2 V2 + x̂3 V3

(6.62)
= V~ 0 (x01 , x02 , x03 ) = x̂01 V10 + x̂02 V20 + x̂03 V30 ,
ya que el punto puede ser dado en cualquiera de los dos sistema de coordenadas (x1 , x2 , x3 ) o
(x01 , x02 , x03 ). Notemos que V~ y V~ 0 son geométricamente el mismo vector (pero con diferentes
componentes). Si los ejes de coordenadas son rotados, el vector se mantiene fijo. Usando la
ecuación (6.60) para eliminar x̂1 , x̂2 , x̂3 , podemos separar la ecuación (6.62) en tres ecuaciones
escalares
V10 = a11 V1 + a12 V2 + a13 V3
V20 = a21 V1 + a22 V2 + a23 V3 (6.63)
V30 = a31 V1 + a32 V2 + a33 V3 .
En particular, estas relaciones se mantendrán para las coordenadas de un punto (x1 , x2 , x3 )

y (x01 , x02 , x03 ), dando
x01 = a11 x1 + a12 x2 + a13 x3

x02 = a21 x1 + a22 x2 + a23 x3 (6.64)
x03 = a31 x1 + a32 x2 + a33 x3 ,
y similarmente para las coordenadas primas. En esta notación el conjunto de tres ecuaciones
(6.64) pueden ser escritas como
X 3
0
xi = aij xj , (6.65)
j=1
donde i toma los valores 1, 2 y 3 y el resultado son tres ecuaciones separadas.

De la ecuación anterior podemos derivar interesante información sobre los aij los cuales
describen la orientación del sistema de coordenadas (x01 , x02 , x03 ) relativa al sistema (x1 , x2 , x3 ).
La distancia respecto al origen es la misma en ambos sistemas. Elevando al cuadrado,
X X 2
x2i = x0i
i i
! !
X X X
= aij xj aik xk (6.66)
i j k
X X
= xj xk aij aik .
j,k i
Esto sólo puede ser cierto para todos los puntos si y sólo si
X
aij aik = δjk , j, k = 1, 2, 3 . (6.67)
i
La ecuación (6.67) es una consecuencia de requerir que la longitud permanezca constante

(invariante) bajo rotaciones del sistema de coordenadas, es llamada la condición de ortogo-
nalidad. Los aij escritos como una matriz A, forman una matriz ortogonal. Notemos que la
ecuación (6.67) no es una multiplicación matricial.
En notación matricial la ecuación (6.65) llega a ser
|x0 i = A|xi . (6.68)
Condiciones de ortogonalidad, caso bidimensional.

Podemos ganar un mejor entendimiento de los aij y de la condición de ortogonalidad
considerando con detalle rotaciones en dos dimensiones. Esto lo podemos pensar como un
sistema tridimensional con los ejes x1 y x2 rotados respecto a x3 . De la figura 6.2,
x01 = x1 cos ϕ + x2 sen ϕ ,

(6.69)
x02 = −x1 sen ϕ + x2 cos ϕ .
x2
x’2 x2 nϕ
s e
x2
x’1
ϕ ϕ
ϕ c os
x1
ϕ x1
x1
Figura 6.2: Sistemas de coordenadas rotados en dos dimensiones.
Por lo tanto por la ecuación (6.68)

cos ϕ sen ϕ
A= . (6.70)
− sen ϕ cos ϕ
Notemos que A se reduce a la matriz unidad para ϕ = 0. La rotación cero significa que nada
ha cambiado. Es claro a partir de la figura 6.2 que
a11 = cos ϕ = cos(x01 , x1 ) ,

π (6.71)
a12 = sen ϕ = cos − ϕ = cos(x01 , x2 ) , y ası́ sucesivamente,
2
de este modo identificamos los elementos de matriz aij con los cosenos directores. La ecuación
(6.67), la condición de ortogonalidad, llega a ser
sen2 ϕ + cos2 ϕ = 1 ,
(6.72)
sen ϕ cos ϕ − sen ϕ cos ϕ = 0 .
la extensión a tres dimensiones ( rotación de las coordenadas a lo largo del eje z en un ángulo
ϕ en el sentido de los punteros del reloj) es simplemente
 
cos ϕ sen ϕ 0
A = − sen ϕ cos ϕ 0 . (6.73)
0 0 1
El a33 = 1 expresa el hecho que x03 = x3 , ya que la rotación ha sido en torno al eje x3 Los
ceros garantizan que x01 y x02 no dependen de x3 y que x03 no depende de x1 y x2 . En un
lenguaje más sofisticado, x1 y x2 se extienden sobre un subespacio invariante, mientras que
x3 forma un subespacio invariante por si solo. La forma de A es reducible. La ecuación (6.73)
da una posible descomposición.
Matriz inversa A−1 .

Volviendo a la matriz de transformación general A, la matriz inversa A−1 es definida tal
que
|xi = A−1 |x0 i . (6.74)
Esto es, A−1 describe el inverso de la rotación dada por A y retorna el sistema de coordenadas
a su posición original. Simbólicamente, las ecuaciones (6.68) y (6.74) combinadas dan
|xi = A−1 A|xi , (6.75)
y ya que |xi es arbitrario,

A−1 A = 1 , (6.76)
la matriz unidad, Similarmente,
AA−1 = 1 . (6.77)
usando las ecuaciones (6.68) y (6.74) y eliminando |x0 i en vez de |xi.
Matriz transpuesta, Ã.

Podemos determinar los elementos de nuestra postulada matriz inversa A−1 empleando
la condición de ortogonalidad. La ecuación (6.67), la condición de ortogonalidad, no está de
acuerdo con nuestra definición de multiplicación matricial, pero la podemos definir de acuerdo
a una nueva matriz Ã tal que
ãji = aij . (6.78)
La ecuación (6.67) llega a ser
ÃA = 1 . (6.79)
Esta es una reformulación de la condición de ortogonalidad y puede ser tomada como una
definición de ortogonalidad. Multiplicando (6.79) por A−1 por la derecha y usando la ecuación
(6.77), tenemos
Ã = A−1 . (6.80)
Este importante resultado que la inversa es igual a la transpuesta se mantiene sólo para
matrices ortogonales y puede ser tomado como una reformulación de la condición de ortogo-
nalidad.
Multiplicando la ecuación (6.80) por A por la izquierda, obtenemos
AÃ = 1 , (6.81)
o X
aji aki = δjk , (6.82)
i
lo cual es otra forma más de la condición de ortogonalidad.

Resumiendo, la condición de ortogonalidad puede ser enunciada de varias maneras equi-

valentes:
X
aij aik = δjk (6.83a)
i
X
aji aki = δjk (6.83b)
i
ÃA = AÃ = 1 (6.83c)

−1
Ã = A . (6.83d)
Cualquiera de estas relaciones es condición necesaria y suficiente para que A sea ortogonal.
Es posible ahora ver y enteder por qué el nombre ortogonal es apropiado para estas
matrices. Tenemos la forma general
 
a11 a12 a13
A = a21 a22 a23  ,
a31 a32 a33
de una matriz de cosenos directores en la cual aij es el coseno del ángulo entre x0i y xj . Por lo
tanto, a11 , a12 , a13 son los cosenos directores de x01 relativo a x1 , x2 , x3 . Estos tres elementos
de A definen una unidad de longitud a lo largo de x01 , esto es, un vector unitario x̂01 ,
x̂01 = x̂1 a11 + x̂2 a12 + x̂3 a13 .
La relación de ortogonalidad (ecuación (6.82)) es simplemente una declaración que los vecto-
res unitarios x̂01 , x̂02 , y x̂03 son mutuamente perpendiculares o ortogonales. Nuestra matriz de
transformación ortogonal A transforma un sistema ortogonal en un segundo sistema ortogonal
de coordenadas por rotación y/o reflexión.
Ángulos de Euler.
Nuestra matriz de trasformación A contiene nueve cosenos directores. Claramente, sólo
tres de ellos son independientes, la ecuación (6.67) proveen seis restricciones. De otra manera,
uno puede decir que necesita dos parámetros (θ y ϕ en coordenadas polares esféricas) para
fijar el eje de rotación, más uno adicional para describir la magnitud de la rotación en torno a
ese eje. En la formulación Lagrangiana de la mecánica es necesario describir A usando algún
conjunto de tres parámetros independientes más que los redundantes cosenos directores. La
elección usual de estos parámetros es la de los ángulos de Euler6
El objetivo de describir la orientación de un sistema final rotado (x000 000 000
1 , x2 , x3 ) relativo a
algun sistema de coordenadas inicial (x1 , x2 , x3 ). El sistema final es desarrollado en tres pasos
cada paso involucra una rotación descrita por un ángulo de Euler (figura 6.3):
1. Los ejes x01 , x02 , y x03 son rotados respecto al eje x3 en un ángulo α en el sentido horario
relativo a x1 , x2 y x3 . (Los ejes x3 y x03 coinciden.)
6
No hay una única manera de definir los ángulos de Euler. Usamos la elección usual en Mecánica Cuántica
de momento angular.
x 3= x’3
x 3= x’3 x’’
3 = x’’’
3 x 3= x’3
x’’ γ
3
β β
x1
x’1 α
α
x2 x’1
x’2 β x’’’
α 2
x’=
2 x’’ x’= x’’
x’’
1 x2
2 x’’
1
2 2
x’’’
1
(a) (b) (c)
Figura 6.3: (a) Rotación respecto al eje x3 en un ángulo α; (b) Rotación respecto a un eje x02
en un ángulo β; (c) Rotación respecto a un eje x003 en un ángulo γ.
2. los ejes x001 , x002 , y x003 son rotados respecto al eje x02 en un ángulo β en el sentido horario
relativo a x01 , x02 y x03 . (Los ejes x02 y x002 coinciden.)
3. la tercera y final rotación es en un ángulo γ en sentido horario respecto al eje x003 produ-
ciendo el sistema (x000 000 000 00 000
1 , x2 , x3 ). (Los ejes x3 y x3 coinciden.)
Las tres matrices que describen estas rotaciones son:

 
cos α sen α 0
Rz (α) = − sen α cos α
 0 , (6.84)
0 0 1
exactamente como en la ecuación (6.73,
 
cos β 0 − sen β
Ry (β) =  0 1 0  (6.85)
sen β 0 cos β
y  
cos γ sen γ 0
Rz (γ) = − sen γ cos γ 0 . (6.86)
0 0 1
La rotación total es descrita por el producto matricial triple,
A(α, β, γ) = Rz (γ)Ry (β)Rz (α) . (6.87)
Notemos el orden: Rz (α) opera primero, entonces Ry (β), y finalmente Rz (γ). La multipli-
cación da
 
cos γ cos β cos α − sen γ sen α cos γ cos β sen α − sen γ cos α − cos γ sen β
A = − sen γ cos β cos α − cos γ sen α − sen γ cos β sen α + cos γ cos α sen γ sen β  .
sen β cos α sen β sen α cos β
(6.88)
Comparando A(aij ) con A(α, β, γ) elemento por elemento, nos produce los cosenos directores
en términos de los ángulos de Euler.
Propiedades de simetrı́a.
Nuestra descripción matricial conduce al grupo de rotaciones SO(3) en el espacio tridi-
mensional R3 , y la descripción en términos de ángulos de Euler de las rotaciones forman una
base para desarrollar el grupo de rotaciones. Las rotaciones pueden también ser descritas por
el grupo unitario SU (2) en el espacio bidimensional C2 .
La matriz transpuesta es útil en la discusión de las propiedades de simetrı́a. Si
A = Ã , aij = aji , (6.89)
la matriz es llamada simétrica, mientras que si
A = −Ã , aij = −aji , (6.90)
es llamada antisimétrica. Los elementos de la diagonal son nulos. Es fácil mostrar que cual-
quier matriz cuadrada puede ser escrita como la suma de una matriz simétrica y una anti-
simétrica. Consideremos la identidad
1h i 1h i
A= A + Ã + A − Ã . (6.91)
2 2
A + Ã es claramente simétrica, mientras que A − Ã es claramente antisimétrica.
Hasta ahora hemos interpretado las matrices ortogonales como rotaciones del sistema de
coordenadas. Estas cambian las componentes de un vector fijo. Sin embargo, una matriz orto-
gonal A puede ser interpretada igualmente bien como una rotación del vector en la dirección
opuesta (figura 6.4).
r
y r 1= A r
y’
x’
α
β x
Figura 6.4: Vector fijo con coordenadas rotadas.
Estas dos posibilidades, (1) rotar el vector manteniendo la base fija y (2) rotar la base
(en el sentido opuesto) manteniendo el vector fijo.
6.4. MATRICES HERMÍTICAS, MATRICES UNITARIAS. 129
Supongamos que interpretamos la matriz A como rotar un vector ~r en una nueva posición
~r1 , i.e., en un particular sistema de coordenadas tenemos la relación
~r1 = A~r . (6.92)
Ahora rotemos las coordenadas aplicando una matriz B, la cual rota (x, y, z) en (x0 , y 0 , z 0 ),
~r 01 = B~r1 = BA~r = (A~r)0

= BA(B−1 B)~r (6.93)
−1 −1 0
= (BAB )B~r = (BAB )~r .
B~r1 es justo ~r1 0 en el nuevo sistema de coordenadas con una interpretación similar se mantine
para B~r. Ya que en este nuevo sistema (B~r) es rotado a la posición (B~r1 ) por la matriz BAB−1 .
B~r1 = (BAB−1 ) B~r

↓ ↓ ↓
0 0
~r 1 = A ~r 0 .
En el nuevo sistema las coordenadas han sido rotadas por la matriz B, A tiene la forma A0 ,
en la cual
A0 = BAB−1 . (6.94)
A0 opera en el espacio x0 , y 0 , z 0 como A opera en el espacio x, y, z.
La transformación definida por la ecuación (6.94) con B cualquier matriz, no necesaria-
mente ortogonal, es conocida como trasformación de similaridad. Por componentes la ecuación
(6.94) llega a ser X
a0ij = bik akl (B−1 )lj . (6.95)
k,l
Ahora si B es ortogonal,
(B−1 )lj = (B̃)lj = bjl , (6.96)
y tenemos X
a0ij = bik bjl akl . (6.97)
k,l
La matriz A es la representación de un mapeo lineal en un sistema de coordenadas dado

o base. Pero hay direcciones asociadas con A, ejes cristalinos, ejes de simetrı́a en un sólido
rotando y etc. tal que la representación depende de la base. La transformación de similaridad
muestran justo como la representación cambia con un cambio de base.
6.4. Matrices Hermı́ticas, matrices unitarias.

Definiciones.
Hasta aquı́ hemos generalmente supuesto que nuestro espacio vectorial es un espacio real
y que los elementos de las matrices (la representación de los operadores lineales) son reales.
Para muchos cálculos en Fı́sica Clásica los elementos de matriz reales serán suficientes. Sin
embargo, en Mecánica Cuántica las variables complejas son inevitables por la forma de las
reglas de conmutación básicas (o la ecuación tiempo dependiente de Schödinger). Con esto
en mente, generalizamos al caso de matrices con elementos complejos. Para manejar estos
elementos, definamos algunas propiedades.
1. Compleja conjugada, A∗ , √
formada por tomar los complejos conjugados (i → −i) de
cada elemento, donde i = −1.
2. Adjunta, A† , formada por transponer A∗ ,
A† = A
f∗ = Ã∗ . (6.98)
3. Matriz hermı́tica: La matriz es etiquetada como hermı́tica (o autoadjunta) si
A = A† . (6.99)
Si A es real, entonces A† = Ã, y las matrices hermı́ticas reales son matrices reales y
simétricas. En Mecánica Cuántica las matrices son hermı́ticas o unitarias.
4. Matriz unitaria: La matriz U es etiquetada como unitaria si
U† = U−1 . (6.100)
Si U es real, entonces U−1 = Ũ, tal que las matrices reales unitarias son matrices
ortogonales. Este representa una generalización del concepto de matriz ortogonal.
5. (AB)∗ = B∗ A∗ , (AB)† = B† A† .
Si los elementos son complejos, a la Fı́sica casi siempre le interesan las matrices adjuntas,
hermı́ticas y unitarias. Las matrices unitarias son especialmente importantes en Mecánica
Cuántica porque ellos dejan el largo de un vector (complejo) inalterado, análoga a la operación
de una matriz ortogonal sobre un vector real. Una importante excepción a este interés en las
matrices unitarias es el grupo de matrices de Lorentz.
En un espacio n-dimensional complejo el cuadrado del largo de P un punto x̃ P
= (x1 , x2 , . . . , xn ),
o el cuadrado de su distancia al origen, es definido como x x = i xi xi = i | xi |2 . Si una
† ∗
trasformación de coordenadas y = Ux deja la distancia inalterada, entonces x† x = y † y =

(Ux)† Ux = x† U† Ux. Ya que x es arbitrario concluimos que U† U = 1n , i.e., U es una matriz
unitaria de n × n. Si x0 = Ax es un mapa lineal, entonces su matriz en las nuevas coordenadas
llega a ser una transformación unitaria (análogo de una de similaridad)
A0 = UAU† ,
porque Ux0 = y 0 = UAx = UAU−1 y = UAU† y.

6.4. MATRICES HERMÍTICAS, MATRICES UNITARIAS. 131
Matrices de Pauli y de Dirac.

El conjunto de tres matrices de Pauli de 2 × 2 σ,

0 1 0 −i 1 0
σ1 = , σ2 = , σ3 = , (6.101)
1 0 i 0 0 −1
1
fueron introducidas por W. Pauli para describir una partı́cula de spin 2
en Mecánica Cuántica
no relativista. Se puede demostrar que las σ satisfacen
σi σj + σj σi = 2δij 12 , anticonmutación (6.102)

σi σj = iσk , permutación cı́clica de los ı́ndices (6.103)
(σi )2 = 12 , (6.104)
donde 12 es la matriz unidad de 2 × 2. Ası́, el vector ~σ /2 satisface las mismas reglas de

conmutación
[σi , σj ] ≡ σi σj − σj σi = 2iεijk σk , (6.105)
que el momento angular L.~
Las tres matrices de Pauli ~σ y la matriz unitaria forman un conjunto completo tal que
cualquier matriz de 2 × 2 M puede ser expandida como
~ · ~σ ,
M = m0 1 + m1 σ1 + m2 σ2 + m3 σ3 = m0 1 + m (6.106)
donde los mi son constantes. Usando σi2 = 1 y tr(σi ) = 0 nosotros obtenemos a partir de la
ecuación (6.106) los coeficientes mi de la expansión formando las trazas,
2m0 = tr(M) , 2mi = tr(M σi ) , i = 1, 2, 3 . (6.107)
En 1927 P.A.M. Dirac extendió este formalismo para partı́culas de spin 21 moviéndose a
velocidades cercana a la de la luz tales como electrones Para incluı́r la relatividad especial
su punto de partida es la ecuación de Einstein para la energı́a E 2 = p~ 2 c2 + m2 c4 en vez de
la energı́a cinética y potencial no relativista E = p~ 2 /2m + V . La clave para la ecuación de
Dirac es factorizar
E 2 − p~ 2 c2 = E 2 − (c~σ · p~)2 = (E − c~σ · p~)(E + c~σ · p~) = m2 c4 , (6.108)
usando la identidad matricial en 2 × 2
(c~σ · p~)2 = p~ 2 12 . (6.109)
La matriz unidad de 2 × 2 12 no es escrita explı́citamente en la ecuación (6.108) y (6.109).

Podemos presentar las matrices γ0 y γ para factorizar E 2 − p~ 2 c2 directamente,
(γ0 E − γc~σ · p~)2 = γ02 E 2 + γ 2 c2 (~σ · p~)2 − Ec~σ · p~(γ0 γ + γγ0 ) = E 2 − p~ 2 c2 = m2 c4 . (6.110)
Si reconocemos
γ0 E − γc~σ · p~ = γ · p = (γ0 , γ~σ ) · (E, c~p) , (6.111)
como el producto escalar de dos cuadrivectores γ µ y pµ , entonces la ecuación (6.110) con

p2 = p · p = E 2 − p~ 2 c2 puede ser visto como una generalización cuadrivectorial de la ecuación
(6.109). Claramente, para que la ecuación (6.110) mantenega las condiciones
γ02 = 1 = −γ 2 , γ0 γ + γγ0 = 0 , (6.112)
debe satisfacerse que las cuatro matrices γ µ anticonmuten, justo como las tres matrices de
Pauli. Ya que estas últimas son un conjunto completo de matrices anticonmutantes de 2 × 2,
la condición (6.112) no puede ser satisfacerse para matrices de 2 × 2, pero ella puede ser
satisfecha para matrices de 4 × 4
 
1 0 0 0
0
0 1 0 0 12 0
γ0 = γ =   = ,
0 0 −1 0  0 −12
0 0 0 −1
  (6.113)
0 0 0 1
0 0 1 0 0 12
γ=  0 −1 0 0 = −12 0 .

−1 0 0 0
Alternativamente, el vector de matrices de 4 × 4

0 ~σ
γ= = γ~σ = σ1 × ~σ , (6.114)
−~σ 0
puede obtenerse como el producto directo en el mismo sentido de la sección 6.2 de las matrices
de 2 × 2 de Pauli. De la misma manera, γ0 = σ3 × 12 y 14 = 12 × 12 .
Resumiendo el tratamiento relativista de una partı́cula de spin 21 , produce matrices de
4 × 4, mientras que las partı́culas no relativistas de spin 12 son descritas por las matrices de
Pauli σ de 2 × 2.
6.5. Diagonalización de matrices.

Momento de la matriz de inercia .
En muchos problemas en Fı́sica que involucran matrices reales simétricas o complejas
hermı́ticas es deseable llevar a cabo una real transformación de similaridad ortogonal o una
transformación unitaria (correspondiente a una rotación del sistema de coordenadas) para
reducir la matriz a una forma diagonal, con todos los elementos no diagonales nulos. Un
ejemplo particularmente directo de ésto es la matriz del momento de inercia I de un cuerpo
~ tenemos
rı́gido. A partir de la difinición del momento angular L
~ = I~ω ,
L (6.115)
donde ω
~ viene a ser la velocidad angular. La matriz de inercia I tiene elementos diagonales
X
Ixx = mi (ri2 − x2i ) , y ası́ sucesivamante, (6.116)
i
6.5. DIAGONALIZACIÓN DE MATRICES. 133
el subı́ndice i referencia la masa mi localizada en ~ri = (xi , yi , zi ). Para las componentes no

diagonales tenemos X
Ixy = − mi xi yi = Iyx . (6.117)
i
Por inspección la matriz I es simétrica. También, ya que I aparece en una ecuación fı́sica de la
forma (6.115), la cual se mantiene para todas las orientaciones del sistema de coordenadas,
esta puede ser considerada un tensor (regla del cuociente).
La clave ahora es la orientación de los ejes (a lo largo de un cuerpo fijo) tal que Ixy y
los otros elementos no diagonales desaparezcan. Como una consecuencia de esta orientación
y una indicación de ella, si la velocidad angular está a lo largo de tales realineados ejes, la
velocidad angular y el momento angular serán paralelos.
Autovectores y autovalores (eigenvector y eigenvalues).

Es quizás instructivo considerar un cuadro geométrico asociado a este problema. Si la
matriz de inercia I es multiplicada a cada lado por un vector unitario cuya dirección es
variable, n̂ = (α, β, γ), entonces en notación de Dirac
hn̂|I|n̂i = I , (6.118)
donde I es el momento de inercia respecto a la dirección n̂ y es un número positivo (escalar).
Llevando a cabo la multiplicación, obtenemos
I = Ixx α2 + Iyy β 2 + Izz γ 2 + 2Ixy αβ + 2Ixz αγ + 2Iyz βγ . (6.119)
Si introducimos
n̂
~n = √ = (n1 , n2 , n3 ) , (6.120)
I
la cual es variable en dirección y magnitud entonces la ecuación (6.119) llega a ser
1 = Ixx n21 + Iyy n22 + Izz n23 + 2Ixy n1 n2 + 2Ixz n1 n3 + 2Iyz n2 n3 , (6.121)
una forma cuadrática positiva la cual debe ser un elipsoide (ver figura 6.5).
A partir de la geometrı́a analı́tica es sabido que los ejes de coordenadas pueden ser rotados
para coincidir con los ejes de nuestro elipsoide. En muchos casos elementales, espacialmente
cuando hay simetrı́a, estos nuevos ejes, llamados ejes principales, pueden ser encontrados por
inspección. Ahora nosotros procederemos a desarrollar un método general de hallazgo de los
elementos diagonales y los ejes principales.
Si R−1 = R̃ es la correspondiente matriz ortogonal real tal que ~n0 = R~n, o |n0 i = R|ni en
la notación de Dirac, son las nuevas coordenadas, luego obtenemos usando hn0 |R = hn| en la
ecuación (6.121)
2 2 2
hn|I|ni = hn0 |RIR̃|n0 i = I10 n01 + I20 n02 + I30 n03 , (6.122)
0
Ii0
donde los > 0 son los momentos de inercia principales. La matriz de inercia I en la ecuación
(6.122) es diagonal en las nuevas coordenadas,
 0 
I1 0 0
I0 = R1R̃ =  0 I20 0  . (6.123)
0
0 0 I3
n3
n’3
n’1 n2
n1
n’2
Figura 6.5: Elipsoide del momento de inercia.
Si reescribimos la ecuación (6.123) usando R−1 = R̃
R̃I0 = IR̃ , (6.124)
y tomando R̃ = (~v1 , ~v2 , ~v3 ) compuesto de tres vectores columnas, entonces la ecuación (6.124)
se separa en tres ecuaciones de autovalores
I~vi = Ii0~vi , i = 1, 2, 3 , (6.125)
con autovalores Ii0 y autovectores ~vi . Como estas ecuaciones son lineales y homogéneas (para
un i fijo), por la sección 6.1 los determinantes tienen que anularse:

I11 − I10 I12 I13

0

I21
I22 − I2 I23 = 0 . (6.126)
0
I31 I32 I33 − I3
Reemplazando los autovalores Ii0 por una variable λ veces la matriz unidad 1, podriamos
reescribir la ecuación (6.125) como
(I − λ1)|vi = 0 , (6.127)
cuyo determinante
|I − λ1| = 0 , (6.128)
es un polinomio cúbico en λ; sus tres raices, por supuesto, son los Ii0 . Sustituyendo una raı́z
de regreso en la ecuación (6.125), podemos encontrar los correspondientes autovectores. La
ecuación (6.126) (o la (6.128)) es conocida como la ecuación secular. El mismo tratamiento
se aplica a una matriz simétrica real I, excepto que sus autovalores no necesitan ser todos po-
sitivos. También, la condición de ortogonalidad en la ecuación (6.83a-6.83d) para R dice que,
en términos geométricos, los autovectores ~vi son vectores mutuamente ortogonales unitarios.
Por cierto ellos forman las nuevas coordenadas del sistema. El hecho que cualquier par de
autovectores ~vi , ~vj son ortogonales si Ii0 6= Ij0 se deduce de la ecuación (6.125) en conjunción
con la simetrı́a de I multiplicando con ~vi y ~vj , respectivamente,
hvj |I|vi i = Ii0 hvj |vi i = hvi |I|vj i = Ij0 hvj |vi i . (6.129)
Ya que Ii0 6= Ij0 y la ecuación (6.129) implica que (Ii0 − Ij0 ) ~vi · ~vj = 0, por lo tanto ~vi · ~vj = 0.
Matrices hermı́ticas.
Para espacios vectoriales complejos las matrices unitarias y hermı́ticas juegan el mismo
rol como las matrices ortogonales y simétricas sobre los espacios vectoriales reales, respecti-
vamente. Primero, generalicemos el importante teorema acerca de los elementos diagonales
y los ejes principales para la ecuación de autovalores
A|ri = λ|ri . (6.130)
Ahora mostramos que si A es una matriz hermı́tica, sus autovalores son reales y sus
autovectores ortogonales.
Sean λi y λj dos autovalores y |ri i y |rj i, los correspondientes autovectores de A, una
matriz hermı́tica. Entonces
A|ri i = λi |ri i (6.131)

A|rj i = λj |rj i . (6.132)
La ecuación (6.131) es multilicada por |rj i
hrj |A|ri i = λi hrj |ri i . (6.133)
La ecuación (6.132) es multiplicada por |ri i para dar
hri |A|rj i = λj hri |rj i . (6.134)
Tomando la adjunta conjugada de esta ecuación, tenemos
hrj |A† |ri i = λ∗j hrj |ri i (6.135)
o
hrj |A|ri i = λ∗j hrj |ri i , (6.136)
ya que A es hermı́tica. Sustrayendo la ecuación (6.136) de la ecuación (6.133), obtenemos
(λi − λ∗j )hrj |ri i . (6.137)
Este es un resultado general para todas las combinaciones posibles de i y j. Primero, sea
j = i. Luego la ecuación (6.137) se convierte en
(λi − λ∗i ) hri |ri i = 0 . (6.138)
Ya que hri |ri i = 0 serı́a una solución trivial de la ecuación (6.138), concluimos que
λi = λ∗i , (6.139)
es decir, λi es real, para todo i.

Segundo, para i 6= j y λi 6= λj ,
(λi − λj ) hri |rj i = 0 (6.140)
o
hri |rj i = 0 (6.141)
lo cual significa que los autovectores de distintos autovalores son ortogonales, la ecuación
(6.141) siendo la generalización de ortogonalidad en este espacio complejo.
Si λi = λj (caso degenerado), hri | no es automáticamente ortogonal a |rj i, pero podrı́a
hacerse ortogonal. Consideremos el problema fı́sico de la matriz del momento de inercia
nuevamente. Si xi es un eje de simetrı́a rotacional, entonces encontraremos que λ2 = λ3 . Los
autovectores |r2 i y |r3 i son cada uno perpendiculares al eje de simetrı́a, |r1 i, pero ellos yacen
en alguna parte en el plano perpendicular a |r1 i; esto es, alguna combinación lineal de |r2 i y
|r3 i es también un autovector. Considere (a2 |r2 i + a3 |r3 i) con a2 y a3 constantes. Entonces
A(a2 |r2 i + a3 |r3 i) = a2 λ2 |r2 i + a3 λ3 |r3 i

(6.142)
= λ2 (a2 |r2 i + a3 |r3 i) ,
como es esperado, para x1 un eje de simetrı́a rotacional. Por lo tanto, si |r1 i y |r2 i son
fijos, |r3 i, puede simplemente escogerse yaciendo en el plano perpendicular a |r1 i y también
perpendicular a |r2 i. Un método general para ortogonalizar soluciones conocido como proceso
de Gram-Schmidt, es aplicado a funciones más adelante.
El conjunto de n autovectores ortogonales de nuestra matriz hermı́tica de n × n forma un
conjunto completo, generando el espacio de n dimensiones complejo. Este hecho es útil en un
cálculo variacional de los autovalores. Los autovalores y los autovectores no están limitados
a las matrices hermı́ticas. Todas las matrices tienen autovalores y autovectores. Por ejemplo,
la matriz T de población estocástica satisface una ecuación de autovalores
TP~equilibrio = λP~equilibrio ,
con λ = 1. Sin embargo, solamente las matrices hermı́ticas tienen todos los autovectores
ortogonales y todos sus autovalores reales.
Matrices antihermı́ticas.
Ocasionalmente, en Mecánica Cuántica encontramos matrices antihermı́ticas:
A† = −A .
Siguiendo el análisis de la primera porción de esta sección, podemos mostrar que
a. Los autovalores son imaginarios puros (o cero).
b. Los autovectores correspondientes a autovalores distintos son ortogonales.

La matriz R formada de los autovectores normalizados es unitaria. Esta propiedad anti-

hermı́tica es preservada bajo transformaciones unitarias.
Ejemplo: Autovalores y autovectores de una matriz real simétrica.

Sea  
0 1 0
A= 1  0 0 . (6.143)
0 0 0
La ecuación secular es
−λ 1 0

1 −λ 0 = 0 , (6.144)

0 0 −λ
o
− λ(λ2 − 1) = 0 , (6.145)
expandiéndolo por las menores. Las raices son λ = −1, 0, 1. Para encontrar el autovector
correspondiente a λ = −1, sustituimos este valor de vuelta en la ecuación de autovalores,
ecuación (6.130),     
−λ 1 0 x 0
 1 −λ 0  y  = 0 . (6.146)
0 0 −λ z 0
Con λ = −1, esto produce
x+y =0 , z=0. (6.147)
Dentro de un factor de escala arbitrario, y un signo arbitrario (factor de fase), hr1 | = (1, −1, 0).
Notemos que (para el real |ri en el espacio ordinario) el autovector define una lı́nea en el
espacio. El sentido positivo o negativo no está determinado. Esta indeterminación puede
ser entendida si notamos que la ecuación (6.130) es homogénea en |ri. Por conveniencia
requeriremos que los autovectores estén normalizados a la unidad, hr1 |r1 i = 1. Con esta
elección de signo
1 1
hr1 | = r~1 = √ , − √ , 0 , (6.148)
2 2
está fijo. Para λ = 0, la ecuación (6.130) produce
y=0, x=0, (6.149)
hr2 | o ~r2 = (0, 0, 1) es un autovector aceptable. Finalmente, para λ = 1, tenemos
−x+y =0 , z=0, (6.150)
o
1 1
hr3 | = r~3 = √ , √ , 0 . (6.151)
2 2
La ortogonalidad de ~r1 , ~r2 y ~r3 , correspondientes a los tres autovalores distintos, puede ser
fácilmente verificada.
Ejemplo: Autovalores degenerados.

Consideremos  
1 0 0
A = 0 0 1 . (6.152)
0 1 0
La ecuación secular es
1 − λ 0 0

0
−λ 1 = 0 , (6.153)
0 1 −λ
o
(1 − λ)(λ2 − 1) = 0 , λ = −1, 1, 1 , (6.154)
un caso degenerado. Si λ = −1, la ecuación de autovalores (6.130) produce
2x = 0 , y+z =0 . (6.155)
Un autovector normalizado adecuado es

1 1
hr1 | = r~1 = 0, √ , − √ . (6.156)
2 2
para λ = 1, tenemos
−y+z =0 . (6.157)
Cualquier autovector que satisface la ecuación (6.157) es perpendicular a ~r1 . Tenemos infinito
número de opciones. Tomemos una elección posible tomando

1 1
hr2 | = r~2 = 0, √ , √ , (6.158)
2 2
la cual claramente satisface la ecuación (6.157). Entonces ~r3 debe ser perpendicular a ~r1 y
puede ser escogido perpendicular a ~r2 por7
~r3 = ~r1 × ~r2 = (1, 0, 0) . (6.159)
Funciones de matrices.
Polinomios con uno o más argumentos matriciales están bien definidos y ocurren a menu-
do. Series de potencias de una matriz también pueden estar definidas para dar la convergencia
de la serie para cada uno de los elementos de matriz. Por ejemplo, si A es cualquiera matriz
de n × n entonces la serie de potencia
∞
X Ai
exp(A) = , (6.160a)
i=0
i!
∞
X A2i+1
sen(A) = (−1)i , (6.160b)
i=0
(2i + 1)!
∞
X A2i
cos(A) = (−1)i , (6.160c)
i=0
(2i)!
7
El uso del producto cruz es limitado a tres dimensiones.
6.6. MATRICES NORMALES. 139
son matrices de n × n bien definidas. Para todas las matrices de Pauli σk la identidad de
Euler para θ real y k =1, 2 o 3
exp(iσk θ) = 12 cos(θ) + iσk sen(θ) , (6.161)
sale a partir de colectar las potencias pares e impares en series separadas usando σk2 = 1.
Para las matrices de Dirac σ ij de 4 × 4 con (σ ij )2 = 1, si j 6= k = 1, 2 o 3, obtenemos de
manera similar (sin escribir las obvias matrices 14 nunca más)
exp(iσ jk θ) = cos(θ) + iσ jk sen(θ) , (6.162)
mientras
exp(iσ 0k ζ) = cosh(ζ) + iσ 0k senh(ζ) , (6.163)
manteniendo ζ real porque (iσ 0k )2 = 1 para k = 1, 2 o 3.
Para una matriz hermı́tica A hay una matriz unitaria U que la diagonaliza, es decir,
UAU† = [a1 , a2 , . . . , an ]. Entonces la fórmula de la traza
det(exp(A)) = exp(tr(A)) (6.164)
Puede ser fácilmente demostrado.

Otra importante relación es la de fórmula de Baker-Hausdorff
[iG, [iG, H]]
exp(iG)H exp(−iG) = H + [iG, H] + + ··· (6.165)
2!
lo cual resulta de multiplicar las serie de potencia para exp(iG) y recolectar los términos de
la misma potencia en iG. Aquı́ definimos
[G, H] = GH − HG
como el conmutador de G con H.
6.6. Matrices normales.

En la sección 6.5 nos concentramos principalmente en matrices hermı́ticas o reales simétri-
cas y en el proceso de encontrar autovalores y autovectores. En esta sección generalizaremos a
matrices normales con matrices hermı́tica y unitario como casos especiales. Consideramos los
casos fı́sicamente importantes como el problema de los modos de vibraciones y el problema
numérico importante de matrices patológicas.
Una matriz normal es una matriz que conmuta con su adjunta,
[A, A† ] = 0 .
Ejemplos obvios e importante son las matrices hermı́ticas y unitarias. Mostraremos que
las matrices normales tienen autovectores (ver tabla 6.1)
I. Sea |xi un autovector de A con correspondiente autovalor λ. Entonces
A|xi = λ|xi (6.166)

Autovectores
Matriz Autovalores (para diferentes autovalores)
Hermı́tica Real Ortogonal
Antihermı́tica Imaginaria puro (o cero) Ortogonal
Unitaria Magnitud uno Ortogonal
Normal Si A tiene autovalor λ Ortogonal
† ∗ †
A tiene autovalor λ A y A tienen los mismos autovectores
Cuadro 6.1:
o
(A − λ1)|xi = 0 . (6.167)
Por conveniencia la combinación A − λ1 la etiquetamos B. Tomando la adjunta de la ecuación
(6.167), obtenemos
hx|(A − λ1)† = 0 = hx|B† . (6.168)
Porque
[(A − λ1), (A − λ1)† ] = [A, A† ] = 0 ,
tenemos
[B, B† ] = 0 . (6.169)
La matriz B es también normal.
A partir de las ecuaciones (6.167) y (6.168) formamos
hx|B† B|xi = 0 . (6.170)
Usando (6.169)
hx|BB† |xi = 0 . (6.171)
Ahora la ecuación (6.171) puede ser rescrita como
(B† |xi)† (B† |xi) = 0 . (6.172)
Asi
B† |xi = (A† − λ∗ 1)|xi = 0 . (6.173)
Vemos que para matrices normales, A† tiene los mismos autovectores que A pero los autova-
lores son los complejos conjugados.
II. Ahora, consideremos más que uno autovector-autovalor, tenemos
A|xi i = λi |xi i , (6.174)

A|xj i = λj |xj i . (6.175)
Multiplicando la ecuación (6.175) por la izquierda por hxi | produce
hxi |A|xj i = λj hxi |xj i . (6.176)

Operando sobre el lado izquierdo de la ecuación (6.176), obtenemos
hxi |A = (A† |xi i)† . (6.177)
A partir de la ecuación (6.173) sabemos que A† tiene los mismos autovectores que A pero con
los complejos conjugados de los autovalores
(A† |xi i)† = (λ∗i |xi i)† = λi hxi | . (6.178)
Sustituyendo en la ecuación (6.176) tenemos
λi hxi |xj i = λj hxi |xj i (6.179)
o
(λi − λj )hxi |xj i = 0 . (6.180)
Esta es la misma que la ecuación (6.140).
Para λi 6= λj
hxi |xj i = 0 .
Los autovectores correspondientes a diferentes autovalores de una matriz normal son ortogo-
nales. Esto significa que una matriz normal puede ser diagonalizada por una transformación
unitaria. La matriz unitaria requerida puede ser construida a partir de los vectores ortonor-
males como se mostró en la sección anterior.
El converso también es válido. Si A puede ser diagonalizada por una transformación
unitaria, entonces A es normal.
Modos normales de vibración.

Consideremos las vibraciones de un modelo clásico de la molecula de CO2 Esta es una
ilustración de la aplicación de las técnicas matriciales a un problema que no parte como
un problema de matrices. También provee un ejemplo de autovalores y autovectores de una
matriz real asimétrica.
Ejemplo: Modos Normales.

Consideremos tres masas sobre el eje x unidas por resortes como muestra la figura 6.6.
Las fuerzas de los resortes se suponen lineales (para pequeños desplazamientos, ley de Hooke)
y las masas se restringen a mantenerse sobre el eje x.
Usando una coordenada diferente para cada masa la segunda ley de Newton produce el
conjunto de ecuaciones
k
ẍ1 = − (x1 − x2 )
M
k k
ẍ2 = − (x2 − x1 ) − (x2 − x3 ) (6.181)
M m
k
ẍ3 = − (x3 − x2 ) .
M
k k
M m M
x1 x2 x3
Figura 6.6: Vector fijo con coordenadas rotada.
El sistema de masa está vibrando. Buscamos las frecuencias comunes, ω tal que todas las
masas vibren en esta misma frecuencia. Estos son los modos normales. Sea
xi = xi0 eiωt , i = 1, 2, 3.
Subtituyendo en la ecuacion (6.181), podemos escribir este conjunto como

 k k  x   
x1
1
− 0
M M 
   
 

 k 2k k
    
− −  x2  = ω2 
x2  ,
 (6.182)
 m m m  
 
 
k k
    
0 −
M M x3 x3
dividiendo por el factor común eiωt . Tenemos una ecuación matricial de autovalores con la
matriz asimétrica. La ecuación secular es
k k

− ω2 − 0

M M
k 2k k

− 2 =0. (6.183)
−ω −

m m m
k k

2
− −ω

0
M M
Esto conduce a
2 k 2k k
ω − ω2 2
ω − − =0
M m M
Los autovalores son
k k 2k
ω2 = 0 , , y + ,
M M m
todas reales.
Los correspondientes autovectores son determinados sustituyendo los autovalores de re-

greso en la ecuación (6.182) un autovalor a la vez. Para ω 2 = 0, ecuación (6.182) produce
x1 − x2 = 0
−x1 + 2x2 − x3 = 0
−x2 + x3 = 0 .
Entonces, tenemos
x1 = x2 = x3 .
Esto describe una translación pura sin movimiento relativo de las masas y sin vibración.
k
Para ω 2 = , la ecuación (6.182) produce
M
x1 = −x3 , x2 = 0 . (6.184)
Las masas exteriores se mueven en direcciones opuestas. El masa del centro está estacionaria.
k 2k
Para ω 2 = + , las componentes de los autovectores son
M M
2M
x1 = x3 , x2 = − x1 .
m
Las dos masas exteriores se están moviendo juntas. La masa del centro se está moviendo
opuesta a las otras dos. El momentum neto es cero.
Cualquier desplazamiento de estas tres masas a lo largo del eje x puede ser descrito como
una combinación lineal de estos tres tipos de movimiento: translación más dos formas de
vibración.
Sistemas con condiciones patológicas.

Un sistema lineal de ecuaciones puede ser escrito como
A|xi = |yi o A−1 |yi = |xi , (6.185)
con A y |yi conocido y |xi desconocido. Podemos encontrar ejemplos en los cuales un pequeño
error en |yi resulta en un gran error en |xi. En este caso la matriz A es llamada de condición
patológica. Si |δxi es el error en |xi y |δyi es el error en |yi, entonces los errores relativos
pueden ser escritos como
1/2 1/2
hδx|δxi hδy|δyi
≤ K(A) . (6.186)
hx|xi hy|yi
Aquı́ K(A), una propiedad de la matriz A, es etiquetado la condición de número. Para A

hermı́tica una forma de la condición de número es dada por
| λ |max
K(A) = . (6.187)
| λ |min
Una forma aproximada debido a Turing es
K(A) = n[Aij ]max [A−1

ij ]max , (6.188)
en la cual n es el orden de la matriz y [Aij ]max es el máximo elemento en A.
Ejemplo: Una matriz patológica.

Un ejemplo común de una matriz con condición patológica es la matriz de Hilbert, la
matriz de Hilbert de orden 4 es Hij = (i + j − 1)−1 ,
1 1 1
 
1
 2 3 4
1 1 1 1
 
 
H4 =  2 3 4 5  . (6.189)
 
1 1 1 1
 
3 4 5 6
1 1 1 1
4 5 6 7
Los elementos de la matriz inversa (orden n) son dados por
(−1)i+j (n + i − 1)!(n + j − 1)!

(H−1
n )ij = · . (6.190)
i + j ± 1 [(i − 1)!(j − 1)!]2 (n − i)!(n − j)!
Para n = 4  
16 −120 240 −140
 −120 1200 −2700 1680 
H−1
4 =
 240 −2700
 . (6.191)
6480 −4200 
−140 1680 −4200 2800
A partir de la ecuación (6.188) la estimación de Turing de la condición de número para H4
llega a ser
KTuring = 4 × 1 × 6480
2.59 × 104 .
Esto es una advertencia de que un error en la entrada puede ser multiplicado por 26000
en el cálculo del resultado de salida. Esto sentencia que H4 tiene condición patológica. Si
usted encuentra un sistema altamente patológico tiene un par de alternativas (además de
abandonar el problema).
a. Tratar un ataque matemático diferente.
b. Hacer arreglos para llevar más cifras significativas y a costa de fuerza bruta empujar de
principio a fin.
Capı́tulo 7
Teorı́a de grupo.
Disciplined judgment about what is neat

and simmetrical and elegant has time and
time again proved an excellent guide to
how nature work.
Murray Gell-Mann
7.1. Introducción.
En mecánica clásica la simetrı́a de un sistema fı́sico conduce a una ley de conservación. La
conservación del momentum angular es una consecuencia directa de la simetrı́a rotacional, lo
cual significa invariancia bajo rotaciones espaciales. A principios del siglo pasado, Wigner y
otros comprendieron que la invariancia era el concepto clave en el entendimiento de los nuevos
fenómenos y en el desarrollo de teorı́as apropiadas. Ası́, en mecánica cuántica los conceptos de
momento angular y spin han llegado a ser aún más centrales. Sus generalizaciones, el isospin
en fı́sica nuclear y la simetrı́a de sabor en fı́sica de partı́culas, son herramientas indispensables
en la construcción teórica y en sus soluciones. Las generalizaciones del concepto de invariacia
de gauge de la electrodinámica clásica para la simetrı́a del isospin conduce a la teorı́a de
gauge electrodébil.
En cada caso el conjunto de estas operaciones de simetrı́a forman un grupo. La teorı́a
de grupo es la herramienta matemática para tratar las invariancias y las simetrı́as. Ella trae
consigo unificación y formalización de principios tales como reflexión espacial, o paridad,
momento angular, y geometrı́a que son ampliamente usados por los fı́sicos.
En geometrı́a el rol fundamental de la teorı́a de grupo fue reconocido hace mucho tiempo
por los matemáticos. En geometrı́a euclideana la distancia entre dos puntos, el producto
escalar de dos vectores o métrica, no cambia bajo rotaciones o translaciones. Estas simetrı́as
son caracterı́sticas de esta geometrı́a. En relatividad especial la métrica, o producto escalar
de cuadrivectores, difiere del de la geometrı́a euclideana en que ya no es más positivo definido
y es invariante ante transformaciones de Lorentz.
1
Este capı́tulo está basado en el cuarto capı́tulo del libro: Mathematical Methods for Physicists, fourth
145
146 CAPÍTULO 7. TEORÍA DE GRUPO.
Para un cristal el grupo de simetrı́a contiene sólo un número finito de rotaciones en valores
discretos del ángulo y reflexiones. La teorı́a de tales grupos discretos o finitos, desarrollada
inicialmente como una rama de las matemáticas pura, ahora es una útil herramienta para
el desarrollo de la cristalografı́a y la fı́sica de la materia condensada. Haremos una breve
introducción a ellos. Cuando las rotaciones dependen de un ángulo continuo el grupo de
rotaciones tiene un número infinito de elementos. Estudiaremos tales grupos continuos o de
Lie.
Definición de grupo.
Un grupo G puede ser definido como un conjunto de objetos u operaciones, llamados los
elementos de G, que pueden ser combinados o “multiplicados” para formar un producto bien
definido en G el cual satisface las siguientes cuatro condiciones.
1. Si a y b son cualquier par de elementos de G, entonces el producto ab es también elemento

de G; o (a, b) → ab mapea G × G sobre G.
2. Esta multiplicación es asociativa, (ab)c = a(bc).
3. Hay un elemento unidad o neutro I en G tal que Ia = aI = a para cada elemento a de

G.2
4. Debe haber un inverso o reciproco de cada elemento a de G, etiquetado a−1 , tal que
aa−1 = a−1 a = I.
Un ejemplo de grupo es el conjunto de rotaciones de coordenadas en el sentido del puntero

del reloj,
cos ϕ sen ϕ
R(ϕ) = (7.1)
− sen ϕ cos ϕ
en un ángulo ϕ del sistema de coordenadas xy a una nueva orientación. El producto de dos
rotaciones R(ϕ1 )R(ϕ2 ) es definida como una rotación primero en un ángulo ϕ2 y entonces
en un ángulo ϕ1 . De acuerdo a la ecuación (6.29), esto corresponde al producto de las dos
matrices ortogonales de 2 × 2

cos ϕ1 sen ϕ1 cos ϕ2 sen ϕ2 cos(ϕ1 + ϕ2 ) sen(ϕ1 + ϕ2 )
= , (7.2)
− sen ϕ1 cos ϕ1 − sen ϕ2 cos ϕ2 − sen(ϕ1 + ϕ2 ) cos(ϕ1 + ϕ2 )
usando las fórmulas de adición de funciones trigonométricas. El producto es claramente una

rotación representada por una matriz ortogonal con un ángulo ϕ1 + ϕ2 . El producto es la
multiplicación asociativa de matrices. Es conmutativo o abeliano porque el orden en el cual
esta rotaciones son realizadas no importa. El inverso de la rotación con ángulo ϕ es una con
ángulo −ϕ. La unidad o neutro corresponde al ángulo ϕ = 0. El nombre del grupo es SO(2), si
el ángulo varı́a continuamente desde 0 a 2π. Claramente, SO(2) tiene infinitos elementos. La
unidad con ángulo ϕ = 0 y la rotación con ϕ = π forman un subgrupo finito. Un subgrupo G0
de un grupo G consiste de elementos de G tal que el producto de cualquiera de sus elementos
2
También etiquetan al elemento unidad como E.
7.1. INTRODUCCIÓN. 147
está de nuevo en el subgrupo G0 , i.e., G0 es cerrado bajo la multiplicación de G. Si gg 0 g −1

es un elemento de G0 para cualquier g de G y g 0 de G0 , entonces G0 es llamado un subgrupo
invariante de G.
Las matrices ortogonales n × n forman el grupo O(n), y también SO(n) si sus determi-
nantes son +1 (S por eSpecial). Si Õi = O−1i para i = 1 y 2, entonces el producto
] −1 −1 −1
O 1 O2 = Õ2 Õ1 = O1 O2 = (O1 O2 )
es también una matriz ortogonal en SO(n). La inversa es la matriz (ortogonal) transpuesta.

La unidad del grupo es 1n . Una matriz real ortogonal de n × n tiene n(n − 1)/2 parámetros
independientes. Para n = 2 hay sólo un parámetro: un ángulo en la ecuación (7.1). Para
n = 3, hay tres parámetros independientes: los tres ángulos de Euler de la sección 6.3.
De la misma manera, las matrices unitarias de n × n forman el grupo U(n), y también
SU(n) si sus determinantes son +1. Si U†i = U−1
i , entonces
(U1 U2 )† = U†2 U†1 = U−1 −1

2 U1 = (U1 U2 )
−1
,
tal que el producto es unitario y un elemento de SU(n). Cada matriz unitaria tiene una
inversa la cual es también unitaria.
Homomorfismo, isomorfismo.
Puede haber una correspondencia entre los elementos de dos grupos (o entre dos repre-
sentaciones), uno a uno, dos a uno, o muchos a uno. Si esta correspondencia preserva la
multiplicación del grupo, diremos que los dos grupos son homomórficos. Una de las más im-
portantes correspondencias homomórficas entre el grupo de rotaciones SO(3) y el grupo de
matrices unitarias SU(2) será desarrollado en la próxima sección. Si la correspondencia es
uno a uno, y aún preserva la multiplicación del grupo,3 entonces los grupos son isomórficos.
Un ejemplo es las rotaciones de coordenadas a través de un ángulo finito ϕ en el sentido
horario respecto al eje z en el espacio tridimensional descrito por
 
cos ϕ sen ϕ 0
Rz (ϕ) = − sen ϕ cos ϕ 0 . (7.3)
0 0 1
El grupo de rotaciones Rz es isomórfico al grupo de rotaciones en la ecuación (7.1).
Representaciones matriciales, reducibles e irreducibles.

La representación de los elementos de un grupo por matrices es una técnica muy poderosa
y ha sido casi universalmente adoptada por los fı́sicos. El uso de matrices no impone restric-
ciones significativas. Puede mostrarse que los elementos de cualquier grupo finito y de grupos
continuos pueden ser representados por matrices. Ejemplos son las rotaciones descritas en la
ecuación (7.1) y (7.3).
3
Supongamos que los elementos del primer grupo son etiquetados por gi y los elementos del segundo
grupo por hi . Entonces gi ↔ hi en una correspondencia uno a uno para todos los valores de i. Si gi gj = gk y
hi hj = hk , entonces gk y hk deben ser los elementos correspondientes del grupo.
Para ilustrar como las representaciones matriciales surgen a partir de una simetrı́a, con-
sideremos la ecuación estacionaria de Schrödinger (o algún otra ecuación de autovalores tal
como I vi = Ii vi para los momentos principales de inercia de un cuerpo rı́gido en mecánica
clásica)
Hψ = Eψ . (7.4)
Supongamos que la ecuación (7.4) se mantiene invariante bajo la acción de un grupo G de

transformaciones R en G (rotaciones de coordenadas, por ejemplo, para un potencial central
V (r) en el Hamiltoniano H), i.e.,
HR = RHR−1 = H . (7.5)
Ahora tomamos una solución ψ de la ecuación (7.4) y la “rotamos”: ψ → Rψ. Entonces Rψ

tiene la misma energı́a E porque multiplicando la ecuación (7.4) por R y usando (7.5) produce
RHψ = E(Rψ) = (RHR−1 )Rψ = H(Rψ) . (7.6)
En otras palabras, todas las soluciones rotadas Rψ son degeneradas en energı́a o forman lo
que los fı́sicos llaman un multiplete. Supongamos que este espacio vectorial Vψ de soluciones
transformadas tiene una dimensión finita n. Sean ψ1 , ψ2 , . . . , ψn una base. Ya que Rψj es un
miembro del multiplete, podemos expandirlo en términos de esta base
X
Rψj = rjk ψk . (7.7)
k
Ası́, cada R en G puede ser asociado a una matriz (rjk ), y este mapeo R → (rjk ) es llamada
una representación de G. Si podemos tomar cualquier elemento de Vψ y por rotaciones con
todos los elementos de R de G transforman en todos los otros elementos de Vψ entonces la
representación es irreducible. Si todos los elementos de Vψ no son alcanzados, entonces Vψ se
separa en una suma directa de dos o más subespación vectoriales, Vψ = V1 + V2 + . . ., los
cuales son mapeados dentro de ellos mismos por rotación de sus elementos. En este caso la
representación es llamada reducible. Entonces podemos encontrar una base en Vψ (i.e., hay
una matriz unitaria U) tal que
 
r1 0 . . .
U(rjk )U† =  0 r2 . . . (7.8)
 
.. .. . .
. . .
para todos los R de G y todas las matrices (rjk ). Aqui r1 , r2 , . . ., son matrices de menor
dimensiones que (rjk ) que están alineadas a lo largo de la diagonal y los 0 son matrices de
ceros. podemos decir que R ha sido descompuestas en r1 + r2 + . . . en paralelo con Vψ =
V1 ⊕ V2 ⊕ . . ..
Las representaciones irreducibles juegan un rol en teorı́a de grupo que es aproximadamente
análogo a los vectores unitarios en el análisis vectorial. Ellas son las representaciones más
simples, toda otra puede ser construida desde ellas.
7.2. GENERADORES DE GRUPOS CONTINUOS. 149
7.2. Generadores de grupos continuos.

Un caracterı́stica de los grupos continuos conocidos como grupos de Lie es que los paráme-
tros de un producto de elementos son funciones analı́ticas de los parámetros de los factores.
La naturaleza analı́tica de las funciones nos permite desarrollar el concepto de generador y
reduce el estudio del grupo completo a un estudio de los elementos del grupo en la vecindad
del elemento identidad.
La idea esencial de Lie fue el estudio de elementos R en un grupo G que esten infinitesi-
malmente cercanos a la unidad de G. Consideremos el grupo SO(2) como un ejemplo simple.
Las matrices de rotación de 2 × 2 en la ecuación (7.1) puede ser escrita en forma exponencial
usando la identidad de Euler ecuación (6.161) como

cos ϕ sen ϕ
R(ϕ) = = 12 cos ϕ + iσ2 sen ϕ = exp(iσ2 ϕ) . (7.9)
− sen ϕ cos ϕ
A partir de la forma exponencial es obvio que la multiplicación de estas matrices es equivalente
a la suma de los argumentos
R(ϕ2 )R(ϕ1 ) = exp(iσ2 ϕ2 ) exp(iσ2 ϕ1 ) = exp(iσ2 (ϕ1 + ϕ2 )) = R(ϕ1 + ϕ2 ) .
Por supuesto las rotaciones cercanas a 1 tienen un ángulo pequeño ϕ ∼ 0.

Esto sugiere que busquemos una representación exponencial
R = exp(iεS) , ε→0, (7.10)
para elementos del grupos R ∈ G cercanos a la 1. Las transformaciones infinitesimales S son

llamadas los generadores de G. Ellos forman un espacio lineal cuya dimensión es el orden
de G porque la multiplicación de los elementos R del grupo se traduce en la suma de los
generadores S.
Si R no cambia el elemento de volumen, i.e., det(R) = 1, nosotros usamos la ecuación
(6.164) para ver que
det(R) = exp(tr(ln R)) = exp(iεtr(S)) = 1
implica que los generadores son de traza nula,
tr(S) = 0 . (7.11)
Este es el caso para el grupo de rotaciones SO(n) y el grupo unitario SU(n), como veremos
más adelante.
Si R de G en la ecuación (7.1) es unitario, entonces S† = S es hermı́tica, lo cual también
es el caso para SO(n) y SU(n). Ya que hay un i extra en la ecuación (7.10).
Expandamos los elementos del grupo
1
Ri = exp(iεi Si ) = 1 + iεi Si − ε2i S2i + . . . ,
2 (7.12)
1 2 2
R−1
i = exp(−iεi Si ) = 1 − iεi Si − εi Si + . . . ,
2
a segundo orden en el pequeño parámetro del grupo εi porque los términos lineales y varios
términos cuadráticos se cancelan en el producto (figura 7.1)
−1
Rj
Ri
−1
Ri
Rj
R ij
Figura 7.1: Ilustración de la ecuación (7.13).
R−1 −1
i Rj Ri Rj = 1 + εi εj [Sj , Si ] + . . . ,
X (7.13)
= 1 + εi εj ckji Sk + . . . ,
k
cuando las ecuaciones (7.12) son sustituidas dentro de la ecuación (7.13). La última lı́nea
es debido a que el producto en la ecuación (7.13) es nuevamente un elemento, Rij cercano
a la unidad en el grupo G. Por tanto su exponente debe ser una combinación lineal de los
generadores Sk y sus parámetros infinitesimales del grupo tienen que ser proporcionales al
producto εi εj . Comparando ambas lı́neas (7.13) encontramos la relación de clausura de los
generadores del grupo de Lie G,
X
[Si , Sj ] = ckij Sk (7.14)
k
Los coeficientes ckij son las constantes de estructura del grupo G. Ya que el conmutador en la
ecuación (7.14) es antisimétrico en i y en j, también lo son las constantes de estructura en
los ı́ndices inferiores,
ckij = −ckji . (7.15)
Si el conmutador en la ecuación (7.14) es tomado como la regla de multiplicación de los
generadores, vemos que el espacio vectorial de los generadores llega a ser un álgebra, el álgebra
de Lie G del grupo G. Para SU(l + 1) el álgebra de Lie es llamada Al , para SO(2l + 1) es Bl
y para SO(2l) es Dl , donde l = 1, 2, . . . es un entero positivo, esto será llamado el rango de
grupo de Lie G o de su álgebra G.
Finalmente, la identidad de Jacobi se satisface para los doblas conmutadores
[[Si , Sj ], Sk ] + [[Sj , Sk ], Si ] + [[Sk , Si ], Sj ] = 0 , (7.16)
lo cual es fácilmente verificable usando la definición de conmutador. Cuando la ecuación (7.14)

es substituida en (7.16) encontramos otra restricción sobre las constantes de estructura,
X
cm m m

ij [Sm , Sk ] + cjk [Sm , Si ] + cki [Sm , Sj ] = 0 . (7.17)
m
Usando de nuevo la ecuación (7.14) en la ecuación (7.17) implica que

X
cm n m n m n

ij cmk Sn + cjk cmi Sn + cki cmj Sn = 0 , (7.18)
mn
donde el factor común Sn (y la suma sobre n) pueden eliminarse por que los generadores son
linealmente independientes. Por tanto
X
cm n m n m n

ij cmk + cjk cmi + cki cmj = 0 . (7.19)
m
Las relaciones (7.14), (7.15) y (7.19) forman la base de las álgebras de Lie desde la cual los
elementos finitos del grupo de Lie cerca de su unidad puede ser reconstruı́do.
Volviendo a la ecuación (7.5), el inverso de R es exactamente R−1 = exp(−iεS). expandi-
mos HR de acuerdo a la fórmula de Baker-Haudorff, ecuación (6.17),
[S, [iS, H]]
H = HR = exp(iεS)H exp(−iεS) = H + iε[S, H] − ε2 + ··· . (7.20)
2!
Al simplificar H de la ecuación (7.20), dividiendo por ε y haciendo ε → 0. Entonces la
ecuación (7.20) implica que para cualquier rotación cercana a 1 en G el conmutador
[S, H] = 0 . (7.21)
Si S y H son matrices hermı́ticas, la ecuación (7.21) dice que S y H pueden ser simultaneamen-
te diagonalizados. Si S y H son operadores diferenciales como el Hamiltoniano y el momento
angular orbital en mecánica cuántica, entoces la ecuación (7.21) dice que S y H tienen auto-
funciones en común y que los autovalores degenerados de H pueden ser distinguidos por los
autovalores de los generadores S. Esta es con mucho la más importante aplicación de teorı́a
de grupos a mecánica cuántica.
A continuación, estudiaremos los grupos ortogonales y unitarios como ejemplos.
Grupos de rotaciones SO(2) y SO(3).

Para SO(2) definido por la ecuación (7.1) hay sólo un generador linealmente independien-
te, σ2 y el orden de SO(2) es 1. Obtenemos σ2 a partir de diferenciar la ecuación (7.9) y
evaluarla en cero,

dR(ϕ) − sen ϕ cos ϕ 0 1
−i = −i = −i = σ2 . (7.22)
dϕ ϕ=0 − cos ϕ − sen ϕ ϕ=0 −1 0
Para las rotaciones Rz (ϕ) sobre el eje z descritas por la ecuación (7.3), el generador es
dado por  
0 −i 0
dR(ϕ)
−i = Sz =  i 0 0 , (7.23)
dϕ ϕ=0
0 0 0
donde el factor extra i es insertado para hacer Sz hermı́tica. La rotación Rz (δϕ) en un ángulo
infinitesimal δϕ puede ser escrita como
Rz (δϕ) = 13 + iδϕSz , (7.24)
Una expansión de Maclaurin-Taylor de Rz cerca de la unidad ϕ = 0 con términos hasta

orden (δϕ)2 y los superiores son despreciados. Una rotación finita puede ser compuesta por
sucesivas rotaciones infinitesimales
Rz (δϕ1 + δϕ2 ) = (13 + iδϕ1 Sz )(13 + iδϕ2 Sz ) . (7.25)
Sea δϕ = ϕ/N para N rotaciones, con N → ∞. Entonces,

h ϕ iN
Rz (ϕ) = lı́m 13 + i Sz = exp(iSz ) . (7.26)
N →∞ N
Esta forma identifica Sz como el generador del grupo Rz , un subgrupo abeliano de SO(3), el
grupo de rotaciones en tres dimensiones con determinante +1. Cada matriz de 3 × 3 Rz (ϕ)
es ortogonal, por lo tanto unitaria, y la tr(Sz ) = 0 de acuerdo con la ecuación (7.11).
Por diferenciación de las rotaciones de coordenadas
   
1 0 0 cos θ 0 − sen θ
Rx (ψ) = 0 cos ψ sen ψ  , Ry (θ) =  0 1 0  , (7.27)
0 − sen ψ cos ψ) sen θ 0 cos θ
obtenemos los generadores

   
0 0 0 0 0 −i
Sx = 0 0 −i , Sy = 0 0 0  , (7.28)
0 i 0 i 0 0
de Rx y Ry , los subgrupos de rotaciones en torno a los ejes x e y respectivamente.
Rotaciones de funciones y momento angular orbital.

En la discusión precedente los elementos del grupos son matrices que rotan las coordena-
das. Cualquier sistema fı́sico que esta siendo descrito se mantiene fijo. Ahora mantengamos
fijas las coordenadas y rotemos una función ψ(x, y, z) relativa a nuestras coordenadas fijas.
Con R para rotar las coordenadas,
~x 0 = R~x , (7.29)
definimos R por
Rψ(x, y, z) = ψ 0 (x, y, z) → ψ(~x 0 ) . (7.30)
En palabras, la matriz R opera sobre la función ψ, creando una nueva función ψ 0 que
es numéricamente igual a ψ(~x 0 ), donde ~x 0 son las coordenadas rotadas por R. Si R rota las
coordenadas en el sentido horario, el efecto de la matriz R es rotar el modelo de la función ψ
en el sentido horario.
Volviendo a las ecuaciones (7.3) y (7.28), consideremos una rotación infinitesimal, ϕ → δϕ.
Luego, usando Rz , ecuación (7.3), obtenemos
Rz (δϕ)ψ(x, y, z) = ψ(x + yδϕ, y − xδϕ, z) . (7.31)

El lado derecho puede ser expandido como una serie de Taylor de primer orden en δϕ para
dar

∂ψ ∂ψ
Rz (δϕ)ψ(x, y, z) = ψ(x, y, z) − δϕ x −y + O(δϕ)2
∂y ∂x (7.32)
= (1 − iδϕLz )ψ(x, y, z) ,
la expresión diferencial en el paréntesis de llave es iLz . Ya que una rotación primero en ϕ y

luego en δϕ alrededor del eje z está dado por
Rz (ϕ + δϕ)ψ(x, y, z) = Rz (δϕ)Rz (ϕ)ψ(x, y, z) = (1 − iδϕLz )Rz (ϕ)ψ(x, y, z) , (7.33)
tenemos (como una ecuación de operadores)
Rz (ϕ + δϕ) − Rz (ϕ)
= −iLz Rz (ϕ) . (7.34)
δϕ
El lado izquierdo es justo dRz (ϕ)/δϕ (para δϕ → 0). En esta forma la ecuación (7.34) se
integra inmediatamente a
Rz (ϕ) = exp(−iϕLz ) . (7.35)
Note cuidadosamente que Rz (ϕ) rota funciones (en el sentido horario) relativa a las coorde-
nadas fijadas y que Lz es la componente z del momento angular orbital L.~ La constante de
integración está fijada por la condición de borde Rz (0) = 1.
Si reconocemos que los elementos de matriz
∂
 
 ∂x 
 
∂ 
Lz = (x, y, z)Sz 
 ∂y  ,
 (7.36)
 
∂
 
∂z
claramente Lx , Ly , Lz satisface la misma relación de conmutación
[Li , Lj ] = iεijk Lk (7.37)
que Sx , Sy , Sz y tienen a la misma constantes de estructura iεijk de SO(3).
Homomorfismo SU(2)-SO(3).
El grupo unitario especial SU(2) de matrices unitarias de 2 × 2 con determinante +1 tiene
las tres matrices de Pauli σi como generadores (mientras que las rotaciones de la ecuación
(7.3) forman un subgrupo abeliano unidimensional). Por lo tanto SU(2) es de orden 3 y
depende de tres parámetros continuos reales ξ, η y ζ los cuales a menudo son llamados los
parámetros de Caley-Klein. Sus elementos generales tienen la forma

eiξ cos η eiζ sen η a b
U2 (ξ, η, ζ) = = . (7.38)
−e−iζ sen η e−iξ cos η −b∗ a∗
Es fácil chequear que el determinante det(U2 ) = 1 y que U†2 U2 = 1 = U2 U†2 se mantiene.

Para obtener los generadores diferenciamos

∂U2 1 0
−i = = σ3 ,
∂ξ ξ=0,η=0 0 −1

−i ∂U2 0 1
= = σ1 , (7.39)
sen η ∂ζ ζ=0 1 0

∂U2 0 i
−i = = σ2 .
∂η ζ=0,η=0 −i 0
Por supuesto, las matrices de Pauli son todas de traza nula y hermı́ticas.
Con las matrices de Pauli como generadores de los elementos (U1 , U2 , U3 ) de SU(2) pueden
ser generados por
U1 = exp(ia1 σ1 /2) , U2 = exp(ia2 σ2 /2) , U3 = exp(ia3 σ3 /2) . (7.40)
Los tres parámetros ai son reales. El factor extra 1/2 está presente en los exponentes ya que
si = σi /2 satisface las mismas relaciones de conmutación 4
[si , sj ] = iεijk sk (7.41)
como el momento angular en la ecuación (7.37).
La ecuación (7.3) da un operador de rotación para rotar las coordenadas cartesianas en el
espacio tridimensional. Usando la matriz de momento angular s3 , tenemos el correspondiente
operador de rotación en el espacio de dos dimensiones (complejo) Rz (ϕ) = exp(iϕσ3 /2).
Para rotar una función de onda vectorial de dos componentes (spinor) o una partı́cula de
spin 1/2 relativa a coordenadas fijas, el operador de rotación es Rz (ϕ) = exp(−iϕσ3 /2) de
acuerdo a la ecuación (7.35).
Usando la ecuación (7.40) la identidad de Euler, la ecuación (6.161), obtenemos
a a
j j
Uj = cos + iσj sen .
2 2
Aquı́ el parámetro aj aparece como un ángulo, el coeficiente de una matriz tipo momento
angular ϕ en la ecuación (7.26). Con esta identificación de los exponenciales, la forma general
de la matriz SU(2) (para rotar funciones más que las coordenadas) podrı́a ser escrita como
U(α, β, γ) = exp(−iγσ3 /2) exp(−iβσ2 /2) exp(−iασ1 /2) .
Como vimos, los elementos de SU(2) describen rotaciones en un espacio complejo bidi-
mensional que deja invariante a |z1 |2 + |z2 |2 . El determinante es +1. Hay tres parámetros
independientes. Nuestro grupo ortogonal real SO(3) de determinante +1, claramente descri-
be rotaciones comunes en el espacio tridimensional con la importante caracterı́stica de dejar
invariante a x2 + y 2 + z 2 . También hay tres parámetros independientes. Las interpretaciones
de rotación y la igualdad de números de parámetros sugiere la existencia de alguna clase de
correspondencia entre los grupos SU(2) y SO(3). Aquı́ desarrollamos esta correspondencia.
4
Las constantes de estructuras (iεijk ) conducen a las representaciones de SU(2) de dimensión 2J = 1
para generadores de dimensión 2j + 1, con J = 0, 1/2, 1, . . .. Los casos con J entero también conducen a las
representaciones de SO(3).
M
M’
U
Figura 7.2: Ilustración de M0 = UMU† ecuación (7.42).
La operación SU(2) sobre una matriz está dada por una transformación unitaria, la ecua-
ción (7.5), con R = U y la figura (7.2)
M0 = UMU† . (7.42)
Tomando M como una matriz de 2 × 2, notemos que cualquier matriz de 2 × 2 puede ser
escrita como una combinación lineal de la matriz unidad y las tres matrices de Pauli. Sea M
la matriz de traza cero,

z x − iy
M = xσ1 + yσ2 + zσ3 = , (7.43)
x + iy −z
la matriz unidad no entra. Ya que la traza es invariante bajo transformaciones unitarias, M0

deberı́a tener la misma forma,
z0 x0 − iy 0

0 0 0
M = x σ1 + y σ2 + z σ3 = . (7.44)
x0 + iy 0 −z 0
El determinante también es invariante bajo una transformación unitaria. Por lo tanto

2 2 2
− (x2 + y 2 + z 2 ) = −(x0 + y 0 + z 0 ) , (7.45)
o (x2 + y 2 + z 2 ) es invariante bajo esta operación de SU(2), como con SO(3). SU(2) debe,
por lo tanto, describir una rotación. Esto sugiere que SU(2) y SO(3) pueden ser isomórficos
o homomórficos.
Aproximemos el problema de qué rotación describe SU(2) considerando casos especiales.
Retomando la ecuación (7.38) sea a = eiξ y b = 0, o

eiξ 0
Uz = . (7.46)
0 e−iξ
En anticipación de la ecuación (7.50), esta U le está dado un subı́ndice z.

Realizando una transformación unitaria sobre cada una de las tres matrices de Pauli,
tenemos
iξ −iξ
† e 0 0 1 e 0
Uz σ1 Uz =
0 e−iξ 1 0 0 eiξ
(7.47)
0 e2iξ
= −2iξ .
e 0
Reexpresamos este resultado en términos de las matrices de Pauli para obtener
Uz xσ1 U†z = x cos 2ξσ1 − x sen 2ξσ2 . (7.48)
Similarmente,
Uz yσ2 U†z = y sen 2ξσ1 − y cos 2ξσ2 ,
(7.49)
Uz zσ3 U†z = zσ3 .
A partir de esta expresión de doble ángulo vemos que podrı́amos comenzar con el ángulo
medio: ξ = α/2. Entonces, de las ecuaciones (7.42)–(7.44), (7.48) y (7.49),
x0 = x cos α + y sen α
y 0 = −x sen α + y cos α (7.50)
z0 = z .
La transformación unitaria de 2 × 2 usando Uz (α/2) es equivalente al operador de rotación
R(α) de la ecuación (7.3).
El establecimiento de la correspondencia de

cos β/2 sen β/2
Uy (β/2) = (7.51)
− sen β/2 cos β/2
y Ry (β) y de
cos ϕ/2 i sen ϕ/2
Ux (ϕ/2) = (7.52)
i sen ϕ/2 cos ϕ/2
y Rx (ϕ) pueden calcularse como ejercicio. Podemos notar que Uk (ψ/2) tiene la forma general
Uk (ψ/2) = 1 cos ψ/2 + iσk sen ψ/2 , (7.53)
donde k = x, y, z.
La correspondencia
 
α iα/2
cos α sen α 0
e 0
Uz = −iα/2 ↔  − sin α cos α 0 = Rz (α) , (7.54)
2 0 e
0 0 1
no es una simple correspondencia uno a uno. Especı́ficamente, como α en Rz recorre desde 0
a 2π, el parámetro Uz , α/2, recorre desde 0 a π . Encontramos que
Rz (α + 2π) = Rz (α)
(7.55)
iα/2
−e 0
Uz (α/2 + π) = = −Uz (α/2) .
0 −e−iα/2
Por lo tanto ambos Uz (α/2) y Uz (α/2+π) = −Uz (α/2) corresponde a Rz (α). La corresponden-
cia es de 2 a 1, o SU(2) y SO(3) son homomórficos. Este establecimiento de la correspondencia
entre las representaciones de SU(2) y de aquella SO(3) significa que las representaciones cono-
cidas de SU(2) automáticamente nos proporciona de las representaciones de SO(3).
Combinando las rotaciones, encontramos que una transformación unitaria usada
U(α, β, γ) = Uz (γ/2)Uy (β/2)Uz (α/2) , (7.56)
corresponde a la rotación general de Euler Rz (γ)Ry (β)Rz (α). Por multiplicación directa,
iγ/2 iα/2
e 0 cos β/2 sen β/2 e 0
U(α, β, γ) =
0 e−iγ/2 − sen β/2 cos β/2 0 e−iα/2
(7.57)
ei(γ+α)/2 cos β/2 ei(γ−α)/2 sen β/2
= .
−e−i(γ−α)/2 sen β/2 e−i(γ+α)/2 cos β/2
Esta es nuestra forma general alternativa, la ecuación (7.38), con
(γ + α) β (γ − α)
ε= , η= , ζ= . (7.58)
2 2 2
De la ecuación (7.57) podemos identificar los parámetros de la ecuación (7.38) como
a = ei(γ+α)/2 cos β/2

(7.59)
b = ei(γ−α)/2 sen β/2
SU(2) isospin y el octeto SU(3).

En el tratamiento de las partı́culas con interacciones fuertes de Fı́sica nuclear y de altas
energı́as que conducen al grupo de SU(2) de isospin y la simetrı́a de sabor SU(3), podrı́amos
mirar el momento angular y el grupo de rotación SO(3) por una analogı́a. Supongamos que
tenemos un electrón en un potencial atractivo esféricamente simétrico de algún núcleo atómi-
co. La función de onda para el electrón puede ser caracterizada por tres números cuánticos
n, l, m, que están relacionados con los autovalores de los operadores conservados H, L2 , Lz .
La energı́a, 5 sin embargo, es 2l + 1 veces degenerada, dependiendo solamente de n y l. La
razón para esta degeneración puede ser expresado de dos maneras equivalentes:
1. El potencial es simétricamente esférico, independiente de θ, ϕ.
2. El hamiltoniano de Schrodinger −(~2 /2me )∇2 + V (r) es invariante bajo rotaciones

espaciales ordinarias SO(3).
Como una consecuencia de la simetrı́a esférica del potencial V (r), el momento angular
~ es conservado. En la sección 7.2 las componentes cartesianas de L
orbital L ~ están indentifi-
cadas como los generadores del grupo de rotación SO(3). En vez de representar Lx , Ly , Lz
por operadores, usaremos matrices. Las matrices Li son matrices (2l + 1) × (2l + 1) con la
5
Para un potencial de Coulomb puro la energı́a depende sólo de n.
misma dimensión del número de estados degenerados. La dimensión 2l + 1 está identificada

con los estados degenerados 2l + 1.
Esta degeneranción es removida por un campo magnético B, ~ hecho conocido como el
efecto Zeeman. Esta interacción magnética añade un término al Hamiltoniano que no es
invariante bajo SO(3). Este es un término quiebra la simetrı́a.
En el caso de partı́culas con interacción fuerte (protones, neutrones, etc.) no podemos
seguir la analogı́a directamente, ya que todavı́a no entendemos completamente las interaccio-
nes nucleares. La fuerza fuerte está descrita por la teorı́a gauge de Yang-Mills basada sobre
la simetrı́a de color SU(3) llamada cromodinámica cuántica o abreviada QCD. Sin embargo,
QCD es una teorı́a no lineal y por lo tanto complicada a grandes distancias y baja energı́a
que permanece no resuelta. Por lo tanto, no conocemos el Hamiltoniano, en vez de esto,
volveremos a la analogı́a.
En los años 1930, después del descubrimiento del neutrón, Heinsenberg propuso que las
fuerzas nucleares eran cargas independientes. Los neutrones difieren en masa de los protones
solamente en un 1.6 %. Si esta pequeña diferencia es ignorada, el neutrón y el protón podrı́an
ser consideradas como dos estados de cargas (o isospin) de un doblete, llamado nucleón. El
isospin I tiene proyección en el eje z I3 = 1/2 para el protón y I3 = −1/2 para el neutrón. El
isospin no tiene nada que ver con el spin (el momento angular intrı́nseco de una partı́cula) pero
las dos componentes del estado de isospin obedece las mismas relaciones matemáticas que el
estado de spin 1/2. Para el nucleón, I = τ /2, son las matrices usuales
de Pauli y los estados
1 0
de isospin (±1/2) son autovectores de la matriz de Pauli τ3 = . Similarmente, los
0 −1
tres estados de carga del pión π + , π 0 , π − forman un triplete. El pión es la partı́cula más
liviana con interacción fuerte y es la mediadora de la fuerza nuclear a distancia, como el fotón
es partı́cula que media la fuerza electromagnética. La interacción fuerte trata igualmente a
miembros de esa familia de partı́culas, o multipletes y conserva el isospin. La simetrı́a es el
grupo isospin SU(2).
El octuplete mostrado en la tabla 7.1 llama la atención 6 . Los números cuánticos conser-
vados que son análogos y generalizaciones de Lz y L2 de SO(3) son I3 e I 2 para el isospin, e
Y para hipercarga. Las partı́culas pueden ser agrupadas dentro de multipletes de carga o de
isospin. Entonces la hipercarga puede ser tomada como dos veces el promedio de carga del
1
multiplete. Para el nucleón, i.e., el doblete neutrón–protón, Y = 2 · (0 + 1) = 1. Los valores
2
de la hipercarga y los del isospin son listados en la tabla 7.1 para bariones como el nucleón y
sus compañeros (aproximadamente degenerados). Ellos forman un octeto como lo muestra la
figura 7.3. En 1961 Gell-Mann, e independientemente Ne’eman, sugirieron que la interacción
fuerte debe ser (aproximadamente) invariante bajo un grupo espacial tridimensional unitario,
SU(3), esto es, tienen simetrı́a de sabor SU(3).
La elección de SU(3) estuvo basada primero sobre los dos números cuánticos conservados
e independientes H1 = I3 y H2 = Y (i.e., generados con [I3 , Y ] = 0), que llaman para un
grupo de rango 2. Segundo, el grupo ha tenido una representación de ocho dimensiones para
tener en cuenta los cercanamente degenerados bariones y cuatro octetos similares para los
mesones. En un sentido SU(3) es la generalización más simple del isospin SU(2). Tres de sus
generadores son matrices hermı́ticas de 3 × 3 de traza nula que contienen las matrices de
6
Todas las masas están dadas en unidades de energı́a.
Masa [MeV] Y I I3
Ξ− 1321.32 − 12
1
Ξ -1 2
Ξ 0
1314.9 + 12
Σ− 1197.43 -1
Σ Σ0 1192.55 0 1 0
Σ+ 1189.37 +1
Λ Λ 1115.63 0 0 0
n 939.566 − 12
1
N 1 2
p 938.272 + 12
1
Cuadro 7.1: Bariones con spin 2
y paridad par
n p
1
Σ
−
Σ0 Λ Σ+
I3
−1 −½ 0 +½ 1
Ξ− Ξ0
−1
Figura 7.3: Octeto bariónico diagrama de peso para SU(3).
Pauli de 2 × 2 para los isospin τi en la esquina superior izquierda.
 
τi 0
λi =  0 , i = 1, 2, 3 . (7.60)
0 0 0
De este modo, el grupo del isospin SU(2) es un subgrupo de SU(3) con I3 = λ3 /2. Otros
cuatro generadores tienen los no diagonales 1 de τ1 e i, −i de τ2 en todas las otras posibles
ubicaciones para formar las matrices hermı́ticas 3 × 3 de traza nula.
   
0 0 1 0 0 −i
λ4 = 0 0 0 , λ5 = 0 0 0  ,
1 0 0 i 0 0
    (7.61)
0 0 0 0 0 0
λ6 = 0 0 1 , λ7 = 0 0 −i .
0 1 0 0 i 0
El segundo generador diagonal tiene la matriz unidad bidimensional 12 en la esquina superior

izquierda, la cual la hace claramente independiente del subgrupo SU(2) isospin ya que su traza
no nula en el subespacio, y -2 en el lugar de la tercera diagonal la hace traza nula,
 
1 0 0
1
λ8 = √ 0 1 0 . (7.62)
3 0 0 −2
Generalmente hay 32 − 1 = 8 generadores para SU(3) el cual tiene orden 8. De los con-
mutadores de esos generadores pueden obtenerse fácilmente las constantes de estructura de
SU(3).
Volviendo a la simetrı́a de sabor SU(3) imaginemos que el Hamiltoniano para nuestro
octeto de bariones están compuesto de tres partes
H = Hfuerte + Hmedio + Helectromagnético . (7.63)
La primera parte, Hfuerte , tiene la simetrı́a SU(3) y conduce a la degeneranción ocho. La

introducción del término de quiebre de simetrı́a, Hmedio , remueve parte de la degeneración
dando los cuatro multipletes del isospin (Ξ− , Ξ0 ), (Σ− , Σ0 , Σ+ ), Λ, y N = (p, n) con diferentes
masas. Estos aún son multipletes ya que Hmedio tiene la simetrı́a del isospin SU(2). Final-
mente, la presencia de fuerzas dependientes de la carga separan los multipletes de isospin y
remueve la útima degeneración. Esta secuencia se muestra en la figura 7.4
Aplicando teorı́a de perturbación de primer orden de Mecánica Cuántica, relaciones sim-
ples de masas de bariónicas pueden ser calculadas. Quizás el suceso más espectacular de este
modelo SU(3) ha sido su predicción de nuevas partı́culas. En 1961 cuatro mesones K y tres
π (todos pseudoescalares; spin 0, paridad impar) sugieren otro octeto, similar al del octeto
bariónico. SU(3) predice un octavo mesón η, de masa 563 MeV. El mesón η con una masa
determinada experimentalmente de 548 MeV fue encontrado poco después. Agrupamientos
de nueve de los bariones más pesados (todos con spin 3/2, con paridad par) sugirió un mul-
tiplete de 10 miembros o un decaplete de SU(3). El décimo barión faltante fue predicho con
una masa cercana a 1680 MeV y una carga negativa. En 1964 Ω− cargada negativamente con
masa (1675±12) MeV fue descubierta.
La representación de octeto no es la más simple para SU(3). La representación más simple
son triangulares como se muestra en la figura 7.5 a partir de las cuales todas las otras
pueden ser generadas por acoplamiento del momento angular generalizado. La representación
Ξ
−
Ξ
masa Ξ0
Σ
−
Σ
Σ0
Σ+
Λ Λ
n
N
p
H fuerte H fuerte + H medio H fuerte + H medio+ H electromagnética
Figura 7.4: Separación de masa bariónica.
(a) Y (b) Y
_
s 2/3
d 1/3 u
−½ +½ I3
−½ +½ I3
_ −1 / 3 _
−2 / 3 u d
s
Figura 7.5: Separación de masa bariónica.
fundamental en la figura 7.5 (a) contiene los quark u (arriba) y d (abajo) y el s (extrañeza),
y figura 7.5 (b) los correspondientes antiquarks. Ya que los octetos de mesones pueden ser
obtenidos a partir de la representación de quark como pares q q̄, 32 = 8 + 1, esto sugiere que
los mesones contienen quarks (y antiquarks) como sus constituyentes. El modelo de quarks
resultante dan una exitosa descripción de la espectroscopı́a hadrónica. La solución de sus
problemas con el principio de exclusión de Pauli eventualmente conduce a la teorı́a de gauge
de SU(3)-color de las interacciones fuertes llamada cromodinámica cuántica o QCD.
Para mantener la teorı́a de grupo en su real perspectiva, podrı́amos enfatizar que la teorı́a
de grupo identifica y formaliza las simetrı́as. Ella clasifica partı́culas (y algunas veces predice).
Pero a parte de decir que una parte del hamiltoniano tiene simetrı́a SU(2) y otra parte tiene
simetrı́a SU(3), la teorı́a de grupo no dice nada a cerca de la interacción de las partı́culas.
Recuerde que la afirmación de que el potencial atómico es esféricamente simétrico no nos dice
nada a cerca de la dependencia radial del portencial o de su función de onda. En contraste, en
una teorı́a de gauge la interacción es mediada por bosones vectoriales (como el fotón media en
la electrodinámica cuántica) y determinado únicamente por la derivada covariante de gauge.
7.3. Momento angular orbital.

El concepto clásico de momento angular L ~ clásico = ~r × p~ es mostrado en el capı́tulo de
vectores para presentar el producto cruz. Siguiendo con la representación usual de Schrödinger
de la Mecánica Cuántica, el momento lineal clásico p~ es reemplazado por el operador −i∇. ~
7
El operador de momento angular en la mecánica cuántica se convierte en
~ QM = −i~r × ∇
L ~ . (7.64)
Las componentes del momento angular satisfacen las relaciones de conmutación
[Li , Lj ] = iεijk Lk . (7.65)
El εijk es el sı́mbolo de Levi-Civita. Una suma sobre el ı́ndice k es sobreentendida.

El operador diferencial correspondiente al cuadrado del momento angular
~2=L
L ~ ·L
~ = L2x + L2y + L2z , (7.66)
puede ser determinado a partir de
~ ·L
L ~ = (~r × p~) · (~r × p~) , (7.67)
la cual puede verificarse como ejercicio. Ya que L ~ 2 es un escalar rotacional, [L

~ 2 , Li ] = 0, el
cual también puede ser verificado directamente.
La ecuación (7.65) presenta las relaciones de conmutación básicas de los componentes del
momento angular en Mecánica Cuántica. Por cierto, dentro del marco de la Mecánica Cuánti-
ca y la teorı́a de grupo, estas relaciones de conmutación definen un operador de momento
angular.
Acercamiento a los operadores de subida y bajada.

Comencemos con una aproximación más general, donde el momento angular J~ lo consi-
~ un spin σ/2, o un momento
deramos que puede representar un momento angular orbital L,
~ + σ/2, etc. Supongamos que
angular total L
1. J es un operador hermı́tico cuyas componentes satisfacen las relaciones de conmutación
[Ji , Jj ] = iεijk Jk , [J~ 2 , Ji ] = 0 . (7.68)

7
Por simplicidad, ~ = 1. Esto significa que el momento angular es medido en unidades de ~.
7.3. MOMENTO ANGULAR ORBITAL. 163
2. |λM i es simultaneamente una autofunción normalizada (o autovector) de Jz con auto-

valor M y una autofunción de J~ 2 ,
Jz |λM i = M |λM i , J~ 2 |λM i = λ|λM i . (7.69)
Mostraremos ahora que λ = J(J + 1). Este tratamiento ilustrará la generalidad y potencia
de las técnicas de operadores particularmente el uso de operadores de subida y bajada.
Un operador de subida o bajada se defina como
J+ = Jx + iJy , J− = Jx − iJy . (7.70)
En términos de ese operador J~ 2 puede ser reeescrito como

1
J~ 2 = (J+ J− + J− J+ ) + Jz2 . (7.71)
2
A partir de las relaciones de conmutación, encontramos que
[Jz , J+ ] = +J+ , [Jz , J− ] = −J− , [J+ , J− ] = 2Jz . (7.72)
Ya que J+ conmuta con J~ 2 , hagalo como ejercicio
J~ 2 (J+ |λM i) = J+ (J~ 2 |λM i) = λ(J+ |λM i) . (7.73)
Por lo tanto, J+ |λM i todavı́a es una autofunción de J~ 2 con autovalores λ, y similarmente

para J− |λM i. Pero de la ecuación (7.72)
Jz J+ = J+ (Jz + 1) , (7.74)
o
Jz (J+ |λM i) = J+ (Jz + 1)|λM i = (M + 1)(J+ |λM i) . (7.75)
Por lo tanto, J+ |λM i todavı́a es una autofunción de Jz con autovalores M +1. J+ ha elevado el
autovalor en 1 y por eso es llamado operador de subida. Similarmente, J− baja los autovalores
en 1 y a menudo es llamado operador de bajada.
Tomando los valores esperados y usando Jx† = Jx , Jy† = Jy ,
hλM |J~ 2 − Jz2 |λM i = hλM |Jx2 + Jy2 |λM i = | Jx |λM i |2 + | Jy |λM i |2 ,
vemos que λ − M 2 ≥ 0, tal que M es ligado. Sea J el más grande valor de M . Luego
J+ |λJi = 0, lo cual implica que J− J+ |λJi = 0. Luego combinando las ecuaciones (7.71) y
(7.72) obtenemos
J~ 2 = J− J+ + Jz (Jz + 1) , (7.76)
encontramos que a partir de la ecuación (7.76)
0 = J− J+ |λM = Ji = (J~ 2 − Jz2 − Jz )|λM = Ji = (λ − J 2 − J)|λM = Ji .
Por lo tanto
λ = J(J + 1) ≥ 0; (7.77)
con un J no negativo. Ahora reetiquetaremos los estados |λM i = |JM i. Similarmente, sea
J 0 el más pequeño de los M . Entonces J− |JJ 0 i = 0. A partir de
J~ 2 = J+ J− − Jz (Jz + 1) , (7.78)
vemos que
2
0 = J+ J− |JJ 0 i = (J~ 2 + Jz − Jz2 )|JJ 0 i = (λ + J 0 − J 0 )|JJ 0 i . (7.79)
De manera que
λ = J(J + 1) = J 0 (J 0 − 1) = (−J)(−J − 1) .
Ası́ J 0 = −J, y M corre en pasos enteros desde −J a +J,
− J ≤ M ≤ +J . (7.80)
Comenzando desde |JJi y aplicando J− repetidas veces, alcanzaremos todos los otros estados
|JM i. De manera que |JM i forma una representación irreductible; M varı́a y J está fijo.
Entonces usando las ecuaciones (7.68), (7.76) y (7.78) obtenemos
J− J+ |JM i = [J(J + 1) − M (M + 1)]|JM i = (J − M )(J + M + 1)|JM i ,

(7.81)
J+ J− |JM i = [J(J + 1) − M (M − 1)]|JM i = (J + M )(J − M + 1)|JM i .
Como J+ y J− son hermı́ticos conjugados,
J+† = J− , J−† = J+ , (7.82)
los autovalores o valores esperados en la ecuación (7.81) deberı́an ser positivos o cero.
Ya que J+ aumenta el autovalor de M a M + 1, reetiquetaremos la autofunción resultante
|JM + 1i. La normalización está dada por la ecuación (7.81) como
p
J+ |JM i = (J − M )(J + M + 1)|JM + 1i , (7.83)
tomando la raı́z cuadrada positiva y no introduciendo ningún factor de fase. Por los mismos
argumentos p
J− |JM i = (J + M )(J − M + 1)|JM − 1i . (7.84)
Finalmente, ya que M va desde −J a +J en pasos unitarios, 2J deberı́a ser un número
entero. J es por lo tanto un entero o la mitad de un entero impar. Como hemos visto, el
momento angular orbital está descrito con J entero. A partir de los spin de algunas partı́culas
fundamentales y de algunos núcleos, tenemos que J = 1/2, 3/2, 5/2, . . . Nuestro momento
angular está cuántizado esencialmente como un resultado de relaciones de conmutaciones.
En coordenadas polares esféricas θ, ϕ las funciones hθ, ϕ|lmi = Ylm (θ, ϕ) son armónicos
esféricos.
Resumen de grupos y álgebras de Lie.

Las relaciones de conmutaciones generales, ecuación (7.14) en la sección 7.2, para un
grupo de Lie clásico [SO(n) y SU(n) en particular] pueden ser simplificadas para verse más
como la ecuación (7.72) para SO(3) y SU(2) en la sección 7.3.
7.3. MOMENTO ANGULAR ORBITAL. 165
Álgebra de Lie Al Bl Dl
Grupo de Lie SU(l+1) SO(2l+1) SO(2l)
rango l l l
orden l(l+2) l(2l+1) l(2l-1)
Cuadro 7.2: Rango y orden de grupos rotacionales y unitarios.
Primero escogemos generadores Hi que sean linealmente independientes y que conmuten

entre sı́, estos son generalizaciones de Jz de SO(3) y SU(2). Sea l el número máximo de tales
Hi con
[Hi , Hk ] = 0 . (7.85)
Entonces l es llamado el rango del grupo Lie G o de su álgebra. El rango y la dimensión u
orden de algunos grupos Lie son dados en la tabla 7.2. Todos los otros generadores Eα puede
mostrarse que son operadores de subida y bajada con respecto a todos los Hi , tal que
[Hi , Eα ] = αi Eα . (7.86)
El conjunto de los (α1 , α2 , . . . , αl ) son llamados los vectores raices.

Ya que los Hi conmutan entre sı́, ellos pueden ser diagonalizados simultáneamente. Ellos
nos dan un conjunto de autovalores m1 , m2 , . . . , ml . Al conjunto (m1 , m2 , . . . ..ml ) se les llama
vectores de peso de una representación irreductible. Hay l operadores invariantes Ci , llamados
operadores de Casimir, los cuales conmutan con todos los generadores y son generalizaciones
de J 2 ,
[Ci , Hj ] = 0 , [Ci , Eα ] = 0 . (7.87)
El primero, C1 , es una función cuadrática de los generadores, los otros son más complicados.
Ya que Ci conmuta con todos los Hj , ellos pueden ser diagonalizados simultáneamente con
los Hj . Sus autovalores c1 , c2 , . . . , cl caracterizan las representaciones irreductibles y perme-
necen constantes mientras los vectores de peso varı́an sobre una representación irreductible
particular. Por lo tanto, la autofunción general puede ser escrita como
|(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml i , (7.88)
generalizando |JM i de SO(3) y SU(2). Sus ecuaciones de autovalores son
Hi |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml i = mi |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml i , (7.89a)

Ci |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml i = ci |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml i . (7.89b)
Ahora podemos mostrar que Eα |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml i tiene los vector peso (m1 +
α1 , m2 +α2 , . . . , ml +αl ) usando las relaciones de conmutación, la ecuación (7.86), en conjunto
con las ecuaciones (7.89a) y (7.89b),
Hi Eα |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml i = (Eα Hi + [Hi , Eα ])|(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml i

= (mi + αi )Eα |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml i .
(7.90)
Por lo tanto
Eα |(c1 , c2 , . . . , cl )m1 , m2 , . . . , ml i ∼ |(c1 , c2 , . . . , cl )m1 + α1 , m2 + α2 , . . . , ml + αl i
estas son las generalizaciones de las ecuaciones (7.83) y (7.84) a partir de SO(3). Esos cambios
de autovalores por el operador Eα son llamados sus reglas de selección en mecánica cuántica.
7.4. Grupo homogéneo de Lorentz.

En relatividad especial requerimos que nuestras leyes fı́sicas sean covariantes8 bajo
a. traslaciones en el tiempo y en el espacio,
b. rotaciones en el espacio real tridimensional, y
c. transformaciones de Lorentz.
El requerimiento para la covarianza bajo traslaciones está basada en la homogeneidad del
espacio y el tiempo. Covarianza bajo rotaciones es una afirmación de la isotropı́a del espacio.
El requerimiento de la covarianza de Lorentz viene de la relatividad especial. Todas estas
tres transformaciones en conjunto forman el grupo inhomogeneo de Lorentz o el grupo de
Poincaré. Aquı́ excluı́mos las traslaciones. Las rotaciones espaciales y las transformaciones
de Lorentz forman un grupo, el grupo homogéneo ed Lorentz.
Primero generamos un subgrupo, las transformaciones de Lorentz en el cual la velocidad
relativa ~v está a lo largo del eje x = x1 . El generador puede ser determinad considerando un
marco de referencia espacio-temporal moviendose con una velocidad relativa infinitesimal δv.
Las relaciones son similares a aquellas para rotaciones en el espacio real, excepto que aquı́ el
ángulo de rotación es imaginario puro.
Las transformaciones de Lorentz son lineales no sólo en el espacio de coordenadas xi
si no que también en el tiempo t. Ellas se originan a partir de las ecuaciones de Maxwell
de la electrodinámica las cuales son invariantes bajo la transformaciones de Lorentz, como
veremos luego. Las transformaciones de Lorentz dejan invariante la forma cuadrática siguiente
c2 t2 − x21 − x22 − x23 = x20 − x21 − x22 − x23 donde x0 = ct. Vemos esto si encendemos una fuente
de luzpen Pel2origen del 2sistema de coordenadas. En tiempo t la luz ha viajado una distancia
ct = xi , tal que c t − x1 − x22 − x23 = 0. La relatividad especial requiere esto en todos
2 2
los sistemas (inercial) que se mueven con velocidad v ≤ c en cualquier dirección relativa
al sistema xi y que tengan el mismo origen a tiempo t = 0, se mantenga también que
c2 t0 2 − x01 2 − x02 2 − x03 2 = 0. El espacio cuadridimensional con la métrica x20 − x21 − x22 − x23 es
llamado espacio de Minkowski con el producto escalar de dos cuadrivectores definido como
a · b = a0 b0 − ~a · ~b. Usando el tensor métrico
 
1 0 0 0
0 −1 0 0
(gµν ) = (g µν ) = 
0 0 −1 0  ,
 (7.91)
0 0 0 −1
8
Ser covariante significa que tienen la misma forma en diferentes sistemas de coordenadas tal que no hay
un sistema de referencia privilegiado.
7.4. GRUPO HOMOGÉNEO DE LORENTZ. 167
podemos subir y bajar ı́ndices de un cuadrivector tal como de las coordenadas xµ = (x0 , ~x)
es decir xµ = gµν xν = (x0 , −~x) y xµ gµν xν = x20 − ~x 2 , la conveción de suma de Einstein se
dan por entendida. Para el gradiente ∂ µ = (∂/∂x0 , −∇) ~ = ∂/∂xµ y ∂µ = (∂/∂x0 , ∇) ~ tal que
2 2 2 2 2 2
∂ = ∂ /∂x0 − ∇ es un escalar de Lorentz, al igual que la métrica x0 − ~x .
Para v c, en el lı́mite no relativista, las transformaciones de Lorentz deben ser trans-
formaciones de Galileo. Por lo tanto, para derivar la forma de una transformación de Lorentz
a lo largo del eje x1 , partimos con una transformación Galileana para una velocidad relativa
infinitesimal δv:
x01 = x1 − δvt = x1 − x0 δβ . (7.92)
v
Como es usual β = . Por simetrı́a también podemos escribir
c
x00 = x0 − ax1 δβ , (7.93)
donde a es un parámetro a fijar una vez que se imponga que x20 − x21 deba ser invariante,
2 2
x00 − x01 = x20 − x21 . (7.94)
Recordemos que x = (x0 ; x1 , x2 , x3 ) es el prototipo de cuadrivector en el espacio de Minkowski.

Ası́ la ecuación (7.94) es simplemente una afirmación de la invariancia del cuadrado de la
magnitud del vector distancia bajo rotaciones en el espacio de Minkowski. Aquı́ es donde la
relatividad especial compromete nuestra trasnformación. Elevando al cuadrado y restando
las ecuaciones (7.92) y (7.93) y descartando términos del orden de δβ 2 , encontramos a = −1.
Las ecuaciones (7.92) y (7.93) pueden ser combinadas como una ecuación matricial
0
x0 x
0 = (1 − δβσ1 ) 0 , (7.95)
x1 x1
σ1 es la matriz de Pauli, y el parámetro δβ representa un cambio infinetesimal. Repetimos la

transformación N veces para desarrollar una transformación finita con el parámetro velocidad
ρ = N δβ. entonces 0
x0 ρσ1 N x0
= 1− . (7.96)
x01 N x1
En el lı́mite N → ∞ ρσ1 N
lı́m 1 − = exp(−ρσ1 ) . (7.97)
N →∞ N
Interpretamos la exponencial como una serie de Maclaurin
(ρσ1 )2 (ρσ1 )3
exp(−ρσ1 ) = 1 − ρσ1 + − + ··· . (7.98)
2! 3!
Notando que σ 2 = 1,
exp(−ρσ1 ) = 1 cosh ρ + σ1 senh ρ . (7.99)
Por lo tanto nuestra transformación de Lorentz finita es
0
x0 cosh ρ − senh ρ x0
0 = . (7.100)
x1 − senh ρ cosh ρ x1
σ1 ha generado las representaciones de esta especial transformación de Lorentz.

El cosh ρ y el senh ρ pueden ser identificados considerando el origen del sistema de coor-
denadas primas, x01 = 0, o x1 = vt. Sustituyendo en la ecuación (7.100), tenemos
0 = x1 cosh ρ − x0 senh ρ . (7.101)
Con x1 = vt y x0 = ct.
v
tanh ρ = β = .
c
v
Note que la rapidez ρ 6= excepto en el lı́mite v → 0.
c
Usando 1 − tanh2 ρ = (cosh2 ρ)−1 ,
cosh ρ = (1 − β 2 )−1/2 ≡ γ , senh ρ = βγ . (7.102)
El anterior caso especial en que la velocidad es paralela a uno de los ejes espaciales es
simple, pero ilustra la velocidad infinitesimal, la técnica de la exponenciación y el generador.
Ahora esta técnica puede ser aplicada para derivar las transformaciones de Lorentz para una
velocidad relativa ~v no paralela a ningún eje. Las matrices dadas por la ecuación (7.100) para
el caso ~v = x̂vx forman un subgrupo. Las matrices en el caso general no lo hacen. El producto
de dos matrices de transformaciones de Lorentz, L(~v1 ) y L(~v2 ), producen una tercera matriz
de transformación L(~v3 ), si las dos velocidades ~v1 y ~v2 son paralelas. La velocidad resultante
v3 está relacionada con v1 y con v2 mediante la regla de adición de velociades de Einstein. Si
~v1 y ~v2 no son paralelas, no existe entonces una relación simple.
7.5. Covarianza de Lorentz de las ecuaciones de Ma-

xwell.
Si una ley fı́sica se mantiene para todas las orientaciones de nuestro (real) espacial sistema
de coordenadas (i.e. es invariante ante rotaciones), los términos de la ecuación deben ser cova-
riantes bajo rotaciones. Esto significa que escribimos las leyes fı́sicas en la forma matemática
escalar=escalar, vector=vector, tensor de segundo rango=tensor de segundo rango, y ası́ su-
cesivamente. Similarmente, si una ley fı́sica se mantiene para todos los sistemas inerciales,
los términos de la ecuación deben ser covariantes bajo transformaciones de Lorentz.
Usando el espacio de Minkowski (x = x1 , y = x2 , z = x3 , ct = x0 ) tenemos un espacio
cuadridimensional cartesiano con métrica gµν . Las transformaciones de Lorentz son lineales
en el espacio y en el tiempo en este espacio real de cuatro dimensiones.
Consideremos las ecuaciones de Maxwell
~
~ ×E
∇ ~ = − ∂B , (7.103a)
∂t
~
~ ×H
∇ ~ = ∂ D + ρ~v , (7.103b)
∂t
~ ~
∇·D =ρ , (7.103c)
~ ·B
∇ ~ =0, (7.103d)
7.5. COVARIANZA DE LORENTZ DE LAS ECUACIONES DE MAXWELL. 169
y las relaciones
~ = ε0 E
D ~ , ~ = µ0 H
B ~ . (7.104)
Todos los sı́mbolos tienen sus significados usuales y hemos supuesto el vacio por simplicidad.
Supongamos que las ecuaciones de Maxwell se mantienen en todos los sistemas inerciales;
esto es , las ecuaciones de Maxwell son consistentes con la relatividad especial. (La covarian-
cia de las ecuaciones de Maxwell bajo transformaciones de Lorentz fue realmente mostrada
por Lorentz y Poincaré antes de que Einstein propusiera su teorı́a de la relatividad espe-
cial). Nuestro objetivo inmediato es reescribir las ecuaciones de Maxwell como ecuaciones
tensoriales en el espacio de Minkowski. Esto hará la covariancia de Lorentz explı́cita.
En términos de los potenciales escalar y vectorial, podemos escribir
~ =∇
B ~ ×A ~,
~ (7.105)
~ = − ∂ A − ∇ϕ
E ~ .
∂t
~ la divergencia de A
La ecuación anterior especifica el rotor de A; ~ no está definida. Po-
demos, y por futuras conveniencias lo hacemos, imponer la siguiente relación sobre el vector
potencial
~ ·A
∇ ~ + ε0 µ0 ∂ϕ = 0 . (7.106)
∂t
Este es conocido como el gauge de Lorentz. Servirá a nuestros propósitos de desacoplar las
~ y para ϕ .
ecuaciones diferenciales para A
Ahora reescribimos las ecuaciones de Maxwell en términos de los potenciales. A partir de
~ ·D
la ecuación (7.103c) para ∇ ~ y (7.105)
~
~ · ∂A = − ρ ,
∇2 ϕ + ∇ (7.107)
∂t ε0
~ ×H
considerando que la ecuación (7.103b) para ∇ ~ y (7.105) y la identidad vectorial para el
rotor del rotor produce
~
∂2A ∂ϕ 1 h~ ~ ~ i ρ~v
~
+ +∇ + 2~
∇∇ · A − ∇ A = . (7.108)
∂t2 ∂t ε 0 µ0 ε0
Usando el gauge de Lorentz, la ecuación (7.106), y la relación ε0 µ0 = 1/c2 , obtenemos
1 ∂2 ~

2
∇ − 2 2 A = −µ0 ρ~v ,
c ∂t
(7.109)
1 ∂2

2 ρ
∇ − 2 2 ϕ=− .
c ∂t ε0
Ahora el operador diferencial
1 ∂2
∇2 − 2 2
= ∂ 2 = −∂ µ ∂µ ,
c ∂t
es un Laplaciano cuadridimensional. Usualmente este operador es llamado el d’Alembertiano

y denotado por 2 . Puede probarse que es un escalar.
Por conveniencia definimos
Ax Az
A1 ≡ = cε0 Ax , A3 ≡ = cε0 Az ,
µ0 c µ0 c
(7.110)
Ay
A2 ≡ = cε0 Ay , A 0 ≡ ε0 ϕ = A . 0
µ0 c
Si ponemos además
ρvx ρvy ρvz
≡ i1 , ≡ i2 , ≡ i3 , ρ ≡ i0 = i0 , (7.111)
c c c
entonces la ecuación (7.109) puede ser escrita de la forma
∂ 2 Aµ = iµ . (7.112)
La ecuación anterior parece una ecuación tensorial, pero eso no basta. Para probar que es una
ecuación tensorial, partimos investigando las propiedades de transformación de la corriente
generalizada iµ .
Ya que un elemento de carga de es una cantidad invariante, tenemos
de = ρdx1 dx2 dx3 , invariante. (7.113)
Vimos que el elemento de volumen cuadridimensional es también un invariante, dx1 dx2 dx3 dx0 ,
comparando estos resultados vemos que la densidad de carga ρ debe transformar de la misma
manera que x0 . Ponemos ρ = i0 con i0 establecida como la componente cero de un cuadri-
vector. Las otras partes de la ecuación (7.111) pueden ser expandidas como
ρvx ρ dx1
i1 = =
c c dt (7.114)
dx 1
= i0 .
dt
Ya que justo mostramos que i0 transforma como dx0 , esto significa que i1 transforma como
dx1 . Con resultados similares para i2 e i3 . tenemos que iλ transforma como dxλ , probando
de esta manera que iλ es un vector, un vector del espacio cuadridimensional de Minkowski.
La ecuación (7.112), la cual deriva directamente de las ecuaciones de Maxwell, suponemos
que se mantiene en todos los sistemas cartesianos. Entonces, por la regla del cuociente Aµ es
también un vector y (7.112) es una legitima ecuación tensorial.
Ahora, devolviendonos, la ecuación (7.105) puede ser escrita
∂Aj ∂A0
ε0 Ej = − + , j = 1, 2, 3,
∂x0 ∂xj
(7.115)
1 ∂Ak ∂Aj
Bi = − , (i, j, k) = (1, 2, 3) ,
µc ∂xj ∂xk
y permutaciones cı́clicas.
Definimos un nuevo tensor

∂Aν ∂Aµ
∂ µ Aν − ∂ ν Aµ = − ≡ F µν = −F νµ (µ, ν = 0, 1, 2, 3)
∂xµ ∂xν
un tensor antisimétrico de segundo rango, ya que Aµ es un vector. Escribamoslo axplı́cita-

mente
   
0 Ex Ey Ez 0 −Ex −Ey −Ez
−Ex 0 −cBz cBy  0 −cBz
 , F µν = ε0 Ex cBy 

Fµν = ε0 
−Ey
 .
cBz 0 −cBx  Ey cBz 0 −cBx 
−Ez −cBy cBx 0 Ez −cBy cBx 0
(7.116)
~ ~
Notemos que en nuestro espacio de Minkowski E y B no son más vectores sino que juntos
forman un tensor de segundo rango. Con este tensor podemos escribir las dos ecuaciones de
Maxwell nohomogeneas (7.103b) y (7.103c) y combinandolas como una ecuación tensorial
∂Fµν
= iµ . (7.117)
∂xν
El lado izquierdo es una divergencia cuadridimensional de un tensor y por lo tanto un vector.

∂F µν
Esto es, por supuesto, equivalente a contraer un tensor de tercer rango . Las ecuaciones
∂xλ
de Maxwell (7.103a) para ∇ ~ ×E ~ y la ecuación (7.103d) para ∇
~ · B pueden ser expresadas en
forma tensorial
∂F23 ∂F31 ∂F12
+ + =0, (7.118)
∂x1 ∂x2 ∂x3
para (7.103d) y tres ecuaciones de la forma
∂F30 ∂F02 ∂F23

− − =0, (7.119)
∂x2 ∂x3 ∂x0
para (7.103a). Una segunda ecuación permutando 120 y una tercera permutando 130.
Ya que
∂F µν
∂ λ F µν = ≡ tλµν ,
∂xλ
es un tensor de tercer rango, las ecuaciones (7.117) y (7.119) pueden ser expresadas por la
ecuación tensorial
tλµν + tνλµ + tµνλ = 0 . (7.120)
En todos los casos anteriores los ı́ndices µ, ν y λ se suponen diferentes.
~ y B.
Transformaciones de Lorentz de E ~
La construcción de las ecuaciones tensoriales (7.118) y (7.120) completan nuestro objetivo

inicial de reescribir las ecuaciones de Maxwell en forma tensorial. Ahora explotamos las
propiedades tensoriales de nuestros cuadrivectores y del tensor F µν .
Para las transformaciones de Lorentz que correspoonden a movimientos a lo largo del eje
z(x3 ) con velocidad v, los “cosenos directores” están dados por
x00 = γ(x0 − βx3 )

(7.121)
x03 = γ(x3 − βx1 ) ,
donde
v
β=
c
y
−1/2
γ = 1 − β2 . (7.122)
Usando las propiedades de transformación tensorial, podemos calcular los campos eléctrico y
magnético en el sistema en movimiento en términos de los valores en el marco de referencias
original. A partir de las ecuaciones (7.116) y (7.121) obtenemos
1 v
Ex0 = p Ex −
By ,
1 − β2 c2
0 1 v (7.123)
Ey = p Ey + 2 Bx ,
1 − β2 c
0
Ez = Ez ,
y
1 v
Bx0 = p Bx +Ey ,
1 − β2 c2
1 v (7.124)
By0 = p By − 2 Ex ,
1 − β2 c
Bz0 = Bz .
Este acoplamiento de E ~ y B
~ es esperado. Consideremos, por ejemplo, el caso de campo
eléctrico nulo en el sistema sin prima
Ex = Ey = Ez = 0 .
Claramente, no habrá fuerza sobre una partı́cula carga estacionaria. Cuando la partı́cula
está en movimiento con una velocidad pequeña ~v a lo largo del eje z un observador sobre la
partı́cula ve campos (ejerciendo una fuerza sobre la partı́cula cargada) dados por
Ex0 = −vBy ,
Ey0 = vBx ,
donde B~ es un campo magnético en el sistema sin primas. Estas ecuaciones pueden ser puestas
en forma vectorial
~ 0 = ~v × B
E ~ , o bien, F~ = q~v × B
~ , (7.125)
~
la cual es usualmente tomada como la definición operacional del campo magnético B.
Invariantes electromagnéticas.
Finalmente, las propiedades tensoriales (o vectorioles) nos permiten construir una multi-
tud de cantidades invariantes. Una de las importantes es el producto escalar de los cuadri-
vectores Aλ y iλ . Tenemos
ρvx ρvy ρvz
Aλ iλ = −cε0 Ax − cε0 Ay − cε0 Az + ε0 ϕρ
c c c (7.126)
~ · J)
= ε0 (ρϕ − A ~ , invariante,
con A~ el usual potencial vector y J~ la densidad de corriente ordinaria. El primer término ρϕ es

el ordinario acoplamiento electroestático con dimensiones de energı́a per unidad de volumen.
En consecuencia nuestro recien construı́do invariante escalar es un densidad de energı́a. La
interacción dinámica del campo y corriente es dado por el producto A ~ · J.
~ Este invariante
Aλ iλ aparece en los Lagrangianos electromagnéticos.
Capı́tulo 8
Series infinitas.
versión final corregida 2.31, 6 de Mayo del 20031
8.1. Conceptos fundamentales

Las series infinitas, literalmente sumas de un número infinito de términos, ocurre fre-
cuentemente tanto en matemáticas pura como aplicada. Ellas podrı́an ser usadas por los
matemáticos puros para definir funciones como una aproximación fundamental a la teorı́a
de funciones, tanto como para calcular valores precisos de constantes y funciones trascen-
dentales. En matemática, en ciencias y en ingenierı́a las series infinitas son ubicuas, es por
ello que aparecen en la evaluación de integrales, en la solución de ecuaciones diferenciales, en
series de Fourier y compite con las representaciones integral para la descripción de funciones
especiales.
Encaramos el problema que significa la suma de un número infinito de términos. La
aproximación usual es por sumas parciales. Si tenemos una sucesión de términos infinitos
u1 , u2 , u3 , u4 , u5 , . . ., definimos la suma parcial i-ésima como
i
X
si = un , (8.1)
n=1
Esta es una suma finita y no ofrece dificultades. Si las sumas parciales si convergen a un
lı́mite (finito) cuando i → ∞,
lı́m si = S , (8.2)
i→∞
La serie infinita ∞
P
n=1 un se dice que es convergente y tiene el valor S. Note cuidadosamente
que nosotros razonablemente y plausiblemente, pero aún arbitrariamente definimos que la
serie infinita es igual a S. Podemos notar que una condición necesaria para esta convergencia
a un lı́mite es que el lı́mn→∞ un = 0. Esta condición, sin embargo, no es suficiente para
garantizar la convergencia. La ecuación (8.2) usualmente está escrita en notación matemática
formal:
La condición para la existencia de un lı́mite S es que para cada ε > 0, haya un
N fijo tal que
| S − si | < ε , para todo i > N .
1
Este capı́tulo está basado en el quinto capı́tulo del libro: Mathematical Methods for Physicists, fourth
175
176 CAPÍTULO 8. SERIES INFINITAS.
Esta condición a menudo derivada del criterio de Cauchy aplicado a las sumas parciales
si . El criterio de Cauchy es:
Una condición necesaria y suficiente para que una sucesión (si ) converja es que
para cada ε > 0 exista un número fijo N tal que
|sj − si | < ε para todos los i, j > N .
Esto significa que la sumas parciales individuales deben mantenerse cercanas

cuando nos movemos lejos en la secuencia.
El criterio de Cauchy puede fácilmente extenderse a sucesiones de funciones. La vemos

en esta forma en la sección 8.5 en la definición de convergencia uniforme y más adelante en
el desarrollo del espacio de Hilbert.
Nuestras sumas parciales si pueden no converger a un lı́mite simple sino que podrı́a oscilar,
como en el caso ∞
X
un = 1 − 1 + 1 − 1 + 1 − · · · + (−1)n − · · · .
n=0
Claramente, si = 1 para i impar pero 0 para i par. No hay convergencia a un lı́mite, y

series tal como estas son llamadas oscilantes.
Para las series
1 + 2 + 3 + ··· + n + ···
tenemos
n(n + 1)
sn =
2
Cuando n → ∞,
lı́m sn = ∞ .
n→∞
Cada vez que las sumas parciales diverjan (tienden a ±∞ ), la serie infinita se dice que
diverge. A menudo el término divergente es extendido para incluir series oscilatorias.
Ya que evaluamos las sumas parciales por aritmética ordinaria, la serie convergente, de-
finida en términos del lı́mite de las sumas parciales, asume una posición de importancia
suprema. Dos ejemplos pueden clarificar la naturaleza de convergencia o divergencia de una
serie y servirá como una base para una investigación más detallada en la próxima sección.
Ejemplo Series geométricas.

La sucesión geométrica, comenzando con a y con una razón r(r >= 0), está dado por
a + ar + ar2 + ar3 + · · · + arn−1 + · · · .
La suma parcial n-ésima está dada por

1 − rn
sn = a (8.3)
1−r
8.1. CONCEPTOS FUNDAMENTALES 177
Tomando el lı́mite cuando n → ∞,

a
lı́m sn = , para r < 1. (8.4)
n→∞ 1−r
De modo que, por definición, la serie geométrica infinita converge para r < 1 y está dada por
∞
X a
arn−1 = . (8.5)
n=1
1−r
Por otra parte, si r ≥ 1, la condición necesaria un → 0 no se satisface y la serie infinita

diverge.
Ejemplo Series armónicas.

Consideremos la serie armónica
∞
X 1 1 1 1
n−1 = 1 + + + + ··· + + ··· . (8.6)
n=1
2 3 4 n
Tenemos que el lı́mn→∞ un = lı́mn→∞ 1/n = 0, pero esto no es suficiente para garantizar la
convergencia. Si agrupamos los términos (no cambiando el orden) como

1 1 1 1 1 1 1 1 1
1+ + + + + + + + + ··· + + ··· , (8.7)
2 3 4 5 6 7 8 9 16
se verá que cada par de paréntesis encierra p términos de la forma

1 1 1 p 1
+ + ··· + > = . (8.8)
p+1 p+2 p+p 2p 2
Formando sumas parciales sumando un grupos entre paréntesis por vez, obtenemos
5
s1 = 1 , s4 > ,
2
3 6
s2 = , s5 > , (8.9)
2 2
4 n+1
s3 > , sn > .
2 2
Las series armónicas consideradas de esta manera ciertamente son divergentes. Una demos-
tración independiente y alternativa de su divergencia aparece en la sección 8.2.
Usando el teorema del binomio, podrı́amos expandir la función (1 + x)−1 :
1
= 1 − x + x2 − x3 + . . . + (−x)n−1 + · · · . (8.10)
1+x
Si tomamos x → 1, la serie se convierte
1 − 1 + 1 − 1 + 1 − 1 + ..., (8.11)
una serie que etiquetamos como oscilatoria anteriormente. Aunque no converge en el sentido
usual, significa que puede ser ligada a su serie. Euler, por ejemplo, asignado un valor de 1/2 a
esta sucesión oscilatoria sobre la base de la correspondencia entre esta serie y la bien definida
función (1 + x)−1 . Desafortunadamente, tal correspondencia entre la serie y la función no es
única y esta aproximación deberá ser redefinida. Otros métodos de asignar un significado a
una serie oscilatoria o divergente, métodos de definir una suma, han sido desarrollados. Otro
ejemplo de generalizar la convergencia lo vemos en las serie asintótica o semi-convergente,
consideradas más adelante.
8.2. Pruebas de Convergencia

Aunque las series no convergentes pueden ser útiles en ciertos casos especiales, usualmente
insistimos, como una materia de conveniencia si no de necesidad, que nuestras series sean
convergentes. Por lo tanto esto llega a ser una materia de extrema importancia para ser
capaz de decir si una serie dada es o no convergente. Desarrollaremos un número de posibles
pruebas, comenzando con una prueba simple pero poco sensible y posteriormente trabajar
con una más complicada pero muy sensible.
Por ahora consideremos una serie de términos positivos, an > 0, posponiendo los términos
negativos hasta la próxima sección.
8.2.1. Pruebas de comparación.

P una serie de términos un ≤ an , en el cual los an forman una serie
Si término a término
convergente, las series n un también es convergente. Simbólicamente, tenemos
X
an = a1 + a2 + a3 + · · · , convergente,
n
X
un = u1 + u2 + u3 + · · · .
n
P P P
Si un ≤ an para todo n, luego n un ≤ n an y n un por lo tanto es convergente.
P es una serie de términos vn ≥ bn , en el cual bn forma una serie
Si término a término
divergente, las series n vn también es divergente. Note que las comparaciones de un con bn
o vn con an no dan información. Aquı́ tenemos
X
bn = b1 + b2 + b3 + · · · , divergente,
n
X
vn = v1 + v2 + v3 + · · · .
n
P P P
Si vn ≥ bn para todo n, luego n vn ≥ n bn y n vn por lo tanto es divergente.
Para las series convergente an tenemos las series geométricas, mientras las series armónicas
servirán como las series divergentes bn . En tanto otras series son identificadas como conver-
gentes o divergentes, ellas pueden ser usadas como las series conocidas en estas pruebas de
comparación.
8.2. PRUEBAS DE CONVERGENCIA 179
Raíz de Cauchy Kummer, an Integral de

Euler Maclaurin
(Comparación con las (Comparación con
series geométricas) la integral)
an = 1 an= n
Razón de D’Alembert
Raabe
Cauchy
(También por comparación
an= n ln n
con la series geométricas)
Gauss
Figura 8.1: Prueba de comparación.
Todos las pruebas desarrolladas en esta sección son esencialmente pruebas de comparación.
La figura 8.1 muestra estas pruebas y sus relaciones.
Ejemplo Las series p.
Probamos n n−p , p = 0.999, por convergencia. Ya que n−0.999 >P n−1 , y bn = n−1 forman
P
la serie armónicaPdivergente, la prueba de comparación muestra que n n−0.999 es divergente.
Generalizando, n n−p se ve como divergente para todo p ≤ 1.
8.2.2. Prueba de la raı́z de Cauchy.

1/n
P Si (an ) ≤ r < 1 para todo 1/n
n suficientemente grande, con r independiente de n, P
entonces
n an es convergente. Si (an ) ≥ 1 para todo n suficientemente grande, entonces n an es
divergente.
La primera parte de esta prueba se verifica fácilmente elevando (an )1/n ≤ r a la n-ésima
potencia. Obtenemos
an ≤ r n < 1 .
Ya que rn es sólo el término n-ésimo en una serie geométrica convergente, n an es conver-

P
gente por la prueba de comparación. Conversamente, si (an )1/n ≥ 1, entonces an ≥ 1 y la serie
deberı́a diverger. La prueba de la raı́z es particularmente útil en establecer las propiedades
de la serie de potencias.
8.2.3. Prueba de la razón de D’ Alembert o Cauchy.

P Si an+1 /an ≤ r < 1 para todo n suficientemente grande, y r independiente
P de n, entonces
n an es convergente. Si an+1 /an ≥ 1 de un n en adelante, entonces n an es divergente.
La convergencia está dada por la comparación directa con las series geométricas (1 + r +
r2 + . . .). En la segunda parte an+1 ≥ an y la divergencia debe ser razonablemente obvia.
Aunque la prueba no es tan sensible como la prueba de la raı́z de Cauchy, esta prueba de
la razón e D’ Alembert es una de las más fáciles de aplicar y es ampliamente usada. Una
afirmación alternativa de la prueba de la razón está en la forma de un lı́mite: si
an+1
lı́m <1, convergencia
n→∞ an
>1, divergencia (8.12)

=1, indeterminado.
A causa de la posibilidad de ser indeterminado, la prueba de la razón es probable que falle

en puntos cruciales, y se hace necesario una prueba más delicada y sensible.
Podrı́amos preguntarnos cómo podrı́a levantarse esta indeterminación. Realmente fue di-
simulado en el primera afirmación an+1 /an ≤ r < 1. Podrı́amos encontrar an+1 /an < 1 para
todo n finito pero ser inapropiado escoger un r < 1 e independiente de n tal que an+1 /an ≤ r
para todo n suficientemente grande. Un ejemplo está dado por las series armónicas
an+1 n
= <1, (8.13)
an n+1
Ya que
an+1
lı́m =1, (8.14)
n→∞ an
no existe una razón fija r < 1 y la prueba de la razón falla.
Ejemplo Prueba de la razón de D’ Alembert.

X n
Probar la convergencia de
n
2n
an+1 (n + 1)/2n+1 1n+1

= n
= . (8.15)
an n/2 2 n
Ya que
an+1 3
≤ para n ≥ 2, (8.16)
an 4
tenemos convergencia. Alternativamente,
an+1 1
lı́m = , (8.17)
n→∞ an 2
y de nuevo converge.
8.2.4. Prueba integral de Cauchy o Maclaurin.

Esta es otra clase de prueba de comparación en la cual comparamos una serie con una
integral. Geométricamente, comparamos el área de una serie de un rectángulo de ancho
unitario con el área bajo la curva.
P Sea f (x) una función
R∞ continua, monótonamente decreciente en la cual f (n) = an . Luego
n an converge si 0 f (x) dx es finita y diverge si la integral es infinita. Para la i-ésima suma
parcial
Xi X i
si = an = f (n) . (8.18)
n=1 n=1
Pero Z i+1
si > f (x) dx , (8.19)
1
por la figura 8.2a, f (x) es monótonamente decreciente. Por otra parte, de la figura 8.2b,
Z i
si − a1 < f (x) dx , (8.20)
1
en la cual la serie está representada por los rectángulos inscritos. Tomando el lı́mite como
i → ∞, tenemos
Z ∞ ∞
X Z ∞
f (x) dx < an < f (x) dx + a1 . (8.21)
1 n=1 1
De modo que la serie infinita converge o diverge cuando la integral correspondiente converge
o diverge respectivamente.
(a) (b)
f(1)=a1 f(1)=a1
f(x) f(x)
f(2)=a2
x x
1 2 3 4 1 2 3 4 5
Figura 8.2: (a) Comparación de la integral y la suma de bloques sobresalientes. (b) Compa-
ración de la integral y la suma de bloques envueltos.
La prueba de la integral es particularmente útil para acotar superior e inferiormente el

resto de una serie, después de que algunos números de términos iniciales hayan sido sumados.
Esto es,
∞
X N
X ∞
X
an = an + an ,
n=1 n=1 n=N +1
donde ∞
Z ∞ X Z ∞
f (x) dx < an < f (x) dx + aN +1 .
N +1 n=N +1 N +1
Podemos liberar la prueba de la integral de los requerimientos muy restrictivos de que la

función de interpolación f (x) sea positiva y monótonamente decreciente, basta que la función
f (x) tenga una derivada continua que satisfaga
Nf Z Nf Z Nf
X
f (n) = f (x) dx + (x − [x])f 0 (x) dx . (8.22)
n=Ni +1 Ni Ni
Aquı́ [x] denota el entero mayor por debajo de x, tal que x − [x] varı́a como diente de sierra
entre 0 y 1.
Ejemplo Función Zeta de Riemann.

La función zeta de Riemann está definida por
∞
X
ζ(p) = n−p . (8.23)
n=1
Podemos tomar f (x) = x−p y entonces

 ∞
−p+1
 x
, p 6= 1
Z ∞ 

−p

−p
x dx = + 1 (8.24)
1
1 
ln x∞ ,


1
p=1
La integral y por lo tanto la serie son divergentes para p ≤ 1 y convergente para p > 1. De
modo que la ecuación (8.23) lleva la condición de p > 1. Esto, incidentalmente, es una prueba
independiente de que la serie armónica (p = 1) diverge y lo hace en forma logarı́tmica. La
P1.000.000
suma del primer millón de términos n−1 , es solamente 14.392726. . . .
Esta comparación con la integral también puede ser usada para dar una cota superior a
la constante Euler-Mascheroni definida por
n
!
X 1
γ = lı́m − ln n . (8.25)
n→∞
m=1
m
Volviendo a las sumas parciales,
n Z n
X
−1 dx
sn = m − ln n < − ln n + 1 . (8.26)
m=1 1 x
Evaluando la integral del lado derecho, sn < 1 para todo n y por lo tanto γ < 1. Realmente
la constante de Euler-Mascheroni es 0.57721566. . . .
8.2.5. Prueba de Kummer.

Esta es la primera de tres pruebas que son algo más difı́ciles para aplicar que las anteriores.
Su importancia radica en su poder y sensibilidad. Frecuentemente, al menos una de las
tres funcionará cuando las pruebas más fáciles sean indeterminadas. Debe recordarse, sin
embargo, que estas pruebas, como aquellas previamente discutidas, están finalmente basadas
en comparaciones. Esto significa que todas las pruebas de convergencia dadas aquı́, incluyendo
la de Kummer, puedan fallar algunas veces.
Consideremos una serie de términos positivos ui y una sucesión de constantes positivas
finitas ai . Si
un
an − an+1 ≥ C > 0 , (8.27)
un+1
para todo n ≥ N , algún número fijo, entonces ∞
P
i=1 ui converge. Si
un
an − an+1 ≤ 0 (8.28)
un+1
P∞
a−1 diverge, luego ∞
P
y i=1 i i=1 ui diverge.
La prueba de este poderoso test es simple y queda como ejercicio.
Si las constantes positivas an de la prueba de Kummer son elegidas como an = n, tenemos
la prueba de Raabe.
8.2.6. Prueba de Raabe.

Si un > 0 y si

un
n −1 ≥P >1 , (8.29)
un+1
P
para todo n ≥ N , donde N es un entero positivo independiente de n, entonces i ui converge.
Si
un
n −1 ≤1 , (8.30)
un+1
entonces i ui diverge ( n−1 diverge).
P P
La forma en lı́mite en el test de Raabe es

un
lı́m n −1 =P . (8.31)
n→∞ un+1
Tenemos convergencia para P > 1, y divergencia para P < 1, y no hay prueba para P = 1
exactamente como con el test de Kummer. Esta indeterminancia está expresada en que
podemos encontrar ejemplos de una serie convergente y una divergente en que ambas series
tienden a P = 1 en la ecuación (8.31).
P∞ −1
El test de Raabe es más sensible
P∞ que la prueba de la razón de D’Alembert ya que n=1 n
diverge más lentamente que n=1 1. Obtenemos una prueba aún más sensible (y una relati-
vamente fácil de aplicar) si escogemos an = n ln n. Esto es la prueba de Gauss.
8.2.7. Prueba de Gauss.

Si un > 0 para todo n finito y
un h B(n)
=1+ + 2 , (8.32)
un+1 n n
P
en el cual B(n) es una función acotada de n para n → ∞, luego i ui converge para h > 1
y diverge para h ≤ 1.
La razón un /un+1 de la ecuación (8.32) a menudo llega a ser como la razón de dos formas
cuadráticas:
un n2 + a1 n + a0
= 2 . (8.33)
un+1 n + b1 n + b0
Se puede mostrar que tenemos convergencia para a1 > b1 + 1 y divergencia para a1 ≤ b1 + 1.
El test de Gauss es un test extremadamente sensible para la convergencia de series. Esto
funcionará para prácticamente todas las series que encontraremos en Fı́sica. Para h > 1 o
h < 1 la prueba se deduce directamente del test de Raabe

h B(n) B(n)
lı́m n 1 + + 2 − 1 = lı́m h + =h. (8.34)
n→∞ n n n→∞ n
Si h = 1, falla el test de Raabe. Sin embargo, si volvemos al test de Kummer y usamos
an = n ln n, tenemos

1 B(n)
lı́m n ln n 1 + + 2 − (n + 1) ln(n + 1)
n→∞ n n

(n + 1)
= lı́m n ln n · − (n + 1) ln(n + 1) (8.35)
n→∞ n

1
= lı́m (n + 1) ln n − ln n − ln 1 + .
n→∞ n
Pidiendo prestado un resultado de la sección 8.6 (el cual no es dependiente de la prueba de
Gauss) tenemos

1 1 1 1
lı́m −(n + 1) ln 1 + = lı́m −(n + 1) − + . . . = −1 < 0 . (8.36)
n→∞ n n→∞ n 2n2 3n3
De modo que tenemos divergencia para h = 1. Esto es un ejemplo de una aplicación exitosa
del test de Kummer en el cual el test de Raabe falla.
Ejemplo Series de Legendre.

La relación de recurrencia para la solución en serie de la ecuación de Legendre pueden ser
colocadas en la forma
a2j+2 2j(2j + 1) − l(l + 1)
= . (8.37)
a2j (2j + 1)(2j + 2)
Esto es equivalente a u2j+2 /u2j para x = +1. Para j l
a2j (2j + 1)(2j + 2) 2j + 2 1
→ = =1+ . (8.38)
a2j+2 2j(2j + 1) 2j j
Por la ecuación (8.33) la serie es divergente. Más adelante exigiremos que las series de Legen-
dre sean finitas (se corten) para x = 1. Eliminaremos la divergencia ajustando los parámetros
n = 2j0 , un entero par. Esto truncará la serie, convirtiendo la serie infinita en un polinomio.
8.2.8. Mejoramiento de convergencia.

En esta sección no nos preocupará establecer la convergencia como una propiedad ma-
temática abstracta. En la práctica, la razón de convergencia puede ser de considerable im-
portancia. Aquı́ presentamos un método que mejora la razón de la convergencia de una serie
ya convergente.
El principio básico de este método, debido a Kummer, es formar una combinación lineal
de nuestra serie lentamente convergente y una o más series cuya suma es conocida. Entre las
series conocidas, la colección
∞
X 1
α1 = =1,
n=1
n(n + 1)
∞
X 1 1
α2 = = ,
n=1
n(n + 1)(n + 2) 4
∞
X 1 1
α3 = = ,
n=1
n(n + 1)(n + 2)(n + 3) 18
.. ..
. .
∞
X 1 1
αp = = ,
n=1
n(n + 1)(n + 2) · · · (n + p) p · p!
es particularmente útil. Las series están combinadas término a término y los coeficientes en
combinación lineal son escogidos para cancelar los términos que convergen lentamente.
Ejemplo Función zeta de Riemann, ζ(3).

Sea la serie a ser sumada ∞ −3
P
n=1 n . En la sección 8.10 está identificada como una función
zeta de Riemann, ζ(3). Formamos una combinación lineal
∞ ∞
X
−3
X a2
n + a2 α2 = n−3 + .
n=1 n=1
4
α1 no está incluida ya que converge más lentamente que ζ(3). Combinando términos, obte-
nemos sobre la mano izquierda
∞ ∞
n2 (1 + a2 ) + 3n + 2
X
X 1 a2
3
+ = 3 (n + 1)(n + 2)
.
n=1
n n(n + 1)(n + 2) n=1
n
Si escogemos a2 = −1, la ecuación precedente tiende a

∞ ∞
X
−3 1 X 3n + 2
ζ(3) = n = + 3
. (8.39)
n=1
4 n=1 n (n + 1)(n + 2)
La serie resultante no es muy bonita pero converge como n−4 , apreciablemente más rápido
que n−3 .
El método puede ser extendido incluyendo a3 α3 para obtener la convergencia como n−5 ,
a4 α4 para obtener la convergencia como n−6 , etc. Eventualmente, usted tiene que alcanzar
un compromiso entre cuánta álgebra usted hace y cuánta aritmética la computadora hace.
Como las computadoras lo hacen más rápido, el balance está seguramente sustituyendo menos
álgebra hecha por usted, por más aritmética realizada por el computador.
8.3. Series alternadas.

En la sección 8.2 nos limitamos a series de términos positivos. Ahora, en contraste, consi-
deraremos series infinitas en las cuales los signos se alternan. La cancelación parcial debida a
la alternancia de los signos hace la convergencia más rápida y mucho más fácil de identificar.
Probaremos que el criterio de Leibniz es una condición general para la convergencia de una
serie alternada.
8.3.1. Criterio de Leibniz.

Consideremos la serie ∞ n+1
P
n=1 (−1) an con an > 0. Si an es monótonamente decreciente
(para N suficientemente grande) y el lı́mn→∞ an = 0, entonces la serie converge.
Para probar esto, examinemos las sumas parciales pares
s2n = a1 − a2 + a3 − . . . − a2n ,
(8.40)
s2n+2 = s2n + (a2n+1 − a2n+2 ) .
Ya que a2n+1 > a2n+2 , tenemos
s2n+2 > s2n . (8.41)
Por otra parte,
s2n+2 = a1 − (a2 − a3 ) − (a4 − a5 ) − . . . − a2n+2 . (8.42)
De modo que, con cada par de términos a2p − a2p+1 > 0,
s2n+2 < a1 . (8.43)
Con las sumas parciales pares acotamos s2n < s2n+2 < a1 y los términos an decrecen monóto-
namente aproximándose a cero, esta serie alternada converge.
Un resultado más importante puede ser extraı́do de las sumas parciales. A partir de las
diferencias entre el lı́mite de la serie S y las sumas parciales sn
S − sn = an+1 − an+2 + an+3 − an+4 + . . .
(8.44)
= an+1 − (an+2 − an+3 ) − (an+4 − an+5 ) − . . .
o
S − sn < an+1 . (8.45)
La ecuación (8.45) dice que el error en el corte de una serie alternada después de n términos
es menor que an+1 , el primer término excluido. Un conocimiento del error obtenido de esta
manera puede ser de gran importancia práctica.
8.3. SERIES ALTERNADAS. 187
8.3.2. Convergencia absoluta.

P
Dada unaP serie en términos de un en la cual un puede variarPen signo, si |un | conver-
P
ge, entonces un se dice que es absolutamente convergente. Si un converge pero |un |
diverge, la convergencia recibe el nombre de condicional.
La serie alternada armónica es un ejemplo simple de esta convergencia condicionada.
Tenemos ∞
X 1 1 1 1
(−1)n−1 n−1 = 1 − + − + · · · + − · · · (8.46)
n=1
2 3 4 n
convergente por el criterio de Leibniz, pero
∞
X 1 1 1 1
n−1 = 1 + + + + ··· + + ···
n=1
2 3 4 n
se ha demostrado que es divergente en la sección 8.1 y 8.2.
Podemos notar que todas las pruebas desarrolladas en la sección 8.2 supone una serie de
términos positivos. Por lo tanto, todas las pruebas en esa sección garantizan la convergencia
absoluta.
Ejemplo
Para 0 < x < π la serie de Fourier
∞
X cos(nx) x
= − ln 2 sen , (8.47)
n=1
n 2
converge teniendo coeficientes que cambian de signo frecuentemente, pero no tanto para que
el criterio de convergencia de Leibniz se aplique fácilmente. Apliquemos el test de la integral
de la ecuación (8.22). Usando integración por partes vemos de inmediato que
Z ∞ ∞
1 ∞ sen(nx)
Z
cos(nx) sen(nx)
dn = − dn
1 n nx 1 x 1 n2
converge para n → ∞, y la integral del lado derecho incluso converge absolutamente. El
término derivado en la ecuación (8.22) tiene la forma
Z ∞
x cos(nx)
(n − [n]) − sen(nx) − dn ,
1 n n2
donde el segundo término converge
R N absolutamente y no necesita ser considerado. Lo próxi-
mo es observar que g(N ) = 1 (n − [n]) sen(nx) dn es acotado para N → ∞, tal como
RN
sen(nx) dn es acotado debido a la naturaleza periódica de sen(nx) y a su regular cambio
de signo. Usando integración por partes nuevamente
Z ∞ 0 ∞ Z ∞
g (n) g(n) g(n)
dn = + dn ,
1 n n 1 1 n2
vemos que el segundo término es absolutamente convergente, y el primero va a cero en el
lı́mite superior. Por lo tanto la serie en la ecuación (8.47) converge, lo cual es duro de ver
usando otro test de convergencia.
8.4. Álgebra de series.

Establecer la convergencia absoluta es importante porque puede probarse que las series
absolutamente convergentes pueden ser manipuladas de acuerdo a las reglas familiares del
álgebra o aritmética.
1. Si una serie infinita es absolutamente convergente, la suma de la serie es independiente
del orden en el cual los términos son añadidos.
2. La serie puede ser multiplicada por otra serie absolutamente convergente. El lı́mite del
producto será el producto de los lı́mites de las series individuales. El producto de las
series, una doble serie, también será absolutamente convergente.
No hay tales garantı́as en series condicionalmente convergentes. Nuevamente consideremos
la serie armónica alternada. Si escribimos

1 1 1 1 1 1 1
1 − + − + ··· = 1 − − − − − ··· , (8.48)
2 3 4 2 3 4 5
es claro que la suma
∞
X
(−1)n−1 n−1 < 1 . (8.49)
n=1
Sin embargo, si rearreglamos los términos sutilmente, podemos hacer que la serie armónica
alternada converja a 3/2. Reagrupamos los términos de la ecuación (8.48), tomando

1 1 1 1 1 1 1 1 1
1+ + − + + + + + −
3 5 2 7 9 11 13 15 4
(8.50)
1 1 1 1 1 1
+ + ··· + − + + ··· + − + ··· .
17 25 6 27 35 8
Tratando los términos agrupados en paréntesis como términos simples por conveniencia,
obtenemos las sumas parciales
s1 = 1.5333 s2 = 1.0333
s3 = 1.5218 s4 = 1.2718
s5 = 1.5143 s6 = 1.3476
s7 = 1.5103 s8 = 1.3853
s9 = 1.5078 s10 = 1.4078
A partir de esta tabulación de los sn y el gráfico de sn versus n en la figura 8.3 es clara la
convergencia a 3/2. Hemos rearreglado los términos, tomando términos positivos hasta que
la suma parcial sea igual o mayor que 3/2, luego sumando los términos negativos hasta que la
suma parcial caiga bajo 3/2, etc. Como las series se extienden hasta infinito, todos los térmi-
nos originales eventualmente aparecerán, pero las sumas parciales de este reordenamiento
de esta serie armónica alternada converge a 3/2. Por un reordenamiento de términos una
serie condicionalmente convergente podrı́a ser hecha para converger a algún valor deseado o
para que diverja. Esta afirmación es dada como el teorema de Riemann. Obviamente, series
condicionalmente convergentes deberı́an ser tratadas con precaución.
8.4. ÁLGEBRA DE SERIES. 189
1.5
1.4
1.3
2 4 6 8 10
Figura 8.3: Serie armónica alternada, rearreglo de términos para dar convergencia a 1.5.
8.4.1. Mejoramiento de la convergencia, aproximaciones raciona-

les.
La serie
∞
X xn
ln(1 + x) = (−1)n−1 , −1 < x ≤ 1 , (8.51)
n=1
n
converge muy suavemente cuando x se aproxima a +1. La razón de convergencia podrı́a ser
mejorada sustancialmente multiplicando ambos lados de la ecuación (8.51) por un polinomio
y ajustando los coeficientes del polinomio para cancelar las porciones que convergen más
lentamente en la serie. Consideremos la posibilidad más simple: Multiplicar ln(1 + x) por
1 + a1 x.
∞ ∞
X xn X xn+1
(1 + a1 x) ln(1 + x) = (−1)n−1 + a1 (−1)n−1 .
n=1
n n=1
n
Combinando las dos series sobre la derecha término a término, obtenemos
∞
X
n−1 1 a1
(1 + a1 x) ln(1 + x) = x + (−1) − xn
n=2
n n−1
∞
X n(1 − a1 ) − 1 n
=x+ (−1)n−1 x .
n=2
n(n − 1)
Claramente, si tomamos a1 = 1, el n en el numerador desaparece y nuestra serie combinada

converge como n−2 .
Continuando este proceso, encontramos que (1 + 2x + x2 ) ln(1 + x) se anula como n−3 ,
(1 + 3x + 3x2 + x3 ) ln(1 + x) se anula cuando n−4 . En efecto estamos desplazándonos desde
una expansión de serie simple de la ecuación (8.51) a una representación racional en la cual
la función ln(1 + x) está representada por la razón de una serie y un polinomio:

∞
X (−1)n xn
x+
n=1
n(n − 1)
ln(1 + x) = .
1+x
Tales aproximaciones racionales pueden ser ambas compactas y precisas. Los programas
computacionales hacen extensivo el uso de ellas.
8.4.2. Reordenamiento de series dobles.

Otro aspecto del reordenamiento de series aparece en el tratamiento de series dobles
(figura 8.4):
m= 0 1 2 3
n= 0 a00 a01 a02 a03
1 a10 a11 a12 a13
2 a20 a21 a22 a23
3 a30 a31 a32 a33
Figura 8.4: Series dobles, la suma sobre n es indicada por lı́neas segmentadas verticales.
∞ X
X ∞
an,m .
m=0 n=0
sustituyamos
n=q≥0,
m=p−q ≥0 ,
(q ≤ p) .
Esto resulta en la identidad

∞ X
∞ p
∞ X
X X
an,m = aq,p−q . (8.52)
m=0 n=0 p=0 q=0
La suma sobre p y q de la ecuación (8.52) está ilustrada en la figura 8.5. La sustitución

r
n=s≥0, m = r − 2s ≥ 0 , s≤
2
8.4. ÁLGEBRA DE SERIES. 191
p= 0 1 2 3
q= 0 a00 a01 a02 a03
1 a10 a11 a12
2 a20 a21
3 a30
Figura 8.5: Series dobles nuevamente, la primera suma es representada por lı́neas segmentadas
verticales pero estas lı́neas verticales corresponden a las diagonales en la figura 8.4.
tiende a
∞ X
∞ [r/2]
∞ X
X X
an,m = as,r−2s . (8.53)
m=0 n=0 r=0 s=0
con [r/2] = r/2 para r par, (r − 1)/2 para r impar. La suma sobre r y s de la ecuación
(8.53) está mostrada en la figura 8.6. Las ecuaciones (8.52) y (8.53) son claramente reordena-
mientos del arreglo de coeficientes an,m , reordenamientos que son válidos en tanto tengamos
convergencia absoluta. La combinación de las ecuaciones (8.52) y (8.53),
r= 0 1 2 3 4
s= 0 a00 a01 a02 a03 a04
1 a10 a11 a12
2 a20
Figura 8.6: Series dobles. La suma sobre s corresponde a la suma a lo largo de la lı́neas
segmentadas inclinadas, en la figura 8.4.
p
∞ X [r/2]
∞ X
X X
aq,p−q = as,r−2s . (8.54)
p=0 q=0 r=0 s=0
es usada en la determinación de la forma en serie de los polinomios de Legendre.
8.5. Series de funciones.

Extendemos nuestro concepto de series infinitas para incluir la posibilidad que cada
término un pueda ser una función de alguna variable, un = un (x). Numerosas ilustracio-
nes de tales series de funciones aparecerán más adelante. Las sumas parciales llegan a ser
funciones de la variable x
sn (x) = u1 (x) + u2 (x) + · · · + un (x) , (8.55)
tal como lo hacemos para la suma de serie, definimos el lı́mite como el lı́mite de las sumas
parciales
X∞
un (x) = S(x) = lı́m sn (x) . (8.56)
n→∞
n=1
Hasta ahora nos hemos ocupado del comportamiento de las sumas parciales como una función
de n. Ahora consideremos cómo las cantidades anteriores dependen de x. Aquı́ el concepto
clave es la convergencia uniforme.
8.5.1. Convergencia uniforme.

Si para cualquier ε > 0 pequeño, existe un número N , independiente de x en el intervalo
[a, b] con (a ≤ x ≤ b) tal que
| S(x) − sn (x) | < ε , ∀ n ≥ N , (8.57)
se dice que la serie converge uniformemente en el intervalo [a, b]. Esto dice que para que
nuestra serie sea uniformementeP∞ convergente, debe ser posible encontrar un N finito tal que
la cola de la serie infinita, | i=N +1 ui (x)|, sea menor que un ε arbitrariamente pequeño para
todo x en el intervalo dado.
Esta condición, ecuación (8.57), la cual define la convergencia uniforme, es ilustrada en
la figura 8.7. El punto es que no importa cuan pequeño sea ε podemos siempre tomar un n
suficientemente grande tal que la magnitud absoluta de la diferencia entre S(x) P y sn (x) sea
menor que ε para todo x, a ≤ x ≤ b. Si esto no puede ser hecho, entonces un (x) no es
uniformemente convergente en el intervalo [a, b].
Ejemplo
∞ ∞
X X x
un (x) = . (8.58)
n=1 n=1
[(n − 1)x + 1][nx + 1]
La suma parcial sn (x) = nx(nx + 1)−1 puede ser verificada por inducción matemática. Por
inspección esta expresión para sn (x) es válida para n = 1, 2. Suponemos que se mantiene
8.5. SERIES DE FUNCIONES. 193
S(x) + ε
S(x)
S(x) − ε
ε sn (x)
ε
x
x=a x=b
Figura 8.7: Convergencia uniforme.
para el término n y probamos para n + 1.

x
sn+1 = sn +
[nx + 1][(n + 1)x + 1]
nx x
= +
[nx + 1] [nx + 1][(n + 1)x + 1]
(n + 1)x
= ,
(n + 1)x + 1
completando la prueba.
Tomando n → ∞ tenemos
S(0) = lı́m sn (0) = 0 ,
n→∞
S(x 6= 0) = lı́m sn (x 6= 0) = 1 .
n→∞
Tenemos una discontinuidad en el lı́mite de la serie en x = 0. Sin embargo, sn (x) es una

función continua de x, en el intervalo 0 ≤ x < 1, para todo n finito. La ecuación (8.57)
con ε suficientemente pequeño, será violado para todo n finito. Nuestra serie no converge
uniformemente.
8.5.2. Prueba M de Weierstrass.

La prueba más comúnmente usada para la convergencia
P∞ uniforme es la prueba M de
Weierstrass. Si podemos construir la cual Mi ≥ |ui (x)| para
P∞ una serie de números 1 Mi , en P
todo x en el intervalo [a, b] y 1 Mi es convergente, nuestra serie ∞1 ui (x) será uniforme-
mente convergente en [a, b].
P
La prueba de este test M de Weierstrass es directa y simple. Ya que i Mi converge,
existen algunos números N tal que n + 1 ≥ N ,
∞
X
Mi < ε . (8.59)
i=n+1
Esto a partir de nuestra definición de convergencia. Entonces, con |ui (x)| ≤ Mi para todo x
en el intervalo a ≤ x ≤ b,
X∞
|ui (x)| < ε . (8.60)
i=n+1
De modo que

X∞
|S(x) − sn (x)| = ui (x) < ε , (8.61)

i=n+1
P∞
y por definición 1 ui (x) es uniformemente convergente en [a, b]. Ya que tenemos especifica-
dos valores absolutos en el planteamiento de la prueba M de Weierstrass, la serie ∞
P
1 ui (x)
también es vista como serie absolutamente convergente.
Podemos notar que la convergencia uniforme y convergencia absoluta son propiedades
independientes. Una no implica la otra. Para ejemplos especı́ficos,
∞
X (−1)n
, −∞ < x < ∞ (8.62)
n=1
n + x2
y
∞
X xn
(−1)n−1 = ln(1 + x) , 0≤x≤1, (8.63)
n=1
n
converge uniformemente en los intervalos indicados pero no converge absolutamente. Por otra
parte,
∞
(
X 1, 0≤x<1
(1 − x)xn = , (8.64)
n=1
0 , x = 1
converge absolutamente pero no uniformemente en [0, 1].

A partir de la definición de convergencia uniforme podrı́amos mostrar que cualquier serie
∞
X
f (x) = un (x) , (8.65)
n=1
no puede converger uniformemente en ningún intervalo que incluya una discontinuidad de

f (x).
Ya que la prueba M de Weierstrass establece tanto la convergencia uniforme como abso-
luta, necesariamente falla para series que son uniformes pero condicionalmente convergentes.
8.5. SERIES DE FUNCIONES. 195
8.5.3. Prueba de Abel.

Una prueba algo más delicada para la convergencia uniforme ha sido dada por Abel. Si
un (x) = an fn (x) ,
X
an = A , convergente,
son monótonas [fn+1 (x) ≤ fn (x)] y acotadas, 0 ≤ fn (x) ≤ M , para todo

y las funciones f (x) P
x en [a, b], entonces un (x) converge uniformemente en [a, b].
Las series uniformemente convergentes tienen tres propiedades particularmente útiles.
1. Si los términos individuales un (x) son continuos, la suma de la serie

∞
X
f (x) = un (x) , (8.66)
n=1
es también continua.
2. Si los términos individuales un (x) son continuos, las series pueden ser integradas término
a término. La suma de las integrales es igual a la integral de la suma.
Z b ∞ Z
X b
f (x) dx = un (x)dx . (8.67)
a n=1 a
3. Las derivadas de la suma de la serie f (x) es igual a la suma de los términos individuales
derivados,
∞
df (x) X dun (x)
= , (8.68)
dx n=1
dx
siempre que las siguientes condiciones sean satisfechas:
dun (x)
un (x) y son continuas en [a, b].
dx
∞
X dun (x)
es uniformemente convergente en [a, b].
n=1
dx
La integración término a término de una serie uniformemente convergente2 requiere sólo

continuidad de los términos individuales. Esta condición casi siempre es satisfecha en las
aplicaciones fı́sicas. La diferenciación término a término de una serie a menudo no es váli-
da porque deben satisfacer condiciones más restrictivas. Por cierto, encontraremos casos en
series de Fourier, en la cual la diferenciación término a término de una serie uniformemente
convergente tiende a una serie divergente.
2
La integración término a término también puede ser válida en ausencia de convergencia uniforme.
8.6. Expansión de Taylor.

Esta es una expansión de una función en una serie infinita o en una serie finita más
un término remanente. Los coeficientes de los términos sucesivos de la serie involucra las
derivadas sucesivas de la función. Este tipo de expansiones de son ampliamente usadas.
Ahora derivaremos la expansión de Taylor.
Supongamos que nuestra función f (x) tiene una derivada n-ésima continua en el intervalo
a ≤ x ≤ b. Entonces, integrando esta n-ésima derivada n veces,
Z x x
(n) (n−1)

f (x) dx = f (x) = f (n−1) (x) − f (n−1) (a)
a
Z x Z x a Z x
(8.69)
f (n) (x) dx dx = [f (n−1) (x) − f (n−1) (a)]dx
a a a
(n−2)
=f (x) − f (n−2) (a) − (x − a)f (n−1) (a) .
Continuando, obtenemos
Z Z Z x
(x − a)2 (n−1)
f (n) (x)(dx)3 = f (n−3) (x) − f (n−3) (a) − (x − a)f (n−2) (a) − f (a) . (8.70)
a 2
Finalmente, integrando por n-ésima vez,

Z x Z
· · · f (n) (x)(dx)n = f (x) − f (a) − (x − a)f 0 (a)+
a
(8.71)
(x − a)2 00 (x − a)n−1 (n−1)
− f (a) − · · · − f (a) .
2! (n − 1)!
Note que esta expresión es exacta. No hay términos que hayan sido excluidos, ni aproxima-
ciones hechas. Ahora, resolviendo para f (x), tenemos
(x − a)2 00 (x − a)n−1 (n−1)

f (x) = f (a) + (x − a)f 0 (a) + f (a) + · · · + f (a) + Rn . (8.72)
2! (n − 1)!
El remanente, Rn , está dado por la integral n-dimensional

Z x Z
· · · f (n) (x)(dx)n . (8.73)
a
Este remanente, ecuación (8.73), puede ser puesto en una forma más inteligible usando la
forma integral del teorema del valor medio
Z x
g(x) dx = (x − a)g(ξ) , (8.74)
a
con a ≤ ξ ≤ x. Integrando n veces obtenemos la forma Lagrangiana del remanente:
(x − a)n (n)
Rn = f (ξ) . (8.75)
n!
8.6. EXPANSIÓN DE TAYLOR. 197
Con la expansión de Taylor en esta forma no estamos interesados en cualquier pregunta de

convergencia de series infinitas. Esta serie es finita, la sola pregunta que nos importa es la
magnitud del remanente.
Cuando la función f (x) es tal que
lı́m Rn = 0 , (8.76)
n→∞
la ecuación (8.72) se convierte en la serie de Taylor

(x − a)2 00
f (x) = f (a) + (x − a)f 0 (a) + f (a) + · · ·
2!
∞ (8.77)
X (x − a)n (n)
= f (a) .
n=0
n!
Nuestra serie de Taylor especifica el valor de una función en un punto, x, en términos del
valor de la función y sus derivadas en un punto de referencia, a. Esta es una expansión en
potencias de un cambio en la variable, ∆x = x−a en este caso. La notación puede ser variada
según la conveniencia del usuario. Con la sustitución x → x + h y a → x tenemos una forma
alterna ∞
X hn (n)
f (x + h) = f (x) .
n=0
n!
Cuando usamos el operador D = d/dx la expansión de Taylor se convierte en
∞
X hn Dn
f (x + h) = f (x) = ehD f (x) .
n=0
n!
Un forma en operadores equivalente de la expansión e Taylor. Una derivación de la expansión

de Taylor en el contexto de la teorı́a de variable compleja aparece en el próximo capı́tulo.
8.6.1. Teorema de Maclaurin.

Si expandimos alrededor del origen (a = 0), la ecuación (8.77) es conocida como la serie
de Maclaurin
x2 00
f (x) = f (0) + xf 0 (0) + f (0) + · · ·
2!
∞ (8.78)
X xn
= f (n) (0) .
n=0
n!
Una aplicación inmediata de la serie de Maclaurin (o serie de Taylor) está en la expansión

de varias funciones transcendentales en una serie infinita.
Ejemplo
Sea f (x) = ex . Diferenciando, tenemos
f (n) (0) = 1 , (8.79)

para todo n, n = 1, 2, 3 . . .. Entonces, para la ecuación (8.78), tenemos

∞
x x2 x3 X xn
e =1+x+ + + ··· = . (8.80)
2! 3! n=0
n!
Esta es la expansión en serie de la función exponencial. Algunos autores usan esta serie para
definir la función exponencial.
Aunque esta serie es claramente convergente para todo x, podrı́amos chequear el término
remanente, Rn . Por la ecuación (8.75) tenemos
xn (n)
Rn = f (ξ)
n! (8.81)
xn ξ
= e , 0 ≤ |ξ| ≤ x .
n!
Por lo tanto
xn x
| Rn | ≤ e (8.82)
n!
y
lı́m Rn = 0 (8.83)
n→∞
para todo los valores finitos de x, el cual indica que esta expansión de Maclaurin de ex es
válida sobre el intervalo −∞ < x < ∞.
Ejemplo
Sea f (x) = ln(1 + x). Diferenciando, obtenemos
1
f 0 (x) = ,
(1 + x)
(8.84)
(n) n−1 1
f (x) = (−1) (n − 1)! .
(1 + x)n
La expansión de Maclaurin produce
x2 x3 x4
ln(1 + x) = x − + − + · · · + Rn
2 3 4
Xn
xp (8.85)
= (−1)p−1 + Rn .
p=1
p
En este caso el remanente está dado por
xn (n)
Rn = f (ξ) , 0 ≤ ξ ≤ x
n! (8.86)
xn
≤ , 0≤ξ≤x≤1.
n
8.6. EXPANSIÓN DE TAYLOR. 199
Ahora el remanente se aproxima a cero cuando n crece indefinidamente, dado 0 ≤ x ≤ 13 .

Como una serie infinita ∞
X xn
ln(1 + x) = (−1)n−1 , (8.87)
n=1
n
la cual converge para −1 < x ≤ 1. El intervalo −1 < x < 1 es fácilmente establecido por la
prueba de la razón de D’ Alembert. La convergencia en x = 1 se deduce a partir del criterio
de Leibniz. En particular, en x = 1, tenemos
1 1 1 1
ln 2 = 1 − + − + − ···
2 3 4 5
X∞
1 (8.88)
= (−1)n − 1 ,
n=1
n
la serie armónica alterna condicionalmente convergente.
8.6.2. Teorema Binomial.

Una segunda, aplicación extremadamente importante de las expansiones de Taylor y Ma-
claurin es la derivación del teorema binomial para potencias negativas y/o no enteras.
Sea f (x) = (1 + x)m , en la cual m puede ser negativo y no está limitado a valores enteros.
La aplicación directa de la ecuación (8.78) da
m(m − 1) 2
(1 + x)m = 1 + mx + x + · · · + Rn . (8.89)
2!
Para esta función el remanente es
xn
Rn = (1 + ξ)m−n × m(m − 1) · · · (m − n + 1) (8.90)
n!
y ξ con 0 ≤ ξ ≤ x. Ahora, para n > m, (1 + ξ)m−n es un máximo para ξ = 0. Por lo tanto
xn
Rn ≤ × m(m − 1) · · · (m − n + 1) . (8.91)
n!
Note que los factores dependientes de m no dan un cero a menos que m sea entero no negativo;
Rn tiende a cero cuando n → ∞ si x está restringido al intervalo 0 ≤ x ≤ 1. La expansión
binomial resulta
m(m − 1) 2 m(m − 1)(m − 2) 3
(1 + x)m = 1 + mx + x + x + ··· . (8.92)
2! 3!
En otra notación equivalente
∞
X m!
(1 + x)m = xn
n=0
n!(m − n)!
∞ (8.93)
X m n
= x .
n=0
n
3
Este intervalo puede ser fácilmente extendido a −1 < x ≤ 1 pero no a x = −1.
Cuando la cantidad m

n
es igual a m!/(n!(m−n)!), es llamado el coeficiente binomial. Aunque
hemos mostrado solamente que el remanente se anula,
lı́m Rn = 0 ,
n→∞
para 0 ≤ x < 1, realmente puede mostrarse que la serie en la ecuación (8.92) converge en el
intervalo extendido −1 < x < 1. Para m un entero, (m − n)! = ±∞ si n > m y las series
automáticamente terminan en n = m.
Ejemplo Energı́a relativista.

La energı́a total relativista de una partı́cula es
−1/2
v2

2
E = mc 1− 2 . (8.94)
c
1 2
Comparemos esta ecuación con la energı́a cinética clásica, mv .
2
v2 1
Por la ecuación (8.92) con x = − 2 y m = − tenemos
c 2
" 2 2 2
2 1 v (−1/2)(−3/2) v
E = mc 1 − − 2 + − 2 +
2 c 2! c
2 3 #
(−1/2)(−3/2)(−5/2) v
+ − 2 + ··· .
3! c
o 2
v2 v2

1 3 5
2
E = mc + mv 2 + mv 2 2 + mv 2 + ··· . (8.95)
2 8 c 16 c2
El primer término, mc2 , lo identificamos como la masa en reposo. Entonces
" 2 #
1 2 3 v2 5 v2
Ecinética = mv 1 + 2 + + ··· . (8.96)
2 4c 8 c2
Para la velocidad de la partı́cula v c, donde c es la velocidad de la luz, la expresión en

los paréntesis cuadrados se reduce a la unidad y vemos que la porción cinética de la energı́a
relativista total concuerda con el resultado clásico.
Para polinomios podemos generalizar la expansión binomial a
X n!
(a1 + a2 + · · · + am )n = an1 an2 · · · anmm ,
n1 !n2 ! · · · nm ! 1 2
donde
Pmla suma anterior incluye todas las combinaciones diferentes de los n1 , n2 , . . . , nm tal
que i=1 ni = n. Aquı́ ni y n son enteros. Esta generalización encuentra considerables usos
en Mecánica Estadı́stica.
8.7. SERIES DE POTENCIAS. 201
Las series de Maclaurin pueden aparecer algunas veces indirectamente más que el uso di-
recto de la ecuación (8.78). Por ejemplo, la manera más conveniente para obtener la expansión
en serie ∞
−1
X (2n − 1)!! x2n+1 x3 3x5
sen x = =x+ + + ··· , (8.97)
n=0
(2n)!! 2n + 1 6 40
es hacer uso de la relación Z x
−1 dt
sen x= .
0 (1 − t2 )1/2
2 −1/2
Expandimos (1 − t ) (teorema binomial) y luego integramos término a término. Esta
integración término a término es discutida en la sección 8.7. El resultado es la ecuación
(8.97). Finalmente, podemos tomar el lı́mite cuando x → 1. La serie converge por la prueba
de Gauss.
8.6.3. Expansión de Taylor de más de una variable.

La función f tiene más de una variable independiente, es decir, f = f (x, y), la expansión
de Taylor se convierte en
∂f ∂f
f (x, y) = f (a, b) + (x − a) + (y − b) +
∂x ∂y
2
∂2f 2

1 2∂ f 2∂ f
+ (x − a) + 2(x − a)(y − b) + (y − b) +
2! ∂x2 ∂x∂y ∂y 2
(8.98)
∂3f ∂3f

1
+ (x − a)3 3 + 3(x − a)2 (y − b) 2 +
3! ∂x ∂x ∂y
3 3

2 ∂ f 3∂ f
+3(x − a)(y − b) + (y − b) + ··· ,
∂x∂y 2 ∂y 3
con todas las derivadas evaluadas en el punto (a, b). Usando αj t = xj − xj0 , podemos escribir
la expansión de Taylor para m variables independientes en la forma simbólica
∞ m
!n
X tn X ∂
f (xj ) = αi f (xk ) . (8.99)

n=0
n! i=1
∂x i
xk =xk0
Una forma vectorial conveniente es

∞
X 1 ~ n ψ(~r) .
ψ(~r + ~a) = (~a · ∇) (8.100)
n=0
n!
8.7. Series de potencias.

Las series de potencias son un tipo especial y extremadamente útil de series infinitas de
la forma
f (x) = a0 + a1 x + a2 x2 + a3 x3 + · · ·
∞
X (8.101)
= an xn ,
n=0
donde los coeficientes ai son constantes e independientes de x.4
8.7.1. Convergencia.
La ecuación (8.101) puede testearse rápidamente para la convergencia ya sea por la prueba
de la raı́z de Cauchy o por la prueba de la razón de D’ Alembert. Si
an+1
lı́m = R−1 , (8.102)
n→∞ an
la serie converge para −R < x < R. Este es el intervalo o radio de convergencia. Ya que las
pruebas de la raı́z y la razón fallan cuando el lı́mite es la unidad, el punto final del intervalo
requiere atención especial.
Por ejemplo, si an = n−1 , entonces R = 1 y, la serie converge para x = −1, pero diverge
para x = +1. Si an = n!, entonces R = 0 y la serie diverge para todo x 6= 0.
8.8. Convergencia uniforme y absoluta.

Supongamos que nuestra serie de potencia es convergente para −R < x < R; entonces
será uniforme y absolutamente convergente en cualquier intervalo interior, −S ≤ x ≤ S,
donde 0 < S < R. Esto podrı́a ser probado directamente por la prueba M de Weierstrass
usando Mi = |ai |S i .
8.8.1. Continuidad.
Ya que cada término un (x) = an xn es una función continua de x y f (x) = an xn con-
P
verge uniformemente para −S ≤ x ≤ S, f (x) deberı́a ser una función continua en el intervalo
de convergencia uniforme. Este comportamiento es contradictorio con el comportamiento
impresionantemente diferente de las series de Fourier. Las series de Fourier son usadas fre-
cuentemente para representar funciones discontinuas tales como ondas cuadradas y ondas
dientes de sierra.
8.8.2. Diferenciación e integración.

an xn uniformemente convergente, encontramos que la serie dife-
P
Con un (x) continua y
renciada es una serie de potencia con funciones continuas y del mismo radio de convergencia
que la serie original. Los nuevos factores introducidos por diferenciación (o integración) no
afecta ni a la prueba de la raı́z ni a la de la razón. Por lo tanto nuestra serie podrı́a ser
diferenciada o integrada tan a menudo como deseemos dentro del intervalo de convergencia
uniforme.
En vista de las restricciones algo severas puestas en la diferenciación, esto es un resultado
valioso y notable.
4
La ecuación (8.101) puede ser reescrita con z = x + iy, reemplazando a x. Luego todos los resultados de
esta sección se aplican a series complejas
8.8. CONVERGENCIA UNIFORME Y ABSOLUTA. 203
8.8.3. Teorema de unicidad.

En la sección precedente, usando las series de Maclaurin, expandimos ex y ln(1 + x) en
series infinitas. En los capı́tulos venideros las funciones son frecuentemente representadas e
incluso definidas por series infinitas. Ahora estableceremos que la representación de la serie
de potencias es única.
Si
∞
X
f (x) = an xn , −Ra < x < Ra
n=0
∞ (8.103)
X
= bn x n , −Rb < x < Rb ,
n=0
con intervalos de convergencia sobrepuestos, incluyendo el origen, luego

an = b n , (8.104)
para todo n; esto es, supongamos dos representaciones de serie de potencias (diferentes) y
luego procedamos a demostrar que las dos son idénticas.
De la ecuación (8.103)
∞
X ∞
X
n
an x = bn x n , −R < x < R (8.105)
n=0 n=0
donde R es el más pequeño entre Ra , Rb . Haciendo x = 0 para eliminar todo salvo el término
constante, obtenemos
a0 = b0 . (8.106)
Ahora, aprovechándose de la diferenciabilidad de nuestra serie de potencia, diferenciamos la
ecuación (8.105), obteniendo
∞
X ∞
X
n−1
nan x = nbn xn−1 . (8.107)
n=1 n=1
De nuevo ajustamos x = 0 para aislar el nuevo término constante y encontramos

a1 = b1 . (8.108)
Repitiendo este proceso n veces, obtenemos
an = bn , (8.109)
lo cual muestra que las dos series coinciden. Por lo tanto nuestra representación en serie de
potencia es única.
Esto será un punto crucial cuando usamos una serie de potencia para desarrollar soluciones
de ecuaciones diferenciales. Esta unicidad de las series de potencia aparece frecuentemente
en fı́sica teórica. La teorı́a de perturbaciones en Mecánica Cuántica es un ejemplo de esto.
La representación en serie de potencia de funciones es a menudo útil en formas de evaluación
indeterminadas, particularmente cuando la regla de l’Hospital puede ser inconveniente de
aplicar.
Ejemplo
Evaluemos
1 − cos x
lı́m . (8.110)
x→0 x2
Remplazando cos x por su expansión en serie de Maclaurin, obtenemos
1 − cos x 1 − (1 − x2 /2! + x4 /4! − · · · )

=
x2 x2
2 4
x /2! − x /4! + · · ·
=
x2
2
1 x
= − + ··· .
2! 4!
Tomando x → 0, tenemos
1 − cos x 1
lı́m 2
= . (8.111)
x→0 x 2
La unicidad de las series de potencia significa que los coeficientes an pueden ser identifi-
cadas con las derivadas en una serie de Maclaurin. A partir de
∞ ∞
X X
n 1 (n)
f (x) = an x = f (0)xn
n−0 n=0
n!
tenemos
1 (n)
an = f (0) .
n!
8.8.4. Inversión de series de potencia.

Supongamos que tenemos una serie
y − y0 = a1 (x − x0 ) + a2 (x − x0 )2 + · · ·
∞
X (8.112)
= an (x − x0 )n ,
n=1
en la cual está dada (y − y0 ) en términos de (x − x0 ). Sin embargo, podrı́a ser deseable tener
una expresión explı́cita para (x−x0 ) en términos de (y −y0 ). Necesitamos resolver la ecuación
(8.112) para (x − x0 ) por inversión de nuestra serie. Supongamos que
∞
X
x − x0 = bn (y − y0 )n , (8.113)
n=0
con bn determinado en términos de los supuestamente conocidos an . Una aproximación a

fuerza bruta, la cual es perfectamente adecuada para los primeros coeficientes, ya que es
simplemente sustituir la ecuación (8.112) en la ecuación (8.113). Igualando los coeficientes
8.9. INTEGRALES ELÍPTICAS. 205
de (x − x0 )n en ambos lados de la ecuación (8.113), ya que la serie de potencia es única,

obtenemos
1
b1 = ,
a1
a2
b2 = 3 ,
a1
1 (8.114)
b3 = 5 (2a22 − a1 a3 ) ,
a1
1
b4 = 7 (5a1 a2 a3 − a21 a4 − 5a32 ) , y ası́ sucesivamente.
a1
Los coeficientes mayores son listados en tablas generalmente. Una aproximación más general
y mucho más elegante es desarrollada usando variables complejas.
8.9. Integrales elı́pticas.

Las integrales elı́pticas son incluidas aquı́ parcialmente como una ilustración del uso de
las series de potencias y por su propio interés intrı́nseco. Este interés incluye la ocurrencia
de las integrales elı́pticas en una gran variedad de problemas fı́sicos.
Ejemplo Perı́odo de un péndulo simple.

Para pequeñas oscilaciones en la amplitud nuestro péndulo, figura 8.8, tiene un movi-
miento armónico simple con un perı́odo T = 2π(l/g)1/2 . Para una amplitud grande θM tal
que sen θM 6= θM , la segunda ley de movimiento de Newton y las ecuaciones de Lagrange
conducen a una ecuación diferencial no lineal (sen θ es una función no lineal de θ ), ası́ que
necesitamos un acercamiento diferente.
Figura 8.8: Péndulo simple.
La masa oscilante m tiene una energı́a cinética de ml2 (dθ/dt)2 /2 y una energı́a potencial
de −mgl cos θ (θ = π/2 como la elección del cero de la energı́a potencial). Ya que dθ/dt = 0
en θ = θM , el principio de la conservación de la energı́a da
2
1 2 dθ
ml − mgl cos θ = −mgl cos θM . (8.115)
2 dt
Resolviendo para dθ/dt obtenemos

1/2
dθ 2g
=± (cos θ − cos θM )1/2 (8.116)
dt l
con la cancelación de la masa m. Tomando t como cero cuando θ = 0 y dθ/dt > 0. Una
integración desde θ = 0 a θ = θM produce
Z θM 1/2 Z t 1/2
−1/2 2g 2g
(cos θ − cos θM ) dθ = dt = t. (8.117)
0 l 0 l
Esto es 1/4 del ciclo, y por lo tanto el tiempo t es 1/4 del perı́odo, T . Notemos que θ ≤ θM ,
trataremos la sustitución
θ θM
sen = sen sen ϕ . (8.118)
2 2
Con esto, la ecuación (8.117) se convierte en
1/2 Z π/2
l dϕ
T =4 s (8.119)
g 0

θM
1 − sen2 sen2 ϕ
2
Aunque no hay un obvio mejoramiento en la ecuación (8.117), la integral ahora corresponde a

la integral elı́ptica completa del primer tipo, K(sen θM /2). A partir de la expansión de serie,
el perı́odo de nuestro péndulo puede ser desarrollado como una serie de potencia en sen θM /2:
1/2
l 1 2 θM 9 4 θM
T = 2π 1 + sen + sen + ··· (8.120)
g 4 2 64 2
8.9.1. Definiciones.
Generalizando el ejemplo anterior para incluir el lı́mite superior como una variable, la
integral elı́ptica del primer tipo está definida como
Z ϕ
dθ
F (ϕ\α) = √ (8.121)
0 1 − sen2 α sen2 θ
o Z x
dt
F (x\m) = p , 0≤m<1. (8.122)
0 (1 − t2 )(1 − mt2 )
Para ϕ = π/2, x = 1, tenemos la integral elı́ptica completa de primer tipo,
Z π/2
dθ
K(m) = √
0 1 − m sen2 θ
Z 1 (8.123)
dt
= p ,
0 (1 − t )(1 − mt2 )
2
con m = sen2 α, 0 ≤ m < 1.

8.9. INTEGRALES ELÍPTICAS. 207
La integral elı́ptica de segundo tipo está definida por

Z ϕ√
E(ϕ\α) = 1 − sen2 α sen2 θ dθ (8.124)
0
o r
x
1 − mt2
Z
E(x\m) = dt , 0≤m<1 (8.125)
0 1 − t2
Nuevamente, para el caso ϕ = π/2, x = 1,tenemos la integral elı́ptica completa de segundo
tipo:
Z π/2 √
E(m) = 1 − m sen2 θ dθ
0
1
r (8.126)
1 − mt2
Z
= dt , 0≤m<1.
0 1 − t2
La figura 8.9 muestra el comportamiento de K(m) y E(m). Los valores de ambas funciones
pueden encontrarse en tablas o evaluar en software como Mathematica.
K(m)
2
π/2
1 E(m)
0.2 0.4 0.6 0.8 1

m
Figura 8.9: Integrales elı́pticas completas, K(m), E(m).
8.9.2. Expansión de series.

Para nuestro intervalo 0 ≤ m < 1, el denominador de K(m) puede ser expandido en serie
binomial
1 3
(1 − m sen2 θ)−1/2 = 1 + m sen2 θ + m2 sen4 θ + · · ·
2 8
X∞
(2n − 1)!! n (8.127)
= m sen2n θ .
n=0
(2n)!!
Para cualquier intervalo cerrado [0, mmax ], con mmax < 1, esta serie es uniformemente con-
vergente y puede ser integrada término a término.
Z π/2
(2n − 1)!! π
sen2n θ dθ = . (8.128)
0 (2n)!! 2
De modo que
" 2 2 2 #
π 1 1·3 2 1·3·5 3
K(m) = 1+ m+ m + m + ··· . (8.129)
2 2 2·4 2·4·6
Similarmente,
" 2 2 2 #
1 · 3 m2 1 · 3 · 5 m3

π 1 m
E(m) = 1− − − − ··· . (8.130)
2 2 1 2·4 3 2·4·6 5
Más adelante estas series son identificadas como funciones hipergeométricas, y tenemos

π 1 1
K(m) = 2 F1 , , 1; m (8.131)
2 2 2

π 1 1
E(m) = 2 F1 − , , 1; m (8.132)
2 2 2
8.9.3. Valores lı́mites.

De las series en las ecuaciones (8.129) y (8.130), o a partir de las integrales definidas,
obtenemos
π
lı́m K(m) = , (8.133)
m→0 2
π
lı́m E(m) = . (8.134)
m→0 2
Para m → 1, las expansiones en series no son muy útiles, A partir de la representación
integral tenemos que
lı́m K(m) = ∞ , (8.135)
m→1
diverge logarı́tmicamente, y por otra parte, la integral para E(m) tiene un lı́mite finito
lı́m E(m) = 1 . (8.136)
m→1
Las integrales elı́pticas han sido usadas ampliamente en el pasado para evaluar integrales.
Por ejemplo, integrales de la forma
Z x p
I= R(t, a4 t4 + a3 t3 + a2 t2 + a1 t + a0 ) dt ,
0
donde R es una función racional de t y del radical, pueden ser expresadas en términos de
integrales elı́pticas. Con los computadores actuales disponibles para una evaluación numérica
rápida y directa, el interés en estas técnicas de integrales elı́pticas ha declinado. Sin embargo,
las integrales elı́pticas mantienen su interés a causa de su apariencia en problemas en Fı́sica.
8.10. NÚMEROS DE BERNOULLI. 209
8.10. Números de Bernoulli.

Los números de Bernoulli fueron introducidos por Jacques Bernoulli. Hay muchas defini-
ciones equivalentes, pero debe tenerse extremo cuidado, porque algunos autores introducen
variaciones en la numeración o en signo. Un acercamiento relativamente simple para definir
los números de Bernoulli es por la serie5
∞
X Bn xn
x
= , (8.137)
ex − 1 n=0 n!
la cual converge para |x| < 2π usando el test del cociente. Diferenciando esta serie de potencia
repetidamente y luego evaluando para x = 0, obtenemos
n
d x
Bn = . (8.138)
dxn ex − 1 x=0
Especı́ficamente,
x

d x 1 xe 1
B1 = x
= x
− x 2
=− , (8.139)
dx e − 1 x=0
e − 1 (e − 1) x=0
2
como puede ser visto por la expansión en series de los denominadores. Usando B0 = 1 y
B1 = −1/2, es fácil verificar que la función
∞
x x X Bn xn x x
x
− 1 + = = − −x −1− , (8.140)
e −1 2 n=2
n! e −1 2
es par en x, tal que todos los B2n+1 = 0.
Para derivar una relación de recurrencia para los números de Bernoulli, multiplicamos
" ∞ #" ∞
#
ex − 1 x X xm x X B2n x2n
=1= 1− +
x ex − 1 m=0
(m + 1)! 2 n=1 (2n)!
∞ X ∞
X
m 1 1 X B2n
=1+ x − + xN .
m=1
(m + 1)! 2 m! N =2
[(2n)!(N − 2n + 1)!]
1≤n≤N/2
(8.141)
La ecuación (8.141) produce

1 X N +1 1
(N + 1) − 1 = B2n = (N − 1) , (8.142)
2 2n 2
1≤n≤N/2
la cual es equivalente a
N
1 X 2N + 1
N− = B2n ,
2 n=1 2n
N −1 (8.143)
X 2N
N −1= B2n .
n=1
2n
5 x
La función puede ser considerada una función generatriz ya que genera los números de Bernoulli.
ex −1
n Bn Bn
0 1 1.0000 00000
1 − 21 -0.5000 00000
1
2 6
0.1666 66667
1
3 − 30 -0.0333 33333
1
4 42
0.0238 09524
1
5 − 30 -0.0333 33333
5
6 66
0.0757 57576
Cuadro 8.1: Números de Bernoulli
A partir de la ecuación (8.143) los números de Bernoulli en la tabla 8.1 se obtienen rápida-
mente. Si la variable x en la ecuación (8.137) es remplazada por 2xi (y B1 elegido igual a
-1/2), obtenemos una definición alternativa (y equivalente) de B2n , la expresión
∞
X (2x)2n
x cot x = (−1)n B2n , −π < x < π . (8.144)
n=0
(2n)!
Usando el método del residuo o trabajando a partir de la representación de producto

infinito de sen(x), encontramos que
∞
(−1)n−1 2(2n)! X 1
B2n = , n = 1, 2, 3 . . . . (8.145)
(2π)2n p=1
p 2n
Esta representación de los números de Bernoulli fue descubierta por Euler. Es fácil ver a
partir de la ecuación (8.145) que |B2n | aumenta sin lı́mite cuando n → ∞. Ilustrando el
comportamiento divergente de los números de Bernoulli, tenemos
B20 = −5.291 × 102
B200 = −3.647 × 10215 .
Algunos autores prefieren definir los números de Bernoulli con una versión modificada de la
ecuación (8.145) usando
∞
2(2n)! X 1
B2n = , (8.146)
(2π)2n p=1 p2n
el subı́ndice es justo la mitad de nuestro subı́ndice original y todos los signos son positivos.
Nuevamente, se debe chequear cuidadosamente la definición que se está usando de los números
de Bernoulli.
Los números de Bernoulli aparecen frecuentemente en teorı́a de números. El teorema de
von Standt-Clausen establece que
1 1 1 1
B2n = An − − − − ··· − , (8.147)
p1 p2 p3 pk
8.10. NÚMEROS DE BERNOULLI. 211
en el cual An es un entero y p1 , p2 , . . . pk son números primos tal que pi − 1 es un divisor de

2n. Podemos fácilmente verificar que esto se satisface para
B6 (A3 = 1, p = 2, 3, 7) ,
B8 (A4 = 1, p = 2, 3, 5) , (8.148)
B10 (A5 = 1, p = 2, 3, 11) ,
y otros casos especiales.
Los números de Bernoulli aparecen en la suma de potencias enteras de enteros,
N
X
jp , p entero.
j=1
y en numerosas expansiones de series de las funciones trascendentales, incluyendo tan x, cot x,

sen−1 x, ln | sen x|, ln | cos x|, ln | tan x|, tanh x, coth x y cosh−1 x. Por ejemplo,
x3 2 5 (−1)n−1 22n (22n − 1)B2n 2n−1
tan(x) = x + + x + ··· + x + ··· . (8.149)
3 15 (2n)!
Los números de Bernoulli probablemente vengan en tales expansiones en series a causa de las
ecuaciones de definición (8.137) y (8.143) y de su relación con la función zeta de Riemann
∞
X 1
ζ(2n) = . (8.150)
p=1
p2n
8.10.1. Funciones de Bernoulli.

Si la ecuación (8.137) puede ser fácilmente generalizada, tenemos
∞
xexs X xn
= Bn (s) . (8.151)
ex − 1 n=0 n!
definiendo las funciones de Bernoulli, Bn (s). Las primeras siete funciones de Bernoulli están
dadas en la tabla 8.2.
De la función generadora, ecuación (8.151),
Bn (0) = Bn , n = 1, 2, . . . . (8.152)
la función de Bernoulli evaluadas en cero es igual al correspondiente número de Bernoulli. Dos
propiedades particularmente importantes de las funciones de Bernoulli se deducen a partir
de la definición: una relación de diferenciación
Bn0 (s) = nBn−1 (s) , n = 1, 2, . . . . (8.153)
y una relación de simetrı́a
Bn (1) = (−1)n Bn (0) , n = 1, 2, . . . . (8.154)
Estas relaciones son usadas en el desarrollo de la fórmula de integración de Euler-Maclaurin.
B0 = 1
B1 = x − 12
B2 = x2 − x + 16
B3 = x3 − 23 x2 + 21 x
1
B4 = x4 − 2x3 + x2 − 30
B5 = x5 − 25 x4 + 35 x2 − 61 x
B6 = x6 − 3x5 + 52 x4 − 21 x2 + 1
42
Cuadro 8.2: Funciones de Bernoulli
8.10.2. Fórmula de integración de Euler-Maclaurin.

Uno de los usos de las funciones de Bernoulli es la derivación de la fórmula de integración
de Euler-Maclaurin. Esta fórmula es usada en el desarrollo de una expresión asintótica para
la función factorial, serie de Stirling. La técnica es integración por partes repetida, usando la
ecuación (8.153) para crear nuevas derivadas. Comenzamos con
Z 1 Z 1
f (x) dx = f (x)B0 (x) dx . (8.155)
0 0
A partir de la ecuación (8.153)

B10 (x) = B0 (x) = 1 . (8.156)
Sustituyendo B10 (x) en la ecuación (8.155) e integrando por partes, obtenemos
Z 1 Z 1
f (x) dx = f (1)B1 (1) − f (0)B1 (0) − f 0 (x)B1 (x) dx
0 0
Z 1 (8.157)
1
= [f (1) − f (0)] − f 0 (x)B1 (x) dx
2 0
Nuevamente, usando la ecuación (8.153), tenemos

1
B1 (x) = B20 (x) , (8.158)
2
e integrando por partes
Z 1
1 1
f (x) dx = [f (1) − f (0)] − [f 0 (1)B2 (1) − f 0 (0)B2 (0)]+
0 2 2!
Z 1 (8.159)
1
f (2) (x)B2 (x) dx .
2! 0
Usando las relaciones,
B2n (1) = B2n (0) = B2n , n = 0, 1, 2, . . .

(8.160)
B2n+1 (1) = B2n+1 (0) = 0 , n = 1, 2, 3, . . . ,
8.11. FUNCIÓN ZETA DE RIEMANN. 213
y continuando este proceso, tenemos

Z 1 q
1 X 1
f (x) dx = [f (1) − f (0)] − B2p [f (2p−1) (1) − f (2p−1) (0)]+
0 2 p=1
(2p)!
Z 1 (8.161)
1
+ f (2q) (x)B2q (x) dx .
(2p)! 0
Esta es la fórmula de integración de Euler-Maclaurin. Supone que la función f (x) tiene todas
las derivadas requeridas.
El intervalo de integración en la ecuación (8.161) puede ser trasladado de [0, 1] a [1, 2]
reemplazando f (x) por f (x + 1). Sumando tales resultados hasta [n − 1, n],
Z n
1 1
f (x) dx = f (0) + f (1) + f (2) + · · · + f (n − 1) + f (n)+
0 2 2
q Z 1 n−1
X 1 1 X
(2p−1) (2p−1)
− B2p [f (n) − f (0)] + B2q (x) f (2q) (x + ν) dx .
p=1
(2p)! (2p)! 0 ν=0
(8.162)
Los términos 21 f (0) + f (1) + . . . + 21 f (n) aparecen exactamente como una integración o
cuadratura trapezoidal. La suma sobre p puede ser interpretada como una corrección a la
aproximación trapezoidal. La ecuación (8.162) es la forma usada en la derivación de la fórmula
de Stirling.
La fórmula de Euler-Maclaurin es a menudo útil para sumar series al convertirlas en
integrales.
8.11. Función zeta de Riemann.

Estas series ∞ −2n
P
p=1 p fueron usadas como series de comparación para probar la con-
vergencia y en la ecuación (8.144) como una definición de los números de Bernoulli, B2n .
También sirve para definir la función zeta de Riemann por
∞
X 1
ζ(s) ≡ s
, s>1. (8.163)
n=1
n
La tabla 8.3 muestra los valores de ζ(s) para s entero, s = 2, 3, . . . , 10. La figura 8.10 es un
gráfico de ζ(s) − 1. Una expresión integral para esta función zeta de Riemann aparecerá como
parte del desarrollo de la función gama.
Otra interesante expresión para la función zeta puede ser derivada como

−s 1 1 1 1 1
ζ(s)(1 − 2 ) = 1 + s + s + · · · − + + + ··· (8.164)
2 3 2s 4s 6s
eliminando todos los n−s , donde n es un múltiplo de 2. Entonces
1 1 1 1
ζ(s)(1 − 2−s )(1 − 3−s ) = 1 + s + s + s + s + · · ·
3 5 7 9
1 1 1
(8.165)
− + + + ··· ,
3s 9s 15s
s ζ(s)
2 1.64493 40668
3 1.20205 69032
4 1.08232 32337
5 1.03692 77551
6 1.01734 30620
7 1.00834 92774
8 1.00407 73562
9 1.00200 83928
10 1.00099 45751
Cuadro 8.3: Función zeta de Riemann.

10
0.1 −s
2
ζ (s)−1
0.01
0.001
0.0001
0 2 4 6 8 10 12 14
s
Figura 8.10: Función zeta de Riemann, ζ(s) − 1, versus s.
eliminando todos los términos remanentes, donde n es un múltiplo de 3. Continuando, tene-

mos ζ(s)(1 − 2−s )(1 − 3−s )(1 − 5−s ) . . . (1 − P −s ), donde P es un número primo, y todos los
términos n−s , en el cual n es un múltiplo entero por sobre P , son cancelados. Para P → ∞,
∞
Y
−s −s −s
ζ(s)(1 − 2 )(1 − 3 ) · · · (1 − P ) = ζ(s) (1 − P −s ) = 1 . (8.166)
P (primo)=2
Por lo tanto  −1

∞
Y
ζ(s) =  (1 − P −s ) (8.167)
P (primo)=2
8.11. FUNCIÓN ZETA DE RIEMANN. 215
dando ζ(s) como un producto infinito.6

Este procedimiento de cancelación tiene una clara aplicación en el cálculo numérico. La
ecuación (8.164) dará ζ(s)(1 − 2−s ) con la misma precisión como la ecuación (8.163) da ζ(s),
pero solamente con la mitad de términos. (En cuyo caso, podrı́a hacerse una corrección para
despreciar la cola de la serie por la técnica de Maclaurin reemplazando la serie por una
integral).
Conjuntamente con la función zeta de Riemann, habitualmente se definen otras tres fun-
ciones de sumas de potencia recı́procas:
∞
X (−1)n−1
η(s) = = (1 − 21−s )ζ(s) ,
n=1
ns
∞
X 1 1
λ(s) = = 1− s ζ(s) ,
n=0
(2n + 1)s 2
y
∞
X 1
β(s) = (−1)n .
n=0
(2n + 1)s
A partir de los números de Bernoulli o de las series de Fourier podemos determinar algunos
valores especiales
1 1 π2
ζ(2) = 1 + + + · · · =
22 32 6
1 1 π4
ζ(4) = 1 + + + ··· =
24 34 90
1 1 π2
η(2) = 1 − + − · · · =
22 32 12
1 1 7π 4
η(4) = 1 − + − ··· =
24 34 720
1 1 π2
λ(2) = 1 + + + ··· =
32 52 8
1 1 π4
λ(4) = 1 + + + ··· =
34 54 96
1 1 π
β(1) = 1 − + − ··· =
3 5 4
1 1 π3
β(3) = 1 − + − · · · =
33 53 32
La constante de Catalán
1 1
β(2) = 1 − 2
+ 2 − · · · = 0.9159 6559 . . . ,
3 5
6
Este es el punto de partida para la vasta aplicación de la función zeta de Riemann a la teorı́a de números.
8.11.1. Mejoramiento de la convergencia.

Si requerimos sumar una serie convergente ∞
P
n=1 an cuyos términos son funciones racio-
nales de n, la convergencia puede ser mejorada dramáticamente introduciendo la función zeta
de Riemann.
Ejemplo Mejorando la convergencia.

∞
X 1 1 1 1
El problema es evaluar la serie 2
. Expandiendo 2
= 2 por
(1 + n ) (1 + n ) n 1
n=1 1+ 2
n
división directa, tenemos
n−6

1 1 1 1
= 2 1− 2 + 4 −
1 + n2 n n n 1 + n−2
1 1 1 1
= 2− 4+ 6− 8 .
n n n n + n6
Por lo tanto
∞ ∞
X 1 X 1
= ζ(2) − ζ(4) + ζ(6) − .
n=1
1 + n2 n=1
n 8 + n6
Las funciones ζ son conocidas y el remanente de la series converge como n−6 . Claramente, el
proceso puede ser continuado hasta cuando uno desee. Usted puede hacer una elección entre
cuánta álgebra hará y cuánta aritmética hará el computador.
Otros métodos para mejorar la efectividad computacional están dadas al final de la sección
8.2 y 8.4.
8.12. Series asintóticas o semi-convergentes.

Las series asintóticas aparecen frecuentemente en Fı́sica. En cálculo numérico ellas son
empleadas para el cálculo de una variedad de funciones. Consideremos aquı́ dos tipos de
integrales que conducen a series asintóticas: primero, una integral de la forma
Z ∞
I1 (x) = e−u f (u) du ,
x
donde la variable x aparece como el lı́mite inferior de una integral. Segundo, consideremos la
forma Z ∞ u
I2 (x) = e−u f du ,
0 x
con la función f expandible en serie de Taylor. Las series asintóticas a menudo ocurren como
solución de ecuaciones diferenciales. Un ejemplo de este tipo de series aparece como una de
las soluciones de la ecuación de Bessel.
8.12. SERIES ASINTÓTICAS O SEMI-CONVERGENTES. 217
8.12.1. Función gama incompleta.

La naturaleza de una serie asintótica es quizás mejor ilustrada por un ejemplo especı́fico.
Supongamos que tenemos una función integral exponencial7
Z x u
e
Ei(x) = du , (8.168)
−∞ u
o ∞
e−u
Z
− Ei(−x) = du = E1 (x) , (8.169)
x u
para ser evaluada para grandes valores de x. Mejor todavı́a, tomemos una generalización de
la función factorial incompleta (función gama incompleta),
Z ∞
I(x, p) = e−u u−p du = Γ(1 − p, x) , (8.170)
x
en la cual x y p son positivas. De nuevo, buscamos evaluarla para valores grandes de x.

Integrando por partes, obtenemos
Z ∞ Z ∞
e−x −u −p−1 e−x pe−x
I(x, p) = p − p e u du = p − p+1 + p(p + 1) e−u u−p−2 du (8.171)
x x x x x
Continuando para integrar por partes, desarrollamos la serie

−x 1 p p(p + 1) n−1 (p + n − 2)!
I(x, p) = e − + − · · · (−1) +
xp xp+1 xp+2 (p − 1)!xp+n−1
Z ∞ (8.172)
n (p + n − 1)!
+ (−1) e−u u−p−n du .
(p − 1)! x
Esta es una serie notable. Chequeando la convergencia por la prueba de D’ Alembert, encon-
tramos
|un+1 | (p + n)! 1
lı́m = lı́m
n→∞ |un | n→∞ (p + n − 1)! x
(p + n) (8.173)
= lı́m
n→∞ x
=∞
para todos los valores finitos de x. Por lo tanto nuestras series son series infinitas que divergen
en todas partes!. Antes de descartar la ecuación (8.172) como inútil, veamos cuan bien una
suma parcial dada se aproxima a la función factorial incompleta, I(x, p).
Z ∞
n+1 (p + n)!
= (−1) e−u u−p−n−1 du = Rn (x, p) . (8.174)
(p − 1)! x
7
Esta función ocurre con frecuencia en problemas astrofı́sicos que involucran gases con una distribución
de energı́a de Maxwell-Boltzmann.
En valor absoluto
Z ∞
(p + n)!
| I(x, p) − sn (x, p) | ≤ e−u u−p−n−1 du .
(p − 1)! x
Luego sustituimos u = v + x la integral se convierte en

Z ∞ Z ∞
−u −p−n−1 −x
e u du = e e−v (v + x)−p−n−1 dv
x 0
Z ∞
e−x v −p−n−1
= p+n+1 e−v 1 + dv .
x 0 x
Para x grande la integral final se aproxima a 1 y
(p + n)! e−x
| I(x, p) − sn (x, p) | ≈ . (8.175)
(p − 1)! xp+n+1
Esto significa que si tomamos un x suficientemente grande, nuestra suma parcial sn es arbi-
trariamente una buena aproximación a la función deseada I(x, p). Nuestra serie divergente,
por lo tanto, es perfectamente buena para cálculos de sumas parciales. Por esta razón algunas
veces es llamada serie semi-convergente. Notemos que la potencia de x en el denominador
del remanente (p + n + 1) es más alto que la potencia de x en último término incluido en
sn (x, p), (p + n).
Ya que el remanente Rn (x, p) alterna en signo, las sucesivas sumas parciales dan alterna-
damente cotas superiores e inferiores para I(x, p). El comportamiento de la serie (con p = 1)
como una función del número de términos incluidos es mostrado en la figura 8.11. Tenemos
0.21
0.19
sn (x=5)
0.1741
0.1704
0.17
0.1664
0.15
2 4 6 8 10
n

x
Figura 8.11: Sumas parciales de e E1 (x) .
x=5
∞
e−u
Z
x x
e E1 (x) = e du
x u (8.176)
1 1! 2! 3! n!
= sn (x) ≈ − 2 + 3 − 4 + · · · + (−1)n n+1 ,
x x x x x
8.12. SERIES ASINTÓTICAS O SEMI-CONVERGENTES. 219
la cual es evaluada en x = 5. Para un valor dado de x las sucesivas cotas superiores e inferiores
dadas por las sumas parciales primero convergen y luego divergen. La determinación óptima
de ex E1 (x) está dada por la aproximación más cercana de las cotas superiores e inferiores,
esto es, entre s4 = s6 = 0.1664 y s5 = 0.1741 para x = 5. Por lo tanto

x

0.1664 ≤ e E1 (x) ≤ 0.1741 . (8.177)
x=5
Realmente, a partir de las tablas,

x

e E1 (x) = 0.1704 , (8.178)
x=5
dentro de los lı́mites establecidos por nuestra expansión asintótica. Note cuidadosamente
que la inclusión de términos adicionales en la serie de expansión más allá del punto óptimo,
literalmente reduce la precisión de la representación.
Cuando aumentamos x, la diferencia entre la cota superior más baja y la cota inferior
más alta disminuirá. Tomando x suficientemente grande, uno podrı́a calcular ex E1 (x) para
cualquier grado de precisión deseado.
8.12.2. Integrales coseno y seno.

Las series asintóticas también pueden ser desarrolladas a partir de integrales definidas
si el integrando tiene el comportamiento requerido. Como un ejemplo, las integrales seno y
coseno están definidas por Z ∞
cos t
Ci(x) = − dt , (8.179)
x t
Z ∞
sen t
si(x) = − dt , (8.180)
x t
Combinando éstas con funciones trigonométricas regulares, podemos definir
Z ∞
sen(x)
f (x) = Ci(x) sen(x) − si(x) cos(x) = dy
0 y+x
Z ∞ (8.181)
cos(x)
g(x) = −Ci(x) cos(x) − si(x) sin(x) = dy
0 y+x
con la nueva variable y = t − x. Llevando a variable compleja, tenemos

Z ∞ iy
e
g(x) + if (x) = dy
0 y+x
Z ∞ −xu (8.182)
ie
= du
0 1 + iu
en el cual u = −iy/x. Los lı́mites de integración, 0 a ∞, a más que de 0 a −i∞, puede ser
justificado por el teorema de Cauchy. Racionalizando el denominador e igualando la parte
real y la parte imaginaria, obtenemos

∞
ue−xu
Z
g(x) = du ,
1 + u2
Z0 ∞ (8.183)
e−xu
f (x) = du .
0 1 + u2
La convergencia de las integrales requiere que Re(x) > 0.8

Ahora, desarrollamos la expansión asintótica, consideremos el cambio de variable v = xu
y expandimos el factor [1 + (v/x)2 ]−1 por el teorema del binomio. Tenemos
1 ∞ −v X v 2n
Z
1 X (2n)!
f (x) ≈ e (−1)n 2n dv = (−1)n 2n
x 0 0≤n≤N
x x 0≤n≤N x
Z ∞ 2n+1
(8.184)
1 −v
X
nv 1 X n (2n + 1)!
g(x) ≈ 2 e (−1) 2n
dv = 2 (−1) 2n
.
x 0 0≤n≤N
x x 0≤n≤N
x
De las ecuaciones (8.181) y (8.184)
sen(x) X (2n)! cos(x) X n (2n + 1)!

Ci(x) ≈ (−1)n 2n − (−1)
x 0≤n≤N x x2 0≤n≤N x2n
(8.185)
cos(x) X (2n)! sen(x) X (2n + 1)!
si(x) ≈ − (−1)n 2n − 2
(−1)n ,
x 0≤n≤N x x 0≤n≤N
x2n
las expansiones asintóticas deseadas.

La técnica de expandir el integrando de una integral definida e integrar término a término
lo volveremos a aplicar para desarrollar una expansión asintótica de la función de Bessel mo-
dificada Kv y también para las expansiones de las dos funciones hipergeométricas confluentes
M (a, c; x) y U (a, c; x).
8.12.3. Definición de series asintóticas.

El comportamiento de estas series (ecuaciones (8.172) y (8.185)) en consistencia con las
propiedades definidas para una serie asintótica9 . Siguiendo a Poincaré, tomamos
xn Rn (x) = xn [f (x) − sn (x)] , (8.186)
donde
a1 a2 an
+ 2 + ··· + n .
sn (x) = a0 + (8.187)
x x x
La expansión asintótica de f (x) tiene las propiedades que
lı́m xn Rn (x) = 0 , para n fijo, (8.188)

x→∞
8
La parte real.
9
No es necesario que las series asintóticas sean series de potencia.
8.13. PRODUCTOS INFINITOS. 221
y
lı́m xn Rn (x) = ∞ , para x fijo, (8.189)
n→∞
Vemos la ecuaciones (8.172) y (8.173) como un ejemplo de estas propiedades. Para series de
potencias, como las supuestas en la forma de sn (x), Rn (x) ∼ x−n−1 . Con condiciones (8.188)
y (8.189) satisfechas, escribimos
∞
X 1
f (x) ≈ an n . (8.190)
n=0
x
Notemos el uso de ≈ en lugar de =. La función f (x) es igual a la serie solamente en el lı́mite
cuando x → ∞.
Las expansiones asintóticas de dos funciones pueden ser multiplicadas entre sı́ y el resul-
tado será una expansión asintótica de un producto de dos funciones.
La expansión asintótica de una función dada f (t) puede ser integrada término a término
(justo como en una serie uniformemente convergente de una Rfunción continua) a partir de
∞
x ≤ t < ∞ y el resultado será una expansión asintótica de x f (t)dt. Una diferenciación
término a término, sin embargo, es válida solamente bajo condiciones muy especiales.
Algunas funciones no poseen una expansión asintótica; ex es un ejemplo de tales fun-
ciones. Sin embargo, si una función tiene una expansión asintótica, tiene solamente una.
La correspondencia no es uno a uno; muchas funciones pueden tener la misma expansión
asintótica.
Uno de los métodos más poderoso y útil de generar expansiones asintóticas, es el método
de steepest descents, será desarrollado más adelante. Las aplicaciones incluyen la derivación
de la fórmula de Stirling para la función factorial (completa) y las formas asintóticas de las
varias funciones de Bessel.
8.12.4. Aplicaciones a cálculo numérico.

Las series asintóticas son usadas frecuentemente en el cálculo de funciones por los compu-
tadores. Este es el caso de las funciones de Neumann N0 (x) y N1 (x), y las funciones modi-
ficadas de Bessel In (x) y Kn (x). Las series asintóticas para integrales del tipo exponencial,
ecuación (8.176), para las integrales de Fresnel, y para la función de error de Gauss, son usa-
das para la evaluación de estas integrales para valores grandes del argumento. Cuán grande
deberı́a ser el argumento depende de la precisión requerida.
8.13. Productos infinitos.

Consideremos una sucesión de factores positivos f1 · f2 · f3 · f4 · · · fn (fi > 0). Usando π
mayúscula para indicar el producto, tenemos
n
Y
f1 · f2 · f3 · f4 · · · fn = fi . (8.191)
i=1
Definimos pn , como el producto parcial, en analogı́a con sn la suma parcial,

Yn
pn = fi , (8.192)
i=1
y entonces investigamos el lı́mite

lı́m pn = P . (8.193)
n→∞
Si P es finito (pero no cero), decimos que el producto infinito es convergente. Si P es infinito

o cero, el producto infinito es etiquetado como divergente.
Ya que el producto divergerá a infinito si
lı́m fn > 1 (8.194)

n→∞
o a cero para
0 < lı́m fn < 1 , (8.195)
n→∞
es conveniente escribir nuestro producto como

∞
Y
(1 + an ) .
n=1
La condición an → 0 es entonces una condición necesaria (pero no suficiente) para la conver-

gencia.
El producto infinito puede ser relacionado a una serie infinita por el método obvio de
tomar el logaritmo
∞
Y X∞
ln (1 + an ) = ln(1 + an ) . (8.196)
n=1 n=1
Una relación más útil es probada por el siguiente teorema.
8.13.1. Convergencia de un producto infinito.

producto infinito ∞
Q Q∞ P∞
Si 0 ≤ an < 1, el P n=1 (1 + an ) y n=1 (1 − an ) converge si n=1 an
∞
converge y diverge si n=1 an diverge.
Considerando el término 1 + an , vemos que de la ecuación (8.80)
1 + an ≤ ean . (8.197)
Por lo tanto el producto parcial pn

pn ≤ esn , (8.198)
y haciendo n → ∞,
∞
Y ∞
X
(1 + an ) ≤ exp an . (8.199)
n=1 n=1
estableciendo una cota superior para el producto infinito.

Para desarrollar una cota más baja, notemos que
n
X n X
X n
pn = 1 + ai + ai aj + · · · > s n , (8.200)
i=1 i=1 j=1
8.13. PRODUCTOS INFINITOS. 223
ya que ai ≥ 0. De modo que

∞
Y ∞
X
(1 + an ) ≥ an . (8.201)
n=1 n=1
Si la suma infinita permanece finita, el producto infinito también lo hará. Si la suma infinita
diverge, también
Q lo hará el producto infinito.
El caso de (1−an ) es complicado por el signo negativo, pero una prueba de que depende
de la prueba anterior puede ser desarrollada notando que para an < 1/2 (recuerde que an → 0
para convergencia)
1
(1 − an ) ≤
1 + an
y
1
(1 − an ) ≥ . (8.202)
1 + 2an
8.13.2. Funciones seno, coseno y gama.

El lector reconocerá que un polinomio de orden n Pn (x) con n raı́ces reales puede ser
escrito como un producto de n factores:
n
Y
Pn (x) = (x − x1 )(x − x2 ) · · · (x − xn ) = (x − xi ) . (8.203)
i=1
De la misma manera podemos esperar que una función con un número infinito de raı́ces
pueda ser escrito como un producto infinito, un factor para cada raı́z. Esto es por cierto el
caso de las funciones trigonométricas. Tenemos dos representaciones muy útiles en productos
infinitos,
∞
x2
Y
sen(x) = x 1− 2 2 , (8.204)
n=1
nπ
∞
4x2
Y
cos(x) = 1− . (8.205)
n=1
(2n − 1)2 π 2
La más conveniente y quizás la más elegante derivación de estas dos expresiones es usando
variable compleja. Por nuestro teorema de convergencia, las ecuaciones (8.204) y (8.205) son
convergentes para todos los valores finitos de x. Especı́ficamente, para el producto infinito
para el sen(x), an = x2 /n2 π 2 ,
∞ ∞
X x2 X 1 x2
an = 2 = ζ(2)
π n=1 n2 π2
n=1 (8.206)
x2
= .
6
La serie correspondiente a la ecuación (8.205) se comporta en una manera similar.
La ecuación (8.204) conduce a dos resultados interesantes. Primero, si fijamos x = π/2,
obtenemos ∞ ∞
π Y (2n)2 − 1

πY 1
1= 1− = . (8.207)
2 n=1 (2n)2 2 n=1 (2n)2
Resolviendo para π/2, obtenemos

∞
(2n)2

π Y 2·2 4·4 6·6
= = · · ··· , (8.208)
2 n=1 (2n − 1)(2n + 1) 1·3 3·5 5·7
la cual es la famosa fórmula de Wallis para π/2.

El segundo resultado involucra la función factorial o función gama. Una definición de la
función gama es
−x −1
" ∞
#
Y x
Γ(x) = xeγx 1+ er , (8.209)
r=1
r
donde γ es la constante de Euler-Mascheroni, sección 8.2. Si tomamos el producto de Γ(x) y
Γ(−x), la ecuación (8.209) tiende a
" ∞ ∞
#−1
Y x −x −γx Y x x
Γ(x)Γ(−x) = − xeγx 1+ e r xe 1− er
r=1
r r=1
r
" ∞ #−1 (8.210)
x2
Y
= − x2 1− 2 .
r=1
r
Usando la ecuación (8.204) con x reemplazado por πx, obtenemos

π
Γ(x)Γ(−x) = − . (8.211)
x sen(πx)
Anticipando una relación de recurrencia desarrollada posteriormente, tenemos que usando

−xΓ(−x) = Γ(1 − x), la ecuación (8.211) puede ser escrita como
π
Γ(x)Γ(1 − x) = . (8.212)
sen(πx)
Esto será útil cuando tratamos la función gama.

Estrictamente hablando, podrı́amos chequear el intervalo en x para el cual la ecuación
(8.209) es convergente. Claramente, para x = 0, −1, −2, . . . los factores individuales se anulan.
La prueba que el producto infinito converge para todos los otros valores (finitos) de x es dejado
como ejercicio.
Estos productos infinitos tienen una variedad de usos en matemática analı́tica. Sin em-
bargo, a causa de su lentitud de convergencia, ellas no son aptas para un trabajo numérico
preciso.
Capı́tulo 9
Ecuaciones diferenciales.
versión final 2.1 7 de Julio del 20031
9.1. Ecuaciones diferenciales parciales, caracterı́sticas

y condiciones de borde.
En Fı́sica el conocimiento de la fuerza en una ecuación de movimiento usualmente conduce
a una ecuación diferencial. Por lo tanto, casi todas las partes elementales y numerosas par-
tes avanzadas de la Fı́sica teórica están formuladas en términos de ecuaciones diferenciales.
Algunas veces son ecuaciones diferenciales ordinarias en una variable (ODE). Más a menudo
las ecuaciones son ecuaciones diferenciales parciales (PDE) en dos o más variables.
Recordemos que la operación de tomar una derivada ordinaria o parcial, es una operación
lineal 2 (L)
d(aϕ(x) + bψ(x)) dϕ dψ
=a +b ,
dx dx dx
para ODE que involucran derivadas en una variable x solamente y no cuadráticas, (dψ/dx)2 ,
o potencias mayores. Similarmente, para derivadas parciales,
∂(aϕ(x, y) + bψ(x, y)) ∂ϕ(x, y) ∂ψ(x, y)

=a +b .
∂x ∂x ∂x
En general
L(aϕ + bψ) = aL(ϕ) + bL(ψ) . (9.1)
Ası́, las ODE y las PDE aparecen como ecuaciones de operadores lineales
L(ψ) = F ,
donde F es una función conocida de una (para ODE) o más variables (para PDE), L es una
combinación lineal de derivadas, ψ es una función o solución desconocida. Cualquier combi-
nación lineal de soluciones es de nuevo una solución; esto es el principio de superposición.
1
Este capı́tulo está basado en el octavo capı́tulo del libro: Mathematical Methods for Physicists, fourth
2
Estamos especialmente interesados en operadores lineales porque en mecánica cuántica las cantidades
fı́sicas están representadas por operadores lineales operando en un espacio complejo de Hilbert de dimensión
infinita.
225
226 CAPÍTULO 9. ECUACIONES DIFERENCIALES.
Ya que la dinámica de muchos sistemas fı́sicos involucran sólo dos derivadas, e.g., la ace-
leración en mecánica clásica y el operador de energı́a cinética, ∼ ∇2 , en mecánica cuántica,
las ecuaciones diferenciales de segundo orden ocurren más frecuentemente en Fı́sica. [Las
ecuaciones de Maxwell y de Dirac son de primer orden pero involucran dos funciones des-
conocidas. Eliminando una incógnita conducen a una ecuación diferencial de segundo orden
por la otra.]
9.1.1. Ejemplos de PDE.

Entre las PDE más frecuentemente encontradas tenemos:
1. La ecuación de Laplace, ∇2 ψ = 0. Esta ecuación muy común y muy importante aparece

en el estudio de
a. Fenómenos electromagnéticos incluyendo electroestáticos, dieléctricos, corrientes esta-

cionarias y magnetoestática.
b. Hidrodinámica (flujo irrotacional de lı́quidos perfectos y superficies de ondas).
c. Flujo de calor.
d. Gravitación.
2. La ecuación de Poisson, ∇2 ψ = −4πρ. En contraste a la ecuación homogénea de Laplace,

la ecuación de Poisson es no homogénea con un término de fuente −4πρ.
3. Las ecuaciones de onda (Helmholtz) y las ecuaciones de difusión tiempo independiente,
∇2 ψ ± k 2 ψ = 0. Estas ecuaciones aparecen en fenómenos tan diversos como
a. Ondas elásticas en sólidos, incluyendo cuerdas vibrantes, barras y membranas.
b. En sonido o acústica.
c. En ondas electromagnéticas.
d. En reactores nucleares.
4. La ecuación de difusión tiempo dependiente
1 ∂ψ
∇2 ψ = .
a2 ∂t
5. Las ecuaciones de onda tiempo dependiente,
1 ∂2ψ
∇2 ψ = .
c2 ∂t2
La forma cuadridimensional que involucra el D’Alembertiano, un análogo cuadridimensio-
nal del Laplaciano en el espacio Minkowski,
1 ∂2
∂ µ ∂µ = ∂ 2 = − ∇2 .
c2 ∂t2
Luego las ecuaciones de onda tiempo dependiente quedan ∂ 2 ψ = 0.
9.1. ECUACIONES DIFERENCIALES PARCIALES 227
6. La ecuación del potencial escalar, ∂ 2 ψ = 4πρ. Como la ecuación de Poisson esta ecuación
es no homogénea con un término de fuente 4πρ.
7. La ecuación de Klein-Gordon, ∂ 2 ψ = −µ2 ψ, y las correspondientes ecuaciones vectoriales

en las cuales la función escalar ψ es reemplazada por una función vectorial. Otras formas
complicadas son comunes.
8. La ecuación de onda de Schrödinger,

~2 2 ∂ψ
− ∇ ψ + V ψ = i~
2m ∂t
y
~2 2
− ∇ ψ + V ψ = Eψ ,
2m
para el caso tiempo independiente.
9. Las ecuaciones para ondas elásticas y lı́quidos viscosos y la ecuación telegráfica.
10. Ecuaciones diferenciales parciales acopladas de Maxwell para los campos eléctricos y
magnéticos son aquellas de Dirac para funciones de ondas relativistas del electrón.
Algunas técnicas generales para resolver PDE de segundo orden son discutidas en esta
sección:
1. Separación de variables, donde el PDE es separada en ODEs que están relacionadas
por constantes comunes las cuales aparecen como autovalores de operadores lineales,
Lψ = lψ, usualmente en una variable. La ecuación de Helmholtz dada como ejemplo
3 anteriormente tiene esta forma, donde el autovalor k 2 puede surgir por la separación
del tiempo t respecto de las variables espaciales. Como en el ejemplo 8, la energı́a E es
el autovalor que surge en la separación de t respecto de ~r en la ecuación de Schrödinger.
2. Conversión de una PDE en una ecuación integral usando funciones de Green que se
aplica a PDE no homogéneas tales como los ejemplos 2 y 6 dados más arriba.
3. Otros métodos analı́ticos tales como el uso de transformadas integrales que serán desa-
rrolladas en el próximo curso.
4. Cálculo numérico. El desarrollo de los computadores ha abierto una abundancia de

posibilidades basadas en el cálculo de diferencias finitas. Aquı́ también tenemos los
métodos de relajación. Métodos como Runge-Kutta y predictor-corrector son aplicados
a ODEs.
Ocasionalmente, encontramos ecuaciones de orden mayor. En ambos la teorı́a del movi-
miento suave de un lı́quido viscoso y la teorı́a de un cuerpo elástico encontramos la ecuación
(∇2 )2 ψ = 0 .
Afortunadamente, estas ecuaciones diferenciales de orden más altos son relativamente raras
y no son discutidas en una etapa introductoria como esta.
Aunque no son tan frecuentemente encontrados y quizás no son tan importantes como
las ecuaciones diferenciales de segundo orden, las ecuaciones diferenciales de primer orden
aparecen en Fı́sica teórica y algunas veces son pasos intermedios para ecuaciones diferenciales
de segundo orden. Las soluciones de algunos de los tipos más importantes de ODE de primer
orden son desarrollados en la sección 9.2. Las PDEs de primer orden siempre pueden ser
reducidas a ODEs. Este es un proceso directo pero lento e involucra una búsqueda para las
caracterı́sticas que son presentadas brevemente más adelante.
9.1.2. Clases de PDE y caracterı́stica.

Las PDEs de segundo orden forman tres clases:
(i) Las PDEs elı́pticas que involucran ∇2 o c−2 ∂ 2 /∂t2 + ∇2 .
(ii) Las PDEs parabólica, a∂/∂t − ∇2 .
(iii) Las PDEs hiperbólica, c−2 ∂ 2 /∂t2 − ∇2 .

Estos operadores canónicos aparecen por un cambio de variables ξ = ξ(x, y), η = η(x, y)
en un operador lineal (para dos variables sólo por simplicidad)
∂2 ∂2 ∂2 ∂ ∂
L=a 2
+ 2b + c 2
+d +e +f , (9.2)
∂x ∂x∂y ∂y ∂x ∂y
la cual puede ser reducida a las formas canónicas (i), (ii), (iii) de acuerdo a si el discriminante
D = ac − b2 > 0, = 0 o < 0. Si ξ(x, y) es determinada a partir de la ecuación de primer
orden, pero no lineal, PDE
2 2
∂ξ ∂ξ ∂ξ ∂ξ
a + 2b +c =0, (9.3)
∂x ∂x ∂y ∂y
donde los términos de más bajo orden en L son ignorados, entonces los coeficientes de ∂ 2 /∂ξ 2
en L es cero (i.e., ecuación (9.3)). Si η es una solución independiente de la misma ecuación
(9.3), entonces el coeficiente de ∂ 2 /∂η 2 también es cero. El operador remanente ∂ 2 /∂ξ∂η en L
es caracterı́stico del caso hiperbólico (iii) con D < 0, donde la forma cuadrática aλ2 + 2bλ + c
es factorizable y, por lo tanto, la ecuación (9.3) tiene dos soluciones independientes ξ(x, y),
η(x, y). En el caso elı́ptico (i) con D > 0 las dos soluciones ξ, η son complejos conjugados los
cuales, cuando se sustituyeron en la ecuación (9.2), remueven la derivada de segundo orden
mezclada en vez de los otros términos de segundo orden produciendo la forma canónica (i).
En el caso parabólico (ii) con D = 0, solamente ∂ 2 /∂ξ 2 permanece en L, mientras que los
coeficientes de las otras dos derivadas de segundo orden se anulan.
Si los coeficientes a, b, c en L son funciones de las coordenadas, entonces esta clasificación
es solamente local, i.e., su tipo podrı́a cambiar cuando las coordenadas varı́an.
Ilustremos la fı́sica implı́cita en el caso hiperbólico mirando la ecuación de onda (en 1 +
1 dimensiones por simplicidad)
1 ∂2 ∂2

− ψ=0. (9.4)
c2 ∂t2 ∂x2
9.1. ECUACIONES DIFERENCIALES PARCIALES 229
Ya que la ecuación (9.3) se convierte en

2 2
∂ξ 2 ∂ξ ∂ξ ∂ξ ∂ξ ∂ξ
−c = −c +c =0, (9.5)
∂t ∂x ∂t ∂x ∂t ∂x
y es factorizable, determinamos la solución de ∂ξ/∂t − c∂ξ/∂x = 0. Esta es una función
arbitraria ξ = F (x + ct), y ξ = G(x − ct) resuelve ∂ξ/∂t + c∂ξ/∂x = 0, la cual se verifica
rápidamente. Por superposición lineal una solución general de la ecuación (9.4) es la suma
ψ = F (x + ct) + G(x − ct). Para funciones periódicas F , G reconocemos los argumentos x + ct
y x − ct como la fase de la onda plana o frente de ondas, donde las soluciones de la ecuación
de onda (9.4) cambian abruptamente (de cero a sus valores actuales) y no están únicamente
determinadas. Normal al frente de onda están los rayos de la óptica geométrica. De este modo,
las soluciones de la ecuación (9.5) o (9.3) más generalmente, son llamadas caracterı́sticas o
algunas veces bicaracterı́sticas (para PDE de segundo orden) en la literatura matemática
corresponde a los frente de ondas de la solución de la óptica geométrica de la ecuación de
onda completa.
Para el caso elı́ptico consideremos la ecuación de Laplace
∂2ψ ∂2ψ
+ 2 =0, (9.6)
∂x2 ∂y
para un potencial ψ de dos variables. Aquı́ la ecuación caracterı́stica es
2 2
∂ξ ∂ξ ∂ξ ∂ξ ∂ξ ∂ξ
+ = +i −i =0 (9.7)
∂x ∂y ∂x ∂y ∂x ∂y
tiene soluciones complejas conjugadas: ξ = F (x+iy) para ∂ξ/∂x+i∂ξ/∂y = 0 y ξ = G(x−iy)
para ∂ξ/∂x−i∂ξ/∂y = 0. Una solución general de la ecuación de potencial (9.6) es por lo tanto
ψ = F (x+iy)+iG(x−iy) Tanto la parte real como la imaginaria de ψ, son llamadas funciones
armónicas, mientras que las soluciones polinomiales son llamadas polinomios armónicos.
En mecánica cuántica la forma de Wentzel-Kramers-Brillouin (WKB) de ψ = exp(−iS/~)
para la solución de la ecuación de Schröedinger
~2 2

∂ψ
− ∇ + V ψ = i~ , (9.8)
2m ∂t
conduce a la ecuación Hamilton-Jacobi de la mecánica clásica,
1 ~ 2 ∂S
(∇S) + V = , (9.9)
2m ∂t
en el lı́mite ~ → 0. La acción clásica de S entonces llega a ser la caracterı́stica de la ecuación
de Schröedinger. Sustituyendo ∇ψ ~ = −iψ ∇S/~,
~ ∂ψ/∂t = −iψ∂S/∂t/~ en la ecuación (9.8),
dejando la totalidad de los factores de ψ no nulos, y aproximando el Laplaciano ∇2 ψ =
−iψ∇2 S/~ − ψ(∇S)2 /~2 ' −ψ(∇S)2 , i.e., despreciando −i∇2 ψ/~, realmente obtenemos la
ecuación (9.9).
Resolver las caracterı́sticas es una de las técnicas generales de encontrar las soluciones
de PDE. Para más ejemplos y tratamientos detallados de las caracterı́sticas, las cuales no
perseguimos aquı́, nos referimos a H. Bateman, Partial Differential Equations of Mathematical
Physics. New York: Dover (1994); K.E. Gustafson, Partial Differential Equations and Hilbert
Space Methods, 2nd ed. New York: Wiley (1987).
9.1.3. Las PDE no lineales.

Las ODEs y PDEs no lineales son un campo importante y de rápido crecimiento. Encon-
tramos más arriba la ecuación de onda lineal más simple
∂ψ ∂ψ
+c =0,
∂t ∂x
como la PDE de primer orden a partir de la caracterı́stica de la ecuación de onda. La ecuación
de onda no lineal más simple
∂ψ ∂ψ
+ c(ψ) =0, (9.10)
∂t ∂x
resulta si la velocidad local de propagación, c, no es constante sino que depende de la onda ψ.
Cuando una ecuación no lineal tiene una solución de la forma ψ(x, t) = A cos(kx − ωt), donde
ω(k) varı́a con k tal que ω 00 (k) 6= 0, entonces ella es llamada dispersiva. Quizás la ecuación
dispersiva no lineal más conocida de segundo orden es la ecuación de Korteweg-de Vries
∂ψ ∂ψ ∂ 3 ψ
+ψ + =0, (9.11)
∂t ∂x ∂x3
la cual modela la propagación sin pérdidas de las ondas de agua superficiales y otros fenóme-
nos. Esta es ampliamente conocida por sus soluciones solitón. Un solitón es una onda viajera
con la propiedad de persistir a través de una interacción con otro solitón: después de que
ellos pasan uno a través del otro, ellos emergen en la misma forma y con la misma velocidad
y no adquieren más que un cambio de fase. Sea ψ(ξ = x − ct) tal onda viajera. Cuando es
sustituida en la ecuación (9.11) esta produce la ODE no lineal
dψ d3 ψ
(ψ − c) + 3 =0, (9.12)
dξ dξ
la cual puede ser integrada dando
d2 ψ ψ2
= cψ − . (9.13)
dξ 2 2
No hay constantes de integración aditivas en la ecuación (9.13) para asegurar que se satisfaga
la condición d2 ψ/dξ 2 → 0 con ψ → 0 para ξ grande, tal que ψ está localizado en la carac-
terı́stica ξ = 0, o x = ct. Multiplicando la ecuación (9.13) por dψ/dξ e integrando nuevamente
tenemos 2
dψ ψ3
= cψ 2 − , (9.14)
dξ 3
donde dψ/dξ → 0 para ξ grande. Tomando la raı́z de la ecuación (9.14) e integrando una vez
más encontramos la solución solitónica
3c
ψ(x − ct) = . (9.15)
√ x − ct

2
cosh c
2
9.2. ECUACIONES DIFERENCIALES DE PRIMER ORDEN. 231
9.1.4. Condiciones de borde.

Usualmente, cuando conocemos un sistema fı́sico en algún momento y la ley que rige ese
proceso fı́sico, entonces somos capaces de predecir el desarrollo subsecuente. Tales valores ini-
ciales son las más comunes condiciones de borde asociadas con ODEs y PDEs. Encontrando
soluciones que calcen con los puntos, curvas o superficies dados correspondientes al problema
de valores de contorno. Las autofunciones usualmente requieren que satisfagan ciertas condi-
ciones de borde impuestas (e.g., asintóticas). Estas condiciones pueden ser tomadas de tres
formas:
1. Condiciones de borde de Cauchy. El valor de una función y su derivada normal es-

pecificada en el borde. En electroestática estas significarı́an ϕ, el potencial, y En la
componente normal del campo eléctrico.
2. Condiciones de borde de Dirichlet. El valor especı́fico en el borde.
3. Condiciones de borde de Neumann. La derivada normal (gradiente normal) de una

función especı́fica en el borde. En el caso electrostático este serı́a En y por lo tanto σ,
la densidad de carga superficial.
Un resumen de las relaciones de estos tres tipos de condiciones de borde con los tres tipos
de ecuaciones diferenciales parciales bidimensionales están dadas en la tabla 9.1. Para discu-
siones más extensas de estas ecuaciones diferenciales parciales puede consultar Sommerfeld,
capı́tulo 2, o Morse y Feshbach, capı́tulo 6.
Partes de la tabla 9.1 son simplemente un asunto de mantener la consistencia interna, o
sentido común. Por ejemplo, para la ecuación de Poisson con una superficie cerrada, las con-
diciones de Dirichlet conducen a una solución única y estable. Las condiciones de Neumann,
independiente de las condiciones de Dirichlet, del mismo modo conducen a una solución única
y estable independiente de la solución de Dirichlet. Por lo tanto las condiciones de borde de
Cauchy (lo que significa la de Dirichlet más la de Neumann) conducen a una inconsistencia.
El término de condiciones de borde incluye como un caso especial el concepto de condi-
ciones iniciales. Por ejemplo, especificando la posición inicial x0 y la velocidad inicial v0 en
algunos problemas de dinámica corresponderı́a a condiciones de borde de Cauchy. La única
diferencia en el presente uso de las condiciones de borde en estos problemas unidimensionales
es que estamos aplicando las condiciones en ambos extremos del intervalo permitido de la
variable.
9.2. Ecuaciones diferenciales de primer orden.

La fı́sica involucra algunas ecuaciones diferenciales de primer orden, ellas fueron estudia-
das en el curso de ecuaciones diferenciales. Por completitud parece ser deseable revisarlas
brevemente.
Consideremos aquı́ ecuaciones diferenciales de la forma general
dy P (x, y)
= f (x, y) = − . (9.16)
dx Q(x, y)
Condiciones Tipo de ecuación diferencial parcial

de borde Elı́pticas Hiperbólicas Parabólicas
Laplace, Poisson Ecuación de Ondas Ecuación de difusión
en (x, y) en (x, t) en (x, t)
Cauchy
Superficie Abierta Resultados no fı́sicos Solución única Demasiado
(inestabilidades) y estable restrictivo
Superficie Cerrada Demasiado Demasiado Demasiado
restrictivo restrictivo restrictivo
Dirichlet
Superficie Abierta Insuficiente Insuficiente Solución única y
estable en 1 dim
Superficie Cerrada Solución única Solución no Demasiado
y estable única restrictivo
Neumann
Superficie Abierta Insuficiente Insuficiente Solución única y
estable en 1 dim
Superficie Cerrada Solución única Solución no Demasiado
y estable única restrictivo
Cuadro 9.1:
La ecuación (9.16) es claramente una ecuación de primer orden ordinaria. Es de primer orden
ya que contiene la primera derivada y no mayores. Es Ordinaria ya que la derivada dy/dx
es una derivada ordinaria o total. La ecuación (9.16) puede o no puede ser lineal, aunque
trataremos el caso lineal explı́citamente más adelante.
9.2.1. Variables separables.

Frecuentemente la ecuación (9.16) tendrá la forma especial
dy P (x)
= f (x, y) = − . (9.17)
dx Q(y)
Entonces la podemos reescribir como
P (x)dx + Q(y)dy = 0 .
Integrando de (x0 , y0 ) a (x, y) tiende a
Z x Z y
0 0
P (x )dx + Q(y 0 )dy 0 = 0 . (9.18)
x0 y0
Ya que los lı́mites inferiores x0 e y0 contribuyen en unas constantes, podrı́amos ignorar los
lı́mites inferiores de integración y simplemente añadir una constante de integración al final.
Note que esta técnica de separación de variables no requiere que la ecuación diferencial sea
lineal.
Ejemplo Ley de Boyle.

Una forma diferencial de la ley de los gases de Boyle es
dV V
=− ,
dP P
para el volumen V de una cantidad fija de gas a presión P (y temperatura constante). Sepa-
rando variables, tenemos
dV dP
=−
V P
o
ln V = − ln P + C .
Con dos logaritmos presentes, es más conveniente reescribir la constante de integración C
como ln k. Entonces
ln V + ln P = ln P V = ln k
y
PV = k .
9.2.2. Ecuaciones diferenciales exactas.

Reescribimos la ecuación (9.16) como
P (x, y)dx + Q(x, y)dy = 0 . (9.19)
Esta ecuación se dice que es exacta si podemos calzar el lado izquierdo de ella a un diferencial
dϕ,
∂ϕ ∂ϕ
dϕ = dx + dy . (9.20)
∂x ∂y
Ya que la ecuación (9.19) tiene un cero a la derecha, buscamos una función desconocida
ϕ(x, y) = constante, tal que dϕ = 0. Tenemos (si tal función ϕ(x, y) existe)
∂ϕ ∂ϕ
P (x, y)dx + Q(x, y)dy = dx + dy (9.21)
∂x ∂y
y
∂ϕ ∂ϕ
= P (x, y) , = Q(x, y) . (9.22)
∂x ∂y
La condición necesaria y suficiente para que la ecuación sea exacta es que la segunda derivada
parcial mezclada de ϕ(x, y) (supuesta continua) es independiente del orden de diferenciación:
∂2ϕ ∂P (x, y) ∂Q(x, y) ∂2ϕ

= = = . (9.23)
∂y∂x ∂y ∂x ∂x∂y
Si la ecuación (9.19) corresponde a un rotor (igual cero), entonces un potencial, ϕ(x, y),
debiera existir.
Si ϕ(x, y) existe entonces a partir de las ecuaciones (9.19) y (9.21) nuestra solución es
ϕ(x, y) = C . (9.24)
Podemos construir ϕ(x, y) a partir de sus derivadas parciales de la misma manera que cons-
truimos un potencial magnético vectorial en el capı́tulo de vectores a partir de su rotor.
Podemos volver a la ecuación (9.19) y ver qué pasa si no es exacta: la ecuación (9.23) no
es satisfecha. Sin embargo, siempre existe al menos una o quizás una infinidad de factores de
integración, α(x, y), tales que
α(x, y)P (x, y)dx + α(x, y)Q(x, y)dy = 0
es exacta. Desafortunadamente, un factor de integración no siempre es obvio o fácil de en-

contrar. Diferente es el caso de la ecuación diferencial de primer orden lineal considerada a
continuación, no hay una manera sistemática de desarrollar un factor de integración para la
ecuación (9.19).
Una ecuación diferencial en la cual las variables han sido separadas es automáticamente
exacta. Una ecuación diferencial exacta no es necesariamente separable.
9.2.3. Ecuaciones diferenciales ordinarias de primer orden lineales.

Si f (x, y) en la ecuación (9.16) tiene la forma −p(x)y + q(x), entonces la ecuación (9.16)
se convierte en
dy
+ p(x)y = q(x) . (9.25)
dx
La ecuación (9.25) es la ODE de primer orden lineal más general. Si q(x) = 0, la ecuación
(9.25) es homogénea (en y). Un q(x) distinto de cero puede representar una fuente o un
término de forzamiento. La ecuación (9.25) es lineal ; cada término es lineal en y o dy/dx.
No hay potencias mayores; esto es, no hay y 2 , ni productos, y(dy/dx). Note que la linealidad
se refiere a y y a la dy/dx; p(x) y q(x) no es necesario que sean lineales en x. La ecuación
(9.25), es la más importante de estas ecuaciones diferenciales de primer orden para los fı́sicos
y puede ser resuelta exactamente.
Busquemos un factor de integración α(x) tal que
dy
α(x) + α(x)p(x)y = α(x)q(x) , (9.26)
dx
puede ser reescrito como
d
[α(x)y] = α(x)q(x) . (9.27)
dx
El propósito de esto es hacer el lado izquierdo de la ecuación (9.25) una derivada total que
pueda ser integrada por inspección. Esto también, incidentalmente, hace la ecuación (9.25)
exacta. Expandiendo la ecuación (9.27), obtenemos
dy dα
α(x) + y = α(x)q(x) .
dx dx
La comparación con la ecuación (9.26) muestra que debemos requerir que

dα(x)
= α(x)p(x) . (9.28)
dx
Aquı́ hay una ecuación diferencial para α(x), con las variables α y x separables. Separamos
variables, integramos, y obtenemos
Z x
0 0
α(x) = exp p(x ) dx (9.29)
como nuestro factor de integración.

Con α(x) conocida procedemos a integrar la ecuación (9.27). Esto, por supuesto, fue el
objetivo de introducir α en primer lugar. Tenemos
Z x Z x
d 0 0
[α(x )y] dx = α(x0 )q(x0 ) dx0 .
dx0
Ahora integrando por inspección, tenemos
Z x
α(x)y = α(x0 )q(x0 ) dx0 + C .
Las constantes a partir del lı́mite inferior de integración constante son reunidas en la constante
C. Dividiendo por α(x), obtenemos
Z x
1 0 0 0
y(x) = α(x )q(x ) dx + C .
α(x)
Finalmente, sustituyendo en la ecuación (9.29) por α conduce
Z x Z x Z s
y(x) = exp − p(t) dt exp p(t) dt q(s) ds + C . (9.30)
Aquı́ las variables mudas de integración han sido reescritas para hacerlas inambiguas. La
ecuación (9.30) es la solución general completa de la ecuación diferencial lineal, de primer
orden, la ecuación (9.25). La porción
Z x
y1 (x) = C exp − p(t) dt (9.31)
corresponde al caso q(x) = 0 y es solución general de la ecuación diferencial homogénea. El

otro término en la ecuación (9.30),
Z x Z x Z s
y(x) = exp − p(t) dt exp p(t) dt q(s) ds , (9.32)
es una solución particular que corresponde al término especı́fico de fuente q(x).

Podemos notar que si nuestra ecuación diferencial de primer orden es homogénea (q = 0),
entonces ella es separable. De lo contrario, salvo casos especiales tal como p =constante,
q =constante, o q(x) = ap(x), la ecuación (9.25) no es separable.
Ejemplo Circuito RL.

Para un circuito resistencia-inductancia las leyes de Kirchhoff producen
dI(t)
L + RI(t) = V (t) ,
dt
para la corriente I(t), donde L es la inductancia y R es la resistencia, ambas constantes. V (t)

es el voltaje aplicado tiempo dependiente.
De la ecuación (9.29) nuestro factor de integración α(t) es
Z t
R
α(t) = exp dt
L
= eRt/L .
Entonces por la ecuación (9.30)

Z t
−Rt/L Rt/L V (t)
I(t) = e e dt + C ,
L
con la constante C es determinada por una condición inicial (una condición de borde).
Para el caso especial V (t) = V0 , una constante,

−Rt/L V0 L Rt/L
I(t) = e e +C
LR
V0
= + Ce−Rt/L .
R
Si la condición inicial es I(0) = 0, entonces C = −V0 /R y
V0
1 − e−Rt/L .

I(t) =
R
9.2.4. Conversión a una ecuación integral.

Nuestra ecuación diferencial de primer orden, ecuación (9.16), puede ser convertida a una
ecuación integral por integración directa:
Z x
y(x) − y(x0 ) = f [x, y(x)] dx . (9.33)
x0
Como una ecuación integral hay una posibilidad de una solución en serie de Neumann (se
verá en el próximo curso) con la aproximación inicial y(x) ≈ y(x0 ). En la literatura de
ecuaciones diferenciales esto es llamado el “método de Picard de aproximaciones sucesivas”.
Ecuaciones diferenciales de primer orden las encontraremos de nuevo en conexión con las
transformadas de Laplace y de Fourier.
9.3. SEPARACIÓN DE VARIABLES. 237
9.3. Separación de variables.

Las ecuaciones de la fı́sica matemática listada en la sección 9.1 son todas ecuaciones dife-
renciales parciales. Nuestra primera técnica para su solución es dividir la ecuación diferencial
parcial en n ecuaciones diferenciales ordinarias de n variables. Cada separación introduce
una constante de separación arbitraria. Si tenemos n variables, tenemos que introducir n − 1
constantes, determinadas por las condiciones impuestas al resolver el problema.
9.3.1. Coordenadas cartesianas.

En coordenadas cartesianas las ecuaciones de Helmholtz llegan a ser
∂2ψ ∂2ψ ∂2ψ

+ 2 + 2 + k2ψ = 0 , (9.34)
∂x2 ∂y ∂z
usando la forma cartesiana para el Laplaciano. Por el momento, k 2 será una constante. Quizás
la manera más simple de tratar una ecuación diferencial parcial tal como la ecuación (9.34)
es dividirla en un conjunto de ecuaciones diferenciales ordinarias. Esto puede ser hecho como
sigue. Sea
ψ(x, y, z) = X(x)Y (y)Z(z) , (9.35)
y sustituir de vuelta en la ecuación (9.34). ¿Cómo sabemos que la ecuación (9.35) es válida?.
La respuesta es muy simple: ¡No sabemos si es válida!. Mejor dicho, estamos procediendo en
este espı́ritu y tratando de ver si trabaja. Si nuestro intento es exitoso, entonces la ecuación
(9.35) será justificada. Si no es exitoso, lo descubriremos pronto y luego trataremos otro
ataque tal como las funciones de Green, transformadas integral, o análisis numérico a la
fuerza bruta. Con ψ supuestamente dada por la ecuación (9.35), la ecuación (9.34) llega a ser
d2 X d2 Y d2 Z
YZ + XZ + XY + k 2 XY Z = 0 . (9.36)
dx2 dy 2 dz 2
Dividiendo por ψ = XY Z y rearreglando los términos, obtenemos
1 d2 X 2 1 d2 Y 1 d2 Z
= −k − − . (9.37)
X dx2 Y dy 2 Z dz 2
La ecuación (9.37) exhibe una separación de variables. El lado izquierdo es sólo función de x,
mientras que el lado derecho depende solamente de y y z. Ası́ la ecuación (9.37) es una clase
de paradoja. Una función de x es igualada a una función de y y z, pero x, y y z son todas
coordenadas independientes. Esta independencia significa que el comportamiento de x como
una variable independiente no está determinada ni por y ni por z. La paradoja está resuelta
fijando cada lado igual a una constante, una constante de separación. Escogemos3
1 d2 X
= −l2 , (9.38)
X dx2
3
La elección de signo es completamente arbitraria, será fijada en un problema especı́fico por la necesidad
de satisfacer las condiciones de borde.
1 d2 Y 1 d2 Z
− k2 − 2
− 2
= −l2 . (9.39)
Y dy Z dz
Ahora, volviendo nuestra atención a la ecuación (9.39), obtenemos
1 d2 Y 2 2 1 d2 Z
= −k + l − , (9.40)
Y dy 2 Z dz 2
y una segunda separación ha sido realizada. Aquı́ tenemos una función de y igualada a una
función de z y aparece la misma paradoja. La resolvemos como antes igualando cada lado a
otra constante de separación, −m2 ,
1 d2 Y
= −m2 , (9.41)
Y dy 2
1 d2 Z
= −k 2 + l2 + m2 = −n2 , (9.42)
Z dz 2
introduciendo una constante n2 por k 2 = l2 + m2 + n2 para producir un conjunto simétrico de
ecuaciones. Ahora tenemos tres ecuaciones diferenciales ordinarias ((9.38), (9.41), y (9.42))
para reemplazar en la ecuación (9.34). Nuestra suposición (ecuación (9.35)) ha sido exitosa
y es por lo tanto justificada.
Nuestra solución serı́a etiquetada de acuerdo a la elección de nuestras constantes l, m, n,
esto es,
ψlmn (x, y, z) = Xl (x)Ym (y)Zn (z) . (9.43)
Sujeto a las condiciones del problema que se resuelve y a la condición k 2 = l2 + m2 + n2 ,
podemos escoger l, m, n como queramos, y la ecuación (9.43) será todavı́a una solución de la
ecuación (9.34), dado que Xl (x) es una solución de la ecuación (9.38) y ası́ seguimos. Podemos
desarrollar la solución más general de la ecuación (9.34) tomando una combinación lineal de
soluciones ψlmn , X
Ψ= almn ψlmn . (9.44)
l,m,n
Los coeficientes constantes almn finalmente son escogidos para permitir que Ψ satisfaga las
condiciones de borde del problema.
9.3.2. Coordenadas cilı́ndricas circulares.

Si consideramos que nuestra función desconocida ψ depende de ρ, ϕ, z la ecuación de
Helmholtz se convierte en
∇2 ψ(ρ, ϕ, z) + k 2 ψ(ρ, ϕ, z) = 0 , (9.45)
o
1 ∂2ψ ∂2ψ

1 ∂ ∂ψ
ρ + + 2 + k2ψ = 0 . (9.46)
ρ ∂ρ ∂ρ ρ2 ∂ϕ2 ∂z
Como antes, suponemos una forma factorizada para ψ,
ψ(ρ, ϕ, z) = P (ρ)Φ(ϕ)Z(z) . (9.47)

Sustituyendo en la ecuación (9.46), tenemos

P Z d2 Φ d2 Z

ΦZ d dP
ρ + 2 + P Φ + k 2 P ΦZ = 0 . (9.48)
ρ dρ dρ ρ dϕ2 dz 2
Todas las derivadas parciales han llegado a ser derivadas ordinarias. Dividiendo por P ΦZ y
moviendo la derivada z al lado derecho conduce a
1 d2 Φ 1 d2 Z

1 d dP 2
ρ + 2 + k = − . (9.49)
P ρ dρ dρ ρ Φ dϕ2 Z dz 2
De nuevo, tenemos la paradoja. Una función de z en la derecha aparece dependiendo de
una función de ρ y ϕ en el lado izquierdo. Resolvemos la paradoja haciendo cada lado de la
ecuación (9.49) igual a una constante, la misma constante. Escojamos4 −l2 . Entonces
d2 Z
= l2 Z , (9.50)
dz 2
y
1 d2 Φ

1 d dP
ρ + 2 + k 2 = −l2 . (9.51)
P ρ dρ dρ ρ Φ dϕ2
Ajustando k 2 + l2 = n2 , multiplicando por ρ2 , y reordenando términos, obtenemos
1 d2 Φ

ρ d dP
ρ + n 2 ρ2 = − . (9.52)
P dρ dρ Φ dϕ2
Podemos ajustar el lado derecho a m2 y
d2 Φ
2
= −m2 Φ (9.53)
dϕ
Finalmente, para la dependencia en ρ tenemos

d dP
ρ ρ + (n2 ρ2 − m2 )P = 0 . (9.54)
dρ dρ
Esta es la ecuación diferencial de Bessel. La solución y sus propiedades serán presentadas
en el próximo curso. La separación de variables de la ecuación de Laplace en coordenadas
parabólicas también conduce a ecuaciones de Bessel. Puede notarse que la ecuación de Bessel
es notable por la variedad de formas que puede asumir.
La ecuación original de Helmholtz, una ecuación diferencial parcial tridimensional, ha
sido reemplazada por tres ecuaciones diferenciales ordinarias, las ecuaciones (9.50), (9.53) y
(9.54). Una solución de la ecuación de Helmholtz es
ψ(ρ, ϕ, z) = P (ρ)Φ(ϕ)Z(z) . (9.55)
Identificando las soluciones especı́ficas P , Φ, Z por subı́ndices, vemos que la solución más
general de la ecuación de Helmholtz es una combinación lineal del producto de soluciones:
X
ψ(ρ, ϕ, z) = amn Pmn (ρ)Φm (ϕ)Zn (z) . (9.56)
m,n
4
La elección del signo de la constante de separación es arbitraria. Sin embargo, elegimos un signo menos
para la coordenada axial z en espera de una posible dependencia exponencial en z. Un signo positivo es
elegido para la coordenada azimutal ϕ en espera de una dependencia periódica en ϕ.
9.3.3. Coordenadas polares esféricas.

Tratemos de separar la ecuación de Helmholtz, de nuevo con k 2 constante, en coordenadas
polares esféricas. Usando la expresión del Laplaciano en estas coordenadas obtenemos
1 ∂2ψ

1 ∂ 2 ∂ψ ∂ ∂ψ
sen θ r + sen θ + = −k 2 ψ . (9.57)
r2 sen θ ∂r ∂r ∂θ ∂θ sen θ ∂ϕ2
Ahora, en analogı́a con la ecuación (9.35) tratamos
ψ(r, θ, ϕ) = R(r)Θ(θ)Φ(ϕ) . (9.58)
Sustituyendo de vuelta en la ecuación (9.57) y dividiendo por RΘΦ, tenemos

d2 Φ

1 d 2 dR 1 d dΘ 1
r + sen θ + = k2 . (9.59)
Rr2 dr dr Θr2 sen θ dθ dθ Φr2 sen2 θ dϕ2
Note que todas las derivadas son ahora derivadas ordinarias más que parciales. Multiplicando
por r2 sen2 θ, podemos aislar (1/Φ)(d2 Φ/dϕ2 ) para obtener5
1 d2 Φ

2 2 2 1 d 2 dR 1 d dΘ
= r sen θ −k − 2 r − 2 sen θ . (9.60)
Φ dϕ2 r R dr dr r sen θΘ dθ dθ
La ecuación (9.60) relaciona una función únicamente de ϕ con una función de r y θ. Ya
que r, θ, y ϕ son variables independientes, igualamos cada lado de la ecuación (9.60) a una
constante. Aquı́ una pequeña consideración puede simplificar el análisis posterior. En casi
todos los problemas fı́sicos ϕ aparecerá como un ángulo azimutal. Esto sugiere una solución
periódica más que una exponencial. Con esto en mente, usemos −m2 como la constante de
separación. Cualquier constante lo hará, pero ésta hará la vida un poquito más fácil. Entonces
1 d2 Φ
= −m2 (9.61)
Φ dϕ2
y
m2

1 d 2 dR 1 d dΘ
2
r + 2 sen θ − = −k 2 . (9.62)
r R dr dr r sen θΘ dθ dθ r2 sen2 θ
Multiplicando la ecuación (9.62) por r2 y reordenando términos, tenemos
m2

1 d 2 dR 2 2 1 d dΘ
r +r k =− sen θ + . (9.63)
R dr dr sen θΘ dθ dθ sen2 θ
Nuevamente, las variables son separadas. Igualamos cada lado a una constante Q y finalmente
obtenemos
m2

1 d dΘ
sen θ − Θ + QΘ = 0 , (9.64)
sen θ dθ dθ sen2 θ

1 d 2 dR QR
2
r + k2R − 2 = 0 . (9.65)
r dr dr r
5
El orden en el cual las variables son separadas aquı́ no es único. Muchos textos de mecánica cuántica
separan la dependencia en r primero.
Una vez más hemos reemplazado una ecuación diferencial parcial de tres variables por tres
ecuaciones diferenciales ordinarias. Las soluciones de estas tres ecuaciones diferenciales or-
dinarias son discutidas en el próximo curso. Por ejemplo, la ecuación (9.64) es identificada
como la ecuación de asociada de Legendre en la cual la constante Q llega a ser l(l + 1); con l
entero. Si k 2 es una constante (positiva), la ecuación (9.65) llega a ser la ecuación de Bessel
esférica.
Nuevamente, nuestra solución más general puede ser escrita
X
ψQm (r, θ, ϕ) = RQ (r)ΘQm (θ)Φm (ϕ) . (9.66)
q,m
La restricción que k 2 sea una constante es innecesariamente severa. El proceso de separación

será todavı́a posible para k 2 tan general como
1 1 2
k 2 = f (r) + g(θ) + h(ϕ) + k 0 . (9.67)
r2 r2 sen2 θ
En el problema del átomo de hidrógeno, uno de los ejemplos más importantes de la ecuación
de onda de Schrödinger con una forma cerrada de solución es k 2 = f (r). La ecuación (9.65)
para el átomo de hidrógeno llega a ser la ecuación asociada de Laguerre.
La gran importancia de esta separación de variables en coordenadas polares esféricas
deriva del hecho que el caso k 2 = k 2 (r) cubre una tremenda cantidad de fı́sica: las teorı́as de
gravitación, electroestática, fı́sica atómica y fı́sica nuclear. Y, con k 2 = k 2 (r), la dependencia
angular es aislada en las ecuaciones (9.61) y (9.64), la cual puede ser resuelta exactamente.
Finalmente, una ilustración de cómo la constante m en la ecuación (9.61) es restringida,
notamos que ϕ en coordenadas polares esféricas y cilı́ndricas es un ángulo azimutal. Si esto es
un problema clásico, ciertamente requeriremos que la solución azimutal Φ(ϕ) sea univaluada,
esto es,
Φ(ϕ + 2π) = Φ(ϕ) . (9.68)
Esto es equivalente a requerir que la solución azimutal tenga un perı́odo de 2π o algún
múltiplo entero de él. Por lo tanto m debe ser un entero. Cuál entero, depende de los detalles
del problema. Cada vez que una coordenada corresponda a un eje de translación o a un
ángulo azimutal la ecuación separada siempre tendrá la forma
d2 Φ(ϕ)
2
= −m2 Φ(ϕ)
dϕ
para ϕ, el ángulo azimutal, y
d2 Z
= ±a2 Z(z) (9.69)
dz 2
para z, un eje de traslación en un sistema de coordenadas cilı́ndrico. Las soluciones, por su-
puesto, son sen az y cos az para −a2 y la correspondiente función hiperbólica (o exponencial)
senh az y cosh az para +a2 .
Otras ecuaciones diferenciales ordinarias encontradas ocasionalmente incluyen las ecua-
ciones de Laguerre y la asociada de Laguerre del importante problema del átomo de hidrógeno
en mecánica cuántica:
d2 y dy
x 2 + (1 − x) + αy = 0 , (9.70)
dx dx
d2 y dy
x 2
+ (1 + k − x) + αy = 0 . (9.71)
dx dx
De la teorı́a de la mecánica cuántica del oscilador armónico lineal tenemos la ecuación de
Hermite,
d2 y dy
2
− 2x + 2αy = 0 . (9.72)
dx dx
Finalmente, de vez en vez encontramos la ecuación diferencial de Chebyshev
d2 y dy
(1 − x2 ) 2
− x + n2 y = 0 . (9.73)
dx dx
Para una referencia conveniente, las formas de la solución de la ecuación de Laplace, la ecua-
ción de Helmholtz y la ecuación de difusión en coordenadas polares esféricas son resumidas
en la tabla 9.2. Las soluciones de la ecuación de Laplace en coordenadas circulares cilı́ndricas
son representadas en la tabla 9.3.
X
ψ= alm ψlm
l,m

2 rl Plm (cos θ) cos mϕ
1. ∇ ψ=0 ψlm =
r−l−1 Qm
l (cos θ) sen mϕ

2 2 jl (kr) Plm (cos θ) cos mϕ
2. ∇ ψ+k ψ =0 ψlm =
nl (kr) Qm
l (cos θ) sen mϕ

il (kr) Plm (cos θ) cos mϕ
3. ∇2 ψ − k 2 ψ = 0 ψlm =
kl (kr) Qm
l (cos θ) sen mϕ
Cuadro 9.2: Soluciones en coordenadas polares esféricas
X
ψ= amα ψmα , ∇2 ψ = 0
m,α
e−αz

Jm (αρ) cos mϕ
a. ψmα =
Nm (αρ) sen mϕ eαz

Im (αρ) cos mϕ cos αz
b. ψmα =
Km (αρ) sin mϕ sen αz

α = 0 (no hay ρm cos mϕ
c. ψm =
dependencia en z) ρ−m sen mϕ
Cuadro 9.3: Soluciones en coordenadas cilı́ndricas circulares

Para las ecuaciones de Helmholtz y de difusión la constante ±k 2 se agrega a la constante

de separación ±α2 para definir un nuevo parámetro γ 2 o −γ 2 . Para la elección de +γ 2 (con
γ 2 > 0) obtenemos Jm (γρ) y Nm (γρ). Para la elección −γ 2 (con γ 2 > 0) obtenemos Im (γρ)
y Km (γρ) como previamente.
Estas ecuaciones diferenciales ordinarias y sus generalizaciones serán examinadas y siste-
matizadas en el próximo curso.

Análisis Tensorial 2

Cargado por

Información del documentohacer clic para expandir la información del documento

Copyright:

Formatos disponibles

Análisis Tensorial 2

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Análisis Tensorial 2

Cargado por

Copyright:

Formatos disponibles

Departamento de Fı́sica, Facultad de Ciencias, Universidad de Chile.

Las Palmeras 3425, Ñuñoa. Casilla 653, Correo 1, Santiago

2. Operadores en campos escalares y vectoriales. 19

3. Sistemas de Coordenadas Curvilı́neos. 41

3.4.2. Geometrı́a diferencial. . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

5. Sistema de coordenadas no ortogonales. 85

6. Determinantes y matrices. 107

6.5. Diagonalización de matrices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

7. Teorı́a de grupo. 145

8. Series infinitas. 175

8.9.3. Valores lı́mites. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208

9. Ecuaciones diferenciales. 225

1.1. El sistema Cartesiano estandard . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.1. Equipotenciales y lı́neas de campo eléctrico de dos lı́neas paralelas de carga. . 20

3.1. El vector posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.1. Sistemas rotados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.4. Sistema de la mano derecha. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

5.1. Los sistemas de coordenadas de la Relatividad Especial. . . . . . . . . . . . . . 88

6.1. Sistemas de coordenadas cartesianos. . . . . . . . . . . . . . . . . . . . . . . . 121

7.1. Ilustración de la ecuación (7.13). . . . . . . . . . . . . . . . . . . . . . . . . . . 150

8.1. Prueba de comparación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

Una breve revisión de álgebra lineal.

Cuadro 1.1: Notación

Un vector tridimensional ~v puede ser expresado como

~v = vx êx + vy êy + vz êz , (1.1)

La ecuación (1.1) se transforma en

~v = v1 ê1 + v2 ê2 + v3 ê3 , (1.3)

Nos referimos a la combinación de los subı́ndices y la convención de suma como la notación

Imaginemos ahora que queremos escribir una simple relación vectorial

La multiplicación de la ecuación (1.10) puede ser escrita, en la notación matricial abreviada,

Mij Njk = Pik , (1.12)

~v = 1ê1 + 3ê2 + 2ê3 . (1.13)

1.2. Operaciones vectoriales.

1.2.1. Rotación de vectores.

~a 0 = a cos(θ + φ) ê1 + a sen(θ + φ) ê2 . (1.18)

Si nosotros representamos a ~a y ~a 0 como matrices columna.

La ecuación (1.19) puede ser puesta en forma de arreglo matricial

En notación matricial abreviada, la podemos escribir como

[a0 ] = [R(φ)] [a] . (1.22)

Escritos usando arreglos de matrices, estas expresiones llegan a ser

Es fácil ver que la ecuación (1.25) es enteramente equivalente a la ecuación (1.21).

a0i = Rij aj . (1.26)

porque el subı́ndice i permanece sobre el LD después de contraer sobre j, mientras en el LI

1.2.2. Productos vectoriales.

Notemos que hemos ocupados dos ı́ndices en A ~ y B,

porque no hay subı́ndices en el LD, y ninguno en el LI después de las contracciones sobre

Cuando nos familiaricemos con la notación de Einstein y la delta de Kronecker, estos

Mij (Ak δik ) = Mij Ai

~ y enrollelos apuntando hacia B,

Figura 1.4: El producto cruz.

Expandiendo el determinante de la ecuación (1.49) tenemos

donde ijk es definido como

Figura 1.5: El arreglo de 3 × 3 × 3 de Levi-Civita

El producto cruz, escrito usando notación de Einstein en la ecuación (1.51), y el producto

1.2.3. Cálculos usando notación de Einstein.

A ~ 0 = [A]† [R(φ)]† [R(φ)] [A] .

El producto entre las dos matrices de rotación puede realizarse

y la ecuación (1.56) llega a ser

donde ijk es definido como

ijk = −ikj = jki . (1.77)