Física Matemática - Rudi Gaelzer

F ÍSICA -M ATEMÁTICA
R UDI G AELZER (I NSTITUTO DE F ÍSICA - UFRGS)
Apostila preparada para as disciplinas de Física-

Matemática ministradas para os Cursos de Ba-
charelado em Física do Instituto de Física da
Universidade Federal do Rio Grande do Sul,
Porto Alegre - RS.
Início: M AIO DE 2006 Impresso: 29 de agosto de 2018

Apostila escrita com: Referências bibliográficas:
P ROCESSADOR DE D OCUMENTOS S ISTEMA biblatex
LYX http://ctan.org/pkg/biblatex
http://www.lyx.org/ https://github.com/plk/biblatex
http://wiki.lyx.org/LyX/LyX
S UMÁRIO
1 Sistemas de Coordenadas Curvilíneas Ortogonais 1

1.1 Coordenadas curvilíneas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Coordenadas curvilíneas ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Análise vetorial em sistemas de coordenadas curvilíneas ortogonais . . . . . . . . . . 6
1.3.1 Álgebra vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3.2 Integrais de caminho, de superfície e de volume . . . . . . . . . . . . . . . . . . 7
1.4 Operadores vetoriais diferenciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4.1 Gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4.2 Divergente e laplaciano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4.3 Rotacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.5 Sistemas de coordenadas curvilíneas ortogonais . . . . . . . . . . . . . . . . . . . . . 13
1.5.1 Coordenadas polares cilíndricas . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.5.2 Coordenadas polares esféricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.5.3 Coordenadas elípticas cilíndricas . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.6 Linhas de força e superfícies equipotenciais . . . . . . . . . . . . . . . . . . . . . . . . 19
1.6.1 Linhas de força de um campo vetorial . . . . . . . . . . . . . . . . . . . . . . . . 19
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2 Funções de Uma Variável Complexa 23

2.1 Números e variáveis complexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.1.1 Representações vetorial e polar . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.1.2 Fórmula de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2 Álgebra de números complexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2.1 Fórmula de Moivre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2.2 Raízes de números complexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3 Funções de uma variável complexa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3.1 Transformações ou mapeamentos . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3.2 Pontos de ramificação, linhas de ramificação e superfícies de Riemann . . . . 31
2.3.3 Exemplos de funções unívocas ou plurívocas . . . . . . . . . . . . . . . . . . . 32
2.4 O cálculo diferencial de funções de uma variável complexa . . . . . . . . . . . . . . . 33
2.4.1 Limite de uma função complexa . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4.2 Continuidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4.3 Derivadas de funções complexas . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4.4 As condições de Cauchy-Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4.5 Funções analíticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.4.6 Funções harmônicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.4.7 Pontos singulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.5 Integração no plano complexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.5.1 Integrais de caminho no plano complexo . . . . . . . . . . . . . . . . . . . . . . 41
2.5.2 Propriedades matemáticas das integrais de linha . . . . . . . . . . . . . . . . . 42
2.5.3 Tipos de curvas e domínios no plano complexo . . . . . . . . . . . . . . . . . . 43
2.5.3.1 Tipos de curvas no plano complexo . . . . . . . . . . . . . . . . . . . . 43
2.5.3.2 Domínios simplesmente ou multiplamente conexos . . . . . . . . . . . 43
2.5.3.3 Convenção para o percurso de um contorno fechado . . . . . . . . . . 44
2.6 O teorema de Cauchy-Goursat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
i
ii
2.6.1 O teorema de Green no plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

2.6.2 O teorema de Cauchy-Goursat . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.7 Fórmulas integrais de Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.8 Representação em séries de funções analíticas . . . . . . . . . . . . . . . . . . . . . . 50
2.8.1 Séries complexas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.8.1.1 Convergência da série . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.8.1.2 Convergência absoluta . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.8.1.3 Convergência uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.8.2 Testes de convergência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.8.2.1 Testes de convergência absoluta . . . . . . . . . . . . . . . . . . . . . . 52
2.8.2.2 Teste de convergência uniforme . . . . . . . . . . . . . . . . . . . . . . 52
2.8.3 Séries de potências e séries de Taylor . . . . . . . . . . . . . . . . . . . . . . . . 53
2.8.4 Séries de Taylor de funções elementares . . . . . . . . . . . . . . . . . . . . . . 55
2.8.5 Séries de Laurent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.8.6 Teoremas de existência e unicidade . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.8.7 Algumas técnicas de construção de séries de Taylor e Laurent . . . . . . . . . 57
2.8.8 Séries de Laurent de funções elementares . . . . . . . . . . . . . . . . . . . . . 59
2.8.9 Classificação de singularidades . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.8.9.1 Polos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.8.9.2 Singularidades essenciais . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.8.9.3 Singularidades removíveis . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.9 Integração no plano complexo pelo método dos resíduos . . . . . . . . . . . . . . . . . 60
2.9.1 Resíduos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.9.2 Teorema dos resíduos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.9.3 Cálculo de resíduos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.9.3.1 Primeiro método: direto da definição . . . . . . . . . . . . . . . . . . . 62
2.9.3.2 Segundo método: polos de ordem m em z = z0 . . . . . . . . . . . . . 63
2.9.3.3 Terceiro método: resíduo de uma função racional . . . . . . . . . . . . 64
2.9.3.4 Quarto método: pelo desevolvimento em série de Laurent . . . . . . . 64
2.9.4 Cálculo de integrais definidas ou impróprias . . . . . . . . . . . . . . . . . . . . 65
2.9.4.1 Integrais do tipo I: funções racionais . . . . . . . . . . . . . . . . . . . 65
2.9.4.2 Integrais do tipo II: funções racionais de funções trigonométricas . . 67
2.9.4.3 Integrais do tipo III: integrais de Fourier . . . . . . . . . . . . . . . . . 68
2.9.4.4 Integrais do tipo IV: integrando com polos no eixo real . . . . . . . . . 69
2.9.4.5 Integrais do tipo V: integração ao longo de linhas de ramificação . . . 72
2.9.4.6 Outros tipos de integrais . . . . . . . . . . . . . . . . . . . . . . . . . . 74
2.10 Continuação analítica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3 Teoria de Grupos Abstratos 81

3.1 Definições e classificações iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.1.1 Classificação dos grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3.1.2 Exemplos de grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3.1.2.1 Grupos infinitos discretos . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.1.2.2 Grupos contínuos compactos . . . . . . . . . . . . . . . . . . . . . . . . 85
3.1.2.3 Grupos contínuos não compactos . . . . . . . . . . . . . . . . . . . . . 86
3.1.2.4 Grupos finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
3.2 Grupos finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
3.2.1 Tabela de multiplicação de grupo . . . . . . . . . . . . . . . . . . . . . . . . . . 88
3.2.2 Grupo cíclico Cn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.2.3 O Grupo simétrico Sn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.2.3.1 Verificação dos axiomas de grupo . . . . . . . . . . . . . . . . . . . . . 92
3.2.3.2 Notação de ciclos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
3.3 Subgrupos, classes laterais e de conjugação . . . . . . . . . . . . . . . . . . . . . . . . 95
3.3.1 Subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3.3.2 Classes laterais e o teorema de Lagrange . . . . . . . . . . . . . . . . . . . . . . 96
3.3.3 Classes de conjugação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.3.4 Subgrupos invariantes e grupo fator . . . . . . . . . . . . . . . . . . . . . . . . 101
3.4 Grupos de simetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Autor: Rudi Gaelzer – IF/UFRGS Impresso: 29 DE AGOSTO DE 2018

iii
3.4.1 Grupos cristalográficos pontuais . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

3.4.2 Projeções estereográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
3.4.3 Grupos cristalográficos espaciais . . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.5 Produto direto de grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
3.6 Mapeamentos entre grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
3.6.1 Funções e mapeamentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
3.6.2 Mapeamento entre grupos e homomorfismo . . . . . . . . . . . . . . . . . . . . 115
3.7 Estruturas algébricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
3.7.1 Estruturas compostas por um conjunto com operações . . . . . . . . . . . . . 121
3.7.1.1 Estruturas do tipo grupo . . . . . . . . . . . . . . . . . . . . . . . . . . 121
3.7.1.2 Estruturas do tipo anel . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
3.7.2 Estruturas do tipo Módulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
3.7.3 Estruturas do tipo álgebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
4 Espaços Vetoriais 127

4.1 Espaço vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.2 Subespaços vetoriais e subespaços complementares . . . . . . . . . . . . . . . . . . . 128
4.2.1 Subespaço soma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
4.2.2 Subespaços complementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.3 Bases de um espaço vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.3.1 Transformação de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
4.4 Mapeamentos entre espaços vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
4.5 Subespaços invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
4.6 Espaço vetorial normado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
4.7 Espaço com produto interno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
4.7.1 Espaço real com produto interno . . . . . . . . . . . . . . . . . . . . . . . . . . 137
4.7.2 Espaço complexo com produto interno . . . . . . . . . . . . . . . . . . . . . . . 138
4.7.3 Norma de um vetor induzida pelo produto interno . . . . . . . . . . . . . . . . 138
4.7.4 Bases ortonormais em espaços normados com produto interno . . . . . . . . 139
4.7.5 Operadores lineares em espaços com produto interno . . . . . . . . . . . . . . 140
4.8 Elementos de espaços métricos e topologia . . . . . . . . . . . . . . . . . . . . . . . . 141
4.9 Espaço vetorial métrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
4.9.1 Espaço vetorial métrico com norma. . . . . . . . . . . . . . . . . . . . . . . . . 144
4.9.2 Espaço de Banach. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
4.9.3 Espaço vetorial dual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
4.9.4 Espaço de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
4.9.5 Espaço afim . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
5 Teoria de Representações de Grupos 153

5.1 Primeiras definições e representações . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
5.1.1 Vetores e funções de base e representações regulares . . . . . . . . . . . . . . 155
5.1.2 Representação natural . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
5.2 Representações de grupos de transformações lineares . . . . . . . . . . . . . . . . . . 158
5.2.1 Espaços vetoriais e operadores na mecânica quântica . . . . . . . . . . . . . . 159
5.2.2 Espaços vetoriais e suas representações . . . . . . . . . . . . . . . . . . . . . . 160
5.3 Representações equivalentes e caracteres . . . . . . . . . . . . . . . . . . . . . . . . . 161
5.4 Soma e produto diretos de matrizes e representações . . . . . . . . . . . . . . . . . . 162
5.4.1 Soma direta de matrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
5.4.2 Soma direta de representações . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
5.4.3 Produto direto de matrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
5.4.4 Produto direto de representações . . . . . . . . . . . . . . . . . . . . . . . . . . 168
5.5 Representações redutíveis ou irredutíveis . . . . . . . . . . . . . . . . . . . . . . . . . 168
5.6 Teoremas fundamentais sobre representações de grupos e caracteres . . . . . . . . . 172
5.6.1 Teoremas sobre representações . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
5.6.2 Interpretação do teorema da ortogonalidade . . . . . . . . . . . . . . . . . . . . 173
5.6.3 Teoremas sobre caracteres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
5.6.4 Interpretação do teorema da ortogonalidade dos caracteres . . . . . . . . . . . 180
5.6.5 Decomposição de uma representação em irreps . . . . . . . . . . . . . . . . . . 181

iv
5.6.6 Construção de uma tabela de caracteres . . . . . . . . . . . . . . . . . . . . . . 184

5.7 Bases simetrizadas para representações irredutíveis . . . . . . . . . . . . . . . . . . . 186
5.8 Bases para representações de grupos de produto direto . . . . . . . . . . . . . . . . . 189
5.8.1 Redução da representação do produto direto . . . . . . . . . . . . . . . . . . . 189
5.8.2 Bases para representações de produtos diretos . . . . . . . . . . . . . . . . . . 189
5.8.3 Representação de um grupo produto direto . . . . . . . . . . . . . . . . . . . . 190
5.9 Aplicações físicas da teoria de representações de grupo . . . . . . . . . . . . . . . . . 191
5.9.1 Isomorfismo entre transformações sobre sistemas físicos e transformações
sobre espaços funcionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
5.9.2 O grupo do Hamiltoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
5.9.2.1 Degenerescência normal ou acidental . . . . . . . . . . . . . . . . . . . 199
5.9.2.2 Representações de PH . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
5.9.2.3 Teoria de grupos e “bons” números quânticos . . . . . . . . . . . . . . 203
5.9.3 Grupos Abelianos e o teorema de Bloch . . . . . . . . . . . . . . . . . . . . . . . 205
5.9.3.1 Grupos cíclicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
5.9.3.2 O teorema de Bloch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
5.9.4 Funções de base para representações irredutíveis . . . . . . . . . . . . . . . . 207
5.9.5 Perturbações, regras de seleção e simetria . . . . . . . . . . . . . . . . . . . . . 210
5.9.5.1 Perturbações sobre autoestados . . . . . . . . . . . . . . . . . . . . . . 210
5.9.5.2 O teorema dos elementos de matriz e regras de seleção . . . . . . . . 211
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
6 Álgebra e Análise Tensoriais 217

6.1 Introdução e definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
6.1.1 Convenção de soma de índices e símbolos auxiliares . . . . . . . . . . . . . . . 219
6.1.2 Símbolos auxiliares: Kronecker e Levi-Civita . . . . . . . . . . . . . . . . . . . . 220
6.2 Propriedades de transformação de escalares, vetores e tensores . . . . . . . . . . . . 220
6.2.1 Rotações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
6.2.2 Transformações de paridade ou reflexões . . . . . . . . . . . . . . . . . . . . . . 225
6.2.3 Reversão temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
6.3 Tensores Cartesianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
6.3.1 Espaços funcionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
6.3.2 Tensores Cartesianos de postos zero e um . . . . . . . . . . . . . . . . . . . . . 228
6.3.3 Tensores Cartesianos de posto dois ou superior . . . . . . . . . . . . . . . . . . 231
6.4 Álgebra tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
6.4.1 Adição de tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
6.4.2 Simetria e antissimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
6.4.3 Tensores hermitianos ou anti-hermitianos . . . . . . . . . . . . . . . . . . . . . 236
6.4.4 Produto externo de tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
6.4.4.1 Produto externo de dois tensores . . . . . . . . . . . . . . . . . . . . . 237
6.4.4.2 Diádicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
6.4.4.3 Gradiente de um vetor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
6.4.4.4 Produto externo em geral . . . . . . . . . . . . . . . . . . . . . . . . . . 238
6.4.5 Contração . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
6.4.5.1 Produto interno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
6.4.5.2 Produtos com diádicas . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
6.4.6 Regra do quociente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
6.5 Composição de transformações, rotações infinitesimais e tensores isotrópicos . . . . 242
6.5.1 Composição de transformações . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
6.5.2 Rotações infinitesimais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
6.5.3 Tensores isotrópicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
6.6 Rotações impróprias, pseudotensores e tensores duais . . . . . . . . . . . . . . . . . 246
6.6.1 Rotações impróprias e pseudotensores . . . . . . . . . . . . . . . . . . . . . . . 246
6.6.2 Tensores duais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
6.6.3 Tensores irredutíveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
6.7 Tensores generalizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
6.7.1 Coordenadas curvilíneas generalizadas . . . . . . . . . . . . . . . . . . . . . . . 252
6.7.2 O espaço de Riemann e o tensor de métrica . . . . . . . . . . . . . . . . . . . . 254
6.7.2.1 Operação de elevação ou rebaixamento de índice . . . . . . . . . . . . 254

v
6.7.2.2 Elementos infinitesimais de arco e volume . . . . . . . . . . . . . . . . 255

6.8 Transformações generalizadas de coordenadas e tensores generalizados . . . . . . . 257
6.9 Tensores relativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
6.10 Derivadas dos vetores de base e os símbolos de Christoffel . . . . . . . . . . . . . . . 262
6.11 Diferenciação covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
6.12 Operadores vetoriais na forma tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . 268
6.12.1Gradiente de campo escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
6.12.2Divergente de campo vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
6.12.3Laplaciano de um campo escalar . . . . . . . . . . . . . . . . . . . . . . . . . . 270
6.12.4Rotacional de um campo vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . 270
6.13 Diferenciação absoluta e curvas geodésicas . . . . . . . . . . . . . . . . . . . . . . . . 271
6.13.1Diferenciação absoluta ou intrínseca . . . . . . . . . . . . . . . . . . . . . . . . 271
6.13.2Curvas Geodésicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
6.13.3Transporte paralelo de campos vetoriais . . . . . . . . . . . . . . . . . . . . . . 276
6.14 Os tensores de Riemann, Ricci e Einstein . . . . . . . . . . . . . . . . . . . . . . . . . 279
6.14.1O tensor de curvatura de Riemann-Christoffel . . . . . . . . . . . . . . . . . . . 279
6.14.1.1Propriedades do tensor de curvatura . . . . . . . . . . . . . . . . . . . 282
6.14.2O tensor de Ricci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
6.14.3O tensor de Einstein e as equações do campo gravitacional . . . . . . . . . . . 284
6.15 Aplicações físicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284
6.15.1A transformação de Lorentz, o espaço-tempo de Minkowski e a formulação
covariante do eletromagnetismo clássico . . . . . . . . . . . . . . . . . . . . . . 285
6.15.1.1A situação anterior a 1900. A transformação de Galileu . . . . . . . . 285
6.15.1.2Equações de Maxwell e a transformação de Galileu . . . . . . . . . . . 286
6.15.1.3A transformação de Lorentz e os princípios da relatividade restrita . . 290
6.15.1.4O espaço-tempo de Minkowski e os quadrivetores . . . . . . . . . . . . 292
6.15.1.5Formulação covariante do eletromagnetismo clássico . . . . . . . . . 296
6.15.2A métrica de Schwarzschild . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300
6.15.2.1Derivação do tensor de métrica . . . . . . . . . . . . . . . . . . . . . . 301
6.15.2.2Consequências e aplicações da métrica de Schwarzschild . . . . . . . 303
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307
A Distribuições e a “Função” Delta de Dirac 309

A.1 Definição de Distribuições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
A.1.1 Definição operacional de distribuição . . . . . . . . . . . . . . . . . . . . . . . . 309
A.1.1.1 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
A.1.2 Propriedades de distribuições . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310
A.1.2.1 Combinação linear de distribuições . . . . . . . . . . . . . . . . . . . . 310
A.1.2.2 Produto de duas distribuições . . . . . . . . . . . . . . . . . . . . . . . 310
A.1.2.3 Séries e integrais de distribuições . . . . . . . . . . . . . . . . . . . . . 310
A.1.2.4 Derivadas de distribuições . . . . . . . . . . . . . . . . . . . . . . . . . 311
A.2 Propriedades da “Função” δ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312
A.2.1 Definição da δ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312
A.2.2 Representações da δ(x − x0 ) como o limite de um operador integral . . . . . . 312
A.2.3 Principais propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
A.2.4 Derivadas da δ(x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
A.2.5 Deltas de Dirac em mais de uma dimensão . . . . . . . . . . . . . . . . . . . . 314
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316

vi

1
S ISTEMAS DE C OORDENADAS
C URVILÍNEAS O RTOGONAIS
TÉ ESTE PONTO , todas as expressões foram desenvolvidas utilizando-se um sistema de co-
A ordenadas retangulares, também denominado de Cartesiano. O sistema Cartesiano de

coordenadas oferece a vantagem única de ter os seus três vetores unitários de base, ı̂,
̂ e k̂, constantes em direção, em qualquer ponto em um espaço vetorial de dimensão
3, doravante denotado por E 3 e denominado espaço Euclideano de dimensão 3.1
Algumas propriedades adicionais do espaço Euclideano são discutidas no capítulo 6.
Mesmo o vetor unitário êr = r/r foi intrinsecamente tratado como função das três coorde-
nadas Cartesianas x, y e z. Infelizmente, nem todos os problemas físicos são adequadamente
tratados por um sistema de coordenadas Cartesiano. Um exemplo desta situação é a dinâmica
de uma partícula sob a ação de uma força central, F = F (r) êr , tal como as forças gravitacional
ou eletrostática. Tal dinâmica é, em geral, mais facilmente tratada se for empregado um outro
sistema de coordenadas, no caso, o sistema esférico (r, θ, ϕ), no qual as coordenadas possuem
uma relação unívoca com as coordenadas Cartesianas, mas cujos vetores unitários de base, êr ,
êθ e êϕ , não são constantes em direção.
Existe um número relativamente grande de distintos sistemas de coordenadas ortogonais na
literatura. Um determinado sistema deve ser escolhido de forma a explorar adequadamente
qualquer simetria ou vínculo no problema físico em estudo. Uma vez escolhido o sistema mais
adequado, espera-se que o problema possa ser resolvido mais facilmente que seria caso fosse
empregado o sistema Cartesiano. Esta simplificação pode se manifestar, por exemplo, na re-
dução do número de graus de liberdade do problema ou na possibilidade de separação de uma
equação diferencial parcial.
Neste capítulo, será desenvolvido inicialmente o formalismo básico de um sistema de coor-
denadas curvilíneo na seção 1.1. Uma vez definida a forma geral do tensor de métrica, válida
para qualquer lei de transformação de coordenadas, a seção 1.2 será voltada exclusivamente
para sistemas de coordenadas ortogonais. Em seguida, na seção 1.4, os operadores diferenciais
vetoriais gradiente, divergente, rotacional e laplaciano serão derivados para um sistema qual-
quer, bem como as respectivas formas dos Teoremas de Gauss (ou do divergente) e de Stokes.
Na seção 1.5, alguns dos mais importantes e empregados sistemas de coordenadas ortogonais
serão discutidos. Finalmente, na seção 1.6 será apresentada uma técnica útil para o traçado de
linhas de força de um campo vetorial e suas respectivas superfícies equipotenciais.
1.1 C OORDENADAS CURVILÍNEAS

O conceito básico envolvido na definição de um sistema de coordenadas consiste nas famílias
de superfícies contidas no E 3 , sobre as quais uma das três coordenadas permanece constante.
Este conceito, neste texto empregado para um espaço de dimensão 3, pode ser facilmente esten-
dido para um número arbitrário de dimensões. O exemplo mais usual vem do sistema Cartesi-
ano: as coordenadas do sistema Cartesiano são definidas pelos planos mutuamente ortogonais
x = constante, y = constante e z = constante. Um ponto P qualquer (P ∈ E 3 ), identificado pela
terna de números P = (x, y, z), pode ser localizado em um sistema de coordenadas Cartesiano
pela intersecção destes três planos. Por sua vez, cada coordenada varia ao longo da intersecção
1 Na verdade, trata-se de um espaço afim de dimensão 3, no qual é adotada a métrica Euclideana. Ver exemplo 4.2.
1
2 1.1. Coordenadas curvilíneas
q3
q1 = c1
q2 = c2
q2
q1
q3 = c3
k̂
̂
ı̂
Figura 1.1: Sistema geral de coordenadas curvilíneas.
dos planos das outras. Por exemplo, a coordenada x, nas vizinhanças do ponto P , varia ao longo
da intersecção dos planos y = cte. e z = cte. em P .
Pode-se então imaginar três outras famílias de superfícies contidas no E 3 , q1 = c1 , q2 = c2
e q3 = c3 (c1 , c2 e c3 constantes), denominadas superfícies coordenadas, as quais passarão a
definir o novo sistema de coordenadas, de modo que agora o mesmo ponto P ∈ E 3 passa a
ser localizado por P = (q1 , q2 , q3 ). Esta construção está ilustrada na figura 1.1. Cada par de
superficies coordenadas possui sua intersecção ao longo de uma curva denominada curva ou
linha coordenada. A variação da coordenada oposta às duas superfícies intersectantes ocorre
então ao longo desta curva. Por exemplo, na figura 1.1 observa-se que a variação de q3 ocorre ao
longo da curva coordenada definida pela intersecção das superfícies q1 = c1 e q2 = c2 .
Ao contrário do sistema Cartesiano, estas três novas famílias de superfícies não necessitam
ser mutuamente ortogonais; contudo, é suposto que exista uma relação unívoca entre as novas
coordenadas (q1 , q2 , q3 ) e as coordenadas Cartesianas (x, y, z), isto é, deve ser possível escrever
tanto as Leis de Transformação:
x = x(q1 , q2 , q3 ) (1.1a)
y = y(q1 , q2 , q3 ) (1.1b)
z = z(q1 , q2 , q3 ), (1.1c)
quanto as suas relações inversas
q1 = q1 (x, y, z) (1.2a)
q2 = q2 (x, y, z) (1.2b)
q3 = q3 (x, y, z). (1.2c)
De acordo com (1.1a), uma variação infinitesimal da coordenada x pode ser escrita
3
X ∂x ∂x ∂x ∂x
dx = dqi = dq1 + dq2 + dq3 ,
i=1
∂qi ∂q1 ∂q2 ∂q3
existindo expressões equivalentes para as coordenadas y e z. No sistema Cartesiano, o vetor

posição r pode ser escrito em termos da base canônica ı̂, ̂, k̂ , também ilustrada na figura 1.1.
Autor: Rudi Gaelzer – IF/UFRGS Início: 05/2012 Impresso: 29 DE AGOSTO DE 2018

C APÍTULO 1. Sistemas de Coordenadas Curvilíneas Ortogonais 3
Então, o vetor deslocamento infinitesimal dr pode ser escrito tanto em termos da base canônica,
como dr = dxı̂ + dy̂ + dz k̂, quanto como
3 3
X ∂r X ∂x ∂y ∂z
dr = dqi = ı̂ + ̂ + k̂ dqi . (1.3)
i=1
∂qi i=1
∂qi ∂qi ∂qi
De acordo com o Teorema de Pitágoras, o elemento infinitesimal de arco d`2 = dr · dr, o qual
corresponde à distância entre dois pontos vizinhos no E 3 , é dado por
d`2 = dx2 + dy 2 + dz 2 . (1.4)
Para simplificar e condensar a notação empregada, serão feitas as equivalências

{x, y, z} ↔ {x1 , x2 , x3 } e ı̂, ̂, k̂ ↔ {x̂1 , x̂2 , x̂3 } ,
nas expressões a seguir.

Utilizando as leis de transformação (1.1a-c), deve então ser possível escrever d`2 para um
sistema qualquer de coordenadas curvilíneas na seguinte forma quadrática:
d`2 = g11 dq12 + g12 dq1 dq2 + g13 dq1 dq3

+ g21 dq2 dq1 + g22 dq22 + g23 dq2 dq3 (1.5a)
+ g31 dq3 dq1 + g32 dq3 dq2 + g33 dq32 ,
ou
3
X
d`2 = gij dqi dqj . (1.5b)
i,j=1
Espaços para os quais a definição (1.5) é uma expressão válida para representar d`2 são deno-
minados Riemannianos. O espaço Euclideano é um tipo particular de um espaço Riemanniano,
para o qual o elemento de arco d`2 pode sempre ser calculado com o teorema de Pitágoras,
independente do sistema de coordenadas adotado.
Inserindo os diferenciais (1.3) em (1.4) e identificando a expressão resultante com (1.5),
encontra-se
3
∂x ∂x ∂y ∂y ∂z ∂z X ∂xk ∂xk ∂r ∂r
gij = + + = = · . (1.6)
∂qi ∂qj ∂qi ∂qj ∂qi ∂qj ∂qi ∂qj ∂qi ∂qj
k=1
Os coeficientes gij especificam a natureza do sistema de coordenadas (q1 , q2 , q3 ). Coletivamente,

estes coeficientes compõe a métrica do espaço E 3 .2 Por sua vez, os gij são os componentes de
um tensor de posto 2, denominado tensor de métrica. Na relatividade geral, os componentes do
tensor de métrica são determinados pelas propriedades da matéria contida no espaço, ou seja,
a métrica ou a geometria do espaço passa a ser determinada pelas propriedades físicas deste:
geometria se mescla com a física.
Em (1.6), observa-se que os componentes de gij podem ser expressos em termos dos vetores
tangentes ei = ei (q1, q2, q3 ) ≡ ∂r/∂qi . Estes vetores estão na direção da curva tangente à coorde-
nada qi no ponto P e no seu sentido crescente, quando qj = cte. (j 6= i). Neste caso, pode-se ver
que o conjunto e1 , e2 , e3 é composto por vetores linearmente independentes e, portanto, forma
uma base para o E 3 , alternativa à base canônica. Nesta base, o vetor deslocamento infinitesimal
(1.3), nas vizinhanças do ponto P , pode ser escrito como
3 3
X ∂r X
dr = dqi = dqi ei .
i=1
∂qi i=1
Observa-se aqui também que os vetores tangentes podem ser expressos através da base
canônica no E 3 como
3 3
∂r X ∂xj X ∂xi
ei = = x̂j = Hji x̂j , onde Hij = , (1.7a)
∂qi j=1
∂qi j=1
∂qj
2 Espaços métricos são definidos na seção 4.8.

4 1.1. Coordenadas curvilíneas
sendo que a relação inversa também é útil, isto é,

3
X
H −1

x̂i = ji
ej . (1.7b)
j=1
A partir deste resultado, calculando-se o elemento de arco d`2 = dr · dr e comparando-se com

(1.6), pode-se identificar os componentes do tensor de métrica como
3
X
gij = ei · ej = Hki Hkj . (1.8)
k=1
Uma outra base neste sistema de coordenadas pode ser formada, tomando-se os vetores
normais às superfícies coordenadas no ponto P . Estes vetores são definidos por i = ∇qi e
também estão ilustrados na figura 1.1. Desta forma, um vetor a ∈ E 3 qualquer pode ser escrito
tanto em termos da base {ei } quanto da base {i } como
3
X 3
X
a= αi ei = β i i . (1.9)
i=1 i=1
Os componentes {αi } e {βi } são denominados, respectivamente, de componentes contravarian-

tes e covariantes de a.
Os componentes contravariantes {αi } podem ser expressos em termos da inversa do tensor
de métrica,
3
X 3
X
g −1 ij (a · ej ) .

a · ej = αi gij =⇒ αi = (1.10a)
i=1 j=1
Por sua vez, as bases {ei } e {i } formam um conjunto de vetores recíprocos. Ou seja, usando
a base canônica para r e ∇ e a regra de derivação em cadeia, pode-se calcular
∂r
e i · j = · ∇qj
∂q
i
∂x ∂y ∂z ∂qj ∂qj ∂qj
= ı̂ + ̂ + k̂ · ı̂ + ̂ + k̂
∂qi ∂qi ∂qi ∂x ∂y ∂z
∂qj ∂x ∂qj ∂y ∂qj ∂z ∂qj
= + + = .
∂x ∂qi ∂y ∂qi ∂z ∂qi ∂qi
Portanto, ei · j = δij , o que caracteriza dois conjuntos de vetores recíprocos.

Escrevendo-se os vetores de base {i } em termos da base {ei } como
3
X
i = γij ej ,
j=1
o fato destas bases serem recíprocas permite escrever

3
X 3
X
γik gkj , ou seja, γij = g −1

i · ej = γik ek · ej =⇒ δij = ij
.
k=1 k=1
Portanto,
3
X 3
X
g −1

i = e ,
ij j
ei = gij j .
j=1 j=1
Desta maneira, pode-se escrever os componentes covariantes {βi } de a em (1.9) simplesmente

como
X3 3
X
βi g −1 ij ej =⇒ βi = a · ei .

a= βi i = (1.10b)
i=1 i,j=1

Observando as expressões (1.10a,b), pode-se concluir que as relações entre os componentes

contravariantes e covariantes do vetor a são determinadas pelo tensor de métrica como
3
X
g −1

αi = ij
βj (1.10c)
j=1
3
X
βi = gij αj . (1.10d)
j=1
Uma discussão mais detalhada destes componentes, no contexto da análise tensorial, será rea-
lizada na seção 6.7.
Finalmente, os vetores de base {ei } e {i } podem ser normalizados por
1 ∂r ∇qi
êi = , î = ,
hi ∂qi |∇qi |
onde v v
u 3
u 3
2 uX
∂r uX ∂x j
hi ≡ |ei | = =t = t 2,
Hji (1.11)
∂qi j=1
∂qi j=1
é denominado o fator de escala da coordenada qi , formando assim as bases normais { êi } e {î }.
Estes vetores normalizados estão ilustrados na figura 1.1. A forma matemática dos fatores de
escala depende do sistema de coordenadas adotado. Por exemplo, no sistema Cartesiano, hi = 1,
simplesmente. Cabe ressaltar também que embora i seja o recíproco de ei , estes vetores não
são necessariamente paralelos entre si.
Pode-se então escrever o vetor deslocamento infinitesimal dado por (1.3), tanto em termos
dos fatores de escala quanto em termos da matriz H definida em (1.7), como
3
X 3
X 3
X
dr = dqi ei = hi dqi êi = Hij dqj x̂i . (1.12)
i=1 i=1 i,j=1
Esta expressão é útil também quando o deslocamento infinitesimal dr é ocasionado pela

variação de algum parâmetro contínuo (θ, por exemplo). Neste caso, o vetor posição percorre
uma curva no espaço determinada pela forma paramétrica r = r (θ) e o vetor dr é o vetor tangente
a esta curva quando θ −→ θ + dθ. Dividindo-se ambos os lados de (1.12) por dθ resulta então
3
dr X dqi
= hi êi ,
dθ i=1
dθ
sendo dqi /dθ a variação da coordenada qi com o parâmetro θ.

O resultado acima é particularmente útil na física, onde usualmente o parâmetro livre cor-
.
responde ao tempo. Neste caso, v = dr/dt = ṙ, sendo v = v (t) o vetor velocidade. Portanto,
3 3
dr X dqi X
v ≡ ṙ = = hi êi = hi q̇i êi , (1.13)
dt i=1
dt i=1
onde foi introduzida a notação q̇i = dqi /dt, comum na mecânica clássica.
1.2 C OORDENADAS CURVILÍNEAS ORTOGONAIS

A partir deste ponto, a atenção estará voltada exclusivamente para sistemas de coordenadas
ortogonais, isto é, para famílias de superfícies mutuamente ortogonais em cada ponto do E 3 .
Neste caso em particular, a base { êi } é ortonormal, existindo uma regra dextrógira entre os seus
vetores, isto é, 
 ê1 × ê2 = ê3

êi × êj = ijk êk =⇒ ê3 × ê1 = ê2 (1.14)

ê2 × ê3 = ê1 ,


6 1.3. Análise vetorial em sistemas de coordenadas curvilíneas ortogonais
onde ijk é o tensor de Levi-Civita.3 Esta regra se deve ao fato de que o sistema de coordenadas
empregado possui uma orientação dextrógira.
Como êi · êj = δij , o tensor de métrica (1.6), de acordo com (1.8), possui todos os seus
elementos fora da diagonal principal nulos, isto é, gij = 0, para (i 6= j). Pode-se escrever então
os componentes gii não nulos em termos dos fatores de escala, a partir de (1.8), como
3
X
gij = h2i δij = Hki Hkj , (1.15a)
k=1
o que permite concluir que

3
X
Hki Hkj = h2i δij . (1.15b)
k=1
Já as relações (1.7) e (1.15a) mostram que
3
X
h2k H −1 H −1

ki kj
= δij . (1.15c)
k=1
Além disso, o determinante da matriz g que representa o tensor de métrica é, simplesmente,
3
X
2 2 2 2
det (g) = (h1 h2 h3 ) = Hi1 Hj2 Hk3 ,
i,j,k=1
ao passo que a sua inversa é

g −1 = h−2

ij i δij .
Neste caso, o elemento infinitesimal de arco d`2 em (1.5b) se reduz à seguinte forma quadrá-
tica:
3
X
2 2 2
d`2 = (h1 dq1 ) + (h2 dq2 ) + (h3 dq3 ) = h2i dqi2 . (1.16)
i=1
A forma resultante para d`2 em (1.16) permite definir a projeção de dr ao longo da coordenada qi
como sendo
dì = hi dqi , (1.17)
sendo dì obtido mantendo-se as outras coordenadas qj (j 6= i) constantes. Porém, o fator de

escala hi pode depender de todas as novas coordenadas, isto é, em geral,
hi = hi (q1 , q2 , q3 ) , (i = 1, 2, 3) ,
e pode possuir dimensão de comprimento, em cuja situação qi não terá dimensão (um ângulo,
por exemplo). O vínculo consiste em que dì deve possuir dimensão de comprimento.
As bases {ei } e {i } serão empregadas novamente na seção 6.7, no contexto da análise ten-
sorial. Para o restante da discussão neste capítulo será empregada somente a base ortonormal
{ êi }.
1.3 A NÁLISE VETORIAL EM SISTEMAS DE COORDENA -

DAS CURVILÍNEAS ORTOGONAIS
Nesta seção as operações de álgebra vetorial, os operadores diferenciais vetoriais e os teore-
mas integrais para campos escalares e vetoriais serão derivados para um sistema de coordena-
das curvilíneas ortogonais em geral.
3 Tensor totalmente anti-simétrico. Ver seção 6.1.2.

1.3.1 Á LGEBRA VETORIAL

Consideram-se dois vetores {a, b} ∈ E 3 , os quais podem ser escritos tanto em termos da base
canônica quanto em termos da base ortonormal { êi } como
3
X 3
X
a = ax ı̂ + ay ̂ + az k̂ = ai êi e b = bx ı̂ + by ̂ + bz k̂ = bi êi .
i=1 i=1
A adição vetorial se procede como o usual,

3
X
a+b= (ai + bi ) êi .
i=1
No caso dos produtos envolvendo vetores, as transformações (1.1) e (1.2) por hipótese são
tais que o escalar ou vetor resultantes da operação são invariantes, ou seja, estes objetos geo-
métricos são os mesmos para qualquer sistema de coordenadas curvilíneas. As condições que
as leis de transformação (1.1) e (1.2) devem satisfazer para que esta exigência seja satisfeita
serão discutidas na seção 6.3.3, dentro do contexto da análise tensorial. Esta condição já foi
tacitamente suposta cumprida na seção anterior.
Assumindo que as condições mencionadas acima são satisfeitas, então o resultado do pro-
duto escalar entre os vetores a e b é, simplesmente,
3
X
a·b= ai bi .
i=1
Por sua vez, o resultado do produto vetorial entre os mesmos vetores, de acordo com (1.14), é
3
X 3
X
a×b= ai bj êi × êj = ijk ai bj êk .
i,j=1 i,j=1
Observa-se que o mesmo resultado pode ser obtido pelo cálculo do determinante
 
ê1 ê2 ê3
a × b = det  a1 a2 a3  .
b1 b2 b3
1.3.2 I NTEGRAIS DE CAMINHO , DE SUPERFÍCIE E DE VOLUME

Para o cálculo dos teoremas integrais em coordenadas curvilíneas, é necessário adaptar as
integrais em uma, duas ou três dimensões, conforme definidas no sistema Cartesiano, para o
sistema de coordenadas geral.
Considerando o campo vetorial A = A (r),4 cujas componentes são
3
X
A (r) = Ai (r) êi ,
i=1
para calcular a integral de A (r) ao longo de uma curva C contida no E 3 usando o sistema
{q1 , q2 , q3 }, parte-se do elemento de arco d`, cujas projeções sobre as coordenadas curvilíneas
são dadas por (1.17). Então,
ˆ 3 ˆ
X
A (r) · d` = Ai (r) hi dqi .
C i=1 C
Para o cálculo de uma integral de superfície envolvendo A (r), por exemplo, para se obter o
fluxo deste campo através de uma superfície S contida no E 3 , é necessário, em primeiro lugar,
determinar-se a forma do elemento de superfície no sistema curvilíneo.
Fazendo uma interpretação geométrica usualmente realizada com o sistema Cartesiano, ob-
serva-se, em primeiro lugar, que, dados os vetores a e b, a quantidade escalar |a × b| = ab sen φ
4 Uma definição mais rigorosa de um campo vetorial é realizada na seção 6.3.2.

8 1.3. Análise vetorial em sistemas de coordenadas curvilíneas ortogonais
fornece a área do paralelograma definido por estes, sendo 0 6 φ 6 π o menor ângulo entre
os mesmos. Assim, o vetor s = a × b pode ser interpretado geometricamente como um vetor
superfície, cuja área é igual à do paralelograma mencionado e com a direção e sentido definidos
pelo resultado do produto vetorial; ou seja, o vetor s é sempre ortogonal ao plano definido por a
e b, com o sentido dado pelo produto de ambos.
Uma superfície S qualquer contida no E 3 pode ser subdividida em um número muito grande
de superfícies infinitesimais. Com base na interpretação geométrica do produto vetorial, pode-se
então definir um vetor elemento de superfície dσ a partir da área delimitada entre dois elementos
de arco d` e d`0 que não estejam paralelos entre si. Com esta notação, obtém-se com a base
canônica
3
X 3
X
d` × d`0 = dxi dx0j x̂i × x̂j = ijk dxj dxk x̂i .
i,j=1 i,j,k=1
Então, uma definição apropriada para o vetor elemento de superfície de S é

3
1 X
dσ = |ijk | dσjk x̂i = dσ23 x̂1 + dσ13 x̂2 + dσ12 x̂3 , (1.18)
2
i,j,k=1
sendo dσij = dxi dxj o elemento de superfície no plano xi − xj (j 6= i), perpendicular ao vetor
unitário x̂k (k 6= i e k 6= j).
Nota-se que esta definição satisfaz a interpretação geométrica de dσ. Por exemplo, se a
superfície S estiver contida totalmente no plano x2 − x3 ↔ y − z, então dx1 = dx = 0 e
dσ = dσ23 x̂1 = dx2 dx3 x̂1 = dydzı̂,
como era o esperado.

Passando agora para o sistema curvilíneo {q1 , q2 , q3 }, o elemento de arco d` é dado por (1.12)
e daí o elemento de superfície dσ pode ser definido, por analogia a (1.18), como
3
1 X
dσ = |ijk | dσjk êi = dσ23 ê1 + dσ13 ê2 + dσ12 ê3 , (1.19)
2
i,j,k=1
sendo agora dσij ≡ dì d`j = hi hj dqi dqj (j 6= i).

Portanto, a integral de fluxo de A (r) através de S resulta
ˆ 3 ˆ 3 ˆ
1 X 1 X
A · dσ = |ijk | Ai dσjk = |ijk | Ai hj hk dqj dqk ,
S 2 S 2 S
i,j,k=1 i,j,k=1
ˆ ˆ ˆ ˆ
A · dσ = A1 h2 h3 dq2 dq3 + A2 h1 h3 dq1 dq3 + A3 h1 h2 dq1 dq2 . (1.20)
S S S S
Finalmente, para o cálculo de uma integral de volume é necessário o elemento infinitesimal

de volume d3 r no E 3 . Novamente realizando uma interpretação geométrica, dados os vetores
a, b e c, o produto escalar triplo |a · (b × c)| fornece o volume do paralelepípedo definido pelos
vetores. Então, no sistema Cartesiano, o elemento de volume é escrito simplesmente como

d3 r = dxdydz ı̂ · ̂ × k̂ = dxdydz.

Por consequência, se dì = hi dqi êi é o vetor elemento de arco na direção i, então o correspon-
dente elemento de volume pode ser calculado como
d3 r = |d`1 · (d`2 × d`3 )| = h1 h2 h3 dq1 dq2 dq3 , (1.21a)
uma vez que | ê1 · ( ê2 × ê3 )| = 1 para um sistema de coordenadas ortogonais.
Uma expressão equivalente para d3 r é obtida escrevendo-se, inicialmente, dì = dqi ei . Então,
de (1.7a), resulta
X3
dì = Hji dqi x̂j .
j=1

Percebe-se então que o elemento de volume fica

3
X
d3 r =

Hi1 Hj2 Hk3 x̂i · ( x̂j × x̂k ) dq1 dq2 dq3
i,j,k=1

3
X
= ijk Hi1 Hj2 Hk3 dq1 dq2 dq3 .
i,j,k=1
Porém, uma expressão conhecida envolvendo o tensor de Levi-Civita e o determinante de uma
matriz A de ordem 3 é
3
X 3
X
det (A) abc = ijk Aai Abj Ack = ijk Aia Ajb Akc .
i,j,k=1 i,j,k=1
Portanto,
d3 r = |det (H)| dq1 dq2 dq3 . (1.21b)
Mas  ∂x 
1 ∂x1 ∂x1
∂q ∂q2 ∂q3
 12 ∂ (x1 , x2 , x3 )
J ≡ det (H) = det  ∂x
∂q1
∂x2
∂q2
∂x2 
∂q3  ≡ ,
∂x3 ∂x3 ∂x3 ∂ (q1 , q2 , q3 )
∂q1 ∂q2 ∂q3
o qual é justamente o Jacobiano da transformação {x1 , x2 , x3 } → {q1 , q2 , q3 }. Ou seja,

3
∂ (x1 , x2 , x3 )
d r = |J| dq1 dq2 dq3 =
dq1 dq2 dq3 . (1.21c)
∂ (q1 , q2 , q3 )
Portanto, para sistemas de coordenadas curvilíneas ortogonais, infere-se que |J| = J = h1 h2 h3 .
Com este elemento de volume, pode-se agora calcular as integrais de volume no sistema curvilí-
neo.
Exercício 1.1. Mostre que para sistemas de coordenadas curvilíneas ortogonais o Jacobiano da
transformação está relacionado aos fatores de escala por J = h1 h2 h3 .
Demonstração. Para demonstrar este resultado, é mais fácil elevar-se ambos os lados ao qua-
drado. Então, de (1.21c) e (1.11), deseja-se demonstrar que
 2
X3
2
J2 =  ijk Hi1 Hj2 Hk3  = (h1 h2 h3 ) ,
i,j,k=1
 2
3
X 3
X
2 2 2
 ijk Hi1 Hj2 Hk3  = Hi1 Hj2 Hk3 .
i,j,k=1 i,j,k=1
O lado esquerdo pode ser escrito como

 2
X3 3
X 3
X
 ijk Hi1 Hj2 Hk3  = ijk `mn Hi1 Hj2 Hk3 H`1 Hm2 Hn3 .
i,j,k=1 i,j,k=1 `,m,n=1
Usando a propriedade (6.3),

ijk `mn = δi` (δjm δkn − δjn δkm ) + δim (δjn δk` − δj` δkn ) + δin (δj` δkm − δjm δk` ) ,
resulta
 2
X3 3
X
 ijk Hi1 Hj2 Hk3  = [Hi1 Hj2 Hk3 − Hi1 Hk2 Hj3
i,j,k=1 i,j,k=1
+Hk1 Hi2 Hj3 − Hj1 Hi2 Hk3 + Hj1 Hk2 Hi3 − Hk1 Hj2 Hi3 ] Hi1 Hj2 Hk3 .
Agora, de acordo com (1.15b), somente o primeiro termo permanece não nulo na expressão
acima, resultando então
X3
2
J2 = 2
Hi1 2
Hj2 2
Hk3 = (h1 h2 h3 ) ,
i,j,k=1
como se queria demonstrar.

10 1.4. Operadores vetoriais diferenciais
1.4 O PERADORES VETORIAIS DIFERENCIAIS

Nesta seção serão obtidas as expressões gerais para os operadores gradiente, divergente e
rotacional, válidas para qualquer sistema de coordenadas ortogonais.
1.4.1 G RADIENTE
O ponto de partida para a obtenção dos operadores vetoriais diferenciais em qualquer sistema
de coordenadas ortogonal consiste na interpretação geométrica do gradiente como aquele vetor
que possui o módulo, direção e sentido da máxima taxa de variação de um determinado campo
escalar sobre uma de suas superfícies equipotenciais.
Sendo ψ = ψ (q1 , q2 , q3 ) um campo escalar, função das coordenadas curvilíneas ortogonais, a
taxa máxima de variação deste campo sobre a superfície q1 = cte., por exemplo, será dada pelo
maior valor da derivada direcional em qualquer ponto sobre esta superfície. A variação de ψ, de
uma forma geral, é dada por
3
X ∂ψ
dψ = dqi , (1.22)
i=1
∂qi
ao passo que um arco infinitesimal d` é dado por (1.12),

3
X
d` = hi dqi êi .
i=1
Portanto, a variação do campo ψ ao longo de d` será dado pela derivada direcional

dψ|d` = ∇ψ · d`,
sendo ∇ψ a expressão procurada para o gradiente do campo. Então,
3
X
dψ|d` = (∇ψ)i hi dqi ,
i=1
sendo (∇ψ)i a expressão procurada. Comparando-se com (1.22), resulta que

∂ψ 1 ∂ψ
hi (∇ψ)i = =⇒ (∇ψ)i = .
∂qi hi ∂qi
Portanto,
3
X 1 ∂ψ
∇ψ = êi . (1.23)
h
i=1 i
∂qi
Pode-se verificar facilmente a interpretação geométrica do gradiente. Sejam P e Q dois pontos
infinitesimalmente próximos sobre a superfície equipotencial ψ = cte. Ao longo do deslocamento
P → Q, a taxa de variação do campo é, portanto, dψ = ∇ψ · d` = 0. Ou seja, o gradiente é
perpendicular à superfície equipotencial em P . Agora, sejam S1 : ψ = C1 e S2 : ψ = C2 duas
superfícies infinitesimalmente próximas entre si e seja P um ponto sobre S1 e Q um ponto sobre
S2 . Ao longo do deslocamento P → Q, a variação do campo será agora dψ = C2 − C1 = ∇ψ · d`.
Dentre todas as posições relativas entre P e Q, a taxa de variação do campo, para um dado |d`|,
será maximizada quando o ângulo entre ∇ψ e d` for nulo. Ou seja, o gradiente está na direção
de máxima variação do campo.
Exercício 1.2. Mostre que para coordenadas curvilíneas ortogonais, ∇qi = êi /hi . Como con-
sequência, mostre que os dois conjuntos de vetores recíprocos { êi } e {î } são idênticos neste
caso.
Demonstração. Fazendo ψ = qi em (1.23), resulta
3
X 1 ∂qi êi
∇qi = êj = = i .
h ∂qj
j=1 j
hi
Portanto, como |∇qi | = h−1

i , resulta que
∇qi
î = = êi ,
|∇qi |
como se desejava demonstrar.

1.4.2 D IVERGENTE E LAPLACIANO

O operador divergente pode ser obtido a partir de sua definição relacionada ao teorema do
divergente. Sendo A = A (q1 , q2 , q3 ) um campo vetorial definido em um volume elementar d3 r do
E 3 , centrado em torno do ponto P = (q1 , q2 , q3 ) e delimitado pela superfície gaussiana S, então o
divergente do campo em P é dado por
¸
S´
A·dσ
∇ · A (q1 , q2 , q3 ) = ´ lim .
d3 r→0 d3 r
A figura 1.2 ilustra o elemento de volume d3 r em questão, sendo que os lados do elemento
de volume são os elementos infinitesimais de arco dì = hi dqi , ao longo de cada coordenada
curvilínea. Consideram-se agora as integrais de superfície através de cada lado do elemento de
volume.
Figura 1.2: Um elemento de volume em termos das coordenadas curvilíneas ortogonais.
Por exemplo, a integral de fluxo de A através de uma das superfícies S1 : q1 = cte., correspon-
dentes à face 3 e sua oposta na figura 1.2. A partir de (1.20), esta integral é dada simplesmente
por ˆ ˆ
Φ1 = A · dσ = ± A1 h2 h3 dq2 dq3 ≈ ±A1 (q1 , q2 , q3 ) h2 h3 dq2 dq3 ,
S1 S
uma vez que a área de S1 é infinitesimal. O sinal será tomado a partir de uma convenção para
fluxo positivo. Como o sistema de coordenadas é dextrógiro, isto é, ê1 × ê2 = ê3 , o fluxo de A
através da face 3 ou sua oposta será tomado positivo quando este ocorrer no sentido de ê1 , ou
seja, através da face em q1 + dq1 . Nesta,5
ˆ
∂
Φ01 = A · dσ ≈ A1 (q1 + dq1 , q2 , q3 ) h2 h3 dq2 dq3 ≈ A1 (q1 , q2 , q3 ) h2 h3 + (A1 h2 h3 ) dq1 dq2 dq3 .
S1 ∂q1
Portanto, o fluxo líquido através da superfície 3 e de sua oposta oposta será

∂
∆Φ1 = Φ01 − Φ1 ≈ (A1 h2 h3 ) dq1 dq2 dq3 .
∂q1
Procedendo-se da mesma maneira nas superfícies 1 e oposta, 2 e 4 da figura 1.2, obtém-se
que o fluxo total através da superfície gaussiana elementar é
˛
∂ ∂ ∂
A · dσ ≈ (A1 h2 h3 ) + (A2 h1 h3 ) + (A3 h1 h2 ) dq1 dq2 dq3 .
S ∂q1 ∂q2 ∂q3
5 Lembrando que f (a + α) ≈ f (a) + α· (∂f /∂a).

12 1.4. Operadores vetoriais diferenciais
Figura 1.3: Elemento dσ23 , sobre uma superfície S1 : q1 = cte.
Por sua vez, a integral de volume é, de acordo com (1.21), simplesmente,

ˆ
d3 r ≈ h1 h2 h3 dq1 dq2 dq3 .
Tomando-se o limite d3 r → 0, resulta a expressão desejada para o divergente do campo vetorial,

1 ∂ ∂ ∂
∇ · A (q1 , q2 , q3 ) = (A1 h2 h3 ) + (A2 h1 h3 ) + (A3 h1 h2 ) . (1.24)
h1 h2 h3 ∂q1 ∂q2 ∂q3
O operador laplaciano em coordenadas curvilíneas ortogonais é obtido simplesmente aplicando-

se o divergente (1.24) sobre o gradiente (1.23) de um campo escalar ψ,
∇2 ψ (q1 , q2 , q3 ) = ∇· (∇ψ) ,
ou seja,

2 1 ∂ h2 h3 ∂ψ ∂ h1 h3 ∂ψ ∂ h1 h2 ∂ψ
∇ ψ (q1 , q2 , q3 ) = + + . (1.25)
h1 h2 h3 ∂q1 h1 ∂q1 ∂q2 h2 ∂q2 ∂q3 h3 ∂q3
1.4.3 R OTACIONAL
Finalmente, dado novamente o campo vetorial A, o seu rotacional no ponto P será obtido a
partir de sua definição baseada no teorema de Stokes. Em E 3 , se S é uma superfície delimitada
pela curva fechada C, então ˛
1
(∇ × A) · n̂ = lim A·d` ,
S→0 S C
onde n̂ é o vetor unitário normal a S.

Tomando como guia geométrico agora a figura 1.3, a qual ilustra o elemento de superfície
dσ23 , orientado sobre a superfície S1 : q1 = cte., calcula-se então a circulação do campo A ao
longo do caminho fechado `14 : 1 → 4 que delimita dσ23 . De acordo com o teorema da média e de
(1.20), pode-se escrever
ˆ
∇ × A · dσ = ê1 · [∇ × A (q1 , q2∗ , q3∗ )] dσ23 = ê1 · [∇ × A (q1 , q2∗ , q3∗ )] h2 h3 dq2 dq3 ,
S1
sendo (q1 , q2∗ , q3∗ ) um ponto sobre S1 , contido dentro do caminho fechado `14 . De acordo com o
teorema de Stokes, o resultado anterior é dado por
˛
ê1 · [∇ × A (q1 , q2∗ , q3∗ )] h2 h3 dq2 dq3 = A·d`.
`14

Seguindo-se ao longo do contorno fechado `14 , que delimita S1 , a integral de caminho acima
pode ser escrita, usando (1.16) e cuidando-se novamente os sentidos dos vetores unitários { êi },
como
˛
A·d` ≈ A2 (q1 , q2 , q3 ) h2 dq2 + A3 (q1 , q2 + dq2 , q3 ) h3 dq3
`14
− A2 (q1 , q2 , q3 + dq3 ) h2 dq2 − A3 (q1 , q2 , q3 ) h3 dq3 ,
a qual pode ser ainda escrita como

˛
∂ ∂
A·d` ≈ A2 h2 dq2 + A3 h3 + (A3 h3 ) dq2 dq3 − A2 h2 + (A2 h2 ) dq3 dq2 − A3 h3 dq3 ,
`14 ∂q2 ∂q3
ou seja,
∂ ∂
ê1 · [∇ × A (q1 , q2∗ , q3∗ )] h2 h3 dq2 dq3 ≈ (A3 h3 ) dq2 dq3 − (A2 h2 ) dq2 dq3 .
∂q2 ∂q3
No limite dq2 dq3 → 0, obtém-se

1 ∂ ∂
ê1 · [∇ × A (q1 , q2 , q3 )] = (A3 h3 ) − (A2 h2 ) .
h2 h3 ∂q2 ∂q3
Procedendo-se da mesma maneira nos contornos das superfícies S2 e S3 , obtém-se as outras

componentes de ∇ × A pela permutação cíclica de índices do resultado acima. Desta maneira,
pode-se escrever o rotacional do campo A como o determinante

h1 ê1 h2 ê2 h3 ê3
1
∇×A= ∂/∂q1 ∂/∂q2 ∂/∂q3 . (1.26)
h1 h2 h3
h1 A1 h2 A2 h3 A3
Devido à presença dos operadores diferenciais, este determinante deve ser desenvolvido a partir
da primeira linha.
1.5 S ISTEMAS DE COORDENADAS CURVILÍNEAS ORTO -

GONAIS
Serão obtidas agora as expressões desenvolvidas nas seções 1.2 e 1.4 para alguns dos siste-
mas de coordenadas curvilíneas ortogonais mais empregados na literatura.
1.5.1 C OORDENADAS POLARES CILÍNDRICAS

Este sistema de coordenadas é usualmente empregado em problemas com simetria cilíndrica.
As coordenadas polares cilíndricas são identificadas pelo conjunto {q1 , q2 , q3 } → {ρ, φ, x3 }, sendo
identificadas na figura 1.4a.
As leis de transformação para este sistema são as seguintes,
 q
 ρ = x21 + x22 
 x1 = ρ cos φ



 
−1 x 2 =⇒ x2 = ρ sen φ
 φ = tan x1 
x3 = x3 ,

 


x3 = x3
sendo que as coordenadas curvilíneas estão definidas nos seguintes intervalos: 0 6 ρ < ∞,
0 6 φ < 2π e −∞ < x3 < ∞.
O vetor posição pode ser escrito em termos da base canônica; empregando as coordenadas
cilíndricas, o vetor posição pode ser escrito como
r = ρ cos φ x̂1 + ρ sen φ x̂2 + x3 x̂3 .

14 1.5. Sistemas de coordenadas curvilíneas ortogonais
x3 φ = c2 x3
x̂3 ρ = c1
(a) (b)
x3 = c3
x̂3
x̂2 x2 x1
x̂1 x2
x1
Figura 1.4: (a) Coordenadas cilíndricas e seus vetores unitários. (b) Superfícies coordenadas. O ponto P está
localizado na intersecção das superfícies.
Assim, os vetores da bases {ei }, { êi } e os fatores de escala {hi } para este sistema ficam escritos

∂r
eρ = = cos φ x̂1 + sen φ x̂2

  
∂ρ  êρ = cos φ x̂1 + sen φ x̂2  hρ = 1



  
∂r =⇒ êφ = − sen φ x̂1 + cos φ x̂2 =⇒ hφ = ρ
eφ = = −ρ sen φ x̂1 + ρ cos φ x̂2
∂φ
  
ê3 = x̂3 h3 = 1.

  


 e = x̂
3 3
Invertendo-se o sistema de equações acima, resulta a transformação inversa


 x̂1 = cos φ êρ − sen φ êφ

x̂2 = sen φ êρ + cos φ êφ

x̂3 = ê3 .

Pode-se ver claramente que o sistema cilíndrico é ortonormal, êρ · êφ = êρ · x̂3 = êφ · x̂3 = 0 e
êρ × êφ = x̂3 , bem como qualquer permutação cíclica dos vetores de base. Assim, o vetor posição
pode também ser escrito como
r = ρ êρ + x3 x̂3 .
O vetor velocidade em coordenadas cilíndricas é diretamente obtido de (1.13), resultando
dr
v ≡ ṙ = = hρ ρ̇ êρ + hφ φ̇ êφ + ẋ3 h3 ê3 ,
dt
ou seja,
v = ρ̇ êρ + ρφ̇ êφ + ẋ3 ê3 .
Este resultado pode ser verificado pela derivação direta de r (t).
Para se obter a aceleração (a derivada segunda do vetor posição), é útil primeiro obter-se as
derivadas temporais dos vetores de base, ou seja,
. dêρ


 ê˙ ρ = = − sen φφ̇ x̂1 + cos φφ̇ x̂2


 dt
. dêφ

ê˙ φ = = − cos φφ̇ x̂1 − sen φφ̇ x̂2

 dt
. dê3


 ê˙ =

= 0.
3
dt
Então,
dv
a ≡ v̇ = = ρ̈êρ + ρ̇φ̇ + ρφ̈ êφ + ρ̇ê˙ ρ + ρφ̇ê˙ φ + ẋ3 ê3
dt

= ρ̈êρ + ρ̇φ̇ + ρφ̈ êφ − sen φρ̇φ̇ + cos φρφ̇2 x̂1 + cos φρ̇φ̇ − sen φρφ̇2 x̂2 + ẋ3 ê3 ,
resultando em
a = ρ̈ − ρφ̇2 êρ + ρφ̈ + 2ρ̇φ̇ êφ + ẋ3 ê3 .
O tensor de métrica é representado pela matriz

  x3
1 0 0
g = 0 ρ2 0 .
0 0 1
dx3
O vetor elemento de superfície e o elemento de
volume ficam escritos respectivamente,
dσ = ρdφdx3 êρ + dρdx3 êφ + ρdρdφ x̂3 x2

d3 r = ρdρdφdx3 .
Em particular, o elemento de volume pode ser vi-

sualizado na figura 1.5. x1
Finalmente, os operadores diferenciais ficam,
para ψ = ψ (ρ, φ, x3 ) e A = A (ρ, φ, x3 ),
Figura 1.5: Elemento de volume em coordenadas
∂ψ 1 ∂ψ ∂ψ cilíndricas.
∇ψ = êρ + êφ + x̂3
∂ρ ρ ∂φ ∂x3
1∂ 1 ∂Aφ ∂A3
∇·A= (ρAρ ) + +
ρ ∂ρ ρ ∂φ ∂x3

êρ ρ êφ x̂3
1 ∂ ∂
∇×A= /∂ρ /∂φ ∂/∂x3
ρ
Aρ ρAφ A3
1 ∂2ψ ∂2ψ

1∂ ∂ψ
∇2 ψ = ρ + 2 + .
ρ ∂ρ ∂ρ ρ ∂φ2 ∂x23
1.5.2 C OORDENADAS POLARES ESFÉRICAS

Este sistema de coordenadas é usualmente empregado em problemas com simetria esférica.
As coordenadas polares esféricas são identificadas pelo conjunto {q1 , q2 , q3 } → {r, θ, φ}, sendo
ilustradas na figura 1.6a.
As leis de transformação para este sistema são as seguintes:
 q
 r = x21 + x22 + x23
 
 x1 = r sen θ cos φ


 x 
3
θ = cos−1

=⇒ x2 = r sen θ sen φ
 r 
x x3 = r cos θ,

 
 −1 2
 φ = tan

x1
sendo que as coordenadas estão definidas nos intervalos: 0 6 r < ∞, 0 6 θ 6 π e 0 6 φ < 2π.
O vetor posição pode ser escrito agora como
r = r sen θ cos φ x̂1 + r sen θ sen φ x̂2 + r cos θ x̂3 .
Assim, as bases {ei }, { êi } e os fatores de escala {hi } para o sistema de coordenadas esféricas
são:

∂r

 er = = sen θ cos φ x̂1 + sen θ sen φ x̂2 + cos θ x̂3
∂r




 ∂r
eθ = = r cos θ cos φ x̂1 + r cos θ sen φ x̂2 − r sen θ x̂3

 ∂θ
∂r


 eφ = = −r sen θ sen φ x̂1 + r sen θ cos φ x̂2


∂φ

x3 x3 θ = c2
(a) (b)
φ = c3 r = c1
P
x̂3
x̂2 x1
x̂1 x2 x2
x1
Figura 1.6: (a) Coordenadas esféricas e seus vetores unitários. (b) Superfícies coordenadas. O ponto P está
localizado na intersecção das superfícies.
 
 êr = sen θ cos φ x̂1 + sen θ sen φ x̂2 + cos θ x̂3
  hr = 1

=⇒ êθ = cos θ cos φ x̂1 + cos θ sen φ x̂2 − sen θ x̂3 =⇒ hθ = r
 
êφ = − sen φ x̂1 + cos φ x̂2 hφ = r sen θ.
 
Percebe-se claramente que o sistema esférico é ortonormal, com êr · êθ = êr · êφ = êθ · êφ = 0 e
êr × êθ = êφ , bem como qualquer permutação cíclica dos vetores de base.
Em termos da base ortonormal esférica, a base
x3 canônica pode agora ser escrita

 x̂1 = sin θ cos φ êr + cos θ cos φ êθ − sen φ êφ

x̂2 = sin θ sin φ êr + cos θ sin φ êθ + cos φ êφ

x̂3 = cos θ êr − sen θ êθ .

Assim, o vetor posição pode ser escrito simplesmente

como
r = r êr .
O tensor de métrica é representado por
x2
 
1 0 0
g = 0 r2 0 .
2 2
0 0 r sen θ
x1
O vetor elemento de superfície e o elemento de
volume são, respectivamente,
Figura 1.7: Elemento de volume em coordenadas
esféricas.
dσ = r2 sen θdθdφ êr + r sen θdrdφ êθ + rdrdθ êφ
d3 r = r2 sen θdrdθdφ.
O elemento de volume para este sistema pode ser visualizado na figura 1.7.
O vetor velocidade é fornecido por (1.13), resultando em
dr
v ≡ ṙ = = hr ṙ êr + hθ θ̇ êθ + hφ φ̇ êφ
dt
= ṙ êr + rθ̇ êθ + r sen θφ̇ êφ .
Este resultado pode ser verificado por derivação direta de r (t).

Para se obter a aceleração, primeiro calcula-se



 ˙ r = cos θ cos φθ̇ − sen θ sen φφ̇ x̂1 + cos θ sen φθ̇ + sen θ cos φφ̇ x̂2 − senθθ̇ x̂3
ê







 = θ̇ êθ + sen θφ̇ êφ


êθ = − sen θ cos φθ̇ + cos θ sen φφ̇ x̂1 + − sen θ sen φθ̇ + cos θ cos φφ̇ x̂2 − cos θθ̇ x̂3





 = −θ̇ êr + cos θφ̇ êφ

êφ = − cos φφ̇ x̂1 − sen φφ̇ x̂2






= − sin θφ̇ êr − cos θφ̇ êθ .

Então,

a ≡ v̇ = r̈êr + ṙθ̇ + rθ̈ êθ + ṙ sen θφ̇ + r cos θθ̇φ̇ + r sen θφ̈ êφ + ṙê˙ r + rθ̇ê˙ θ + r sen θφ̇ê˙ φ ,
resultando

a = r̈ − rθ̇2 − r sin2 θφ̇2 êr + rθ̈ + 2ṙθ̇ − r sen θ cos θφ̇2 êθ

+ r sen θφ̈ + 2 sen θṙφ̇ + 2r cos θθ̇φ̇ êφ .
Por sua vez, os operadores diferenciais ficam, para ψ = ψ (r, θ, φ) e A = A (r, θ, φ),
∂ψ 1 ∂ψ 1 ∂ψ
∇ψ = êr + êθ + êφ
∂r r ∂θ r sen θ ∂φ
1 ∂ 1 ∂ 1 ∂Aφ
r 2 Ar +

∇·A= 2 (sen θAθ ) +
r ∂r r sen θ ∂θ r sen θ ∂φ

êr r êθ r sen θ êφ
1
∇×A= 2 ∂/∂r ∂/∂θ ∂/∂φ
r sen θ
Ar rAθ r sen θAφ
∂2ψ

2 1 ∂ 2 ∂ψ 1 ∂ ∂ψ 1
∇ ψ= 2 r + 2 sen θ + 2 .
r ∂r ∂r r sen θ ∂θ ∂θ r sen2 θ ∂φ2
1.5.3 C OORDENADAS ELÍPTICAS CILÍNDRICAS

Este sistema de coordenadas é empregado com frequência muito menor que os anteriores,
mas é adequado para tratar sistemas que ocorrem sobre superfícies elípticas, ao invés de esféri-
cas. Trata-se de um sistema de coordenadas ortogonais resultantes da projeção sobre o eixo x3
de um sistema de coordenadas elíptico sobre o plano x1 − x2 . Desta forma, as superfícies coor-
denadas são superfícies elípticas e hiperbólicas confocais, sendo que os focos estão usualmente
posicionados nos pontos x1 = −a e x1 = a (a > 0).
As coordenadas elípticas são definidas por {q1 , q2 , q3 } → {u, v, x3 }, sendo

 x1 = a cosh u cos v

x2 = a senh u sen v

x3 = x3 ,

onde 0 6 u < ∞ e 0 6 v < 2π estão relacionados com as coordenadas Cartesianas por
x21 x22 x21 x2

+ =1 e − 2 2 2 = 1.
a2 cosh u a2 senh2 u
2 a2 2
cos v a sen v
As coordenadas elípticas cilíndricas e algumas superfícies coordenadas podem ser visualizadas
na figura 1.8.
Escrevendo-se o vetor posição como
r = a cosh u cos v x̂1 + a senh u sen v x̂2 + x3 x̂3 ,
resultam as bases e os fatores de escala

x2 (b)
(a)
v = c2 u = c1
êv
êu x3
x1
x1 x2
Figura 1.8: (a) Coordenadas elípticas cilíndricas e seus vetores unitários. (b) Algumas superfícies coordenadas.

∂r
 eu = = a senh u cos v x̂1 + a cosh u sen v x̂2




 ∂u
 ∂r
ev = = −a cosh u sen v x̂1 + a senh u cos v x̂2

 ∂v
∂r


 e3 = = x̂3


∂x3

2 2
−1/2
 êu = senh u + sen v (senh u cos v x̂1 + cosh u sen v x̂2 )


=⇒ 2 −1/2
êv = senh u + sen2 v

 (− cosh u sen v x̂1 + senh u cos v x̂2 )

ê3 = x̂3

( p
hu = hv = a senh2 u + sen2 v
=⇒
h3 = 1.
Novamente observa-se que o sistema é ortogonal, êu · êv = êu · x̂3 = êv · x̂3 = 0 e êu × êv = x̂3 ,
bem como todas as permutações cíclicas.
Agora, os vetores da base canônica podem ser escritos em termos da nova base como

2 2
−1/2
 x̂1 = senh u + sen v

 (senh u cos v êu − cosh u sen v êv )
−1/2
x̂2 = senh2 u + sen2 v

 (cosh u sen v êu + senh u cos v êv )

x̂3 = ê3 .

Assim, o vetor posição pode ser escrito em termos da nova base como
a senh u cosh u a sen v cos v
r=p êu − p êv + x3 x̂3 .
2
senh u + sen v 2 senh2 u + sen2 v
O tensor de métrica é dado por
a senh2 u + sen2 v
 2 
0 0
a2 senh2 u + sen2 v 0 .

g= 0
0 0 1
Já os elementos de superfície e volume ficam

p p
dσ = a senh2 u + sen2 vdvdx3 êu + a senh2 u + sen2 vdudx3 êv + a2 senh2 u + sen2 v dudv x̂3

d3 r = a2 senh2 u + sen2 v dudvdx3 .


d`
r
A(r)
Figura 1.9: Linhas de força do campo A (r). O elemento de arco d` é tangencial ao campo no ponto r.
Finalmente, os operadores diferenciais ficam

1 ∂ψ ∂ψ ∂ψ
∇ψ = p êu + êv + x̂3
2
a senh u + sen v2 ∂u ∂v ∂x 3
∂A
1 ∂ p 2 2 vA
∂ p 2 2 vA 3
∇·A= senh u + sen u + senh u + sen v +
a senh2 u + sen2 v ∂u

∂v ∂x3
p p
a senh2 u + sen2 v êu a senh2 u + sen2 v êv x̂3

1
∇×A= 2 ∂/∂u ∂/∂v ∂/∂x3

2
p
2
a senh u + sen v p
a senh2 u + sen2 vAu a senh2 u + sen2 vAv A3

2
∂ ψ ∂2ψ ∂2ψ

1
∇2 ψ = 2 2 + + .
2 2 ∂x23

a senh u + sen v2 ∂u ∂v
1.6 L INHAS DE FORÇA E SUPERFÍCIES EQUIPOTENCI -

AIS
Em muitas situações, uma melhor compreensão do comportamento de certos campos vetori-
ais é possibiliitada fazendo-se uso do conceito de linhas de força ou de superfícies equipotenciais.
1.6.1 L INHAS DE FORÇA DE UM CAMPO VETORIAL

Seja então o campo vetorial A = A (r) no espaço vetorial E 3 . Suas linhas de força são as
curvas no E 3 cujas tanjentes são paralelas a A (r) em todos os pontos. Uma representação das
linhas de força para um campo vetorial arbitrário pode ser vista na figura 1.9. Para traçar estas
linhas, faz-se necessário obter um conjunto de equações diferenciais cujas soluções correspon-
derão às mesmas. Sendo então d` o elemento de arco na direção e no sentido de A em todos
os pontos, conforme representado na figura 1.9, uma condição suficiente para a obtenção das
equações diferenciais desejadas é
d` × A = 0.
Considerando-se agora o sistema de coordenadas curvilíneas ortogonais {q1 , q2 , q3 }, o ele-
P3
mento de arco d` é dado por (1.12) e A = i=1 Ai (q1 , q2 , q3 ) êi . Portanto,

ê1 ê2 ê3

d` × A = h1 dq1 h2 dq2 h3 dq3 = 0,
A1 A2 A3
de onde resulta o sistema de equações
h1 A2 dq1 − h2 A1 dq2 = 0
h3 A1 dq3 − h1 A3 dq1 = 0 (1.27)
h2 A3 dq2 − h3 A2 dq3 = 0,

20 1.6. Linhas de força e superfícies equipotenciais
cuja solução irá fornecer a expressão para as linhas de força.

Exemplo 1.1. Linhas de força de uma carga puntiforme.
O campo elétrico de uma carga elétrica puntiforme situada na origem do sistema de coorde-
nadas pode ser escrita em coordenadas esféricas como
q
E (r) = K êr ,
r2
onde K é uma constante que depende do sistema de unidades empregado. As expressões para as
coordenadas esféricas e seus fatores de escala são q1 = r, q2 = θ, q3 = ϕ, h1 = 1, h2 = r, h3 = r sen θ.
Então o sistema de equações (1.27) se reduz a
q
−K dθ = 0
r
q
sen θK dϕ = 0,
r
ou seja, θ = cte e ϕ = cte.
O exemplo a seguir mostra obtém as linhas de força de um dipolo elétrico.
Exemplo 1.2. Linhas de força de um dipolo elétrico.
O campo elétrico de um dipolo de momento p centrado na origem do sistema de coordenadas
é dado por
K
E (r) = 5 3 (p · r) r − r2 p .

r
Em coordenadas esféricas, este campo fica escrito
Kp
E (r) = (2 cos θ êr + sen θ êθ ) .
r3
Então, o sistema de equações (1.27) fica
sen θdr − 2r cos θdθ = 0
dϕ = 0.
A segunda equação mostra que ϕ = cte. ao longo de uma linha de força. Já a primeira fica
escrita
dr
= cotan θdθ =⇒ ln r1/2 = ln (sen θ) + C =⇒ r = L sen2 θ,
2r
sendo L uma constante que parametriza uma determinada linha de força.
O exemplo a seguir obtém as linhas de força de um quadrupolo elétrico.
Exemplo 1.3. Linhas de força de um quadrupolo elétrico.
Seja um quadrupolo elétrico gerado pela seguinte distribuição de 3 cargas elétricas posicio-
nadas ao longo do eixo z: 1 carga +q em z = −b, uma carga −2q em z = 0 e uma carga +q em
z = +b. Para esta distribuição em particular, não existem termos nem de monopolo (carga total
nula) nem de dipolo (ptotal = p − p = 0). Portanto, a primeira contribuição não nula em uma
expansão de multipolos provém do termo de quadrupolo elétrico.
O potencial eletrostático desta distribuição, observado em um ponto r b é dado por
Kqb2
3 cos2 θ − 1 .

Φ (r) =
r3
Então o campo elétrico fica, em coordenadas esféricas,
∂Φ 1 ∂Φ
E (r) = −∇Φ (r) = − êr − êθ ,
∂r r ∂θ
Kqb2
3 cos2 θ − 1 êr + sen (2θ) êθ .

E (r) = 3 4
r
Assim, o sistema de equações (1.27) fica
1
sen (2θ) dr − 3 cos2 θ − 1 dθ = 0

r
dϕ = 0.

A segunda equação novamente fornece ϕ = cte. Já a primeira pode ser escrita
1 3 cos2 θ − 1
dr = dθ.
r sen (2θ)
Integrando-se ambos os lados, obtém-se

1
ln r = ln (|cos θ|) + ln (sen θ) + C,
2
a qual pode ser escrita como
r2 = L sen2 θ |cos θ| .
R EFERÊNCIAS
ARFKEN, G. B.; WEBER, H. J. Mathematical Methods for Physicists. Sixth. New York: Elsevier,
2005. 1182 + xii pp. ISBN: 0-12-059876-0.
CHOW, T. L. Mathematical Methods for Physicists: A Concise Introduction. Cambridge: Cambridge,
2000. 555 pp. ISBN: 0521655447.

22 REFERÊNCIAS

2
F UNÇÕES DE U MA VARIÁVEL
C OMPLEXA
UITAS VEZES , pergunta-se o porquê da necessidade de se estudar variáveis comple-
M xas quando na física estamos interessados apenas nas soluções reais. Poder-se-ia
esperar que um estudo de funções reais de variáveis reais seria suficiente para se
conhecer as soluções fisicamente relevantes. A resposta é que em muitas situa-
ções é desejavel estender nosso estudo a valores complexos das variáveis e das
soluções por razões de completicidade e conveniência. Por exemplo, o conjunto dos números
reais não forma uma base suficiente para a representação das raízes de equações polinomiais
ou algébricas. Além disso, o conhecimento do comportamento de uma função complexa f (z),
para todos os valores complexos de z, nos fornece uma visão mais completa de suas principais
propriedades (mesmo suas propriedades para z real), do que o conhecimento de seu compor-
tamento para somente valores reais de z. A localização, no plano complexo, dos zeros e dos
infinitos de f (isto é, a posição das raízes de f (z) = 0 e de 1/f (z) = 0) nos fornece informações
sobre o comportamento de f para todos os valores de z. Adicionalmente, uma integral de f (z)
ao longo de valores reais de z pode ser modificada em uma integral ao longo de uma trajetória
conveniente no plano complexo, de forma a simplificar consideravelmente o seu cálculo.
Integrais no plano complexo possuem uma ampla variedade de aplicações úteis na física e na
matemática. Dentre estas, pode-se destacar:
• Cálculo de integrais definidas.
• Inversão de séries de potências.
• Cálculo de produtos infinitos.
• Obtenção de soluções de equações diferenciais para grandes valores da variável (soluções

assintóticas).
• Investigação da estabilidade de sistemas potencialmente oscilatórios.
• Inversão de transformadas integrais.
Algumas destas propriedades serão tratadas ao longo deste capítulo.

Em se tratando de soluções de equações da física-matemática, uma solução complexa deve
ser tratada como uma função ou número complexos até o momento em que se quer compará-la
com um valor medido, físico. Neste momento, devemos associar a parte real e/ou imaginária ou
outra quantidade real derivada do número complexo (tal como o módulo) com parâmetros físicos
reais. Assim, mencionando somente dois exemplos, o índice de refração real de uma onda
eletromagnética propagando-se em um meio ativo torna-se uma quantidade complexa quando a
absorção da energia transportada pela onda é incluída. A energia real associada com um nível de
energia atômico ou nuclear torna-se complexa quando o tempo de vida finito do nível de energia
é considerado.
Mas a mais importante razão para se estudar funções complexas é a compreensão que se
pode obter a respeito das propriedades gerais das funções. Por exemplo, as singularidades da
função podem estar relacionadas com singularidades físicas, tais como as causadas por fontes,
cargas elétricas pontuais, etc. É possível, a partir do conhecimento das singularidades de uma
função complexa, especificar-se a função completamente.
Estes serão alguns dos tópicos abordados neste capítulo.
23
24 2.1. Números e variáveis complexos
2.1 N ÚMEROS E VARIÁVEIS COMPLEXOS

O sistema numérico em uso atualmente é o resultado de um desenvolvimento gradual na
matemática que se iniciou na Idade Antiga. Os números naturais (inteiros positivos) {0, 1, 2, . . . }
foram utilizados inicialmente para a contagem. O conjunto dos números naturais é representado
pelo símbolo N e diz-se que um dado número natural n pertence a N (n ∈ N).
Os inteiros negativos e o conceito do zero foram então introduzidos para permitir soluções de
equações tais como x+3 = 2. Cria-se então o conjunto dos números inteiros {. . . , −2, −1, 0, 1, 2, . . . },
representado pelo símbolo Z. Observa-se aqui que o conjunto N é um sub-conjunto de Z. Diz-se
então que N está contido em Z (N ⊂ Z), ou que Z contém N (Z ⊃ N).
Para permitir a solução de equações tais como bx = a, para todos os inteiros a e b (com
b 6= 0), os números racionais (x = a/b) foram introduzidos. Representa-se o conjunto de todos
os números racionais por Q = {x | x = p/q, com (p, q) ∈ Z e q 6= 0}. Nota-se aqui que Q contém Z,
consistindo em aqueles x ∈ Q | q = 1.
Posteriormente, os números irracionais foram introduzidos quando descobriu-se que núme-
ros tais como as soluções da equação
√
x2 − 2 = 0 =⇒ x = ± 2 = ±1.41423 . . .
ou a razão entre o perímetro de uma circunferência de raio unitário e o seu diâmetro, igual a
π = 3.14159265359 . . . , não podem ser expressos por números racionais. O conjunto dos números
irracionais é representado pelo símbolo Q0 . Nota-se aqui que Q não contém nem está contido em
Q0 , sendo ambos conjuntos de números completamente distintos.
A reunião, ou a união, dos números racionais com os irracionais formam o conjunto dos
números reais, representado pelo símbolo R (R = Q ∪ Q0 ). Disciplinas usuais de cálculo apre-
sentam seus teoremas e resultados considerando somente números pertencentes ao conjunto
R. Contudo, este conjunto ainda está incompleto para aplicações em álgebra e para a análise
matemática.
Os números complexos foram descobertos na Idade Média, ao se pesquisar as raízes de certas
equações quadráticas, tais como
√
z 2 + 1 = 0 =⇒ z = ± −1.
É óbvio, pelo nome dado, que eles foram considerados de maneira suspeita. Leonhard Paul
Euler (1707-1783), em 1777, introduziu o símbolo
√
i = −1.
Carl Friedrich Gauss (1777-1855), na sua tese de doutorado em 1799, forneceu aos números
complexos a agora familiar expressão algébrica z = x + iy, bem como a sua representação geomé-
trica (vetorial) e, com isso, ajudou a desvendar parte de seu mistério. Neste século, a tendência
tem sido definir os números complexos como símbolos abstratos sujeitos a certas regras formais
de manipulação. √
Como o número −1 não possui representação possível dentro do conjunto√ de números reais,
chamou-se este número de imaginário puro e atribuiu-se a ele símbolo i = −1. Além disso,
definiu-se um conjunto mais amplo de números, denominado conjunto dos números complexos
C ⊃ R, o qual contém todos os números complexos, tendo o conjunto dos números reais como
um sub-conjunto.
Um número complexo nada mais é que um par ordenado de dois números reais x e y. Assim,
o número complexo z pode ser representado de, pelo menos, duas maneiras:
z = (x, y) = x + iy,
sendo a última representação a preferida neste texto. Deve-se notar que o ordenamento é signi-
ficante; assim, a + ib 6= b + ia.
Uma propriedade imediata do número i pode ser deduzida observando-se que i2 = i · i = −1,
i = i2 · i = −i, i4 = i2 · i2 = 1, i5 = i · i4 = i, . . . . Da mesma forma,
3
1 i
i−1 = = = −i
i i·i
1
i−2 = 2 = −1
i
C APÍTULO 2. Funções de Uma Variável Complexa 25
Figura 2.1: Plano complexo ou diagrama de Argand.
1
i−3 = − =i
i
i−4 = 1
... ...,
resultando
i±2n = (−1)n (2.1a)

±(2n+1) n
i = ±(−1) i, para n = 0, 1, 2, 3, . . . . (2.1b)
2.1.1 R EPRESENTAÇÕES VETORIAL E POLAR

Em muitas situações, é conveniente empregar-se uma representação gráfica da variável com-
plexa. Traçando-se x — a parte real de z — como a abcissa e y — a parte imaginária de z —
como a ordenada, obtém-se o plano complexo, ou plano de Argand, ilustrado na figura 2.1.
Em álgebra linear, frequentemente utiliza-se o conceito de um vetor posição r como membro
do espaço vetorial R2 . Assim, pode-se representar o vetor r fazendo-se uso da base canônica
{ı̂, ̂}:
r = xı̂ + y̂,
sendo x a componente de r na direção definida por ı̂ e y a componente de r ao longo de ̂.
Da mesma forma, pode-se interpretar o número complexo z = x + iy, de acordo com a re-
presentação gráfica da figura 2.1, como um vetor (ou fasor), sendo x a componente ao longo do
eixo real e y a componente ao longo do eixo imaginário. Assim, tal quantidade satisfaz as regras
usuais de adição de vetores e de multiplicação por escalar. Inspecionando a figura 2.1, relações
simples de trigonometria mostram que
x = r cos θ
y = r sen θ,
sendo r ∈ R (0 ≤ r < ∞) denominado módulo ou magnitude de z e θ ∈ R (0 ≤ θ < 2π)1 chamado

de argumento ou fase de z. Portanto,
z = r (cos θ + i sen θ) , (2.2a)
onde
p
r= x2 + y 2 (2.2b)
−1
θ = tan (y/x) . (2.2c)
1 Ver uma definição mais geral para o intervalo de variação de θ a seguir.

26 2.2. Álgebra de números complexos
2.1.2 F ÓRMULA DE E ULER

Uma representação equivalente à representação algébrica de z dada por (2.2) é a chamada
representação polar:
z = reiθ . (2.3)
Demonstração. A partir das seguintes séries de McLaurin:
∞
X x2n+1
sen x = (−1)n
n=0
(2n + 1)!
∞
X x2n
cos x = (−1)n
n=0
(2n)!
∞
X xn
ex =
n=0
n!
e das potências (2.1a,b), obtemos

∞ ∞ ∞
iθ
X (iθ)n X (iθ)2n X (iθ)2n+1
e = = +
n=0
n! n=0
(2n)! n=0
(2n + 1)!
∞ ∞
X θ2n X θ2n+1
= (−1)n +i (−1)n ,
n=0
(2n)! n=0
(2n + 1)!
ou seja,
eiθ = cos θ + i sen θ .
Esta é a conhecida Fórmula de Euler.
2.2 Á LGEBRA DE NÚMEROS COMPLEXOS

Sendo z = x + iy ∈ C um número complexo qualquer, as seguintes operações e definições se
aplicam:
Parte real de z: a parte real de z é o número x ∈ R. Esta operação é representada por
Re z = x.
Parte imaginária de z: a parte imaginária de z é o número y ∈ R. Esta operação é representada

por
Im z = y.
Complexo conjugado de z: o complexo conjugado de z, representado por z̄ ou z ∗ , tal que z ∗ ∈ C,

é definido por z ∗ = x − iy. Na figura 2.1, pode-se observar a representação vetorial de z ∗ .
Módulo de z: é o número |z| ∈ R tal que
p √
|z| = |x + iy| = x2 + y 2 = z.z ∗ .
Fase ou argumento de z: número θ ∈ R tal que θ0 6 θ < θ0 + 2π, dado por

y
θ ≡ arg(z) = tan−1 .
x
Usualmente, toma-se θ0 = 0, mas outros textos podem usar, por exemplo, −π 6 θ < π.
As seguintes operações algébricas estão definidas para dois números z1 = a + ib = r1 eiθ1 e
z2 = c + id = r2 eiθ2 quaisquer, tais que {z1 , z2 } ∈ C. Os números {r1 , r2 } ∈ R são, respectivamente,
os módulos de z1 e z2 e {θ1 , θ2 } ∈ R são os respectivos argumentos.
Identidade: Se z1 = z2 , então Re z1 = Re z2 e Im z1 = Im z2 ; ou, de forma equivalente, r1 = r2 e
θ1 = θ2 + 2kπ.

Im (a) Im (b)
b+d
2
z1 .z
z2 z2
2
1 +z
z
θ1+θ2
b θ2 z1
z1
c a a+c θ1
Re Re
Figura 2.2: (a) Representação da operação z1 + z2 . (b) Representação da operação z1 .z2 .
Adição: z1 + z2 = (a + ib) + (c + id) = (a + c) + (b + d)i. Esta operação está representada na figura

2.2(a).
Subtração: z1 − z2 = (a + ib) − (c + id) = (a − c) + (b − d)i.

∗
Conjugação complexa da adição: (z1 + z2 ) = z1∗ + z2∗ .
Multiplicação por real: Dado um h ∈ R,
h.z1 = h(a + ib) = ha + ihb.
Multiplicação de complexos:
z1 .z2 = (a + ib)(c + id) = (ac − bd) + (ad + bc)i,
ou, em termos da forma polar,
z1 .z2 = r1 r2 ei(θ1 +θ2 ) = r1 r2 [cos (θ1 + θ2 ) + i sen (θ1 + θ2 )] . (2.4)
Esta operação está representada na figura 2.2(b).
Divisão de complexos:
z1 z∗ z1 .z2∗
= z1 2 ∗ = 2 , ou
z2 z2 .z2 |z2 |
z1 a + ib (a + ib)(c − id) ac + bd ad − bc
= = = 2 −i 2 .
z2 c + id (c + id)(c − id) c + d2 c + d2
Ou, em termos da forma polar,

z1 r1 r1
= ei(θ1 −θ2 ) = [cos (θ1 − θ2 ) + i sen (θ1 − θ2 )] .
z2 r2 r2
∗
Conjugação complexa do produto: (z1 .z2 ) = z1∗ .z2∗ .
Outras operações algébricas, como potenciação e radiciação, serão vistas nas seções seguintes.
O valor absoluto de z ainda possui as seguintes propriedades. Sendo {z1 , z2 , . . . , zn } números
complexos, então
1. |z1 z2 . . . zn | = |z1 | |z2 | . . . |zn |.

z1 |z1 |
2. = , desde que z2 6= 0.
z2 |z2 |
3. |z1 + z2 + · · · + zn | 6 |z1 | + |z2 | + · · · + |zn |.

28 2.2. Álgebra de números complexos
4. |z1 ± z2 | > ||z1 | − |z2 ||.

Números complexos z = reiθ com r = 1 possuem |z| = 1 e são denominados unimodulares.
Pode-se imaginar estes números situados ao longo da circunferência de raio unitário sobre o
plano complexo. Pontos especiais nesta circunferência são:
θ = 0. z = ei0 = 1.
θ = π/2. z = eiπ/2 = i.
θ = π. z = e−iπ = −1.
θ = 3π/2 ou θ = −π/2. z = ei3π/2 = e−iπ/2 = −i.
2.2.1 F ÓRMULA DE M OIVRE

Sejam z1 = r1 (cos θ1 + i senθ1 ) = r1 eiθ1 e z2 = r2 (cos θ2 + i senθ2 ) = r2 eiθ2 dois números comple-
xos. Então o produto de ambos já foi calculado em (2.4):
z1 z2 = r1 r2 ei(θ1 +θ2 ) = r1 r2 [cos (θ1 + θ2 ) + i sen (θ1 + θ2 )] .
Generalizando agora este resultado para n números complexos, {z1 , z2 , . . . , zn }, obtém-se
z1 z2 . . . zn = r1 r2 . . . rn ei(θ1 +θ2 +···+θn ) = r1 r2 . . . rn [cos (θ1 + θ2 + · · · + θn ) + i sen (θ1 + θ2 + · · · + θn )] .
Agora, se z1 = z2 = · · · = zn = z, onde se escreve z = r (cos θ + i senθ). Resulta então,

n
z n = rn (cos θ + i senθ) = rn [cos (nθ) + i sen (nθ)] , (2.5)
a qual é a fórmula para a n−ésima potência (n > 0) de z. Cancelando os termos rn em ambos os

lados de (2.5), resulta a Fórmula de Moivre:
n
(cos θ + i senθ) = cos (nθ) + i sen (nθ) . (2.6)
2.2.2 R AÍZES DE NÚMEROS COMPLEXOS

A Fórmula de Moivre (2.6) permite que se obtenha uma expressão para as raízes de um
número complexo. Para tanto, considera-se a seguinte equação polinomial:
z n − w = 0, (2.7)
onde n ∈ N e w ∈ C. Buscar a solução de (2.7) é equivalente

√ a buscar a raiz n de w. Esta
solução poderia ser escrita simplesmente como z = n w, mas esta forma dá a entender que
existe somente uma solução de (2.7), o que não é verdade. O número de soluções (ou raízes)
de um polinômio de grau n, como a função no lado esquerdo de (2.7), é bem determinado, de
acordo com o Teorema Fundamental da Álgebra abaixo.
Teorema 2.1 (Teorema Fundamental da Álgebra). Toda equação polinomial de grau n, cujos
coeficientes são reais ou complexos, possui exatamente n raízes reais ou complexas.
Portanto, deve-se buscar n soluções para (2.7), o que é equivalente a procurar as n raízes de
w, as quais serão denominadas z0 , z1 , . . . , zn−1 . Concentrando-nos inicialmente em z0 , tal que
z0n = w,
pode-se usar para ambos as suas formas polares dadas por (2.2a),
z0 = |z0 | (cos θ + i sen θ) e w = |w| (cos α + i sen α) .
Então, de acordo com (2.6),

n n n
|z0 | (cos θ + i sen θ) = |z0 | [cos (nθ) + i sen (nθ)] = |w| (cos α + i sen α) , (2.8)
possibilitando-nos a identificar
n
p
n
|z0 | = |w| =⇒ |z0 | = |w|,

Im Im (b)
(a)
w w
z1
z 0
z0
Re Re
z 1
z2
Figura 2.3: (a) Raízes quadradas z0 e z1 de w = 1 + i. (b) Raízes cúbicas w0 , w1 e w2 de z = 1 + i.
α
nθ = α =⇒ θ = .
n
Portanto, a raiz principal de (2.7) é dada por
p h α α i p
z0 = n
|w| cos + i sen = n |w|eiα/n . (2.9a)
n n
Contudo, como já foi mencionado, existem outras n − 1 raízes distintas de w. Estas outras raízes
podem ser determinadas levando-se em conta as identidades
cos (β ± 2kπ) = cos β e sen (β ± 2kπ) = sen β, para k = 0, 1, 2, 3, . . . .
Assim, retornando-se a (2.8), pode-se escrever a relação entre as fases como

α + 2kπ
nθ − 2kπ = α =⇒ θ = .
n
Constata-se facilmente que se α for substituído por α+2kπ em (2.9a), haverá sempre um número
total de n arcos tais que
α + 2kπ
06 6 2π, para k = 0, 1, . . . , n − 1,
n
os quais são geometricamente distintos sobre o plano complexo. Se fossem considerados os
valores k = n, n + 1, . . . , isto simplesmente repetiria os arcos anteriormente encontrados.
Portanto, as n raízes de (2.7), incluindo z0 , são:

p α + 2kπ α + 2kπ p
n
zk = |w| cos + i sen = n |w|ei(α+2kπ)/n , (k = 0, 1, . . . , n − 1) . (2.9b)
n n
Exemplo 2.1 (Raízes quadradas). Dado o número w = 1 + i, encontre as suas raízes quadradas.
Solução: há exatamente 2 raízes quadradas para w. Inicialmente, escreve-se w na forma polar:
√ π π √ π
w = 2 cos + i sen =⇒ |w| = 2 e α = ,
4 4 4
sendo que π/4 ; 45◦ . De acordo com (2.9b), n = 2, k = 0, 1, e as raízes são:
√
4
π π
z0 = 2 cos + i sen ,
8 8
30 2.3. Funções de uma variável complexa
√

4 9π 9π
8 8
sendo que π/8 ; 22, 5◦ e 9π/8 ; 202, 5◦ , de tal forma que as raízes z0 e z1 são antiparalelas no
plano complexo. Estas raízes encontram-se representadas no diagrama da figura 2.3(a).
Exemplo 2.2 (Raízes cúbicas). Dado o número w = 1 + i, encontre as suas raízes cúbicas.
Solução: há exatamente 3 raízes cúbicas para w. Dado w na forma polar:
√ π π √ π
z = 2 cos + i sen =⇒ |z| = 2 e θ = ,
4 4 4
sendo que π/4 ; 45◦ . Agora, de acordo com (2.9b), n = 3, k = 0, 1, 2, e as raízes são:
√6
h π π i
12 12
√

6 3π 3π
4 4
√

6 17π 17π
12 12
sendo que π/12 ; 15◦ , 3π/4 ; 135◦ e 17π/12 ; 255◦ , de tal forma que z0 , z1 e z2 estão nos vértices
de um triângulo equilátero. Estas raízes encontram-se representadas no diagrama da figura
2.3(b).
2.3 F UNÇÕES DE UMA VARIÁVEL COMPLEXA

Seja D ⊆ C um conjunto de números complexos z = x + iy. Uma função f (z), definida em D é
uma operação que atribui a cada z ∈ D um outro número complexo w ∈ I, onde I ⊆ C. O número
w é denominado o valor de f (z) em z, isto é,
w = f (z).
O conjunto D é denominado o domínio de definição de f(z) e o conjunto I é denominado a imagem

de f(z).
Deve ser enfatizado que tanto o domínio de definição quanto a operação são necessários para
que a função seja bem definida. Quando o domínio não é especificado, deve-se supor que o
maior conjunto possível é tomado. Assim, se é mencionada simplesmente a função f (z) = 1/z, o
domínio é subentendido como o conjunto de todos os pontos não nulos no plano complexo.
Existem dois tipos básicos de funções complexas:
Funções unívocas. Uma função é denominada unívoca em D se a cada valor de z corresponde
um único valor de w.
Funções plurívocas. Uma função é denominada plurívoca em D se a um determinado valor de
z corresponder mais de um valor de w. Uma função plurívoca pode ser considerada como
uma coleção de funções unívocas, onde cada membro desta coleção é chamado de ramo
da função plurívoca. É usual tomar-se um membro em particular da coleção como o ramo
principal da função plurívoca e o valor da função correspondente a este ramo é denominado
valor principal.
Como exemplos de funções unívocas ou plurívocas, pode-se tomar:
1. w = z 2 – função unívoca ou simplesmente função.
√
2. w = z – função plurívoca, pois a cada valor de z correspondem dois valores de w, de acordo
com (2.9b). Assim:
√ √
se z = reiθ , então z = wk = rei(θ+2kπ)/2 , onde k = 0, 1,
√
Para k = 0 : w0 = reiθ/2 −→ ramo principal.
√ √
Para k = 1 ; w1 = reiθ/2 eiπ = − reiθ/2 −→ segundo ramo.

2.3.1 T RANSFORMAÇÕES OU MAPEAMENTOS

Nota-se agora que w, como o valor de f (z), também é uma variável complexa e que, portanto,
pode ser escrita na forma
w = u + iv,
sendo {u, v} ⊂ R, ao passo que f (z) também pode ser separada em partes real e imaginária,
f (z) = u (x, y) + iv (x, y) ,
onde u (x, y) e v (x, y) são ambas funções reais. Igualando as partes real e imaginária das expres-
sões acima, obtém-se
Re w = u = u (x, y) , Im w = v = v (x, y) .
Se w = f (z) é uma função unívoca de z, então pode-se imaginar o plano complexo de z e, a
cada ponto neste plano, corresponde um ponto no plano complexo de w. Se f (z) for plurívoca,
então um ponto no plano complexo de z é mapeado em mais de um ponto no plano complexo de
w. Pontos no plano z são mapeados em pontos no plano w, enquanto que curvas no plano z são
mapeadas em curvas no plano w. A figura 2.4 ilustra o processo de mapeamento.
f(z)
w
z
Figura 2.4: A função w = f (z) mapeia pontos no plano z em pontos no plano w.
2.3.2 P ONTOS DE RAMIFICAÇÃO , LINHAS DE RAMIFICAÇÃO E SU -

PERFÍCIES DE R IEMANN
2
Comparando agora√ o comportamento de uma função unívoca, f1 (z) = z , e de uma função
plurívoca, f2 (z) = z, percebe-se uma diferença importante entre ambas. Suponha que seja
permitido que z = reiθ execute uma revolução completa em torno do ponto z = 0, no sentido
anti-horário e mantendo r = cte., partindo de um determinado ponto no seu plano complexo.
Esta operação consiste em substituir
θ −→ θ + 2π (2.10)
na fórmula polar de z. Observando agora o comportamento de f1 (z) e f2 (z) frente a transforma-
ção (2.10), observa-se que
f1 (z) → r2 ei2θ ei4π → f1 (z)

f2 (z) → r1/2 eiθ/2 eiπ → −f2 (z).
Pode-se constatar que f1 (z) permanece inalterada frente a transformação (2.10), porém f2 (z)
muda de sinal. Como o plano complexo possui por definição uma variação total de fase igual a
2π, a transformação (2.10) levou f2 (z) a um valor distinto daquele que apresentava no início. De
fato, f2 (z) somente retornará ao valor inicial através de uma nova rotação completa. Ou seja,

32 2.3. Funções de uma variável complexa
√
Figura 2.5: Linha de ramificação para a função w = z.
√
f2 (z) = z não apresenta simetria frente a uma rotação de 2π radianos, mas sim frente a uma
rotação θ → θ + 4π, em cuja situação
f2 (z) → r1/2 eiθ/2 ei2π → f2 (z).

√
Pode-se descrever o que se sucede com a função f2 (z) = z afirmando-se que quando 0 6
θ < 2π, o mapeamento do plano z para o plano w permanece sobre um dos ramos da função
plurívoca f2 (z), enquanto que no intervalo 2π 6 θ < 4π, o mapeamento leva ao outro ramo
da função. Claramente, sobre cada ramo a função f2 (z) é unívoca e, para assim mantê-la,
estabelece-se uma barreira artificial ligando a origem ao infinito ao longo de alguma reta sobre o
plano complexo de z. A função permanecerá unívoca desde que esta barreira não seja cruzada.
√
Para a função z, esta linha é usualmente traçada ao longo do eixo real positivo e é deno-
minada linha de ramificação, enquanto que o ponto O, de onde parte a linha de ramificação,
é denominado ponto de ramificação. A figura 2.5 mostra esta linha de ramificação como uma
linha sinuosa sobre o eixo real positivo. É importante enfatizar aqui que uma volta em torno de
um outro ponto qualquer, distinto da origem, de tal forma que esta não √ esteja dentro da área
delimitada pelo caminho fechado, não leva a um outro ramo da função z. Ou seja, o ponto O é
o único ponto de ramificação desta função.
George Friedrich Bernhard Riemann (1826–1866) sugeriu uma outra interpretação para a
linha de ramificação definida acima. Imagina-se o plano z composto por duas folhas sobrepostas
uma à outra. Corta-se agora as duas folhas ao longo da linha OB vista na figura 2.5 e junta-se a
borda inferior da folha de baixo à borda superior da folha de cima. Da mesma forma, juntam-se
as outras duas bordas. Partindo-se então do primeiro quadrante da folha de cima, realiza-se
uma volta completa sobre o plano z em torno de O. Ao se cruzar a linha de ramificação, passa-se
para o primeiro quadrante da folha de baixo; ao se realizar mais um volta completa em torno da
origem, retorna-se √à folha de cima ao se cruzar pela segunda vez a linha de ramificação. Desta
maneira, a função z permanece unívoca sobre um domínio no qual 0 6 θ < 4π.
√
A coleção de duas folhas para a garantia da unicidade da função z é denominada de super-
fície de Riemann. Cada folha de Riemann corresponde a um ramo da função e, sobre cada
folha, a função é unívoca. O conceito de superfície de Riemann possui a vantagem de possibilitar
a obtenção dos vários valores de uma função √ plurívoca de uma maneira contínua. A figura 2.6
ilustra as duas folhas de Riemann da função z.
2.3.3 E XEMPLOS DE FUNÇÕES UNÍVOCAS OU PLURÍVOCAS

√
Além das funções f1 (z) = z 2 e f2 (z) = z já abordadas, outras funções de uma variável
complexa que com frequência surgem são as seguintes.
Função exponencial. Definida por
w = ez = ex+iy = ex (cos y + i seny) .

Funções trigonométricas. Define-se as funções trigonométricas em termos das funções expo-

nenciais.
eiz − e−iz
sen z = +
2i
cos2 z + sen2 z = 1.
iz −iz
e +e
cos z =
2
Funções trigonométricas hiperbólicas. De maneira análoga, define-se
ez − e−z
senh z = +
2
cosh2 z − senh2 z = 1.
z −z
e +e
cosh z =
2
É possível mostrar as seguintes relações entre as funções trigonométricas circulares e as
hiperbólicas:
sen iz = i senh z senh iz = i sen z

cos iz = cosh z cosh iz = cos z.
Função logarítmica. Esta é uma outra função plurívoca, definida por

h i
w = lnz = ln rei(θ+2kπ) = ln r + i (θ + 2kπ) , k = 0, 1, 2, · · · .
Como se pode notar, esta função possui infinitos ramos, sendo w = ln r + iθ, para 0 6 θ < 2π,
o ramo principal. A superfície de Riemann para esta função está representada na figura
2.7.
2.4 O CÁLCULO DIFERENCIAL DE FUNÇÕES DE UMA VA -

RIÁVEL COMPLEXA
Nesta seção serão definidos os conceitos de limites, continuidade e de derivação de uma
função de uma variável complexa.
2.4.1 L IMITE DE UMA FUNÇÃO COMPLEXA

Dados os números {z, z0 , w0 } ⊂ C, diz-se que o número w0 é o limite de f (z) à medida que z se
aproxima de z0 , o que é escrito como
lim f (z) = w0 ,
z→z0
se:
√
Figura 2.6: Folhas de Riemann da função z.

34 2.4. O cálculo diferencial de funções de uma variável complexa
Figura 2.7: Superfície de Riemann da função ln z.
1. A função f (z) está definida e é unívoca em uma vizinhança de z = z0 , com a possível exceção
do próprio ponto z0 .
2. Dado um número real positivo qualquer , arbitrariamente pequeno, existe um outro nú-
mero real positivo δ tal que
|f (z) − w0 | < sempre que 0 < |z − z0 | < δ.
É importante observar o seguinte:
• O limite w0 deve ser sempre o mesmo para um dado z0 , independente da maneira como é
realizado o limite z → z0 .
• Se f (z) é uma função plurívoca, o limite para z → z0 depende do particular ramo em que se
encontra a vizinhança de z0 .
A figura 2.8 ilustra as vizinhanças dos pontos z = x + iy e w0 = u + iv nos respectivos planos

complexos.
Figura 2.8: Vizinhanças dos pontos z0 e w0 nos respectivos planos complexos.
Exemplo 2.3 (Cálculos de limites). Encontre os seguintes limites:

(a) Se f (z) = z 2 , prove que limz→z0 f (z) = z02 .
(b) Encontre limz→z0 f (z) se
(
z 2 , z 6= z0
f (x) =
0, z = z0 .

Solução.
(a) Deve-se mostrar que para qualquer > 0 é sempre possível encontrar-se um δ > 0 (depen-
dendo, em geral, de ) tal que z 2 − z02 < sempre que 0 < |z − z0 | < δ.
Para tanto, considera-se δ < 1. Neste caso, 0 < |z − z0 | < δ implica que
|z − z0 | |z + z0 | < δ |z + z0 | = δ |z − z0 + 2z0 | ,
2
z − z02 < δ (|z − z0 | + 2 |z0 |) < δ (1 + 2 |z0 |) .

Para um 6 1 escolhe-se então δ = / (1 + 2 |z0 |), ou seja, δ < ∀z0 ∈ C, de tal maneira que
2
z − z02 < ,

provando-se o limite.
(b) Não há diferença entre este problema e o problema da parte (a), uma vez que em ambos os
casos o ponto z = z0 foi excluído. Portanto, limz→z0 f (z) = z02 . Nota-se que o valor do limite não
necessariamente é igual ao valor de f (z0 ).
Teorema 2.2 (Propriedades dos limites). Se limz→z0 f (z) = w1 e limz→z0 g(z) = w2 , então as
seguintes propriedades de limites são válidas:
• lim [f (z) + g(z)] = lim f (z) + lim g(z) = w1 + w2 .

z→z0 z→z0 z→z0

• lim [f (z)g(z)] = lim f (z) lim g(z) = w1 w2 .
z→z0 z→z0 z→z0
lim f (z)
f (z) z→z0 w1
• lim = = , desde que w2 6= 0.
z→z0 g(z) lim g(z) w2
z→z0
2.4.2 C ONTINUIDADE
Seja f (z) definida e unívoca em uma vizinhança de z = z0 , assim como em z = z0 . A função
f (z) é dita contínua em z = z0 se
lim f (z) = f (z0 ) .
z→z0
Observa-se que isso implica em três condições que devem ser satisfeitas:
1. O limite deve existir.
2. f (z0 ) deve existir, isto é, f (z) deve ser definida em z = z0 .
3. O limite deve ser igual a f (z0 ).
Pontos no plano z onde f (z) deixa de ser contínua são denominados descontinuidades de f (z).
Se o limite limz→z0 f (z) existe mas não é igual a f (z0 ), então z0 é denominado uma desconti-
nuidade removível, pois é sempre possível redefinir-se f (z) para se obter uma função contínua.
Teorema 2.3 (Teoremas de continuidade). Os seguintes teoremas de continuidade são válidos.
• Se f (z) e g(z) são contínuas em z = z0 , então também são contínuas:

f (z)
f (z) + g(z), f (z)g(z) e , desde que g (z0 ) 6= 0.
g(z)
• Se w = f (z) é contínua em z = z0 e z = g(ξ) é contínua em ξ = ξ0 e se ξ0 = f (z0 ), então a

função w = g [f (z)] é contínua em z = z0 .
Uma função contínua de uma função contínua também é contínua.
• Se f (z) é contínua em uma região fechada do plano complexo, então ela é limitada nessa
região; isto é, existe uma constante real positiva M tal que |f (z)| < M para todos os pontos
z dentro dessa região.
• Se f (z) é contínua em uma região, então as partes real e imaginária de f (z) também são
contínuas nessa região.

2.4.3 D ERIVADAS DE FUNÇÕES COMPLEXAS

Dada uma função f (z), contínua e unívoca de uma variável complexa z, em uma dada região
R ⊆ C, a derivada
df
f 0 (z) ≡
dz
em algum ponto fixo z0 ∈ R é definida como
f (z0 + ∆z) − f (z0 )

f 0 (z0 ) = lim , (2.11)
∆z→0 ∆z
desde que este limite exista de forma independente da maneira como ∆z → 0. Aqui, ∆z =
z − z0 , sendo z ∈ R algum ponto na vizinhança de z0 .
Teorema 2.4. Se uma função f (z) possui derivada em z = z0 , então ela é necessariamente contí-
nua em z = z0 .
Demonstração. Supondo que f (z0 ) exista, então
f (z0 + ∆z) − f (z0 )

lim [f (z0 + ∆z) − f (z0 )] = lim lim ∆z = 0,
z→z0 z→z0 ∆z z→z0
ou seja,
lim f (z0 + ∆z) = f (z0 ) .
z→z0
Se f 0 (z) existe em z0 e em todos os pontos em uma dada vizinhança de z0 , então f (z) é dita
analítica em z0 . A função f (z) é analítica na região R se ela é analítica em todos os pontos
z ∈ R. Contudo, nem toda a função contínua é diferenciável em z = z0 .
Exemplo 2.4. Dada a a função f (z) = z ∗ , mostre que embora esta seja contínua em qualquer
z0 ∈ C, sua derivada dz ∗ /dz não existe em z0 .
Solução. Pela definição (2.11),
∗ ∗ ∗
dz ∗ (z + ∆z) − z ∗ (x + iy + ∆x + i∆y) − (x + iy)
= lim = lim
dz ∆→0 ∆z ∆x→0 ∆x + i∆y
∆y→0
x − iy + ∆x − i∆y − (x − iy) ∆x − i∆y
= lim = lim .
∆x→0 ∆x + i∆y ∆x→0 ∆x + i∆y
∆y→0 ∆y→0
Se ∆y = 0, o limite resulta em lim∆x→0 ∆x/∆x = 1. Por outro lado, se ∆x = 0, o limite resulta

em lim∆y→0 (−∆y) /∆y = −1. Portanto, como o valor do limite depende da maneira como ∆z → 0,
a derivada de f (z) = z ∗ não existe em nenhum ponto e, portanto, a função não é analítica em
nenhum ponto.
2
Exemplo 2.5. Dada a função g(z) = |z| , mostre que esta somente é diferenciável em z = 0.
Solução. Pela definição (2.11),
2 2
|z + ∆z| − |z| (z + ∆z) (z ∗ + ∆z ∗ ) − zz ∗
g 0 (z) = lim = lim
∆z→0 ∆z ∆z→0 ∆z
z ∗ ∆z + z∆z ∗ + ∆z∆z ∗ ∆z ∗
= lim = z ∗ + z lim + lim ∆z ∗ .
∆z→0 ∆z ∆z→0 ∆z ∆z→0
Pode-se considerar 2 possibilidades:

1. z = 0. Neste caso,
g 0 (z)|z=0 = 0,
e a derivada existe.
2. z 6= 0. Neste caso, se g 0 (z) existe, então a derivada deve existir independente da maneira como
se toma o limite. Assim:

• Se ∆z = ∆x, então ∆z ∗ = ∆z e o limite fica
g 0 (z) = z ∗ + z.
• Se ∆z = i∆y, então ∆z ∗ = −∆z e o limite fica
g 0 (z) = z ∗ − z.
Portanto, a função g(z) não é analítica, pois somente possui derivada em z = 0.

Teorema 2.5 (Regras de derivação). As regras de derivação para somas, produtos e quocientes
de funções são, em geral, as mesmas que as regras para funções reais. Isto é, se f 0 (z0 ) e g 0 (z0 )
existem, então
0
• (f + g) (z0 ) = f 0 (z0 ) + g 0 (z0 ).
0
• (f g) (z0 ) = f 0 (z0 ) g (z0 ) + f (z0 ) g 0 (z0 ).
0
f f 0 (z0 ) g (z0 ) − f (z0 ) g 0 (z0 )
• (z0 ) = 2 , se g (z0 ) 6= 0.
g [g (z0 )]
2.4.4 A S CONDIÇÕES DE C AUCHY -R IEMANN

Para testar se uma função f (z) é analítica, Cauchy e Riemann criaram um teste simples
mas extremamente importante para testar a analiticidade de f (z). Para deduzir as condições de
Cauchy-Riemann, retorna-se à definição (2.11),
f (z0 + ∆z) − f (z0 )
f 0 (z0 ) = lim . (2.12)
∆z→0 ∆z
Escrevendo f (z) = u (x, y) + iv (x, y), obtém-se
u (x + ∆x, y + ∆y) − u (x, y) v (x + ∆x, y + ∆y) − v (x, y)
f 0 (z) = lim + i lim .
∆x→0 ∆x + i∆y ∆x→0 ∆x + i∆y
∆y→0 ∆y→0
Existe um número infinito de maneiras para ∆z tender a zero sobre o plano complexo. Consideram-
se duas possibilidades (ver figura 2.9): ao longo de x ou ao longo de y. Supondo-se que se tome
primeiro a rota ao longo de x, mantendo y constante, isto é, ∆y = 0. Neste caso,
u (x + ∆x, y) − u (x, y) v (x + ∆x, y) − v (x, y) ∂u ∂v
f 0 (z) = lim + i lim = +i .
∆x→0 ∆x ∆x→0 ∆x ∂x ∂x
Agora, toma-se a rota ao longo de y, mantendo x constante (∆x = 0). Neste caso,
u (x, y + ∆y) − u (x, y) v (x, y + ∆y) − v (x, y) ∂u ∂v
f 0 (z) = lim + i lim = −i + .
∆y→0 i∆y ∆y→0 i∆y ∂y ∂y
A condição necessária para que f (z) seja analítica é que o li-
mite deve resultar sempre no mesmo valor, independente do ca-
minho adotado sobre o plano complexo. Portanto, uma condição
necessária para que f (z) seja analítica é
∂u ∂v ∂u ∂v
+i = −i + ,
∂x ∂x ∂y ∂y
de onde resultam as condições de Cauchy-Riemann
∂u ∂v ∂u ∂v
= e =− . (2.13)
∂x ∂y ∂y ∂x
Figura 2.9: Caminhos alternati-
Estas relações fornecem também duas expressões úteis para a vos para z0 .
derivada de f (z):
∂u ∂v ∂v ∂u
f 0 (z) = +i = −i . (2.14)
∂x ∂x ∂y ∂y
Podemos estabelecer então o seguinte teorema.

Teorema 2.6 (Condição necessária). Se a derivada f 0 (z) de um função f (z) = u(x, y) + iv(x, y)
existe em um ponto z = x+iy, então as derivadas parciais de primeira ordem de u(x, y) e v(x, y) com
respeito a x e a y devem existir neste ponto e satisfazer as relações de Cauchy-Riemann (2.13).
Além disso, f 0 (z) pode ser determinada pelas expressões (2.14).
Exemplo 2.6 (Condições de Cauchy-Riemann). Seja a função f (z) = z 2 = x2 − y 2 + i2xy. Neste
caso, u(x, y) = x2 − y 2 e v(x, y) = 2xy. Para estas funções,
∂u ∂v ∂u ∂v
= 2x = e = −2y = − .
∂x ∂y ∂y ∂x
Portanto, as relações de Cauchy-Riemann são satisfeitas e f 0 (z) pode ser obtida por (2.14),
f 0 (z) = 2x + i2y = 2z.

2
Exemplo 2.7 (Condições de Cauchy-Riemann). Seja agora a função f (z) = |z| = x2 + y 2 . Neste
caso, u(x, y) = x2 + y 2 e v(x, y) = 0. Portanto, embora as derivadas parciais existam,
∂u ∂u ∂v ∂v
= 2x, = 2y, = = 0,
∂x ∂y ∂x ∂y
estas não satisfazem as relações (2.13) e, portanto, a função f (z) não possui derivada.
As condições de Cauchy-Riemann fornecem uma condição necessária para que a função
seja diferenciável em algum ponto z = z0 . Contudo, não há garantia até este momento de que
estas condições sejam suficientes para garantir a existência desta derivada. Um teorema mais
geral, apresentado a seguir, estabelece as condições necessária e suficiente para a existência da
derivada de f (z).
Teorema 2.7 (Condição necessária e suficiente). Dada a função f (z) = u (x, y) + iv (x, y), se
u (x, y) e v (x, y) são contínuas com derivadas parciais de primeira ordem e que satisfazem as
condições de Cauchy-Riemann (2.13) em todos os pontos em uma região R ⊆ C , então f (z) é
analítica em R.
Demonstração. Para provar este teorema, é necessário empregar o seguinte teorema do cálculo
de funções reais de 2 variáveis: se h (x, y), ∂h/∂x e ∂h/∂y são contínuas em uma região R em
torno do ponto (x0 , y0 ), então existe uma função H (∆x, ∆y) tal que H (∆x, ∆y) → 0 à medida que
(∆x, ∆y) → (0, 0) e

∂h ∂h
q
2 2
h (x0 + ∆x, y0 + ∆y) − h (x0 , y0 ) = ∆x + ∆y + H (∆x, ∆y) (∆x) + (∆y) .
∂x (x0 ,y0 ) ∂y (x0 ,y0 )
Retornando então à definição de derivada (2.12)
f (z0 + ∆z) − f (z0 )

lim ,
∆z→0 ∆z
sendo z0 qualquer ponto que pertence a R e ∆z = ∆x + i∆y. Pode-se escrever então
f (z0 + ∆z) − f (z0 ) = [u (x0 + ∆x, y0 + ∆y) − u (x0 , y0 )] + i [v (x0 + ∆x, y0 + ∆y) − v (x0 , y0 )] ,

∂u ∂u
q
2 2
f (z0 + ∆z) − f (z0 ) = ∆x + ∆y + H (∆x, ∆y) (∆x) + (∆y)
∂x (x0 ,y0 ) ∂y (x0 ,y0 )
" #
∂v ∂v
q
2 2
+i ∆x + ∆y + G (∆x, ∆y) (∆x) + (∆y) ,
∂x (x0 ,y0 ) ∂y (x0 ,y0 )
onde H (∆x, ∆y) → 0 e G (∆x, ∆y) → 0 quando (∆x, ∆y) → (0, 0).
Empregando agora as condições de Cauchy-Riemann (2.13), obtém-se
" #
∂u ∂v
f (z0 + ∆z) − f (z0 ) = +i (∆x + i∆y)
∂x (x0 ,y0 ) ∂x (x0 ,y0 )

q
2 2
+ [H (∆x, ∆y) + iG (∆x, ∆y)] (∆x) + (∆y) ,
portanto,
q
2 2
(∆x) + (∆y)

f (z0 + ∆z) − f (z0 ) ∂u ∂v
= +i + [H (∆x, ∆y) + iG (∆x, ∆y)] .
∆z ∂x (x0 ,y0 ) ∂x (x0 ,y0 ) ∆x + i∆y
Assim, no limite (∆x, ∆y) → (0, 0),

q q
2 2 2 2
(∆x) + (∆y) (∆x) + (∆y)

lim ; lim = 1.
∆x→0 ∆x + i∆y ∆x→0 ∆x + i∆y
∆y→0 ∆y→0
Ou seja,
0 ∂u ∂v
f (z0 ) = +i ,
∂x (x0 ,y0 ) ∂x (x0 ,y0 )
o que mostra que o limite e, portanto, f 0 (z) existem em todos os pontos em R. As condições de
Cauchy-Riemann são, portanto necessárias e suficientes para garantir a existência de f 0 (z) em
R.
2.4.5 F UNÇÕES ANALÍTICAS

Uma função f (z) é analítica em um ponto z0 se a sua derivada f 0 (z) existe não somente em
z0 mas em todos os pontos z dentro de uma vizinhança de z0 . As seguintes definições são feitas,
com respeito a funções analíticas:
• Uma função é dita analítica em um domínio R ⊆ C se ela é analítica em todos os pontos

z ∈ R. Uma função analítica também é denominada regular ou holomórfica.
• Se a função f (z) é analítica sobre todo o plano z complexo, ela é denominada inteira.
• Uma função f (z) é denominada singular em z = z0 se ela não é diferenciável neste ponto.
O ponto z0 é denominado ponto singular ou singularidade de f (z).
2.4.6 F UNÇÕES HARMÔNICAS

Se f (z) = u (x, y) + iv (x, y) é analítica em alguma região R do plano complexo, então em todos
os pontos desta região as condições de Cauchy-Riemann (2.13) são satisfeitas:
∂u ∂v ∂u ∂v
= e =−
∂x ∂y ∂y ∂x
e, portanto,
∂2u ∂2v ∂2u ∂2v
2
= e 2
=− ,
∂x ∂x∂y ∂y ∂y∂x
desde que as derivadas segundas existam. Igualando a ambas as expressões acima, obtém-se
que u (x, y) e v (x, y) satisfazem a Equação de Laplace:
∂2u ∂2u
+ 2 =0 (2.15a)
∂x2 ∂y
2
∂ v ∂2v
+ =0 (2.15b)
∂x2 ∂y 2
sobre toda a região R.

Toda a função que satisfaz as equações de Laplace (2.15) é denominada de função harmô-
nica. Como ambas as funções u e v satisfazem a (2.15), estas são denominadas funções harmô-
nicas conjugadas.

40 2.5. Integração no plano complexo
2.4.7 P ONTOS SINGULARES

Um ponto onde f (z) deixa de ser analítica é denominado ponto singular ou singularidade de
f (z). As condições de Cauchy-Riemann não são obedecidas em um ponto singular.
Existem várias tipos de pontos singulares distintos:
1. Pontos singulares isolados. O ponto z = z0 é denominado ponto singular isolado de f (z) se

for possível encontrar-se uma quantidade δ > 0 tal que o círculo |z − z0 | = δ circunda apenas
o ponto singular z0 . Se não for possível encontrar-se um δ > 0, o ponto z0 é denominado
ponto singular não isolado.
2. Polos. O ponto singular z = z0 é denominado polo de ordem n de f (z) se for possível

encontrar-se um número inteiro positivo n tal que
n
lim (z − z0 ) f (z) = A 6= 0. (2.16)
z→z0
Exemplos:
• f (z) = 1/ (z − 2) possui um polo simples ou de ordem 1 em z = 2.

2
• f (z) = 1/ (z − 2) possui um polo duplo ou de ordem 2 em z = 2.
3
• f (z) = 1/ (z − 2) possui um polo de ordem 3 em z = 2.
3. Ponto de ramificação. Uma função possui um ponto de ramificação em z = z0 se, após

circular-se em torno de z0 , retornando ao ponto de partida sobre o plano z, a função não
retorna ao seu valor inicial sobre o plano w. Os pontos√de ramificação são singularidades
das funções plurívocas. Por exemplo, a função f (z) = z possui um ponto de ramificação
em z = 0.
4. Singularidades removíveis. O ponto singular z = z0 é denominado uma singularidade remo-

vível se limz→z0 f (z) existe. Por exemplo, a função f (z) = sen z/z possui um ponto singular
em z = 0, mas limz→0 sen z/z = 1. Neste caso, pode-se redefinir a função f (z) para esta esteja
definida em z0 .
5. Singularidades essenciais. Uma função possui uma singularidade essencial em z0 se esta

n
não possui polos, em qualquer ordem, que sejam eliminados pela multiplicação por (z − z0 ) ,
para qualquer valor finito de n. Por exemplo, a função f (z) = e1/(z−2) possui uma singulari-
dade essencial em z = 2.
6. Singularidades no infinito. Uma função f (z) possui uma singularidade em z → ∞ se esta

for do mesmo tipo que a singularidade de f (1/w), para w → 0. Por exemplo, f (z) = z 2 possui
um polo de ordem 2 no infinito, uma vez que f (1/w) = 1/w2 possui um polo duplo em w = 0.
2.5 I NTEGRAÇÃO NO PLANO COMPLEXO

Integração complexa é uma ferramenta muito importante na física-matemática. Por exemplo,
com frequência surgem integrais de funções reais que não podem ser calculadas pelos métodos
usuais de integração, mas que podem ser resolvidas estendendo-se a definição do integrando
para o conjunto dos números complexos e realizando-se a integração neste plano. Na análise
matemática, o método de integração complexa possibilita demonstrações de algumas proprieda-
des básicas de funções analíticas, as quais seriam muito difíceis de ser realizadas sem o recurso
da integração complexa.
O resultado mais importante na teoria da integração complexa é o teorema integral de Cau-
chy, a partir do qual as fórmulas integrais de Cauchy são derivadas. A outra propriedade de
fundamental importância para a física-matemática é o teorema dos resíduos, que possibilita o
cálculo de integrais que não poderiam ser realizadas de outra maneira. Estes resultados serão
abordados nas seções posteriores. Nesta seção, será introduzido o conceito de integral de ca-
minho sobre o plano complexo e apresentadas as propriedades matemáticas fundamentais das
integrais complexas.

Figura 2.10: Caminho C ao longo do qual a integração complexa é realizada.
2.5.1 I NTEGRAIS DE CAMINHO NO PLANO COMPLEXO

Uma integral de caminho, também denominada integral de linha, possui uma relação com a
derivada no plano complexo exatamente ´ igual à que existe para funções reais. Se a função F (z)
é dada pela integral indefinida F (z) = f (z) dz, então a derivada de F (z) é dada por F 0 (z) = f (z).
Em outras palavras uma integral indefinida no plano complexo é a operação inversa da derivação
no mesmo plano.
Por outro lado, o plano complexo é definido a partir de duas variáveis independentes reais.
Neste caso, poder-se-ia pensar que uma integral (definida) no plano complexo seria equivalente
a uma integral de superfície de uma função real de duas variáveis. Contudo, na análise das
funções complexas, a função f (z) é integrada ao longo de um caminho no plano complexo. Para
tanto, pode-se parametrizar o caminho ao longo do plano z fazendo-se uso de um parâmetro real
t:
z(t) = x(t) + iy(t) para a 6 t 6 b,
o qual define um caminho sobre o plano complexo à medida que t varia de a a b. Diz-se que este
curva é suave se existe um vetor tangente à mesma ao longo de todos os pontos; isto implica
que dx/dt e dy/dt existem são contínuas e não são nulas simultaneamente para a 6 t 6 b.
Sendo C uma curva suave sobre o plano z complexo, como mostra a figura 2.10, assume-se
que a mesma possui um comprimento finito. Dada agora a função f (z), contínua sobre todos
os pontos ao longo de C, subdivide-se C em n partes por meio dos pontos {z0 , z1 , z2 , . . . , zn },
arbitrariamente escolhidos, mas com z0 = a e zn = b. Para cada arco de C que conecta os pontos
zk−1 e zk (k = 1, 2, . . . , n), escolhe-se um ponto wk (zk−1 6 wk 6 zk ) e forma-se a soma
n
X
Sn = f (wk ) ∆zk , onde ∆zk = zk − zk−1 .
k=1
Fazendo-se agora com que o número de subdivisões n aumente indefinidamente, de tal forma
que o maior dos |∆zk | tenda a zero, a soma Sn aproxima-se de um limite. Se este limite existe e
possui o mesmo valor, independente das escolhas dos {zk } e dos {wk } ao longo de C, então este
limite é denominado a integral de caminho (ou de linha) de f (z) ao longo de C e é denotado
por:
Xn ˆ ˆ b
S = lim Sn = n→∞ lim f (wk ) ∆zk ≡ f (z) dz = f (z) dz. (2.17)
n→∞ C a
|∆z|max →0 k=1
Quando o caminho é fechado, isto é, quando b = a (ou zn = z0 ), a integral de linha é denomi-

nada integral de contorno de f (z), a qual é denotada por
˛
S= f (z) dz.
C
Teorema 2.8 (Teorema

´ de existência). Se o caminho C é suave por partes e f (z) é contínua ao
longo de C, então C f (z) dz sempre existe.

42 2.5. Integração no plano complexo
2.5.2 P ROPRIEDADES MATEMÁTICAS DAS INTEGRAIS DE LINHA

A integral de linha de f (z) = u (x, y) + iv (x, y) ao longo de um caminho C pode sempre ser
expressa em termos de integrais reais de caminho como
ˆ ˆ ˆ ˆ
f (z) dz = (u + iv) (dx + idy) = (u dx − v dy) + i (v dx + u dy) ,
C C C C
onde a curva C pode ser aberta ou fechada, mas o sentido de integração deve sempre ser espe-
cificado, por exemplo através do uso de um parâmetro t. Invertendo-se o sentido de variação de
t, inverte-se o sinal da integral.
Integrais complexas são, portanto, redutíveis a integrais reais de caminho e possuem as
seguintes propriedades:
ˆ ˆ ˆ
(1) [f (z) + g(z)] dz = f (z) dz + g(z) dz.
C C C
ˆ ˆ
(2) kf (z) dz = k f (z) dz, sendo k ∈ C uma constante.
C C
ˆ b ˆ a
(3) f (z) dz = − f (z) dz, sendo {a, b} ∈ C.
a b
ˆ b ˆ m ˆ b
(4) f (z) dz = f (z) dz + f (z) dz, sendo m ∈ C.
a a m
ˆ

(5) f (z) dz 6 M L, onde M = max |f (z)| ao longo de C e L é o comprimento de C.

C
ˆ ˆ

(6) f (z) dz 6
|f (z)| |dz|.
C C
A propriedade (5), em particular, é bastante útil e será bastante utilizada, porque ao se trabalhar
com integrais de linha complexas, com frequência é necessário estabelecer-se limites nos seus
valores absolutos.
Demonstração. (Propriedade 5). Retornando à definição (2.17),
ˆ Xn
f (z) dz = n→∞
lim f (wk ) ∆zk .
C |∆z|max →0 k=1
Mas, n
X X n n
X
f (wk ) ∆zk 6 |f (wk )| |∆zk | 6 M |∆zk | 6 M L,

k=1 k=1 k=1
P
onde se fez uso do fato de que |f (z)| 6 M para todos os pontos z ao longo de C e que |∆zk |
representa a soma de todas as cordas juntando os pontos zk−1 e zk ao longo de C e que esta soma
não pode ser maior que o comprimento L de C. Tomando-se agora o limite para n → ∞ em ambos
os lados, resulta a propriedade (5). A propriedade (6) também segue desta demonstração.
´ 2
Exemplo 2.8. Calcule a integral C (z∗) dz, sendo C a linha reta ligando os pontos z = 0 e
z = 1 + 2i.
Solução. Uma vez que
2 2
(z∗) = (x − iy) = x2 − y 2 − 2ixy,
resulta ˆ ˆ ˆ
2 2 2
−2xy dx + x2 − y 2 dy .

(z∗) dz = x −y dx + 2xy dy + i
C C C
Para parametrizar a curva C, pode-se escolher x(t) e y(t) dados por
x(t) = t, y(t) = 2t, para (0 6 t 6 1) ,
ou, simplesmente, pode-se escrever y = 2x. Portanto,
ˆ ˆ 1 ˆ 1
2 2 5 10
−10x2 dx = − i.

(z∗) dz = 5x dx + i
C 0 0 3 3

(a) Curva simples. (b) Curva não (c) Curva simples

simples. fechada.
Figura 2.11: Exemplos de curvas simples ou não simples.
Exemplo 2.9. Calcule a integral de caminho

˛
dz
n+1 ,
(z − z0 )
sendo C uma circunferência de raio r centrada em z0 e n é um número inteiro. Uma ilustração

deste contorno pode ser vista na figura 2.8 à esquerda.
Solução. Por conveniência, escolhe-se z−z0 = reiθ , onde θ é o parâmetro cuja variação (0 6 θ < 2π)
determina o contorno C. Então, dz = ireiθ dθ e a integral fica:
˛ ˆ 2π ˆ 2π ˆ 2π
(
dz ireiθ dθ i i 2πi, n = 0
n+1 = = n e−inθ dθ = n (cos nθ − i sen nθ) dθ =
(z − z0 ) 0 rn+1 ei(n+1)θ r 0 r 0 0, |n| > 1.
Este é um resultado importante, que será utilizado diversas vezes nas seções posteriores.
2.5.3 T IPOS DE CURVAS E DOMÍNIOS NO PLANO COMPLEXO

Nesta seção serão brevemente definidos os tipos de curvas e domínios no plano complexo que
serão considerados nas seções posteriores.
2.5.3.1 T IPOS DE CURVAS NO PLANO COMPLEXO
Uma curva C é dita simples (também denominada arco de Jordan) se esta não se intersec-
ciona em nenhum ponto, isto é, z (t1 ) 6= z (t2 ) se t1 6= t2 , para a 6 t 6 b. A exceção z(b) = z(a) é
permitida para um contorno fechado, em cuja situação o contorno é dito contorno simples ou
curva simples fechada ou ainda curva ou contorno de Jordan. A figura 2.11 mostra exemplos
de curvas simples e de curvas não simples.
2.5.3.2 D OMÍNIOS SIMPLESMENTE OU MULTIPLAMENTE CONEXOS
Um domínio ou região simplesmente conexa D é uma região no plano complexo tal que
toda curva simples fechada Γ dentro de D delimita somente pontos que pertencem a D. Uma
outra definição: uma região D é dita simplesmente conexa se qualquer curva simples fechada Γ
contida dentro de D pode ser reduzida a um ponto de tal maneira que nenhum ponto contido
em Γ abandone D.
Uma região que não é simplesmente conexa é dita multiplamente conexa. De acordo com
as definições, deve então existir pelo menos uma curva simples fechada Γ contida em D que
cerca pontos que não pertencem a D. Ou, alternativamente, uma região multiplamente conexa
é aquela que não pode ser reduzida a um ponto sem que abandone (mesmo que momentanea-
mente) a região D. A figura 2.12 apresenta exemplos de regiões simplesmente e multiplamente
conexas.

44 2.6. O teorema de Cauchy-Goursat
Figura 2.12: Exemplos de regiões: (a) simplesmente conexa e (b) e (c) multiplamente conexas.
2.5.3.3 C ONVENÇÃO PARA O PERCURSO DE UM CONTORNO FECHADO
Considera-se uma região D do plano complexo, composta por pontos no interior e ao longo
de um contorno simples fechado Γ. O contorno é percorrido no sentido positivo se todos os
pontos de D se situarem à esquerda de um observador que se desloca ao longo de Γ. Este sentido
positivo consiste no percurso anti-horário indicado pelas setas nos contornos Γ, representados
nas figuras 2.12, e no percurso horário nos contornos interiores a Γ.
2.6 O TEOREMA DE C AUCHY -G OURSAT

O teorema de Cauchy-Goursat é um dos mais importantes resultados da análise matemática
das funções complexas. Este teorema possui diversas consequências teóricas e práticas a res-
peito das propriedades analíticas das funções de variável complexa e serve de base para outros
teoremas importantes como o teorema dos resíduos.
Para se realizar uma das demonstrações existentes do teorema de Cauchy, faz-se uso do
teorema de Green, válido para integrais de linha e de superfície de funções de duas variáveis
reais.
2.6.1 O TEOREMA DE G REEN NO PLANO

Teorema 2.9. Sejam P (x, y) e Q (x, y) duas funções reais tais que suas derivadas são contínuas
sobre toda uma região R, delimitada por um contorno fechado simples C. Neste caso, as funções
P e Q satisfazem a seguinte identidade,
˛ ¨
∂Q ∂P
[P (x, y) dx + Q (x, y) dy] = − dxdy. (2.18)
R R ∂x ∂y
Observação. A demonstração do teorema (2.18) baseia-se no teorema de Stokes e não será apre-
sentada aqui.
2.6.2 O TEOREMA DE C AUCHY -G OURSAT

Serão apresentadas aqui duas versões do mencionado teorema, a primeira para um domínio
simplesmente conexo e a segunda para uma região multiplamente conexa. A demonstração
apresentada para a primeira versão foi obtida originalmente por Augustin-Louis Cauchy (1789
– 1857) no início do século XIX e supõe que as derivadas da função f (z) são contínuas sobre
o domínio D. Posteriormente, Édouard Jean-Baptiste Goursat (1858 – 1936) mostrou que a
condição de continuidade de f 0 (z) não é necessária para a validade do teorema. Por esta razão,
o teorema leva o nome de ambos os matemáticos franceses.
Teorema 2.10 (Teorema de Cauchy-Goursat). Se uma função f (z) = u (x, y) + iv (x, y) é analítica
em todos os pontos de um domínio simplesmente conexo D, então para todo contorno simples
fechado C no interior de D, ˛
f (z) dz = 0. (2.19)
C

Demonstração. Escreve-se o lado direito de (2.19) da seguinte maneira:

˛ ˛ ˛ ˛
f (z) dz = (u + iv) (dx + idy) = (u dx − v dy) + i (v dx + u dy) .
C C C C
Aplicando-se o teorema de Green (2.18) a cada integral de contorno acima, obtém-se

˛ ¨ ¨
∂v ∂u ∂u ∂v
f (z) dz = − + dxdy + i − dxdy.
C D ∂x ∂y D ∂x ∂y
Como a função f (z) é suposta analítica, então as funções u (x, y) e v (x, y) satisfazem as condições
de Cauchy-Riemann (2.13). Portanto,
˛ ¨ ¨
∂v ∂v ∂u ∂u
f (z) dz = − − dxdy + i − dxdy = 0,
C D ∂x ∂x D ∂x ∂x
o que demonstra o teorema.
Quando o domínio D é multiplamente conexo, a seguinte versão do teorema de Cauchy-
Goursat se aplica.
Teorema 2.11 (Teorema de Cauchy-Goursat em regiões multiplamente conexas). Seja C
um contorno simples fechado e seja {Cj } (j = 1, . . . , n) um conjunto finito de contornos fechados
simples interiores a C, tais que não existam duas regiões Rj e Rj 0 , interiores a Cj e Cj 0 , que
compartilhem pontos no plano complexo em comum entre si. Seja R a região do plano complexo
que consiste em todos os pontos no interior e ao longo de C, exceto por aqueles pontos no interior
de cada contorno Cj . Finalmente, seja B o contorno completo que delimita R e que consiste no
contorno C mais os contornos Cj , sendo todos estes contornos percorridos no sentido que mantém
os pontos de R à direita de B. Se a função f (z) é analítica em R, então
˛
f (z) dz = 0. (2.20)
B
Demonstração. A situação descrita no teorema está ilustrada pela figura 2.13a. O contorno
mostrado na figura é composto por C, juntamente com os contornos C1 , . . . , Cn e os segmentos
de reta L11 , L21 , . . . , Ln1 e Ln2 . Desta maneira a região R passa de multiplamente conexa a sim-
plesmente conexa. Aproximando-se agora os pares de segmentos de reta L11 e L12 , L21 e L22 , . . . ,
Ln1 e Ln2 , de tal forma que a distância entre os mesmos se torne infinitesimalmente pequena, as
integrais de caminho de f (z) em cada par de segmentos se anulam mutuamente, isto é,
ˆ ˆ ˆ ˆ ˆ ˆ
f (z) dz = − f (z) dz, f (z) dz = − f (z) dz, ··· f (z) dz = − f (z) dz,
L11 L12 L21 L22 Ln
1 Ln
2
de tal forma que o contorno restante é exatamente o contorno B descrito no teorema. Como a
região R é agora simplesmente conexa e a função f (z) é analítica em R, de (2.19) resulta
˛
f (z) dz = 0.
B
O teorema de Cauchy-Goursat (2.19) possui consequências importantes, algumas das quais

serão apresentadas nesta e nas seções posteriores.
Teorema 2.12 (Deformação do contorno de integração). Seja f (z) uma função analítica so-
bre uma região R delimitada pelo contorno simples fechado C e pelo conjunto de contornos {Cj }
(j = 1, . . . , n), interiores a C e que envolvem n buracos que podem conter singularidades isoladas
ou não isoladas. Então,
ffi n ffi
X
f (z) dz = f (z) dz, (2.21)
C j=1 Cj
sendo que tanto a integral ao longo de C quanto as integrais nos contornos Cj são realizadas no
sentido anti-horário.2
2O que fica evidenciado pelo símbolo .

46 2.6. O teorema de Cauchy-Goursat
Figura 2.13: Contorno B que transforma uma região multiplamente conexa em uma região simplesmente conexa.
Demonstração. Esta situação também está ilustrada na figura 2.13. Ao se considerar o contorno
B na figura 2.13a, o teorema de Cauchy (2.20) afirma que
˛ ˆ ˆ ˆ ˆ
 !
n
X
f (z) dz =  + + +  f (z) dz = 0,
B C j=1 −Cj Lj1 −Lj2
onde ˆ ˆ ˆ ˆ ! ˆ ˆ !
f (z) dz = − f (z) dz =⇒ + f (z) dz = − f (z) dz.
−Lj2 Lj2 Lj1 −Lj2 Lj1 Lj2
Ao se reduzir a distância de cada par de segmentos de reta Lj1 e Lj2 assintoticamente a zero, as
integrais de linha percorrem o mesmo caminho sobre o plano complexo, resultando então que
ˆ ˆ !
Lj →Lj
− f (z) dz −−2−−−→
1
0.
Lj1 Lj2
Neste caso, os caminhos C, C1 , . . . , Cn se tornam contornos fechados simples, resultando que

˛ n 
X
f (z) dz + f (z) dz = 0,
C j=1 −Cj
onde se deve notar o símbolo . Como os contornos Cj são percorridos no sentido horário, de
acordo com a figura (2.13)a, resulta que
 ffi
=− ,
−Cj Cj
onde na segunda integral o contorno é agora percorrido no sentido anti-horário, e a situação se

torna semelhante à ilustrada pela figura (2.13)b. Portanto,
ffi n ffi
X
f (z) dz − f (z) dz = 0,
C j=1 Cj
de onde resulta o teorema.

Nas situações em que a identidade (2.21) é válida, é comum afirmar-se que o contorno C foi
deformado nos contornos C1 , C2 , . . . , Cn .
Teorema 2.13 (Independência do caminho). Se a função f (z) é analítica em uma região sim-
plesmente conexa R, então dados dois pontos z0 e z quaisquer, contidos em R, a integral
ˆ z
f (z) dz
z0
independe do caminho ligando os pontos z0 e z, desde que este caminho esteja totalmente contido
em R.

Figura 2.14: Independência nos caminhos C1 e C2 .
Demonstração. A situação está ilustrada na figura 2.14. Sendo C1 e C2 dois caminhos quaisquer,
contidos em R e que ligam os pontos z0 e z, então, de acordo com o teorema de Cauchy (2.19),
ˆ ˆ ˆ ˆ
f (z) dz + f (z) dz = 0, mas f (z) dz = − f (z) dz.
−C1 c2 −C1 C1
Portanto ˆ ˆ
f (z) dz = f (z) dz,
C1 c2
o que demonstra o teorema.
Teorema 2.14 (Teorema de analiticidade). Seja f (z) uma função contínua em uma região
simplesmente conexa R e sejam z0 e z dois pontos
´z contidos em R, os quais são conectados por um
caminho C, também contido em R. Então, se z0 f (s) ds independe de C,
ˆ z
F (z) = f (s) ds é analítica em R e F 0 (z) = f (z).
z0
Demonstração. Sendo z + ∆z qualquer ponto contido em R e distinto de z, mas que esteja em

uma vizinhança de z. Então
ˆ z+∆z ˆ z
F (z + ∆z) − F (z) = f (s) ds − f (s) ds.
z0 z0
Pela propriedade (4) da seção 2.5.2, resulta que

ˆ z+∆z
F (z + ∆z) − F (z) = f (s) ds.
z
Dividindo ambos os lados por ∆z, pode-se escrever

ˆ z+∆z ˆ z+∆z
F (z + ∆z) − F (z) 1 1
− f (z) = f (s) ds − f (z) = [f (s) − f (z)] ds.
∆z ∆z z ∆z z
Como a função f (z) é contínua em R, então para um número positivo , deve existir um outro
número positivo δ tal que
|f (s) − f (z)| <
sempre que |s − z| < δ. Desta forma, se z + ∆z é próximo o suficiente de z de tal forma que
|∆z| < δ, então ˆ
z+∆z
[f (s) − f (z)] ds < |∆z|

z
e, portanto,
F (z + ∆z) − F (z)
< 1 |∆z| = .

− f (z) |∆z|
∆z

48 2.7. Fórmulas integrais de Cauchy
No limite em que ∆z → 0, → 0, resultando que
F (z + ∆z) − F (z)
lim ≡ F 0 (z) = f (z).
∆z→0 ∆z
Portanto, a derivada de F (z) existe em todos os pontos z pertencentes a R. Como consequência,
F (z) é analítica em R e sua derivada é igual a f (z), demonstrando o teorema.
Teorema 2.15 (Teorema
¸ de Morera). Se uma função f (z) é contínua em uma região simples-
mente conexa R e C f (z) dz = 0 para todo contorno simples fechado C no interior de R, então f (z)
é analítica em R.
Observação. O teorema de Morera é a recíproca do teorema de Cauchy.
Exemplo 2.10 (Cálculo de integrais no plano complexo).
¸
Calcule C dz/ (z − a), onde C é um con-
torno fechado simples qualquer, quando z = a
está (a) fora de C e (b) dentro de C.
Solução.
(a) Se z = a está fora de C, então f (z) =
1/ (z − a) é analítica em todos os pontos inter-
nos e ao longo de C. Portanto, pelo teorema
de Cauchy (2.20),
˛
dz
= 0.
C z −a
(b) Se z = a está dentro de C e Γ é uma

circunferência de raio ε centrada em z = a, de
Figura 2.15: Exemplo de cálculo de integrais sobre o tal forma que Γ está totalmente contido em C
plano complexo. (figura 2.15), então pelo teorema (2.21),
˛ ˛
dz dz
= .
C z − a Γ z −a
Agora, o contorno Γ é dado por todos os pontos z tais |z − a| = ε. Pode-se descrever o contorno
na figura 2.15 através do parâmetro θ tal que
z − a = εeiθ , quando 0 6 θ 6 2π.
Então dz = iεeiθ dθ e ˛ ˆ ˆ
2π 2π
dz iεeiθ dθ
= =i dθ = 2πi.
Γ z−a 0 εeiθ 0
2.7 F ÓRMULAS INTEGRAIS DE C AUCHY

Uma das consequências mais importantes do teorema integral de Cauchy são as fórmulas
integrais que também levam o seu nome. Pode-se introduzir estas fórmulas através do seguinte
teorema.
Teorema 2.16 (Fórmula integral de Cauchy). Seja f (z) uma função analítica em uma região
simplesmente conexa R e z0 é um ponto qualquer no interior de R, a qual é delimitada pelo contorno
simples C, então ˛
1 f (z)
f (z0 ) = dz, (2.22)
2πi C z − z0
sendo a integração em (2.22) realizada ao longo de C no sentido positivo (anti-horário).
Demonstração. Para provar o teorema (2.22), toma-se uma circunferência Γ, centrada em z0 e
com raio r, como ilustrado na figura 2.16. Então, de acordo com o teorema (2.21),
˛ ˛
f (z) f (z)
dz = dz.
C z − z0 Γ z − z0

Figura 2.16: Fórmula integral de Cauchy.
Agora, a circunferência Γ é descrita por |z − z0 | = r, ou seja, usando o parâmetro θ, z − z0 = reiθ ,

sendo (0 6 θ 6 2π) e dz = ireiθ dθ. Então
˛ ˆ 2π ˆ 2π
f (z) f z0 + reiθ iθ
f z0 + reiθ dθ.

dz = iθ
ire dθ = i
Γ z − z0 0 re 0
Tomando-se agora o limite r → 0 em ambos os lados e fazendo uso da continuidade de f (z),

resulta
˛ ˆ 2π ˆ 2π ˆ 2π
f (z) iθ
iθ

dz = lim i f z0 + re dθ = i lim f z0 + re dθ = i f (z0 ) dθ = 2πif (z0 ) .
C z − z0 r→0 0 0 r→0 0
Ou seja, ˛
1 f (z)
f (z0 ) = dz.
2πi C z − z0
Uma forma conveniente para a fórmula integral (2.22) é escrevê-la como

˛
1 f (z 0 ) 0
f (z) = dz , (2.23)
2πi C z 0 − z
para enfatizar o fato que z pode ser um ponto qualquer em C.

¸
Exemplo 2.11. Calcule a integral C ez dz/ z 2 + 1 , sendo C a circunferência de raio unitário e
com centro em: (a) z = i e (b) z = −i.
Solução.
(a) Escrevendo-se a integral na forma
˛
ez

dz
,
C z+i z−i
z
percebe-se que f (z) = e / (z + i) é analítica dentro e sobre a circunferência de raio unitário
centrada em z0 = i. Portanto, pela fórmula integral de Cauchy (2.22), temos
˛ z
e dz ei
= 2πif (i) = 2πi = πei = π (cos 1 + i sen 1) .
C z+i z−i 2i
(b) Para a circunferência centrada em z0 = −i, define-se f (z) = ez / (z − i), a qual é novamente
analítica dentro e sobre C. Então, usando novamente (2.22) resulta
˛ z
e dz e−i
= 2πif (−i) = 2πi = −πe−i = −π (cos 1 − i sen 1) .
C z − i z + i −2i
A fórmula integral de Cauchy pode ser generalizada para derivadas de ordem mais alta de
f (z). Isto é descrito pelo teorema a seguir.

50 2.8. Representação em séries de funções analíticas
Teorema 2.17 (Fórmula integral de Cauchy para derivadas de ordens mais altas). Seja
f (z) uma função analítica em uma região simplesmente conexa R e z0 é um ponto qualquer no
interior de R, a qual é delimitada pelo contorno simples C, então
˛
(n) n! f (z)dz
f (z0 ) = (2.24)
2πi C (z − z0 )n+1
e as derivadas de f (z) em z0 existem em todas as ordens.
Demonstração. Uma prova simples, porém incompleta, do teorema (2.24) pode ser feita por inter-
médio da indução matemática. Derivando-se ambos os lados de (2.23) em relação a z, obtém-se
˛
1! f (s)
f 0 (z) = ds.
2πi C (s − z)2
Derivando-se novamente, ˛
00 2! f (s)
f (z) = 3 ds.
2πi C (s − z)
E assim sucessivamente, resultando, para a derivada de ordem n, na fórmula (2.24). A demons-
tração completa desta fórmula integral pode ser obtida na bibliografia citada.
A fórmula (2.24), obtida para uma região simplesmente conexa, pode ser estendida para o
caso onde o contorno simples C é substituído pelo contorno B da figura 2.13, composto por um
contorno exterior C e por um conjunto {Ci } de contornos interiores. Para tanto, basta assumir
que em (2.24) o ponto z0 pertence ao domínio definido por B e que f (z) é analítica neste domínio.
Desta forma, a fórmula integral de Cauchy pode ser estendida a regiões multiplamente conexas.
Exemplo 2.12. Calcule ˛

e2z
4 dz,
C (z + 1)
sendo C um contorno simples que não passa por z = −1. Considere 2 casos: (a) C não envolve
z = −1 e (b) C envolve z = −1.
Solução.
4
(a) Neste caso, a função f (z) = e2z / (z + 1) é analítica dentro e sobre C. Portanto, pelo teorema
de Cauchy,
˛
e2z
4 dz = 0.
C (z + 1)
(b) Chamando agora f (z) = e2z , esta função é analítica dentro e sobre C. Portanto, de acordo
com o teorema (2.24),
˛ ˛
e2z dz 2πi (3) (3) −2 e2z dz 8π −2
4 = f (−1) . Como f (−1) = 8e , resulta 4 = e i.
C (z + 1) 3! C (z + 1) 3
2.8 R EPRESENTAÇÃO EM SÉRIES DE FUNÇÕES ANALÍ -

TICAS
Será apresentado agora um ponto muito importante: a representação em séries de funções
analíticas. Inicialmente será discutida a noção de convergência de uma série complexa. Grande
parte das definições e teoremas válidos para séries de termos reais podem ser aplicadas às séries
complexas com uma pequena ou nenhuma modificação.
2.8.1 S ÉRIES COMPLEXAS

Nesta seção, serão consideradas séries complexas em geral, cujos termos são funções com-
plexas,
f1 (z) + f2 (z) + f3 (z) + · · · + fn (z) + · · · . (2.25)

A soma dos n primeiros termos desta série,

n
X
Sn (z) = f1 (z) + f2 (z) + f3 (z) + · · · + fn (z) = fi (z) ,
i=1
é denominada a n-ésima soma parcial da série (2.25). A soma dos termos restantes, partindo
do (n + 1)-ésimo termo, é denominada de resto da série.
2.8.1.1 C ONVERGÊNCIA DA SÉRIE
Associa-se agora à série (2.25) a sequência de suas somas parciais S1 , S2 , . . . , Sn . Se esta

sequência de somas parciais é convergente, então a série converge; se a sequência é divergente,
então a série também diverge. De uma maneira mais formal, a série (2.25) é dita convergente
à soma S(z) em uma região R do plano complexo se para qualquer > 0 existe um inteiro N ,
dependente de e do valor de z sob consideração, tal que
|Sn (z) − S (z)| < para todo n > N.
Neste caso, escreve-se
∞
X
S (z) = lim Sn (z) ≡ fn (z) . (2.26)
n→∞
n=1
A diferença Sn (z) − S (z) é o resto Rn (z). Assim, a definição de convergência da série (2.25)
demanda que
lim |Rn (z)| = 0.
n→∞
Teorema 2.18 (Teoremas de convergência). Os seguintes teoremas de convergência são váli-

dos:
1. Uma condição necessária, mas não suficiente, para que Sn (z) convirja no limite n → ∞ é
lim fn (z) = 0.
n→∞
2. A multiplicação de cada termo de uma série por uma constante não nula não afeta a
convergência, assim como a remoção ou adição de um número finito de termos.
3. Uma condição necessária e suficiente para que a série de termos complexos
∞
X
fn (z) = f1 (z) + f2 (z) + f3 (z) + · · · + fn (z) + · · ·
n=1
seja convergente é que as séries das respectivas partes reais e imaginárias dos termos fn (z)
sejam convergentes. Além disso, se
∞
X ∞
X
Re fn e Im fn
n=1 n=1
convergem às respectivas funções R (z) e I (z), então a série complexa converge para S (z) =
R (z) + iI (z).
2.8.1.2 C ONVERGÊNCIA ABSOLUTA
Se os valores absolutos dos termos em (2.25),

∞
X
|fn (z)| = |f1 (z)| + |f2 (z)| + |f3 (z)| + · · · + |fn (z)| + · · · ,
n=1
formam uma série convergente, então a série (2.25) é dita absolutamente convergente.
Se a série (2.25) converge, mas não é absolutamente convergente, então esta é dita condicio-
nalmente convergente. A partir da definição de convergência, pode-se demonstrar os teoremas
a seguir.
Teorema 2.19 (Teoremas de convergência absoluta). Os seguintes teoremas são válidos.
P∞ P∞
1. Se n=1 |fn (z)| converge, então n=1 fn (z) também converge (condição suficiente).
2. A soma, diferença ou o produto de séries absolutamente convergentes é convergente.

2.8.1.3 C ONVERGÊNCIA UNIFORME
Seja
Rn (z) = fn+1 (z) + fn+2 (z) + · · · = S (z) − Sn (z)
o resto da série S (z), dada por (2.26), sobre uma região R. A série S (z) é dita uniformemente
convergente em R se, dado um número real positivo , é possível encontrar um número inteiro
positivo N , tal que para todo z ∈ R,
|Rn (z)| = |S (z) − Sn (z)| < , para todo n > N.
2.8.2 T ESTES DE CONVERGÊNCIA

Os testes de convergência determinam uma condição necessária e suficiente para a conver-
gência de uma determinada série. Há vários testes, dentre os quais os principais serão citados
abaixo sem as demonstrações, as quais podem ser obtidas na bibliografia recomendada.
2.8.2.1 T ESTES DE CONVERGÊNCIA ABSOLUTA
Para testar a convergência absoluta de uma série, os seguintes testes existem:

P∞
Teste da comparação.
P∞ Se n=1 gn (z) converge absolutamente em R e |fn (z)| 6 |gn (z)|, ∀z ∈ R,
então n=1 fn (z) também converge absolutamente.
Teste da razão. Dentre todos os testes de convergência, o mais útil éPo teste da razão, o qual
∞
se aplica a séries complexas, além de séries reais. Dada a série n=1 fn (z), esta converge
absolutamente na região R se

fn+1 (z)
0 < |r (z)| = lim
<1 (2.27)
n→∞ fn (z)
e diverge se |r (z)| > 1. Quando |r (z)| = 1, este teste não fornece informação conclusiva a
respeito da convergência da série.
P∞
Teste da raiz. Dada a série n=1 fn (z), esta converge absolutamente na região R se
p
0 < |r (z)| = lim n |fn (z)| < 1

n→∞
e diverge se |r (z)| > 1. Quando |r (z)| = 1, este teste não fornece informação conclusiva a
respeito da convergência da série.
Exemplo 2.13 (Teste da razão). Mostre que a série complexa

∞
X
2−n + ie−n

S (z) =
n=0
converge.
Solução. Pode-se aplicar o teste da razão separadamente para as partes real e imaginária:
−n−1 −n−1
2 1 e 1
lim n = < 1 e lim n = < 1.

n→∞ 2 2 n→∞ e e
Portanto, a série converge absolutamente.
2.8.2.2 T ESTE DE CONVERGÊNCIA UNIFORME
O seguinte teste verifica a convergência uniforme de uma série.

P∞
Teste de Weierstrass.
PSe |fn (z)| 6 Mn , sendo Mn independente de z em uma região R e n=1 Mn
∞
converge, então n=1 fn (z) converge uniformemente em R.

2.8.3 S ÉRIES DE POTÊNCIAS E SÉRIES DE TAYLOR

Séries de potências constituem-se em uma das mais importantes ferramentas da análise
matemática em geral e da teoria de funções complexas em particular. Isto porque séries de
potências com raios de convergência não nulos podem sempre representar funções analíticas.
Como exemplo, a série
∞
X
S1 (z) = an z n (2.28)
n=0
claramente define uma função analítica, desde que a série convirja.

Nesta seção, o interesse estará restrito às séries que apresentam convergência absoluta.
Neste caso, o teste da razão (2.27) demanda que
an+1 z n+1

an+1 1 an+1
lim = lim |z| < 1 =⇒ > lim .
n→∞ an z n n→∞ an |z| n→∞ an
O resultado acima mostra que a série irá convergir absolutamente para todos os pontos z cujos
módulos satisfazem a condição |z| < R, sendo R o raio de convergência da série, definido por

1 an+1
= lim . (2.29)
R n→∞ an
A série (2.28) está centrada na origem do plano complexo; assim, o raio de convergência R
em (2.29) define uma circunferência centrada na origem. De forma similar, a série
∞
X n
S2 (z) = an (z − z0 ) (2.30)
n=0
converge para todos os pontos z dentro da circunferência de raio R centrada em z0 .

A série de potências mais importante na análise matemática é a série de Taylor. Na análise
complexa é possível realizar-se uma expansão de Taylor para toda e qualquer função analítica.
Esta propriedade é devida ao homônimo teorema de Taylor,3 exposto a seguir.
Teorema 2.20 (Teorema de Taylor). Seja f (z) uma função analítica sobre a região R, delimitada
pela circunferência C centrada em a e de raio R0 . Se z é um ponto interior a C, então f (z) pode ser
desenvolvida em uma série de potênciascentrada em z = a,
∞
f 00 (a) 2 f (n) (a) n
X f (n) (a) n
f (z) = f (a) + f 0 (a) (z − a) + (z − a) + · · · + (z − a) + · · · = (z − a) , (2.31)
2! n! n=0
n!
a qual converge para f (z) quando |z − z0 | < R0 . Esta série é denominada Série de Taylor.
Demonstração. Seja z qualquer ponto interior à circunferência C0 . Portanto, se |z − a| = r, então
r < R0 . Seja agora uma outra circunferência C1 , centrada em a e de raio r1 , tal que r < r1 < R0 .
Uma vez que z está dentro de C1 e f (z) é analítica no interior e sobre C1 , a fórmula integral de
Cauchy (2.23) é válida, a qual é escrita da seguinte maneira:
˛ ˛
1 f (w) dw 1 f (w) 1
f (z) = = dw.
2πi C1 w − z 2πi C1 (w − a) 1 − (z − a) / (w − a)
Nota-se que, na integral acima, como w está sempre ao longo do contorno C1 e z é um ponto
interior a C1 , então
z−a
w − a < 1, ∀w.

Agora, a partir da fórmula de progressão geométrica

1 − q n+1 1 q n+1
1 + q + q2 + · · · + qn = = − ,
1−q 1−q 1−q
válida para q 6= 1, obtém-se
1 q n+1
= 1 + q + q2 + · · · + qn + .
1−q 1−q
3 Devido ao matemático inglês Brook Taylor (1685 – 1731).

Identificando-se então q = (z − a) / (w − a), e inserindo a progressão geométrica resultante na

fórmula integral acima, resulta
˛ ˛ 2 ˛
1 f (w) dw (z − a) f (w) dw (z − a) f (w) dw
f (z) = + 2 + 3
2πi C1 (w − a) 2πi C1 (w − a) 2πi C1 (w − a)
n ˛ n+1 ˛
(z − a) f (w) dw (z − a) f (w) dw
+ ··· + n+1 + n+1 .
2πi C1 (w − a) 2πi C1 (w − a) (w − z)
Contudo, nesta situação as fórmulas integrais de Cauchy (2.24) garantem que
˛
1 f (w)dw f (n) (a)
n+1 = ;
2πi C1 (w − a) n!
portanto, pode-se escrever a expressão para f (z) como
f 00 (a) 2 f (n) (a) n
f (z) = f (a) + f 0 (a) (z − a) + (z − a) + · · · + (z − a) + Rn (z) ,
2! n!
sendo ˛
n+1
(z − a) f (w) dw
Rn (z) = n+1
2πi C1 (w − a) (w − z)
o resto do desenvolvimento de f (z) na forma de um polinômio de grau n. Porém, uma vez que
|z − a| = r e |w − a| = r1 em C1 , nota-se que
|w − z| = |(w − a) − (z − a)| > |w − a| − |z − a| = r1 − r > 0.
Em consequência, se M > 0 é o módulo do maior valor de f (z) ao longo de C1 , pode-se estabelecer
um limite superior para |Rn (z)|, dado por
(z − a)n+1 ˛
n
f (w) dw rn+1 M Mr r
|Rn (z)| = 6 n = .

2πi n+1 r1 (r1 − r) r1 − r r1
C1 (w − a) (w − z)
Portanto, como r/r1 < 1, se n → ∞, o resto da série resultante tenderá a zero,

lim Rn (z) = 0,
n→∞
e a série converge uniformemente para f (z), o que demonstra o teorema de Taylor.

No caso particular onde a = 0, a série de Taylor (2.31) para f (z) é denominada série de
Maclaurin.4
Com as fórmulas integrais de Cauchy (2.24) e a série de Taylor (2.31), ficam estabelecidas
duas propriedades fundamentais das funções analíticas:
1. Elas possuem derivadas de todas as ordens.
2. Elas sempre podem ser representadas por uma série de Taylor.
O mesmo não pode ser dito sobre as funções reais; existem funções reais que possuem derivadas
de todas as ordens, mas que não podem ser representadas por uma série de Taylor.
As principais propriedades de séries de potências podem ser resumidas nos seguintes teore-
mas.
Teorema 2.21. Os seguintes teoremas sobre séries de potências são válidos:
1. Uma série de potências converge uniformemente e absolutamente em qualquer região inte-
rior ao seu raio de convergência.
2. Uma série de potências pode ser diferenciada termo a termo em qualquer ponto interno ao
seu raio de convergência.
3. Uma série de potências pode ser integrada termo a termo ao longo de qualquer curva C,
desde que C esteja contida dentro do seu círculo de convergência.
4. Uma série de potências representa uma função analítica em cada ponto de seu círculo de
convergência.
4 Colin Maclaurin (1698 – 1746), matemático escocês.

2.8.4 S ÉRIES DE TAYLOR DE FUNÇÕES ELEMENTARES

Séries de Taylor de funções analíticas são similares às series de funções reais. Em geral,
basta trocar a variável independente real pela variável complexa z para que as séries reais sejam
continuadas5 para o plano complexo. A lista a seguir mostra as séries de Taylor de algumas
funções elementares; no caso de funções plurívocas, a série apresentada representa o ramo
principal.
∞
1 X n
= (−1) z n = 1 − z + z2 − · · · , |z| < 1 (2.32a)
1 + z n=0
∞
X zn z2
ez = =1+z+ + ··· , |z| < ∞ (2.32b)
n=0
n! 2!
∞ n
X (−1) z 2n+1 z3 z5
sen z = =z− + − ··· , |z| < ∞ (2.32c)
n=0
(2n + 1)! 3! 5!
∞ n
X (−1) z 2n z2 z4
cos z = =1− + − ··· , |z| < ∞ (2.32d)
n=0
(2n)! 2! 4!
∞
X z 2n+1 z3 z5
senh z = =z+ + + ··· , |z| < ∞ (2.32e)
n=0
(2n + 1)! 3! 5!
∞
X z 2n z2 z4
cosh z = =1+ + + ··· , |z| < ∞ (2.32f)
n=0
(2n)! 2! 4!
∞ n+1 n
X (−1) z z2 z3
ln (1 + z) = =z− + − ··· , |z| < 1. (2.32g)
n=0
n 2 3
2.8.5 S ÉRIES DE L AURENT

Em muitas aplicações, é comum deparar-se com funções que não são analíticas sobre todo
o plano complexo.6 Tipicamente, estas funções não são analíticas em um ou vários pontos ou
até em uma região do plano. Por consequência, séries de Taylor não podem ser empregadas
nas vizinhanças destes pontos. Contudo, em muitos casos, uma representação em série con-
tendo potências tanto positivas quanto negativas pode ainda ser obtida, a qual é válida nesta
vizinhança. Esta série é denominada série de Laurent e é válida para aquelas funções que são
analiticas dentro e sobre um anel caracterizado pelos raios R1 e R2 (R1 < R2 ); isto é, a função é
analítica nos pontos
R1 6 |z − z0 | 6 R2 ,
sendo z = a um dos pontos singulares da função. Esta situação está representada na figura
2.17a. A série de Laurent foi obtida pela primeira vez pelo matemático francês Pierre Alphonse
Laurent (1813 – 1854).
Teorema 2.22 (Série de Laurent). Seja f (z) uma função analítica ao longo dos contornos cir-
culares concêntricos C1 e C2 , de raios R1 e R2 (R1 < R2 ), respectivamente, ambos centrados em
z = z0 , bem como na região anelar delimitada por C1 e C2 . Então em cada ponto z nesta região, a
função f (z) pode ser representada pela série
∞ ∞
X n
X bn
f (z) = an (z − z0 ) + n, (2.33a)
n=0 n=1
(z − z0 )
onde
˛
1 f (z) dz
an = n+1 (2.33b)
2πi C2 (z − z0 )
˛
1 f (z)
bn = −n+1 dz, (2.33c)
2πi C1 (z − z0 )
5 Ver seção 2.10.
6 Isto é, não são inteiras.

Figura 2.17: (a) Anel R1 6 |z − z0 | 6 R2 que representa a região de analiticidade da função. (b) Contornos de
integração interior (C1 ) e exterior (C2 ), utilizados para a derivação da série de Laurent.
sendo cada contorno de integração realizado no sentido anti-horário.

Demonstração. Realiza-se a integração ao longo do contorno mostrado na figura 2.17b. Como
f (z) é analítica ao longo e no interior do contorno e z é um ponto que pertence a esta região, a
fórmula integral de Cauchy (2.22) pode ser utilizada, resultando em
˛ ˛
1 f (w) dw 1 f (w) dw
f (z) = − .
2πi C2 w − z 2πi C1 w − z
Na primeira integral, escreve-se
∞ j
1 1 1 1 X z − z0
= = ,
w−z w − z0 1 − (z−z0 ) w − z0 j=0 w − z0
(w−z0 )
sendo que a última identidade é válida porque |z − z0 | < |w − z0 | = R2 , para todo w ao longo de
C2 . Já na segunda integral, escreve-se
∞ j
1 1 1 1 1 X w − z0
− = = = ,
w−z z − z0 − (w − z0 ) z − z0 1 − (w−z0 ) z − z0 j=0 z − z0
(z−z0 )
sendo que agora a última identidade é válida porque |w − z0 | = R1 < |z − z0 |. Então, pode-se
escrever f (z) como
∞
" ˛ # ∞
" ˛ #
X 1 f (w) dw j
X 1 f (w) dw 1
f (z) = (z − z0 ) + −j
j=0
2πi C2 (w − z0 )j+1 j=0
2πi C1 (w − z0 ) (z − z0 )
j+1
∞
" ˛ # ∞
" ˛ #
X 1 f (w) dw j
X 1 f (w) dw 1
= (z − z0 ) + −j+1
,
j=0
2πi C2 (w − z0 )j+1 j=1
2πi C1 (w − z0 ) (z − z0 )
j
de onde resulta (2.33).

Em (2.33a,b), a série com os coeficientes {an } é denominada a parte analítica, ao passo
que em (2.33a,c) a série com os coeficientes {bn } é denominada a parte principal da série de
Laurent. Se a parte principal for nula, a série de Laurent se reduz à série de Taylor (2.31).
n+1 −n+1
Uma vez que as funções f (z)/ (z − z0 ) e f (z)/ (z − z0 ) são analíticas sobre toda a região
R na figura 2.17b, qualquer contorno simples fechado C contido dentro deste anel pode ser
usado como caminho de integração, desde que percorrido no sentido positivo, no lugar dos
contornos circulares C1 e C2 . Assim, a série de Laurent (2.33) pode ser generalizada como
∞
X n
f (z) = cn (z − z0 ) , (R1 < |z − z0 | < R2 ) , (2.34a)
n→−∞

sendo ˛
1 f (z) dz
cn = n+1 , (n = 0, ±1, ±2, . . . ) . (2.34b)
2πi C (z − z0 )
2.8.6 T EOREMAS DE EXISTÊNCIA E UNICIDADE

A seguir serão apresentados, sem demonstração, dois teoremas de existência e unicidade
das séries de Laurent. Demonstrações destes teoremas podem ser encontradas na bibliografia
citada.
Teorema 2.23 (Teorema de existência). A série de Laurent (2.34a,b) de uma função f (z), ana-
lítica na região anelar R1 6 |z − z0 | 6 R2 , converge uniformemente para f (z) para ρ1 6 |z − z0 | 6 ρ2 ,
sendo R1 < ρ1 e R2 > ρ2 .
Teorema 2.24 (Teorema de unicidade). Dada uma função analítica f (z), se esta pode ser re-
presentada pela série uniformemente convergente
∞
X n
f (z) = bn (z − z0 )
n→−∞
na região anelar R1 6 |z − z0 | 6 R2 , então bn = cn , para n = 0, ±1, ±2, . . . , sendo o coeficiente cn

dado por (2.34b).
2.8.7 A LGUMAS TÉCNICAS DE CONSTRUÇÃO DE SÉRIES DE TAY -

LOR E L AURENT
Nos exemplos a seguir, serão ilustradas algumas das técnicas mais comuns para a construção
das séries de Taylor e Laurent. Em muitas situações, não ocorre a necessidade de se calcular
explicitamente os coeficientes {cn } da série, pois o teorema de unicidade acima garante que
qualquer série que represente uma função f (z) é, de fato, a única série de Laurent para a
mesma. Usualmente, para se obter a série de Laurent de uma dada função f (z), basta fazer uso
de expansões de Taylor de funções conhecidas e realizar substituições de forma apropriada.
Exemplo 2.14 (Uso de séries geométricas). Seja

1
f (z) = .
z−a
Sabendo-se que
∞
2 3
X 1
1 + z + z + z + ··· = zn = , (|z| < 1) ,
n=0
1−z
pode-se escrever, para |z| < |a|:

∞
1 1 1 1 X z n
f (z) = =− =− , (|z| < |a|) .
z−a a 1 − z/a a n=0 a
Esta é a série de Taylor de f (z) em torno de z = 0. Seu raio de convergência é R = |a|, porque a
uma distância R da origem existe o ponto z = a, onde f (z) não é analítica. Este é o único ponto
onde f (z) não é analítica.
Portanto, f (z) deve possuir uma série de Laurent em torno de z = 0 válida para |z| > |a|.
Escrevendo-se
1 1 1
f (z) = = ,
z−a z 1 − a/z
se |z| > |a|, |a/z| < 1 e é possível desenvolver:
∞ n
1 X a
= .
1 − a/z n=0 z

Portanto,
∞ ∞
1 1 X a n X an
f (z) = = = , (|z| > |a|) .
z−a z n=0 z n=0
z n+1
Esta é a série de Laurent desejada.
A função f (z) pode ser espandida por este método em torno de qualquer ponto z = b:
1 1 w=z−b 1
f (z) = = −−−−−→ , (b 6= a) .
z−a (z − b) − (a − b) w − (a − b)
Então,
∞ ∞ n
1 X wn 1 X (z − b)
f (z) = − = − , (|z − b| < |a − b|)
a − b n=0 (a − b)n a − b n=0 (a − b)n
ou
∞ n
X (a − b)
f (z) = n+1 , (|z − b| > |a − b|) .
n=0 (z − b)
Exemplo 2.15 (Decomposição em frações racionais). Seja
1
f (z) = .
z2 − (2 + i) z + 2i
Esta função não é analítica nos pontos z = i e z = 2; portanto, ela deve possuir uma série de
Taylor em torno de z = 0, válida para |z| < 1 e duas séries de Laurent em torno de z = 0, válidas
para 1 < |z| < 2 e |z| > 2, respectivamente. Para se obter estas três séries, usa-se a identidade:

1 1 1 1 1
f (z) = 2 = = − .
z − (2 + i) z + 2i (z − i) (z − 2) 2−i z−2 z−i
Para |z| < 1. Neste caso, pode-se usar diretamente a série geométrica:
∞
1 1 1 1 X z n
=− =− , (|z| < 2)
z−2 2 1 − z/2 2 n=0 2
∞
1 1 X n
=i =i (−iz) , (|z| < 1) .
z−i 1 + iz n=0
Subtraindo as séries, pode-se colocar em evidência fatores proporcionais à mesma potência

de z,
∞ ∞ ∞
1 1 1 X z n X n
X 1 n n+1
− =− −i (−iz) = − n+1
+ (−1) i zn,
z−2 z−i 2 n=0 2 n=0 n=0
2
de onde se obtém a série de Taylor de f (z), válida para |z| < 1.
Para 1 < |z| < 2. Neste caso, escreve-se:
∞
1 1 1 1 X z n
=− =− , (|z| < 2)
z−2 2 1 − z/2 2 n=0 2
∞ n
1 1 1 1X i
= = , (|z| > 1) .
z − i z 1 − i/z z n=0 z
Subtraindo-se ambas as séries, obtém-se a série de Laurent para 1 < |z| < 2.
Para |z| > 2. Neste caso, escreve-se:
∞ n
1 1 1 1X 2
= = , (|z| > 2)
z − 2 z 1 − 2/z z n=0 z
∞ n
1 1 1 1X i
= = , (|z| > 1) .
z − i z 1 − i/z z n=0 z
Subtraindo-se ambas as séries, obtém-se a série de Laurent para |z| > 2, a qual é composta
somente pela parte principal.

Exemplo 2.16 (Uso de séries de Taylor conhecidas). Fazendo-se uso das séries de Taylor
para as funções ez e sen z, expressões (2.32b) e (2.32c), respectivamente, as seguintes séries de
Laurent podem ser obtidas:
∞ n
sen z 2 1 X (−1) z 4n−2 1 z2 z6 z 10
4
= 2
+ = 2− + − + · · · , |z| > 0
z z n=1
(2n + 1)! z 3! 5! 7!
∞
ez 1 1 X z n−2 1 1 1 z z2
2
= 2+ + = 2
+ + + + + · · · , |z| > 0
z z z n=2 n! z z 2! 3! 4!
∞
X 1 1 1 1
e1/z =1 + n
=1+ + + + ··· , |z| > 0.
n=1
n!z z 2!z 2 3!z 3
Exemplo 2.17 (Obtenção da série de Laurent por diferenciação). Seja, por exemplo,
1
f (z) = 2.
(z − 1)
Para esta função, não se pode aplicar diretamente a expressão para a série geométrica. Contudo,
sabendo-se que para z 6= 0
1 d 1
2 = ,
(z − 1) dz 1 − z
agora pode-se usar a série geométrica, resultando
∞
1 d 1 d X n
f (z) = 2 = = z .
(z − 1) dz 1 − z dz n=0
Esta série pode ser diferenciada termo a termo dentro de seu círculo de convergência (|z| < 1),
de onde se obtém:
∞
1 X
f (z) = 2 = (n + 1) z n = 1 + 2z + 3z 2 + 4z 3 + · · · .
(z − 1) n=0
Exemplo 2.18 (Obtenção da série de Laurent por integração). Seja, por exemplo,
f (z) = ln (1 + z) = ln |1 + z| + i arg (1 + z) ,
onde se assume que o plano z fica restrido ao ramo principal da função logarítmica.
Sabendo-se que ˆ z
d 1 dw
ln (1 + z) = , então ln (1 + z) = ,
dz 1+z 0 1+w
pode-se desenvolver
∞
1 X n
= 1 − z + z2 − z3 + z4 + · · · = (−1) z n , (|z| < 1) ,
1+z n=0
e integrar termo a termo:

ˆ z ∞ ˆ z ∞ n
dw X n
X (−1) z n+1 z2 z3 z4
ln (1 + z) = = (−1) wn dw = =z− + − + ··· .
0 1 + w n=0 0 n=0
n+1 2 3 4
2.8.8 S ÉRIES DE L AURENT DE FUNÇÕES ELEMENTARES

Sem demonstração, apresenta-se a seguir algumas séries de Laurent de funções elementares
desenvolvidas em torno de z0 = 0:
n−1
1 z z3 2z 5 (−1) 22n B2n 2n−1
cotan z = − − − − ··· − z − ··· (|z| < π) (2.35a)
z 3 45 945 (2n)!
1 z z3 2z 5 22n B2n 2n−1
cotanh z = + − + − ··· + z + ··· (|z| < π) (2.35b)
z 3 45 945 (2n)!

60 2.9. Integração no plano complexo pelo método dos resíduos
n−1
1 z 7z 3 31z 5 (−1) 2 22n−1 − 1 B2n 2n−1
cosec z = + + + + ··· + z + ··· (|z| < π) (2.35c)
z 6 360 15120 (2n)!

1 z 7z 3 31z 5 2 22n−1 − 1 B2n 2n−1
cosech z = − + − + ··· − z + ··· (|z| < π) , (2.35d)
z 6 360 15120 (2n)!
sendo {Bn } os números de Bernoulli, dados por

n−1
1 1 1 1 X Bk
B0 = 1, B1 = − , B2 = , B4 = − , B6 = , B2n−1 = 0, Bn = −n! (n > 2) .
2 6 30 42 k! (n + 1 − k)!
k=0
2.8.9 C LASSIFICAÇÃO DE SINGULARIDADES

Na seção 2.8.7 observou-se que sempre que a função f (z) possui alguma singularidade em
um dado ponto z0 , a sua série de Laurent desenvolvida em torno deste ponto possui uma parte
principal não nula, a qual pode conter um número finito ou infinito de termos. O número de
termos contidos na parte principal serve como um critério adicional, alternativo aos critérios
definidos na seção 2.4.7, de classificação do tipo de singularidade que f (z) possui em z0 .
2.8.9.1 P OLOS
Se a série de Laurent da função f (z) possuir um número finito de termos na sua parte
principal, então esta singularidade é um polo, cuja ordem é dada pela potência mais alta na
parte principal.
Exemplo 2.19 (Polos). A função
e2z e2 2e2 2e2 4 2

f (z) = 3 = 3 + 2 + + e2 + e2 (z − 1) + · · · (2.36)
(z − 1) (z − 1) (z − 1) z−1 3 3
possui um polo de ordem 3 em z = 1.
2.8.9.2 S INGULARIDADES ESSENCIAIS
Se a série de Laurent da função f (z) possuir um número infinito de termos na sua parte
principal, então a função possui uma singularidade essencial.
Exemplo 2.20 (Singularidades essenciais). A função

1 1 1
f (z) = e1/z = 1 + + 2
+ + ···
z 2!z 3!z 3
possui uma singularidade essencial em z = 0.
2.8.9.3 S INGULARIDADES REMOVÍVEIS
Neste caso, a série de Laurent de f (z) possui apenas parte analítica.
Exemplo 2.21 (Singularidades removíveis). A função
sen z z2 z4 z6
f (z) = =1− + − + ···
z 3! 5! 7!
possui uma singularidade removível em z = 0.
2.9 I NTEGRAÇÃO NO PLANO COMPLEXO PELO MÉTODO

DOS RESÍDUOS
Nesta seção, o teorema de Cauchy será estendido a casos onde o integrando não é analítico;
por exemplo, se o integrando possui pontos singulares isolados. Cada singularidade isolada

contribui com um termo ao resultado da integral, sendo este termo proporcional ao resíduo
da singularidade. Esta propriedade, discutida pelo teorema dos resíduos, é muito útil para o
cálculo de integrais definidas, não somente no plano complexo, mas também puramente reais.
Em muitas situações, o teorema dos resíduos consiste no único método conhecido de solução da
integral. O mesmo teorema também é útil na solução de certas equações diferenciais ordinárias
ou parciais.
2.9.1 R ESÍDUOS
Seja f (z) unívoca e analítica no interior e sobre um contorno fechado simples C, exceto em
um ponto z = z0 , o qual por hipótese é interno a C. Se o ponto z0 é uma singularidade isolada
de f (z), então existe, de acordo com o teorema 2.22, um número real R1 > 0 tal que para
0 < |z − z0 | < R1 a função f (z) pode ser desenvolvida em termos de uma série de Laurent (2.34),
∞
X n c−1 c−2
f (z) = cn (z − z0 ) + + 2 + ··· , (2.37)
n=0
z − z0 (z − z0 )
onde ˛
1 f (z)dz
cn = n+1 .
2πi C (z − z0 )
Em particular, para n = −1 obtém-se que
˛
1
c−1 = f (z)dz. (2.38)
2πi C
O número complexo c−1 , o qual é o coeficiente de 1/ (z − z0 ) na expansão (2.37), é denominado o

resíduo de f (z) no ponto singular isolado z0 .
Este resultado também pode ser obtido de uma maneira mais formal integrando-se (2.37) em
ambos os lados ao longo de C:
˛ ∞ ˛ ˛ ˛
X n c−1 c−2
dz f (z) = cn dz (z − z0 ) + dz + dz 2 + ··· .
C n=0 C C z − z 0 C (z − z0 )
De acordo com o teorema de Cauchy (teorema (2.10)) ou com o exemplo (2.9),
˛
dz
n+1 = 2πiδn0 ,
C (z − z0 )
resultando em ˛
dz f (z) = 2πic−1 ,
C
de onde resulta o resíduo (2.38).
É comum usar-se também a notação
˛
1
Res f (z0 ) ≡ f (z)dz = c−1 .
2πi C
A fórmula (2.38) consiste em um método poderoso para calcular certas integrais ao longo de
contornos simples fechados. Para tanto, basta conhecer o valor do coeficiente c−1 da série de
Laurent associada à função que está sendo integrada.
Exemplo 2.22. Calcule a integral
˛
e−z dz
2, sendo Cdefinido por |z| = 2.
C (z − 1)
Solução. O único ponto singular do integrando é z = 1, um polo simples interior à circunferência
|z| = 2. Desenvolvendo e−z em uma série de Taylor em torno do ponto z = 1, resulta a série de
Laurent
∞ n
e−z e−1 e−1 −1
X (−1) n−2
2 = 2 − + e (z − 1) , (|z − 1| > 0) ,
(z − 1) (z − 1) z − 1 n=2
n!
cujo resíduo em z = 1 é c−1 = −e−1 . Portanto,
˛
e−z dz 2πi
2 =− .
C (z − 1) e

Exemplo 2.23. Calcule a integral ˛

1
exp dz
C z2
ao longo do mesmo contorno do exemplo anterior.
Solução. O ponto singular do integrando agora é z = 0, a qual é uma singularidade essencial.
Empregando a série de MacLaurin para ez , pode-se escrever
∞
1 X 1 1 1
exp = =1+ 2 + + · · · , (|z| > 0) .
z2 n=0
n!z 2n z 2!z 4
Portanto, o resíduo em z = 0 é c−1 = 0 e, assim,

˛
1
exp dz = 0.
C z2
Observação. Se f (z) for uma função analítica em z = z0 , o resíduo Res f (z) = c−1 é, obviamente
zero. Contudo, se z0 for um ponto singular isolado, o resíduo neste ponto pode ou não ser nulo.
2.9.2 T EOREMA DOS RESÍDUOS

Se uma função f (z) possui um número finito de pontos singulares no interior de algum
contorno simples fechado C, a integral de f (z) ao longo deste contorno será dada pela soma dos
respectivos resíduos da função. Este resultado é garantido pelo teorema dos resíduos de Cauchy,
descrito a seguir.
Teorema 2.25 (Teorema dos resíduos). Seja f (z) uma função analítica no interior e ao longo
de um contorno simples fechado C, exceto em um número finito de pontos singulares isolados
z1 , . . . , zn localizados no interior de C. Se bj = Res f (zj ) (j = 1, . . . , n) são os respectivos resíduos
de f (z) nestes pontos singulares, então
˛ n
X
f (z)dz = 2πi bj = 2πi (b1 + b2 + · · · + bn ) . (2.39)
C j=1
Demonstração. Considera-se o contorno exterior C representado na figura 2.18. Deformando-

P os segmentos de reta e as circunferências {Cj } ilustradas na figura, o
se este contorno com
contorno B = C + j (−Cj ) passa a ser simplesmente conexo. Então, de acordo com o teorema
de deformação do contorno (teorema 2.12), resulta
˛ n ˛
X
f (z)dz = f (z)dz.
C j=1 Cj
Como f (z) possui uma expansão de Laurent (2.37) em torno de cada ponto singular zj , resulta
a expressão (2.39).
2.9.3 C ÁLCULO DE RESÍDUOS

Alguns métodos básicos de obtenção dos resíduos de uma função f (z) serão agora discutidos.
2.9.3.1 P RIMEIRO MÉTODO : DIRETO DA DEFINIÇÃO
Calcula-se o resíduo de f (z) no ponto z0 direto da definição (2.38),

˛
1
Res f (z0 ) = f (z)dz,
2πi C
sendo C o contorno que envolve somente o ponto singular z0 . Este método é pouco utilizado, mas
pode ser útil se f (z) tem a primitiva (F 0 (z) = f (z)) conhecida e possui um ponto de ramificação
em z = z0 .

Figura 2.18: Contorno C utilizado na demonstração do teorema dos resíduos. Os pontos {zj } (j = 1, . . . , n) são
pontos singulares do integrando.
Exemplo 2.24. Calcule resíduo de f (z) = 1/z em z = 0.

Solução. Esta função possui a primitiva conhecida, F (z) = ln z, sendo que o ponto z = 0 é
um ponto de ramificação, com a linha de ramificação ao longo do eixo real positivo. No ramo
principal, F (z) = ln r + iθ, onde z = reiθ . Para evitar a linha de ramificação, o contorno C deve ser
inicialmente desconexo (aberto), sendo o mesmo fechado por um processo de limite, conforme
mostra a figura 2.19. Assim,
ˆ B
1 dz 1 1
Res f (z0 = 0) = lim = lim (ln B − ln A) = lim i (2π − ) = 1.
2πi B→A A z 2πi B→A 2πi →0
2.9.3.2 S EGUNDO MÉTODO : POLOS DE ORDEM m EM z = z0

Se f (z) é analítica no interior e ao longo de um con-
torno fechado simples C, exceto por um polo de ordem
m em z = z0 , então
1 dm−1 m
Res f (z0 ) = lim [(z − z0 ) f (z)] .
(m − 1)! z→z0 dz m−1
Demonstração. Se f (z) possui um polo de ordem m em

z = z0 , então da definição de polo (2.16) e pela propri-
edade das séries de Laurent (2.36), segue ser possível
m
escrever f (z) = g(z)/ (z − z0 ) , sendo g(z) uma função
analítica em R. Então
˛ ˛
1 1 g(z)
Res f (z0 ) = f (z)dz = dz.
2πi C 2πi C (z − z0 )m
Pela fórmula integral de Cauchy (2.24), resulta
1 1 dm−1 m
Res f (z0 ) = g (m−1) (z0 ) = lim [(z − z0Figura
) f (z)] . Contorno de integração para o
2.19:
(m − 1)! (m − 1)! z→z0 dz m−1 exemplo 2.24.
Exemplo 2.25. Calcule os resíduos de:

z
(a) f (z) = 2.
(z − 1) (z + 1)
Solução. Os polos são: z = 1 (polo simples) e z = −1 (polo duplo). Então,
z 1
Res f (1) = lim (z − 1) 2 = ,
z→1 (z − 1) (z + 1) 4
" #
d 2 z 1
Res f (−1) = lim (z + 1) 2 =− .
z→−1 dz (z − 1) (z + 1) 4

tan z
(b) f (z) = .
z2
Solução. Há somente um polo simples em z = 0, pois
tan z sen z 1
lim z 2
= lim lim = 1.
z→0 z z→0 z z→0 cos z
Portanto, Res f (0) = 1.
(c) f (z) = cot z.
Solução. Os polos são z = nπ, os quais são de primeira ordem. Então,
z − nπ n n
Res f (nπ) = lim (z − nπ) cot z = lim cos z lim = (−1) (−1) = 1.
z→nπ z→nπ z→nπ sen z
2.9.3.3 T ERCEIRO MÉTODO : RESÍDUO DE UMA FUNÇÃO RACIONAL
Este método se aplica quando a função f (z) possui um polo simples em z0 e pode ser escrita
na forma racional
p(z)
f (z) = ,
q(z)
sendo p(z) e q(z) funções analíticas, com q (z0 ) = 0 e p (z0 ) 6= 0. Neste caso,
p (z0 )
Res f (z0 ) = , desde que q 0 (z0 ) 6= 0.
q 0 (z0 )
Demonstração. Como z0 por hipótese é um polo simples, pode-se escrever
2
p (z0 ) + p0 (z0 ) (z − z0 ) + p00 (z0 ) (z − z0 ) /2! + · · ·
(z − z0 ) f (z) = (z − z0 ) 2
q (z0 ) +q 0 (z0 ) (z − z0 ) + q 00 (z0 ) (z − z0 ) /2! + · · ·
| {z }
=0
2
p (z0 ) + p0 (z0 ) (z − z0 ) + p00 (z0 ) (z − z0 ) /2! + · · ·
= .
q 0 (z0 ) + q 00 (z0 ) (z − z0 ) /2! + · · ·
Então,
p (z0 )
Res f (z0 ) = lim (z − z0 ) f (z) = .
z→z0 q 0 (z0 )
Exemplo 2.26. Calcule o resíduo em z = 0 para

ez
f (z) = .
sen z
Solução. O resíduo é dado por:
ez

Res f (0) = = 1.
cos z z=0
2.9.3.4 Q UARTO MÉTODO : PELO DESEVOLVIMENTO EM SÉRIE DE L AURENT

Quando z = z0 é uma singularidade essencial, este é o único método disponível. Deve-se
então primeiramente construir a série de Laurent de f (z) a partir dos métodos discutidos na
seção 2.8.7, ou a partir de outro método. Então, o resíduo será diretamente fornecido pelo
coeficiente c−1 , de acordo com a definição (2.38).
Exemplo 2.27. Calcule o resíduo de:
(a) f (z) = e1/z em z = 0.
Solução. De acordo com o exemplo 2.16,
1 1 1
e1/z = 1 + + + + · · · , (c−1 = 1) ,
z 2!z 2 3!z 3
então Res f (0) = 1.
2
(b) f (z) = e−1/z em z = 0.
Solução. Aqui pode-se usar novamente o exemplo 2.16, resultando
2 1 1 1
e−1/z = 1 − + − + · · · , (c−1 = 0) ,
z2 2!z 4 3!z 6
então Res f (0) = 0.

Figura 2.20: (a) Contorno CR no semi-plano superior. (b) Contorno CR no semi-plano inferior.
2.9.4 C ÁLCULO DE INTEGRAIS DEFINIDAS OU IMPRÓPRIAS

O teorema dos resíduos pode ser usado para calcular uma grande variedade de integrais,
tanto definidas quanto impróprias, reais ou complexas. É necessário, contudo, escolher-se o
contorno integração de uma forma adequada. Alguns do procedimentos mais frequêntes são
ilustrados nas seções seguintes. As integrais ilustradas podem aparecer em problema físicos,
particularmente na solução de problemas de contorno em equações diferenciais parciais.
2.9.4.1 I NTEGRAIS DO TIPO I: FUNÇÕES RACIONAIS
Aqui serão consideradas integrais do tipo

ˆ ∞
N (x)
dx,
−∞ D(x)
onde N (x) e D(x) são dois polinômios reais que satisfazem as seguintes condições:
1. D(x) 6= 0, ∀x ∈ R, isto é, D(x) não possui raízes no eixo real. Isto implica que o grau do
polinômio é necessariamente par.
2. O grau de D(x) é maior que o grau de N (x) por um fator de 2, no mínimo.
A última hipótese é necessária para garantir a convergência da integral.
Considera-se então a seguinte integral de contorno
˛ ˆ R ˆ
N (z) N (x) N (z)
dz = dx + dz,
C D(z) −R D(x) CR D(z)
onde R > 0. As funções N (z) e D(z) são as continuações analíticas7 dos polinômios reais para
o plano complexo, obtidas pela substituição x → z. A curva simples CR consiste em um semi-
círculo de raio R localizado ou no semi-plano complexo superior ou no inferior e que fecha o
contorno C com a reta [−R, R] no eixo real, conforme é ilustrado na figura 2.20. Desta forma,
o contorno fechado C pode envolver parte das ou todas as N raízes de D(z) no semi-plano su-
perior ({zj }, onde j = 1, . . . , N ) quando CR está nesta região (figura 2.20a) ou os seus complexos
conjugados ({z̄j } , j = 1, . . . , N ) quando CR está no semi-plano inferior (figura 2.20b). Ao se fazer
R → ∞, o contorno C engloba todas as N raízes de D(z) em um dos semi-planos.
Portanto, pelo teorema dos resíduos (2.39),
˛ ˆ R ˆ N
N (z) N (x) N (z) X N (z)
lim dz = lim dx + lim dz = 2πi Res ,
R→∞ C D(z) R→∞ −R D(x) R→∞ C D(z) D(z) z=zj
R j=1
sendo {zj } as raízes de D(z) englobadas por C. Portanto,

ˆ ∞ ˆ R N ˆ
N (x) N (x) X N (z) N (z)
dx = lim dx = 2πi Res − lim dz.
−∞ D(x) R→∞ −R D(x) j=1
D(z)
z=zj
R→∞ C D(z)
R
Mostra-se agora, por intermédio de um teorema, que a integral ao longo de CR se anula

quando R → ∞, bastando para isso que |N (z)/D(z)| → 1/ z 2 quando |z| → ∞.
7 Ver seção 2.10.

Teorema 2.26. Seja F (z) uma função analítica ao longo do semi-círculo CR , de raio R, tal que
|F (z)| 6 M/Rk , sendo z = Reiθ e onde k > 1 e M são constantes, então
ˆ
lim F (z)dz = 0.
R→∞ CR
Demonstração. Pela propriedade (5) das integrais de linha (seção 2.5.2), sendo A = max (|F (z)|)
ao longo de CR e L a extensão de CR , então
ˆ
M πM
F (z)dz 6 k πR = k−1 .

CR R R
Assim, ˆ ˆ

lim F (z)dz = lim F (z)dz = 0.
R→∞ CR R→∞ CR
O corolário a seguir particulariza o teorema 2.26 para polinômios.

Corolário. Seja F (z) uma função racional,
N (z) an z n + an−1 z n−1 + · · · + a1 z + a0
F (z) = = ,
D(z) bm z m + bm−1 z m−1 + · · · + b1 z + b0
com m > n + 2, então ˆ
N (z)
lim dz = 0.
R→∞ CR D(z)
Demonstração. De acordo com o teorema 2.26, ao longo de CR ,
ˆ
|an | Rn + |an−1 | Rn−1 + · · · + |a0 |

N (z)
dz 6 πR.

CR D(z)
||bm | Rm − |bm−1 | Rm−1 − · · · − |b0 ||
Então ˆ
π |an | Rn+1

N (z) π |an | 1
lim dz 6 lim = lim = 0.
R→∞ CR D(z) R→∞ |bm | Rm R→∞ |bm | Rm−n+1
Assim, de acordo com o teorema 2.26, resulta

ˆ ∞ N
N (x) X N (z)
dx = 2πi Res . (2.40)
−∞ D(x) j=1
D(z) z=zj

ˆ ∞
dx
I= 2 2
, (sendo a > 0) .
−∞ x + a

Solução. Como F (z) = 1/ z 2 + a2 satisfaz a condição
estipulada no teorema 2.26, então
ˆ
dz
lim = 0.
R→∞ C z 2 + a2
R
Por outro lado, as raízes de D(z) são z = ±ia. Pode-se

escolher CR dentro do semi-plano superior ou inferior.
Figura 2.21: Contorno de integração para in- Escolhendo-se CR conforme a figura ao lado, temos de
tegrais do tipo I. (2.40),
1
I = 2πi Res 2 2
.
z + a z=ia
Pelo método de cálculo de resíduos para funções que possuem polos no plano complexo, apre-
sentado na seção 2.9.3.2,
z − ia 1 π
I = 2πi lim 2 = 2πi = .
z→ia z + a2 2ia a
Se o contorno escolhido fosse no semi-plano inferior, o resultado seria o mesmo.

Exemplo 2.29. Calcule a integral ˆ ∞

x2
I= dx.
−∞ x4 + 1
2 4

Solução. A função F (z) = z / z + 1 novamente satisfaz a condição estipulada no teorema 2.26.
Agora as 4 raízes de D(z) são determinadas pela equação z 4 = −1 = eiπ , resultando em (ver
eq. 2.9) z1 = eiπ/4 , z2 = ei3π/4 , z3 = ei5π/4 e z4 = ei7π/4 . Traçando novamente CR no semi-plano
superior, somente será necessário considerar as raízes z1 e z2 . Então,
" #
z 2 z 2

I = 2πi Res 4 + Res 4 .
z + 1 z + 1 z=z1 z=z2
Pelo método apresentado na seção 2.9.3.3, resulta

−iπ/4
e−i3π/4 eiπ/4 + e−iπ/4
2
z22

z1 e π π
I = 2πi 3 + 3 = 2πi + = π = π cos =√ .
4z1 4z2 4 4 2 4 2
2.9.4.2 I NTEGRAIS DO TIPO II: FUNÇÕES RACIONAIS DE FUNÇÕES TRIGONO -

MÉTRICAS
Agora serão consideradas integrais do tipo

ˆ 2π
F (sen θ, cos θ) dθ,
0
onde F (sen θ, cos θ) é uma função racional de sen θ e cos θ.

Realizando a substituição
z = eiθ , dz = ieiθ dθ
e usando cos θ = eiθ + e−iθ /2 = (z + 1/z) /2 e sen θ = eiθ − e−iθ /2i = (z − 1/z) /2i, resulta

ˆ 2π ˛
dz z − 1/z z + 1/z
F (sen θ, cos θ) dθ = F , ,
0 C0 iz 2i 2
sendo C0 a circunferência de raio unitário centrada na origem. Como F (x, y) é uma função raci-
onal, a integral complexa acima pode ser obtida a partir do teorema dos resíduos, os quais serão
determinados novamente pelas raízes de um polinômio. Portanto, se o polinômio resultante no
denominador possui N raízes dentro do círculo de raio unitário, determinadas pelo conjunto
{zj } (j = 1, . . . , N ),
ˆ 2π N
X 1 z − 1/z z + 1/z
F (sen θ, cos θ) dθ = 2πi Res F , . (2.41)
0 j=1
iz 2i 2
z=zj

ˆ 2π
cos 3θ
I= dθ.
0 5 − 4 cos θ
Solução. Realizando a transformação z = eiθ , resulta
ei3θ + e−i3θ z 3 + z −3
cos 3θ = =
2 2
e ˛ ˛
1 dz z6 + 1 1 z6 + 1
I= 2 2
=− dz .
2 C0 iz z (5z − 2z − 2) 2i C0 z 3 (2z − 1) (z − 2)
O integrando possui os seguintes polos:
• z = 0: polo de ordem 3.
• z = 1/2: polo de ordem 1.
• z = 2: polo de ordem 1 (fora do círculo |z| = 1).

Os resíduos são os seguintes:

d2 z6 + 1

1 21
Res F (0) = lim 2 z 3 3 =
2! z→0 dz z (2z − 1) (z − 2) 8
z6 + 1

1 1 65
Res F = lim z− 3
=− .
2 z→1/2 2 z (2z − 1) (z − 2) 24
Portanto,
1 21 65 π
I=− 2πi − = .
2i 8 24 12
2.9.4.3 I NTEGRAIS DO TIPO III: INTEGRAIS DE F OURIER

Tratam-se de integrais do tipo
ˆ ∞
I± = F (x)e±ikx dx (k > 0) ,
−∞
onde F (x) é uma função racional que satisfaz as condições do teorema 2.26. As partes real e
imaginária do integrando determinam as integrais
ˆ ∞ ˆ ∞
Ic = F (x) cos kxdx e Is = F (x) sen kxdx.
−∞ −∞
Novamente, é feita a hipótese de ausência de singularidades de F (x) no eixo real. Quando é

necessário calcular integrais dos tipos Ic ou Is , inicialmente substitui-se a integral em questão
por I+ (ou I− , dependendo das singularidades de F (x)) e novamente calcula-se a integral ao
longo do semi-círculo ilustrado na figura 2.20a. Isto é, calcula-se
˛ "ˆ
R ˆ #
ikz ikx ikz
F (z)e dz = lim F (x)e dx + F (z)e dz .
C R→∞ −R CR
As condições que F (z) deve satisfazer para que a integração ao longo de CR se anule para R → ∞
são dadas pelo Lema de Jordan.
Lema 2.1 (Lema de Jordan). Seja F (z) uma função analítica ao longo do semi-círculo CR , de raio
R, tal que |F (z)| 6 M/Rα , sendo z = Reiθ e onde α > 0 e M são constantes, então
ˆ
lim F (z)eikz dz = 0.
R→∞ CR
iθ
Demonstração. Sendo z = Re , então
ˆ ˆ π
F (z)eikz dz = F Reiθ exp ikReiθ iReiθ dθ.

CR 0
Pelas propriedades (5) e (6) da seção 2.5.2,

ˆ π ˆ π
iθ iθ iθ F Reiθ exp ikReiθ iReiθ dθ,

F Re exp ikRe iRe dθ 6

0 0
mas
exp ikReiθ = eikR(cos θ+isen θ) 6 e−kRsen θ ,

portanto,
ˆ π ˆ π ˆ π
F Reiθ e−kRsen θ Rdθ 6 M
F Reiθ exp ikReiθ iReiθ dθ 6 e−kRsen θ dθ.

0 0 Rα−1 0
Como sen (π − θ) = sen θ, pode-se alterar o intervalo de integração para [0, π/2]. Além disso, como
mostra a figura 2.22, sen θ > 2θ/π neste intervalo. Assim,
ˆ π ˆ π/2
2M πM
iθ iθ iθ
e−2kRθ/π dθ = 1 − e−kR .

F Re exp ikRe iRe dθ 6 α−1
α

0 R 0 kR
Portanto, ˆ
lim F (z)eikz dz = 0.
R→∞ CR

Devido ao Lema de Jordan, o teorema dos resíduos ga-

rante que
ˆ ∞ X
F (x)eikx dx = 2πi Res F (zj ) eikzj ,

I+ = Ic + iIs =
−∞ j
(2.42a)
sendo {zj } os pontos singulares de F (z) na região deli-
mitada pelo contorno C ilustrado na figura 2.26.
Caso os pontos singulares de F (z) sejam tais que
se faz necessário considerar-se CR percorrendo o semi-
círculo no semi-plano inferior ilustrado na figura 2.20b,
Figura 2.22: Demonstração gráfica da ine- deve-se calcular então I− . As conclusões são simila-
gualdade sen θ > 2θ/π em 0 6 θ 6 π/2. res às de I+ , salvo que os resíduos são computados no
semi-plano inferior e
X
Res F (zj ) e−ikzj .

I− = Ic − iIs = −2πi (2.42b)
j

cos αx
I= dx.
0 1 + x2
Solução. Pode-se escrever ˆ ∞
1 eiαx
I= Re dx.
2 −∞ 1 + x2
2

Identifica-se F (z) = 1/ 1 + z , e esta satisfaz as condições do Lema de Jordan, pois ao longo de
CR ,
1 1 R→∞ 1
|F (z)| = 6 2 −−−−→ 2 .
|1 + z 2 | R −1 R
Os resíduos de F (z) estão em z = ±i, sendo estes polos simples. Assim, de (2.42a),
ˆ ∞ iαx iαx
e e
= πe−α .

2
dx = 2πi Res 2

−∞ 1 + x 1 + z z=i
Portanto,
π −α
I= e .
2
2.9.4.4 I NTEGRAIS DO TIPO IV: INTEGRANDO COM POLOS NO EIXO REAL
Seja F (z) uma função meromórfica, ou seja, uma função que possui apenas polos em um
domínio finito no plano complexo. Supõe-se que F (z) possua, no mínimo, um polo ao longo do
eixo real. Supõe-se também que |F (z)| → 0 para |z| → ∞. Deseja-se calcular agora integrais do
tipo ˆ ∞ ˆ ∞
f (x)
F (x) dx = dx.
−∞ −∞ x − x0
Devido a presença do polo no eixo real, para que o teorema dos resíduos permaneça válido,
o contorno de integração não pode passar pela referida singularidade; torna-se necessário, por-
tanto, que o contorno seja deformado nas vizinhanças do polo real. A partir desta situação surge
a definição da parte principal de Cauchy da integral.
PARTE PRINCIPAL DE C AUCHY

Seja F (z) = f (z)/ (z − x0 ) uma função meromórfica que possui, no mínimo, um polo simples
´b
no eixo real em z = x0 . Ao se considerar a integral a F (x)dx, com a < x0 < b tais que z = x0
é o único polo de F (z) neste intervalo, a convergência desta integral depende da existência do
seguinte limite:
ˆ x0 − ˆ b !
f (x) f (x)
IP P = lim+ dx + dx .
→0 a x − x0 x0 + x − x0

´b
Diz-se que a F (x)dx é convergente se e somente se IP P existe e é finito, caso contrário a integral
é divergente. O limite IP P pode existir, em algumas situações, mesmo se limx→x0 f (x) → ±∞. Isto
ocorre, por exemplo, se f (x) é simétrica em uma vizinhança de x0 .
´b
Caso IP P exista e seja finita, esta define a parte principal de Cauchy da integral a F (x)dx, a
ffl b ´b
qual é representada pelos símbolos a ou Pa :
b ˆ b ˆ x0 − ˆ b
!
f (x) f (x) f (x) f (x)
≡P dx = lim dx + dx . (2.43a)
a x − x0 a x − x0 →0+ a x − x0 x0 + x − x0
A parte principal de Cauchy no infinito existe se

∞ ˆ ∞ ˆ x0 − ˆ ∞
f (x) f (x) f (x) f (x)
dx ≡ P dx = lim+ dx + dx (2.43b)
−∞ x − x0 −∞ x − x0 →0 −∞ x − x0 x0 + x − x0
existe e é finito.
C ÁLCULO DE INTEGRAIS DO TIPO IV

Para calcular integrais do tipo IV pelo teorema
dos resíduos, considera-se o contorno
C = Γ + γ + (−R, x0 − ) + (x0 + , R)
apresentado na figura 2.23, o qual é composto por

um semi-círculo exterior Γ, dois segmentos de reta
ao longo do eixo real nos intervalos (−R, x0 − ) e
(x0 + , R), e do semi-círculo interior γ. Na figura
2.23, a curva Γ foi traçada no semi-plano supe-
rior para englobar os polos {zj } (j = 1, . . . , N ) de
f (z). Caso estes polos se encontrem no semi-plano
inferior, a curva Γ pode ser traçada nesta região.
Supõe-se também que (> 0) seja pequeno o sufi-
ciente para que nenhum dos polos {zj } se encontre
Figura 2.23: Contorno de integração para integrais na região interior da curva γ.
do tipo IV.
Assim, pelo teorema dos resíduos,
˛ N
f (z) X f (z)
dz = 2πi Res .
C z − x0 j=1
z − x0 z=zj
Dividindo o contorno C nas suas curvas constituintes,

ˆ R ˆ N
f (z) f (x) f (z) X f (z)
dz + dx + dz = 2πi Res ,
Γ z − x0 −R x − x0 γ z − x0 j=1
z − x0 z=zj
Toma-se agora o limite R → ∞, supondo

´ que F (z) ao longo de Γ satisfaça as condições prescritas
pelo teorema 2.26. Neste caso, Γ F (z)dz = 0. A integral ao longo de γ pode ser calculada,
tomando-se para ela o limite → 0:
ˆ ˆ 0
f (z) f x0 + eiθ
dz = lim ieiθ dθ = −iπf (x0 ) ,
γ z − x0 →0 π eiθ
sendo neste caso suposto que f (x0 ) exista e seja finita. Este valor da integral em γ é muitas
vezes denominado de semi-resíduo de f (x) em x0 .
Portanto, obtém-se o seguinte resultado para a parte principal,
∞ N
f (x) X f (z)
dx = πif (x0 ) + 2πi Res . (2.44a)
−∞ x − x0 j=1
z − x0 z=zj

Caso a função F (x) possua mais de um polo no eixo real, o resultado (2.44a) pode ser facilmente
generalizado. Sendo novamente {zj } (j = 1, . . . , N ) o conjunto de polos de F (z) fora do eixo real e
{x` } (` = 1, . . . , M ) o conjunto de polos ao longo do eixo real, a forma generalizada de (2.44a) é
∞ M
X N
X
F (x) dx = πi Res F (x` ) + 2πi Res F (zj ) . (2.44b)
−∞ `=1 j=1

sen x
dx.
−∞ x
Solução. É conveniente calcular
∞
eix
dx.
−∞ x

A função eiz /z satisfaz as condições
´ estabelecidas
pelo Lema de Jordan, ou seja, z −1 6 M/Rα
(α > 0) ao longo de Γ. Portanto, Γ eiz /z dz = 0 e a equação (2.44a) pode ser aplicada, de onde
resulta ∞ ix
e
dx = iπ.
−∞ x
Uma vez que eix = cos x + i sen x, obtém-se
ˆ ∞
sen x
dx = π.
−∞ x
ffl ´
Observação. Nota-se que, neste caso, = , pois x = 0 é uma singularidade removível. É
interessante também que o mesmo resultado fornece
∞
cos x
dx = 0,
−∞ x
o que é esperado, uma vez que o integrando neste caso é ímpar.
∞
sen x
dx, (a > 0) .
−∞ x (a2 − x2 )
Solução. Novamente toma-se
eiz
F (z) = ,
z (a2 − z 2 )
sendo que F (z) satisfaz as condições do Lema de Jordan e os seus polos são z = 0 e z = ±a,
todos ao longo do eixo real. Neste caso, de acordo com (2.44b),
∞
eix dx
= iπ [Res F (0) + Res F (a) + Res F (−a)] .
−∞ x (a2 − x2 )
Calculando os resíduos,
eiz

1
Res F (0) = z 2 2
= 2,
z (a − z ) z=0 a
iz
eia

e
Res F (a) = (z − a) 2 2
=− 2
z (a − z ) z=a
2a
iz
e−ia

e
Res F (−a) = (z + a) 2 2
=− 2.
z (a − z ) z=−a
2a
Portanto,
∞
eix dx π
= i 2 (1 − cos a)
−∞ x (a2 − x2 ) a
e o resultado desejado fica
∞
sen x dx π
2 − x2 )
= 2 (1 − cos a) .
−∞ x (a a
Observação. Novamente observa-se também que
∞
cos x dx
= 0.
−∞ x (a2 − x2 )

2.9.4.5 I NTEGRAIS DO TIPO V: INTEGRAÇÃO AO LONGO DE LINHAS DE RAMIFI -

CAÇÃO
Neste caso, o contorno de integração deve ser construído de forma a evitar tanto os pontos
de singularidades essenciais e polos no eixo real quanto a linha de ramificação.
Para ilustrar este tipo de integração, serão consideradas integrais do tipo
ˆ ∞
xλ−1 G(x) dx, (sendo 0 < λ < 1)
0
e a função G(z) é racional, analítica em z = 0 e não possui polos ao longo do eixo real positivo.
Supõe-se ainda que
lim z λ−1 G(z) = 0.

|z|→0
|z|→∞
A função f (z) = z λ−1 é plurívoca, com um ponto de ramificação em z = 0, o que pode ser
comprovado por uma rotação do fasor z em torno da origem,
θ→θ+2π
f (z) = z λ−1 −−−−−→ ei2π(λ−1) z λ−1 .
Como λ − 1 não é inteiro, o valor de f (z) em θ + 2π difere do valor em θ. A outra singularidade

de f (z) está no infinito, significando que a linha de ramificação deve unir estes dois pontos
singulares. Usualmente, esta linha é traçada ao longo do eixo real positivo. O número de folhas
de Riemann para f (z) depende da natureza do número λ. Se este número é racional, então
há um número finito de folhas de Riemann; contudo, se λ é irracional, então existem infinitas
folhas de Riemann. Devido a este fato, o contorno de integração C a ser adotado deve evitar o
cruzamento da linha de ramificação para evitar a necessidade de se considerar os outros ramos
da função z λ−1 .
O contorno de integração usualmente empre-
gado para resolver uma integral do tipo V é apre-
sentado na figura 2.24, a qual mostra também a
linha de ramificação no intervalo [0, ∞). Este tipo
de contorno é denominado buraco de fechadura 8 e
consiste em um arco de circunferência exterior CR ,
de raio R e centrado na origem, com uma varia-
ção angular δR 6 θ 6 2π − δR . O número 0 < δR 1
pode ser tão pequeno quanto se queira, mas nunca
é nulo, justamente para evitar que CR toque a li-
nha de ramificação. O contorno C contém tam-
bém o arco de circunferência interior Cr , de raio
r e centrado na origem, com a variação angular
δr 6 θ 6 2π − δr , sendo 0 < δr 1 também tão
pequeno quanto se queira. Finalmente, os arcos
Cr e CR são ligados pelos segmentos de reta [r, R] e
[R, r],9 os quais distam da linha de ramificação por
Figura 2.24: Contorno de integração para integrais uma distância 0 < 1. Obviamente, = r sen δr .
do tipo V. Como a função z λ−1 é descontínua ao longo da
linha de ramificação, o valor das integrais ao longo
dos segmentos de reta não se cancelam. Na reta superior, arg(z) ' 0 e, portanto,
λ−1
f (z) = z λ−1 = (x + i) .
Na reta inferior, arg(z) ' 2π e, portanto,

λ−1
f (z) = ei2π(λ−1) z λ−1 = ei2π(λ−1) (x − i) .
Supondo agora que a função R(z) possua N singulares isoladas (polos e/ou singularidades
essenciais) nos pontos {zj } (j = 1, . . . , N ), o teorema dos resíduos (2.39) aplicado ao contorno
simples fechado C = CR + Cr + [r, R] + [R, r] garante que
8 Do inglês keyhole.
9 Rigorosamente, os segmentos de reta percorrem o intervalo [r cos δr , R cos δR ], em ambos os sentidos.

˛ ˆ ˆ ˆ R
λ−1
z λ−1 G(z) dz = z λ−1 G(z) dz + z λ−1 G(z) dz + (x + i) G (x + i) dx
C CR Cr r
ˆ r N
X
2πi(λ−1) λ−1
Res z λ−1 G(z) z .

+ e (x − i) G (x − i) dx = 2πi
j
R j=1
A integral em CR se anula no limite R → ∞, desde que as condições do seguinte teorema

sejam satisfeitas.
Teorema 2.27. Seja uma função F (z) analítica ao longo do arco de circunferência CR , de raio R
centrado na origem, tal que |F (z)| 6 M/Rα ao longo de CR , sendo α > 1 e M > 0 constantes, então
ˆ
lim F (z)dz = 0.
R→∞ CR
Demonstração. Sendo a curva CR parametrizada pelo ângulo θ, o qual varia no intervalo [θ1 , θ2 ],
então ˆ ˆ θ2 ˆ θ2
M M (θ2 − θ1 )
F (z)dz 6 |F (z)| R dθ 6 dθ = .

CR Rα−1 Rα−1
θ1 θ1
Portanto, ˆ

lim F (z)dz = 0,
R→∞ CR
de onde segue o teorema.
Por outro lado, a integral ao longo de Cr pode ser calculada parametrizando-se z = reiθ e
tomando-se o limite r → 0:
ˆ " ˆ 2π−δr #
λ−1 λ iλθ iθ G (0) i2πλ −iλδr iλδr
lim rλ .

lim z G(z) dz = lim ir e G re dθ = e e −e
r→0 C
r
r→0 δr λ r→0
Como G(z) por hipótese é analítica em z = 0 e λ > 0, resulta que

ˆ
lim z λ−1 G(z) dz = 0.
r→0 Cr
Lembrando também que r → 0 implica em → 0, restam as seguintes integrais,

ˆ ∞ ˆ 0 N
X
xλ−1 G (x) dx + e2πi(λ−1) xλ−1 G (x) dx = 2πi Res z λ−1 G(z) zj ,

0 ∞ j=1
as quais podem ser escritas

ˆ ∞ ˆ 0 ˆ ∞
λ−1 2πi(λ−1) λ−1 2πi(λ−1)
x G (x) dx + e G (x) dx = 1 − e
x xλ−1 G (x) dx
∞
0
ˆ 0
ˆ
iπλ iπλ −iπλ
∞ λ−1 λ+1
∞
= −e e −e x G (x) dx = 2i (−1) sen πλ xλ−1 G (x) dx.
0 0
Portanto, resulta
ˆ ∞ N
λ−1 −(λ+1) π X
Res z λ−1 G(z) zj .

x G (x) dx = (−1) (2.45)
0 sen πλ j=1

ˆ ∞
xλ−1
I= dx, (0 < λ < 1) .
0 1+x

Solução. Como 0 < λ < 1, o integrando ao longo da curva CR , para R 1, pode ser escrito
λ−1
z 1
1 + z ' R2−λ .

Então, de acordo com o teorema 2.27,

ˆ
z λ−1
lim dz = 0
R→∞ CR 1+z
−1
e o resultado (2.45) é válido neste caso. O único polo de G(z) = (1 + z) está em z = −1 e o
resíduo do integrando neste ponto é
λ−1
z λ−1
Res = (−1) .
1 + z z=−1
Portanto, ˆ ∞
xλ−1 −(λ+1) π λ−1 π
I= dx = (−1) (−1) = .
0 1+x sen πλ sen πλ
2.9.4.6 O UTROS TIPOS DE INTEGRAIS
Existem diversos outros exemplos de integrais que podem ser calculadas usando o teorema
dos resíduos por intermédio de uma escolha adequada do contorno de integração. Nesta seção
serão apresentados alguns exemplos relevantes para a física.
I NTEGRAIS DE F RESNEL . D IFRAÇÃO DE

ONDAS ELETROMAGNÉTICAS . As integrais
ˆ ∞ ˆ ∞
cos tx2 dx e S = sen tx2 dx

C=
0 0
correspondem aos valores assintóticos das funções

de Fresnel, as quais descrevem a difração de ondas
eletromagnéticas em um único obstáculo pontia-
gudo (difração de canto).
Para a obtenção dos valores de C e S, considera-
CL
CR se a seguinte integral
ˆ ∞
2
I= eitx dx,
0
Cx
cujas partes real e imaginária fornecem, respecti-
vamente, C e S. Por conveniência, assume-se que
t > 0; para este caso, o contorno de integração ade-
Figura 2.25: Contorno de integração para as inte- quado pode ser visto na figura 2.25. Como a fun-
2
grais de Fresnel. ção eitz é analítica dentro e ao longo do contorno
C = Cx + CR + CL , pode-se escrever
˛ ˆ ˆ ˆ
itz 2 2
e dz = + + eitz dz = 0.
C Cx CR CL
A integral em CR pode ser estimada usando argumento semelhante ao exposto pelo Lema de
Jordan. Ao longo deste contorno, z 2 = R2 (cos 2θ + i sen 2θ). Como demonstrado graficamente na
figura 2.22, sen 2θ > 4θ/π em 0 6 θ 6 π/4, portanto
ˆ ˆ π/4

itz 2 itR 2
(cos 2θ+i sen 2θ) iθ

e dz = e iRe dθ

CR 0
ˆ π/4
2
6 Re−tR sen 2θ dθ
0

ˆ π/4
2 π 2

6 Re−tR 4θ/π
dθ = 1 − e−tR .
0 4tR
´ 2

Ou seja, CR eitz dz → 0 para R → 0.

Por outro lado, ao longo de Cx , z = x e ao longo de CL , z = reiπ/4 (0 6 r 6 R). Assim,

ˆ ˆ R ˆ ˆ 0
itz 2 itx2 itz 2 2
e dz = e dx e e dz = e−tr eiπ/4 dr.
Cx 0 CL R
Portanto, no limite R → ∞, ˆ ˆ
∞ ∞
itx2 2
e dx = e iπ/4
e−tr dr.
0 0
´∞ 2
A integral J = 0
e−tr dr pode ser calculada da seguinte maneira:
ˆ ∞ ˆ ∞ ˆ ∞ ˆ ∞
2
2 2
+y 2 )
J2 = e−tx dx e−ty dy = e−t(x dxdy.
0 0 0 0
Usando coordenadas polares, resulta

ˆ π/2 ˆ ∞
2 π
J2 = dθ dρ ρe−tρ = .
0 0 4t
Finalmente, obtém-se
ˆ ∞
eiπ/4
r r
itx2 π π π 1 π
e dx = = cos + i sen .
0 2 t 4 4 2 t
Portanto, as integrais de Fresnel valem

r
1 π
S=C= .
2 2t
I NTEGRAL DE P LANCK E L EI DE S TEFAN -B OLTZMANN . A Lei de Planck determina

a intensidade espectral da radiação eletromagnética emitida por um corpo negro em equilíbrio
termodinâmico a uma temperatura absoluta T . Esta intensidade é dada por
2h ν3
I (ν, T ) = 2 hν/k
,
c e BT − 1
sendo I (ν, T ) a potência emitida por unidade de área da superfície emissora por unidade de
ângulo sólido por frequência ν. As quantidades h, kB e c são, respectivamente, as constantes
de Planck e Boltzmann e a velocidade da luz no vácuo. A Lei de Stefan-Boltzmann fornece a
potência total emitida por unidade de área do corpo negro, ou seja,
ˆ ∞ 4 ˆ ∞
u3 du

2πh kB T
j=π dν I (ν, T ) = 2 IP , sendo IP =
0 c h 0 eu − 1
a integral que se deseja calcular, a qual é obtida por uma simples troca de variáveis de integra-
ção.
Para se obter IP , considera-se a integral
ˆ ∞
sen (kx)
f (k) = dx.
0 ex − 1
Obviamente,
d3 f

IP = − .
dk 3 k=0

Im Portanto, pode-se obter IP conhecendo-se f (k). A

integral que define esta função também pode ser
escrita como
ˆ ∞ ikx
e
f (k) = Im x−1
dx.
2π 0 e
C5
C4 Este cálculo será realizado utilizando-se o con-
C3
C6 torno C = C1 + · · · + C6 ilustrado na figura 2.26
e a integral de contorno
C1
C2 ˛
eikz
z
dz = 0,
ε R C e −1
Re
a qual é nula pelo teorema dos resíduos (2.39) por-
Figura 2.26: Contorno de integração empregado que o integrando possui apenas polos simples nos
para o cálculo da integral de Planck. Observa-se pontos z = 2nπi, (n = 0, ±1, ±2 . . . ). As integrais nos
que 1 e R 1. contorno C1 , . . . , C6 devem ser realizadas separada-
mente. Nos contornos C2 e C4 obtém-se
ˆ ikz ˆ
R eikx
ˆ
e −2πk
+ dz = 1 − e dx.
C2 C4 ez − 1 ex − 1
Já ao longo dos contornos C1 e C5 observa-se que |z| = 1, o que permite o uso da série de
Laurent (2.35d). Para a integral I1 pode-se escrever z = eiθ , resultando
ˆ ˆ
eikz 1 z/2 ikz
z
I1 () ≡ dz = e e cosech dz
C1 ez − 1 2 C1 2
ˆ ˆ π/2
7z 3

1 2 z 1
ez/2 eikz + ik eiθ dθ − O 2 .

= − + − · · · dz = −i exp
2 C1 z 12 2880 0 2
Portanto,
π
lim I1 = −i .
→0 2
Já para o contorno C5 pode-se escrever z = 2πi + eiθ e
ˆ ˆ
eikz 1 z/2 ikz
z
I5 () ≡ z
dz = e e cosech dz.
C5 e − 1 2 C5 2
Neste caso é necessária a série de Laurent de cosech z em torno de z0 = 2πi, a qual é simplesmente
3
1 z − 2πi 7 (z − 2πi)
cosech z = − + − + ··· ,
z − 2πi 6 360
resultando,
ˆ ˆ −π/2
1 2 z − 2πi 1
ez/2 eikz − + · · · dz = ie−2πk + ik eiθ dθ + O 2 .

I5 () = + exp
2 C5 z − 2πi 12 0 2
Portanto,
π
lim I5 = −i e−2πk .
→0 2
Já a integral I3 pode ser escrita
ˆ ˆ 2π
eikz e−ky
I3 (R) ≡ dz = ie−(1−ik)R dy.
C3
z
e −1 0 eiy− e−R
Observa-se agora que no limite R → ∞ a integral é finita, pois o denominador do integrando pode
ser substituído por eiy , o que torna a integração trivial. Portanto, limR→∞ I3 = 0. Finalmente, a
integral I6 pode ser escrita
ˆ ˆ 2π− −ky ˆ 2π− −ky −iy/2 ˆ
eikz e e e 1 2π− e−ky e−iy/2
I6 ≡ dz = −i dy = −i dy = − dy.
z
C6 e − 1 eiy − 1 eiy/2 − e−iy/2 2 sen (y/2)

Assim, pelo teorema dos resíduos,

ˆ R ˆ 2π−
−2πk
eikx 1 e−ky e−iy/2
1−e x
dx = dy − I1 − I5 − I3 (R)
e −1 2 sen (y/2)
e, portanto, f (k) é dada por
ˆ R ˆ 2π
eikx 1 π 1 + e−2πk
f (k) = lim Im dx = − e−ky dy +
→0
x
e −1 2 (1 − e−2πk ) 0 2 1 − e−2πk
R→∞
−2πk
1 π1+e 1 π
=− + −2πk
=− + cotanh (πk)
2k 2 1−e 2k 2
2
(2.35b) π k π4 k3 π6 k5 πB2n 2n−1
−−−−→ − + − ··· + (2πk) + · · · . (2.46)
6 90 945 (2n)!
Com este resultado, é possível finalmente obter-se IP :
π4
IP = ,
15
resultando na seguinte expressão para a constante de Stefan-Boltzmann,
2π 5 kB
4
j = σT 4 , sendo σ = .
15h c2
3
Como um bônus, o resultado (2.46) pode ser usado para fornecer o valor das integrais
ˆ ∞
x2n+1 dx 2n+1

n d f n B2(n+1)
= (−1) = (−1) 22n π 2(n+1) , (n = 0, 1, 2, . . . ) .
0 ex − 1 dk 2n+1 k=0 n+1
2.10 C ONTINUAÇÃO ANALÍTICA

Com frequência, a representação conhecida de uma dada função é válida somente em uma
região limitada do plano complexo, como uma série de Laurent com raio de convergência finito,
por exemplo. A região de convergência (ou domínio) desta série se estende até a singularidade
mais próxima, distinta do ponto em torno do qual se realiza a expansão, que pode ou não conter
uma singularidade. Com frequência também é desejável obter-se uma outra forma matemática
que represente a mesma função em uma outra região do plano complexo, ou que seja válida
em uma porção maior do mesmo. O processo de estender o intervalo de validade de uma re-
presentação ou, de forma mais geral, estender a região de domínio de uma função analítica é
denominado continuação analítica.
Definição 2.1. Um elemento de função analítica (f (z), D) é uma função analítica f (z) no interior
de seu domínio de definição D. Um elemento de função (f2 , D2 ) é uma continuação analítica de
outro elemento (f1 , D1 ) se D1 ∩ D2 6= ∅ e se f1 (z) = f2 (z) em D1 ∩ D2 .
Em outras palavras, seja f1 (z) uma função analítica da variável z em um domínio D1 do plano
complexo. Supõe-se agora ser possível encontrar uma outra função f2 (z), a qual é analítica em
um outro domínio D2 . Se ocorrer uma intersecção D1 ∩ D2 não nula de ambos os domínios,
conforme representado na figura 2.27, e se f1 (z) = f2 (z) em D1 ∩ D2 , então se diz que f2 (z) é a
continuação analítica de f1 (z) em D2 , e vice-versa. Da mesma forma, pode existir uma terceira
função f3 (z), analítica em D3 , e se f3 (z) = f1 (z) em D3 ∩ D1 e f3 (z) = f2 (z) em D3 ∩ D2 , então f3 (z)
pode ser a continuação analítica das anteriores em D3 . Esta situação também está representada
na figura 2.27. Portanto, existe uma função analítica f (z) com o domínio D = D1 ∪ D2 ∪ D3 , tal
que f (z) = f1 (z) em D1 , f (z) = f2 (z) em D2 e f (z) = f3 (z) em D3 . Nota-se que basta a intersecção
entre os domínios ser composta simplesmente por um arco que a continuação analítica existe e
é única, desde que as três regiões não englobem um ponto singular ou um ponto de ramificação
de uma função plurívoca.

78 2.10. Continuação analítica
Contudo, a situação descrita acima nem sempre

ocorre. Somente é garantida a existência da fun-
ção analítica f (z) no domínio D = D1 ∪ D2 ∪ D3 se
D1 ∩ D2 ∩ D3 6= ∅. Caso a intersecção ocorra somente
entre pares de domínios e se a região entre os domínios
D1 , D2 e D3 contiver pontos singulares, como por exem-
plo, pontos de ramificação, então f3 (z) 6= f1 (z), porque
a região D1 ∩ D3 será parte do domínio de diferentes fo-
lhas de Riemann para cada função. O exemplo a seguir
mostra uma situação onde isto ocorre.
Exemplo 2.35.√ Considera-se o seguinte ramo da fun-

Figura 2.27: Representação de três possí- ção f (z) = z:
veis continuações analíticas da mesma fun- √
ção f (z). f1 (z) = reiθ/2 , D1 : (r > 0, 0 < θ < π) .
Uma continuação analítica de f1 (z) através do eixo real negativo e para o semi-plano inferior é:
√ π
f2 (z) = reiθ/2 , D2 : r > 0, < θ < 2π .
2
Claramente, em D1 ∩ D2 : (r > 0, π/2 < θ < π) (segundo e terceiro quadrantes), f1 (z) = f2 (z). Uma
continuação analítica de f2 através do eixo real positivo e para o semi-plano superior pode ser
definida então como
√

5π
f3 (z) = reiθ/2 , D3 : r > 0, π < θ < .
2
Claramente, agora, em D2 ∩ D3 : (r > 0, π < θ < 2π) (terceiro e quarto quadrantes), f3 (z) = f2 (z),
mas em D1 ∩ D3 : (r > 0, 0 < θ < π/2) (primeiro quadrante), f3 (z) 6= f1 (z); de fato, f3 (z) = −f1 (z).
Isto ocorre porque os três domínios circundam o ponto de ramificação na origem.
T EOREMAS DE EXISTÊNCIA E UNICIDADE

Os seguintes teoremas, apresentados sem demonstração, mostram quais são as condições
necessárias e suficientes para a existência e unicidade das continuações analíticas.
Teorema 2.28. Se uma função f (z) é analítica em todo o domínio D e f (z) = 0 em todos os pontos
de uma região R ⊂ D ou de um arco C, interior a D, então f (z) = 0 em todos os pontos de D.
Observação. Este teorema é muito importante porque, em primeiro lugar, ele garante que todas
as raízes de f (z) são isoladas. Contudo, a sua importância aqui está no fato de que ele garante a
unicidade das continuações analíticas. Sejam as funções f1 (z) e f2 (z) mencionadas na definição
2.1. Definindo-se agora a função g(z) = f1 (z) − f2 (z) em R = D1 ∩ D2 , obviamente g(z) = 0 em R;
de onde se conclui que g(z) = 0 em todo o domínio D1 ∪ D2 . Segue então o seguinte teorema de
unicidade.
Teorema 2.29. Uma função f (z) que é analítica em todo o domínio D é determinada de forma
única sobre D pelos seus valores sobre uma região, ou ao longo de um arco, contidos no interior
de D.
Exemplo. A função inteira f (z) = ez é a única que pode assumir os valores de f (x) = ex , ao
longo do eixo real. Além disso, uma vez que e−z também é inteira e ex e−x = 1 (∀x ∈ R), a
função h(x) = ex e−x − 1 é nula sobre todo o eixo real e, portanto, a única função que representa
a continuação analítica de h(x) fora do eixo real é h(z) = ez e−z − 1 = 0. Segue então que a
identidade e−z = 1/ez é válida sobre todo o plano complexo.
Corolário. Como corolário a este teorema, qualquer forma polinomial de funções fk (x) que satis-
faça a identidade
P [f1 (x), f2 (x), . . . , fn (x)] = 0
tem a sua forma mantida,
P [f1 (z), f2 (z), . . . , fn (z)] = 0,
ao longo de todo o domínio D.

Figura 2.28: Continuação analítica da função f1 (z) para a região Rn por dois caminhos distintos.
Exemplo. Dadas as funções trigonométricas sen x e cos x, estas satisfazem a forma polinomial
sen2 x+cos2 x−1 = 0. Portanto, a identidade sen2 z +cos2 z = 1 é válida sobre todo o plano complexo.
Teorema 2.30 (Teorema da monodromia). Se uma função f1 (z), definida no domínio R1 , é
continuada analiticamente a uma região Rn ao longo de dois caminhos diferentes, então as duas
continuações analíticas serão idênticas se não houver singularidades contidas entre os dois cami-
nhos.
A propriedade descrita no teorema acima
é ilustrada na figura 2.28, na qual um ponto
na região R1 é ligado a um outro ponto na re-
gião Rn por dois caminhos simples (C1 e C2 )
distintos. Os domínios R1 , R2 , . . . , Rn , . . . po-
dem ser definidos pelos raios de convergên-
cia das séries de Taylor que representam a
mesma função f (z) em diferentes regiões do
plano complexo. Se não houver pontos singu-
lares na região interna aos circulos na figura
2.28, então a continuação analítica de f (z) da
região R1 a Rn pelo caminho C1 será equiva-
lente à continuação analítica ao longo de C2 .
Portanto,


 f1 (z), em R1
Figura 2.29: Domínios de f (z) = (1 − z)−1 .



 f2 (z), em R2
.

..
f (z) = .. .

fn (z), em Rn




.. ..


. .
As funções f1 (z), f2 (z), . . . , fn (z), . . . acima são

denominadas os elementos da função analítica completa f (z).
Exemplo 2.36. Considera-se a função f1 (z) definida por
∞
X
f1 (z) = zn = 1 + z + z2 + · · · .
n=0
Sabe-se que esta série de Taylor converge na região R1 : |z| < 1 para a funçãof (z) = 1/ (1 − z), cujo
domínio é todo o plano complexo exceto o ponto z = 1. Como o domínio de f (z) se intersecciona

80 REFERÊNCIAS
com o domínio de f1 (z), esta última é a única continuação analítica de f1 (z) possível para |z| > 1
(exceto z = 1). Outras possíveis continuações analíticas de f (z) para a região à esquerda de z = 1
(ao longo do eixo real) são:
∞ n ∞ n
1 X z+1 1 X z+i
f2 (z) = (Região R2 : |z + 1| < 2) , f3 (z) = (Região R3 : |z + i| < 2) .
2 n=0 2 1 + i n=0 1 + i
A figura 2.29 ilustra estas três regiões.
R EFERÊNCIAS
ABLOWITZ, Mark J.; FOKAS, Athanassios S. Complex Variables. Introduction and Applications.
Second. New York: Cambridge, 2003. (Cambridge Texts in Applied Mathematics). 647 pp. ISBN:
978-0-521-53429-1. Disponível em: <http://www.cambridge.org/9780521534291>.
CHURCHILL, R. V.; BROWN, J. W.; VERHEY, R. F. Complex Variables and Applications. Third.
New York: McGraw-Hill, 1976. 332 pp. ISBN: 0070108552.
EISBERG, R. M. Introdução à Física Moderna. [S.l.]: Guanabara Dois, 1979. 643 pp.

3
T EORIA DE G RUPOS A BSTRATOS
STE CAPÍTULO tem o objetivo básico de colocar o leitor em contato com um dos ramos mais
E ativos da física e da matemática dos dias de hoje: a Teoria de Grupos e suas aplicações
ao estudo dos fenômenos físicos.
As origens históricas da teoria de grupos, como uma disciplina ou área da matemática, re-
montam a três áreas distintas: à teoria de números, à teoria de equações algébricas e à geome-
tria. A teoria de números obteve contribuições importantes do matemático e físico suiço Leo-
nhard Euler (1707 – 1783), juntamente com desenvolvimentos no campo da aritmética modular
oferecidos pelo matemático e físico alemão Carl Friederich Gauss (1777 – 1855), o qual tam-
bém identificou os grupos aditivos e multiplicativos de campos quadráticos. Resultados iniciais
acerca dos grupos de permutação foram obtidos pelos filósofos naturais italianos Joseph-Louis
Lagrange (1736 – 1813) e Paolo Ruffini (1765 – 1822) e pelo matemático norueguês Niels Henrik
Abel (1802 – 1829).
Contudo o termo grupo foi proposto pela primeira vez pelo matemático francês Évariste Ga-
lois (1811 – 1832), o qual estabeleceu a conexão, conhecida como teoria de Galois, entre a teoria
de grupos e a teoria de corpos abstratos. Na geometria, grupos são importantes na geometria
projetiva e para geometrias não-Euclideanas. Finalmente, os grupos de permutação foram defi-
nitivamente estabelecidos pelo matemático britânico Arthur Cayley (1821 – 1895) e pelo francês
Augustin-Louis Cauchy (1789 – 1857).
As diferentes contribuições para a teoria de grupos foram unificadas em meados de 1880.
Desde então, a mesma fomentou o surgimento de outros campos na matemática tais como a
álgebra abstrata e a teoria da representação (tratada no capítulo 5), entre outros.
A importância do estudo da Teoria de Grupos em física surgiu, basicamente, com o livro
do matemático, físico e filósofo alemão Hermann Klaus Hugo Weyl (1885 – 1955) intitulado
Gruppentheorie und QuantenmeĚanic,1 publicado em 1928, no qual o autor mostra que existe
uma íntima relação entre as leis gerais da Teoria Quântica e a Teoria de Grupos, ao observar
que todos os números quânticos, com exceção do número quântico principal n, são índices que
caracterizam as representações de grupo.
Uma das grandes aplicações práticas da Teoria de Grupos em física é vista no livro do físico
húngaro-norte-americano Eugene Paul Wigner (1902 – 1995) intitulado Gruppentheorie und ihre
Anwendung auf die QuantenmeĚanik der Atomspektren.2 Neste livro, publicado em 1944, evidencia-
se que todas as regras da espectroscopia atômica podem ser bem entendidas fazendo-se o estudo
das simetrias observadas nos resultados espectroscópicos. Neste estudo, Wigner empregou a
teoria originalmente criada por Évariste Galois em 1832.
O grande momento da aplicação em Física da Teoria de Grupos em Partículas Elementares
ocorreu em 1961, com a publicação de dois artigos independentes dos físicos: o norte-americano
Murray Gell-Mann (1929 –) e o israelense Yuval Neéman (1925 – 2006). Nestes trabalhos, ad-
mitindo que a Hamiltoniana de Interações Fortes fosse invariante pelo grupo SU(3) os autores
obtiveram, entre outros resultados, uma classificação coerente dos hádrons (usando as repre-
sentações de octetos desse grupo) e a previsão da existência de novas partículas elementares,
dentre as quais a partícula Ω− . Esta partícula foi detectada em 1964, em uma experiência sobre
o espalhamento de káons por prótons K − + p −→ Ω− + K + + K 0 .

Deve se observar que anteriormente, em 1956, o físico japonês Shoichi Sakata (1911 – 1970)
havia sem sucesso usado o grupo SU(3) para classificar as Partículas Elementares. Observe-se
ainda que em 1964 Gell-Mann e, independentemente, o físico russo-norte-americano George
Zweig (1937 –) usaram uma outra representação do SU(3) (na forma de tripletos) para prever
1 Teoria de Grupos e Mecânica Quântica.
2 Teoria de Grupos e sua Aplicação à Mecânica Quântica dos Espectros Atômicos.
81
82 3.1. Definições e classificações iniciais
a existência dos quarks. Estes até o momento não foram observados isoladamente. Um outro
grande momento da aplicação em Física da Teoria de Grupos ocorreu no começo da década de
1970 quando o físico norte-americano Nobel Kenneth Geddes Wilson (1936 – 2013) e o físico
britânico Michael Ellis Fisher (1931 –) aplicaram o Grupo de Renormalização aos fenômenos
críticos (transições de fases), retomando o que havia sido considerado por Gell-Mann e pelo
físico norte-americano Francis Eugene Low (1921 – 2007), em 1954.
De um modo geral, a aplicação da Teoria de Grupos a problemas físicos é dividida em duas
grandes áreas: considerações sobre simetria e considerações sobre problemas de autovalores.
Como exemplo do primeiro tipo, pode-se mencionar o estudo da simetria de um cristal, de
fundamental importância na Física da Matéria Condensada (Espectroscopia, Cristalografia, etc.).
No segundo tipo, um exemplo relevante é o estudo de invariâncias das equações de autovalores
resultantes de transformações de coordenadas (translações e rotações).
3.1 D EFINIÇÕES E CLASSIFICAÇÕES INICIAIS

A estrutura matemática denominada grupo faz parte de um conjunto amplo de entidades
abstratas denominadas estruturas algébricas, as quais consistem em determinados conjuntos
de objetos, para os quais estão definidas uma ou mais operações finitas, e no estudo das con-
sequentes propriedades matemáticas dessas operações sobre o conjunto. Além dos objetos de-
nominados grupos (os quais serão abordados aqui), também fazem parte deste conjunto outros
conceitos tais como semigrupo, monóide, corpo, espaço vetorial, álgebra, anel, módulo, etc. Neste
capítulo somente serão definidos e discutidos em detalhes os grupos. Algumas das outras es-
truturas algébricas existentes serão somente exemplificadas na seção 3.7.
Serão feitas inicialmente uma série de definições pertinentes à teoria de grupos, a partir das
quais as classificações básicas bem como alguns dos principais teoremas e consequências de
interesse para a física serão então apresentados e discutidos.
Definição 3.1 (Grupo). Um conjunto G, composto pelos elementos a, b, c, . . . , é denominado um

grupo frente a uma dada operação, denominada produto e representada pelo símbolo ∗, se seus
elementos satisfizerem as seguintes propriedades:
(PG 1) Condição de clausura: ∀a, b ∈ G, a ∗ b ∈ G.
(PG 2) Condição de associatividade: ∀a, b, c ∈ G, (a ∗ b) ∗ c = a ∗ (b ∗ c).
(PG 3) Elemento neutro ou unitário ou identidade: ∃I ∈ G tal que ∀a ∈ G, a ∗ I = I ∗ a = a.
(PG 4) Elemento inverso: ∀a ∈ G, ∃a−1 ∈ G tal que a ∗ a−1 = a−1 ∗ a = I.
O conjunto G pode ser representado por G = {a, b, c, . . . }, ao passo que o grupo formado pelo
mesmo frente a operação ∗ é representado por
.
G = {a, b, c, . . . ; ∗} = {G; ∗} .
Definição 3.2 (Grupo comutativo ou Abeliano). Dado um grupo G = {G, ∗}, com G = {a, b, c, . . . },
se para todos a, b ∈ G ocorre
a ∗ b = b ∗ a,
diz-se que o grupo é comutativo ou Abeliano.3
A partir das definições acima, os seguintes exercícios podem ser propostos.
Exercício 3.1. Na definição 3.1, partindo dos lados esquerdos das propriedades (PG 3) e (PG 4),
demonstre os respectivos lados direitos.
Resolução. Considera-se o produto a−1 ∗ a ∗ a−1 . Manipulando-se o mesmo, obtém-se
(2) (4)
a−1 ∗ a ∗ a−1 = a−1 ∗ a ∗ a−1 = a−1 ∗ I

(3.1)
(3)
= a−1 .
3 Em homenagem ao matemático norueguês Niels Henrik Abel (1802 – 1829).

C APÍTULO 3. Teoria de Grupos Abstratos 83
Mas a−1 ∈ G, pela propriedade (1). Assim, a partir da propriedade (4), existe um elemento c ∈ G
o qual é o inverso de a−1 , isto é, tal que
a−1 ∗ c = I.
Multiplicando-se agora a primeira e a última expressões em (3.1) à direita com o elemento c,
obtém-se −1
a ∗ a ∗ a−1 ∗ c = a−1 ∗ c = I.

Simultaneamente, o lado esquerdo deste resultado resulta em

(2) (3)
a−1 ∗ a ∗ a−1 ∗ c = a−1 ∗ a ∗ a−1 ∗ c = a−1 ∗ a ∗ I = a−1 ∗ a.

Comparando-se os dois últimos resultados, conclui-se que

a−1 ∗ a = I,
o qual é o lado direito da propriedade (4), como se queria obter.
Dado agora o produto I ∗ a,
(4) (2)
I ∗ a = a ∗ a−1 ∗ a = a ∗ a−1 ∗ a .

Empregando o resultado acima,

(3)
I ∗ a = a ∗ I = a,
o qual é o lado direito da propriedade (3), como se queria obter.
Exercício 3.2. Dado o grupo G = {a, b, . . . , I, . . . ; ∗}, mostre que o elemento identidade é único.
Demonstração. A resolução é obtida via reductio ad absurdum. Suponha, ao contrário, que exista
um outro elemento I 0 ∈ G (I 0 6= I) tal que para todo a ∈ G e pela propriedade (PG 3),
I 0 ∗ a = a ∗ I 0 = a.
Neste caso, se a = I, então
I 0 ∗ I = I.
Por outro lado, também da propriedade (PG 3),
a ∗ I = a.
Se agora for tomado a = I 0 , então
I 0 ∗ I = I 0.
Comparando-se ambos os resultados, necessariamente conclui-se que I = I 0 , contrariando a
premissa de que I 0 6= I. Portanto, o elemento I é único.
Exercício 3.3. Dado o grupo G = {G; ∗}, mostre que para todo elemento a ∈ G, o seu elemento
inverso é único.
A partir das definições e exercícios apresentados acima, algumas propriedades adicionais de
grupos podem ser demonstradas.
Propriedade 3.1 (Inverso do produto). Dado o grupo G = {G; ∗}, uma vez que para todo a ∈ G o
seu elemento inverso a−1 é único, segue então que, para a, b, . . . , y, z ∈ G,
(a ∗ b ∗ · · · ∗ y ∗ z) ∗ z −1 ∗ y −1 ∗ · · · ∗ b−1 ∗ a−1

(2)
= (a ∗ b ∗ · · · ∗ y) ∗ z ∗ z −1 ∗ y −1 ∗ · · · ∗ b−1 ∗ a−1

(4,3)
= (a ∗ b ∗ · · · ∗ y) ∗ y −1 ∗ · · · ∗ b−1 ∗ a−1

= (a ∗ b ∗ · · · ) ∗ y ∗ y −1 ∗ · · · ∗ b−1 ∗ a−1

..
.
= I.
Por conseguinte, pela propriedade (PG 1), como ambos os produtos iniciais pertencem a G, segue
de (PG 4) que a inversa de um produto é o produto dos inversos na ordem reversa, isto é,
−1
(a ∗ b ∗ · · · ∗ y ∗ z) = z −1 ∗ y −1 ∗ · · · ∗ b−1 ∗ a−1 . (3.2)

Propriedade 3.2 (Axioma da divisão). Dado o grupo G = {G; ∗}, para cada par de elementos
a, b ∈ G, existem outros elementos únicos c, d ∈ G tais que
a ∗ c = b e d ∗ a = b.
Ou seja, c = a−1 ∗ b e d = b ∗ a−1 . Em geral, c 6= d, exceto se o grupo for Abeliano.
Propriedade 3.3 (Lei do cancelamento). Dado o grupo G = {G; ∗}, se existem os elementos
a, b, c ∈ G tais que
a ∗ b = a ∗ c ou b ∗ a = c ∗ a,
então, necessariamente,
b = c.
3.1.1 C LASSIFICAÇÃO DOS GRUPOS

As definições apresentadas a seguir permitem estabelecer a classificação básica dos diferen-
tes tipos de grupos.
Definição 3.3 (Ordem do grupo). O número total de elementos de um grupo é denominada a

ordem ou a cardinalidade do grupo. Dado o grupo G = {G, ∗}, a seguinte operação que resulta
na ordem do mesmo pode ser definida:
g = ord (G) = |G| . (3.3)
Se o grupo G for finito, então g ∈ N∗ (g = 1, 2, . . . ).
Desta forma, os grupos podem ser classificados inicialmente em:
Finitos: com um número finito de elementos. Um grupo finito pode ter seus elementos organi-
zados em uma tabela de multiplicações de grupo, discutida na seção 3.2.1.
Infinitos: com um número infinito de elementos. Um grupo infinito pode ser classificado como
discreto ou contínuo.
Definição 3.4 (Grupos infinitos discretos). Um grupo infinito G é discreto se os seus elementos
forem enumeráveis, isto é, se for possível estabelecer uma relação unívoca entre cada elemento
de G com um elemento do conjunto N∗ . Um exemplo é próprio conjunto dos números inteiros
frente a operação de soma algébrica.
Definição 3.5 (Grupos contínuos). Um grupo infinito G cujos elementos são inumeráveis, mas
que podem ser identificados por um conjunto de parâmetros contínuos é denominado grupo
contínuo.
Pode-se afirmar que dois elementos do grupo estão “arbitrariamente próximos” entre si, de tal
forma que eles podem ser distinguidos através da variação de um conjunto de parâmetros {i }
(i = 1, . . . ). Ou seja, estes podem ser identificados por funções do tipo g (1 , 2 . . . ) e as operações
de produto de grupo e inversão operam sobre essas funções. Uma classificação mais moderna
para este tipo de grupo é grupo topológico.
As seguintes classificações podem ser aplicadas a um grupo contínuo:
Dimensão: o número de parâmetros necessários para a identificação dos elementos do grupo.
Compacidade: um grupo contínuo é compacto se o espaço de seus parâmetros é compacto,

ou seja, se o espaço é fechado (contém todos os seus pontos limites) e limitado (a maior
distância entre qualquer ponto do espaço e todos os demais é finita).
A partir destas definições e classificações básicas, alguns exemplos de grupos podem ser
agora apresentados.
3.1.2 E XEMPLOS DE GRUPOS

Serão apresentados agora alguns exemplos importantes de grupos, bem como as notações
mais comuns adotadas para as suas identificações.

3.1.2.1 G RUPOS INFINITOS DISCRETOS
{Z; +}: grupo formado pelo conjunto de todos os números inteiros
Z = {. . . , −2, −1, 0, 1, 2, . . . }
frente a operação de soma algébrica. Trata-se de um grupo Abeliano infinito, com I = 0 e,

para todo n ∈ Z, seu elemento inverso é simplesmente −n.
{Q; +}: o conjunto de todos os números racionais
Q = {n/m, tais que n, m ∈ Z e m 6= 0} ,
frente a operação de soma algébrica. Trata-se de um grupo Abeliano infinito.
{Q∗ ; ×}: o conjunto de todos os racionais exceto 0, frente a operação de produto algébrico.
Grupo Abeliano infinito.
3.1.2.2 G RUPOS CONTÍNUOS COMPACTOS
Grupo ortogonal O (n): grupo formado pelas matrizes n × n reais ortogonais frente a multipli-
e a sua transposta,4 então
cação matricial. Se A ∈ O (n) é uma matriz real quadrada n × n e A
AA = In , onde In é a matriz identidade.
e
Um exemplo importante do grupo O (n) é formado pelo conjunto das matrizes de rotações
ou reflexões de vetores no espaço Euclideano Rn .
Dimensão: O número total de elementos em uma matriz n × n é n2 . A condição de ortogo-
nalidade AAe = In gera n2 relações entre os elementos da matriz; contudo, como AA
e é uma
matriz simétrica, somente metade das relações envolvendo os elementos fora da diagonal
principal são
distintos. Portanto, o número de relações entre os elementos da matriz é
n2 − n2 − n /2 = n (n + 1) /2 e, assim, o número de parâmetros independentes em uma
matriz do grupo O (n) (i. e., a dimensão do grupo), é igual a
1 1
dim [O (n)] = n2 − n (n + 1) = n (n − 1) .
2 2
Grupo ortogonal especial SO (n): as matrizes do grupo O (n) possuem sempre determinante
igual a ±1. O grupo ortogonal especial SO (n) é composto somente por matrizes ortogonais
com determinante igual a +1. A dimensão do grupo SO (n) também é n (n − 1) /2.
O caso particular do grupo de rotações SO (2) é mencionado a seguir.
Grupo de rotações SO (2): o conjunto das matrizes de rotações próprias5 de um vetor no

R3 em torno do eixo z por um certo ângulo θ6 forma um grupo contínuo Abeliano com-
pacto de dimensão 1, denotado por SO (2). Os elementos deste grupo são as matrizes
2 × 2 R = R (θ), cujos componentes são
R11 = cos θ R12 = sen θ R21 = − sen θ R22 = cos θ.
O parâmetro contínuo do grupo é o ângulo −π < θ 6 π, o qual identifica cada ele-

mento do grupo e o produto de grupo é a multiplicação matricial. Dados então R1 =
R (θ1 ) , R2 = R (θ2 ) , R3 = R (θ3 ) ∈ O (2), de acordo com a definição 3.1,
1. R (θ1 ) R (θ2 ) = R (θ1 + θ2 ) ∈ O (2).
2. R3 (R2 R1 ) = (R3 R2 ) R1 .
3. Existe I = R (0) = I2 tal que I2 R (θ) = R (θ) I2 .
4. Para todo R (θ), existe R (−θ) tal que R (θ) R (−θ) = R (−θ) R (θ) = I2 .
4 Os símbolos A e ou AT serão empregados alternativamente para representar a transposta da matriz A.
5 Ver seção 6.2.1.
6 Ver figura 6.1a.

Grupo unitário U (n): grupo formado pelas matrizes n × n complexas unitárias frente a multi-
plicação matricial. Se U ∈ U (n), e U† é a sua Hermitiana conjugada, então UU† = In .
Dimensão: Dada a matriz U ∈ U (n), se uij = Re uij + i Im uij (i, j = 1, . . . , n) denotar generica-
mente os seus elementos, então o número total de parâmetros envolvidos na matriz é 2n2 .
Agora, a condição de matriz unitária leva às relações
 n
X 2
|uik | = 1



n 

k=1
X
UU† = In =⇒ uik u∗jk = δij =⇒ n
 X
k=1
uik u∗jk = 0, (i 6= j) .




k=1

Ou seja, há n relações para os casos i = j e 2 n2 − n /2 relações distintas para i 6= j.
Portanto, a dimensão do U (n) é
dim [U (n)] = 2n2 − n + n2 − n = n2 .

Grupo unitário especial SU (n): as matrizes do grupo U (n) possuem determinante com mó-
dulo unitário. O grupo unitário especial SU (n) é composto por aquelas matrizes unitárias
cujo determinante é igual a +1.
3.1.2.3 G RUPOS CONTÍNUOS NÃO COMPACTOS
{R; +}: grupo formado pelo conjunto de todos os números reais frente a operação de soma
algébrica.
Grupo Abeliano, com I = 1 e para todo x ∈ R∗ a sua inversa é simplesmente −x.
{R∗ ; ×}: grupo formado pelo conjunto de todos os números reais exceto 0, frente a operação de
produto algébrico.
Grupo Abeliano infinito, com I = 1 e para todo x ∈ R∗ , x−1 = 1/x.
{C; +}: grupo Abeliano formado pelo conjunto de todos os números complexos frente a operação
de adição de números complexos.
{C∗ ; ×}: grupo Abeliano formado pelo conjunto de todos os números complexos exceto 0, frente
a operação de produto de números complexos.
.
R3 = R3 ; + : grupo formado pelo conjunto de todas as ternas ordenadas
R3 = {(x1 , x2 , x3 ) , onde xi ∈ R (i = 1, 2, 3)} ,
frente a operação aditiva “+” tal que, dados a = (a1 , a2 , a3 ) e b = (b1 , b2 , b3 ) pertencentes a R3 ,
.
a + b = (a1 + b1 , a2 + b2 , a3 + b3 ) ∈ R3 .
Grupo Abeliano não compacto de dimensão 3, onde I = (0, 0, 0) ∈ R3 e, para cada a ∈ R3 , o

.
seu elemento inverso é −a = (−a1 , −a2 , −a3 ) ∈ R3 .
.
C 3 = C3 ; + : grupo formado pelo conjunto de todas as ternas ordenadas
C3 = {(z1 , z2 , z3 ) , onde zi ∈ C (i = 1, 2, 3)} ,
frente a operação aditiva “+” tal que, dados a = (a1 , a2 , a3 ) e b = (b1 , b2 , b3 ) pertencentes a C3 ,
.
a + b = (a1 + b1 , a2 + b2 , a3 + b3 ) ∈ C3 .
Grupo Abeliano não compacto de dimensão 3, onde I = (0, 0, 0) ∈ C 3 e, para cada a ∈ C 3 , o

.
seu elemento inverso é −a = (−a1 , −a2 , −a3 ) ∈ C 3 .
Grupo geral linear GL (n, K): grupo formado pelas matrizes n×n com componentes pertencen-
tes ao corpo 7 K (usualmente, K = R ou C) inversíveis, i. e., com determinante não nulo,
frente a multiplicação matricial. GL (n, K) é não-Abeliano se n > 1 e tem dimensão n2 .
7 Ver seção 3.7.1.2.

Grupo de Lorentz L: trata-se do grupo formado por todas as operações de isometria do espaço
de Minkowski que mantêm a origem do referencial fixa. O produto de grupo é novamente
a multiplicação matricial. Uma designação mais correta deste grupo é grupo de Lorentz
homogêneo.
O grupo de Lorentz é formado por todas as matrizes 4 × 4 L que realizam a transformação
de Lorentz8 entre dois referenciais inerciais O e O0 , deslocando-se com velocidade relativa
v e também por todas as rotações espaciais próprias em torno da origem do referencial. A
transformação de Lorentz mantém a norma do espaço tempo de Minkowski invariante, ou
seja, as matrizes L mantêm invariante a forma quadrática
L
→ t02 − x02 − y 02 − z 02
t2 − x2 − y 2 − z 2 − (c = 1) .
O grupo de Lorentz é não-Abeliano e de dimensão 6. O grupo é não-compacto porque o
espaço topológico de variação do parâmetro v não é compacto (fechado e delimitado), uma
vez que −c < v < c.
Exemplificando-se com 2 referenciais inerciais O e O0 que se deslocam ao longo dos eixos
x e x0 com velocidade relativa v, as transformações de Lorentz que mantêm invariante a
forma quadrática
L
→ t02 − x02
t 2 − x2 −
são obtidas a partir dos sistemas de equações
( (
x0 = γ (x − vt) x = γ (x0 + vt0 )
⇐⇒
t0 = γ (t − βx/c) t = γ (t0 + βx0 /c) ,
−1/2
sendo c a velocidade da luz no vácuo, γ = 1 − β 2 e β = v/c, então a matriz de transfor-
mação de Lorentz é
0
x x γ −γv
= L (v) , sendo L (v) = .
t0 t −γβ/c γ
As matrizes L (v) formam um grupo (de dimensão 1) pois, da definição 3.1, constata-se que:
1. L1 L2 = L (v1 ) L (v2 ) ∈ L.
Demonstração: realizando-se o produto,

γ1 −γ1 v1 γ2 −γ2 v2
L1 L2 =
−γ1 β1 /c γ1 −γ2 β2 /c γ2
!
β1 +β2
1 − 1+β 1 β2
c
= [γ1 γ2 (1 + β1 β2 )] β1 +β2 1 .
− 1+β 1 β2 c
1
A composição de velocidades na relatividade restrita é

v1 + v2 β1 + β2
v3 = 2
= c.
1 + v1 v2 /c 1 + β1 β2
Portanto,
γ1 γ2 (1 + β1 β2 ) = γ3 ,
ou seja,
γ3 −γ3 v3
L1 L2 = = L3 ∈ L.
−γ3 β3 /c γ3
2. L1 (L2 L3 ) = (L1 L2 ) L3 .
3. Existe I = L (0).
4. Para todo L (v) existe L (−v) tal que L (v) L (−v) = L (−v) L (v) = L (0).
Finalmente, uma maneira de se verificar a não-compacidade de L é obtida considerando-se
a rapidez η = tanh−1 (v/c). Neste caso, a matriz de Lorentz fica

cosh η − senh η
L (η) =
− senh η cosh η
e a variação do parâmetro fica mapeada em
v 7→ η =⇒ −c < v < c 7−→ R.
8 Nos textos em inglês, esta transformação é usualmente denominada boost.

88 3.2. Grupos finitos
3.1.2.4 G RUPOS FINITOS
Zn : grupo formado pelas n raízes da unidade frente a multiplicação algébrica, ou seja, Zn =

{zp (p = 0, . . . , n − 1) , ×}, sendo que os {zp } satisfazem
z n = 1 =⇒ zp = ei2pπ/n , (p = 0, . . . , n − 1) .
Grupo cíclico Cn : grupo formado a partir de um único elemento a (6= I) a partir de multiplica-
ções sucessivas a = a1 , b = a2 , c = a3 , etc.
Grupo de permutações: grupo formado pelas permutações de um conjunto de N objetos.
Grupo cristalográfico: grupo formado pelas operações de simetria de um cristal ou molécula

em uma rede cristalina.
Dentre os grupos finitos, os três últimos citados acima são particularmente importantes para
a física e serão abordados em maiores detalhes nas próximas seções.
3.2 G RUPOS FINITOS

Grupos finitos são importantes na física porque certas propriedades de sistemas físicos po-
dem ser agrupadas nestes. Um exemplo é o grupo formado pelas operações de simetria de um
cristal, o qual consiste na célula básica de uma rede cristalina em um sólido. Os grupos resul-
tantes, denominados grupos cristalográficos, serão estudados em mais detalhe na seção 3.4.
Outro grupo importante, tanto para a física quanto para a matemática, é o grupo formado
por todas as operações de permutação (ou de parte destas) possíveis em um conjunto com N
objetos. Este grupo é denominado grupo simétrico, e o mesmo será estudado em mais detalhes
na seção 3.2.3. A importância deste grupo é enfatizada pelo teorema de Cayley, o qual mostra
que o mesmo pode ser empregado para representar qualquer grupo finito.
Antes de se estudar estes grupos em particular, discute-se a construção das tabelas de mul-
tiplicação de grupo, as quais são empregadas para representar o grupo finito de forma diagra-
mática.
3.2.1 TABELA DE MULTIPLICAÇÃO DE GRUPO

Trata-se de um diagrama que representa tanto os elementos de um grupo quanto os resulta-
dos de todas operações binárias entre os elementos do mesmo.
Definição 3.6 (Tabela de multiplicação de grupo). Dado um grupo G = {G, ∗} finito, de ordem
g, formado a partir do conjunto
G = {I = a1 , a2 , a3 , . . . , ag } .
Elabora-se uma tabela quadrada contendo, nas primeiras linha e coluna, os elementos de G na
mesma ordem e, no corpo da tabela, os resultados das operações de multiplicação de grupo
realizadas de forma matricial, ou seja, de tal forma que se ai ∈ G está na i-ésima linha da tabela
e aj ∈ G está na j-ésima coluna (i, j = 1, . . . , g), então o elemento na posição ij será dado por
ai ∗ aj .
Com esta definição, a tabela de multiplicação do grupo G pode ser visualizada como
∗ I a2 a3 ··· ag
I I a2 a3 ··· ag
a2 a2 a2 ∗ a2 a2 ∗ a3 · · · a2 ∗ ag
a3 a3 a3 ∗ a2 a3 ∗ a3 · · · a3 ∗ ag
.. .. .. .. .. ..
. . . . . .
ag ag ag ∗ a2 ag ∗ a3 ··· ag ∗ ag
O conhecimento de parte de uma tabela de multiplicação pode também ser utilizado para a
dedução do restante da mesma, graças ao teorema do rearranjo, mencionado a seguir.

Teorema 3.1 (Teorema do rearranjo). Seja G = {G, ∗} um grupo finito de ordem g obtido a partir
do conjunto G = {I, a2 , a3 , . . . , ag }. Se ak ∈ G (k = 1, . . . , g), então cada elemento de G ocorre uma e
somente uma vez na sequência I ∗ ak = ak , a2 ∗ ak , a3 ∗ ak , . . . ,ak ∗ ak , . . . , ag ∗ ak .
Demonstração. Primeiro, demonstra-se que todos os elementos de G aparecem pelo menos uma
vez na sequência acima. Para tanto, se aj ∈ G, então devem existir ak , ar ∈ G (k, r = 1, . . . , g) tais
que ar = aj ∗ a−1
k . Logo, aj = ar ∗ ak deve fazer parte da sequência.
A unicidade de aj na sequência segue da lei do cancelamento (propriedade 3.3).
A sequência resultante da multiplicação de ak por todos os elementos de G, gerando nova-

mente todos os elementos do grupo, porém em outro arranjo de ordenamento, é muitas vezes
representada por
G ∗ ak = G, ou, simplesmente, Gak = G.
O teorema do rearranjo pode ser empregado para completar uma tabela de multiplicação
com vacâncias, pois, de acordo com o mesmo, nenhum elemento do grupo pode aparecer mais
de uma vez ao longo de uma linha ou de uma coluna.
Exemplo 3.1. O teorema do rearranjo é usado para completar a tabela de multiplicação do

grupo G = {I, A, B; ∗}, apresentada abaixo:
∗ I A B
I I A B
A A
B B
Resolução: De acordo com o teorema do rearranjo, o elemento na posição (2, 3): A ∗ B não pode
ser nem A nem B, pois ambos já estão presentes ao longo da linha e da coluna, respectivamente.
Logo, A ∗ B = I. Com isto, o preenchimento do restante da tabela é trivial. A tabela completa,
portanto, é:
∗ I A B
I I A B
A A B I
B B I A
Observa-se também como a multiplicação de cada elemento de G pelo grupo simplesmente reor-
ganiza o ordenamento de seus elementos: I ∗ G = {I, A, B}, A ∗ G = {A, B, I} e B ∗ G = {B, I, A}.
Definição 3.7 (Ordem do elemento do grupo). Dado o grupo G = {G; ∗} finito de ordem g,
qualquer elemento a ∈ G quando multiplicado por si mesmo, resultando nos elementos
a2 = a ∗ a, a3 = a ∗ a2 , . . . ,
irá necessariamente resultar na identidade I ∈ G, após um máximo de g − 1 multiplicações.

Representando estas operações de multiplicação por
an = a
| ∗ ·{z
· · ∗ a} (n ≥ 1) , (3.4a)
n vezes
então deve existir um natural 1 6 m 6 g, o qual é o menor número tal que am = I; ou, em outras
palavras, a identidade deve resultar após m − 1 multiplicações de a por si mesmo. Este número
é denominado a ordem do elemento do grupo. A obtenção deste número pode ser representada
pela operação
m = ord (a) = |a| ,
para todo a ∈ G.
Prosseguindo com a convenção de “potências” do elemento a ∈ G, se “potências positivas” an
(n > 0) são definidas por (3.4a), então, por extensão,
a0 = I (3.4b)
−n −1 n

a = a (3.4c)
n m n+m
a ∗a =a (3.4d)
n m nm
(a ) =a , (n, m ∈ Z) , (3.4e)
onde a−1 ∈ G é o inverso de a.

Para qualquer grupo G = {G; ∗}, a identidade I ∈ G possui sempre a ordem 1, ord (I) = 1, pois
I 1 = I. Por outro lado, se existe b ∈ G tal que b ∗ b = I, isto é, b é o seu próprio inverso, então
ord (b) = 2 sempre. Para todos os outros elementos a ∈ G (a 6= I e a 6= b), resulta ord (a) > 2.
Definição 3.8 (Período do elemento do grupo). Dado o grupo G = {G; ∗} finito de ordem g, seja
x ∈ G tal que ord (x) = n (n > 1). A sequência x, x2 , x3 , . . . , xn = I é denominada o período de x.
3.2.2 G RUPO CÍCLICO Cn

Dado o grupo G = {G; ∗} finito e de ordem g = ord (G). Dado um elemento a ∈ G (a 6= I), se
todos os seus demais elementos podem ser gerados a partir de a pela aplicação sucessiva das
multiplicações (3.4), então o conjunto de elementos G pode ser escrito como
G = a, a2 , a3 , . . . , ag−1 , I = ag

e o grupo é denominado cíclico. O elemento a é denominado o gerador de G e este fato é muitas

vezes representado por G = hai = {an | n = 1, 2, . . . , g}.
Um grupo cíclico é sempre Abeliano.
As notações usualmente empregadas para representar um grupo cíclico são: Cg , hai ou [a],
sendo g a ordem do grupo e a o seu gerador.
Definição 3.9 (Grau e base do grupo). Dado um grupo G = {G; ∗} e os elementos {a1 , . . . , am } ∈
G. O número mínimo de geradores necessários para reproduzir a tabela de multiplicações de
G é denominado o grau do grupo. Por sua vez, o menor subconjunto de G também capaz de
reproduzir a tabela de multiplicações de G é denominada uma base do grupo. Observa-se que
um grupo pode conter mais de uma base.
3.2.3 O G RUPO SIMÉTRICO Sn

Considera-se um conjunto χ composto por n objetos quaisquer. Cada elemento desse con-
junto pode ser identificado por χi (i = 1, . . . , n), por exemplo, ou simplesmente pelo índice posici-
onal i. Neste caso, pode-se escrever
χ = {χ1 , χ2 , . . . , χn } ou, simplesmente, χ = {1, 2, . . . , n} .
O grupo simétrico de grau n sobre o conjunto χ = {1, 2, . . . , n} corresponde ao grupo cujos ele-
mentos são iguais a todas as operações de permutação possíveis ao ordenamento original de
χ.
O grupo simétrico sobre um conjunto χ qualquer é denotado de diferentes maneiras na lite-
ratura: Sχ , Σχ , Sχ ou Sym (χ). Se o conjunto é finito, χ = {1, 2, . . . , n}, então o grupo simétrico de
grau n sobre χ é denotado por: Sn , Σn , Sn , ou Sym (n). Neste caso, a ordem do grupo simétrico
finito é simplesmente o número total de permutações possíveis sobre as posições dos elementos
de χ, ou seja,
ord (Sn ) = |Sn | = n!.
Dado o ordenamento original dos elementos de χ, denotado por χ = {1, 2, . . . , n}, uma opera-
ção de permutação sobre χ irá rearranjar os objetos contidos no mesmo de uma determinada
maneira. O ordenamento final obtido por esta operação será identificado por uma sequência
numérica contendo novamente os índices i = 1, . . . , n, porém num ordenamento que indica a
posição final de um dado objeto em relação à inicial.
Estas permutações podem ser representadas com um total de |Sn | operadores na forma ma-
tricial do tipo
1 2 ··· n
πp = , (3.5)
p1 p2 · · · pn
onde pj = i, com i, j = 1, . . . , n. A primeira linha de πp indica o ordenamento inicial dos elementos
de χ (antes da permutação), enquanto que a segunda linha indica o ordenamento em relação às
posições iniciais.
Há ao todo n índices pj os quais assumem valores entre 1 e n de forma excludente, ou seja,
não é possível ocorrer p1 = p2 , por exemplo. Se p1 = i, isto indica que o objeto que estava ori-
ginalmente na i-ésima posição passou a ocupar a primeira posição no novo ordenamento dos

elementos de χ. Por sua vez, p2 = ` (` = 1, . . . , n, mas ` 6= i) indica que o objeto que estava origi-
nalmente na `-ésima posição passou a ocupar a segunda posição, e assim consecutivamente.
A operação de permutação πp sobre χ pode ser interpretado como uma bijeção do tipo
πp
χ 7−→ χ,
ou seja, um mapeamento de χ sobre si mesmo. A aplicação de πp sobre χ resulta no mesmo

conjunto de objetos, porém rearranjados. Este “novo” conjunto pode ser identificado por ψ, por
exemplo, para ser distinguido de χ. Este procedimento pode ser representado por
ψ = πp χ.
Exemplo 3.2 (O grupo S3 ). Considere um conjunto de 3 objetos, χ = {1, 2, 3}. O número total de
permutações possíveis sobre χ é igual a 3! = 6. Esses operadores podem ser representados por

123 123 123
π1 = π2 = π3 =
123 132 213

123 123 123
π4 = π5 = π6 = .
231 312 321
Nota-se que π1 mantém o ordenamento original inalterado. A figura 3.1 ilustra todas essas
permutações na ordem de operadores apresentada acima.
O conjunto de operadores de permutação de 3 objetos é definido então como
.
S3 = {π1 , π2 , π3 , π4 , π5 , π6 } .
Posteriormente, no exercício 3.5, será demonstrado que este conjunto forma um grupo.
Após se realizar duas permutações consecutivas em χ, o ordenamento final pode ser descrito
na forma de um operador do tipo (3.5) através de uma composição de permutações. Se πa e πb
são dois operadores do tipo (3.5) e estes são aplicados consecutivamente sobre χ, o ordenamento
final pode ser descrito na forma de um terceiro operador πc , obtido a partir da operação
πb (πa χ) ≡ (πb ◦ πa ) χ ≡ πb πa χ = πc χ. (3.6)
Desde já chama-se a atenção que, em geral, πb ◦ πa 6= πa ◦ πb .

A composição de permutações é um caso particular de uma composição de funções bijetoras,
ou seja, a operação resultante da aplicação de uma função bijetora à imagem de uma outra
função bijetora. A composição de permutações sobre o conjunto χ pode ser representada por
π a bπ
χ 7−→ χ 7−→ χ, ou seja, χ ; πa χ ; πb (πa χ) .
Exercício 3.4. Considere o mesmo conjunto de 3 objetos, χ = {1, 2, 3} e os operadores de per-

mutação empregados no exemplo 3.2. Realize as composições π3 ◦ π2 e π2 ◦ π3 e identifique os
operadores resultantes.
Figura 3.1: As 6 permutações possíveis sobre um con- Figura 3.2: Os ordenamentos finais de χ após as com-
junto de 3 objetos. posições π3 ◦ π2 = π5 e π2 ◦ π3 = π4 .

Resolução. Realizando-se as permutações, resulta

123
(π3 ◦ π2 ) χ = π3 (π2 χ) = π3 {1, 2, 3}
132

123
= π3 {1, 3, 2} = {1, 3, 2} = {3, 1, 2} = π5 χ.
213
Ou seja, π3 ◦ π2 = π5 . Por sua vez,

123 123
(π2 ◦ π3 ) χ = π2 {1, 2, 3} {2, 1, 3} = {2, 3, 1} = π4 χ.
213 132
Ou seja, π2 ◦ π3 = π4 . A figura 3.2 ilustra estas composições.
3.2.3.1 V ERIFICAÇÃO DOS AXIOMAS DE GRUPO
O grupo simétrico Sn sobre o conjunto χ = {1, 2, . . . , n} será formado, portanto, não pelos n
objetos que compõe χ, mas sim pelos |Sn | = n! operadores de permutação πp definidos em (3.5),
frente a composição de permutações (3.6), a qual é a operação de multiplicação de grupo. Ou
seja,
Sn = {π1 , π2 , . . . , πn! ; ◦} .
Para verificar que Sn é de fato um grupo, este deve satisfazer os axiomas apresentados na
definição 3.1. Ou seja:
1. Clausura. Dados πa , πb ∈ Sn , a composição de permutações πa ◦ πb irá simplesmente gerar
um rearranjo dos elementos de χ. Portanto, πa ◦ πb ∈ Sn .
2. Associatividade. A condição de associatividade é satisfeita, porque a composição de fun-
ções bijetoras é uma operação associativa.
3. Identidade. A operação trivial de permutação

123
I= tal que Iχ = χ
123
é o elemento identidade de Sn , pois para todo π ∈ Sn , I ◦ π = π ◦ I.

4. Elemento inverso. Toda bijeção possui uma função inversa que desfaz a operação inicial.
Em consequência, para toda permutação π ∈ Sn existe um elemento π −1 ∈ Sn tal que
π −1 ◦ π = π ◦ π −1 = I.
Exercício 3.5. Demonstre que o conjunto S3 forma um grupo, obtenha a ordem de cada ele-
mento e os períodos do grupo e construa a sua tabela de multiplicação.
Resolução. Os elementos de S3 já foram identificados no exemplo 3.2, com π1 = I. Realizando-se
todas as composições de permutações possíveis, é fácil verificar que
II = I π 2 I = π2 π3 I = π3 π4 I = π4 π5 I = π5 π6 I = π6
Iπ2 = π2 π2 π2 = I π3 π2 = π5 π4 π2 = π6 π5 π2 = π3 π6 π2 = π4
Iπ3 = π3 π2 π3 = π4 π3 π3 = I π4 π3 = π2 π5 π3 = π6 π6 π3 = π5
Iπ4 = π4 π2 π4 = π3 π3 π4 = π6 π4 π4 = π5 π5 π4 = I π6 π4 = π2
Iπ5 = π5 π2 π5 = π6 π3 π5 = π2 π4 π5 = I π5 π5 = π4 π6 π5 = π3
Iπ6 = π6 π2 π6 = π5 π3 π6 = π4 π4 π6 = π3 π5 π6 = π2 π6 π6 = I.
Portanto, as condições de clausura, associatividade e existência da identidade são satisfeitas.

Os elementos inversos são os seguintes:
I −1 = I π2−1 = π2 π3−1 = π3 π4−1 = π5 π5−1 = π4 π6−1 = π6 .
A condição de existência dos elementos inversos foi verificada. As ordens dos elementos de S3
são:
|I| = 1 |π2 | = 2 |π3 | = 2 |π4 | = 3 |π5 | = 3 |π6 | = 2.

Assim, os períodos de S3 são:
I, {π2 , I} , {π3 , I} , {π4 , π5 , I} , {π6 , I} .
Finalmente, a tabela de multiplicação de grupo é:

◦ I π2 π3 π4 π5 π6
I I π2 π3 π4 π5 π6
π2 π2 I π4 π3 π6 π5
π3 π3 π5 I π6 π2 π4
π4 π4 π6 π2 π5 I π3
π5 π5 π3 π6 I π4 π2
π6 π6 π4 π5 π2 π3 I
Observe como o teorema do rearranjo é obedecido pela tabela acima.
3.2.3.2 N OTAÇÃO DE CICLOS
Como o número total de operações de permutação possíveis em um conjunto de n objetos é

igual a n!, a ordem do grupo Sn cresce muito rapidamente com n. A notação de ciclos dos ope-
radores π ∈ Sn simplifica a identificação das operações possíveis e também facilita a construção
de seus subgrupos.
T RANSPOSIÇÕES . Uma transposição é uma permutação que atua somente sobre dois obje-
tos do conjunto χ, com a qual estes objetos têm suas posições trocadas no ordenamento original
de χ, mantendo os demais objetos fixos.
Dado o conjunto χ de n objetos, a transposição (mk) (m, k 6 n) troca a posição do m-ésimo
objeto pela posição do k-ésimo objeto, e vice-versa. Esta notação simplifica a representação do
operador de permutação quando este realiza somente uma transposição. Ou seja,

12···m··· k ···n
se π = , pode-se escrever π = (mk) .
12··· k ···m···n
A composição de transposições entre (mk) e (r`) (com m, k, r, ` 6 n) pode ser representada por
(mk) ◦ (r`) ou, simplesmente, (mk) (r`), sempre mantendo a convenção direita → esquerda na
ordem das permutações. É possível verificar-se que o grupo Sn pode ser completamente gerado
através de composições das n − 1 transposições (12), (1, 3), . . . , (1, n).
Se uma permutação consistir em um número par de transposições, ela é denominada uma
permutação par. Se consistir em um número ímpar, é chamada de permutação ímpar. A compo-
sição de duas permutações pares ou ímpares resulta em uma permutação par, ao passo que a
composição de uma permutação par com uma permutação ímpar resulta em uma permutação
ímpar.
Exemplo 3.3. Os elementos de S3 definidos no exemplo 3.2 podem ser construídos pelas trans-
posições (12) e (13) da seguinte maneira:
π1 = (12) (12) π2 = (12) (13) (12) π3 = (12)

π4 = (12) (13) π5 = (13) (12) π6 = (13) .
Portanto, π1 = I, π4 e π5 são permutações pares, enquanto que π2 , π3 e π6 são permutações

ímpares.
C ICLOS . Dados o conjunto de n objetos χ = {χ1 , . . . , χn } e o grupo simétrico Sn , composto por

todas as permutações de χ. Uma particular permutação aplicada a χ é denominada um ciclo
se esta atua sobre um subconjunto σ ⊂ χ, permutando as posições dos elementos de σ de uma
maneira cíclica, mantendo os demais elementos de χ \ σ fixos. O conjunto σ é denominado a
órbita do ciclo.
Dado o grupo Sn , de ordem n!, um determinado elemento π ∈ Sn pode ser representado
genericamente por
1 2 ··· i ··· n
π= .
p1 p2 · · · pi · · · pn

Define-se então a operação π (i) = pi atuando sobre o i-ésimo objeto em χ. Ou seja, π (1) = p1 ,
π (2) = p2 , . . . , π (n) = pn . Um ciclo de extensão k é uma permutação π ∈ Sn para a qual existe
um elemento x ∈ χ tal que os únicos elementos movidos pela permutação são x, π (x), π 2 (x), . . . ,
π k (x) = x.
Como exemplo, observa-se que a permutação ψ ∈ S5 dada por

12345
ψ=
42135
é um ciclo de extensão 3, uma vez que, dado χ = {1, 2, 3, 4, 5},
ψχ ψ2 χ ψ3 χ
χ 7−→ {4, 2, 1, 3, 5} 7−→ {3, 2, 4, 1, 5} 7−→ {1, 2, 3, 4, 5} .
Ou seja, ψ (1) = 4, ψ 2 (1) = ψ (4) = 3 e ψ 3 (1) = ψ (3) = 1. Da mesma forma, ψ (3) = 1, ψ 2 (3) =
ψ (1) = 4 e ψ 3 (3) = ψ (4) = 3 e ψ (4) = 3, ψ 2 (4) = ψ (3) = 1 e ψ 3 (4) = ψ (1) = 4. Observa-se que
somente os objetos 1, 3 e 4 são permutados por ψ e de uma maneira cíclica, sendo os objetos 2
e 5 mantidos fixos.
Este ciclo pode ser denotado por (143), onde a ordem dos objetos indica a ordem sucessiva de
trocas realizadas no sentido direita 7−→ esquerda, ou seja,
4 7−→ 1, 3 7−→ 4, 1 7−→ 3,
fechando o ciclo. Porém, o ordenamento dos objetos no ciclo também pode ser trocado ciclica-
mente, ou seja, (143) = (431) = (314).
Um ciclo deve ter uma extensão k > 2, pois k = 1 significa que o objeto não é trocado de
lugar. Entretanto, para a permutação ψ acima, pode-se acrescentar os símbolos (2) e (5), os
quais indicam que estes objetos permanecem fixos. Um cíclo de extensão 2 é uma transposição,
como discutida acima.
Dois ciclos são disjuntos se estes movem subconjuntos disjuntos de elementos de χ. Como
dois ciclos disjuntos comutam, todos os elementos de Sn podem ser escritos como composições
de ciclos disjuntos.
Portanto, uma outra notação mais compacta para um ciclo ψ ∈ Sn , denotada notação por
ciclos, indica explicitamente as trocas cíclicas de posições dos objetos de χ. Por exemplo, para o
ciclo ψ ∈ S5 definido acima,
ψ = (143) (2) (5) = (2) (5) (143) = (2) (143) (5) = (143) ,
sendo que a última notação omite os objetos que permanecem fixos. O elemento identidade de
Sn pode ser representado por I = (1) (2) · · · (n) ou simplesmente por I = ().
Como qualquer permutação arbitrária, um ciclo de extensão maior que 2 sempre pode ser de-
composto em uma composição de ciclos menores de diversas formas. Sendo ζ = (i1 i2 i3 . . . ik−1 ik ) ∈
Sn um ciclo de extensão k (2 < k 6 n, ij = 1, . . . , n, j = 1, . . . , k), as seguintes propriedades são
válidas:
• O ordenamento das posições em ζ pode ser alterada de forma cíclica k − 1 vezes:
ζ = (i1 i2 i3 . . . ik−1 ik ) = (i2 i3 . . . ik−1 ik i1 ) = · · · = (ik i1 i2 i3 . . . ik−1 ) .

| {z }
k termos
• O ciclo ζ é igual à composição de dois ciclos, os quais possuem em comum a posição ij . Um

ciclo contém as posições 1 até j, enquanto que o outro ciclo parte de j e contém as posições
restantes. A composição de ciclos menores é então realizada na ordem inversa:
ζ = (i1 . . . ij . . . ik ) = (ij . . . ik ) (i1 . . . ij ) .
• Um ciclo de extensão maior que 2 sempre pode ser expresso como a composição de trans-
posições que possuem como posição em comum i1 ou ik . Ou seja, o ciclo ζ pode ser
decomposto: 
(i1 i2 ) (i1 i3 ) · · · (i1 ik )

ζ = (i1 i2 i3 . . . ik ) = ou

(i1 ik ) (i2 ik ) · · · (ik−1 ik ) .


• Dada a permutação ζ, a permutação inversa ζ −1 , tal que ζ ◦ ζ −1 = ζ −1 ◦ ζ = I, é

ζ −1 = (ik ik−1 . . . i2 i1 ) .
• A paridade do ciclo é igual é obtida diretamente de sua extensão. Se Pζ é a paridade da

permutação ζ, então (
k−1 +1, permutação par
Pζ = (−1) =
−1, permutação ímpar.
• O elemento identidade é sempre uma permutação par.
Exemplo 3.4. Os elementos de S3 dados no exemplo 3.2 podem ser representados na notação
de ciclos por:
π1 = (1) (2) (3) = () π2 = (1) (23) = (23) π3 = (3) (12) = (12)
π4 = (123) = (12) (13) π5 = (132) = (13) (12) π6 = (2) (13) = (13) .
Exercício 3.6. Considere as seguintes permutações contidas em S6 :

123456 123456
θ= φ= .
256143 453621
Expresse estes elementos na notação por ciclos, bem como a sua composição θ ◦ φ.
3.3 S UBGRUPOS , CLASSES LATERAIS E DE CONJUGA -

ÇÃO
Nesta seção serão discutidos alguns teoremas de subdivisões de um grupo finito genérico e
suas consequências. Contudo, as definições apresentadas e suas consequências podem também
ser aplicadas a grupos infinitos, o que será feito em seções posteriores.
3.3.1 S UBGRUPOS
A principal subdivisão possível de um grupo é um subgrupo do mesmo.
Definição 3.10 (Subgrupo). Dado um grupo G = {G; ∗}, um subgrupo H de G é formado a partir
de um subconjunto H ⊆ G que forma um grupo sob o mesmo produto de grupo ∗. Isto é, o
conjunto H deve satisfazer os axiomas de grupo (definição 3.1). Nestas condições o subgrupo
H = {H; ∗} é denotado por H ⊆ G. O grupo G é denominado o sobregrupo de H.
Um subgrupo H é denominado próprio se H ⊂ G. Por outro lado, qualquer grupo G possui
dois subgrupos triviais ou impróprios: H = {I; ∗} ou H = G.
Dado o grupo G = {G; ∗} e um subgrupo H ⊆ G, algumas propriedades simples de subgrupos
podem ser destacadas:
• Se I ∈ G é o elemento identidade, então, necessariamente, I ∈ H.
• Se G é Abeliano, então H também o é. A recíproca não é verdadeira.
• Dado qualquer elemento a ∈ G de ordem n = |a|, o período de a (definição 3.8) forma o
subgrupo cíclico
hai ⊆ G : hai = a, a2 , . . . , an = I; ∗ .

• O conjunto de elementos de G que pertencem a todos os subgrupos de G forma um subgrupo

por si mesmo, embora este conjunto possa ser composto somente pela identidade.
Com relação aos subgrupos cíclicos próprios formados a partir dos períodos de determinados
elementos do grupo, uma nova definição é importante, a qual explicita o número mínimo de
geradores capazes de reproduzir o sobregrupo.
Dado um grupo G = {G; ∗} e o elemento a1 ∈ G que gera o subgrupo cíclico próprio ha1 i ⊆ G.
Se ha1 i ⊂ G, então deve existir outro elemento a2 ∈ G (a2 6= I), mas a2 ∈ / ha1 i, tal que ha2 i ⊂ G. Se
ha1 i ∪ ha2 i =
6 G, então deve existir a3 ∈ G (a3 6= I) tal que a3 ∈
/ ha1 i ∪ ha2 i, o qual gera o subgrupo
próprio ha3 i ⊂ G. E assim por diante, até que existam m subgrupos próprios hai i (j = 1, . . . , m)
tais que ha1 i ∪ ha2 i ∪ · · · ∪ ham i = G.

96 3.3. Subgrupos, classes laterais e de conjugação
E XEMPLOS DE SUBGRUPOS
Serão apresentados alguns exemplos de subgrupos obtidos a partir dos exemplos de grupos
apresentados até o momento.
Grupo de permutações Pnm . Dado o grupo simétrico Sn um subgrupo próprio Pnm ⊂ Sn é de-
nominado um grupo de permutações de m objetos se m < n ou seja, a ordem de Pnm deve
ser menor que a ordem de Sn .
Grupo alternante An . Dado o grupo simétrico Sn , para n > 2, sempre existirá um subgrupo
próprio denominado alternante, o que é composto pelas permutações pares de Sn . A ordem
de An é |An | = n!/2. Como I ∈ G é sempre uma permutação par, o conjunto das permutações
ímpares não forma um subgrupo de Sn .
Exemplo 3.5 (Subgrupos de S3 ). Dados os elementos de S3 identificados no exemplo 3.2, suas

paridades foram obtidas no exemplo 3.3. Portanto,
A3 = π4 , π5 = π42 , I = π43 .

No exercício 3.5 foi construída a tabela de multiplicação de S3 . A partir desta, pode-se obter
os grupos de permutações hπ2 i = {π2, I}, hπ3 i = {π3 , I} e hπ6 i = {π6 , I}.
Portanto, o grupo S3 é de grau 4 e sua base é o conjunto {π2 , π3 , π4 , π6 }.
Exercício 3.7. Mostre que o conjunto:
e = () , a = (12) , b = (34) , c = a ◦ b = (12) (34)
forma um subgrupo de permutação de S4 .
3.3.2 C LASSES LATERAIS E O TEOREMA DE L AGRANGE

Uma classe lateral 9 é um outro subconjunto importante de um grupo. Porém, de forma dis-
tinta a um subgrupo, os elementos de uma classe lateral não necessariamente satisfazem os
axiomas de grupo. Contudo, a identificação das classes laterais de um grupo fornece informa-
ções importantes quanto aos subgrupos do mesmo.
Grupos de ordens 1 – 3 não possuem subgrupos próprios. Isto somente ocorre para grupos
de ordem maior ou igual a 4. Dado um grupo de ordem g, a existência ou não de subgrupos
próprios é determinada pelo teorema de Lagrange, o qual será exposto a seguir, após a definição
das classes laterais.
Dado um grupo G = {G; ∗} de ordem g e com elemento identidade I, que contém pelo menos
um subgrupo próprio H = {H; ∗} (H ⊂ G), de ordem h (h < g). Denota-se o conjunto H por
H = {H1 , H2 , . . . , Hh } , sendo que Hj = I para algum j = 1, . . . , h.
Seja o elemento a tal que a ∈ G, mas a ∈

/ H. Formam-se então dois novos conjuntos através das
multiplicações de a por todos os elementos de H. Estas multiplicações podem ser realizadas pela
esquerda ou pela direita; desta forma, os novos conjuntos serão respectivamente representados
por
.
aH = {a ∗ H1 , a ∗ H2 , . . . , a ∗ Hh }
.
Ha = {H1 ∗ a, H2 ∗ a, . . . , Hh ∗ a} .
Deve ser enfatizado aqui que, em geral, a ∗ Hj 6= Hj ∗ a. Definem-se então as seguintes classes
laterais.
Definição 3.11 (Classes laterais). Dado um grupo G = {G; ∗} de ordem g, que contém pelo
menos um subgrupo próprio H = {H; ∗} (H ⊂ G), de ordem h (h < g). Seja o elemento a tal que
a ∈ G, mas a ∈
/ H. Então,
aH = {a ∗ Hj : j = 1, . . . , h} é uma classe lateral à esquerda de H em G

Ha = {Hj ∗ a : j = 1, . . . , h} é uma classe lateral à direita de H em G.
9 Em inglês: coset. Este termo será usado como designação compacta de classe lateral.

A importância na formação das classes laterais reside no seguinte teorema.
Teorema 3.2 (Teorema de Lagrange). Seja G = {G; ∗} um grupo finito de ordem g. Seja H =
{H; ∗} um subgrupo de G de ordem h. Então, a ordem de H é um divisor da ordem de G, ou seja,
g
= m, onde m ∈ N \ {0} ,
h
onde m é denominado o índice do subgrupo H sob o grupo G.
Demonstração. Dados o grupo G = {G; ∗} de ordem g e com elemento identidade I, e um subgrupo

H = {H; ∗} de ordem h. Se H é um subgrupo impróprio, então h = 1 ou h = g e o teorema é
trivialmente satisfeito.
Se H é um subgrupo próprio de G, então existe pelo menos um elemento a1 ∈ G tal que a1 ∈ / H.
Forma-se então a classe lateral a1 H, por exemplo. Se H∪a1 H 6= G, ou seja, se H e o coset a1 H não
contêm todos os elementos de G, então existe pelo menos um outro elemento a2 ∈ G mas tal que
a2 ∈/ H e a2 ∈ / a1 H. Forma-se então um segundo coset a2 H = {a2 H1 , . . . , a2 Hh }, cujos elementos
não estão contidos nem em H nem em a1 H. Verifica-se então se H ∪ a1 H ∪ a2 H = G. Se isto não
for satisfeito, o processo é continuado até que se forme um conjunto de classes laterais {aj H}
(j = 1, . . . , k, k > 1) tais que
H ∪ a1 H ∪ a2 H ∪ · · · ∪ ak H = G.
A operação acima em teoria de grupos é escrita como
H + a1 H + a2 H + · · · + ak H = G,
onde, neste contexto, a operação “+” corresponde à união de conjuntos. Da mesma forma,
H + Ha1 + Ha2 + · · · + Hak = G.
Como H e todas as classes laterais {aj H} contêm um número de elementos igual a h, então
g
(k + 1) h = g =⇒ = m ∈ N \ {0} .
h
No teorema de Lagrange, o número m é denominado o índice do subgrupo H sob o grupo

G. A partir do teorema de Lagrange, o seguinte corolário pode ser obtido.
Corolário 3.1 (Lagrange). Seja G = {G; ∗} um grupo finito de ordem g. Seja a ∈ G um elemento
de ordem n. Então,
g
= m ∈ N \ {0} , para todo a ∈ G.
n
Exercício 3.8. Verifique o teorema de Lagrange para o grupo S3 , usando o subgrupo A3 , e mostre
como S3 é formado pela união de A3 com suas classes laterais.
Resolução. Como |S3 | = 3! = 6, os únicos subgrupos possíveis têm ordens 1, 2, 3 e 6. Os
elementos de S3 foram identificados no exemplo 3.2, enquanto que os elementos de A3 foram
obtidos no exemplo 3.5. Os elementos que não pertencem a A3 são π2 , π3 e π6 . A tabela de
multiplicações de S3 foi deduzida no exercício 3.5. Formam-se então os cosets:
π2 A3 = {π2 , π3 , π6 } , π3 A3 = {π3 , π6 , π2 } , π6 A3 = {π6 , π2 , π3 } .
Ou seja,
S3 = A3 + π2 A3 = A3 + π3 A3 = A3 + π6 A3 .
Nota-se que os três cosets são o mesmo, pois A3 ∪ π2 A3 = S3 . Portanto, os subgrupos de S3 são:
{I} , hπ2 i , hπ3 i , hπ6 i , A3 , S3 .
O exercício a seguir mostra como o teorema de Lagrange pode ser usado para se determinar
a tabela de multiplicação de um grupo finito.

Exercício 3.9. Obtenha as tabelas de multiplicação dos possíveis grupos de ordem 6 a partir do
teorema de Lagrange.
Resolução. Como g = 6, segue do corolário 3.1 que a ordem de qualquer um de seus elementos
é um divisor de g, ou seja, 1, 2, 3 ou 6. A primeira estrutura possível consiste em um grupo
cíclico cujo gerador é o elemento a, ou seja, G = hai = a, a2 , a3 , . . . , a5 , a6 = I .
Para verificarmos outras estruturas, assume-se que não há nenhum elemento de ordem 6.
Suponha então que o elemento a seja agora de ordem 3. Neste caso, G possui o subgrupo
hai = a, a2 , I . Necessariamente então G deve conter um outro elemento b ∈
/ hai, com o qual
pode-se construir a classe lateral b hai = b, ba, ba2 . Ou seja, G = I, a, a2 , b, ba, ba2 . Agora, a
ordem de b pode ser 2 ou 3. Se |b| = 3, o elemento b2 deve ser um dos listados anteriormente,
exceto I. Além disso, as possibilidades b2 = b, ba ou ba2 implicam em b = I, a ou a2 , ou que
contradiz a hipótese de que b ∈ / hai. Por outro lado, a possibilidade b2 = a implica ba = I e
2 2 2
b = a implica ba = I, o que também contradiz a hipótese. Portanto, necessariamente, |b| 6= 3,
implicando que |b| = 2. Estas conclusões já permitem a obtenção dos termos em azul na tabela
de multiplicação abaixo. Agora, pelo teorema do rearranjo, ab = ba ou ba2 . A hipótese ab = ba
2 3 4 5 6
leva a: (ab) = (ab) (ab) = (ab) (ba) = a2 , (ab) = a2 (ab) = b, (ab) = a, (ab) = ba2 e (ab) = I, o que
2
contraria a hipótese de que G não é cíclico. Portanto, ab = ba , o que leva aos demais termos (em
vermelho) da tabela de multiplicação.
I a a2 b ba ba2
2 2
a a I ba b ba
a2 I a ba ba2 b
b ba ba2 I a a2
ba ba2 b a2 I a
2
ba b ba a a2 I
O teorema de Lagrange também pode ser empregado para a decomposição de grupos infinitos,
como mostra o exemplo a seguir.
Exemplo 3.6. Seja G = {Z; +} e H ⊂ G tal que
H = {4n : n ∈ Z; +} = {. . . , −8, −4, 0, 4, 8, . . . ; +} .
Então, pode-se construir os cosets
(1 + H) = {. . . , −7, −3, 1, 5, 9, . . . } = {4n + 1 : n ∈ Z} ,

(2 + H) = {. . . , −6, −2, 2, 6, 10, . . . } = {4n + 2 : n ∈ Z} ,
(3 + H) = {. . . , −5, −1, 3, 7, 11, . . . } = {4n + 3 : n ∈ Z} ,
de tal forma que

G = H + (1 + H) + (2 + H) + (3 + H) ,
pois (4 + H) = {4n + 4 : n ∈ Z} = H. Portanto, H possui índice 4 em G.
3.3.3 C LASSES DE CONJUGAÇÃO

Nas seções anteriores verificou-se como um grupo pode ser subdividido em subgrupos ou em
classes laterais. Verificou-se também que há mais de uma maneira de se dividir um grupo, de
forma consistente com o teorema de Lagrange. Como resultado, um determinado elemento do
grupo pode resultar em diferentes conjuntos, dependendo de qual subgrupo é usado para se
construir as classes laterais.
Deve existir então uma maneira de se particionar um grupo qualquer de tal forma que os
subconjuntos resultantes sejam compostos por elementos que possuam algum tipo de “afini-
dade” entre si. Uma maneira de se realizar este particionamento ordenado do grupo é através
das classes de conjugação.
Definição 3.12 (Relação de equivalência). Uma dada relação binária “∼” sobre um conjunto
S é denominada uma relação de equivalência sobre S se e somente se, para quaisquer elementos
a, b, c ∈ S, as seguintes propriedades são satisfeitas:
1. Reflexividade: a ∼ a.
2. Simetria: Se a ∼ b então b ∼ a.

3. Transitividade: Se a ∼ b e b ∼ c, então a ∼ c.
Uma particular relação de equivalência pode ser empregada para particionar um grupo em
classes, tais que um determinado elemento do grupo pertence a somente uma classe e todos os
membros dessa classe são equivalentes entre si.
Existem várias notações distintas para uma relação de equivalência. Dado o conjunto S e o
elementos a, b ∈ S, se estes elementos são equivalentes entre si com respeito a uma dada relação
de equivalência R, isto pode ser representado por a ∼ b ou a ≡ b, se não houver ambiguidade
quanto à relação de equivalência, ou, em caso contrário, como a ∼R b, a ≡R b ou ainda aRb.
Alguns exemplos de relações de equivalência:
• ∼: “É igual a” sobre o conjunto R.
• ∼: “Têm o mesmo aniversário” sobre um conjunto de pessoas.
• ∼: “É congruente a” sobre o conjunto de todos os triângulos.
• ∼: “Têm a mesma imagem da função” sobre o conjunto dos elementos do domínio da

função.
• ∼: “Têm o mesmo cosseno” sobre o conjunto de todos os ângulos.
Percebe-se então que dado um conjunto S qualquer, nem sempre é possível determinar uma
relação de equivalência entre todos os seus elementos. Da mesma forma, se dois elemento de S
são equivalentes, os demais elementos não necessariamente são equivalentes aos dois primeiros.
Portanto, faz-se necessária a definição de uma classe de equivalência, a seguir.
Definição 3.13 (Classe de equivalência). Dado um conjunto S e o elemento a ∈ S, a classe de

equivalência de a frente a relação de equivalência R é definida como o conjunto [a]R tal que
1. [a]R = {b ∈ S | a ∼R b}.
2. Todo elemento a ∈ S pertence a exatamente uma classe.
Quando não há ambiguidade, a classe de equivalência do elemento a pode ser denotada

simplesmente por [a] ou Ca .
A propriedade (2) na definição de classe de equivalência é, na verdade, uma consequência
da definição da mesma. Para demonstrar isso, seja a ∈ S e [a] a sua classe de equivalência.
Claramente, a ∈ [a] por reflexividade. Supõe-se agora que exista um outro elemento b ∈ S,
formando a classe [b], mas tal que a ∼ b. Se c ∈ S é tal que c ∈ [b], então b ∼ c. Porém, por
transitividade, a ∼ c, o que significa que c ∈ [a]. De forma inversa, pela lei de reflexividade b ∼ a;
então, se c ∈ [a], isto implica que c ∈ [b]. Ou seja, necessariamente [a] = [b].
A partir da definição de classe de equivalência, o seguinte corolário pode ser demonstrado:
Corolário 3.2. Dados o conjunto S e os elementos a, b ∈ S, com asTclasses de equivalência [a]R e

[b]R frente a relação de equivalência R. Então ou [a]R = [b]R ou [a]R [b]R = ∅ e a coleção de todas
as classes Ci é uma partição de S, ou seja, todo elemento de S pertence a uma e somente uma
classe de equivalência.
Demonstração. Supõe-se inicialmente que [a]R e [b]R são subconjuntos distintos, mas com pelo
menos um elemento c em comum. Então, a ∼ c e b ∼ c e pelas leis de simetria e transitividade
a ∼ b. Contudo, isto implica
T que [a]R = [b]R , o que contradiz a hipótese de que os conjuntos são
distintos. Portanto, [a]R [b]R 6= ∅.
Por outro lado, dadas as classes [a]R e [b]R , qualquer outro elemento c ∈ S ou está em uma
das classes já definidas ou constitui uma nova classe. Este processo pode ser seguido até que as
coleção de todas as classes de equivalência exaurem S, i. e., todo elemento de S está em alguma
classe.
Até este momento, o tipo de relação de equivalência é geral. Para a teoria de grupo em par-
ticular, uma relação de equivalência importante é aquela que define uma classe de conjugação,
através de relações de conjugação entre seus elementos.

Definição 3.14 (Conjugação). Dado um grupo G = {G; ∗}, dois elementos a, b ∈ G são ditos
conjugados se existe um elemento c ∈ G tal que10
c−1 ∗ a ∗ c = b.
Diz-se também que b é o equivalente de a, ou que b é o transformado de a por c.

A importância dos elementos conjugados em um grupo está no fato de que estes pertencem
a uma classe de equivalência, de acordo com as definições 3.12 e 3.13. Ou seja, se a, b ∈ G são
conjugados entre si, pode-se dizer que a ∼ b.
Para verificar que a condição de conjugação realmente consiste em uma relação de equiva-
lência, é necessário que satisfaça os axiomas da definição 3.12, a saber:
1. Reflexividade: a ∼ a, pois dado o elemento identidade I ∈ G, I −1 aI = IaI = a.

2. Simetria: se a ∼ b, então existe c ∈ G tal que b = c−1 ac. Portanto, existe c−1 ∈ G tal que
−1 −1 −1
c−1 b c−1 = c−1 a cc−1 = a.

c
Ou seja, a ∼ b implica em b ∼ a.
3. Transitividade: se a ∼ b e b ∼ c, então existem d, e ∈ G tais que b = d−1 ad e c = e−1 be.
Portanto,
−1
c = e−1 d−1 ad e = e−1 d−1 a (de) = (de) a (de) ,

−1
de acordo com a propriedade (3.2) do inverso do produto. Como necessariamente de, (de) ∈
G, isto implica em c ∼ a.
Estes resultados estabelecem que a conjugação entre dois elementos do grupo é uma relação
de equivalência. Em consequência, estes elementos pertencem a mesma classe de equivalência,
agora denominada classe de conjugação.
Definição 3.15 (Classe de conjugação). Dado o grupo G = {G; ∗} e o elemento a ∈ G, o conjunto
[a] ≡ Ca = b−1 ∗ a ∗ b, ∀b ∈ G

forma uma classe de equivalência, denominada classe de conjugação de a.

Algumas consequências importantes desta definição devem ser mencionadas:
• O elemento a ∈ G pertence à sua própria classe de conjugação, pois escolhendo b = a,
a−1 ∗ a ∗ a = a; ou seja, a ∈ [a].
• Se a, b ∈ G são tais que a ∼ b, então [a] = [b]. Isto é uma consequência direta do corolário
3.2.
• Se a, b ∈ G são tais que a b, então [a] 6= [b]. Também uma consequência do corolário 3.2.
• Se o elemento a é tal que am = I, então todos os elementos de Ca têm a mesma ordem.
• Se [I] é uma classe de conjugação contendo o elemento identidade I ∈ G, então, para todo
a ∈ G,
a−1 ∗ I ∗ a = I.
Ou seja, [I] = {I}; a classe de conjugação de I contém somente este elemento.
• Se a ∈ G está em uma classe por si próprio, então a conjugação c = b−1 ∗ a ∗ b para todo
b ∈ G deve necessariamente implicar que c = a. Mas, como
a = b ∗ b−1 ∗ a ∗ b ∗ b−1 = b ∗ b−1 ∗ a ∗ b ∗ b−1 = b ∗ c ∗ b−1 = b ∗ a ∗ b−1 ,

conclui-se que a ∗ b = b ∗ a para todo b ∈ G. Portanto, a comutação de a com todos os

elementos de G é uma condição necessária e suficiente para que [a] = {a}. Isto ocorre com
I ∈ G, mas ocorre também em um grupo Abeliano; ou seja, cada elemento deste grupo
forma uma classe por si próprio.
10 Alguns textos definem a operação de conjugação como b = c ∗ a ∗ c−1 , a qual é equivalente.

Teorema 3.3 (Centro do grupo). Seja o grupo G = {G; ∗}. Dado o conjunto S ⊆ G, composto pelos
elementos de G que formam classes por si próprios, este conjunto forma um subgrupo Abeliano de
G, denominado o centro do grupo.
Demonstração. Para todo grupo G, existe pelo menos um elemento em S que forma uma classe
por si próprio: o elemento identidade. Portanto, I ∈ S. Se este é o único elemento em S, então o
subgrupo é Abeliano.
Se houver pelo menos um outro elemento de G que forma uma classe em si próprio, então
S possui pelo menos dois elementos. Assim, se s1 , s2 ∈ S, então s1 b = bs1 e s2 b = bs2 , para todo
b ∈ G. Portanto,
1. Clausura: (s1 s2 ) b = s1 (bs2 ) = b (s1 s2 ); ou seja, s1 s2 ∈ S.

2. Elemento inverso: Se s1 b = bs1 , então s−1 −1 −1 −1 −1 −1
1 (s1 b) s1 = s1 (bs1 ) s1 implica em bs1 = s1 b; ou
−1
seja, s1 ∈ S.
3. Grupo Abeliano: s1 s2 = s1 bb−1 s2 = bs1 s2 b−1 = bs2 s1 b−1 = s2 s1 .
3.3.4 S UBGRUPOS INVARIANTES E GRUPO FATOR

A partir das definições e propriedades das classes de conjugações, é possível construir-se
uma classe importantes de subgrupos. As definições a seguir pertencem a essa classe.
Definição 3.16 (Subgrupo conjugado). Dados um grupo G = {G; ∗} e um subgrupo H ⊆ G. A
partir de qualquer elemento a ∈ G, pode-se formar o conjunto
.
a−1 Ha = a−1 ∗ h ∗ a, ∀h ∈ H ,

o qual é também um subgrupo de G, denominado subgrupo conjugado de H em G.

Tomando diversos elementos distintos de G, é possível formar-se vários subgrupos conjuga-
dos distintos. Dentre os possíveis subgrupos conjugados, pode existir um tipo especial para o
qual a−1 Ha = H, para todo a ∈ G. Este é denominado um subgrupo invariante.
Definição 3.17 (Subgrupo invariante). Dados um grupo G = {G; ∗}, um subgrupo H ⊆ G e o
conjunto {h1 , h2 } ⊆ H. Se, para todo a ∈ G, ocorrer que a−1 ∗ h1 ∗ a = h2 , ou, de forma equivalente,
se h1 ∗ a = a ∗ h2 , então o subgrupo conjugado H é denominado um subgrupo invariante (ou
auto-conjugado, ou ainda divisor normal) em G.
Pode-se representar um subgrupo invariante na forma de classes laterais como
aH = Ha, (∀a ∈ G) .
Esta notação permite uma definição equivalente para um subgrupo invariante como aquele para
o qual as classes laterais à esqueda e à direita são as mesmas, para qualquer a ∈ G.
Consequências e proprieades importantes desta definição:
• Qualquer grupo G contém dois subgrupos invariantes H ⊆ G triviais ou impróprios: H = G

e H = {I}.
• Se h ∈ H, então todos os elementos do conjunto a−1 ∗ h1 ∗ a, ∀a ∈ G também estão em H.

Ou seja, um subgrupo H ⊆ G é invariante se e somente se ele contém os elementos de G

em classes completas; isto é, H deve conter todos ou nenhum elemento de uma ou mais
classes de G.
• Dado o grupo G = {G; ∗} e um subgrupo invariante H ⊆ G, o produto de duas classes
laterais de H também é uma classe lateral, pois, dados {a, b} ∈ G,
(aH) (bH) = a (Hb) H = a (bH) H = (ab) (HH) = (ab) H.
Foi introduzida aqui a operação de multiplicação de cosets, definida de tal forma que
.
(aH) (bH) = {(a ∗ h1 ) ∗ (b ∗ h2 ) , ∀h1 , h2 ∈ H} .

• Igualmente, o produto de H por uma classe lateral resulta na própria classe lateral,
H (aH) = (aH) H = a (HH) = aH.
• Da mesma forma, o produto de uma classe lateral pela sua “classe inversa” resulta no
subgrupo invariante; isto é, dado a ∈ G e o coset aH, deve existir o elemento inverso a−1 ∈ G,
cujo coset é a−1 H (o coset invariante). Então,
a−1 H (aH) = a−1 (Ha) H = a−1 (aH) H = a−1 a (HH) = H.

Nota-se também que o subgrupo normal H pode ser considerado o elemento identidade
frente a operação de multiplicação de cosets.
Outras definições importantes são apresentadas a seguir.
Definição 3.18. Um dado grupo G, este é denominado:
Simples: caso não possua nenhum subgrupo invariante próprio.
Semisimples: caso nenhum de seus subgrupos invariantes próprios seja Abeliano.
Apresenta-se finalmente o importante teorema a seguir.
Teorema 3.4 (Grupo fator). Dados o grupo G = {G; ∗} e um subgrupo invariante H ⊆ G, o conjunto
formado por H e por todas as suas classes laterais forma um grupo, denominado grupo fator ou
grupo quociente, frente a operação de multiplicação de cosets. O grupo fator é representado por
G/H e sua ordem, se |G| for finita, é a razão |G| / |H|.
Exercício 3.10. Dado o grupo S3 , obtenha suas classes de conjugação, seus grupos invariantes
e seus grupos fatores.
Resolução. O grupo S3 foi definido no exemplo 3.2 e sua tabela de multiplicação foi obtida no
exercício 3.5.
Classes: a primeira classe trivial é [π1 ] ≡ [I] = {I}. Para [π2 ]:
Iπ2 I = π2 π2−1 π2 π2 = π2 π3−1 π2 π3 = π6

π4−1 π2 π4 = π6 π5−1 π2 π5 = π3 π6−1 π2 π6 = π3 .
Portanto, [π2 ] = [π3 ] = [π6 ] = {π2 , π3 , π6 }. Para [π4 ]:
Iπ4 I = π4 π2−1 π4 π2 = π5 π3−1 π4 π3 = π4

π4−1 π4 π4 = π4 π5−1 π4 π5 = π4 π6−1 π4 π6 = π5 .
Portanto, [π4 ] = [π5 ] = {π4 , π5 }. O grupo S3 é formado por 3 classes de conjugação distintas.
Subgrupos invariantes: no exemplo 3.5 foi mostrado que os subgrupos próprios de S3 são:
A3 , hπ2 i, hπ3 i e hπ6 i. Cada subgrupo será testado agora quanto a sua invariância. Para A3 :
nI o nI o nI o
IA3 I = A3 π2−1 A3 π2 = π2−1 π4 π2 = π5 = A3 π3−1 A3 π3 = π5
π5 π π
nI o n I4 o n I4 o
−1 −1 −1
π4 A3 π4 = π4 π5 A3 π5 = π4 π 6 A3 π 6 = π 5 .
π5 π5 π4
Portanto, o subgrupo A3 é invariante. Para hπ2 i:
π2−1 hπ2 i π2 = π2−1 πI2 π2 = hπ2 i π3−1 hπ2 i π3 =

I

I hπ2 i I = hπ2 i π6 6= hπ2 i .
Portanto, hπ2 i não é invariante. O mesmo pode ser verificado para hπ3 i e hπ6 i. O único grupo
normal é A3 .
Grupo fator: no exercício 3.8 foi demonstrado que há somente uma única classe lateral de A3 :
π2 A3 . Portanto, o grupo fator é
.
S3 /A3 = {A3 , π2 A3 } ,
sendo que, neste grupo, I = A3 . Observa-se também que |S3 /A3 | = |S3 | / |A3 | = 2.

3.4 G RUPOS DE SIMETRIA

Simetria, tanto para as ciências naturais (física, química, biologia, etc) quanto para a mate-
mática possui significado semelhante, embora o conceito seja aplicado a diferentes objetos ou
estruturas.
Para a matemática, o termo simetria está relacionado à invariância das estruturas matemá-
ticas abstratas. Por esta razão, simetria não ocorre somente em geometria ou topologia, mas
ocorre também na álgebra e na análise, como no estudo de equações diferenciais, por exemplo.
Para a física, o termo simetria está relacionado às características de um sistema físico que
são preservadas, de acordo com algum tipo de observação, após a aplicação de algum tipo de
transformação sobre o mesmo. Em outras palavras, a simetria de um sistema físico é uma
característica física (estrutural) e/ou matemática do mesmo (observada ou intrínseca) que é
mantida invariante frente à transformação aplicada (passiva ou ativa) sobre o mesmo. Algumas
das transformações que podem ser aplicadas sobre um sistema físico são também discutidas
nas seções 6.2 e 6.6, no contexto da álgebra e análise tensoriais.
Observa-se que as transformações mencionadas são tais que a estrutura ou propriedades
do objeto (físico ou matemático) permanecem invariantes frente a aplicação destas transforma-
ções. Assim, como cada transformação deste tipo essencialmente leva o sistema para si mesmo
(processo denominado também de automorfismo), duas transformações distintas e consecutivas
terão a mesma consequência.
Assim, o conjunto de todas as transformações aplicadas ao objeto que satisfazem a condi-
ção de automorfismo formam um grupo, denominado grupo de simetria ou, em outros textos,
de grupo de transformações. A validade da última designação baseia-se no fato de que, como
cada transformação sobre o objeto que não seja isomórfica irá alterar o mesmo, dificilmente o
conjunto de tais transformações anisomórficas irá constituir um grupo.
Como o conceito de simetria em física aplica-se tanto à estrutura material do mesmo quanto
às suas propriedades matemáticas, um grupo de simetria em particular pode ser tanto finito
quanto infinito (discreto ou contínuo). Exemplos de grupos de simetria contínuos já foram
apresentados na seção 3.1.2, dentre os quais pode-se mencionar os grupos O (n), SO (n), U (n),
SU (n) e o grupo de Lorentz.
O grupo de Lorentz, em particular, na verdade, o grupo de Lorentz homogêneo, é composto por
todas as transformações de Lorentz11 descritas por matrizes 4×4, as quais são determinadas por
3 parâmetros não compactos. O grupo também é composto por todas as rotações no R3 em torno
da origem, as quais formam o grupo SO (3), compacto de dimensão 3. Estas transformações
mantêm invariante a norma do espaço-tempo de Minkowski e mantêm também a origem fixa.
Portanto, o grupo de Lorentz é um grupo de simetria contínuo, não compacto e não Abeliano,
de dimensão 6. A simetria neste caso (ou isometria) consiste no conjunto de tranformações que
mantém invariante uma propriedade matemática do sistema: a norma do espaço-tempo.
O grupo homogêneo de Lorentz é um subgrupo do grupo de Poincaré (ou grupo de Lorentz ino-
mogêneo), o qual contém também o conjunto de todas as translações espaciais e deslocamentos
temporais que mantêm a norma do espaço-tempo invariante. O grupo de Poincaré é um grupo
de simetria contínuo, não compacto e não Abeliano, com 06 + 04 = 10 dimensões.
Os exemplos de grupos de simetria até aqui apresentados destacam grupos contínuos e
grande parte das transformações isométricas que mantêm invariantes propriedades matemá-
ticas do sistema físico formam grupos contínuos.
Considerando tranformações isométricas na estrutura material do sistema físico, os grupos
de simetria que surgem são de interesse principalmente nas áreas de física molecular e do es-
tado sólido. Já para a química, o interesse primordial está nas simetrias de moléculas. Estas
propriedades fundamentais são importantes para a dinâmica das reações químicas, para a es-
pectroscopia e estrutura dos níveis de energia das moléculas.
Já para a física do estado sólido, as propriedades de simetria das redes cristalinas têm in-
fluência na estrutura eletrônica dos cristais, nos espectros de difração, nas suas propriedades
elétricas e magnéticas, entre outras. Um cristal consiste no ordenamento regular de átomos em
três dimensões. Uma rede cristalina é composta por uma rede de Bravais e uma base. A rede
de Bravais é simplesmente um arranjo regular de pontos discretos em 3 dimensões de tal forma
que a rede é vista exatamente da mesma forma, independente do ponto de observação. Já a
base da rede cristalina consiste em um conjunto de 3 vetores primitivos que geram e varrem a
rede de Bravais; ou seja, que descrevem a posição de cada átomo da rede cristalina com o uso de
11 Em inglês: boost.

104 3.4. Grupos de simetria
Figura 3.4: Célula unitária de uma rede de Bravais

Figura 3.3: Uma rede de Bravais cúbica simples. Os cúbica de corpo centrado (bcc). Os vetores unitários
três vetores primitivos a1 , a2 e a3 são mutuamente são dados por a1 = ax̂, a2 = aŷ e a3 = a (x̂ + ŷ + ẑ) /2.
perpendiculares e têm a mesma magnitude.
até 3 índices inteiros. As figuras 3.3 e 3.4 mostram dois exemplos de redes cristalinas cúbicas
(simples e de corpo centrado) e os vetores primitivos usualmente empregados na localização de
todos os pontos da rede.
Assumindo-se que os efeitos de superfície são negligenciáveis em um cristal, as transforma-
ções que preservam as posições relativas entre os pontos discretos do cristal podem ser de 3
tipos:
1. Rotações por um dado ângulo em torno de algum eixo.
2. Reflexão especular em um plano e inversões.
3. Translações espaciais.
As duas primeiras duas primeiras mantêm pelo menos um ponto do cristal fixo, ao passo que a
terceira implica em deslocamentos ao longo da rede cristalina.
A descrição algébrica das transformações de simetria aplicadas sobre objetos físicos e/ou
matemáticos é implementada pela noção de ação de grupo. Os elementos que caracterizam o
objeto são identificados e descritos por um conjunto e as simetrias desse objeto são descritas pelo
grupo simétrico do conjunto. Este grupo é um grupo de permutações se o conjunto for finito e não
constituir um espaço vetorial ou um grupo de transformações, se o conjunto forma um espaço
vetorial, em cuja situação a ação de grupo atua como transformações lineares no conjunto.12
Um exemplo de ações de grupo ocorre quando se considera as operações de isometria de um
triângulo equilátero, sendo o triângulo descrito por um conjunto de pontos que identificam seus
vértices. O grupo de simetria resultante é obtido no exercício 3.11.
Definição 3.19 (Ação de grupo). Sejam G = {G; ∗} um grupo e C um conjunto. Um ação (pela
esquerda) de grupo ϕ de G sobre C é o mapeamento
ϕ : G × C 7−→ C, (g, c) 7→ ϕ (g, c) ,
para todo g ∈ G e todo c ∈ C, que satisfaz os axiomas
Identidade. Sendo I o elemento identidade de G, ϕ (I, c) = c, para todo c ∈ C.
Compatibilidade. Para todo g, h ∈ G e c ∈ C, ϕ (g ∗ h, c) = ϕ (g, ϕ (h, c)).
São definidos também os seguintes tipos de ações de grupo.
Transitiva. Se C não for o conjunto vazio (C 6= ∅) e se para todo c, d ∈ C existir um elemento

g ∈ G tal que ϕ (g, c) = d.
12 Espaços vetoriais e transformações lineares operando no mesmo são apresentados na seção 4.1.

Fiel ou efetiva. Se para todos g, h ∈ G distintos (g 6= h) existe um elemento c ∈ C tal que ϕ (g, c) 6=
ϕ (h, c). Alternativamente, se para todo g ∈ G tal que g 6= I existe um elemento c ∈ C tal que
ϕ (g, c) 6= c.
Intuitivamente, para uma ação de grupo fiel, diferentes elementos de G induzem diferentes
permutações dos elementos de C.
Livre ou semiregular. Se, dados g, h ∈ G, a existência de um elemento c ∈ C onde ϕ (g, c) =

ϕ (h, c) implica g = h. De forma equivalente, se g ∈ G e existir um elemento c ∈ C para o qual
ϕ (g, c) = c, então, necessariamente, g = I.
Regular ou transitivo simples. Se ϕ for tanto transitivo quanto livre. Isto equivale a dizer que
para quaisquer c, d ∈ C existe um e somente um g ∈ G tal que ϕ (g, c) = d.
n-Transitiva. Se C possuir pelo menos n elementos e existirem subconjuntos {c1 , . . . , cn } e

{d1 , . . . , dn } para os quais existe um elemento g ∈ G tal que ϕ (g, ck ) = dk (k = 1, . . . , n).
Primitiva. Se as ações de todos os elementos de G sobre C forem transitivas e a subtração de

todos os pares c, d ∈ C resultantes das ações de grupo resultar no conjunto vazio, i. e., se a
ação de grupo não preservar nenhuma partição de C em subconjuntos não vazios.
Logicamente livre. Se G for um grupo topológico e não existir nenhuma vizinhança U de I tal
que a restrição da ação em U seja livre. Isto é, se ϕ (g, c) = c para algum c ∈ C e algum
g ∈ U , então g = I.
Irredutível. Se C for um módulo sobre um anel R,13 a ação de G é R-linear e não existir nenhum
submódulo próprio invariante.
Após esta longa introdução, discute-se agora alguns dos grupos de simetria mais importantes
para a física. Globalmente, os grupos de simetria podem ser divididos em dois tipos, descritos a
seguir.
Grupo de simetria pontual. Um grupo pontual é um grupo de simetrias geométricas (isome-

trias) que mantêm pelo menos um ponto fixo. As transformações isométricas consistem
usualmente em rotações em torno de um eixo, reflexões especulares e inversões, tais que
todos os eixos de rotação e todos os planos de reflexão devem se interceptar em pelo menos
um ponto.
Os grupos O (n) e U (n) são grupos de simetria pontuais. Da mesma forma, o grupo ho-
mogêneo de Lorentz também, uma vez que as transformações consideradas neste são os
boosts e rotações no espaço. Grupos pontuais finitos de interesse para a cristalografia são
considerados a seguir.
Grupo de simetria espacial. Grupo de simetria formado a partir de translações espaciais. Para
que um sistema físico possua simetria espacial, este deve ter a mesma estrutura, para
qualquer deslocamento realizado por um observador. Para que isso seja possível, é neces-
sário que o sistema tenha uma extensão infinita ou que as propriedades físicas observadas
da rede não sejam afetadas pela sua superfície.
O grupo inomogêneo de Lorentz é uma grupo de simetria espacial, uma vez que a norma
do espaço-tempo (o qual é infinito) não é afetado por translações espaciais e deslocamentos
temporais. Redes de Bravais também irão apresentar simetria espacial se estas puderem
ser consideradas infinitas.
Os grupos finitos de simetria que são de interesse para a física do estado sólido e para a
química serão consideradas em mais detalhes a seguir.
3.4.1 G RUPOS CRISTALOGRÁFICOS PONTUAIS

Como já mencionado, este é o grupo formado pelas transformações isométricas que mantêm
um ponto central fixo e movem as pontos e faces restantes do cristal, de tal forma que este
assume, após a transformação, uma configuração indistinguível da inicial, de forma consistente
com a simetria translacional da rede cristalina.

Existem ao todo 32 grupos pontuais que preservam a simetria translacional de redes crista-
linas em um espaço de 3 dimensões. Este número em particular é fornecido pelo teorema da
restrição cristalográfica, o qual afirma que as simetrias rotacionais de um cristal somente podem
ser de segunda, terceira, quarta e sexta ordens. Redes com outras ordens de simetria (como de
5ª ordem, por exemplo) são denominados quasecristais.
Se a origem do sistema de coordenadas for posicionada sobre um dos pontos fixos das trans-
formações, então o grupo pontual é composto pelas seguintes operações:
1. Rotações por um dado ângulo em torno de um eixo que passa pela origem.
2. Reflexões especulares em planos que passam pela origem.
3. Inversão espacial.
Cabe aqui mencionar que estas operações não são totalmente independentes entre si. Qualquer
uma das operações acima pode ser expressa por uma combinação adequada das duas restantes.
Assim, uma inversão espacial pode ser considerada como uma rotação por π radiano, seguida
por uma reflexão no plano perpendicular ao eixo de rotação.
Uma rotação seguida por uma reflexão ou inversão é denominada uma rotação imprópria,
a qual muda a quiralidade do cristal. Assim, as rotações acima mencionadas, as quais não
mudam a quiralidade do sistema, são também denominadas rotações próprias. Pode-se verificar
facilmente que o produto de duas rotações próprias ou duas impróprias sempre resulta em
um rotação própria, ao passo que o produto de uma rotação própria por uma imprópria, em
qualquer ordem, é sempre uma rotação imprópria. As implicações ao sistema físico oriundas de
rotações próprias ou impróprias (ativas ou passivas) são discutidas em maior detalhe na seção
6.6, no contexto de campos tensoriais.
É também conveniente observar aqui que os seguintes pares de operações consecutivas co-
mutam entre si: (a) uma inversão com qualquer outra operação, (b) duas rotações em torno
do mesmo eixo, (c) duas rotações por π radianos em torno de eixos perpendiculares, (d) uma
rotação e uma reflexão em um plano normal ao eixo de rotação, (e) uma rotação por π radia-
nos e uma reflexão em um plano que passa pelo eixo de rotação, e (f) duas reflexões em planos
perpendiculares.
Alguns exemplos de grupos pontuais serão apresentados a seguir. Será feita também uma
breve descrição dos 32 grupos pontuais, juntamente com a nomenclatura e notações adotadas.
Com respeito às notações, atualmente há dois sistemas empregados: a notação Schoenflies,
comumente empregada em espectroscopia, e a notação internacional, ou Hermann-Mauguin,
empregada em cristalografia. Os grupos discutidos serão sempre identificados pela notação de
Schoenflies, mas a notação internacional equivalente será também mencionada.
Empregando a notação de Schoenflies, os grupos cristalográficos pontuais são os seguintes:
Cn : grupo cíclico composto pelas rotações próprias de um polígono regular de n lados. Este
polígono será levado em coincidência consigo mesmo por meio de uma rotação em um
ângulo ψ = 2π/n em torno de um eixo normal ao plano do polígono e que passa através
de seu ponto central. Este eixo de rotação é denominado eixo de rotação de ordem n. A
operação de rotação do polígono através deste eixo pelo ângulo ψ será denotada por Cn .
Aplicações sucessivas deste operador ao polígono são denotadas por Cn2 , Cn3 , etc., isto é,
rotações através de 2ψ = 4π/n, 3ψ, etc. Claramente, a n-ésima aplicação do operador Cn irá
levar o polígono à sua configuração original e isto corresponde então à operação identidade,
denotada aqui por Cnn = E.14 O conjunto destas rotações forma o grupo cíclico Cn (notação
de Scheonflies) ou n (notação internacional):
Cn = E, Cn , Cn2 , . . . , Cnn−1 .

Este grupo é ampliado por produtos diretos de rotações com reflexões, criando-se os gru-
pos:
Cnh : criado pela adição de uma reflexão especular em um plano perpendicular (horizon-
tal) ao eixo de rotação. A operação de reflexão neste plano será identificada por σh .
Claramente, σh2 = E, constituindo assim o grupo cíclico
C1h = {E, σh } . (3.7)

14 E: do alemão Einheit (identidade).

Cnv : criado pela adição de reflexões especulares em n planos paralelos (verticais) ao eixo de
rotação, separados por um ângulo ψ entre si. Esta operação será identificada por σv .
Claramente, σv2 = E; assim, cada operador σv constitui um grupo cíclico {E, σv }.
S2n : (de Spiegel, espelho em alemão) denota o grupo que contém somente um eixo rotação
imprópria (rotação-reflexão) de ordem 2n.
Dn : (de diedral, ou frente-verso) indica que o grupo possui um eixo de rotação de ordem n mais
n eixos de rotação de ordem 2 perpendiculares ao primeiro. Por exemplo, o grupo D2 possui
um eixo de rotação principal de ordem 2 mais dois outros eixos de ordem 2, ortogonais ao
primeiro; assim, o grupo D2 possui três eixos de rotação de ordem 2 mutuamente ortogo-
nais. Este grupo é ampliado por:
Dnh : com a adição de uma reflexão especular em um plano perpendicular ao eixo de ordem
n.
Dnd : com a adição de reflexões especulares em planos paralelos ao eixo de ordem n.
T : (de tetraedro) indica o grupo que possui a simetria de um tetraedro. Este poliedro possui ao
todo 12 eixos de rotação que geram os seus elementos de simetria. Este grupo pode ser
ampliado por:
T d : inclui 6 rotações impróprias e 6 planos de reflexão, de forma que o grupo possui ao

todo 24 elementos.
T h : inclui uma inversão, o que gera ao todo 24 elementos também.
O: (de octaedro) indica o grupo que possui a simetria de um octaedro (ou cubo). Possui ao todo
24 elementos. Ampliado por:
O d : inclui rotações impróprias, o que eleva o número total de elementos para 48.
Como já mencionado, de acordo com o teorema da restrição cristalográfica, somente são

possíveis eixos de ordens n = 1, 2, 3, 4 ou 6 para redes cristalinas no R3 , os quais são os valores
possíveis para o índice n dos grupos Cn , Cnh , Cnv , Dn , Dnh , Dnd e S2n . É importante mencionar
também que C1v = C1h , D1 = C2 , D1h = C2v , D1d = C2h e que os grupos D4d , D6d , S8 e S12 são
proibidos.
Os 27 grupos de rotações, juntamente com T , Td , Th , O e Oh constituem os 32 grupos crista-
lográficos pontuais. Os exercícios a seguir ilustram a formação de alguns destes grupos.
Exercício 3.11. Construa o grupo pontual de simetrias de um triângulo equilátero.
Resolução: a figura 3.5 ilustra um triângulo equilátero (n = 3), com seus vértices e linhas medi-
anas identificadas. O eixo de rotação de ordem 3 atravessa o baricentro em O e é perpendicular
ao plano do triângulo. As linhas medianas correspondem às intersecções dos planos verticais
(paralelos ao eixo de rotação) com o triângulo. Os números 1 − 6 permanecem sempre fixos,
enquanto que os pontos a, b, e c identificam os vértices do triângulo, os quais se movem com
o mesmo a cada operação de simetria. As ações dos operadores são denotadas pelas coinci-
dências entre as letras (móveis) e os números (imóveis). Definem-se os seguintes operadores de
transformações de simetria:
1 1 1
a c a
4 5 4 5 4 5
c b b a b c
3 2 3 2 3 2
6 6 6
(a) (b) (c)
Figura 3.5: Triângulo equilátero: vértices e medianas para a determinação do grupo de simetrias. (a) Configu-
ração original. (b) Ação do operador C3 . (c) Ação do operador σv16 .

Rotações próprias: O operador de rotação própria C3 corresponde a uma rotação por ψ = 2π/3
radianos ou 120◦ graus no sentido horário, por convenção. Ou seja, se {123} corres-
ponde à ordem inicial dos vértices, no sentido horário,
E ≡ C33 {abc} → {abc} C3 {abc} → {cab} C32 {abc} → {bca} .
Ou seja,
C3 = E, C3 , C32 .

A ação de C3 sobre o triângulo está ilustrada na figura 3.5b.
Reflexões nas medianas: Este polígono não possui reflexões no plano perpendicular ao eixo de
rotação, mas existem 3 operações de reflexão σv que podem ser definidas, uma para
a reflexão em torno de cada mediana, ou seja, σv16 (reflexão em torno da linha 1 − 6),
σv24 (em torno da linha 2 − 4) e σv35 (em torno de 3 − 5). Neste caso,
σv16 {abc} → {acb} σv24 {abc} → {cba} σv35 {abc} → {bac} ,
sendo que estes operadores têm ordem igual a 2. A ação de σv16 está ilustrada na
figura 3.5c.
Rotações nas medianas: Ao invés de reflexões, podem ser definidas também as 3 operações de
rotação por um ângulo de π radianos (ordem 2) em torno de eixos que passam pelas
medianas:
C2,16 {abc} → {acb} C2,24 {abc} → {cba} C2,35 {abc} → {bac} .
Desta forma, o grupo pontual de simetrias de um triângulo equilátero é dado por:
Grupo C3v : (notação internacional: grupo 3m) composto por
C3v = C3 + (reflexões) = E, C3 , C32 , σv16 , σv24 , σv35 .

Grupo D3 : (notação internacional: grupo 32) composto por
D3 = E, C3 , C32 , C2,16 , C2,24 , C2,35 .

Nota-se que o grupo cíclico C3 é sempre um subgrupo invariante de C3v ou D3 .
Exercício 3.12. Construa as tabelas de multiplicações dos grupos pontuais de um triângulo e

destaque o isomorfismo existente entre o grupo C3v e os grupos D3 e S3 (ver também exercício
3.15).
Resolução: realizando-se todas as multiplicações entre os membros do grupo C3v obtém-se a
tabela 3.1. Este grupo é formado por um subgrupo próprio de ordem 3: C3 e pelas rotações
impróprias {σv16 , σv24 , σv35 }. Pode-se realizar então os mapeamentos entre os elementos de C3v ,
D3 e S3 ilustrados na tabela 3.2. Nota-se também o isomorfismo entre os grupos invariantes:
C3 7→ A3 .
Tabela 3.1: Tabela de multiplicações do grupo C3v . Tabela 3.2: Tabela de isomorfismos entre os grupos
E C3 C32 σv16 σv24 σv35 C3v , D3 e S3 .
C3 C32 E σv35 σv16 σv24
C3v D3 S3
C32 E C3 σv24 σv35 σv16
σv16 σv24 σv35 E C3 C32 E E I
σv24 σv35 σv16 C32 E C3 C3 C3 π5
σv35 σv16 σv24 C3 C32 E C32 C32 π4
σv16 C2,16 π2
σv24 C2,24 π6
σv35 C2,35 π3

Exercício 3.13. Construa o grupo pontual de simetrias de um quadrado e obtenha sua tabela
de multiplicações.
Resolução: a figura 3.6 ilustra o quadrado (n = 4), identificando seus vértices e os planos de
reflexão. O eixo de rotação de ordem 4 atravessa o ponto O e é perpendicular ao plano do qua-
drado. Os números 1, 2, ..., 8 permanecem sempre fixos, enquanto que os pontos do quadrado
marcados por a, b, ..., h movem-se com o mesmo frente as transformações de simetria. Assim,
os pontos a, b, c e d marcam os vértices do quadrado, enquanto que e, f, g e h marcam os pontos
médios de suas arestas. As ações das transformações serão denotadas pelas coindidências entre
as letras (móveis) e os números (fixos). Os operadores de simetria são:
Rotações próprias: O operador C4 consiste em uma rotação horária em torno de O por um ângulo
de ψ = 2π/4 = π/2 radianos (90◦ graus). Identificando cada rotação própria pela
variação dos vértices do quadrado, o grupo de rotações C4 , de ordem 4, é formado
pelos operadores:
E {abcd} → {abcd} C4 {abcd} → {dabc}

C42 {abcd} → {cdab} C43 {abcd} → {bcda} .
Ou seja,
C4 = E, C4 , C42 , C43 .

Reflexões nas medianas e diagonais: As reflexões nas linhas medianas são executadas pelos
operadores σv57 , definido como a reflexão especular em torno da linha 5 − 7, e σv68 ,
gera a reflexão em torno da linha 6 − 8. Já as reflexões nas diagonais são realizadas
pelos operadores σv13 e σv24 . Desta forma,
σv57 {abcd} → {dcba} σv68 {abcd} → {badc}

σv13 {abcd} → {adcb} σv24 {abcd} → {cbad} .
Todos estes operadores têm ordem 2.
Portanto, o grupo de todas as operações de simetria de um quadrado é
C4v = C4 + (reflexões) = E, C4 , C42 , C43 , σv57 , σv68 , σv13 , σv24 ,

o qual é de ordem 8.
A tabela de multiplicações do grupo C4v é facilmente obtida:
E C4 C42 C43 σv57 σv68 σv13 σv24

C4 C42 C43 E σv13 σv24 σv68 σv57
C42 C43 E C4 σv68 σv57 σv24 σv13
C43 E C4 C42 σv24 σv13 σv57 σv68
σv57 σv24 σv68 σv13 E C42 C43 C4
σv68 σv13 σv57 σv24 C42 E C4 C43
σv13 σv57 σv24 σv68 C4 C43 E C42
σv24 σv68 σv13 σv57 C43 C4 C42 E
3.4.2 P ROJEÇÕES ESTEREOGRÁFICAS

A conexão entre as posições dos átomos em uma rede cristalina no R3 com os polígonos regu-
lares permitidos pelo teorema da restrição cristalográfica é realizada através de projeções desses
átomos em certos planos, projeções essas que formarão os polígonos estudados. Projeções em
planos também são empregados para as faces do cristal.
Uma das projeções mais empregadas em cristalografia é a projeção estereográfica. Como esta
é obtida para uma estrutura no R3 está exemplificado na figura 3.7. Nesta, três átomos em
particular de uma molécula ou um cristal encontram-se sobre a superfície de uma esfera, nos
pontos P , P 00 e P 000 , todos situados no hemisfério superior da mesma. No painel (a) observa-se

(a)
(b)
Figura 3.7: (a) Projeção estereográfica dos átomos em P , P 00 e P 000 na superfície da esfera sobre o plano
equatorial. (b) Projeções sobre o plano equatorial dos átomos.
que a partir de cada átomo é traçada uma reta que parte da superfície da esfera até o polo da
esfera situado no hemisfério oposto. A intersecção da linha que parte de P até o polo S com
o plano equatorial da esfera, representado pela reta AB, será a projeção estereográfica deste
átomo. Para o átomo em P , a sua projeção, portanto, estará no ponto P 0 do plano equatorial.
Realizando-se a mesma projeção para os demais átomos em P 00 e P 000 , a projeção estereo-
gráfica desta parte da molécula ou do cristal sobre o plano equatorial é visualizada na figura
3.7b. Observa-se que as projeções, representadas por círculos aberto, compõe os vértices de um
triângulo equilátero.
Projeções estereográficas existem para os 32 grupos cristalográficos pontuais. A figura 3.8
mostra estas projeções.
3.4.3 G RUPOS CRISTALOGRÁFICOS ESPACIAIS

Considera-se inicialmente uma rede linear composta por N pontos de rede com uma cons-
tante de rede a. Definindo a coordenada medida ao longo da rede linear por x, esta é invariante
sob translações por múltiplos de a ao longo da coordenada x.
Idealmente, N → ∞, mas para se tratar redes finitas (embora com N grande), empregam-
se condições de contorno periódicas, ou seja, x − N a = x. Definindo T1 como o operador que
realiza a translação ao longo de x pela distância a, a operação de translação Tn denota então a
translação pela distância na. Ou seja, se
n
T1 x = x − a, então Tn x = (T1 ) x = x − na.
Devido às condições de contorno periódicas,

N
TN x = (T1 ) x = x − N a = x.
Portanto, o conjunto
T = {T1 , T2 , . . . , Tn , . . . , TN −1 , TN = E}
claramente define um grupo cíclico de ordem N . Este grupo será denominado grupo de transla-
ção.
Os operadores isométricos de translação de uma rede de Bravais no R3 também constituem
um grupo. Dada a rede gerada pelos vetores primitivos a1 , a2 e a3 e sujeita às condições de
contorno periódicas
r − N1 a1 = r, r − N2 a2 = r, r − N3 a3 = r,
onde r é a posição em algum ponto da rede cristalina e {N1 , N2 , N3 } é o número de celas em cada
direção.
Define-se o operador de translação T (n1 , n2 , n3 ) dentro da rede cristalina como
T (n1 , n2 , n3 ) r = r − n1 a1 − n2 a2 − n3 a3 ≡ r − t (n1 , n2 , n3 ) ,

Figura 3.8: Projeções estereográficas para os grupos pontuais. O símbolo “+” significa acima do plano, “O”
abaixo do plano e “⊕” no plano.

112 3.5. Produto direto de grupos
onde 1 6 ni 6 Ni . Observa-se que a aplicação sucessiva de dois operadores de translação é

equivalente a uma outra translação, i. e.,
T (m1 , m2 , m3 ) T (n1 , n2 , n3 ) r = T (m1 , m2 , m3 ) [r − n1 a1 − n2 a2 − n3 a3 ]

= r − (n1 + m1 ) a1 − (n2 + m2 ) a2 − (n3 + m3 ) a3 = T (m1 + n1 , n2 + m2 , n3 + m3 ) r.
Dessa forma, observa-se que o conjunto de operadores de translação forma um grupo de

ordem N1 N2 N3 no qual o elemento identidade é E = T (0, 0, 0) ≡ T (N1 , N2 , N3 ) e onde o elemento
inverso de T (n1 , n2 , n3 ) é T (N1 − n1 , N2 − n2 , N3 − n3 ). Observa-se também que as operações de
translação comutam e, portanto, o grupo é Abeliano, porém não é cíclico.
O tipo de simetria translacional recém descrita forma um grupo cristalográfico espacial e
muitas redes cristalinas reais seguem o mesmo. De fato, cristais simples são invariantes tanto
frente às operações de simetria pontual quanto frente a translações. Contudo, cristais mais
complexos demandam outros tipos de simetrias. Pode ocorrer que o cristal seja invariante frente
uma operação pontual seguida de uma translação, mas não é isométrico frente a apenas uma
das operações. A complexidade apresentada pelas redes cristalinas reais tem como consequência
que existem ao todo 230 grupos cristalográficos conhecidos.
3.5 P RODUTO DIRETO DE GRUPOS

Trata-se de um artifício que permite descrever um grupo em termos de seus subgrupos pró-
prios invariantes, mas serve também para combinar grupos distintos e então formar um grupo
superior, denominado de grupo do produto direto. Neste segundo caso, um grupo do produto di-
reto resulta, por exemplo, quando o conjunto completo de operações de simetria do sistema em
consideração (físico ou matemático) pode ser dividido em dois ou mais subconjuntos (formando
grupos) tais que os operadores de um subconjunto comutam com os operadores do outro.
Um exemplo já foi apresentado na seção 3.4.1. Em um grupo cristalográfico pontual, um
operador de inversão espacial comuta com qualquer operador de rotação própria, por exemplo.
Por isso, um determinado cristal que possui um eixo de rotação de ordem n tem o seu grupo de
isometrias Cn ampliado pelo produto direto com o grupo {E, J}, sendo J o operador de inversão
espacial. Um outro exemplo consiste no grupo formado pelos operadores que comutam com o
hamiltoniano de um determinado sistema eletrônico. Se a interação spin-órbita for desconside-
rada em primeira aproximação, então os operadores que atuam sobre a parte orbital da função
de onda são independentes dos operadores que atuam sobre os spins (dos elétrons ou dos nú-
cleos). Neste caso, o grupo dos operadores de momentum angular é composto pelo produto dos
operadores orbitais pelos de spin.
O produto direto de subgrupos será definido inicialmente.
Definição 3.20. Um grupo G = {G; ∗} de ordem |G| é dito ser o produto direto de seus subgrupos
próprios H1 , H2 , . . . , Hn , respectivamente de ordens |H1 | , |H2 | , . . . , |Hn |, se:
1. Os subgrupos não possuem nenhum elemento em comum, exceto a identidade.

2. Os elementos dos diferentes subgrupos comutam.
3. Todo elemento g ∈ G for exprimível de uma única maneira através dos produtos
g = h1 ∗ h2 · · · ∗ hn = h2 ∗ h1 · · · ∗ hn = . . . ,
onde h1 ∈ H1 , h2 ∈ H2 , . . . , hn ∈ Hn .
Os subgrupos H1 , H2 , . . . , Hn são denominados os fatores diretos de G. Simbolicamente, escreve-

se o produto direto como
G = H1 ⊗ H2 ⊗ · · · ⊗ Hn ,
sendo que este produto direto gera o grupo G de ordem |G| = |H1 | |H2 | · · · |Hn |.
Como consequência da definição acima, os subgrupos em questão são os subgrupos próprios
invariantes de G. Para exemplificar, supõe-se que G possua dois subgrupos próprios invariantes:
H1 de ordem |H1 | e H2 de ordem |H2 |, i. e.,

H1 = h11 = I, h12 , . . . , h1|H1 | , H2 = h21 = I, h22 , . . . , h2|H2 | .

Então, o produto direto G = H1 ⊗ H2 gera o conjunto composto pelas multiplicações de todos os

elementos de H1 por todos os elementos de H2 :

G = I, I ∗ h22 , . . . , I ∗ h2|H2 | , h12 ∗ I, h12 ∗ h22 , . . . , h12 ∗ h2|H2 | , . . . ,

h1|H1 | ∗ I, h1|H1 | ∗ h22 , . . . , h1|H1 | ∗ h2|H2 | .
Como os subgrupo são invariantes, ocorre que h12 ∗ h22 = h22 ∗ h12 , por exemplo, e, por isso,
cada elemento de G é obtido somente uma vez: g1 = I, g2 = h22 , . . . , gi = h12 ∗ h22 , . . . , g|G| =
h1|H1 | ∗ h2|H2 | = h2|H2 | ∗ h1|H1 | , onde |G| = |H1 | |H2 |.
Exemplo 3.7. Dado o grupo cíclico hai, de ordem 6, onde a ∈ hai | a6 = I, os seus fatores diretos
são
A = I, a2 , a4 , B = I, a3 .

Então,
hai = A ⊗ B = I, a3 , a2 , a2 a3 = a5 , a4 , a4 a3 = a .

Exemplo 3.8. Dentro do grupo C4v de isometrias pontuais de um quadrado, discutido no exer-
cício 3.13, os subgrupos cíclicos {E, σv57 } e {E, σv68 } formam por produto direto o subgrupo
{E, σv57 } ⊗ {E, σv68 } = E, C42 , σv57 , σv68 .

Se a estrutura completa de um grupo G não for conhecida, mas se dois ou mais (supostos)
subgrupos invariantes de G o são, pelo fato de compartilharem o mesmo produto de grupo, a
mesma identidade e de satisfazerem as condições da definição 3.20, então um novo subgrupo
de G (ou talvez o próprio) pode ser construído pelo produto direto dos subgrupos menores.
Também é possível partir-se de dois grupos distintos, G e G 0 , tais que os elementos do primeiro
são independentes do segundo, e então construir o grupo G ⊗ G 0 superior, denominado grupo do
produto direto. Isto é realizado pela formação de todos os pares
(a, a0 ) ∈ G ⊗ G 0 , tais que a ∈ G e a0 ∈ G 0 .
O produto de pares em G ⊗ G 0 é definido por
(a, a0 ) (b, b0 ) = (ab, a0 b0 ) .
Como ab ∈ G e a0 b0 ∈ G 0 , então (ab, a0 b0 ) ∈ G ⊗ G 0 , de acordo com a exigência de clausura.
Se I ∈ G e I 0 ∈ G 0 são as respectivas identidades, então os pares (a, I 0 ) formam um subgrupo
Γ ⊂ G ⊗ G 0 isomórfico a G,15 enquanto que os pares (I, a0 ) formam um subgrupo Γ0 ∈ G ⊗ G 0
isomórfico a G 0 .
Exemplo 3.9 (Grupo de isometrias pontuais de uma cunha). Considere todas as operações de
simetria de uma cunha cujas faces são triângulos equiláteros, mas que possui também uma
certa espessura. Neste caso, além das operações de isometrias contidas no grupo D3 , o qual é
isomorfo ao grupo C3v ,16 surge uma transformação isométrica adicional constituída pela reflexão
em torno do plano perpendicular ao eixo de ordem 3, denotada pelo símbolo σh . Este operador é
o gerador do grupo de ordem 2
C1h = {E, σh } .
Pode-se observar facilmente que qualquer rotação (própria ou imprópria) do triângulo seguida
pela reflexão operada por σh terá o mesmo resultado que a ordem inversa de aplicação dos
operadores. Neste caso, o grupo do produto direto D3 ⊗ C1h possui ordem 12 e este forma o grupo
D3h , cujos elementos são
D3h = D3 ⊗ C1h = E, C3 , C32 , σv16 , σv24 , σv35 , σh , C3 σh , C32 σh , σv16 σh , σv24 σh , σv35 σh .

3.6 M APEAMENTOS ENTRE GRUPOS

Até este momento, os grupos abstratos e suas propriedades foram estudados de forma indi-
vidual. Contudo, é possível estabelecer-se relações entre diferentes grupos que permitem gene-
ralizar o estudo das propriedades comuns entre os mesmos. Estas relações são estabelecidas a
partir de mapeamentos entre os grupos, realizados de tal forma que existe um homomorfismo ou
isomorfismo entre os mesmos. Alguns desses conceitos serão agora discutidos.
15 A definição de isomorfia será apresentada na seção 3.6.
16 Ver exercícios 3.11 e 3.12.

114 3.6. Mapeamentos entre grupos
Figura 3.9: Representação do mapeamento entre os

conjunto domínio (X) e contradomínio (Y ) da função
f (x). O subconjunto amarelo de Y representa a ima-
gem da função.
3.6.1 F UNÇÕES E MAPEAMENTOS

Um mapeamento entre grupos consiste em alguma relação entre um elemento de um dado
grupo G e um elemento de um outro grupo G 0 . A forma como esta relação pode ser estabelecida
é bastante ampla, e possui uma grande semelhança com o conceito de função em análise ma-
temática. Por esta razão, será feita inicialmente a definição formal deste conceito, para depois
discutir-se o mapeamento entre grupos.
Definição 3.21 (Função). Uma função é uma relação binária entre dois conjuntos, sendo um
conjunto de entrada, denominado o domínio e um conjunto de saída, denominado o contrado-
mínio. Se o conjunto domínio de uma função denominada f é identificado por X e o conjunto
contradomínio é identificado por Y , então a relação binária entre os conjuntos é representada
por
f
f : X 7→ Y ou X −
→ Y,
sendo dito que f é a função de X em Y .
A operação realizada por f sobre o elemento x ∈ X é usualmente representada por f (x),
quando então x é denominado o argumento de f . Quando a função f estabelece a relação
binária entre o argumento x e o elemento y ∈ Y , y é denominado o valor de f em x, e essa relação
é usualmente representada por y = f (x).
Para que a relação binária f : X 7→ Y seja uma função, é necessário que:
1. f seja unívoca: se y = f (x) e z = f (x), então z = y.

2. f seja total: para todo x ∈ X existe um y ∈ Y tal que y = f (x).
Para cada x ∈ X relacionado com y ∈ Y | y = f (x) é estabelecido um par ordenado (x, y).
Sendo {x1 , x2 , . . . , xn } ⊆ X o conjunto de argumentos operados por f e {y1 , y2 , . . . , yn } ⊆ Y , com
y1 = f (x1 ), etc, o conjunto de valores de f , O conjunto de pares ordenados
C = X × Y = {(x1 , y1 ) , (x2 , y2 ) , . . . (xn , yn )}
é denominado o produto Cartesiano de X e Y .17 Se {y1 , y2 , . . . , yn } ⊂ Y , este conjunto é usual-

mente denominado a imagem da função.
A figura 3.9 ilustra o mapeamento entre conjuntos realizado pela função f : X 7→ Y . Existem
diversos tipos de funções, dependendo da regra que associa os elementos de X aos elementos
de Y e da amplitude da ação de f sobre X. Alguns desses tipos serão citados:
Função injetora ou injetiva. Quando cada y ∈ Y está associado a apenas um x ∈ X, i. e., se
para todo x1 , x2 ∈ X tais que x1 6= x2 , com os valores y1 = f (x1 ) e y2 = f (x2 ), então y1 6= y2 .
Função sobrejetora ou sobrejetiva. Quando todos os elementos do contradomínio estão asso-
ciados a algum elemento do domínio, i. e., o conjunto imagem se torna igual ao contrado-
mínio inteiro.
Função bijetora ou bijetiva. Quando a função é ao mesmo tempo sobrejetora e injetora, i. e.,
cada elemento do domínio está associado a um único elemento do contradomínio e vice-
versa.
17 Ver definição 3.26.

Mapeamento. Uma função f : X 7→ Y é denominada um mapeamento se o conjunto {x1 , x2 , . . . , xn }

de elementos de X operados por f é o conjunto X inteiro. Um mapeamento pode ainda ser
dividido em:
Mapeamento de X em Y . Quando a imagem do mapeamento está contida no contrado-

mínio, i. e., {y1 , y2 , . . . , yn } ⊂ Y . Este mapeamento pode ser representado por f : X → Y .
Mapeamento de X sobre Y . Quando o conjunto de valores de f é igual ao contradomínio
sobre
inteiro. Este mapeamento pode ser representado por f : X −−−→ Y .
As definições recém apresentadas sobre funções e mapeamentos podem ser agora implementa-
das para o mapeamento entre dois grupos.
3.6.2 M APEAMENTO ENTRE GRUPOS E HOMOMORFISMO

A definição e tipos de funções apresentados acima serão agora generalizados na definição
de mapeamento entre grupos. Dentre todos os mapeamentos possíveis, os mais importantes
são aqueles que estabelecem um homomorfismo entre dois grupos. Assim, nesta seção esses
conceitos serão apresentados e discutidos.
Definição 3.22 (Mapeamento entre grupos). Dados os grupos G = {G; ∗} e G 0 = {G0 ; •}, o
mapeamento Φ de G em G 0 , representado por
Φ : G 7−→ G 0 ,
consiste em uma relação binária entre cada elemento g ∈ G com um elemento g 0 ∈ G0 , o qual é
denominado o valor de Φ em g. Esta relação pode ser representada por g 0 = Φ (g).
Exemplo 3.10. Dados os grupos:
• GL (n, R): grupo geral linear composto pelas matrizes n × n reais inversíveis, frente à multi-
plicação matricial.
• (R∗ ; ×): grupo formado pelo conjunto dos números reais, exceto o 0, frente ao produto
algébrico.
Pode-se definir o mapeamento

Φ : GL (n, R) 7−→ (R∗ ; ×)
tal que para cada matriz A ∈ GL (n, R) corresponde o elemento ∆ ∈ (R∗ ; ×) determinado por
∆ = Φ (A) ≡ det (A) .
Diz-se então que cada matriz A é mapeada ao seu determinante ∆.
A partir da definição básica de mapeamento entre grupos, alguns tipos importantes de ma-
peamentos podem então ser definidos:
Homomorfismo. Dados os grupos G = {G; ∗} e G 0 = {G0 ; •}, o mapeamento Φ : G 7−→ G 0 será

denominado um homomorfismo do grupo G para o grupo G 0 se cada elemento g ∈ G for
mapeado a um único elemento g 0 = Φ (g) ∈ G 0 de tal forma que
Φ (g1 ∗ g2 ) = Φ (g1 ) • Φ (g2 ) .
O elemento g 0 = Φ (g) ∈ G 0 é denominado a imagem ou o mapa do elemento g de G sob o

homomorfismo.
Monomorfismo. Dados os grupos G = {G; ∗} e G 0 = {G0 ; •}, o mapeamento Φ : G 7−→ G 0 será

denominado um monomorfismo do grupo G para o grupo G 0 se:
1. O mapeamento for homomórfico.

2. O mapeamento for injetivo, i. e., para todos g1 , g2 ∈ G tais que g1 6= g2 , se g10 = Φ (g1 ) e
g20 = Φ (g2 ), com g10 , g20 ∈ G 0 , então g10 6= g20 .

Epimorfismo. Dados os grupos G = {G; ∗} e G 0 = {G0 ; •}, o mapeamento Φ : G 7−→ G 0 será

denominado um epimorfismo do grupo G para o grupo G 0 se:
1. O mapeamento for homomórfico.
2. O mapeamento for sobrejetivo, i. e., todos os elementos de G 0 forem mapeados a partir
de algum elemento de G.
Isomorfismo. Dados os grupos G = {G; ∗}, de ordem |G|, e G 0 = {G0 ; •}, de ordem |G 0 |, o mapea-
mento Φ : G 7−→ G 0 será denominado um isomorfismo se:
1. Existir um homomorfismo do grupo G para o grupo G 0 .
2. Os grupos tiverem a mesma ordem; i. e., |G 0 | = |G|.
3. Existir uma correspondência bijetora entre n cada elemento o g ∈ G com cada elemento
g 0 ∈ G 0 , i. e., se G = g1 , g2 , . . . , g|G| e G0 = g10 , g20 , . . . , g|G|
0

, então
g1 ↔ g10 , g2 ↔ g20 , . . . , g|G| ↔ g|G|

0
.
Os grupos G e G 0 são ditos então isomórficos.
Endomorfismo. Dado o grupo G = {G; ∗}, o mapeamento Φ : G 7−→ G é denominado um endo-
morfismo de G.
Automorfismo. Dado o grupo G = {G; ∗}, o mapeamento Φ : G 7−→ G é denominado um auto-
morfismo de G se:
1. O mapeamento for endomórfico.
2. O mapeamento for isomórfico.
Exercício 3.14. Mostre que o mapeamento definido no exemplo 3.10 é um tipo de homomor-
fismo e classifique o mesmo.
Resolução: Dadas as matrizes A1 , A2 ∈ GL (n, R) e os números reais ∆1 , ∆2 ∈ (R∗ , ×) tais que
∆1 = det (A1 ) e ∆2 = det (A2 ). O mapeamento Φ : GL (n, R) 7−→ (R∗ ; ×) | Φ (A) = det (A) é um
homomorfismo porque
det (A1 A2 ) = det (A1 ) det (A2 ) = ∆1 ∆2 .
Além disso, o mapeamento será um epimorfismo porque, uma vez que o grupo GL (n, R) é de
dimensão n2 , sempre haverá uma combinação de parâmetros da matriz A cujo determinante
será mapeado a qualquer número real ∆. Por outro lado, o mapeamento não é isomórfico porque
a um dado ∆ sempre haverá mais de uma matriz A mapeada ao mesmo.
Alguns exemplos de homomorfismo:
• No exercício 3.12 já foi demonstrado o isomorfismo entre os grupos C3v , D3 e S3 .
• Φ : C4 7−→ Z4 , com E ↔ 1, C4 ↔ i, C42 ↔ −1 e C43 ↔ −i. Observa-se o isomorfismo claramente
nas tabelas de multiplicação:
C4 Z4
E C4 C42 C43 1 i −1 −i
C4 C42 C43 E i −1 −i 1
C42 C43 E C4 −1 −i 1 i
C43 E C4 C42 −i 1 i −1
• Dados o grupo (Z; +) e o grupo cíclico Z/3 = {0, 1, 2; + (mod 3)}, o mapeamento Φ : (Z; +) 7−→
Z/3, onde para todo n ∈ Z, Φ (n) = n (mod 3) forma um epimorfismo.
• Dados H ⊂ GL (2, R), formado pelo conjunto

a b
H= a > 0, b ∈ R ,
01
para qualquer u ∈ C, define-se fu : H 7−→ (C \ {0} ; ×) tal que

ab
fu = au .
01
Novamente este mapeamento consiste em um epimorfismo.

Algumas observações e consequências diretas das definições do homomorfismo Φ : G 7−→ G 0

acima:
• Se n elementos de G forem mapeados ao mesmo elemento de G 0 , diz-se que ocorre um
mapeamento ou homomorfismo n-para-1 de G para G 0 . Claramente, se n = 1 para todo
g ∈ G, o mapeamento se reduz a um isomorfismo.
• Se I ∈ G e I 0 ∈ G 0 forem os respectivos elementos identidade, então, para todo g ∈ G e
g 0 = Φ (g) ∈ G 0 ,
g 0 = Φ (I ∗ g) = Φ (I) • Φ (g) = Φ (I) • g 0 =⇒ I 7−→ I 0 . (3.8a)
Ou seja, o elemento identidade em G é sempre mapeado ao elemento identidade I 0 em G 0 .
−1 −1
• Se g, g −1 ∈ G forem tais que g ∗g −1 = I e g 0 , (g 0 ) ∈ G 0 forem tais que g 0 •(g 0 ) = I 0 e g 0 = Φ (g),
então
−1
I 0 = Φ g ∗ g −1 = Φ (g) • Φ g −1 = g 0 • Φ g −1 =⇒ (g 0 ) = Φ g −1 .

(3.8b)
Ou seja, o elemento inverso em G é mapeado ao respectivo elemento inverso em G 0 .
• Se o elemento g ∈ G for de ordem n (finita), i. e., g n = I, então
I 0 = Φ (g n ) = Φ (g) • Φ g n−1 = g 0 • Φ g n−1 = · · · = g 0 • g 0 • · · · • g 0 .

| {z }
n vezes
Ou seja,
n
(g 0 ) = I 0 . (3.8c)
O teorema a seguir está relacionado com a propriedade (3.8c).

Teorema 3.5 (Ordem da imagem sob o homomorfismo). Sejam os grupos G = {G; ∗; I} e G 0 =
{G0 ; •; I 0 }. Seja o mapeamento Φ : G −→ G 0 , o qual forma um homomorfismo de G em G 0 . Seja g ∈ G
um elemento de ordem finita. Então, ord (Φ (g)) divide ord (g).
Demonstração. Seja g 0 = Φ (g); sejam n, m ∈ Z tais que n = ord (g) e m = ord (g 0 ). Então, elevando-
m km
se ambos os lados da identidade (g 0 ) = I 0 a uma potência inteira positiva k resulta (g 0 ) = I 0,
o que implica, pela propriedade (3.8c), que
n
km = n =⇒ = k = 1, 2, . . . .
m
Se o mapeamento for monomórfico, então, necessariamente, m = n; caso contrário, é possível

que m < n. A ordem da imagem do homomorfismo também é um divisor da ordem do grupo do
domínio. A demonstração disto é dada pelo primeiro teorema do isomorfismo abaixo.
Mais algumas definições e consequências importantes:
Definição 3.23 (Núcleo e imagem do homomorfismo). Dado o homomorfismo Φ : G 7−→ G 0 , o
núcleo 18 de Φ é o conjunto de elementos de G que são mapeados ao elemento identidade de G 0 .
Este conjunto é representado por
ker (Φ) = {g ∈ G | Φ (g) = I 0 } .
A imagem de Φ é o conjunto de imagens dos elementos de G em G 0 , i. e.,
Im (Φ) ≡ Φ (G) = {Φ (g) , ∀g ∈ G} .
A importância das definições acima está nos seguintes teoremas:

Teorema 3.6 (Primeiro teorema do isomorfismo). Dados os grupos G = {G; ∗} e G 0 = {G0 ; •},
se o mapeamento Φ : G 7−→ G 0 forma um homomorfismo de G em G 0 , então:
1. O núcleo do homomorfismo forma um subgrupo invariante de G.

2. A imagem do homomorfismo forma um subgrupo de G 0 .
18 Em alemão: Kernel.

3. A imagem do homomorfismo é isomórfica ao grupo fator G/ ker (Φ).
Demonstração. Será demonstrada aqui somente a primeira afirmação do teorema. Primeiro,

demonstra-se que ker (Φ) forma um subgrupo. Dados g1 , g2 ∈ ker (Φ), observa-se que
Φ (g1 ∗ g2 ) = Φ (g1 ) • Φ (g2 ) = I 0 ,
portanto, g1 ∗ g2 ∈ ker (Φ) e a condição de clausura é satisfeita. Dado agora g1 ∈ ker (Φ) e g1−1 ∈ G.
Então,
I 0 = Φ g1 ∗ g1−1 = Φ (g1 ) • Φ g1−1 ;

ou seja, se g1 ∈ ker (Φ), então necessariamente g1−1 ∈ ker (Φ), e os axiomas de grupo são satisfeitos.
Para demonstrar agora que ker (Φ) é invariante, é necessário que para todo g ∈ G, g ker (Φ) g −1 =
ker (Φ). Então, para todo gk ∈ ker (Φ),
Φ g ∗ gk ∗ g −1 = Φ (g) • Φ (gk ) • Φ g −1 = Φ (g) • I 0 • Φ g −1

= Φ (g) • Φ g −1 = Φ g ∗ g −1 = I 0 .

Portanto, para qualquer g ∈ G, g ∗ gk ∗ g −1 ∈ ker (Φ) e o grupo é invariante.
Teorema 3.7 (Segundo teorema do isomorfismo). Dado o grupo G, seja H ⊆ G um subgrupo de

G e N um subgrupo invariante de G, então:
1. O produto HN é um subgrupo de G.
T
2. A intersecção H N é um subgrupo invariante de H.
T
3. Os grupos fatores (HN ) /N e H/ (H N ) são isomórficos.
Teorema 3.8 (Terceiro teorema do isomorfismo). Dado o grupo G com subgrupos invariantes
N e K tais que
K ⊆ N ⊆ G,
então:
1. O fator N /K é um subgrupo normal do grupo fator G/K.
2. O grupo fator (G/K) / (N /K) é isomórfico a G/N .
Finalmente, o teorema a seguir afirma a singular importância do grupo simétrico Sn dentro

da classe dos grupos finitos.
Teorema 3.9 (Teorema de Cayley 19 ). Todo grupo G é isomórfico a um subgrupo do grupo simé-
trico Sym (G) atuando sobre G.
A demonstração deste teorema pode ser realizada tanto para grupos finitos quanto para
qualquer outro tipo de grupo.
Demonstração. (grupos finitos) Dado o grupo G = {G; ∗} de ordem n, onde G = {a1 , a2 , . . . , an }.

Dado o elemento b ∈ G, o produto
bG = {b ∗ a1 , b ∗ a2 , . . . , b ∗ an }
contém todos os elementos de G, porém arranjados em uma ordem distinta da original, de acordo
com o teorema 3.1. Dado agora o grupo Sn , existe sempre um elemento πb ∈ Sn , cuja ação em G
irá permutar o elementos do conjunto na mesma ordem de bG, ou seja,

1 2 ... n
πb G = bG =⇒ πb = ,
πb (ba1 ) πb (ba2 ) . . . πb (ban )
onde πb (bai ) = 1, 2, . . . , n é a operação que fornece a posição original do elemento ai e cujo orde-
namento em πb indica a nova posição. Realiza-se então a associação b −→ πb .
19 Em homenagem ao matemático britânico Arthur Cayley (1821 – 1895).

Toma-se agora um outro elemento c ∈ G, a partir do qual é gerado o conjunto cG. O novo
ordenamento dos elementos de G é descrito agora por um outro operador πc ∈ Sn , dado por

1 2 ... n
πc = .
πc (ca1 ) πc (ca2 ) . . . πc (can )
Realiza-se então a associação c −→ πc . Procede-se desta forma para todos ai ∈ G (i = 1, . . . , n),

criando-se o subconjunto Pnn ⊆ Sn , composto por todas as permutações πai ←− ai . Em particu-
lar, como c ∗ b ∗ ai ∈ G, deve existir um elemento πcb ∈ Pnn que descreve a permutação levada a
cabo por (c ∗ b) G, ou seja, se

1 2 ... n
πcb = =⇒ c ∗ b −→ πcb .
πc (cba1 ) πc (cba2 ) . . . πc (cban )
Para provar que existe um isomorfismo entre G e algum subgrupo de Sn , é necessário mostrar
que o conjunto Pnn forma um subgrupo de Sn e que sua tabela de multiplicações é idêntica à
tabela de G, ou seja, assim como d = c ∗ b, é necessário que πc ◦ πb = πcb .
Para tanto, observa-se que no operador πc , por exemplo, a ordem numérica na primeira linha
é irrelevante, uma vez que as posições na segunda linha serão sempre referentes às posições na
primeira. Então, pode-se escrever

πb (ba1 ) πb (ba2 ) . . . πb (ban )
πc = .
πc (c (ba1 )) πc (c (ba2 )) . . . πc (c (ban ))
Ou seja,

πb (ba1 ) πb (ba2 ) . . . πb (ban ) 1 2 ... n
πc ◦ πb = ◦
πc (c (ba1 )) πc (c (ba2 )) . . . πc (c (ban )) πb (ba1 ) πb (ba2 ) . . . πb (ban )

1 2 ... n
= = πcb .
πc (c (ba1 )) πc (c (ba2 )) . . . πc (c (ban ))
A associação I ∈ G com I ∈ Sn também é respeitada, uma vez que π1 = I faz necessariamente

parte de Pnn . Além disso, como a−1
i ∈ G, também é necessariamente feita a associação a−1i −→
πa−1 ∈ Pnn . Finalmente, como |Pnn | = n, o mapeamento é sobrejetivo e injetivo, ou seja, existe
i
um isomorfismo entre G e Pnn .
Exercício 3.15. Use o teorema de Cayley para demonstrar o isomorfismo entre os grupos C3v e
S3 .
Resolução: Representando o triângulo equilátero da figura 3.5a pela sequência de vértices {abc},
temos a seguinte associação entre os elementos de C3v e de S3 , sendo estes dados na notação
cíclica do exemplo 3.4:
C3 {abc} = {cab} −→ π5 {abc} = (132) {abc} = {cab} =⇒ C3 7−→ π5

C32 {abc} = {bca} −→ π4 {abc} = (123) {abc} = {bca} =⇒ C32 7−→ π4
σv16 {abc} = {acb} −→ π2 {abc} = (23) {abc} = {acb} =⇒ σv16 7−→ π2
σv24 {abc} = {cba} −→ π6 {abc} = (13) {abc} = {cba} =⇒ σv24 7−→ π6
σv35 {abc} = {bac} −→ π3 {abc} = (12) {abc} = {bac} =⇒ σv35 7−→ π3 .
Assim, as tabelas de multiplicação ficam idênticas e o isomorfismo demonstrado, se uma das

tabelas de multiplicação for alterada adequadamente, como por exemplo:
S3 C3v
I π2 π3 π4 π5 π6 E σv16 σv35 C32 C3 σv24
2
π2 I π4 π3 π6 π5 σv16 E C3 σv35 σv24 C3
π3 π5 I π6 π2 π4 σv35 C3 E σv24 σv16 C32
π4 π6 π2 π5 I π3 C32 σv24 σv16 C3 E σv35
π5 π3 π6 I π4 π2 C3 σv35 σv24 E C32 σv16
π6 π4 π5 π2 π3 I σv24 C32 C3 σv16 σv35 E

120 3.7. Estruturas algébricas
3.7 E STRUTURAS ALGÉBRICAS

Nesta seção será feita uma descrição sucinta de algumas Estruturas Algébricas, entre as
quais os grupos estão contidos. A principal razão para tanto está na necessidade de definição
formal de uma álgebra, onde serão discutidos os grupos e a álgebra de Lie.
Uma estrutura algébrica é composta por um conjunto de objetos, os quais se interrelaci-
onam através de uma ou mais operações finitárias definidas sobre o conjunto. As definições
dessas operações finitárias e de outros conceitos envolvendo relações entre objetos contidos em
conjuntos serão apresentadas antes de se definir as estruturas propriamente ditas.
Definição 3.24 (Operação finitária). Uma operação finitária é uma operação (ou ação ou pro-
cedimento) aplicada sobre um número finito de objetos, produzindo um resultado.
Se a operação é realizada sobre um número infinito de objetos, está é denominada operação
infinitária. Dentre as operações finitárias, as mais comuns são:
• Operações 1-árias ou unárias: operações executadas sobre um único objeto.
• Operações 2-árias ou binárias: operações executadas entre dois objetos. Adição e multipli-
cação são os exemplos mais comuns de operações binárias.
Definição 3.25 (Estrutura algébrica). Seja C um conjunto de objetos e F uma coleção de
operações sobre C e elementos especiais. A dupla hC, F i é denominada uma estrutura algébrica
sobre C.
Muitas vezes, por simplicidade e quando não houver ambiguidade, representa-se a estrutura
hC, F i simplesmente por C. Na sua maior generalidade possível, estruturas algébricas podem
envolver um número arbitrário de conjuntos e uma vasta coleção de operações entre os mesmos.
De interesse à física, serão definidas somente estruturas envolvendo, no máximo, dois conjuntos
e com, no máximo, duas operações definidas sobre os mesmos.
Definição 3.26 (Produto Cartesiano de conjuntos). Dados m conjuntos C1 , . . . , Cn , o seu pro-
duto Cartesiano é o conjunto
.
C n ≡ C1 × · · · × Cn = {(c1 , . . . , cn ) | ck ∈ Ck , ∀1 6 k 6 n} .
O objeto (c1 , . . . , cn ) é denominado uma n-upla ordenada. Se n = 2, a 2-upla é também denomi-

nada de par ordenado.
Definição 3.27 (Comutatividade, associatividade e distributividade de operações biná-
rias). Dado o conjunto C, denota-se por C 2 ou C × C o produto Cartesiano de todas as duplas
ordenadas formadas em C e por χ : C 2 −→ C a função que executa a operação binária entre os
elementos de um par ordenado e com resultado aplicado sobre C. Dados a, b, c ∈ C, a operação
binária entre quaisquer pares destes é denotada por aχb. Definem-se então as seguintes leis de
operações binárias:
Lei da associatividade: Uma operação binária χ : C 2 −→ C é dita associativa se
aχ (bχc) = (aχb) χc.
Lei da comutatividade: Uma operação binária χ : C 2 −→ C é dita comutativa ou Abeliana se
aχb = bχa.
Lei da distributividade: Dadas duas operações binárias χ1 , χ2 : C 2 −→ C, a operação χ1 é dita

distributiva em relação a χ2 se:
aχ1 (bχ2 c) = (aχ1 b) χ2 (aχ1 c) .
Exemplo 3.11. A estrutura algébrica mais conhecida é hR, +, ×i, a qual usa as operações de
adição (“+”) e multiplicação (“×”) usuais. De acordo com a definição acima, dados a, b, c ∈ R:
• Adição é associativa: a + (b + c) = (a + b) + c.

• Multiplicação é associativa: a × (b × c) = (a × b) × c.
• Adição é comutativa: a + b = b + a.
• Multiplicação é comutativa: a × b = b × a.
• Multiplicação é distributiva em relação a adição: a × (b + c) = (a × b) + (a × c).
• Adição não é distributiva em relação a multiplicação: a + (b × c) 6= (a + b) × (a + c) = a +

(b × c) + a × [a + b + c − 1].
Dentre as diversas estruturas algébricas já definidas, as de interesse podem ser agrupadas

da maneira apresentada a seguir.
3.7.1 E STRUTURAS COMPOSTAS POR UM CONJUNTO COM OPERA -

ÇÕES
Consiste nas estruturas com uma única estrutura hC, F i. Dentre estas, destacam-se:
3.7.1.1 E STRUTURAS DO TIPO GRUPO
Estruturas que contêm uma única operação binária.
Magma ou grupóide. Dado o conjunto C e a operação binária • : C 2 → C, a estrutura hC, •i será

um grupóide se os seus elementos satisfizerem:
Condição de clausura: ∀a, b ∈ C, a • b ∈ C.
Semigrupo. Dado o conjunto C e a operação binária •, denominada produto, a estrutura hC, •i

será um semigrupo se os seus elementos satisfizerem:
Condição de associatividade: ∀a, c, b ∈ C, a • (b • c) = (a • b) • c.
Nota-se aqui que a condição de clausura está ausente.
Subsemigrupo. Um subsemigrupo de hC, •i é um subconjunto não vazio D ⊆ C o qual

satisfaz a condição de clausura sob o produto do semigrupo, i. e., ∀a, b ∈ D, a • b ∈ D.
Um subsemigrupo pode ser considerado um grupóide com a condição de associatividade.
Monóide. Dado o conjunto C e a operação binária •, denominada produto, a estrutura hC, •i

será um monóide se os seus elementos satisfizerem:
Condição de associatividade: ∀a, c, b ∈ C, a • (b • c) = (a • b) • c.

Elemento identidade: ∃I ∈ C tal que ∀a ∈ C, a • I = I • a = a.
Um monóide consiste em um semigrupo com elemento identidade.
Submonóide. Um submonóide de hC, •i é um subconjunto não vazio D ⊆ C o qual satisfaz

a condição de clausura sob o produto do monóide, i. e., ∀a, b ∈ D, a • b ∈ D, e contém a
identidade, i. e., I ∈ D.
Grupo. Dado o conjunto C e a operação binária • : C 2 → C, denominada produto, a estrutura

hC, •i será um grupo se satisfizer os axiomas de grupo da definição 3.1.
Percebe-se nas definições acima que, partindo de um magma, cada estrutura posterior pode
ser considerada, sob certas condições, uma extensão das estruturas anteriores. O diagrama na
figura 3.10 representa esta evolução condicional. Cada estrutura ao final de uma seta “herda”
as propriedades da estrutura anterior. A inversão no sentido das setas depende da adição de
condições adicionais sobre a estrutura; por exemplo, todo grupo é um monóide, mas nem todo
monóide é um grupo. É necessário também mencionar que nesta seção somente foram definidas
as estruturas do lado direito do diagrama. As estruturas do lado esquerdo estão adicionalmente
condicionadas à satisfação do axioma da divisão 3.2.

Figura 3.10: Diagrama representando a evolução na

complexidade das estruturas algébricas do tipo grupo.
A complexidade aumenta nos sentidos das setas. Es-
truturas no lado esquerdo do diagrama são equivalen-
tes às estruturas do lado direito, porém com a inclusão
do axioma da divisão.
3.7.1.2 E STRUTURAS DO TIPO ANEL
Estruturas contendo duas operações binárias, denominadas adição e produto, sendo que o
produto é distributivo em relação a adição.
Semianel. Dado o conjunto R e as operações binárias ⊕, denominada adição e •, denominada

produto, a estrutura hR, ⊕, •, 0, Ii será um semianel se, dados a, b, c ∈ R estes satisfizerem:
1. Frente a adição. O semianel é um monóide comutativo, i. e.:

(a) Associatividade: a ⊕ (b ⊕ c) = (a ⊕ b) ⊕ c.
(b) Comutatividade: a ⊕ b = b ⊕ a.
(c) Elemento identidade: ∃0 ∈ R tal que a ⊕ 0 = 0 ⊕ a = a.
2. Frente ao produto. O semianel é um monóide, i. e.:
(a) Associatividade: a • (b • c) = (a • b) • c.
(b) Elemento identidade: ∃I ∈ R tal que a • I = I • a = a.
3. Distributividade. O produto é distributivo frente a adição tanto pela esquerda quanto
pela direita:
(a) Distributividade pela esquerda: a • (b ⊕ c) = (a • b) ⊕ (a • c).
(b) Distributividade pela direita: (a ⊕ b) • c = (a • c) ⊕ (b • c).
Uma operação que respeita distributividade por ambos os lados é também denominada
biaditiva.
4. Produto por 0: a • 0 = 0 • a = 0.
Semianel comutativo. Consiste em um semianel o qual é comutativo frente ao produto.
Quaseanel. Dado o conjunto R e as operações binárias ⊕, denominada adição e •, denominada

produto, a estrutura hR, ⊕, •, 0i será um quaseanel se, dados a, b, c ∈ R estes satisfizerem:
1. Frente a adição. O quaseanel forma um grupo, sendo 0 ∈ R o elemento identidade.

2. Frente a multiplicação. O quase anel forma um semigrupo.
3. Distributividade. O produto é distributivo frente a adição pela direita: (a ⊕ b) • c =
(a • c) ⊕ (b • c).
Anel não associativo. Dado o conjunto R e as operações binárias ⊕, denominada adição e •,

denominada produto, a estrutura hR, ⊕, •, 0i será um anel não associativo se, dados a, b, c ∈ R
estes satisfizerem:
1. Frente a adição. O anel forma um grupo Abeliano, sendo 0 ∈ R o elemento identidade

e, para todo a ∈ R, o elemento −a ∈ R é a sua inversa aditiva: a ⊕ (−a) = −a ⊕ a = 0.
2. Distributividade. O produto é biaditivo frente a adição.

Anel de Lie. Um anel de Lie é um anel não associativo composto por um conjunto L com
a operação de adição, denotada por ” + ”, e a operação de colchete (ou colchete de Lie),
denotada por “[ , ]”. A estrutura hL, +, [ , ] , 0i será um anel de Lie se, dados x, y, z ∈ L
estes satisfizerem as seguintes condições:
1. Frente ao colchete de Lie. Os elementos do anel devem satisfazer:

(a) Anticomutatividade: [x, y] = − [y, x]. Por consequência, [x, x] = 0.
(b) Identidade de Jacobi: [x, [y, z]] + [y, [z, x]] + [z, [x, y]] = 0.
2. Distributividade. O colchete de Lie é biaditivo em relação a adição:
[x + y, z] = [x, y] + [y, z] e [x, y + z] = [x, y] + [x, z] .
É importante mencionar aqui que anéis de Lie não são grupos de Lie frente a adição.
Anel. Dado o conjunto R e as operações binárias ⊕, denominada adição e •, denominada pro-
duto, a estrutura hR, ⊕, •, 0, Ii será um anel se, dados a, b, c ∈ R estes satisfizerem os axiomas
de anel:
1. Frente a adição. O anel forma um grupo Abeliano, sendo 0 ∈ R o elemento identidade

e, para todo a ∈ R, o elemento −a ∈ R é a sua inversa aditiva: a ⊕ (−a) = −a ⊕ a = 0.
2. Frente ao produto. O anel forma um monóide, sendo I ∈ R o elemento identidade.
3. Distributividade. O produto é distributivo frente a adição tanto pela esquerda quanto
pela direita.
Anel comutativo. Consiste em um anel o qual é comutativo frente ao produto.
Corpo. Dado o conjunto K e as operações binárias ⊕, denominada adição e •, denominada

.
produto, a estrutura K = hK, ⊕, •, 0, Ii será um corpo 20 se, dados a, b, c ∈ K estes satisfizerem:
1. Condições de clausura: a ⊕ b ∈ K e a • b ∈ K.
2. Condições de associatividade: a ⊕ (b ⊕ c) = (a ⊕ b) ⊕ c e a • (b • c) = (a • b) • c.
3. Condições de comutatividade: a ⊕ b = b ⊕ a e a • b = b • a.
4. Elementos identidades: ∃0 ∈ K tal que a ⊕ 0 = 0 ⊕ a = a e ∃I ∈ K tal que a • I = I • a = a.
5. Elementos inversos: para todo a ∈ K existe −a ∈ K tal que a ⊕ (−a) = −a ⊕ a = 0. Para
todo a ∈ K \ {0}, existe a−1 ∈ K tal que a ⊕ a−1 = a−1 ⊕ a = I.
6. Distributividade: O produto é distributivo em relação a adição: a • (b ⊕ c) = (a • b) ⊕
(a • c).
Um corpo, portanto, consiste em dois grupos Abelianos frente a cada operação algébrica,
com o embargo de que o elemento I possui inversa frente a adição, mas o elemento 0 não
possui inversa frente ao produto.
Dentre as estruturas recém apresentadas, é interessante destacar aquelas que tipificam as
definições básicas da teoria de conjuntos; quais sejam:
• O semianel comutativo hN, +, ×, 0, 1i.
• O anel comutativo hZ, +, ×, 0, 1i.
. .
• Os corpos: Q = hQ, +, ×, 0, 1i dos números racionais e I = hI, +, ×, 0, 1i dos números irracio-
nais.
.
O corpo real. O corpo21 R = hR, +, ×, 0, 1i, formado pelos grupos Abelianos {R; +} e {R∗ ; ×},
onde “+” e “×” são as operações de adição e multiplicação algébricas, respectivamente.
.
O corpo complexo. O corpo C = hC, +, ×, 0, 1i, formado pelos grupos Abelianos {C; +} e
{C∗ ; ×}, onde “+” e “×” são as operações de adição e multiplicação algébricas de nú-
meros complexos,22 respectivamente. Cabe mencionar aqui que o corpo R está contido
no corpo C, em cuja situação é denominado um subcorpo.
20 O termo corpo empregado em português segue os termos em alemão Körper e em francês corps. Textos em inglês
normalmente usam o termo field.

21 Note a diferença tipográfica entre o corpo R e o conjunto R.
22 Ver seção 2.2.

3.7.2 E STRUTURAS DO TIPO M ÓDULO

Consistem em sistemas de duas estruturas hC1 , F1 i e hC2 , F2 i, muitas das quais definidas na
seção anterior. Tratam-se de sistemas compostos por duas estruturas, cada uma envolvendo,
no mínimo, duas operações binárias.
Dentre as estruturas compostas por dois conjuntos e por duas operações binárias, destacam-
se as seguintes.
Grupo com operadores. A estrutura hG, Ωi é denominada um grupo com operadores ou Ω-grupo.
Esta estrutura é composta por um grupo G = (G; •) e um conjunto Ω cujos elementos
operam sobre os elementos do grupo de uma determinada maneira. O Ω-grupo é definido
com a ação de Ω sobre G: Ω × G → G : (ω, g) 7→ g ω , sendo ω ∈ Ω e g ∈ G, de tal forma que a
operação é distributiva em relação ao produto de grupo:
ω
(g • h) = g ω • hω , onde h ∈ G.
Para todo ω ∈ Ω, o mapeamento g 7→ g ω consiste em um endomorfismo de G. Portanto,

o Ω-grupo pode ser visualizado como um grupo G com uma família indexada (uω )ω∈Ω de
endomorfismos de G.
Uma ação de G sobre G é um caso particular de um Ω-grupo quando Ω = G. Por exemplo,
a ação esquerda de grupo é o endomorfismo G × G → G tal que para todos g1 , g2 ∈ G,
(g1 , g2 ) 7→ g1 • g2 . Escrevendo simbolicamente esta ação como g1 G, observa-se que esta se
trata simplesmente de uma classe lateral esquerda do grupo.
Espaço vetorial. Devido a sua importância, espaços vetoriais são discutidos em mais detalhes
no capítulo 4.
Módulo. Um módulo sobre um anel consiste em uma generalização da noção de um espaço

vetorial sobre um corpo, apresentado acima, sendo que os escalares são elementos de um
anel, ao invés de um corpo. Além disso, os produtos por escalares ocorrem em ambos os
lados.
Dado um grupo Abeliano M = hM, +, 0i frente a operação de adição “+” e com elemento
.
identidade 0 ∈ M. Dado também o anel A = hA, ⊕, •, 0, Ii e, finalmente, dada a operação
. : A × M → M, denominada produto, a estrutura hM, A, .i pode ser definida de duas
maneiras:
.
A-Módulo à esquerda. O A-módulo à esquerda M = hM, A, .i é tal que o produto satisfaz
as condições:
1. Clausura no grupo. Para todo a ∈ A e para todo m ∈ M, a.m ∈ M.
2. Associatividade. Para cada a, b ∈ A e m ∈ M, a. (b.m) = (a • b) .m.
3. Produto pela unidade de A. Para todo m ∈ M, I.m = m.
4. Distributividade. Para a, b ∈ A e m, n ∈ M,
a. (m + n) = a.m + a.n
(a ⊕ b) .m = a.m + b.m.
.
A-Módulo à direita. O A-módulo à direita MR = hM, A, .R i possui produto (.R ≡ .) que sa-
tisfaz:
1. Clausura no grupo. Para todo a ∈ A e para todo m ∈ M, m.a ∈ M.
2. Associatividade. Para cada a, b ∈ A e m ∈ M, (m.a) .b = m. (a • b).
3. Produto pela unidade de A. Para todo m ∈ M, m.I = m.
4. Distributividade. Para a, b ∈ A e m, n ∈ M,
(m + n) .a = m.a + n.a
m. (a ⊕ b) = m.a + m.b.

3.7.3 E STRUTURAS DO TIPO ÁLGEBRA

Sistemas compostos definidos sobre duas estruturas: um espaço vetorial e um corpo ou
um anel e um A-módulo, equipados com uma operação adicional, o que totaliza no mínimo 5
operações binárias: duas operações no espaço vetorial/anel, duas no corpo/A-módulo e uma
envolvendo elementos de ambas as estruturas.
Álgebra sobre um corpo. Trata-se de um espaço vetorial equipado com um mapa bilinear.
.
Seja A = hA, K, +, .i um espaço vetorial sobre o corpo K = hK, ⊕, •, 0, Ii. Define-se a operação
binária × : A × A 7−→ A , denominada produto de vetores. Então A será denominada uma
álgebra sobre K se, para todo x, y, z ∈ A e para todo a, b ∈ K, as seguintes condições forem
satisfeitas:
• Distributividade pela esquerda: (x + y) × z = x × z + y × z.
• Distributividade pela direita: x × (y + z) = x × y + x × z.
• Compatibilidade com escalares: (a.x) × (b.y) = (a • b) . (x × y).
Álgebra sobre um anel comutativo. Esta álgebra generaliza o conceito de uma álgebra sobre
um corpo, ao substituir este último por um anel comutativo.
.
Seja A = hA, ⊕, •, 0, Ii um anel comutativo e M o A-módulo definido sobre A. Uma álgebra
sobre um anel comutativo, ou A-álgebra, é obtida a partir da definição da operação binária
[ , ] : M × M → M , denominada A-produto, o qual satisfaz a condição:
• Bilinearidade: para todo x, y, z ∈ M e a, b ∈ A,
[a.x + b.y, z] = a. [x, y] + b. [y, z]

[x, a.y + b.z] = a. [x, y] + b. [x, z] .
Álgebra associativa. Dada uma A-álgebra, esta é dita associativa se o A-produto for asso-
ciativo, i. e., para todo x, y, z ∈ M ,
[x, [y, z]] = [[x, y] , z] .
Álgebra não associativa. Quando o A-produto não for associativo. Neste caso, o resultado
de [x, [y, z]] pode ser definido de diferentes maneiras, o que gera álgebras especiais,
como a álgebra de Lie.
Cabe mencionar que a classificação de álgebras entre associativas ou não associativas

também é aplicável para álgebras sobre corpos.
Álgebra de Lie. Estas álgebras são não associativas, sendo que o produto da álgebra satisfaz a
identidade de Jacobi. A sua importância reside no contexto de teoria de grupos contínuos
(grupos de Lie) porque estão associadas às operações de isosimetria de um sistema físico.
As álgebras de Lie surgem a partir dos geradores de grupos de Lie, geradores estes que são
transformações infinitesimais. Esta álgebra será definida a partir de um espaço vetorial
sobre um corpo, mas pode ser também generalizada no contexto de A-álgebras.
. .
Uma álgebra de Lie é um espaço vetorial g = hg, K, +, .i sobre o corpo K = hK, ⊕, •, 0, Ii com a
operação [ , ] : g × g → g, denominada colchete de Lie, a qual, para todos x, y, z ∈ g e a, b ∈ K,
satisfaz os axiomas:
• Bilinearidade: [a.x + b.y, z] = a. [x, z] + b. [y, z] , [z, a.x + b.y] = a. [z, x] + b. [z, y].
• Anticomutatividade: [x, y] = − [y, x]. Por consequência, [x, x] = 0.
• Identidade de Jacobi: [x, [y, z]] + [y, [z, x]] + [z, [x, y]] = 0.
R EFERÊNCIAS
ALABISO, C.; WEISS, I. A Primer on Hilbert Space Theory: Linear Spaces, Topological Spaces,
Metric Spaces, Normed Spaces, and Topological Groups. New York: Springer, 2014. (UNITEXT for
Physics). 255 + xvii pp. ISBN: 9783319037134. DOI: 10.1007/978-3-319-03713-4.

126 REFERÊNCIAS
BARATA, João Carlos Alves. Notas para um Curso de Física-Matemática. São Paulo: USP. Versão
de 28/02/2018. Disponível em: <http://denebola.if.usp.br/~jbarata/Notas_de_aula/>.
BASSALO, José Maria F.; CATTANI, Mauro Sérgio D. Teoria de Grupos. Segunda edição. São
Paulo: Livraria da Física, 2008. 286 + ix pp. ISBN: 9788578610005.
DRESSELHAUS, S.; DRESSELHAUS, G.; JORIO, Ado. Group Theory: Application to the Physics of
Condensed Matter. Berlin: Springer, 2008. 582 + xv pp. ISBN: 9783540328971. DOI: 10.1007/
978-3-540-32899-5.
FAZZIO, A.; WATARI, K. Introdução à Teoria de Grupos: com Aplicações em Moléculas e Sólidos.
Santa Maria: UFSM, 1998. 239 pp. ISBN: 85-7391-010-0.
HAMERMESH, Morton. Group Theory and Its Application to Physical Problems. New York: Dover
Publications, 2012. (Dover Books on Physics). ISBN: 9780486140391. Disponível em: <http:
//books.google.com.br/books?id=w6PDAgAAQBAJ>.
JOSHI, A. W. Elements of Group Theory for Physicists. Third Ed. New Delhi: John Wiley & Sons,
1982. 348 + xv pp. ISBN: 0-470-27306-2.
MESSIAH, Albert. Quantum Mechanics. Volume I. Amsterdam: North-Holland, 1961. 1136 + xxii
pp. ISBN: 0-486-40924-4.
RILEY, K. F.; HOBSON, M. P.; BENCE, S. J. Mathematical Methods for Physics and Engineering.
Third Ed. Cambridge: Cambridge University Press, 2006. 1333 + xxvii pp. ISBN: 9781139450997.
Disponível em: <http://books.google.com.br/books?id=Mq1nlEKhNcsC>.
SZEKERES, Peter. A Course in Modern Mathematical Physics: Groups, Hilbert Space, and Differen-
tial Geometry. Cambridge: Cambridge University Press, 2004. ISBN: 9780521536455. Disponível
em: <http://books.google.com.br/books?id=pRgjkgEACAAJ>.
TINKHAM, M. Group Theory and Quantum Mechanics. [S.l.]: Dover Publications, 2012. (Dover
Books on Chemistry). 340 + xii pp. ISBN: 9780486131665. Disponível em: <https://books.
google.com.br/books?id=oe7DAgAAQBAJ>.

4
E SPAÇOS V ETORIAIS
CONCEITO DE ESPAÇO VETORIAL possui importância singular para a física-matemática,
O pois todas as áreas da matemática aplicada, da física contemporânea e engenharia

fazem uso de suas propriedades. Suas propriedades fornecem os fundamentos para
o tratamento de sistemas de equações lineares, séries de Taylor e Fourier, na solução
de equações diferenciais parciais, entre outras técnicas comumente empregadas em matemática
aplicada. Espaços vetoriais fornecem também um ferramental abstrato e livre de coordenadas
para o estudo das propriedades de objetos geométricos e físicos tais como tensores, a teoria
quântica, a estrutura cristalina da matéria e a própria estrutura do espaço-tempo. Isso tudo é
possível devido à possibilidade de se estender o conceito de um espaço vetorial, a partir de uma
estrutura puramente algébrica e abstrata, para uma estrutura mais elevada, a qual contém
elementos de análise matemática, geometria e topologia.
Historicamente, as primeiras concepções que levaram ao conceito de um espaço vetorial po-
dem ser traçadas para o início do século XVII, quando foi desenvolvida a teoria da geometria
afim com a introdução das coordenadas em espaços de duas ou três dimensões. Por volta do
ano 1636, os matemáticos franceses René Descartes (1596 – 1650) e Pierre de Fermat (1607
– 1665) fundaram a disciplina da geometria analítica através do mapeamento das soluções de
equação de duas variáveis a pontos sobre uma superfície. O desenvolvimento histórico que cul-
minou com o conceito moderno de um espaço vetorial como uma estrutura algébrica (ver seção
3.7) ocorreu ao longo dos séculos XVIII – XX, contando com as contribuições de diversos ma-
temáticos importantes, tais como Jean-Robert Argand (1768 – 1822), Bernard Bolzano (1781 –
1848), August Ferdinand Möbius (1790 – 1868), C. V. Mourey (1791? – 1830?), Giusto Bellavitis
(1803 – 1880), William Rowan Hamilton (1805 – 1865), Hermann Günther Grassmann (1809 –
1877), Arthur Cayley (1821 – 1895), Edmond Laguerre (1834 – 1886), Giuseppe Peano (1858 –
1932), David Hilbert (1862 – 1943), Henri Léon Lebesgue (1875 – 1941) e Stefan Banach (1892 –
1945). Atualmente, a teoria das estruturas algébricas continua sendo desenvolvida como parte
da teoria das categorias, criada por Samuel Eilenberg (1913 – 1998) e Saunders Mac Lane (1909
– 2005).
Neste capítulo serão apresentadas algumas das propriedades básicas de espaços vetoriais.
Os principais objetivos deste capítulo são:
• Caracterizar um espaço vetorial como uma estrutura algébrica abstrata, hierarquicamente
superior aos grupos discutidos no capítulo 3. A categorização de um espaço vetorial como
uma estrutura algébrica foi realizada na seção 3.7.
• Prover conceitos e propriedades fundamentais que serão empregados posteriormente nos
capítulos que tratam da teoria de representações de grupos (capítulo 5) e de tensores (ca-
pítulo 6).
Para atingir estes objetivos, na seção 4.8 o capítulo também abandona temporariamente a dis-
cussão de uma estrutura puramente algébrica para introduzir elementos de espaços métricos
e topologia, os quais possibilitarão a definição de espaços vetoriais métricos ou topológicos,
fundamentais para as teorias modernas da física.
4.1 E SPAÇO VETORIAL

O conceito de espaço vetorial é normalmente definido na disciplina de álgebra linear; porém,
nesta seção o mesmo conceito será apresentado como um tipo de estrutura algébrica.
127
128 4.2. Subespaços vetoriais e subespaços complementares
Definição 4.1 (Espaço vetorial). Um espaço vetorial sobre um corpo K, também denominado
.
um espaço-K, e denotado por V = hV, K, +, .i, consiste em um conjunto V de elementos denomi-
nados vetores e dotado de uma operação + : V 2 → V , denominada soma vetorial. O espaço é
.
composto também por um corpo K = hK, ⊕, •, 0, Ii, cujos elementos são denominados escalares,
e, finalmente, de uma operação . : K × V → V , denominada produto por escalar. Os conjuntos
de vetores e escalares satisfazem as seguintes propriedades frente as operações definidas:
Frente a soma vetorial. A estrutura V = hV, +, 0i forma um grupo Abeliano, sendo que o ele-
mento identidade 0 é denominado vetor nulo.
Frente ao produto por escalar. Dado o corpo K, para cada α ∈ K e u ∈ V , existe um vetor
denotado por α.u ∈ V , denominado produto de u por α, o qual satisfaz as condições:
1. Associatividade. Para cada α, β ∈ K, α. (β.u) = (α • β) .u.

2. Produto pela unidade de K. Para todo u ∈ V , I.u = u.
3. Distributividade. Para cada α, β ∈ K e u, v ∈ V , o produto por escalares segue diferen-
tes regras frente as operações “+” e “⊕”:
(a) Distributivo pela esquerda em relação a soma vetorial: α. (u + v) = α.u + α.v
(b) Distributividade mista pela direita em relação a “⊕” e “+”: (α ⊕ β) .u = α.u + β.u.
Em física, espaços vetoriais são usualmente definidos sobre corpos reais ou complexos,
quando então são também denominados espaços vetoriais reais ou espaços vetoriais comple-
xos, respectivamente. Algumas propriedades dos espaços vetoriais são discutidas na seções a
seguir.
4.2 S UBESPAÇOS VETORIAIS E SUBESPAÇOS COMPLE -

MENTARES
Um subespaço vetorial é um conjunto de vetores contidos no espaço vetorial, os quais satis-
fazem as condições de clausura frente a adição vetorial e produto por escalar.
Definição 4.2 (Subespaço vetorial). Seja V um espaço vetorial. Dado um subconjunto W ⊆ V ,

este é denominado um subespaço vetorial de V se satisfizer os axiomas de espaço vetorial.
Adicionalmente, para todos os vetores u, v ∈ W e todos os escalares α, β ∈ K, a adição vetorial e
o produto por escalar estão contidos no subespaço: α.u + β.v ∈ W .
Em particular, o subespaço W ⊆ V sempre irá conter o vetor nulo. Dados dois subespaços
U , W ⊆ V , a sua intersecção U ∩ W também é subespaço de V , pois se u, v ∈ U ∩ W , então
necessariamente α.u + β.v ∈ U ∩ W também.
4.2.1 S UBESPAÇO SOMA

Sejam os subespaços U , W ⊆ V . Embora a sua intersecção U ∩W também seja um subespaço
de V , o mesmo não pode ser dito de sua união; U ∪ W em geral não é subespaço de V . Contudo,
é sempre possível definir-se o subespaço soma:
Definição 4.3 (Subespaço soma). Sejam os subespaços U , W ⊆ V , o conjunto

.
U + W = {u + w, tais que u ∈ U e w ∈ W }
é subespaço soma de V , pois se u = u1 + w1 ∈ U + W e w = u2 + w2 ∈ U + W , então
α.u + β.w = α. (u1 + w1 ) + β. (u2 + w2 ) = (α.u1 + β.u2 ) + (α.w1 + β.w2 ) ∈ U + W .

C APÍTULO 4. Espaços Vetoriais 129
4.2.2 S UBESPAÇOS COMPLEMENTARES

A definição do subespaço soma U + W serve para determinar se U e W são também subes-
paços complementares.
Definição 4.4 (Subespaços complementares e soma direta de subespaços). Sejam os su-

bespaços U , W ⊆ V . Estes são ditos subespaços complementares se todo vetor v ∈ V possuir
uma decomposição única v = u + w, sendo que u ∈ U e w ∈ W .
Caso U , W ⊆ V sejam subespaços complementares, então V é dito ser a soma direta destes
subespaços. Esta operação é representada por
V =U ⊕W.
O teorema a seguir estabelece as condições necessárias e suficientes para a determinação de

subespaços complementares.
Teorema 4.1. Sejam os subespaços U , W ⊆ V . Estes são subespaços complementares de V se e

somente se:
1. V = U + W ;
2. U ∩ W = ∅.
Um outro tipo importante de subespaço vetorial, um subespaço invariante, será apresentado

na seção 4.5, após a definição de base de um espaço vetorial.
4.3 B ASES DE UM ESPAÇO VETORIAL

Uma base de um espaço vetorial é um conjunto de vetores que reproduz todo o espaço a
partir de combinações lineares entre os vetores do conjunto. Serão apresentadas uma série de
definições para a construção do conceito de base e obtenção de suas propriedades.
.
Definição 4.5 (Varredura linear). Seja C = {vi } ⊂ V um subconjunto do espaço vetorial V
1
sobre o corpo K. A varredura linear de C, denotada por span (C), é definida como o conjunto de
todas as combinações lineares possíveis em C; ou seja,
( )
. X
span (C) = αi .vi , ∀αi ∈ K .
i
.
Teorema 4.2 (Subespaço gerado por um conjunto). Seja C = {vi } ⊂ V um subconjunto do
espaço vetorial V sobre o corpo K. Então,
1. span (C) é um subespaço de V .
2. Se U ⊂ V é um subespaço tal que C ⊂ U , então span (C) ⊂ U .
Definição 4.6 (Espaço vetorial finito ou infinito e dimensão do espaço). Um espaço vetorial
V é dito ser de dimensão finita se este pode ser gerado a partir de um conjunto finito de vetores
Cn = {v1 , . . . , vn } ⊂ V , sendo n ∈ N:
V = span (Cn ) .
Caso não exista um conjunto finito Cn capaz de gerar V , então este é dito ser de dimensão
infinita.
Quando V tem dimensão finita, sua dimensão dim V é definida como o menor número natural
n tal que V = span (Cn ).
Será definida agora uma noção fundamental para a teoria de espaços vetoriais: a indepen-
dência (ou dependência) linear entre vetores.
1 Do inglês: linear span.

130 4.3. Bases de um espaço vetorial
Definição 4.7 (Vetores linearmente independentes). Seja V um espaço vetorial sobre o corpo
.
K. O conjunto de vetores C = {vi }, onde i = 1, 2, . . . e vi ∈ V , é dito ser linearmente independente
(identificado também por “LI”) se todos os subconjuntos finitos {vj } ⊆ C (j = 1, 2, . . . , k) forem
tais que
Xk
αj .vj = 0 ⇐⇒ αj = 0, para todo j = 1, . . . , k,
j=1

sendo que αj ⊂ K.
Um conjunto de vetores é dito ser linearmente dependente se este não for LI.
Com as definições acima, torna-se agora possível definir-se a base de um espaço vetorial.
Definição 4.8 (Base de um espaço vetorial). Seja V um espaço vetorial sobre o corpo K. Um
subconjunto B ⊂ V é denominado uma base de V se:
1. B for linearmente independente;
2. V = span (B); ou seja, se V for gerado por B.
Teorema 4.3. Todo espaço vetorial possui uma base.
Observa-se que o teorema acima é válido tanto para espaços finitos quanto para infinitos. Os
teoremas a seguir são válidos para espaços finitos.
Teorema 4.4. Seja V um espaço vetorial finito de dimensão n. Um subconjunto B = {e1 , . . . , en }

gera V se e somente se B for linearmente independente.
Corolário 4.1. Seja V um espaço vetorial finito. Se o subconjunto B = {e1 , . . . , en } é uma base de
V , então dim V = n. Ou seja, a dimensão do espaço vetorial é idêntica à cardinalidade da base.
Teorema 4.5 (Redução de base). Seja V um espaço vetorial finito de dimensão n. Se existe um
subconjunto C = {v1 , . . . , vm } ⊂ V com m > n tal que V = span (C), então ou C é uma base de V ou
um número m − n de vetores de C pode ser removido para formar uma base de V .
(Enunciado alternativo) Seja V um espaço vetorial finito de dimensão n. Seja B = {e1 , . . . , en }
uma base de V . Qualquer conjunto de vetores C = {v1 , . . . , vm } ⊂ V com m > n é linearmente
dependente.
Teorema 4.6. Seja V um espaço vetorial finito. Sejam B = {e1 , . . . , en } ⊂ V e B 0 = {e01 , . . . , e0m } ⊂ V
bases de V . Então m = n.
Demonstração. De acordo com o teorema 4.5, as inegualdades n 6 m e n > m devem ser ambas
satisfeitas. Então, n = m.
O importante teorema a seguir relaciona conjuntos LI com uma base de um espaço de di-
mensão finita.
Teorema 4.7 (Extensão de base). Seja V um espaço vetorial finito de dimensão n. Seja A =
{v1 , v2 , . . . , vm } ⊆ V um subconjunto de vetores linearmente independentes de V , sendo que m 6
n = dim V . Então existe uma base B = {e1 , e2 , . . . , en } de V tal que
e1 = v 1 , e 2 = v2 , ... e m = vm .
Em outras palavras, qualquer conjunto LI de V pode ser estendido para formar uma base
de V . Apresenta-se agora um outro importante teorema, o qual versa sobre a decomposição de
vetores.
Teorema 4.8 (Decomposição de vetores). Seja V um espaço vetorial sobre o corpo K. Se o

conjunto B = {e1 , e2 , . . . } é uma base de V , então cada vetor v ∈ V pode ser decomposto de
maneira unívoca pela combinação linear
X
v= vi .ei , (vi ∈ K) .
i
Os escalares {vi } são denominados os componentes do vetor v com respeito à base B.

4.3.1 T RANSFORMAÇÃO DE BASE

Se para um dado espaço vetorial V existirem pelos menos duas bases distintas (B e B 0 por
exemplo), então é sempre possível decompor-se um vetor da base B por uma combinação linear
dos vetores da base B 0 e vice-versa. Este processo é denominado a transformação de base
B
B0.
Seja um espaço vetorial finito V de dimensão n, o qual possui duas bases B = {e1 , . . . , en } e
B 0 = {e01 , . . . , e0n }. De acordo com o teorema 4.8, cada vetor da base B é decomposto de forma
unívoca pelos vetores da base B 0 na forma
n
X
ei = Aji .e0j , (Aij ∈ K, i = 1, . . . , n) ,
j=1
sendo Aji o j-ésimo componente do vetor ei com respeito à base B 0 .

Seja agora um vetor v ∈ V qualquer. Novamente, de acordo com o 4.8, este pode ser decom-
posto pelas duas bases como
Xn n
X
v= vi .ei = vi0 .e0i ,
i=1 i=1
sendo vi e os componentes de v em respeito às bases B e B 0 , respectivamente. Mas, empregando-

vi0
se a decomposição dos vetores em B em B 0 obtida acima, pode-se escrever
n X
X n n
X
v= (vi • Aji ) .e0j = vj0 .e0j ,
j=1 i=1 j=1
de onde se identifica a lei de transformação das componentes de v como

n
X
vi0 = Aij • vj , (i = 1, . . . , n) .
j=1
A transformação das coordenadas de um vetor pode ser representada na forma matricial.

Definindo-se novamente as matrizes coluna
   0
v1 v1
.  ..  0 .  .. 
v =  . , v =  . ,
vn vn0
a relação entre a matrizes v e v0 é dada por
v0 = Av,
ficando novamente subentendida que as multiplicações ocorrem via a operação de produto • do

corpo K.
Como é suposta a existência da transformação inversa, deve existir a matriz inversa A−1 ,
−1
∈ K, tal que AA−1 = A−1 A = In . Neste caso,

composta por elementos A ij
n
X
v = A−1 v0 =⇒ vi = A−1 • vj0 .

ij
j=1
No capítulo 6 será realizada uma longa discussão a respeito de transformações de bases em

espaços Euclideanos ou Riemannianos.
4.4 M APEAMENTOS ENTRE ESPAÇOS VETORIAIS

Um mapeamento entre espaços vetoriais ou sobre um espaço vetorial é uma função que toma
um vetor de um espaço e o mapeia sobre outro vetor, em um espaço distinto ou sobre o mesmo
espaço, ou ainda sobre um escalar. Alguns tipos de mapeamentos praticados sobre ou entre
espaços vetoriais são mencionados agora.

132 4.4. Mapeamentos entre espaços vetoriais
Definição 4.9 (Mapeamento entre espaços vetoriais). Sejam V e W dois espaços vetoriais
sobre o mesmo corpo K. Uma função T : V 7−→ W é denominada um mapeamento de V sobre W
se para todo v ∈ V existe um e somente um w ∈ W tal que
T (v) = w.
O vetor w = T (u) é denominado o valor de T em v. O conjunto V ⊆ V que contém os vetores

sobre o qual o mapeamento T atua é denominado o domínio de T , representado por Dom (T ). O
conjunto W ⊆ W = {w | T (v) = w, ∀v ∈ V } é denominado a imagem de V sob T , representada por
Img (T ).
Um mapa linear, também denominado aplicação linear, mapeamento linear ou transformação

linear, é um mapeamento entre dois espaços vetoriais tal que as operações de soma vetorial e
produto por escalar são preservadas.
Definição 4.10 (Mapa linear). Sejam V e W dois espaços vetoriais sobre o mesmo corpo K.
Uma função L : V 7−→ W é denominada um mapa linear se para todo u, v ∈ V e para todo α ∈ K
as seguintes propriedades são satisfeitas:
1. Aditividade: L (u + v) = L (u) + L (v).
2. Homogeneidade de grau 1: L (α.u) = α.L (u).
Alguns casos particulares de um mapa linear são:
Operador linear. Quando domínio e imagem coincidem (W =V ), o mapa linear também é de-
nominado operador linear. Um operador linear obviamente obedece as propriedades de
aditividade e homogeneidade de um mapa linear. Adicionalmente, se u = 0 ∈ V é o vetor
nulo de V , então
L (0) = 0.
Forma linear. Quando o mapa linear é a função f : V 7−→ K, i. e., do espaço vetorial sobre
o seu corpo escalar, este é denominado uma forma linear ou um funcional linear. Uma
propriedade importante é que o mapeamento do funcional sobre o corpo é sempre ou trivial
ou é sobrejetivo.
A partir da definição de um operador linear e do teorema sobre decomposição de vetores, é

possível identificar a ação de um determinado operador linear atuando sobre um espaço vetorial
com uma matriz que irá conter os seus componentes.
Definição 4.11 (Matriz de um operador linear). Seja V um espaço vetorial sobre o corpo K;
seja T : V 7−→ V um operador linear atuando sobre V e seja B = {b1 , b2 , . . . } uma base de V . De
acordo com o teorema 4.8, a decomposição
X
T (bi ) = Tji .bj , (para todo bi ∈ B e com Tij ∈ K) ,
j
existe e é única. Os escalares {Tij } são denominados os componentes do operador linear T com
respeito à base B. Estes componentes podem ser organizados como os elementos de uma matriz
.
quadrada T = [Tij ], denominada a matriz do operador T com respeito à base B.
A definição da matriz associada a uma operador linear é útil porque permite sempre descrever
a ação de um operador abstrato sobre vetores de um espaço também abstrato (desde que exista
uma base) através de objetos “concretos” que são as matrizes, através da álgebra matricial.
Dados os objetos empregados no teorema 4.8 e na definição 4.11, se o vetor v é decomposto
por X
v= vi .bi ,
i
então o seu vetor imagem ṽ = T (v) é decomposto e expresso por

 
X X X X
ṽ = T (v) = T  vj .bj  = vj . [T (bj )] = (Tij • vj ) .bi ≡ ṽi .bi .
j j i,j i

Ou seja, os componentes de ṽ são dados por

X
ṽi = Tij • vj .
j
Com isto, se os vetores v e ṽ forem representados em termos de seus componentes na base B

através das matrizes coluna
   
v1 ṽ1
.  v2  . ṽ2 
v =  , ṽ =   ,
.. ..
. .
então os componentes de ṽ são obtidos a partir dos componentes de v por meio da multiplicação
matricial
ṽ = Tv,
sendo T a matriz do operador T na base B. No resultado acima, fica subentendido que os
produtos entre os elementos da matriz T e os elementos da matriz v ocorrem via a operação “•”
de produto entre componentes do corpo K.
.
Dados agora dois operadores, T e S, que atuam sobre V , a sua composição ST = S ◦ T é
representada na notação matricial por
X X X
ST (bi ) = S (Tji .bj ) = Tji . [S (bj )] = (Skj • Tji ) .bk
j j j,k
X
= (ST )ki .bk ,
k
sendo X h i
(ST )ij = Sik • Tkj =⇒ ST = (ST )ij .
k
Ou seja, o elemento ij da matrix que representa a composição dos operadores S e T é exatamente

o mesmo elemento da matriz resultante da multiplicação de S por T.
Um mapa bilinear, também denominado operador bilinear, é uma função que combina ele-
mentos de dois espaços vetoriais para resultar em um elemento de um terceiro espaço vetorial
que é linear em cada um dos argumentos.
Definição 4.12 (Mapa bilinear). Sejam V , W e X três espaços vetoriais sobre o mesmo corpo
K. Um mapa bilinear B é definido como a função B : V × W → X tal que para todo v ∈ V e
w∈W:
1. O mapeamento v 7→ B (v, w) é um mapa linear de V a X .
2. O mapeamento w 7→ B (v, w) é um mapa linear de W a X .
Em outras palavras, mantendo o primeiro argumento do mapa fixo e permitindo o segundo

variar, o resultado é um mapa linear, e vice-versa.
Forma bilinear. Definido no caso em que a imagem do mapeamento (X ) é o corpo base K. Dado
o espaço vetorial V sobre o corpo K, o mapa bilienar B : V × V 7→ K é denominado uma
forma bilinear, tal que, dados u, v, w ∈ V e α ∈ K:
1. B (u + v, w) = B (u, w) + B (v, w)
2. B (u, v + w) = B (u, v) + B (u, w)
3. B (α.u, v) = B (u, α.v) = α • B (u, v).
Desta definição são definidos os produto interno, produto escalar e forma quadrática.
Forma sesquilinear. Trata-se de uma forma bilinear sobre um espaço vetorial complexo, a qual
é linear em um dos argumentos, mas antilinear no outro. Existe uma liberdade em definir
qual argumento é antilinear. Neste texto, o primeiro argumento terá tal propriedade. Seja
V um espaço linear complexo. Uma forma sesquilinear sobre V é um mapa ϕ : V × V 7−→ C
tal que, para todos x, y, z ∈ V e α, β ∈ C, as seguintes propriedades são satisfeitas:

134 4.4. Mapeamentos entre espaços vetoriais
1. ϕ (x + y, z) = ϕ (x, z) + ϕ (y, z).

2. ϕ (α.x, β.y) = α∗ βϕ (x, y), sendo α∗ ∈ C o complexo conjugado de α.
Definição 4.13 (Mapa multilinear). Trata-se de uma generalização de um mapa bilinear. Se-
jam V1 , V2 , . . . , Vn (n > 1) e W espaços vetoriais, todos sobre o mesmo corpo K. Um mapa multi-
linear f é a função
f : V1 × V2 × · · · × Vn 7−→ W ,
tal que para todo vi ∈ Vi e para um dado w ∈ W ,
vi 7→ w = f (v1 , . . . , vi , . . . , vn )
é um mapa linear de Vi a W .
Claramente, mapas lineares ou bilineares são casos particulares de mapas multilineares.
Forma multilinear. Ocorre quando a imagem do mapa multilinear é o corpo substrato aos es-
paços vetoriais. Ou seja, uma forma multilinear é a função
f : V1 × V2 × · · · × Vn 7−→ K,
a qual é separadamente linear em cada um de seus argumentos. Ou seja, que satisfaça:
• α.f (v1 , . . . , vi , . . . , vn ) = f (v1 , . . . , α.vi , . . . , vn ), para todos α ∈ K e vi ∈ Vi e para todo

i = 1, . . . , n.
• f (v1 , . . . , vi , . . . , vn ) + f (v1 , . . . , vi0 , . . . , vn ) = f (v1 , . . . , vi + vi0 , . . . , vn ), para todos vi , vi0 ∈ Vi e
para todo i = 1, . . . , n.
Algumas definições e teoremas acerca de mapeamentos entre ou sobre espaços vetoriais são
apresentados a seguir.
Definição 4.14 (Composição de mapeamentos). Dados os espaços vetoriais V , W e Z , todos

sobre o corpo K e os mapeamentos S : V 7−→ W e T : W 7−→ Z , a composição de T com S é o
mapeamento T ◦ S : V 7−→ Z dado por
(T ◦ S) (u) = T (S (u)) ,
para todo u ∈ V .
A operação de composição ◦ não é, em geral, comutativa, i. e., T ◦S 6= S◦T ; porém é associativa

e distributiva, como o teorema a seguir assegura.
Teorema 4.9. Sejam V1 , V2 ,V3 e V4 espaços vetoriais sobre K. Sejam S1 , S2 : V1 7−→ V2 , T1 , T2 :

V2 7−→ V3 e U1 : V3 7−→ V4 mapeamentos. Finalmente, seja α ∈ K. Então, as seguintes propriedades
são satisfeitas:
1. Associatividade: U1 ◦ (T1 ◦ S1 ) = (U1 ◦ T1 ) ◦ S1 .
2. Distributividade:
(a) (T1 + T2 ) ◦ S1 = T1 ◦ S1 + T2 ◦ S1 ;
(b) T1 ◦ (S1 + S2 ) = T1 ◦ S1 + T1 ◦ S2 , se T1 é linear;
(c) (αT1 ) ◦ S1 = α (T1 ◦ S1 );
(d) T1 ◦ (αS1 ) = α (T1 ◦ S1 ), se T1 é linear;
Teorema 4.10 (Composição de mapeamentos lineares). Sejam V1 , V2 e V3 espaços vetoriais

sobre K. Se L1 : V1 7−→ V2 e L2 : V2 7−→ V3 são mapas lineares, então a composição L2 ◦ L1 : V1 7−→
V3 também é linear.
As definições e o teorema a seguir estão relacionados com o mapeamento inverso de um

dado mapeamento. A noção de um mapeamentos e operadores inversos está ligada à definição
de matrizes inversas e possibilita a obtenção de diversas outras propriedades importantes a
respeito de operadores lineares atuando sobre espaços vetoriais.

Definição 4.15 (Mapeamento identidade). Seja V um espaço vetorial e IV : V − 7 → V o opera-

dor linear tal que para todo v ∈ V , IV (v) = v. A função IV é então denominada o mapeamento
identidade ou o operador identidade.
Definição 4.16 (Mapeamento invertível). Sejam V e W espaços vetoriais, cujos vetores nulos
são, respectivamente, 0V e 0W . Seja T : V 7−→ W um operador. O mapa T é dito invertível se
existe um outro mapeamento S : W 7−→ V tal que S ◦ T = IV e T ◦ S = IW . Neste caso, S é
denominado o mapeamento inverso de T , sendo representado por S = T −1 .
Teorema 4.11. Se T : V 7−→ W é um mapa invertível, então, para todos v ∈ V e w ∈ W ,
Img T −1 = Dom (T ) = V ⊆ V e Dom T −1 = Img (T ) = W ⊆ W ,

e
T (v) = w ⇐⇒ T −1 (w) = v.
Teorema 4.12. Se S : V 7−→ W e T : W 7−→ Z são mapeamentos invertíveis, então

−1
(T ◦ S) = S −1 ◦ T −1 .
Teorema 4.13. Se L : V 7−→ W é um operador linear invertível, então o seu inverso L−1 : W 7−→ V
também é linear.
4.5 S UBESPAÇOS INVARIANTES

O conceito de subespaços invariantes é fundamental para a teoria de representação de gru-
pos, discutida no capítulo 5. A definição de um subespaço invariante depende dos operadores
lineares que atuam sobre o espaço vetorial.
Definição 4.17 (Subespaço invariante). Seja V um espaço vetorial sobre o corpo K. Seja
L : V 7−→ V um operador linear sobre V . Um subespaço U ⊆ V é denominado um subespaço
invariante sob o operador L se
L (U ) = {L (u) , ∀u ∈ U } ⊆ U .
Ou seja, a ação do operador linear L sobre qualquer vetor do subespaço gera um outro vetor
que também pertence ao mesmo subespaço. O exemplo a seguir ilustra a importância dos
subespaços vetoriais invariantes.
Exemplo 4.1 (Matriz de um operador atuando sobre um espaço invariante). Dado um

subespaço U ⊂ V , de dimensão dim U = m < n = dim V , seja BU = {b1 , b2 , . . . , bm } uma base de
U . Se U é invariante frente ao operador L, então
m
X
L (bi ) = Lji .bj , (i = 1, . . . , m) ,
j=1
sendo {Lji } os elementos da matriz do operador L com respeito à base BV (definição 4.11). De
acordo com o teorema 4.7, a base BU pode ser estendida para uma base BV = {b1 , . . . , bn } de V .
Portanto, se a ação L (bi ) ∈ U for descrita na forma matricial,
 
L11 L12 · · · L1m · · · L1n
 L21 L22 · · · L2m · · · L2n 
 . .. . . . .. 
 
..
 .. . . .. . . 
bL = b1 b2 · · · bm · · · bn 
e  ,
L L
 m1 m2 · · · Lmm · · · Lmn 

 . .. .. . . . .. 
 .. . . .. . . 
Ln1 Ln2 · · · Lnm · · · Lnn
isto implica que Lij = 0 para j 6 m e i > m, isto é, a matriz L deve estar na forma bloco-diagonal
superior

136 4.6. Espaço vetorial normado
 
L1 L3
L= ,
0 L2
onde L1 é uma submatriz m × m, a qual contém os elementos de [L (U )] na base BU , enquanto

que L2 e L3 são submatrizes de tamanhos (n − m) × (n − m) e m × (n − m), respectivamente. A
submatriz 0 é a matriz nula de tamanho (n − m) × m.
Estas submatrizes são elementos essenciais para a discussão a respeito de representações
redutíveis realizada no capítulo 5.
Se U , W ⊂ V forem subespaços complementares de V ,2 i. e., V = U ⊕W , sendo que dim (U ) =
m e dim (W ) = n − m, então a base BV = {b1 , . . . , bm , bm+1 , . . . , bn } pode ser organizada de tal forma
que BU = {b1 , . . . , bm } e BW = {bm+1 , . . . , bn }. Neste caso, se ambos U e W forem invariantes
frente a um operador L, então a matriz deste terá a forma bloco-diagonal
 
L1 0
L= .
0 L2
A partir das definições de espaço vetorial e dos mapeamentos e formas aplicados aos vetores,
foram caracterizados diversos tipos particulares de espaços vetoriais, alguns dos quais serão
descritos a seguir.
4.6 E SPAÇO VETORIAL NORMADO

Um espaço vetorial normado, ou simplesmente espaço normado, ou ainda espaço normali-
zado, é um espaço vetorial sobre o corpo dos complexos3 no qual os vetores possuem uma norma
definida. Um espaço vetorial normado é a estrutura hV , k · ki, onde V é um espaço vetorial e k · k
é uma norma definida sobre V .
Uma norma é uma função que opera sobre os vetores de um espaço e que, como resul-
tado, atribui aos mesmos uma quantidade real estritamente positiva que pode ser interpretada,
quando o espaço vetorial é também um espaço métrico, como sendo a medida geométrica do
comprimento ou da extensão dos mesmos. A exceção é o vetor nulo, o qual possui norma tam-
bém nula.
Definição (Norma). Seja V um espaço vetorial sobre o corpo K. Uma norma sobre V é uma
função k · k : V 7→ R, tal que para todos x, y ∈ V e α ∈ R, as seguintes propriedades são
satisfeitas:
1. Positividade: kxk > 0, sendo que se kxk = 0, então x é o vetor nulo.
2. Homogeneidade absoluta ou escalabilidade absoluta: kα.xk = |α| kxk.
3. Inegualdade triangular ou subaditividade: kx + yk 6 kxk + kyk.
4.7 E SPAÇO COM PRODUTO INTERNO

Trata-se de um espaço vetorial sobre os corpos dos reais ou complexos ou qualquer um de
seus subcorpos, para o qual é definido um produto interno.
Definição 4.18 (Produto interno). Dado um espaço vetorial V sobre um corpo K (= C, R, . . . ),

um produto interno sobre o espaço V é a forma bilinear
h · , · i : V × V 7−→ K,
que associa cada par de vetores (u, v) ∈ V × V com um escalar hu, vi ∈ K.

Para todos u, v, w ∈ V e α ∈ K, os seguintes axiomas do produto interno são satisfeitos:
3 Ou sobre qualquer um de seus subcorpos.

∗
(EPI1 ) Conjugação complexa: hu, vi = hv, ui .
(EPI2 ) Linearidade: hu, α.vi = α • hu, vi.
(EPI3 ) Distributividade: hu + v, wi = (u, w) + hv, wi.
Desta forma, definem-se os espaços vetoriais em questão.
Definição 4.19 (Espaço vetorial com produto interno). Seja um espaço vetorial V sobre um
corpo K, o qual é dotado de um produto interno h , iV : V × V 7→ K. A dupla (V , h , iV ) forma um
espaço vetorial com produto interno.
Usualmente, os conjuntos dos escalares em espaços com produto interno de interesse fazem
parte dos corpos K = R (reais) ou C (complexos). Neste caso, estes espaços são consecutivamente
denominados espaço real ou complexo com produto interno. Nestes casos, uma propriedade adi-
cional é imposta, dependendo da natureza do espaço vetorial.
A definição do produto interno entre dois vetores de um espaço vetorial permite também
introduzir-se a noção de ortogonalidade entre os vetores.
Definição 4.20 (Vetores ortogonais). Seja V um espaço vetorial com produto interno. Dois
vetores x, y ∈ V são ditos ser ortogonais ou perpendiculares se
hx, yi = 0.
Neste caso, emprega-se a notação x ⊥ y.
Até este momento, o conceito de vetores ortogonais ou perpendiculares não possui neces-
sariamente nenhum caráter geométrico, uma vez que a definição 4.20 é puramente algébrica.
A concepção geométrica entre dois vetores perpendiculares é válida quando o espaço vetorial
também é um espaço métrico. Este tipo de espaço será discutido mais adiante.
4.7.1 E SPAÇO REAL COM PRODUTO INTERNO

Neste caso, o corpo é real (K = R) e uma propriedade adicional é imposta, a qual distingue
dois tipos de espaços reais.
Espaços pseudo-Euclideanos. Tratam-se de espaços reais com produto interno, os quais obe-
decem a propriedade adicional:
(EPI4 ) Se hx, yi = 0 para todo y ∈ V , então x = 0.
Vetores de um espaço pseudo-Euclideano não podem possuir norma, mas possuem magni-
tude.
Magnitude. Sejam V um espaço real pseudo-Euclideano e x ∈ V . A magnitude de x é

definida por hx, xi.
Um vetor x de um espaço pseudo-Euclideano que não seja o vetor nulo (i. e., a identidade
aditiva do conjunto dos vetores) pode possuir uma magnitude nula ou negativa. Caso
hx, xi = 0, mas x 6= 0, este é dito auto-ortogonal.4
Espaços Euclideanos ou positivo-definidos. Tratam-se de espaços reais com produto interno

aos quais é imposta uma condição adicional mais restritiva que (EPI4 ):
EPI04 Positividade: hx, xi > 0, sendo que hx, xi = 0 se e somente se x = 0.

A condição EPI04 implica na condição (EPI4 ), pois se existisse um vetor x 6= 0 tal que

hx, yi = 0 para todo y ∈ V , então, fazendo y = x teríamos hx, xi = 0, o que viola EPI04 .
4 Ver definição 4.20 de vetores ortogonais.

138 4.7. Espaço com produto interno
4.7.2 E SPAÇO COMPLEXO COM PRODUTO INTERNO

Neste caso, o corpo é complexo (K = C) e a condição adicional normalmente imposta é a
positividade EPI04 .

Uma observação também é necessária em relação à definição 4.18 de linearidade (EPI2 ).

Esta foi aqui definida em relação ao segundo argumento, seguindo a convenção estabelecida na
física pela descrição formal da mecânica quântica. Textos matemáticos usualmente definem a
linearidade no primeiro argumento. Esta distinção é necessária porque o produto interno sobre
o corpo C é uma forma sesquilinear, como consequência da conjugação complexa.
4.7.3 N ORMA DE UM VETOR INDUZIDA PELO PRODUTO INTERNO

Em espaços (reais ou complexos) nos quais a condição de positividade EPI04 é obedecida,

pode-se definir a norma de um vetor x, a qual é induzida pelo produto interno, por
. p
x = hx, xi > 0.
Verifica-se que esta definição satisfaz as condições de norma de um vetor.

Neste caso, o espaço vetorial com produto interno também é um espaço normado. Os seguin-
tes teoremas são válidos nesses espaços.
Teorema 4.14 (Inegualdade de Cauchy-Schwarz). Seja V um espaço vetorial normado com

produto interno. Para qualquer par de vetores x, y ∈ V ,
|hx, yi| 6 kxk kyk . (4.1)
Corolário 4.2. A igualdade em (4.1) somente irá ocorrer se os vetores x e y forem proporcionais
entre si, isto é,
hx, yi = kxk kyk ⇐⇒ y = αx, para algum α ∈ K (R ou C) .
Da definição de ortogonalidade 4.20 segue imediatamente a generalização do teorema de

Pitágoras:
Teorema 4.15 (Teorema de Pitágoras). Seja V um espaço vetorial normado com produto in-
terno. Se os vetores x, y ∈ V são ortogonais, então
2 2 2
kx + yk = kxk + kyk .
Demonstração. Basta empregar as definições:
2 2 2 2 2
kx + yk = hx + y, x + yi = kxk + hx, yi + hy, xi + kyk = kxk + kyk .
Dados dois vetores pertencentes a um espaço normado com produto interno: x e y, com y 6= 0.
O vetor x sempre pode ser decomposto em duas partes: uma paralela a y e uma perpendicular.
Este processo é denominado a decomposição ortogonal do vetor x ao longo de y.
Inicialmente escreve-se x = xk + x⊥ , sendo xk = αy, para algum α ∈ K a ser determinado, a
componente de x paralela a y e x⊥ a componente perpendicular. Como x⊥ deve ser ortogonal a
y,
2
x⊥ = x − xk = x − αy =⇒ 0 = hx⊥ , yi = hx − αy, yi = hx, yi − α kyk .
2
Portanto, α = hx, yi / kyk e o vetor x fica decomposto então por
!
hx, yi hx, yi
x= 2 y+ x− 2 y .
kyk kyk

4.7.4 B ASES ORTONORMAIS EM ESPAÇOS NORMADOS COM PRO -

DUTO INTERNO
Espaços nos quais a propriedade de positividade EPI04 é obedecida são adicionalmente be-

neficiados por possuirem bases ortonormais. Bases ortonormais têm diversas propriedades es-
peciais que levam a simplificações úteis em cálculos envolvendo a álgebra de vetores. Essas
bases fazem uso constante do conceito de vetores ortogonais (definição 4.20).
Definição 4.21 (Conjunto ortogonal/ortonormal). Seja V um espaço vetorial com produto

interno. Seja C = {x1 , . . . , xn } ⊂ V um conjunto de vetores não nulos. O conjunto C é dito ser
ortogonal se
hxi , xj i = 0,
ou seja, se xi ⊥ xj para todos 1 6 i 6= j 6 n.
O mesmo conjunto C é dito ser ortonormal se
hxi , xj i = δij , para todos i, j = 1, . . . , n,
onde δij = 1 (se i = j) ou δij = 0 (se i 6= j) é denominada a delta de Kronecker.5
Teorema 4.16 (Independência linear de um conjunto ortogonal). Seja V um espaço vetorial

com produto interno. Se C = {x1 , . . . , xn } ⊂ V , com n 6 dim V , é um conjunto ortogonal de vetores,
então C é linearmente independente.
Demonstração. Dado o conjunto C de vetores, suponha que exista um conjunto de escalares

{α1 , . . . , αn } ⊂ K tal que
n
. X
x= αi xi = α1 x1 + α2 x2 + · · · + αn xn = 0.
i=1
Então,
n n n n
hx, xi =
X
αi∗ αj hxi , xj i =
X 2
|αi | hxi , xi i +
X
αi∗ αj
hx : 0 X |α |2 hx , x i = 0.
i , xj i =
i i i
i,j=1 i=1 i,j=1 i=1
(i6=j)
2
Como hxi , xi i > 0 para xi ∈ C e |αi | > 0 para todo αi ∈ K, a igualdade acima somente será
satisfeita se αi = 0 (i = 1, . . . , n).
Teorema 4.17 (Base ortonormal). Seja V um espaço vetorial normado com produto interno de
dimensão n. Se B = {b1 , . . . , bn } ⊂ V é um conjunto ortonormal de vetores, então B é uma base de
V , denominada base ortonormal.
Demonstração. Para que B seja uma base é necessário (definição 4.8) que: (i) B seja LI e que (ii)
V seja gerado por B. A condição (i) é satisfeita por B ser um conjunto ortogonal e pelo teorema
4.16. A condição (ii) é satisfeita porque a cardinalidade de B é igual a dim V e pelos teoremas da
seção 4.3. Portanto, B é base de V .
O conceito de ortogonalidade de vetores também serve para definir um subespaço comple-

mentar ortogonal.
Definição 4.22 (Complemento ortogonal). Seja V um espaço vetorial de dimensão finita com
produto interno h·, ·i e C ⊂ V um subconjunto de V . O complemento ortogonal de C, denotado
por C ⊥ , é o conjunto
.
C ⊥ = {v ∈ V | hu, vi = 0 para todo u ∈ C} .
Observa-se que, de acordo com o teorema 4.2, tanto C quanto C ⊥ formam subespaços de V
⊥
por varredura. Da mesma maneira, {0} = V e V ⊥ = {0}. Adicionalmente, se C1 ⊂ C2 ⊂ V ,
então C2⊥ ⊂ C1⊥ .
Com a definição de subespaço complementar ortogonal, resulta o seguinte importante teo-
rema.
5 Ver também seção 6.1.2.

140 4.7. Espaço com produto interno
Teorema 4.18. Se C ⊂ V é subespaço de um espaço vetorial com produto interno de dimensão

finita, então
V = C ⊕ C ⊥.
Demonstração. De acordo com o teorema 4.1, para que C e C ⊥ sejam subespaços complemen-
tares de V , é necessário que (i) V = C + C ⊥ e (ii) C ∩ C ⊥ = {0}.
Para mostrar que a condição (i) é satisfeita, seja n = dim (C ) e B = {e1 , . . . , en } uma base
ortonormal de C . Então, para todo v ∈ V , pode-se escrever
   
Xn n
X
v= hv, ej i ej  + v −  hv, ej i ej  .
j=1 j=1
| {z } | {z }
u w
Claramente u ∈ C . Mas, em sendo w = v − u,
hw, ej i = hv, ej i − hu, ej i = 0, (j = 1, . . . , n) .
Ou seja, w ∈ C ⊥ , implicando que todo v ∈ V pode ser escrito como v = u + w.

Para provar a condição (ii), seja agora v ∈ C ∩ C ⊥ . Isto implica que v deve ser ortogonal a
todos os vetores em C , inclusive a si próprio. Portanto, necessariamente, v = 0, implicando em
C ∩ C ⊥ = {0}.
4.7.5 O PERADORES LINEARES EM ESPAÇOS COM PRODUTO IN -

TERNO
A definição de um produto interno para o espaço vetorial possibilita a definição e subsequente
obtenção de novas propriedades interessantes com relação a mapas e operadores lineares que
atuam sobre esses espaços.
Definição 4.23 (Mapeamento adjunto). Sejam (V , h , iV ) e (W , h , iW ) espaços vetoriais com

produto interno sobre o corpo K. Seja L : V 7−→ W um mapeamento linear de V sobre W . O
adjunto de L é o mapeamento L∗ : W 7−→ V , o qual satisfaz, para todos v ∈ V e w ∈ W ,
hL (v) , wiW = hv, L∗ (w)iV .
Teorema 4.19. Sejam (V , h , iV ) e (W , h , iW ) espaços vetoriais com produto interno sobre o corpo
K. Para todo mapa linear L : V −7 → W existe um único adjunto L∗ : W 7−→ V .
Operador adjunto. A partir das definições de operador linear (definição 4.10) e de mapeamento
adjunto (definição 4.23) e, de acordo com o teorema 4.19, dado um operador linear L : V 7→
V , existe um único operador adjunto L∗ : V 7→ V que satisfaz
hL (u) , vi = hu, L∗ (v)i ,
para todos u, v ∈ V .
b dois operadores lineares atuando sobre V e dado α ∈ K, os respectivos opera-
Sendo L e L
dores adjuntos satisfazem as propriedades:
∗
1. (αL) = α∗ L∗ ;
∗
2. (L∗ ) = L;
∗
3. L + L b = L∗ + L b∗ ;
∗
4. L ◦ L b =L b ∗ ◦ L∗ .
Definição 4.24 (Operador auto-adjunto ou Hermitiano). Seja (V , h , iV ) um espaço vetorial

com produto interno sobre o corpo K. Seja L : V 7−→ V um operador linear sobre V . O operador
L é denominado auto-adjunto ou Hermitiano se
L∗ = L.

O nome operador Hermitiano é usualmente atribuído quando K = C. Por outro lado, quando
o corpo é real (K = R), o operador também pode ser denominado simétrico.
Teorema 4.20. Seja (V , h , iV ) um espaço vetorial com produto interno sobre o corpo K. Seja
L : V 7−→ V um operador linear sobre V . O operador L é auto-adjunto se e somente se
hL (u) , vi = hu, L (v)i ,
para todos u, v ∈ V .
Um tipo especial de operadores lineares que atuam sobre espaços vetoriais com produto
interno são os operadores unitários. A definição destes é largamente influenciada pela definição
de uma matriz unitária.
Definição 4.25 (Operador unitário). Seja (V , h , i) um espaço vetorial com produto interno.
Seja U : V 7−→ V um operador linear que atua sobre os vetores de V . Este operador é dito ser
unitário com respeito ao produto interno se
U ∗ = U −1 .
Uma propriedade importante de operadores unitários é que estes preservam a norma de um

vetor e o produto interno de dois vetores.
Teorema 4.21. Seja (V , h , i) um espaço vetorial com produto interno. Seja U : V 7−→ V um
operador linear que atua sobre V . Se U é um operador unitário com relação ao produto interno,
então, para quaisquer u, v ∈ V ,
• kU (u)k = kuk.
• hU (u) , U (v)i = hu, vi.
4.8 E LEMENTOS DE ESPAÇOS MÉTRICOS E TOPOLOGIA

Antes de introduzir estruturas algébricas mais complexas, será necessário realizar algumas
definições adicionais, as quais introduzem conceitos que estabelecem relações entre três impor-
tantes ramos da matemática: álgebra abstrata, geometria e topologia. Uma definição importante,
que será realizada em seguida, introduz o conceito de uma métrica ou função distância ou sim-
plesmente distância entre os diferentes elementos de um conjunto.
Definição 4.26 (Métrica). Dado o conjunto C, uma métrica em C é uma função d : C × C 7−→ R,
denominada função distância ou, simplesmente, distância, tal que, para todos x, y, z ∈ C as
seguintes propriedades são satisfeitas:
1. Positividade: d (x, y) > 0, sendo que se d (x, y) = 0, então x = y.
2. Simetria: d (x, y) = d (y, x).
3. Inegualdade triangular ou subaditividade: d (x, z) 6 d (x, y) + d (y, z).
Na sua concepção mais geral, um espaço métrico é um conjunto no qual se define a noção de
distância, denominada a métrica do espaço, entre os seus elementos.
Definição 4.27 (Espaço métrico). Dado um conjunto C e uma métrica d : C × C 7−→ R atuando
sobre C, a estrutura hC, di é denominada um espaço métrico.
A partir desta definição é possível caracterizar-se um espaço métrico tanto do ponto de vista
da geometria quanto da álgebra. Um exemplo de espaço geométrico é o espaço Euclideano,6
o qual tem sido categorizado desde o período clássico da Grécia antiga e no qual as noções
cotidianas e intuitivas de posição e distância estão definidas. A definição aqui apresentada é
aquela realizada a partir de estruturas algébricas abstratas.
6 Ver exemplo 4.2.

142 4.8. Elementos de espaços métricos e topologia
Definição 4.28 (Sequência de Cauchy). Uma sequência de Cauchy é aquela sequência cu-
jos elementos se tornam arbitrariamente próximos entre si à medida que a sequência progride.
Alternativamente, uma sequência de Cauchy pode ser definida quando, dada uma quantidade
positiva arbitrariamente pequena, todos os elementos da mesma distam entre si por uma dis-
tância menor que , exceto possivelmente por um subconjunto finito de elementos da sequência.
A partir das definições de espaço métrico e de uma sequência de Cauchy, um outro conceito
útil, um espaço métrico completo, pode ser definido.
Definição 4.29 (Espaço métrico completo). Um espaço métrico M é denominado espaço mé-
trico completo ou espaço de Cauchy se todas as sequências de Cauchy compostas por pontos
em M possuem um limite que também está contido em M. Em outras palavras, se todas as
sequências de Cauchy em M convergem em M.
De forma coloquial, um espaço métrico completo é aquele em que não existem “pontos au-
sentes” no seu interior ou sobre o contorno. Exemplos de espaços métricos completos são os
corpos dos números reais (R) ou dos complexos (C), nos quais a métrica é definida como o valor
absoluto da distância entre os números: d (x, y) = |x − y|. Já um espaço métrico não completo é
o corpo dos números racionais (Q) com a mesma métrica, pois a sequência
xn 1
x1 = 1, xn+1 = + (n = 1, 2, . . . ) ,
2 xn
√
embora composta por pontos em Q, converge para 2, o qual não pertence ao corpo.
As observações e definições abaixo referem-se a conceitos introduzidos nas áreas de geo-
metria e topologia. Estes conceitos não são discutidos em maiores detalhes neste texto, mas
são necessários para categorizar de uma forma adequada certas estruturas como grupos contí-
nuos. As definições apresentadas não são rigorosas, sendo, outrossim, realizadas de uma forma
coloquial, porém compreensiva.
Topologia é um ramo da matemática que estuda formas e espaços topológicos (ver definição
abaixo), sendo considerada uma extensão da geometria. A topologia estuda as propriedades
matemáticas do espaço e como estas são ou não preservadas sob deformações contínuas, tais
como o alongamento ou a flexão do espaço. Dentre as propriedades consideradas, estão a
conexão, continuidade e os contornos do espaço.
Definição 4.30 (Topologia). Dado um conjunto C, uma topologia em C consiste em uma coleção
O de subconjuntos, denominados os conjuntos abertos da topologia, ou simplesmente os abertos
da topologia, os quais satisfazem as condições:
1. O conjunto vazio ∅ é aberto e o conjunto C também é aberto. Além disso, {∅, C} ⊂ O.
2. Se U e V são conjuntos abertos, então também o é a sua intersecção U ∩ V ,
U ∈ O e V ∈ O =⇒ U ∩ V ∈ O.
S
3. Se {Vi | i ∈ N} é uma coleção qualquer de conjuntos abertos, então a sua união i∈N Vi
também é um conjunto aberto.
Definição 4.31 (Espaço topológico). Dado um conjunto C e um topologia O sobre C, a estru-

tura hC, Oi é denominada um espaço topológico. Os elementos de C são usualmente denomina-
dos de pontos e a topologia O define a vizinhança desses pontos.
Pode-se mostrar que todo espaço métrico é um espaço topológico induzido pela sua métrica;
contudo, a recíproca não é verdadeira: nem todo espaço topológico deve, necessariamente, pos-
suir uma métrica.
Definição 4.32 (Homeomorfismo). Um homeomorfismo ou isomorfismo topológico ou ainda uma

função bi-contínua é uma função contínua entre espaços topológicos que possui uma função
inversa também contínua. Homeomorfismos são os isomorfismos (seção 3.6) entre espaços
topológicos, i. e., são mapeamentos que preservam todas as propriedades topológicas de um
dado espaço.

(x,y,z)
Figura 4.1: No espaço E3 , todo ponto é determi-

O z nado pela terna (x1 , x2 , x3 ) ≡ (x, y, z) e possui uma
x representação geométrica em termos de um sis-
y Y tema Cartesiano.
Definição 4.33 (Variedade). Uma variedade 7 é um espaço topológico que se assemelha ao

espaço Euclideano nas vizinhanças de cada ponto. De forma mais precisa, cada ponto de uma
variedade n-dimensional possui uma vizinhança que é homeomórfica ao espaço Euclideano de
dimensão n.
Definição 4.34 (Variedade diferenciável). Uma variedade diferenciável é um tipo de variedade

que é localmente similar a um espaço vetorial para que as operações de cálculo definidas na
análise matemática sejam realizáveis.
Será apresentado agora o importante exemplo do espaço Euclideano como um espaço mé-
trico.
Exemplo 4.2 (O espaço métrico Euclideano En ). Um dos espaços métricos mais importantes
e empregados na física-matemática é o espaço Euclideano de n dimensões En , o qual contém o
espaço de 3 dimensões da geometria euclideana, ao qual também é atribuído um espaço vetorial
normado e dotado de produto interno.8
Como um espaço métrico, o espaço Euclideano é um conjunto de pontos que satisfazem cer-
tas relações entre si, em particular a métrica (ou distância) entre os mesmos. Esta métrica
permite estabelecer-se uma relação geométrica entre os pontos do espaço, usualmente repre-
sentada pelo sistema Cartesiano de coordenadas. Dessa maneira, em uma dimensão, o espaço
E1 é visualizado por meio da reta real; em duas dimensões, o espaço E2 é visualizado através do
plano Cartesiano e em três ou mais dimensões o espaço En (n > 3) é visualizado por um sistema
Cartesiano de n coordenadas ortogonais.
Um ponto no espaço E3 é ilustrado na figura 4.1. Um ponto P neste espaço é dado pela
.
terna ordenada P = (x1 , x2 , x3 ) ou, como também costuma-se escrever, P = (x, y, z). Ao se
representar este ponto geometricamente em um sistema Cartesiano de 3 coordenadas, neste
caso, os números x, y e z são as coordenadas do ponto P ao longo de cada eixo do sistema.
Estas coordenadas são obtidas traçando-se retas que partem de P e que são perpendiculares a
cada eixo, conforme ilustrado na figura.
Para se definir o espaço Euclideano, é necessário primeiro estabelecer a métrica do mesmo.
.
Definição 4.35 (Métrica Euclideana). Seja R = hR, +, ×, 0, 1i o corpo dos números reais.9 Seja
Rn ≡ R × · · · × R = {(x1 , . . . , xn ) | xj ∈ R, j = 1, . . . n}
| {z }
n vezes
o conjunto de todas as n-uplas ordenadas obtidas a partir do produto Cartesiano10 do corpo R

por si mesmo. Dados então p, q ∈ Rn , a métrica ou distância Euclideana entre p e q é a extensão
7 Em inglês: manifold.
8 Discutido na seção 4.1.
9 Ver definição na página 123.
10 Definição 3.26.

144 4.9. Espaço vetorial métrico
do segmento de reta pq conectando ambos os pontos, ou seja,

v
u n
uX q
2 2 2
d (p, q) = d (p, q) = t (qi − pi ) = (q1 − p1 ) + · · · + (qn − pn ) .
j=1
A partir da definição da métrica Euclideana, pode-se realizar a definição de um espaço Eucli-

deano.
Definição 4.36 (Espaço métrico Euclideano En ). Seja
Rn ≡ R × · · · × R = {(x1 , . . . , xn ) | xj ∈ R, j = 1, . . . n}
| {z }
n vezes
o conjunto de todas as n-uplas ordenadas obtidas a partir do produto Cartesiano do corpo dos
números reais. Sejam d, q ∈ Rn tais que a distância entre estes pontos é definida pela métrica
.
Euclideana d ≡ d (p, q). A estrutura En = hRn , di forma o Espaço Euclideano de dimensão n.
É importante observar aqui que na definição de um espaço métrico em geral, e no espaço En

em particular, não se define nenhuma outra operação ou relação entre seus elementos (pontos)
além da métrica. Por isso, um espaço métrico não é, por exemplo, um espaço vetorial, salvo se
este for dotado de estruturas adicionais.
4.9 E SPAÇO VETORIAL MÉTRICO

Um espaço vetorial métrico é um espaço vetorial no qual é definida a noção de métrica, ou
distância (ver definição 4.26), entre seus elementos. Um espaço vetorial métrico, como uma
estrutura algébrica, é também um tipo de espaço métrico (definição 4.27), visto como uma es-
trutura geométrica. Este é um exemplo típico de uma estrutura matemática híbrida (algébrica e
geométrica).
4.9.1 E SPAÇO VETORIAL MÉTRICO COM NORMA .

Dado um espaço vetorial normado hV , k · ki, este é um espaço vetorial métrico normado quando
é possível definir-se uma métrica sobre V pela norma da seguinte maneira: para todos x, y ∈ V ,
.
d (x, y) = kx − yk = kx + (−y)k ,
sendo −y ∈ V o elemento inverso de y em V . Diz-se então que a métrica d é induzida pela norma
k · k.
A métrica acima definida, além de apresentar a propriedade de homogeneidade como con-
sequência da definição de norma, possui também a propriedade de invariância translacional, i.
e.,
d (x + a, y + a) = d (x, y) ,
para todos x, y, a ∈ V .
De forma recíproca, se a métrica d sobre o espaço V satisfaz as condições de homogeneidade
.
e invariância translacional, então a norma é induzida pela métrica por kxk = d (x, 0) , ∀x ∈ V ,
sendo 0 o vetor nulo.
4.9.2 E SPAÇO DE B ANACH .

Um espaço vetorial métrico pode ser completo ou não, de acordo com a definição 4.29. Um
espaço vetorial métrico completo é denominado um espaço de Banach.

4.9.3 E SPAÇO VETORIAL DUAL

Qualquer espaço vetorial possui um correspondente espaço dual, o qual consiste no conjunto
de todos os funcionais lineares do primeiro, conjunto este que constitui um outro espaço vetorial.
Dado o espaço vetorial V sobre o corpo K, o conjunto de todos os seus funcionais lineares, i.
e., todos os mapas lineares do tipo ϕ : V 7−→ K, representado por HomK (V , K), forma um novo
espaço vetorial sobre K com o mesmo produto por escalar, denominado espaço vetorial dual a
V ou, simplesmente, espaço dual, quando as seguintes propriedades são satisfeitas. Para todos
x ∈ V , ϕ, ψ ∈ HomK (V , K) e α ∈ K:
1. Aditividade: (ϕ + ψ) (x) = ϕ (x) + ψ (x) .
2. Homogeneidade: (α.ϕ) (x) = α. (ϕ (x)) .
O espaço dual a V pode ser representado por V ∗ ou V 0 quando o corpo K fica subentendido.
Um dado elemento de V ∗ é também denominado de covetor ou forma-um ou 1-forma.
O produto Cartesiano entre o espaço V e seu dual V ∗ , resultando no mapeamento [ · , · ] :
V × V 7−→ K, é um exemplo de uma forma bilinear. Um determinado par ordenado do domínio
∗
.
deste mapeamento, obtido a partir de ϕ ∈ V ∗ e x ∈ V , pode ser representado por [ϕ, x] = ϕ (x) e
ser denominado um bracket.
Existem dois tipos de espaços duais: o espaço dual algébrico e o espaço dual contínuo. O
primeiro tipo é a definição acima apresentada, válida para qualquer espaço dual. O segundo
tipo surge quando se consideram somente funcionais lineares contínuos.
4.9.4 E SPAÇO DE H ILBERT

Um espaço de Hilbert é uma generalização tanto de um espaço com produto interno quanto
de um espaço Euclideano, de tal forma que o espaço vetorial pode ter uma dimensão finita
arbritrária ou mesmo infinita.
Um espaço de Hilbert H é um espaço vetorial complexo com produto interno, o qual é tam-
bém um espaço métrico completo, sendo assim um exemplo de um espaço de Banach. No espaço
de Hilbert, a métrica do espaço é induzida pelo produto interno, sendo que este é uma forma
sesquilinear. Para todos x, y ∈ H e α, β ∈ C, o produto interno satisfaz as propriedades de con-
jugação complexa, distributividade e positividade. Além disso, por ser uma forma sesquilinear:
• hx, α.yi = α hx, yi (linear no segundo argumento).
• hα.x, yi = α∗ hx, yi (antilinear no primeiro argumento).
A norma e a métrica sobre H satisfazem as propriedades:

p
• kxk = hx, xi.
p
• d (x, y) = kx − yk = hx − y, x − yi.
E SPAÇO DE H ILBERT DUAL .
A cada espaço de Hilbert H é possível associar-se um espaço dual H ∗ , composto pelos

funcionais lineares que atuam sobre os vetores de H . Como o resultado de um funcional linear
deste tipo resulta em um elemento do corpo, este resultado pode ser usado para a implementação
do produto interno em H . Este é o procedimento empregado no desenvolvimento formal da
mecânica quântica.
No caso de um espaço de Hilbert, existe uma correspondência bijetiva com o seu espaço dual,
garantida pelo teorema de representação de Fréchet-Riesz.
Teorema 4.22 (Teorema de representação de Fréchet-Riesz). Seja H um espaço de Hilbert

e H ∗ o seu espaço dual, composto por todos of funcionais lineares contínuos ϕ : H 7−→ K
(K = R ou C). Se o vetor x ∈ H , então existe um e somente um funcional ϕx , dado por
.
ϕx (y) = hx, yi (∀y ∈ H ) ,
o qual é um elemento de H ∗ .

Portanto, a função ϕx (y) determina o produto interno entre os vetores x, y ∈ H . A correspon-

dência entre o vetor x ∈ H e o funcional ϕx ∈ H ∗ estabelece um mapeamento Φ : H 7−→ H ∗
o qual é um (anti-) isomorfismo isométrico, ou seja, para todos os vetores x, y ∈ H e para todo
α ∈ K:
• Φ é bijetivo.
• Φ preserva a norma: kxk = kϕx k.
• Φ é aditivo: Φ (x + y) = Φ (x) + Φ(y).
• Se K = R, então Φ (αx) = αΦ (x). Se K = C, então Φ (αx) = α∗ Φ (x).
4.9.5 E SPAÇO AFIM

Um espaço afim11 é uma estrutura geométrica que generaliza certas propriedades de linhas
paralelas em um espaço Euclideano (exemplo 4.2) atribuindo assim ao mesmo a estrutura adi-
cional de um espaço vetorial. A definição de um espaço afim serve para definir de forma rigorosa
as noções geométricas de “somas vetoriais” como composições de setas direcionadas sobre o
plano ou espaço Cartesianos. Em um espaço afim não existe um ponto particular que serve
como uma origem. Dessa forma, nenhum vetor possui uma origem fixa nem pode ser associado
univocamente a um ponto do espaço. Ao invés disso, um espaço afim é composto por vetores
deslocamento entre dois pontos do espaço. Esta definição permite atribuir um vetor à subtração
de dois pontos do espaço métrico, mas não atribui sentido à soma dos mesmos. Pela mesma
concepção, é concebível adicionar-se um vetor a um ponto do espaço afim, tendo como resultado
um novo ponto deslocado a partir do primeiro pelo vetor deslocamento.
Definição 4.37 (Espaço afim). Seja um espaço vetorial V sobre um corpo K (sendo “+V ” o ope-
rador de soma vetorial), juntamente com um conjunto M 6= ∅, cujos elementos são denominados
pontos. A estrutura hM, V , +i forma um espaço afim sobre V ou espaço afim de direção V se
para todo ponto p ∈ M e vetor v ∈ V existir um mapeamento
+ : M × V 7−→ M, (v, p) 7→ v + p
que satisfaça as propriedades:
(EA1 ) Identidade à esquerda. Se 0 ∈ V for o vetor nulo, para todo p ∈ M , 0 + p = p.

(EA2 ) Associatividade. Para todos v, w ∈ V e p ∈ M , v + (w + p) = (v +V w) + p.
(EA3 ) Unicidade. Para todos p, q ∈ M , existe um único vetor v ∈ V tal que v + p = q.
O mapeamento “+” é uma ação de grupo livre e transitiva12 de V sobre M . A ação é livre pela
propriedade (EA1 ); ao passo que a unicidade (EA3 ) assegura que a ação é transitiva, pois, dados
p, q ∈ M quaisquer, se q = p + u = p + u0 , com u, u0 ∈ V , resulta que p + u − u0 = p e, portanto, pela
propriedade (EA1 ), necessariamente u0 = u.
Como o grupo V ∈ V é Abeliano, não há diferença entre ações pela esquerda ou pela direita;
assim, a identidade v + p = p + v é válida.
Definindo-se uma origem O ∈ M , pode-se transformar o conjunto M em um espaço vetorial.
Reciprocamente, qualquer espaço vetorial V é um espaço afim sobre si próprio.
Denotando-se o vetor único v provido por (EA3 ) como → −
pq, escreve-se q = p + → −
pq. De (EA1 )
−
→
resulta que pp = 0. Então, de (EA2 ) segue que o mapeamento
M × M 7−→ V , (q, p) 7→ →
−
pq
satisfaz a equação
→
−
pq +V →
−
qr = →
−
pr.
→
− →
−
Em particular, este resultado implica que pq = −qp.
A partir da definição de um espaço afim, as seguintes propriedades da geometria analítica
podem ser rigorosamente definidas.
11 Do inglês: affine space.
12 Definição 3.19.

Translação. Para cada v ∈ V , a função
τv : M 7−→ M, p 7→ p + v
é uma translação do ponto p ∈ M pelo vetor v. Escrevendo q = p + v, então v ≡ →

−
pq é o vetor
que conecta (translada) o ponto p ao ponto q ∈ M .
Origem e vetor posição. Seja O ∈ M um ponto em particular denominado a origem do espaço
afim. A função
V 7−→ M, v 7→ O + v
é bijetiva, com inversa
−→
M 7−→ V , p 7→ Op.
−→
O vetor Op é denominado o vetor posição de p com respeito a O.
Coordenadas e sistema coordenado. Se dim (V ) = m e se {b1 , . . . , bm } é uma base em V , existe
uma única m-upla (x1 , . . . , xm ) ∈ Km tal que
m
−→ X
Op = x j bj . (4.2)
j=1
Neste caso, os números x1 , . . . , xm ∈ K são denominados as coordenadas (afins) do ponto p

com respeito ao sistema de coordenadas (O; b1 , . . . , bm ). A função bijetiva
M 7−→ Km , p 7→ (x1 , . . . , xm ) ,
a qual mapeia cada ponto p ∈ M a suas coordenadas, é denominada a função coordenada

de M com respeito a (O; b1 , . . . , bm ).
A dimensão do espaço afim é a dimensão do espaço vetorial que o compõe. A figura 4.2
mostra a construção de um sistema Cartesiano de coordenadas no espaço como um espaço afim
−−→
de dimensão 3 sobre o corpo R, no qual a cada ponto P do espaço é atribuído um vetor OP ,
expresso pela combinação linear (4.2) dos vetores de uma base ortonormal de V .
I DENTIDADE DE C HASLES E A REGRA DO PARALELOGRAMO . Dados três pontos

quaisquer a, b, c ∈ M , conforme visualizado no painel esquerdo da figura 4.3, resulta que c =
→
− →
− →
− →
− →
− → − →− → −
a + ac, b = a + ab e c = b + bc. Então, de (EA2 ), c = b + bc = a + ab + bc = a + ab + bc . E de
(EA3 ) resulta que →
− → − →
− → −
c=a+→
−
ac = a + ab + bc =⇒ →
−
ac = ab + bc,
a qual é a identidade de Chasles. Se b = a, resulta de (EA1 ), a = a + −

→ =⇒ −
aa → = 0. Ou, fazendo
aa
→
− →
−
c = a, resulta ab = −ba.
Finalmente, dados agora 4 pontos a, b, c, d ∈ M , da identidade de Chasles resulta
→
− → − −
→ → −
ab + bc = ad + dc = →
−
ac,
de onde vem a regra do paralelogramo

→
− →
− →
− −
→
ab = dc se e somente se bc = ad.
Para finalizar esta seção, serão apresentados a seguir alguns exemplos importantes de espa-
ços vetoriais.
Exemplo 4.3 (O espaço vetorial real R 3 ). O espaço vetorial mais comum na física é aquele
formado pelo grupo R3 definido na seção 3.1.2.3 e pelo corpo dos números reais R, definido na
página 123. Esta estrutura é definida como
.
R 3 = R3 , R, +, .

e é corriqueiramente denominada o “espaço Cartesiano” ou o “espaco Euclideano,” embora am-

bas as designações não sejam rigorosamente corretas, uma vez que um espaço Euclideano é um
espaço métrico.13
13 Exemplo 4.2.

Figura 4.2: O sistema de coordenadas (O; b1 , b2 , b3 )

de um espaço afim de dimensão 3 sobre o corpo
R. A base empregada é ortogonal, com bj =
−−−−→
O kbj k (j = 1, 2, 3), onde kbj k é a norma do ve-
−
−→
tor. Observa-se também o vetor v ≡ OP dado por
(4.2), bem como as suas coordenadas {x1 , x2 , x3 }.
M V
→
−
ab
→
−
ac
→
−
bc
Figura 4.3: Espaço afim hM, V , +i visualizado tanto do ponto de vista do conjunto M (painel esquerdo), com
−
→ − → →
os pontos a, b, c, quanto do ponto de vista do espaço V (painel direito), com os vetores ab, bc e −
ac. A regra do
paralelogramo é satisfeita no espaço afim.
O produto por escalar neste espaço vetorial é definido da seguinte maneira. Dados o vetor
a = (a1 , a2 , a3 ) ∈ R3 e o escalar α ∈ R, o produto de a por α resulta no vetor b ∈ R 3 dado por
b = α.a = (αa1 , αa2 , αa3 ) .
Verifica-se facilmente que esta operação satisfaz as condições de associatividade, produto pela
unidade e distributividade.
Adicionalmente, o espaço R 3 é sempre considerado com uma ou mais definições de produto
interno, sendo o produto escalar o mais corriqueiro. O produto escalar do vetor a pelo vetor b é
definido como
.
ha,bi ≡ a · b = a1 b1 + a2 b2 + a3 b3 ∈ R.
Verifica-se facilmente que o produto escalar satisfaz os requisitos de um produto interno. Além
disso, o produto escalar no R 3 induz a norma dos vetores do espaço: para todo a ∈ R 3 ,
. √
q
kak ≡ |a| = a · a = a21 + a22 + a23 .
Esta definição em particular da norma do vetor a é denominada de norma Euclideana no R 3 .

Em suma, o espaço real R 3 é um espaço vetorial normado com produto interno. Uma ge-
neralização imediata é realizada para o espaço real R n , formado pelas n-uplas (a1 , a2 , . . . , an )
(n = 1, 2, . . . ).
Exemplo 4.4 (O espaço vetorial complexo C 3 ). O espaço vetorial C 3 é uma generalização do

espaço real R 3 . Este espaço é formado pelo grupo Abeliano aditivo C 3 definido na seção 3.1.2.3

e pelo corpo dos números complexos C, definido na página 123. Esta estrutura é definida como
.
C 3 = C 3 , C, +, . .

O produto por escalar neste espaço vetorial é definido da forma usual. Dados o vetor a =
(a1 , a2 , a3 ) ∈ C 3 e o escalar α ∈ C, o produto de a por α resulta no vetor b ∈ C 3 dado por
b = α.a = (αa1 , αa2 , αa3 ) .
O produto interno no C 3 é uma forma sesquilinear. Dados a, b ∈ C 3 ,
ha, bi = a∗1 b1 + a∗2 b2 + a∗3 b3 .
Claramente, ha, bi ∈ C. Finalmente, a norma no C 3 é a generalização da norma Euclideana. Dado

a ∈ C3, q
2 2 2
p
kak = ha, ai = |a1 | + |a2 | + |a3 | .
Em suma, o espaço vetorial complexo C 3 é um espaço vetorial normado com produto interno.
Uma generalização imediata é realizada para o espaço complexo C n , formado pelas n-uplas
(a1 , a2 , . . . , an ) (n = 1, 2, . . . ).
Exemplo 4.5 (O espaço vetorial Euclideano E 3 ). Neste ponto é possível definir-se o espaço
vetorial Euclideano E 3 , também denominado o espaço real coordenado R3 . A definição aqui
realizada concorda com as noções usuais empregadas em geometria analítica sobre o plano Eu-
clideano em 2 dimensões ou o espaço tridimensional da geometria Euclideana, no qual os pontos
do espaço são identificados através de um sistema Cartesiano de coordenadas. Adicionalmente,
os vetores neste espaço são representados no sistema Cartesiano como setas orientadas, as
quais conectam dois pontos no mesmo: ou a origem O ao ponto P ou o ponto P ao ponto Q.
A operação algébrica de adição vetorial é representada no sistema como uma composição das
setas orientadas.
A construção parte da definição do espaço (métrico) E3 realizada no exemplo 4.2. Em seguida,
toma-se a definição do espaço vetorial real R 3 no exemplo 4.3. Então, de acordo com a definição
4.37, o par E = E , R constitui um espaço (vetorial) afim, no qual é usualmente empregada
3 . 3 3

a base canônica ortonormal do R 3 formada pelos vetores

. . .
ê1 ≡ x̂1 ≡ ı̂ = (1, 0, 0) ê2 ≡ x̂2 ≡ ̂ = (0, 1, 0) ê3 ≡ x̂3 ≡ k̂ = (0, 0, 1) .
. . .
Sendo agora os pontos do E3 O = (0, 0, 0) (a origem), 1x = (1, 0, 0), 1y = (0, 1, 0) e 1z = (0, 0, 1),
−−→ −−→ −−→
resulta que os vetores de base do R 3 são também os vetores posição ı̂ = O1x , ̂ = O1y e k̂ = O1z
do E . Qualquer outro ponto P = (p1 , p2 , p3 ) ∈ E é localizado no sistema Cartesiano pela seta
3 . 3
−−→
orientada OP a qual é simplesmente o vetor posição
3
OP ∈ E 3 .
−−→ X −−→
OP ≡ r P = pi êi ,
i=1
−−→
.

Dado um outro ponto Q = (q1 , q2 , q3 ) ∈ E3 , o vetor deslocamento de P a Q P Q ≡ r P Q é
3
−−→ −−→ −−→ X
P Q = OQ − OP = (qi − pi ) êi .
i=1
−−→ −−→
Além disso, pela definição do produto escalar entre os vetores OQ e OP no R 3 ,
v
D−−→ −−→E −−→ −−→ u uX 3
OQ, OP ≡ OQ · OP = t qi pi .
i=1
Adicionalmente, pela definição das normas destes vetores e também pela distância entre os
pontos P e Q dados pela métrica Cartesiana no E3 , observa-se que
v
−−→ −−→ −−→ u 3
uX 2
d (P, Q) = P Q = OQ − OP = t (qi − pi ) .

i=1

150 REFERÊNCIAS
Ou seja, as medidas da métrica e da norma no E 3 concordam entre si. Consequentemente, a

norma do R 3 induz a métrica do E3 e vice-versa. Por esta razão, o espaço E 3 , além de ser um
espaço afim, também é um espaço vetorial métrico normado.
Todas as definições e propriedades consideradas neste exemplo são automaticamente gene-
ralizadas para o espaço vetorial Euclideano de n dimensões E n , com n = 1, 2, 3, 4, . . . .
Exemplo 4.6 (A álgebra do espaço R 3 ). No exemplo 4.3, mostrou-se que o R 3 é um espaço
vetorial normado com produto interno. As definições contidas nesse exemplo abrangem quase
todas as operações algébricas normalmente apresentadas em disciplinas de álgebra linear, cál-
culo e física básica: (i) adição vetorial, (ii) produto de vetor por escalar e (iii) produto escalar e
norma. A única operação que não foi definida no exemplo é aquela denominada produto vetorial.
Isto porque a definição do produto vetorial no R 3 promove este a uma álgebra,14 sendo que então
o conjunto completo de operações é comumente denominado álgebra vetorial.
O produto vetorial é definido então como o mapa bilinear × : R 3 × R 3 7−→ R 3 tal que, dados
a, b, c ∈ R 3 ,
3
. X
c = a × b =⇒ ci = ijk aj bk (i = 1, 2, 3) , (4.3)
j,k=1
onde ijk é o símbolo de Levi-Civita definido na seção 6.1.2. O produto vetorial satisfaz a condição
de bilinearidade, pois para α, β ∈ R,
[(αa) + (βb)] × c = (αa) × c + (βb) × c = α (a × c) + β (b × c)

c × [(αa) + (βb)] = α (c × a) + β (c × b) .
Além disso, como é bem sabido, o produto vetorial é anticomutativo: a × b = −b × a. Como

consequência, a álgebra vetorial é não associativa: a× (b × c) 6= (a × b) ×c, pois15
(6.3)
[a× (b × c)]i = ijk k`m aj b` cm = aj cj bi − aj bj ci
[(a × b) ×c]i = ijk j`m a` bm ck = ak ck bi − bk ck ai ,
ou seja, a× (b × c) = (a · c) b − (a · b) c 6= (a × b) ×c = (a · c) b − (b · c) a. Contudo, a identidade

de Jacobi é satisfeita, i. e.,
a× (b × c) + b× (c × a) + c× (a × b) = 0.
Portanto, talvez de uma forma até surpreendente, a álgebra vetorial é uma álgebra de Lie.
R EFERÊNCIAS
ALABISO, C.; WEISS, I. A Primer on Hilbert Space Theory: Linear Spaces, Topological Spaces,
Metric Spaces, Normed Spaces, and Topological Groups. New York: Springer, 2014. (UNITEXT for
Physics). 255 + xvii pp. ISBN: 9783319037134. DOI: 10.1007/978-3-319-03713-4.
AMANN, H.; ESCHER, J. Analysis I. Basel: Birkhäuser, 2013. (Grundstudium Mathematik). 435
+ xv pp. ISBN: 9783034877947.
ARFKEN, G. B.; WEBER, H. J.; HARRIS, F. E. Mathematical Methods for Physicists: A Comprehen-
sive Guide. New York: Elsevier, 2013. ISBN: 9780123846549.
LANG, S. Undergraduate Algebra. [S.l.]: Springer New York, 2013. (Undergraduate Texts in
Mathematics). ISBN: 9781475768985. Disponível em: <https : / / books . google . com . br /
books?id=SqrqBwAAQBAJ>.
15 Usando notação de Einstein para as somas (seção 6.1.1).

SCHILLING, A.; LANKHAM, I.; NACHTERGAELE, B. Linear Algebra as an Introduction to Abs-

tract Mathematics. [S.l.]: WORLD SCIENTIFIC Publishing Company Incorporated, 2015. ISBN:
9789814730358. Disponível em: <https://books.google.com.br/books?id=J3SSjgEACAAJ>.

152 REFERÊNCIAS

5
T EORIA DE R EPRESENTAÇÕES DE
G RUPOS
T EORIA DE R EPRESENTAÇÃO é um ramo da matemática que estuda estruturas algébricas
A abstratas através da representação de seus elementos como transformações lineares de

espaços vetoriais e estuda os módulos sobre essas estruturas algébricas abstratas. As
diferentes estruturas algébricas abstratas são discutidas na seção 3.7.
De forma resumida, uma representação torna uma estrutura algébrica abstrata mais “con-
creta” através da descrição de seus elementos por matrizes e da conversão das operações algébri-
cas entre os elementos das estruturas às operações usuais de soma e multiplicação matriciais.
As estruturas algébricas suscetíveis a tais representações incluem grupos, álgebras associativas
e álgebras de Lie. A aplicação mais importante da teoria de representação ocorre para grupos
abstratos.
A Teoria de Representações de Grupos descreve grupos abstratos em termos de transfor-
mações lineares de espaços vetoriais; em particular, os elementos do grupo são representados
como matrizes e, assim, a operação de multiplicação de grupo se torna a multiplicação matricial
usual. Nisto reside a importância da teoria de representações: ela permite que a formulação
teórica de sistemas físicos abstratos se reduza às propriedades da álgebra linear, a qual é bem
compreendida.
Ao longo do desenvolvimento dos novos modelos físicos que surgiram a partir da formula-
ção teórica da mecânica quântica e da teoria quântica de campos, podem ser destacados vários
exemplos nos quais a teoria de grupos e a teoria de representações possibilitaram a compreen-
são de objetos físicos abstratos e suas interrelações. Um destes exemplos é a proposição do uso
das matrizes de Pauli,1 as quais pertencem ao grupo GL (2, C) e apresentam simetria de isos-
pin, formando uma base ao SU (2). Neste caso, tratou-se da construção formal de um modelo
matemático ao recém-descoberto spin do elétron, o qual é propriedade física fundamental dos
férmions e não possui contrapartida clássica, sendo, neste sentido, uma propriedade “abstrata”
das partículas. Posteriormente, com a proposição de uma equação da onda relativística pelo fí-
sico inglês Paul Adrien Maurice Dirac (1902–1984), o estado quântico de um elétron passou a ser
descrito por um espinor, o qual é um elemento de um campo vetorial abstrato, construído de tal
forma que satisfaz as isometrias do grupo de Lorentz homogêneo. Posteriormente, ao longo da
década de 1960 e com as contribuições principais do físico paquistanês Mohammad Abdus Sa-
lam (1926–1996) e dos físicos norte-americanos Sheldon Lee Glashow (1932–) e Steven Weinberg
(1933–), ocorreu a construção da Lagrangiana da interação eletrofraca, a qual envolve interações
entre os campos eletromagnéticos e os bósons vetoriais da interação fraca, e cuja unificação foi
possibilitada pela construção do grupo de gauge SU (2) ⊗ U (1). Ainda mais recente, a construção
do modelo padrão da física de partículas envolveu o acréscimo do setor da cromodinâmica quân-
tica à Lagrangiana da teoria eletrofraca, bem como de suas interações mútuas. Esta proeza
foi possibilitada pela representação do grupo total de isometrias das partículas fundamentais
no espaço-tempo de Minkowski: o supergrupo SU (3) ⊗ SU (2) ⊗ U (1). Estes são apenas alguns
exemplos nos quais as representações de grupos foram importantes na exploração das simetrias
dos sistemas físicos e na consequente determinação e soluções das equações que descrevem a
evolução dos mesmos.
O termo representação de um grupo também é empregado de uma forma mais geral ao propor
uma “descrição” de um grupo abstrato como um grupo de transformações de algum objeto
matemático. De uma maneira mais formal, uma representação é um homomorfismo do grupo
1 Geralmente atribuídas ao físico austríaco Wolfgang Pauli (1900–1958).
153
154 5.1. Primeiras definições e representações
abstrato a um grupo de automorfismos do objeto. Se o objeto em questão é um espaço vetorial,

a representação é linear. Quando o objeto matemático possui outra natureza, o termo realização
costuma também ser empregado. Na matemática, a teoria da representação permeia diversas
disciplinas tais como a álgebra, a análise, a geometria e topologia e a teoria de números. Tais
desenvolvimentos possibilitaram, ao longo do século XX, a criação da Teoria das Categorias, a
qual unifica a descrição de diferentes estruturas matemáticas oriundas de diversas áreas e de
suas interrelações.
5.1 P RIMEIRAS DEFINIÇÕES E REPRESENTAÇÕES

Nesta seção, apresenta-se as definições básicas da teoria de representação de grupos e alguns
exemplos imediatos, aplicados aos grupos finitos.
A representação de um determinado grupo abstrato G é realizada usando o conceito de homo-
morfismo introduzido na seção 3.6. De uma forma coloquial, pode-se dizer que a representação
de um grupo abstrato é semelhante ao que é realizado quando se decompõe um vetor. Se A é um
vetor que possui sentido físico e matemático independente do sistema de coordenadas adotado,
a “representação prática” deste vetor é obtida escolhendo-se um determinado sistema de coorde-
nadas (cartesiano, esférico, cilíndrico, etc), o qual possui
P um conjunto de coordenadas {qi } e de
vetores de base { êi }. Então, pode-se escrever A = i αi êi , sendo {αi = αi (q)} as componentes
do vetor A neste sistema de coordenadas. A partir deste momento, as informações sobre o vetor
A serão fornecidas pelas suas coordenadas.
De forma semelhante, a teoria de representação de grupos toma um grupo abstrato G, cujos
elementos podem não possuir uma descrição matemática conhecida, mas cujas propriedades
são idênticas a de um outro grupo D conhecido. Então, a representação de G consiste na escolha
de um “sistema de coordenadas” bem comportado (o grupo D), o qual irá então fornecer as
informações desejadas sobre G.
Para a física, as representações desejadas serão estabelecidas por matrizes não singulares
que formam um grupo frente a multiplicação matricial; especificamente, um homomorfismo
será estabelecido entre G e o grupo geral linear. Como a dimensão do grupo G pode ser tanto
uma quantidade finita quanto infinita, a definição mais geral de uma representação deve ser
realizada de forma independente da mesma, mencionando somente todos os automorfismos do
espaço vetorial considerado. Posteriormente, a definição geral será reduzida aos casos mais
usuais de grupos finitos, grupos compactos, etc.
Definição 5.1 (Grupo geral linear de um espaço vetorial). Sendo V um espaço vetorial sobre
o corpo K, o grupo geral linear de V , denotado por GL (V ) ou Aut (V ), é o grupo de todos os
automorfismos de V , i. e., o conjunto de todas as transformações lineares bijetivas V → V , em
conjunto com a regra de composição funcional como a operação de grupo.
A definição de grupo geral acima, portanto, faz uso do conceito de espaço vetorial (capítulo
4) e de transformação ou mapa linear, definidos na seção 4.4. Se o espaço vetorial V possui
dimensão n finita, então o grupo GL (V ) se torna isomórfico ao grupo GL (n, K) definido na seção
3.1.2.3. Contudo, o isomorfismo irá depender da escolha de uma base, como discutido mais
adiante.
Definição 5.2 (Representação de grupo (geral)). Uma representação de um grupo G em um
espaço vetorial V sobre um corpo K é um homomorfismo de grupo de G = {G; ∗} ao grupo geral
linear GL (V ), i. e., consiste no mapeamento
ρ : G 7−→ GL (V ) ,
tal que, para todos os elementos g1 , g2 ∈ G,
ρ (g1 ∗ g2 ) = ρ (g1 ) ρ (g2 ) ,
onde o produto ρ (g1 ) ρ (g2 ) é realizado com o produto do grupo GL (V ).
O espaço vetorial V é denominado o espaço de representação e a dimensão do mesmo é a
dimensão da representação.
Esta definição é completamente geral, por não pressupor que o grupo tenha uma dimensão
finita, ou que sua ordem seja finita. A definição a seguir é mais restritiva, porém mais adequada,
uma vez que as representações de interesse aplicam-se a esses grupos em particular e serão
realizadas por intermédio de matrizes.

C APÍTULO 5. Teoria de Representações de Grupos 155
Definição 5.3 (Representação de grupo (dimensão finita)). Dado o grupo G = {G; ∗} e um sub-
grupo D (G) ⊆ GL (n, K), uma representação do grupo G é um homomorfismo de G para GL (n, K),
i. e.,
ρ : G 7−→ GL (n, K) ,
tal que:
1. Para cada elemento g ∈ G existe uma única matriz D (g) ∈ D (G), a qual é a imagem2 de g
sob o homomorfismo.
2. Para todos g1 , g2 ∈ G, com suas respectivas imagens D (g1 ) , D (g2 ) ∈ D (G),
D (g1 ∗ g2 ) = D (g1 ) D (g2 ) . (5.1)
O grupo D (G) ⊆ GL (n, K) é a imagem do homomorfismo, i. e., o conjunto de todas as matrizes

D (g) , ∀g ∈ G.
O espaço vetorial sobre o corpo K no qual as matrizes D ∈ GL (n, K) estão contidas é o espaço
de representação e n, a ordem de D, é denominado a dimensão da representação. Se Dij (g) é
o elemento da matriz D (g) na i-ésima linha e na j-ésima coluna, então a multiplicação matricial
em (5.1) implica em
n
X
Dij (g1 ∗ g2 ) = Dik (g1 ) Dkj (g2 ) , (i, j = 1, . . . , n) . (5.2)
k=1
Todas as propriedades de um homomorfismo que foram discutidas na seção 3.6 continuam

sendo válidas para uma representação; em particular, as coincidências entre os elementos iden-
tidade e inverso entre os dois grupos, consequências diretas da definição de homomorfismo.
É necessário enfatizar também que a dimensão da representação (a ordem n das matrizes)
não corresponde necessariamente à ordem de G ou à sua dimensão, caso este seja um grupo
contínuo. Portanto, em princípio é possível estabelecer homomorfismos entre G e GL (n, K) para
todos n > 1. Assim, em geral existe mais de uma representação, em diferentes ordens, para
o mesmo grupo. Distintas representações do mesmo grupo G serão distinguidas pelo índice
superescrito (µ), onde µ = 1, 2, . . . , m, sendo m o número de diferentes representações de G.
Sendo também nµ ou [µ] a dimensão da µ-ésima representação, então esta será identificada por
D(µ) (G) ⊆ GL (nµ , K) , (µ = 1, 2, . . . , m) ,
enquanto que a imagem de g ∈ G nesta particular representação será identificada por
D(µ) (g) ∈ D(µ) (G) .
Nas seções a seguir serão apresentadas algumas técnicas usuais para se determinar o homo-
morfismo ρ : G 7→ GL (n, K), ou em outras palavras, para se obter as matrizes D (G) ⊂ GL (n, K).
5.1.1 V ETORES E FUNÇÕES DE BASE E REPRESENTAÇÕES REGU -

LARES
Como o grupo GL (n, K) é composto pelas matrizes não singulares de ordem n pertencentes a
um espaço vetorial V sobre o corpo K, uma maneira prática de se estabelecer a representação
consiste no emprego de vetores de base 3 pertencentes a V e adequadamente escolhidos. Um
T
vetor de base pode ser escrito como uma matriz coluna u = u1 u2 . . . un ∈ V , sendo seus
componentes {ui } (i = 1, . . . , n) denominados as funções de base, as quais possuem as mais
variadas origens (números, coordenadas, rótulos, etc).
Uma vez determinados os vetores de base, a representação regular do grupo G = {G; ∗} =
{g1 , g2 , . . . , gn ; ∗} (de ordem n) é construída a partir do homomorfismo
ρ : gG 7−→ D (G) ⊆ GL (n, K) ,

3 Ressalta-se que um vetor de base não é, ncessariamente, um elemento da base do espaço vetorial.

156 5.1. Primeiras definições e representações
i. e., por todas ações de grupo de G sobre si mesmo.4

Para todos g ∈ G, a matriz D (g) irá executar a mesma ação sobre as funções de base do vetor
u que é realizada pela ação gG, respeitando a condição imposta a um homomorfismo, isto é, a
relação (5.1).
Este mapeamento é implementado fazendo uso dos vetores de base da seguinte maneira.
Escreve-se inicialmente todos os elementos de G na forma de uma matriz linha [G], onde

[G] = g1 g2 · · · gn .
A cada ação de grupo5 de G sobre os elementos de u atribui-se um vetor linha através dos mapea-
mentos: se G 7→ [G], então, para todo gi ∈ G, gi G 7→ [gi G] = gi ∗ g1 gi ∗ g2 . . . gi ∗ gn . Escrevendo-se
f segue que a ação de gi sobre G pode ser escrita como uma matriz coluna ui , a qual é o
u = [G],
resultado da ação de uma matriz M (gi ) ∈ GL (n, K) sobre u, de acordo com
ui = M (gi ) u. (5.3a)
]
Mas, obviamente, ui = [gi G], de onde se conclui que
^
[gi G] = [G] M (gi ).
O resultado acima sugere que a representação de gi em D (G) deve ser
^
D (gi ) = M (gi ), (5.3b)
sendo que as matrizes D (gi ) satisfazem a condição de homomorfismo (5.1).

De fato, dados g1 , g2 , g3 ∈ G tais que g3 = g1 ∗ g2 e a relação (5.3a), as multiplicações sucessivas
u1 = M (g1 ) u −→ M (g2 ) u1 = M (g2 ) M (g1 ) u
devem resultar em u3 = M (g3 ) u, sendo M (g3 ) = M (g2 ) M (g1 ), pois isto implica em que D (g3 ) =
D (g1 ) D (g2 ), de acordo com (5.1). O exercício a seguir exemplifica este processo.
Exemplo 5.1 (Representação regular do grupo S3 ). Uma representação regular de dimensão
6 para o grupo S3 é obtida a partir da metodologia descrita acima.
Dado o grupo S3 = {I, π2 , . . . , π6 ; ◦}, cujos elementos foram definidos no exemplo 3.2, deseja-se
uma representação do mesmo com o grupo D(4) (S3 ) ⊂ GL (6, R). Definindo-se então o vetor de
T
base u = I π2 . . . π6 , em primeiro lugar, obviamente,
I 7→ M (I) = D(4) (I) = I6 , pois I6 u = u,
sendo I6 a matriz identidade de ordem 6. Para os demais elementos, a ação de grupo πi S3 pode
ser obtida a partir das linhas da tabela de multiplicação derivada no exercício 3.5. Então, de
acordo com (5.3a),
 π2   0 1 0 0 0 0   I  0 1 0 0 0 0
I 100000 π2 100000
u2 = M (π2 ) u ;  ππ43  =  00 00 01 10 00 00   ππ34  =⇒ M (π2 ) =  00 00 01 10 00 00  ,
π6 000001 π5 000001
π 000010 π6 000010
 π35  0 0 1 0 0 0 I
 0 0 1 0 0 0
π5 00001 0 π2 000010
u3 = M (π3 ) u ;  πI6  =  10 00 00 00 00 0 3
1
π
π4
 =⇒ M (π3 ) =  10 00 00 00 00 01  ,
π2 01000 0 π5 010000
π 00010 0 π6 000100
 π44  0 0 0 1 0 0
  I
 0 0 0 1 0 0
π6 00000 1 π2 000001
π π
u4 = M (π4 ) u ;  π25  =  00 10 00 00 01 0 3
0 π4
 =⇒ M (π4 ) =  00 10 00 00 01 00  ,
I 10000 0 π5 100000
π 00100 0 π6 001000
 π35  0 0 0 0 1 0
  I
 0 0 0 0 1 0
π3 00100 0 π2 001000
π6  =  01 00 00 00 00 1   π3  =⇒ M (π5 ) =  01 00 00 00 00 10  ,
u5 = M (π5 ) u ;  I 0 π4
π4 00010 0 π5 000100
π2 01000 0 π6 010000
4 Ver definição de grupo com operadores na seção 3.7.2.
5 Definição 3.19.

 π6   0 0 0 0 0 1   I  0 0 0 0 0 1
π4 000100 π2 000100
u6 = M (π6 ) u ;  ππ52  =  00 01 00 00 10 00   ππ34  =⇒ M (π6 ) =  00 01 00 00 10 00  .
π3 001000 π5 001000
I 100000 π6 100000
Portanto, de acordo com (5.3b), D(4) (πi ) = M

^ (πi ), ou seja,
0 1 0 0 0 0
100000
D(4) (I) = I6 D(4) (π2 ) =  00 00 01 10 00 00 
000001
000010
0 0 1 0 0 0 0 0 0 0 1 0
000010 001000
D(4) (π3 ) =  10 00 00 00 00 01  D(4) (π4 ) =  01 00 00 00 00 10 
010000 000100
000100 010000
0 0 0 1 0 0 0 0 0 0 0 1
000001 000100
D(4) (π5 ) =  00 10 00 00 01 00  D(4) (π6 ) =  00 01 00 00 10 00  .
100000 001000
001000 100000
Pode-se verificar que

I6 D(4) (π2 ) D(4) (π3 ) D(4) (π4 ) D(4) (π5 ) D(4) (π6 )
D(4) (π2 ) I6 D(4) (π4 ) D(4) (π3 ) D(4) (π6 ) D(4) (π5 )
D(4) (π3 ) D(4) (π5 ) I6 D(4) (π6 ) D(4) (π2 ) D(4) (π4 )
D(4) (π4 ) D(4) (π6 ) D(4) (π2 ) D(4) (π5 ) I6 D(4) (π3 )
D(4) (π5 ) D(4) (π3 ) D(4) (π6 ) I6 D(4) (π4 ) D(4) (π2 )
D(4) (π6 ) D(4) (π4 ) D(4) (π5 ) D(4) (π2 ) D(4) (π3 ) I6
a qual é idêntica à tabela de S3 . Portanto, esta representação é isomórfica.
O exercício acima obteve uma representação do grupo S3 que consiste em um isomorfismo
do mesmo em D(4) (S3 ) ⊂ GL (6, R). Neste caso, aplica-se a definição a seguir.
Definição 5.4 (Representação fiel). Dada a representação ρ : G 7−→ GL (n, K), quando esta
é isomórfica à sua imagem, diz-se que a representação é fiel. Quando esta condição não é
satisfeita, a representação é dita não fiel ou degenerada.
A representação obtida no exemplo 5.1 para o grupo S3 é fiel. Contudo, uma representação
fiel não necessita possuir a dimensão igual à ordem do grupo. Com base neste exercício, pode-se
fazer a seguinte definição para uma representação regular.
Definição 5.5 (Representação regular). Dado um grupo finito G = {G; ∗} de ordem n, a sua
representação regular ρ : gG 7→ D (G) ⊆ GL (n, R) é uma representação fiel tal que para todo gk ∈ G
(k = 1, . . . , n), os elementos de sua representação serão dados por
(
1, se gi ∗ gk = gj
Dij (gk ) = δik,j , onde δik,j = (i, j = 1, . . . , n) (5.4)
0, se gi ∗ gk 6= gj .
É fácil verificar que a regra (5.4) realmente fornece uma representação. Supondo que os
elementos gm , gn , g` ∈ G sejam tais que gm ∗ gn = g` , então é necessário que D (gm ) D (gn ) = D (g` ).
Escrevendo o elemento ij de ambos os lados da equação,
 n n
X (5.4) X n
 [D (gm ) D (gn )] =

Dir (gm ) Drj (gn ) = δim,r δrn,j
ij
X
r=1 r=1 =⇒ δim,r δrn,j = δi`,j .

 r=1
Dij (g` ) =δi`,j
O resultado desta soma é um dígito binário, para o qual basta que um dos símbolos δim,r ou δrn,j
seja nulo (para todos os índices r) para que o elemento ij resulte igual a zero. Este é o resultado
usual. Para o elemento ser unitário, é necessário que ambos os símbolos sejam iguais a um
para um dado r. No lado esquerdo da equação isto implica que, simultaneamente, gi ∗ gm = gr
e gr ∗ gn = gj . Por consequência, (gi ∗ gm ) ∗ gn = gi ∗ (gm ∗ gn ) = gi ∗ g` = gj , o que garante que
o elemento do lado direito também é igual a um. Portanto, a representação regular realmente
constitui uma representação do grupo G.

158 5.2. Representações de grupos de transformações lineares
5.1.2 R EPRESENTAÇÃO NATURAL

Uma outra maneira de se obter uma representação, particularmente útil quando o grupo é de
isometrias, consiste na representação natural. Nesta representação, as matrizes D (G) descrevem
o que ocorre ao objeto quando se aplica ao mesmo uma transformação de simetria, em relação
a um referencial fixo.
O exemplo a seguir obtém uma representação natural D(5) (S3 ) de dimensão 3, baseado no
isomorfismo de S3 com o grupo C3v de isometrias pontuais de um triângulo equilátero.
Exemplo 5.2. Uma representação de dimensão 3 para o grupo S3 pode ser obtida, baseada no
seu isomorfismo com o grupo de operações de isometria de um triângulo equilátero.
Deseja-se construir o grupo D(5) (S3 ) ⊂ GL (3, R). Para tanto, inicialmente retorna-se aos
exercícios 3.11 e 3.15, os quais obtiveram o grupo C3v e o seu isomorfismo com S3 . Se o vetor
T
de base for definido agora como a sequência dos vértices do triângulo, u = a b c , então a ação
de cada elemento de C3v sobre o mesmo irá provocar uma alteração nas posições dos vértices,
em relação ao referencial fixo determinado pelos números externos ao triângulo, como pode ser
visto na figura 3.5a. Estas operações são mapeadas isomorficamente através das multiplicações
das matrizes de D(5) (S3 ) sobre o vetor de base, empregando-se o isomorfismo entre C3v e S3 .
Desta maneira,
I 7−→ E =⇒ =⇒ D(5) (I) = I3

a 1 0 0a 1 0 0
π2 7−→ σv16 =⇒ c = 001 b =⇒ D(5) (π2 ) = 0 0 1
b 010 c 010
0 1 0a 0 1 0
b
π3 7−→ σv35 =⇒ a = 100 b =⇒ D(5) (π3 ) = 100
c 001 c 001
0 1 0a 0 1 0
b
π4 7−→ C32 =⇒ c = 001 b =⇒ D(5) (π4 ) = 001
a 100 c 100
c 0 0 1a 0 0 1
π5 7−→ C3 =⇒ a = 100 b =⇒ D(5) (π5 ) = 100
b 010 c 010
c 0 0 1a 0 0 1
π6 7−→ σv24 =⇒ b = 010 b =⇒ D(5) (π6 ) = 010
a 100 c 100
Verifica-se então que a tabela de multiplicação

I3 D(5) (π2 ) D(5) (π3 ) D(5) (π4 ) D(5) (π5 ) D(5) (π6 )
D(5) (π2 ) I3 D(5) (π4 ) D(5) (π3 ) D(5) (π6 ) D(5) (π5 )
D(5) (π3 ) D(5) (π5 ) I3 D(5) (π6 ) D(5) (π2 ) D(5) (π4 )
D(5) (π4 ) D(5) (π6 ) D(5) (π2 ) D(5) (π5 ) I3 D(5) (π3 )
D(5) (π5 ) D(5) (π3 ) D(5) (π6 ) I3 D(5) (π4 ) D(5) (π2 )
D(5) (π6 ) D(5) (π4 ) D(5) (π5 ) D(5) (π2 ) D(5) (π3 ) I3
é exatamente a tabela do grupo S3 obtida no exercício 3.5. Esta representação também é um
isomorfismo e, portanto, a mesma também é uma representação fiel.
5.2 R EPRESENTAÇÕES DE GRUPOS DE TRANSFORMA -

ÇÕES LINEARES
As definições e exemplos das seções anteriores enfatizam o conceito de representação de
grupo usualmente empregado na física, consistindo este na descrição das propriedades e evolu-
ção de sistemas compostos por partículas e campos e suas interações em termos de operadores
que atuam sobre os componentes do sistema e que são descritos por grupos de transformação.
Neste contexto, os grupos de representação de interesse, e que são constituídos pelas operações
de transformação aplicadas aos sistemas físicos, são usualmente formados por matrizes.

Nesta formulação, o estado de um sistema físico é usualmente expresso como um vetor que
pertence a um determinado espaço vetorial. Qualquer transformação atuando sobre esse vetor
deve gerar um novo vetor, o qual pertence ao mesmo espaço vetorial e que descreve um outro
estado físico do sistema. Os operadores responsáveis pelas possíveis transformações às quais o
sistema está sujeito pertencem a determinados grupos de transformação, os quais podem então
ser representados por um grupo de matrizes não singulares contido no GL (n, K).
Nesta seção será discutida a formulação da teoria de representação de grupos usualmente
empregada na base formal da mecânica quântica e da teoria de quântica de campos.
5.2.1 E SPAÇOS VETORIAIS E OPERADORES NA MECÂNICA QUÂN -

TICA
De acordo com a descrição formal da mecânica quântica, proposta inicialmente por Paul
Adrien Maurice Dirac (1902 – 1984), a cada estado físico do sistema associa-se um vetor ket
representado pelo símbolo |ui, o qual pertence a um espaço de Hilbert H sobre o corpo C.6
Associado ao espaço H , existe também o seu espaço dual H ∗ , composto por todos os funcionais
lineares χ : H 7−→ C. Assim, se χ (|ui) é uma forma linear aplicada ao vetor |ui ∈ H , este
funcional em particular será um vetor pertencente ao espaço dual H ∗ . Estes são denominados
vetores bra, sendo representados pelo símbolo “h · |”. Desta maneira, o funcional linear χ (|ui)
define o vetor bra hχ| ∈ H ∗ .
Como o mapeamento de um funcional linear é sobrejetivo, o resultado da operação χ (|ui)
irá sempre resultar em um número (usualmente) complexo, o qual é representado pelo sím-
.
bolo hχ|ui = χ (|ui) e é denominado um braket. Adicionalmente, para um espaço de Hilbert a
correspondência entre o vetor ket |ui e o vetor bra hχ| é única, pois existe um único número
χ (|ui) = hχ|ui ∈ C resultante da aplicação da forma linear; ou seja, a função χ (|ui) é de fato bije-
tora. Como consequência, a quantidade hχ|ui satisfaz as condições impostas ao produto interno
entre dois vetores de um espaço vetorial. Além disso, sempre existe um único vetor ket |χi ∈ H
para o qual o resultado da aplicação hχ|χi = χ (|χi) irá resultar em um número que satisfaz as
condições impostas à sua norma. Por isso, as operações hχ|χi e hχ|ui definem, no espaço de
Hilbert, respectivamente a norma do vetor |χi e o seu produto interno com o vetor |ui.
O mapeamento isomórfico |χi ↔ hχ| é assegurado pelo teorema de representação de Fréchet-
Riesz (teorema 4.22). Uma das importantes consequências deste teorema é que a dimensão do
espaço dual H ∗ é igual à dimensão de H . Vetores bra e ket associados por esta correspondência
unívoca são ditos conjugados entre si e são rotulados pelo mesmo símbolo. Assim, dado o vetor
ket |ui ∈ H , o seu vetor bra conjugado é representado por hu| ∈ H ∗ .
Assume-se agora que para um dado ket |ui do espaço vetorial existe um outro ket |vi re-
sultante da ação de um certo operador linear O sobre o primeiro. Esta ação é representada
por
|vi = O |ui .
Na mecânica quântica, o operador O é um agente abstrato, mas que está associado a uma de-
terminada variável dinâmica mensurável, representada por O. Estas quantidades mensuráveis
são denominadas observáveis. Para que o operador O possa ser associado a um observável, é
usualmente assumido que este seja um operador Hermitiano.7
De acordo com o formalismo da mecânica quântica, cada processo de medida do observável O
em um sistema que está inicialmente no estado |ui (suposto normalizado) irá resultar, em geral,
em diferentes valores para o observável. Imaginando-se um ensemble de sistemas físicos, isto
é um conjunto hipotético de sistemas físicos idênticos entre si, todos inicialmente no mesmo
estado físico |ui, o conjunto de medidas do observável O irá resultar em uma distribuição de
valores, cujo valor médio (denominado valor esperado) é dado por
hOi = hu|O|ui .
Dada agora uma base ortonormal {|ni} do espaço P de Hilbert, um sistema físico no estado |ui
.
pode ser descrito8 pela decomposição vetorial |ui = n hn|ui |ni, onde a quantidade un = hn|ui é a
componente do vetor |ui sobre o vetor de base |ni. Esta quantidade pode ser considerada como
6 Ver
seção 4.9.4.
7 Definição
4.24.
8 Empregando-se operadores de projeção, os quais não serão discutidos aqui.

160 5.2. Representações de grupos de transformações lineares
a n-ésima linha de um vetor coluna. Ou seja, o estado do sistema sempre pode ser descrito em
termos da base ortonormal {|ni}. Por sua vez, o operador O também pode ser escrito em termos
desta base como X
O= hm|O|ni |mi hn| .
mn
.
Nesta expressão, a quantidade hm|O|ni = Omn é o elemento mn da matriz quadrada O que repre-
senta o operador O na representação do grupo ao qual o mesmo faz parte.
Portanto, a ação do operador O sobre o sistema no estado |ui leva este ao estado |vi dado por
X
|vi = O |ui = hm|O|ni hn|ui |mi .
mn
P
Contudo, como |vi sempre pode ser escrito em termos da base {|ni} como |vi = n hn|vi |ni,
resulta que a n-ésima linha do vetor coluna que representa o ket |vi é determinada a partir da
matriz O como X
hn|vi = hn|O|mi hm|ui .
m
Por outro lado, se |ui pertence à base do espaço de Hilbert (|ui = |ì ∈ {|ni}), observa-se que a
ação do operador O sobre o mesmo é igual a
X X
O |ì = hm|O|ni hn|ì |mi = hm|O|ì |mi ,
mn m
ou seja, O |ì sempre pode ser escrito em termos da base {|ni} através da matriz O e, portanto,
pertence ao mesmo espaço de Hilbert.
Finalmente, o valor médio obtido ao ser realizada uma medida da variável dinâmica O quando
o sistema está no estado |ui resulta ser igual a
∗
XX
hOi = hu|O|ui = hm|O|ni hm|ui hn|ui .
m n
Ou seja, a matriz O, a qual é a representação do operador O, está diretamente associada ao

processo de medida da quantidade física O. Este resultado mostra a importância da teoria de
representação de grupos para a mecânica quântica.
5.2.2 E SPAÇOS VETORIAIS E SUAS REPRESENTAÇÕES

Os argumentos da seção anterior podem ser apresentados novamente de uma maneira li-
geiramente mais abstrata, para ilustrar suas aplicações a outros formalismos empregados na
física. Dado um grupo de transformações G = {G; ∗}, cuja representação é dada pelo grupo de
matrizes D (G) ⊆ GL (n, K), as transformações que compõe G atuam sobre um sistema físico cujo
estado pode ser descrito por um vetor pertencente a um espaço vetorial complexo V n , de dimen-
são n, no qual estão definidos tanto o produto interno quanto a norma dos vetores. Para certos
sistemas físicos, é necessário que este seja um espaço métrico completo de dimensão arbitrária,
ou seja, um espaço de Hilbert.
O estado do sistema físico é suposto completamente descrito por um vetor u ∈ V n . Dada uma
.
base ortonormal Ψ = {ψi } em V n , o vetor u pode ser desenvolvido em termos dos vetores de base
como
n
X
u= ui ψi ,
i=1
onde {ui } são os componentes de u ao longo de ψi . Estes componentes são obtidos então a partir
do produto interno:
ui = hψi , ui .
Observa-se aqui que a escolha alternativa ui = hu, ψi i também poderia ser feita, uma vez que
∗
ambas estão relacionadas por hu, ψi i = hψi , ui . Como hu, ui > 0, resulta a relação de Parseval
X 2
|hψi , ui| = hu, ui .
i

A expressão obtida acima para a componente ui permite realizar-se uma correspondência

T
entre o vetor abstrato u com a matriz coluna u = u1 u2 · · · un , a qual pode ser considerada
uma representação matricial para o vetor na base Ψ.
Dado agora um operador linear A ∈ G, a ação deste sobre o vetor u consiste em um mapea-
mento linear A : V n 7−→ V n que irá associar u com outro vetor v ∈ V n através da relação
v = Au.
Quando u = ψi ∈ Ψ, ou seja, um vetor da base, resulta vP

= Aψi . Mas o vetor v, por sua vez,
também pode ser expresso em termos da base Ψ como v = j hψj , vi ψj , ou seja,
X
v = Aψi = hψj , Aψi i ψj
j
X
= Dji (A) ψj ,
j
.
onde Dji (A) = hψj , Aψi i. Isto implica em que ao operador linear abstrato A é possível atribuir-se
uma representação matricial na base Ψ através da associação
A ←→ D (A) ,
onde D (A) é uma matriz n × n cujos elementos são Dij (A) (i, j = 1, . . . , n).
.
Para verificar que o conjunto de matrizes D (G) = {D (A)} (∀A ∈ G) realmente forma uma
representação de G, considera-se a aplicação consecutiva dos operatores A, B ∈ G sobre o vetor
de base ψi ∈ Ψ. Por um lado, esta operação resulta em
!
X X X
(A ∗ B) ψi = A (Bψi ) = A ψk Dki (B) = (Aψk ) Dki (B) = ψj Djk (A) Dki (B) ,
k k j,k
enquanto que, por outro lado,

X
(A ∗ B) ψi = ψj Dji (A ∗ B) .
j
Ou seja, X
Dij (A ∗ B) = Dik (A) Dkj (B) =⇒ D (A ∗ B) = D (A) D (B) ,
k
satisfazendo as condições (5.1) e (5.2).

Em resumo, mostrou-se que mediante a escolha de uma base ortonormal adequada, tanto
os vetores quanto os operadores de um espaço vetorial podem ser representados por meio de
matrizes. Esta argumentação ilustra a importância tanto da teoria de representação de grupo
para a física quanto a preferência para a mesma de grupos de representações compostos por
matrizes quadradas pertencentes ao grupo geral linear.
5.3 R EPRESENTAÇÕES EQUIVALENTES E CARACTERES

Como foi visto nas seções anteriores, a representação de um determinado grupo pode, em
princípio, ser realizada por mais de um grupo de representações de diferentes dimensões, de-
pendendo da escolha feita para o conjunto de vetores de base. Por outro lado, para uma dada
dimensão da representação, a qual foi obtida com uma determinada base do espaço vetorial,
pode sempre ser realizada uma mudança de base, com a qual obtém-se uma outra representa-
ção de mesma dimensão. As duas representações assim obtidas são denominadas equivalentes.
Definição 5.6 (Representações equivalentes). Dado o grupo G = {G; ∗}, duas representação
D (G) e D0 (G), ambas de dimensão n, i. e., D (G) , D0 (G) ⊆ GL (n, K), são ditas representações
equivalentes se para todo g ∈ G existe uma matriz não singular S ∈ GL (n, K) tal que
D0 (g) = S−1 D (g) S. (5.5)
Esta transformação é denominada transformação de similaridade.

162 5.4. Soma e produto diretos de matrizes e representações
É possível verificar que a matriz D0 (g) obtida a partir da definição acima realmente constitui
uma representação de g, de acordo com a definição 5.3:
1. Clausura: Dados g1 , g2 ∈ G e suas respectivas representações D (g1 ) , D (g2 ) ∈ D (G),
D0 (g1 ) D0 (g2 ) = S−1 D (g1 ) SS−1 D (g2 ) S

= S−1 D (g1 ) D (g2 ) S = S−1 D (g1 ∗ g2 ) S = D0 (g1 ∗ g2 ) .
2. Unicidade da representação do elemento unitário: como D (I) = In ,
D0 (I) = S−1 D (I) S = S−1 In S = In .
3. Unicidade da representação do elemento inverso: se g −1 ∈ G é o elemento inverso de g,

−1 −1
então D g = D (g) e
−1 −1
D0 g −1 = S−1 D g −1 S = S−1 D−1 (g) S = S−1 D (g) S = [D0 (g)] .

Portanto, uma dada representação de dimensão n em geral não é única. Deseja-se então
obter representações em particular ou quantidades derivadas das representações que sejam in-
variantes frente a uma transformação de similaridade. Este problema será abordado na próxima
seção. Uma quantidade relacionada à representação e que é invariante será definida agora.
Definição 5.7 (Caractere da representação). Seja V um espaço vetorial de dimensão finita
sobre o corpo K, seja G = {G; ∗} um grupo finito e seja ρ : G 7−→ GL (n, K) uma representação de
G em V . O caractere da representação ρ é o mapeamento
χρ : G 7−→ K
tal que para todo g ∈ G com representação D (g) ∈ GL (n, K),

n
X
χρ (g) = Tr [ρ (g)] = Tr [D (g)] = Dii (g) , (5.6)
i=1
sendo χρ (g) denominado o caractere do elemento g na representação ρ.

Verifica-se facilmente que o caractere de uma representação é uma quantidade invariante
frente a uma transformação de similaridade. Dados g ∈ G e D (g) , D0 (g) ∈ GL (n, K) duas repre-
sentações equivalentes obtidas pela tranformação (5.5), então
n n X
n
" n
#
X X X
0
S−1 ik

χρ0 (g) = Dii (g) = Dkm (g) Smi
i=1 k=1 m=1 i=1
n X
X n n
X
= Dkm (g) δmk = Dkk (g) = χρ (g) .
k=1 m=1 k=1
A mesma demonstração pode ser realizada de uma forma mais compacta empregando-se a se-
guinte propriedade do traço de uma matriz,
χρ0 (g) = Tr [D0 (g)] = Tr S−1 D (g) S = Tr D (g) S−1 S = Tr [D (g)] = χρ (g) .

Observa-se portanto que o caractere da representação depende somente da dimensão da mesma,

e não da base adotada.
5.4 S OMA E PRODUTO DIRETOS DE MATRIZES E RE -

PRESENTAÇÕES
Chega-se então a um ponto crucial na teoria de representações de grupos: a obtenção de
uma representação irredutível de uma determinada dimensão. Nas seções anteriores verificou-
se que existe, em geral, mais de uma representação para um determinado grupo. Essas dis-
tintas representações podem ser de diferentes dimensões ou, caso tenham a mesma dimensão,

distinguem-se por serem equivalentes ou não equivalentes. Representações de dimensão n > 1

podem também ser construídas a partir de representações de dimensões mais baixas através da
técnica da soma direta de matrizes. Esta técnica permite, então, classificar uma dada represen-
tação como redutível ou irredutível. Um dos principais objetivos da teoria de representações de
grupos consiste na obtenção das representações irredutíveis, ou irreps, de mais baixas ordens
para um dado grupo. O conhecimento das irreps do grupo permite construir representações de
mais alta dimensão para o mesmo grupo através da soma direta. Estes conceitos são discutidos
nesta seção.
Serão apresentadas agora duas operações entre matrizes que não são normalmente discu-
tidas em textos de álgebra matricial. Tratam-se da soma e do produto diretos de matrizes.
Estas operações são úteis na construção de representações maiores a partir de representações
não equivalentes de dimensões mais baixas ou a partir de duas representações distintas para o
mesmo grupo.
5.4.1 S OMA DIRETA DE MATRIZES

Trata-se de uma operação entre matrizes que permite a construção de matrizes de ordens
altas a partir de matrizes de ordens mais baixas. Dadas a matriz A de tamanho m × n e a matriz
B de tamanho p × q, a soma direta de ambas, executada pela operação binária representada pelo
símbolo “⊕”, resulta em uma matriz C de tamanho (m + p) × (n + q). Ou seja, se
   
a11 a12 · · · a1n b11 b12 · · · b1q
   
 a21 a22 · · · a2n  b21 b22 · · · b2q 
A= . eB= . . . ,
   
 .. .. . . ..  . . . .. 
 . . . 
 . .
 . . 

am1 am2 · · · amn bp1 bp2 · · · bpq
então  
a11 a12 · · · a1n 0 0 · · · 0
 
 a21 a22
 ··· a2n 0 0 ··· 0 

 . .. .. .. .. .. . . .. 
 . . .
 . . . . . .


 
a a
 m1 m2 · · · amn 0 0 ··· 0 
C=A⊕B= .

 0 0
 · · · 0 b11 b12 · · · b1q 

 
 0 0
 ··· 0 b21 b22 · · · b2q 

 . .. .. .. .. .. . . .. 
 .. . . . . . . . 
 
0 0 · · · 0 bp1 bp2 · · · bpq
Os elementos da matriz C são dados, portanto, por


 aij , i 6 m, j 6 n

b
(i−m)(j−n) , m + 1 6 i 6 m + p, n + 1 6 j 6 n + q
cij =


 0, m + 1 6 i 6 m + p, j 6 n
0, i 6 m, n + 1 6 j 6 n + q,

com i = 1, . . . , m + p e j = 1, . . . , n + q.
A construção da matriz C a partir das matrizes A e B também é usualmente representada
como uma matriz bloco-diagonal de duas maneiras equivalentes:
   
. A 0 A 0
C= ≡ .
0 B 0 B
Estas representações mostram explicitamente as matrizes-pais que originaram C.
Por exemplo, se
   
132 16
A=  e B =   , então
231 01

 
13200
 
2 3 1 0 0
C=A⊕B= .
 
0 0 0 1 6
 
00001
Em geral, se P matrizes Ak (k = 1, . . . , P ) devem ser somadas diretamente para formar a matriz

B, esta operação é representada por
 
A1 0 · · · 0
 . 
P  .
 . A2 · · · 0 

. M .
B= Ai = diag (A1 , A2 , . . . , AP ) =  .

.. . .
,
..  (5.7)
i=1  .
. . . . 
 
0 0 · · · AP
onde os zeros são na verdade blocos de zeros, i. e., matrizes nulas. Se a matriz Ak tem
tamanho mi × ni e seus elementos são representados por (ak )ij , então a matriz B terá o ta-
PP PP
manho M × N , onde M = i=1 mi e N = i=1 ni , e seus elementos serão as quantidades bij
(1 6 i 6 M, 1 6 j 6 N ) dadas por


 (a1 )ij , i 6 m1 , j 6 n1

(a2 )i2 j2 , m1 + 1 6 i 6 m1 + m2 , n1 + 1 6 j 6 n1 + n2



 .
..

 .
..


bij = (a` )i` j` , µ`−1 + 1 6 i 6 µ` , ν`−1 + 1 6 j 6 ν`
. .

.. ..









 (aP )iP jP , µP −1 + 1 6 i 6 M, νP −1 + 1 6 j 6 N

0, no restante,

sendo ir = i − µr−1 e jr = j − νr−1 , com

r
X r
X
µr = mk νr = nk .
k=1 k=1
Propriedade (Soma direta de matrizes). A soma direta de matrizes também possui as seguintes
propriedades:
• A soma direta é associativa: A ⊕ (B ⊕ C) = (A ⊕ B) ⊕ C.
• A soma direta não é comutativa: A ⊕ B 6= B ⊕ A.
• O determinante da soma direta é igual ao produto dos determinantes das matrizes originais.
Dada a matriz B em (5.7),
P
Y
det (B) = det (Ai ) = det (A1 ) det (A2 ) · · · det (AP ) . (5.8a)
i=1
• O traço da soma direta é igual à soma dos traços das matrizes originais, i. e.,
P
X
Tr (B) = Tr (Ai ) = Tr (A1 ) + Tr (A2 ) + · · · + Tr (AP ) . (5.8b)
i=1
• A inversa da soma direta é igual à soma direta das inversas das matrizes originais, i. e.,
P
M
B−1 = A−1
i = A−1 −1 −1
1 ⊕ A2 ⊕ · · · ⊕ AP . (5.8c)
i=1
• Se A1 e A2 são ambas matrizes quadradas de ordem n e B1 e B2 são ambas matrizes quadra-

das de ordem m, então
(A1 ⊕ B1 ) (A2 ⊕ B2 ) = (A1 A2 ) ⊕ (B1 B2 ) . (5.8d)

5.4.2 S OMA DIRETA DE REPRESENTAÇÕES

A questão que se coloca agora é a seguinte: a soma direta de matrizes pode ser empregada
para gerar novas representações? Dado o grupo G = {G; ∗} e duas representações conhecidas,
D(1) (G) ⊆ GL (n1 , K) e D(2) (G) ⊆ GL (n2 , K), a soma direta
.
D(3) (G) = D(1) (G) ⊕ D(2) (G) ,
com D(3) (G) ⊆ GL (n1 + n2 , K), será também uma representação de G?

Dados g1 , g2 , g3 ∈ G, de acordo com a definição 5.3 e as expressões (5.1) e (5.2), se D(3) (g1 ),
D (g2 ) e D(3) (g3 ) são representações, então
(3)
D(3) (g3 ) = D(3) (g1 ∗ g2 ) = D(3) (g1 ) D(3) (g2 ) ,
ou seja,
nX
1 +n2
(3) (3) (3)
Dij (g3 ) = Dik (g1 ) Dkj (g2 ) , (i, j = 1, . . . , n1 + n2 ) .
k=1
Mas,
 (1)
Dij (gi ) ,
 i 6 n1 , j 6 n1
(3) (2)
Dij (gi ) = D(i−n 1 )(j−n1 )
(gi ) , n1 + 1 6 i 6 n1 + n2 , n1 + 1 6 j 6 n1 + n2

0, no restante.

Portanto, é possível realizar a seguinte partição:

n1 nX
1 +n2
(3) (3) (3) (3) (3)
X
16i6n1
(16j6n1 ) Dij (g3 ) = Dik (g1 ) Dkj (g2 ) + Dik (g1 ) Dkj (g2 )
k=1 k=n1 +1
n1 nX
1 +n2
(3) (3) (3) (3) (3)
X
16i6n1
(n1 +16j6n1 +n2 ) Dij (g3 ) = Dik (g1 ) Dkj (g2 ) + Dik (g1 ) Dkj (g2 )
k=1 k=n1 +1
n1 nX
1 +n2
(3) (3) (3) (3) (3)
X
n1 +16i6n1 +n2
( 16j6n1 ) Dij (g3 ) = Dik (g1 ) Dkj (g2 ) + Dik (g1 ) Dkj (g2 )
k=1 k=n1 +1
n1 nX
1 +n2
(3) (3) (3) (3) (3)
X
n1 +16i6n1 +n2
(n1 +16j6n1 +n2 ) Dij (g3 ) = Dik (g1 ) Dkj (g2 ) + Dik (g1 ) Dkj (g2 ) ,
k=1 k=n1 +1
ou seja,
n1
(3) (1) (1) (1)
X
16i6n1
(16j6n 1
) Dij (g3 ) = Dik (g1 ) Dkj (g2 ) = Dij (g3 )
k=1
16i6n1 (3)
( n1 +16j6n1 +n2 ) Dij (g3 ) = 0
n1 +16i6n1 +n2 (3)
( 16j6n1 ) Dij (g3 ) = 0
nX
1 +n2
(3) (2) (2) (2)
(nn11+16j6n
+16i6n1 +n2
1 +n2
) Dij (g3 ) = D(i−n1 )(k−n1 ) (g1 ) D(k−n1 )(j−n1 ) (g2 ) = D(i−n1 )(j−n1 ) (g3 ) ,
k=n1 +1
o que satisfaz a condição de clausura da representação.

Desta forma, mostrou-se que para todo g ∈ G,
 
D(1) (g) 0
D(3) (g) =  .
0 D(2) (g)
Em particular,
   
D(1) (I) 0 In1 0
D(3) (I) =  =  = In1 +n2 .
0 D(2) (I) 0 In2

Observa-se também que, como a soma direta não é comutativa, uma outra representação
D(4) (G), distinta de D(3) (G), pode ser obtida através de D(2) (G) ⊕ D(1) (G).
De uma forma geral, a partir de N representações distintas do grupo G, identificadas por
D(1) (G) , . . . , D(N ) (G) e de dimensões n1 , . . . , nN , respectivamente, é sempre possível para todo
g ∈ G construir-se uma representação D (g) de dimensão n1 + · · · + nN pela soma direta
N
M
D (g) = D(µ) (g) = D(1) (g) ⊕ D(2) (g) ⊕ · · · ⊕ D(N ) (g) ,
µ=1
cuja matriz bloco-diagonal é

 
D(1) (g) 0 ··· 0
 

D(2) (g) · · ·

 0 0 
D (g) =  .
 
.. .. .. ..

 . . . .


 
0 0 · · · D(N ) (g)
O artifício da soma direta de matrizes será explorado na seção 5.5 nos conceitos de represen-
tações redutíveis ou irredutíveis.
5.4.3 P RODUTO DIRETO DE MATRIZES

Dadas novamente a matriz A de tamanho m × n e a matriz B de tamanho p × q, o produto
direto ou o produto de Kronecker de ambas, executado pela operação binária representada pelo
símbolo “⊗”, resulta em uma matriz C de tamanho mp × nq tal que
 
a11 B a12 B · · · a1n B
 
 a21 B a22 B · · · a2n B 
C=A⊗B= . ,
 
 .. .. . . .. 
 . . . 
am1 B am2 B · · · amn B
sendo que cada “elemento” aij B consiste na verdade na matriz de tamanho p × q dada por
 
aij b11 aij b12 · · · aij b1q
 
aij b21 aij b22 · · · aij b2q 
aij B =  . .
 
 .. .. . . .. 
 . . . 

aij bp1 aij bp2 · · · aij bpq
Para se obter um elemento de C em termos dos elementos de A e B, pode-se usar a notação
cik,j` , onde uma linha de C é denotada pelo símbolo dual “ik” e uma coluna por “j`”, de tal forma
que
cik,j` = aij bk` , (1 6 i 6 m, 1 6 j 6 n, 1 6 k 6 p, 1 6 ` 6 q) .
Como um exemplo, o produto direto das matrizes
 
  hr
ab c  
A=  e B=
s t 

def
uv
é a matriz 6 × 6  
ah ar bh br ch cr
 
  as at bs bt cs ct 
 

 
aB bB cB au av bu bv cu cv 
C=A⊗B=   =
 .
dB eB f B dh dr eh er f h f r 

 
 ds dt es et f s f t 
 
du dv eu ev f u f v

Se {Ai } (i = 1, . . . , p) é um conjunto de matrizes, então o produto direto das mesmas pode ser
escrito como
p
O
B = A1 ⊗ A2 ⊗ · · · ⊗ Ap ≡ Ai . (5.9)
i=1
Propriedade 5.1 (Produto direto de matrizes). O produto direto de matrizes possui as seguintes
propriedades:
• O produto direto é associativo: A ⊗ (B ⊗ C) = (A ⊗ B) ⊗ C.
• O produto direto não é comutativo: A ⊗ B 6= B ⊗ A.
• O produto direto é distributivo com respeito à soma matricial:
A ⊗ (B + C) = A ⊗ B + A ⊗ C.
• Distributividade com respeito à soma direta:
(A ⊕ B) ⊗ C = A ⊗ C ⊕ B ⊗ C.
• Dadas as matrizes A1 , A2 , B1 e B2 , se os produtos matriciais A1 A2 e B1 B2 existem, então
(A1 ⊗ B1 ) (A2 ⊗ B2 ) = (A1 A2 ) ⊗ (B1 B2 ) . (5.10a)
• Devido à propriedade acima,

[p] [p] [p]
(AB) = (A) (B) ,
onde
p
O
A[p] = A = A ⊗ A ⊗ ··· ⊗ A.
| {z }
i=1 p vezes
• A inversa do produto direto é o produto direto das inversas, caso estas existam:
" p
#−1 p
O O
B−1
= Ai = A−1
i .
i=1 i=1
• O Hermitiano conjugado do produto direto é o produto direto dos Hermitianos conjugados:

" p #† p
A†i .
O O
†
B = Ai =
i=1 i=1
• Seja A uma matriz m × m e B uma matriz p × p. O determinante do produto direto das mesmas
é dado por:
p m
det (A ⊗ B) = [det (A)] [det (B)] .
• Se a matriz B é dada por (5.9), então

p
Y
Tr (B) = Tr (Ai ) = Tr (A1 ) Tr (A2 ) · · · Tr (Ap ) . (5.10b)
i=1
• Se A e B são matrizes quadradas com autovalores e autovetores {λi }, {xi } e {µj }, {yj }, res-
pectivamente, os autovalores de A ⊗ B são {λi µj } e seus autovetores são {xi ⊗ yj }, i. e., se
Axi = λi xi e Byj = µj yj , então
(A ⊗ B) (xi ⊗ yj ) = λi µj (xi ⊗ yj ) .

168 5.5. Representações redutíveis ou irredutíveis
5.4.4 P RODUTO DIRETO DE REPRESENTAÇÕES

Dado agora o grupo G = {G; ∗} e duas representações conhecidas, D(µ) (G) e D(ν) (G), considera-
se, para cada elemento g ∈ G, o seguinte produto direto:
.
D(µ×ν) (g) = D(µ) (g) ⊗ D(ν) (g) .
A questão que se coloca é se a matriz D(µ×ν) (g) consiste em uma representação do elemento g.
Se isto for verdade, então, para todos os produtos g1 ∗ g2 = g3 , resulta
h ih i
D (g1 ) D (g2 ) = D(µ) (g1 ) ⊗ D(ν) (g1 ) D(µ) (g2 ) ⊗ D(ν) (g2 ) .
Pelas propriedades do produto direto, resulta que

h i h i
D (g1 ) D (g2 ) = D(µ) (g1 ) D(µ) (g2 ) ⊗ D(ν) (g1 ) D(ν) (g2 )
= D(µ) (g3 ) ⊗ D(ν) (g3 )
= D(µ×ν) (g3 ) .
Ou seja, o produto direto de duas representações também é uma representação.

Genericamente, a operação
D(µ×ν) (G) = D(µ) (G) ⊗ D(ν) (G) (5.11)
é denominada o produto direto das representações D(µ) (G) e D(ν) (G) e a representação
D(µ×ν) (G) resultante é denominado o grupo do produto direto.
A propriedade (5.10b) possui também uma consequência importante no que concerne aos ca-
racteres de uma representação. Dadas as representações D(µ) (g) e D(ν) (g) de qualquer elemento
g ∈ G e o seu produto direto D(µ×ν) (g), os caracteres destas representações estão relacionados,
a partir de (5.6), por
χ(µ×ν) (g) = χ(µ) (g) χ(ν) (g) . (5.12)
Estas propriedades serão exploradas nas próximas seções.
5.5 R EPRESENTAÇÕES REDUTÍVEIS OU IRREDUTÍVEIS

Os conceitos de representações redutíveis e irredutíveis são centrais na teoria de representa-
ção de grupos. Na seção anterior mostrou-se que uma representação de dimensão maior pode
ser construída a partir da soma direta de representações de dimensões mais baixas. Considera-
se agora a questão oposta: dada uma representação D (G) de uma dada dimensão, é possível
descrevê-la em termos de representações mais “simples”, i. e., de mais baixas dimensões?
Um procedimento sistemático que pode ser adotado para responder a esta questão consiste
em realizar uma ou mais transformações de similaridade (5.5) sobre D (G) até que as matrizes
da representação fiquem próximas (mas não necessariamente idênticas) à forma bloco-diagonal.
Caso isto seja possível, esta representação é dita redutível.
Definição 5.8 (Representação redutível). Dado o grupo G = {G; ∗} e uma representação de

dimensão n D (G) ⊆ GL (n, K). Esta representação é denominada representação redutível se para
todo g ∈ G com representação D (g) ∈ D (G) existir uma transformação de similaridade (5.5) tal
que D (g) resulte na forma bloco-escalonada
 
D(1) (g) A(g)
D (g) =  , (5.13)
0 D(2) (g)
onde D(1) (g) ∈ D(1) (G) e D(2) (g) ∈ D(2) (G) (com D(1) (G) , D(2) (G) ⊂ D (G)) são também represen-
tações de G, respectivamente de dimensões n1 e n2 tais que n1 + n2 = n. Por sua vez, A (g) é uma
matriz retangular de tamanho n1 × n2 .

Verifica-se facilmente que a matriz D (g) expressa em (5.13) é uma representação do elemento
g. Dados g1 , g2 ∈ G com respectivas representações D (g1 ) e D (g2 ) dadas na forma (5.13), então
  
D(1) (g1 ) A(g1 ) D(1) (g2 ) A(g2 )
D (g1 ∗ g2 ) = D (g1 ) D (g2 ) =   
0 D(2) (g1 ) D(2) (g2 )0
 
D(1) (g1 ) D(1) (g2 ) D(1) (g1 ) A(g2 ) + A(g1 ) D(2) (g2 )
= .
0 D(2) (g1 ) D(2) (g2 )
O resultado acima está claramente na forma (5.13), uma vez que D(1) (g1 ) D(1) (g2 ) é uma re-
presentação de dimensão n1 de g1 ∗ g2 , enquanto que D(2) (g1 ) D(2) (g2 ) é uma representação de
dimensão n2 do mesmo elemento e D(1) (g1 ) A (g2 ) + A (g1 ) D(2) (g2 ) é uma matriz retangular de
tamanho n1 × n2 . Portanto, a condição de homomorfismo (5.1) está satisfeita.
A condição para que uma representação seja redutível está ligada à teoria de espaços ve-
toriais. Retornando ao espaço vetorial V n , de dimensão n, considerado na seção 5.2.2,9 a re-
ducibilidade de uma representação depende da existência de um subespaço próprio invariante
V n1 ⊂ V n , de dimensão n1 < n.10 Se u = ( u1 . . . un1 un1 +1 . . . un )T é um vetor de V n , então a ação
da representação D (g) na forma reduzida (5.13) sobre o mesmo irá resultar no vetor u0 dado
por u0 = D (g) u. Se o espaço vetorial possui um subespaço invariante de dimensão n1 , então
um vetor contido neste subespaço pode ser escrito, mediante uma escolha conveniente de base,
como u = (u1 . . . un1 0 . . . 0)T = ( un1 0 )T e o vetor u0 resulta
      
D(1) (g) A(g) un1 u0n1 D(1) (g)un1
  = = .
0 D(2) (g) 0 0 0
o mesmo ocorrendo para todos os outros elementos de G. Ou seja, os vetores u0 resultantes

da ação de D (G) sobre os vetores contidos no subespaço n1 também estão contidos no mesmo
subespaço, caracterizando o mesmo como invariante.
Por outro lado, para os vetores contidos no subespaço complementar de dimensão n2 = n−n1 ,
os quais podem ser escritos como u = (0 . . . 0 un1 +1 . . . un )T = ( 0 un2 )T , a aplicação do mesmo
operador resulta em
    
D(1) (g) A(g) 0 A(g)un2
u00 =   = .
0 D(2) (g) un2 D(2) (g)un2
Ou seja, o subespaço complementar não é invariante.

Agora surge a questão da reducibilidade das representações D(1) (g) e D(2) (g) em (5.13). Se
existir uma matriz S1 ∈ GL (n1 , K) tal que a transformação de similaridade (5.5) sobre D(1) (g) a
coloque também na forma (5.13), então
 
D(3) (g) A0 (g)
D(1) (g) =  ,
0 D(4) (g)
o mesmo ocorrendo com D(2) (g). Novamente, a condição imposta para a reducibilidade destas
representações consiste na existência de subespaços invariantes.
Procedendo-se desta forma, chega-se a um ponto onde não mais existem subespaços invari-
antes para a subsequente redução da representação e a matriz D (g) original fica então expressa
9 Ver também capítulo 4.

10 Subespaços invariantes foram considerados na seção 4.5.

170 5.5. Representações redutíveis ou irredutíveis
na forma  
D(1) (g) A(1) (g)
 
D(2) (g) A(2) (g)
 
 
 
D(3) (g) A(3) (g)
 
 
D(g) =  ..
.

 0 . .........



 0 
D(k−1) (g) A(k−1) (g) 

 0
 0 
(k)
0 D (g)
Por outro lado, se for possível encontrar uma base ortonormal para V n na qual todas as
matrizes da representação D (G) podem ser reduzidas na forma (5.13), porém com A (g) = 0,
então esta representação é dita completamente redutível.
Definição 5.9 (Representação completamente redutível). Dado o grupo G = {G; ∗} e uma
representação D (G) ⊆ GL (n, K). Esta representação é denominada representação completamente
redutível se para todo g ∈ G com representação D (g) ∈ D (G) existir uma transformação de
similaridade (5.5) tal que D (g) resulte na forma bloco-diagonal D (g) = D(1) (g) ⊕ D(2) (g), ou seja,
 
D(1) (g) 0
D (g) =  , (5.14)
0 D(2) (g)
onde D(1) (g) ∈ D(1) (G) ⊂ D (G) e D(2) (g) ∈ D(2) (G) ⊂ D (G) são também representações de G,
respectivamente de dimensões n1 e n2 tais que n1 + n2 = n.
Se esta condição for satisfeita, ambos os subespaços V n1 e V n2 são invariantes e o espaço
vetorial V n pode ser decomposto pela soma direta
V n = V n1 ⊕ V n2 .
Aplicando-se agora novas transformações de similaridade tanto sobre D(1) (g) quanto sobre
(2)
D (g) em (5.14), estas podem, por sua vez, também ser colocadas na forma bloco-diagonal,
dependendo da existência de subespaços invariantes de V n1 e V n2 . Nota-se aqui que sempre
é possível construir-se uma transformação de similaridade do tipo (5.5) a qual irá transformar
somente o bloco D(1) (g) em (5.14), mantendo D(2) (g) invariante. Uma matriz deste tipo seria
 
C1 0
S= ,
0 I n2
sendo C1 ∈ GL (n1 , K), pois

   
C1−1 0 D(1) (g) 0 C1 0
D0 (g) = S−1 D (g) S =    
0 In2 0 D(2) (g) 0 In2
 
C−1
1 D
(1)
(g) C1 0
= .
0 D(2) (g)
Repetindo-se este processo, chega-se a um ponto em que não mais existem subespaços inva-
riantes para a representação e a matriz D (g) resulta na forma bloco-diagonal
 
(1)



D̂ (g)
(2)
D̂ (g)



0
D (g) =  , (5.15a)
 
..
0 .
 
 
 
D̂(N ) (g)
onde as matrizes D̂(1) (g) , . . . , D̂(N ) (g) não podem mais ser reduzidas à forma bloco-diagonal por
nenhuma transformação de similaridade. Estas representações são denominadas irredutíveis.

Definição 5.10 (Representação irredutível). Dado o grupo G = {G; ∗} e uma representação

D̂ (G) ⊆ GL (n, K). Esta representação é denominada representação irredutível ou Irrep se, para
todo g ∈ G com representação D (g) ∈ D (G), não existir uma transformação de similaridade (5.5)
tal que D̂ (g) resulte na forma bloco-diagonal (5.14).
A definição acima implica em que não existem subespaços próprios invariantes que decompo-
nham o espaço V n . Quando uma representação D (G) puder ser escrita na forma bloco-diagonal
(5.15a) em termos das matrizes D̂(µ) (g), estas são denominadas as representações irredutíveis
ou irreps de G e a forma da representação D (g) em (5.15a) é dita completamente reduzida.
Dentre as N irreps em (5.15a) pode ocorrer que diversas são equivalentes entre si, todas com
a mesma dimensão. Representações irredutíveis equivalentes não são consideradas distintas
entre si e se pode usar a mesma designação para estas. Neste caso, dada a irrep D̂(µ) (g), de
dimensão nµ , se houver mµ = 0, 1, . . . irreps equivalentes entre si, a representação D (g) em
(5.15a) pode ser escrita como
N
M
D (g) = mµ D̂(µ) (g) = m1 D̂(1) (g) ⊕ m2 D̂(2) (g) ⊕ · · · ⊕ mN D̂(N ) (g) . (5.15b)
µ=1
Portanto, se para um dado grupo G for possível escrever a sua representação na forma com-
pletamente reduzida (5.15), as suas irreps conterão toda a informação carregada pelos operado-
res de transformação. A vantagem de empregar as irreps é evidente, uma vez que estas em geral
são matrizes de baixa dimensão, fáceis de serem manuseadas.
A questão que ainda resta é se qualquer representação pode ser escrita em termos de irreps.
O teorema a seguir oferece uma resposta parcial a esta questão ao mostrar que uma represen-
tação qualquer de um grupo finito é sempre equivalente a uma representação unitária.
Definição 5.11 (Representação unitária). Dado o grupo G e uma representação Γ (G) ⊆ GL (n, K).
Se para todo g ∈ G a sua representação Γ (g) ∈ Γ (G) for uma matriz unitária, i. e.,
Γ† (g) Γ (g) = Γ (g) Γ† (g) = In ,
então Γ (G) é denominada uma representação unitária de G.
Teorema 5.1. Dado o grupo G = {G; ∗} finito e uma representação D (G) ⊆ GL (n, K). Esta repre-
sentação é sempre equivalente a uma representação unitária Γ (G) ⊆ GL (n, K).
Demonstração. Define-se a matriz Hermitiana
X
H= D (g) D† (g) ,
g∈G
ou seja, a qual satisfaz H = H† . Uma vez que qualquer matriz Hermitiana sempre pode ser dia-
gonalizada por uma transformação de similaridade (5.5) através do uso de uma matriz unitária
U, então
U−1 HU = Hd ,
onde Hd é uma matriz diagonal cujos elementos são os autovalores (reais) de H. Mas,
 
X
Hd = U−1  D (g) D† (g) U
g∈G
X
−1
= U D (g) UU−1 D† (g) U
g∈G
X
= D0 (g) D0† (g) ,
g∈G
onde D0 (g) = U−1 D (g) U. Tomando agora o k-ésimo elemento de Hd , observa-se que
XX
0 0†
XX
0 0∗
XX
0
2
dk = (Hd )kk = Dkj (g) Djk (g) = Dkj (g) Dkj (g) = Dkj (g) ,
g∈G j g∈G j g∈G j
0
ou seja, dk > 0. Para que dk seja nulo, é necessário que Dkj (g) = 0, ∀j, g, o que implica que
det [D (g)] = 0, ∀g, o que implicaria que D (g) ∈
/ GL (n, K). Portanto, necessariamente, dk > 0 e
det (Hd ) > 0.

172 5.6. Teoremas fundamentais sobre representações de grupos e caracteres
√
Pode-se definir agora a matriz Hermitiana diagonal E, cujos elementos são Eij = di δij ,
tal que E2 = Hd . Definindo-se então a matriz de transformação V = UE, para todo D (g) ∈
D (G), resulta que a partir da representação D (g) é sempre possível obter-se uma representação
unitária equivalente Γ (g) através da transformação de similaridade
Γ (g) = V−1 D (g) V = E−1 U−1 D (g) UE = E−1 D0 (g) E.
Para verificar que as matrizes Γ (g) realmente são unitárias, calcula-se

† †
Γ (g) Γ† (g) = E−1 D0 (g) E E−1 D0 (g) E = E−1 D0 (g) EE† D0† (g) E−1

 
X
= E−1 D0 (g) Hd D0† (g) E−1 = E−1 D0 (g)  D0 (g 0 ) D0† (g 0 ) D0† (g) E−1
g 0 ∈G
X X
= E−1 D0 (g) D0 (g 0 ) D0† (g 0 ) D0† (g) E−1 = E−1 D0 (g ∗ g 0 ) D0† (g ∗ g 0 ) E−1
g 0 ∈G g 0 ∈G
−1 −1
=E Hd E .
−1/2
Mas, como E−1

ij
= di δij , resulta que
X X −1/2 −1/2 −1/2 1/2
Γ (g) Γ† (g) ij = E−1 i` (Hd )`k E−1 kj =

di d` dk δi` δ`k δkj = di dj δij = δij .
k,` k,`
Ou seja, Γ (g) Γ† (g) = In para todo g ∈ G e a representação Γ (G) é unitária.

A importância deste teorema é percebida retornando-se a (5.13). Se a representação D (G) é
redutível, então realizando-se a transformação de similaridade com a matriz V = UE obtém-se
a representação Γ (G), a qual deve estar na forma (5.13). Contudo, como Γ (g) é unitária para
qualquer g ∈ G, observa-se que, se
 
Γ(1) (g) A(g)
Γ (g) =  ,
0 Γ(2) (g)
isto é, se
 (1) (1)   (1)∗ (1)∗ 
Γ11 · · · Γ1n1 A11 · · · A1n2 Γ11 · · · Γ n1 1 0 ··· 0
 . .. . .. .. ..   . .. . .. .. .. 
 .. . .. . . .   .. . .. . . . 
   
 (1) (1)  (1)∗ (1)∗
Γ · · · Γ n 1 n 1 An 1 1 · · · An 1 n 2  Γ1n1 · · · Γ n1 n1 0 ··· 0 
 
†
Γ (g) =  n1 1 (2) (2)  , então Γ (g) =  ∗ (2)∗ (2)∗  ,
 0 · · · 0 Γ11 · · · Γ1n2    A11 · · · A∗n1 1 Γ11 ··· Γn2 1 
 .. . .. .  .. . .. .. 
  
.. .. .. ..
. .. . ..  . ..

 . .  . . . . 
(2) (2) (2)∗ (2)∗
0 ··· 0 Γn2 1 · · · Γn2 n2 A∗1n2 ∗
· · · An1 n2 Γ1n2 · · · Γn2 n2
ou seja,
Γ(1)† (g)

† 0
Γ (g) = .
A† (g) Γ(2)† (g)
Isto significa que se Γ (g) for unitária, então, necessariamente, A (g) = 0, e a representação é
sempre totalmente redutível.
A conclusão, portanto, é que para grupos finitos sempre é possível encontrar-se uma repre-
sentação completamente reduzida em termos das representações irredutíveis.
5.6 T EOREMAS FUNDAMENTAIS SOBRE REPRESENTA -

ÇÕES DE GRUPOS E CARACTERES
Serão apresentados agora alguns teoremas adicionais sobre representações irredutíveis de
grupos e seus caracteres. Esses teoremas oferecem diversas informações importantes, como o
número total de irreps de um determinado grupo e suas dimensões.

5.6.1 T EOREMAS SOBRE REPRESENTAÇÕES

Alguns dos principais teoremas sobre representações de grupos são apresentados nesta se-
ção.
Lema 5.1 (Lema de Schur 1). Se D̂ (G) é uma representação irredutível de um grupo G e se
uma matriz P comuta com todas as matrizes D̂ (a) ∈ D̂ (G) (∀a ∈ G), então P deve ser uma matriz
constante, i. e., P = λI, sendo λ um escalar.
Lema 5.2 (Lema de Schur 2). Se D̂(µ) (G) e D̂(ν) (G) são duas representações irredutíveis de um
grupo G, de dimensões nµ e nν respectivamente, e se uma matriz M de tamanho (nµ × nν ) satisfaz
a relação
D̂(µ) (a) M = MD̂(ν) (a) ,
para todo a ∈ G, então ou:
(a) M = 0, i. e., M é a matriz nula, ou
(b) det (M) 6= 0, em cujo caso D̂(µ) e D̂(ν) são representações equivalentes (com nµ = nν ).
Chega-se então ao grande teorema da ortogonalidade para as representações irredutíveis de

um grupo. Este teorema ocupa uma posição central na teoria de representações de grupos.
Teorema 5.2 (Teorema da ortogonalidade). Seja G um grupo de ordem g e sejam Γ(µ) (G) e
Γ(ν) (G) representações irredutiveis unitárias de G, de dimensões nµ e nν , respectivamente. Então,
para todo ai ∈ G,
X (µ) (ν)
X (µ) (ν)∗ g
Γjm (ai ) Γnk a−1

i = Γjm (ai ) Γkn (ai ) = δµν δjk δmn . (5.16)
nµ
ai ∈G ai ∈G
O teorema da ortogonalidade possui uma interpretação interessante dentro da teoria de es-

paços vetoriais. Essa interpretação será apresentada na seção 5.6.2.
Uma expressão complementar ao teorema da ortogonalidade é a relação de completeza para
as representações, apresentada a seguir.
Teorema 5.3 (Relação de completeza). Seja G um grupo de ordem g e

.
n o
Γ = Γ(µ) (G) | µ = 1, . . . , N
o conjunto de suas representações irredutíveis unitárias. Então, dados ai , aj ∈ G,

N Xnµ r r
X nµ (µ) nµ (µ)∗
Γk` (ai ) Γ (aj ) = δij ,
µ=1
g g k`
k,`=1
onde nµ é a dimensão da µ-ésima representação.
5.6.2 I NTERPRETAÇÃO DO TEOREMA DA ORTOGONALIDADE

Considera-se um grupo finito G de ordem g. Assume-se agora que o número total de repre-
sentações irredutíveis não equivalentes de G seja igual a N . Dada a representação irredutível
unitária Γ(µ) (G) ⊆ GL (nµ , K) de dimensão nµ , cada matriz Γ(µ) (ai ) ∈ Γ(µ) (G) na representação
(µ)
contém um total de n2µ elementos. A quantidade Γjk (ai ) é um destes elementos, com ai ∈ G,
1 6 µ 6 N e 1 6 j, k 6 nµ .
Define-se agora a g-upla
(µ) .

(µ) (µ) (µ)
Γjk = Γjk (a1 ) , Γjk (a2 ) , . . . , Γjk (ag ) .
As diferentes g-uplas que podem ser construídas a partir de todas as irreps unitárias de G são
distinguidas pelos índices µ, j, k. Assim, pode-se formar o conjunto
.
n o
(µ)
Γ = Γjk | 1 6 µ 6 N, 1 6 j, k 6 nµ , (5.17)

composto por todas as g-uplas possíveis. O número total de g-uplas neste conjunto, ou seja, a
sua cardinalidade, é igual a
N
X
|Γ| = n2µ .
µ=1
Será demonstrado agora que o conjunto Γ é composto por vetores, denominados vetores de
representação, de um espaço vetorial normado e com produto interno, de dimensão g, o qual
possui propriedades semelhantes ao espaço vetorial R g , porém com algumas diferenças. Cada
(µ)
componente de Γjk (G) é um elemento do corpo K. Os corpos de interesse para a física são, em
sua grande maioria, K = R ou K = C. Será assumido então um destes corpos em particular.
Retornando então à definição de um espaço vetorial, apresentada na seção 4.1, seja o espaço
.
vetorial complexo K g = hK, Ki sobre o corpo K, onde o conjunto K é o conjunto de vetores em
K g , formado pelas g-uplas
K = {κ | κ = (κ1 , κ2 , . . . , κg ) , onde κi ∈ K} .
Este conjunto forma um grupo Abeliano frente a operação de adição vetorial “+”:
• Clausura: se κ, η ∈ K, então κ + η = (κ1 + η1 , κ2 + η2 , . . . , κg + ηg ) ∈ K.
• Associatividade: se κ, η, ζ ∈ K, então κ + (η + ζ) = (κ + η) + ζ.
• Elemento identidade: existe 0 = (0, 0, . . . , 0) ∈ K tal que para todo κ ∈ K resulta 0 + κ = κ + 0 =
κ.
• Elemento inverso: para todo κ ∈ K existe o elemento (−κ) = (−κ1 , −κ2 , . . . , −κg ) tal que
κ + (−κ) = (−κ) + κ = 0.
• Comutatividade: para todos κ, η ∈ K, resulta κ + η = η + κ.
Se o corpo K forma o conjunto dos escalares de K g , então o produto por escalar é definido,
para todo κ ∈ K e todo k ∈ K, como
k.κ = (kκ1 , kκ2 , . . . , kκg ) .
O produto interno em K g será definido como a forma sesquilinear h · , · i : K g × K g

7−→ K tal
que, dados κ, η ∈ K g , o produto interno de κ por η será a quantidade
g
X
hκ, ηi = κ∗i ηi .
i=1
P 2
Esta definição satisfaz todos os requisitos de um produto interno; em particular, hκ, κi = i |κi | >
0, sendo que hκ, κi = 0 somente se κ = 0.
Retornando agora ao conjunto Γ, é fácil verificar que Γ ⊂ K g . Considera-se então o produto
(ν) (µ)
interno entre os vetores Γkn , Γjm ∈ Γ. Este resulta igual a
D g
E X g
(ν) (µ) (µ) (ν)∗ (µ) (ν)
X
Γjm (ai ) Γnk a−1

Γkn , Γjm = Γjm (ai ) Γkn (ai ) = i .
i=1 i=1
O último resultado ocorre porque as matrizes Γ(µ) (a) são unitárias, ou seja, Γ(µ) (a) Γ(µ)† (a) =
Γ(µ)† (a) Γ(µ) (a) = Inµ , de onde resulta que
h i−1
Γ(µ)† (a) = Γ(µ) (a) = Γ(µ) a−1 ,

sendo que o último resultado é uma das propriedades do grupo de representação. Por isso,
(ν)
dados a matriz unitária Γ(ν) (ai ) e o elemento Γnk (ai ) da mesma em particular, ao se tomar o
(ν)† (ν)∗ −1 (ν)
conjugado Hermitiano da matriz, resulta que Γnk (ai ) = Γkn (ai ) = Γ(ν) (ai ) nk = Γnk a−1

i .
Porém, do teorema da ortogonalidade (5.16) obtém-se que
D
(ν) (µ)
E µ6=ν D
(µ) (µ)
E g D
(ν) (µ)
E g
Γkn , Γjm = 0, se j6=k ou Γjm , Γjm = =⇒ Γkn , Γjm = δµν δjk δmn , (5.18)
m6=n nµ nµ

(µ)
sendo que o último resultado serve para definir a norma de Γjm (G). Portanto, conclui-se que
o conjunto Γ é formado por vetores mutuamente ortogonais frente ao produto interno definido.
Este resultado é muito interessante porque a cardinalidade de qualquer conjunto de vetores
mutuamente ortogonais nunca pode exceder a dimensão do espaço vetorial,11 ou seja,
N
X
|Γ| = n2µ 6 g. Na verdade, |Γ| = g. (5.19)
µ=1
Posteriormente será demonstrado que, de fato, |Γ| = g.12 Este resultado é importante porque
fornece uma informação adicional sobre o número e as dimensões das irreps de um grupo finito.
Os exercícios a seguir ilustram a construção das irreps do grupo S3 e aplicações do teorema
da ortogonalidade às mesmas.
Exercício 5.1. Encontre o conjunto de representações irredutíveis do grupo S3 .

Resolução: De acordo com a condição (5.19), o número de irreps unitárias deste grupo e suas
dimensões deve satisfazer |Γ| = |S3 | = 6. Existem duas possibilidades: ou todas as irreps têm
dimensão 1, existindo então 6 irreps não equivalentes, ou há 2 irreps de dimensão 1 e uma de
dimensão 2, pois 12 + 12 + 22 = 6. Será mostrado que a segunda opção é a correta.
Irreps de dimensão 1: de acordo com a tabela de multiplicações do S3 , obtida no exercício 3.5,
π22 = π32 = π62 = I. Então, a representação Γ (S3 ) de dimensão 1 deve ser tal que
2
Γ π22 = Γ (π2 ) Γ (π2 ) = [Γ (π2 )] = Γ (I) = 1,

ou seja, Γ (π2 ) = ±1, com o mesmo ocorrendo para π3 e π6 . Por outro lado, π43 = π53 = I, de onde
se conclui que
3 3 1 √
[Γ (π4 )] = [Γ (π5 )] = 1 =⇒ Γ (π4 ) , Γ (π5 ) = 1, t, t2 , sendo t = − 1−i 3 .
2
Mas, como π2 ◦ π3 = π4 , segue que Γ (π2 ) Γ (π3 ) = Γ (π4 ). Da mesma forma, como π3 ◦ π2 = π5 ,
segue que Γ (π3 ) Γ (π2 ) = Γ (π5 ). Portanto, existem somente duas escolhas possíveis de irreps de
dimensão 1 que satisfazem a tabela de S3 :
Γ(1) (S3 ) :Γ(1) (g) = 1, ∀g ∈ S3

(
Γ(2) (I) = Γ(2) (π4 ) = Γ(2) (π5 ) = 1
Γ(2) (S3 ) :
Γ(2) (π2 ) = Γ(2) (π3 ) = Γ(2) (π6 ) = −1.
Ambas são representações degeneradas.

Irrep de dimensão 2: busca-se agora a representação Γ(3) (S3 ) ⊂ GL (2, R). Já de início,
(3)
Γ (I) = I2 . Para os demais elementos, usa-se novamente a informação contida na tabela
do grupo para obter as matrizes na forma

ab
Γ(3) (πi ) = , para i = 2, . . . , 6 e com a, b, c, d ∈ R.
cd
Novamente, como π22 = π32 = π62 = I, então, para i = 2, 3, 6
a2 + bc = 1 ab + bd = 0

ab ab 10
= =⇒
cd cd 01 ac + cd = 0 bc + d2 = 1.
Dentre as equações acima,
ab + bd = b (a + d) = 0 =⇒ d = −a ou b = 0.
Toma-se a opção destacada. Da mesma forma,
ac + cd = 0 =⇒ d = −a ou c = 0.
11 Ver teoremas e definições na seção 4.3.
12 A demonstração será realizada na página 183.

Das equações restantes, resulta então que
a2 + bc = 1 ⇒ a = ±1 bc + d2 = 1 ⇒ d = ±1.
Há 4 combinações de sinais, com 3 disponíveis para uma representação fiel. Contudo, somente
para um elemento a escolha é adequada. Realizando as outras escolhas para os demais elemen-
tos, o resultado não seguirá a tabela do grupo. Assim, escolhe-se somente

(3) −1 0
Γ (π2 ) = ,
0 1
uma vez que para essa escolha a matriz é ortogonal: Γ(3) (π2 ) Γ(3) ^(π2 ) = I2 .
Buscam-se então matrizes também ortogonais para os demais elementos, ou seja, para i =
3, . . . , 6, matrizes Γ(3) (πi ) tais que
h i−1
Γ(3) (πi ) = Γ^
(3) (π ).
i
Então, se
i−1 1
ab d −b ac
h
Γ(3) (πi ) = =⇒ Γ(3) (πi ) = = ,
cd ad − bc −c a bd
resultando em
d b
=a = −c
ad − bc ad − bc
c a
= −b = d.
ad − bc ad − bc
Então,
d
= d (ad − bc) ⇒ ad − bc = ±1.
ad − bc
Escolhendo ad − bc = 1, a = d e b = −c, escreve-se

a b
Γ(3) (πi ) = , com a2 + b2 = 1 .
−b a
Como π43 = I, resulta
( )
a3 − 3ab2 = 1
3 3
a − 3ab2 3a2 b − b3 b=0

a b 10
= = ⇒ ⇒ .
−b a −3a2 b + b3 a3 − 3ab2 01 3a2 b − b3 = 0 3a2 − b2 = 0
Então,
√
2 2 1 2 2 2 3
3a = 1 − a ⇒ 4a = 1 ⇒ a = − e b = 1 − a ⇒ b = .
2 2
Portanto,
√
1 −1 3
Γ (3)
(π4 ) = √ .
2 − 3 −1
Agora, como π2 ◦ π3 = π4 ,
√ √ √
a = 1/2 b = − 3/2

−1 0 ab 1 −1 3 1 1 − 3
= √ ⇒ √
(3)
⇒ Γ (π3 ) = √ .
0 1 cd 2 − 3 −1 c = − 3/2 d = −1/2 2 − 3 −1
Por outro lado, como π5 = π3 ◦ π2 ,

√ √
1 1 − 3 −1 0 1 −1 − 3
Γ(3) (π5 ) = √ ⇒ Γ(3) (π5 ) = √ .
2 − 3 −1 0 1 2 3 −1
Finalmente, como π6 = π2 ◦ π5 ,
√ √
1 −1 0 −1 − 3 1 1 3
Γ(3) (π6 ) = √ ⇒ Γ(3) (π6 ) = √ .
2 0 1 3 −1 2 3 −1
Verifica-se facilmente que todas as matrizes obtidas são ortogonais e que esta representação é
fiel. A tabela 5.1 destaca as irreps do grupo S3 .

Tabela 5.1: Representações irredutíveis ortogonais do grupo S3 .

Irreps de S3
(1)
Γ Γ(2) Γ(3)
nµ
1 1 2
πi
10
I 1 1
01
−1 0
π2 1 -1
0 1√
1 1 − 3
π3 1 -1 √
2 − 3 √ −1
1 −1 3
π4 1 1 √
2 − 3 √ −1
1 −1 − 3
π5 1 1 √
2 3 √ −1
1 1 3
π6 1 -1 √
2 3 −1
Exercício 5.2. Verifique o teorema da ortogonalidade para as representações irredutíveis do

grupo S3 .
Resolução. Dadas as irreps na tabela 5.1 e o teorema (5.16), é possível realizar várias combina-
ções distintas. Por exemplo:
(1) (1)
(a) µ = ν = 1. Neste caso, j = m = n = k = 1 e Γjm (ai ) = Γnk a−1

i = 1, resultando em
6
12 + 12 + 12 + 12 + 12 + 12 = .
1
(b) µ = ν = 2. Neste caso,

6
1.1 + 1.1 + (−1) (−1) + (−1) (−1) + 1.1 + 1.1 + (−1) (−1) = .
1
(c) µ = 1, ν = 2. Neste caso,
1.1 + 1.1 + 1. (−1) + 1. (−1) + 1.1 + 1. (−1) = 0.
(d) µ = 1, ν = 3. Tomando j = m = 1 e k = 1, n = 2,
√ ! √ √ ! √
3 3 3 3
1.0 + 1.0 + 1. − + 1. + 1. − + 1. = 0.
2 2 2 2
(e) µ = ν = 3. Tomando j = m = k = n = 2:

1 1 1 1 1 1 1 1 6
1.1 + 1.1 + − − + − − + − − + − − = .
2 2 2 2 2 2 2 2 2
(f) µ = ν = 3. Tomando j = 1, m = 2, k = 1, n = 2:
√ ! √ ! √ √ √ ! √ ! √ √
3 3 3 3 3 3 3 3 6
0.0 + 0.0 + − − + + − − + = .
2 2 2 2 2 2 2 2 2
(g) µ = ν = 3. Tomando j = 1, m = 2, k = 2, n = 1:
√ ! √ ! √ √ ! √ !√ √ √
3 3 3 3 3 3 3 3
0.0 + 0.0 + − − + − + − + = 0.
2 2 2 2 2 2 2 2
Observa-se que todos os resultados acima satisfazem o teorema da ortogonalidade. Diversas

outras combinações são possíveis, mas que não serão apresentadas aqui.

Observa-se aqui que qualquer grupo possui sempre a representação irredutível trivial
Γ (a) = 1, para todo a ∈ G.
Esta representação não é fiel, mas permite a obtenção de um conjunto de relações entre os
elementos de quaisquer outra representação a partir do teorema da ortogonalidade. Colocando-
(ν)∗
se, em (5.16), Γkn (ai ) = 1 e assumindo que µ 6= ν, resulta
X (µ) X (µ)
Γjm (ai ) = 0, ou Γjm (ai ) = −δjm ,
ai ∈G ai ∈G
ai 6=I
uma vez que a representação da identidade é sempre Inµ . Esta expressão fornece um sistema
de g equações que os elementos da µ-ésima representação devem satisfazer. Estas equações
são úteis, por exemplo, para verificar se uma determinada representação é realmente irredu-
tível e unitária. Verifica-se facilmente que os elementos das representações Γ(2) (S3 ) e Γ(3) (S3 ),
apresentadas na tabela 5.1, satisfazem estas relações.
5.6.3 T EOREMAS SOBRE CARACTERES

Serão apresentados agora teoremas importantes concernentes aos caracteres de uma repre-
sentação.
Teorema 5.4. Dado o grupo G = {G; ∗} e uma representação ρ : G 7−→ D (G) ⊆ GL (n, K), os
elementos de G pertencentes a uma dada classe de conjugação possuem os mesmos caracteres
em ρ.
Demonstração. Retornando à definição 3.15 de uma classe de conjugação, dado o elemento
a ∈ G, a sua classe de conjugação é dada por
Ca = b−1 ∗ a ∗ b, ∀b ∈ G .

Então, para qualquer c ∈ Ca , existe um elemento d ∈ G tal que c = d−1 ∗ a ∗ d. Neste caso, as
respectivas representações destes elementos devem satisfazer
−1
D (c) = D d−1 ∗ a ∗ d = D d−1 D (a) D (d) = [D (d)] D (a) D (d) .

Em consequência, o caractere do elemento c na representação ρ é dado por (5.6) e deve satisfazer

n o
−1
χρ (c) = Tr [D (c)] = Tr [D (d)] D (a) D (d)
n o
−1
= Tr D (a) [D (d)] D (d) = Tr {D (a)} = χρ (a) .
Portanto, todos os elementos da classe Ca possuem o mesmo caractere na representação ρ.

Dado o grupo G, suas diferentes representações são distinguidas pelo índice “µ” em D(µ) (G).
Como o caractere um determinado elemento de G depende da representação empregada em par-
ticular, é conveniente então distinguir-se os caracteres também com o mesmo índice empregado
para a representação; ou seja, se a representação de g ∈ G é D(µ) (g), então o seu caractere nesta
representação pode ser identificado por χ(µ) (g). Quando o grupo possui mais de um classe de
conjugação, é útil também distinguir as mesmas para uma dada representação. Neste caso, o
(µ)
símbolo χa indica o caractere dos elementos da classe Ca na representação µ.
Para um determinado grupo finito, muitas vezes é útil construir-se a sua tabela de caracteres,
a qual indica tanto a partição de seus elementos em classes de conjugação quanto os valores
dos caracteres para cada representação irredutível. Os exemplo a seguir obtém a tabela de
caracteres do grupo S3 .
Exemplo 5.3 (Tabela de caracteres do grupo S3 ). Dado o grupo S3 , cuja tabela de multiplica-
ções foi obtida no exercício 3.5, as suas classes de conjugação são: a classe CI = {I}, a classe
Cπ2 , composta por πi−1 ◦ π2 ◦ πi , para i = 1, . . . , 6:
I   I  π 
 π2   π2   π22 
π3
◦ π2 ◦ ππ34 = ππ66 =⇒ Cπ2 = {π2 , π3 , π6 } = Cπ3 = Cπ6 ,
 ππ54   π5   π3 
π6 π6 π3

e a classe Cπ4 , composta por

I  I  π 
 π2   π2   π45 
π3 π3 π5
◦ π4 ◦ = =⇒ Cπ4 = {π4 , π5 } = Cπ5 .
 ππ54   ππ45   ππ44 
π6 π6 π5
Portanto, de acordo com a tabela 5.1 de irreps do S3 , obtém-se a tabela 5.2 de caracteres do
grupo.
Tabela 5.2: Tabela de caracteres do grupo S3 . Os caracteres de cada representação são identificados por índices
que seguem a classificação dos irreps do S3 apresentados na tabela 5.1.
Classes CI C π2 Cπ4
Caracteres {I} {π2 , π3 , π6 } {π4 , π5 }
χ(1) +1 +1 +1
χ(2) +1 −1 +1
χ(3) +2 0 −1
Obtém-se agora o teorema de ortogonalidade dos caracteres a partir do teorema (5.16).

Teorema 5.5 (Ortogonalidade dos caracteres). Seja G um grupo de ordem g, com representa-
ções irredutíveis unitárias Γ(µ) (G) e Γ(ν) (G), de dimensões nµ e nν , respectivamente. Se Ca é a
classe de conjugação do elemento a ∈ G, ca é a cardinalidade de Ca , e nC é o número de classes
de conjugação de G, então
nC r r
X ck (µ) ck (ν)∗
χk χ = δµν , (5.20a)
g g k
k=1
(µ)
onde χk é o caractere de qualquer elemento na classe Ck na representação Γ(µ) (G) e a soma é
realizada sobre todas as classes de conjugação distintas do grupo G.
Demonstração. Partindo do teorema de ortogonalidade (5.16), coloca-se j = m e n = k e soma-se
sobre m e n, resultando
nµ nν nµ nν
X XX g X X
Γ(µ) (ν)∗
mm (ai ) Γnn (ai ) = δµν δmn .
m=1 n=1 ai ∈G
nµ m=1 n=1
Mas,
nµ nν nµ nν
X X X X
Γ(µ)
mm (ai ) = χ
(µ)
(ai ) , Γ(ν)∗
nn (ai ) = χ
(ν)
(ai ) e δµν δmn = δµν nµ ,
m=1 n=1 m=1 n=1
resultando X
χ(µ) (ai ) χ(ν)∗ (ai ) = gδµν .
ai ∈G
A soma sobre os elementos ai pode ser agora particionada em conjuntos contendo os elementos
das classes de conjugação de G, os quais possuem todos os mesmos caracteres. Desta maneira,
o resultado acima pode ser escrito
nC
(µ) (ν)∗
X
ck χk χk = gδµν ,
k=1
(µ)
sendo que a soma agora é sobre as classes de G, χk é o caractere dos elementos na classe
Ck e na representação µ e ck é o número de elementos na classe. Obtém-se assim o resultado
(5.20).
Como sempre existe, para qualquer grupo, uma irrep unitária ou trivial Γ(1) (a) = +1 para
todo a ∈ G, os caracteres desta irrep serão os mesmos em qualquer classe, ou seja, χ(1) (a) =
(1)
χk = +1 (∀a, k). Colocando-se então ν = 1 na condição de ortogonalidade (5.20a), os caracteres
de qualquer outra representação µ 6= 1 devem satisfazer
nC
(µ)
X
ck χk = 0, (µ 6= 1) . (5.20b)
k=1
O teorema de ortogonalidade dos caracteres possui também uma interpretação geométrica

com base na teoria de espaços vetoriais, de forma semelhante à interpretação realizada para o
teorema da ortogonalidade das representações.

5.6.4 I NTERPRETAÇÃO DO TEOREMA DA ORTOGONALIDADE DOS

CARACTERES
Dado o grupo finito G de ordem g, se o mesmo possui nC classes de conjugação, sendo
ck = |Ck | a cardinalidade da k-ésima classe, então pode-se definir a tupla
r r r
(µ) . c1 (µ) c2 (µ) cnC (µ)
χ̂ = χ , χ ,..., χ , (5.21a)
g 1 g 2 g nC
a qual é composta pelos caracteres de cada classe na representação µ. Assim, cada tupla χ̂(µ) é
distinguida pelo índice que identifica a representação do grupo, existindo tantas tuplas quantas
representações. Restringindo-se às representações irredutíveis, assume-se que existem, ao todo,
N irreps de G. Neste caso, o conjunto
.
n o
χ = χ̂(1) , χ̂(2) , . . . , χ̂(N ) (5.21b)
é composto por N = |χ| tuplas.

(µ)
Como a quantidade χk ∈ K (K = C ou K = R), a tupla χ̂(µ) é um vetor, denominado vetor
de caracteres, do espaço vetorial K nC sobre o corpo K, com dimensão nC . Definindo-se então a
produto interno do vetor ψ pelo vetor ζ (com ψ, ζ ∈ K nC ) por
nC
X
hψ, ζi = ψi ζi∗ ,
i=1
o teorema (5.20) mostra que

nC nC r r
D E X
(µ) (ν)∗
X ci (µ) ci (ν)∗
χ̂(µ) , χ̂(ν) = χ̂i χ̂i = χi χ = δµν . (5.21c)
i=1 i=1
g g i
Portanto, o conjunto χ ⊂ K nC é composto por vetores ortonormais do espaço vetorial.

Como a cardinalidade de um conjunto contendo vetores ortogonais não pode exceder a di-
mensão do espaço vetorial, resulta que
|χ| = N 6 nC . (5.22)
Será mostrado posteriormente que, na verdade, N = nC , ou seja, o número de representações
irredutíveis de G é igual ao número de suas classes de conjugação. Este resultado também é útil
para a determinação do número total de representações irredutíveis de um grupo finito.
Exemplo 5.4 (Número de Irreps de S3 ). O número de classes de conjugação do grupo S3 é
nC = 3, como pode ser visto na tabela 5.2. Portanto,
NS3 = nC = 3,
sendo NS3 o número de representações irredutíveis do grupo. Combinando-se esta informação
com a expressão (5.19), conclui-se que realmente o único conjunto possível de Irreps do S3 é
aquele obtido no exercício 5.1.
Exemplo 5.5 (Tabela de caracteres do grupo C1h ). O grupo C1h , dado por (3.7), é composto
somente pela identidade E e pela reflexão σh . Por ser um grupo Abeliano, ambos elementos
formam classes de conjugação por si próprios e, por conseguinte, N = nC = |C1h | = 2. Isto implica
que há somente duas representações irredutíveis, ambas unidimensionais. Como Γ(1) (C1h ) =
χ(1) (C1h ) = +1, a outra irrep, para satisfazer a tabela de multiplicações do grupo, deve ser
Γ(2) (E) = χ(2) (E) = +1 e Γ(2) (σh ) = χ(2) (σh ) = −1. Resulta então a tabela 5.3.
Finalmente, existe também uma relação de completeza para os caracteres.
(µ)
Teorema 5.6 (Relação de completeza de caracteres). Seja G um grupo de ordem g e χk o
caractere de qualquer elemento na classe de conjugação Ck e na representação irredutível unitária
Γ(µ) (G). Então,
N r r
X ck (µ) c` (µ)∗
χ χ = δk` , (5.23)
µ=1
g k g `
sendo ck a cardinalidade da classe Ck .

Tabela 5.3: Tabela de caracteres do grupo C1h .

Classes CE Cσh
Caracteres {I} {σh }
χ(1) +1 +1
χ(2) +1 −1
5.6.5 D ECOMPOSIÇÃO DE UMA REPRESENTAÇÃO EM IRREPS

Uma vez estabelecidos os principais teoremas envolvendo representações de grupos e seus
caracteres, pode-se retornar à questão inicial acerca da expressão ou decomposição de uma
representação qualquer em termos de representações irredutíveis de mais baixa dimensionali-
dade.
Sendo G um grupo finito, supõe-se a existência de uma representação D (G) ⊆ GL (n, K), a
qual pode ser uma representação regular ou natural, por exemplo, sendo assumido de D (G)
não é uma irrep. Os teoremas apresentados anteriormente e suas consequências permitem
estabelecer, para qualquer grupo finito, o número (N ) e as dimensões ({nµ }) de suas irreps.
Então, sempre é possível expressar a matriz D (ai ) (para todo ai ∈ G) como a soma direta das
irreps de G dada na expressão (5.15b), ou seja,
N
M
D (ai ) = mµ Γ(µ) (ai ) = m1 Γ(1) (ai ) ⊕ m2 Γ(2) (ai ) ⊕ · · · ⊕ mN Γ(N ) (ai ) , (5.24)
µ=1
sendo que as irreps são supostas unitárias. Os únicos parâmetros ainda indeterminados na
expressão acima são os índices {mµ }, os quais indicam quantas vezes uma determinada irrep
irá aparecer na soma direta. Para determinar estes índices, calcula-se o traço das matrizes
envolvidas, o que significa a obtenção dos caracteres das representações. Com o auxílio da
propriedade (5.8b) da soma direta, resulta
N
X
χ (ai ) = mν χ(ν) (ai ) , (5.25)
ν=1
sendo χ (ai ) o caractere

de ai na representação D (ai ).
Os caracteres χ(ν) (ai ) das irreps são denominados caracteres primitivos ou caracteres
simples, ao passo que os caracteres χ (ai ) de uma representação redutível são denominados
caracteres compostos, como o resultado recém obtido indica. Multiplicando-se ambos os lados
por χ(µ)∗ (ai ) e somando sobre todos os elemento de G, resulta
g N g nC N nC
(µ)∗ (ν) (µ)∗
X X X X X X
(µ)∗ (ν) (µ)∗
χ (ai ) χ (ai ) = mν χ (ai ) χ (ai ) =⇒ ck χk χk = mν ck χk χk .
i=1 ν=1 i=1 k=1 ν=1 k=1
Na última expressão acima, os caracteres dos elementos foram agrupados por classes de con-
jugação, sendo ck o número de elementos na k-ésima classe, nC o número total de classes de
conjugação em G e χk o caractere da k-ésima classe na representação D (ai ). Usando então o
teorema (5.20), resulta
nC
1X (µ)∗
mµ = ck χk χk . (5.26)
g
k=1
Este resultado permite finalmente a decomposição completa de uma representação em termos

das irreps do grupo.
Um outro resultado importante envolvendo os índices {mµ } pode ser obtido. Multiplicando-se
(5.25) pelo seu complexo conjugado e somando sobre os elementos de G, obtém-se
g
X N
X g
X
χ (ai ) χ∗ (ai ) = mµ mν χ(ν) (ai ) χ(µ)∗ (ai ) ,
i=1 µ,ν=1 i=1
nC N nC N
(ν) (µ)∗
X 2
X X X
ck |χk | = mµ mν ck χk χk =g m2µ .
k=1 µ,ν=1 k=1 µ=1

Se a representação D (ai ) já era irredutível, então todos os índices mµ são nulos, exceto por
um que é igual à unidade. Portanto, uma condição necessária e suficiente para que uma dada
representação seja irredutível é
g
X nC
X
2 2
|χ (ai )| = ck |χk | = g. (5.27)
i=1 k=1
Verifica-se na tabela 5.2 que os caracteres das irreps do grupo S3 satisfazem este critério.
Por outro lado, se a representação for redutível, então a expressão
nC N
1X 2
X
ck |χk | = m2µ
g µ=1
k=1
fornece informações sobre a decomposição da mesma em irreps.

Exercício 5.3. Estude a decomposição da representação natural do grupo S3 em irreps.
Resolução. A representação natural Dnat (S3 ) foi obtida no exercício 5.2. Verifica-se que os
caracteres da representação são os seguintes:
χI = 3, χπ2 = 1, χπ4 = 0.
Por sua vez, os caracteres das irreps são dados na tabela 5.2. Assim, da expressão (5.26), com
k = I, π2 , π4 , resulta
3
1X (1)∗ 1
m1 = ck χk χk = (1.3.1 + 3.1.1 + 2.0.1) = 1
6 6
k=1
3
1X (2)∗ 1
m2 = ck χk χk = (1.3.1 + 3.1. (−1) + 2.0.1) = 0
6 6
k=1
3
1X (3)∗ 1
m3 = ck χk χk = (1.3.2 + 3.1.0 + 2.0. (−1)) = 1.
6 6
k=1
Portanto,
Dnat (S3 ) = Γ(1) (S3 ) ⊕ Γ(3) (S3 ) .
Será apresentado agora um teorema relacionado com a decomposição de uma representação
regular em irreps.
Teorema 5.7. Dado um grupo G, a sua representação regular contém todas as suas representa-
ções irredutíveis, com multiplicidades iguais às dimensões destas irreps.
Demonstração. Seja a representação regular (5.4) de um grupo de ordem g. A representação do
elemento I será sempre Dreg (I) = Ig e, portanto, χreg (I) = g. Por outro lado, para os demais
elementos gk ∈ G as diagonais principais das respectivas representações serão dadas por
(
reg 1, se gk ∗ gi = gi
Dii (gk ) = (i = 1, . . . , g) .
0, se gk ∗ gi 6= gi ,
reg
Como gk 6= I, então gk ∗ gi 6= gi sempre; ou seja, Dii (gk ) = 0 (i = 1, . . . , g). Portanto, χreg (gk ) = 0.
Usando agora a relação (5.25), considera-se a decomposição do caractere composto do ele-
mento identidade em termos dos caracteres do mesmo elemento nas irreps,
N
X N
X
χreg (I) = g = mν χ(ν) (I) = mν nν , (5.28)
ν=1 ν=1
uma vez que D(ν) (I) = Inν sempre. Por outro lado, os índices {mν } são dados por (5.26),
C n
1X (ν)∗
mν = ck χreg
k χk .
g
k=1
(ν)
Contudo, como χreg
I = g, χI = nν , cI = 1 e χreg
k = 0 para k 6= I, resulta que
mν = nν . (5.29)

Exemplo 5.6 (Decomposição da representação regular do grupo S3 ). A representação regu-

lar do grupo S3 foi obtida no exemplo 5.1, enquanto que suas irreps foram obtidas no exercício
5.1. De acordo com (5.29), esta representação é decomposta pelas irreps de acordo com
Dreg (S3 ) = Γ(1) (S3 ) ⊕ Γ(2) (S3 ) ⊕ Γ(3) (S3 ) ⊕ Γ(3) (S3 ) .
O teorema 5.7 será empregado agora para demonstrar a igualdade na expressão (5.19).
Demonstração da expressão (5.19). É possível agora demonstrar-se a expressão |Γ| = g. Para
tanto, emprega-se a representação regular (5.4) de um grupo de ordem g. A propriedade (5.28)
mostra que
N
X
mν nν = g.
ν=1
Mas, levando-se em conta que para a representação regular a multiplicidade da ν-ésima irrep é
dada por (5.29), resulta então que
XN
g= n2ν ,
ν=1
o que completa a demonstração.
Uma vez demonstrado que o conjunto (5.17) é uma base do espaço vetorial K g , conclui-
se que não existe nenhum outro vetor de representação que seja ortogonal aos vetores em Γ.
Isto, por sua vez, implica que não existe nenhum outro vetor de caractere que seja ortogonal aos
vetores no conjunto χ em (5.21b). Portanto, os vetores de caracteres em χ também devem formar
uma conjunto completo de vetores de base para o espaço K nC e a cardinalidade de χ deve ser
assim igual à dimensão do espaço. Isto completa a demonstração da igualdade em (5.22).
Uma última propriedade importante dos caracteres de uma representação pode ser deduzida.
Sendo Γ(µ) (G) uma irrep unitária de dimensão nµ , uma irrep equivalente pode ser obtida a partir
da transformação de similaridade
Γ(µ)0 (G) = S−1 Γ(µ) (G) S,
onde S é uma matriz nµ × nµ não singular. Agora, para qualquer elemento a ∈ G, a sua represen-
tação Γ(µ) (a) possui um conjunto de autovalores {λj } (j = 1, . . . , nµ ), sendo cada autovalor obtido
a partir do autovetor xj = (xj1 xj2 . . . xjnµ )T pela equação secular
h i
(µ)
Γ(µ) (a) xj = λj xj =⇒ det Γ(µ) (a) − λ(µ) Inµ = 0.
Pode-se mostrar que as raízes da equação secular, i. e., os nµ autovalores de Γ(µ) (a) são unimo-
(µ)
dulares, ou seja, λj = 1, ∀j = 1, . . . , nµ .
Construindo então a matriz S tal que suas colunas são os autovetores de Γ(µ) (a), i.e.,
 
x11 x21 · · · xnµ 1
 12 x22 · · · xnµ 2 
x
x1 x2 · · · xnµ

S= = . . . . =⇒ Sij = xji ,
⇓ ⇓ ··· ⇓  .. .. . . ..  
x1nµ x2nµ · · · xnµ nµ
resulta que
h i nµ nµ
(µ) (µ)
X X
−1 (µ) −1
S−1 ik Γk` (a) xj`

S Γ (a) S = S Γ (a) S`j =
ik k`
ij
k,`=1 k,`=1
nµ nµ
(µ) (µ) (µ)
X X
−1
S−1

= S λ xjk
ik j
= λj ik
Skj = λj δij .
k=1 k=1
Ou seja,  (µ) 
λ1 0 ··· 0
(µ)
 0 λ2 · · · 0
 
Γ(µ)0 (a) = 

.
 .. . ..
 . 0 .. .


(µ)
0 0 · · · λnµ

Como uma transformação de similaridade não altera o valor do caractere, resulta que o caractere
do elemento a pode ser calculado como a soma dos autovalores de sua representação, i. e.,
nµ
(µ)
X
(µ)
χ (a) = χ(µ)
a = λj , (5.30a)
j=1
(µ)
sendo χa o caractere de todos os elementos da classe de conjugação mCa .
Agora, se o elemento a é tal que am = I, isto implica que Γ(µ) (a) = Inµ (propriedade 3.8c).
Além disso, todos os elementos na classe de conjugação Ca possuem a mesma ordem. Então,
h im h im h im
Γ(µ)0 (a) = S−1 Γ(µ) (a) S = S−1 Γ(µ) (a) SS−1 Γ(µ) (a) S · · · S−1 Γ(µ) (a) S = S−1 Γ(µ) (a) S,
ou seja,
λm
 
1 0 ··· 0
h im  0 λm
2 ··· 0  h im
(µ)
Γ(µ)0 (a) =  .. ..  = Inµ =⇒ λj = 1 (j = 1, . . . , nµ ) . (5.30b)
 
..
 . 0 . . 
0 0 · · · λm
nµ
Ou seja, os autovalores da representação do elemento a são as m raízes da unidade, sendo m a

ordem do elemento a.
Embora este último resultado tenha sido obtido com o emprego de uma irrep, o mesmo vale
para qualquer representação do grupo.
5.6.6 C ONSTRUÇÃO DE UMA TABELA DE CARACTERES

Para que se possa realizar a decomposição de uma dada representação em irreps, é necessário
o conhecimento da tabela de caracteres do grupo G de ordem g. Os resultados obtidos nesta
seção possibilitam a construção desta última de uma forma sistemática, bastando para tanto a
determinação das seguintes propriedades:
1. O número de irreps é igual ao número de classes de conjugação de G: N = nC (propriedade

5.22).
2. As dimensões das irreps de G satisfazem a relação (propriedade 5.19)

N
X
n2µ = g.
µ=1
3. A irrep identidade ou trivial Γ(1) (a) = +1 (n1 = 1), para todo a ∈ G, está sempre presente
(1)
para todo grupo. Portanto, χ(1) (a) = χk = +1.
4. Para qualquer representação, a irrep da identidade é sempre Γ(µ) (I) = Inµ . Portanto,
(µ)
χ(µ) (I) = χI = nµ .
5. Os caracteres da irrep Γ(µ) (G) satisfazem a relação (propriedade 5.27)

g 2 XnC nC
(µ) 2 (µ) 2

Passo (4)
X (µ) X
(a ) = c = g −−−− − → ck χk = g − n2µ .

χ i k χk
cI =1
i=1 k=1 k=2
6. O caractere do elemento a de ordem m na µ-ésima irrep pode ser expresso como a soma dos
autovalores de Γ(µ) (a), sendo que cada autovalor é a m-ésima raiz da unidade (propriedade
5.30).
7. O vetor formado pelos caracteres de uma dada irrep é ortogonal ao vetor formado pelos
caracteres de uma outra irrep qualquer (propriedades 5.20 e 5.21).
8. O vetor formado pelos caracteres de uma dada classe de conjugação (ao longo de todas as
irreps) é ortogonal ao vetor de uma outra classe (propriedade 5.23).

Exemplo 5.7. As classes de conjugação do grupo S3 são C1 = {I} (c1 = 1), C2 = {π2 , π3 , π6 } (c2 = 3)
e C3 = {π4 , π5 } (c3 = 2). Aplicando sistematicamente as informações contidas no algoritmo acima,
resulta:
1. O número de classes de conjugação é nC = 3. Então, o número de irreps do S3 é N = nC = 3.
2. A ordem do grupo é g = |S3 | = 6. Então, as dimensões das irreps devem satisfazer a relação
3
X
n2µ = n21 + n22 + n23 = 6.
µ=1
O único conjunto de números naturais que satisfazem esta equação é {1, 1, 2}. Portanto,
n1 = n2 = 1 e n3 = 2.
(1)
3. A irrep trivial do S3 é, portanto, χk = +1 (k = 1, 2, 3). Com isso, fica preenchida a primeira
linha da tabela 5.2.
4. Os caracteres das irreps µ = 2, 3 satisfazem as equações

3
(
(µ) 2 (µ) 2 (µ) 2 (µ) 2 (µ) 2 (µ) 2 5, µ=2
X
ck χk = χ1 + 3 χ2 + 2 χ3 = 6 =⇒ 3 χ2 + 2 χ3 =
k=1
2, µ = 3.
5. Cada caractere é igual à soma de uma raiz da unidade. Todos os elementos de uma dada
classe têm a mesma ordem. Sendo mk a ordem dos elementos da k-ésima classe, então
(µ)
m1 = 1, m2 = 2 e m3 = 3. Chamando zkp = λj , esta quantidade é uma das raízes de
mk 13
z = 1, ou seja, zkp = exp (2pπi/mk ) (k = 1, . . . , nC , p = 0, . . . , mk − 1).
6. Os caracteres das irreps µ = 2, 3 também devem satisfazer

3
(
X (µ) (µ) (µ) (µ) (µ) (µ) −1, µ = 2
ck χk = χ1 + 3χ2 + 2χ3 = 0 =⇒ 3χ2 + 2χ3 =
k=1
−2, µ = 3.
Para obter os caracteres das representações µ = 2, 3 deve-se realizar escolhas que satisfazem as
condições impostas pelos passos (4) a (6) do algoritmo.
(2)
• µ = 2. Esta representação também é unidimensional (n2 = 1). Então, χ1 = +1. Para
satisfazer as condições dos passos (4) – (6):
(2) 2 (2) 2

(2) (2)
3 χ2 + 2 χ3 = 5 3χ2 + 2χ3 = −1,
h i2 h i3
(2) (2) (2) (2) (2) (2) (2) (2)
χ2 = λ2 , λ2 = 1 ⇒ λ2 = ±1; χ3 = λ3 , λ3 = 1 ⇒ λ3 = 1, e2πi/3 ou e4πi/3 .
(2) (2)
As únicas escolhas possíveis são χ2 = −1 e χ3 = +1, resultando preenchida a segunda
linha da tabela 5.2.
(3)
• µ = 3. Agora, n3 = 2, implicando em χ1 = +2. O passo (7) demanda que
 (3) (3)∗
 (2) (2)∗ (3) (3)∗ χ2 χ3 = 0
χ2 χ3 + χ2 χ3 = −1


g
  (3) 2

(2) (2)∗ (3) (3)∗
χk χ` + χk χ` = δk` − 1 ⇒ χ(2) (2)∗
2 χ2
(3) (3)∗
+ χ2 χ2 = 1 ⇒ χ2 = 0
ck  (2) (2)∗
 (3) (3)∗
 2
χ3 χ3 + χ3 χ3 = 2 χ(3) = 1.


3
(3) 2

(3)
Ou seja, χ2 = 0. O valor de χ3 também poderia ter sido obtido com o passo (4). Já o
(3)
valor de χ3 deve ser consistente com o passo (6), ou seja,
(3) (3) (3)
3χ2 + 2χ3 = −2 =⇒ χ3 = −1,
13 Ver fórmula (2.9).

186 5.7. Bases simetrizadas para representações irredutíveis
o que completa a terceira linha da tabela 5.2. Nota-se que este último resultado está
consistente com o passo (5), o qual exige que
2
(3)
X
χ3 = λ3pj , sendo λ3p = e2pπi/3 , (p = 0, 1, 2) .
j=1
Fazendo-se a escolha p1 = 1 e p2 = 2, resulta

(3)
χ3 = e2πi/3 + e4πi/3 = eiπ e−iπ/3 + eiπ/3 = −2 cos (π/3) = −1.
As tabelas de caracteres de grupos de ordens mais altas podem ser sistematicamente construí-
das seguindo-se o mesmo algoritmo.
5.7 B ASES SIMETRIZADAS PARA REPRESENTAÇÕES IR -

REDUTÍVEIS
Chega-se então ao problema prático de como se obter e reduzir uma representação em geral.
Como já foi mencionado na seção 5.2, em muitos problemas na física o estado do sistema
é descrito por um vetor em um espaço vetorial. Operadores neste espaço (lineares ou não)
correspondem a transformações realizadas sobre o sistema físico, levando o mesmo a um outro
estado, descrito por um outro vetor no mesmo espaço. Estas transformações podem ser divididas
em grupos abstratos os quais, dada uma base ortonormal adequada, serão representados por
matrizes do GL (n, K).
O aspecto inconveniente no procedimento recém mencionado está no fato de que os espaços
vetoriais em questão muitas vezes são de dimensão alta (em muitos casos infinita) e as repre-
sentações assim obtidas devem ser descritas por matrizes de ordem alta. É neste ponto que
se manifesta a possibilidade de reduzir essas representações em termos das irreps do grupo,
como foi discutido ao longo das seções 5.5 e 5.6. Partindo-se de uma base ortonormal genérica,
deseja-se reduzir a representação através de uma escolha adequada de subconjuntos de vetores
da base, sendo que cada subconjunto forma a base em um subespaço invariante sob as opera-
ções dos elementos do grupo. Em consequência, a representação genérica inicial será reduzida
em termos das irreps de baixa dimensão.
Nesta seção será apresentado um método que possibilita a obtenção destes subconjuntos e
alguns exemplos serão apresentados.
Retornando à discussão realizada na seção 5.2.2, dado o espaço vetorial V n e uma base
.
ortonormal Φ = {φ1 , φ2 , . . . , φn } do mesmo e dado o grupo de transformações T = {T ; ∗}, cuja
representação na base Φ é composta pelas matrizes D (T ), qualquer transformação A ∈ T terá
sua ação sobre o vetor de base φi dada por
n
X
Aφi = φj Dji (A) . (5.31)
j=1
É assumido que D (A) é uma representação redutível em termos de irreps de dimensões mais
baixas.
Para reduzir a representação D (T ), deseja-se encontrar uma matriz unitária U adequada, tal
que realizando-se a transformação de similaridade com a mesma, obtém-se
Dred (A) = U−1 D (A) U, (∀A ∈ T ) ,
onde as matrizes Dred (T ) estão todas na forma bloco-diagonal (5.15a), escritas em termos das
irreps unitárias de T . Para tanto, reescreve-se a expressão (5.31) para descrever a ação do
operador A sobre todos os vetores da base Φ na forma matricial como
Aφ = φD (A) ,
. .
onde φ = (φ1 φ2 . . . φn ) é a matriz linha composta por todos os vetores da base e Aφ = (Aφ1 Aφ2 . . . Aφn ).
Se U é a matriz desejada, então
AφU = φUU−1 D (A) U =⇒ A (φU) = (φU) Dred (A) .

Este resultado sugere que a base ortonormal adequada para os fins desejados é o conjunto Ψ
definido por
.
Ψ = ΦU = {ψ1 , ψ2 , . . . , ψn } ,
com vetores {ψi } tais que
n
X
ψi = (φU)i = φj Uji , (i = 1, . . . , n) . (5.32a)
j=1
Com o propósito de encontrar os elementos de matriz {Uij }, considera-se agora a derradeira

redução de D (T ). De (5.24),
N
M
D (T ) = mµ Γ(µ) (T ) ,
µ=1
.
sendo Γ (T ) = Γ(µ) (T ) o conjunto das N irreps unitárias do grupo T . Dentro do conjunto
Γ (T ), a µ-ésima irrep possui dimensão nµ < n e, portanto, representa o grupo T dentro de um
subespaço invariante V nµ ⊂ V n . É possível então particionar-se o conjunto Ψ em subconjuntos
X
Ψ(µ)
p ⊂ Ψ, tais que mµ nµ = n.
µ
(µ)
O índice p em Ψp indica a p-ésima ocorrência da irrep Γ(µ) em D (T ); ou seja, 1 6 p 6 mµ , sendo
que a irrep somente irá ocorrer na redução se mµ > 0. n o
(µ) n (µ)
Denotando-se os vetores da base Ψp do subespaço invariante Vp µ ⊂ V n por ψpi , ou seja,
n o
(µ) (µ)
Ψ(µ)
p = ψp1 , ψp2 , . . . , ψ (µ)
pnµ ,
(µ)
a ação do operador A sobre o vetor ψpi é dada por
nµ
(µ) (µ) (µ)
X
Aψpi = ψpk Γki (A) . (5.32b)
k=1
(µ)
Diz-se, neste caso, que o vetor ψpi transforma-se de acordo com a i-ésima coluna da represen-
tação irredutível Γ(µ) (A). O espaço vetorial V n resulta particionado pela soma direta de seus
subespaços invariantes: M
Vn= Vpnµ .
µ,p
.
Agora, é sempre possível escrever-se a matriz linha ψ = ( ψ1 ψ2 . . . ψn ) na forma bloco-linha
como
(1) (N )
ψ = ψ1 · · · ψmN ,
(µ) (µ) (µ) (µ)

onde ψp = ( ψp1 ψp2 . . . ψpnµ ). Neste caso, retornando a (5.32a), esta expressão pode ser escrita
como
n
(µ)
X
ψpi = φj Uj(µpi) , (∀µ, p, i) , (5.32c)
j=1

onde a matriz Uj(µpi) é simplesmente a matriz U, porém com o índice j indicando uma linha da
mesma e o conjunto de índices (µpi) = 1, . . . , n indicando uma coluna.
Lembrando que os vetores da base Φ são ortonormais, ou seja, hφi , φj i = δij , ressalta-se que
(µ)
(µ) (µ)
os vetores da base Ψ também o são. Portanto, dentro da base Ψp , ψpi , ψpj = δij . Além disso,
(µ) (ν)
qualquer vetor em Ψp é ortogonal a qualquer vetor em Ψq (com ν 6= µ e q 6= p). Assim, pode-se
escrever uma condição de ortonormalidade entre os vetores de Ψ como
D E
(µ) (ν)
ψpi , ψqj = δµν δpq δij .
Inserindo a expansão (5.32c) no produto interno acima, resulta a seguinte relação entre os
elementos da matriz U,
n
X n
X
∗ ∗
Uk(µpi) U`(νqj) hφk , φ` i = Uk(µpi) Uk(νqj) = δµν δpq δij .
k,`=1 k=1

188 5.7. Bases simetrizadas para representações irredutíveis
Além disso, como U é unitária,

X
UU† = In =⇒ ∗
Ui(µpk) Uj(µpk) = δij ,
µ,p,k
o que corresponde a uma segunda relação entre os elementos da matriz.

Aplicando-se agora o operador A em ambos os lados de (5.32c) e usando (5.31) e (5.32b),
obtém-se
n
(µ)
X
Aψpi = (Aφj ) Uj(µpi) ,
j=1
nµ n X
n
(µ) (µ)
X X
ψpk Γki (A) = φ` D`j (A) Uj(µpi) .
k=1 j=1 `=1
Usando novamente (5.32c) no último resultado acima, resulta

nµ n n
(µ)
X X X
φ` U`(µpk) Γki (A) = φ` D`j (A) Uj(µpi) ,
k=1 `=1 j,`=1
 
n nµ n
(µ)
X X X
 U`(µpk) Γki (A) − D`j (A) Uj(µpi)  φ` = 0.
`=1 k=1 j=1
Como os {φ` } são LI, resulta que

nµ n
(µ)
X X
U`(µpk) Γki (A) = D`j (A) Uj(µpi) , (∀µ, p, i, `) .
k=1 j=1
Esta é uma terceira relação que ajuda a determinar

n o os elementos da matriz unitária U, os quais,
(µ)
por sua vez, determinam os vetores de base ψpi .
As três expressões que determinam a matriz U são reapresentadas abaixo:
n
X
∗
Uk(µpi) Uk(νqj) = δµν δpq δij (5.33a)
k=1
X
∗
Ui(µpk) Uj(µpk) = δij (5.33b)
µ,p,k
nµ n
(µ)
X X
U`(µpk) Γki (A) = D`j (A) Uj(µpi) . (5.33c)
k=1 j=1
As expressões (5.33) serão empregadas para a obtenção da base simetrizada de uma repre-
sentação regular. Dado um grupo G = {A, B, C, . . . ; ∗} de ordem g, os elementos das matrizes
de sua representação regular Dreg (G) são dados por (5.4). Como a dimensão das matrizes de
Dreg (G) é igual à ordem do grupo (n = g), os índices de Dreg (A) em (5.33c) indicam também os
elementos de G. Ou seja, a variação do índice j mantendo ` fixo corresponde à varredura da
linha do elemento A na tabela de multiplicações de grupo. Chamando j → C e ` → B, sendo
B, C ∈ G, a relação (5.33c) pode ser escrita como
nµ
(µ)
X X
UB,(µpk) Γki (A) = DB,C (A) UC,(µpi) = UBA,(µpi) .
k=1 C∈G
pois (
1, se B ∗ A = C
DB,C (A) =
0, se B ∗ A 6= C.
Este resultado vale para todos A, B ∈ G e 1 6 i 6 nµ . Se for feita a escolha B = I com a convenção
de que I ↔ 1 sempre, então
nµ
(µ)
X
UA,(µpi) = U1(µpk) Γki (A) . (5.34)
k=1
Esta última relação, em conjunto com (5.33a,b) determinam a matriz U.

5.8 B ASES PARA REPRESENTAÇÕES DE GRUPOS DE PRO -

DUTO DIRETO
Na seção 3.5 mostrou-se que um dado grupo G sempre pode ser escrito como o produto direto
de seus subgrupos invariantes, i. e., se H1 , H2 ⊂ G são invariantes, então
G 0 = H1 ⊗ H2 .
Se H1 + H2 = G, então G 0 = G. Os subgrupos invariantes de C4v constituem em um exemplo

simples deste conceito. Os subgrupos H1 = {E, σvA } e H2 = {E, σvB } formam o grupo
H1 ⊗ H2 = E, σvA , σvB , C42 .

Contudo mencionou-se também que um grupo superior pode ser criado a partir de dois
grupos menores. Tomando-se por exemplo o grupo das rotações próprias Cn , se a operação de
simetria denominada inversão espacial (J) for acrescentada às rotações próprias, esta forma o
grupo cíclico hJi = {E, J}. Foi mencionado na seção 3.4.1 que a operação de inversão comuta
com qualquer outra operação de simetria. Portanto, é possível criar um grupo contendo tanto
rotações próprias quanto inversões através do produto Cn ⊗ hJi.
Posteriormente, na seção 5.4.4 mostrou-se que o produto direto de duas representações
também é uma representação (expressão 5.11), sendo que o caractere do grupo produto direto é
o produto dos caracteres (expressão 5.12).
5.8.1 R EDUÇÃO DA REPRESENTAÇÃO DO PRODUTO DIRETO

Dadas agora duas representações irredutíveis do grupo G, Γ(µ) (G) e Γ(ν) (G), o grupo produto
direto Γ(µ) (G) ⊗ Γ(ν) (G) também é representação. Porém, em princípio esta representação é
redutível. Assim,
a redução do grupo produto direto em irreps de G consiste na obtenção dos
coeficientes xηµν tais que
N
M
Γ(µ) (G) ⊗ Γ(ν) (G) = xηµν Γ(η) (G) . (5.35a)
η=1
Claramente,
N
X
χ(µ) (a) χ(ν) (a) = xηµν χ(η) (a) , (∀a ∈ G) . (5.35b)
η=1
Em geral, dadas duas representações redutíveis de G, D(µ) (G) e D(ν) (G), o seu produto direto
(µ×ν)
D (G) = D(µ) (G) ⊗ D(ν) (G) sempre pode ser reduzido, uma vez que
N
M N
M
D(µ) (G) = mηµ Γ(η) (G) D(ν) (G) = mκν Γ(κ) (G)
η=1 κ=1
e, portanto,
N
! N
!
M M
(µ×ν) (µ) (ν)
D (G) = D (G) ⊗ D (G) = mηµ Γ(η) (G) ⊗ mκν Γ(κ) (G)
η=1 κ=1
N M
N N
" N
#
M M X
= mηµ mκν Γ(η) (G) ⊗ Γ (κ)
(G) = mηµ mκν xτηκ Γ(τ ) (G) .
η=1 κ=1 τ =1 η,κ=1
Esta expressão pode sempre ser estendida ao produto direto de mais de duas representações.
5.8.2 B ASES PARA REPRESENTAÇÕES DE PRODUTOS DIRETOS

A base para uma representação de produto direto pode ser facilmente obtida conhecendo-se
as bases das irreps que compõe do produto direto.

190 5.8. Bases para representações de grupos de produto direto

Sejam Φ = φ1 , φ2 , . . . , φnµ a base da irrep Γ(µ) e Ξ = {ξ1 , ξ2 , . . . , ξnν } a base da irrep Γ(ν) , então
a representação D(µ×ν) = Γ(µ) ⊗ Γ(ν) possui nµ nν vetores de base, os quais compõe o conjunto
.
Ψ = Φ × Ξ = {ψmn }, onde ψmn = φm ξn (1 6 m 6 nµ e 1 6 n 6 nν ). O conjunto Ψ forma a base do
espaço vetorial V nµ ⊗ V nν de dimensão nµ nν .
Se isto for verdade, então a ação de qualquer operador A ∈ T do grupo de transformações T
sobre um vetor da base Ψ resulta em
nµ nν h i
X
Aψmn = ψk` Γ(µ) (A) ⊗ Γ(ν) (A)
k`,mn
[k`]=1
nµ nν
(µ) (ν)
X X
= φk ξ` Γkm (A) Γ`n (A)
k=1 `=1
= (Aφm ) (Aξn ) .
Observa-se aqui que também é possível realizar-se o produto direto de um espaço vetorial
por si mesmo: V n ⊗ V n . Neste caso, em Ψ deve se distinguir os vetores de base de cada espaço,
i. e., φm φn 6= φn φm . Um exemplo desta situação ocorre com os produtos externos de tensores,
gerando as diádicas discutidas na seção 6.4.4.
5.8.3 R EPRESENTAÇÃO DE UM GRUPO PRODUTO DIRETO

Considera-se agora um grupo que é o produto direto de dois subgrupos que comutam entre
si. Sejam H = {H1 ≡ I, H2 , . . . , Hh } (ordem h) e G = {G1 ≡ I, G2 , . . . , Gg } (ordem g) estes subgrupos,
.
o grupo produto direto K = H ⊗ G (de ordem k = hg) possui os elementos
K = {K11 ≡ I, K12 , . . . , K1g , K21 , . . . , K2g , . . . , Kh1 , Kh2 , . . . , Khg } ,
os quais são obtidos por

Kij = Hi Gj = Gj Hi .
Sejam Hi Hm = Hp e Gj Gn = Gq ; então
Kij Kmn = (Hi Gj ) (Hm Gn ) = (Hi Hm ) (Gj Gn ) = Hp Gq = Kpq . (5.36)
Sejam agora D(µ) (H) uma representação de H e D(ν) (G) uma representação de G. Então
D(µ) (Hi ) D(µ) (Hm ) = D(µ) (Hp ) D(ν) (Gj ) D(ν) (Gn ) = D(ν) (Gq ) .
Realizando-se o produto direto destas matrizes, obtém-se

h i h i
D(µ) (Hp ) ⊗ D(ν) (Gq ) = D(µ) (Hi ) D(µ) (Hm ) ⊗ D(ν) (Gj ) D(ν) (Gn )
h ih i
= D(µ) (Hi ) ⊗ D(ν) (Gj ) D(µ) (Hm ) ⊗ D(ν) (Gn ) ,
onde a propriedade (5.10a) foi empregada. Definindo-se novas matrizes pelo produto direto
.
D(µ×ν) (Kpq ) = D(µ) (Hp ) ⊗ D(ν) (Gq ) ,
então
D(µ×ν) (Kpq ) = D(µ×ν) (Kij ) D(µ×ν) (Kmn ) . (5.37)
Comparando-se (5.37) com (5.36), conclui-se que as matrizes produto direto assim definidas
formam uma representação de K. Esta representação é identificada por D(µ×ν) (K). Ou seja,
o produto direto de representações de dois grupos que comutam é uma representação do grupo
produto direto.
Agora, se D(µ) (H) ≡ Γ(µ) (H) e D(ν) (G) ≡ Γ(ν) (G) são irreps de H e G, respectivamente, então
D(µ×ν) (K) ≡ Γ(µ×ν) (K) também é irrep de K. Para verificar isso, recorre-se à condição necessária
e suficiente (5.27), a qual fica escrita
X 2
k= χ(µ×ν) (Kij ) .

Kij ∈K

Pode-se verificar facilmente, de forma semelhante ao que foi feito em (5.12), que χ(µ×ν) (Kij ) =
χ(µ) (Hi ) χ(ν) (Gj ), ou seja,
" # 
X 2 X 2 X 2
χ(µ×ν) (Kij ) =
(µ) (ν)
χ (Hi )  χ (Gj )  = hg = k,

Kij ∈K Hi ∈H Gj ∈G
provando que Γ(µ×ν) (K) de fato é irrep de K.

Finalmente, se Nh e Ng forem respectivamente os números de classes e, portanto, de irreps
dos grupos H e G, então a condição (5.19) se aplica a ambos. Dada a irrep Γ(µ×ν) (K), de dimensão
nµν = nµ nν , todas as combinações possíveis de µ e ν fornecem a soma a seguir,
 
Nµ Nν Nµ Nν Nµ Nν
!
X X X X X X
2 2 2 2 2
nµν = nµ nν =  nµ  nν = hg = k.
µ=1 ν=1 µ=1 ν=1 µ=1 ν=1
Portanto, a condição (5.19) também se aplica a Γ(µ×ν) (K), i. e., Nµν = Nµ Nν é o número total de
irreps de K e os produtos diretos das irreps de H e G exaurem todas as irreps de K.
5.9 A PLICAÇÕES FÍSICAS DA TEORIA DE REPRESENTA -

ÇÕES DE GRUPO
Algumas aplicações físicas da teoria de representações de grupos serão discutidas agora.
Desde as primeiras contribuições ao assunto, no início do século XX, as principais aplicações
são dirigidas para a mecânica quântica, física atômica, molecular e estado sólido e física de
partículas e campos. São estas as aplicações a ser discutidas aqui.
O problema fundamental na mecânica quântica está na solução e investigação das proprie-
dades das soluções da equação de Schroedinger14
d
H |ψ (t)i = i~ |ψ (t)i , (5.38)
dt
ou H |ψi = E |ψi na forma independente do tempo, sendo |ψi um vetor ket que descreve o estado
do sistema e que pertence a um espaço de Hilbert H , H um operador linear sobre H e E a
energia total do sistema físico no estado |ψi. A equação acima forma (juntamente com condições
de contorno apropriadas) um problema de autovalores,15 no qual |ψi é a autofunção de H e E o
seu autovalor. O operador H, denotado o Hamiltoniano do sistema é suposto ser um operador
Hermitiano,16 em cuja situação o autovalor E é real.
Os casos em que a equação de Schroedinger é exatamente solúvel são muito poucos e restritos
a sistemas com uma ou duas partículas. Portanto, a grande maioria dos sistemas físicos de
interesse, tais como átomos com números atômicos Z > 2, moléculas e sólidos, não têm solução
conhecida. Entretanto, os métodos desenvolvidos neste capítulo e no capítulo 3 podem fornecer
informações importantes sobre esses sistemas.
O poder da teoria de representações de grupos aplicada à mecânica quântica está na sua
capacidade de fornecer conclusões e informações exatas sobre o sistema físico, partindo-se so-
mente do conhecimento de suas simetrias, frente as quais o Hamiltoniano permanece invariante.
Além disso, ao se estabelecer o grupo de operadores de simetria (o grupo do Hamiltoniano), as re-
presentações irredutíveis do grupo surgem de forma natural, devido à conexão entre as simetrias
do sistema e a degenerescência dos autoestados descritos pela equação de Schroedinger.
5.9.1 I SOMORFISMO ENTRE TRANSFORMAÇÕES SOBRE SISTEMAS

FÍSICOS E TRANSFORMAÇÕES SOBRE ESPAÇOS FUNCIONAIS
A partir deste ponto, ao invés de se manter a descrição da evolução do sistema físico na
forma abstrata fornecida pela equação (5.38), será adotada a descrição simplificada provida pela
15 De forma mais específica, um problema de Sturm-Liouville.

192 5.9. Aplicações físicas da teoria de representações de grupo
“representação” ou “modo de descrição” de Schroedinger, segundo a qual o vetor de estado do

sistema é descrito pela função de onda
ψ = ψ (r, t)
sobre o espaço Euclideano E 3 (ver exemplo 4.5). Nesta descrição, a equação de Schroedinger
(5.38) passa a ser formalmente escrita como
∂
Hψ (r, t) = i~ ψ (r, t) , (5.39)
∂t
sendo que agora o Hamiltoniano é um operador que atua sobre o espaço das funções sobre o
E 3 , i. e., é um funcional na forma H = H {r, ∇; t}, por exemplo.
Seja R = {Ri } um grupo abstrato que contenha todas as isometrias de um sistema físico.
Os elementos de R são transformações aplicadas ao sistema, de tal forma que a ação de R ∈ R
sobre o sistema físico consiste em modificar as coordenadas do mesmo. O termo “coordenadas”
aqui possui um significado amplo. Este pode significar de fato as coordenadas das posições
das partículas do sistema físico em relação a um determinado sistema de referência em um
espaço métrico, mas podem também se referir a coordenadas no espaço de fase, ou a outras
propriedades que caracterizam o estado físico do sistema, tais como spin, carga elétrica, cor,17
etc.
A dinâmica deste sistema, por sua vez, será determinada por um conjunto de leis (e. g., Leis
de Newton, equações de Maxwell, equação de Schroedinger, etc) que fornecerão uma descrição
quantitativa da evolução do mesmo. Esta descrição será usualmente realizada por intermédio de
uma classe de funções que irão depender das coordenadas (no sentido amplo) do sistema. Essas
funções serão elementos de um espaço funcional, isto é, de um espaço vetorial (de dimensão
finita ou infinita), cujas bases são conjuntos de funções das coordenadas.
Seja agora o grupo PR = {PR } formado por operadores lineares que executam transformações
sobre as funções das coordenadas do sistema, ao invés das coordenadas propriamente ditas.
Como o sistema físico permanece indistinguível após ser atuado por uma transformação isomé-
trica R ∈ R, as leis que regem a sua evolução também devem também permanecer invariantes
frente a ação de um operador PR ∈ PR que atua sobre uma função das coordenadas. Para que
esta exigência seja satisfeita, é necessário que exista um isomorfismo entre o operador R ∈ R e
um (e somente um) operador PR ∈ PR . Este isomorfismo é garantido pelo seguinte mapeamento:
se r denota as coordenadas (no sentido amplo) do sistema físico e f (r) é uma função dessas
coordenadas, então
PR f (Rr) = f (r)
(5.40)
PR f (r) = f R−1 r ,

sendo ambas as expressões equivalentes. Pode-se dizer que o operador PR muda a forma funci-
onal de f (r) de maneira tal que compensa a transformação nas coordenadas r executada pelo
operador R.
Antes de se mostrar alguns exemplos, será verificado agora que o grupo PR é de fato isomór-
fico a R. Para tanto, é necessário demonstrar que para R, S ∈ R, os correspondentes operadores
PR , PS ∈ PR , dados por (5.40), satisfazem
PS PR = PSR .
Procede-se por etapas. Inicialmente, dada uma função das coordenadas f (r), a ação de PR
executa a transformação f (r) → g (r), sendo esta última uma outra função das mesmas coorde-
nadas. Ou seja,
PR f (r) = f R−1 r = g (r) .

Assim, g (r) é a nova função que incorpora a ação de R−1 sobre as coordenadas na sua forma
funcional. Aplicando-se agora o operador PS , obtém-se
(5.40)
PS [PR f (r)] = PS g (r) = g S −1 r = f R−1 S −1 r

R,S∈R
h i
−1
= f R−1 S −1 r −−−−−−−−−−−

→
−1
f (SR) r = PSR f (r) .
R−1 S −1 =(SR)
17 No sentido da cromodinâmica quântica.

Portanto, a transformação PSR correspondente ao elemento SR ∈ R é de fato o “produto” das

transformações PS por PR .
Algumas das transformações isométricas mais comuns e seus respectivos operadores funci-
onais serão apresentados a seguir.
T RANSLAÇÕES ESPACIAIS . Seja um sistema físico cujas coordenadas são descritas como
pontos no espaço Euclideano E 3 . Uma translação no sistema de coordenadas do E 3 consiste na
operação
.
r → r 0 , onde r 0 = Tρ r = r + ρ,
sendo r = (x1 , x2 , x3 ) ∈ E 3 uma posição no espaço, Tρ o operador de translação atuando sobre
E 3 e ρ = (ρ1 , ρ2 , ρ3 ) ∈ E 3 um vetor constante. A isometria do sistema físico frente a ação T irá
estabelecer os grupos cristalográficos espaciais.18 Como T pertence a um grupo, sempre existe
a transformação inversa Tρ−1 r = r − ρ.
Seja agora uma função das coordenadas ψ (r). Esta função pode ser, por exemplo, a solução
da equação de Schroedinger para uma rede cristalina. Então, como após a transformação r → r 0
a relação r = r 0 − ρ é válida, a função ψ (r) passa a ser escrita como
r 0 ;r
ψ (r) = ψ (r 0 − ρ) −−−→ ψ (r − ρ) ,
sendo que a última forma foi obtida simplesmente eliminando-se o apóstrofo.

Esta transformação possui duas interpretações. A translação r → r 0 ocorreu no sistema de
referências, cuja origem foi colocada no ponto r = −ρ do sistema original. Esta transformação
é dita ser do ponto de vista passivo. De forma equivalente, a transformação ψ (r) → ψ (r − ρ)
consiste em manter o referencial fixo e deslocar a função ψ (r) pela quantidade ρ. Esta é uma
transformação do ponto de vista ativo.19 Por exemplo, se ρ1 > 0, a ação Tρ1 r = T x1 = x01 = x1 + ρ1
significa que a origem do referencial foi deslocada para a esquerda e colocada no ponto x1 = −ρ1
do referencial anterior (transformação passiva). De forma equivalente, ψ (x1 ) → ψ (x1 − ρ1 ) signi-
fica que a função foi deslocada em relação à origem para a direita pela quantidade ρ1 (transfor-
mação ativa), pois o valor da função na origem ψ (0) irá ocorrer agora em x1 = ρ1 .
Define-se então um operador linear PTρ que atua sobre as funções ψ (r) e que realiza sobre
as mesmas a transformação correspondente a Tρ . Este operador é definido por
PTρ ψ (r) = ψ T −1 r ≡ ψ 0 (r) = ψ (r − ρ) .

(5.41)
Busca-se agora uma expressão para o operador de translação PTρ . Escrevendo r = (x, y, z),
considera-se inicialmente o caso particular onde ρ = (ρ, 0, 0). Então, dada a função ψ (x, y, z),
PTρ ψ (x, y, z) = ψ (x − ρ, y, z) .
Desenvolvendo-se ψ (x − ρ, y, z) em uma série de Taylor em torno de r, resulta
ρ2 ∂ 2

∂ ∂
ψ (x − ρ, y, z) = 1 − ρ + + · · · ψ (x, y, z) = exp −ρ ψ (x, y, z) ,
∂x 2! ∂x2 ∂x
onde o operador exp (−ρ∂/∂x) pode ser interpretado no contexto de uma série de Taylor.
Estendendo-se essa operação agora para translação arbitrária ρ = (ρx , ρy , ρz ), resulta
ψ (r − ρ) = exp (−ρ · ∇) ψ (r) = exp (−iρ · p/~) ψ (r) ,
onde p = −i~∇ é o operador momento linear empregado na descrição de Schroedinger da mecâ-

nica quântica. Comparando este resultado com (5.41), identifica-se

i i
PTρ = exp − ρ · p = 1 − ρ · p + · · · .
~ ~
Uma vez que ρ é real e p é um operador Hermitiano,20 resulta que PTρ é unitário. Neste caso, o
operador inverso de PTρ satisfaz
ψ 0 (r) = PTρ ψ (r) =⇒ PT−1

ρ
ψ 0 (r) = PT†ρ ψ 0 (r) = ψ (r) .
18 Ver seção 3.4.3. Note que a presente definição de T é distinta da definição do operador T1 .
19 Transformações ativas ou passivas serão novamente abordadas na seção 6.2.1.

Uma interpretação mais clara do significado matemático do operador PTρ é a seguinte. Su-
pondo que PTδr seja o operador que executa uma translação infinitesimal por ρ = δr. Então,
adotando-se a notação r = (x1 , x2 , x3 ), pode-se escrever
3 3
i iX . X pj
PTδr = 1 − p· δr = 1 − pj δxj = 1 − i Ixj δxj , onde Ixj = .
~ ~ j=1 j=1
~
Este deslocamento arbitrário por δr pode ser escrito em termos de deslocamentos infinitesimais
ao longo de cada eixo coordenado como
3
Y
PTδr = PTδxj , sendo PTδxj = 1 − iIxj δxj .
j=1
Portanto, basta estudar o comportamento dos operadores de translação unidimensional PTδxj .

Duas aplicações consecutivas de PTδxj rendem a translação
2
PT2δx = 1 − iIxj δxj = 1 − 2iIxj δxj ,
j
o que equivale a uma translação infinitesimal de magnitude 2δxj . Após N aplicações sucessivas
deste operador, a translação total na direção xj , N δxj , será finita, se
.
ρj = lim N δxj .
δxj →0
N →∞
Então, a translação finita ao longo de xj será obtida através do processo de limite

N h ρ iN
j
PTρj = lim PTNδx = lim 1 − iIxj δxj = lim 1−i Ixj .
δxj →0 j δxj →0 N →∞ N
N →∞ N →∞
Dado então o conhecido limite exponencial

x N
lim 1+ = ex ,
N →∞ N
resulta que
3
Y

PTρj = exp −iρj Ixj =⇒ PTρ = PTρj .
j=1
Dessa maneira, a translação executada pelo operador PTρj ocorre devido à existência da
quantidade Ixj = pj /~, a qual é denominada o gerador do grupo de translações.
Uma outra relação importante é obtida considerando-se a aplicação do operador comutador
h i
xi , PTδxj = xi PTδxj − PTδxj xi
sobre a função de onda. Cada termo separadamente fornece

i i
xi PTδxj ψ (r) = xi 1 − δxj pj ψ (r) , PTδxj xi ψ (r) = xi 1 − δxj pj ψ (r) − δxj δij ψ (r) ,
~ ~
resultando h i
xi , PTδxj ψ (r) = δxj δij ψ (r) .
Mas, do ponto de vista dos operadores,

h i i
xi , PTδxj = − δxj [xi , pj ] .
~
Portanto, resulta daí a importante relação de comutação
[xi , pj ] = i~δij . (5.42)

h i
Por outro lado, a ação do comutador PTδxi , PTδxj
resulta em
h i 1
PTδxi , PTδxj ψ (r) = − 2 δxi δxj [pi , pj ] ψ (r) .
~
Entretanto, uma propriedade fundamental das
translações no espaço é que translações suces-
sivas, mesmo em diferentes direções, comutam δxj
entre si. Isto está ilustrado na figura 5.1.
hEsta propriedade
i implica que, necessariamente,
PTδxi , PTδxj ψ (r) = 0, de onde resulta uma outra
relação de comutação essencial,
[pi , pj ] = 0.
Isto é, os geradores do grupo de translações comu-
δxi
tam. Uma das consequências deste fato é que este
grupo é Abeliano.
Deseja-se agora investigar a ação do operador Figura 5.1: Translações infinitesimais sucessivas
em diferentes direções.
PTρ sobre um sistema quantum-mecânico, descrito
pela equação de Schroedinger (5.39). Aplicando-se o operador i~∂/∂t sobre ψ 0 (r,t),
∂ 0 ∂ ∂
i~ ψ (r, t) = i~ PTρ ψ (r, t) = i~PTρ ψ (r, t) ,
∂t ∂t ∂t
uma vez que ∂/∂t e ∇ comutam. Mas, de acordo com (5.39), resulta que
∂ 0
i~ ψ (r, t) = PTρ Hψ (r, t) = PTρ HPT†ρ ψ 0 (r, t) .
∂t
Portanto, se
PTρ HPT†ρ = H ou, de forma equivalente, se PTρ , H = 0,

então
∂ 0
ψ (r, t) = Hψ 0 (r, t) .
i~
∂t
Ou seja, a função transformada ψ 0 (r, t) também satisfaz a equação de Schroedinger e é uma
função de onda do sistema.
Se o operador PTρ comuta com o Hamiltoniano e, lembrando da dependência do mesmo com
o operador p, segue que [p, H] = 0. Além disso, como PTρ não depende explicitamente do tempo,
resulta que se o sistema físico é invariante frente a todas as translações espaciais, o seu momento
linear é uma constante de movimento, i. e., p é conservado. A mesma lei de conservação é válida
para um sistema clássico.
R OTAÇÕES . Da mesma forma como ocorre com as translações, uma rotação pode ser exe-
cutada dos pontos de vista passivo ou ativo, sendo estas também discutidas na seção 6.2.1.
Uma rotação no ponto de vista passivo no espaço de configuração consiste na aplicação de um
operador R ∈ R, sendo R representado por matrizes dos grupos SO (3) ou SO (2).
Como um exemplo simples, considera-se um rotação (passiva) do sistema de coordenadas em
torno de um dos eixos coordenados, por exemplo, em torno do eixo x. O operador Rx (θ) ∈ SO (2)
que executa esta transformação é representado por (seção 6.5.2)
   
1 0 0 1 0 0
Rx (θ) = 0 cos θ sen θ , Rx−1 (θ) = 0 cos θ − sen θ ,
0 − sen θ cos θ 0 sen θ cos θ
juntamente com o operador inverso Rx−1 (θ). Após a aplicação de Rx (θ), as coordenadas de um
ponto no E 3 , representadas pelo vetor coluna r = x y z , passam a ser dadas por
T
r0 = Rx (θ) r.
O grupo de operadores PR , isomórfico a R, tem seus elementos dados pelo mapeamento
(5.40), de tal forma que PRx (θ) ∈ PR é o operador que executa a rotação (do ponto de vista ativo)
das funções das coordenadas que compensa a ação de Rx (θ). O exemplo a seguir ilustra a
diferença nas ações destes operadores.

Exemplo (Orbitais p do átomo de hidrogênio). Sabe-se da solução da equação de Schroedin-

ger para o átomo de hidrogênio que as funções de onda correspondentes aos orbitais p podem
ser escritas nas formas px (r) = xϕ (r), py (r) = yϕ (r) e pz (r) = zϕ (r), sendo ϕ (r) uma função de
r = |r|, isotrópica em r. Estas funções são tais que px (r) está orientada ao longo do eixo x, py ao
longo de y e pz ao longo de z, conforme está ilustrado na figura 5.2.
Figura 5.2: Representações dos orbitais atômicos px , py e pz .
Suponha agora que uma rotação de 90◦ em torno do eixo x (sentido anti-horário) é executada.
Do ponto de vista passivo, esta transformação é tal que
 0
x = x
    
1 0 0 x x 
r → r =⇒ r → r = 0 0 1 y  =  z  =⇒ y 0 = z
0 0
0 −1 0 z −y  0

z = −y.
Lembrando que     
h π i 10 0 x x
Rx−1 r = 0 0 −1 y  = −z  ,
2
01 0 z y
de acordo com (5.40), a ação de PRx (θ) sobre uma função f (x, y, z) resulta em
h π i
PRx ( π ) f (x, y, z) = PRx ( π ) f (r) = f Rx−1 r = f (x, −z, y) .
2 2 2
Portanto, se o operador PRx ( π ) atuar sobre os orbitais p, os resultados serão
2
p0x = PRx ( π ) px = PRx ( π ) [xϕ (r)] = xϕ (r) = px

2 2
p0y = PRx ( π ) py = PRx ( π ) [yϕ (r)] = −zϕ (r) = −pz

2 2
p0z = PRx ( π ) pz = PRx ( π ) [zϕ (r)] = yϕ (r) = py ,

2 2
p
uma vez que r = x2 + y 2 + z 2 é invariante frente a esta rotação. Nota-se na figura 5.2 que os
contornos destes orbitais são rotados no sentido horário por 90◦ em torno do eixo x, compen-
sando a rotação dos eixos coordenados.
A forma explícita do operador PRx (θ) pode ser obtida considerando-se inicialmente a matriz
T
R1−1para uma rotação infinitesimal δθ sobre as coordenadas r = x1 x2 x3 , em torno do eixo x1 :
 
1 0 0 X3
R1−1 (δθ) = 0 1 −δθ ⇐⇒ r0 = R1−1 (δθ) r ⇒ x0i = (δij − 1ij δθ) xj , (i = 1, 2, 3) ,
0 δθ 1 j=1
sendo ijk o símbolo de Levi-Civita.21 Então, a ação de PR1 (δθ) sobre a função de onda ψ (r) ≡
ψ (x1 , x2 , x3 ) ≡ ψ ({xj }) resulta em
ψ 0 ({xj }) = PR1 (δθ) ψ ({xj }) = ψ x0j .

21 Seção 6.1.2.

0
Desenvolvendo ψ xj em uma série de Taylor em termos de δθ,
" 3 #
0 d 0 X∂ dx0k
ψ xj = ψ ({xj }) + ψ xj δθ = ψ ({xj }) + ψ ({xj }) δθ
dθ ∂xk dθ
k=1
3
X ∂ψ i
= ψ ({xj }) − 1k` x` δθ = 1 − L1 δθ ψ ({xj }) ,
∂xk ~
k,`=1
sendo
3 3
X X ∂
L1 = 1jk xj pk = −i~ 1jk xj
∂xk
j,k=1 j,k=1
a componente na direção x1 do operador quantum-mecânico associado ao momento angular.

Portanto,
i . L1
PR1 (δθ) = 1 − L1 δθ = 1 − iIL1 δθ, sendo IL1 = .
~ ~
Uma rotação finita por θ é então obtida via
θ = lim N δθ
δθ→0
N →∞
e pela aplicação do operador PR1 (θ) , dado por

N
θ
PR1 (θ) = lim PRN1 (δθ) = lim 1 − i IL1 = exp (−iIL1 θ) .
δθ→0 N →∞ N
N →∞
Ou seja, IL1 = L1 /~ é o gerador do grupo de rotações (ativas) em torno de x1 .

Portanto, rotações no espaço de configuração aplicadas a um sistema físico estão relaciona-
das com o momento angular desse sistema, da mesma forma que translações estão relacionadas
com o momento linear. Também de forma equivalente, a invariância de um sistema físico frente a
uma rotação arbitrária no espaço de configuração, em torno de um eixo xi , implica na conservação
de seu momento angular nesta direção, uma vez que o operador Li irá comutar com o Hamiltoni-
ano.
Retornando brevemente ao grupo de rotações passivas em torno do eixo x1 , composto pelas
matrizes R1 (θ) ∈ SO (2), é possível obter-se também o seu gerador. Para tanto, considera-se a
rotação infinitesimal implementada por
 
1 0 0
R1 (δθ) = 0 1 δθ .
0 −δθ 1
Então,
3
X
r0 = R1 (δθ) r =⇒ x0i = (δij + 1ij δθ) xj , (i = 1, 2, 3) ,
j=1
uma vez que
R1 (δθ) = R1−1 (−δθ) .
A partir de R1 (δθ), deseja-se escrever o operador que executa uma rotação arbitrária R1 (θ)
na forma
R1 (θ) = exp (iM1 θ) = I3 + iM1 θ + · · · ,
onde I3 é a matriz identidade e M1 é uma matriz 3 × 3 a ser determinada. Realizando-se o limite
θ → δθ, observa-se que
 
00 0
1
R1 (δθ) = I3 + iM1 δθ =⇒ M1 = [R1 (δθ) − I3 ] = 0 0 −i ,
iδθ
0i 0
a qual pode ser escrita como
M1 = 0 ⊕ σ2 ,
onde 0 = 0 é a matriz 1 × 1 nula e
0 −i
σ2 =
i 0
é uma das matrizes de Pauli. Portanto, as matrizes de Pauli são os geradores do grupo SO (2).

D ESLOCAMENTO TEMPORAL . Um último exemplo de operador de transformação consiste

em realizar um deslocamento temporal sobre a função de onda. Esta transformação é realizada
por um operador PTτ ∈ PR tal que
PTτ ψ (r,t) = ψ 0 (r,t) = ψ (r,t − τ ) .
Desenvolvendo a função ψ (r,t − τ ) em uma série de Taylor em torno de t, é fácil concluir que

∂
PTτ = exp −τ .
∂t
Porém, de acordo com a equação de Schroedinger (5.39), observa-se que

H
PTτ = exp iτ .
~
Este resultado mostra também que PTτ é um operador unitário, uma vez que o Hamiltoniano é
Hermitiano.
Se o sistema físico é invariante frente a qualquer deslocamento temporal, a forma de PTτ
mostra que a energia do mesmo é uma constante de movimento e, também, que este operador
comuta com o Hamiltoniano,
[PTτ , H] = 0, para todo τ .
Sistemas que possuem essa simetria têm o seu estado descrito por funções de onda ψ = ψ (r)
determinadas pela equação de Schroedinger independente do tempo (5.39)
Hψ (r) = Eψ (r) , (5.43)
onde E é o autovalor de energia e ψ (r) é a autofunção associada a este autovalor. Neste caso, a
evolução temporal da função de onda é determinada simplesmente pela ação de PTτ sobre ψ (r):
Ψ (r, t) = PTt ψ (r) = ψ (r) eiEt/~ .
5.9.2 O GRUPO DO H AMILTONIANO

Os exemplos anteriores destacaram alguns operadores de transformações que podem ser
aplicados à função de onda ψ (r, t), como solução da equação de Schroedinger (5.39). Observou-
se que se essas transformações são isométricas para o sistema físico, os operadores comutam
com o Hamiltoniano e seus geradores (que são também observáveis do sistema) são constantes
de movimento.
O Hamiltoniano, por si próprio, é um funcional de vários parâmetros do sistema, tais como
posição, tempo, momento linear, momento angular, etc. A sua forma funcional específica reflete
a simetria do sistema físico cuja dinâmica o mesmo está descrevendo.
Por exemplo, para uma única partícula com massa m movimentando-se sob a energia poten-
cial V , o Hamiltoniano é
~2
H = − ∇2 + V.
2m
O Laplaciano ∇2 é invariante frente as transformações ortogonais do sistema de referências, i. e.,
frente ao grupo O (3) que compreende as rotações próprias ou impróprias, e também invariante
frente as translações espaciais. Por sua vez, o potencial V pode apresentar as mesmas simetrias
ou outras. Se a partícula se movimenta sob um campo de forças centrais, então V = V (r) e
o potencial também é invariante frente o O (3). Em consequência, o Hamiltoniano H como um
todo apresenta a simetria rotacional. Por outro lado, se a partícula encontra-se sob a ação de
um potencial periódico, como o de uma rede cristalina, V é invariante frente as translações de
algum grupo de isometrias espaciais.
A partir deste ponto, serão considerados sistemas para os quais o tempo é uma constante
de movimento e que, portanto, têm sua dinâmica determinada pela equação de Schroedinger
independente do tempo (5.43).
Seja então ψ (r) uma função de onda determinada por Hψ = Eψ, onde E é a energia do
sistema. Seja agora PR um operador que atua sobre a função de onda ψ (r) e o qual corresponde a

uma determinada transformação de coordenadas (no sentido amplo) R, através do mapeamento

(5.40). Considera-se a transformação
ψ 0 (r) = PR ψ (r) .
Aplicando-se o Hamiltoniano na relação acima, obtém-se
Hψ 0 (r) = HPR ψ (r) .

Por outro lado, como sempre existe a transformação inversa PR−1 tal que PR−1 PR = PR PR−1 = 1,
pode-se escrever
Hψ 0 (r) = PR PR−1 HPR ψ (r) = PR H0 ψ (r) ,
0 0
onde H é o Hamiltoniano transformado por H = PR−1 HPR . Entretanto se R, R−1 são isometrias
0
do sistema físico, então o Hamiltoniano é invariante frente a PR , PR−1 , ou seja, H = H. Em
consequência,
PR H = HPR =⇒ [PR , H] = 0;
ou seja, o operador PR comuta com o Hamiltoniano. Retornando, segue então de (5.43) que
Hψ 0 (r) = HPR ψ (r) = PR Hψ (r) = EPR ψ (r) .

Do desenvolvimento acima, seguem então que:
1. Se R é uma isometria do sistema físico, então H é invariante frente a ação de PR .
2. Como H é invariante frente a PR , segue que [PR , H] = 0.
3. Como PR comuta com H, segue que
ψ 0 (r) = PR ψ (r)
também é autofunção de H para o mesmo autovalor de energia E, pois
Hψ 0 = H (PR ψ) = E (PR ψ) = Eψ 0 .
4. Como ψ 0 = PR ψ está associada ao mesmo autovalor E, segue que ψ (r) e ψ 0 (r) são autofun-
ções degeneradas.
Assumindo-se que as simetrias do sistema físico e, portanto, do Hamiltoniano, são conheci-

das, então é em princípio possível determinar-se um conjunto de operadores que executam as
transformações correspondentes a essas simetrias. Todos esses operadores comutam com H e
formam o denominado grupo do Hamiltoniano (PH ). Este conjunto de operadores de fato forma
um grupo frente a operação de concatenação de transformações porque: (i) a transformação
trivial PR = 1 é o elemento identidade deste grupo; (ii) para todo operador de transformação
existe o elemento inverso que executa a transformação inversa; (iii) o produto de dois operadores
quaisquer também é uma transformação que comuta com H e (iv) a ação de operadores lineares
é sempre associativa.
Diversas propriedades importantes do grupo do Hamiltoniano serão agora discutidas.
5.9.2.1 D EGENERESCÊNCIA NORMAL OU ACIDENTAL
Dado um certo sistema físico o qual tem associado o Hamiltoniano H e sejam ψ (r) e E
respectivamente a autofunção e o autovalor de energia determinados por H através de (5.43).
Seja PH o grupo do Hamiltoniano H. Todo PR ∈ PH satisfaz a relação de comutação [PR , H] = 0
e gera uma nova autofunção ψ 0 (r) degenerada a ψ (r) ao mesmo autovalor E através da ação
ψ 0 (r) = PR ψ (r).
Pela aplicação de todos os elementos de PH a ψ (r) cria-se um conjunto de autofunções de-
generadas ao mesmo autovalor E. Em outras palavras, a aplicação de todas as operações de
simetria que comutam com o Hamiltoniano gera um conjunto de estados físicos, todos com o
mesmo valor de energia. Se este procedimento gerar todas as autofunções degeneradas a E,
esta degenerescência é dita normal ou essencial. Se existir alguma outra função de onda com
o mesmo valor de energia, mas que não é gerada pelas operações de simetria do sistema, esta

degenerescência é dita acidental, no sentido de que se trata de uma degenerescência sem uma
origem evidente a partir das simetrias conhecidas do sistema.
A existência de degenerescências acidentais pode estar ligada a simetrias ocultas no sistema
e que não são aparentes no Hamiltoniano. Neste caso, a presença de degenerescências acidentas
pode indicar que grupo do Hamiltoniano não está completo. Outra razão para a sua ocorrência
está ligada a determinadas combinações dos parâmetros físicos do sistema que levam dois ou
mais níveis de energia, usualmente distintos, a se cruzarem nesta particular combinação. A pre-
sença de degenerescências acidentais também pode resultar em quantidades físicas conservadas
adicionais, relacionadas às mesmas.
Usando as autofunções e autovalores do átomo de hidrogênio como exemplo, a degenerescên-
cia entre as diferentes autofunções de um mesmo orbital atômico é normal; dada a autofunção
px , as outras funções podem ser obtidas por rotações de coordenadas. Por outro lado, a degene-
rescência entre as autofunções de diferentes orbitais com o mesmo autovalor de energia (orbitais
2s e 2p, por exemplo) é acidental.
5.9.2.2 R EPRESENTAÇÕES DE PH
Assume-se
agora que um dado autovalor E = En de H seja `n -plamente degenerado `n =
1, 2, . . . , excluindo-se quaisquer degenerescências acidentais. O índice n = 1, 2, . . . passa a ser
adotado para se distinguir os distintos autovalores de energia e a quantidade `n é denominada a
ordem da degenerescência. Selecionando aquelas autofunções de H que são também degene-
radas ao autovalor En , pode-se formar a partir destas o conjunto de autofunções degeneradas
dado por n o
(n) (n)
Ψn = ψ1 , . . . , ψ`n | Hψν(n) = En ψν(n) , (n = 1, 2, . . . ; ν = 1, . . . , `n ) .
(n)
A partir deste ponto, será empregada a notação ψν (r) para identificar a ν-ésima autofunção
pertencente ao conjunto Ψn , formado pelos autovetores degenerados à energia En .
As funções em Ψn formam um subespaço do espaço de Hilbert H ao qual as autofunções de
H pertencem22 e, portanto, sempre é possível determinar-se um conjunto de funções que sejam
tanto LI quanto ortonormais através de combinações lineares de funções em Ψn , via algum
processo de ortogonalização como o de Gram-Schmidt. Ou seja, a partir das autofunções em Ψn
sempre é possível se formar uma base em um subespaço, de dimensão menor ou igual a `n , do
espaço de Hilbert H .
A importância que os subespaços formados pelas bases em Ψn possuem está no fato de que
estes são subespaços invariantes de H com relação ao grupo PH .23 Estes subespaços devem ser
(n)
invariantes porque a aplicação de qualquer operador em PH em uma dada autofunção ψν ∈ Ψn
0(n)
deve, necessariamente, gerar outra outra autofunção ψν associada ao mesmo autovalor En e
pertencente ao conjunto Ψn . Portanto, o espaço de Hilbert H ao qual todas as soluções de (5.43)
pertencem pode ser contruído a partir da soma direta
M
H = Hn = H1 ⊕ H2 ⊕ · · · ,
n=1,2,...,
sendo Hn o subespaço formado pela base em Ψn .

(n)
Será assumido então que as autofunções ψν (r) ∈ Ψn (com |Ψn | = `n ) formam uma base
ortonormal do subespaço Hn . Considera-se agora um operador PR ∈ PH , o qual corresponde
à transformação de coordenadas R via o mapeamento (5.40). É sempre possível construir-se
uma representação para PR ↔ R. De acordo com a discussão realizada na seção 5.2.2, esta
(n)
representação é obtida a partir da aplicação de PR sobre ψν (r), da qual resulta a função ψ 0 (r)
que descreve um outro estado físico do sistema com a mesma energia. A função ψ 0 (r) pode
sempre ser decomposta em termos dos vetores da base Ψn , resultando, dessa maneira,
`n
X D E X`n
ψ 0 (r) = PR ψν(n) = ψµ(n) ψµ(n) , PR ψν(n) = ψµ(n) Γ(n)
µν (R) , (5.44a)
µ=1 µ=1
sendo
. .
D E h i
Γ(n) (n) (n)
µν (R) = ψµ , PR ψν ; Γ(n) (R) = Γ(n)
µν (R) (`n × `n ) (5.44b)
22 Ver teorema 4.2
23 Ver definição 4.17

a representação de PR na base Ψn .
O conjunto n o
Γ(n) (H) = Γ(n) (R) , ∀PR ∈ PH (5.44c)
forma, portanto, uma representação de dimensão `n do grupo do Hamiltoniano H. Estas repre-

sentações são necessariamente irredutíveis, uma vez que a aplicação de qualquer PR ∈ PH sobre
(n)
qualquer ψν sempre vai resultar em um vetor contido em Hn (por este ser invariante); pela
(n)
mesma razão, nunca será possível representar PR ψν pela soma direta de matrizes menores.
(n)
Uma demonstração de que Γ (H) é irredutível segue da seguinte maneira. Supõe-se que a
representação Γ(n) (H), obtida a partir da base Ψn seja redutível. Então Hn é dado pela soma
direta de pelo menos dois subespaços menores. Existe então uma matriz S unitária que executa
uma transformação de similaridade, correspondente a uma mudança de base Ψn → Φn , que irá
colocar cada matriz em Γ(n) (H) na forma bloco-diagonal. Isto implica que agora o resultado da
aplicação de PR ∈ PH a qualquer nova autofunção ϕ(n) ∈ Φn corresponderá a uma combinação
linear que contém somente autofunções de seu subespaço e nenhuma dos complementares em
Hn . Isto significa que PR ϕ(n) é degenerado ao mesmo resultado obtido a partir de qualquer
outro subespaço complementar e, portanto, a degenerescência em En é acidental, contrariando
a hipótese inicial de que a degenerescência é normal. Portanto, a representação Γ(n) (H) não
pode ser redutível; ela deve ser necessariamente irredutível.
Pode-se repetir aqui a demonstração de que Γ(n) (H) de fato forma uma representação de
PH . Dadas as transformações R, S ∈ R, com os correspondentes operadores PS , PR ∈ PH , então
(n)
SR ←→ PSR = PS PR . Dado agora qualquer ψν ∈ Ψn , a representação de PSR na base Ψn é então
`n
X
PSR ψν(n) = PS PR ψν(n) = PS ψκ(n) Γ(n)
κν (R)
κ=1
`n `n
(n) (n)
X X
= PS ψκ(n) Γ(n)
κν (R) = ψλ Γλκ (S) Γ(n)
κν (R)
κ=1 κ,λ=1
`n h i
(n)
X
= ψλ Γ(n) (S) Γ(n) (R) .
λν
λ=1
Ou seja,
`n
(n) (n)
X
PSR ψν(n) = ψλ Γλν (SR) =⇒ Γ(n) (SR) = Γ(n) (S) Γ(n) (R) ,
λ=1
mostrando que Γ(n) (H) é de fato uma representação de PH .

(n)
Portanto, conclui-se que o conjunto das `n autofunções ψν (r) que descrevem estados dege-
nerados de energia En consistem nas funções de base que formam uma representação irredutível
`n -dimensional Γ(n) (H) do grupo do Hamiltoniano.
Pode-se mostrar facilmente que esta representação é também unitária, se a base Ψn for for-
mada por autofunções ortonormais e se os elementos de PH forem operadores unitários com um
parâmetro contínuo. Conforme mencionado nos exemplos apresentados no início desta seção, os
operadores que formam o grupo PH atuam sobre as funções de onda e como estas, por sua vez,
descrevem estados físicos (mensuráveis) do sistema, é assumido então que os membros de PH
sejam expressos em termos de operadores Hermitianos (como os momentos linear ou angular),
pois somente neste caso pode-se garantir que o valor esperado do observável seja real.24 Esses
operadores Hermitianos servirão de geradores infinitesimais dos grupos de transformação e se
esses grupos possuírem somente um parâmetro livre, é sempre possível escrever os elementos
de PH como operadores unitários.
Demonstração. Emprega-se a definição usual do produto interno de dois vetores de um espaço

de Hilbert H complexo, sendo que estes vetores são funções das coordenadas do espaço Eucli-
deano E 3 . Neste caso, dados ψ, ϕ ∈ H , o seu produto interno é
ˆ
hψ, ϕi = d3 r ψ ∗ ϕ.
24 Ver discussão na seção 5.2.1.

(n) (n)
Dados agora os autovetores ψµ , ψν ∈ Ψn , como a base é ortonormal, resulta que
D E ˆ
(n) (n)
ψµ , ψν = d3 r ψµ(n)∗ ψν(n) = δµν .
Como o Hamiltoniano é Hermitiano, um operador PR ∈ PH sempre pode ser construído de

forma que este seja unitário. Neste caso, de acordo com o teorema 4.21,
D E D E
ψµ(n) , ψν(n) = PR ψµ(n) , PR ψν(n) = δµν .
Este resultado pode ser compreendido interpretando-se a ação de PR como uma “rotação gené-
rica” das coordenadas que não altera o produto interno. Então,
*` `n
+
D E n
(n) (n)
X X
(n) (n) (n) (n)
δµν = PR ψµ , PR ψν = ψκ Γκµ (R) , ψλ Γλν (R)
κ=1 λ=1
`n D E `n
(n) (n)
X X
= ψκ(n) , ψλ Γ(n)∗
κµ (R) Γλν (R) = Γ(n)∗ (n)
κµ (R) Γκν (R)
κ,λ=1 κ=1
`n
X h i
= Γ(n)† (n)
µκ (R) Γκν (R) = Γ
(n)†
(R) Γ(n) (R) .
µν
κ=1
Ou seja,
Γ(n)† (R) Γ(n) (R) = I`n
e a representação é unitária.
A relação entre a ortonormalidade das funções de base e a unitariedade da representação
Γ(n) (H) discutida acima também pode ser considerada no sentido inverso. Supondo-se que
Ψn seja formado por autofunções linearmente independentes, será mostrado agora que se os
elementos do grupo PH forem operadores unitários então as autofunções serão necessariamente
ortogonais entre si.
(n) (m)
Demonstração. Sejam as autofunções ψν ∈ Ψn e ψµ ∈ Ψm , associadas respectivamente aos
autovalores En e Em . Seja também PR ∈ PH um operador unitário. O produto interno destas
funções satisfaz, portanto, a identidade
D E D E
ψµ(m) , ψν(n) = PR ψµ(m) , PR ψν(n) .
Introduzindo a representação para PR dada por (5.44), resulta

*` `n
+
D E m
(n) (n)
X X
(m) (n) (m) (m)
ψµ , ψν = ψκ Γκµ (R) , ψλ Γλν (R)
κ=1 λ=1
`m X
`n D E
(n) (n)
X
= Γ(m)∗ (m)
κµ (R) Γλν (R) ψκ , ψλ .
κ=1 λ=1
Observa-se que o lado esquerdo da identidade acima não depende de PR . Então, o mesmo
produto interno à esquerda ocorrerá para todos os elementos de PH . Somando-se todas as
equações correspondentes a todos os elementos do grupo, resulta
D E X`m X
`n D E
(n) (n)
X
g ψµ(m) , ψν(n) = Γ(m)∗ (m)
κµ (R) Γλν (R) ψκ , ψλ ,
κ=1 λ=1 PR ∈PH
onde g = |PH | será assumido finito, por enquanto.

Segundo o teorema 5.1, as representações de PR em Hn e Hm ou são unitárias ou podem
se tornar unitárias frente a transformações de similaridade, que correspondem a mudanças de
base em Ψn e Ψm . Portanto, de acordo com o grande teorema da ortogonalidade 5.2, resulta
então
`m X
`n
D
(m) (n)
E 1 X D
(n)
E
ψµ , ψν = δnm δµν δκλ ψκ(m) , ψλ . (5.45a)
`n κ=1 λ=1

O resultado acima mostra que se n 6= m e/ou µ 6= ν,

!
D E n 6= m
ψµ(m) , ψν(n) = 0, . (5.45b)
µ 6= ν
(m) (n)
Ou seja, as propriedades do grupo PH mostram que as autofunções ψµ e ψν são necessa-
riamente ortogonais quanto estas estão associadas a distintos autovalores de energia ou são
distintas autofunções do mesmo autovalor En . Por outro lado, se m = n e µ = ν,
`n `n D
D E 1 X D
(n)
E 1 X E
ψν(n) , ψν(n) = δκλ ψκ(n) , ψλ = ψκ(n) , ψκ(n) .
`n `n κ=1
κ,λ=1
Ou seja, obtém-se a seguinte relação entre as normas das autofunções:

`n
(n) 2 1 X (n) 2

ψν = ψκ .
`n κ=1
Mas, somando-se ambos os lados sobre o índice ν = 1, . . . , `n , conclui-se que, necessariamente,

(n) (n)
ψν = ψκ , (1 6 ν, κ 6 `n ) . (5.45c)
Ou seja, todas as autofunções em Ψn possuem a mesma norma.

Embora as conclusões acima tenham sido obtidas supondo-se que PH é finito, as mesmas va-
lem também para grupos do Hamiltoniano contínuos e compactos. Este resultado é importante
porque demonstra a ortogonalidade das autofunções, mesmo que estas sejam degeneradas na
energia. Este resultado foi obtido de uma forma genérica, empregando-se somente as proprie-
dades de simetria do sistema físico. A bem conhecida ortogonalidade das autofunções do átomo
de Hidrogênio, tanto dentro de um orbital quanto entre diferentes orbitais, é um exemplo deste
resultado.
5.9.2.3 T EORIA DE GRUPOS E “ BONS ” NÚMEROS QUÂNTICOS
Em mecânica quântica, um “bom” número quântico é aquele número/índice (ou conjunto de

números/índices) que identificam os diferentes autovalores de observáveis que são constantes
de movimento. Uma condição necessária e suficiente para tanto ocorre se o operador associado
ao observável comuta com o Hamiltoniano do sistema.
A teoria de representações de grupos oferece uma relação direta entre as irreps do grupo
do Hamiltoniano e bons números quânticos. De acordo com a discussão realizada na seção
(n)
anterior, a representação de qualquer PR ∈ PH é obtida a partir de uma dada autofunção ψν ∈
(n)
Ψn via as expressões (5.44). Estas expressões mostram que ψν está sempre relacionada com a
ν-ésima coluna de qualquer matriz do conjunto Γ(n) (H), que forma a n-ésima irrep do grupo do
(n) (n) (n)
Hamiltoniano. Estabelece-se então a correspondência ψν ! Γµν (H) e diz-se que ψν pertence
à (ou que se transforma de acordo com a) ν-ésima coluna da n-ésima representação irredutível
de PH .
Caso fosse realizada uma mudança de base Ψn → Ψ0n em Hn através da relação
`n
X `n
X
ψν(n)0 = ψµ(n) Aµν ⇐⇒ ψν(n) = ψµ(n)0 A−1
µν ,
µ=1 µ=1
(n) (n)0
onde ψν ∈ Ψn , ψµ ∈ Ψ0n e A = [Aµν ] : (`n × `n ) é uma matriz não singular, então, para todo
PR ∈ PH ,
`n `n
X (5.44) X
PR ψν(n)0 = PR ψµ(n) Aµν = ψκ(n) Γ(n)
κµ (R) Aµν
µ=1 µ,κ=1
`n `n h i
(n)0 (n)0
X X
= ψλ A−1 (n)
λκ Γκµ (R) Aµν = ψλ A−1 Γ(n) (R) A
λν
µ,κ,λ=1 λ=1

`n
(n)0 (n)0
X
= ψλ Γλν (R) ,
λ=1
onde
.
Γ(n)0 (R) = A−1 Γ(n) (R) A
é a representação de PR na base Ψ0n .
Contudo, esta relação nada mais é senão a transformação de similaridade (5.5); ou seja,
(n)0
Γ(n)0 (R) é equivalente a Γ(n) (R). Além disso, ψν também se transforma de acordo com a ν-
(n)0
ésima coluna de Γ (R). Portanto, a menos de uma transformação de similaridade, existe uma
única representação irredutível do grupo do Hamiltoniano correspondente a cada autovalor de
energia.
Um conjunto de autofunções pode sempre ser classificado ou identificado de uma única
maneira, de acordo com a representação irredutível à qual pertence. Desta forma, a teoria de
representações de grupos fornece os “bons números quânticos” para a dinâmica do sistema
físico através dos índices relacionados ao autovalor de energia (n) e à coluna da irrep Γ(n) (H).
A degenerescência (normal) do autovalor é simplesmente a dimensionalidade da representação.
Caso seja possível calcular as dimensionalidades de todas as irreps do grupo do Hamiltoniano,
as ordens das degenerescências (normais) serão automaticamente obtidas.
Se ocorrerem degenerescências acidentais associadas a um dado autovalor En , as distintas
bases dos subespaços invariantes correspondentes podem ser facilmente distinguidas, bastando
para isso introduzir-se um índice adicional. Dessa forma, a base
.
n o
(n) (n) (n)
Ψpn = ψpν (r) | Hψpν = Epn ψpν , (n = 1, 2, . . . ; p = 1, 2, . . . ; ν = 1, . . . , `n ; E1n = E2n = · · · )
(n)
é formada por autofunções tais que uma dada ψpν ∈ Ψpn é a autofunção que se transforma de
acordo com a ν-ésima coluna da n-ésima irrep de PH que ocorre pela p-ésima vez na distribuição
de níveis de energia do sistema físico. Nesta situação, é adequado identificar os autovalores por
Epn e os bons números quânticos serão portanto {p, n, ν}.
Esta discussão também implica que uma perturbação aplicada ao sistema físico somente
poderá quebrar degenerescências se, e somente se, a sua inclusão no Hamiltoniano reduz o
grupo de simetria do sistema, alterando assim as suas representações irredutíveis.
Exemplo 5.8. Um exemplo simples, envolvendo um grupo PH finito, consiste em um elétron
movendo-se sob o potencial de três prótons localizados nos vértices de um triângulo equilátero.
Neste caso, o sistema físico claramente possui as isometrias do triângulo, discutidas pela
primeira vez nos exercícios 3.11 e 3.12. Estas isometrias formam o grupo C3v , isomórfico ao S3 e
que possui três representações irredutíveis (exercício 5.1), de dimensões 1, 1 e 2, apresentadas
na tabela 5.1.
Portanto, este sistema possui somente 3 (três) autoestados de energia, sendo que os dois
primeiros são não degenerados e o terceiro é duplamente degenerado. De acordo com (5.44), a
(1)
autofunção do estado E1 ψ1 (r) permanece invariante frente a todas as operações de simetria
do grupo, uma vez que estas são operacionalizadas por Γ(1) (S3 ). Por outro lado, a autofunção
(2)
do estado E2 ψ1 (r) , em ações são descritas por Γ(2)
(S3 ), permanece invariante frente as rota-
2
ções próprias, operadas por {I, π4 , π5 }S3 ≡ E, C3 , C3 C3v , mas muda de sinal frente as rotações
impróprias {π2 , π3 , π6 }S3 ≡ {σv16 , σv35 , σv24 }C3v . Finalmente, as duas autofunções do estado E3 são
transformadas de acordo com Γ(3) (S3 ):
2
!
(3)
X
(3) (3) i = 1, . . . , 6
Pπ i ψ ν = ψµ Γµν (πi ) , ;
µ=1
ν = 1, 2
(3)
ou seja, ψν transforma-se de acordo com a ν-ésima coluna de Γ(3) (S3 ). Por exemplo, uma
reflexão em torno do plano 3 − 5 do triângulo (figura 3.5) irá realizar as transformações
2
(3) Pσ (3)0
X
−→ ψ1,2 : ψν(3)0 = Pσv35 ψν(3) =
ψ1,2 −−−v35 ψµ(3) Γ(3)
µν (σv35 ) , (ν = 1, 2) ,
µ=1
1 −√ 3 1 √ (3) !
!
(3)0 (3)
ψ1 1 ψ1 − 3ψ2
(3)0 = (3) (3)
ψ1 ψ2 √ = √ (3) (3) .
ψ2 2 − 3 −1 2 − 3ψ1 − ψ2

5.9.3 G RUPOS A BELIANOS E O TEOREMA DE B LOCH

Algumas conclusões importantes já podem ser obtidas para sistemas físicos que possuem
propriedades de simetria que formam grupos Abelianos. Um exemplo de sistema com essa
propriedade é uma rede cristalina, a qual é isométrica frente a algum grupo cristalográfico
espacial.25
Em um grupo Abeliano, cada elemento forma uma classe por si próprio26 e, por consequência,
o número de representações irredutíveis é igual ao número de elementos do grupo. Contudo,
como (5.19) deve sempre ser satisfeita, i. e.,
g
X
`2n = g, sendo g = PH ,

n=1
a única possibilidade é `n = 1, para n = 1, 2, . . . , g.

Portanto, um grupo Abeliano de ordem g tem g representações irredutíveis unidimensionais e
um sistema físico cujas isometrias pertencem a esse grupo possui o mesmo número de autoestados
de energia. Um sistema cujo grupo do Hamiltoniano é Abeliano tem seus autoestados descritos
por autofunções não degeneradas.
5.9.3.1 G RUPOS CÍCLICOS

g
= PA , PA2 , . . . , PAg =

Se além de Abeliano, o grupo for também cíclico, então P H = P A : P A = I
I , sendo PA o gerador do grupo.
Denotando por Γ (A) = r o valor que representa PA em uma certa irrep de PH , a discussão
m
realizada ao longo da seção 5.6 mostra que Γ (PAm ) = [Γ (PA )] = rm (m = 2, . . . , g). Em particular,
como Γ (PAg ) = Γ (I) = 1, resulta que a quantidade r satisfaz rg = 1. Ou seja, as g irreps de PA são
dadas pelas g raízes da unidade. Assim, pode-se escolher
rg = 1 =⇒ Γ(n) (PA ) = rn = e2π(n−1)i/g , (n = 1, . . . , g) ,
sendo que esta escolha foi realizada para que Γ(1) (PA ) = 1 seja a irrep trivial.
2
As irreps de PA2 são, por conseguinte, obtidas a partir de Γ(n) PA2 = Γ(n) (PA ) = rn2 =
e4π(n−1)i/g . Assim, para qualquer elemento de PH pode-se escrever
Γ(n) (PAm ) = e2πm(n−1)i/g , (n, m = 1, . . . , g) . (5.46)
Nota-se que com as escolhas aqui realizadas, a irrep trivial corresponde a Γ(1) (PAm ) = 1, m =
1, . . . , g . A tabela 5.4 lista algumas das irreps de PH . A mesma tabela também serve para listar
os caracteres das representações.
Tabela 5.4: Tabela das representações irredutíveis do grupo cíclico de ordem g PA : PAg = I , sendo ω = e2πi/g .

I PA PA2 PA3 ··· PAg−1

Γ(1) 1 1 1 1 ··· 1
Γ(2) 1 ω ω2 ω3 ··· ω (g−1)
Γ(3) 1 ω2 ω4 ω6 ··· ω 2(g−1)
.. .. .. .. .. .. ..
. . . . . . .
2
Γ(g) 1 ω (g−1) ω 2(g−1) ω 3(g−1) ··· ω (g−1)
5.9.3.2 O TEOREMA DE B LOCH

O teorema de Bloch possui grande importância da dinâmica de uma rede cristalina e pode
ser deduzido facilmente considerando-se a simetria translacional inerente a estes sistemas. Este
teorema será deduzido agora para uma rede unidimensional, mas o mesmo pode ser estendido
para outras dimensões.
Conforme discutido na seção 3.4.3, em uma dimensão o grupo cíclico de ordem N é o grupo
de simetria do Hamiltoniano para o potencial periódico de uma rede cristalina com N períodos
25 Seção 3.4.3.
26 Ver página 100.

em um anel circular ou em uma rede linear com condições de contorno periódicas, sendo a o
parâmetro de rede. Neste caso, um elemento do grupo translação T é o operador T1 , cuja ação
sobre a coordenada x ao longo da rede é
T1 x = x0 = x − a,
ou seja, transladar a origem para a direita por uma distância igual ao parâmetro de rede. O
operador inverso é T1−1 x = x + a e o operador que executa a translação por m 6 N períodos de
rede é simplesmente Tm x = T1m x = x − ma, onde, devido às condições de contorno, TN x = T1N x =
x − N a = x = Ex.
Assim, observa-se
que T1 é o gerador do grupo de translação, o qual pode ser
descrito por T = T1 : T1N = E .
De acordo com o mapeamento (5.40), o operador PT1 que efetua a transformação correspon-
dente na função de onda é dado por
PT1 ψ (x) = ψ T1−1 x = ψ (x + a) .

−1

Da mesma forma, o operador PTm ↔ Tm tem sua ação dada por PTm ψ (x) = ψ Tm x = ψ (x + ma) .
Conforme a discussão realizada a respeito das propriedades do grupo do Hamiltoniano, dada
a equação de Schroedinger (5.43) para um potencial periódico, o número total de autovalores
de energia possíveis é igual ao número de representações irredutíveis do grupo PH ; ou seja,
E = En , com 1 6 n 6 N . Além disso, como o grupo T é cíclico, todos os autovalores são não
degenerados, pois as irreps são unidimensionais. Finalmente, de acordo com (5.44), a ação de
qualquer operador em T implica na transformação de ψ (x) de acordo com alguma representação
irredutível de PH .
Assim, dada autofunção ψ (n) (x) associada ao autovalor En , esta deve se transformar sob a
ação de PT1 de acordo com a n-ésima irrep de PH . De acordo com (5.46), resulta então
ψ (n) (x + a) = PT1 ψ (n) (x) = Γ(n) (T1 ) ψ (n) (x) = e2π(n−1)i/N ψ (n) (x) = ω n−1 ψ (n) (x) ,
onde o parâmetro ω está na tabela 5.4. Como as irreps na tabela são puramente fases unimo-
dulares, a seguinte propriedade é imediata:
2 2
(n)
ψ (x + a) = ψ (n) (x) .

Portanto, a forma mais geral para ψ (n) (x) é
ψ (n) (x) = eiφn (x) un (x) ,
onde φn (x) é uma função real denominada função de fase e un (x) apresenta a periodicidade da
rede: un (x + a) = un (x).
A forma explícita de φn (x) pode ser determinada. Aplicando-se uma translação qualquer,
(5.46)
PTm ψ (n) (x) = ω m(n−1) ψ (n) (x) = ω m(n−1) eiφn (x) un (x) .
Por outro lado,

PTm ψ (n) (x) = ψ (n) (x + ma) = eiφn (x+ma) un (x) .
Igualando-se ambos os resultados, conclui-se que a função de fase φn (x) deve satisfazer
2πm (n − 1)
φn (x + ma) = φn (x) + .
N
Desenvolvendo-se φn (x + ma) em uma série de Taylor em torno de x,
∞
X mr ar 0 1 2 2 00
φn (x + ma) = φ(r)
n (x) = φn (x) + maφn (x) + m a φn (x) + · · · ,
r=0
r! 2
conclui-se que a identidade somente pode ser satisfeita se φ00n (x) = 0, ou seja, se esta for linear
em x. Obtém-se também que
2π (n − 1) 2π (n − 1)
φ0n (x) = ⇒ φn (x) = x + α,
L L
onde L = N a é a extensão da rede periódica e α é uma constante.

Portanto, definindo-se a nova quantidade
2π (n − 1)
kn = ,
L
denominada o número de onda, a forma geral da autofunção é
ψn (x) = eikn x un (x) .
Este resultado é o teorema de Bloch (unidimensional) e esta forma para ψn (x) é denominada
função de Bloch.
A dedução recém concluída pode ser estendida para uma rede cristalina real (em 3D). Fazendo-
se isso, pode-se mostrar que o número de onda é generalizado para o vetor de onda
3
X nr − 1
kn1 ,n2 ,n3 = 2π br ,
r=1
Nr
onde {br } são os vetores translacionais da rede recíproca. Com isso, a função de Bloch fica
escrita
ψk (r) = eik·r uk (r) .
De acordo com a discussão realizada na seção 5.9.2.3, o vetor de onda k é um bom número
quântico para a função de onda de um elétron em um cristal, desde que a simetria translacional
não seja quebrada por alguma perturbação. Neste caso, o vetor de onda aparece relacionado
com o espalhamento do elétron e ~k é o momento de um quantum de vibração da rede.
5.9.4 F UNÇÕES DE BASE PARA REPRESENTAÇÕES IRREDUTÍVEIS

Os exemplos apresentados na seção anterior já dão uma indicação da utilidade da teoria de
representação para obter-se informações importantes a respeito da dinâmica do sistema quando
o seu grupo de simetria é Abeliano.
Nesta seção, serão desenvolvidos métodos mais gerais, que irão também fornecer informações
importantes quando os estados de energia são degenerados, em cuja situação as representações
irredutíveis possuem dimensões maiores que um. Nesta situação, conforme salientado na dis-
cussão a respeito de bons números quânticos (seção 5.9.2.3), as funções de base dos subespaços
vetoriais necessitam de, no mínimo, dois índices para a sua identificação, um índice para indicar
a representação irredutível à qual pertencem e outro para indicar a coluna (ou linha) dentro da
representação.
(n)
Retomando então a nomenclatura introduzida na seção 5.9.2.3, ψν (r) é a função de base
(n)
pertencente à ν-ésima coluna da n-ésima irrep. As outras autofunções ψµ (r) necessárias para
(n)
completar a base da representação são denominadas as parceiras de ψν (r).
Então, retornando a (5.44), a ação de qualquer elemento PR do grupo do Hamiltoniano PH
(n)
sobre ψν (r) pode ser expresso com o auxílio das parceiras como
`n
X
PR ψν(n) = ψµ(n) Γ(n)
µν (R) ,
µ=1
sendo `n a ordem da degenerescência do n-ésimo estado de energia. Multiplicando-se agora am-

(m)∗
bos os lados por Γµ0 ν 0 (R) e somando sobre os elementos do grupo, o teorema da ortogonalidade
5.2 fornece
`n
(m)∗ (m)∗
X X X
Γµ0 ν 0 (R) PR ψν(n) = ψµ(n) Γ(n)
µν (R) Γµ0 ν 0 (R)
PR ∈PH µ=1 PR ∈PH
`n
g X
= ψ (n) δmn δµµ0 δνν 0
`n µ=1 µ
g (n)
= δmn δνν 0 ψµ0 ,
`n

lembrando que g = |PH |.

O resultado acima permite definir-se o operador de transferência
. `n X (n)∗
P(n)
µν
= Γµν (R) PR , (5.47a)
g
PR ∈PH
com o qual pode-se escrever o resultado como
P(k)
µκ ν
ψ (n) = δnk δνκ ψµ(k) . (5.47b)
(m)
Ou seja, a atuação do operador Pµκ sobre uma função de base gera um resultado nulo, a não
ser que esta pertença à κ-ésima coluna da k-ésima representação irredutível. Neste caso, se
n = k e ν = κ, resulta que
P(n)
µν ν
ψ (n) = ψµ(n) ,
(n) (n)
ou seja, ao se aplicar (5.47a) na função de base ψν , obteve-se a sua parceira ψµ . Esta pro-
(n)
priedade do operador Pµν fornece um método para se obter todas funções de base de uma dada
irrep conhecendo-se somente uma delas.
Retornando ao último resultado acima, se µ = ν, resulta que
P(n)
νν ν
ψ (n) = ψν(n) .
(n) (n)
Ou seja, ψν é uma autofunção de Pνν com autovalor unitário. Esta propriedade permite
identificar-se de forma única os índices de qualquer função de base e até mesmo se uma dada
(n)
autofunção associada a En é de fato uma função de base. Além disso, como Pνν é um operador
linear, qualquer combinação de funções pertencentes à ν-ésima coluna de Γ(n) , mas oriundas
(n) (n)0
de diferentes escolhas de bases (tal como aψν + bψν ) também pertencerá às mesmas coluna
(n) (n) (n)
e representação. Finalmente, como o autovalor é unitário, o operador é tal que Pνν Pνν = Pνν .
Operadores que possuem esta propriedade são denominados idempotentes.
Com base nas propriedades do operador de transferência, o teorema a seguir pode ser for-
mulado.
Teorema 5.8. Se Γ(1) , Γ(2) , . . . , Γ(g) são as representações irredutíveis de um grupo de operadores
PR , então qualquer função F no espaço operado por PR pode ser decomposto em uma soma na
forma
Xg X`n
F = fν(n) ,
n=1 ν=1
(n)
onde fν pertence à ν-ésima coluna da n-ésima representação irredutível do grupo.
Demonstração. Considera-se todas as funções F, F20 , F30 , . . . , Fg0 obtidas pelas aplicações de todos
os operadores PR sobre F . Primeiro descarta-se todas as funções que são LD das outras e
ortonormaliza-se as demais (e. g. via o processo de Gram-Schmidt). Denotando-se o conjunto
resultante por Φ = {F, F2 , . . . , Fm } (m 6 g), estas funções formam a base de uma representação
unitária do grupo, identificada por D̂, de tal forma que
m
X
P R Fk = Fr D̂rk (R) , (k = 1, . . . , m) .
r=1
Agora, há duas possibilidades: ou a representação D̂ é irredutível ou não. Se for irredutível,

então Fk pertence à sua k-ésima coluna e o teorema está provado. Se não o for, então existe
uma matriz não singular S que gera uma transformação de similaridade que irá colocar todas as
matrizes em D̂ na forma bloco-diagonal. Neste caso, as novas funções
m
X
F`00 = Fk Sk` , (` = 1, . . . , m)
k=1
(n)
podem ser escritas como combinações lineares de funções do tipo fν , as quais são as funções
de base das irreps. Usando então a matriz inversa S−1 , pode-se finalmente escrever as funções
(n)
em Φ (em particular F ) em termos das funções fν .

Com base neste teorema, é possível empregar-se o operador de transferência (5.47a) para a
determinação das funções de base. Como foi constatado que
P(k)
κκ ν
f (n) = δnk δνκ fκ(k) , (5.48a)
(k)
a aplicação de Pκκ sobre uma função qualquer F resulta
g X g X
`n
! `n
(k) (k)
X X
Pκκ F = Pκκ (n)
fν = P(k)
κκ ν
(k)
f (n) =⇒ Pκκ F = fκ(k) . (5.48b)
n=1 ν=1 n=1 ν=1
(k)
Assim, Pκκ atua sobre qualquer função F projetando sua componente ao longo da κ-ésima
(k)
coluna da irrep Γ(k) . Por esta razão, Pκκ é denominado operador de projeção.
(n) (n)
É importante mencionar que a função fν (r) projetada pelo operador Pνν aplicado a uma
(n)
função arbitrária F (r) está diretamente relacionada à função de base ψν (r), pertencente à
(n) (n) (n) (n)
ν-ésima coluna da irrep Γ(n) , por fν (r) = cν ψν (r), sendo cν ∈ C uma constante a ser
determinada, e. g., pela normalização da autofunção.
Com os recursos deduzidos acima, é possível obter-se as funções de base de qualquer re-
presentação irredutível (por exemplo, Γ(n) ). Partindo de uma função F arbitrária, projeta-se
(n)
inicialmente a mesma ao longo de uma coluna da irrep, obtendo-se assim fν (por exemplo).
(n)
Esta função é então normalizada, obtendo-se assim a função de base ψν adequada. A partir
(n)
daí, o uso sistemático do operador de transferência Pµν irá gerar todas as suas parceiras, uma
(n) (n) (n)
vez que Pµν ψν = ψµ . O físico americano John Hasbrouck Van Vleck (1899–1980) denominou
este procedimento de máquina geradora das funções de base.
Os resutados recém obtidos requerem o conhecimento total das representações irredutíveis
do grupo do Hamiltoniano. Em algumas situações, este conhecimento é impossível ou muito
difícil de ser obtido. Em comparação, a dedução da tabela de caracteres é mais fácil de ser obtida,
se for aplicado um procedimento semelhante ao discutido na seção 5.6.6. Nesta situação, ainda
é possível obter-se informações a respeito das funções de base, conhecendo-se os caracteres da
representação. Com este intuito, retorna-se a (5.47a), coloca-se µ = ν e soma-se sobre ν para
obter
`n `n
!
(n) .
X (n) `n X X
(n)∗
P = Pνν = Γνν (R) PR ,
g
ν=1 ν=1 PR ∈PH
`n X
P(n) = χ(n)∗ (R) PR , (5.49)
g
PR ∈PH
sendo χ(n) (R) o caractere de PR na n-ésima representação irredutível.

(n)
A ação de P sobre uma função qualquer das coordenadas pode ser vista a partir de (5.48b),
X (n) X
P(n)
νν
F = fν
(n)
=⇒ Pνν
F =
(n)
fν(n) =⇒ P F = f (n) ,
ν ν
(n)
isto é, a partir de uma função arbitrária, P projeta a parte pertencendo à n-ésima irrep, a
qual consiste na soma das funções de base da mesma. Este resultado, da mesma forma que o
caractere, não é afetado por transformações de similaridade que alteram as funções de base.
(n)
Por sua vez, a ação de P sobre a função f (n) pode ser visualizada a partir de (5.48a),
X (n) X
P(n)
κκ
fν
(n)
= δ νκ f (n)
κ =⇒ Pκκ
f (n)
ν =
(n)
δνκ fκ(n) =⇒ P fν(n) = fν(n) .
κ κ
Então, X X
P(n) fν(n) = fν(n) =⇒ P
(n) (n)
f = f (n) .
ν ν
Finalmente, retornando à ação genérica do operador de transferência sobre uma função de

base, dada por (5.47b), fazendo κ = µ e somando sobre µ e k, resulta
X (k)
P ψν(n) = ψν(n) .
k

Ou seja,
X
P(k) = PI ,
k
sendo PI a identidade do grupo do Hamiltoniano.
Exemplo 5.9 (Operador de projeção do grupo C1h ). O grupo C1h contém apenas duas ope-
rações (3.7): a identidade E e a reflexão σh , a qual realiza a transformação σh x = −x. Os
correspondentes operadores que atuam no espaço funcional são PE e Pσh , cujas ações sobre
uma função F (x), de acordo com (5.40), são PE F (x) = F (x) e Pσh F (x) = F (−x). A partir agora
da tabela de caracteres do grupo (tabela 5.3), os operadores de projeção do grupo são dados por
(5.49):
1 1
P(1) = (PE + Pσh ) , P(2) = (PE − Pσh ) .
2 2
Estes operadores, ao atuarem sobre uma função arbitrária F (x), resultam em
1 1
P(1) F (x) =
[PE F (x) + Pσh F (x)] = [F (x) + F (x)] ,
2 2
(2) 1 1
P F (x) = [PE F (x) − Pσh F (x)] = [F (x) − F (−x)] .
2 2
Claramente, as funções resultantes são, respectivamente, par e ímpar frente a uma reflexão,
como seria esperado para estas pertecerem às representações Γ(1) e Γ(2) , respectivamente.
5.9.5 P ERTURBAÇÕES , REGRAS DE SELEÇÃO E SIMETRIA

Nesta seção será realizada uma breve discussão sobre como o formalismo da teoria de gru-
pos pode auxiliar na obtenção de resultados aproximados envolvendo sistemas quânticos. Em
particular, será abordado o problema do tratamento de perturbações que são aplicadas a um
sistema inicialmente em um estado estacionário, levando o mesmo a transições para diferentes
estados. Um dos objetivos do uso da teoria de grupos neste caso consiste na obtenção das regras
de seleção que definem quais transições são permitidas ou quais são proibidas.
5.9.5.1 P ERTURBAÇÕES SOBRE AUTOESTADOS
Em geral, a solução completa da equação de Schroedinger completa (5.39) não existe; de

fato, na maior parte das situações, mesmo a forma estacionária (5.43) não é exatamente solúvel.
Contudo, para simplificar a discussão, será suposto que as soluções da equação independente
do tempo sejam conhecidas.
Assume-se que o sistema físico esteja inicialmente em um estado estacionário, determinado
pela solução de (5.43), quando o Hamiltoniano é formalmente escrito como H = H0 . Aplica-se
então uma perturbação sobre o sistema de tal forma que o Hamiltoniano é alterado por H0 → H,
onde H inclui o efeito da perturbação. Se esse efeito puder ser considerado suficientemente
“pequeno” (sob algum critério), então a perturbação pode ser adicionada linearmente ao Hamil-
toniano original e pode-se então escrever
H = H0 + H0 ,
0
onde H é o termo que inclui a perturbação.
Seja P0 o grupo das transformações de simetria de H0 . Em geral, existe um ou mais opera-
0
dores PR ∈ P0 para os quais PR , H 6= 0, i. e., existem operações para as quais H0 é invariante,
0
mas H não o é. Isto se deve ao fato de que a ação da perturbação remove uma ou mais simetrias
do sistema físico. Supõe-se que, neste caso, o sistema atuado pela perturbação apresente um
conjunto reduzido de isometrias, o qual é um subconjunto das isometrias originais. Por isso,
0
assume-se que ainda existe um grupo de transformações de simetria de H , denotado por P 0 e tal
0 0
que todos os operadores PR0 ∈ P 0 satisfaçam PR0 , H = 0, i. e., deixam H invariante. Supõe-se

também que P 0 ⊂ P0 , i. e., é um subgrupo das operações de simetria de H0 . Com isso, o Hamil-
toniano completo H permanece invariante apenas sob as transformações de simetria comuns a
H0 e H0 , ou seja, o grupo de simetrias de H passa a ser P 0 .

Retornando ao Hamiltoniano não perturbado H0 , uma vez que suas propriedades foram su-
postas conhecidas, sabe-se quantos autovalores de energia En existem e as ordens de suas
{n} {n}
degenerescências. Conhecem-se também os conjuntos de autofunções Ψn = ψ1 , . . . , ψ`n , as
quais formam as bases ortonormais dos subespaços Hn e a partir das quais as representações
irredutíveis Γ(n) (P0 ) são deduzidas.
0
Aplicando-se então a perturbação H sobre o sistema, o grupo de simetrias é reduzido para
0 0
P . Como P é subgrupo de P0 , as funções de base em Ψn ainda geram uma representação de
dimensão `n para P 0 , mas esta representação será, em geral, redutível. Essa representação pode
ser reduzida à forma bloco-diagonal, quando então surgirão novos subconjuntos de funções de
base, expressos a partir de Ψn , tais que uma dada função de um determinado subconjunto será
expressa apenas em termos de suas parceiras no subconjunto sob a ação de qualquer PR0 ∈ P 0 .
Como as representações irredutíveis de P0 foram determinadas a partir das autofunções dege-
neradas (normais) aos autovalores de H0 , os novos subconjuntos serão compostos por funções
degeneradas a novos autovalores, exceto no caso de degenerescências acidentais; em outras pa-
(0)
lavras, os autovalores de energia originais En dividem-se em novos níveis devido à redução
na simetria do sistema físico.
5.9.5.2 O TEOREMA DOS ELEMENTOS DE MATRIZ E REGRAS DE SELEÇÃO
Uma importante aplicação do tratamento perturbativo da mecânica quântica está na de-

terminação das probabilidades temporais (ou taxas temporais) de transições entre dois estados
estacionários de energia sob a ação de uma perturbação dependente (de forma “lenta”) do tempo.
É assumido que antes da perturbação incidir sobre o sistema, este estava em um estado estaci-
(n)
onário bem definido, descrito pela autofunção ψν (r), associada ao autovalor En ,27 os quais são
soluções do Hamiltoniano H0 .
Uma perturbação dependente do tempo é então aplicada ao sistema em um dado instante t =
t0 . Um tipo comum de perturbação deste tipo consiste na incidência de radiação eletromagnética
sobre átomos, moléculas ou sólidos. Essa perturbação não somente reduz a simetria do sistema,
como também promove transições entre diferentes estados, de tal maneira que, se no instante t =
tf > t0 a perturbação é removida e o sistema torna a ser regido por H0 , existe uma probabilidade
(m)
não nula de o mesmo se encontrar em um outro autoestado ψµ , distinto do inicial.
Empregando a teoria de perturbações dependentes do tempo na mecânica quântica, mostra-
se que a probabilidade de transição por unidade de tempo na presença de uma perturbação
pode ser expressa genericamente pela regra de ouro de Fermi
2π 0 2 0
D
0
E
w= ρ (m) Hmµ,nν , sendo Hmµ,nν = ψµ(m) , H ψν(n) .
~
0
Na expressão acima, ρ (m) é a densidade de estados finais e Hmµ,nν é o elemento da matriz do
0
Hamiltoniano perturbado H que conecta o estado inicial nν com o estado final mµ. A partir
0
desta expressão fica evidente que a transição nν → mµ somente poderá ocorrer se Hmµ,nν 6= 0.
Transições que satisfazem esta condição são denominadas permitidas, ao passo que aquelas
0
para as quais Hmµ,nν = 0 são ditas proibidas.
A teoria de representações de grupos pode fornecer informações acerca de quais transições
0
são permitidas ou não. Para tanto, considera-se a ação da perturbação H sobre a autofunção
(n) 0 (n)
do estado inicial ψν . Como H ψν continua sendo uma função pertencente ao espaço de Hilbert
H completo, o teorema 5.8 mostrou que a mesma pode ser decomposta em termos do conjunto
completo de autofunções de H0 por
H0 ψν(n) =
XX
ψµ(m) c (n, ν; m, µ) ,
m µ
sendo {c (n, ν; m, µ)} ∈ C constantes a ser determinadas. Como as autofunções H0 são ortonor-
mais, estas constantes são formalmente dadas por
D E
0 0
c (n, ν; m, µ) = ψµ(m) , H ψν(n) = Hmµ,nν .
Ou seja,
H0 ψν(n) =
XX
0
ψµ(m) Hkκ,mµ .
m µ
27 Ou (n)
ψpν (r) e Epn , caso existam degenerescências acidentais.

0 (n) (k)
O que mostra que a componente de H ψν ao longo da função de base ψκ é justamente deter-
0
minada pela matriz de transição Hkκ,nν
Na linguagem da teoria de grupos, o resultado acima mostra que a transição nν → mµ so-
0 (n)
mente é permitida se o vetor H ψν possuir uma componente ao longo do estado final. Isto
demonstra o teorema a seguir.
0 (n)
Teorema (Elemento da matriz de transição). Se a função H ψν não contiver uma compo-
nente que se transforma de acordo com a µ-ésima coluna da representação irredutível Γ(m) (P0 ), o
elemento de matriz D E
0 0
Hmµ,nν = ψµ(m) , H ψν(n)
deve ser nulo.

É necessário ressaltar aqui que ainda assim pode ocorrer que transições em princípio per-
0
mitidas pelo teorema acima resultem com Hmµ,nν = 0, mas neste caso isto ocorre devido a
circunstâncias particulares.
Para determinar se uma transição é permitida ou proibida de acordo com este teorema, o
seguinte procedimento genérico é adotado. Lembrando que, por hipótese, P 0 ⊂ P0 , a função
0 (n)
ψ 0 = H ψν pode ser usada para gerar uma representação D̂H0 ψ(n) do grupo de simetria P0 .
ν
Contudo, essa representação em geral será redutível, uma vez que ψ 0 não é autofunção de H0 ,
0
exceto nos (raros) casos em que H , H0 = 0.
0
A perturbação H , de forma isolada, é suposta ser uma função das coordenadas ou um fun-
cional das coordenadas. Neste caso, pode-se usar o mesmo para gerar uma representação D̂0
de P0 , também redutível em princípio. Além disso, a autofunção sobre a qual a perturbação
atua pertence à representação irredutível Γ(n) (P0 ). Então, para se construir de forma gené-
0 (n)
rica a representação à qual H ψν pertence, sem possuir-se maiores detalhes acerca da forma
de atuação da perturbação, pode-se empregar a técnica de construção de produtos diretos de
representações, discutida na seção 5.8.
0 (n) 0 (n)
A função ψ 0 = H ψν , considerada como o “produto” da “função” H com a função ψν , per-
tence à representação
D̂H0 ψ(n) = D̂0 ⊗ Γ(n) (P0 ) .
ν
Esta representação de produto direto, por sua vez, pode ser decomposta nas irreps de P0 , de
acordo com (5.35a), X
D̂H0 ψ(n) = D̂0 ⊗ Γ(n) (P0 ) = an Γ(n) (P0 ) .
ν
n
Portanto, fica claro que se o produto direto D̂0 ⊗ Γ(n) (P0 ) não contiver nenhum componente na
0
representação Γ(m) (i. e., am = 0), então o elemento de matriz Hmµ,nν deve ser nulo.
Deve ser observado que esta é uma condição fraca; ou seja, para determinar se uma transição
é proibida, basta verificar se am = 0. Contudo, o resultado am 6= 0 não é suficiente para determi-
0 (n)
nar se a transição é permitida; para tanto, é necessário verificar se H ψν contém alguma parte
(m)
que se transforma de acordo com a µ-ésima coluna de Γ .
Um outro procedimento semelhante ao acima e que irá fornecer a mesma conclusão é devido
à seguinte propriedade da decomposição de produtos diretos de representações:
Propriedade 5.2. Dadas Γ(α) e Γ(β) duas representações irredutíveis não equivalentes de um
mesmo grupo G:
(i) O produto direto Γ(α)∗ ⊗ Γ(β) não contém a representação identidade.
(ii) Os produtos diretos Γ(α)∗ ⊗ Γ(α) ou Γ(β)∗ ⊗ Γ(β) contêm a representação identidade somente
uma vez.
Com base nesta propriedade, o procedimento alternativo consiste em realizar o produto direto
de Γ(m) por D̂H0 ψ(n) e realizar a decomposição
ν
X
Γ(m)∗ (P0 ) ⊗ D̂0 ⊗ Γ(n) (P0 ) = bn Γ(n) (P0 ) .
n
Se b1 = 0, i. e. o produto direto não contém a representação identidade, então Γ(m) e D̂H0 ψ(n) são
ν
não equivalentes e o elemento de matriz é nulo.

Em resumo, a teoria de representações de grupos determina, com base nas simetrias do

sistema físico, se uma determinada transição é proibida. Se a transição for permitida, cálculos
adicionais se fazem necessários para determinar a probabilidade da transição.
Exemplo (Transições eletrônicas induzidas por ondas eletromagnéticas). O Hamiltoniano
clássico de um elétron confinado por um potencial V (r), sobre o qual se incide um campo de
radiação eletromagnética é
1 2
H= [p + eA (r, t)] + V (r) − eΦ (r, t) ,
2me
sendo p o momento conjugado, e a carga elementar e Φ (r, t) e A (r, t) os potenciais escalar e
vetor do campo eletromagnético, respectivamente. Para a obtenção do correspondente operador
H, a seguinte generalização do comutador (5.42) é empregada,
∂f
[f (r) , pj ] = i~ , (j = 1, 2, 3) .
∂xj
Com isso, obtém-se
p2 e ie~ e2 A2
H= + A·p− ∇·A+ + V (r) − eΦ.
2me me 2me 2me
Adotando-se o calibre de Coulomb, resulta que ∇ · A = Φ = 0. Assumindo-se também que a
perturbação introduzida pela radiação é de pequena amplitude (i. e., e |A · p| me |V |), resulta
que o operador Hamiltoniano pode ser escrito como
H ' H0 + H0 , sendo
p2 0 e
H0 = + V (r) , H = A · p.
2me me
Com isto, resulta que o elemento da matriz de transição é dado por
3
0 e X D (m) E
Hmµ,nν = ψµ , Aj pj ψν(n) .
me j=1
Exemplo (Transições do tipo dipolo elétrico). O elemento de matriz obtido na seção anterior
pode ser aproximado para certas situações. Uma vez que a perturbação incidente é uma onda
eletromagnética, o potencial vetor pode ser escrito como
Aj (r, t) = A0j eik·r−ωt ,
onde k e ω são respectivamente o vetor de onda e a sua frequência (angular). Pode ser mostrado
neste caso que a probabilidade de transição do autoestado En ao autoestado Em sob a ação da
onda será dada por
3 D E2
2πe X (m)
w= ρ (m) ψµ , A0j eik·r pj ψν(n) δ (Em − En − ~ω) .

~me j=1
Em muitos casos de interesse, o comprimento da onda (dado por λ = 2π/k) é muito maior
que a dimensão típica da função de onda. Nesta situação, pode-se realizar a aproximação
k · r 1 ; exp (ik · r) ≈ 1. Neste caso,
3 2
2πe X
2 mn mn
D E
w≈ ρ (m) |A0j | (pj )µν δ (Em − En − ~ω) , onde (pj )µν = ψµ(m) , pj ψν(n) .
~me j=1
Mas, uma relação básica para a dinâmica de um elemento de matriz Fk` = hψk , F ψ` i é
dFk` ∂Fk`
= + i~ [H, F ]k` .
dt ∂t
Como o operador pj não depende explicitamente do tempo, resulta então que
mn i mn i D E
(pj )µν = me (Em − En ) (xj )µν = me (Em − En ) ψµ(m) , xj ψν(n) .
~ ~
Ou seja,
3 E2
2πme 2
X D
2
w≈ ρ (m) (E − E ) |A0j | ψµ(m) , exj ψν(n) δ (Em − En − ~ω) .

3 m n
~ j=1
O aparecimento da componente do momento de dipolo elétrico pe = er (pej = exj ) mostra que a

perturbação introduzida pela onda deforma a nuvem eletrônica do sistema de maneira a induzir
a formação de um dipolo elétrico. Por esta razão, as transições permitidas pelo elemento de
matriz acima são denominadas transições do tipo dipolo elétrico.
O exemplo a seguir apresenta uma aplicação particular da metodologia delineada nesta seção
para determinar as regras de seleção para transições.
Exemplo (Regras de seleções para transições do tipo dipolar em uma molécula trian-
gular). Considere um sistema formado por três átomos idênticos ligados quimicamente de tal
forma que no estado estacionário os mesmos se encontrem nos vértices de um triângulo equi-
látero. Este sistema possui a evidente isometria do grupo pontual C3v , obtido no exercício 3.11.
Por sua vez, as suas representações irredutíveis foram obtidas no exercício 5.1 (pelo isomorfismo
S3 ↔ C3v ) e a tabela de caracteres deste grupo foi obtida no exemplo 5.3. A tabela 5.5 é repetida
aqui, explicitamente em termos das classes do C3v .
Tabela 5.5: Tabela de caracteres do grupo C3v .

Classes CE Cσv16 CC3 2
Caracteres {E} {σv16 , σv24 , σv35 } C3 , C3
χ(1) +1 +1 +1
χ(2) +1 −1 +1
χ(3) +2 0 −1
Uma perturbação (de pequena amplitude) que incide sobre esta molécula irá excitar osci-
lações harmônicas na mesma, de tal forma que a simetria triangular é quebrada. Em outras
palavras, a perturbação irá provocar transições entre estados vibracionais da molécula. Se as
oscilações induzidas pela perturbação são do tipo dipolo elétrico, então a probabilidade de tran-

(m) (n)
sição depende do elemento de matriz ψµ , xj ψν (j = 1, 2, 3). Neste caso, para determinar-se
as regras de seleções de dipolo elétrico para este sistema, é necessário primeiro determinar as
propriedades de transformação do operador posição r = (x, y, z). Para tanto, será aplicado o
procedimento delineado nesta seção.
Assumindo que a molécula se situa no plano x − y, o eixo z está orientado ao longo do eixo
de rotação do triângulo. Supondo que as oscilações ocorrem somente no plano da molécula, a
coordenada z permanece invariante frente a todas as operações de transformação do C3v . Por
outro lado, as coordenadas (x, y) podem servir como funções de base para gerar a representação
irredutível de dimensão 2, i. e., Γ(3) (C3v ). Portanto, o operador r transforma-se, neste sistema
de coordenadas, de acordo com
D̂0 (r) = Γ(1) ⊕ Γ(3) ,
onde a representação identidade Γ(1) ocorre devido à invariância do sistema na direção z.
Como é necessário realizar-se produtos diretos de representações irredutíveis do grupo P0 ,
isomórfico a C3v , é útil verificar quais são as possíveis decomposições em irreps que podem ser
obtidas. Usando resultados obtidos nas seções 5.6.5 e 5.8, obtém-se a tabela abaixo, a qual
apresenta os caracteres dos produtos diretos das irreps e suas decomposições.
L
⊗ CE Cσv16 CC3 Γ ⊗ Γ = aΓ
Γ(1) ⊗ Γ(1) 1 1 1 Γ(1)
Γ(1) ⊗ Γ(2) 1 -1 1 Γ(2)
(1) (3)
Γ ⊗Γ 2 0 -1 Γ(3)
(2) (2)
Γ ⊗Γ 1 1 1 Γ(1)
(2) (3)
Γ ⊗Γ 2 0 -1 Γ(3)
(3) (3)
Γ ⊗Γ 4 0 1 Γ(1) ⊕ Γ(2) ⊕ Γ(3)
Observa-se como as possibilidades mencionadas na propriedade 5.2 são de fato satisfeitas.

Com base nesta tabela, pode-se começar a construir as diferentes possibilidades da represen-
tação D̂H0 ψ(n) = D̂0 (r)⊗Γ(n) . Essas possibilidades são apresentadas na tabela abaixo, juntamente
ν

com as decomposições dos resultados, os quais foram obtidos empregando-se as propriedades

5.1:
D̂0 (r) Γ(n)

Γ(1) ⊕ Γ(3) ⊗ Γ(1) = Γ(1) ⊗ Γ(1) ⊕ Γ(3) ⊗ Γ(1) = Γ(1) ⊕ Γ(3)
Γ(1) ⊕ Γ(3) ⊗ Γ(2) = Γ(1) ⊗ Γ(2) ⊕ Γ(3) ⊗ Γ(2) = Γ(2) ⊕ Γ(3)
Γ(1) ⊕ Γ(3) ⊗ Γ(3) = Γ(1) ⊗ Γ(3) ⊕ Γ(3) ⊗ Γ(3) = Γ(3) ⊕ Γ(1) ⊕ Γ(2) ⊕ Γ(3)
Finalmente, verifica-se agora se a decomposição de Γ(m)∗ ⊗ D̂0 (r)⊗Γ(n) contém a representação

identidade. Em caso contrário, a transição é proibida. Isto será realizado considerando-se todas
as possibilidades em que m 6= n. A tabela abaixo resume os resultados:
Γ(m) D̂0 (r) Γ(n) Transição

Γ(2) ⊗ Γ ⊕ Γ(3)
(1)
⊗ Γ(1) (2)
=Γ ⊕Γ (3)
1 −→ 2 Proibida
Γ(1) ⊗ Γ(1) ⊕ Γ(3) ⊗ Γ(2) = Γ(2) ⊕ Γ(3) 2 −→ 1 Proibida
Γ(3) ⊗ Γ(1) ⊕ Γ(3) ⊗ Γ(2) = Γ(3) ⊕ Γ(1) ⊕ Γ(2) ⊕ Γ(3) 2 −→ 3 Permitida
Nota-se que somente verificou-se a condição fraca, isto é, somente verificou-se quais transi-
ções são proibidas. Para confirmar se as transições listadas como permitidas acima realmente
podem ocorrer, é necessário ainda verificar se D̂0 (r) ⊗ Γ(n) possui algum componente que se
transforma conforme a µ-ésima coluna de Γ(m) .
R EFERÊNCIAS
BASSALO, José Maria F.; CATTANI, Mauro Sérgio D. Teoria de Grupos. Segunda edição. São
Paulo: Livraria da Física, 2008. 286 + ix pp. ISBN: 9788578610005.
FAZZIO, A.; WATARI, K. Introdução à Teoria de Grupos: com Aplicações em Moléculas e Sólidos.
Santa Maria: UFSM, 1998. 239 pp. ISBN: 85-7391-010-0.
GOLDSTEIN, H.; POOLE, C.; SAFKO, J. Classical Mechanics. Third Ed. New York: Addison Wes-
ley, 2001. 638 + xi pp. ISBN: 978-0201657029.
HAMERMESH, Morton. Group Theory and Its Application to Physical Problems. New York: Dover
Publications, 2012. (Dover Books on Physics). ISBN: 9780486140391. Disponível em: <http:
//books.google.com.br/books?id=w6PDAgAAQBAJ>.
JACKSON, J. D. Classical Electrodynamics. Third. New York: John Wiley & Sons, 1999. 808 +
xxi pp. ISBN: 0-471-30932-X.
JOSHI, A. W. Elements of Group Theory for Physicists. Third Ed. New Delhi: John Wiley & Sons,
1982. 348 + xv pp. ISBN: 0-470-27306-2.
MESSIAH, Albert. Quantum Mechanics: Two Volumes Bound as One. Mineola: Dover, 1999. 1136
+ xxii pp. ISBN: 0-486-40924-4.
SAKURAI, J. J.; NAPOLITANO, J. Modern Quantum Mechanics. San Francisco: Addison-Wesley,
2011. 550 + xviii pp. ISBN: 9780805382914. Disponível em: <https://books.google.com.
br/books?id=N4I-AQAACAAJ>.
SCHIFF, Leonard I. Quantum mechanics. Second. New York: McGraw-Hill, 1955. (International
series in pure and applied physics). Disponível em: <https://books.google.com.br/books?
id=XujUaYBU5oEC>.

216 REFERÊNCIAS
TINKHAM, M. Group Theory and Quantum Mechanics. [S.l.]: Dover Publications, 2012. (Dover
Books on Chemistry). 340 + xii pp. ISBN: 9780486131665. Disponível em: <https://books.
google.com.br/books?id=oe7DAgAAQBAJ>.
YOSIDA, Kôsaku. Functional Analysis. Sixth. Berlin: Springer-Verlag, 1980. (Grundlehren der
mathematischen Wissenschaften). ISBN: 9783662117910. Disponível em: <https : / / books .
google.com.br/books?id=xWrvCAAAQBAJ>.

6
Á LGEBRA E A NÁLISE T ENSORIAIS
O LONGO do processo histórico de desenvolvimento das ciências da natureza, observou-se
A com frequência a necessidade da definição e do uso de estruturas matemáticas com graus

crescentes de generalidade e abstração. Um exemplo disso é a evolução da mecânica
newtoniana.
Conforme é a prática usual em cursos contemporâneos de física básica, a mecânica é ini-
cialmente apresentada e aplicada a sistemas físicos compostos por um número pequeno de
partículas que interagem entre si através de forças conservativas, tais como as interações gravi-
tacional e eletrostática. Para tais sistemas simples, o arcabouço matemático usualmente neces-
sário limita-se ao cálculo infinitesimal e aos conceitos básicos de espaços vetoriais, nos quais as
definições abstratas de vetores, produto interno e operadores lineares são apresentadas. Na me-
canica newtoniana, estas entidades matemáticas abstratas (os vetores) são então identificadas
com grandezas físicas mensuraveis tais como posição, velocidade, aceleração e força.
Contudo, quando o formalismo da mecânica foi aplicado ao estudo de sistemas com um grau
de complexidade física maior, tais como sistemas com vínculos, meios contínuos e transfor-
mações de referenciais, e também com a descoberta e pesquisa de outros tipos de interações
e objetos que levaram à criação de novas teorias físicas, tais como o eletromagnetismo, a me-
cânica quântica e a teoria da relatividade, constatou-se a necessidade do uso de estruturas
matemáticas mais abrangentes do que aquelas oferecidas pelas definições de um espaço veto-
rial, conforme usualmente apresentadas em disciplinas básicas de álgebra linear. Uma classe
destas novas estruturas (ou objetos) matemáticos são os tensores.
De uma forma simplista, pode-se caracterizar um tensor como um conjunto de objetos ma-
temáticos (em geral) ou físicos (em particular) que estão relacionados entre si e que determinam
algum tipo de relação entre duas outras entidades matemáticas (ou físicas). Estes diferentes
objetos podem ser identificados de forma prática com o uso de um número finito de índices e
possuem leis de transformação bem definidas quando sua representação é alterada de um dado
sistema de coordenadas ou referencial para outros.
Neste capítulo, será realizada uma introdução à definição, à álgebra e à análise de tensores.
6.1 I NTRODUÇÃO E DEFINIÇÕES

Partindo-se das definições de espaços vetoriais e operadores lineares,1 neste capítulo será
realizada uma investigação mais aprofundada das propriedades de tensores, operadores e outros
objetos relacionados, os quais existem em espaços vetoriais específicos.
O termo tensor foi utilizado pela primeira vez em 1846 por William Rowan Hamilton (1805 –
1865), matemático bastante conhecido também por suas contribuições para a mecânica newto-
niana. Porém, este termo foi utilizado em um contexto distinto daquele empregado atualmente.
Historicamente, as primeiras concepções do que viria a posteriori ser denominado de análise
tensorial foram introduzidas por Carl Friedrich Gauss (1777 – 1855), em seu pioneiro trabalho
a respeito de geometria diferencial. Estes conceitos foram então desenvolvidos ao longo do sé-
culo XIX, sendo que o termo tensor, neste contexto, foi introduzido em 1898 por Woldemar Voigt
(1850 – 1919).
O cálculo tensorial foi desenvolvido em definitivo a partir de 1890 com os trabalhos de Wol-
demar Voigt, Elwin Bruno Christoffel (1829 – 1900), Gregorio Ricci-Curbastro (1853 – 1925) e
Tullio Levi-Civita (1873 – 1941), com a designação inicial cálculo diferencial absoluto. Já no
1 Discutidos na seção 4.4.
217
218 6.1. Introdução e definições
século XX, esta área da álgebra e análise matemáticas passou a ser denominada em definitivo
como análise tensorial, tendo a sua popularização muito a dever com a proposta, em 1915, da
teoria da relatividade geral formulada por Albert Einstein (1879 – 1955). Durante a formulação
da teoria da relatividade geral, inteiramente baseada no conceito de tensores, Einstein contou
com a colaboração intensa tanto de Levi-Civita quanto do matemático Marcel Grossmann (1878
– 1936).
O desenvolvimento da análise tensorial também está ligada ao estudo da mecânica de meios
contínuos, sendo o tensor de stress, o qual determina as tensões internas que surgem no meio
quando este é submetido a esforços aplicados em diferentes direções do espaço, uma das quan-
tidades físicas que surgiram desde os primeiros estudos nesta área da física e engenharia.
De uma forma genérica, tensores são objetos geométricos que descrevem relações lineares
entre escalares, vetores e outros tensores. Na formulação da álgebra e análise tensoriais, as
quantidades físicas identificadas usualmente como escalares e vetores são elas próprias casos
particulares de tensores. Porém, esta formulação realiza a extensão lógica destes conceitos,
permitindo o tratamento de estruturas matemáticas mais abstratas e complexas. Esta extensão
possibilitou o desenvolvimento posterior das áreas da física mencionadas acima (entre outras).
Como já mencionado, tensores são importantes em muitas áreas da física, as quais estudam
diferentes tipos de sistemas, tais como sólidos, gases ionizados, teoria eletromagnética, relativi-
dade restrita e geral e mecânica quântica. Um meio contínuo inomogêneo e/ou anisotrópico é
um exemplo típico de sistema físico onde o conceito e a necessidade do uso de tensores ocorrem
de forma natural.
Um exemplo inicial pode ser mencionado a partir do problema do fluxo de corrente elétrica
em um meio anisotrópico. A Lei de Ohm é apresentada em textos de física básica como
J = σE, (6.1)
sendo as quantidades vetoriais J e E respectivamente a densidade de corrente elétrica e o campo

elétrico. Em um meio homogêneo e isotrópico, a relação entre estes campos é determinada pela
quantidade escalar σ, denominada a condutividade do meio.
Se o meio for anisotrópico, por outro lado, a relação empírica (6.1) não é válida em geral,
pois o agente que gera a anisotropia do meio determina a existência de pelo menos uma direção
preferencial no espaço. Então, verifica-se empiricamente que, como consequência, a densidade
de corrente resulta distinta caso o campo E esteja orientado na direção da anisotropia ou contido
sobre o plano perpendicular a esta direção. Neste caso, a expressão correta para o i-ésimo
componente do vetor J é
3
X
Ji = σij Ej , (i = 1, 2, 3) , (6.2a)
j=1
sendo que o conjunto de 9 valores {σ11 , σ12 , . . . , σ32 , σ33 } pode ser expresso na forma matricial.
Assim, a forma generalizada (6.2a) para a Lei de Ohm pode ser expressa também como uma
multiplicação matricial,     
J1 σ11 σ12 σ13 E1
J2  = σ21 σ22 σ23  E2  . (6.2b)
J3 σ31 σ32 σ33 E3
Os 9 elementos da matriz de condutividade {σij } (i, j = 1, . . . , 3) estão relacionados entre si tanto
do ponto de vista do seu significado físico, sendo os valores da condutividade do meio em função
da orientação relativa entre os campos E e J , quanto do ponto de vista matemático, uma vez
que a matriz de condutividade obedece as regras da álgebra de matrizes.
Porém, verifica-se, também de forma empírica, que os elementos da matriz {σij } obedecem a
um conjunto de regras mais amplo que a simples álgebra matricial. Estas regras determinam,
por exemplo, como as quantidades físicas em (6.2) devem se alterar quando é realizada uma
mudança no sistema de referências do laboratório, ou quando se muda o sistema de coorde-
nadas em um dado referencial. Observa-se então que os elementos do conjunto {σij } devem se
transformar de forma a satisfazer a definição de um tensor, sendo que estas regras de trans-
formação também são verificadas empiricamente. Portanto, a denominação mais correta para o
conjunto {σij } é tensor de condutividade do meio anisotrópico, o qual pode ser expresso na forma
matricial. Usualmente, empregando-se as propriedades microscópicas do meio ou fazendo uso
de propriedades de simetria, é possível se mostrar que diferentes componentes do tensor de
condutividade estão relacionadas entre si.

C APÍTULO 6. Álgebra e Análise Tensoriais 219
Generalizando e expandindo o argumento acima, espera-se que a descrição quantitativa dos

processos físicos, ou seja, as leis físicas que descrevem a evolução espaço-temporal das quanti-
dades físicas mensuráveis, não dependam do sistema de coordenadas empregado em um dado
referencial, nem da transformação de um referencial (inercial) a outro. A aplicação deste prin-
cípio às leis físicas, dentre as quais a Lei de Ohm (6.1) ou (6.2) é apenas um exemplo, irá
determinar a natureza e a classificação das quantidades matemáticas envolvidas na descrição
dessas leis.
Antes, porém, de se entrar em maiores detalhes neste ponto, serão introduzidos tanto a
notação básica a ser empregada ao longo deste capítulo, quanto dois símbolos tensoriais empre-
gados amiúde em todos os textos de física-matemática: os símbolos da delta de Kronecker e de
Levi-Civita.
6.1.1 C ONVENÇÃO DE SOMA DE ÍNDICES E SÍMBOLOS AUXILIARES

Para evitar o acúmulo de símbolos de soma nas expressões apresentadas, será utilizada a
convenção de somas implícitas, usualmente atribuída a Einstein.
Qualquer índice minúsculo que apareça exatamente duas vezes em quaisquer termos de uma
expressão algébrica é assumido implicitamente como sendo somado sobre todos os valores pos-
síveis que aquele índice possa assumir. Por outro lado, o caso particular em que esta convenção
não deve ser empregada deve ser considerado como uma exceção, sendo feita então uma obser-
vação explícita deste caso. Usualmente, inclui-se o termo “NS” (não somado) nas proximidades
da expressão.
Alguns exemplos desta convenção, válidos para expressões no espaço vetorial vetorial R 3 de-
finido no exemplo 4.3, e empregando um sistema de coordenadas Cartesiano, são os seguintes:
• Produto escalar dos vetores a e b:
3
X
ai bi ≡ ai bi = a1 b1 + a2 b2 + a3 b3 .
i=1
• Produto matricial entre as matrizes A e B:

3
X
(AB)ik = Aij Bjk ≡ Aij Bjk = Ai1 B1k + Ai2 B2k + Ai3 B3k , (i, k = 1, 2, 3) .
j=1
• Produto misto entre matrizes e vetores:

3 X
X 3
aij bjk ck ≡ aij bjk ck = ai1 b11 c1 + ai1 b12 c2 + ai1 b13 c3 + ai2 b21 c1 + · · · + ai3 b32 c2 + ai3 b33 c3 .
j=1 k=1
• Divergente do campo vetorial v (r):

3
∂vi X ∂vi
≡ = ∇ · v.
∂xi i=1
∂xi
• Laplaciano do campo escalar φ (r):

3
∂2φ X ∂2φ
2
≡ 2 = ∇ φ.
∂xi ∂xi i=1
∂xi
Algumas observações adicionais a respeito desta convenção devem ser realizadas.

• Índices repetidos são denominados índices mudos, enquanto que os demais são chama-
dos índices livres. Uma característica de índices (ou de variáveis) mudos está no fato de
que o resultado final não mais depende dos mesmos; portanto, o resultado independe do
caractere alfabético realmente empregado para representar o índice mudo. Ou seja,
ai bi = aj bj ou aij bjk ck = aik bkj cj ,
onde no último exemplo acima realizou-se a troca j ↔ k, o que não afeta o resultado final
da operação algébrica.

220 6.2. Propriedades de transformação de escalares, vetores e tensores
• Quando há índices mudos e livres em uma expressão, não é permitida a permuta de ca-
racteres entre os mesmos. Ou seja, em geral
aij bjk ck 6= aji bik ck .
• Ao se introduzir novos índices mudos em uma expressão, deve-se tomar cuidado para não
repetir índices já presentes, quer sejam estes mudos ou livres. Ou seja, a troca
aij bjk ck −→ aij bjj cj
não é permitida, pois gera uma ambiguidade na maneira como as somas implícitas devem
ser realizadas.
6.1.2 S ÍMBOLOS AUXILIARES : K RONECKER E L EVI -C IVITA

Dois símbolos tensoriais muito úteis para as expressões empregadas neste capítulo serão
introduzidos agora.
Delta de Kronecker. Trata-se da quantidade δij , definida por
(
1, se i = j
δij =
0, se i 6= j.
Símbolo (ou tensor) de Levi-Civita. Trata-se da quantidade ijk , com três índices, a qual esta-
belece uma relação totalmente anti-simétrica entre os índices. A sua definição é

+1, se {i, j, k} é uma permutação par de {1, 2, 3}

ijk = −1, se {i, j, k} é uma permutação ímpar de {1, 2, 3}

0, se dois ou mais índices são repetidos

1
= [(j − i) (k − i) (k − j)] .
2
Alguns exemplos: 123 = 231 = 312 = +1, 213 = 132 = 321 = −1 e 113 = 122 = 111 = 0.
Algumas propriedades matemáticas importantes que fazem uso dos símbolos acima são as
seguintes:
ai = δij aj (6.3a)
aij δjk = aij δkj = aik (6.3b)
aij bji = aij bjk δk` (6.3c)
δij δik = δjk (6.3d)
δii = 3 (6.3e)

δi` δim δin

ijk `mn = det δj` δjm δjn (6.3f)
δk` δkm δkn
ijk `mk = kij k`m = δi` δjm − δim δj` (6.3g)
ijk `jk = 2δi` (6.3h)
ijk ijk = 6 (6.3i)
ijk δij = 0. (6.3j)
6.2 P ROPRIEDADES DE TRANSFORMAÇÃO DE ESCALA -

RES , VETORES E TENSORES
Retorna-se agora à discussão envolvendo a invariância das leis físicas frente a diferentes
transformações realizadas no sistema de referências e a sua relação com as leis de transforma-
ção dos tensores empregados na descrição dessas leis físicas. Relações semelhantes às formas

da Lei de Ohm (6.1) ou (6.2) podem ser generalizadas considerando-se a relação entre dois cam-
pos vetoriais quaisquer A = A (r) e B = B (r), dada por
Ai = αij Bj ,
sendo αij = αij (r) a matriz que descreve a relação constitutiva entre os campos.
Nesta seção será iniciada a discussão de tensores Cartesianos e suas transformações. Se-
rão considerados objetos matemáticos denominados escalares, vetores e tensores em geral, aos
quais serão atribuídas as noções intuitivas de campos escalares, vetoriais ou tensoriais, res-
pectivamente. Uma definição mais rigorosa destes campos será apresentada posteriormente.
Para o presente momento, será assumido que todos os campos envolvidos (escalares, vetoriais e
tensoriais) existem em um espaço vetorial particular, o espaço vetorial Euclideano de dimensão
três, denotado por E 3 . O espaço E 3 é, na verdade, um espaço afim que é também um espaço
vetorial métrico no qual a norma induz a métrica. A definição do E 3 foi realizada no exemplo 4.5.
Um espaço Euclideano é aquele no qual as noções geométricas intuitivas de espaço, dimensão
e deslocamento em um sistema de coordenadas Cartesiano ou retangular 2 são respeitadas, em
conjunto com as noções algébricas de vetores posição que ligam o origem do sistema com um
dado ponto do espaço e de vetores deslocamento que são setas orientadas que ligam dois pontos
quaisquer no referencial. Por ser um espaço afim, o E 3 identifica tanto “pontos” do espaço, os
quais podem ser ocupados por partículas, por exemplo, como “linhas orientadas”, que são os
vetores posição e deslocamento. Por ser também um espaço métrico, o comprimento de qualquer
segmento de reta pode ser obtido pela fórmula de Pitágoras, concordando assim com medidas
experimentas das posições e deslocamentos das partículas. As definições realizadas no exemplo
4.5 para um espaço de dimensão 3 pode ser automaticamente generalizada para o E n , o qual é
o espaço Euclideano de dimensão (finita) n.
Sobre o substrato algébrico/geométrico fornecido pelo espaço E 3 , atribui-se agora a cada
ponto do mesmo um campo escalar φ = φ (r) ≡ φ (x1 , x2 , x3 ) ou um campo vetorial A = A (r) ≡
A (x1 , x2 , x3 ). Portanto, os campos escalares e os componentes dos campos vetoriais que perten-
cem a este espaço são funções do vetor posição
r = xi êi ≡ x1 ê1 + x2 ê2 + x3 ê3 , (6.4)
ou seja,
A = A (r) ≡ A (x1, x2 , x3 ) = Ai (r) êi .
Em (6.4), o conjunto de vetores ortonormais { ê1 , ê2 , ê3 } forma uma base do espaço E 3 . Neste
caso,
em se tratando de um sistema Cartesiano, emprega-se a base canônica { ê1 , ê2 , ê3 } =
ı̂, ̂, k̂ , onde ı̂ = (1, 0, 0), ̂ = (0, 1, 0) e k̂ = (0, 0, 1). Como é usual, assume-se que o sistema de
coordenadas Cartesiano é dextrógiro, isto é, a base canônica obedece a relação3
êi × êj = ijk êk . (6.5)
Algumas propriedades básicas de escalares e vetores que pertencem ao espaço Euclideano
frente a transformações no sistema de coordenadas serão brevemente discutidas agora. Em
seguida, esta discussão será generalizada para tensores Cartesianos em geral.
A hipótese de que as quantidades físicas apresentem propriedades matemáticas bem defini-
das frente a certos tipos de transformação de coordenadas impõe limitações e exigências impor-
tantes às leis físicas. É necessário, portanto, discutir-se em algum detalhe as propriedades de
transformação de algumas quantidades físicas escalares ou vetoriais.
Alguns dos tipos mais importantes de transformações de coordenadas para a física são rota-
ções, reflexão espacial ou transformação de paridade e reversão temporal. Já para a relatividade
restrita, também são fundamentais as mudanças entre diferentes referenciais inerciais, dadas
por uma translação entre os dois referenciais. Embora a rotação seja o tipo de transformação
para o qual será dado a maior atenção neste capítulo, é importante realizar-se também uma
breve discussão a respeito das outras transformações.
6.2.1 R OTAÇÕES
Uma rotação no E 3 é uma transformação linear das coordenadas, realizada em torno de
um ponto fixo e de tal forma que a norma do espaço permaneça invariante. Este ponto fixo
2 Ver figuras 4.1.
3 Esta relação segue a definição de produto vetorial entre vetores do R 3 dada em (4.3).

(a) (b)
R
R x3
R´
R´ r
x’3
r x’2
x2
x1
x’1
Figura 6.1: (a) Rotação sobre o plano (x1 , x2 ) (em torno do eixo x3 ) por um ângulo θ. (b) Rotação arbitrária
de eixos em torno da origem do sistema de coordenadas. Pode-se observar que em ambos os casos as rotações
mantêm a norma do vetor r invariante.
usualmente é a origem do sistema de coordenadas e pode ocorrer sobre um determinado plano

(subespaço) de E 3 ou sobre todo o espaço. A figura 6.1 ilustra rotações de eixos sobre o plano
ou no espaço.
O caso particular ilustrado na figura 6.1a, onde é realizada uma rotação do sistema de coor-
denadas sobre o plano em torno do eixo x3 por um ângulo θ, será considerado como referência
na discussão a seguir. As conclusões obtidas serão então generalizadas para uma rotação ar-
bitrária dos eixos no E 3 , representada na figura 6.1b. A discussão feita nesta ponto pode ser
então facilmente generalizada para rotações em um espaço vetorial de n dimensões.
O vetor posição r é representado no sistema de coordenadas Cartesiano original por r = xi êi ,
onde {x1 , x2 , x3 } são as componentes (ou projeções) de r que constituem a sua representação
no sistema de coordenadas R. Realizando-se então uma rotação de eixos arbitrária, ilustrada na
figura 6.1b, o vetor posição passa a ser, em princípio, representado por
r 0 = x0i ê0i ,
onde {x0i } são suas componentes no sistema de coordenadas R0 e ê0i são os vetores de base no

sistema rotado.
Atribuindo-se agora uma realidade física ao vetor posição r, assume-se que o espaço é isotró-
pico; isto é, não há direção preferencial ou, em outras palavras, todas as direções são equivalen-
tes. Então, o sistema físico em estudo, para o qual uma lei física está sendo aplicada fazendo-se
uso de quantidades vetoriais, não pode depender da orientação do sistema de coordenadas.
Como consequência desta exigência, necessariamente
r 0 = r =⇒ xi êi = x0i ê0i . (6.6)
ê01 , ê02 :

Observando-se a figura 6.1a, percebe-se a seguinte relação imediata entre { ê1 , ê2 } e
ê01 = cos θ ê1 + sen θ ê2

ê02 = − sen θ ê1 + cos θ ê2 .
Generalizando-se para o caso de uma rotação arbitrária dos eixos no E 3 , como ilustrado na
figura 6.1b, pode-se escrever, em geral,
ê0i = Sji êj , (6.7a)
onde {Sij } são os elementos da matriz de rotação S. No caso particular da rotação em torno de
x3 , mostrado na figura 6.1a, esta matriz tem ordem 2 e seus elementos são

cos θ − sen θ
S= ,
sen θ cos θ

ou seja, estes elementos dependem somente de um parâmetro (ou ângulo) fixo.

Retornando ao caso geral, a relação (6.7a) pode ser escrita na forma matricial ao se definir as
seguintes matrizes coluna e linha
 
ê1
êT = ê1 ê2 ê3

ê =  ê2  ,
ê3
para os vetores unitários, sendo que o símbolo “T” indica a transposição da matrix. Neste caso,
a transformação (6.7a) pode ser representada pela multiplicação matricial
ê0T = êT S, ou ê0 = ST ê.
Para uma rotação em torno de um eixo, somente um ângulo se faz necessário. Já no caso
geral, é necessário pelo menos um ângulo adicional, mas esta rotação arbitrária sempre pode
ser escrita em termos da matriz quadrada S de ordem 3, cujos elementos são funções de um ou
mais parâmetros (ângulos) fixos. Para se construir essa matrix de rotação S para o caso geral,
retorna-se inicialmente à figura 6.1a e define-se o cosseno diretor
. .
Sji = ê0i · êj = cos θji ,
o qual é a projeção do vetor ê0i sobre o vetor êj . Este cosseno diretor é simplesmente o cosseno
do ângulo θij entre os vetores de base. Ou seja, pode-se escrever
ê01 = cos θ11 ê1 + cos θ21 ê2 = cos θ ê1 + sen θ ê2
ê02 = cos θ12 ê1 + cos θ22 ê2 = − sen θ ê1 + cos θ ê2 ,
onde foi chamado θ11 = θ e, por consequência, θ21 = π2 − θ, θ22 = θ e θ12 = π2 + θ, de onde resultam
as últimas expressões. Fazendo referência agora à figura 6.1b, observa-se que uma rotação geral
do referencial R0 em relação a R pode sempre ser expressa em termos dos 9 cossenos diretores
{θij }. Contudo, será mostrado em seguir que somente 3 desses ângulos são independentes entre
si.
A expressão (6.7a) descreve uma mudança de bases na transformação { êi } → ê0i de um

sistema de coordenadas Cartesiano para outro, rotado em relação ao original. A transforma-

ção inversa ê0i → { êi } consiste na rotação inversa θ → −θ aplicada sobre a base ê0i ; esta

transformação é escrita como

êi = S −1 ji ê0j ,

(6.7b)
onde S−1 é a matriz de rotação inversa.

O objetivo agora consiste em tomar a expressão para a mudança de bases { êi } ↔ ê0i para

se obter uma
0 relação
entre as coordenadas dos sistemas, ou seja, para escrever x0i = x0i ({xj })
ou xi = xi xj . Antes, porém, com o intuito de simplificar a notação, introduz-se a matriz de
transformação L tal que L = S−1 . Introduzindo então as relações (6.7a,b) em (6.6), resulta
( 0
xi = S−1 ij xj = Lij xj
( 0
êi = L−1 ji êj = Lij êj

=⇒ (6.7c)
êi = Lji ê0j xi = Sij x0j = L−1 ij x0j = Lji x0j .

T
Cabe ressaltar agora que, definindo-se a matriz coluna r = x1 x2 x3 , as transformações de
coordenadas acima podem ser representadas pelas multiplicações matriciais
r0 = Lr, r = L−1 r0 .
Levando em conta agora a exigência adicional de invariância da norma do espaço Euclideano

E 3 , isto é, krk = kr0 k, resulta
xi xi = x0i x0i =⇒ xi xi = Lij Lik xj xk .
A identidade somente pode ser obedecida em geral se a seguinte condição de ortogonalidade é

satisfeita:
Lki Lkj = δij ou Lik Ljk = δij . (6.8)

Comparando esta condição com a definição da matriz inversa de L, Lij L−1 ki = δjk , resulta que

L−1 = LT , sendo esta última a transposta da matriz L. A segunda expressão em (6.8) é con-
sequência disto. Portanto, as leis desejadas para a transformação dos sistemas de coordenadas
podem ser escritas como ( 0 (
êi = Lij êj x0i = Lij xj
0 ⇐⇒ (6.9a)
êi = Lji êj xi = Lji x0j .
A condição de ortogonalidade (6.8) também leva à seguinte classificação para a classe de
rotações executadas no sistema de coordenadas. Escrevendo (6.8) na forma matricial, sendo I a
matriz identidade, e calculando-se o determinante, resulta
2
LLT = I =⇒ det LLT = det (L) det LT = [det (L)] = 1.

Classifica-se, então,
det (L) = +1 ; Rotações próprias
(6.9b)
det (L) = −1 ; Rotações impróprias.
Em (6.9b), uma rotação própria é aquela em que a transformação R → R0 pode ser obtida por
uma sequência de rotações infinitesimais. Já uma rotação imprópria corresponde a uma reflexão
dos eixos (transformação de paridade), seguida por uma rotação própria.
A partir das relações de mudança de bases (6.7a,b) e lembrando que a matriz L depende
somente de parâmetros fixos, as seguintes relações também podem ser deduzidas,
ê0i = Lij êj =⇒ Lij = ê0i · êj

(6.9c)
êi = Lji ê0j =⇒ Lji = êi · ê0j
∂x0i
x0i = Lij xj =⇒ Lij =
∂xj
(6.9d)
∂xi
xi = Lji x0j =⇒ Lji = .
∂x0j
Lembrando finalmente dos cossenos diretores, escreve-se Lij = êi · êj = cos θij e então, a
partir da condição de ortogonalidade (6.8), resultam as equações
L21i + L22i + L23i = 1 (i = 1, 2, 3)

L1i L1j + L2i L2j + L3i L3j = 0 (i 6= j, i, j = 1, 2, 3) .
Ou seja, a condição de ortogonalidade implica em 6 equações distintas que relacionam os di-

ferentes valores de ângulo. Por conseguinte, dos 9 cossenos diretores, somente 3 ângulos são
realmente independentes. Uma das definições com frequência empregada para esses ângulos
será discutida na seção 6.5.2.
Exemplo 6.1. Encontre a matriz L que realiza a rotação de eixos representada na figura 6.1a.
Resolução. Usando os elementos da matriz S apresentados acima e sabendo que S = L−1 = LT ,
resulta    
cos θ − sen θ 0 cos θ sen θ 0
S = sen θ cos θ 0 = LT =⇒ L = − sen θ cos θ 0 .
0 0 1 0 0 1
Com base na lei de transformação (6.9a-e), é possível agora realizar-se uma classificação
das quantidades físicas de acordo com o seu comportamento frente a uma rotação arbitrária no
sistema de coordenadas adotado para representá-las.
Escalares (tensores de posto zero). Seja φ (r) uma quantidade física que, em geral, pode de-
pender da posição de observação da mesma em relação à origem do sistema de coordena-
das, mas que não é um vetor, ou seja, esta pode ser caracterizada por um único número. Se
φ (r) for invariante frente a uma rotação arbitrária do sistema de coordenadas, descrita pela
matriz L, então esta quantidade é denominada um escalar ou tensor de posto (ou ordem)
zero.
Exemplos de quantidades físicas escalares são: massa, carga elétrica, potencial elétrico e
energia. Certos produtos escalares de vetores e divergentes de campos vetoriais também
são quantidades escalares.

Vetores (tensores de posto um). Seja A ≡ A (r) = Ai (r) êi uma quantidade física representada
por um conjunto de três quantidades escalares {Ai (r)} no E 3 , quando medidas em relação
ao sistema de coordenadas Cartesiano R. Ao se aplicar uma rotação arbitrária R → R0 ao
sistema de coordenadas, descrita pela matriz L, as componentes desta quantidade física
passam a ser representadas por {A0i (r)}. A quantidade A (r) é, então, um vetor ou um
tensor de posto um se e somente se a relação equivalente a (6.9a), ou seja,
A0i = Lij Aj , (6.10)
também se aplica entre suas componentes nos respectivos sistemas de coordenadas.
Posteriormente serão apresentadas algumas quantidades físicas vetoriais.
Tensores de posto (ou ordem) dois. Antes de se introduzir uma definição formal de tensores,
será feita uma breve menção sobre tensores de posto dois, uma vez que estes aparecem
com frequência em problemas físicos. A relação constitutiva (Lei de Ohm) (6.2) mostra que
em um meio anisotrópico a relação entre os vetores J e E é determinada pela matriz de
condutividade {αij }, a qual possui 9 elementos no E 3 . Esta matriz será a representação de
um tensor de posto dois (tensor de condutividade elétrica) se e somente se, após realizada
a transformação R → R0 , quando seus elementos serão então transformados {αij } → αij
0
,
estes elementos se relacionarem por
0
αij = Lik Lj` αk` .
Além do tensor de condutividade elétrica, outros exemplos de tensores de posto dois são o
tensor de campo eletromagnético e o tensor energia-momento, também denominado tensor
de stress de Maxwell.
Finalmente, pode-se também classificar rotações e outras
transformações como passivas ou ativas.
x2
Transformação passiva. Em uma transformação passiva o sis-
tema físico é mantido inalterado e somente o sistema de co- q1
ordenadas é alterado. As rotações ilustradas na figura 6.1 q2
são exemplos de transformações passivas. r1́
r2́
Transformação ativa. Já em uma transformação ativa, o refe- q2
rencial é mantido fixo e a transformação é aplicada ao sis- r2 q1
tema físico em estudo. A figura 6.2 ilustra uma rotação ativa r1
realizada sobre um sistema composto por duas cargas elé-
tricas interagentes. O
1 x
Na seção seguinte será realizada uma definição formal de ten-
sores, partindo das leis de transformação (6.9a-e) aqui deduzidas.
Figura 6.2: Exemplo de uma
Antes, porém, outros tipos de transformações serão brevemente transformação ativa.
discutidos.
6.2.2 T RANSFORMAÇÕES DE PARIDADE OU REFLEXÕES

Uma transformação de paridade, também denominada reflexão espacial ou inversão de pa-
ridade, é uma transformação em que uma ou mais coordenadas do sistema de referência são
invertidas, ou seja, xi → −xi . Uma reflexão espacial em um plano consiste em inverter o sinal da
coordenada normal ao plano, mantendo as coordenadas sobre o plano inalteradas. Assim, uma
reflexão no plano x1 − x2 consiste em realizar a transformação
(x1 , x2 , x3 ) → (x1 , x2 , −x3 ) .
Já uma inversão espacial ou transformação de paridade é realizada invertendo-se os sinais
de todas as coordenadas do referencial, ou seja,
r → r 0 = −r. (6.11)
A matriz de transformação para (6.11) pode ser escrita simplesmente como Lij = −δij . Ou seja,
det (L) = −1, implicando que uma inversão espacial é sempre imprópria.
Esta transformação permite a definição de uma nova classificação das quantidades físicas
em função de seu comportamente frente a inversões espaciais.

Escalares ou pseudoescalares. Dado o campo φ (r), esta quantidade é um escalar se permane-

cer inalterado frente a uma operação de inversão espacial. Caso contrário, esta quantidade
é um pseudoescalar.
Um exemplo de um pseudoescalar é obtido a partir do produto misto a · (b × c), desde que
a, b e c sejam todos vetores polares, os quais serão definidos a seguir.
Vetores polares ou vetores axiais (pseudovetores). Um vetor polar ou simplesmente vetor é
aquela quantidade A = A (r) que continua se transformando de acordo com a relação
(6.10), mesmo quando realizada uma reflexão espacial, ou seja, se
A → A0 = −A quando r → −r.
Um vetor axial ou pseudovetor é aquela quantidade B = B (r) que frente a uma transfor-
mação de paridade comporta-se como
B → B 0 = B.
Um exemplo de um vetor axial é obtido partindo-se de dois vetores polares a e b e obtendo-

se o vetor c a partir de c = a × b. Neste caso, o vetor c é um pseudovetor.
Tensores ou pseudotensores. As propriedades de transformação de tensores de posto N arbi-
trário podem ser deduzidas facilmente se estes são puderem ser construídos a partir de
produtos de vetores polares e/ou axiais. Se for realizada uma transformação de paridade
N
sobre um tensor de posto N e este se transformar com o fator (−1) , então este é denomi-
nado um tensor verdadeiro ou simplesmente tensor. Contudo, se a inversão espacial levar
N +1
ao fator (−1) , então este é denominado de pseudotensor de posto N .
6.2.3 R EVERSÃO TEMPORAL

Um outro tipo de transformação relevante aos sistemas físicos é a transformação de reversão
temporal t → t0 = −t. Embora esta transformação não se aplica a sistemas descritos pela
mecânica newtoniana, na qual a dependência temporal no comportamento do sistema físico é
considerada de forma distinta da sua dependência espacial, mesmo assim é importante que esta
seja discutida.
As leis básicas da física comportam-se de maneira bem determinada frente a inversão no sen-
tido de evolução do tempo, e esse comportamento permite classificar-se as quantidades físicas
como pares ou ímpares frente a uma reversão temporal.
Transformação par. Uma determinada quantidade física é par frente a uma reversão temporal
se a lei física que a determina não muda de sinal frente à transformação t → t0 = −t.
t→−t
Um exemplo simples de uma quantidade par é o vetor posição, r −−−→ r. Um outro vetor
par é a aceleração de uma partícula, pois
d2 r t→−t d2 r
a= −−−→ 2 = a.
dt2 dt
Transformação ímpar. Uma quantidade física é ímpar frente a uma reversão temporal se a lei
física que a determina muda de sinal frente a esta transformação.
Um exemplo de quantidade ímpar é o momentum de uma partícula, pois
dr t→−t dr
p= −−−→ − = −p.
dt dt
As propriedades de algumas quantidades fundamentais na mecânica clássica e no eletro-

magnetismo frente às transformações discutidas nas seções 6.2.1 – 6.2.3 são apresentadas na
tabela 6.1.
As definições e o comportamento das quantidades físicas frente a transformações passivas
do sistema de coordenadas, discutidos nesta seção, serão desenvolvidos em maiores detalhes
nas seções posteriores. Para esta discussão aprofundada acerca dos tensores Cartesianos, será
considerada de forma preponderante a transformação de rotação (própria) do sistema de refe-
rência.

Tabela 6.1: Propriedades de transformação de algumas quantidades físicas na mecânica clássica e no eletro-
magnetismo.
Rotação (posto Inversão Reversão
Quantidade Física
do tensor) Espacial Temporal
Mecânica Clássica
Posição r 1 Polar Par
Momentum linear p 1 Polar Ímpar
Momentum angular L=r×p 1 Axial Ímpar
Força F 1 Polar Par
Torque τ =r×F 1 Axial Par
Energia Cinética p2 /2m 0 Escalar Par
Energia potencial U (r) 0 Escalar Par
Eletromagnetismo
Densidade de carga ρ (r) 0 Escalar Par
Densidade de corrente J (r) 1 Polar Ímpar
Campo elétrico E (r) 1 Polar Par
Deslocamento elétrico D (r) 1 Polar Par
Polarização P (r) 1 Polar Par
Indução magnética B (r) 1 Axial Ímpar
Campo magnético H (r) 1 Axial Ímpar
Vetor de Poynting S=E×B 1 Polar Ímpar
Tensor de stress Tij 2 Tensor Par
6.3 T ENSORES C ARTESIANOS

Nesta seção serão realizadas definições um pouco mais rigorosas dos campos escalares, ve-
toriais e tensoriais e suas propriedades sob tranformações em geral. A discussão ainda estará
restrita aos chamados tensores Cartesianos. Esta restrição será posteriormente eliminada na
seção 6.7.
Uma vez que os campos de interesse na física dependem de forma contínua nas coordenadas
do vetor posição, será realizada inicialmente uma breve discussão a respeito de espaços funci-
onais e suas classes. Essa discussão servirá como uma continuação à definição 3.21 de uma
função.
6.3.1 E SPAÇOS FUNCIONAIS

Um espaço funcional é formado por um conjunto de funções f : X 7→ Y (definição 3.21) de
um determinado tipo ou classe, que estabelecem um mapeamento do conjunto X ao conjunto
Y.
Este conjunto de funções é denominado um espaço porque em muitas aplicações de inte-
resse para a física esse conjunto forma um espaço topológico 4 (incluindo espaços métricos5 ), um
espaço vetorial,6 ou ambos. Por exemplo, o conjunto de todas as transformações lineares7 (ou
funções) do espaço vetorial V ao espaço vetorial W sobre o mesmo corpo K é, em si mesmo, um
espaço vetorial sobre o corpo K.
Alguns exemplos relevantes destes espaços funcionais são:
• C [a, b], o conjunto de todas as funções reais f : R 7→ R contínuas no intervalo (fechado)
[a, b] ⊂ R.
• C r [a, b], o conjunto de todas as funções reais que são contínuas até a derivada de ordem r
no intervalo [a, b] ⊂ R.
• C0 (R), o conjunto de todas as funções reais contínuas que são nulas no infinito.
• C r (R), o conjunto de todas as funções reais que são contínuas até a derivada de ordem r.
4 Definição 4.31.
5 Definição 4.27.
6 Capítulo 4.
7 Seção 4.4.

228 6.3. Tensores Cartesianos
• C ∞ (R), o conjunto de todas as funções reais que possuem derivadas em todas as ordens.
Estas funções também são denominadas de funções suaves.
• L1 [a, b], o conjunto de todas as funções reais cujo valor absoluto é integravel no intervalo
[a, b] ⊂ R.
• L2 [a, b], o conjunto de todas as funções reais quadraticamente integráveis no intervalo

[a, b] ⊂ R.
A partir desta definição de espaços funcionais é possível prosseguir com a definição de cam-
pos tensoriais em geral. Inicialmente serão tratados os campos escalares e vetoriais, os quais
serão em seguida generalizados.
6.3.2 T ENSORES C ARTESIANOS DE POSTOS ZERO E UM

Nesta seção serão apresentadas as definições dos campos escalares e vetoriais, bem como
suas propriedades de transformação.
Sejam os conjuntos Rn e Cn , respectivamente formados pelos produtos Cartesianos8 de R ou
C consigo mesmos n − 1 vezes. Uma região Ω de Rn ou de Cn consiste em um subconjunto dos
mesmos que é não vazio, aberto e conectado.9 O subconjunto Ω é uma região fechada se este
contiver o fecho do mesmo, isto é, seus pontos-limite. Esta definição de região de um conjunto
numérico pode ser imediatamente estendida para referir a subconjuntos de qualquer estrutura
mais complexa, como corpos, espaços vetoriais ou espaços afim.
Nas definições a seguir, os campos escalares e vetoriais são definidos sobre espaços vetoriais
Euclideanos.10 A generalização para espaços não Euclideanos será apresentada na seção 6.7.
Definição 6.1 (Campo escalar). Seja U ⊂ E n uma região do espaço Euclideano E n de dimensão
n. Um campo escalar φ da classe C r sobre U é o mapeamento
φ : U 7−→ K
sobre o corpo K, o qual atribui a cada ponto r ≡ (x1 , x2 , . . . , xn ) ∈ U a função φ = φ (r) ≡

φ (x1 , x2 , . . . , xn ) ∈ C r (K).
Nas aplicações para a física, usualmente K = R

ou C. Alguns dos exemplos mais conhecidos de
campos escalares:
• Campos potenciais, tais como o potencial es-

calar elétrico ou o potencial escalar gravitaci-
onal.
• Em hidrodinâmica, temperatura, humidade e

pressão também são descritos como campos
escalares.
• Na teoria quântica de campos, os campos es-

calares são atribuídos a partículas de spin 0.
Já um campo vetorial é apresentado desde as

Figura 6.3: Visualização das linhas de força de um disciplinas básicas de física e matemática como
dipolo elétrico e do campo elétrico resultante em um conjunto de setas orientadas, tangenciais às li-
alguns pontos particulares. nhas de força oriundas do(s) agente(s) que gera(m)
o campo. Um exemplo típico de visualização de um
campo vetorial é apresentado na figura 6.3. Duas cargas elétricas pontuais geram o campo
elétrico representado em alguns pontos da figura como setas orientadas que são tangenciais às
linhas de força. Uma terceira carga elétrica posicionada em qualquer ponto do espaço irá sentir
uma força elétrica cuja direção será paralela à reta tangente à linha de força nessa posição.
8 Definição3.26.
9 Um conjunto ou espaço conectado é um espaço topológico que não pode ser formado pela união de dois ou mais
subconjuntos não vazios disjuntos.
10 Ver exemplo 4.5.

A aparente simplicidade desta concepção visual do que é um campo vetorial esconde uma
complexidade intrínseca devido ao conjunto de objetos matemáticos distintos envolvidos e nas
suas interrelações. Um campo vetorial é composto por vetores, que são os componentes de um
espaço vetorial. Observando com atenção a definição do que é um espaço vetorial, realizada na
seção 4.1, nota-se que os vetores são, estritamente, objetos algébricos, i. e., não lhes é atribuída
a priori nenhuma estrutura geométrica ou analítica. Porém, um campo vetorial também possui
uma concepção geométrica inerente, uma vez que o campo se distribui no espaço a partir do(s)
agente(s) gerador(es). Além disso, para o seu cálculo, o campo vetorial também necessita de
um sistema de referências, com um escala de medidas bem definida. Por isso, um campo
vetorial também deve ser um tipo de espaço métrico (definição 4.27). A estrutura matemática que
estabelece a interrelação entre um espaço vetorial e um espaço métrico é o espaço afim (definição
4.37), o qual estabelece de forma rigorosa os conceitos de vetores posição e deslocamento, os
quais localizam os pontos do espaço métrico através de setas orientadas que partem da origem
do sistema de coordenadas. Qualquer transformação de um ponto do espaço a outro é então
realizado pelo vetor deslocamento, o qual é uma seta orientada que parte do primeiro a termina
no segundo (nesta seção serão considerados campos vetoriais sobre o espaço vetorial Euclideano
E n , exemplo 4.5). Finalmente, sobre cada ponto r do espaço E n será atribuído um vetor do
campo vetorial, vinculado a esse ponto. Esse vetor terá a característica adicional de possuir
uma topologia, i. e., os conceitos de limite e continuidade são supostos válidos em relações aos
vetores do campo em pontos da vizinhança imediata de r, de tal forma que seja possível realizar
operações do cálculo infinitesimal (derivações ou integrações), pelo menos na vizinhança do
ponto.
Definição 6.2 (Campo vetorial). Seja E n = (En , R n ) o espaço vetorial Euclideano e seja U ⊂ E n
uma região deste espaço. Seja K n um espaço vetorial sobre o corpo K de dimensão n, o qual
pode ser o espaço real R n ou o espaço complexo C n (definições 4.3 e 4.4). Um campo vetorial A
da classe C r sobre U é o mapeamento
A : U 7−→ K n ,
o qual atribui a cada ponto r ≡ (x1 , . . . , xn ) ∈ E n a função vetorial

.
A (r) ≡ A (x1 , . . . , xn ) = (A1 (r) , A2 (r) , . . . , An (r)) ∈ K n ,
para a qual cada componente é o campo escalar
Ak (r) ∈ C r (U ) , ∀k = 1, . . . , n.
O conjunto de todos os campos vetoriais da classe C r (U ) sobre U é denotado por Ar (U ).

O conjunto de todos os espaços vetoriais da classe C ∞ (U ) sobre U é denotado por A∞ (U ) ou
simplesmente por A (U ).
Retomando então as definições e considerações realizadas na seção 6.2.1, serão impostas
agora condições adicionais às componentes de um campo vetorial. A quantidade A (r) = Ai (r) êi
é um vetor ou um tensor Cartesiano de posto (ou ordem) um de um campo vetorial se e so-
mente se suas componentes comportam-se frente a uma rotação do sistema de coordenadas de
acordo com as relações (6.9a,b,e) e (6.10), repetidas aqui juntamente com a respectiva transfor-
mação inversa,
∂x0i
A0i = Lij Aj = Aj (6.12a)
∂xj
∂xi 0
Ai = Lji A0j = A , (6.12b)
∂x0j j
uma vez que a matriz de rotação é ortogonal, de acordo com (6.8).

Exemplo 6.2. Considere a matriz de rotação L obtida no exemplo 6.1, a qual executa uma
rotação passiva de R por um ângulo θ em torno de x3 . Verifique se as triplas ordenadas
(v1 (r) , v2 (r) , v3 (r)), dadas por
(iii) x21 , x22 , x3

(i) (x2 , −x1 , x3 ) (ii) (x2 , x1 , x3 )
correspondem a campos vetoriais no E3.

Resolução. Dada a matriz  

cos θ sen θ 0
L = − sen θ cos θ 0 ,
0 0 1
como o eixo x3 não é transformado pela rotação, este não precisa ser considerado. Por outro
lado, de acordo com a relação (6.9a), x0i = Lij xj , ou seja,
x01 = L1j xj = x1 cos θ + x2 sen θ

x02 = L2j xj = −x1 sen θ + x2 cos θ.
Tripla (i). Se esta tripla realmente é um vetor, então espera-se que suas componentes transformem-
se como
v10 = x02 = −x1 sen θ + x2 cos θ

v20 = −x01 = −x1 cos θ − x2 sen θ.
Para verificar se isto ocorre, aplica-se a relação (6.12a), ou seja, vi0 = Lij vj , de onde se obtém
v10 = v1 cos θ + v2 sen θ = x2 cos θ − x1 sen θ

v20 = −v1 sen θ + v2 cos θ = −x2 sen θ − x1 cos θ.
Como ambas as expressões são as mesmas, a quantidade v = (x2 , −x1 , x3 ) de fato é um vetor.
Tripla (ii). As componentes desta tripla devem se transformar como
v10 = x02 = −x1 sen θ + x2 cos θ

v20 = x01 = x1 cos θ + x2 sen θ.
Verificando, de vi0 = Lij vj obtém-se
v10 = v1 cos θ + v2 sen θ = x2 cos θ + x1 sen θ

v20 = −v1 sen θ + v2 cos θ = −x2 sen θ + x1 cos θ,
as quais são distintas das expressões acima. Portanto este objeto não é um vetor.
Tripla (iii). Para este objeto, basta verificar que a primeira componente,
2
v10 = (x01 ) = x21 cos2 θ + x22 sen2 θ + 2x1 x2 sen θ cos θ
não satisfaz a condição, uma vez que deveria resultar
v10 = v1 cos θ + v2 sen θ = x21 cos θ + x22 sen θ.
Portanto, este objeto também não é um vetor.

Um vetor, portanto, é um tensor cujos componentes são identificados com um único índice,
por enquanto posicionado somente na posição inferior (subscrito). Os componentes deste tensor
devem se alterar, frente a uma rotação do sistema de coordenadas, de acordo com as relações
(6.12).
Já um campo escalar ou, simplesmente, um escalar, por sua vez, é descrito por uma única
função11 φ (r) e, por esta razão, é também denominado um tensor de posto zero, pois não ne-
cessita de índices para identificação de componentes. Por conseguinte, um objeto matemático
somente será classificado como um escalar se este for invariante frente à rotação do referencial.
Objetos escalares também podem ser contruídos a partir do produto escalar de dois vetores.
Sendo A (r) e B (r) dois vetores quaisquer, então, usando (6.12a) e (6.8),
R→R0
φ (r) = A · B −−−−→ φ0 (r) = A0 · B 0 = Lij Lik Aj Bk = Aj Bj = φ (r) .
Esta propriedade possui aplicações físicas importantes, pois diversas quantidades escalares
como trabalho, energia potencial e densidade de energia nos campos eletromagnéticos são obti-
das a partir de produtos escalares de vetores. Estas propriedades são, respectivamente, propor-
cionais a F · dr, qE · dr, D · E e B · H.
11 Definição 6.1.

Outra maneira de se obter um escalar a partir de um vetor é através do operador divergente.

Se A (r) é um vetor, então
0
∂A0i

∂Ai R→R0 0 ∂Ai
φ (r) = ∇ · A = −−−−→ φ (r) = = .
∂xi ∂xi ∂x0i
Levando em conta agora que deve existir uma lei de transformação x0i = x0i ({xj }) bem definida,
pode-se usar a regra da cadeia e escrever, usando (6.9e), (6.12a) e (6.8),
∂xj ∂A0i ∂Ak ∂Aj

φ0 (r) = = Lij Lik = = φ (r) .
∂x0i ∂xj ∂xj ∂xj
De forma recíproca, é possível obter-se um vetor a partir de um escalar. Uma maneira de

realizar este feito consiste na aplicação do operador gradiente sobre um campo escalar φ (r),
resultando assim
∂φ
A (r) = ∇φ = êi .
∂xi
Dada a lei de transformação xi = xi x0j , emprega-se a derivação em cadeia, realiza-se a

0
mudança de base { êi } → êi , e, empregando (6.9e), resulta
∂x0j ∂φ ∂φ ∂φ 0
A (r) → Lki ê0k = Lji Lki 0 ê0k = ê ,
∂xi ∂xj0 ∂xj ∂x0j j
a qual é justamente a expressão para o vetor A0 = ∇0 φ no referencial R0 .
6.3.3 T ENSORES C ARTESIANOS DE POSTO DOIS OU SUPERIOR

Seguindo na discussão iniciada na seção 6.2.1 acerca de tensores de posto dois, a definição
prévia então realizada será agora generalizada.
Tensores são objetos geométricos que estabelecem relações lineares entre vetores, escalares
e outros tensores. Um exemplo que já foi empregado é o tensor de condutividade (6.2) que
relaciona o campo elétrico com o vetor densidade de corrente elétrica.
Um tensor pode ser representado por uma matriz multidimensional de valores numéricos.
O posto ou ordem de um tensor é a dimensão da matriz necessária para a sua representação.
Desta maneira, um escalar é um tensor de posto zero e um vetor é um vetor de posto um.
Por expressar uma relação entre vetores, a representação empregada para um tensor irá
depender da base do sistema de coordenadas e do referencial empregado. Grande parte dos
tensores empregados na física estabelecem relações entre objetos definidos no espaço vetorial
Euclideano E n usando uma base ortonormal. Estes são usualmente denominados de tensores
Cartesianos.
Definição 6.3 (Tensor Cartesiano). Um tensor Cartesiano é aquele tensor cuja representação é
obtida a partir de uma base ortonormal do espaço vetorial Euclideano E n , no qual é empregado
o sistema Cartesiano de coordenadas. O número de índices necessário para identificar todos os
seus componentes determina o posto ou a ordem do tensor.
Da mesma maneira como foi argumentado para vetores na seção 6.3.3, o tensor como uma
entidade físico/matemática deve permanecer invariante frente a uma transformação no sistema
de coordenadas ou no referencial. Esta exigência fundamental estabelece simultaneamente a
lei de transformação de seus elementos ou componentes, bem como a própria definição de um
tensor de um determinado posto. Será apresentada primeiro a definição de um tensor do posto
dois.
Definição 6.4 (Tensor Cartesiano de posto 2). Seja E 3 o espaço vetorial Euclideano de dimen-
.
são 3 e ê = { ê1 , ê2 , ê3 } uma base ortonormal do mesmo. Seja T [ê] a matriz quadrada 3 × 3 cujos
elementos Tij [ê] estão representados na base ê. Seja também a transformação de coordenadas
ê → ê0 , em conjunto com a transformação inversa ê0 → ê, tais que
∂x0i ∂xi 0
ê0i = Lij êj = êj , êi = Lji ê0j = ê .
∂xj ∂x0j j

Se os elementos da matriz T [ê] se transformarem frente às transformações ê ↔ ê0 de acordo com

a lei de transformação
∂x0i ∂x0j
Tij0 = Lik Lj` Tk` = Tk` (6.13a)
∂xk ∂x`
0 ∂xi ∂xj 0
Tij = Lki L`j Tk` = T , (6.13b)
∂x0k ∂x0` k`
então a matriz T [ê] representa um tensor Cartesiano de posto dois.
Da mesma maneira como foi realizado com vetores, os índices que identificam os distintos
componentes do tensor estão na posição inferior. Posteriormente, no contexto de tensores ge-
neralizados, será permitido o posicionamento de índices tanto na posição inferior (subíndices)
quanto na superior (superíndices). Isto será discutido na seção 6.7.
Como a extensão lógica da definição (6.13), considera-se agora uma matriz T [ê] de n dimen-
sões, isto é, a coleção de 3n quantidades identificadas pelo símbolo Tij···n [ê], o qual contém n
índices. Então, a seguinte definição é realizada.
Definição 6.5 (Tensor Cartesiano de posto n). Seja E 3 o espaço vetorial Euclideano de dimen-
.
são 3 e ê = { ê1 , ê2 , ê3 } uma base ortonormal do mesmo. Seja T [ê] a matriz cujos elementos
Ti1 i2 ...in [ê] , (i1 , i2 , . . . , in = 1, 2, 3)
estão representados na base ê. A matriz T [ê] representa um tensor Cartesiano de posto n se e
somente se suas coordenadas se transformarem de acordo com a lei de transformação
∂x0i1 ∂x0i2 ∂x0

Ti01 i2 ...in = Li1 j1 Li2 j2 . . . Lin jn Tj1 j2 ...jn = · · · in Tj1 j2 ...jn (6.14a)
∂xj1 ∂xj2 ∂xjn
∂xi1 ∂xi2 ∂xi
Tij···n = Lj1 i1 Lj2 i2 . . . Ljn in Tj01 j2 ...jn = · · · 0 n Tj01 j2 ...jn . (6.14b)
∂x0j1 ∂x0j2 ∂xjn
Obviamente, a definição (6.14) contém os tensores de ordem zero, um e dois como casos
particulares.
Uma das desvantagens das definições 6.4 e 6.5 está no fato de não ser evidente a invariância
do tensor frente a transformação de coordenadas. Embora essa invariância possa ser demons-
trada, é interessante apresentar também uma definição mais moderna, a qual independe do
sistema de coordenadas e da base adotados para representar o tensor. A definição a seguir in-
terpreta um tensor de posto n como uma forma multilinear 12 que realiza a projeção do produto
Cartesiano V n do espaço vetorial V sobre o corpo subjacente K.
Definição 6.6 (Espaço tensorial (Cartesiano)). Seja V um espaço vetorial sobre o corpo K.
Seja
.
V n = V × ··· × V
| {z }
n vezes
o produto Cartesiano de V . A forma multilinear
T : V n 7−→ K
é denominada um tensor Cartesiano sobre V . A potência n do produto V n determina o posto

do tensor. Conjunto de tensores sobre V podem formar espaços vetoriais denominados espaços
tensoriais Cartesianos.
Retornando agora à discussão feita na página 228 sobre a concepção intuitiva de um campo
vetorial, dado o espaço vetorial Euclideano, sobre cada ponto do mesmo atribui-se um tensor
Cartesiano, cujos elementos são contínuos e diferenciáveis, de tal forma que seja possível a
aplicação de operadores íntegro-diferenciais sobre os mesmos.
Antes de se realizar a definição de um campo tensorial, é necessário definir um campo vetorial
generalizado.

Definição 6.7 (Campo vetorial generalizado). Seja E m = (Em , R m ) o espaço vetorial Euclide-
ano de dimensão m e seja U ⊂ E m uma região deste espaço. Sejam A1 (r) , A2 (r) , . . . , An (r) um
conjunto de n campos vetoriais de dimensão m e da classe C r (U ). Um campo vetorial generali-
zado de ordem n e da classe C r sobre U é a mn -upla ordenada
.
A (r) = (A11 (r) , . . . , A1m (r) , A21 (r) , . . . , Aij (r) , . . . , Anm (r)) , (i = 1, . . . , n; j = 1, . . . , m) ,
formada pelos campos escalares {Aij (r) ∈ K, ∀i = 1, . . . , n e j = 1, . . . , m}.
Definição 6.8 (Campo tensorial Cartesiano). Seja E m = (Em , R m ) o espaço vetorial Euclide-
ano de dimensão m e seja U ⊂ E m uma região deste espaço. Seja T (r) um campo vetorial
generalizado de ordem n e da classe C r (U ). Sendo
Ti1 ...,in (r) , (ij = 1, . . . , m; j = 1, . . . , n) ,
uma componente deste espaço vetorial, se para todos {i1 , . . . , in = 1, . . . , m} esta componente se
transformar como um tensor Cartesiano de posto n (equações 6.14) frente a uma transformação
de coordenadas em E m , então T (r) forma um campo tensorial Cartesiano de posto n e da classe
C r sobre U .
Serão apresentados agora alguns exemplos de campos tensoriais.
Exemplo 6.3. Mostre que os componentes da matriz

2
x2 −x1 x2
T=
−x1 x2 x21
formam um tensor de posto 2 frente a uma rotação dos eixos coordenados.

Resolução. Dadas as relações entre as coordenadas x01 = x1 cos θ + x2 sen θ e x02 = −x1 sen θ +
x2 cos θ, espera-se que
2
(x02 ) −x01 x02

0
T = 2
−x01 x02 (x01 )
2
(−x1 sen θ + x2 cos θ) (x1 cos θ + x2 sen θ) (x1 sen θ − x2 cos θ)
= 2 .
(x1 cos θ + x2 sen θ) (x1 sen θ − x2 cos θ) (x1 cos θ + x2 sen θ)
Para verificar, emprega-se a lei de transformação (6.13a), resultando

0
T11 = x22 cos2 θ − 2x1 x2 sen θ cos θ + x21 sen2 θ
0
T12 = −x22 sen θ cos θ − x1 x2 cos2 θ + x1 x2 sen2 θ + x21 sen θ cos θ
0 0
T21 = T12
0
T22 = x22 sen2 θ + 2x1 x2 sen θ cos θ + x21 cos2 θ.
Ou seja, as expressões para os componentes são idênticas, o que confirma que T é de fato um
tensor de posto 2.
Exemplo 6.4 (Símbolos de Kronecker e Levi-Civita). Mostre que os símbolos de Kronecker

(δij ) e de Levi-Civita (ijk ) apresentados na seção 6.1.2 são, na verdade, tensores de postos dois
e três, respectivamente, sob o ponto de vista de rotações próprias no espaço.
Resolução. Dados os símbolos δij e ijk , definidos conforme é descrito na seção 6.1.2 em
um determinado sistema de coordenadas. Se estes objetos forem realmente tensores, respec-
tivamente de segunda e terceira ordens, então a aplicação da lei de transformação geral (6.14)
a ambos irá gerar outros tensores que possuem as mesmas propriedades no outro sistema de
coordenadas.
Verificando esta propriedade para a delta de Kronecker, de (6.14) e (6.8) resulta
0
δij = Lik Ljm δkm = Lik Ljk = δij .
Ou seja, a lei de transformação R → R0 gera um símbolo de Kronecker δij

0
que possui os mesmos
componentes do sistema original. Portanto, δij transforma-se da maneira esperada para um
tensor de posto dois.

234 6.4. Álgebra tensorial
Verificando agora para o símbolo de Levi-Civita, novamente de (6.14) resulta
0ijk = Lim Ljn Lk` mn` .
Emprega-se agora a seguinte fórmula para o cálculo do determinante de uma matriz quadrada
de ordem 3: sendo A uma matriz qualquer, então
det (A) ijk = Aim Ajn Ak` mn` . (6.15)
Substituindo na expressão acima os elementos de A pelos respectivos elementos da matriz de

transformação L, resulta então que
0ijk = det (L) ijk .
Portanto, de acordo com (6.9c), se a transformação realizada em R for própria, como é o caso de
uma rotação dos eixos, então, 0ijk = ijk e o símbolo de Levi-Civita satisfaz a lei de transformação.
Exemplo 6.5. Mostre que o tensor de stress de Maxwell, definido por

2 1 2

Tij = 0 Ei Ej + c Bi Bj − E · E + c B · B δij ,
2
sendo E e B respectivamente os campos elétrico e de indução magnética, 0 a constante de

permissividade elétrica do vácuo e c a velocidade da luz no vácuo, é realmente um tensor de
posto dois.
Resolução. Como 0 e c são escalares e E e B vetores por hipótese, então na transformação
R → R0 , Ei0 = Lij Ej , Bi0 = Lij B e E · E e B · B também são escalares. Portanto, se Tij é um tensor
de posto 2, então este deve satisfazer (6.13),
Tij0 = Lik Ljm Tkm

2 1 2

= 0 Lik Ljm Ek Em + c Lik Ljm Bk Bm − E · E + c B · B Lik Ljm δkm
2

0 0 2 0 0 1 0 0 2 0 0

= 0 Ei Ej + c Bi Bj − E · E + c B · B δij .
2
Ou seja, Tij possui a mesma estrutura em qualquer sistema de coordenadas.
Um comentário final importante se refere à simbologia utilizada para representar um tensor

de posto N . Um tensor de posto 2 pode ser representado naturalmente por uma matriz; assim,
se o conjunto {Tij } compreende os 9 componentes de um tensor deste posto, este pode ser
representado coletivamente por T a qual é a notação empregada neste texto para uma matrix
genérica.
Contudo, tensores de postos mais altos não podem ser representados por matrizes. Assim,
se {Tijk } representa os 27 componentes de um tensor de posto 3, este pode ser representado de
forma genérica como T , sem mostar explicitamente o seu posto.
A notação introduzida acima será empregada para representar um tensor genérico, quando
o seu posto não for importante. Esta notação permite também tratar o tensor como um objeto
geométrico genérico, onde não é feita menção do sistema de coordenadas em particular onde
seus componentes são calculados. Assim, o tensor T tem os seus componentes dados por {Tijk }
no sistema de coordenadas 0 R, ao passo que os componentes do mesmo tensor no referencial
rotado R0 são dados por Tijk . Desta forma, o tensor pode ser representado de uma maneira
semelhante aos operadores diferenciais gradiente (∇), divergente (∇·) e rotacional (∇×), cujos
símbolos são os mesmos, independente do sistema adotado. Esta notação será aplicada na
próxima seção.
6.4 Á LGEBRA TENSORIAL

Como os tensores consistem em extensões lógicas dos conceitos de vetores e matrizes, é
natural que as regras algébricas impostas a estes objetos sejam equivalentes àquelas aplicadas
às estruturas mais simples citadas, e se reduzam a estas regras como casos particulares. Estas
regras de álgebra serão discutidas nesta seção.

6.4.1 A DIÇÃO DE TENSORES

A adição (e também a subtração) de tensores é definida naturalmente como a extensão lógica
das adições de vetores e matrizes. Para que esta generalização tenha sentido, contudo, deve-
se impor como condição necessária que todos os tensores sendo adicionados tenham o mesmo
posto.
Se {Tij···r } e {Uij···r } são os componentes dos tensores T e U , ambos de posto N , então a
soma e a diferença destes geram, respectivamente, os tensores S e D de mesmo posto, cujos
componentes são dados por
Sij···r = Tij···r + Uij···r

Dij···r = Tij···r − Uij···r .
Estas operações podem ser representadas de forma genérica como S = T + U e D = T − U ,

respectivamente.
6.4.2 S IMETRIA E ANTISSIMETRIA

É simples demonstrar que, se {Tij···k } são os componentes de um tensor, então o conjunto de
funções obtido pela permutação de quaisquer dois índices do conjunto original, ou seja, {Tji···k },
também será um tensor. Contudo, este tensor não irá apresentar, em geral, uma simetria bem
definida frente a permuta quaisquer dois de seus índices. Somente uma classe particular de
tensores apresenta tais propriedades.
Restringindo inicialmente a discussão para tensores de posto 2, dado o T , cujos componentes
são {Tij }. Se suas componentes apresentarem uma simetria bem definida frente a troca i ↔ j,
esta pode se manifestar de duas maneiras:
se Tij = Tji ; tensor simétrico;

se Tij = −Tji ; tensor antissimétrico.
Embora um outro tensor U não necessariamente apresente propriedades de simetria bem

definidas, este sempre pode ser escrito como uma combinação de suas partes simétrica e antis-
simétrica através da identidade
1 1
Uij = (Uij + Uji ) + (Uij − Uji ) ,
2 2
sendo que o primeiro termo a parte simétrica de Uij , enquanto que o segundo termo é a sua
parte antissimétrica.
Considerando agora um tensor de posto N qualquer, seja {Tijk···r } o conjunto de componentes
de T . Se este tensor apresentar propriedade de simetria, então há duas possibilidades:
Tijk···r = Tjik···r , Tijk···r = Tkji···r , etc ; simétrico com respeito aos índices i e j ou i e k, etc;
Tijk···r = −Tjik···r , Tijk···r = −Tkji···r , etc ; antissimétrico com respeito aos mesmos índices.
Da mesma maneira, um tensor genérico U pode sempre ser escrito como uma combinação de
suas partes simétrica e antissimétrica, frente uma permutação de dois índices quaisquer, como
1 1
Uijk···r = (Uijk···r + Ujik···r ) + (Uijk···r − Ujik···r ) ,
2 2
ou
1 1
Uijk···r = (Uijk···r + Ukji···r ) + (Uijk···r − Ukji···r ) ,
2 2
etc.
A separação de tensores ou operadores em suas partes simétrica e antissimétrica é de ex-
trema importância em diversas disciplinas, tais como mecânica e eletromagnetismo de meios
contínuos e mecânica quântica.

6.4.3 T ENSORES HERMITIANOS OU ANTI - HERMITIANOS

Uma propriedade adicional relacionada a tensores de posto dois e cujas componentes são
funções analíticas complexas é a hermiticidade dos mesmos.
Usualmente empregado em matrizes, tensores de posto dois também são hermitianos ou anti-
hermitianos se apresentarem simetria frente a operação de conjugação hermitiana, definida da
seguinte maneira. Seja A uma matriz quadrada cujos elementos {Aij } são complexos. O seu
hermitiano conjugado ou adjunto, denotado por A† , é obtido a partir da conjugação complexa dos
elementos da matriz transposta, isto é,
T ∗
A† = (A∗ ) = AT ,
sendo que os elementos de A† são dados por
A† = A∗ji .

ij
Como é sempre possível usar-se uma representação matricial para um tensor de posto dois, em
muitas aplicações físicas é aplicada a operação de conjugação hermitiana ao mesmo.
Da mesma forma como é definido para matrizes, portanto, um tensor de posto dois A é
hermitiano ou autoadjunto se satisfaz a propriedade
A = A† .
Por outro lado, este tensor é anti-hermitiano se
A = −A† .
É possível então definir-se as partes hermitiana e anti-hermitiana de um tensor A respecti-

vamente por
1
AH = A + A†
2
1
aH
A = A − A† .
2i
Desta forma, sempre se pode escrever A como
A = AH + iAaH .
Em muitos meios descritos por tensores complexos, as respectivas partes hermitiana e anti-
hermitiana estão relacionadas com processos físicos distintos que ocorrem neste meio.
Exemplo 6.6. Em um meio contínuo, linear e homogêneo, mas anisotrópico e dissipativo, a
relação constitutiva entre o campo elétrico E e o vetor deslocamento elétrico D pode ser escrita,
no espaço de Fourier, como
Di (k, ω) = εij (k, ω) Ej (k, ω) ,
onde k e ω são, respectivamente, o vetor de onda e a frequência angular das ondas que se
propagam neste meio e {εij } são as componentes do tensor dielétrico do meio. Para este meio,
o teorema de Poynting, que descreve a conservação de energia entre campos e partículas, pode
ser escrito como
∂U ω
+ ∇· (v g U ) = − E· εaH ·E,
∂t 8π
sendo v g = ∂ω/∂k a velocidade de grupo das ondas e13
" #
1 ∂ ωεH
U= : EE
8π ∂ω
a densidade de energia contida nos campos.

Na equação acima, o termo v g U = S corresponde ao vetor de Poynting, ou seja, ao fluxo local
de energia. Conclui-se, portanto, que a parte hermitiana de εij está relacionada com a refração
ou ao fluxo da energia transportada pelas ondas, ao passo que a parte anti-hermitiana está
relacionada com a dissipação irreversível de energia devido a interação dos campos com o meio.
13 Ver notação de diádicas na seção 6.4.4.2.

6.4.4 P RODUTO EXTERNO DE TENSORES

O produto externo de dois ou mais tensores, também denominado produto direto ou produto
tensorial, consiste em uma operação que permite a construção de um tensor com posto mais
alto que os tensores-pais. De fato, o posto do tensor resultante é exatamente igual à soma dos
postos de seus progenitores.
O produto externo é realizado de diferentes maneiras. A maneira usual consiste na multi-
plicação direta de componentes dos tensores envolvidos. Uma outra maneira de se construir
um tensor de posto mais alto consiste em se aplicar os componentes de um operador sobre os
componentes de outro tensor. Ambas as maneiras serão abordadas nesta seção.
6.4.4.1 P RODUTO EXTERNO DE DOIS TENSORES
Considera-se inicialmente um caso mais simples. Dados os vetores a = ai êi e b = bi êi ,

deseja-se contruir a partir destes um tensor de posto dois T , cujos componentes são dados pelo
produto externo dos vetores acima, ou seja,
Tij = ai bj .
Os componentes Tij resultantes desta construção de fato pertencem ao tensor T , o que pode ser
facilmente demonstrado. Se isto for verdade, então na transformação R → R0 devem resultar os
componentes
Tij0 = a0i b0j .
Usando a lei de transformação para os vetores, resulta
Tij0 = Lik Lj` ak b` = Lik Lj` Tk` ,
a qual é justamente a lei de transformação de um tensor do posto 2.

Na sua representação matricial, o tensor T pode ser escrito como a matriz 3 × 3
 
a 1 b1 a 1 b2 a 1 b3
T = a2 b1 a2 b2 a2 b3  .
a3 b1 a3 b2 a3 b3
Este tipo de produto externo é representado de diferentes maneiras, todas independentes do

sistema de coordenadas adotado. Uma maneira usual consiste em empregar o símbolo ⊗. Nesta
notação, dados os vetores a e b acima, o tensor T é representado como
T = a ⊗ b = ai bj êi ⊗ êj , (6.16a)
e as componentes resultantes deste tensor também podem ser representadas por
Tij = (a ⊗ b)ij . (6.16b)
6.4.4.2 D IÁDICAS
No caso particular de tensores de posto dois, uma outra representação, um tanto ultrapas-
sada mas ainda empregada em alguns textos, é a de uma diádica. Esta é uma outra maneira
de se representar o produto externo de dois vetores, estendendo a álgebra vetorial usual e re-
sultando em um tensor. Dados os vetores a e b, a diádica T é obtida pela simples justaposição
destes vetores, ou seja,
T = ab = ai bj êi êj .
Uma vantagem que esta notação possui está na praticidade de realização de produtos de
diádicas entre si ou com vetores, como será mostrado a seguir. Contudo, em se tratando de
uma prática em desuso, será dada preferência para a notação de produto externo introduzida
em (6.16).

6.4.4.3 G RADIENTE DE UM VETOR
Uma outra maneira de se construir um tensor de posto 2 consiste em aplicar o operador

gradiente sobre um vetor, operação esta que não está definida na álgebra vetorial ordinária.
Dado o operador ∇ = êi ∂/∂xi e o vetor v = vi êi , o componente Tij do tensor T é definido
como
∂vj
Tij = .
∂xi
Esta expressão pode ser escrita de uma forma genérica, independente do sistema de coordena-
das adotado, como
∂vj
T = ∇v = êi êj .
∂xi
Neste caso em particular, a notação empregada é em muito semelhante ao de uma diádica,
exceto que é feito uso de um operador diferencial no lugar de um vetor ordinário.
6.4.4.4 P RODUTO EXTERNO EM GERAL
Considera-se agora o caso mais geral de produto externo entre dois tensores arbitrários.
Dado o tensor T de posto M e o tensor U de posto N , o produto externo destes gera o tensor V
com posto M + N , cujas componentes são
Vi · · · pq · · · v = T i · · · p Uq · · · v .
| {z } | {z } | {z }
M +N índices M índices N índices
A notação para este produto externo é, então
V = T ⊗ U.
6.4.5 C ONTRAÇÃO
A definição do produto externo, na seção 6.4.4, possibilitou a construção de um tensor de
um dado posto a partir de outros tensores de ordem mais baixa. Processos inversos também
são definidos na álgebra tensorial, ou seja, operações aplicadas sobre um determinado tensor
de posto N que reduzem o seu posto, resultando em outro tensor de posto N − 2. Uma destas
operações é denominada de contração de índices ou, simplesmente, contração. Uma outra opera-
ção, denominada produto interno, está relacionada com a contração dos índices e será também
discutida. Obviamente, para que esta operação tenha sentido, é necessário que N > 2.
Dado um tensor T de posto N > 2, uma contração deste tensor consiste em tomar qualquer
par de seus índices, representá-los com o mesmo símbolo e executar então a sua soma implícita.
A resultante desta operação será um novo tensor U de posto N − 2. Dado então o conjunto
{Tijk`···r }, as expressões a seguir apresentam algumas de suas possíveis contrações:
Uk`···r = Tiik`···r , Vi`···r = Tijj`···r , Wj`···r = Tiji`···r , Xik`··· = Tijk`···j , etc.
Claramente, o número de contrações possíveis depende do posto do tensor. Se N = 2, somente

uma contração é possível. Neste caso, a operação é equivalente ao cálculo do traço da matriz que
representa o tensor e o resultado da operação é uma quantidae escalar. Se o posto for N = 3, há
3 contrações possíveis, gerando o mesmo número de vetores distintos. Em geral, um tensor de
posto N > 2 pode gerar por contrações um total de 21 N !/ (N − 2)! tensores de posto N − 2.
Para mostrar que o objeto resultante da contração é realmente um tensor de posto N − 2,
parte-se da lei de transformação (6.14a) aplicada a T ,
0
Tij···`···m···k = Lip Ljq . . . L`r . . . Lms . . . Lkn Tpq···r···s···n .
Contraindo-se os índices ` e m no componente transformado à esquerda e utilizando a condição

de ortogonalidade (6.8), resulta
0
Tij···`···`···k = Lip Ljq . . . L`r . . . L`s . . . Lkn Tpq···r···s···n
= Lip Ljq . . . δrs . . . Lkn Tpq···r···s···n
= Lip Ljq . . . Lkn Tpq···r···r···n ,
| {z }
N −2 fatores

ou seja,
0
Uij···k = Lip Ljq . . . Lkn Upq···n ,
ou que mostra que U é realmente um tensor de posto N − 2.
6.4.5.1 P RODUTO INTERNO
O produto interno, conforme definido em espaços vetoriais, é bem conhecido. Se a e b são

membros do espaço vetorial V , então o produto interno entre ambos, usualmente representado
por ha, bi, terá como resultado uma quantidade escalar.
A forma mais empregada do produto interno para aplicações físicas é o produto escalar entre
dois vetores a e b do E 3 ,14 resultando no escalar c,
c = a · b. (6.17)
De acordo com a terminologia aqui empregada, trata-se de um produto entre dois tensores de
posto um, resultando em um tensor do posto zero.
Estendendo o conceito de produto interno a tensores de posto mais alto e relacionando esta
operação com a definição de contração de índices anteriormente apresentada, pode-se dizer que
a operação realizada em (6.17) consiste, inicialmente, no produto externo dos vetores a e b,
resultando em um tensor de posto 2, seguida posteriormente pela contração dos índices deste
tensor, o que resulta finalmente em um escalar:
C = a ⊗ b ; c = Cii = ai bi .
A única característica própria nesta operação em relação ao processo geral de contração

de índices está no fato de que no produto interno a contração é realizada sobre os índices de
tensores-pais (de postos M e N ) distintos, os quais foram inicialmente justapostos por uma
operação de produto externo, resultando em um tensor-filho de ordem M + N . Como resultado
do produto interno, igualmente resulta um tensor de posto M + N − 2.
Assim, se A, B, C e D são tensores de postos M , N , M + N e M + N − 2, respectivamente a
seguinte cadeia de operações ilustra a o produto interno entre A e B, resultando no tensor D,
C = A ⊗ B ; Cijk · · · r `mn · · · s = Aijk···r B`mn···s

| {z } | {z N
}
M
=⇒ Dik · · · rmn · · · s ≡ Cijk···rjmn···s = Aijk···r Bjmn···s .

| {z }
M +N −2
No caso acima, foi realizada a contração no índices j de cada tensor. Obviamente, a contração
em outros índices irá gerar tensores de posto M +N −2 em geral distintos de D. Por conseguinte,
há diversos produtos internos possíveis entre tensores de ordem maior que dois.
6.4.5.2 P RODUTOS COM DIÁDICAS
A definição de produto interno acima realizada é particularmente útil na notação de diádicas

(seção 6.4.4.2). Sendo a e b vetores e C uma diádica, formada pela justaposição dos vetores,
C = ab = ai bj êi êj ,
Esta poderá sofrer produto interno com um outro vetor c, tanto à esquerda quanto à direita, re-
sultando nos vetores d e e, em geral distintos entre si. Além disso, o produto interno envolvendo
diádicas utiliza a mesma notação do produto escalar entre vetores. Assim,
d = c · C = ci ai bj êj
e = C · c = ai bj cj êi .
Na verdade, no caso específico de produtos envolvendo diádicas é possível também definir-se

o produto vetorial de uma diádica por um vetor, com a mesma definição empregada na álgebra
vetorial.15 Agora, o resultando desta operação é uma outra diádica e também são possíveis
14 Exemplo 4.3.
15 Exemplo 4.6.

Tabela 6.2: Possiveis operações de produto entre duas diádicas.

Produtos escalares Produtos vetoriais
Operação Produto escalar
N/A
única A · B = (ab) · (cd) = (b · c) ad
O fator de rotação origina-se do
O fator de expansão consiste na produto vetorial entre os vetores da
Contração contração de índices usual: diádica:
de índices A ≡ hAi = a × b
Tr (A) = a · b = ai bi = ai bj êi × êj
= ikj ak bj êi .
Operação Produto escalar duplo Produto escalar-vetorial
dupla A : B = (ab) : (cd)
incluindo = ai bj ck d` ( êi êj ) : ( êk ê` ) · ·
A × B = (ab) × (cd) = (a · c) (b × d)
produto = ai bj ck d` ( êj · êk ) ( êi · ê` )
escalar = (a · d) (b · c)
Operação Produto vetorial-escalar Duplo produto vetorial
dupla
incluindo
A×· B = (ab) ×
· (cd) = (a × c) (b · d) A× ×
× B = (ab) × (cd) = (a × c) (b × d)
produto
vetorial
produtos à esquerda ou à direita. Assim, sendo F e G diádicas, o produto vetorial de c por C

pela esquerda ou pela direita resultam em
F = c × C = (c × a) b = ci aj bk ( êi × êj ) êk = i`k ak bj c` êi êj

G = C × c = a (b × c) = ai bj ck êi ( êj × êk ) = jk` ai bk c` êi êj ,
onde se fez uso de (6.5). Portanto, há quatro operações possíveis envolvendo uma diádica e um
vetor.
Existem também 7 possíveis produtos, tanto escalares quanto vetoriais, envolvendo duas
diádicas. Considerando agora os vetores a, b, c e d e as diádicas A = ab e B = cd, estas são
apresentadas na tabela 6.2.
6.4.6 R EGRA DO QUOCIENTE

Como consequência da definição de produto externo na seção 6.4.4, foi demonstrado que se
A e B são tensores de postos M e N , respectivamente, então o produto externo destes gera o
tensor C = A ⊗ B, de posto M + N .
A regra do quociente consiste na propriedade recíproca do produto externo. Assumindo-se
agora que B e C são tensores de postos N e M + N , respectivamente, então caso exista um
conjunto de objetos {Aij···k···m }, identificados por M índices, tal que
Aij · · · k · · · m Bnp · · · q · · · r = Cij · · · k · · · mnp · · · q · · · r ,

| {z } | N índices
{z } | {z }
M índices M +N índices
então {Aij···k···m } necessariamente compõe os componentes do tensor A de posto M .

A demonstração deste teorema segue da lei de transformação de tensores. Como B (posto N )
e C (posto M + N ) são, por hipótese, tensores, então a transformação R → R0 leva os compo-
nentes do conjunto {A··· } a um outro conjunto de valores {A0··· }, ainda não determinados. Como
consequência, existe a seguinte relação no sistema R0 ,
A0ij···k···m Bnp···q···r
0 0
= Cij···k···mnp···q···r .
Dada agora a lei de transformação (6.14a),
A0ij···k···m Lna Lpb . . . Lqc . . . Lrd Bab···c···d = Lie Ljh . . . Lks . . . Lmv Lna Lpb . . . Lqc . . . Lrd Ceh···s···vab···c···d ,
Lna Lpb . . . Lqc . . . Lrd A0ij···k···m Bab···c···d − Lie Ljh . . . Lks . . . Lmv Ceh···s···vab···c···d = 0.


Como a transformação é arbitrária, a equação acima somente pode ser satisfeita para todos os
componentes se
A0ij···k···m Bab···c···d − Lie Ljh . . . Lks . . . Lmv Ceh···s···vab···c···d = 0.
Introduzindo agora a relação original entre os conjuntos {A··· }, {B··· } e {C··· },
A0ij···k···m Bab···c···d − Lie Ljh . . . Lks . . . Lmv Aeh···s···v Bab···c···d = 0,

A0ij···k···m − Lie Ljh . . . Lks . . . Lmv Aeh···s···v Bab···c···d = 0.

Como esta identidade deve ser satisfeita para qualquer tensor B, então, necessariamente,
A0ij···k···m = Lie Ljh . . . Lks . . . Lmv Aeh···s···v .
Ou seja, a relação entre os conjuntos {A··· } e {A0··· } é idêntica à lei de transformação (6.14a).
Portanto, A é realmente um tensor de posto M .
O uso da regra do quociente para determinar se um determinado conjunto de objetos é de
fato um tensor consiste, muitas vezes, em uma maneira mais conveniente de se cumprir este
objetivo do que a aplicação direta das leis de transformação. Uma maneira particular de se
realizar esta tarefa consiste em efetuar contração de índices de forma a obter-se um escalar ou
um tensor de posto mais baixo.
A mesma conclusão obtida acima com relação ao produto externo de dois tensores também
é válida para o seu produto interno. Sendo novamente {Aij···k···m } um conjunto de M objetos e
B e D tensores de postos N e M + N − 2, respectivamente, então a relação
Aij···k···m Bnp···k···r = Dij···mnp···r
implica em que {A··· } forma o conjunto de componentes de um tensor de posto M .

A demonstração segue novamente da relação equivalente no sistema transformado,
A0ij···`···m Bnp···`···r
0 0
= Dij···mnp···r ,
Lna Lpb . . . Lrd L`k A0ij···`···m Bab···k···d − Lie Ljh . . . Lmv Deh···vab···d = 0,

L`k A0ij···`···m Bab···k···d − Lie Ljh . . . Lmv Deh···vab···d = 0,
L`k A0ij···`···m Bab···k···d − Lie Ljh . . . Lmv Aeh···k···v Bab···k···d = 0,

L`k A0ij···`···m − Lie Ljh . . . Lmv Aeh···k···v Bab···k···d = 0,

L`k A0ij···`···m − Lie Ljh . . . Lmv Aeh···k···v = 0.
Usando a condição de ortogonalidade (6.8) no resultado acima, resulta
Lnk L`k A0ij···`···m − Lie Ljh . . . Lnk · · · Lmv Aeh···k···v = 0,

A0ij···n···m = Lie Ljh . . . Lnk · · · Lmv Aeh···k···v ,
a qual é a lei de transformação do tensor A de posto M .

Obviamente, como há mais de uma contração de índices possível para tensores de posto
maior que um, o produto interno ilustrado acima poderia ser realizado em qualquer par de
índices dos tensores A e B.
Exemplo 6.7. Use a lei do quociente para mostrar que a matriz T do exemplo 6.3 é realmente a
representação de um tensor de posto dois.
Resolução. Dado que a diádica rr é um tensor de posto dois, realiza-se a contração dupla
de índices das componentes desta diádica com a matriz T, o que pode ser representado pela
seguinte multiplicação matricial,
2
x1 x22 − x1 x22

x2 −x1 x2 x1
Tij xi xj = x1 x2 = x1 x2 = 0.
−x1 x2 x21 x2 −x21 x2 + x21 x2
Como o resultado desta contração é um escalar e rr é um tensor, então, pela lei do quociente,
T também deve ser um tensor.

242 6.5. Composição de transformações, rotações infinitesimais e tensores isotrópicos
Exemplo 6.8. Considera-se uma partícula de massa m rigidamente conectada à origem do re-
ferencial. Se r e p forem, respectivamente, a posição e momentum linear instantâneos da partí-
cula, então a i-ésima component de seu momentum angular é dada por
Li = (r × p)i = ijk xj pk .
Como a partícula está presa a uma distância fixa da origem O, então
p = mv = m (ω × r) ,
sendo ω a sua velocidade angular instantânea. Portanto, Li pode ser escrito, fazendo uso de
(6.3), como
Li = ijk xj pk = mijk k`m xj xm ω` = m r2 ωi − xi xj ωj = m r2 δij − xi xj ωj ≡ Iij ωj .

A quantidade
Iij = m r2 δij − xi xj

é denominada tensor de inércia da partícula em relação a O.

O conjunto {Iij } (i, j = 1, 2, 3) realmente compõe um tensor de posto dois, uma vez que L e ω
são tensores de posto um e, de acordo com a lei do quociente, segue então que I é necessaria-
mente um tensor de posto dois.
6.5 C OMPOSIÇÃO DE TRANSFORMAÇÕES , ROTAÇÕES IN -

FINITESIMAIS E TENSORES ISOTRÓPICOS
Nesta seção serão discutidos alguns tópicos de interesse geral.
6.5.1 C OMPOSIÇÃO DE TRANSFORMAÇÕES

Quando mais de uma transformação é realizada sobre o sistema de coordenadas de forma
concomitante, a transformação resultante sempre pode ser escrita em termos de uma única
matriz de transformação.
Restringindo-se a tensores de posto um, realizam-se duas transformações concomitantes ao
referencial,
L(1) L(2)
R −−→ R0 −−→ R00 .
Dado então um vetor a, este será transformado como

(1) (2) (2) (1)
a0i = Lij aj ; a00i = Lij a0j = Lij Ljk ak .
Ou seja, as transformações concomitantes irão corresponder a uma única transformação
a00i = Lij aj ,
cuja matriz de transformação é
(2) (1)
Lij = Lik Lkj −→ L = L(2) L(1) .
Em particular, duas rotações seguidas em torno do eixo x3 , de ângulos θ1 e θ2 , consecutiva-

mente, correspondem a uma única rotação por um ângulo θ1 + θ2 . Pode-se verificar facilmente
que, neste caso, estas rotações podem ser realizadas em qualquer ordem.
O exemplo acima, contudo, é um caso particular onde as transformações são permutáveis.
Em geral, a multiplicação matricial não comuta, isto é, L(2) L(1) 6= L(1) L(2) .

6.5.2 R OTAÇÕES INFINITESIMAIS

Rotações arbitrárias são um exemplo de transformações não comutáveis. Dadas duas matri-
zes de rotações gerais L(1) e L(2) , em geral a ordem de realização das mesmas é importante.
Uma forma comum de se realizar uma rotação arbitrária de eixos consiste no emprego dos
ângulos de Euler, os quais são ilustrados na figura 6.4. Com o uso destes ângulos, pode-se
construir uma matriz genérica de rotação, a qual é uma função somente dos parâmetros φ, θ e
ψ. Fazendo isso, a expressão obtida para a matriz de rotação E é
E11 = cos ψ cos φ − cos θ sen φ sen ψ E12 = cos ψ sen φ + cos θ cos φ sen ψ E13 = sen ψ sen θ
E21 = − sen ψ cos φ − cos θ sen φ cos ψ E22 = − sen ψ sen φ + cos θ cos φ cos ψ E23 = cos ψ sen θ
E31 = sen θ sen φ E32 = − sen θ cos φ E33 = cos θ.
Na técnica dos ângulos de Euler, a matriz de rotação geral é construída a partir de três rotações
consecutivas, realizadas sempre no sentido anti-horário e em torno de um determinado eixo de
rotação.
Os ângulos de Euler são apenas uma das formas de se implementar uma rotação arbitrária
em três dimensões. De uma forma genérica, estas rotações parciais são realizadas com as
seguintes matrizes
     
1 0 0 cos θ2 0 − sen θ2 cos θ3 sen θ3 0
L(1) = 0 cos θ1 sen θ1  L(2) = 0 1 0  L(3) = − sen θ3 cos θ3 0 ,
0 − sen θ1 cos θ1 sen θ2 0 cos θ2 0 0 1
as quais correspondem a rotações em torno dos eixos x1 , x2 e x3 , respectivamente. Pode-se

verificar facilmente que a composição de rotações arbitrárias não é comutável. Por exemplo,
L(1) L(2) 6= L(2) L(1) .
Por outro lado, quando as rotações são infinitesimais, a comutatividade nas rotações é obtida.
Considera-se como exemplo uma rotação infinitesimal δθ3 em torno de x3 . Neste caso, pode-se
substituir em L(3) , cos θ3 ' 1 e sen θ3 ' δθ3 e esta matriz pode ser decomposta como
   
100 0 δθ3 0
L(3) ' 0 1 0 + −δθ3 0 0 .
001 0 0 0
Ou seja, as componentes de um vetor a transformam-se de acordo com
(3)
a0i = Lij aj ' (δij + ij3 δθ3 ) aj .
Figura 6.4: Ângulos de Euler usualmente empregados para executar uma rotação arbitrária no sistema de
coordenadas. (a) Primeira rotação: sentido anti-horário em torno de x3 , por um ângulo φ. (b) Segunda
rotação: sentido anti-horário por um ângulo θ em torno do eixo x01 . (c) Terceira rotação: sentido anti-horário
por um ângulo ψ em torno de x03 .

244 6.5. Composição de transformações, rotações infinitesimais e tensores isotrópicos
Realizando a mesma consideração para as outras matrizes de rotação, observa-se que a forma
infinitesimal das mesmas é
(1) (2) (3)
Lij = δij + ij1 δθ1 , Lij = δij + ij2 δθ2 , Lij = δij + ij3 δθ3 .
Assim, é possível compor-se uma rotação infinitesimal arbitrária, dada por L = L(3) L(2) L(1) a qual,
em ordem mais baixa nas rotações, é dada por
(3) (2) (1)
Lij = Lik Lk` L`j ' δij + ijk δθk , (6.18)
a qual é visivelmente comutável nesta ordem. Pode-se facilmente inverter a relação acima com
o auxílio de (6.3h,j) para obter
1
δθi = ijk Ljk .
2
Qualquer rotação arbitrária pode então ser a princípio realizada com a composição de um
número grande de rotações arbitrárias executadas pela matriz (6.18).
6.5.3 T ENSORES ISOTRÓPICOS

Um tensor isotrópico (ou invariante) é aquele que mantém a forma matemática de seus com-
ponentes em qualquer sistema de coordenadas. Determinar quais são os possíveis tensores
isotrópicos com um determinado posto é importante, não somente do ponto de vista matemá-
tico, mas também físico, uma vez que este conhecimento terá consequências importantes para
diversas propriedades físicas de meios contínuos, propriedades tais como suas condutividades
elétrica e térmica, susceptibilidade magnética e resistência a tensões, para citar somente alguns
exemplos, quando esses meios são uniformes.
No exemplo 6.4 foi mostrado que os tensores de Kronecker e Levi-Civita são tensores isotrópi-
cos de postos dois e três, sob o ponto de vista de rotações próprias arbitrárias, uma vez que suas
componentes possuem os mesmos valores para qualquer orientação do sistema de coordenadas.
A questão que surge neste ponto é se existem outros tensores isotrópicos de mesmos postos e
de postos superiores.
Iniciando por tensores de posto dois, se Tij é isotrópico frente a rotações próprias arbitrárias,
então
Tij0 = Lik Lj` Tk` = Tij .
Como foi demonstrado na seção 6.5.2, uma rotação arbitrária pode sempre ser composta por
um número grande de rotações infinitesimais. Para a dedução da forma geral de um tensor
isotrópico, é conveniente então utilizar-se a matriz de rotação infinitesimal (6.18). Desta forma,
em ordem mais baixa nas rotações,
(δik + ikm δθm ) (δj` + j`n δθn ) Tk` = Tij ,

(j`m Ti` + ikm Tkj ) δθm = 0.
Como as rotações {δθm } são arbitrárias, então
jm` Ti` + imk Tkj = 0.
Multiplicando-se ambos os lados por jmr e somando sobre j e m, obtém-se
2Tij + Tji = Tkk δij .
Permutando-se os índices livres i ↔ j e subtraindo ambas as expressões, conclui-se que
Tij = Tji .
Ou seja, um tensor isotrópico é também simétrico. Retornando então à expressão anterior,

obtém-se que
1
Tij = Tkk δij .
3
Ou seja, a forma mais geral para um tensor isotrópico de posto dois é
Tij = λδij ,

sendo λ = Tr (T) /3 uma constante.

Considerando agora tensores de posto três, parte-se novamente de
0
Tijk = Li` Ljm Lkn T`mn = Tijk .
Inserindo novamente (6.18), obtém-se em ordem mais baixa nas rotações,
mis Tsjk + mjs Tisk + mks Tijs = 0. (6.19)
Multiplicando-se a equação acima sucessivamente por mir , mjr e mkr e somando,
2Tijk + Tjik + Tkji = δij Tssk + δik Tsjs
2Tijk + Tjik + Tikj = δji Tssk + δjk Tiss
2Tijk + Tkji + Tikj = δki Tsjs + δkj Tiss .
Multiplicando-se agora as equações acima respectivamente por δjk , δik e δij e somando, obtém-se
2Tiss + Tsis + Tssi = Tssi + Tsis Tiss = 0
2Tsis + Tiss + Tssi = Tssi + Tiss =⇒ Tsis = 0
2Tssi + Tiss + Tsis = Tsis + Tiss Tssi = 0.
Portanto, retornando ao sistema acima, conclui-se que
2Tijk + Tjik + Tkji = 0
2Tijk + Tjik + Tikj = 0
2Tijk + Tkji + Tikj = 0.
O que implica em que as soluções deste sistema devem satisfazer as relações
Tjik + Tkji = Tjik + Tikj =⇒Tkji = Tikj
Tjik + Tkji = Tkji + Tikj =⇒Tjik = Tikj
Tjik + Tikj = Tkji + Tikj =⇒Tjik = Tkji ,
ou seja,
Tikj = Tjik = Tkji = −Tijk .
Neste ponto, conclui-se que Tijk é antissimétrico ante uma permutação ímpar dos índices. Em
consequência, será simétrico frente a uma permutação par de índices, pois
Tijk = −Tjik = Tjki ou Tijk = −Tkji = Tkij ou . . . .
Retornando a (6.19), multiplica-se agora por δmi e, somando, obtém-se
ijs Tisk + iks Tijs = 0.
Como j e k são parâmetros livres, no primeiro termo somente são não nulos os termos onde i 6= s,
i 6= j e s 6= j, restando somente 2 termos. No segundo, somente são não nulos aqueles onde i 6= s,
i 6= k e s 6= k, restando também 2 termos. Pode-se escrever então, sem somas implícitas,
ijs Tiks − iks Tijs = 0.
Se k = j, a igualdade é trivialmente satisfeita. Por outro lado, se k 6= j, considerando-se os
símbolos de Levi-Civita, ou i 6= j 6= s, em cuja situação k deve ser necessariamente igual a i ou s
e o segundo termo é nulo, ou i 6= k 6= s, e então j deve ser igual a i ou s, quando então o primeiro
termo é nulo. Considerando-se todas as possibilidade, conclui-se então que
Tiij = Tiji = Tjii = 0,
ou seja, quando 2 índices são iguais, o componente do tensor é nulo.
Portanto, o tensor isotrópico T possui as mesmas propriedades do símbolo de Levi-Civita.
Conclui-se então que a forma geral de um tensor de posto 3 isotrópico deve ser dada por
Tijk = µijk ,
onde µ é uma constante.
Finalmente, a forma geral de um tensor isotrópico de posto quatro é,
Tijk` = αδij δk` + βδik δj` + γδi` δjk ,
sendo α, β e γ constantes, forma esta apresentada sem demonstração.

246 6.6. Rotações impróprias, pseudotensores e tensores duais
6.6 R OTAÇÕES IMPRÓPRIAS , PSEUDOTENSORES E TEN -

SORES DUAIS
Até este ponto, considerou-se sempre transformações próprias, no sentido atribuído pela ex-
pressão (6.9c), isto é, as transformações são tais que det (L) = +1. Na maior parte dos casos
considerados, assumiu-se explicitamente que a transformação em questão era uma rotação pas-
siva própria.
Contudo, outras transformações de interesse para a física existem. Dentre essas, uma de
particular importância são as rotações impróprias, para as quais det (L) = −1. Esta e outros tipos
de transformações impróprias são importantes para determinar a quiralidade de um determi-
nado objeto físico, ou seja, se este é invariante ou não frente a uma reflexão planar (ou se este é
idêntico ou não à sua imagem especular, ver seção 6.2.2).
Esta seção irá discutir aspectos relacionados com a transformação de tensores quando a lei
de transformação abrange tanto transformações próprias quanto impróprias.
6.6.1 R OTAÇÕES IMPRÓPRIAS E PSEUDOTENSORES

Uma rotação imprópria de um sistema de coordenadas pode ser executada através da com-
posição de duas transformações: uma transformação de paridade ou inversão espacial, para a
qual {xi } → {x0i } : x0i = −xi (i = 1, 2, 3), cuja matriz de transformação P é dada simplesmente por
Pij = −δij ,
seguida por uma rotação própria, executada pela matriz de rotação L(p) . Pode-se então construir
a matriz de rotação imprópria L(i) pela composição
(i) (p)
Lij = Lik Pkj ,

onde se verifica facilmente que det L(i) = det (P) = −1.
Conforme já foi introduzido na seção 6.2.2, um objeto de ordem zero é classificado como um
escalar ou pseudoescalar se este é, respectivamente, invariante ou muda de sinal frente a uma
transformação imprópria. Objetos físicos classificados como escalares consistem usualmente
nas propriedades intrínsecas da matéria tais como massa de repouso e carga elétrica, as quais
são assumidas invariantes frente a transformações arbitrárias por princípios que devem ser con-
tinuamente corroborados experimentalmente, sob as mais diversas condições. Adicionalmente,
outras quantidades físicas escalares, tais como trabalho mecânico e potencial elétrico, são obti-
das via produtos internos entre vetores. Por sua vez, objetos classificados como pseudoescalares
são usualmente construídos através de produtos internos entre vetores e pseudovetores; estes
objetos serão mencionados novamente a seguir.
Prosseguindo, um objeto de primeira ordem será denominado vetor polar ou, simplesmente,
vetor se satisfizer as leis de transformação (6.12), quer ela seja própria ou imprópria. Já um
vetor axial, que é na maior parte dos textos denominado também como pseudovetor, pode ser
definido então como uma tripla ordenada B = (B1, B2 , B3 ) que obedece as leis de transformação
Bi0 = det (L) Lij Bj , Bi = det (L) Lji Bj0 , (6.20)
onde det (L) 6= +1. Para transformações ortogonais, det (L) = −1.
A figura 6.5 ilustra uma transformação de paridade (P) ou inversão espacial (passiva) aplicada
a um referencial dextrógiro R. O primeiro aspecto digno de nota é que a transformação P
altera a quiralidade do referencial empregado, isto é, o referencial R dextrógiro transformou-se
no referencial R0 levógiro. Esta alteração de quiralidade não pode ser realizada por nenhuma
composição de rotações próprias.
Um vetor polar, tal como o vetor r representado na figura 6.5 tem seus componentes trans-
formados de acordo com (6.12); simultaneamente, os vetores de base { êi } também são transfor-
mados, de acordo com (6.7c), como ê0i = Pij êj . Portanto,
(
P xi → x0i = Pij xj = −xi
r− → r0 : mas r 0 = x0i ê0i = Pij Pik xj êk = xj êj = r,
êi → ê0i = Pij êj = − êi

x3
R B
r x´1
ê3 ê´1
P r´
ê2 x2 x´2 ê´2
ê1 ê´3
x1
B´ R´
x´3
Figura 6.5: Um sistema dextrógiro de coordenadas (R) é transformado em um sistema levórigo (R0 ) através de
uma transformação de paridade P. Observa-se também os comportamentos de um vetor (r) e de um pseudovetor
(B) frente a esta transformação.
uma vez que a transformação P é ortogonal. Ou seja, um vetor polar é um objeto geométrico
cujas características (módulo, direção e sentido) não são alteradas alteradas por uma transfor-
mação (própria ou imprópria).
Por outro lado, um vetor axial transforma-se de acordo com a lei (6.20), sendo o vetor axial
B representado na figura 6.5 um exemplo. Frente a uma inversão espacial, este se transforma
como
P
B− → B 0 : Bi → Bi0 = −Pij Bj = Bi , mas B 0 = Bi0 ê0i = −Pij Pik Bj êk = −B.
Ou seja, uma transformação de paridade inverte o sentido de um vetor axial, embora ele se
comporte como um vetor frente a transformações próprias. Diz-se então que os componentes
desta terna ordenada compõe um pseudovetor ou um pseudotensor Cartesiano de posto um.
Estendendo então o conceito de um pseudotensor a objetos de ordens mais altas, a defi-
nição de um tensor Cartesiano de ordem N é mantida como aquele objeto cujos componentes
transformam-se de acordo com a lei (6.14) frente a qualquer transformação (própria ou impró-
pria). Por sua vez, um pseudotensor de posto N é agora definido como aquele objeto cujos
componentes transformam-se de acordo com a lei de transformação
0
Tij···n = det (L) Lip Ljq . . . Lnr Tpq···r (6.21a)
0
Tij···n = det (L) Lpi Lqj . . . Lrn Tpq···r . (6.21b)
Ou seja, comporta-se como um tensor somente frente a transformações próprias.

Exemplo 6.9 (Símbolo de Levi-Civita). No exemplo 6.4, mostrou-se que frente a uma transfor-
mação L qualquer, o símbolo de Levi-Civita transforma-se como 0ijk = det (L) ijk . Para transfor-
mações próprias, como foi assumido no exemplo, este se comporta como um tensor. Entretanto,
para uma transformação imprópria L(i) ,
L(i)

{ijk } −−→ 0ijk /0ijk = det L(i) ijk = −ijk .

Portanto, a lei de transformação apropriada para o símbolo de Levi-Civita é (6.21),
0ijk = det (L) Li` Ljm Lkn `mn ,
sendo assim identificado como um pseudotensor de posto três.

Existem vários exemplos de vetores axiais na física. Em particular, vetores obtidos a partir
de produtos vetoriais ou rotacionais de vetores polares são os mais comuns. Assim, se a e b são
ambos polares, então o vetor c = a × b é axial, uma vez que este se comporta, frente a L(i) como
L(i)

(i) (i) (i) (i) (i)
c −−→ c0 = a0 × b0 =⇒ c0i = 0ijk a0j b0k = det L(i) Li` Ljm Ljq Lkn Lkr `mn aq br

x3 x3
x3
ê3 ê3
ê2 x2 x´2 ê´2
ê1 ê1
x1 x1x1 x1x1
B´ B
x2
J´ J
x1 (a) (b)
Figura 6.6: Reflexão sobre o plano x1 − x3 . (a) O vetor polarização elétrica P (polar) transforma-se em P 0 , o
qual é sua imagem especular. (b) O vetor indução magnética B (axial), frente a uma reflexão espacial, resulta
com a sua imagem especular invertida.

(i)
= det L(i) Li` `mn aq bn ,

(i)
c0i = det L(i) Li` c` ,
obedecendo a (6.20). A tabela 6.1 mostra exemplos de vetores axiais na mecânica clássica e no
eletromagnetismo.
Em termos das operações algébricas definidas na seção 6.4, a possibilidade de ocorrência
de operações mistas envolvendo tensores e pseudotensores merecem alguma consideração. Em
primeiro lugar, a operação de adição não faz sentido neste caso. Assumindo que a é um vetor
polar e c um vetor axial, então um possível objeto b decorrente da operação b = a + c seria
transformado, de acordo com (6.12a) e (6.20) como
L
→ b0 = a0 + c0 =⇒ b0i = a0i + c0i = Lij aj + det (L) Lij cj = Lij [aj + det (L) cj ] ,
b−
o que não satisfaz nenhuma das leis de transformação. Em particular, para transformações
impróprias, |c0 | = |a − c|!
Já o produto externo envolvendo tensores e pseudotensores pode resultar em objetos de
ordens mais altas de diferentes naturezas. Na construção do objeto Z realizada por
Z = A ⊗ B ⊗ · · · ⊗ Y,
se houver N pseudotensores-pais, a lei de transformação de Z será

0 N
Zi···k = [det (L)] Liq . . . Lkr Zq···r ,
ou seja, Z será um tensor se N for par ou um pseudotensor se N for ímpar.

Observa-se que a mesma propriedade é válida para o caso do produto interno entre tensores
e/ou pseudotensores. De particular importância para a teoria da interação eletrofraca, a heli-
cidade de uma partícula é determinada pelo produto interno h = p · S, sendo p o momentum
linear transportado pela mesma e S o seu spin. Como o momentum linear é um vetor polar e o
spin é um vetor axial, a quantidade h é um pseudotensor de posto zero ou um pseudoescalar.
Se a helicidade da partícula é positiva, então seu spin tem orientação dextrógira. Se h < 0, a
partícula tem spin com orientação levógira. Uma transformação de paridade inverte os sinais de
h.
Inversões espaciais, como exemplo de transformações impróprias, não são a única possibili-
dade coletivamente denominada de transformações de paridade. Comportamentos semelhantes

são obtidos por operações de reflexão no plano, representadas na figura 6.6. Uma reflexão sobre
o plano x1 − x3 é realizada por intermédio da matriz de transformação
 
1 0 0
P(r) = 0 −1 0 .
0 0 1
Neste caso, um vetor polar como a polarização elétrica P transforma-se, de acordo com (6.12a),
como
P(r)
P −−→ P 0 = (P1 , −P2 , P3 ) ,
ou seja, somente a componente P2 muda de sinal, o que corresponde à imagem especular de P
sobre um espelho colocado no plano x1 − x3 . Esta operação está representada na figura 6.6a.
Já um vetor axial, como a indução magnética B, por exemplo, transforma-se, de acordo com
(6.20), como
P(r)
B −−→ B 0 = (−B1 , B2 , −B3 ) ,
o que corresponde a uma reflexão especular seguida por uma inversão de sentido. Esta operação
está ilustrada na figura 6.6b. Nesta, uma espira circular que conduz uma corrente elétrica com
densidade J , gerando assim o campo B de acordo com a lei de Biot-Savart, também é refletida
sobre o plano x1 − x3 . Como posição e J são polares, os vetores transformados são as imagens
especulares destes. Porém, o campo B sofre adicionalmente uma inversão, resultando em uma
componente B2 inalterada.
A análise do comportamento das leis físicas frente a transformações de paridade é um tópico
importante na atualidade. Dentre as quatro interações fundamentais, as equações da gravi-
tação, do eletromagnetismo e das interações fortes são invariantes frente a transformações de
paridade.
Por exemplo, a imagem especular do campo B gerado pela corrente J na espira, ilustrada
na figura 6.6b, está orientada de tal forma que as leis de Biot-Savart e Faraday permanecem
válidas em um mundo virtual que seria a reflexão especular do mundo real. A operação de
reflexão, ditada por P(r) , transforma-se em uma inversão espacial completa, ditada por P, se a
imagem especular for girada em 180◦ em torno do eixo x2 (figura 6.5). Neste caso, a imagem
refletida seria indistinguível do sistema físico real. Portanto, para uma interação invariante
com a transformação de paridade, o mundo virtual é indistinguível do mundo real, o que está
em acordo com a suposição de que leis físicas devem ser invariantes frente a transformações
realizadas sobre o referencial utilizado.
Já a interação fraca apresenta uma quebra de simetria no de-
caimento β. Dentre os léptons sujeitos à interação fraca, somente
partículas cujos spins estao no sentido levógiro e anti-partículas
com spins no sentido dextrógiro interagem através da força fraca.
A combinação inversa é proibida pelo modelo padrão, violando a
paridade da interação.
Esta quebra de paridade foi sugerida por T. D. Lee e C. N. Yang
em 1956 e verificada no ano seguinte por dois experimentos in-
dependentes. O primeiro experimento consistiu na observação de
elétrons emitidos pelo decaimento β de núcleos de cobalto, con-
forme está representado na figura 6.7. A baixas temperaturas,
a maior parte dos núcleos podem ser mantidos com seus spins
alinhados com um campo magnético externo. O elipsóide da es-
querda na figura ilustra um grande número de núcleos de 60 27 Co,
os quais decaem de acordo com a fórmula
60
27 Co −→ 60
28 Ni + e− + ν̄e + γ.
Figura 6.7: Violação de paridade
A seta vermelha indica o sentido de giro dos núcleos, o que sig- no decaimento β de núcleos de
nifica que estes têm seu spin no sentido dextrógiro. Já a imagem cobalto-60.
da direita representa a imagem especular e, portanto, o sentido
do spin nuclear S N é invertido por ser um vetor axial. No experimento, os elétrons emitidos por
decaimento β com momentum linear pe mostraram uma correlação notável com o pseudoescalar
hN e = S N · pe , sendo emitidos preferencialmente na direção e sentido determinados por hN e < 0.

De acordo com a teoria eletrofraca, os elétrons emitidos são levógiros (he < 0) e os anti-neutrinos
do elétron (ν̄e ) são dextrógiros (hν̄ > 0).
Na imagem especular à direita na figura 6.7, o spin nuclear S N resulta invertido, mas pe não
o é, resultando em uma inversão de sinal dos pseudoescalares hN e , he e hν̄ . A inversão espacial
torna-se completa se o espelho for girado em 180◦ , quando então o spin nuclear volta a sua
orientação original, mas os elétrons seriam observados sendo emitidos preferencialmente para
cima.
Em outras palavras, a imagem no mundo virtual é distinguível do sistema físico real, ao
contrário do que ocorre com as outras interações fundamentais. A dependência da força fraca
com o pseudoescalar hN e cria uma violação do princípio de invariância na transformação de
paridade que não é observada nas outras interações fundamentais. Adicionalmente, a helicidade
dos léptons envolvidos no decaimento β também seria invertida em comparação com o mundo
real, o que ressalta ainda mais a violação de paridade nesta interação fundamental.
O outro experimento foi realizado em um anel de cíclotron e investigou a helicidade dos
léptons emitidos nos decaimentos
π + −→ µ+ + νµ
µ+ −→ e+ + νe + ν̄µ .
Este experimento verificou a polarização sugerida por Lee & Yang, segundo a qual as partículas
são emitidas no sentido levógiro enquanto que as anti-partículas são dextrógiras. Esta prefe-
rência na helicidade das partículas e anti-partículas que interagem via força fraca evidenciam a
quebra de paridade na interação.16
Uma observação importante deve ser feita agora relativa à realidade física dos pseudotenso-
res. Alguns textos argumentam que objetos geométricos tais como vetores e tensores somente
podem ser atribuídos a quantidades que possuem realidade física se não forem alterados por
transformações arbitrárias no sistema de coordenadas. Neste caso, pseudovetores e pseudoten-
sores deveriam ser considerados meramente objetos matemáticos abstratos que não poderiam
descrever quantidades tais como momentum angular e indução magnética.
A solução para este aparente dilema é encontrada se as transformações de paridade não
forem realizadas de forma passiva, como foi assumido até este momento, mas sim de forma
ativa, isto é, o sistema físico é fisicamente rotado em torno da origem do referencial por 180◦ , de
tal forma que
P (ativa)
r −−−−−→ r 0 = −r.
A figura 6.8 ilustra uma inversão espacial ativa em torno da origem. Neste caso, o sistema de
coordenadas permanece sempre dextrógiro, mas as quantidades vetoriais são transformadas de
acordo com sua paridade frente a esta inversão ativa. Qualquer rotação passiva posteriormente
aplicada após a inversão será sempre própria, e assim a quiralidade do referencial não é alterada
e, portanto, todas os objetos geométricos são tensores que satisfazem as leis de transformação
(6.14).
Realizando esta inversão ativa, os vetores podem então ser classificados como vetores polares,
os quais são ímpares frente à inversão, tais como os vetores r e p na figura 6.8 e vetores axiais,
os quais são pares frente à inversão, tais como os vetores L = r × p e S (spin). Agora, porém,
ambos os tipos de vetores podem ser classificados como tensores de posto um, uma vez que todas
as transformações doravante aplicadas ao sistema de coordenadas serão próprias.
Contudo, é importante mencionar também que pseudoescalares ainda são necessários para
teorias físicas que prevêem quebra de paridade, tal como a teoria eletrofraca. Na interpretação de
que transformações de paridade devem ser ativas, estes pseudoescalares continuam existindo.
Um exemplo é fornecido pelos vetores p e S na figura 6.8, onde se verifica que a helicidade
h = p · S continua mudando de sinal, mesmo frente a uma transformação de paridade ativa.
Pode-se verificar também que o produto externo misto entre vetores polares e axiais continua
gerando tensores de postos mais altos, mas o produto interno entre dois tensores criados desta
maneira pode resultar em um pseudotensor.
16 A violação da simetria quiral possui uma importância vital na bioquímica e na genética. Uma discussão atual a
respeito deste assunto pode ser encontrada no doi: 10.1103/RevModPhys.85.603.

x3 x3
R p R
L S
dr dr
r+ L0
r P (ativa)
−−−−−−−→
x2 r0 x2
dr 0 0
x1 dr
0 + x1
r
0
p
S0
Figura 6.8: Inversão espacial ativa realizada sobre um sistema físico. Vetores polares são invertidos, mas vetores
axiais permanecem invariantes.
6.6.2 T ENSORES DUAIS

Independente da polêmica com relação a pseudotensores, estes têm sido empregados em
diversas teorias físicas, mesmo em teorias invariantes frente a transformações de paridade.
Um tipo de pseudotensor com frequência empregado é o tensor dual. Na sua definição,
usualmente faz-se uso do símbolo de Levi-Civita. Realizando produtos internos deste com um
tensor totalmente antissimétrico conhecido, pode-se criar um tensor dual de posto igual ou
inferior, dependendo da necessidade.
Um exemplo pode ser dado tomando-se o tensor A, totalmente antissimétrico, isto é, Aij =
−Aji , o que implica que Tr (A) = 0. Com ijk , pode-se definir então o pseudovetor p, cujos
componentes são
1
pi = ijk Ajk . (6.22a)
2
Ou, reciprocamente, multiplicando-se a expressão acima por ijk e contraíndo os índices, obtém-
se
1 1
ijk pi = ijk i`m A`m = (Ajk − Akj ) =⇒ Aij = ijk pk . (6.22b)
2 2
Pode-se criar também um pseudoescalar s a partir agora de um tensor C de posto 3 totalmente
antissimétrico,
1
s = ijk Cijk .
3!
Então, multiplicando ambos os lados por ijk e usando (6.3), resulta
1
ijk s = ijk `mn C`mn =⇒ Cijk = sijk .
3!
Tensores duais são empregados, por exemplo, na formulação covariante do eletromagne-
tismo, onde o dual do tensor de campo é empregado para expressar a forma covariante das
equações homogêneas de Maxwell. Para tanto, faz-se uso de um pseudotensor de posto quatro,
o qual é a extensão do símbolo de Levi-Civita para um espaço vetorial de dimensão quatro.
6.6.3 T ENSORES IRREDUTÍVEIS

Um uso para tensores duais está na representação de um tensor qualquer em formas irre-
dutíveis. Para exemplificar, emprega-se um tensor de posto dois qualquer T . Da seção 6.4.2,
sabe-se que é possível representar todos os seus componentes em partes simétrica TijS e antis-

simétrica TijA . Para a parte antissimétrica, cria-se o pseudovetor u de acordo com (6.22),
1 1
ui = ijk TijA = ijk (Tij − Tji ) ⇐⇒ TijA = ijk uk .
2 4
252 6.7. Tensores generalizados
Já da parte simétrica, substrai-se o traço da matriz T, definindo-se então o tensor

1 1 1
Sij = TijS − Tr (T) δij = (Tij + Tji ) − Tr (T) δij .
3 2 3
Portanto, o tensor T pode agora ser representado pelas suas partes irredutíveis,
1
Tij = Tr (T) δij + ijk uk + Sij ,
3
as quais são compostas por tensores de posto zero, um e dois.
6.7 T ENSORES GENERALIZADOS

As seções anteriores restringiram-se ao estudo de tensores descritos em termos de coorde-
nadas Cartesianas e os tipos de transformação passiva aplicados a este sistema aos quais foi
dedicada a maior atenção foram as rotações rígidas dos eixos coordenados e as transformações
de paridade.
A partir desta seção, os conceitos e propriedades considerados anteriormente serão generali-
zados para transformações arbitrárias aplicadas sobre um sistema de coordenadas geral e que
levam a outro sistema. Antes de se abordar tensores propriamente ditos, será realizada uma
revisão e adaptação das propriedades matemáticas de sistemas de coordenadas curvilíneas, dis-
cutidas no capítulo 1. Posteriormente, essas propriedades serão generalizadas e aplicadas a
tensores de postos arbitrários.
6.7.1 C OORDENADAS CURVILÍNEAS GENERALIZADAS

Fazendo referência novamente à figura 1.1, a posição de um ponto P arbitrário no espaço
E 3 pode ser expressa em termos de uma terna ordenada de números (q1 , q2 , q3 ), as quais são as
coordenadas deste ponto dentro do sistema de coordenadas curvilíneas adotado.
Qualquer vetor neste espaço, sendo o vetor posição r um caso particular, pode ser expresso
em termos de uma combinação linear de duas bases apresentadas na seção 1.1, as bases {ei } e
{i }, dadas por
∂r
ei = e i = ∇qi ,
∂qi
sendo i = 1, 2, 3. Em geral estes vetores não formam bases ortonormais. Por outro lado, ambos
os conjuntos sempre formam duas bases recíprocas no E 3 , isto é,
ei · j = δij .
Dentro do contexto de tensores generalizados, uma das modificações necessárias está na

posição dos índices, tanto livres quanto mudos, que identificam os componentes i dos mesmos.
Devido a esta modificação, a base { i } será doravante identificada por e , com a equivalência
{1 , 2 , 3 } ↔ e1 , e2 , e3 .
Adicionalmente, a convenção de somas implícitas introduzida na seção 6.1.1 será modificada.
Doravante, qualquer índice minúsculo que apareça exatamente duas vezes em qualquer com-
ponente ou expressão, uma vez como subscrito e uma vez como superescrito, será somado sobre
todos os valores que um índice naquela posição pode assumir, exceto quando for realizada uma
observação explícita ao contrário.
Com esta nova convenção de posicionamento dos índices, a relação de reciprocidade entre as
bases possíveis para um dado sistema de coordenadas curvilíneas passa a ser escrita como
ei · ej = δij , (6.23)
sendo δij o mesmo tensor delta de Kronecker discutido em detalhes na seção 6.1.2.
Pela mesma razão, as coordenadas curvilíneas do ponto P serão também doravante identifi-
cadas por índices superescritos P = q 1 , q 2 , q 3 , de tal forma que as bases passam a ser obtidas
pelas expressões
∂r
ei = i e ei = ∇q i . (6.24)
∂q

Nestas expressões nota-se que a derivação em relação a uma coordenada cujo índice está na
posição superior resulta em um objeto com o mesmo índice na posição inferior.
Posteriormente, será demonstrado que o operador derivação em relação a coordenada contra-
variante q i ∂/∂q i comporta-se, frente a uma transformação qualquer, como o i-ésimo compo-
nente de um vetor covariante. Em muitos textos, costuma-se escrever, de forma resumida,
∂
∂i ≡ .
∂q i
De forma equivalente,
∂
∂i ≡,
∂qi
o qual se comporta como a i-ésima coordenada de um vetor contravariante.
Dadas bases (6.24), um vetor a ∈ E 3 qualquer será escrito em termos de combinações lineares
das mesmas de duas formas equivalentes,
a = a1 e1 + a2 e2 + a3 e3 = ai ei
a = a1 e1 + a2 e2 + a3 e3 = ai ei .

Da mesma forma como foi mencionado para a expressão (1.9), as coordenadas ai são deno-
minadas as componentes contravariantes do vetor a, ao passo que as coordenadas {ai } são as
componentes covariantes do mesmo. A posição dos índices distingue os dois tipos de compo-
nentes entre si. Por conseguinte, os vetores {ei } formam uma base covariante no E 3 , ao passo
i
que e formam uma base contravariante no mesmo espaço vetorial. Obviamente, os diferentes
componentes do vetor a são dados por
ai = a · ei e ai = a · ei .
A distinção entre coordenadas covariantes e contravariantes não foi realizada para tensores
Cartesianos porque neste sistema ambas as bases são idênticas. Contudo, em sistemas genera-
lizados isto não é necessariamente verdade.
A partir deste momento, a designação de tensores também deverá ser alterada, em função
das distintas posições que seus índices podem adotar. Uma definição formal de um tensor de
posto arbitrário será realizada posteriormente. Neste momento, será empregado somente um
tensor de posto dois, para exemplificar a identificação. Um tensor T de posto dois pode ser
escrito e/ou construído de diferentes maneiras. Se for empregado o produto externo de dois
vetores a e b, escritos em termos de uma ou ambas as bases em (6.24), as possibilidades são:
1. Sendo a = ai ei e b = bi ei , então T = a ⊗ b = ai bj ei ⊗ ej , de onde se identifica T ij = ai bj , os
quais são os componentes contravariantes do tensor T .
2. Sendo a = ai ei e b = bi ei , então T = a ⊗ b = ai bj ei ⊗ ej , identificando-se T ij = ai bj como os
componentes mistos do tensor T . Outra possibilidade é T = Ti j ei ⊗ ej .
3. Sendo a = ai ei e b = bi ei , então T = ai bj ei ⊗ ej , identificando-se Tij = ai bj como os compo-
nentes covariantes do tensor T .
É importante ressaltar que T ij , T ij ou Tij formam três conjuntos distintos de componentes
do mesmo tensor T , porém correspondentes a diferentes construções dos vetores de base do
sistema de coordenadas.
As expressões acima envolvendo o produto escalar entre dois vetores merece uma maior aten-
ção neste momento. Na notação tensorial covariante empregada nesta seção, uma contração de
índices (ou seja, a soma implícita dos mesmos) somente será realizada se um estiver na posição
contravariante e o outro na posição covariante. De acordo com esta convenção, o produto esca-
lar entre os vetores a e b somente pode ser escrito na forma usual, ou seja, em termos da soma
dos produtos das respectivas coordenadas dos mesmos, da seguinte maneira,
a · b = ai bi ou a · b = ai bi . (6.25a)
Este resultado está garantido graças à condição de reciprocidade (6.23), pois com esta pode-se
escrever
a · b = ai ei · bj ej = ai bj ei · ej = ai bj δji = ai bi ,

(6.25b)
ou vice-versa. Esta discussão terá prosseguimento na próxima seção, quando for discutida a
operação de elevação ou rebaixamento de índices.

6.7.2 O ESPAÇO DE R IEMANN E O TENSOR DE MÉTRICA

Conforme já foi discutido na seção 1.1, a métrica de qualquer espaço Riemanniano é com-
pletamente determinada pelo tensor de métrica g, o qual é um tensor de posto dois. Antes de se
prosseguir com a apresentação das propriedades do tensor de métrica, é conveniente definir-se
de forma mais rigorosa o espaço de Riemann ou o espaço Riemanniano.
O espaço (métrico) de Riemann é a generalização do espaço métrico Euclideano En definido
no exemplo 4.2. Esta generalização é realizada tanto na dimensão arbritrária do espaço quanto
na definição de sua métrica, a qual passa a descrever tanto espaços planos, como o Euclideano,
como espaços curvos, importantes para as teorias modernas em física e matemática.
Definição 6.9 (Espaço métrico de Riemann). Seja
Rn ≡ R × · · · × R = q 1 , . . . , q n | q j ∈ R, j = 1, . . . n

| {z }
n vezes
o conjunto de todas as n-uplas ordenadas obtidas a partir do produto Cartesiano do corpo dos
números reais e com valores determinados por um sistema de coordenadas X. Seja d` um
elemento de arco medido em X e cujo valor é determinado pela métrica Riemanniana
d`2 = gij dq i dq j , (6.26)
onde g = [gij ] é o tensor de métrica que satisfaz as condições:

1. As componentes gij q 1 , . . . , q n do tensor de métrica pertencem à classe C 2 (Rn ).
2. O tensor g = [gij ] é simétrico, i. e., gij = gji .
3. O tensor g = [gij ] é não singular, i. e., det [gij ] 6= 0.
4. A forma diferencial (6.26) é invariante frente a uma troca arbitrária de coordenadas.

.
Então, estrutura Rn = hRn , gi forma o Espaço Riemanniano de dimensão n.
Os componentes do tensor de métrica são obtidos a partir da base covariante {ei } e são dados
por (1.8),
gij = ei · ej , (6.27a)
o que mostra claramente que o tensor de métrica é simétrico.
Se o sistema de coordenadas é ortogonal, ei · ej = 0 para j 6= i. Neste caso, é conveniente
empregar-se mais uma vez os fatores de escala hi , definidos em (1.11), com os quais se pode
escrever a base ortonormal { êi } como êi = ei /hi , ressaltando-se que neste caso i é um índice
livre. Assim, o tensor de métrica fica escrito simplesmente como
gij = h2i δij (i : índice livre) . (6.27b)
6.7.2.1 O PERAÇÃO DE ELEVAÇÃO OU REBAIXAMENTO DE ÍNDICE
O tensor de métrica possui uma outra função na álgebra tensorial covariante que é de ex-
trema importância. Ele possibilita alterar-se a posição (contra- ou covariante) de um determi-
nado índice (livre ou mudo).
Para se mostrar como esta operação ocorre, retoma-se a discussão do produto escalar entre
os vetores a e b realizada no final da seção anterior. Ressaltando que, como estes são tensores de
posto um, o objeto resultante de seu produto interno deve ser um escalar, que possui o mesmo
valor seja qual for a representação ou sistema de coordenadas adotado para os vetores. Por isto,
uma expressão alternativa às obtidas acima para o produto escalar é
a · b = ai ei · bj ej = ai bj ei · ej = gij ai bj ,

onde se nota o surgimento do tensor de métrica, devido a sua definição. Comparando-se com
uma das expressões (6.25), percebe-se que, necessariamente,
ai = gij aj .

Ou seja, uma componente covariante de a é obtida a partir de suas componentes contravari-

antes com o uso do tensor de métrica. Diz-se então que o índice foi rebaixado para a posição
covariante.
Por outro lado, da mesma forma como a expressão (6.27) define o tensor de métrica co-
variante, pode-se também definir o mesmo tensor com seus componentes escritos na forma
contravariante através de
g ij = ei · ej . (6.28)
Ressalta-se que os componentes de g ij são, em geral, distintos dos respectivos componentes de
gij .
Desta maneira, o produto escalar entre a e b também pode ser escrito como
a · b = ai ei · bj ej = g ij ai bj .

Nota-se agora que ai = g ij aj , ou seja, foi realizada a elevação o índice para a posição contravari-
ante por intermédio também do tensor de métrica.
A capacidade do tensor de métrica de realizar a mudança na posição de um determinado
índice não se restringe aos componentes de tensores de posto um. Este pode ser empregado
também para mover o índice de um vetor de base. Ou seja, se ek · ej = δkj , multiplicando-se
ambos os lados por gji e realizando a soma implícita,
ek · ej gji = δkj gji = gki = ek · ei .
Portanto, observa-se que ei = gij ej , uma vez que o tensor de métrica é simétrico. A partir do
produto externo, verifica-se facilmente que o tensor de métrica pode realizar a mesma operação
em qualquer índice de um tensor de posto dois ou superior, ou seja,
T ij = T ik gkj ou T ij = T ik g kj , etc.
Finalmente, a relação entre gij e g ij também é facilmente derivada. Dado o i-ésimo compo-
nente do vetor a, pode-se escrever
ai = g ij aj , mas, aj = gjk ak . Portanto, ai = g ij gjk ak .
Este resultado implica em que

g ik gkj = δji , (6.29)
ou seja, usando uma representação matricial para o tensor de métrica e denotando-se g = [gij ],
a sua inversa será g−1 = g ij .

Finalmente, a forma mista (contra- e covariante) do tensor de métrica pode ser obtida dire-
tamente do resultado anterior, empregando-se o mesmo para alterar a posição de um de seus
índices,
g ij = g ik gkj = δji . (6.30)
6.7.2.2 E LEMENTOS INFINITESIMAIS DE ARCO E VOLUME
Continuando com a discussão realizada na seção 1.1, se dr = dq i ei é o vetor deslocamento

infinitesimal em um espaço Riemanniano escrito em termos da base {ei }, a norma ou o elemento
infinitesimal de arco deste espaço é dado pela métrica (6.26), isto é,
d`2 = dr · dr = gij dq i dq j .
Considera-se agora a base canônica. De acordo com o que foi demonstrado no exercicio 1.2,
para sistemas ortogonais resulta { x̂i } = x̂i . Além disso, como os fatores de escala são todos

unitários, resulta também que xi = xi . Assim, os vetores de base {ei } podem ser novamente
expressos, conforme as definições (6.24) e (1.7a), como
∂r ∂xj ∂xj j
ei = i
= x̂j = x̂ ≡ H ji x̂j = Hji x̂j , (6.31)
∂q ∂q i ∂q i
respectivamente, sendo agora
∂xi ∂xi
H ij = e Hij = j ,
∂q j ∂q

onde H é a matriz de transformação do sistema Cartesiano ao curvilíneo, cujo determinante

corresponde ao Jacobiano da transformação. Portanto, o tensor de métrica pode ser escrito
também como
gij = ei · ej = H ki H`j x̂k · x̂` = H ki H`j δk` = H ki Hkj , (6.32)
a qual é simplesmente a expressão (1.8) já obtida.
Por sua vez, o elemento de arco ao longo da i-ésima coordenada curvilínea é escrito como
dì = dq i ei , sendo que neste caso não se realiza a soma implícita. Portanto, o elemento de arco
na direção de q i pode ser escrito como dì = dq i H ji x̂j .
De acordo com a discussão realizada na página 8, o elemento de volume delimitado pelos
arcos {d`1 , d`2 , d`3 }, independente destes serem ortogonais ou não, é sempre dado por
d3 r = |d`1 · (d`2 × d`3 )| = |e1 · (e2 × e3 )| dq 1 dq 2 dq 3 .
Portanto,
d3 r = H i1 H j2 H k3 x̂i · ( x̂j × x̂k ) dq 1 dq 2 dq 3 = ijk H i1 H j2 H k3 dq 1 dq 2 dq 3 .

É conveniente neste ponto introduzir-se alguns resultados oriundos da álgebra de matrizes.

Sendo A e B duas matrizes 3×3 não singulares, e sendo B = A−1 , recorda-se a expressão (6.15), a
qual fornece o determinante da matriz A. Esta expressão pode ser adaptada para a notação co-
variante empregada nesta seção de diversas maneiras, como apresentado a seguir, onde também
é apresentada uma expressão para os elementos da matriz B,
det (A) ijk = Aim Ajn Ak` mn` (6.33a)

m n `
det (A) ijk = A i A j A k mn` (6.33b)
2 det (A) B ij = ik` jmn Amk An` . (6.33c)
As operações de elevação ou rebaixamento de índices envolvidas nas expressões acima são

realizadas com o emprego do tensor de métrica e serão discutidas em breve. Desta forma, resulta
e1 · (e2 × e3 ) = det (H)
e o elemento de volume fica escrito
d3 r = |det (H)| dq 1 dq 2 dq 3 = |J| dq 1 dq 2 dq 3 ,
lembrando que
∂ x1 , x1 , x3
J ≡ det (H) =
∂ (q 1 , q 2 , q 3 )
é o Jacobiano da transformação do sistema Cartesiano ao curvilíneo. Esta é novamente a ex-
pressão para o elemento de volume já obtida em (1.21b).
Agora, o determinante do tensor de métrica também pode ser calculado com as expressões
acima. Usando então a expressão (6.32) para o mesmo,
2
det (g) = ijk g1i g2j g3k = ijk Hì Hmj Hnk H `1 H m2 H n3 = det (H) `mn H `1 H m2 H n3 = [det (H)] .
Ou seja, p
e1 · (e2 × e3 ) = det g
e o elemento de volume pode ser escrito na forma generalizada como
p
d3 r = det gdq 1 dq 2 dq 3 ,
o qual é um resultado importante, válido também para sistemas de coordenadas não ortogonais.
Algumas relações adicionais envolvendo as bases e o tensor de métrica são úteis para aplica-
ções posteriores. Em primeiro lugar, o produto triplo entre os vetores da base covariante pode
ser escrito de uma forma geral como
√
ei · (ej × ek ) = gijk , (6.34)
o que pode ser facilmente verificado. No resultado acima, definiu-se g ≡ det (g) para simplificar
a notação.

Deseja-se agora escrever os vetores de uma base como combinações lineares de vetores da
base recíproca. Isto é realizado através da operação de elevação ou rebaixamento de índices
executada pelo tensor de métrica, isto é,
ei = g ij ej e ei = gij ej .
Porém, empregando-se (6.33c) e (6.29), pode-se escrever 2gg ij = ik` jmn gmk gn` . Portanto, para
ei ,
1 ik` jmn
ei = gkm g`n ej .
2g
Empregando-se novamente as relações (6.31) e (6.32), resulta então
1 ik` jmn q r 1
ei = H k H ` Hqm Hrn Hpj x̂p = √ ik` qrp H qk H r` x̂p ,
2g 2 g
onde foi usado também (6.33a). Comparando este resultado com o produto
ei × ej = H ki H `j x̂k × x̂` = k`r H ki H `j x̂r ,
conclui-se que
1
ei = √ ik` (ek × e` ) . (6.35a)
2 g
Uma outra expressão útil pode ser agora obtida a partir deste resultado,
1 ik` jmn
ei × ej = (ek × e` ) × (em × en ) .
4g
Como (a × b) × (c × d) = d· (a × b) c − c· (a × b) d, o produto triplo (6.34) mostra que
1 ik` jmn 1
ei × ej = [en · (ek × e` )] em = √ ijk ek , (6.35b)
2g g
√
g
ei = ijk ej × ek . (6.35c)
2
Finalmente, se o sistema de coordenadas for ortogonal, então de (6.27b) e de (6.29) pode-se
deduzir a forma para os componentes contravariantes do tensor de métrica. Se j 6= i, resulta
gik g kj = 0 =⇒ h2i g ij = 0 =⇒ g ij = 0, (j 6= i) .
Por outro lado, se j = i, então

gik g ki = 1 =⇒ g ii = 1/h2i .
Portanto,
δ ij
g ij =
h2i
para um sistema ortogonal.
Da mesma forma,
g = h21 h22 h23 =⇒ d3 r = h1 h2 h3 dq 1 dq 2 dq 3 .
6.8 T RANSFORMAÇÕES GENERALIZADAS DE COORDE -

NADAS E TENSORES GENERALIZADOS
A discussão realizada no capítulo 1 e na seção 6.7 restringiu-se a transformações realizadas
do sistema Cartesiano para um sistema curvilíneo. Nesta seção esta discussão será generali-
zada para incluir qualquer transformação do tipo Rn 7−→ Rn realizada entre dois sistemas de
coordenadas quaisquer.
Parte-se então de um sistema de coordenadas {q1 , q2 , q3 } e, a partir de uma lei de transforma-
ção bem definida, obtém-se o novo sistema de coordenadas curvilíneas {q10 , q20 , q30 }, obtido a partir
de
q 0i = q 0i q 1 , q 2 , q 3 ,

(6.36a)

258 6.8. Transformações generalizadas de coordenadas e tensores generalizados
sendo que a transformação inversa
q i = q i q 01 , q 02 , q 03

(6.36b)
também deve estar definida.

Duas observações importantes a serem realizadas neste ponto são que as leis de transforma-
ção (6.36a,b) não são necessariamente lineares; ou seja, os elementos das matrizes de transfor-
mação podem ser funções das coordenadas, ao contrário do que foi considerado na seção 6.3,
onde as matrizes de rotação, por exemplo, dependem somente de um ângulo fixo de rotação.
Também devido a isso, as matrizes de transformação não são necessariamente ortogonais.
A exemplo do que foi feito em (6.24), os dois conjuntos de vetores de base no novo sistema de
coordenadas são dados por
∂r
e0i = 0i e e0i = ∇q 0i .
∂q
Considerando-se agora a base {e0i }, observa-se que, como
∂r ∂q 0j ∂r
= ,
∂q i ∂q i ∂q 0j
então os vetores das bases {ei } e {e0i } relacionam-se através da relação
∂q 0j 0
ei = e .
∂q i j
Como um vetor qualquer a ∈ E 3 pode ser escrito em termos de qualquer uma destas bases,
∂q 0i 0
a = ai ei = a0i e0i =⇒ a0i e0i = aj e,
∂q j i
isto significa que a lei de transformação dos componentes contravariantes do vetor a deve ser
∂q 0i j
a0i = a . (6.37a)
∂q j

Esta será então a condição necessária e suficiente para que um conjunto de objetos ai formem
as componentes contravariantes de um tensor de posto um.
Considerando-se agora a situação inversa, sabendo que
∂r ∂q j ∂r
= ,
∂q 0i ∂q 0i ∂q j
em virtude da transformação inversa (6.36b), observa-se que
∂q j
e0i = ej .
∂q 0i
Portanto, para o vetor a escreve-se
∂q i
a = a0i e0i = ai ei =⇒ ai ei = a0j ei ,
∂q 0j
ou seja,
∂q i 0j
ai = a , (6.37b)
∂q 0j
a qual é a transformação inversa de (6.37a).
Por outro lado, considerando agora a base e0i , pode-se escrever o operador ∇ em termos
de suas componentes Cartesianas, obtendo-se então
∂q i k ∂q i ∂q 0j k ∂q i
∇q i = x̂ = x̂ = ∇q 0j .
∂xk ∂q 0j ∂xk ∂q 0j
Ou seja,
∂q i 0j
ei = e .
∂q 0j

Dado agora o mesmo vetor a, escreve-se o mesmo agora como
∂q j
a = ai ei = a0i e0i =⇒ aj e0i = a0i e0i ,
∂q 0i
ou seja, a lei de transformação dos componentes covariantes do vetor a deve ser
∂q j
a0i = aj . (6.38a)
∂q 0i
Esta será a condição necessária e suficiente para que o conjunto {ai } contenha os componentes
covariantes de um tensor de posto um.
Realizando agora a transformação inversa, escreve-se
∂q 0i ∂q 0i ∂q j ∂q 0i
∇q 0i = k
x̂k = j k
x̂k = ∇q j .
∂x ∂q ∂x ∂q j
Ou seja,
∂q 0i j
e0i = e .
∂q j
Assim,
∂q 0j i
a = a0i e0i = ai ei =⇒ ai ei = a0j e,
∂q i
ou seja, a transformação inversa de (6.38a) é
∂q 0j 0
ai = a . (6.38b)
∂q i j
Partindo das leis de transformação (6.37) e (6.38), definem-se agora os componentes con-
travariante, mistos e covariantes de um tensor generalizado de posto dois T respectivamente
como
∂q 0i ∂q 0j k`
T 0ij = T
∂q k ∂q `
∂q 0i ∂q ` k
T 0ij = T
∂q k ∂q 0j `
∂q k ∂q `
Tij0 = 0i 0j Tk` .
∂q ∂q
Pode-se generalizar agora a definição de um tensor com um número arbitrário de índices con-
travariantes e/ou covariantes. Esta forma generalizada possui várias designações na literatura.
Assumindo que o tensor T possua r índices na posição contravariante e s índices na posição
covariante, o seu posto é N = r + s e este é denominado um tensor do tipo (r, s) ou tensor
de valência (r, s) ou ainda tensor r-vezes contravariante e s-vezes covariante. A notação
empregada também varia na literatura. De acordo com a notação empregada neste texto até o
presente momento, os índices mistos de um tensor devem apresentar-se espaçados. Contudo,
esta regra pode ser flexibilizada para facilitar a notação e visualização das expressões.
Portanto, um tensor T é do tipo (r, s) se os seus componentes transformarem-se de acordo
com
∂q 0i1 ∂q 0ir ∂q `1 ∂q `s k1 ···kr
T 0i1 ···irj1 ···js = · · · · · · T `1 ···`s . (6.39)
∂q k1 ∂q kr ∂q 0j1 ∂q 0js
Por conveniência de notação, estes componentes também podem ser representados simples-
···ir
mente por Tji11···j r
.
Os componentes do tensor generalizado definido por (6.39) seguem as mesmas regras algé-
bricas dos tensores Cartesianos discutidas na seção 6.4.
Exemplo 6.10. Verifique se a delta de Kronecker satisfaz a lei de transformação (6.39).
Resolução. Dado δji , se este símbolo é de fato um tensor misto de posto dois, então frente a
uma transformação de coordenadas generalizada,
∂q 0i ∂q ` k ∂q 0i ∂q k ∂q 0i
δ 0ij = δ ` = = = δji ,
∂q k ∂q 0j ∂q k ∂q 0j ∂q 0j

260 6.9. Tensores relativos
onde foi empregada derivação em cadeia. Ou seja, a delta de Kronecker possui os mesmos
componentes em qualquer sistema de coordenadas, demonstrando ser um tensor misto de posto
dois. A expressão (6.30) já havia mostrado que o tensor de métrica na forma mista é justamente
dado por esta delta.
Exercício 6.1. Mostre que gij = ei · ej são os componentes covariantes de um tensor de posto
dois.
Demonstração. Em uma transformação generalizada, a nova base {e0i } deve levar aos compo-
nentes
0
gij = e0i · e0j .
Usando a transformação inversa em (6.37b), resulta
0 ∂q k ∂q ` ∂q k ∂q `
gij = e k · e` = gk` .
∂q 0i ∂q 0j ∂q 0i ∂q 0j
Ou seja, os componentes de {gij } transformam-se como um tensor covariante de posto dois.
6.9 T ENSORES RELATIVOS

Na seção 6.6.1 discutiu-se a diferença entre um tensor Cartesiano e um pseudotensor. Esta
distinção será novamente discutida em um contexto mais amplo, generalizando esta distinção
para qualquer transformação entre sistemas de coordenadas.
Um tensor relativo ou densidade de tensor é aquele objeto que se transforma como um
tensor entre um sistema de coordenadas a outro, exceto que sua lei de transformação difere de
(6.39) pela multiplicação de um peso, correspondente a uma determinada potência do Jacobiano
da transformação.
Observando a lei de transformação dos
componentes contravariantes de um vetor (6.37a),
percebe-se que as quantidades ∂q 0i /∂q j podem ser escritas na forma de uma matriz J, cujos

elementos são definidos por

∂q 0i
J ij = , (6.40a)
∂q j
e cujo determinante J ≡ det (J) é justamente o Jacobiano da transformação q i → q 0i . Assim,

0
pode-se escrever, de forma compacta, a i = J ij aj .
Por sua vez, a transformação inversa (6.37b) também pode ser escrita em termos de uma
matriz K, definida por
∂q i
K ij = 0j , (6.40b)
∂q
ou seja, ai = K ij a0j . É fácil mostrar que K = J−1 e, portanto, K ≡ det (K) = J −1 .
Com a mesma notação, as leis de transformação dos componentes covariantes de um vetor,
dadas por (6.38a,b), podem ser escritas de forma compacta como
a0i = K ji aj e ai = J ji a0j .
iUsando então o determinante K, define-se o tensor relativo de peso w como o conjunto

···ir

Tj11···j s
, composto por 3r+s objetos matemáticos identificados por r índices contravariantes e s
índices covariantes que se transformam de acordo com a lei
∂q 0i1 ∂q 0ir ∂q `1 ∂q `s k1 ···kr

T 0i1 ···irj1 ···js = K w · · · · · · T `1 ···`s . (6.41)
A partir da definição (6.41), os diferentes valores que o peso w pode assumir estabelecem
classificações dos tensores relativos que muitas vezes depende do texto consultado na litera-
tura. Uma classificação distingue entre densidades de tensores (autênticos) ou densidades
tensoriais e densidades de pseudotensores, quando o peso w é uma quantidade inteira. De
acordo com esta classificação, chamam-se:
Tensores verdadeiros ou absolutos: quando o peso é w = 0, ou seja, o tensor segue a lei (6.39).

Densidade de tensor (autêntico) de peso w (inteiro): quando o peso é w > 1. Em particular,

quando w = +1, este objeto é chamado simplesmente de densidade de tensor ou densidade
tensorial.
Densidade de pseudotensor de peso w (inteiro): quando o peso é w 6 −1. Em particular,

quando w = −1, este objeto é chamado simplesmente de pseudotensor. Cabe mencionar
aqui que tanto objetos com peso w = −1 quanto com peso w = +1 são classificados como
pseudotensores escalares, de acordo com a lei de transformação (6.21).
Esta classificação exige que o peso w seja inteiro, uma vez que no caso contrário a transfor-
mação (6.41) não é necessariamente unívoca.
Uma outra classificação que pode ser encontrada, para a qual o peso w não necessita ser
necessariamente inteiro. Segundo esta classificação, as densidades de tensores podem ser:
Densidade par de tensor de peso w: quando o objeto se transforma de acordo com
w ∂q 0i1 ∂q 0ir ∂q `1 ∂q `s k1 ···kr

T 0i1 ···irj1 ···js = |K| · · · 0j
· · · T `1 ···`s .
k
∂q 1 k
∂q r ∂q 1 ∂q 0js
Densidade ímpar de tensor de peso w: quando o objeto se transforma de acordo com
w ∂q 0i1 ∂q 0ir ∂q `1 ∂q `s k1 ···kr

T 0i1 ···irj1 ···js = sgn (K) |K| · · · 0j
· · · T `1 ···`s ,
k
∂q 1 k
∂q r ∂q 1 ∂q 0js
onde sgn (K) é o sinal de K.
Neste texto, a lei de transformação geral a ser adotada para tensores relativos continuará a
ser (6.41).
Exemplo 6.11. Sendo {gij } as componentes covariantes do tensor de métrica, mostre que o
determinante g = det (g) é uma densidade escalar de peso w = +2.
Resolução. Os componentes do tensor de métrica transformam-se de acordo com (6.39),
0 ∂q k ∂q `
gij = gk` .
∂q 0i ∂q 0j
A representação matricial desta lei de transformação é
g0 = KT gK.
Portanto,
g 0 = det (g0 ) = det KT gK = K 2 g,

o que mostra que g é uma densidade escalar (ou escalar relativo) de peso w = +2.
Algumas propriedades de tensores relativos podem ser agora apresentadas:
1. A transformação tensorial é transitiva, ou seja, ao se realizarem duas transformações

seguidas, representadas esquematicamente por {qi } → {qi0 } → {qi00 }, o tensor resultante
pode ser descrito por uma única transformação {qi } → {qi00 }, a qual é dada pela composição
das transformações anteriores. Esta propriedade já havia sido discutida no contexto de
tensores Cartesianos na seção 6.5.1.
2. Tensores relativos de mesmo posto, tipo e peso podem ser adicionados e a soma resulta em
um outro tensor relativo com as mesmas características.
3. Se dois tensores relativos possuem pesos w1 e w2 , respectivamente, então os produtos

externo ou interno dos mesmos resulta em um novo tensor relativo com peso w1 + w2 .
4. A operação de contração aplicada a um tensor relativo resulta em um outro tensor relativo

com o mesmo peso que o tensor original.

262 6.10. Derivadas dos vetores de base e os símbolos de Christoffel
5. O resultado obtido no exemplo 6.11 mostra que qualquer tensor relativo T de peso w pode
gerar um tensor absoluto de mesmo posto através do produto externo
U i1 ···ir j1 ···js = g −w/2 T i1 ···ir j1 ···js ,
pois ao se realizar a transformação, resulta
−w/2 −w/2 ∂q 0i1 ∂q 0ir ∂q `1 ∂q `s k1 ···kr

U 0i1 ···irj1 ···js = (g 0 ) T 0i1 ···irj1 ···js = K 2 g Kw · · · · · · T `1 ···`s ,
o qual se comporta como um tensor verdadeiro.
Exercício 6.2. Calcule os pesos dos símbolos de Levi-Civita ijk e ijk .
Demonstração. Partindo de ijk , válido em um determinado sistema de coordenadas, deseja-se
aplicar sobre o mesmo a transformação {qi } → {qi0 }. Fazendo isso, resulta o objeto
∂q ` ∂q m ∂q n
`mn = K ì K mj K nk `mn .
∂q 0i ∂q 0j ∂q 0k
Contudo, de acordo com a identidade matricial (6.33b), K ì K mj K nk `mn = Kijk . Portanto, a lei
de transformação correta para ijk , a qual irá resultar em um tensor 0ijk cujos componentes têm
os valores esperados para o símbolo de Levi-Civita em qualquer sistema de coordenadas, é
∂q ` ∂q m ∂q n
0ijk = K −1 `mn .
∂q 0i ∂q 0j ∂q 0k
Portanto, {ijk } é uma densidade tensorial de peso w = −1.

Já para o símbolo ijk , a mesma transformação de coordenadas resulta no objeto
∂q 0i ∂q 0j ∂q 0k `mn
= J i` J jm J kn `mn = Jijk = K −1 ijk .
∂q ` ∂q m ∂q n
Portanto, o símbolo ijk deve se transformar como
∂q 0i ∂q 0j ∂q 0k `mn
0ijk = K ,
∂q ` ∂q m ∂q n
correspondendo a uma densidade tensorial de peso w = +1.
6.10 D ERIVADAS DOS VETORES DE BASE E OS SÍMBO -

LOS DE C HRISTOFFEL
No sistema Cartesiano, os vetores da base canônica { x̂i } são constantes e por isso a aplicação
de qualquer operador diferencial sobre um campo vetorial irá atuar somente sobre os compo-
nentes do campo.
Por outro lado, em um sistema de coordenadas generalizado os vetores de
base {ei } e ei são funções das próprias coordenadas curvilíneas. Portanto, qualquer operador
diferencial irá atuar também sobre estes vetores.
Considera-se então uma derivada qualquer atuando sobre um determinado vetor de base;
por exemplo, a operação ∂ei /∂q j . O resultado desta derivação é também um vetor, o qual pode,
portanto, ser expresso em termos da própria base {ei }. Dado então o vetor ei = ei q 1 , q 2 , q 3 ,
escreve-se
∂ei
= Γkij ek , (6.42a)
∂q j
onde Γkij é denominado símbolo de Christoffel (de três índices) do segundo tipo. Os símbolos
de Christoffel podem ser visualizados como matrizes 3 × 3 × 3, possuindo portanto 27 elementos
ao todo no R3 (ou n3 no Rn ). Na literatura, uma outra notação empregada com frequência para
os símbolos de Christoffel do segundo tipo é:

i
Γijk ≡ .
j k

Usando a relação de reciprocidade (6.23), os valores de Γkij podem ser obtidos por
∂ei
Γkij = ek · . (6.42b)
∂q j

Com a mesma relação pode-se obter também a expressão para as derivadas de ei . Escrevendo
∂ei
= αi jk ek ,
∂q j
observa-se que
∂ei
ek · = αi jk .
∂q j
Porém, derivando a relação de reciprocidade, obtém-se que
∂ei
ek · = −Γi kj .
∂q j
Ou seja, αi jk = −Γi kj e
∂ei
= −Γi kj ek . (6.42c)
∂q j

Exercício 6.3. Mostre que o conjunto dos símbolos de Christoffel Γi kj não são componentes
de um tensor misto de terceira ordem.
Demonstração. Aplicando-se uma tranformação arbitrária sobre (6.42b), no novo sistema de
coordenadas resulta
∂e0
Γ0kij = e0k · 0ji .
∂q
Mas, conforme as leis de transformação (6.37) e (6.38), pode-se escrever
∂q j ∂q 0i j
e0i = ej e e0i = e ,
∂q 0i ∂q j
ou seja,
∂q 0k ` ∂
m
∂q
Γ0kij = e · 0j em
∂q ` ∂q ∂q 0i
∂q 0k
2 m
∂q m ` ∂em

∂ q `
= e · e m + e ·
∂q ` ∂q 0j ∂q 0i ∂q 0i ∂q 0j
∂q 0k ∂ 2 q` ∂q m ∂q n ` ∂em

= + e · ,
∂q ` ∂q 0j ∂q 0i ∂q 0i ∂q 0j ∂q n
∂q 0k ∂ 2 q ` ∂q 0k ∂q m ∂q n `
Γ0kij = + Γ . (6.43)
0j
∂q ∂q ∂q 0i
` ∂q ` ∂q 0i ∂q 0j mn
Observa-se que somente o segundo termo do lado direito está de acordo com a lei de transforma-
ção de um tensor de posto 3. A presença do termo adicional mostra que o símbolo de Christoffel
não é um tensor.
Uma expressão alternativa para o cálculo de Γkij , em termos do tensor de métrica, pode ser
obtida. Inicialmente, observa-se que o símbolo de Christoffel é simétrico frente a permutação
i ↔ j. Isto é facilmente demonstrado a partir da definição (6.24). Uma vez que
∂ei ∂2r ∂2r ∂ej

j
= j i = i j = ,
∂q ∂q ∂q ∂q ∂q ∂q i
resulta de (6.42a,b) que
∂ei ∂ej ∂ej

= Γkij ek = =⇒ Γkij = · ek = Γkji .
∂q j ∂q i ∂q i

264 6.10. Derivadas dos vetores de base e os símbolos de Christoffel
Considera-se então a definição (6.27a). Derivando a mesma, obtém-se

∂gij ∂ei ∂ej
= k · ej + ei · k
∂q k ∂q ∂q
` `
= Γ ik e` · ej + Γ jk ei · e`
= Γìk g`j + Γ`jk gi` .
Realizando duas permutações cíclicas dos índices livres i, j e k neste resultado, resultam as
expressões
∂gjk
= Γ`ji g`k + Γ`ki gj`
∂q i
∂gki
= Γ`kj gì + Γìj gk` .
∂q j
Somando as duas últimas expressões e subtraindo a primeira e fazendo uso da simetria de gij e
Γkij , resulta
∂gjk ∂gki ∂gij
+ − = 2Γìj gk` .
∂q i ∂q j ∂q k
Realizando o produto interno com g mk e usando (6.29), resulta finalmente

1 ∂gj` ∂gì ∂gij
Γkij = g k` + − . (6.44a)
2 ∂q i ∂q j ∂q `
Uma maneira prática de se visualizar os símbolos de Christoffel é oferecida definindo-se três

matrizes (no R3 ) 3 × 3 simétricas, cada uma correspondendo a um valor do índice k em (6.44a),
ou seja,  k
Γ 11 Γk12 Γk13

Γk ≡ Γkij = Γk21 Γk22 Γk23  , (k = 1, 2, 3) .

(6.44b)
Γk31 Γk32 Γk33
Exemplo 6.12. Calcule os símbolos de Christoffel para o sistema de coordenadas cilíndricas.
Resolução. Usando os resultados da seção 1.5.1, o tensor de métrica e sua inversa são dados
por    
1 0 0 1 0 0
g = 0 ρ2 0 =⇒ g−1 = 0 ρ−2 0 .
0 0 1 0 0 1
Portanto, a primeira conclusão é que gij = h2i δij , resultando para (6.44),
!
k 1 −2
∂h2j kj 2
−2 ∂hi ki −2 ∂hi
2
Γ ij = hj δ + hi δ − hk δij ,
2 ∂q i ∂q j ∂q k
sendo que não existem somas implícitas nos índices duplos. Observa-se então que somente são
não nulos os símbolos onde i = 2 e/ou j = 2 e/ou k = 2. Ou seja,
1
Γφρφ = Γφφρ =
ρ
Γρφφ = −ρ.
Todas as outras possibilidades resultam nulas.

Em termos das representações matriciais,
   
0 0 0 0 1/ρ 0
Γρ = 0 −ρ 0 Γφ = 1/ρ 0 0 Γz = 0.
0 0 0 0 0 0
Os símbolos de Christoffel (de três índices) do primeiro tipo correspondem

à expansão
equivalente a (6.42a), porém em termos dos vetores da base contravariante ei , ou seja,
∂ei
= [ij, k] ek , (6.45a)
∂q j

onde [ij, k] é a notação usualmente empregada na literatura para os símbolos de Christoffel do

primeiro tipo.
Da mesma forma como se procedeu com Γijk , as expressões para estes símbolos são obtidas
a partir da relação de reciprocidade, resultando em
∂ei
[ij, k] = · ek . (6.45b)
∂q j
Como ei = gi` e` , resulta de (6.42b) a seguinte relação entre ambos os tipos de símbolos,

` k
[ij, k] = gk` Γìj = gk` ⇐⇒ Γkij = = g k` [ij, `] . (6.45c)
i j i j
Este último resultado mostra também que [ij, k] = [ji, k].

Finalmente, usando (6.44) obtém-se a seguinte expressão para [ij, k] em termos do tensor de
métrica,
1 ∂gik ∂gjk ∂gij
[ij, k] = + − . (6.45d)
2 ∂q j ∂q i ∂q k
6.11 D IFERENCIAÇÃO COVARIANTE

Nesta seção introduz-se o conceito de derivada covariante, a qual está envolvida no cálculo de
operadores diferenciais aplicados a campos tensoriais em sistemas de coordenadas generaliza-
das. Para iniciar a discussão, consideram-se os objetos matemáticos resultantes das variações
arbitrárias de campos tensoriais de mais baixa ordem, ou seja, campos escalares e vetoriais.
Para o caso de um campo escalar ψ = ψ (r), sua variação infinitesimal, quando calculada no
sistema Cartesiano, pode sempre ser escrita como dψ = ∇ψ · dr, sendo o gradiente escrito em
coordenadas Cartesianas. No sistema curvilíneo, a mesma variação resulta em
∂ψ i
dψ = dq .
∂q i

Como dq i são os componentes de um vetor contravariante e dψ é um escalar, resulta que, de
acordo com a lei do quociente, ∂ψ/∂q i formam os componentes
de um vetor covariante.

Por outro lado, embora em coordenadas Cartesianas ∂v i /∂xj formam os componentes de
um tensor de posto dois, esta regra não é geral para qualquer sistema de coordenadas, pois
∂v i /∂q j se transforma de acordo com
0
∂v i ∂v 0i ∂q k ∂v 0i

= 0j
= 0j k
∂q j ∂q ∂q ∂q
∂q k ∂ ∂q 0i `

= 0j k v
∂q ∂q ∂q `
∂q k ∂ 2 q 0i ` ∂q 0i ∂q k ∂v `
= v + ,
∂q 0j ∂q k ∂q ` ∂q ` ∂q 0j ∂q k
o qual não segue a lei de transformação de um tensor generalizado de segunda ordem. Este
objeto, a propósito, transforma-se de maneira semelhante aos símbolos de Christoffel. Este
resultado não segue a lei de transformação de tensores porque a matriz de transformação J é,
em geral, uma função das coordenadas, ou seja, J = J (q).
Ao se calcular a derivada de um vetor v em relação a uma coordenada q j qualquer, é neces-
sário levar em conta também a geometria do sistema adotado, a qual é descrita pelos símbolos
de Christoffel. Neste caso, pode-se escrever
∂v i ∂v i
i
∂v ∂ i i ∂ei i k ∂v k i
= v ei = ei + v = e i + v Γ ij e k = + v Γ kj ei .
∂q j ∂q i ∂q j ∂q j ∂q j ∂q j
Agora o objeto obtido na expressão acima comporta-se como um tensor de posto dois. Este
objeto é denominado a derivada covariante do vetor v e é representado por
∂v i
v i;j ≡ + Γikj v k ≡ v i,j + Γikj v k . (6.46a)
∂q j

266 6.11. Diferenciação covariante
Em (6.46a), o índice “; j” denota a derivação covariante em relação a coordenada q j , enquanto

que o índice “, j” indica a derivação usual na mesma coordenada, i. e., v i,j = ∂v i /∂q j . Usando o
símbolo da derivação covariante, pode-se escrever então
∂v
= v i;j ei . (6.46b)
∂q j

Exercício 6.4. Mostre que v i;j forma os componentes de um tensor misto de posto dois.
Demonstração. Realizando a transformação q i → q 0i ,

0 ∂v 0i
v i;j = v 0i;j = + v 0k Γ0ikj .
∂q 0j
Usando a lei de transformação de Γkij dada por (6.43), pode-se escrever
∂q ` ∂ ∂q 0i m ∂q 0k r ∂q 0i ∂ 2 q ` ∂q 0i ∂q m ∂q n `

v 0i;j = 0j ` v + v + Γ
∂q ∂q ∂q m ∂q r 0j
∂q ` ∂q ∂q 0k ∂q ` ∂q 0k ∂q 0j mn
∂q ` ∂ 2 q 0i m ∂q 0k ∂q 0i ∂ 2 q ` r ∂q ` ∂q 0i ∂v m ∂q 0i ∂q n m `
= v + 0j v + + v Γ mn .
∂q 0j ∂q ` ∂q m ∂q r ∂q ` ∂q ∂q 0k ∂q 0j ∂q m ∂q ` ∂q ` ∂q 0j
Mas os dois primeiros termos resultam
∂q ` ∂ 2 q 0i m ∂q 0k ∂q 0i ∂ 2 q ` r ∂q ∂ 2 q 0i ∂q 0i ∂q 0k ∂
` `
∂q
v + 0j v = + vm
0j `
∂q ∂q ∂q m r `
∂q ∂q ∂q ∂q 0k 0j
∂q ∂q ∂q` m ∂q ` m
∂q ∂q 0k ∂q 0j
∂δji
2 0i
∂q 0i ∂ 2 q `
0i `
∂q `

∂ q m ∂ ∂q ∂q
= m ` 0j
+ ` m 0j v = m ` 0j
v m = m v m = 0.
∂q ∂q ∂q ∂q ∂q ∂q ∂q ∂q ∂q ∂q
Portanto,
∂q 0i ∂q ` ∂v m ∂q 0i ∂q ` k

v 0i;j = + v n Γmn` = v ,
∂q m ∂q 0j ∂q ` ∂q k ∂q 0j ;`
o qual segue a lei de transformação de um tensor misto de posto dois.
Exemplo 6.13. Calcule a derivada covariante v i;j em coordenadas cilíndricas. Em seguida,
calcule a contração v i;i .
Resolução. Da definição (6.46) e dos valores de Γkij para as coordenadas cilíndricas obtidos

no exemplo 6.12, resulta, para {i, j} = {1, 2, 3} ≡ ρ, φ, x3 ,
∂v i δ iφ ρ
v i;j = v δjφ + v φ δjρ − ρv φ δ iρ δjφ .

j
+
∂q ρ
Realizando agora contração,
∂v i vρ 1 ∂ ∂v φ ∂v 3
v i;i = + = (ρv ρ
) + + ,
∂q i ρ ρ ∂ρ ∂φ ∂x3
a qual é exatamente a expressão para o divergente do campo v em coordenadas cilíndricas,
obtido na seção 1.5.1.
A expressão equivalente a (6.46), porém para os componentes covariantes do vetor v, pode
ser obtida derivando-se agora v = vi ei , com o emprego de (6.42c), ou seja,

∂ i ∂vi
− vk Γ ij ei .
k

vi e =
∂q j ∂q j
Chamando vi;j a derivada covariante da i-ésima componente covariante do vetor v, obtém-se
∂vi
vi;j = − Γkij vk = vi,j − Γkij vk . (6.47a)
∂q j
Portanto, pode-se escrever
∂v
= vi;j ei . (6.47b)
∂q j

Derivadas covariantes de tensores de ordens mais altas podem ser obtidas seguindo o mesmo
procedimento adotado acima. Por exemplo, um tensor de posto dois possui ao todo 4 representa-
ções: 1 contravariante, 1 covariante e 2 mistas. Para realizar em detalhes a derivação covariante
para os componentes contravariantes do tensor T , escreve-se o mesmo como T = T ij ei ⊗ ej .
Derivando-se então em relação a q k ,
∂T ∂
= k T ij ei ⊗ ej

∂q k ∂q
∂T ij ∂ei ∂ej
= k
ei ⊗ ej + T ij k ⊗ ej + T ij ei ⊗ k
∂q ∂q ∂q
ij
∂T
= + Γi`k T `j + Γj `k T i` ei ⊗ ej .
∂q k
Chamando então T ij;k como a derivada covariante dos componentes contravariantes do tensor
T , identifica-se
∂T ij
T ij;k = + Γi`k T `j + Γj `k T i` , (6.48a)
∂q k
podendo-se escrever
∂T
= T ij;k ei ⊗ ej .
∂q k
Pode-se mostrar facilmente que o conjunto T ij;k forma os componentes de um tensor de posto

três.
Expressões equivalentes a (6.48a) para as outras representações de T podem ser derivadas
da mesma maneira. Estas são:
T ij;k = T ij,k + Γi`k T `j − Γ`jk T i` (6.48b)

` `
Tij;k = Tij,k − Γ ik T`j −Γ jk Ti` , (6.48c)
onde o índice “, k” indica agora a derivação usual nesta coordenada, i. e., Tij,k = ∂Tij /∂q k .
Expressões para as derivadas covariantes de tensores de postos maiores que dois podem ser
derivadas seguindo os modelos fornecidos pelas expressões (6.46), (6.47) e (6.48a-c): a derivada
covariante de cada componente de um tensor de posto N é composta por N +1 termos. O primeiro
termo é sempre a derivada direta do componente em relação à coordenada; os demais N termos
são combinações de produtos dos símbolos de Christoffel com os componentes do tensor. Para
cada índice na posição contravariante, o termo correspondente na derivada covariante é somado,
enquanto que para cada índice covariante, o termo correspondente é subtraído. Em cada um
destes termos, o último índice do símbolo de Christoffel é sempre a coordenada que está sendo
derivada. Por sua vez, os demais índices são sempre tais que a convenção de somas implícitas é
respeitada para a particular representação do tensor que está sendo derivada.
A derivação covariante também serve para atribuir significado à aplicação do operador nabla
∂
∇ = ek (6.49)
∂q k
sobre um tensor de posto N , de tal forma que o objeto matemático resultante seja um tensor de
posto N +1 que satisfaz a lei de transformação. Por exemplo, para o tensor T em (6.48a-c), a ope-
ração U ≡ ∇T resulta em um tensor de posto três, sendo que algumas de suas representações
possíveis são
U = T ij;k ei ⊗ ej ⊗ ek = T ij;k ei ⊗ ej ⊗ ek = Tij;k ei ⊗ ej ⊗ ek .
Retornando rapidamente aos tensores de posto zero, ou seja, a escalares, como estes não
fazem uso de vetores de base para a sua representação, resulta que a derivada covariante é
idêntica a derivação direta, ou seja,
∂ψ
ψ;j = j = ψ,j .
∂q
Para a física em espaços curvos, em particular para a relatividade geral e gravitação, a deri-
vada covariante possui uma importância ímpar, pois

268 6.12. Operadores vetoriais na forma tensorial
...(a) substituição consistente das derivadas parciais regulares por derivadas covari-
antes carrega as leis da física (na forma de componentes) a partir do espaço-tempo
plano para o espaço-tempo (Riemanniano) curvo da relatividade geral. De fato, esta
substituição pode ser tomada como uma expressão matemática do Princípio da Equi-
valência de Einstein.
Finalmente, um teorema importante para a derivada convectiva do tensor de métrica é apre-
sentado a seguir.
Teorema 6.1 (Teorema de Ricci). A derivada covariante do tensor de métrica é identicamente
nula.
Demonstração. Este teorema será inicialmente demonstrado para a forma covariante do tensor
de métrica. De acordo com (6.48c),
gij;k = gij,k − Γìk g`j − Γ`jk gi` .
Então, introduzindo (6.44) na expressão acima e usando também (6.45c), resulta
gij;k = gij,k − [ik, j] − [jk, i]
1 1 1 1 1 1
= gij,k − gji,k − gij,k − gkj,i + gjk,i + gik,j − gki,j = 0.
2 2 2 2 2 2
Empregando as relações entre as formas contravariante e mista do tensor de métrica, é fácil
demonstrar que este teorema é válido também para estas formas.
Em particular, o teorema de Ricci implica na seguinte expressão para a derivada usual do
tensor de métrica,
∂gij
≡ gij,k = [ik, j] + [jk, i] , (6.50a)
∂q k
a qual, com o uso de g ik gkj = δji , resulta em
∂g ij
≡ g ij,k = −g i` Γj `k − g j` Γik` . (6.50b)
∂q k
6.12 O PERADORES VETORIAIS NA FORMA TENSORIAL

Na seção 1.4 foram derivadas as expressões para os operadores diferenciais gradiente, rota-
cional, laplaciano e rotacional, válidas para sistemas de coordenadas ortogonais. Em seguida,
na seção 1.5 foram derivadas expressões explícitas destes operadores para alguns exemplos de
sistemas de coordenadas ortogonais. Nesta seção, os mesmos operadores diferenciais serão no-
vamente obtidos, porém agora para qualquer sistema de coordenadas, inclusive para aqueles
que não são ortogonais.
Para fins de posterior comparação entre as expressões que serão derivadas nesta seção, com
as apresentadas na seção 1.5, deve-se lembrar que as bases aqui adotadas, {ei } e ei não
são necessariamente normalizadas. Contudo, é sempre possível normalizar-se a primeira base,
lembrando da definição (1.11) para os fatores de escala hi . Desta forma, pode-se adotar a base
{ êi } = {ei /hi } para fins de comparação. Nesta base, o vetor v, por exemplo, pode ser escrito
NS
v = v i ei = v̂ i êi , sendo v̂ i = hi v i , o que possibilita uma comparação direta entre os resultados.
Adicionalmente, deve-se lembrar também que para um sistema ortogonal as representações do
tensor de métrica são gij = h2i δij e g ij = h−2 ij
i δ . Por fim, o determinante do tensor de métrica é
2 2 2
g = det ([gij ]) = h1 h2 h3 .
6.12.1 G RADIENTE DE CAMPO ESCALAR

Como o campo escalar ψ (q) não depende dos vetores de base, o seu gradiente é obtido sim-
plesmente pela aplicação do operador vetorial (6.49),
3
∂ψ i X 1 ∂ψ
∇ψ = e = êi . (6.51)
∂q i h ∂q i
i=1 i
Pode-se ver que neste caso simples a expressão resultante coincide com (1.23).

6.12.2 D IVERGENTE DE CAMPO VETORIAL

Dado o campo vetorial v = v (q), o seu divergente consiste na aplicação sobre o mesmo de um
operador diferencial de tal forma que resulte um campo escalar. Esta operação é usualmente
representada por ∇ · v.
Para resultar um tensor de posto zero, esta operação pode ser concebida como composta por
duas etapas: inicialmente, o operador ∇ é multiplicado diretamente ao vetor v, resultando em
um tensor de posto dois. Em seguida, é realizada uma contração entre os índices do tensor,
tendo como resultado um escalar. A primeira etapa destas operações pode ser representada por
∂
v = v i ei =⇒ ∇v = v i ei ⊗ ej = v i;j ei ⊗ ej ,

∂q j
onde foi introduzida a derivada covariante (6.46). Portanto, o divergente de v é dado pela con-
tração
∂v i
∇ · v = v i;i = i + Γiki v k .
∂q
Usando agora a expressão (6.44) para os símbolos de Christoffel, observa-se que

1 ∂gi` ∂gk` ∂gki 1 i` ∂gi`
Γiki = g i` k
+ i
− = g , (6.52)
2 ∂q ∂q ∂q ` 2 ∂q k
sendo que os últimos dois termos se cancelam, uma vez que

∂gk` ∂gki ∂gk` ∂gk`
g i` − = g i` i − g ì i = 0.
∂q i ∂q ` ∂q ∂q
Por outro lado, o termo restante em (6.52) pode ser simplificado fazendo-se uso do seguinte
lema.
Lema. Sendo as matrizes a (q) = [aij ] e b (q) = bij tais que b = a−1 , e sendo a = det (a), então

∂a ∂aij
= abji k . (6.53)
∂q k ∂q
Demonstração. Para se demonstrar este lema, emprega-se novamente a identidade matricial

(6.33a), a qual pode ser escrita como
1 ijk abc
a= aai abj ack .
6
Por outro lado, o elementos da matriz b podem ser expressos em termos dos elementos de a como
1 ik` jmn
bij = amk an` .
2a
Então, derivando-se a em relação a q ` ,

∂a 1 ijk abc ∂aai ∂abj ∂ack
= abj ack ` + aai ack ` + aai abj
∂q ` 6 ∂q ∂q ∂q `

1 ∂aai ∂abj ∂ack
= a bia ` + bjb ` + bkc `
3 ∂q ∂q ∂q
∂aij
= abji ` .
∂q
Ou seja,
∂a ∂aij
= abji k .
∂q k ∂q
Embora o lema tenha sido demonstrado para uma matriz 3 × 3, pode-se mostrar que este
resultado independe da ordem da matriz.

270 6.12. Operadores vetoriais na forma tensorial
Aplicando então a identidade (6.53) para o tensor de métrica e lembrando que o mesmo é
simétrico, obtém-se
∂g ∂gij
k
= gg ij k . (6.54)
∂q ∂q
Usando então este resultado em (6.52), conclui-se que
p
i 1 ∂g 1 ∂ |g| ∂ p
Γ ki = = = ln |g| .
2g ∂q k |g| ∂q k ∂q k
p
Portanto, o divergente de um campo vetorial pode ser sempre expresso em termos do deter-
minante do tensor de métrica como
p
i ∂v i 1 ∂ |g| i 1 ∂ p i

∇ · v = v ;i = i + p v = |g|v (6.55a)
|g| ∂q i |g| ∂q i
p
∂q
3
1 X ∂ p v̂ i

=p |g| . (6.55b)
|g| i=1 ∂q i hi
6.12.3 L APLACIANO DE UM CAMPO ESCALAR

Dado o campo escalar ψ = ψ (q), o seu laplaciano pode ser obtido a partir da operação usual,
∇2 ψ = ∇· (∇ψ). Inicialmente, percebe-se em (6.51) que (∇ψ)i = ∂ψ/∂q i . Então, com o emprego
do tensor de métrica, pode-se escrever
i ∂ψ
v i = (∇ψ) = g ij .
∂q j
Introduzindo este resultado em (6.55), obtém-se

2 1 ∂ p ∂ψ
ij
∇ ψ=p |g|g . (6.56)
|g| ∂q i ∂q j
Exercício 6.5. Mostre que (6.56) se reduz a (1.25) no caso particular de um sistema de coorde-
nadas ortogonal.
Demonstração. Para um sistema ortogonal, g ij = h−2 ij
p
i δ e |g| = h1 h2 h3 . Então, em (6.56),
3
2 1 X ∂ h1 h2 h3 ∂ψ
∇ ψ= ,
h1 h2 h3 i=1 ∂q i h2i ∂q i
o qual é exatamente o resultado (1.25).
6.12.4 R OTACIONAL DE UM CAMPO VETORIAL

A definição usual do rotacional de um campo vetorial está associada ao conceito do produto
vetorial entre dois vetores. Contudo, é interessante obter-se neste momento uma expressão
mais geral, a qual pode ser facilmente estendida a espaços vetoriais de dimensões mais altas,
uma vez que o produto vetorial somente existe no E 3 .
Considerando-se inicialmente o produto vetorial entre os vetores a e b, pode-se escrever
1
a × b = ai bj ei × ej = √ ijk ai bj ek ,
g
onde foi empregado (6.35b). Definindo então o tensor antissimétrico

1 ijk
Mij = ijk k`m a` bm = ai bj − aj bi ⇐⇒ ijk ai bj = Mij ,
2
observa-se que é possível escrever
1
a × b = √ ijk Mij ek .
2 g

Ou seja, é sempre possível escrever-se os componentes do produto vetorial em termos do ten-

sor antissimétrico Mij . É vantajoso definir-se este tensor, uma vez que se pode então considerar
a sua extensão para espaços vetoriais de dimensão mais alta.
Focando agora no rotacional de um campo v (q), escreve-se

∂ ∂v 1
∇ × v = ej j ×v = ej × j = − √ ijk vi;j ek .
∂q ∂q g
onde foram empregados (6.47b) e (6.35b). Define-se então o tensor antissimétrico
1 ijk
(rotv)ij = ijk k`m v`;m = vi;j − vj;i ⇐⇒ ijk vi;j = (rotv)ij ,
2
o qual está relacionado ao i-ésimo componente do rotacional de v. Contudo, de (6.47), observa-se
que (rotv)ij = ijk k`m (v`,m − Γn`m vn ) = ijk k`m v`,m = vi,j −vj,i , devido à simetria de Γkij . Portanto,
(rotv)ij = ijm k`m vk,` = vi,j − vj,i .

Então, para reproduzir o resultado (1.26) conhecido mas, ao mesmo tempo, generalizando
para sistemas não ortogonais e, eventualmente, para espaços de dimensões superiores, o campo
vetorial w = ∇ × v, desenvolvido como w = wi ei , tem seus componentes dados por
i 1 1 ∂vk
wi = (∇ × v) = − √ ijk (rotv)jk = √ ijk j . (6.57)
2 g g ∂q
6.13 D IFERENCIAÇÃO ABSOLUTA E CURVAS GEODÉSI -

CAS
Nesta seção serão introduzidos alguns conceitos mais avançados da análise tensorial, com
frequência empregados em trabalhos envolvendo geometria diferencial e relatividade geral.
6.13.1 D IFERENCIAÇÃO ABSOLUTA OU INTRÍNSECA

Uma aplicação importante das derivadas convectivas consiste na derivação de um campo
tensorial ao longo de uma curva no Rn , a qual é parametrizada por r = r (t), ou seja, em termos
de um parâmetro t.
Considera-se inicialmente o campo vetorial v = v (q). Escrevendo v = v i ei , a derivada abso-
luta deste campo em relação a t fica
dv dv i dei
= ei + v i
dt dt ∂t
dv i dq j
∂ei
= ei + v i .
dt dt ∂q j
Introduzindo-se o símbolo de Christoffel (6.42), resulta
i
dq k . δv i

dv dv
= + Γijk v j ei = ei .
dt dt dt δt
O termo entre parênteses é denominada a derivada absoluta (ou intrínseca) δv i /δt do
componente v i ao longo da curva r (t). Esta derivada é usualmente representada, de acordo com
(6.46), como
δv i dv i dq k dq j
≡ + Γijk v j = v i;j . (6.58)
δt dt dt dt
Ou seja, pode-se escrever
dv dq j
= v i;j ei .
dt dt
De forma semelhante, as seguintes expressões para as derivadas absolutas das diferentes
formas de um tensor de posto dois podem ser deduzidas,
δT ij dq k
= T ij;k
δt dt
272 6.13. Diferenciação absoluta e curvas geodésicas
C
E
Figura 6.9: Uma curva C no espaço 3 ,
definida como o mapeamento de um in-
tervalo de variação do parâmetro t ∈ I
(I ⊂ R) sobre uma coleção de pontos
E
P ⊂ 3 , determinados pela variação
do vetor posição r (t).
δTij dq k
= Tij;k
δt dt
δT ij dq k
= T ij;k .
δt dt
As expressões acima atribuem significado à derivação absoluta deste tensor como um todo,
dT δT ij δTij i
= ei ⊗ ej = e ⊗ ej = · · · .
dt δt δt
Finalmente, se ψ (q) é um campo escalar, então sua derivada intrínseca é simplesmente a
derivada ordinária,
δψ dψ
= . (6.59)
δt dt
As derivadas absoluta e covariante obedecem as seguintes propriedades da diferenciação:
1. A derivada de uma soma de tensores é a soma das derivadas.
2. A derivada do produto (externo ou interno) dos tensores T e U é igual a U δT + T δU , onde
o símbolo “δ” representa qualquer tipo de diferenciação.
3. O fato da derivada covariante do tensor de métrica ser nula implica em que as operações
de elevação ou rebaixamento de índices e de diferenciação podem ser permutadas.
6.13.2 C URVAS G EODÉSICAS

Um exemplo importante de aplicação da derivada absoluta de um campo em uma deter-
minada geometria do espaço são as curvas geodésicas. De maneira simples, uma geodésica é
aquela curva no espaço cujos vetores tangentes permanecem paralelos ou invariantes ao longo
da mesma. Em um espaço Riemanniano, a geodésica também é a curva de menor distância
entre dois pontos no espaço.
Em um espaço Euclideano, a geodésica entre dois pontos é, simplesmente, a linha reta entre
os mesmos. Porém em um espaço curvo, a geodésica é realmente uma curva. Uma maneira
alternativa de se definir uma geodésica está relacionada com topologia e geometria diferencial.
Nesta abordagem, a geodésica é a curva de menor distância entre dois pontos sobre uma super-
fície curva no Rn . Esta interpretação é particularmente importante para a teoria da relatividade
geral, uma vez que a geometria do espaço-tempo, ou seja, a sua métrica, é determinada pela pre-
sença de objetos maciços. Quando uma partícula-teste está nas vizinhanças destes objetos, a
sua trajetória entre dois pontos quaisquer neste espaço-tempo segue ao longo de uma geodésica.
É conveniente neste ponto introduzir-se a definição formal de uma curva no E 3 . A definição
abaixo é ilustrada pela figura 6.9.
Definição 6.10 (Curva no espaço E 3 ). Seja I ⊂ R um conjunto de valores do parâmetro t ∈ I e
o espaço Euclideano E 3 . Uma curva C no espaço E 3 é o mapeamento contínuo
I 7−→ E 3

das funções x (t) , y (t) , z (t) ∈ C 2 (I) sobre E 3 tal que para cada t ∈ I existe um e somente um vetor
posição r = r (t) ∈ E 3 , determinado por
r (t) = (x (t) , y (t) , z (t)) .
Para seguir a discussão, já é possível e conveniente abandonar-se a restrição do E 3 e consi-
derar um espaço Riemanniano qualquer de dimensão n, denotado por Rn . Uma curva no Rn é
definida, de forma análoga à definição 6.10, como o conjunto de pontos C ⊂ Rn determinados pelo
1 2 n
mapeamento da varredura do parâmetro t ∈ R em imagens das funções q (t) , q (t) , . . . , q (t) ∈
2 1 2 n
C (R), as quais irão formar as n-uplas ordenadas q (t) , q (t) , . . . , q (t) ∈ C.
Para se determinar então a equação de uma geodésica no Rn , emprega-se com frequência o
cálculo variacional. Neste caso, a geodésica é definida como a curva cujo comprimento possui um
valor estacionário com respeito a variações arbitrariamente pequenas, mas com pontos extremos
mantidos fixos.
Seja então d` o comprimento elementar de arco correspondente ao deslocamento infinitesimal
d` e ti e tf os valores extremos do parâmetro t que determina a curva C entre os pontos A e B,
contidos no Rn . Então, as coordenadas dos pontos ao longo de C serão dadas pelas fórmulas
q i = q i (t) , ti 6 t 6 tf , q i (t) ∈ C 3 (R) , i = 1, 2, . . . , n,

sendo que q i (ti ) 7→ A e q i (tf ) 7→ B. Portanto, a extensão da curva C, denotada por `, será
dada por
ˆ B
`= d`.
A,C
De acordo com o princípio variacional acima, a curva geodésica entre A e B será determinada
então por
ˆ B
δ` = δ d` = 0.
A,C
Mas como o deslocamento d` ocorre ao longo da curva C, o princípio variacional acima pode
ser escrito também em termos de uma integração no parâmetro t. Em um espaço Riemanniano,
a norma d` é dada por d`2 = gij dq i dq j . Então, ao longo de uma variação infinitesimal ao longo de
C, entre os valores t e t + dt do parâmetro livre, a coordenada qi (t) varia por
dq i
dq i = dt,
dt
ou seja, a norma varia por
r
2 dq i dq j 2 dq i dq j
d` = gij dt =⇒ d` = gij dt.
dt dt dt dt
Portanto, o princípio variacional pode ser expresso como
ˆ tf r
dq i dq j
δ` = δ gij dt = 0.
ti dt dt

O integrando
acima é um funcional das quantidades q i (t) (através do tensor de métrica) e
dq i /dt , as quais serão determinadas a partir do princípio variacional. Denota-se este funcional
por
r
i dq i dq i dq j

L q , = gij .
dt dt dt
Portanto, aplicando a variação δ`, mantendo os extremos fixos, resulta
ˆ tf ˆ tf ˆ tf
 
i
∂L ∂L dq
δ` = δ L dt = δL dt =  δq i + i δ  dt.
ti ti ti ∂q i ∂ dq dt
dt
Como é usual, a variação δq i corresponde à diferença entre duas formas funcionais para q i (t)
i
que são arbitrariamente próximas entre si. Denotando-se estas formas funcionais como q(1) (t) e
i
q(2) (t), escreve-se δq i = q(2)
i i
− q(1) e, portanto,
i
d d h i i d i d i dq
δq i = i

q(2) − q(1) = q(2) − q(1) =δ .
dt dt dt dt dt

Então, integrando por partes o segundo termo, resulta

ˆ tf ˆ tf
dq i

∂L ∂L d
δq i dt

i δ dt = i
ti ∂ dq dt ti ∂ dq dt
dt dt
0
f ˆ tf ˆ tf
t
>    
∂L i d  ∂L  i d  ∂L  i
= i δq − i δq dt = − i δq dt,
∂ dq ti dt ∂ dq ti dt ∂ dq
dt dt dt

ti

uma vez que os extremos são fixos. Portanto, o princípio variacional sustenta que
ˆ tf 
  
∂L d  ∂L  i
δ` = i
− δq dt = 0.
ti  ∂q dt ∂ dqi 
dt
Para uma variação arbitrária das coordenadas q i , a identidade acima somente pode ser satisfeita
se forem obedecidas as equações de Euler-Lagrange
 
∂L d  ∂L 
− = 0, (i = 1, 2, . . . n) .
∂q i dt ∂ dqi
dt
Até este ponto, o parâmetro t foi considerado arbitrário. Porém, como se deseja relacionar a
geodésica como a curva de menor extensão entre A e B, o parâmetro t será escolhido como o
comprimento de arco ` ao longo da mesma, ou seja,
dq i dq i d`
t = `, = =⇒ L = = 1.
dt d` d`
Calculando então as derivadas acima,
r
∂L ∂ dq j dq k 1 ∂gjk dq j dq k 1 ∂gjk dq j dq k
i
= i gjk = L −1 i
= .
∂q ∂q d` d` 2 ∂q d` d` 2 ∂q i d` d`
Já a outra derivada fica
r
dq j dq k dq k dq j k dq j

∂L ∂ 1
i = gjk = gjk δij + δi = gij .
∂ dq
∂ dq i
d` d` 2 d` d` d`
d` d`
Para este termo é ainda necessário calcular a derivada absoluta

 
dq j dgij dq j d2 q j ∂gij dq k dq j d2 q j

d  ∂L  d
i = gij = + gij 2 = + gij .
d` ∂ dq d` d` d` d` d` ∂q k d` d` d`2
d`
Portanto, as equações de Euler-Lagrange tornam-se
d2 q j 1 ∂gjk dq j dq k

∂gij
gij 2 + − = 0.
d` ∂q k 2 ∂q i d` d`
Nota-se que esta equação pode ainda ser escrita como
d2 q j ∂gjk dq j dq k

1 ∂gij ∂gik
gij 2 + + − = 0,
d` 2 ∂q k ∂q j ∂q i d` d`
o que, de acordo com (6.45d), resulta em
d2 q j dq j dq k
gij + [jk, i] = 0, (i = 1, 2, . . . , n) , (6.60a)
d`2 d` d`
as quais são as equações da curva geodésica. Finalmente, usando (6.45c), pode-se escrever
estas equações também como
d2 q i dq j dq k
2
+ Γijk =0 (i = 1, 2, . . . , n) . (6.60b)
d` d` d`
Exemplo 6.14. Encontre as equações da curva geodésica em coordenadas cilíndricas.

Resolução. Usando os resultados para os símbolos
de Christoffel obtidos na exemplo 6.12, as
equações (6.60b) são escritas para n = 3 e q i 7→ {ρ, φ, z}. Os pontos extremos entre ì = 0 e `f
são dados respectivamente pelas coordenadas {ρ, φ, z}i e {ρ, φ, z}f . Então,
2 2
d2 ρ 1 dφ d2 ρ dφ
2
+ Γ 22 = 0 =⇒ 2
− ρ =0
d` d` d` d`
d2 φ dρ dφ d2 φ 2 dρ dφ
2
+ 2Γ212 =0 =⇒ + =0
d` d` d` d`2 ρ d` d`
d2 z `
2
=0 =⇒ z (`) = zi + (zf − zi ) .
d` `f
A equação para z (`) é trivial, porém, a equações diferenciais para ρ (t) e φ (t) são acopladas e não
lineares, portanto muito difíceis de serem resolvidas analiticamente para dois pontos arbitrários
no E 3 .
Uma solução simples do sistema acima ocorre quando φ = cte., ou seja, entre dois pontos no
mesmo azimute. Neste caso, o sistema se reduz a
d2 ρ `
=0 =⇒ ρ (`) = ρi + (ρf − ρi ) ,
d`2 `f
ou seja,
z − zi ρ − ρi zf − zi
= =⇒ z = zi + (ρ − ρi ) ,
zf − zi ρf − ρi ρf − ρi
a qual é uma linha reta no plano φ = cte. conectando os pontos extremos.
As soluções das equações (6.60) sempre fornecem a curva de menor extensão entre dois pon-
tos para qualquer sistema de coordenadas no Rn . Contudo, em certas situações, é interessante
encontrar-se a geodésica quando a curva C possui vínculos; por exemplo, a curva de menor
extensão entre os pontos A e B que se encontram sobre a superfície F q i = 0, tal que todos
os pontos ao longo de C também estão sobre essa superfície. Em um espaço Rn , a equação de
superfície define uma variedade 17 em Rn−1 . Por exemplo, a geodésica sobre uma esfera de raio
a.
Neste caso, a norma da variedade Rn−1 irá determinar um tensor de métrica representado por
uma matriz (n − 1) × (n − 1) e as equações (6.60) ainda poderão ser aplicadas, com uma definição
conveniente das coordenadas q i sobre essa variedade.
Exemplo 6.15. Encontre a curva geodésica conectando dois pontos sobre a superfície de um
cilindro ρ = cte. e que está vinculada a esta superfície.
Resolução. Neste caso, as equações obtidas no exemplo 6.14 não podem ser aplicadas, pois
mesmo que os pontos extremos {ρ, φ, z}i e {ρ, φ, z}f encontrem-se sobre a superfície, a curva de
menor extensão não está necessariamente restrita à mesma. Isto pode ser verificado colocando-
se dρ/d` = 0 nas equações. Observa-se que a única solução compatível neste caso é ρ = cte. e
φ = cte., o que corresponde a uma reta vertical sobre a superfície do cilíndro. Esta é a única
solução possível para as equações obtidas.
Sobre a superfície ρ = cte. pode ser realizada a parametrização φ = φ (`), sendo que então
o elemento de arco é dado por d`2 = ds2 + dz 2 , sendo ds = ρdφ. Neste caso, n = 2, o tensor de
métrica é simplesmente gij = δij e os símbolos de Christoffel são nulos. Assim, as equações
geodésicas ficam dadas simplesmente por
d2 s `
=0 =⇒ s (`) = ρφ (`) =⇒ φ (`) = φi + (φf − φi )
d`2 `f
d2 z `
=0 =⇒ z (`) = zi + (zf − zi ) .
d`2 `f
Ou seja,
z − zi φ − φi φ − φi
= =⇒ z = zi + (zf − zi ) ,
zf − zi φf − φi φf − φi
a qual descreve uma hélice sobre a superfície cilíndrica.
17 Variedade (manifold) é uma generalização do conceito de superfície em geometria diferencial e topologia. Uma
variedade de dimensão n é um espaço topológico que nas vizinhanças de cada ponto assemelha-se a um espaço n . E
Curvas e circunferências são variedades no R1 ; esferas e cilindros são variedades no R2 .

Exercício 6.6. Usando o resultado do exemplo 6.15, calcule a extensão da geodésica que une
os pontos Cartesianos P = (x, y, z) = (1, 0, 0) e Q = (0, 1, 1) sobre a superfície cilíndrica de raio
ρ = 1.
Resolução. De acordo com o exemplo, a curva geodésica que une os pontos P e Q é
2 2
z= φ =⇒ dz = dφ.
π π
Então, o elemento de arco é
4
d`2 = dφ2 + dφ2
π2
e a extensão da geodésica é dada por
ˆ Q r ˆ π/2 r
4 π2
`P →Q = d` = 1 + 2 dφ = 1 + = 1, 86209588912 . . . .
P π 0 4
√
Para comparar, a linha reta unindo P a Q possui uma extensão igual a 3 = 1, 73205080757 · · · <
`P →Q .
Exercício 6.7. Mostre que sobre a superfície de uma esfera todas as curvas meridianas são
geodésicas. Mostre também que nenhuma outra circunferência é uma geodésica.

Demonstração. Dada uma esfera de raio a, esta se trata de uma variedadeno R2 com q 1 , q 2 7→
{θ, φ}. O elemento de arco sobre esta superfície é d`2 = a2 dθ2 + sen2 θdφ2 . Então, o tensor de
métrica e os símbolos de Christoffel (6.44b) são dados por
2
a 0 θ 0 0 φ 0 cotan θ
g= =⇒ Γ = , Γ = ,
0 a2 sen2 θ 0 − sen θ cos θ cotan θ 0
e as equações da geodésica (6.60b) se tornam
2
d2 θ dφ
2
− sen θ cos θ =0
d` d`
d2 φ dθ dφ
2
+ 2 cotan θ = 0.
d` d` d`
Embora estas equações sejam não lineares e acopladas, pode-se usar a simetria de uma esfera
para se realizar a demonstração. Assumindo-se que φ = cte., as equações acima reduzem-se a
d2 θ `
2
= 0 =⇒ θ (`) = θi + (θf − θi ) ,
d` `f
ou seja, qualquer meridiano da esfera é uma curva geodésica.
Tomando-se agora θi 6= π/2 e assumindo circunferências θ = cte., a equações reduzem-se a
dφ
= 0 =⇒ φ = cte.,
d`
o que contradiz a suposição inicial. Portanto, exceto as meridianas, nenhuma outra circunfe-
rência sobre a esfera é uma geodésica.
6.13.3 T RANSPORTE PARALELO DE CAMPOS VETORIAIS

Em um espaço Euclideano, um campo vetorial v (r) é denominado um campo de vetores
paralelos se os seus componentes v i são constantes, ou seja, se ∂v i /∂q j = 0. De forma
equivalente, supondo-se que o vetor v possuios seus componentes v i definidos em um ponto
P do E n , localizado pela n-upla q 1 , q 2 , . . . , q n , se o ponto P é deslocado por dr, localizando-se
então no ponto r + dr, o campo vetorial nesta nova posição é dado por v + dv. Diz-se então que
o campo vetorial v sofre um transporte paralelo se ∂v i /∂q j = 0.
Um exemplo deste tipo de campo vetorial é fornecido pelo campo elétrico no interior de um
capacitor de placas paralelas. Nesta região o campo E é uniforme, isto é, em todos os pontos
este possui os mesmos módulo, direção e sentido. Outro exemplo seria o campo de aceleração
gravitacional nas proximidades da superfície terrestre.
Deseja-se agora generalizar este conceito para qualquer campo tensorial em um espaço Rie-
manniano. Será verificado também que a definição realizada abaixo para um campo de vetores
paralelos em um espaço curvo qualquer também pode ser empregada para definir as curvas
geodésicas neste espaço.

Nas seções 6.11 e 6.13.1 mostrou-se que, dados q3

x3
os componentes v i (r) , sua derivada coordenada
usual ∂v i /∂q j não é um tensor, mas sim a sua de-
C
rivada covariante ou a sua derivada absoluta ao
longo de uma curva q i = q i (t). Portanto, para man-
ter a característica tensorial, o transporte paralelo
P q2
de um campo vetorial em um espaço Riemanniano
deve ser definido de forma distinta do que é feito
q1
no espaço Euclideano. v
Considera-se então um espaço Riemanniano
Rn , no qual uma curva C é parametrizada por x2
C 7→ qi = qi (t) , (ti 6 t 6 tf , i = 1, 2, . . . , n) ,
e um campo vetorial v = v (r) em Rn . Diz-se que v x1
é um campo de vetores paralelos a C, ou, de forma
equivalente, que v é transportado paralelamente ao
longo de C se a derivada intrínseca de v ao longo Figura 6.10: Campo vetorial 3 v transportado pa-
desta curva é nula, isto é, se ralelamente à curva C em E . No ponto P , es-
tão
1 também representadas as curvas coordenadas
dv q , q2 , q3 .
= 0. (6.61)
dt
O comportamento de um campo vetorial transportado paralelo a uma curva C no espaço E 3
está representado na figura 6.10. No ponto P , pode-se observar também uma representação
para as curvas coordenadas q 1 , q 2 , q 3 neste ponto.
De forma equivalente, pode-se definir através de (6.61) um campo vetorial transportado pa-
ralelamente ao longo de uma curva C que se estende sobre uma variedade no Rn−1 . Para exem-
plificar, com esta última definição é possível discutir-se campos de vetores paralelos sobre uma
superfície curva no E 3 .
Segue então de (6.58) que a componente con-
travariante v i de v satisfaz a equação diferencial vi Q
i i k
δv dv dq
= + Γijk v j = 0. (6.62a) vPi
δt dt dt
Ou seja, ao longo de C, a componente v i varia por
q j = q j (t)
Q q j + dq j

dv i dq k
= −Γijk v j ou dv i = −Γijk v j dq k , (6.62b)
dt dt
P qj

quando o parâmetro varia de t a t + dt, sendo que

v j e Γijk são calculados nas coordenadas corres-
pondentes a t. A quantidade dv i em (6.62b) mostra Figura 6.11: Componente v i transportada paralela-
que à medida que o campo v é transportado para- mente ao longo da curva C. Quando a coordenada
j
lelamente ao longo da curva C, sua i-ésima compo- q (t) varia entre os pontos P e Q, a componente
i i
nente varia por dv i quando as coordenadas variam varia de vP a vQ .
de q j para q j + dq j . Este comportamento está ilus-
trado na figura 6.11 e mostra como o transporte paralelo de um campo vetorial em um espaço
curvo difere de um espaço plano. Neste último caso, os símbolos de Christoffel são todos nulos
e, portanto, dv i = 0, ou seja, as componentes de v não se alteram ao longo da curva C.
Da mesma forma, a componente covariante vi de v satisfaz a equação diferencial
δvi dvi dq k
= − Γj ik vj = 0, (6.63a)
δt dt dt
ou seja, a i-ésima componente covariante de v varia por
dvi = Γj ik vj dq k (6.63b)
ao longo de C quando a j-ésima coordenada varia de q j a q j + dq j .

Dados agora dois campos vetoriais v e w que são transportados paralelamente ao longo da
mesma curva C, pode-se mostrar facilmente que tanto os módulos dos mesmos quanto o ângulo

θ entre v e w permanecem constantes durante os seus transportes. Isto ocorre porque, em

primeiro lugar, de acordo com (6.59) a derivada intrínseca de um escalar é igual a igual a sua
derivada ordinária. Em segundo lugar, de acordo com o teorema de Ricci (6.1), a derivada
convectiva do tensor de métrica é nula; consequentemente, sua derivada absoluta também o
será. Assim, dado o invariante
v · w = vw cos θ = v i wi = gij v i wj ,
resulta
d δ δv i j δwj
gij v i wj = gij w + gij v i

(v · w) = = 0, (6.64a)
dt δt δt δt
de acordo com (6.62a). Portanto, se w = v, então
d dv 2 dv
(v · v) = = 2v = 0, (6.64b)
dt dt dt
ou seja, o módulo de v permanece constante ao longo do transporte paralelo do vetor. O mesmo
acontecendo com o módulo de w. Por consequência, o ângulo θ entre os mesmos,
d d d dθ
(v · w) = (vw cos θ) = vw cos θ = −vw sen θ = 0, (6.64c)
dt dt dt dt
também permanece constante ao longo de C, mesmo para θ 6= 0 ou θ 6= π.
Considera-se agora o parâmetro t como sendo novamente p o comprimento de arco ` ao longo
da curva C. O elemento de arco é dado sempre por d` = gij q i q j , de tal forma que, de acordo
com a discussão realizada na seção 6.13.2,
r r
dq i dq j dq i dq j dq i dq j
d` = gij d` = L d` =⇒ L = gij = 1 =⇒ gij = 1,
d` d` d` d` d` d`
ao longo de C. Como λ ≡ dr/d` é um vetor, este resultado mostra que o mesmo é unitário. Porém,
o interessante aqui é que, em primeiro lugar, λ é o vetor tangente a C em todos os pontos. Em
segundo lugar, e o mais importante, de acordo com (6.62), a derivada intrínseca da i-ésima
componente de λ ao longo de C, resulta ser
δλi dλi dq k d2 q i dq j dq k
= + Γijk λj = 2
+ Γijk = 0,
δ` d` d` d` d` d`
a qual é justamente a equação diferencial satisfeita pela curva geodésica, (equação 6.60b).
Portanto, um vetor que é tangente a uma curva geodésica em um determinado ponto e que
é transportado paralelamente ao longo desta curva permanecerá sempre tangente à geodésica.
Segue disto que, dado um campo vetorial que é sempre tangente a alguma variedade no Rn , as
curvas geodésicas sobre esta variedade podem sempre ser estabelecidas de forma inequívoca a
partir deste campo vetorial.
Um exemplo de um campo vetorial deste tipo vem de uma superfície esférica no E 3 . Sobre
esta superfície, os vetores unitários êθ são sempre tangentes à mesma. Estes vetores unitários
são sempre transportados paralelamente ao longo de uma curva meridiana, a qual é, de acordo
com o exemplo 6.7, uma curva geodésica sobre a superfície esférica.
Dados agora os vetores λ e w que são transportados pa-
N ralelamente ao longo de uma curva geodésica, sendo que λ
é o campo vetorial tangente à mesma, os resultados (6.64b e
c) mostram que não somente o módulo de w permanece con-
tante ao longo da geodésica, mas que também o seu ângulo
com a curva não varia durante o seu transporte.
A figura 6.12 ilustra o transporte paralelo de um vetor ao
longo de geodésicas de um espaço R2 esférico. Partindo do
ponto A e seguindo até N ao longo de um meridiano (curva
α geodésica), o vetor permanece tangencial à curva ao longo
do trajeto. Em seguida, o mesmo vetor é transportado para-
A B
lelamente ao longo de outra geodésica conectando os pontos
N e B. Finalmente, o vetor é paralelamente transportado de
B a A ao longo da terceira geodésica (linha do equador). Ao

S
Figura 6.12: Transporte paralelo de um

retornar ao ponto de partida, o vetor, embora tenha sido pa-

ralelamente transportado ao longo de um caminho fechado
composto somente por curvas geodésicas, resulta com uma
orientação espacial que difere de sua orientação original pelo
ângulo α ilustrado na figura.
Este tipo de resultado é típico de espaços denominados
curvos e não ocorre em espaços planos, como o E n . Qual-
quer vetor transportado paralelamente em um espaço Eucli-
deano ao longo de suas geodésicas (linhas retas), sempre irá
retornar ao ponto de partida com a mesma orientação inicial. Uma medida da curvatura de um
espaço é fornecida pelo tensor de Riemann, discutido na próxima seção.
6.14 OS TENSORES DE R IEMANN , R ICCI E E INSTEIN

O cálculo do tensor de curvatura de Riemann-Christoffel para uma determinada métrica no
Rn consiste no método mais prático para determinar se o espaço descrito pela métrica é plano
ou curvo e, neste último caso, para então determinar a sua curvatura. Em outras palavras, o
tensor de Riemann mede o quanto o tensor de métrica é ou não localmente isométrico à métrica
Euclideana.
Nesta seção será realizada uma dedução do tensor de Riemann e discutidas algumas de suas
propriedades. Em seguida, serão obtidos dois outros tensores relacionados, os tensores de Ricci
e de Einstein, este último sendo fundamental na teoria da relatividade generalizada.
6.14.1 O TENSOR DE CURVATURA DE R IEMANN -C HRISTOFFEL

Uma quantidade fundamental para a geometria de espaços curvos e para a dinâmica de cor-
pos materiais em tais espaços, é o tensor de curvatura de Riemann-Christoffel. Este tensor está
relacionado com as diferenças obtidas nos componentes de tensores quando o deslocamento pa-
ralelo dos mesmos entre dois pontos do espaço Rn ocorre por dois caminhos distintos. Matema-
ticamente, esta diferença está relacionada com a ausência de simetria na ordem das derivadas
mistas em espaços curvos. Em análise de funções matemáticas, se u = u (x, y) é uma função das
variáveis x e y e pertence à classe C 2 (R), isto é, é duas vezes diferenciável em qualquer uma das
variáveis, então ∂ 2 u/∂x∂y = ∂ 2 u/∂y∂x. Contudo, em espaços curvos, a diferenciação covariante
dos componentes de um tensor não apresenta, em geral, a mesma propriedade.
Uma maneira ilustrativa de verificar a origem desta diferença pode ser apresentada consi-
derando-se o deslocamento paralelo de um campo vetorial entre dois pontos infinitesimalmente
próximos no Rn . A alteração nos componentes do campo vetorial pode ocorrer de maneiras
distintas se forem escolhidos dois caminhos diferentes ao longo de curvas geodésicas, os quais
delimitam assim uma superfície elementar no Rn . Esta alteração nos valores finais de uma
determinada componente do campo vetorial leva à definição do tensor de curvatura.
Em primeiro lugar, é necessário verificar que diferentes caminhos ao longo de curvas geodé-
sicas, que delimitam uma superfície no Rn , conduzem, de fato, ao mesmo ponto final em um
espaço curvo. Para tanto, considera-se um ponto inicial P contido no Rn , ilustrado na figura
i i
6.13. Consideram-se também dois deslocamentos distintos dq = dq i e δq = δq ei , também
ie
ilustrados na figura 6.13.
Estes
deslocamentos
partem ambos de P q e chegam, respectiva-
mente, a Q q i + dq i e R q i + δq i , sendo que estes não são necessariamente infinitesimais.
O símbolo “d” indica aqui um determinado incremento na coordenada, ao passo que “δ” repre-
senta um outro incremento.
Imagina-se agora que o segmento P R é deslocado de tal forma que quando o ponto P coincidir
com Q, o ponto R coincidirá com o ponto S na figura 6.13. Isto equivale a definir-se o segmento
QS, composto pelo mapeamento unívoco de cada ponto ao longo de P R sendo transladado pela
quantidade “d”, resultando nos mapeamentos P → Q : q i → q i + dq i , P → R : q i → q i + δq i , e então
R → S : q i + δq i → q i + δq i + dqR
i
,
sendo
S : q i + δq i + dqR
i
= q i + δq i + d q i + δq i = q i + δq i + dq i + d δq i


280 6.14. Os tensores de Riemann, Ricci e Einstein
as coordenadas do ponto S. Como δq é um vetor no Rn e como os deslocamentos ocorrem ao

longo de geodésicas, então, se os deslocamentos “d” e “δ” tornarem-se elementares, o transporte
paralelo de δq i resulta em
d δq i = −Γijk(P ) δq j dq k ,

de acordo com (6.62b), onde Γijk(P ) indica que os símbolos de Christoffel devem ser calculados
no ponto P . De forma similar, se o segmento P Q é deslocado de tal forma que quando P coincide
com R, o ponto Q coincide com o ponto S 0 , resultando assim no segmento RS 0 . Desta maneira,
cada ponto ao longo de P Q é transladado pela quantidade “δ”, resultando no mapeamento
Q → S 0 : q i + dq i → q i + dq i + δqQ
i
.
Assim, as coordenadas do ponto S 0 são
S 0 : q i + dq i + δqQ
i
= q i + dq i + δ q i + dq i = q i + dq i + δq i + δ dq i .

Portanto, se o deslocamento “δ” for elementar, a variação na coordenada dq i também é dada por
(6.62b), resultando em
δ dq i = −Γijk(P ) dq j δq k .

Comparando as expressões para d δq i e δ dq i ,
observa-se que uma simples troca de índices mu-
Q q i + dq i
dos, aliada à simetria de Γijk frente à permutação
dos índices j e k, mostra que ambas as expressões
dq i i são idênticas, resultando, portanto, que S 0 = S.
δqQ
Ou seja, as curvas elementares C1 ≡ CP →R→S e

P qi C2 ≡ CP →Q→S 0 , partindo do mesmo ponto inicial P ,
S; S 0 conduzem ao mesmo ponto final, desde que estas
sejam realizadas ao longo de curvas geodésicas no
i Rn .
δq i dqR
Considera-se agora o transporte paralelo de um
campo vetorial v = v i ei ao longo de ambos os ca-
R q i + δq i minhos C1 e C2 da figura 6.13. Este transporte está
ilustrado agora na figura 6.14. O campo vetorial é
Figura 6.13: Os deslocamentos paralelos do seg- suposto estar definido no ponto P , onde i suas com-
mento δq i ao longo de P Q e de dq i ao longo de ponentes possuem valores iguais a vP

, e estes
P R resultam no mesmo ponto final S 0 = S. componentes são transportados até o ponto S ao
longo de dois caminhos distintos:
C1 : Realiza-se o transporte i paralelo de v de P até Q com um deslocamento dq i , resultando
então nas componentes vQ . Em seguida, realiza-se o transporte paralelo do mesmo vetor de Q
i
até S com o deslocamento δq i , resultando nos valores finais vSQ para as componentes de v.
i
C2 : Desloca-se
v paralelamente de P a R
i por δq . Em seguida, desloca-se o mesmo de R a S
por dq i , resultando as componentes vSR .
i i
As componentes vSQ e vSR são idênticas ou distintas entre si? Em geral, para um espaço
i i
curvo, vSQ 6= vSR e a razão para tanto pode ser entendida calculando-se as variações da i-ésima
componente de v ao longo dos dois caminhos distintos.
Ao longo do transporte paralelo P → Q, a referida componente resulta com o valor
i
vQ = vPi + dvPi ,
onde dvPi é a variação de v i no referido deslocamento. De acordo com (6.62b), para um desloca-
mento suficientemente pequeno,
dvPi = −Γijk(P ) vPj dq k ,
n o
onde Γijk(P ) são os valores assumidos pelos símbolos de Christoffel no ponto P . Ou seja,
i
vQ = vPi − Γijk(P ) vPj dq k .

i
A componente vQ é agora transportada ao ponto i
i
vQ
S, assumindo o valor vSQ no mesmo, a qual é dada
por
i i i i j
vSQ = vQ + δvQ = vQ − Γijk(Q) vQ δq k ,
n o
onde agora Γijk(Q) são os símbolos de Christoffel vPi Q i i
vSR vSQ
em
i Q. Como estes são funções das coordenadas
q , pode-se escrever, para dq i pequeno o sufici-
ente, dq i

∂Γijk
i i P ) +Γijk,` dq ` , S
i i i
Γ jk = Γ jk q =⇒ Γ jk(Q) = Γ jk(P ) + dq ` ≡ Γijk(P
∂q ` vRi
P
sendo Γijk,` ≡ ∂Γijk /∂q ` em P . Então, a compo-

i
nente vSQ acima pode ser escrita como δq i

i
vSQ = vPi − Γijk(P ) vPj dq k − Γijk(P ) + Γijk,` dq ` vPj − Γj mn(P ) vPm dq n δq k R
h 3 i
= vPi − Γijk(P ) vPj dq k − Γijk(P ) vPj δq k − Γijk,` vPj δq k dq ` + Γijk(P
Figura
j
) Γ mn(P
6.14:
m k
O deslocamento
n
O dq i do vetor v
) vP δq dq +paralelo
do ponto P ao pontoh S3ao i longo de dois cami-
= v i − Γijk v j dq k − Γijk v j δq k − Γijk,` v j δq k dq ` + Γijk Γjnhos m k
δq dq n +
mn v distintos O dq i
.
resulta em diferentes valores para a
componente v i .
Na última expressão, o índice “P ” foi removido por-
que todas as quantidades no lado direito são cal-
culadas neste ponto.
Realizando agora o mesmo procedimento para o
transporte P → R → S, resulta
h 3 i
i
vSR = v i − Γijk v j δq k − Γijk v j dq k − Γijk,` v j dq k δq ` + Γijk Γj mn v m dq k δq n + O dq i .
Portanto, a diferença na i-ésima componente de v no ponto S, para dois caminhos arbitrários e

distintos partindo de P , é igual a
i i
vSR − vSQ = Γijk,` v j δq k dq ` − Γijk,` v j dq k δq ` + Γijk Γj mn v m dq k δq n − Γijk Γj mn v m δq k dq n ,
onde foram mantidos somente os termos até segunda ordem em dq i .

A diferença acima pode ser escrita como
i i
vSR − vSQ = Rij`k v j dq k δq ` , (6.65a)
onde
Rijk` ≡ Γijk,` − Γij`,k + Γim` Γmjk − Γimk Γmj` (6.65b)
é o tensor de curvatura de Riemann-Christoffel misto ou do segundo tipo. Como v i, dq k e
δq ` em (6.65a) são todos componentes de vetores, pela regra do quociente as quantidades Rijk`
realmente compõe um tensor de posto quatro. Uma outra maneira de se escrever (6.65b) é na
forma de determinantes,
∂ ∂ i
Γ m` Γimk
` k
∂q ∂q
Rijk` =

+ m
.
(6.65c)
m
i i

Γ j` Γ jk
Γ j` Γ jk
Observa-se que o tensor de curvatura independe do campo v; este depende somente do tensor
de métrica e de suas derivadas, ou seja, é uma função somente da geometria do espaço curvo.
Para que o valor de vSi independa do caminho adotado a partir de P , é necessário que Rijk` = 0,
uma vez que o campo v é arbitrário. Em um espaço Euclideano, sempre é possível encontrar-
se um sistema de coordenadas (Cartesiano, por exemplo), onde Γijk = 0. Neste sistema de
coordenadas, o tensor de curvatura é identicamente nulo. Pode-se mostrar que o mesmo ocorre
para qualquer outro sistema de coordenadas neste espaço.
Através do tensor de curvatura, é possível atribuir-se significado ao termo espaço plano ou
Euclideano, como sendo aquele onde o tensor de Riemann-Christoffel é identicamente nulo em

282 6.14. Os tensores de Riemann, Ricci e Einstein
todos os pontos deste espaço. Se esta condição não for satisfeita, o espaço é curvo ou não
Euclideano. Este resultado é de fundamental importância para a dinâmica de sistemas físicos
em espaços curvos, descritos por teorias tais como a Relatividade Geral.
Se ao invés das componentes contravariantes de v fossem realizados os transportes paralelos
das componentes covariantes {vi } entre os pontos P e S da figura 6.14, pode-se mostrar, com o
emprego de (6.63b), que a diferença entre os valores de viS obtidos nos dois caminhos distintos
seria igual a
viSR − viSQ = −Rj i`k vj dq k δq ` .
Estes resultados mostram que o deslocamento paralelo de um vetor e, em geral, de um tensor,
entre dois pontos de um espaço Riemanniano depende do caminho escolhido. Segue disto que
se um tensor é deslocado paralelamente ao longo de uma curva fechada, ao retornar ao ponto
de partida os seus componentes não irão possuir em geral os mesmos valores que possuiam
originalmente. Este fato, característico de espaços curvos, tem consequências importantes para
a física acerca do conceito de campos conservativos em espaços Riemannianos curvos.
Um tensor associado a Rijk` é
Rijk` = gim Rmjk` , (6.66a)
denominado o tensor de curvatura de Riemann-Christoffel covariante ou do primeiro tipo.
Não é difícil verificar que este tensor pode ser escrito como
Rijk` = [jk, i],` − [j`, i],k + [ik, m] Γmj` − [i`, m] Γmjk (6.66b)
mn
= [jk, i],` − [j`, i],k + g ([ik, m] [j`, n] − [i`, m] [jk, n]) (6.66c)
∂ ∂
[ik, m] [i`, m]

` k
∂q ∂q
= +
(6.66d)
[j`, i] [jk, i] Γmjk Γmj`

∂ ∂

` [ik, m] [i`, m]
∂q ∂q k

+ g mn

= .
(6.66e)
[jk, n] [j`, n]

[j`, i] [jk, i]
6.14.1.1 P ROPRIEDADES DO TENSOR DE CURVATURA
Pode-se ver, tanto a partir da definição de Rijk` em (6.65) quanto a partir da definição de Rijk`
em (6.66) que as seguintes propriedades de simetria são satisfeitas:
Rijk` = −Rij`k Rijk` = −Rij`k (6.67a)

j
Rijk` = −R ik` Rijk` = −Rjik` (6.67b)
Rijk` =R k
ìj Rijk` = Rkìj . (6.67c)
Uma consequência digna de nota da antissimetria do tensor de curvatura frente aos pares inici-
ais e finais de índices, propriedades (6.67a,b), é:
(NS) : Riik` = Rijkk = Riik` = Rijkk = 0. (6.67d)
A seguinte propriedade cíclica também é válida: se qualquer índice do tensor é mantido fixo
enquanto os três índices restantes são permutados de forma cíclica e os componentes resultantes
são adicionados, o resultado é nulo. Por exemplo,
Rijk` + Rik`j + Ri`jk = 0. (6.67e)
As propriedades de simetria (6.67a-e) reduzem substancialmente o número total de compo-

nentes independentes do tensor de curvatura. Em um espaço Rn , este tensor possui, ao todo, n4
componentes. Porém, com as simetrias conhecidas, o número de componentes independentes
é de “somente” n2 n2 − 1 /12, ao todo. A tabela a seguir ilustra estes números para algumas
dimensionalidades:
Dimensionalidade do espaço 1 2 3 4 5
Número total de componentes 1 16 81 256 625
Número de componentes independentes 0 1 6 20 50

O fato de que o número de componentes independentes em um espaço unidimensional é nulo

implica em que estes espaços são necessariamente Euclideanos. Isto pode ser entendido pelo
fato de que o elemento de arco em um espaço 1D geral deve necessariamente ser do tipo
d`2 = f (q) dq 2 ,
2 02
o qual
ppode ser transformado a um espaço Cartesiano do tipo d` = dq através da definição
0
dq = f (q)dq.
Exemplo 6.16. Encontre os componentes do tensor de curvatura no espaço de dimensão 2

sobre a superfície de uma esfera de raio a.
Resolução. Dados os símbolos de Christoffel para esta variedade, obtidos no exemplo 6.7,
pode-se escrever os símbolos de Christoffel do primeiro tipo e o tensor de métrica na forma
matricial como
a2 sen θ cos θ

[11, i] [12, i] 0 0 0
[i] = =⇒ [θ] = e [φ] = .
[21, i] [22, i] 0 −a2 sen θ cos θ a2 sen θ cos θ 0
Então, como há somente 1 componente independente no tensor de curvatura, e como

−2
a 0
g−1 = ,
0 a−2 sen−2 θ
pode-se tomar o componente R1221 = Rθφφθ como este componente e calcular a partir de (6.66c),
R1221 = [φφ, θ],θ + g φφ [θφ, φ] [φθ, φ]

= a2 sen2 θ.
Os outros componentes de Rij`k são dados por (6.67a-e). Ou seja, este de fato é um espaço
curvo.
6.14.2 O TENSOR DE R ICCI

Dois outros tensores importantes para a dinâmica de partículas e campos em espaços curvos
são os tensores de Ricci e de Einstein. Ambos são obtidos a partir do tensor de curvatura de
Riemann-Christoffel.
O tensor de Ricci é obtido a partir da contração de Rijk` dado por (6.65b,c) como
Rij = Rkijk (6.68a)

k k ` k ` k
= Γ ij,k − Γ ik,j + Γ ij Γ k` − Γ ik Γ j` (6.68b)

∂ ∂ k k

∂q k ∂q j Γ k` Γ j`

= +
`
.
(6.68c)
`
k
Γ ik Γkij
Γ ik Γ ij
Uma outra expressão importante para o tensor de Ricci pode ser obtida a partir da identidade
(6.54). Empregando (6.50a) e (6.45c), esta pode ser escrita como
∂g ∂ √
i
= gg mn ([mi, n] + [ni, m]) = 2gΓmim =⇒ Γmim = i ln g.
∂q ∂q
Portanto, (6.68b) pode ser expresso em termos de g como

√
k ` k ∂ 2 ln g ∂ √
Rij = Γ ij,k − Γ ik Γ j` − i j
+ Γìj ` ln g. (6.68d)
∂q ∂q ∂q
A partir da expressão (6.68d), pode-se ver facilmente que o tensor de Ricci é simétrico, Rij =
Rji . Devido a isso, o número de componentes independentes de Rij é igual a n (n + 1) /2. Em
uma variedade no R4 , se a métrica for determinada pelas equações diferenciais parciais Rij = 0,
isto resultará em um sistema de 10 equações, as quais foram adotadas por Einstein como as
equações do campo gravitacional no espaço livre, na teoria da relatividade geral.

284 6.15. Aplicações físicas
6.14.3 O TENSOR DE E INSTEIN E AS EQUAÇÕES DO CAMPO GRA -

VITACIONAL
As equações de campo de Einstein, ou simplesmente as equações de Einstein consistem em
um conjunto de equações diferenciais que descrevem a interação gravitacional entre corpos físi-
cos como o resultado da curvatura do espaço-tempo causada pela presença de matéria e energia.
As equações de Einstein formam a parte quantitativa da teoria da relatividade generalizada e
foram publicados pela primeira vez em 1915,18 sendo divulgadas novamente em 1916, quando
então a teoria completa foi publicada.19
Para obter-se o tensor derivado por Einstein na relatividade geral, pode-se partir da identi-
dade de Bianchi
Rijk`;m + Rij`m;k + Rijmk;` = 0,
a qual pode ser obtida a partir de (6.67e). Multiplicando-se esta identidade por g i` g jk , usando a
antissimetria do tensor de curvatura e lembrando que a derivada convectiva do tensor de métrica
é nula, obtém-se
g jk R`jk`;m − g jk R`jm`;k − g i` Rkimk;` = 0,
ou seja,
g jk Rjk;m − g jk Rjm;k − g i` Rim;` = 0,
que também pode ser escrita como
Rkk;m − 2Rkm;k = 0.
Definindo-se agora a quantidade escalar
R ≡ g ij Rij ,
observa-se que R,k = g ij Rij;k = Rj j;k ; ou seja, a identidade anterior pode ser reescrita como
R,m − 2Rkm;k = 0,
ou como
k 1 k
R m − δm R = 0.
2 ;k
A condição suficiente para o cumprimento da identidade acima forma o sistema de equações
Gij = 0, (6.69a)
sendo que o tensor

. 1
Gij = Rij − δji R (6.69b)
2
é o tensor de Einstein.
Em um espaço de dimensão 4 (o espaço de Minkowski M 4 ), as 10 equações diferenciais
parciais em (6.69a) são as equações de Einstein para o espaço livre, isto é, as equações
de campo da teoria geral da relatividade para um corpo massivo no vácuo (sem a presença de
outros campos) e sem a constante cosmológica.
6.15 A PLICAÇÕES FÍSICAS

Algumas aplicações físicas do conteúdo desenvolvido neste capítulo serão apresentadas agora.
18 Die Feldgleichungen der Gravitation (As equações de campo da gravitação). Sitzungsberichte der Preussis-
chen Akademie der Wissenschaften zu Berlin, p. 844–847, 25 de novembro de 1915. Acesso: https://www.
biodiversitylibrary.org/item/92536#page/920/mode/1up (versão em inglês: https://einsteinpapers.press.
princeton.edu/vol6-trans/129).
19 Die Grundlage der allgemeinen Relativitätstheorie (Os fundamentos da teoria da relatividade geral). Annalen der
Physik, v. 354, n. 7, p. 769-822, 11 de maio de 1916. Acesso doi: 10.1002/andp.19163540702 (versão em inglês:
https://einsteinpapers.press.princeton.edu/vol6-trans/158).

6.15.1 A TRANSFORMAÇÃO DE L ORENTZ , O ESPAÇO - TEMPO DE

M INKOWSKI E A FORMULAÇÃO COVARIANTE DO ELETRO -
MAGNETISMO CLÁSSICO
Será realizada aqui uma breve abordagem da transformação de Lorentz e do espaço vetorial
de Minkowski, dentro do contexto da relatividade restrita. Não se pretende realizar aqui uma
introdução à teoria da relatividade, mas sim somente apresentar um conjunto de expressões
relevantes para a próxima seção, onde será discutida a formulação covariante do eletromagne-
tismo clássico.
As origens da teoria da relatividade restrita estão relacionadas com o desenvolvimento do
eletromagnetismo clássico, ocorrido principalmente durante a segunda metade do século XIX,
com os trabalhos de James Clerk Maxwell (1831 – 1879). Pode-se afirmar que a unificação da
eletricidade e do magnetismo nas equações de Maxwell forçou o desenvolvimento da relatividade.
Os fundamentos da teoria foram construídos a partir das contribuições pioneiras de diversos
matemáticos e físicos, destacando-se em particular o trabalho do físico holandês Hendrik Antoon
Lorentz (1853 – 1928), a partir de 1890, com contribuições importantes fornecidas pelo físico-
matemático Jules Henri Poincaré (1854 – 1912). Contudo, foi o físico alemão Albert Einstein
(1979 – 1955) quem contribuiu com as ideias cruciais, principalmente com a publicação em
1905 do artigo:
Zur Elektrodynamik bewegter Körper.20 Annalen der Physik, v. 322, n. 10, pp. 891
– 921, Juni 1905.
Na física moderna, a teoria da relatividade restrita é suposta válida para todas as formas de
interações, exceto em fenômenos gravitacionais de larga escala, onde é necessário empregar-se
a teoria generalizada da relatividade. Em particular, fenômenos atômicos, nucleares e subatô-
micos não podem ser adequadamente descritos sem o uso da relatividade.
6.15.1.1 A SITUAÇÃO ANTERIOR A 1900. A TRANSFORMAÇÃO DE G ALILEU

Nos 40 anos anteriores a 1900, a eletricidade, o magnetismo e a óptica tiveram as suas
relações mutuas devidamente estabelecidas na teoria eletromagnética descrita pelas equações
de Maxwell.
Uma vez que a experiência prévia com movimento ondulatório sempre envolvera um meio
necesário para a propagação da onda, era natural assumir-se que a luz também necessitaria
de um meio, denominado éter, o qual permearia todo o espaço, possuía densidade desprezível
e interagia fracamente com a matéria ordinária. Este meio existia somente para permitir a
propagação de ondas eletromagnéticas.
A hipótese do éter colocava os fenômenos eletromagnéticos em um plano conceitual distinto
da mecânica Newtoniana. Nesta, os conceitos de espaço e tempo são separáveis, sendo o tempo
uma quantidade absoluta, independente do referencial e que era determinado por um referencial
absoluto, possivelmente em repouso em relação às estrelas distantes. Paralelamente, as leis da
mecânica são as mesmas em diferentes referenciais inerciais, isto é, elas são invariantes frente
a uma transformação de Galileu.
Para enfatizar a distinção entre a mecânica Newtoniana e o eletromagnetismo, será consi-
derada brevemente a aplicação da relatividade Galileana a cada uma destas teorias. A figura
6.15 mostra dois sistemas de referência K e K 0 , com coordenadas (x1 , x2 , x3 ; t) e (x01 , x02 , x03 ; t0 ),
respectivamente, sendo que o referencial K 0 se move em relação a K com velocidade relativa v
(constante) e as origens de ambos os referenciais concordam no instante t = t0 = 0. Na transfor-
mação de Galileu, as coordenadas espaciais e o tempo em cada referencial estão relacionados
de acordo com ( (
r 0 = r − vt r = r 0 + vt0
⇐⇒ (6.70)
t0 = t t = t0 .
A lei de transformação (6.70) descreve uma simples translação, para um determinado ins-
tante de tempo. No contexto desta transformação, o sistema físico é descrito matematicamente
20 Acerca da eletrodinâmica dos corpos em movimento. Acesso livre no doi: 10.1002/andp.19053221004. Versão em
inglês: https://einsteinpapers.press.princeton.edu/vol2-trans/154.

no espaço Euclideano E 3 . Verifica-se facilmente que nesta transformação os elementos de com-

primento nos dois referenciais são os mesmos,
d`2 = dx21 + dx22 + dx23 = dx02 02 02
1 + dx2 + dx3 ,
pois ambos são mensurados no mesmo instante de tempo, o qual não influi na métrica do
espaço. Ou seja, o tensor de métrica é, simplesmente, gij = δij , como se espera em um espaço
Euclideano com coordenadas Cartesianas.
A lei de transformação (6.70) é perfeitamente
K0 adequada para a mecânica Newtoniana, pois as
x03 suas leis físicas são invariantes frente a uma trans-
K formação de Galileo. Para exemplificar, considera-
x3 R(t) = vt se um sistema de partículas interagindo por meio
de potenciais centrais. Supondo que a equação de
P
movimento da i-ésima partícula no sistema K 0 seja
r0
 
r dp0i X
= −∇0i  Vij r 0i − r 0j  ,

dt0
j6=i
R(t)
O 0 x02
a qual é a expressão para a segunda lei de New-
ton, sendo r 0i (t0 ) e p0i (t0 ) respectivamente a posição
O x2
e o momentum linear instantâneos da i-ésima par-
x01 tícula medidos no referencial K’. Nesta expressão
também está indicado o potencial de interação en-
x1 tre as partículas i e j, Vij r 0i − r 0j , o qual origina-
se da força central conservativa de interação en-
Figura 6.15: Transformação entre os referenciais tre as mesmas. Estas interações podem ser gra-
inerciais K e K 0 . vitacionais ou elétricas, por exemplo. Finalmente,
∇0i = x̂j ∂/∂x0ij é o operador gradiente, calculado no
referencial K 0 , sendo x0ij (t0 ) a j-ésima coordenada
da posição instantânea r 0i (t0 ).
Denominando-se u (t) = dr/dt a velocidade instantânea de uma partícula, mensurada por um
determinado referencial, a lei de transformação (6.70) implica na seguinte fórmula de transfor-
mação para as velocidades medidas em cada referencial,
u0 = u − v ⇐⇒ u = u0 + v. (6.71)
Como a métrica do espaço é a mesma em ambos os referenciais, então ∇0i = ∇i , onde ∇i é o
operador gradiente aplicado sobre r i . Portanto, a lei (6.70) implica em que
dp0i dpi
0
= e r 0i − r 0j = r i − r j ,
dt dt
e a equação de movimento para a i-ésima partícula, transformada do referencial K 0 para K
resulta  
dpi X
= −∇i  Vij (|r i − r j |) ,
dt
j6=i
possuindo a mesma forma matemática apresentada em relação a K 0 . Ou seja, a mecânica

Newtoniana é invariante frente a uma transformação de Galileu.
6.15.1.2 E QUAÇÕES DE M AXWELL E A TRANSFORMAÇÃO DE G ALILEU

Em contraste com a invariância da mecânica, as leis do eletromagnetismo mudam conforme o
referencial, se for assumida uma transformação de Galileu. As equações de Maxwell e expressões
relacionadas para distribuições de carga e corrente elétricas no vácuo e no sistema Gaussiano
de unidades são:
∇ · E = 4πρ (Lei de Gauss: eletricidade) ∇ · B = 0 (Lei de Gauss: magnetismo)
1 ∂E 4π 1 ∂B
∇×B− = J (Lei de Ampère) ∇×E+ = 0 (Lei de Faraday)
c ∂t c c ∂t
(6.72a)

∂ρ
+ ∇ · J = 0 (Equação da continuidade), (6.72b)
∂t
sendo E (r, t), B (r, t), ρ (r, t) e J (r, t) respectivamente os campos elétrico e de indução magnética
e as densidades de carga e corrente elétricas. Os campos também podem ser expressos em
termos dos potenciais escalar Φ (r, t) e vetor A (r, t) como
1 ∂A
B (r, t) = ∇ × A (r, t) e E (r, t)= −∇Φ − . (6.73)
c ∂t
Combinando-se as leis de Ampère e Faraday de forma a desacoplar os campos, obtém-se as
equações da onda eletromagnética
1 ∂2E 4π ∂J
2 2
+∇×∇×E =− 2
c ∂t c ∂t
1 ∂2B 4π
+∇×∇×B = ∇ × J,
c2 ∂t2 c
sendo que a densidade de corrente cumpre aqui o papel de fonte. Pode-se também obter equa-
ções para os potenciais eletromagnéticos, as quais são
1 ∂
∇2 Φ + (∇ · A) = −4πρ
c ∂t
1 ∂2A

1 ∂Φ 4π
+ ∇ × ∇ × A + ∇ = J.
c2 ∂t2 c ∂t c
Nota-se que nas formas gerais acima, as equações para os potenciais são acopladas. Con-
tudo, sobre os potenciais podem ser aplicadas transformações de gatilho (gauge)
A (r, t) −→ A0 (r, t) = A (r, t) + ∇Λ (r, t)

1 ∂Λ
Φ (r, t) −→ Φ0 (r, t) = Φ (r, t) − ,
c ∂t
sem que as equações de campo sejam alteradas. Nestas transformações, Λ (r, t) é um campo
escalar arbitrário, denominado função de calibre. Há infinitas transformações de calibre possí-
veis, mas uma transformação de particular importância para a relatividade restrita é o calibre
de Lorenz, proposto pelo físico-matemático dinamarquês Ludvig Valentin Lorenz (1829 – 1891).
Neste calibre, o campo Λ (r, t) é escolhido de tal forma que a condição de Lorenz,
1 ∂Φ
∇·A+ = 0, (6.74)
c ∂t
é satisfeita. Com esta condição, as equações para os potenciais tornam-se desacopladas e for-
malmente idênticas às equações para os campos, isto é,
1 ∂2Φ
− ∇2 Φ = 4πρ (6.75a)
c2 ∂t2
1 ∂2A 4π
− ∇2 A = J (6.75b)
c2 ∂t2 c
1 ∂2Λ
− ∇2 Λ = 0, (6.75c)
c2 ∂t2
sendo que a última equação determina a função de calibre Λ (r, t). Esta equação foi obtida
assumindo-se que a condição de Lorenz é também invariante frente a uma transformação de
calibre.
Portanto, observa-se que no calibre de Lorenz tanto os campos quanto os potenciais, bem
como a própria função de calibre, satisfazem equações diferenciais que possuem todas a estru-
tura formal de uma equação de onda. Este fato é relevante para a discussão a seguir, acerca da
modificação que uma transformação de Galileu K → K 0 impõe sobre a equação da onda.
Já na descoberta do fenômeno da indução magnética, realizada em meados do ano de 1831 de
forma independente pelo físico britânico Michael Faraday (1791 – 1867) e pelo físico americano
Joseph Henry (1797 – 1878) e que foi formalizada pela lei de Faraday, que a discussão acerca
da transformação dos campos eletromagnéticos frente a uma mudança de referencial é levada a
cabo.

Na lei de Faraday, a variação do fluxo de indução magnética B induz o surgimento do campo

elétrico E. Para a descoberta e determinação desta lei foi empregado um aparato experimental
que consistia em um circuito elétrico que delimita uma área que é atravessada pelo fluxo magné-
tico variável, fazendo surgir então uma força eletromotriz (fem) induzida . Esta fem surge porque
a variação temporal do fluxo magnético faz surgir um campo elétrico ao longo do circuito. Com
base neste tipo de equipamento que a lei de Faraday foi proposta. Contudo, esta lei somente
é válida quando está envolvido o campo elétrico medido no referencial de repouso do circuito.
Se o circuito está em movimento relativo ao equipamento de medida, então a lei de Faraday
impõe uma transformação no campo elétrico devido ao movimento relativo entre o circuito e o
laboratório.
Realizando-se uma análise cuidadosa da lei de Faraday, pode-se mostrar que se no referencial
de laboratório (referencial K na figura 6.15) o campo elétrico é igual a E e no referencial K 0 o
campo é E 0 , então estes campos relacionam-se por
1 1
E = E0 − v × B0 e E0 = E +

(v × B) . (6.76)
c c
Estas expressões são as leis de transformação de Galileu para o campo elétrico. Nota-se que
não é feita menção sobre a possibilidade de transformação também do campo B. De fato, neste
contexto, B 0 = B.
Para se investigar a questão da invariância (ou não) das equações de Maxwell frente a uma
transformação de Galileu, é necessário primeiro verificar-se como os operadores diferenciais ∇
e ∂/∂t se transformam neste contexto. Para auxiliar nesta derivação, será suposta a existência
de um campo escalar ψ = ψ (r, t), o qual é um invariante de Galileu, ou seja, o valor do campo na
posição P , ilustrada na figura 6.15, e no instante t, é o mesmo, quer este seja mensurado a partir
do referencial K, quer seja mensurado a partir do referencial K 0 . Se ψ for uma componente de
um vetor, é necessário considerar-se separadamente a lei de transformação da mesma, além da
transformação dos operadores diferenciais.
Para o operador gradiente, o valor de ∇ψ no ponto P , mensurado em relação ao referencial
K, será tomado da seguinte maneira. Assumindo-se que o observador em K consiga mensurar
simultaneamente os valores do campo no ponto P , na posição r, e na posição r 2 = r + ∆r,
suficientemente próxima ao ponto P , então a quantidade
ψ (x1 + ∆x1 , x2 , x3 , t) − ψ (x1 , x2 , x3 , t) ∆1 ψ
≡
∆x1 ∆x1
será igual, no limite ∆x1 → 0, a ∂ψ/∂x1 . O mesmo ocorrendo para as outras coordenadas. Já
no referencial K 0 , também é possível fazer-se a mesma suposição. Então, pode-se defininir a
quantidade
ψ (x01 + ∆x01 , x02 , x03 , t) − ψ (x01 , x02 , x03 , t) ∆0 ψ
0 ≡ 10 .
∆x1 ∆x1
Mas, de acordo com a transformação (6.70), ∆x01 = x012 − x01 = x12 − x1 , já que t0 = t. Além disso
como d`0 = d`, resulta então que
∇0 ψ = ∇ψ =⇒ ∇0 = ∇.
Por outro lado a derivada temporal é mais complicada. Assumindo-se que o ponto P está em
repouso em relação a K, então realiza-se duas medições do valor do campo neste ponto, nos
instantes t1 e t2 , definindo-se a quantidade
ψ (r, t2 ) − ψ (r, t1 ) ∆t ψ
≡ .
t2 − t1 ∆t
Já em relação a K 0 , o ponto P está em movimento. Portanto, realizando-se duas medidas de ψ
neste ponto nos instantes t01 e t02 , sendo que em relação a K 0 o ponto P está, respectivamente,
nas posições r 01 e r 02 , pode-se definir a quantidade
ψ (r 02 , t02 ) − ψ (r 01 , t01 ) ∆0t ψ
≡ .
t02 − t01 ∆t0
Se ∆t0 = t02 − t01 for pequeno o suficiente, pode-se realizar um desenvolvimento de ψ em série de
Taylor, mantendo somente os termos de ordem mais baixa,
∂ψ ∂ψ
ψ (r 02 , t02 ) ≈ ψ (r 01 , t01 ) + (t02 − t01 ) + (r 02 − r 01 ) · 0 .
∂t01 ∂r 1

Então,
∆0t ψ ∂ψ r 0 − r 01 ∂ψ
≈ 0 + 20 · .
∆t 0 ∂t1 t2 − t01 ∂r 01
Como ψ, ∆t e ∆t0 são invariantes de Galileu, então, chamando t01 = t0 e r 10 = r 0 , no limite
∆t = ∆t0 → 0 obtém-se
∂ψ ∂ψ
= 0 − v · ∇0 ψ.

∂t ∂t
Portanto, as leis de transformação de Galileu dos operadores diferenciais são
 
∇ = ∇0 ∇ 0 = ∇
∂ ∂ ⇐⇒ ∂ ∂ (6.77)
 = − v · ∇0  = + (v · ∇).
∂t ∂t0 ∂t0 ∂t
Cabe mencionar aqui que o mesmo resultado poderia ser obtido caso fosse feita uma antecipação
na definição de quadrivetores e se considerasse a quádrupla ({xµ }) = (ct, r), (µ = 0, . . . , 3). Neste
caso, com a lei de transformação (6.70) e empregando a regra da cadeia, seria possível escrever
∂ ∂x00 ∂ ∂x0j ∂ ∂ ∂


 = 00
+ = δij 0j =
∂ ∂x0ν ∂  ∂x
 i i
∂x ∂x ∂xi ∂x0j ∂x ∂x0i
= =⇒
∂x µ ∂xµ ∂x0ν
∂ ∂x00 ∂ ∂x0i ∂ 1∂ 1∂ vi ∂



= 00
+ ⇒ = − ,
∂x 0 0
∂x ∂x ∂x0 ∂x0i c ∂t c ∂t0 c ∂x0i
onde os índices latinos variam de 1 a 3.
Para verificar como as densidades de carga e corrente transformam-se, considera-se um
conjunto de cargas puntiformes. Neste caso,
X
ρ (r, t) = qi δ (r − r i (t))
i
X
J (r, t) = qi ui (t) δ (r − r i (t)) .
i
Então, de acordo com (6.70) e (6.71),

X X
ρ0 (r 0 , t0 ) = qi δ (r 0 − r 0i (t0 )) = qi δ (r − r i (t)) = ρ (r, t)
i i
X X
J 0 (r 0 , t0 ) = qi u0i (t0 ) δ (r 0 − r 0i (t0 )) = qi (ui (t) − v) δ (r − r i (t)) = J (r, t) − vρ (r, t) .
i i
Ou seja, ( (
ρ0 (r 0 , t0 ) = ρ (r, t) ρ (r, t) = ρ0 (r 0 , t0 )
0 ⇐⇒ (6.78)
0 0
J (r , t ) = J (r, t) − vρ (r, t) J (r, t) = J 0 (r 0 , t0 ) + vρ0 (r 0 , t0 ) .
Pode-se então verificar a transformação das equações de Maxwell e da equação de conti-
nuidade. Supondo que estas equações assumem as suas formas conhecidas no referencial K,
emprega-se as transformações (6.76), (6.77) e (6.78) inicialmente na equação da continuidade
para verificar a sua forma no referencial K 0 :
0
∂ρ K→K 0 ∂ρ
+ ∇ · J = 0 −−−−→ 0 + ∇0 · J 0 + ∇0 · (vρ0 ) − v · ∇0 ρ0 = 0.

∂t ∂t
Como ∇0 · (vρ0 ) = v · ∇0 ρ0 , observa-se que a equação da continuidade é invariante frente a

uma equação de Galileo. Fisicamente, isto significa que a transformação de Galileo respeita o
princípio da conservação da carga elétrica.
Contudo, as equações de Maxwell tomam as seguintes formas frente a uma transformação
de Galileo:
K→K 0
∇0 · E 0 − ∇0 · β × B 0 = 4πρ0

∇ · E = 4πρ −−−−→
K→K 0
∇·B=0 −−−−→ ∇ · B0 = 0

1 ∂E 4π K→K 0 1∂
∇0 × B 0 − E0 − β × B0

∇×B− = J −−−−→ 0
c ∂t c c ∂t
1 4π
+ v · ∇0 E 0 − β × B 0 = J 0 + vρ0

c c
1 ∂B K→K 0 0 0 1 ∂B 0
∇×E+ =0 −−−−→ ∇ ×E +
c ∂t c ∂t0
1
−∇0 × β × B 0 − v · ∇0 B 0 = 0,

c
onde β = v/c. Na lei de Faraday, os últimos dois termos são nulos, uma vez que ∇0 × β × B 0 =

− β · B 0 . Portanto, somente a lei de Gauss do magnetismo e a lei de Faraday são invariantes

em forma. As leis de Gauss da eletricidade e de Ampère são modificadas pela transformação de
Galileu. Isto implica também que as equações da onda eletromagnética também se transformam.
A conclusão é que do ponto de vista da transformação de Galileu, as equações de Maxwell
somente são válidas em um referencial absoluto. Pode-se dizer que a transformação de Galileu
implica na existência do éter.
6.15.1.3 A TRANSFORMAÇÃO DE L ORENTZ E OS PRINCÍPIOS DA RELATIVIDADE

RESTRITA
Em uma tentativa de contornar o conflito que surgiu entre as leis do eletromagnetismo e

as leis de transformação entre referenciais, Hendrik Lorentz propôs, em 1985, uma nova lei de
transformação que tratava o tempo não mais como um parâmetro livre nas equações de campo,
mas como uma nova coordenada que também é alterada na transformação de referenciais. Ou-
tras pessoas contribuíram na elaboração desta nova transformação, dentre as quais pode-se
mencionar o físico-matemático alemão Woldemar Voigt (1850 – 1919), o físico-matemático bri-
tânico Joseph Larmor (1857 – 1942), Henri Poincaré, que consolidou o desenvolvimento mate-
mático desta transformação e a denominou transformação de Lorentz e, finalmente, Albert
Einstein, que em 1905 incorporou a mesma na sua teoria da relatividade restrita. Na literatura
atual, pode-se encontrar diversas derivações distintas da transformação de Lorentz. Aqui, a
mesma será apresentada sem a sua dedução.
Fazendo novamente referência à figura 6.15, considera-se dois referenciais inerciais K e K 0 ,
sendo que este último desloca-se com velocidade v constante em relação ao primeiro. Agora,
porém, deve existir uma quarta coordenada, a coordenada temporal x0 = ct, cujo eixo Cartesiano
está orientado perpendicularmente ao hiper-plano 3D no qual os eixos espaciais {xi } estão
localizados. Se as origens O e O0 de ambos os referenciais coincidem em t = t0 = 0, então a
transformação entre as coordenadas de K e K 0 é dada por:
 0  0 0
 ct = γ (ct − β · r)  ct = γ (ct + β · r )
γ−1 ⇐⇒ γ−1 (6.79a)
 r0 = r + (β · r) β − γβct  r = r0 + (β · r 0 ) β + γβct0 ,
β2 β2
onde foram definidos os parâmetros beta (β) e gama (γ) de Lorentz, respectivamente dados por
v 1
β= e γ=p . (6.79b)
c 1 − β2
Posteriormente, será demonstrado que as equações de Maxwell são invariantes em forma frente
a transformação (6.79a).
Definindo-se as componentes paralela r k e perpendicular (r ⊥ ) do vetor posição em relação
a β,
β·r (β × r) × β
rk = β e r⊥ = r − rk = ,
β2 β2
a transformação de Lorentz pode também ser expressa de uma forma mais simples e intuitiva
como
ct = γ (ct0 + β · r 0 )
 0 
 ct = γ (ct − β · r) 

 
rk0 = γ rk − βct ⇐⇒ rk = γ rk0 + βct0

(6.79c)

 0 

r⊥ = r⊥ 
r ⊥ = r 0⊥ .

Com relação à teoria da relatividade restrita, esta será abordada de uma maneira sucinta.
Como foi visto na seção anterior, as equações de Maxwell não são invariantes frente a uma
transformação de Galileu. De acordo com estas, uma onda eletromagnética necessariamente
requer um meio para se propagar, tal como ocorre com ondas mecânicas. Este meio seria o
éter, o qual não havia sido detectado em experimentos específicos, tais como o experimento de
Michelson-Morley. Embora acredita-se que Albert Einstein não estava ciente dos resultados des-
tes experimentos em 1905, mesmo assim a hipótese do éter não era aceitável a partir de suas
concepções individuais a respeito do espaço-tempo e do comportamento dos campos eletromag-
néticos. Confrontado com o fato de que as equações de Maxwell não são invariantes frente a
uma transformação de Galileu, Albert Einstein considerou as seguintes possibilidades:
1. As equações de Maxwell estavam incorretas. Uma teoria correta do eletromagnetismo de-

veria ser invariante frente a uma transformação de Galileu.
2. Existia um referencial privilegiado para o eletromagnetismo, no qual o éter está em repouso.
3. Existe um princípio da relatividade, distinto da relatividade galileana, e válido tanto para

a mecânica quanto para o eletromagnetismo. Isto implicaria em alterações nas leis da
mecânica.
A escolha realizada por Einstein a favor da possibilidade 3 levou-o a propor 2 postulados

fundamentais:
Postulado 1 (Postulado da relatividade). As leis da natureza e os resultados decorrentes de

quaisquer experimentos realizados em um dado sistema de referências são independentes
do movimento de translação do sistema como um todo.
Postulado 2 (Postulado da constância da velocidade da luz). A velocidade da luz é constante

e independente do movimento da fonte emissora.
Postulado 20 (alternativo). Em todo sistema inercial de referências, existe uma velocidade li-
mite finita universal, denotada por c, para todas as entidades físicas.
Com base nestes postulados e assumindo outros princípios físicos tais como a isotropia do
espaço livre, Einstein realizou sua própria derivação da transformação de Lorentz e demonstrou
que as equações de Maxwell são invariantes em forma para estas transformações.
Fazendo-se referência novamente aos referenciais K e K 0 na figura 6.15, se no instante t =
t = 0, quando as origens O e O0 coincidem, for emitido um pulso luminoso a partir da origem
0
comum, então, de acordo com o postulado 2, as frentes de onda observadas por observadores
situados nas origens de cada referencial irão se propagar na forma de ondas esféricas que se
deslocam com a mesma velocidade, igual a c. Do ponto de vista do observador no referecial K, a
frente de onda no instante t localiza-se no ponto (x1 , x2 , x3 ) determinado pela equação
3
X
x2i − c2 t2 = 0,
i=1
ao passo que a mesma frente de onda, vista pelo observador em K 0 , atinge o ponto (x01 , x02 , x03 ) no
instante t0 , determinado por
X 3
x02 02 02
i − c t = 0.
i=1
Definindo-se uma nova coordenada em cada referencial como
x0 = ict e x00 = ict0 ,
os postulados da relatividade e o princípio de isotropia do espaço demandam então que

3
X 3
X
x2µ = x02
µ.
µ=0 µ=0
Com base nesta expressão, a qual é análoga a uma rotação de eixos em um espaço de dimensão
4 que preserva a métrica do espaço, Einstein derivou novamente a transformação (6.79).

6.15.1.4 O ESPAÇO - TEMPO DE M INKOWSKI E OS QUADRIVETORES
Com base nos trabalhos de Lorentz, Poincaré e Einstein, em 1907 o matemático alemão Her-
mann Minkowski (1864 – 1909) mostrou que a teoria da relatividade restrita poderia ser melhor
formalizada assumindo-se que os fenômenos físicos ocorrem não em um espaço de dimensão
3, mas em um espaço de dimensão 4, doravante denominado o espaço-tempo de Minkowski,
aqui representado por M 4 . Neste espaço, uma transformação de Lorentz corresponde a uma
rotação arbitrária dos eixos em torno da origem.
Einstein, que foi estudante de Minkowski no Instituto Eletrotécnico de Zurique, inicialmente
considerou o trabalho de Minkowski como um simples artifício matemático, porém posterior-
mente percebeu que a interpretação geométrica do M 4 seria necessária para a compreensão e
desenvolvimento de sua posterior teoria da relatividade geral.
Formalmente, o espaço-tempo de Minkowski é um espaço vetorial real de dimensão 4. Este
possui, portanto, 4 vetores de base, os quais não necessitam em geral ser considerados. Um
vetor do M 4 , portanto, possui 4 componentes que podem estar na forma contravariante ou
covariante. Estes vetores do M 4 são usualmente denominados quadrivetores. Cada quadri-
vetor possui 3 componentes que correspondem às coordenadas espaciais usuais do E 3 mais
uma coordenada temporal igual a ct. Uma coordenada qualquer de um quadrivetor, quer seja
temporal ou espacial, será identificada por um índice grego (µ, ν, . . . ). Quando for necessá-
rio especificar-se explicitamente uma coordenada espacial, serão empregado um índice latino
(i, j, . . . ). Finalmente, quando for necessário especificar-se explicitamente a coordenada tempo-
ral, será empregado o índice “0”. O quadrivetor posição no M 4 tem os seus componentes escritos
na forma contravariante definidos como uma quádrupla de números que pode ser representada
de diferentes maneiras como:
x0 , x1 , x2 , x3 = ({xµ }) = x0 , xi = (ct, r) ,

onde µ = 0, . . . , 3 e i = 1, . . . , 3.
No espaço M 4 está suposta a validade de uma transformação xµ → x0µ que leva as coordena-
das {xµ } a novas coordenadas
x0µ = x0µ ({xν }) , (µ = 0, . . . , 3) ,
de acordo com a transformação de Lorentz (6.79). Esta transformação pode ser escrita de uma
forma compacta como
x0µ = Λµν xν , (6.80a)
sendo que Λµν é denominada a matriz de transformação de Lorentz. Obviamente, é válida

também a transformação inversa
µ
xµ = Λ−1 ν x0ν , (6.80b)
onde
 
1000
α 0 1 0 0
Λµα Λ−1 ν
= δνµ , sendo [δνµ ] =  
0 0 1 0
0001
a delta de Kronecker escrita na forma de um tensor de posto 2 misto. Comparando-se (6.80a,b)

com (6.79), conclui-se que
0
Λ00 = γ Λ−1 0
=γ
0 i
Λ0i = Λi0 = −γβi Λ−1 i = Λ−1 = γβi 0 (6.80c)
βi βj i βi βj
Λij = δij + (γ − 1) 2 Λ−1 j = δij + (γ − 1) 2 .
β β

Ou, na forma matricial,

 
γ −γβ1 −γβ2 −γβ3
β2 β β β β 
−γβ1 1 + (γ − 1) β12 (γ − 1) β1 2 2 (γ − 1) β1 2 3 

Λ≡ 2
−γβ2 (γ − 1) β1 β2 2 1 + (γ − 1) β22 (γ − 1) β2 β2 3 

 β β β 
β2
−γβ3 (γ − 1) ββ1 β2 3 (γ − 1) ββ2 β2 3 1 + (γ − 1) β32
  (6.80d)
γ γβ1 γβ2 γβ3
β2 β β β β 
γβ1 1 + (γ − 1) β12 (γ − 1) β1 2 2 (γ − 1) β1 2 3 

−1
Λ ≡γβ2 (γ − 1) β1 β2 2 1 + (γ − 1) β22 (γ − 1) β2 β2 3  .
2 
 β β β 
β2
γβ3 (γ − 1) ββ1 β2 3 (γ − 1) ββ2 β2 3 1 + (γ − 1) β32
De acordo com os postulados da relatividade, dados dois referenciais inerciais K e K 0 , dois

eventos quaisquer sempre ocorrem com separações espaço-temporais dadas respectivamente
por {dxµ } e {dx0µ }, de tal forma que a métrica do espaço M 4 permanece sempre invariante, ou
seja,
2 2 2 2 2 2 2 2
ds2 ≡ dx0 − dx1 − dx2 − dx3 = ds02 ≡ dx00 − dx01 − dx02 − dx03 . (6.81a)
Desta maneira, é possível definir-se o tensor de métrica do M 4 de tal forma que

ds2 = gµν dxµ dxν , (6.81b)
onde  
1 0 0 0
0 −1 0 0 
0 0 −1 0  , sendo que g = det (g) = −1.
g= (6.81c)

0 0 0 −1
O tensor de métrica (6.81b,c) mostra que o espaço M 4 é plano; porém é um tipo de espaço
pseudo-Euclideano, os quais são assim denominados justamente por apresentarem sua métrica
dada por expressões como (6.81a). Em tais espaços, é comum caracterizar-se o tensor de mé-
trica também por sua assinatura, a qual é o conjunto de números indicando a quantidade de
autovalores positivos, negativos e nulos do tensor de métrica. No caso do M 4 , a assinatura do
tensor de métrica é indicada por {+, −, −, −}.
Propriedades matemáticas do tensor de métrica do M 4 :
1. gµν = gνµ (simétrico).
2. g µν = gµν (forma contravariante).
3. g µα gαν = g µν = δνµ (forma mista).
4. Tr (g) = −2.
Não será realizada aqui uma discussão ampla das consequências físicas das transformações
de Lorentz e dos postulados da relatividade. Discussões a respeito do conceito de simultanei-
dade, contração espacial, adição de velocidades e cone de luz são referidas a textos específicos
sobre relatividade. O único conceito relevante para a presente discussão é do tempo próprio.
Considera-se uma partícula com velocidade instantânea u (t) em relação ao referencial K.
Em um intervalo de tempo dt, sua posição muda por dr = udt. De (6.81a), o elemento de arco no
espaço-tempo percorrido pela partícula é
2
ds2 = c2 dt2 − |dr| = c2 dt2 1 − βu2 em K,

sendo β u = u/c o fator beta da velocidade instantânea da partícula em K.

Dado agora o referencial K 0 onde a partícula está instantaneamente em repouso, como dr 0 = 0
em K 0 , a partícula percorre o elemento de arco ds02 somente ao longo da coordenada temporal,
ou seja,
ds02 = c2 dt02 ≡ c2 dτ 2 em K 0 .

Como este elemento de arco é um invariante frente a transformação de Lorentz, isto é, ds02 = ds2 ,
isto implica que
p dt −1/2
dτ = 1 − βu2 (t)dt = , sendo γu (t) = 1 − βu2 (t) .
γu (t)
A outra implicação é que a quantidade dτ também é um invariante de Lorentz. Esta quantidade é
o elemento de tempo próprio da partícula, ou seja, o intervalo infinitesimal de tempo mensurado
no referencial instantaneamente em repouso com a mesma.
Se for possível resolver-se a equação de movimento da partícula no referencial K entre os
instantes t1 e t2 , então o intervalo de tempo próprio transcorrido no referencial em repouso com
a partícula será dado por
ˆ t2
dt
∆τ = .
t1 γ u (t)
Este resultado mostra também que ∆τ 6 ∆t = t2 − t1 , uma vez que γu > 1 sempre. Ou seja,
em qualquer referencial, o intervalo de tempo medido para um determinado processo físico será
sempre maior ou igual que o tempo transcorrido no referencial em repouso com a partícula. Este
fenômeno é denominado de dilatação temporal.
Dado o tensor de métrica na teoria da relatividade restrita, pode-se agora definir os seguintes
objetos que compõe o espaço-tempo de Minkowski:
Tensores de posto zero. Também denominados escalares ou invariantes de Lorentz.
Tensores de posto um. Também denominados quadrivetores. Como os componentes de um
quadrivetor podem estar na forma contravariante ou covariante, será empregada uma no-
tação própria que indica explicitamente qual é a forma dos mesmos.
Vetores contravariantes. Tomando como exemplo o quadrivetor posição, um quadrivetor

com componentes contravariantes
possui uma componente temporal a0 e três compo-
1 2 3
nentes espaciais a = a , a , a , sendo este denotado de forma genérica como
ã ≡ a0 , a = a0 , a1 , a2 , a3 .

As componenes aµ = aµ (r̃) transformam-se de acordo com (6.39) e (6.80a) como
∂x0µ ν
a0µ = a = Λµν aν , (6.82a)
∂xν
ou, de forma explícita,
a00 = Λ0ν aν = Λ00 a0 + Λ0i ai = γa0 − γβ · a (6.82b)

β·a
a0i = Λiν aν = Λi0 a0 + Λij aj = ai − γa0 βi + (γ − 1) 2 βi . (6.82c)
β
A transformação inversa, de acordo com (6.80b), é
∂xµ 0ν µ
aµ = 0ν
a = Λ−1 ν a0ν . (6.82d)
∂x
Vetores covariantes. Um quadrivetor com componentes covariantes possui uma compo-
nente temporal a0 e três componentes espaciais ({ai }). Usando a propriedade de rebai-
xamento de índice do tensor de métrica, percebe-se facilmente, com o uso de (6.81c)
que a relação aµ = gµν aν implica que
a0 = a0 e ai = −ai .
Este quadrivetor com componentes covariantes é denotado de forma genérica como
a = (a0 , a1 , a2 , a3 ) = (a0 , −a) .

e
Suas componentes aµ = aµ (r̃) transformam-se, de acordo com (6.39) e (6.80b) como
∂xν ν
a0µ = 0µ
aν = Λ−1 µ aν , (6.83a)
∂x
ν
a00 = Λ−1 a = γa0 − γβ · a
0 ν
ν β·a
a0i = Λ−1 i aν = ai + γa0 βi − (γ − 1) 2 βi .

β
A transformação inversa, de acordo com (6.80a), é
∂x0ν 0 ν
aµ = µ
aν = Λ−1 µ a0ν . (6.83b)
∂x
Da mesma forma como ocorre com o quadrivetor covariante, a forma contravariante
pode ser obtida a partir da primeira usando-se o tensor de métrica: aµ = g µν aν .
Tensores de posto dois. Podem ter seus componentes em três formas: contravariantes, cova-
riantes ou mistor.
Tensor contravariante. Trata-se de um tensor F µν com 16 componentes que se trans-

forma de acordo com as regras dadas por (6.39) e (6.80a):
∂x0µ ∂x0ν αβ
F 0µν = F = Λµα Λν β F αβ . (6.84a)
∂xα ∂xβ
Tensor covariante. Trata-se de um tensor Fµν com 16 componentes que se transforma de

acordo com (6.39) e (6.80b):
0 ∂xα ∂xβ α β
Fµν = Fαβ = Λ−1 µ Λ−1 ν Fαβ . (6.84b)
∂x0µ ∂x0ν
Tensor misto. Uma das possíveis forma é o tensor F µν com 16 componentes que se trans-
forma como:
∂x0µ ∂xβ α β
F 0µν = α 0ν
F β = Λµα Λ−1 ν F αβ . (6.84c)
∂x ∂x
As diferentes formas do tensor F podem ser obtidas usando a propriedade de elevação
ou rebaixamento de índices do tensor de métrica. Por exemplo,
F µν = g µα g νβ Fαβ , Fµν = gµα gνβ F αβ , F µν = g µα Fαν .
O produto interno no espaço-tempo de Minkowski possui uma definição ligeiramente distinta

do mesmo produto em um espaço Euclideano. Dados os quadrivetores pertencentes ao M 4 , o
produto interno entre quaisquer dois vetores corresponde ao mapeamento M 4 × M 4 7→ R que
satisfaz as seguintes propriedades:
1. Simetria. Dados os quadrivetores ã e b̃, o seu produto interno é
aµ bµ = aµ bµ = a0 b0 − a · b.
2. Bilinearidade. Dados ã, b̃ e ṽ ∈ M 4 e d ∈ R, então
(daµ + bµ ) vµ = daµ vµ + bµ vµ .
3. Dados ã e b̃ ∈ M 4 , se aµ bµ = 0 para qualquer b̃ ∈ M 4 , então, necessariamente, ã = 0.

Dado o quadrivetor ã ∈ M 4 , a sua norma é definida por
kãk = a = aµ aµ = a0 a0 − a2 ,

e
sendo a2 a norma Euclideana de seus componentes espaciais. Nota-se que, ao contrário do que
ocorre em um espaço Euclideano, a norma de um quadrivetor não é necessariamente positivo-
definida.
Como era esperado, o produto interno de dois quadrivetores é um invariante de Lorentz, isto
é, dados ã e b̃, de acordo com (6.82) e (6.83),
β
a0µ b0µ = a0µ b0µ = Λµα Λ−1 µ
aα bβ = δαβ aα bβ = aα bα .

µ
Cabe também discutir a maneira como o operador diferencial ∂/∂x se transforma. Dadas as
0µ 0µ µ µ 0
transformações x = x (r̃) e x = x r̃ , pode-se usar a regra da cadeia e escrever
∂ ∂xν ∂ ν ∂
0µ
= 0µ ν
= Λ−1 µ ν .
∂x ∂x ∂x ∂x
Comparando-se a expressão acima com (6.83a), percebe-se que a diferenciação frente a uma
coordenada contravariante transforma-se como um quadrivetor covariante. Pode-se então usar
a seguinte notação para o operador quadrivetorial gradiente na forma covariante:

∂ ∂ ∂ ∂ ∂ ∂ ∂
∂ ≡ ({∂µ }) = , = , , , = , ∇ , (6.85a)
e ∂x0 ∂xi ∂x0 ∂x1 ∂x2 ∂x3 ∂x0
onde ∇ é o operador gradiente usual do E 3 .

Agora, como xµ = g µν xν , pode-se escrever
∂ ∂xν ∂ ∂ ∂
= = g να δαµ ν = g µν ν = g µν ∂ν ,
∂xµ ∂xµ ∂xν ∂x ∂x
o que mostra que a diferenciação frente a uma coordenada covariante transforma-se como um
quadrivetor contravariante. Especificamente,
∂ ∂ ∂ ∂ ∂ ∂
= g 0ν ν = = ∂0 e = g iν ν = − i = −∂i .
∂x0 ∂x ∂x0 ∂xi ∂x ∂x
Portanto, definindo-se o operador quadrivetorial gradiente na forma contravariante, este resulta
igual a
˜ ≡ ({∂ µ }) = ∂ 0 , ∂ i = ∂ , ∂ ∂

∂ = , −∇ . (6.85b)
∂x0 ∂xi ∂x0
A quadridivergência de um quadrivetor ã é o invariante de Lorentz
∂a0
∂ µ aµ = ∂µ aµ = + ∇ · a.
∂x0
O operador laplaciano no M 4 é a contração invariante
∂2
2 ≡ ∂ µ ∂µ = ∂µ ∂ µ = 2 − ∇2 ,
∂ (x0 )
sendo que o operador “2” é denominado o d’Alembertiano.
6.15.1.5 F ORMULAÇÃO COVARIANTE DO ELETROMAGNETISMO CLÁSSICO
A invariância de forma ou covariância das equações de Maxwell, bem como das leis físicas
relacionadas, tais como a equação de continuidade e a força de Lorentz, foi demonstrada por
Lorentz e por Poincaré. A covariância implica que as grandezas ρ (r, t), J (r, t), E (r, t) e B (r, t)
transformam-se de uma maneira bem definida pelas transformações de Lorentz.
Inicia-se a derivação das formas covariantes das leis do eletromagnetismo pela equação da
continuidade (6.72b), a qual é assumida válida em um determinado referencial K. Inicial-
mente, é necessário postular-se uma forma para o quadrivetor densidade de corrente elétrica J̃ .
Escrevendo-se os operadores diferenciais em termos dos componentes do quadrivetor posição
contravariante r̃,
3
∂ (cρ) X ∂Ji
+ = 0.
∂x0 i=1
∂xi
Percebe-se então que se for definido o quadrivetor
J̃ ≡ J 0 , J i = (cρ, J ) ,

pode-se escrever a equação da continuidade, de acordo com (6.85a), como
∂µ J µ = 0 (em K) .

Mostra-se facilmente que a equação acima é invariante em forma frente a uma transformação
de Lorentz, ou seja, na mudança K → K 0 , pode-se mostrar que esta equação se torna igual a
∂µ0 J 0µ = 0 (em K 0 ) .
É interessante também mostrar explicitamente a transformação das componentes de J̃ para o

referencial K 0 . De (6.82b,c), obtém-se

1
ρ0 = γ ρ − β · J
c
β·J
J 0 = J − γcρβ + (γ − 1) 2 β,
β
a qual pode ser comparada diretamente com a transformação de Galileu (6.78) para estas quan-
tidades. É digno de menção que a densidade de carga é mensurada de forma distinta entre os
referenciais K e K 0 .
Agora, para se derivar a forma covariante das equações de Maxwell (6.72a), a abordagem tra-
dicionalmente adotada parte dos potenciais eletrodinâmicos. É também conveniente adotar-se
o calibre de Lorenz nesta derivação, dentro do qual os potenciais Φ (r, t) e A (r, t) são determi-
nados pela condição de Lorenz (6.74) e pelas equações (6.75a,b). Como antes, assume-se que
estas equações são respeitadas em um determinado referencial K.
Observa-se então ser possível escrever as equações para os potenciais como
3
∂2Φ X ∂2Φ 4π
2 − 2 = (cρ)
∂ (x0 ) i=1 ∂ (xi ) c
3
∂2A X ∂2A 4π
2 − 2 = J
∂ (x0 ) i=1 ∂ (xi ) c
3
∂Φ X ∂Ai
+ = 0.
∂x0 i=1 ∂xi
Dada a definição acima para J̃ , se for definido o quadrivetor potencial

Ã ≡ A0 , Ai = (Φ, A) ,

as 3 equações acima são escritas nas suas formas covariantes como

4π µ
2Aµ = J , (µ = 0, . . . , 3)
c
µ
∂µ A = 0.
Uma vez definidos o quadrivetor potencial e as equações que o mesmo obedece, considera-se
agora a relação dos mesmos com os campo. Esta relação é fornecida pelas expressões (6.73).
Escrevendo as mesmas para a i-ésima componente dos campos, ainda empregando a notação
do E 3 ,
3
∂Φ 1 ∂Ai X ∂Ak
Ei = − − e Bi = ijk .
∂xi c ∂t ∂xj
j,k=1
Reescrevendo agora estas expressões em termos de derivações das componentes contravariantes

do quadrivetor potencial Ã em relação aos componentes do quadrivetor posição covariante r =
e
(x0 , −r), obtém-se
∂A0 ∂Ai
= − ∂ 0 Ai − ∂ i A0

Ei = −
∂xi ∂x0
∂Ak
= −ijk ∂ j Ak =⇒ Bi = − ∂ j Ak − ∂ k Aj ,

Bi = −ijk
∂xj
sendo que na última expressão deve-se sempre realizar uma permutação cíclica de {i, j, k} =
{1, 2, 3}. Ainda na mesma expressão,
Bi = −ijk ∂ j Ak =⇒ ∂ i Aj − ∂ j Ai = −ijk Bk .

Percebe-se então que não é possível estas expressões em um único quadrivetor. A maneira
correta de agrupar os campos é na forma de um tensor de posto dois denominado tensor do
campo eletromagnético, o qual, na forma contravariante F µν é definido como
F µν = ∂ µ Aν − ∂ ν Aµ .
Identificando os componentes de F µν :
NS
F µµ = 0
F 0i = ∂ 0 Ai − ∂ i A0 = −Ei
F i0 = ∂ i A0 − ∂ 0 Ai = Ei
F ij = ∂ i Aj − ∂ j Ai = −ijk Bk .
Ou seja, o tensor de campo é antissimétrico. Pode-se escrever o mesmo forma matricial como
 
0 −E1 −E2 −E3
E1 0 −B3 B2 
[F µν ] ≡ 
E2 B3 0 −B1  .

E3 −B2 B1 0
O tensor de campo eletromagnético na forma covariante é obtido por
Fµν = gµα gνβ F αβ ,
resultando na forma matricial

 
0 E1 E2 E3
−E1 0 −B3 B2 
[Fµν ] ≡ 
−E2 B3 0 −B1  .

−E3 −B2 B1 0
Uma outra forma útil para o tensor de campo é a sua forma dual, a qual é obtida de acordo
com a definição de um tensor dual, apresentada na seção 6.6.2. Para tanto, inicialmente define-
se o símbolo de Levi-Civita de quarta ordem αβγδ como

+1; permutações pares de {0, 1, 2, 3}}

αβγδ = −1; permutações ímpares de {0, 1, 2, 3}}

0; outras combinações

1
= [(α − β) (α − γ) (α − δ) (β − γ) (β − δ) (γ − δ)] .
12
Da mesma forma como ocorre com o símbolo de terceira ordem, o qual está relacionado com
o cálculo do determinante de uma matriz 3 × 3, o símbolo αβγδ pode ser empregado no cálculo
do correspondente determinante de uma matriz 4 × 4,
αβγδ A = µνκθ Aαµ Aβ µ Aγ µ Aδµ ,
como ocorre nas expressões (6.33). Também como ocorre com o símbolo de terceira ordem, αβγδ
é um tensor relativo de peso w = +1. Contudo, como no caso das transformações de Lorentz,
Λ = det (Λ) = +1, o símbolo de Levi-Civita se transforma como um tensor de posto quatro na
transformação entre referenciais.
Portanto, o tensor dual do campo eletromagnético, definido como
1 µναβ
F µν = Fαβ
2
age como um tensor frente a uma transformação de Lorentz. Na representação matricial, este
tensor é dado por  
0 −B1 −B2 −B3
B1 0 E3 −E2 
[F µν ] = 
B2 −E3 0 E1  .

B3 E2 −E1 0

Finalmente, em termos dos tensores de campo F µν , Fµν e F µν e do quadrivetor J̃ , as equações

de Maxwell (6.72a) podem ser escritas de uma forma manifestamente covariante. Principiando
pelas equações inomogêneas (lei de Gauss da eletricidade e lei de Ampère), a forma covariante
das mesmas é
4π ν
∂µ F µν = J .
c
Por sua vez, as equações homogêneas (lei de Gauss do magnetismo e a lei de Faraday) têm a
sua forma covariante de duas maneiras equivalentes,
∂µ F µν = 0,
ou
∂µ Fνσ + ∂ν Fσµ + ∂σ Fµν = 0,
onde µ, ν e σ são quaisquer combinações dos índices {0, 1, 2, 3}.
Um ponto importante consiste em mostrar a lei de transformação dos campos. Dado o tensor
de campo F µν no referencial K, um observador no referencial K 0 irá observar estes campos de
acordo com (6.84a),
F 0µν = Λµα Λν β F αβ .
Realizando a transformação, os campos observados no referencial K 0 são
γ2
E 0 = γ (E + β × B) − (β · E) β
γ+1
γ2
B 0 = γ (B − β × E) − (β · B) β.
γ+1
Exercício 6.8. Obtenha os campos transformados para o referencial K 0 .

Resolução. Realiza-se a transformação inicialmente para o campo elétrico. A i-ésima compo-
nente em K 0 é E 0i = F 0i0 . Então,
F 0i0 = Λiα Λ0β F αβ

= Λiα Λ0β F αβ
= Λi0 Λ0β F 0β + Λij Λ0β F jβ
= Λi0 Λ0j F 0j + Λij Λ00 F j0 + Λij Λ0k F jk
γ2
= γEi + γ (β × B)i − (β · E) βi .
γ+1
Já os componentes de B 0 são dados a partir de

1
F ij = −ij` B` =⇒ ijm F ij = −ijm ij` B` = −2δm
`
B` = −2Bm =⇒ Bi = − ijk F jk .
2
Portanto, no referencial K 0 ,
1
Bi0 = − ijk F 0jk
2
1
= − ijk Λj α Λkβ F αβ
2
1 h i
= − ijk Λj 0 Λkm F 0m + Λj ` Λk0 F `0 + Λj ` Λkm F `m
2
β·B
= γBi − (γ − 1) βi − γ (β × E)i
β2
γ2
= γBi − γ (β × E)i − (β · B) βi .
γ+1
Uma expressão interessante também pode ser obtida para a equação de movimento de uma
partícula carregada sob a ação dos campos eletromagnéticos. Na mecânica Newtoniana, esta
equação é
dp v
=q E+ ×B ,
dt c
sendo p o momentum linear (Newtoniano) da partícula e q a sua carga. Para derivar a forma
covariante desta equação, inicialmente define-se o quadrivetor velocidade a partir de r̃ e do
tempo próprio τ como
dr̃
Ũ = = (γu c, γu v) ,
dτ
sendo Ũ a quadrivelocidade. A partir desta, pode-se definir o quadrivetor momentum linear
como p̃ = m0 Ũ = (E/c, γu p), sendo m0 a massa de repouso da partícula, ou seja, a massa que
seria mensurada em um referencial sempre em repouso com a mesma e
q
2
E = γu m0 c2 = (m0 c2 ) + p2 c2
a sua energia relativística. Esta quantidade também é um invariante de Lorentz. Portanto, a

forma covariante da equação de movimento da carga q é
dpµ dU µ q
= m0 = F µν Uν .
dτ dτ c
É interessante separar as componentes temporal e espacial desta equação. Estas são, res-
pectivamente,
dp0 1 dE q
= = γu (E · u)
dτ c dτ c
dpi

d 1
= (γu pi ) = qγu Ei + (u × B)i .
dτ dτ c
Das equações acima, a última corresponde à forma relativística da força de Lorentz, enquanto
que a primeira descreve a taxa de transferência de energia entre a carga e os campos.
Por fim, quando há um sistema de partículas carregadas (caracterizadas pelo quadrivetor
J̃ ) interagindo com os campos, observa-se a conservação da energia, do momentum linear e
do momentum angular totais deste sistema. A primeira lei de conservação em particular é
denominada teorema de Poynting. A lei de conservação geral possui dois termos, um termo
correspondente às ondas e outro contendo a interação destas com as partículas. O primeiro
termo é descrito em função do tensor energia-momentum Θµν , dado por

1 1
Θµν = g µσ Fσα F αν + g µν Fαβ F αβ .
4π 4
Pode-se perceber que Θµν é simétrico.

A lei de conservação para o sistema cargas + campos é
1
∂µ Θµν = − F νσ Jσ .
c
6.15.2 A MÉTRICA DE S CHWARZSCHILD

Uma solução exata para as equações de Einstein (6.69) foi encontrada por Karl Schwarzs-
child (1873 - 1916) ainda em 1915, menos de dois meses após a primeira publicação da teoria
da relatividade geral. Schwarzschild obteve sua solução enquanto estava servindo no exército
alemão durante a I Guerra Mundial, publicou a mesma no início de 191621 e pouco tempo depois
acabou falecendo em virtude de uma doença contrída no campo de batalha.
A solução de Schwarzschild descreve o campo gravitacional (ou seja, a métrica do espaço-
tempo) gerado no espaço que rodeia um corpo de massa M esférico homogêneo, sem carga
elétrica, com momentum angular nulo e fixa na origem do sistema de referência.
21 Über das Gravitationsfeld eines Massenpunktes nach der Einsteinschen Theorie (A respeito do campo gravitacional de
uma partícula massiva na teoria de Einstein). Sitzungsberichte der Königlich Preussischen Akademie der Wissenschaften,
v. 7, p. 189–196, 1916. Acesso: https://www.biodiversitylibrary.org/item/93032#page/215/mode/1up (Versão
em inglês: https://arxiv.org/abs/physics/9905030v1).

6.15.2.1 D ERIVAÇÃO DO TENSOR DE MÉTRICA
Considera-se então o espaço-tempo de Minkowski introduzido na seção 6.15.1.4, no qual o

quadrivetor posição é determinado pela 4-upla x0 , x1 , x2 , x3 . Assumindo que as equações de
Einstein (6.69a) podem ser escritas como
Gαβ = 0,
contraindo-se o tensor de Einstein (6.69b) resulta

1 1
Gαα = Rαα − δαα R = R − 4R = 0,
2 2
o que implica que R = 0. Portanto, as equações de Einstein se reduzem a
Rαβ = 0.
Lembrando que o tensor de Ricci é dado por (6.68a), no espaço M 4 as equações de Einstein
ficam
∂Γγ αβ ∂Γγ αγ
Rαβ = − + Γδαβ Γγ δγ − Γδαγ Γγ δβ = 0, (α, β, γ, δ = 0, 1, 2, 3) . (6.86)
∂xγ ∂xβ
Busca-se uma solução do sistema acima para um espaço esfericamente simétrico. Por isso,
as coordenadas espaciais do quadrivetor serão escritas em termos das coordenadas polares
esféricas x1 = r, x2 = θ e x3 = ϕ. Além disso, a distâncias infinitas da massa que gera o campo,
a métrica do espaço-tempo deve se reduzir à métrica do espaço-tempo de Minkowski M 4 , dada
por
2
d`2 = (cdt) − dr2 − r2 dθ2 − r2 sin2 θdϕ2 .
Por estas razões, Schwarzschild propôs a seguinte métrica para o espaço-tempo em torno da
massa m:
d`2 = e2ν(r) c2 dt2 − e2λ(r) dr2 − r2 dθ2 + sin2 θdϕ2 ,

(6.87)
onde ν (r) e λ (r) são funções que devem ser derivadas pelas equações de campo e que estão
sujeitas à condição de contorno
lim ν (r) = lim λ (r) = 0.
r→∞ r→∞
Comparando a métrica proposta acima com a métrica geral no Rn definida em (6.26), conclui-
se que  2ν 
e 0 0 0
 0 −e2λ 0 0 
g ≡ [gαβ ] = 
 0 0 −r2
.
0 
2 2
0 0 0 −r sen θ
Ou seja, o tensor de métrica é diagonal. O determinante de gαβ é
g = g00 g11 g22 g33 = −e2(ν+λ) r4 sen2 θ
e sua forma contravariante é

 −2ν 
e 0 0 0
αβ  0 −e−2λ 0 0 
g = 1
.
 0 0 − r2 0 
1
0 0 0 − r2 sen 2θ
De acordo com a expressão (6.44), os símbolos de Christoffel são escritos

γ 1 γδ ∂gβδ ∂gδα ∂gαβ
Γ αβ = g + − .
2 ∂xα ∂xβ ∂xδ
Para a derivação destes símbolos, escreve-se inicialmente
NS NS
gαβ = fα2 δαβ , g αβ = fα−2 δ αβ ,
onde
f0 = e ν , f1 = eλ , f2 = r, f3 = r sen θ,

o que resulta em
!
γ 1 −2 γδ ∂fβ2 ∂fα2 ∂fα2
Γ αβ = fγ δ δβδ + δαδ − δαβ
2 ∂xα ∂xβ ∂xδ

NS −2 ∂fβ ∂fα ∂fα
= fγ fβ δβγ α + fα δαγ β − fα δαβ γ .
∂x ∂x ∂x
Após uma certa álgebra, as matrizes de Christoffel ficam então:
0 ν0 0 0
   2(ν−λ) 0 
e ν 0 0 0
ν 0 0 0 0 0 λ0 0 0
Γ0 =  Γ1 = 
 
 
−2λ
 0 0 0 0  0 0 −e r 0 
−2λ 2
0 0 00 0 0 0 −e r sen θ
    (6.88)
0 0 0 0 0 0 0 0
−1 −1 
0 0 r 0 0 0 0 r
Γ2 =   Γ3 = 
  
.
0 r−1 0 0  0 0 0 cotan θ
0 0 0 − cos θ sen θ 0 r−1 cotan θ 0
Destes resultados pode-se concluir que
Γ0ij = 0, Γi0j = Γij0 = 0.
Pode-se calcular também as contrações Γαβα , as quais podem ser colocadas na forma de uma
matriz coluna:
 α
Γ 0α = Γ000 + Γ101 + Γ202 + Γ303 = 0  
0



Γ α 0 1 2 3 0 0 −1
1α = Γ 10 + Γ 11 + Γ 12 + Γ 13 = ν + λ + 2r ν 0 + λ0 + 2r−1 

=⇒ Γβ =  .

 Γα
2α = Γ0
20 + Γ 1
21 + Γ 2
22 + Γ 3
23 = cotan θ  cotan θ 
0


 α
Γ 3α = Γ030 + Γ131 + Γ232 + Γ333 = 0.
Por sua vez, este resultado permite construir a matriz quadrada
∂ct Γβ 0β ∂ct Γβ 1β ∂ct Γβ 2β ∂ct Γβ 3β

  
0 0 0 0

h i  ∂ Γβ ∂ Γβ ∂ Γβ ∂ Γβ  0 ∂ Γβ 0 0
 r 0β r 1β r 2β r 3β   r 1β
∂α Γγ βγ = [∂α Γβ ] =  β β β β = .
 ∂θ Γ 0β ∂θ Γ 1β ∂θ Γ 2β ∂θ Γ 3β  0 0 ∂θ Γβ 2β 0
∂ϕ Γβ 0β ∂ϕ Γβ 1β ∂ϕ Γβ 2β ∂ϕ Γβ 3β 0 0 0 0
A outra matriz quadrada de derivadas que será necessária é:
∂γ Γγ 00 ∂γ Γγ 01 ∂γ Γγ 02 ∂γ Γγ 03
 
h i ∂ Γγ ∂ Γγ ∂ Γγ ∂ Γγ 
∂γ Γγ αβ =  γ 10 γ 11 γ 12 γ 13 
∂γ Γγ 20 ∂γ Γγ 21 ∂γ Γγ 22 ∂γ Γγ 23 
∂γ Γγ 30 ∂γ Γγ 31 ∂γ Γγ 32 ∂γ Γγ 33
 2(ν−λ) 0 
∂r e ν 0 0 0
 0 λ00 0 0 
= .
0 −∂r e−2λ r

 0 0 
∂r −e−2λ r sen2 θ + ∂θ (− cos θ sen θ)

0 0 0
Esta matriz é diagonal.

Inserindo todos estes resultados nas equações de campo (6.86), obtém-se, após uma certa
quantidade de álgebra,
Rαβ = 0 (α 6= β)
R00 = ν 00 − λ0 ν 0 + ν 02 + 2r−1 ν 0 = 0
R11 = −ν 00 + λ0 ν 0 − ν 02 + 2r−1 λ0 = 0
R22 = 1 − [1 + r (ν 0 − λ0 )] e−2λ = 0
R33 = 1 − (1 + ν 0 r − λ0 r) e−2λ sen2 θ = 0.


Portanto, observa-se que Rαβ = 0 (α 6= β) e a partir dos elementos da diagonal resulta o

seguinte sistema de equações para as função ν (r) e λ (r):
ν 00 − ν 0 λ0 + ν 02 + 2r−1 ν 0 = 0 (6.89a)
00 0 0 02 0 −1
ν − λ ν + ν − 2λ r =0 (6.89b)
0 0 −2λ
[r (λ − ν ) − 1] e +1=0 (6.89c)
0 0 −2λ 2

[r (λ − ν ) − 1] e + 1 sen θ = 0. (6.89d)
A equação (6.89d) é uma mera repetição de (6.89c). De (6.89a) e (6.89b) conclui-se que
λ0 = −ν 0 =⇒ λ (r) = −ν (r) + cte.
Porém, pelo limite r → ∞ que ambas têm que satisfazer, resulta que, simplesmente, λ (r) = −ν (r).
Com isso, (6.89c) resulta
− (2rν 0 + 1) e2ν + 1 = 0.
Chamando µ (r) = e2ν ,
µ0
2ν 0 = =⇒ rµ0 + µ = 1.
µ
A solução desta EDO é
rG
µ (r) = e2ν(r) = 1 −
,
r
onde rG é uma constante de integração denominada o raio gravitacional ou o raio de Schwarzs-
child do corpo, a qual será em breve identificada com a massa do mesmo.
Assim, inserindo esta solução em (6.87), obteve-se a métrica de Schwarzschild
rG 2 2 rG −1 2
d`2 = 1 − dr − r2 dθ2 + sin2 θdϕ2 .

c dt − 1 −
 r r

µ 0 0 0
 0 −µ−1 0 (6.90)
0 
[gαβ ] = 
 0 0 −r2
.
0 
0 0 0 −r2 sen2 θ
6.15.2.2 C ONSEQUÊNCIAS E APLICAÇÕES DA MÉTRICA DE S CHWARZSCHILD

Serão discutidos agora de forma breve algumas das principais consequências advindas da
métrica de Schwarzschild.
T RAJETÓRIA DE PARTÍCULAS NO CAMPO GRAVITACIONAL E O LIMITE N EWTONI -

ANO
Na teoria da relatividade geral, as equações de movimento de uma partícula de massa m sob

a ação do campo gravitacional determinado pela métrica gαβ do espaço-tempo são exatamente as
equações (6.60), as quais resultam nas curvas geodésicas entre dois pontos quaisquer do espaço-
tempo determinado pela métrica. Ou seja, na relatividade geral as equações de movimento são
d2 xα α dxβ dxγ
+ Γ βγ =0 (α, β, γ = 0, 1, 2, 3) ,
d`2 d` d`
sendo ` a extensão do arco da trajetória da partícula no espaço-tempo.
Será feito uso agora do conceito de tempo próprio, discutido na seção 6.15.1.4 e que consiste
no intervalo de tempo registrado no referencial sempre em repouso com o observador. Dada a
métrica
d`2 = gαβ dxα dxβ ,
no referencial em repouso ao observador, dois eventos infinitesimalmente separados no tempo
e que ocorrem no mesmo ponto do espaço ocorrem no intervalo dτ , onde τ é o tempo próprio.
Então, neste referencial, dxi = 0 (i = 1, 2, 3) e
. 2
d`2 = c2 dτ 2 = g00 dx0 .

Portanto,
dτ √
= c−1 , dτ = g00 dt.
d`
Então, nas equações de movimento será realizada a mudança de variável ` → τ via
dxα dxα dτ dxα
= = c−1 .
d` dτ d` dτ
Dessa forma, as equações de movimento da partícula no campo gravitacional ficam
d2 xα dxβ dxγ
2
+ Γαβγ =0 (α, β, γ = 0, 1, 2, 3) .
dτ dτ dτ
Na métrica de Schwarzschild, os símbolos de Christoffel são dados por (6.88) e
√
dτ = µdt.
Neste caso, as equações de movimento tornam-se
d2 x0 dr dx0
2
+ 2ν 0 =0
dτ dτ dτ
0 2 1 2 2 2 3 2
d2 x1 dx dx dx dx
2
+ µ2 ν 0 − ν0 − µr − µr sen2 θ =0
dτ dτ dτ dτ dτ
2 2 1 2
3 2
d x dx dx dx
+ 2r−1 − sen θ cos θ =0
dτ 2 dτ dτ dτ
2 3 1 3
d x −1 dx dx dx2 dx3
+ 2r + 2 cotan θ = 0.
dτ 2 dτ dτ dτ dτ
Mas, como ν 0 = µ0 /2µ, pode-se escrever
dx0

d
µ =0 (6.91a)
dτ dτ
2 2 2 2
d2 r 1 0 dx0 1 µ0 dr

dθ 2 dϕ
− µr − µr sen θ + µµ − =0 (6.91b)
dτ 2 dτ dτ 2 dτ 2 µ dτ
2
d 2 dθ 2 dϕ
r − r sen θ cos θ =0 (6.91c)
dτ dτ dτ

d dϕ
r2 sen2 θ = 0. (6.91d)
dτ dτ
Observa-se que a primeira e a última equações de movimento pode ser imediatamente integra-
das, resultando em
dx0
µ =α
dτ
dϕ
r2 sen2 θ = h,
dτ
onde α e h são constantes de movimento, as quais foram escolhidas de maneira a facilitar a
identificação do limite não relativístico no movimento da partícula. Adicionalmente, será deter-
minada agora a orientação do referencial. Como a métrica é esfericamente simétrica, os eixos do
referencial podem ter qualquer orientação arbitrária, sem que isso comprometa a generalidade
da equação de movimento. Observando que a terceira equação de movimento é
2
d2 θ 2 dr dθ dϕ
+ − sen θ cos θ = 0,
dτ 2 r dτ dτ dτ
se a partícula estiver no plano θ = π/2 em um determinado instante próprio τ0 , pode-se desen-
volver θ (τ ) em torno de τ0 como
1 d2 θ

π dθ 2 1 dθ 3
θ (τ ) = + (τ − τ0 ) + (τ − τ0 ) + (τ − τ0 ) + · · · .
2 dτ τ0 2! dτ 2 τ0 3! dτ τ0

Ou seja,
d2 θ

dθ dθ 1 dθ 2
= + (τ − τ0 ) + (τ − τ0 ) + · · · .
dτ dτ τ0 dτ 2 τ0 2! dτ τ0

Se, adicionalmente, dθ/dτ |τ0 = 0, então a equação de movimento mostra que d2 θ/dτ 2 τ = 0. Para
0
se obter d3 θ/dτ 3 τ , deriva-se a equação para θ (τ ), resultando então que esta derivada também é
0
nula. Assim, pode-se mostrar que todos os termos na série de Taylor para θ (τ ) são nulos exceto
o primeiro. Portanto, as equações de movimento na métrica de Schwarzschild admitem uma
solução θ (τ ) = π/2, exatamente como na teoria Newtoniana da gravitação.
As equações de movimento reduzem-se então para
dx0
µ =α
dτ
dϕ
r2 = h,
dτ
2 2 2
d2 r 1 µ0 dr

h 1 0 α
− µr + µµ − = 0.
dτ 2 r2 2 µ 2 µ dτ
2
Agora, o termo (dr/dτ ) na equação será modificado a partir da métrica. De (6.90), resulta
que
2 0 2 " 2 #
2
−1 dr dx 2 dθ 2 dϕ
µ =µ −r + sen θ − c2
dτ dτ dτ dτ
h2
= µ−1 α2 − − c2 ,
r2
onde também foi empregada a identidade d` = cdτ . Portanto,
d2 r h2 1 0 h2 1
2
− µ 3
+ µ 2 + µ0 c2 = 0,
dτ r 2 r 2
d2 r 3 rG h2 rG c2
2
− 1− 3
+ = 0, (6.92)
dτ 2 r r 2r2
uma vez que µ = 1 − rG /r.

Para identificar finalmente a expressão para o raio gravitacional rG , considera-se primeiro o
limite clássico das equações de movimento. Observa-se que
r
√ rG
dτ = µdt = 1 − dt.
r
O limite clássico é obtido para r rG , de onde
rG
dτ ≈ 1 − dt ≈ dt.
2r
Neste limite, a equação (6.92) fica
d2 r h2 rG c2
− + = 0.
dt2 r3 2r2
Esta equação será comparada com as equações de movimento de uma partícula de massa m sob
a influência da força gravitacional de uma massa M , de acordo com a lei da gravitação universal
de Newton. As equações são as seguintes:
1
r̈ − r θ̇2 + sen2 θϕ̇2 + U 0 = 0
m
2
θ̈ + ṙθ̇ − sen θ cos θϕ̇2 = 0
r
d 2
r sen2 θϕ̇ = 0 =⇒ r2 sen2 θϕ̇ = h

dt
onde
GM m
U =−
r
é a energia potencial gravitacional do sistema composto pelas massas M e m e h é proporcional

ao momentum angular (constante). Estas equações admitem uma solução θ = π/2 = cte., em
cuja situação a equação radial pode ser escrita
h2 GM
r̈ − 3
+ 2 = 0.
r r
Comparando-se esta equação com (6.92) no limite clássico, obtém-se
2GM
rG = .
c2
É interessante comparar-se os raios de Schwarzschild de alguns objetos astronômicos conhe-
cidos. A tabela 6.3 mostra o valores de rG e também da densidade dos objetos. Observa-se que a
Terra tem um raio gravitacional de pouco menos do que 1 cm, ao passo que para o Sol, rG ≈ 3 km.
Ou seja, os seus raios gravitacionais são muito menores que os seus tamanhos. Contudo, um
objeto suficientemente denso pode ser um raio de Schwarzschild maior que o seu tamanho. Se
o raio do objeto é s
3
3M
r= ,
4πρ
sendo ρ sua densidade, então rG > r se
3c6
ρ> .
32πG3 M 2
Isto é o que ocorre com um Buraco Negro.
D ISTORÇÕES DO ESPAÇO - TEMPO NA MÉTRICA DE S CHWARZSCHILD

Alguns dos resultados mais conhecidos da métrica de Schwarzschild serão apresentados
agora. O espaço-tempo descrito pela métrica (6.90) não é “plano” como o espaço Euclideano,
tacitamente assumido na gravitação Newtoniana. Se forem considerados dois pontos infinitesi-
malmente próximos na direção radial a partir da massa M , de tal forma que dt = dθ = dϕ, resulta
que a extensão do elemento de arco na direção radial resulta
rG −1/2
dR = 1 − dr > dr.
r
Ou seja, a distância entre os pontos r1 e r2 (> r1 ) é obtida pela integração
ˆ r2
rG −1/2 hp √ √ i r2
R21 = 1− dr = r (r − rG ) + rG ln r + r − rG > r2 − r1 .
r1 r r1
Obviamente, se M → 0, R21 → r2 − r1 e o espaço torna-se plano.

Considerando agora a relação entre o tempo próprio τ e o tempo t medido por um observador
distante da massa M , parte-se da relação
r
√ rG
dτ = µdt = 1 − dt,
r
o que mostra que dτ < dt. O tempo próprio entre dois eventos quaisquer ocorrendo no mesmo
ponto do espaço é então dado por
ˆ t2 r
rG
τ= 1− dt < t2 − t1 .
t1 r
Tabela 6.3: Raios de Schwarzschild de alguns objetos astronômicos.

rG (m) Densidade g/cm3
Terra 8, 83 × 10−3 2, 04 × 1027
Sol 2, 95 × 103 1, 84 × 1016
Via Láctea 2, 08 × 1015 (∼ 0, 2a.l.) 3, 72 × 10−8

Observa-se que τ → 0 à medida que r → rG . Este resultado caracteriza o denominado horizonte

de eventos, pois para um observador situado exatamente no ponto r = rG quaisquer dois eventos
que levam um intervalo de tempo τ finito irão ocorrer ao longo de um intervalo de tempo infinito
para um outro observador situado distante do raio gravitacional de M . A dilatação temporal
prevista na métrica de Schwarzschild foi corroborada pelo experimento de Pound-Rebka em
1959 (POUND; REBKA, 1959, 9; 1960, 7).22
R EFERÊNCIAS
ARFKEN, G. B.; WEBER, H. J. Mathematical Methods for Physicists. Sixth. New York: Elsevier,
2005. 1182 + xii pp. ISBN: 0-12-059876-0.
BELLAC, M.; LÉVY-LEBLOND, J.M. Galilean electromagnetism. English. Il Nuovo Cimento, So-
cietà Italiana di Fisica, v. 14, n. 2, p. 217–234, abr. 1973. ISSN: 0369-3554. DOI: 10.1007/
BF02895715.
BISHOP, R. L.; GOLDBERG, S. I. Tensor Analysis on Manifolds. New York: Dover, 2012. (Dover
Books on Mathematics). ISBN: 9780486139234.
BLOCH, A. M. Nonholonomic Mechanics and Control. New York: Springer, 2003. (Interdisciplinary
Applied Mathematics). ISBN: 9780387955353.
BORISENKO, A.A.I.; TARAPOV, I.E.; SILVERMAN, R.A. Vector and Tensor Analysis With Applica-
tions. New York: Dover, 1968. (Dover Books on Mathematics). 257 + x pp. ISBN: 9780486638331.
DALARSSON, M.; DALARSSON, N. Tensor Calculus, Relativity, and Cosmology: A First Course.
New York: Elsevier, 2005. 280 + xii pp. ISBN: 9780122006814.
DEBENEDICTIS, Andrew. Integration in General Relativity, p. 7, fev. 1998. Disponível em: <http:
//arxiv.org/abs/physics/9802027>.
EINSTEIN, Albert. A Generalized Theory of Gravitation. Reviews of Modern Physics, American
Physical Society, v. 20, n. 1, p. 35–39, jan. 1948. DOI: 10.1103/RevModPhys.20.35.
FITZPATRICK, Richard. Fluid Mechanics. [S.l.: s.n.], 2012. Acesso em 10/03/2013. Disponível
em: <http://farside.ph.utexas.edu/teaching/336l/fluidhtml/Fluidhtml.html>.
GARWIN, Richard L.; LEDERMAN, Leon M.; WEINRICH, Marcel. Observations of the Failure of
Conservation of Parity and Charge Conjugation in Meson Decays: the Magnetic Moment of the
Free Muon. Physical Review, American Physical Society, v. 105, n. 4, p. 1415–1417, fev. 1957.
DOI: 10.1103/PhysRev.105.1415.
JACKSON, J. D. Classical Electrodynamics. Third. New York: John Wiley & Sons, 1999. 808 +
xxi pp. ISBN: 0-471-30932-X.
JOSHI, A. W. Matrices And Tensors In Physics. New Delhi: John Wiley & Sons, 1995. 342 + xvi
pp. ISBN: 9788122405637.
KAY, D. Schaums Outline of Tensor Calculus. New York: McGraw-Hill, 2011. (Schaum’s Outline
Series). 228 + ix pp. ISBN: 9780071756037.
LEE, T. D.; YANG, C. N. Question of Parity Conservation in Weak Interactions. Physical Review,
American Physical Society, v. 104, n. 1, p. 254–258, out. 1956. DOI: 10.1103/PhysRev.104.
254.
MATHEWS, Jon; WALKER, R. L. Mathematical methods of physics. Second. [S.l.]: W. A. Benjamin,
1970. (World Student Series). 501 + xiii pp. ISBN: 9780805370027.
MISNER, C.W.; THORNE, K.S.; WHEELER, J.A. Gravitation. San Francisco: Freeman, 1973.
1279 + xxvii pp. ISBN: 9780716703440.
NEARING, James. Mathematical Tools for Physics. New York: Dover Publications, out. 2010.
(Dover Books on Physics). 496 pp. ISBN: 978-0486482125.
POUND, R. V.; REBKA, G. A. Apparent Weight of Photons. Physical Review Letters, American
Physical Society, v. 4, n. 7, p. 337–341, abr. 1960. DOI: 10.1103/PhysRevLett.4.337.
. Gravitational Red-Shift in Nuclear Resonance. Physical Review Letters, American Phy-
sical Society, v. 3, n. 9, p. 439–441, nov. 1959. DOI: 10.1103/PhysRevLett.3.439.
22 Ver também: Physics Focus: The Weight of Light.

308 REFERÊNCIAS
PRICE, Richard H. General relativity primer. American Journal of Physics, v. 50, n. 4, p. 300–
329, abr. 1982. DOI: 10.1119/1.12853.
RINDLER, Wolfgang. Relativity: Special, General, and Cosmological. New York: Oxford University
Press, 2006. 430 + xvi pp. ISBN: 9780198567325.
SHARIPOV, R. A. Quick introduction to tensor analysis. [S.l.], mar. 2004. 47 pp. eprint: arXiv:
math/0403252. Disponível em: <http://arxiv.org/abs/math/0403252>.
SIMMONDS, James D. A Brief on Tensor Analysis. Second. New York: Springer-Verlag, jul. 1997.
(Undergraduate Texts in Mathematics). 112 + xiv pp. ISBN: 9780387940885.
SOKOLNIKOFF, I. S. Tensor Analysis. Theory and Applications. New York: John Wiley & Sons,
1951. (Applied Mathematics Series). 335 + x pp.
SYNGE, J.J.L.; SCHILD, A. Tensor calculus. New York: Dover, 1969. (Dover books on advanced
mathematics). 329 + ix pp. ISBN: 9780486636122.
WU, C. S. et al. Experimental Test of Parity Conservation in Beta Decay. Physical Review, Ameri-
can Physical Society, v. 105, n. 4, p. 1413–1415, fev. 1957. DOI: 10.1103/PhysRev.105.1413.

A
D ISTRIBUIÇÕES E A “F UNÇÃO ”
D ELTA DE D IRAC
D ELTA DE D IRAC é um artifício matemático utilizado em diversas áreas da física. Por exem-
A plo, no cálculo da Função de Green, em problemas de contorno não homogêneos, na

determinação do espectro contínuo de autovalores em mecânica quântica, na deter-
minação das flutuações térmicas de partículas puntuais em mecânica estatística e
outras aplicações importantes.
Este roteiro tem por objetivo definir a Delta de Dirac como tipo particular de uma distribuição
e apresentar algumas de suas propriedades.
A.1 D EFINIÇÃO DE D ISTRIBUIÇÕES

Denotando por ϕ(x1 , x2 , . . . , xn ) uma função de n variáveis contínuas x1 , x2 , . . . , xn , cujos
valores não nulos estão todos contidos dentro do domínio da função ϕ e que possui derivadas
de todas as ordens em relação a estas variáveis.
Definição. Uma distribuição T [ϕ] é um funcional linear e contínuo da função ϕ.
Por linearidade, entende-se que para qualquer combinação linear λ1 ϕ1 + λ2 ϕ2 , onde λ1 , λ2 ∈ C :
T [λ1 ϕ1 + λ2 ϕ2 ] = λ1 T [ϕ1 ] + λ2 T [ϕ2 ] .
Por continuidade, entende-se que para qualquer seqüência ϕ1 , ϕ2 , . . . , ϕj , . . . de funções tais que
lim ϕj = ϕ,
j→∞
tem-se
lim T [ϕj ] = T [ϕ] .
j→∞
A.1.1 D EFINIÇÃO OPERACIONAL DE DISTRIBUIÇÃO

A uma função localmente integrável f qualquer, isto é, qualquer função cuja integral1 sobre
qualquer intervalo finito contido no domínio exista, corresponde uma distribuição fˆ, também
denominada funcional definida pelo produto escalar
ˆ
fˆ [ϕ] = f (x)ϕ(x)dx = hϕ∗ , f i .
A.1.1.1 E XEMPLOS
A função 1/x não define uma distribuição porque não é integrável no ponto x = 0. Contudo,
pode-se definir a distribuição ˆ
1 ϕ(x)
PP [ϕ] ≡ PP dx,
x x
1 Integral na definição de Integral de Lebesgue. Uma integral de Lebesgue reduz-se a uma integral de Riemann (integral
usual) sempre que a última puder ser definida. Contudo, a integral de Lebesgue existe mesmo em casos onde a integral
de Riemann não pode ser definida.
309
310 A.1. Definição de Distribuições
onde PP denote a parte principal de Cauchy da integral, isto é,

ˆ ∞ ˆ − ˆ ∞
PP = lim + .
−∞ →0 −∞
A “função de Dirac” δ(x) define a distribuição
δ [ϕ] = ϕ(0),
assim como a “função” δ(x − x0 ) define a distribuição
δx0 [ϕ] = ϕ(x0 ).
A.1.2 P ROPRIEDADES DE DISTRIBUIÇÕES

A.1.2.1 C OMBINAÇÃO LINEAR DE DISTRIBUIÇÕES
Seja T = λ1 T1 + λ2 T2 , onde λ1 , λ2 ∈ C, tem-se
T [ϕ] = λ1 T1 [ϕ] + λ2 T2 [ϕ] .
A.1.2.2 P RODUTO DE DUAS DISTRIBUIÇÕES
Sendo fˆ uma distriuição associada com uma função localmente integrável f e T uma distri-
buição arbitrária, a distribuição
P = fˆT
é bem definida se T é linear, é um funcional contínuo da função f ϕ e tem-se, por definição,
P [ϕ] = T [f ϕ] .
O produto de duas distribuições nem sempre existe. Se f possui derivadas de todas as

ordens, fˆT existe para todas distribuições T . Se f é contínua no ponto x0 ,

fˆδx0 [ϕ] = f (x0 )ϕ(x0 ). (A.1)
Se f e g são funções quadraticamente integráveis,2 o produto fˆĝ está bem definido. Por outro
p 2
2
lado, [δ(x)] não tem sentido, assim como 1/ |x| .
Como um caso especial da equação (A.1), tem-se
xδ(x) = 0.
Por conseguinte, se xT = 0, T é um múltiplo de δ(x) : T = cδ(x), onde c é uma constante.

Portanto, se f (x) e g(x) estão relacionadas pela relação
xf (x) = g(x),
tem-se, necessariamente,
g(x)
f (x) = PP + cδ(x)
x
onde c é uma constante a ser determinada.
A.1.2.3 S ÉRIES E INTEGRAIS DE DISTRIBUIÇÕES
Se um conjunto de distribuições T1 , T2 , . . . , Tj , . . . é tal que quando j → ∞, Tj [ϕ] possui um

limite para qualquer ϕ, este limite é também uma distribuição:
T = lim Tj .
j→∞
2 Isto
´ 2 ´ 2
é, se |f | dx e |g| dx existirem.

C APÍTULO A. Distribuições e a “Função” Delta de Dirac 311
Definição equivalente: Se a série X

Ti [ϕ]
i
for definida para qualquer ϕ, seu resultado define uma distribuição; neste caso, diz-se que
a série de distribuições {Ti } é realizável:
X
T [ϕ] = Ti [ϕ] .
i
Se T (λ) é uma distribuição que depende de um parâmetro λ ∈ C, o qual pode variar continua-
mente em um domínio Λ e se a integral
ˆ
I [ϕ] = T (λ) [ϕ] dλ
Λ
´
converge para qualquer ϕ, o objeto I = Λ T (λ)dλ define uma distribuição. Uma definição análoga
vale para integrais múltiplas.
Em particular, se f (x, λ) é uma função localmente integrável de x e λ, a distribuição fˆ(λ) é
integrável em λ e sua integral é a distribuição ĝ associada com a função:
ˆ ˆ
ĝ [1] = fˆ(λ) [1] dλ = f (x, λ)dλ.
Λ Λ
Se a função a(k) permanece menor que uma potência positiva de |k| quando |k| → ∞ :
α
|a(k)| ≤ A |k| (Ae αconstantes positivas),
a integral ˆ ∞
eikx a(k)dk
−∞
é uma distribuição. Em particular,
ˆ ∞
eikx dk = 2πδ(x).
−∞
A.1.2.4 D ERIVADAS DE DISTRIBUIÇÕES
Por definição, a derivada parcial ∂T /∂xi da distribuição T é:

∂T ∂ϕ
[ϕ] = −T .
∂xi ∂xi
Em particular, se uma função localmente integrável é diferenciável, a derivada da distribuição
correspondente é a distribuição correspondente a sua derivada. Isto pode ser visto via integração
por partes: ˆ ˆ
fˆ0 [ϕ] = f 0 (x)ϕ(x)dx = − f (x)ϕ0 (x)dx = −fˆ [ϕ0 ] .
Todas as propriedade das derivadas de funções aplicam-se a distribuições. Por exemplo, a

derivada do produto P = fˆT é:
P 0 = fˆ0 T + fˆT 0 .
Além disso, certas propriedades que pertencem a uma classe restrita de funções aplicam-se a
todas as distribuições sem restrições. São as seguintes:
1. As distribuições são diferenciáveis em todas as ordens.
2. Derivação é uma operação linear e contínua no espaço das distribuições. Se
lim Tj = T, lim Tj0 = T 0 .
j→∞ j→∞
Em
P conseqüência, se a série existe, ela é diferenciável termo a termo sob o símbolo de soma
. Da mesma forma, se T (λ) é integrável sob o parâmetro λ, ∂T (λ)/∂xi também é integrável
e ˆ
∂I ∂
= T (λ) [ϕ] dλ.
∂xi Λ ∂x i

312 A.2. Propriedades da “Função” δ
A.2 P ROPRIEDADES DA “F UNÇÃO ” δ

A Delta de Dirac é um exemplo de distribuição definida sob o símbolo de integração, isto é,
ela somente tem sentido matemático quando aparece em uma integral. Na física, costuma-se
usar a notação δ(x − x0 ), no lugar da notação mais correta δx0 [ϕ]. Esta notação, contudo, é
bastante conveniente no uso prático. Também neste contexto, a δ(x − x0 ) é tratada como uma
função governada por regras peculiares; contudo, estas regras estão justificadas pela teoria das
distribuições.
A.2.1 D EFINIÇÃO DA δ
Sendo f (x) uma função definida no domínio Ω e x0 ∈ R,
ˆ (
f (x0 ), x0 ∈ Ω
f (x)δ(x − x0 )dx ≡ δx0 [f (x)] = (A.2a)
Ω 0, x0 6∈ Ω.
Formalmente, escreve-se então

(
0, x 6= x0
δ(x − x0 ) =
+∞, x = x0 ,
onde ˆ ∞
δ(x − x0 ) dx = 1. (A.2b)
−∞
Neste caso, a δ pode ser pensada como a generalização da delta de Kronecker
(
0, m 6= n
δnm =
1, m = n
para o caso contínuo.
A.2.2 R EPRESENTAÇÕES DA δ(x − x0 ) COMO O LIMITE DO KER -

NEL DE UM OPERADOR INTEGRAL
A δ(x − x0 ) pode ser considerada como o limite de uma função que possui um máximo estreito
e alto em torno de x0 , e cuja integral sobre todo o espaço permanece constante e igual a 1.
Assim, existem as seguintes representações:
1 sen [L(x − x0 )] 1 sen [(x − x0 ) /]
δ(x − x0 ) = lim = lim (A.3a)
π L→∞ x − x0 π →0 x − x0
1 1 − cos χ(x − x0 )
= lim (A.3b)
π χ→∞ χ(x − x0 )2
1
= lim (A.3c)
π →+0 (x − x0 )2 + 2
H(x − x0 + η) − H(x − x0 )
= lim (A.3d)
η→0 η
−1/2 −(x−x0 )2 /2
= lim (2π) e (A.3e)
→0
onde H(x) é a função de Heaviside ou também denominada função degrau:

(
1, x > 0
H(x) =
0, x < 0.
A δ(x − x0 ) pode ser interpretada como a derivada da função H(x) :

dH(x)
δ(x − x0 ) = .
dx
A figura A.1 mostra outras representações da δ(x − x0 ) juntamente com gráficos ilustrando a
tendência das respectivas funções à medida que o parâmetro → 0.

Figura A.1: Outras representações da δ(x−x0 ) junto com gráficos ilustrando a tendência das funções para → 0.
A.2.3 P RINCIPAIS PROPRIEDADES

As principais propriedades da δ são:
δ(x) = δ(−x) (A.4a)

1
δ(ax) = δ(x), (a = cte. 6= 0) (A.4b)
|a|
1
δ x2 − a2 =

[δ(x − a) + δ(x + a)] , (a = cte. 6= 0) (A.4c)
|a|
X δ(x − xn )
g(xn ) = 0,
δ [g(x)] = , (A.4d)
|g 0 (xn )| g 0 (x) 6= 0
n
xδ(x) = 0 (A.4e)
f (x)δ(x − a) = f (a)δ(x − a) (A.4f)
ˆ
δ(x − y)δ(y − a)dy = δ(x − a) (A.4g)
ˆ ∞
1
δ(x) = eikx dk. (A.4h)
2π −∞
Uma outra propriedade importante, que com freqüência é utilizada no tratamento de funções
complexas é a fórmula de Plemelj:
1 1
lim = PP ∓ iπδ(x − x0 ). (A.4i)
→+0 x − x0 ± i x − x0
Todas as igualdades apresentadas acima indicam que um lado da equação pode ser substi-
tuído pelo outro lado quando a δ for multiplicada por uma função regular e o produto integrado
sobre a variável x. Um exemplo de aplicação da propriedade (A.4d) é apresentada abaixo:
δ(x2 + x − 2) ⇒ g(x) = x2 + x − 2 = (x − 1)(x + 2) ⇒ g 0 (x) = 2x + 1

314 A.2. Propriedades da “Função” δ
⇒ xn = {1, −2}, g 0 (1) = 3 e g 0 (−2) = −3.

1
⇒ δ(x2 + x − 2) = [δ(x − 1) + δ(x + 2)] .
3
A.2.4 D ERIVADAS DA δ(x)

A “função” δ(x) é diferenciavel em todas as ordens. A sua m-ésima derivada δ (m) (x) é definida
pela propriedade
ˆ ∞
(
(m) (−1)m f (m) (x0 ), x0 ∈ Ω
δ (x − x0 )f (x) ≡ δx(m)
0
[f (x)] =
−∞ 0, x0 6∈ Ω.
definição esta válida para qualquer função f (x) diferenciável m vezes no ponto x = x0 ∈ Ω. A
δ (m) (x − x0 ) pode ser considerada como o limite da derivada de ordem m de qualquer das funções
dadas em (A.3a-d). As propriedades das derivadas da δ são as seguintes:
δ (m) (x) = (−1)m δ (m) (−x) (A.5a)

ˆ
(m) (n) (m+n)
δ (x − y)δ (y − a)dy = δ (x − a) (A.5b)
xm+1 δ (m) (x) = 0. (A.5c)
Em particular a derivada primeira tem as propriedades:

ˆ ∞
δ 0 (x − a)f (x)dx = −f 0 (a)
−∞
δ 0 (x) = −δ 0 (−x)
ˆ
δ 0 (x − y)δ(y − a)dy = δ 0 (x − a)
xδ 0 (x) = −δ(x)
x2 δ 0 (x) = 0
ˆ ∞
0 i
δ (x) = keikx dk.
2π −∞
Como exemplo, a propriedade (A.5a) pode ser obtida integrando-se por partes m vezes o
funcional
ˆ ∞ ˆ ∞ ˆ ∞
δ (m) (x)f (x)dx = − δ (m−1) (x)f 0 (x)dx = · · · = (−1)m δ(x)f (m) (x)dx.
−∞ −∞ −∞
A.2.5 D ELTAS DE D IRAC EM MAIS DE UMA DIMENSÃO

Quando o problema envolve duas ou mais dimensões, a delta de Dirac é dada pelo produto de
deltas, cada uma delas unidimensional. Representa-se então a delta de Dirac multidimensional
da seguinte forma:
δ (r − R) = δ (x1 − X1 ) δ (x2 − X2 ) δ (x3 − X3 ) , (A.6)
sendo {x1 , x2 , x3 } o conjunto de coordenadas ortogonais adotado.

Desta forma, a extensão das definições (A.2a,b) para 3 dimensões fica sendo:
ˆ (
1, R ∈ V3
δ (r − R) d r = (A.7a)
V 0, R 6∈ V
ˆ (
F (R) , R ∈ V
F (r) δ (r − R) d3 r = (A.7b)
V 0, R 6∈ V,
sendo V um subespaço vetorial de R3 .

C OORDENADAS C URVILÍNEAS O RTOGONAIS

Quando se está trabalhando em um sistema de coordenadas curvilíneas ortogonais qualquer,
a forma simples dada por (A.6) em geral está incorreta, ou seja, sendo (q1 , q2 , q3 ) o conjunto de
três coordenadas curvilíneas ortogonais, as quais se relacionam com o sistema cartesiano por
qi = qi (x1 , x2 , x3 ) ⇐⇒ xi = xi (q1, q2 , q3 ) , (i = 1, 2, 3) ,
não está correto, em geral, escrever
δ (r − r 0 ) = δ (q1 − q10 ) δ (q2 − q20 ) δ (q3 − q30 ) ,
pois esta expressão não respeita a propriedade (A.7a). Por outro lado, a expressão
δ (q1 − q10 ) δ (q2 − q20 ) δ (q3 − q30 )
δ (r − r 0 ) = , (A.8)
h1 h2 h3
sendo hi o fator de escala da coordenada i, dado por
v
u 3
uX ∂xj 2

hi = t ,
j=1
∂qi
irá respeitar as propriedades (A.7a,b). O produto h1 h2 h3 é também denominado o Jacobiano

da transformação de coordenadas. Portanto, (A.8) é a forma correta para a delta de Dirac em
coordenadas curvilíneas ortogonais.
E XEMPLOS
C OORDENADAS ESFÉRICAS . Nas coordenadas esféricas, q1 = r, q2 = θ e q3 = ϕ. Os fatores
de escala são h1 = r2 , h2 = sen θ e h3 = 1. Portanto,
1
δ (r − r 0 ) = δ (r − r0 ) δ (θ − θ0 ) δ (ϕ − ϕ0 ) .
r2 sen θ
Assim, sendo r 0 um ponto contido em V, (A.7a) será respeitada, pois
ˆ ˆ
1
δ (r − r 0 ) d3 r = 2 sen θ
δ (r − r0 ) δ (θ − θ0 ) δ (ϕ − ϕ0 ) r2 sen θdrdθdϕ = 1.
V V r
Uma outra forma utilizada com freqüência é
1
δ (r − r 0 ) = δ (r − r0 ) δ (cos θ − cos θ0 ) δ (ϕ − ϕ0 ) .
r2
C OORDENADAS CILÍNDRICAS . Nas coordenadas cilíndricas, q1 = ρ, q2 = ϕ e q3 = z. Por

isso, h1 = h3 = 1 e h2 = ρ. Assim,
1
δ (r − r 0 ) = δ (ρ − ρ0 ) δ (ϕ − ϕ0 ) δ (z − z 0 ) .
ρ
P ONTOS DEGENERADOS
A expressão (A.8) assume que r 0 não é um ponto degenerado, isto é, não é caracterizado por
mais de um conjunto de valores de coordenadas. Em algumas situações, o “ponto” degenerado
pode ser uma curva ou uma superfície em 3D.
Exemplos de pontos degenerados são: a origem num sistema plano-polar (caracterizado por
r = 0 e qualquer valor de 0 6 θ 6 2π), a origem em um sistema curvilíneo em 3D (r = 0, 0 6 θ 6 π,
0 6 ϕ 6 2π em coordenadas esféricas), o eixo z em coordenadas cilíndricas (ρ = 0, 0 6 ϕ 6 2π).
Suponha, então, que a coordenada q1 assume todos os valores no intervalo q11 < q1 < q12 .
Neste caso, a representação correta de δ (r − r 0 ) não é (A.8), uma vez que a coordenada q1 não
mais possui um único valor para q10 (sua multiplicidade é coberta pela variação de q1 ). Neste
caso, a propriedade (A.7a) é novamente respeitada se
δ (q2 − q20 ) δ (q3 − q30 )
δ (r − r 0 ) = ´
q12
,
h
q11 1 1
dq h2 h3

316 REFERÊNCIAS
pois (A.7a) fica

ˆ ˆ q12 ¨
0 δ (q2 − q 0 ) δ (q3 − q30 )
3
δ (r − r ) d r = h1 dq1 h2 h3 dq2 dq3 ´ q 2 = 1.
12
V q11 h dq h2 h3
q11 1 1
Por exemplo, considerando um problema em coordenadas esféricas que possua simetria azimu-
tal, então a coordenada ϕ deve ser eliminada, pois será multiplamente definida. Neste caso,
1 1
δ (r − r 0 ) = ´ 2π δ (r − r0 ) δ (θ − θ0 ) = δ (r − r0 ) δ (θ − θ0 ) .
r2 sen θ dϕ 2πr2 sen θ
0
Da mesma maneira, se os pontos multiplamente definidos estiverem sobre a superfície q1 ×q2 ,

estando a coordenada q2 no intervalo q21 < q2 < q22 , então
δ (q3 − q30 )
δ (r − r 0 ) = ´ q ´ q .
12 22
h h dq dq h3
q11 q21 1 2 1 2
R EFERÊNCIAS
MESSIAH, Albert. Quantum Mechanics: Two Volumes Bound as One. Mineola: Dover, 1999. 1136
+ xxii pp. ISBN: 0-486-40924-4.

Física Matemática - Rudi Gaelzer

Enviado por

Direitos autorais:

Formatos disponíveis

Física Matemática - Rudi Gaelzer

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Física Matemática - Rudi Gaelzer

Enviado por

Direitos autorais:

Formatos disponíveis

F ÍSICA -M ATEMÁTICA

R UDI G AELZER (I NSTITUTO DE F ÍSICA - UFRGS)

Apostila preparada para as disciplinas de Física-

Início: M AIO DE 2006 Impresso: 29 de agosto de 2018

1 Sistemas de Coordenadas Curvilíneas Ortogonais 1

2 Funções de Uma Variável Complexa 23

2.6.1 O teorema de Green no plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3 Teoria de Grupos Abstratos 81

Autor: Rudi Gaelzer – IF/UFRGS Impresso: 29 DE AGOSTO DE 2018

3.4.1 Grupos cristalográficos pontuais . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

4 Espaços Vetoriais 127

5 Teoria de Representações de Grupos 153

Autor: Rudi Gaelzer – IF/UFRGS Impresso: 29 DE AGOSTO DE 2018

5.6.6 Construção de uma tabela de caracteres . . . . . . . . . . . . . . . . . . . . . . 184

6 Álgebra e Análise Tensoriais 217

Autor: Rudi Gaelzer – IF/UFRGS Impresso: 29 DE AGOSTO DE 2018

6.7.2.2 Elementos infinitesimais de arco e volume . . . . . . . . . . . . . . . . 255

A Distribuições e a “Função” Delta de Dirac 309

Autor: Rudi Gaelzer – IF/UFRGS Impresso: 29 DE AGOSTO DE 2018

Autor: Rudi Gaelzer – IF/UFRGS Impresso: 29 DE AGOSTO DE 2018

TÉ ESTE PONTO , todas as expressões foram desenvolvidas utilizando-se um sistema de co-

A ordenadas retangulares, também denominado de Cartesiano. O sistema Cartesiano de

1.1 C OORDENADAS CURVILÍNEAS

Figura 1.1: Sistema geral de coordenadas curvilíneas.

quanto as suas relações inversas

existindo expressões equivalentes para as coordenadas y e z. No sistema Cartesiano, o vetor

Autor: Rudi Gaelzer – IF/UFRGS Início: 05/2012 Impresso: 29 DE AGOSTO DE 2018

d`2 = dx2 + dy 2 + dz 2 . (1.4)

Para simplificar e condensar a notação empregada, serão feitas as equivalências

nas expressões a seguir.

d`2 = g11 dq12 + g12 dq1 dq2 + g13 dq1 dq3

Os coeficientes gij especificam a natureza do sistema de coordenadas (q1 , q2 , q3 ). Coletivamente,

2 Espaços métricos são definidos na seção 4.8.

Autor: Rudi Gaelzer – IF/UFRGS Início: 05/2012 Impresso: 29 DE AGOSTO DE 2018

sendo que a relação inversa também é útil, isto é,

A partir deste resultado, calculando-se o elemento de arco d`2 = dr · dr e comparando-se com

Os componentes {αi } e {βi } são denominados, respectivamente, de componentes contravarian-

Portanto, ei · j = δij , o que caracteriza dois conjuntos de vetores recíprocos.

o fato destas bases serem recíprocas permite escrever

Desta maneira, pode-se escrever os componentes covariantes {βi } de a em (1.9) simplesmente

Autor: Rudi Gaelzer – IF/UFRGS Início: 05/2012 Impresso: 29 DE AGOSTO DE 2018

Observando as expressões (1.10a,b), pode-se concluir que as relações entre os componentes

Esta expressão é útil também quando o deslocamento infinitesimal dr é ocasionado pela

sendo dqi /dθ a variação da coordenada qi com o parâmetro θ.

1.2 C OORDENADAS CURVILÍNEAS ORTOGONAIS

Autor: Rudi Gaelzer – IF/UFRGS Início: 05/2012 Impresso: 29 DE AGOSTO DE 2018

o que permite concluir que

Já as relações (1.7) e (1.15a) mostram que

Além disso, o determinante da matriz g que representa o tensor de métrica é, simplesmente,

ao passo que a sua inversa é

sendo d`i obtido mantendo-se as outras coordenadas qj (j 6= i) constantes. Porém, o fator de

1.3 A NÁLISE VETORIAL EM SISTEMAS DE COORDENA -

Autor: Rudi Gaelzer – IF/UFRGS Início: 05/2012 Impresso: 29 DE AGOSTO DE 2018

1.3.1 Á LGEBRA VETORIAL

A adição vetorial se procede como o usual,

1.3.2 I NTEGRAIS DE CAMINHO , DE SUPERFÍCIE E DE VOLUME

Autor: Rudi Gaelzer – IF/UFRGS Início: 05/2012 Impresso: 29 DE AGOSTO DE 2018

Então, uma definição apropriada para o vetor elemento de superfície de S é

dσ = dσ23 x̂1 = dx2 dx3 x̂1 = dydzı̂,

existindo expressões equivalentes para as coordenadas y e z. No sistema Cartesiano, o vetor

Portanto, ei · j = δij , o que caracteriza dois conjuntos de vetores recíprocos.