8 Parte3 (1) Dirac Spin
8 Parte3 (1) Dirac Spin
8 Parte3 (1) Dirac Spin
onde
p 2i eiej
H mat ∑ −∑ , H rad 1 E 2 B 2 d 3 x,
i 2m ji 4 x i − x j 2
e ∑ A p e2 A A
H int − mc i
i 2mc 2
A parte do Hamiltoniano correspondente à radiação já está na forma covariante, uma vez que as equações de
Maxwell são invariantes por transformações de Lorentz.
Por outro lado, o Hamiltoniano que descreve a matéria não é covariante, uma vez que usamos a energia cinética na
forma não-relativística, resultando na equação de onda de Schröndiger, que é inconsistente com a teoria da
relatividade.
A questão é: Podemos encontrar um Hamiltoniano consistente com a teoria da relatividade ao mesmo tempo em
que satisfaça uma equação de onda relativisticamente covariante?
Veremos que a resposta é sim, mas que não se trata de uma simples modificação da equação de onda de
Schrödinger, para a qual, falharam várias tentativas no sentido de adaptá-la para uma forma covariante.
Equação de Klein-Gordon
A equação de Schrödinger é baseada na expressão não-relativística da energia, isto é,
p2
E
2m
A partir desta expressão, obtém-se a equação de Schrödinger pela substituição das grandezas E e p pelos
operadores,
E i ∂ , p −i∇
∂t
∂
− ∇2
2
i
∂t 2m
Com a função de onda complexa podemos construir uma forma bilinear, ∗ || 2 , tal que
|| 2 d 3 x
é interpretadada como a probabilidade de encontrar a partícula num elemento de volume d 3 x.
Equação da continuidade
Esta interpretação só é possível, porque a densidade de probabilidade, P, e a densidade de fluxo, S, dadas por
P || 2 0, S ∗ ∇ − ∇ ∗
2im
satisfazem a equação da continuidade
Para construir uma mecânica quântica relativística, o ponto de partida natural é a troca da expressão clássica da
energia por sua versão relativística, ou seja,
2
E2 p2c2 m2c4 E p2 m2c2
c
Usando a mesma substituição das grandezas por operadores, E → i∂/∂t e p → −i∇, encontra-se
2 ∂2
− 2 ∇ 2 − 12 ∂ 2 − m 2c
2 2 2
− 2 ∇ 2 m 2 c 2 0
c ∂t 2 c ∂t
2 2
− m 2c 0,
c ∂t
A equação resultante, que é a versão relativística da equação de Schrödinger,
2 2
− m 2c 0
é a equação de Klein-Gordon.
Como no caso equação de Schrödinger, a equação de K-G também admite a onda plana como solução para uma
partícula livre,
x, t Ce ipx−Et/ C e ip x /
Segundo Sakurai, não há nada de errado com a equação de Klein-Gordon, se ela for interpretada corretamente.
Historicamente, porém, as “dificuldades” com a teoria de K-G estão associadas com a interpretação probabilística
imposta nos moldes da teoria não-relativística de Schrödinger, que fizeram com que aquela equação fosse
abandonada por algum tempo.
A seguir, discutiremos alguns dos problemas relacionados com a equação de Klein-Gordon.
∗ 1 H
i
− 1 ∗ H d 3 x 12
i
∗H − ∗H d3x
0
Observe que a substituição de ∂/∂t H só foi possível porque a equação de Schrödinger é de primeira ordem no
tempo, de maneira que basta fornecer x, t 0 como condição de inicial no instante t t 0 .
Vamos fazer a mesma coisa com a teoria de K-G. Seja a derivada temporal da “probabilidade total” de K-G,
∂ ∗ x, t ∂x, t
d
dt
∗ x, t x, t d 3 x ∂t
x, t ∗ x, t
∂t
d3x
Mas, como a equação de K-G é de segunda ordem no tempo, precisamos fornecer duas condições iniciais
∂x, t 0
independentes: x, t 0 e . (Lembre-se da solução da equação de Newton, para a qual precisamos fornecer
∂t
a posição e a velocidade no instante inicial),
∂x, t 0
Assim sendo, x, t 0 e , em geral, não se anulam, de maneira que podemos ter
∂t
d
dt
∗ x, t x, t d 3 x ≠ 0
o que significa que a “probabilidade total” não se conserva.
Em outras palavras, a simples transposição da forma bilinear usual, ∗ ∗ , não pode ser considerada como
uma definição de densidade de probabilidade para a equação de Klein-Gordon, uma vez que neste caso esta
quantidade não se conserva.
Uma vez que a forma bilinear usual para a densidade de probabilidade não funciona com a equação de
Klein-Gordon vamos definir uma outra quantidade que possa ser conservada.
Como vimos, a densidade de probabilidade definida pela equação de Schrödinger satisfaz a equação da
continuidade
∇ S ∂P 0
∂t
Então, para escrevermos esta equação numa forma covariante, a densidade de probabilidade P deve ser uma
componente de um quadrivetor densidade, s , definido por
s S, icP
de maneira que a equação da continuidade se escreve agora como
∂s
0
∂x
Podemos mostrar que uma possível expressão para s , baseada na equação de K-G, que satisfaz esta equação da
continuidade e, portanto se conserva, é
∂ ∂ ∗
s A ∗ −
∂x ∂x
onde A é uma constante multiplicativa.
Demonstração Para um o campo escalar complexo x, t que satisfaz a equação de K-G, temos
onde usamos ≡ ∂ 2 /∂x 2 . Então, substituindo s na equação da continuidade, juntamente com os resultados acima,
encontramos
∂s ∂ ∂ ∗ ∂ ∗ ∂ ∂2 ∂ ∗ ∂ ∂2∗
A ∂ ∗ − A ∗ 2 − −
∂x ∂x ∂x ∂x ∂x ∂x ∂x ∂x ∂x ∂x 2
∂ ∗ ∂ 2 2 ∂ ∗ ∂ 2 2
A ∗ m 2c − − ∗ m 2c
∂x ∂x ∂x ∂x
0.
Ou seja, a quadri-divergência se anula, devido a equação de K-G, atendendo às exigências da conservação do fluxo
de probabilidade.
p2 p2 p2
E p 2 c 2 m 2 c 4 mc 2 1 ≈ mc 2 1 mc 2 E nr mc 2
2
m c 2 2m 2 c 2 2m
Mas, x 4 ict
∂ e −imc
2 t/
∂e −mcx 4 / ∂
e −mcx 4 / − mc e −mcx 4 / ,4
∂x ∂x ∂x
∂ ∗ e imc
2 t/
∂ ∗ e mcx 4 / ∂ ∗
e mcx 4 / mc ∗ e mcx 4 / ,4
∂x ∂x ∂x
Logo,
∂e −mcx 4 / ∂ ∗ e mcx 4 / −mcx 4 /
s A ∗ e mcx 4 / − e
∂x ∂x
∂
A ∗ e mcx 4 / e −mcx 4 / − mc e −mcx 4 / ,4 −
∂x
∂ ∗
− e mcx 4 / mc ∗ e mcx 4 / ,4 e −mcx 4 /
∂x
∂ ∗
A ∗ − mc ∗ ,4 − ∂ − mc ∗ ,4
∂x ∂x
∂ ∂ ∗
A ∗ − − 2mc ∗ ,4
∂x ∂x
Até aqui tudo parece funcionar corretamente pelo menos no limite não-relativístico.
Recapitulando, vimos que para o caso relativístico:
∗
s S, s 4 S, icP, s ∗ ∂ − ∂
2im ∂x ∂x
onde
∗ ∗ ∂ ∗
s4 ∗ ∂ − ∂ ∗ ∂ − ∂ − ∗
∂
−
2im ∂x 4 ∂x 4 2im ∂ict ∂ict 2mc ∂t ∂t
∇2 E2 − m2c2
c2 2
− m2c2 0
2
∇2∗ E2 − m2c2 ∗
c2 2
então e ∗ são soluções simultâneas da equação de K-G.
A diferença entre elas está no sinal da energia, ou seja,
∂ ∂ ∗
i E e i −E ∗
∂t ∂t
ou seja, a equação de K-G admite soluções simultâneas com energias positivas e negativas. Diz-se que é uma
função de onda de frequência positiva e ∗ , de frequência negativa. Ambas são necessárias por razões de
completeza.
Teoria de Schrödinger Porém, isto não acontece com a teoria de Schrödinger, que possui derivada de primeira
ordem no tempo, admitindo portanto apenas um tipo de solução. De fato, como
H E
∂
H i ,
∂t
H ∗ −E ∗
então e ∗ não são soluções simultâneas da equação de Schrödinger. Aqui, o sinal da frequência é determinado
pelo autovalor do operador H.
Klein-Gordon Voltando à questão da “densidade de probabilidade” na teoria de K-G, para a solução
x, t ux e −iEt// , encontra-se:
i ∂ ∂ ∗
P ∗ −
2mc 2 ∂t ∂t
i 2 u ∗ x e iEt// ux − iE e −iEt// − u ∗ x iE e iEt// ux e −iEt//
2mc
i 2 |ux| − 2iE E 2 |ux|
2 2
2mc mc
Estas equações mostram que a quantidade P muda de sinal quando trocamos → ∗ . Além disto, P e P ∗
podem ser positivo ou negativo, dependendo do sinal da energia,
P 0 P 0
E0 , E0
P ∗ 0 P ∗ 0
Operador quadricorrente
A interpretação de s como uma densidade carga-corrente é mais satisfatória quando uma solução da equação de
K-G for interpretada como um operador de campo quantizado.
Seja então o operador quadricorrente
∂ ∂ †
j e † −
∂x ∂x
onde 1 i 2 / 2 e † 1 − i 2 / 2 são campos escalares complexos construídos a partir dos campos
escalares reais 1 e 2 .
Pode-se mostrar (Problema 3-1) que a quarta componente de j tem a propriedade
j4
ic
d3x e ∑ Nk − Nk
−
onde
N k a †k a k ,
com
1 2 1 2
a k 1 a k ia k , a †k 1 a k ∓ ia k
2 2
No contexto desta nova teoria, processos em que partículas são criadas ou destruídas, ou seja, o número de
partículas não é constante, o que é conservado não é a probabilidade de encontrar uma dada partícula em todo o
espaço, mas a carga total do campo dada pelo autovalor de Q.
Desta maneira, como afirma Sakurai, a equação de K-G não pode ser rejeitada pelo simples argumento de que não
se pode formar uma densidade de probabilidade positiva definida, sob pena de fazermos o mesmo com a teoria de
Maxwell, onde não é possivel construir um quadrivetor densidade conservado na forma bilinear para o campo
eletromagnético.
O Hamiltoniano de Schrödinger-Pauli
Na mecânica quântica não-relativística, é costume levar em conta o spin, adicionando ao Hamiltoniano usual, H 0 , o
termo H (spin) da interação do momento magnético do elétron com o campo magnético, como foi feito originalmente
por Pauli, isto é,
Com a ajuda de uma importante identidade, envolvendo as matrices de Pauli e os vetores a e b (veja Sakurai, MQM,
pág. 165), isto é,
a b a b i a b
podemos reescrever p2, fazendo a b p, e, portanto,
p 2 p p p p
H 1 p − eA p − eA
2m c c
p − eA
c p − eA
c p − eA
c p − eA
c i p − eA
c p − eA
c
2
p − eA
c i p − eA
c p − eAc
O segundo termo do segundo membro não se anula porque p ∇ é um operador que atua tanto em A como na
i
função de onda. Assim, para uma função arbitrária , temos
ie
c B
Assim,
2
p − eA
c p − eA
c p − eA
c i p − eA
c p − eA
c
2
p − eA
c i ie
c B
2
p − eA
c − e
c B
(Esta expressão é diferente daquela em que iniciams com H p 2 /2m e fazemos p p − eA/c).
e , gerado desta maneira, tem a razão giromagnética correta, g 2.
Observe que o momento magnético gmc
E (op) i ∂ ihc ∂ , p ∇.
∂t ∂x 0 i
ih ∂ − ∇ ih ∂ ∇ mc 2
∂x 0 i ∂x 0 i
onde é uma função de onda de duas componentes (spinor).
Como podemos identificar facilmente, esta é equação de segunda ordem nas derivadas do espaço e tempo.
Porém, estamos interessados em obter uma equação linear em ∂/∂t. Como sugere a covariância relativística, esta
equação deve também ser linear em ∇.
Como vimos, na teoria de Maxwell para o campo livre, a equação para o potencial vetor A é de segunda ordem nas
derivadas do espaço e tempo,
A 0
Por outro lado, as equações de Maxwell para os campos F , obtidos por diferenciação do potencial vetor A , isto é,
∂A
F ∂A −
∂x ∂x
é de primeira ordem nessas variáveis,
∂F
0
∂x
Observe que o campo F tem mais componentes (16) do que o potencial A (4). Este aumento no número de
componentes 4 16, quando passamos de A F , é compensado pela redução da ordem da equação
2 1.
Motivado por essa analogia, vamos definir duas funções de onda, ambas de duas componentes, R e L , como
1 ih ∂ ∇ 1 ih ∂ ∇ L .
L , R mc
∂x 0 i mc ∂x 0 i
Incluindo as duas componentes de cada função, R e R , o número total de componentes aumentou agora para
quatro.
Assim, com a substituição
ih ∂ − ∇ ih ∂ ∇ mc 2
∂x 0 i ∂x 0 i
ih ∂ − ∇ mc R mc 2 L
∂x 0 i
ih ∂ − ∇ R mc L
∂x 0 i
ih ∂ ∇ L mc R
∂x 0 i
Logo, a equação original de segunda ordem é agora equivalente a duas equações de primeira ordem
Estas duas equações acoplam as quatro componentes (exceto quando m 0, e são equivalentes à equação de
onda de Dirac.
−i ∇ R − L − ih ∂ R L −mc R L soma
∂x 0
R L
i ∇ ih ∂ R − L −mc R − L diferença
∂x 0
−ih ∂ −i ∇ A A
∂x 0
−mc .
i ∇ ih ∂ B B
∂x 0
Como A e B são funções de onda de duas componentes cada uma, esta é uma equação em quatro componentes.
Vamos reescrever a matriz 4 4 como um produto escalar de quadrivetores:
−ih ∂ −i ∇ ∂ 0
∂x 0 0 −i ∇ ∂x 4
i ∇ ih ∂ i∇ 0 0 − ∂
∂x 0 ∂x 4
0 −i k ∂ ∂ 0
∂x k ∂x 4
i k ∂ 0 0 − ∂
∂x k ∂x 4
0 −i k ∂ I 0 ∂
i k 0 ∂x k 0 −I ∂x 4
−ih ∂ −i ∇
∂x 0
∇ 4 ∂ ∂
i ∇ ih ∂ ∂x 4 ∂x
∂x 0
0 −i k I 0
k , e 4
i k 0 0 −I
−ih ∂ −i ∇ A A
∂x 0
−mc
i ∇ ih ∂ B B
∂x 0
∇ 4 ∂ mc 0
∂ix 0
ou, usando as quadrimatrizes ,
∂ mc 0
∂x
que é a equação de Dirac na forma original. Esta equação na verdade representa quatro equações diferenciais,
acoplando as quatro componentes de representado por um vetor coluna
1
2
3
4
0 0 0 −1 0 0 0 −i 0 0 −i 0
0 0 1 0 0 0 −i 0 0 0 0 i
1 , 2 , 3
0 1 0 0 0 i 0 0 i 0 0 0
−1 0 0 0 i 0 0 0 0 −i 0 0
1 0 0 0
0 1 0 0
4
0 0 −1 0
0 0 0 −1
Podemos representar explicitamente cada uma das quatro componente da equação de Dirac,
∂ mc 0
∂x
em termos das somatórias envolvidas.
Assim, a componente 1, 2, 3, 4. é dada por
4 4
∑∑ ∂ mc 0,
1 1
∂x
onde a somatória em vem da convenção da soma de Einstein adotada neste texto e a somatória em representa
o produto usual de matrizes.
kl lk 0 k , l 0
0 kl lk 0 k , l
2 kl 0 I 22 0
2 kl
0 2 kl 0 I 22
ou simplesmente
k , l k l l k 2 kl
onde ij deve ser considerada como a matriz identidade 4 4.
Para a componente 4 temos
I 0 I 0 I 0 I 0 I 0
44 44 2
0 −I 0 −I 0 −I 0 −I 0 I
ou
4 , 4 4 4 4 4 2
Finalmente,
0 −i k I 0 I 0 0 −i k
k , 4 k 4 4 k
i k 0 0 −I 0 −I i k 0
0 i k 0 −i k 0 0
i k 0 −i k 0 0 0
∇ 4 ∂ mc 0
∂ix 0
e multiplicar, pela esquerda, por 4 . Ou seja x 0 ct
onde usamos 24 1 4 , 4 1.
2
Reordenando os termos, encontra-se
∂
c 4 ∇ 4 mc 2 i
∂t
ou
∂
H i
∂t
onde
H −ic ∇ mc 2
com
0 k I 0
k i 4 k , 4
k 0 0 −I
Teoria de Shcrödinger
Teoria de Dirac
Nosso problema aqui é similar àquele da teoria de Schrödinger. A diferença é que a função de onda na equação de
Dirac é um spinor com quatro componentes, de maneira que vamos partir da equação de Dirac e de sua conjugada
Hermitiana (ao invés da conjugada complexa ). Assim,
†
∂ mc 0, ∂ mc † 0
∂x ∂x
Spinor adjunto
Similar ao que se faz na teoria de Schrödinger para obter a equação da continuidade, vamos multiplicar a equação
de Dirac por
̄ , à esquerda, e, a equação conjugada Hermitiana por , à direita. Ou seja,
∂
̄ ̄ mc 0
∂x
∂̄
− mc
̄ 0
∂x
Mas, como
∂ ∂ ∂̄
̄
̄
∂x ∂x ∂x
̄ se anula, isto é,
encontra-se então que a quadridivergência de
∂ ̄ 0
∂x
̄ se conserva.
o que indica que a quantidade
Quadrivetor densidade s
Estas derivadas podem ser obtidas, usando-se a forma Hamiltoniana da equação de Dirac,
∂ ∂
i H 1 H
∂t ∂t i
∂ † † ∂ †
− i H † H † † H − 1 †H
∂t ∂t i
Então
d
dt
† d3x † 1 H − 1 † H d 3 x 1 † H − † H d 3 x 0
i i i
e, portanto,
d
dt
† d3x 0 † d3x constante
Além disto, a quantidade † é positiva definida, como se pode ver facilmente, escrevendo-a em termos de suas
componentes. Isto é,
† ∑ ∗ ∑| | 2 0
onde é a componente do spinor , e | | 2 é o quadrado da sua norma, e, portanto, sendo um número sempre
positivo.
̄ 4 † possui todos os requisitos necessários para ser identificada como uma densidade de
Em resumo,
probabilidade, como foi feito na teoria de Schrödinger.
Com esta interpretação, a quantidade
̄ k c † k
s k ic
é identificada com a densidade de fluxo.
Assim, podemos escrever o quadrivetor densidade como
s ic ̄ 4 c † k , ic † s k , icP
̄ k , ic
e a equação da continuidade,
∂ s 0,
∂x
torna-se
Para obter a expressão † ∑ ∗ admitimos que, se o spinor de Dirac for representado por matrizes-coluna,
1
2
3
4
então, o spinor Hermitiano conjugado e o spinor adjunto, são representados por matrizes-linha, isto é,
† ∗1 ∗2 ∗3 ∗4 ,
̄ ∗1 ∗2 − ∗3 − ∗4 ,
1 0 0 0
0 1 0 0
̄ †4
∗1 ∗2 ∗3 ∗4 ∗1 ∗2 − ∗3 − ∗4
0 0 −1 0
0 0 0 −1
p p − ec A − i ∂ −i ∂ − ec A ∂ ∂ − ie A
∂x ∂x ∂x ∂x c
onde A e B , são spinores de duas componentes, satisfazendo às duas equações acopladas. Ou seja p −i∇
−ih ∂ −i ∇ A A
∂x 0
−mc
i ∇ ih ∂ B B
∂x 0
−ih ∂ p A A
∂x 0
−mc
− p ih ∂ B B
∂x 0
− i ∂ −i ∂ − ec A , − i ∂ −i ∂ ec A 0
∂x ∂x ∂x 0 ∂x 0
onde A A, iA 0 .
Portanto, as equações acopladas podem ser reescritas como
− ih ∂ e p − ec A A A
c ∂t c A 0
−mc
− p − ec A ih ∂ − e A 0
c ∂t c B B
−E e p − ec A A A
c c A0
−mc
− p − ec A E − e A0
c c B B
E − eA 0 − mc 2 A p − ec A c2 p − ec A A
E − eA 0 mc 2
Precisamos fazer algumas aproximações nesta equação para tratá-la no caso não-relativístico.
c2 1 2mc 2 1 1
E − eA 0 mc 2 2m 2mc 2 E (NR) − eA 0 2m E (NR) − eA 0
1
2mc 2
−1
1 1 E (NR) − eA 0 1 1− E (NR) − eA 0
2m 2mc 2 2m 2mc 2
≈ 1 1− E (NR) − eA 0
2m 2mc 2
Isto pode ser considerado uma expansão em potências de v/c 2 , uma vez que
− eA 0 ≈ p − ec A /2m ≈ mv 2 /2, ou seja,
2
E (NR)
E (NR) − eA 0 2
≈ mv 2 v 2
2mc 2 mc c
v 2
Assim, substituindo esta expansão na expressão de A , e mantendo até a ordem zero em c , obtém-se
E − eA 0 − mc 2 A E (NR) − eA 0 A
p − ec A 1 1 − E (NR) − eA 0 p − ec A A
2m 2mc 2
≈ 1 p − ec A p − ec A A
2m
p − ec A p − ec A p − ec A
2
− e
m B
Então a equação
E (NR) eA 0 A 1 p− eA p − ec A A
2m c
torna-se
E (NR) eA 0 A 1 p− eA 2
A − e B A
2m c 2mc
Esta equação, correspondente à ordem zero em v/c 2 , pode ser escrita na forma
1 p− eA 2
− e B − eA 0 A E (NR) A ,
2m c 2mc
que nada mais é do que a equação de Schrödinger-Pauli da mecânica quântica não-relativística para a função de
onda A x de duas componentes.
Portanto, a função de onda A x, t pode ser escrita como
(NR) t/
A x, t A xe −iEt/ A xe −iE e −imc SP x, t e −imc
2 t/ 2 t/
,
(NR) t/
onde SP x, t A xe −iE é a função de onda de duas componentes que satisfaz a equação de
Schrödinger-Pauli.
Função de onda B Para estimar a função de onda B , vamos considerar a segunda equação do sistema de
equações, ou seja,
B c p − ec A A
E (NR) − eA 0 2mc 2
c2 1 1− E (NR) − eA 0
≈
E (NR) − eA 0 2mc 2 2m 2mc 2
c 1 E (NR) − eA 0
≈ 1−
E (NR) − eA 0 2mc 2 2mc 2mc 2
então,
pc
B ≈ A,
2mc 2
Logo
B ≈ v A A
2c
uma vez que no limite não-relativístico v c.
Por esta razão, A é conhecida como componente grande e B , como componente pequena da função de onda de
Dirac .
E − eA 0 − mc 2 A p − ec A c2 p − ec A A
E − eA 0 mc 2
e manter na expansão
c2 E (NR) − eA 0
≈ 1 1−
E − eA 0 mc 2 2m 2mc 2
termos até a ordem de v/c 2 , uma vez que para problemas eletrostáticos A 0 ≠ 0 e A 0.
Então, no limite não-relativístico da equação de Dirac, devemos resolver a equação para A , dada por
E (NR) − eA 0 A p 1 1 − E (NR) − eA 0
p A
2m 2mc 2
Condição de normalização
Devido à interpretação probabilística da equação de Dirac, onde definimos a densidade de probabilidade como
̄ 4 † , então
P
† d3x †A A †B B d 3 x 1
p2c2
†A 1
4m 2 c 4
A d3x
1
Nova função de onda Isto sugere que podemos adotar uma nova função de onda de duas componentes
definida como
A
onde é obtido com a ajuda da normalização
E (NR) − eA 0
p 1 1 − p A E (NR) − eA 0 A
2m 2mc 2
E (NR) − eA 0
p 1 1 − p eA 0 A E (NR) A
2m 2mc 2
E (NR) − eA 0
p 1 1 − p eA 0 −1 E (NR) −1
2m 2mc 2
Agora queremos transformar esta equação numa equação de Schrödinger independente do tempo; para isto
precisamos isolar a energia não-relativística, E (NR) , no lado direito da equação.
−1 p 1 1 − E (NR) − eA 0
p eA 0 −1 −1 E (NR) −1
2m 2mc 2
onde −1 como antes vale
p2c2
−1 1− .
8m 2 c 4
Portanto,
p2 E (NR) − eA 0 p2
1− p 1 1 − p eA 0 1−
8m 2 c 2 2m 2mc 2 8m 2 c 2
p2 p2
1− E (NR) 1 −
8m 2 c 2 8m 2 c 2
p2 p4 p2 e pA 0 p p2 p2
eA 0 − − E (NR) − eA 0 − eA 0
2m 3
8m c 2 2
4m c 2 4m c 2 2 2
8m c 2 8m 2 c 2
p2
E (NR) − E (NR)
4m 2 c 2
Agora precisamos calcular os termos que contêm o operador momento atuando sobre A 0 e a função de onda. Seja
iE p − E p A 0 p 2
e
p 2 A 0 p pA 0 − 2 ∇ ∇A 0
− 2 ∇ ∇A 0 A 0 ∇
− 2 ∇ ∇A 0 ∇A 0 ∇ A 0 ∇ ∇ ∇A 0 ∇
2 ∇ E 2 2 E ∇ − A 0 2 ∇ 2
2 ∇ E 2i E p A 0 p 2
p 2 A 0 2 ∇ E 2i E p A 0 p 2
e 2 ∇ E 2i E p A 0 p 2
eA 0 2
− − p E (NR)
8m 2 c 2 8m 2 c 2
Ordenando os termos
p2 p4 ieE p e E p eA 0 p 2
eA 0 − − −
2m 8m 3 c 2 4m 2 c 2 4m 2 c 2 4m 2 c 2
e 2 ∇ E ie E p eA 0 p 2
− − − E (NR)
8m 2 c 2 2
4m c 2 4m 2 c 2
encontra-se, finalmente,
p2 p4 e E p e 2
eA 0 − − − ∇ E E (NR)
2m 8m 3 c 2 4m 2 c 2 8m 2 c 2
que é a equação de Schrödinger para a função de onda de duas componentes obtida da equação de Dirac.
O primeiro e segundo termos são as energias cinética e potencial para um átomo de hidrogênio não perturbado.
O terceiro termo é devio à correção relativística da energia cinética, obtida da expansão
p 2 c 2 1/2 p2 1/2
p 2 c 2 m 2 c 4 mc 2 1 2 4
mc 2 1 2 2
m c m c
p 2 p 4 p2 p4
≈ mc 2 1 − − mc 2
2m c2 2 4
8m c 4 2m 8m 3 c 2
Em relação à origem das energias não-relativísticas
p2 p4
p 2 c 2 m 2 c 4 − mc 2 ≈ −
2m 8m 3 c 2
vemos que o terceiro termo é uma correção à energia cinética.
O quarto termo representa a interação spin-órbita, incluindo o efeito da precessão do spin do elétron (precessão de
Thomas). Para um potencial central,
eA 0 Vr E −∇A 0 − 1e xr ∂V
∂r
− e E p 1 ∂V x p
4m 2 c 2 4m 2 c 2 r ∂r
1 ∂V L 1 1 ∂V L S
4m 2 c 2 r ∂r 2m 2 c 2 r ∂r
onde S /2. Portanto, a bem conhecida interação spin-órbita é um consequência natural da equação de Dirac.
O quinto termo é chamado de termo de Darwin,
e 2
HD − ∇E
8m 2 c 2
Para calcularmos a contribuição deste termo para o átomo de hidrogênio, devemos lembrar que ∇ E e que,
para o átomo de hidrogênio, −e 3 x. Então
e22
HD 3 x
8m 2 c 2
e que, portanto, só os estados s são afetados, uma vez que Sch 0 ≠ 0 para esses estados.
p4 e E p e 2
V− − − ∇E
8m 3 c 2 4m 2 c 2 8m 2 c 2
e usando a teoria de perturbação de primeira ordem independente do tempo, encontra-se a correção relativística
para os níveis de energia do átomo de hidrogênio vale
2
ΔE − e2 e2 1 1 − 3
4c 8a 0 n2 j 12 4n
∂ mc 0 ∂ − mc
∂x ∂x
∂ ∂ mc 0
∂x ∂x
∂ ∂ mc ∂ 0
∂x ∂x ∂x
∂ ∂ mc − mc 0
∂x ∂x
2 2
∂ ∂ − mc 0, ∂ ∂ − mc 0
∂x ∂x ∂x ∂x
2 2
∂ ∂ − mc ∂ ∂ − mc 0
∂x ∂x ∂x ∂x
2
∂ ∂ − 2 mc
∂x ∂x
ou
2 2
∂2 − mc 0 − mc 0
∂x 2
Observe que, uma vez que eliminamos as matrizes , estas equações são na verdade quatro equações
desacopladas, isto é,
1 1
2 mc 2 2
− 0
3 3
4 4
Devido a esta propriedade, a equação de Dirac admite solução para uma partícula livre do tipo
p x, t up e ipx−Et/
onde up é um spinor de quatro componentes independente de x e t.
Substituindo esta solução na equação de K-G, encontra-se
2
− mc 0
2
∇ 2 − 12 ∂ 2 −
2 mc
0
c ∂t
p2 2 2
− 2 E2 2 − mc 0
c
E2 p2 m2c2
c2
E p2c2 m2c4
2
ou
E p2c2 m2c4
Então, da mesma forma que a equação de K-G, a equação de Dirac também admite soluções com energias
negativas.
Até agora não sabemos muito sobre as componentes do spinor de Dirac . Neste sentido, é muito instrutivo estudar
a partícula livre em repouso, isto é, aquela para a qual p 0.
∂ mc 0 0 4 ∂ mc 0 0
∂x ∂x 4
de onde se obtém
4 ∂ mc 0 − ci 4 ∂ mc u0 e −iEt/ 0
∂ict ∂t
− 4 E mc u0 0 E 4 u0 mc u0
c
c
u0 E 4 u0
mc 2
u A 0
0 u0e −iEt/ e −iEt/
u B 0
u A 0
u0
u B 0
Neste caso,
mc
Como 4 é a matriz
I 0
4
0 −I
então
u A 0 a1
u0 , onde u A 0
0 a2
a1
a2
u0
0
0
Ou seja, para energia positiva o spinor de Dirac só tem as duas componentes superiores diferentes de zero, sendo
as demais nulas.
Assim,
0 b1
u0 , u B 0
u B 0 b2
ou
0
0
u0
b1
b2
Como na teoria de Pauli, temos a liberdade de escolher independentemente cada componente do spinor não-nulo.
Assim, no caso de u B 0 0, podemos escolher as componentes do spinor u A 0 para designar, por exemplo, os
estados de spin para cima e de spin para baixo da partícula em repouso em relação a algum eixo de quantização
(base). Ou seja,
1 1 2 0
u A 0 , u A 0 .
0 1
1 0
0 1
u 1 0 , u 2 0
0 0
0 0
1 1 2 0
u B 0 , u B 0 ,
0 1
0 0
0 0
u 3 0 , u 4 0
1 0
0 1
Assim, existem quatro soluções independentes da equação de Dirac para uma partícula em repouso, dadas por
1 0
0 1
1 e −iEt/ , 2 e −iEt/ (energia positiva)
0 0
0 0
0 0
0 0
3 e iEt/ , 4 e iEt/ (energia negativa)
1 0
0 1
1 1 0 1 1
3 u A 0
0 −1 0 0
2
enquanto u A
1 1 0 0 1
3 u A 0 −
0 −1 1 0
Matriz 3 As matrizes k k 1, 2, 3 são análogas às matrizes de Pauli k , na teoria de Dirac. Assim, usando
esta analogia vamos definir
1 , 2 0 2i 3 0
1 1
2 0 1 , 2 2 0 2i 3
ou seja,
3 0
3 ,
0 3
cujo autovalor deve ser interpretado como a componente do spin em unidades de /2.
Como podemos ver facilmente, as soluções 1 , … , 4 são autofunções de 3 ,
1 0 0 0 1 1
0 −1 0 0 0 0
31 e −iEt/ e −iEt/
0 0 1 0 0 0
0 0 0 −1 0 0
1 0 0 0 0 0
0 −1 0 0 1 1
32 e −iEt/ − e −iEt/
0 0 1 0 0 0
0 0 0 −1 0 0
1 0 0 0 0 0
0 −1 0 0 0 0
33 e −iEt/ e −iEt/
0 0 1 0 1 1
0 0 0 −1 0 0
1 0 0 0 0 0
0 −1 0 0 0 0
34 e −iEt/ − e −iEt/
0 0 1 0 0 0
0 0 0 −1 1 1
Então, de acordo com essas equações, 1 e 3 estão relacionadas com a projeção do spin na direção positiva do
eixo-z (spin para cima), uma vez que são autofunções de 3 com autovalor 1; 2 e 4 são autofunções com
autovalor −1 e, portanto, estão relacionadas com a projeção de spin para baixo.
Isto significa que, para cada sinal da energia, existem duas soluções independentes correspondentes aos dois
1 2 3 4
estados de spin ↑ e ↓ com E 0; ↑ e ↓ com E 0 , como esperado da natureza do spin 1/2 das
partículas descritas pela equação de Dirac.
Como vimos, cada componente desta equação satisfaz uma equação de Klein-Gordon, de maneira que a equação
de Dirac admite solução do tipo
up e ipx−Et/ up e ip x /
onde p p, iE
c , x x, ict.
Assim, substituindo de volta na equação de Dirac, encontra-se
∂ mc up e ip x / 0
∂x
ip
mc up e ip x / 0
ou
i p mc up 0
que pode ser separada na parte espacial e temporal p 4 iE/c
i k p k i 4 p 4 mc up 0 i kpk − E
c 4 mc up 0
Mas, como
0 −i k I 0
k , 4
i k 0 0 −I
então
0 −i k I 0 E I 0
i pk − c mc up 0
i k 0 0 −I 0 I
0 kpk E 0 mc 2 0
− 1c 1c up 0
− k p k 0 0 −E 0 mc 2
0 cp −E 0 mc 2 0
up 0
−cp 0 0 E 0 mc 2
de onde resulta
−E mc 2 cp
up 0
−c p E mc 2
0 1 0 −i 1 0
1 , 2 , 3
1 0 i 0 0 −1
então
0 p1 0 −ip 2 p3 0 p3 p 1 − ip 2
p
p1 0 ip 2 0 0 −p 3 p 1 ip 2 −p 3
logo
−E mc 2 0 cp 3 cp 1 − icp 2
0 −E mc 2 cp 1 icp 2 −cp 3
up 0
−p 3 c −cp 1 icp 2 E mc 2 0
−cp 1 − icp 2 cp 3 0 E mc 2
onde
a1
u A p a2
up
u B p b1
b2
Esta equação admite quatro soluções, uma para cada componente do spinor de Dirac.
1 1 2 0
u A 0 e u A 0
0 1
correspondiam a soluções com energias positivas. Em termos do spinor de Dirac, u A 0 representa as duas
primeiras componentes de u0.
Podemos tentar a mesma coisa aqui com
1 0
0 1
u 1 p N e u 2 p N
b1 b1
b2 b2
−E mc 2 0 cp 3 cp 1 − icp 2 1
0 −E mc 2 cp 1 icp 2 −cp 3 0
0
−p 3 c −cp 1 icp 2 E mc 2 0 b1
−cp 1 − icp 2 cp 3 0 E mc 2 b2
−E mc 2 cp 3 b 1 cp 1 − ip 2 b 2
cp 1 ip 2 b 1 − cp 3 b 2
0
−cp 3 E mc 2 b 1
−cp 1 − icp 2 E mc 2 b 2
encontra-se
cp 3 cp 1 ip 2
b1 e b2
E mc 2 E mc 2
−E 2 m 2 c 4 c 2 p 2
−E mc 2 cp 3 b 1 cp 1 − ip 2 b 2
E mc 2
cp 1 ip 2 b 1 − cp 3 b 2
0 0
0
0
0
0
−E 2 m 2 c 4 c 2 p 2 −p 2 c 2 m 2 c 4 m 2 c 4 c 2 p 2
Mas, o termo ≡ 0, ou seja, se anula identicamente, o que garante
E mc 2 E mc 2
a solução.
Spinor u 1 Assim, subtituindo b 1 e b 2 no spinor u 1 encontra-se
1
0
u 1 p N p3c
E mc 2
p 1 ip 2 c
E mc 2
Spinor u 2 Podemos fazer a mesma coisa para o spinor u 2 , partindo da equação,
−E mc 2 0 cp 3 cp 1 − icp 2 0
0 −E mc 2 cp 1 icp 2 −cp 3 1
0
−p 3 c −cp 1 icp 2 E mc 2 0 b1
−cp 1 − icp 2 cp 3 0 E mc 2 b2
para encontrar
cp 3 b 1 cp 1 − ip 2 b 2
−E mc 2 cp 1 ip 2 b 1 − cp 3 b 2
0
−cp 1 ip 2 E mc 2 b 1
cp 3 E mc 2 b 2
0
1
u 2 p N p 1 ip 2 c
E mc 2
− p3c
E mc 2
a1 a1
a2 a2
u 3 p N e u 4 p N
1 0
0 1
−E mc 2 0 cp 3 cp 1 − icp 2 a1
0 −E mc 2 cp 1 icp 2 −cp 3 a2
0
−p 3 c −cp 1 icp 2 E mc 2 0 1
−cp 1 − icp 2 cp 3 0 E mc 2 0
ou
−E mc 2 a 1 cp 3
−E mc 2 a 2 cp 1 ip 2
0
−cp 3 a 1 − cp 1 − ip 2 a 2 E mc 2
−cp 1 ip 2 a 1 cp 3 a 2
−E mc 2 0 cp 3 cp 1 − icp 2 a1
0 −E mc 2 cp 1 icp 2 −cp 3 a2
0
−p 3 c −cp 1 icp 2 E mc 2 0 0
−cp 1 − icp 2 cp 3 0 E mc 2 1
ou
−E mc 2 a 1 cp 1 − ip 2
−E mc 2 a 2 − cp 3
0
−cp 3 a 1 − cp 1 − ip 2 a 2
−cp 1 ip 2 a 1 cp 3 a 2 E mc 2
de onde se obtém
p 1 − ip 2 c p3c
a1 − , a2
|E| mc 2 |E| mc 2
Logo,
Desta maneira, encontramos as quatro soluções de ondas planas r x, t u r pe ipx−Et/ r 1, 2, 3, 4, que
podem ser escritas explicitamente como
1 0
0 1
1 N p3c e ipx−Et/ , 2 N p 1 ip 2 c e ipx−Et/
E mc 2 E mc 2
p 1 ip 2 c − p3c
E mc 2 E mc 2
−p 3 c p 1 − ip 2 c
|E| mc 2 −
|E| mc 2
−p 1 ip 2 c p3c
3 N |E| mc 2 e ipx|E|t/ , 4 N |E| mc 2 e ipx|E|t/
1 0
0 1
Podemos mostrar facilmente que os spinores u r p, com r 1, … , 4, são ortogonais entre si:
′
u r† u r 0 para r ≠ r ′
Observação: Esta condição, que diz que u † u transforma-se tal como a componente zero de um quadrivetor, será
adotada neste curso. Uma outra condição também encontrada na literatura é u † u 1.
Daquela condição, encontra-se
|E|
2 2
|p| c |E| mc 2
1 2
N2 N
|E| mc 2 mc 2 |p| 2 c 2
1 2
|E| mc 2
ou
e, finalmente,
|E| mc 2
N
2mc 2
Queremos que a normalização do spinor, , corresponda a uma partícula por unidade de volume. Assim,
escrevendo o spinor como
r N V u r p e ipx−Et/
então a condição de normalização implica que
ou
|E|
|N V | 2 V1
mc 2
Logo,
NV mc 2
|E| V
e, portanto,
mc 2 up e ipx−Et/
|E| V
Com a ajuda da ortogonalidade dos u r e das funções de onda plana, podemos mostrar facilmente que
V r
′
† r ′
p x, t p x, t d x p − p rr .
3 ′
′
As soluções de ondas planas para uma partícula livre são dadas por
−p 3 c p 1 − ip 2 c
|E| mc 2 −
|E| mc 2
|E| mc 2 −p 1 ip 2 c |E| mc 2 p3c
u 3 p |E| mc 2 , u 4 p |E| mc 2
2mc 2 2mc 2
1 0
0 1
Quando V → , os valores permitidos da energia formam um espectro contínuo. Para soluções de energias
positivas, mc 2 ≤ E , enquanto que para soluções de energias negativas, − E ≤ −mc 2 (cf. figura).
Energias
permitidas E > 0
E = mc2
Energias
E =0 proibidas
E = −mc 2
Energias
permitidas E < 0
Observações finais
Para uma partícula em repouso p 0, vimos que as quatro soluções são auto-spinores da matriz 4 4
z 0
z .
0 z
Em geral, as soluções para a partícula livre com p ≠ 0 não são auto-spinores da matriz z como pode ser verificado
facilmente:
1 1
1 0 0 0
0 0
0 −1 0 0 p3c p3c
z u 1 p etc.
0 0 1 0 E mc 2 E mc 2
0 0 0 −1 p 1 ip 2 c p 1 ip 2 c
−
E mc 2 E mc 2
Mas, existe um caso em que estas soluções u r p r 1, … , r são auto-spinores de z , que corresponde à
situação em que o momento da partícula está na direação-z, tal que p 1 p 2 0. De fato, para u r u r 0, 0, p z ,
1 ou 3 1 ou 3 2 ou 4 2 ou 4
zu u , zu −u
ou seja, u 1 e u 3 são auto-spinores com autovalores 1, enquanto que u 2 e u 4 são auto-spinores com
autovalores −1.
De uma maneira geral, podemos sempre escolher as soluções de ondas planas como sendo autofunções
simultâneas do operador momento, p, e do operador helicidade definido como
Como vimos, a teoria de Klein-Gordon não era consistente com uma densidade de probabilidade positiva-definida
para energias negativas.
O objetivo de Dirac era justamente encontrar uma teoria relativística para os elétrons que não resultasse numa
densidade de probabilidade negativa, embora as soluções com energias negativas ainda estejam presentes.
Para entender melhor estas soluções com energias negativas, vamos calcular as densidades de fluxo e de
probabilidade para uma partícula livre.
De acordo com as definições,
s k c † k , P †
onde
0 k
k
k 0
ou
0 0 0 1 0 0 0 −i 0 0 1 0
0 0 1 0 0 0 i 0 0 0 0 −1
1 , 2 , 3 .
0 1 0 0 0 −i 0 0 1 0 0 0
1 0 0 0 i 0 0 0 0 −1 0 0
Vamos calcular explicitamente s para a solução com energia positiva, 1 , e com energia negativa, 3 .
1
0
|E| mc 2 p3c
1 x, t e ipx−Et/
2|E| V E mc 2
p 1 ip 2 c
E mc 2
Da normalização,
P 1 1† 1 1 0
V
1 |E| mc 2
s2 c 1† 2 1 c
2|E| V
1
0 0 0 −i
0
p3c p 1 − ip 2 c 0 0 i 0 p3c
1 0
E mc 2 E mc 2 0 −i 0 0 E mc 2
i 0 0 0 p 1 ip 2 c
E mc 2
|E| mc 2 p2 c2p2
c 2c
2|E| V E mc 2
|E| V
e
1 |E| mc 2
s3 c 1† 3 1 c
2|E| V
1
0 0 1 0
0
p3c p 1 − ip 2 c 0 0 0 −1 p3c
1 0
E mc 2 E mc 2 1 0 0 0 E mc 2
0 −1 0 0 p 1 ip 2 c
E mc 2
|E| mc 2 p3 c2p3
c 2c
2|E| V E mc 2 |E| V
Ou seja,
c2p
s 1
|E| V
e, portanto,
1 c 2 p ic
s s 1 , icP 1 ,
|E| V V
Da normalização
3 |E| mc 2
s2 c 3† 2 3 c
2|E| V
−p 3 c
0 0 0 −i |E| mc 2
−p 1 ip 2 c
p3c p 1 − ip 2 c 0 0 i 0
− − 1 0 |E| mc 2
|E| mc 2 |E| mc 2 0 −i 0 0
1
i 0 0 0
0
3 |E| mc 2
s3 c 3† 3 3 c
2|E| V
−p 3 c
0 0 1 0 |E| mc 2
0 −1 −p 1 ip 2 c
p3c p 1 − ip 2 c 0 0
− − 1 0 |E| mc 2
|E| mc 2 |E| mc 2 1 0 0 0
1
0 −1 0 0
0
e, portanto
−c 2 p
s 3
|E|V
Logo,
3 −c 2 p ic
s s 3 , icP 3 ,
|E|V V
Observe que, para energias negativas, a densidade de probabilidade é positiva, mas a densidade de fluxo tem
direção oposta à direção do movimento da partícula, p̂ .
Mais adiante discutiremos melhor o significado das soluções com energias negativas.
x2 x 4′
x 2′ x4
x1′
v
ω
x1
S
x1 S′ x1′
(a) (b)
Agora vamos considerar uma transformação de Lorentz ao longo da direção x 1 para um sistema S ′ que se move com
velocidade v c em relação ao sistem S (cf. figura (b)).
Então, as coordenadas de um ponto medidas nos dois sistemas, x, ix 0 e x ′ , ix ′0 , de acordo com a teoria da
relatividade, estão relacionadas por:
x1 x 0 x 1 x0
x ′1 − , x ′0 −
1 − 2 1 − 2 1 − 2 1 − 2
Observe que estas relações são formalmente idênticas a uma rotação no plano 1 − 4, se identificarmos
1 i
cos , sen tg i
1 − 2 1 − 2
Mas, como é real, a relação tg i só será satisfeita para um ângulo de rotação imaginário puro, ou seja,
i, sendo um número real. De fato, como
tg tgi i tgh ,
então,
i tgh i tgh
Conclusão: a transformação de Lorentz ao longo do eixo x 1 pode ser visualizada como uma rotação no plano 1 − 4,
no espaço de Minkowski, por um ângulo imaginário puro i.
Tanto a rotação espacial como a transformação de Lorentz podem ser representadas concisamente por
x ′ a x
De agora em diante, o termo transformação de Lorentz será usado indistintamente tanto para indicar uma rotação
(tridimensional) pura, quanto uma transformação de Lorentz “pura”.
Então, nos dois casos analisados, as matrizes de transformação a são facilmente identificadas como:
cos sen 0 0
(rot) − sen cos 0 0
a
0 0 1 0
0 0 0 1
cosh 0 0 i senh
(Lor) 0 1 0 0
a
0 0 1 0
−i senh 0 0 cosh
Como a são matrizes relacionadas com as transformações de Lorentz das coordenadas e S, dos spinores, então
a e S atuam em espaços completamente diferentes, de maneira que podemos escrever a última equação como
S −1 S a ∂ x mc x 0
∂x
∂ x mc x 0
∂x
concluímos que aquela é equivalente a esta se a matriz S satisfaz a relação
S −1 S a
Então, o problema de demonstrar a covariância relativística da equação de Dirac fica agora reduzido a encontrar
uma matriz S que satisfaz
S −1 S a
uA
u
uB
u ′A cos i 3 sen
2 2
é o spinor no sistema S ′ .
Lembrando que, na teoria de Dirac, a matriz de quatro componentes correspondente a 3 é
− 21 12
3 1 1 , 2 1 2 1 2 −i 1 2 ,
2i 2i 2i
onde usamos , 2 .
Logo, fazendo uma analogia com a teoria de Pauli, vamos definir a matriz S 4 4 como
S rot cos i 3 sen cos 1 2 sen
2 2 2 2
Mas,
Para 1, temos
1 cos 2 1 1 2 cos sen − 1 2 1 sen cos − 1 2 1 1 2 sen 2 a 1
2 2 2 2 2 2
1 cos 2 21 2 cos sen 21 2 sen cos − 1 2 21 2 sen 2 a 1
2 2 2 2 2 2
1 cos 2 2 cos sen 2 sen cos − 1 22 sen 2 a 1
2 2 2 2 2 2
1 cos 2 2 cos sen 2 sen cos − 1 sen 2 a 1
2 2 2 2 2 2
1 cos 2 − sen 2 2 2 sen cos a 1
2 2 2 2
1 cos 2 sen a 1
ou seja,
1 cos 2 sen 1 a 11 2 a 12 3 a 13 4 a 14
Mas, como vimos,
cos sen 0 0
(rot) − sen cos 0 0
a
0 0 1 0
0 0 0 1
Já vimos que uma transformação de Lorentz “pura” corresponde a uma rotação no plano 1 − 4 por um ângulo
imaginário i. Então, a matriz S Lor para uma transformação de Lorentz “pura” é obtida da matriz S rot fazendo → i
e 2 → 4 . Logo,
S Lor cosh i 1 4 senh
2 2
e
S −1
Lor
cosh − i 1 4 senh
2 2
Neste caso,
Para 1, temos
1 cosh 2 i 21 4 cosh senh − i 1 4 1 senh cosh 1 4 21 4 senh 2 a 1
2 2 2 2 2 2
2 2
1 cosh i 4 cosh senh i 1 1 4 senh cosh 1 4 senh
2
a 1
2 2 2 2 2 2
2 2
1 cosh i 4 cosh senh i 4 senh cosh 1 senh a 1
2 2 2 2 2 2
2 2
1 cosh senh 2i 4 cosh senh a 1
2 2 2 2
1 i 4 senh a 1
(Lor) (Lor) (Lor) (Lor)
Mas, como a 11 cosh , a 12 a 13 0 e a 14 i senh , então
a 1 1 a 11 2 a 12 3 a 13 4 a 14 1 cosh i 4 senh
que concorda identicamente. As demais relações são facilmente verificadas.
Até agora estabelecemos a covariância da equação de Dirac sob uma rotação pura no plano 1 − 2 e uma
transformação de Lorentz ao longo do eixo x 1 .
Em geral, a matriz S, que relaciona ′ S, é dada por
S rot cos i ij sen , i, j, k cíclico
k
2 2
para uma rotação em torno do eixo k por um ângulo , e
k
S Lor cosh − k4 senh , onde tgh
2 2
para uma transformação de Lorentz ao longo do eixo k.
Nestas equações, introduzimos novas matrizes 4 4, , definidas como
− − −
1 , −i , ≠ .
2i 2i 2i
Escrevendo explicitamente,
k 0
ij 1 i , j −i i j i j i − ji ≡ k , i, j, k cíclico
2i 0 k
0 k
k4 1 k , 4 −i k 4 i 4 k − 4k ≡ k
2i k 0
Inversão espacial
Vamos estudar o efeito da inversão espacial (ou operação de paridade) sobre o spinor de Dirac e mostrar que a
teoria de Dirac é covariante sob inversão espacial.
Seja então a transformação
x ′ → −x, e t ′ → t ou x ′k → −x k , e x ′4 → x 4
∂′ ′ x ′ mc ′ x ′ 0
∂x
− k ∂ 4 ∂ S P x mc S P x 0
∂x k ∂x 4
S −1 ∂ ∂ S P x mc x 0
P − k 4
∂x k ∂x 4
−S −1 ∂ S −1 S P ∂ x mc x 0
P kSP P 4
∂x k ∂x 4
∂ x mc x 0
∂x
se S P satisfaz as relações
S −1
P k S P − k e S −1
P 4SP 4.
Em outras palavras, S P deve comutar com 4 e anticomutar com k . A matriz 4 já tem esta propriedade, de maneira
que podemos escolher S P como sendo
−1
S P 4 , S −1
P 4 4
Como
1 0 0 0 a ′1 a1
0 1 0 0 a ′2 a2
4 , ′ x ′ e x
0 0 −1 0 b ′1 b1
0 0 0 −1 b ′2 b2
então
a ′1 1 0 0 0 a1 a1
a ′2 0 1 0 0 a2 a2
b ′1 0 0 −1 0 b1 −b 1
b ′2 0 0 0 −1 b2 −b 2
ou seja, quando fazemos uma inversão espacial, a primeira e segunda componentes do spinor não se alteram,
Exemplos simples
Vamos aprender melhor o significado físico das transformações S rot , S Lor e S P através de alguns exemplos simples.
Vamos considerar o caso de rotações infinitesimais no espaço tridimensional, por um ângulo . Assim, de
S rot cos i 3 sen
2 2
e
x ′1 x 1 cos x 2 sen , x ′2 −x 1 sen x 2 cos .
podemos escrever para → 0 sen → , cos → 1
S rot 1 i 3
2
e
x ′1 x 1 x 2 x 1 x ′1 − x 1 x 2
x ′2 −x 1 x 2 x 2 x ′2 − x 2 −x 1
Mas, o operador
x1 ∂ − x2 ∂ x1∇2 − x2∇2 L3
i ∂x 2 i ∂x 1
representa a terceira componente do momento angular.
Então podemos escrever
J 3 3 L 3
2
e
S 1 i J 3
Portanto, vemos que a mudança na forma funcional → ′ , induzida pela rotação infinitesimal, consiste em duas
partes: (i) o operador independente do espaço-tempo i 3 /2 atuando sobre x e (ii) o familiar operador iL 3 /
afetando a parte espacial da função de onda.
A soma dos efeitos destes dois operadores é identificada com a terceira componente do momento angular total, J 3 ,
que é o gerador de uma rotação em torno do eixo 3.
Considere a situação de um elétron livre de energia positiva, E, com helicidade 1 e momento p ao longo da direção
3, em relação ao sistema S. Da relação
mc 2 p c
E Mc 2 p 23 c 2 m 2 c 4 vc 3
1− 2 E
Agora vamos escolher S ′ de maneira que o elétron esteja em repouso neste sistema de coordenadas, isto é, p ′ 0.
p c
Neste caso, o sistema S ′ deve se mover em relação ao sistema S com uma velocidade vc 3 (cf. figura).
E
v p3c
=
c E
direção
do spin x3′
x3
Agora, de acordo com as soluções que encontramos para o caso de uma partícula em repouso, a função de onda do
elétron com helicidade 1 e energia positiva pode ser escrita como
1
2 t ′ / 1 0 2 t ′ /
′ x ′ u ′1 p ′ 0 e −imc e −imc
V′ 0
0
Qual é a função de onda que representa a mesma situação física no sistema S? De acordo com o que aprendemos
′ x ′ S Lor x x S −1 ′ x ′ 1 S −1 u 1 ′ e −imc 2 t/ 1 u 1 e −imc 2 t/
Lor
V Lor V
Das identidades
cosh 2 − senh 2 1, cosh cosh 2 senh 2 , senh 2 senh cosh
2 2 2 2
encontramos
cosh 1
cosh 2 cosh 2 − 1 cosh
2 2 2
senh
senh 2 senh cosh senh 1
2 2 2 2 cosh
2
Substituindo os valores
E 1
mc 2 E mc
2
cosh
2 2 2mc 2
p3
1 mc p3 p3c
senh
2 2 E mc 2 2mE mc 2 2mc 2 E mc 2
2mc 2
Portanto, como
S −1
Lor
cosh/2 − i 3 4 senh/2
0 −i 3 I 0
3 , 4 ,
i 3 0 0 −I
0 −i 3 I 0 0 i 3
34
i 3 0 0 −I i 3 0
então,
I 0 0 3 cosh/2 3 senh/2
S −1
Lor
cosh/2 senh/2
0 I 3 0 3 senh/2 cosh/2
ou
E mc 2 0
p3c
0
2mc 2 2mc 2 E mc 2
0 E mc 2 0 −
p3c
2mc 2 2mc 2 E mc 2
p3c
0 E mc 2 0
2mc 2 E mc 2 2mc 2
0 −
p3c
0 E mc 2
2mc 2 E mc 2 2mc 2
Assim,
u 1 S −1
Lor
u ′1
u 1
E mc 2 0
p3c
0
2mc 2 2mc 2 E mc 2
0 E mc 2 0 −
p3c
2mc 2 2mc 2 E mc 2
p3c
0 E mc 2 0
2mc 2 E mc 2 2mc 2
0 −
p3c
0 E mc 2
2mc 2 E mc 2 2mc 2
1
E mc 2
2mc 2 1
0 0
0 E mc 2
p3c p3c
2mc 2
0 E mc 2
2mc 2 E mc 2
0
0
0
Este resultado,
1
0
u 1 0, 0, p 3 E mc 2 p3c ,
2mc 2
E mc 2
0
é exatamente o mesmo que encontramos resolvendo diretamente a equação de Dirac para p 0, 0, p 3 .
Para a dependência temporal da função de onda, temos
E t − p3x3
mc 2 mc 2
e, portanto,
E p3x3
− imc 2 t ′ −imc 2 t− ip 3 x 3 − Et ip x − Et
mc 2 mc 2
2t′
e −imc e ipx−Et
Logo,
x S −1 ′ x ′ S −1 u ′1 0 ′ e −imc
2 t ′ /
1 u 1 pe ipx−Et/
Lor Lor
V′
p3c 2 E 2 − p 23 c 2 m2c4 mc 2
V V′ 1 − 2 V′ 1 − V′ V′ V′
E E2 E2 E
Ou
V′ E V
mc 2
Finalmente, encontramos
Em resumo vimos que, conhecendo a função de onda para a partícula em repouso, podemos construir a função de
onda para a partícula em movimento com um dado momento não-nulo, aplicando S −1
Lor
sobre aquela função de onda.
Esta operação é conhecida como boost de Lorentz.
̄ † 4 , então
Como ̄ transforma-se de acordo com
†
̄ ′ x ′ ′ x ′ 4 Sx † 4 † xS † 4
S −1
rot
cos − i i j sen , S †rot cos − i i j sen
2 2 2 2
−1 †
S Lor cosh k 4 senh , S Lor cosh − k 4 senh
2 2 2 2
então
É claro que esta relação também vale para S P . De fato, como S P 4 , então
S †P 4 , S −1
P 4
4 S †P 4 4 4 4 4 S −1
P
Logo, para uma rotação pura, transformação de Lorentz pura ou inversão espacial (operação de paridade), a função
de onda adjunta transforma-se como:
†
̄ ′ x ′ ′ x ′ 4 Sx † 4 † xS † 4 † x 4 4 S † 4
† x 4 S −1
̄ x S −1
Transformação de
̄
Usando as propriedades acima, então
̄ ′ x ′ x ′
̄ x S −1 Sx
̄ xx
ou seja, a expressão
̄ xx é invariante por rotação pura, transformação de Lorentz pura e inversão espacial.
̄ é uma densidade escalar (cuidado! isto não vale para † ).
Então,
Transformação de
̄
Neste caso, temos
̄ ′ x ′ ′ x ′
̄ x S −1 Sx
S −1 S a
Para S rot e S Lor Portanto, sob rotação pura e transformação de Loretz pura,
̄ ′ x ′ ′ x ′
̄ x S −1 Sx a
̄ x x
k k
̄ x S −1
P S P x
̄ x 4 4 x
4 4
4k4 − 4 4 k
̄ x x
̄ x x
444 4
−
̄ x k x
̄ x 4 x
Então, a quantidade s
̄ transforma-se como um quadrivetor densidade, uma vez que suas componentes
transformam-se como um vetor de Lorentz sob inversão espacial (as componentes espaciais mudam de sinal e a
quarta componente fica inalterada).
Consequentemente, a densidade de fluxo e a densidade de probabilidade, definidas anteriormente, formam um
quadrivetor.
Transformação de
̄ para ≠
Para −i , para ≠ , temos
̄ ′ ′ −i
̄ ′ ′ i
̄ ′ ′ −
̄ ′ ′
é anti-simétrico nos índices e . Mas, sob rotação pura ou TL pura,
̄ ′ ′
̄ ′ −i ′ −i
̄ S −1 S S −1 S
a a
̄ −i
a a
̄
ou seja, transforma-se como um tensor de segunda ordem.
Por outro lado, sob inversão espacial ≠
̄ ′ ′
̄ S −1
̄ ′ −i ′ −i −1
P SP SP SP
k l k l
̄ S −1
−i P S P S −1
P S P −i
̄ 4 4 4 4
k 4 k 4
4k4 4l4 − k − l
−i
̄ −i
̄
4k4 444 − k 4
kl
̄ −i k l
̄ kl
−i
̄
− k 4 ̄ −i k 4
− ̄ k4
−
Portanto, a quantidade
̄ é um tensor densidade anti-simétrico de segunda ordem.
Γ 1, , −i ≠
Pseudo-vetores e pseudo-escalares
Para completar a lista dos 16 covariantes bilineares, precisamos ainda definir uma quantidade que se transforma
Propriedades da matriz 5
Logo,
5 , 5 5 5 5 5 2 25 2
o que implica
25 1.
0 −I
Forma explícita 5 . Seja,
−I 0
0 i 1 2 3
i 1 2 3 0
Logo,
0 i 1 2 3 0 ii 3 3 0 − 23
5
i 1 2 3 0 ii 3 3 0 − 23 I 0
0 −I
5
−I 0
Transformação de
̄ 5
onde
S Lor cosh − k 4 senh , S †Lor cosh − k 4 senh ,
2 2 2 2
k4 −i k 4 .
Então, como 5 , k4 0,
S −1 S
Lor 5 Lor
cosh − k 4 senh 5 cosh − k 4 senh
2 2 2 2
cosh − k 4 senh 5 cosh − 5 k 4 senh
2 2 2 2
cosh − k 4 senh 5 cosh − k 4 5 senh
2 2 2 2
cosh − k 4 senh cosh − k 4 senh 5
2 2 2 2
S −1 S
Lor Lor 5
5
Logo,
̄ S −1
̄ ′5′
S
Lor 5 Lor
̄ 5
̄ 5
Transformação de i
Mas, como 5 , 0 → 5 , S 0
S −1 S
Lor 5 Lor
5 S −1 S
Lor Lor
Mas,
S −1 −1 −1 −1 −1
P 5 S P S P 5 S P S P S P S P 5 SS P S P
S −1
P kSP
− 5
S −1
P 4SP
k − 5 k
− 5
− 4 54
Então
−
̄ i 5 k
̄ ′ i 5 ′
̄ 54
ou seja, a parte espacial inverte o sinal. Transformações deste tipo são características de vetores axiais ou
pseudo-vetores.
Γ A 1, , −i ≠ , i 5 , 5
Para nos certificar de que não existe nenhuma expressão bilinear linearmente independente daquelas que já
apresentamos, vamos analisar cada um dos produtos com três ou mais matrizes .
Seguindo a estrutura das quantidades Γ mostradas acima, vamos definir o produto de três matrizes .
Se os índices não forem todos diferentes, teremos por exemplo
Γ etc.
que corresponde a Γ e, portanto, não tem nada de novo.
Agora vamos considerar o caso em que as três matrizes têm todos os índices diferentes, isto é,
Γ com ≠ ≠ .
No caso de produtos de quatro matrizes , podemos analisar também dois casos: (1) os índices não são todos
diferentes; (2) os índices são todos diferentes.
No primeiro caso, podemos ter, por exemplo, um índice repetido, ou seja,
Γ , onde ou ou e ≠ ≠
Novamente, o produto de quatro matrizes com um ou mais índices repetidos não produz nada novo.
No caso de todos os índices diferentes, teremos
Γ , ≠ ≠ ≠
Γ sempre pode ser escrita na forma
Γ 1 2 3 4 5
Se tivermos apenas um índice repetido, este produto pode ser escrito como
Γ , ≠ ≠ ≠ etc
Assim, Γ pode sempre ser escrita como
Γ 5
que repete o caso de três matrizes.
Se tivermos dois índices repetidos, então
Γ , ≠ ≠ etc
Logo,
Γ −1 5
o que repete o caso do produto com três matrizes com índices diferentes.
Na tabela abaixo mostramos todas as expressões bilineares linearmente independentes que podemos formar com
as matrizes .
̄ kl
Tensor (2,a-sim)
̄ a a
̄ 6
̄ k4
−
̄ 5k
i
Vetor axial ̄ 5
i ̄ 5
a i 4
−
̄ 54
Pseudo-escalar
̄ 5
̄ 5 −
̄ 5 1
Nº total de matrizes 4 4 linearmente independentes 16
0 k I 0
k i 4 k , 4
k 0 0 −I
Esta forma de tratar o problema é conhecida como representação de Heisenberg, onde o vetor estado é
independente do tempo e o operador depende do tempo.
Por este motivo, vamos rever brevemente a conexão entre as representações de Schrödinger e Heisenberg.
Assim, devido à forma da equação de Schrödinger (ou de Dirac) a função de onda (não necessariamente uma
autofunção da energia) pode ser escrita como
x, t e −iHt/ x, 0
onde H é o operador Hamiltoniano.
Seja S um operador independente do tempo na representação de Schrödinger. O correspondente operador
H t na representação de Heisenberg é definido como
H t e iHt/ S e −iHt/
Constantes de movimento
Sabemos que um operador representa uma constante de movimento quando ele comuta com o Hamiltoniano.
Com a ajuda da equação de movimento de Heisenberg, vamos analisar as constantes de movimento para a
partícula livre.
Operador momento linear p Para a partícula livre, por exemplo, cujo Hamiltoniano é dado por
H c j p j mc 2
a equação de movimento para o momento é
dp k
H, p k c j p j mc 2 , p k 0
dt
Então, esta equação nos diz que podemos encontrar uma solução da equação de Dirac que seja simultaneamente
autofunção do Hamiltoniano e do momento, como realmente encontramos anteriormente.
Operador momento angular orbital L Um exemplo menos trivial é o momento angular L. Para a componente
L 1 temos
L1 x2p3 − x3p2
então
H, L 1 c j p j mc 2 , x 2 p 3 − x 3 p 2 c j p j , x 2 p 3 − x 3 p 2 mc 2 , x 2 p 3 − x 3 p 2
c j p j , x 2 p 3 − x 3 p 2 c j p j , x 2 p 3 − c j p j , x 3 p 2 c j p j , x 2 p 3 − c j p j , x 3 p 2
c j −i j2 p 3 − c j −i j3 p 2 −ic 2 p 3 ic 3 p 2
−ic 2 p 3 − 3 p 2
Portanto,
H, L H, x̂ 1 L 1 x̂ 2 L 2 x̂ 3 L 3 x̂ 1 H, L 1 x̂ 2 H, L 2 x̂ 3 H, L 3
−icx̂ 1 2 p 3 − 3 p 2 x̂ 2 3 p 1 − 1 p 3 x̂ 3 1 p 2 − 2 p 1
−ic p
Logo,
Como dL/dt ≠ 0, significa que, para uma partícula livre de Dirac, L não é uma constante de movimento, em contraste
com o correspondente operador na teoria de Schrödinger.
Operador momento angular de spin Neste caso, temos para a componente k ,
H, k c j p j mc 2 , k
c j p j , k mc 2 , k
cp j j , k
onde usamos , k 4 , i j 4 i j − i j 4 4 i j − 4 i j 0.
Mas, por definição
k 1 i , j 1 i j − j i 1 klm l m ,
2i 2i 2i
j i 4 j
então
ou
cp j j , k −ic − klm mj p j l klm jl p j m
−ic − klm l p m klm p l m ic p k − icp k
2ic p k
Portanto,
H, k cp l l , k 2ic p k
ou, em termos de vetores,
H, 2ic p
d − 2c p
dt
Então, o momento angular de spin, representado pelo operador , também não é uma constante de movimento.
Operador helicidade p O operador helicidade é definido por p, logo
H, p H, p H, p 0 2ic p p 0
que é uma constante de movimento, como já havíamos encontrado.
Operador momento angular total J Vamos considerar agora o momento angular total, definido por
Então, a equação de Dirac conserva o momento angular total, mas não conserva o momento angular orbital L, nem
o momento angular de spin .
2
Operador momento mecânico Na presença de A , o momento mecânico do elétron é definido como
p − ec A
Considerando que A não depende explicitamente do tempo, então a equação de movimento de Heisenberg para o
operador é:
d i H, ∂ i H, − e ∂A i H,
dt ∂t c ∂t
Mas,
i H, i c j j e A 0 mc 2 ,
k k ic j j , k ie A 0 , k i mc 2 , k
ic j j , k ie A 0 , k
e, portanto,
d k
i H, k ic j j , k ie A 0 , k
dt
∂
A 0 , p k −i A 0 ∂ − ∂ A 0 −i A0 − ∂ A 0
∂x k ∂x k ∂x k ∂x k
∂ ∂
−i A 0 − A0 − ∂A 0 ∂A
i 0
∂x k ∂x k ∂x k ∂x k
A 0 , p k i ∂A 0
∂x k
e
j, k p j − ec A j , p k − ec A k
p j , p k − ec p j , A k − ec A j , p k e 2
c A j , A k
− ec p j , A k − ec A j , p k
onde
p j , A k p j A k − A k p j −i ∂ A −A ∂ −i ∂ A − A ∂
∂x j k k
∂x j ∂x j k k
∂x j
∂A k ∂ ∂ ∂A k
−i Ak − Ak −i
∂x j ∂x j ∂x j ∂x j
Logo,
∂A k ∂A j
j, k − ec p j , A k − ec A j , p k ie
c −
∂x j ∂x k
ie ∂ ie
c ijk ∂x j A k c ijk ∇ A i
ie
c ijk B i .
Note que esta equação é similar à equação de operadores para a força de Lorentz, quando associamos o operador
c ao operador velocidade da partícula, embora isto deva ser feito com cuidado. Mais tarde, abordaremos este
assunto.
Operador helicidade num campo eletromagnético Agora vamos analisar a dependência temporal do
operador helicidade num campo eletromagnético.
Considerando que A não depende explicitamente do tempo, então
d
H,
dt
onde
H c e A 0 mc 2 c l l e A 0 mc 2
Mas,
kk
Logo,
H, c l l e A 0 mc 2 , k k
c l l , k k e A 0 , k k mc 2 , k k
c l k l , k e k A 0 , k
Mas,
∂A k
p l , A k p l A k − A k p l p l A k A k p l − A k p l
i ∂x l
∂A l
p k , A l
i ∂x k
uma vez que p é um operador diferencial. Portanto,
∂A k ∂A l ∂A k ∂A l
l, k − ec p l , A k ec p k , A l − e e ie
c −
ic ∂x l ic ∂x k ∂x l ∂x k
ie
c lkm ∇ A m
Também
∂A 0 i ∂A 0
A0, k A 0 , p k − ec A k A0, pk A0pk − pkA0 −
i ∂x k ∂x k
−iE k
Mas,
lkm l k B m lkm n nl k B m n nl lkm k B m
n nl B l
l B l
B
Então,
H, ie lkm l k B m − ie E ie B − ie E
Por outro lado, podemos escrever em função de . De fato, partindo das definições,
k 1 i , j −i i j , i, j, k 1, 2, 3, 2, 3, 1, 3, 1, 2
2i
l i 4 l −i l 4
vemos que, para 3 por exemplo, usando 1 2 2 −1, encontra-se
3 − 3 4 i 1 2 1 2 3 4 i 1 2 1 2 3 4 −−i 1 2 5 − 3 5 .
Assim,
H, ie B − ie E −ie 5 B − ie E
−ie E
Como
H, x k c j p j mc 2 , x k c j p j , x k mc 2 , x k
c j p j , x k c j −i jk −ic k
0 −I k 0 0 k
k − 5 k −
−I 0 0 k k 0
Então,
0 0 0 c
0 1 0 0 c 0
v 1 c 1 c
1 0 0 c 0 0
c 0 0 0
e, portanto,
0 0 0 c a a
0 0 c 0 b b
0 c 0 0 c c
c 0 0 0 d d
Logo,
− 0 0 c
0 − c 0
0 4 − 2c 2 2 c 4 0
0 c − 0
c 0 0 −
cuja solução é
Assim, se medirmos a componente da velocidade em qualquer direção, obteremos o valor c ou −c. Isto é um
resultado surpreendente, uma vez que na mecânica clássica relativística, uma partícula com massa não pode ter
velocidade igual c.
A velocidade não é uma constante de movimento Embora já se tenha demonstrado a constância do momento
p para a partícula livre, a velocidade v k não é uma constante de movimento. De fato,
dv k
H, v k cH, k cH k − k H 2 k H − 2 k H
dt
cH k k H − 2 k H cH, k − 2 k H
onde
H, k c j p j mc 2 , k cp j j , k cp j 2 jk 2cp k
Logo,
dv k
c H, k − 2 k H c 2cp k − 2 k H
dt
onde os termos com r 1, 2 são ondas planas com energias positivas, E |E|, e os termos com r 3, 4, com
energias negativas, E −|E|
〈v k V † x, t v k x, t
pkc2 p c2
∑∑ |c p,r | 2
|E|
− ∑ ∑ |c p,r | 2 k ∑ ∑
|E|
∑ mc 2
|E|
p r1,2 pr3,4 r1,2 p r ′ 3,4
′ ′
c ∗p,r ′ c p,r u r † p v k u r pe −2i|E|t/ c p,r ′ c ∗p,r u r† p v k u r pe −2i|E|t/
Os últimos dois termos, que contém misturas de estados com energias positivas e negativas representam uma
superposição com frequência de oscilação extremamente altas, conhecida como zitterbewegung (literalmente
movimento agitado).
O valor esperado da posição tem também um comportamento similar.