Vous êtes sur la page 1sur 63

Métodos Variacionais

Prof. Dr. Ricardo L. Viana


Departamento de Fı́sica
Universidade Federal do Paraná
Curitiba - PR

14 de maio de 2010
2
Sumário

1 Equação de Euler 5
1.1 Uma variável independente e uma dependente . . . . . . . . . . . 5
1.1.1 Parâmetro variacional . . . . . . . . . . . . . . . . . . . . 5
1.1.2 Dedução da equação de Euler . . . . . . . . . . . . . . . . 6
1.1.3 Identidade de Beltrami . . . . . . . . . . . . . . . . . . . . 8
1.2 Aplicações da equação de Euler . . . . . . . . . . . . . . . . . . . 8
1.2.1 Menor distância entre dois pontos . . . . . . . . . . . . . 8
1.2.2 Braquistócrona . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.3 Superfı́cies de revolução e filmes de sabão . . . . . . . . . 12
1.2.4 Túnel em uma esfera . . . . . . . . . . . . . . . . . . . . . 16
1.3 Uma variável independente e várias dependentes . . . . . . . . . 19
1.3.1 Equações de Euler . . . . . . . . . . . . . . . . . . . . . . 19
1.3.2 Princı́pio de Hamilton . . . . . . . . . . . . . . . . . . . . 20
1.4 Uma variável dependente e várias variáveis independentes . . . . 23
1.4.1 Equação de Euler . . . . . . . . . . . . . . . . . . . . . . . 23
1.4.2 Equação de Laplace . . . . . . . . . . . . . . . . . . . . . 24
1.5 Várias variáveis independentes e dependentes . . . . . . . . . . . 25
1.6 Problemas variacionais com vı́nculos . . . . . . . . . . . . . . . . 26
1.6.1 Vı́nculos e multiplicadores de Lagrange . . . . . . . . . . 26
1.6.2 Exemplos de vı́nculos . . . . . . . . . . . . . . . . . . . . 27
1.6.3 Equações de Euler com vı́nculos . . . . . . . . . . . . . . 28
1.6.4 Problemas mecânicos com vı́nculos . . . . . . . . . . . . . 32
1.7 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

2 Métodos variacionais aplicados 41


2.1 Revisão sobre a equação de Sturm-Liouville . . . . . . . . . . . . 41
2.2 A equação de Sturm-Liouville como um problema variacional . . 42
2.3 Autofunções de L como funções de base . . . . . . . . . . . . . . 44
2.4 O método de Rayleigh-Ritz . . . . . . . . . . . . . . . . . . . . . 47
2.4.1 Exemplos de aplicação do método . . . . . . . . . . . . . 48
2.5 O método da razão no cálculo variacional . . . . . . . . . . . . . 50
2.5.1 Cálculo com o sı́mbolo δ . . . . . . . . . . . . . . . . . . . 51
2.5.2 Teoria geral . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.5.3 O método da razão na mecânica quântica . . . . . . . . . 53
2.6 Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

3
4 SUMÁRIO
Capı́tulo 1

Equação de Euler

1.1 Uma variável independente e uma depen-


dente
No que segue, denotaremos por x a variável independente, e por y a dependente.
Usaremos, ainda, a notação yx = dy/dx para a derivada de y(x) em relação ao
seu argumento.
O problema central do cálculo variacional pode ser expresso na seguinte
forma: desejamos encontrar uma função y(x) que possui valores fixos nos pontos
x = x1 e x = x2 , tal que a integral de linha de uma dada função f (y, yx , x)
Z x2
J= f (y, yx , x)dx (1.1)
x1

seja um extremo (máximo, mı́nimo ou ponto de inflexão). Em outras palavras,


queremos encontrar y(x) com valores fixos y1 = f (x1 ) e y2 = f (x2 ) tal que a
integral J seja estacionária.
A integral J é um funcional, pois não depende só dos valores de y e sua
derivada num dado ponto x, mas sim em todos os pontos do intervalo x1 ≤ x ≤
x2 , já que a integral (2.18) depende do caminho escolhido entre esses pontos.

1.1.1 Parâmetro variacional


Há, naturalmente, infinitas funções com valores fixos em (x1 , y1 ) e (x2 , y2 ), mas
a integral J assume valores diferentes para cada um. No plano cartesiano,
isso equivale a dizer que há infinitos caminhos ligando os pontos fixos, mas
apenas para um deles J é um extremo. Formalmente podemos rotular todos os
caminhos possı́veis entre os pontos (x1 , y1 ) e (x2 , y2 ) por meio de um parâmetro
variacional α, de modo que cada caminho seja caracterizado por y(x, α [Fig.
1.1]. Para um dado valor de α, como α = 0, o caminho “ótimo” correspondente,
denotado por y(x, 0) torna J estacionária.
Suporemos que cada caminho seja uma deformação contı́nua do caminho
ótimo no sentido de que podemos escrever

y(x, α) = y(x, 0) + αη(x), (1.2)

5
6 CAPÍTULO 1. EQUAÇÃO DE EULER

y α=α
2 2
y
2
α=α 1

α=0

y
1 1 α=α
3
x
0 x x x
1 α=α 2
2

Figura 1.1: Parametrização de caminhos ligando dois pontos fixos.

onde η(x) representa a deformação, portanto deve ser uma função continuamente
diferenciável (suave) em todos os pontos do intervalo x1 < x < x2 , anulando-se
nos seus extremos: η(x1 ) = η(x2 ) = 0.
Como um exemplo de parametrização consideremos os pontos fixos no plano
(x1 , y1 ) = (0, 0) e (x2 , y2 ) = (1, 0), onde o caminho ótimo seja o segmento de
reta que os une:
y(x, 0) = {(x, y)|y = 0, 0 ≤ x ≤ 1}.
Uma famı́lia de curvas suaves parametrizadas por α que conectam os pontos
fixos é (α ∈ R)
y(x, α) = αx(1 − x),
onde α = 0 fornece o caminho ótimo: y(x, 0) = 0. Logo η(x) = x(1 − x), que
satisfaz η(0) = η(1) = 0.
Observe que a deformação η(x) deve ser uma função suave no intervalo
[x1 , x2 ], ou seja, deve ser diferenciável em todos os seus pontos. No exemplo
anterior, isso significa que não podemos usar uma função como (α ∈ R)
(
2αx, se 0 ≤ x ≤ 1/2,
η(x) =
2α(x − 1), se 1/2 ≤ x ≤ 1,

pois ela não é diferenciável em x = 1/2.

1.1.2 Dedução da equação de Euler


O funcional integral (2.18), com o auxı́lio do parâmetro variacional α, pode ser
reescrito como Z x2
J(α) = f (y(x, α), yx (x, α), x)dx. (1.3)
x1

A condição imposta ao caminho ótimo y(x, 0) de que torne o funcional acima


estacionário implica em  
∂J
= 0. (1.4)
∂α α=0
1.1. UMA VARIÁVEL INDEPENDENTE E UMA DEPENDENTE 7

Diferenciando (2.28) em relação a α teremos


Z x2  
∂J ∂f ∂y ∂f ∂yx
= + dx. (1.5)
∂α x1 ∂y ∂α ∂yx ∂α
Integrando por partes o segundo termo do lado direito
Z x2 x Z x2  
∂f ∂yx ∂f ∂y 2 ∂y d ∂f
dx = − dx (1.6)
x1 ∂yx |∂α ∂yx ∂α x1 ∂α dx ∂yx
x1 |{z}
|{z} {z } | {z }
=u =dv =v =du

Como todas as curvas parametrizadas por α devem passar pelos pontos fixos,
   
∂y ∂y
= 0, = 0, (1.7)
∂α x1 ∂α x2
tal que a primeira parcela resultante da integração por partes é identicamente
nula, restando, então
Z x2   
∂J ∂f d ∂f ∂y
= − dx. (1.8)
∂α x1 ∂y dx ∂y x ∂α
Multiplicando por dα e calculando as derivadas em relação a α para o cami-
nho ótimo α = 0 teremos
  Z x2   
∂J ∂f d ∂f ∂y
dα = − dαdx. (1.9)
∂α α=0 x1 ∂y dx ∂y x ∂α
Vamos denominar variação da integral J a seguinte expressão
 
∂J
δJ ≡ dα, (1.10)
∂α α=0
assim como, analogamente, a variação de y será
 
∂y
δy ≡ dα, (1.11)
∂α α=0
com as quais reescrevemos (1.9) como
Z x2   
∂f d ∂f
δJ = − δydx. (1.12)
x1 ∂y dx ∂yx
A condição (1.4) para que a integral J seja estacionária é, portanto, simples-
mente
δJ = 0. (1.13)
Impondo essa condição em (1.12), como δy é arbitrário, concluimos que, neces-
sariamente, o termo entre colchetes deve anular-se, o que fornece a equação de
Euler  
∂f d ∂f
− = 0. (1.14)
∂y dx ∂yx
Leonhard Euler chegou à equação acima em 1744, no seu trabalho Método
para achar curvas planas que mostram algumas propriedades de máximos e
mı́nimos. Posteriormente, em 1760, Joseph Louis Lagrange aprofundou a análise
prévia de Euler no seu trabalho Ensaio sobre um novo método para determinar
os máximos e mı́nimos de fórmulas integrais indefinidas. Por esse motivo, den-
tro do contexto da mecânica, a expressão (1.14) é também chamada de equação
de Euler-Lagrange.
8 CAPÍTULO 1. EQUAÇÃO DE EULER

1.1.3 Identidade de Beltrami


Quando a função f no funcional integral (2.18) não depende explicitamente
da variável independente x, é possı́vel reduzir a equação de Euler-Lagrange à
seguinte identidade, descoberta por Beltrami em 1868:

∂f
f − yx = C = constante. (1.15)
∂yx

Para deduzir essa identidade, consideremos primeiramente a derivada total


da função f (y, yx , x):
df ∂f dy ∂f dyx ∂f
= + +
dx ∂y dx ∂yx dx ∂x
∂f ∂f ∂f
= yx + yxx + ,
∂y ∂yx ∂x
onde podemos isolar
∂f df ∂f ∂f
yx = − yxx − . (1.16)
∂y dx ∂yx ∂x
Multiplicando a equação de Euler (1.14) por yx obtemos
 
∂f d ∂f
yx − yx = 0. (1.17)
∂y dx ∂yx
Substituindo (1.16) em (1.17),
 
df ∂f ∂f d ∂f
− yxx − − yx = 0. (1.18)
dx ∂yx ∂x dx ∂yx
Como    
d ∂f ∂f d ∂f
yx = yxx + yx , (1.19)
dx ∂yx ∂yx dx ∂yx
a expressão (1.18) fornece, após um pequeno rearranjo, uma forma alternativa
da equação de Euler:  
∂f d ∂f
− + f− = 0. (1.20)
∂x dx ∂yx
∂f
Caso f não dependa explicitamente de x, então ∂x = 0 e (1.20) reduz-se a
 
d ∂f
f− = 0. (1.21)
dx ∂yx
que, por integração, nos leva à identidade de Beltrami (1.15).

1.2 Aplicações da equação de Euler


1.2.1 Menor distância entre dois pontos
O elemento de comprimento de um arco no plano é dado por
s  2
√ p dy p
ds = dr · dr = dx2 + dy 2 = dx 1 + = dx 1 + yx2 (1.22)
dx
1.2. APLICAÇÕES DA EQUAÇÃO DE EULER 9

de tal sorte que o comprimento total de uma curva plana ligando os pontos de
coordenadas (x1 , y1 ) e (x2 , y2 ) é
Z 2 Z x2 p
L= ds = dx 1 + yx2 , (1.23)
1 x1

na forma de um funcional integral.


Desejamos encontrar a curva ligando os pontos 1 e 2 tal que o seu compri-
mento L seja mı́nimo. Do ponto de vista do cálculo variacional, isso implica
em achar y(x) tal que a integral L seja estacionária (um mı́nimo, na verdade,
mas essa é uma questão posterior),
p ou seja, resolver a equação de Euler (1.14)
correspondente para f = 1 + yx2 . Como f não depende explicitamente de x,
podemos usar a identidade de Beltrami (1.15):
!
p y x
1 + yx2 − yx p = C
1 + yx2
1
p = C
1 + yx2
s 
2
1
yx = ± −1≡a
C

onde a é uma outra constante.


dy
A equação diferencial dx = a é elementar e fornece a solução geral y(x) =
ax + b, onde b é uma constante de integração. Como a curva y(x) deve pas-
sar pelos pontos (x1 , y1 ) e (x2 , y2 ), as constantes a e b são determinadas pela
resolução do seguinte sistema de equações lineares

ax1 + b = y1 ,
ax2 + b = y2 ,

isto é,
y1 − y2
a = , (1.24)
x1 − x2
y2 x 1 − y1 x 2
b = . (1.25)
x1 − x2

Prova de que o extremo é um mı́nimo


Observe que, rigorosamente falando, só mostramos que a curva
   
y1 − y2 y2 x 1 − y1 x 2
y(x) = x+ (1.26)
x1 − x2 x1 − x2
tem um comprimento estacionário, ou seja, pode ser um máximo, mı́nimo ou
ponto de inflexão. Para mostrar que o comprimento L é, de fato, um mı́nimo, é
necessário realizar um cálculo mais elaborado. Vamos considerar o comprimento
de uma curva não-ótima (quando α 6= 0):
Z x2 p
L[y(x, α)] = 2 ,
dx 1 + yxα (1.27)
x1
10 CAPÍTULO 1. EQUAÇÃO DE EULER

onde yxα = yx (x, α), e comparar com o comprimento da curva ótima (1.26):
Z x2 q
L[y(x, 0)] = dx 2 ,
1 + yx0 (1.28)
x1

Pela parametrização dada por (1.2), diferenciando em relação a x temos que

yxα = yx0 + αηx (1.29)

Substituindo (1.29) em (1.27) nós computamos a diferença

∆L = L[y(x, α)] − L[y(x, 0)]


Z x2 q q 
2 2
= dx 1 + (yx0 + αηx ) − 1 + yx0
x1

onde yx0 = a. Usando o teorema binomial nós expandimos o integrando acima


em potências do parâmetro α. Após um cálculo tedioso obtemos

∆L = αI1 + α2 I2 + . . .

onde
a
I1 = √ [η(x2 ) − η(x1 )] = 0
2 1 + a2
e Z x2
1 3a2 + 4
I2 = η 2 dx ≥ 0
8 (1 + a2 )3/2 x1 x
| {z } | {z }
≥0 ≥0

donde ∆L ≥ 0, ou L[y(x, α)] ≥ L[y(x, 0)], a igualdade só valendo para o caso
onde α = 0. Em geral, L[y(x, α)] será sempre maior do que L[y(x, 0)], onde o
último é, de fato, um mı́nimo.
Em geral, curvas que fornecem a menor distância entre dois pontos sobre uma
superfı́cie são chamadas geodésicas. Numa superfı́cie esférica, por exemplo, a
geodésica entre dois pontos é o menor arco de cı́rculo máximo (o centro coincide
com o centro da esfera) que conecta estes pontos. Na relatividade geral, uma
partı́cula livre sempre move-se ao longo de uma geodésica.

1.2.2 Braquistócrona
O problema da braquistócrona consiste em achar a trajetória pela qual uma
partı́cula deslizando a partir do repouso, sem atrito, e acelerada unicamente
pela gravidade, vai de um ponto a outro (num plano vertical) no menor tempo
possı́vel. Ele foi formulado pela primeira vez por Johann Bernoulli em 1696, sob
a forma de um desafio lançado aos maiores matemáticos do seu tempo. Cinco
deles enviaram suas soluções: Newton, Jacob Bernoulli (irmão de Johann), Leib-
nitz, L’Hôpital, além do próprio Johann Bernoulli. Todos eles, usando diferentes
métodos geométricos, encontraram corretamente a curva como sendo um arco de
ciclóide. Os métodos usados pelos irmãos Bernoulli para resolver o problema da
braquistócrona e assemelhados levaram, anos após, Euler e Lagrange a criarem
o cálculo variacional.
1.2. APLICAÇÕES DA EQUAÇÃO DE EULER 11

y
1 x

0 x

2
y

Figura 1.2: A braquistócrona.

Por simplicidade, vamos supor que a partı́cula de massa m parta do repouso


da origem 1 : (0, 0) e deslize sem atrito pela curva y(x) até chegar ao ponto
2 : (x, y). O tempo necessário para percorrer o caminho ligando esses pontos é
Z 2
ds
t12 = , (1.30)
1 v

onde ds é o elemento de arco dado por (1.22). Para achar a velocidade v


como√função da elevação y podemos usar conservação de energia, o que fornece
v = 2gy. Substituindo em (1.30) teremos o funcional integral
Z xs
1 + yx2
t12 = dx. (1.31)
0 2gy

Desejamos achar a forma da curva y(x) para a qual, dados os pontos fixos
1 e 2, o tempo de percurso é mı́nimo. Este é um problema variacional para o
qual a solução é obtida resolvendo-se a equação de Euler (1.14) para a função
1/2 −1/2
f (y, yx ) = (1 + yx2 ) (2gy) . Como ela não depende explicitamente de x
podemos usar, alternativamente, a identidade de Beltrami (1.15):
∂f −1/2 −1/2 1/2 −1/2
f − yx = −yx2 (1 + yx2 ) (2gy) + (1 + yx2 ) (2gy)
∂yx
−1/2 −1/2  
C = (2gy) (1 + yx2 ) −yx2 + (1 + yx2 )
−1/2 −1/2
= (2gy) (1 + yx2 ) .

Quadrando ambos os membros obtemos a seguinte equação diferencial


1
y(1 + yx2 ) = ≡ k2 , (1.32)
2gC 2
onde k é uma nova constante. Isolando dx e tomando apenas o sinal positivo
para a raiz quadrada, obtemos
r
y
dx = dy. (1.33)
k2 − y
12 CAPÍTULO 1. EQUAÇÃO DE EULER

Vamos introduzir um parâmetro 0 ≤ θ < 2π através da seguinte substituição


trigonométrica  
k2 2 2 θ
y(θ) = (1 − cos θ) = k sin , (1.34)
2 2
que, substituida em (1.33), e após algumas simplificações, fornece
 
θ
dx = k 2 sin2 dθ (1.35)
2

tal que a outra coordenada pode ser encontrada, sob a forma paramétrica, por
integração dessa expressão
Z Z  
θ k2
x = dx = k 2 sin2 dθ = (θ − sin θ) + k12 , (1.36)
2 2

onde k12 é uma nova constante de integração, que se anula pela condição de
contorno y(0) = 0. A braquistócrona, então, é determinada pelas seguintes
equações paramétricas:

k2
x(θ) = (θ − sin θ), (1.37)
2
k2
y(θ) = (1 − cos θ), (1.38)
2
que são as equações de uma ciclóide.
A ciclóide é a curva traçada por um ponto fixo num cı́rculo de raio a = k 2 /2
que rola sem deslizar por uma linha reta. Podemos interpretar o parâmetro
θ como o ângulo que o raio vetor do ponto fixo faz com um raio vetor de
referência. Num ciclo completo, portanto, o parâmetro vai de zero a 2π. Ela
foi estudada primeiramente por Galileu em 1599, que tentou achar a sua área
experimentalmente (!) cortando e pesando pedaços de metal. A área sob a curva
após um ciclo completo, dada por 3πa2 , foi encontrada por Torricelli, Fermat e
Descartes usando métodos geométricos. O comprimento de um ciclo completo
da ciclóide é 8a.
A braquistócrona tem uma outra propriedade notável, e aparentemente pa-
radoxal: uma partı́cula colocada em qualquer posição (não necessariamente a
origem), vai alcançar o ponto final no mesmo tempo, ou seja, t12 , além de ser
mı́nimo, independe da posição inicial (ver o Problema 2)! Por esse motivo a
ciclóide é também uma tautócrona. Essa propriedade foi descoberta por 1673
por Huyghens, que a utilizou no (também sua invenção) relógio de pêndulo. Para
garantir o isocronismo das suas oscilações, ele adaptou no ponto de suspensão
do pêndulo duas guias na forma de arcos de ciclóide, o que fez com que o próprio
pêndulo oscilasse não em arcos de cı́rculo (aproximadamente isócronos), mas em
arcos de ciclóide (isócronos), o que melhorou a precisão do relógio usando essa
adaptação.

1.2.3 Superfı́cies de revolução e filmes de sabão


O problema consiste em encontrar a curva que liga os pontos (x1 , y1 ) e (x2 , y2 )
que, ao ser girada em torno do eixo das abscissas, fornece uma superfı́cie de
revolução de mı́nima área [Fig. 1.3]. Imaginando que os pontos 1 e 2, ao serem
1.2. APLICAÇÕES DA EQUAÇÃO DE EULER 13

y
y
2
ds

y y
1

0 x1 x2 x

Figura 1.3: Superfı́cies de revolução de área mı́nima.

girados, geram dois cı́rculos de raios y1 e y2 , respectivamente, isso equivale a


perguntar qual a superfı́cie de mı́nima área limitada por esses dois aros circula-
res.
Sob esse último ponto de vista, o problema das superfı́cies de revolução
tem uma aplicação fı́sica muito interessante. Filmes lı́quidos de sabão têm uma
energia livre de Gibbs F proporcional à área A da sua superfı́cie: F = σf A, onde
σf é o coeficiente de tensão superficial do lı́quido. Se o filme de sabão estiver
em equilı́brio termodinâmico, a energia livre de Gibbs deve ser mı́nima. Como
σf só depende da temperatura do lı́quido, se esta é constante, então o filme de
sabão em equilı́brio deve sempre ter uma configuração que minimiza a sua área
superficial. Este é o famoso problema de Plateau, nomeado em homenagem ao
fı́sico francês que primeiro estudou este e outros problemas relacionados.
A superfı́cie de revolução gerada pela rotação do arco de curva plana y(x)
ligando os pontos (x1 , y1 ) e (x2 , y2 ) em torno do eixo x tem um elemento de
área p
dA = (2πy)(ds) = 2πy 1 + yx2 dx, (1.39)
onde usamos (1.22). A área total da superfı́cie será, portanto, o funcional inte-
gral Z x2 p
A = 2π y 1 + yx2 dx, (1.40)
x1
que se pretende minimizar. p
Como o integrando f = y 1 + yx2 não depende explicitamente de x podemos
usar a identidade de Beltrami (1.15) no lugar da equação de Euler (1.14):
∂f p yy 2
C = f − yx = y 1 + yx2 − p x
∂yx 1 + yx2
p
Multiplicando por 1 + yx2 obtemos
p
y(1 + yx2 ) − yx2 y = y = a 1 + yx2
Isolando yx2 nessa expressão teremos
dx 1 a
= =p . (1.41)
dy yx 1 + yx2
14 CAPÍTULO 1. EQUAÇÃO DE EULER

y
o

−xo 0 xo x

−yo

Figura 1.4: Superfı́cies de revolução de área mı́nima.

A equação diferencial acima pode ser imediatamente integrada:


Z y
dy
x=a p = a cosh−1 +b (1.42)
y 2 − a2 a

onde b é uma constante de integração. Invertendo temos a equação da curva


procurada  
x−b
y(x) = a cosh , (1.43)
a
denominada catenária na literatura. As constantes a e b são determinadas
implicitamente pelas coordenadas dos pontos fixos
   
x1 − b x2 − b
y1 = a cosh , y2 = a cosh , (1.44)
a a
A superfı́cie de revolução gerada pela catenária é chamada de catenóide, e seria
também obtida se a rotação fosse feita em torno do eixo das ordenadas, ao invés
das abscissas (Problema 3). Foi Euler quem, em 1744, mostrou que a catenóide
é uma superfı́cie de mı́nima área.

Outras soluções do problema


Ocorre que a catenóide não é a única solução do problema. Para simplificar
os cálculos, vamos supor que x1 = −x2 = x0 e y1 = y2 = y0 , ou seja, a
superfı́cie mı́nima encontra dois arcos circulares de raio y0 simetricamente postos
em relação à origem. A equação da catenária será, portanto,
x
y(x) = a cosh , (1.45)
a
onde a constante é dada pela solução da equação transcendente
y0
a= , (1.46)
cosh(x0 /a)
Como os valores de x0 , e y0 estão “amarrados” pela condição (1.46), não
podemos especificá-los de uma forma arbitrária. Disso decorre que a solução
1.2. APLICAÇÕES DA EQUAÇÃO DE EULER 15

Figura 1.5: Soluções do problema de área mı́nima


[http://mathworld.wolfram.com/SurfaceofRevolution.html]

(1.45) não é verificada para todos os valores de x0 e y0 . Para mostrar esse fato,
vamos encontrar o valor máximo da razão x0 /y0 para o qual (1.46) é satisfeita.
Fazendo p = 1/a essa condição é reescrita como

py0 = cosh(px0 ). (1.47)

Diferenciando em relação a p ambos os membros


 
dx0
y0 = sinh(px0 ) x0 + p (1.48)
dp
Denotando o valor máximo de x0 por x∗0 , temos a condição de máximo

dx0
=0
dp x0 =x∗
0

tal que (1.48) fique


y0 = x∗o sinh(px∗0 ). (1.49)
Pondo x∗0 em (1.47) e dividindo as equações membro a membro chegamos à
equação transcendente
px∗0 = coth(px∗0 ), (1.50)
que tem apenas uma solução positiva, que pode ser obtida (numericamente)
como px∗0 ≈ 1, 2. De (1.47) e (1.49) teremos que
x∗0
= csch1, 2 ≈ 0, 663 (1.51)
y0
donde para (x0 /y0 ) > 0, 66 a catenóide não é a solução do problema da superfı́cie
mı́nima. Há uma outra solução para o problema da superfı́cie mı́nima, devida
a Goldshmidt, que não é obtida pelo cálculo variacional, e é composta por dois
filmes circulares em cada aro [Fig. 1.5]. Para (x0 /y0 ) > 0, 66 apenas as soluções
de Goldschmidt podem existir. Podemos encarar a situação da seguinte forma:
quando os cı́rculos estão suficientemente afastados entre si, a solução do tipo
catenóide torna-se instável, e apenas as soluções de Goldschmidt existem.
16 CAPÍTULO 1. EQUAÇÃO DE EULER

1 2

r r
o
R θ R
φ

Figura 1.6: Túnel em uma esfera.

1.2.4 Túnel em uma esfera


Um problema similar, porém mais difı́cil do que o da braquistócrona consiste
em encontrar a trajetória de menor tempo de percurso para um túnel escavado
numa esfera homogênea de massa M e raio R, para o qual o campo gravitacional
não é uniforme. Usando a Lei de Gauss para a gravitação, é fácil mostrar que
a energia potencial gravitacional para uma partı́cula de massa m situada à
distância r do centro da esfera é

mg0 r2
U (r) = , (1.52)
2R

onde g0 = GM/R2 é a aceleração da gravidade na superfı́cie da esfera (r = R),


e G é a constante Newtoniana.
Suponha que a partı́cula parta do repouso de um ponto 1 na superfı́cie da
esfera. Usando conservação de energia mecânica, o tempo necessário para ir do
ponto 1 até um ponto 2 situado a uma distância r do centro da esfera é [Figura
1.6]:
Z 2
ds
t12 = q (1.53)
2 
1 g0 R 1 − Rr 2

Introduzindo coordenadas polares (r, θ) o elemento de arco (1.22) é escrito como


q
ds = r2 + rθ2 dθ, (1.54)
1.2. APLICAÇÕES DA EQUAÇÃO DE EULER 17

de modo que o funcional a ser minimizado é


s Z s
R θ2 rθ2 + r2
t12 = dθ. (1.55)
g 0 θ1 R2 − r 2

Como o integrando não depende explicitamente de θ, podemos usar a iden-


tidade de Beltrami (1.15) para obter
r
g0  2 1/2
r2 = C (R − r2 )(rθ2 + r2 ) (1.56)
R

onde podemos exprimir a constante de integração C em termos de r0 , que é a


distância máxima aproximação ao centro da esfera. Por simetria, r = r0 deve
ser o ponto médio de uma trajetória ligando dois pontos sobre a superfı́cie da
esfera, e onde a tangente à trajetória é perpendicular ao raio. Dessa forma
podemos aplicar em (1.56) a condição de que rθ = 0 em r = r0 ,
r
2 g0  2 1/2
r0 = C (R − r02 )r02 (1.57)
R

Dividindo (1.56) e (1.57) membro a membro obtemos a seguinte equação


diferencial s
rR r2 − r02
rθ = , (1.58)
r0 R2 − r2
que pode ser integrada analiticamente fornecendo
 s  s
R r 2 − r2 r r2 − r02
0  0
θ(r) = arctan  − arctan , (1.59)
r0 R2 − r2 R R2 − r 2

onde θ(r0 ) = 0 corresponde ao ponto de máxima aproximação. O ângulo cen-


tral subtendido pelos dois pontos na superfı́cie da esfera pode ser encontrado
impondo r = R em (1.59), fornecendo
 r0 
2φ = π 1 − . (1.60)
R
Definindo um parâmetro Ωt pela relação
s
r2 − r02
tan(Ωt) = , (1.61)
R2 − r 2

a equação (1.59) da trajetória que minimiza o tempo de percurso é


 
R r0
θ(Ωt) = arctan tan Ωt − Ωt. (1.62)
r0 R

Fazendo uma transformação trigonométrica podemos reescrevê-la como


1 2 1
r2 (Ωt) = (R + r02 ) − (R2 − r02 ) cos(2Ωt). (1.63)
2 2
18 CAPÍTULO 1. EQUAÇÃO DE EULER

de modo que (1.61) e (1.63) são as equações paramétricas da trajetória, a qual é


uma hipociclóide, que é a curva produzida por um ponto fixo P sobre um cı́rculo
de raio b que rola sem deslizar pelo interior de um cı́rculo de raio a > b.
Para calcular analiticamente o tempo (mı́nimo) de percurso entre dois pontos
quaisquer substituimos (1.58) em (1.55)
s Z s
R r2 dr R2 (r2 − r02 ) + r02 (R2 − r2 )
t12 = √
g 0 r1 2
R −r 2 R2 (r2 − r02 )
r Z r
1 1/2 −1/2 2 −1/2
= (R2 − r02 ) r(R2 − r2 ) (r − r02 ) dr
Rg0 r0
 2 
1 −1/2 1/2 R + r02 − 2r2
= (Rg0 ) (R2 − r02 ) arccos (1.64)
2 R2 − r02

onde supusemos que, em t = 0, a partı́cula esteja no ponto de maior aproximação


do centro da esfera (r1 , θ1 ) = (r0 , 0).
Supondo, ainda, que a partı́cula “suba” o túnel até chegar na superfı́cie da
esfera em (r2 , θ2 ) = (R, θ) no tempo t = τ , de (1.64)
 2  s
2
1 −1/2 1/2 r − R π R2 − r02
τ = (Rg0 ) (R2 − r02 ) arccos 02 = , (1.65)
2 R − r02 2 Rg0
| {z }
=arccos(−1)=π

Finalmente, por simetria o tempo total de percurso entre dois pontos na su-
perfı́cie será s r
R2 − r02  r 2
0
T = 2τ = π = 1− T0 , (1.66)
Rg0 R
onde s
R
T0 ≡ π (1.67)
g0
é o tempo de percurso para uma trajetória que passe pelo centro da esfera, isto
é, com r0 = 0, conectando dois pontos antipodais na sua superfı́cie. Em geral,
os tempos de trânsito para todas as cordas são idênticos, sendo o diâmetro a
maior corda possı́vel na esfera, evidentemente, Para uma hipociclóide, porém,
na medida em que r0 ≥ 0, então T ≤ T0 , significando que o tempo de percurso
por uma hipociclóide é sempre menor do que o tempo de percurso pela corda
que une os dois pontos.
Como um exemplo numérico, supondo que a Terra seja uma esfera perfeita
onde R = 6370km e g0 = 9, 8m/s2 , temos que T0 = 2, 53 × 103 s = 42, 2min.
Para uma trajetória (num hipotético túnel) onde r0 = R/2, o tempo de per-
curso será T = 0, 0625T0 = 2, 64min. Esse valor é espantosamente baixo, con-
siderando que, como o ângulo central subtendendo os pontos inicial e final é,
de (1.60), φ = π/4,
√ um cálculo simples mostra que a corda ligando esses dois
pontos mede R 2 = 9008km, e que a profundidade máxima de um túnel ao
longo da corda seria h = R(1 − cos φ) = 1865km. Além disso, a distância entre
esses pontos ao longo da superfı́cie é s = Rπ/4 = 5000km.
Este problema tem uma história curiosa. Em 1888 Collignon apresentou
perante o Congresso da Associação Francesa para o Avanço da Ciência um
1.3. UMA VARIÁVEL INDEPENDENTE E VÁRIAS DEPENDENTES 19

trabalho com o tı́tulo De Paris ao Rio de Janeiro em 42 minutos e 11 segundos


(provavelmente referindo-se a um hipotético túnel ao longo da corda ligando as
duas cidades). De fato, na década de 1930 especulou-se muito sobre esse tipo de
possibilidade, naturalmente limitada por vários fatores tecnológicos. Na década
de 1960 esse problema foi objeto de vários artigos [7, 8].

1.3 Uma variável independente e várias depen-


dentes
1.3.1 Equações de Euler
Para generalizar o problema variacional nós consideraremos uma função de n
variáveis yi , i = 1, 2, . . . n, todas elas dependentes de x:

f = f (y1 (x), y2 (x), . . . yn (x); x),

e o funcional integral que desejamos tornar estacionário


Z x2
J= f (y1 , y2 , . . . yn ; y1x , y2x , . . . ynx ; x)dx, (1.68)
x1

onde yix = dyi /dx.


Como antes, consideramos uma infinidade de caminhos possı́veis ligando os
pontos fixos em x = x1 e x = x2 , parametrizados por α, tal que α = 0 represente
o caminho ótimo para cada variável dependente

yi (x, α) = yi (x, 0) + αηi (x), (1.69)

onde ηi (x) representam as deformações continuamente diferenciáveis para cada


i = 1, 2, . . . n, e que são independentes entre si, anulando-se nos extremos:
ηi (x1 ) = ηi (x2 ) = 0.
Diferenciando o funcional (1.68) em relação a α teremos
Z x2
∂J ∂f
=
∂α x1 ∂α
Z x2 n  
X ∂f ∂yi ∂f ∂yix
= dx +
x1 i=1
∂yi ∂α ∂yix ∂α
n
X x2 Z  
∂f ∂f
= dx ηi + ηix (1.70)
i=1 x1
∂yi ∂yix

onde usamos o teorema de Schwartz para escrever


∂yix ∂ dyi d ∂yi dηi
= = = = = ηix . (1.71)
∂α ∂α dx dx ∂α dx
Integrando por partes a parcela
Z x2 x Z x2  
∂f dηi ∂f 2 d ∂f
dx = ηi − ηi dx (1.72)
x1 ∂yix dx ∂yix x x1 dx ∂yix
| {z }1
=0
20 CAPÍTULO 1. EQUAÇÃO DE EULER

e impondo que o funcional integral será estacionário se estivermos no caminho


ótimo entre os pontos fixos  
∂J
= 0. (1.73)
∂α α=0
chegamos a
n Z x2   
X ∂f d ∂f
dxηi − =0 (1.74)
i=1 x1 ∂yi dx ∂yix
Como os ηi são todos mutuamente independentes, para que a condição acima
subsista para quaisquer deformações, cada termo entre os colchetes deve anular-
se identicamente, fornecendo uma equação de Euler para cada variável depen-
dente em separado:
 
∂f d ∂f
− = 0, (i = 1, 2, . . . n) (1.75)
∂yi dx ∂yix

1.3.2 Princı́pio de Hamilton


Uma das consequências mais importantes dos métodos variacionais para a fı́sica
foi a construção, feita por Lagrange, de uma nova formulação para a mecânica
Newtoniana, a partir do princı́pio de mı́nima ação de Maupertuis, e finalmente
consolidada em 1788 com a publicação de sua obra Mécanique Analytique. Nesse
formalismo, a variável independente é o tempo t e trabalhamos com as coorde-
nadas generalizadas de um sistema qi , i = 1, 2, . . . n e as respectivas velocidades
generalizadas q̇i = qit = dqi /dt. Uma partı́cula no espaço, por exemplo, pode ter
como coordenadas generalizadas as componentes do seu vetor posição: q1 = x,
q2 = y, e q3 = z; mas outras escolhas são possı́veis.
A energia cinética é, em geral, uma função das velocidades generalizadas,
enquanto a energia potencial usualmente depende das coordenadas generaliza-
das e/ou do tempo. Neste formalismo ocupa papel central a Lagrangeana do
sistema, igual à diferença entre as energias cinética e potencial L(qi , q̇i , t). O
princı́pio variacional (de Hamilton) da mecânica diz que a trajetória de um sis-
tema entre dois pontos fixos em t = t1 e t = t2 , é aquela que torna estacionária
a seguinte integral de ação
Z t2
J= L(qi , q̇i , t)dt, (1.76)
t1

que é um problema variacional com uma variável independente e n dependentes,


e que implica resolvermos n equações de Euler da forma (1.75):
 
∂L d ∂L
− = 0, (i = 1, 2, . . . n) (1.77)
∂qi dt ∂ q̇i

chamadas, no presente contexto, de equações de Lagrange.

Partı́cula num campo de forças conservativas


Um problema fundamental em dinâmica consiste no movimento de uma partı́cula
de massa m no espaço tridimensional, sujeita a uma energia potencial V (x, y, z)
1.3. UMA VARIÁVEL INDEPENDENTE E VÁRIAS DEPENDENTES 21

conhecida, a partir da qual podemos obter uma força conservativa como F =


−∇V . As coordenadas generalizadas serão x, y, z e as velocidades generalizadas
ẋ, ẏ, ż, com as quais formamos a energia cinética
1 
K= m ẋ2 + ẏ 2 + ż 2 ,
2
tal que a Lagrangeana será
1 
L(x, y, z; ẋ, ẏ, ż) = K − V = m ẋ2 + ẏ 2 + ż 2 − V (x, y, z).
2
As equações de Lagrange (1.77) serão
 
∂L d ∂L dV d
− = − − (mẋ) = Fx − mẍ = 0, (1.78)
∂x dt ∂ ẋ dx dt
 
∂L d ∂L dV d
− = − − (mẏ) = Fy − mÿ = 0, (1.79)
∂y dt ∂ ẏ dy dt
 
∂L d ∂L dV d
− = − − (mż) = Fx − mz̈ = 0, (1.80)
∂z dt ∂ ż dz dt
ou seja, nada mais do que as três componentes da equação Newtoniana do
movimento F = mr̈.

Pião simétrico pesado


Um pião que executa uma rotação uniforme em torno de um eixo de simetria
que passa tanto pelo seu centro de massa como pelo seu ponto fixo de apoio
pode ser descrito por apenas três coordenadas generalizadas, que são os três
ângulos de Euler. Considerando o eixo de simetria o eixo z fixo no corpo, esses
ângulos são [Fig. 1.7]:
• q1 = θ: mede a inclinação do eixo z do corpo em relação ao eixo vertical
fixo no espaço;
• q2 = φ: mede o azimute do pião em relação à vertical
• q3 = ψ: é o ângulo de rotação do pião em relação ao seu eixo de simetria.
As velocidades generalizadas correspondentes são
• q̇1 = θ̇: velocidade de nutação, ou seja, a rapidez da oscilação do eixo de
simetria z do pião em relação ao eixo vertical fixo no espaço;
• q̇2 = φ̇: velocidade de precessão, que é a rapidez da rotação do eixo de
simetria z do pião em torno do eixo vertical fixo no espaço;
• q̇3 = ψ̇: velocidade de rotação do pião em relação ao seu eixo z de simetria.
A energia cinética de rotação do pião é dada, em geral, por
1 1 1
K= I1 ω12 + I2 ω22 + I3 ω32 ,
2 2 2
onde I1 , I2 e I3 são os valores principais do tensor de inércia do pião, que definem
eixos principais do espaço, e para os quais as as componentes correspondentes
22 CAPÍTULO 1. EQUAÇÃO DE EULER

vertical
θ
z

y
centro de massa

Mg

ψ x
φ
linha nodal

Figura 1.7: Pião simétrico pesado.

da velocidade angular de rotação são ω1 , ω2 e ω3 , respectivamente. A relação


entre elas e as velocidades generalizadas é dada por [veja [2], Cap. 4, Sec. 4.9]:
ω1 = φ̇ sin θ sin ψ + θ̇ cos ψ, (1.81)
ω2 = φ̇ sin θ cos ψ − θ̇ sin ψ, (1.82)
ω3 = φ̇ cos θ + ψ̇ (1.83)
Sendo o pião simétrico, temos que I1 = I2 6= I3 . Combinando essa in-
formação com as equações acima, obtemos para a energia cinética do pião:
I1  2  I 
3
2
K(qi , q̇i ) = θ̇ + φ̇2 sin2 θ + ψ̇ + φ̇ cos θ (1.84)
2 2
Além disso, denotando por ℓ a distância entre o centro de massa do pião de
massa M e o ponto de apoio, a sua energia potencial gravitacional é
V (q1 ) = M gz = M gℓ cos θ, (1.85)
de modo que a Lagrangeana é
I1  2  I 
3
2
L= θ̇ + φ̇2 sin2 θ + ψ̇ + φ̇ cos θ − M gℓ cos θ, (1.86)
2 2
As equações de Lagrange serão
 
∂L d ∂L
− = I1 φ̇2 sin θ cos θ − I3 φ̇ sin θ(ψ̇ + φ̇ cos θ) − I1 θ̈ = 0,
(1.87)
∂θ dt ∂ θ̇
 
∂L d ∂L d h  i
− = − I3 ψ̇ + φ̇ cos θ = 0, (1.88)
∂ψ dt ∂ ψ̇ dt
 
∂L d ∂L d h  i
− = − I1 φ̇ sin2 θ + I3 cos θ ψ̇ + φ̇ cos θ = 0, (1.89)
∂φ dt ∂ φ̇ dt
1.4. UMA VARIÁVEL DEPENDENTE E VÁRIAS VARIÁVEIS INDEPENDENTES23

De (1.88) e (1.89) obtemos, imediatamente, que


 
I3 ψ̇ + φ̇ cos θ = a, (1.90)
I1 φ̇ sin2 θ + a cos θ = b, (1.91)

onde a e b são constantes de integração.


Podemos isolar φ̇ em (1.91) e substituir em (1.90), isolando, por sua vez,
ψ̇. Ao substituir ambas as derivadas em (1.87) podemos obter uma equação da
forma θ̈ = F(θ), onde F é uma função complicada de θ, apenas. Entretanto,
não é possı́vel efetuar a quadratura que fornece θ como função do tempo, o
que poderia fornecer posteriormente φ(t) e ψ(t). Ao invés de tentar resolver
diretamente as equações de movimento, usualmente estudamos o problema do
pião pesado simétrico usando a equação da energia do sistema para obter um
problema unidimensional reduzido. Detalhes desse procedimento podem ser
encontrados em [2], Cap. 5, Sec. 5.7.

1.4 Uma variável dependente e várias variáveis


independentes
1.4.1 Equação de Euler
Seja y uma variável dependente e n variáveis independentes x1 , x2 , · · · xn . A de-
rivada de y em relação a cada uma delas será denotada yj = ∂y/∂xj . Neste caso
não deve haver confusão com a notação correspondente quando houver várias
variáveis dependentes. Os pontos fixos em relação a cada variável independente
(1) (2) (1) (2) (1) (2)
serão indicados por (x1 , x1 ), (x2 , x2 ). . ., (xn , xn ). Para evitar uma so-
brecarga inútil na notação, indicaremos estes pontos fixos simplesmente por 1 e
2, ficando subentendido seu significado quando do seu emprego.
Dessa forma, a função f (y, yj , xj ) é o integrando do funcional que se quer
tornar estacionário
Z 2 Z 2 Z 2
J= dx1 dx1 · · · dxn f (y, yj , xj ) (1.92)
1 1 1

O problema variacional será, pois, o de encontrar a função de n variáveis


y(x1 , x2 , . . . xn ) para a qual δJ = 0, considerados os pontos fixos, onde o sı́mbolo
de variação é definido como
 
∂J
δJ = dα, (1.93)
∂α α=0

com o auxı́lio do parâmetro variacional α.


A parametrização a ser introduzida é a mesma dos casos anteriores, ou seja,

y(xj , α) = y(xj .0) + αη(xj ) (1.94)

onde y(xj , 0) indica o caminho que torna J um extremo e η é uma função


diferenciável e que se anula nos pontos fixos: η(1) = η(2) = 0.
24 CAPÍTULO 1. EQUAÇÃO DE EULER

Diferenciando o funcional (1.92) em relação a α


Z 2 Z 2 Z 2
∂J ∂f
= dx1 dx2 · · · dxn
∂α 1 1 1 ∂α
 
Z 2 Z 2 Z 2 n
∂f ∂y X ∂f ∂y j
= dx1 dx2 · · · dxn  +
1 1 1 ∂y ∂α j=1 ∂yj ∂α
 
Z 2 Z 2 Z 2 n
∂f X ∂f
= dx1 dx2 · · · dxn  η+ ηj 
1 1 1 ∂yi j=1
∂y j
Z 2 Z 2 Z 2
∂f
= dx1 dx2 · · · dxn η+ (1.95)
1 1 1 ∂y i
n Z 2 Z 2 Z 2 Z 2 Z 2
X ∂f
dx1 dx2 · · · dxj ηj dxj+1 · · · dxn
j=1 1 1 1 ∂yj 1 1
| {z }
=I

Integrando por partes o fator I na expressão acima temos


Z 2 Z 2 2 Z 2  
∂f ∂f ∂η ∂η d ∂f
dxj ηj = dxj = η − η dxj
1 ∂yj 1 ∂yj ∂xj ∂xj 1 1 dxj ∂yj
| {z }
=0

tal que
Z 2 Z 2 Z 2
∂J ∂f
dx1 dx2 · · · η+ dxn
∂α 1 1 1 ∂yi
n Z 2 Z 2 Z 2  
X d ∂f
dx1 dx2 · · · dxn η dxj
j=1 1 1 1 dxj ∂yj
 
Z 2 Z 2 Z 2 n  
∂f X d ∂f
= dx1 dx2 · · · dxn η  − .
1 1 1 ∂yi j=1 dxj ∂yj

Calculando a derivada de J ao longo do caminho ótimo


 
  Z 2 Z 2 Z 2 n  
∂J ∂f X d ∂f
= dx1 dx2 · · · dxn η  −  = 0 (1.96)
∂α α=0 1 1 1 ∂yi j=1 dxj ∂yj
| {z }
=0

para η(xj ) arbitrárioss, o que nos leva à equação de Euler para várias variáveis
dependentes
n  
∂f X d ∂f
− =0 (1.97)
∂yi j=1 dxj ∂yj

1.4.2 Equação de Laplace


Do eletromagnetismo, sabemos que a densidade de energia num campo elétrico
no vácuo E é dada por
1
u = ǫ 0 E2 (1.98)
2
1.5. VÁRIAS VARIÁVEIS INDEPENDENTES E DEPENDENTES 25

Se o campo for eletrostático, pode ser escrito como menos o gradiente de um


potencial E = −∇Φ, tal que
1 2
u(x, y, z) = ǫ0 |∇Φ| (1.99)
2
Consideremos um paralelepı́pedo de arestas x2 − x2 , y2 − y1 , e z2 − z1 .
Se impusermos que a energia eletrostática encerrada numa região fechada de
volume V seja mı́nima, isso equivale a achar um extremo do funcional
Z Z x2 Z y2 Z z 2
2
J= |∇Φ| = dx dy dz (Φ2x + Φ2y + Φ2z ), (1.100)
V x1 y1 z1 | {z }
≡f

onde Φx = ∂Φ/∂x, etc.


De (1.97), o potencial que satisfaz essa condição é a solução de
∂f d ∂f d ∂f d ∂f
− − − = 0,
∂Φ dx ∂Φ dy ∂Φ dz ∂Φ
|{z} | {zx} y
| {z } | {zz}
=0 =2Φx =2Φy =2Φz

−2(Φxx + Φyy + Φzz ) = 0


que é a equação de Laplace
∇2 Φ = 0. (1.101)

1.5 Várias variáveis independentes e dependen-


tes
A generalização final do problema variacional consiste em consideraremos uma
função de n variáveis dependentes yi , i = 1, 2, . . . n, e n variáveis independentes
xj , j = 1, 2, . . . n, bem como das respectivas derivadas jacobianas yij ≡ dyi /dxj :
f = f (y1 , . . . un ; y11 , . . . ynn ; x1 , . . . xn ),
que é o integrando de um funcional integral n-dimensional, sendo os pontos fixos
(1) (2) (1) (2)
(x1 , x1 ), . . ., (xn , xn ):
(2) (2)
Z x1 Z x2 Z x(2)
n
J= dx1 dx2 · · · dxn f (yi , Yij , xj ). (1.102)
(1) (1) (1)
x1 x2 xn

O problema variacional consiste em encontrar as n funções yi (xj ) para


as quais J é estacionária, ou δJ = 0. O desenvolvimento matemático dessa
condição é semelhante ao efetuado no caso anterior, com a diferença que nós
consideramos agora n variáveis dependentes, e cada uma delas deverá satisfazer
uma equação de Euler. Caso as variáveis xj sejam independentes entre si, a
função f deve satisfazer o seguinte conjunto de n equações de Euler:
n  
∂f X ∂ ∂f
− = 0. (i = 1, 2, . . . n) (1.103)
∂yi j=1 ∂xj ∂yij

Esta situação bastante geral pode ocorrer em problemas variacionais com vı́nculos,
como se verá a seguir.
26 CAPÍTULO 1. EQUAÇÃO DE EULER

1.6 Problemas variacionais com vı́nculos


É comum que as variáveis xj não sejam, de fato, independentes entre si, mas
sim estejam “amarradas” por alguma relação de vı́nculo. A existência desses
vı́nculos leva à introdução dos chamados multiplicadores de Lagrange. Antes
de abordar o problema variacional propriamente dito, vamos estudar esse pro-
blema sob o ponto de vista da determinação de máximos e mı́nimos no cálculo
diferencial.

1.6.1 Vı́nculos e multiplicadores de Lagrange


Considere uma função de três variáveis independentes f (x, y, z). Se ela tem um
extremo, então
∂f ∂f ∂f
df = dx + dy + dz = 0, (1.104)
∂x ∂y ∂z
tal que é necessário e suficiente que, para dx, dy e dz arbitrários, tenhamos
∂f ∂f ∂f
= = = 0. (1.105)
∂x ∂y ∂z
No entanto, se x, y e z estiverem “amarrados” por uma dada relação na
forma geral
ϕ(x, y, z) = 0,
dita “vı́nculo”, então as variáveis não são mais independentes entre si, pois
podemos, em princı́pio, exprimir uma delas, como z, em função das outras
duas: z = z(x, y), de modo que, ainda que dx e dy sejam arbitrários, dz não é
mais arbitrário. Logo, a condição (1.105) para que f tenha um extremo não é
mais válida, em geral.
Para contornar esse problema, observamos que, como dϕ = 0, podemos
introduzir um escalar λ, dito multiplicador de Lagrange, tal que
df + λdϕ = 0. (1.106)
Aplicando diferenciais totais temos que a relação acima implica em
     
∂f ∂ϕ ∂f ∂ϕ ∂f ∂ϕ
+λ dx + +λ dy + +λ dz = 0 (1.107)
∂x ∂x ∂y ∂y ∂z ∂z
Até agora o multiplicador de Lagrange é um escalar qualquer. No entanto,
nós o escolhemos de tal sorte que
∂f ∂ϕ
+λ = 0, (ϕz 6= 0) (1.108)
∂z ∂z
já que, agora, dz não é mais arbitrária devido ao vı́nculo. Logo
   
∂f ∂ϕ ∂f ∂ϕ
+λ dx + +λ dy = 0 (1.109)
∂x ∂x ∂y ∂y
Lembremos, porém, que dx e dy ainda são arbitrários, de modo que a igualdade
acima vale se e somente se
∂f ∂ϕ
+λ = 0, (1.110)
∂x ∂x
∂f ∂ϕ
+λ = 0. (1.111)
∂y ∂y
1.6. PROBLEMAS VARIACIONAIS COM VÍNCULOS 27

Logo, se as condições (1.110)-(1.108) forem satisfeitas, então df = 0 e f é um


extremo. Por tabela, também podemos obter, se o quisermos, o multiplicador
de Lagrange (às vezes isso nem é realmente necessário).
Podemos generalizar a presente discussão para um número n qualquer de
variáveis “independentes” (x1 , x2 , . . . xn ) sujeitas a m vı́nculos, descritos pelas
equações
ϕk (x1 , x2 , . . . xn ) = 0, (k = 1, 2, . . . m). (1.112)

Neste caso, as condições (1.110)-(1.108) são generalizadas na seguinte forma

m
∂f X ∂ϕk
+ λk = 0, (i = 1, 2, . . . n) (1.113)
∂xi ∂xi
k=1

que, também, determinam os m multiplicadores de Lagrange λk , um para cada


vı́nculo do sistema.

1.6.2 Exemplos de vı́nculos


O problema da lata de leite condensado

Um fabricante de leite condensado deseja produzir uma lata cilı́ndrica de raio r


e altura h que acondicione um volume dado V0 do seu produto:

V (r, h) = (πr2 )h = V0 = constante. (1.114)

Em princı́pio, as variáveis r e h são independentes entre si, ou seja, se o fabri-


cante quiser uma lata mais estreita (r menor), então ela deverá ser necessaria-
mente mais alta (h maior), e vice-versa.
No entanto, para cada escolha que for feita de r e h a área S da superfı́cie
da lata será diferente.
S(r, h) = (2πr)h + 2(πr2 ) (1.115)

Como o custo de fabricação da lata é proporcional à área da superfı́cie, o


fabricante naturalmente deseja minimizar a função S(r, h) sujeita ao vı́nculo
V (r, h) = V0 . A condição de vı́nculo será, então

ϕ(r, h) = πr2 h − V0 = 0. (1.116)

Introduzindo o multiplicador de Lagrange λ teremos duas condições para


um extremo na forma (1.110)-(1.108), a saber:

∂S ∂ϕ
+λ = 2πh + 4πr + λ(2πr)h = 0, (1.117)
∂r ∂r
∂S ∂ϕ
+λ = 2πr + λ(πr2 ) = 0 (1.118)
∂h ∂h

De (1.118) obtemos o multiplicador de Lagrange λ = −2/r que, substituido em


(1.117), fornece h = 2r, ou seja, o cilindro de menor área superficial, para um
dado volume, tem o diâmetro igual à altura.
28 CAPÍTULO 1. EQUAÇÃO DE EULER

Elétron numa caixa tridimensional


Um problema elementar em mecânica quântica consiste em achar os nı́veis de
energia de uma partı́cula quanto-mecânica de massa m, como um elétron, dentro
de uma caixa de paredes impenetráveis, na forma de um paralelepı́pedo de
arestas a, b e c. A partir da equação de Schrödinger independente do tempo,
com as condições de contorno apropriadas (a função de onda tem nós nas paredes
da caixa), pode-se mostrar que a energia do estado fundamental é dada por
 
h2 1 1 1
E(a, b, c) = + + . (1.119)
8m a2 b2 c2
Desejamos encontrar os valores de a, b e c que minimizam a energia do
elétron, sujeito ao vı́nculo de que o volume V0 da caixa seja dado:

V (a, b, c) = abc = V0 , (1.120)

de modo que a equação de vı́nculo é

ϕ(a, b, c) = abc − V0 = 0 (1.121)

correspondente a um multiplicador de Lagrange λ.


As condições de mı́nimo para a energia são, portanto
∂E ∂ϕ h2
+λ = − + λbc = 0, (1.122)
∂a ∂a 4ma3
∂E ∂ϕ h2
+λ = − + λac = 0, (1.123)
∂b ∂b 4mb3
∂E ∂ϕ h2
+λ = − + λab = 0. (1.124)
∂c ∂c 4mc3
Multiplicando (1.122) por a, (1.123) por b, e (1.124) por c, chegamos à
seguinte relação
h2 h2 h2
λabc = = = ,
4ma3 4mb3 4ma3
que é identicamente satisfeita se a = b = c, ou seja, o paralelepı́pedo reduz-se a
um cubo de aresta a. O multiplicador de Lagrange é λ = h2 /4ma5 .

1.6.3 Equações de Euler com vı́nculos


Vamos retornar à equação de Euler (1.103) para várias variáveis dependentes e
independentes, no caso em que haja m vı́nculos expresos pela forma geral

ϕk (y1 , y2 , . . . yn ; x1 , x2 , . . . xn ) = 0, (k = 1, 2, . . . m) (1.125)

de sorte que yi e xi não são mais mutuamente independentes, como presu-


mimos até agora. Assim como no caso dos problemas de extremos no cálculo
usual, para cada equação de vı́nculo introduzimos um multiplicador de Lagrange
λk (x1 , . . . xn ).
Multiplicando (1.125) pelos multiplicadores de Lagrange e integrando entre
os pontos fixos 1 e 2 temos
Z 2
λk (xj )ϕk (yi , xj )dxj = 0, (1.126)
1
1.6. PROBLEMAS VARIACIONAIS COM VÍNCULOS 29

y(x)

−a 0 a x

Figura 1.8: O problema isoperimétrico.

tal que a variação correspondente seja também identicamente nula para cada
vı́nculo Z 2
δ λk (xj )ϕk (yi , xj )dxj = 0, (k = 1, 2, . . . m). (1.127)
1

Por outro lado, sabemos que também é nula a variação do funcional (1.102)
Z 2
δ f (yi , yij , xj )dxj = 0. (1.128)
1

Somando (1.128) e (1.127) para todos os m vı́nculos temos que


Z 2" m
X
#
δ f (yi , yij , xj ) + λk (xj )ϕk (yi , xj ) dxj = 0, (1.129)
1 k=1
| {z }
≡g(yi ,yij ,xj )

onde definimos
m
X
g(yi , yij , xj ) = f (yi , yij , xj ) + λk (xj )ϕk (yi , xj ). (1.130)
k=1

Portanto, na presença dos vı́nculos, (1.129) implica em que precisamos sa-


tisfazer n equações de Euler do tipo (1.103) para a nova função (1.130):

n  
∂g X ∂ ∂g
− = 0. (i = 1, 2, . . . n) (1.131)
∂yi j=1 ∂xj ∂yij

O problema isoperimétrico
Um dos mais famosos problemas variacionais com vı́nculo é o isoperimétrico,
também chamado “problema de Dido”: dentre todas as curvas de um dado
comprimento ℓ no semi-plano superior, ligando dois pontos fixos 1 : (−a, 0) e
30 CAPÍTULO 1. EQUAÇÃO DE EULER

2 : (a, 0), encontrar a curva que, juntamente com o intevalo [−a, a], envolve a
maior área possı́vel [Figura 1.8].
A área sob a curva y(x)
Z a
A(y, x) = ydx, (1.132)
−a

é o funcional que se quer maximizar, entre os pontos fixos, sujeito à condição


de que o comprimento seja constante:
Z 2 Z ap
ds = 1 + yx2 dx = ℓ (1.133)
1 −a

onde usamos (1.23).


Este vı́nculo leva-nos a introduzir um único (m = 1) multiplicador de La-
grange λ, de modo que a condição de vı́nculo pode ser escrita na forma padrão
(1.127) desde que definamos
p
ϕ(yx ) = 1 + yx2 , (1.134)

assim como a função (1.130) é dada por


p
g = f + λϕ = y + λ 1 + yx2 . (1.135)

que satisfaz a equação de Euler (1.131):


 
∂g d ∂g
− = 0
∂y dx ∂yx
!
d λy
1− p x = 0
dx 1 + yx2
λyx
p −x = C = constante.
1 + yx2
Isolando a derivada yx chegamos à seguinte equação diferencial
dy C +x
=q , (1.136)
dx 2
λ2 − (C + x)

que pode ser integrada fornecendo


2 2
(x + C) + (y + C1 ) = λ2 (1.137)

onde C1 é uma constante de integração. Essa é a equação de um cı́rculo de raio


λ e com centro no ponto de coordenadas (C, C1 ). Os pontos fixos (−a, 0) e (a, 0)
devem pertencer a esse cı́rculo. Como, por simetria, o centro do cı́rculo deve
estar na origem (veja a Fig. 1.8), temos que C = C1 = 0 e o raio do cı́rculo é
λ = a, tal que a equação do cı́rculo seja simplesmente

x 2 + y 2 = a2 . (1.138)

O problema isoperimétrico tem uma história curiosa, remontando à Grécia


antiga, quando a Rainha Dido fundou a cidade de Cartago. Por motivos belico-
sos, Dido fez uma barganha com o senhor local, que concordou (ingenuamente)
1.6. PROBLEMAS VARIACIONAIS COM VÍNCULOS 31

0 x
L

Figura 1.9: Catenária.

em dar a ela tanta terra quanto ela pudesse envolver com um pelego de boi. A
esperta Rainha instruiu seus seguidores a cortar o pelego em fitas muito finas
e atá-las uma à outra, de modo que ela pôde envolver uma área muito grande
de terra em frente ao Mar Mediterrâneo, que tornou-se a cidade de Cartago.
Os gregos antigos já sabiam que o arco de cı́rculo era a solução do problema
isoperimétrico.

A catenária
Uma corrente ou cabo pesado de comprimento C está suspenso num plano
vertical entre os pontos de coordenadas 1 : (0, a) e 2 : (L, b) [Fig. 1.9], tal
que sua forma seja descrita pela função y(x), escolhida de forma a minimizar a
energia potencial. Seja ρ = dm/dℓ a densidade de massa do cabo. A energia
potencial será o seguinte funcional
Z 2 Z 2 Z 2 Z L p
V (y, yx ) = dV = dmgy = ρg yds = ρg dxy 1 + yx2 , (1.139)
1 1 1 0

onde usamos (1.22), e usamos o sı́mbolo g para representar a aceleração da


gravidade, a fim de que não haja confusão notacional.
O vı́nculo nesse problema é que a corda é suposta inextensı́vel, de modo que
o seu comprimento seja constante:
Z 2 Z L p
C= ds = dx 1 + yx2 , (1.140)
1 0

que pode ser colocada na forma (1.127) desde que


p
ϕ(yx ) = 1 + yx2 , (1.141)

tal que, introduzindo o multiplicador de Lagrange, a expressão (1.130) fica


p
g = f + λϕ = (ρgy + λ) 1 + yx2 . (1.142)
32 CAPÍTULO 1. EQUAÇÃO DE EULER

Como a função g não depende explicitamente da variável independente x po-


demos, ao invés da equação de Euler (1.131), empregar a identidade de Beltrami
(1.15):

∂g
g − yx = k = constante
∂y
" #
p yx yx
(ρgy + λ) 1 + yx2 − yx ρgy p + λp =
2
1 + yx 1 + yx2
p yx
(ρgy + λ) 1 + yx2 − yx (ρgy + λ) p =
1 + yx2

Um pouco de álgebra mostra que a expressão anterior reduz-se à equação


diferencial q
dy 1 2
= (ρgy + λ) − k 2 (1.143)
dx k
que tem como solução a equação da catenária 1
  
1 x+h
y(x) = −λ + k cosh , (1.144)
ρg k

onde h é uma constante de integração. Esta e as outras constantes podem ser


determinadas de forma implı́cita aplicando as condições sobre os pontos fixos:
 
h
y(0) = a ⇒ ρga + λ = k cosh , (1.145)
k
 
b+h
y(b) = L ⇒ ρgL + λ = k cosh , (1.146)
k

além da condição de vı́nculo


Z L Z L      
p x+h L L + 2h
C= dx 1 + = yx2dx cosh = 2k cosh sinh .
0 0 k 2k 2k
(1.147)
O nome catenária vem do latim catena, que significa cadeia, ou corrente. Ga-
lileo, erroneamente, considerava que a solução do problema seria uma parábola.
Curiosamente, se uma parábola rolar por uma reta, o foco da parábola descre-
verá uma catenária. Em 1691 a equação da catenária foi obtida independen-
temente por Leibniz, Huyghens e Johann Bernoulli, em resposta a um desa-
fio (sempre ele!) de Jakob Bernoulli. Vimos, anteriormente, que a catenária
também é a solução do problema de superfı́cies de revolução de mı́nima área.

1.6.4 Problemas mecânicos com vı́nculos


O formalismo anteriormente descrito pode ser aplicado imediatamente a siste-
mas mecânicos onde há m vı́nculos holonômicos, ou seja, vı́nculos cujas equações
podem ser escritos como

ϕk (q1 , q2 , . . . qn , t) = 0, (k = 1, 2, . . . m), (1.148)


1A substituição de variáveis ρgy + λ = k cosh θ pode ajudar.
1.6. PROBLEMAS VARIACIONAIS COM VÍNCULOS 33

r
x θ

h
l−x
φ

Figura 1.10: Aro rolando num plano inclinado.

onde qi são as coordenadas generalizadas. Por exemplo, o movimento plano de


uma partı́cula cuja trajetória é restrita a um cı́rculo de centro na origem e raio
R é caracterizado pelo seguinte vı́nculo holonômico:

x2 + y 2 = R 2 ⇒ ϕ = q12 + q22 − R2 = 0. (1.149)

Para cada equação de vı́nculo associamos um multiplicador de Lagrange


λk (t), com os quais formamos o equivalente mecânico da função (1.130), que é
m
X
g(qi , q̇i , t) = L(qi , q̇i , t) + λk (t)ϕk (qi , t), (1.150)
k=1

que satisfaz a equação de Euler-Lagrange na forma (1.131):


 
∂g d ∂g
− = 0
∂qi dt ∂ q̇i
m  
∂L X ϕk (qi , t) d ∂L
− λk (t) − = 0
∂qi ∂qi dt ∂ q̇i
k=1

que podemos reescrever, definindo ϕki = ∂ϕk /∂qi , como


  m
d ∂L ∂L X
− = varphiki λk . (1.151)
dt ∂ q̇i ∂qi
k=1

Por curiosidade, se a coordenada generalizada qi tiver dimensão de comprimento,


então o produto λk ϕki representa a componente ao longo da direção qi da força
do reação correspondendo ao k-ésimo vı́nculo.

Aro rolando num plano inclinado


Um problema clássico de vı́nculo holonômico em dinâmica lagrangeana é o de
um aro de massa M e raio r rolando sem deslizar sobre um plano inclinado
34 CAPÍTULO 1. EQUAÇÃO DE EULER

de ψ em relação à horizontal. Podemos usar, como coordenadas generalizadas,


q1 = x: distância percorrida pelo aro sobre o plano inclinado, e q2 = θ: ângulo
de rotação do aro em relação ao eixo que passa pelo seu centro de massa [Fig.
1.10]. A condição de vı́nculo impõe que o elemento de arco percorrido pelo aro
é o mesmo elemento de distância ao longo do plano, ou seja rdθ = dx, que
podemos escrever como
ϕ(x, θ) = rθ − x = 0 (1.152)
Tiramos, então, os coeficientes de vı́nculo:
∂ϕ ∂ϕ
ϕx = = −1, ϕθ = = r, (1.153)
∂x ∂θ
ambos associados ao mesmo multiplicador de Lagrange λ.
A energia cinética do aro é igual à energia de translação do centro de massa
mais a energia cinética de rotação em torno do eixo que passa pelo centro de
massa
1 1
K(ẋ, θ̇) = M ẋ2 − I θ̇2 (1.154)
2 2
onde o momento de inércia do aro é I = M r2 . A energia potencial gravitacional
do centro de massa do aro é
U (x) = M gh = M g[(ℓ − x) sin ψ + r cos ψ], (1.155)
onde ℓ é o comprimento total do plano inclinado [Fig. 1.10]. Como o termo
M gr cos ψ é uma constante, ele pode ser ignorado, pois representa apenas um
fator constante aditivo na energia potencial (que, lembramos, é sempre definida
a menos de uma constante aditiva). Logo, a Lagrangeana é
1 1
L=K −U = M ẋ2 − M r2 θ̇2 − M g(ℓ − x) sin ψ. (1.156)
2 2
Há duas equações de Euler-Lagrange da forma (1.151):
 
d ∂L ∂L d
− − ϕx λ = = (M ẋ) − M g sin ψ + λ = 0
dt ∂ ẋ ∂x dt
 
d ∂L ∂L d
− − ϕθ λ = = (M r2 θ̇) − rλ = 0
dt ∂ θ̇ ∂θ dt
Como r é constante, então há duas equações diferenciais a serem resolvidas
M ẍ − M g sin ψ = −λ (1.157)
M r2 θ̈ = λr (1.158)
Da equação de vı́nculo (1.152) ẍ = rθ̈ que, substituido em (1.158), fornece
M ẍ = λ. Pondo esse resultado em (1.157) temos que o multiplicador de La-
grange é
1
λ = M g sin ψ (1.159)
2
tal que a equação do movimento sejam simplesmente
g sin ψ
ẍ = ≡ K1
2
g sin ψ K1
θ̈ = =
2r r
1.6. PROBLEMAS VARIACIONAIS COM VÍNCULOS 35

θ R

0 x

Figura 1.11: Conta deslizando sobre uma calota hemisférica.

Supondo que, em t = 0, tenhamos as condições iniciais x(0) = 0, ẋ(0) = 0


(aro no alto do plano inclinado em repouso) e θ(0) = 0, θ̇(0) = 0 as equações
acima têm soluções triviais
1 1 K1 2
x(t) = K1 t 2 , θ(t) = t . (1.160)
2 2 r
Observe que o aro desce o plano inclindado rolando sem deslizar com aceleração
K1 , que é a metade da aceleração que ele teria se deslizasse em rolar por um
plano sem atrito (como uma partı́cula, portanto). Logo, o atrito é responsável
pelo rolamento do aro, e o multiplicador de Lagrange λ, que é a força de vı́nculo
é, na verdade, a força de atrito de rolamento.

Conta deslizando sobre uma calota


Vamos considerar uma calota hemisférica de raio R com centro na origem [Fig.
1.11] e uma conta de massa m que desliza sobre a mesma tal que sua posição
pode ser especificada pelas coordenadas polares (r, θ) (a conta pode deixar a
calota, de modo que r não é constante), que serão as coordenadas generalizadas
do problema [[3], pg. 1068]. A Lagrangeana correspondente é
1
L(r, θ; ṙ, θ̇) = m(ṙ2 + r2 θ̇2 ) − mgr cos θ. (1.161)
2
Enquanto a conta está deslizando sobre a calota, a condição de vı́nculo é r = R,
ou ϕ(r) = r − R = 0, de sorte que os coeficientes de vı́nculo são
∂ϕ ∂ϕ
ϕr = = 1, ϕθ = = 0, (1.162)
∂r ∂θ
As equações de Euler-Lagrange (1.151) são
 
d ∂L ∂L d
− − ϕr λ = (mṙ) − mrθ̇2 + mg cos θ − λ(θ) = 0(1.163)
dt ∂ ṙ ∂r dt
 
d ∂L ∂L d
− − ϕθ λ = (mr2 θ̇) − mgr sin θ = 0 (1.164)
dt ∂ θ̇ ∂θ dt
36 CAPÍTULO 1. EQUAÇÃO DE EULER

Enquanto a conta desliza sobre a calota r = R, portanto ṙ = 0, de modo que


−mRθ̇2 + mg cos θ − λ(θ) = 0 (1.165)
mR2 θ̈ − mgR sin θ = 0 (1.166)
Derivando (1.165) em relação ao tempo

−2mRθ̇θ̈ − mg θ̇ sin θ = θ̇ (1.167)

e dividindo tudo por θ̇ obtemos
g sin θ
θ̈ = (1.168)
R
que, substituido em (1.167), fornece por integração o multiplicador de Lagrange
λ(θ) = 3mg cos θ + C (1.169)
onde C é uma constante de integração.
O multiplicador de Lagrange é a componente radial da força de reação da
calota agindo sobre a conta. Quando a conta está no alto da calota (θ = 0) essa
força é igual ao peso da conta mg. Portanto a constante de integração é dada
por C = λ(0) − 3mg = −2mg, de forma que λ(θ) = mg(3 cos θ − 2). A partı́cula
permanecerá sobre a calota desde que λ(θ) > 0, ou seja, ela deixará a calota
quando cos θ = 2/3, que fornece o ângulo crı́tico θc = 48o 11′ .

1.7 Problemas
1. Encontre a função y(x) que torna a integral
Z 1
J= (2x + 3y + yx2 )dx
0

um extremo, com y(0) = y(1) = 1.


2. Mostre que o caminho no espaço tridimensional que fornece a menor distância
entre dois pontos quaisquer é um segmento de reta unindo estes dois pontos.
3. Considere o problema da braquistócrona, mas ao invés de uma partı́cula consi-
dere uma esfera de mesma massa e raio a rolando sem deslizar (mas com atrito
desprezı́vel). Ache a forma da trajetória que minimiza o tempo de percurso.
4. Mostre que a ciclóide é uma tautócrona, por meio dos seguintes passos:
p
(a) dt = a/gdθ, onde a = k2 /2;
(b) O tempo decorrido para uma partı́cula sem atrito se deslocar do ponto de
coordenadas (0, 0), ou seja, tal que θ = 0, até o ponto mais baixo da trajetória
(onde θ = π, correspondendo a meio ciclo da ciclóide), é
r
a
T12 = π;
g

(b) O tempo decorrido para uma partı́cula se deslocar do ponto genérico (x0 , y0 ),
ou seja, tal que θ = θ0 , até o ponto mais baixo da trajetória, é
sin θ2
r Z π 
a
T32 =  dθ;
g θ0
q
cos2 θ0 − cos2 θ

2 2
1.7. PROBLEMAS 37

(c) Usando a substituição de variável u = cos(θ/2)/ cos(θ0 /2), T32 = T12 , inde-
pendentemente do valor de θ0 (ponto inicial).

5. Mostre que a superfı́cie mı́nima de revolução também é uma catenóide mesmo


quando o eixo de rotação é y ao invés de x.

6. Estude a existência das soluções de Goldschmidt para o problema da superfı́cie


mı́nima entre dois cı́rculos de raio y0 cujos centros têm coordenadas (±x0 , 0), por
meio das seguintes etapas [http://mathworld.wolfram.com/SurfaceofRevolution.html]:
(a) Substituindo (1.45) em (1.40), mostre que a área da catenóide será
   
2x0 2x0
A = πa2 sinh + ;
a a

(b) Considere, por exemplo, o caso onde x0 = 0, 5 e y0 = 1, para o qual a razão


x0 /y0 = 0, 5 < 0, 663, portanto permitindo soluções do tipo catenóide, de acordo
com (1.51). Mostre graficamente que há duas soluções possı́veis: a1 = 0, 234 e
a2 = 0, 848, correspondendo a dois valores para a área da catenóide: A1 = 6, 845
e A2 = 5, 992. Como isso pode ocorrer, se a área foi obtida a partir de um
tratamento variacional?
(c) A área das soluções de Goldschmidt é AG = 2πy02 . Mostre que, se a área da
catenóide for igual a AG , vale a equação transcendente (com u = py0 = y0 /a)
p
u u2 − 1 + cosh−1 u − u2 = 0,

que tem uma solução positiva em u0 = 1, 211. Usando esse resultado em (1.47)
mostre que
x0 cosh−1 u0
= = 0, 527
y0 u0
de forma que se

• (x0 /y0 ) < 0, 527: só há a solução do tipo catenóide;


• 0, 527 < (x0 /y0 ) < 0, 663: a catenóide coexiste com a solução de Goldsch-
midt (mas A < AG , de modo que a catenóide é um mı́nimo relativo);
• (x0 /y0 ) > 0, 663: só há a solução de Goldschmidt.

7. Além da catenóide e da solução de Goldschmidt, existe ainda uma terceira


solução para o problema de superfı́cie mı́nima, consistindo de um disco de raio
r entre os aros e suportado por duas catenóides apoiadas em cada aro circular.
(a) Mostre que r = c1 cosh c3 , onde c1 e c3 são constantes;
(b) Mostre que a área dessa terceira solução é
    
x0 x0
πc21 sinh 2 + c3 + [cosh2 (c3 ) − sinh(2c3 )] + 2
c1 c1

que é maior do que a área de uma única catenóide, mas é um mı́nimo relativo;
(c) Plateau propôs que filmes de sabão sempre se conectam de três em três,
fazendo ângulos de 120o entre as respectivas tangentes. Aplicando essa regra
√ à
conexão entre as catenóides e o disco central, mostre que c3 = sinh−1 (1/ 3) =
0, 549, tal que cosh2 (c3 ) − sinh(2c3 ) = 0.
(d) Mostre que o valor máximo da razão x0 /y0 para a ocorrência dessa terceira
solução é 0, 377.
38 CAPÍTULO 1. EQUAÇÃO DE EULER

8. A hipociclóide é a curva produzida por um ponto fixo P sobre um cı́rculo de


raio b que rola sem deslizar pelo interior de um cı́rculo de raio a > b. Sendo φ
o ângulo de rotação para o segmento que une os centros dos dois cı́rculos e o
ponto P , as equações paramétricas cartesianas da hipociclóide são
   
a−b a−b
x(φ) = (a − b) cos φ − b cos φ , y(φ) = (a − b) sin φ + b sin φ ,
b b
Mostre que, em termos do problema do túnel numa esfera de raio a = R, o raio
do cı́rculo menor é b = (R − r0 )/2 e que 2Ωt = aφ/b.

9. Considere uma partı́cula de massa m sob a ação de um potencial V (ρ, φ, z)


em coordenadas cilı́ndricas. Obtenha a Lagrangeana da partı́cula e escreva as
equações de Lagrange.

10. O pêndulo esférico consiste de uma massa m pendurada por um fio de compri-
mento ℓ. A massa m é livre para mover-se no espaço, cuja posição é determinada
pelos seus ângulos θ e φ (em coordenadas esféricas).
(a) Obtenha a Lagrangeana da partı́cula e escreva as equações de Lagrange.
(b) Considere o caso particular em que p o fio do pêndulo descreve um cone de
pequena abertura θ0 . Mostre que φ̇ = g/d, onde d = ℓ cos θ0 é a distância
vertical do plano de rotação abaixo do ponto de suspensão.
(c) Suponha, agora, que o movimento é quase-cônico, ou seja, que θ = θ0 + δθ,
onde δθ ≪ θ0 . Expandindo a equação de Lagrange em série de potências mostre
que  p 
θ(t) ≈ θ0 + δθ0 cos tφ̇0 1 + 3 cos2 θ0

11. Na teoria dos reatores de fissão nuclear um problema consiste em minimizar


o volume de um reator cilı́ndrico de raio R e altura H sujeito a um vı́nculo
determinado pela teoria da difusão de nêutrons:
 α 2  π  2
01
+ = C = constante,
R H
onde α01 = 2, 4048... é a menor raiz da função de Bessel J0 (R). Ache a relação
entre R e H.

12. Considere uma elipse de semi-eixos a e b, cuja equação cartesiana é


 x 2  y  2
+ = 1.
a b
Obtenha o retângulo inscrito nessa elipse cuja área seja a maior possı́vel. Mostre
que, para esse retângulo máximo, a área é 64% da área da elipse.

13. Resolva o problema isoperimétrico considerando que a curva é parametrizada


pela distância s medida ao longo da curva, tal que as equações paramétricas da
curva sejam escritas como x = x(s) e y = y(s). A área a ser maximizada é
Z ℓ
dx
A= y ds
0 ds
onde ℓ é o comprimento total da curva.

14. Um pêndulo sı́mples consiste de uma partı́cula de massa m suspensa por um


fio leve e inextensı́vel de comprimento ℓ. Ache a Lagrangeana, a condição de
vı́nculo, e as equações de Euler-Lagrange. Resolva essas equações para o caso
de pequenas oscilações, e encontre a força de tensão no fio via multiplicadores
de Lagrange.
1.7. PROBLEMAS 39

15. Uma partı́cula de massa m está constrangida a mover-se ao longo de uma haste
sem atrito que gira com velocidade angular constante ω sobre um plano horizon-
tal. Ache a Lagrangeana, condição de vı́nculo, as equações de Euler-Lagrange.
Obtenha a posição radial em função do tempo para as condições iniciais r(0) = r0
e ṙ(0) = 0. Ache a força de vı́nculo exercida sobre a partı́cula pela haste.
40 CAPÍTULO 1. EQUAÇÃO DE EULER
Capı́tulo 2

Métodos variacionais
aplicados

2.1 Revisão sobre a equação de Sturm-Liouville


A equação de Sturm-Liouville tem a forma geral
 
d dy
p(x) − s(x)y = −λr(x)y, (2.1)
dx dx

onde y ∈ R, a ≤ x ≤ b, e as funções p(x), s(x) e r(x) (esta última denominada


função peso) assumem valores não-negativos. Definindo o operador de Sturm-
Liouville  
d d
L≡ p(x) − s(x), (2.2)
dx dx

reescrevemos a equação (2.1) na forma compacta

L[y] = −λr(x)y. (2.3)

O operador de Sturm-Liouville é linear, ou seja, se y1 e y2 forem soluções da


equação (2.3), então uma combinação linear das mesmas também o será:

L[c1 y1 + c2 y2 ] = c1 L[y1 ] + c2 L[y2 ]. (2.4)

Em consequência, as soluções da equação (2.1) formam um espaço vetorial linear


real, que é munido de um produto interno definido por
Z b
< y1 , y2 >≡ y1 (x)y2 (x)dx. (2.5)
a

e duas soluções são ortogonais se o produto interno entre elas for nulo: <
y1 , y2 >= 0.
A norma de uma solução y(x) é definida como

||y(x)|| = < y, y >. (2.6)

41
42 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

Como desejamos que a norma das soluções seja finita


Z b
[y(x)]2 dx < ∞, (2.7)
a

as soluções y(x) devem ser funções de quadrado integral, de modo que o espaço
das funções é denotado L2 [a, b]. Em geral, para funções complexas, esse espaço
é dito de Hilbert.
Para a discussão atual basta considerarmos condições de contorno de Diri-
chlet homogêneas:
y(a) = y(b) = 0 (2.8)
para as quais a equação de Sturm-Liouville só apresenta soluções aceitáveis para
determinados valores de λ = λn , denominados autovalores do operador (2.2).
A cada autovalor corresponde um e somente uma solução correspondente, dita
autofunção φn (x), e que satisfaz a equação

L[φn (x)] = −λn r(x)φn (x). (2.9)

Pode-se mostrar que o operador de Sturm-Liouville é auto-adjunto, ou seja,

< L[y1 ], y2 >=< y1 , L[y2 ] > (2.10)


∞ ∞
Em consequência, os autovalores {λn }n=1 são reais, e as autofunções {φn (x)}n=1
correspondentes a autovalores distintos são ortogonais em relação à função peso:
< φn , r(x)φj >= 0 se i 6= j. Se supusermos, adicionamente, que as autofunções
são normalizadas (norma igual a um) então temos a chamada condição de orto-
normalidade (em relação à função peso r(x)):
Z b
φi (x)φj (x)r(x)dx = δij . (2.11)
a

2.2 A equação de Sturm-Liouville como um pro-


blema variacional
Vamos mostrar que, se y(x) é uma solução da equação de Sturm-Liouville (2.1),
então o funcional
Z b  
K[y] = p(x)yx2 + s(x)y 2 − λr(x)y 2 dx (2.12)
a

é estacionário. Logo, a equação de Sturm-Liouville pode ser encarada como uma


equação de Euler para a função

f (y, yx , x) ≡ p(x)yx2 + s(x)y 2 − λr(x)y 2 (2.13)

De fato, abrindo o lado esquerdo da equação de Euler (1.14):


 
∂f d ∂f
− = 0
∂y dx ∂yx
d
2sy − 2λry − (2pyx ) = 0
dx
2.2. A EQUAÇÃO DE STURM-LIOUVILLE COMO UM PROBLEMA VARIACIONAL43

que, dividindo por −2, resulta na equação de Sturm-Liouville (2.1), como querı́amos
demonstrar.
Integrando por partes a primeira parcela do integrando do funcional K,
temos que
Z b Z b Z b
dy b d
pyx2 dx = pyx dx = pyx y|a − y (py )dx (2.14)
a a |{z} dx
| {z } a |{z} |dx {zx }
=u =v
=dv =du

Pelas condições de contorno (2.8) o primeiro termo do lado direito é nulo, pois

p(b)yx (b)y(b) − p(a)yx (a)y(a) = 0 (2.15)

Logo, o funcional (2.12) fica


  
Z b
 d




K[y] = − 
 dx (p(x)y x ) − sy 
 y − y(λr(x)y) (2.16)
a 

 | {z } 


=L[y]

que, usando a notação do produto interno (2.5), resulta em

2
K[y] = − < y, L[y] > − < y, λr(x)y >= − < y, L[y] > −λ||y|| (2.17)

Essa forma para o funcional permite-nos encarar o problema de Sturm-


Liouville também sob a forma de um problema variacional com vı́nculos: achar
a função y(x) que torna estacionário o funcional K[y] (sem restrições) equivale
a tornar estacionário o funcional

J[y] = − < y, L[y] > (2.18)

sujeito à condição de vı́nculo


2
N [y] =< y, r(x)y >= ||y|| = constante, (2.19)

onde λ passa a ser, aqui, um multiplicador de Lagrange, desde que ∂N/∂y 6= 0


ou ∂N/∂x 6= 0.
Podemos, ainda, mostrar que, se y(x) satisfaz a equação de Sturm-Liouville
sem o termo em λ:  
d dy
p(x) − s(x)y = 0 (2.20)
dx dx
então o funcional (2.18) não só é um extremo, como também é um mı́nimo. Para
mostrar esse fato, vamos supor uma função ξ(x) suave e que satisfaça as mesmas
condições de contorno de Dirichlet homogêneas da equação de Sturm-Liouville:
ξ(a) = ξ(b) = 0, mas que não seja uma solução ela própria.
Definimos a função
ψ(x) ≡ ξ(x) − y(x) (2.21)
2
tal que ξ 2 = (ψ + y) = ψ 2 + 2ψy + y 2 e
2
ξx2 = (ψx + yx ) = ψx2 + 2ψx yx + yx2 ,
44 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

donde (2.18) é
Z b
J[ξ] = (pξx2 + sξ 2 )dx
a
= [p(ψ 2 + 2ψy + y 2 ) + s(ψx2 + 2ψx yx + yx2 )]dx
Z b Z b
= 2 (pψx yx + sψy)dx + (pψx2 + sψ 2 ) + J[y].
|a {z } a
=I

A variação no funcional será, portanto, dada por


Z b
∆J ≡ J[ξ] − J[y] = 2I + (pψx2 + sψ 2 )dx. (2.22)
a

Integrando por partes, e usando as condições de contorno, temos


Z b Z b
b d
pyx ψx dx = pyx ψ|a − ψ (pyx )dx (2.23)
a | {z } a dx
=0

donde
Z b   Z b  
d d
I=− ψ (pyx ) − sψy dx = − ψ (pyx ) − sy dx = 0, (2.24)
a dx a dx
| {z }
=0

em vista de (2.20).
Logo, subsituindo em (2.22),
Z b
∆J = (pψx2 + sψ 2 )dx ≥ 0 (2.25)
a

já que p(x) ≥ 0 e s(x) ≥ 0 para todo x ∈ [a, b]. Naturalmente ∆J = 0 se e


somente se ψ = 0, ou ξ = y (isto é, se a função for mesmo uma solução da
equação diferencial). Caso contrário (ξ 6= y) então ∆J > 0, ou J[ξ] > J[y], de
forma que J tem um mı́nimo se y for a solução da equação de Sturm-Liouville,
pois qualquer outra função que não seja solução (mas que satisfaça as mesmas
condições de contorno) resultará num valor maior para o funcional J.
Em resumo, a solução da equação de Sturm-Liouville L[y] = −λr(x)y com
condições de contorno homogêneas y(a) = y(b) = 0, é uma função que minimiza
o funcional J[y] = − < y, L[y] >, sujeito ao vı́nculo de que a norma da solução
2
||y(x)|| seja constante. λ será o multiplicador de Lagrange associado a esse
vı́nculo.

2.3 Autofunções de L como funções de base


Na linguagem da álgebra linear, um conjunto de vetores é completo se podemos
exprimir um vetor arbitrário como uma combinação linear deles sem que falte
nem sobre nenhum vetor. Os vetores de um conjunto completo formam uma
base para o espaço vetorial. Por exemplo, no R3 , o conjunto de versores {î, ĵ, k̂}
é completo, mas o conjunto {î, ĵ} não é, pois “falta alguém”.
2.3. AUTOFUNÇÕES DE L COMO FUNÇÕES DE BASE 45

Essa propriedade é razoavelmente fácil de verificar em espaços de dimensão


finita, como o Rn , mas como assegurar completeza num espaço de dimensão in-
finita, como o espaço das soluções da equação de Sturm-Liouville? Essa questão
está longe de ser trivial, pois uma combinação linear de um número infinito de
vetores só é um vetor do espaço se a série infinita correspondente convergir para
o respectivo vetor.
No caso da equação de Sturm-Liouville, se o espaço vetorial das soluções

y(x) tem uma base, então existe um conjunto completo de funções {φn (x)}n=1 ,
tal que y(x) possa ser expressa como uma superposição linear das funções de
base
X∞
y(x) = cn φn (x). (2.26)
n=1

onde cn =< y(x), φn (x) > são os coeficientes de Fourier generalizados.


A propriedade de completeza significa, nesse conexto, que a série infinita
acima converge no sentido de média quadrática, ou seja,
Z N
2
b X

lim y(x) − cn φn (x) dx = 0 (2.27)
N →∞ a
n=1


de modo que {φn (x)}n=1 é dita uma sequência de Cauchy.

No momento, as funções {φn (x)}n=1 satisfazem as condições de contorno
mas não são necessariamente soluções da equação de Sturm-Liouville. O obje-
tivo dessa seção é mostrar, através de métodos variacionais, que o conjunto de
autofunções do operador de Sturm-Liouville é completo no sentido acima, ou
seja, que as autofunções servem de base para o espaço das soluções y(x).
Começamos substituindo a série infinita (2.26) no funcional (2.18):
* ∞ "∞ #+
X X X
J[y] = − cm φ m , L cn φ n =− cm cn hφm , L [φn ]i (2.28)
m=1 n=1 m,n

onde usamos a linearidade do operador de Sturm-Liouville. Definindo os coefi-


cientes
Z b  
d
Amn = − hφm , L [φn ]i = − φm (pφnx ) + sφn dx
a dx
Z b
= (pφmx φnx + sφm φn )dx (2.29)
a

onde integramos por partes para obter o resultado final, e denotamos φnx =
dφn /dx, etc. Desta forma o funcional (2.28) pode ser escrito como uma expansão
bilinear nos coeficientes cn .
X
J[y] = Amn cm cn (2.30)
m,n

Fazendo a mesma na condição de vı́nculo (2.19) chegamos a nova expansão


bilinear X X
N [y] = cm cn hφm , r(x)φn i = Rmn cm cn , (2.31)
m,n m,n
46 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

onde definimos Z b
Rmn = hφm , r(x)φn i = φm r(x)φn dx. (2.32)
a

Combinando (2.30) e (2.31) o funcional (2.17) é escrito como


X
K[y] = J[y] − λN [y] = cm cn (Amn − λRmn ). (2.33)
m,n


Sendo dado o conjunto completo de funções {φn (x)}n=1 , os coeficientes Amn
e Rmn são conhecidos a priori, de forma que os valores estacionários de K ficam
determinados pelas condições variacionais

∂K
= 0, (j = 1, 2, . . .) (2.34)
∂cj

Impondo essas condições na expansão bilinear (2.33)

∂K X
= (Amn − λRmn )(cm δnj + δmj cn )
∂cj m,n
X X
0 = (Amj − λRmj )cm + (Ajn − λRjn )cn
m n
X
0 = [(Anj + Ajn ) − λ(Rnj + Rjn )]cn
n

onde trocamos m por n, posto que são ı́ndices mudos.


Pelas definições (2.29) e (2.32) é evidente que os coeficientes são simétricos
mediante a troca dos ı́ndices, de forma que, dividindo por 2, temos

X
(Ajn − λRjn )cn = 0, (j = 1, 2, . . .) (2.35)
n=1

que é um sistema linear homogêneo com infinitas equações.



Agora vamos supor que {φn (x)}n=1 sejam as autofunções do operador de
Sturm-Liouville, com as propriedades (2.9). Nesse caso, os coeficientes serão

Amn = λn < φm , rφn >= λn δmn (2.36)


Rmn = < φm , rφn >= δmn (2.37)

onde usamos a ortonormalidade das autofunções (2.11). O sistema linear (2.35)


ficará diagonalizado

X
(λn − λ)δjn cn = (λj − λ)cj = 0, (j = 1, 2, . . .) (2.38)
n=1

Se quisermos soluções não-triviais para esse sistema, ou seja cj 6= 0, então


λj − λ = 0 para todo j, de modo que λ = λj : os multiplicadores de Lagrange
devem ser os autovalores do operador de Sturm-Liouville. Consequentemente,
o conjunto das autofunções é completo e pode ser usado como funções de base
para o espaço das soluções.
2.4. O MÉTODO DE RAYLEIGH-RITZ 47

2.4 O método de Rayleigh-Ritz


Vimos anteriormente que, se escolhermos uma função arbitrária ξ(x) no inter-
valo a ≤ x ≤ b que satisfaça as condições de contorno ξ(a) = ξ(b) = 0, o
funcional de Sturm-Liouville L[ξ] terá um valor maior do que teria para uma
solução bona fide da equação de Sturm-Liouville. Esse importante resultado
é a base do método variacional de Rayleigh-Ritz, pelo qual podemos obter in-
formações relevantes sobre o problema de Sturm-Liouville sem precisar resolvê-lo
diretamente. O método de Rayleigh-Ritz fornece soluções aproximadas para o
problema, cuja exatidão pode ser refinada de forma a termos respostas tão pre-
cisas quanto se queira. Por esse motivo, esse método é bastante usado em várias
áreas como acústica (campo onde foi originalmente proposto por Lord Rayleigh
em ), mecânica quântica, vibrações mecânicas, análise numérica, entre outras.
N
Nós partimos de um conjunto de N funções linearmente independentes {φ̂n (x)}n=1
que satisfazem as condições de contorno do problema de Sturm-Liouville mas
não são autofunções de L, de modo que o que procuramos é uma solução apro-
ximada na forma de uma combinação linear dessas funções
N
X
ŷ(x) = ĉn φ̂n (x) (2.39)
n=1

Substituindo (2.39) no funcional (2.17) e repetindo as manipulações algébricas


explicadas na seção precedente obteremos que
X X
ˆ − λ̂N̂ [ŷ] =
K̂[ŷ] = J[ŷ] m = 1N n = 1N ĉm ĉn (Âmn − λ̂R̂mn ), (2.40)

onde os chapéus foram colocados em todas as funções para denotar o caráter


aproximado da solução procurada:
D h iE
Âmn = − φ̂m , L φ̂n (2.41)
D E
R̂mn = φ̂m , r(x)φ̂n (2.42)

Aqui, como antes, a condição de que o funcional K̂ seja estacionário implica


nas seguintes condições variacionais:

∂ K̂
= 0, (j = 1, 2, . . . N ) (2.43)
∂ĉj

Substituindo (2.40) em (2.43) resultará um sistema linear homogêneo porém


finito (ao invés de infinito, como na seção anterior), com N equações e N
incógnitas, a saber, os coeficientes ĉj :
N
X
(Âjn − λ̂R̂jn )ĉn = 0, (j = 1, 2, . . . N ) (2.44)
n=1

Se desejamos que este sistema tenha soluções não-triviaix, ou seja, que ĉj 6=
0, então o determinante dos coeficientes deve ser nulo:

det(Âjn − λ̂R̂jn ) = 0, (2.45)


48 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

que é uma equação algébrica de grau N . Pelo teorema fundamental da álgebra,


N
teremos N raı́zes reais ou complexas, que são os autovalores aproximados {λ̂n (x)}n=1 .
Espera-se que este conjunto reproduza aproximadamente um certo número de
autovalores exatos do sistema λn . Veremos, por meio de alguns exemplos, que se
as funções φ̂n (x) forem “chutadas” corretamente, já com uma ou duas funções
é possı́vel obter excelentes aproximações para os autovalores.

2.4.1 Exemplos de aplicação do método


Equação de Helmholtz unidimensional
A equação de Helmholtz em uma dimensão [[1], pg. 575]

yxx + λy = 0, (−1 ≤ x ≤ 1) (2.46)

é um caso particular da equação de Sturm-Liouville para p(x) = 1, s(x) = 0 e


r(x) = 1, com a = −1 e b = 1. Supomos condições de contorno de Dirichlet
homogêneas y(−1) = y(1) = 0.
Vamos inicialmente escolher uma única função (N = 1):

φ̂1 (x) = 1 − x2 (2.47)

que satisfaz as condições de contorno φ̂1 (±1) = 0, de modo que a solução apro-
ximada é
ŷ(x) = ĉ1 φ̂1 (x) = ĉ(1 − x2 ). (2.48)
O funcional (2.40) é, em vista de (2.12), dado por
Z 1  
K̂[ŷ] = ŷx2 − λ̂ŷ 2 dx
−1
Z 1  
2
= 4ĉx2 − λ̂ĉ2 (1 − x2 ) dx
−1
 
2 8 16
= ĉ − λ̂ (2.49)
3 15

Aplicando a condição variacional (2.43)


 
∂ K̂ 8 16
= 2ĉ − λ̂ = 0, (2.50)
∂ĉ 3 15

temos que
5
= 2, 5
λ̂ =
2
Naturalmente esse problema tem uma solução exata, que é
 πx 
y(x) = cos
2
que, derivada duas vezes, fornece
 π 2  πx   πx 
yxx = − cos = −λy = −λ cos ,
2 2 2
2.4. O MÉTODO DE RAYLEIGH-RITZ 49

exata
aproximada
0,8

0,6
y(x)

0,4

0,2

0
-1 -0,5 0 0,5 1
x

Figura 2.1: Soluções exata e aproximada da equação (2.46).

que fornece o autovalor exato:


π2
λ= = 2, 467...
4
que resulta num erro relativo de apenas 1, 3%, um resultado surpreendente tendo
em vista que estamos aproximando a solução com apenas uma função. Natu-
ralmente isso ocorre pois a função que “chutamos” é, de fato, muito próxima à
solução exata [Fig. 2.1].

Menor raiz da função de Bessel com m = 3


Vamos considerar a equação de Bessel com m = 3 [[1], pg. 576]
 
1 2 32
yxx + yx + k − 2 y = 0, (0 ≤ x ≤ 1) (2.51)
x x
com a condição de contorno que y(0) < ∞ e y(1) = 0. Ela tem a forma da
equação de Sturm-Liouville se p(x) = x, s(x) = 9/x, r(x) = x, e λ = k 2 .
Sabemos, de Métodos I, que a solução de (2.51) que é regular (isto é, que
não diverge) na origem é a função de Bessel de ordem m = 3:
y(x) = AJ3 (kx). (2.52)
onde A é uma constante de integração. Impondo que y(1) = 0 temos que
AJ3 (k) = 0. Se A 6= 0, então J3 (k) = 0, ou seja, k é uma raiz da função
de Bessel de ordem m = 3. As primeiras raizes de J3 (k) são k1 = 6, 380...,
k2 = 9, 761..., k3 = 13, 015.. e assim por diante [Fig. 2.2]. Logo a solução exata
correspondendo à menor raiz da função de Bessel com m = 3 é
y(x) = AJ3 (k1 x) = AJ3 (6, 380x).
50 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

0.5

0.4

0.3

0.2

J3(x) 0.1

−0.1

−0.2

−0.3
0 2 4 6 8 10 12 14 16 18 20
x

Figura 2.2: Função de Bessel de ordem m = 3.

Usamos o método de Rayleigh-Ritz empregando, como função tentativa,

φ̂1 (x) = x3 (1 − x) (2.53)

que satisfaz as condições de contorno, pois φ̂1 (0) = 0 e φ̂1 (1) = 0; de modo que
ŷ = ĉx3 (1 − x) e montamos o funcional (2.49):
Z 1h i
K̂[ŷ] = p(x)ŷx2 + s(x)ŷ 2 − k̂ 2 r(x)ŷ 2 dx
0
Z 1 
9
= xŷx2 + ŷ 2 − k̂ 2 r(x)ŷ 2 dx
0 x
Z 1 h i 9 
2 2 2
= ĉ2 x 9x4 (1 − x) − 6x5 (1 − x) + x6 + [x6 (1 − x) − k̂ 2 x7 (1 − x) dx
x
0 
1 1 2
= ĉ2 − k̂
8 360

Aplicando
√ a condição variacional ∂ K̂/∂ĉ = 0 chegamos ao autovalor aproximado
k̂ = 45 = 6, 708.... Comparando esse resultado com a menor raiz da função
de Bessel, que é 6, 380..., vemos que o erro cometido é de 5, 14%.

2.5 O método da razão no cálculo variacional


A formulação variacional para o problema de Sturm-Liouville, que foi estudada
na seção anterior, pode ser generalizada de forma elegante para o problema da
razão entre dois funcionais lineares quaisquer num espaço vetorial apropriado.
Como veremos mais tarde, uma das aplicações do método da razão é na esti-
mativa de nı́veis de energia em problemas de mecânica quântica. Inicialmente,
porém, vamos apresentar o formalismo geral, que impõe condições bastante am-
plas.
2.5. O MÉTODO DA RAZÃO NO CÁLCULO VARIACIONAL 51

2.5.1 Cálculo com o sı́mbolo δ


Na seção 1.1. nós introduzimos o sı́mbolo δ denotando variação do funcional
J[y] da seguinte forma:  
∂J
δJ = dα (2.54)
∂α α=0
onde α é um parâmetro que rotula os vários caminhos possı́veis que conectam
os pontos fixos em relação aos quais consideramos o problema variacional. A
escolha α = 0 corresponde ao caminho que torna o funcional J[y] estacionário,
em relação a pequenas variações do argumento, também definidas como
 
∂y
δy = dα (2.55)
∂α α=0

Embora δ não seja uma diferencial autêntica, ela satisfaz às mesmas propri-
edades de cálculo de uma diferencial, de forma que podemos realizar operações
elementares sobre funcionais, como

δ(c1 J1 + c2 J2 ) = c1 δJ1 + c2 δJ2 , (2.56)


δ(J1 J2 ) = (δJ1 )J2 + J1 (δJ2 ), (2.57)
 
J1 J2 (δJ1 ) − J1 (δJ2 )
δ = 2 . (2.58)
J2 (J2 )

dentre outras, que podem ser demonstradas a partir da definição (2.54). Por
exemplo,
 
∂(c1 J1 + c2 J2 )
δ(c1 J1 + c2 J2 ) = dα
∂α α=0
   
∂J1 ∂J2
= c1 dα + c2 dα
∂α α=0 ∂α α=0
= c1 δJ1 + c2 δJ2 ,

e assim por diante.

2.5.2 Teoria geral


Vamos trabalhar com espaços vetoriais complexos, de dimensão finita ou (mais
geralmente) infinita. Nesse espaço, sejam dois vetores quaisquer y e z, e um
escalar complexo a. Valem as seguintes propriedades para o produto interno:
• < y, z >∗ =< z, y >;
• < ay, z >= a∗ < y, z >;
• < y, az >= a < y, z >
Sejam, ainda, dois operadores F e G agindo sobre vetores nesse espaço. Exigi-
mos as seguintes propriedades desses operadores
1. F e G devem ser lineares: sejam a e b dois escalares complexos, então

F [ay + bz] = aF [y] + bF [z], G[ay + bz] = aG[y] + bG[z], (2.59)


52 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

2. F e G devem ser auto-adjuntos (ou hermitianos)


∗ ∗
< F [y], z >=< y, F [z] >= < F [z], y > , < G[y], z >=< y, G[z] >= < G[z], y > ,
(2.60)
3. G deve ser positivo-definido

< y, G[y] >≥ 0 (2.61)

sendo que a igualdade vale se e só se y = 0


Teremos, ainda, oportunidade de trabalhar com a chamada equação de au-
tovalores generalizada
F [y] = λG[y] (2.62)
onde λ é um autovalor generalizado. Podemos mostrar que os autovalores, nas
condições acima citadas, são necessariamente reais. Para isso consideramos que

< y, F [y] >=< y, λG[y] >= λ < y, G[y] > . (2.63)

Tomando o complexo conjugado dessa expressão e usando a propriedade < y, z >∗ =<
z, y > temos que
< F [y], y >= λ∗ < G[y], y > . (2.64)
Usando a propriedade (2.60) podemos escrever

< y, F [y] >= λ∗ < y, G[y] > . (2.65)

Substraindo (2.65) de (2.63) resulta em

0 = (λ − λ∗ ) < y, G[y] >, (2.66)


| {z }
>0


já que y 6= 0. Logo λ = λ , portanto é sempre real, como querı́amos demonstrar.
Se x e y forem funções definidas num certo intervalo I ⊆ R, podemos cons-
truir funcionais sobre esse intervalo a partir dos produtos internos e dos opera-
dores acima definidos:
Z Z
J[y] =< y, F [y] >= y ∗ (x)F [y(x)]dx, N [y] =< y, G[y] >= y ∗ (x)G[y(x)]dx,
I I
(2.67)
tal que podemos definir um novo funcional como a razão destes dois:
J[y]
ω[y] = . (2.68)
N [y]

Caso as condições (2.59)-(2.61) valham para todas as funções do espaço em


questão, então vale o seguinte teorema: o funcional ω[y] será estacionário para
pequenas variações do vetor y se e somente se y satisfizer a equação generali-
zada de autovalores 2.62, onde os autovalores λ são os valores estacionários do
funcional ω[y]. Observe que, no enunciado, falamos numa condição de duplo
sentido: se e somente se. Isso significa que (2.62) implica em δω = 0 (condição
necessária), tanto como δω = 0 implica em (2.62) (condição suficiente) . Vamos
provar apenas a necessidade, deixando a segunda para o leitor como exercı́cio
[detalhes no [1], pg. 583].
2.5. O MÉTODO DA RAZÃO NO CÁLCULO VARIACIONAL 53

Para mostrar que (2.62) implica em δω = 0 fazemos uma variação infinitesi-


mal de y:
y → y + δy
e computamos o efeito nos funcionais (2.67):
J[y + δy] = < y + δy, F [y + δy] >=< y + δy, F [y] + F [δy] >=
= < y, F [y] > + < y, F [δy] > + < δy, F [y] > + < δy, F [δy](2.69)
>
| {z }
=<δy,F [y]>∗

onde usamos as propriedades (2.59), (2.60) e (2.61), nessa ordem.


A variação correspondente no funcional J é, usando (2.69),
δJ = J[y + δy] − J[y]

= < y, F [y] > +< δy, F [y] > + < δy, F [y] > + < δy, F [δy] > − < y, F [y] >

= < δy, F [y] > + < δy, F [y] > + < δy, F [δy] > . (2.70)
Analogamente, para o funcional N ,

δN = < δy, G[y] > + < δy, G[y] > + < δy, G[δy] > . (2.71)
Usando (2.58) podemos calcular a variação no funcional ω:
 
J N δJ − JδN
δω = δ =
N N2
1  ∗ 
= 2 < y, G[y] > < δy, F [y] > + < δy, F [y] > + < δy, F [δy] >
< y, G[y] >
∗ 
< y, F [y] > < δy, G[y] > + < δy, G[y] > + < δy, G[δy] >
Supondo, agora, que y satisfaça a equação de autovalores generalizada (2.62),
teremos
1  ∗ ∗ 
δω = 2 < y, G[y] > λ < δy, G[y] > + λ < δy, G[y] > +λ < δy, G[δy] >
< y, G[y] >
∗ 
λ < y, G[y] > < δy, G[y] > + < δy, G[y] > + < δy, G[δy] >
Finalmente, usando o fato dos autovalores λ serem reais (o que provamos há
pouco), observamos o cancelamento de todos os termos na expressão acima, de
forma que δω = 0, como querı́amos demonstrar. Juntamente com a implicação
no sentido inverso, concluimos que a razão dos funcionais J[y] e N [y] é esta-
cionária somente se λ for o autovalor correspondente à equação generalizada
(2.62).
O tratamento dado no inı́cio deste capı́tulo à equação de Sturm-Liouville
pode ser encarado como um caso particular deste teorema. Nesse caso especı́fico,
F é o operador de Sturm-Liouville L[y] e G[y] = r(y)y, cuja razão é estacionária
quando λ for o autovalor correspondente da equação de Sturm-Liouville (2.3).

2.5.3 O método da razão na mecânica quântica


A equação de Schrödinger
A função de onda ψ(x) é uma quantidade variável que descreve matematica-
mente as caracterı́sticas ondulatórias de uma partı́cula (Enciclopaedia Britta-
nica). A equação de Schrödinger independente do tempo para uma partı́cula
54 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

quanto-mecânica de massa m movendo-se em uma dimensão sob a influência de


um potencial V (x) é
~2 d 2
− ψ(x) + V (x)ψ(x) = Eψ(x), (2.72)
2m dx2
onde ~ = h/2π = 1, 05457148 × 10−34 m2 .kg/s é a constante de Planck reduzida,
e E é a energia total da partı́cula.
A equação de Schrödinger é linear. Como as funções de onda são, em geral,
complexas, elas pertencem a um espaço de funções complexas de quadrado in-
tegrável, chamado espaço de Hilbert. Nesse espaço o produto interno é definido
como 1 Z b
< ψ1 |ψ2 (x) >= ψ1∗ (x)ψ2 (x)dx. (2.73)
a
Definindo o operador Hamiltoniano
~2 d 2
H≡− + V (x), (2.74)
2m dx2
a equação de Schrödinger independente do tempo (2.72) pode ser reescrita como
2

Hψ(x) = Eψ(x), (2.75)


mostrando que, na verdade, ψ(x) são as autofunções do operador hamiltoni-
ano, cujos autovalores correspondentes são os valores da energia E da partı́cula.
Impondo condições de contorno apropriadas ao problema quanto-mecânico, sa-
bemos que só há soluções para determinados autovalores discretos da energia
∞ ∞
{En }n=1 (quantização), correspondendo às autofunções {ψn }n=1 .
O operador Hamiltoniano é auto-adjunto no espaço de Hilbert, também cha-
mado hermitiano, pois
< Hψ1 |ψ2 (x) >=< ψ1 |Hψ2 (x) > . (2.76)
Como consequência, os autovalores de energia são reais, e as autofunções cor-
respondendo a autovalores distintos são ortogonais:
< ψm |ψn (x) >= N δmn , (2.77)
onde N =< ψn |ψn (x) > é uma constante de normalização.

Supondo, ainda, que o conjunto de autofunções {ψn }n=1 é completo, ele
pode ser usado como uma base para funções de onda no espaço de Hilbert, tal
que possamos escrever (“postulado da expansão”)

X
ψ(x) = cn ψn (x), (2.78)
n=1

onde os coeficientes são dados por


< ψ|ψn (x) >
cn = (2.79)
< ψn |ψn (x) >
e, fisicamente, são amplitudes de probabilidade para os autovalores de energia
correspondentes.
1 Usamosa notação bra(c)ket para o produto interno na mecânica quântica, imitando Dirac.
2 Tambémde acordo com o uso consagrado na mecânica quântica, escreveremos Hψ ao
invés de H[ψ].
2.5. O MÉTODO DA RAZÃO NO CÁLCULO VARIACIONAL 55

O método da razão aplicado à equação de Schrödinger


As funções de onda de quadrado integrável adaptam-se sem problemas aos re-
quisitos da teoria geral para a aplicação do método da razão. Além disso, o
operador Hamiltoniano é linear e auto-adjunto, e o operador identidade (de-
finido como I[ψ] = ψ) é trivialmente linear, auto-adjunto e positivo-definido.
Nesse caso, os funcionais J e N serão, respectivamente, dados por
Z b Z b  
∗ ∗ ~2 d 2 ψ
J[ψ] = < ψ|Hψ >= ψ (x)Hψ(x)dx = ψ (x) − + V (x)ψ(x)
(2.80)
dx
a a 2m dx2
Z b
N [ψ] = < ψ|ψ >= ψ ∗ (x)ψ(x)dx. (2.81)
a
O funcional correspondente à razão de J e N corresponde, na teoria da
mecânica quântica, ao valor esperado do operador hamiltoniano
< ψ|Hψ >
< H > [ψ] = (2.82)
< ψ|ψ >
Se empregarmos uma autofunção de energia ψn (x) o valor esperado é o próprio
autovalor, pois
< ψn |Hψn > En < ψn |ψn >
< H > [ψn ] = = = En (2.83)
< ψn |ψn > < ψn |ψn >
Pelo teorema da seção anterior, o valor esperado do Hamiltoniano é esta-
cionário (δ < H >= 0) sob variações infinitesimais da função de onda (δψ).
Além disso, esse valor esperado é, de fato, um mı́nimo [pode-se ver a prova
dessa afirmação em [4], pg. 313, por exemplo]. Portanto, usando uma outra
função ψ̂(x) que não seja a autofunção mas satisfaça às mesmas condições de
contorno, obteremos, em geral, um valor de < H > que é maior do que aquele
que seria obtido usando a autofunção correta. Esta é a base do método variaci-
onal muito frequentemente usado em mecânica quântica, e bastante usado para
determinar a energia do estado fundamental de um sistema mesmo sem conhecer
as suas autofunções. Isso é particularmente importante quando a equação de
Schrödinger não tem solução analı́tica, o que é bastante frequente nas aplicações
em fı́sica atômica e molecular.
Escolhemos uma função-tentativa ψ̂(x) (ou uma combinação linear delas)
que satisfaz as mesmas condições de contorno do problema e depende de um ou
mais parâmetros variacionais c1 , c2 , . . .. Computamos, então, o valor esperado
do hamiltoniano para essa função tentativa
< ψ̂|H ψ̂ >
< H > [ψ̂] = (2.84)
< ψ̂|ψ̂ >
que deverá também ser uma função dos parâmetros c1 , c2 , . . .. Nós tornamos
esse funcional estacionário (na verdade, um mı́nimo) impondo as condições va-
riacionais
∂<H>
= 0, (j = 1, 2, . . .) (2.85)
∂cj
que fornecem valores ótimos que, substituidos em < H >, tornam este um
mı́nimo. Dessa forma < H > [ψ̂] é um limite superior para a energia do estado
fundamental, pois < H > [ψ̂] ≥ E0 , a igualdade só ocorrendo se a função-
tentativa for a própria autofunção do estado fundamental.
56 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

V(x)

Eo

−a 0 a x

Figura 2.3: Poço de potencial quadrado infinito.

Poço de potencial quadrado infinito


Como um primeiro exemplo do método da razão na mecânica quântica, vamos
considerar uma caixa unidimensional de paredes infinitamente rı́gidas tem um
potencial dado por [Fig. 2.3]
(
0, se −a ≤ x ≤ a,
V (x) = (2.86)
∞, se x ≤ −a ou x ≥ a.
Como as paredes são impenetráveis, a função de onda do estado fundamental
deve ter nós nas paredes da caixa, ou seja, ψ(−a) = ψ(a) = 0. Para −a <
x < a o hamiltoniano de uma partı́cula de massa m é, simplesmente, H =
−~2 /2md2 /dx2 .
Usando a função-tentativa real
ψ̂(x) = c(a2 − x2 ), (2.87)
onde c é o parâmetro variacional, e que satisfaz as condições de contorno, pois
ψ̂(±a) = 0. Observe que não é necessário normalizar a função tentativa, pois
nós dividiremos posteriormente pela sua norma, de qualquer jeito.
Uma vez que
d2 ψ̂
= −2c,
dx2
os funcionais (2.80) e (2.81) serão
Z a ! Z a
∗ ~2 d2 ψ̂ ~2 2 2 4c2 ~2 a3
J[ψ̂] = = ψ̂ (x) − dx = − c(−2c) (a − x )dx = (2.88)
−a 2m dx2 2m −a 3m
Z a Z a
16c2 a5
N [ψ̂] = ψ̂ ∗ (x)ψ̂(x)dx = c2 (a2 − x2 )dx = (2.89)
−a −a 15
e o valor esperado do hamiltoniano será
< ψ̂|H ψ̂ > 4c2 ~2 a3 /3m ~2 5
< H > [ψ̂] = = 2 5
= . (2.90)
< ψ̂|ψ̂ > 16c a /15 m 4a2
2.5. O MÉTODO DA RAZÃO NO CÁLCULO VARIACIONAL 57

Observe que, como < H > não depende do parâmetro variacional não é ne-
cessário minimizar < H > em relação a ele.
O problema do poço quadrado infinito é exatamente solúvel. A autofunção
(normalizada) do estado fundamental é [veja, por exemplo, [6], pg. 47]
1  πx 
ψ(x) = √ cos ,
a 2a
correspondente ao autovalor de energia

~2 π 2
E0 = ,
m 8a2
de modo que o método variacional foi capaz de estimar esse valor com um erro
de 1, 63%. Nov
d2 ψ̂
= −2c,
dx2
os funcionais (2.80) e (2.81) serão
Z a ! Z a
∗ ~2 d2 ψ̂ ~2 2 2 4c2 ~2 a3
J[ψ̂] = = ψ̂ (x) − dx = − c(−2c) (a − x )dx = (2.91)
−a 2m dx2 2m −a 3m
Z a Z a 2 5
16c a
N [ψ̂] = ψ̂ ∗ (x)ψ̂(x)dx = c2 (a2 − x2 )dx = (2.92)
−a −a 15

e o valor esperado do hamiltoniano será

< ψ̂|H ψ̂ > 4c2 ~2 a3 /3m ~2 5


< H > [ψ̂] = = = . (2.93)
< ψ̂|ψ̂ > 16c2 a5 /15 m 4a2

Observe que, como < H > não depende do parâmetro variacional não é ne-
cessário minimizar < H > em relação a ele.
O problema do poço quadrado infinito é exatamente solúvel. A autofunção
(normalizada) do estado fundamental é [veja, por exemplo, ]
1  πx 
ψ(x) = √ cos ,
a 2a
correspondente ao autovalor de energia

~2 π 2
E0 = ,
m 8a2
de modo que o método variacional foi capaz de estimar esse valor com um erro
de 1, 63%. Novamente, esse bom resultado se justifica pela proximidade entre a
função de onda verdadeira e aquela usada como tentativa [veja a Fig. 2.4].

Oscilador harmônico
[[5], pg. 1151]
O potencial para um oscilador harmônico unidimensional é [Fig. 2.5]
1
V (x) = mω 2 x2 , (2.94)
2
58 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

exata
aproximada
0,8

0,6

ψ
0,4

0,2

0
-1 -0,5 0 0,5 1
x

Figura 2.4: Autofunções exata e aproximada para o estado fundamental de uma


partı́cula num oço de potencial quadrado infinito, com a = 1.

V(x)

Eo

0 x

Figura 2.5: Oscilador harmônico.


2.6. PROBLEMAS 59

onde ω 2 = k/m é a frequência natural para uma partı́cula de massa m sujeita a


uma força restauradora onde k é a constante elástica. O operador hamiltoniano
será, portanto
~2 d 2 1
H=− 2
+ mω 2 x2 . (2.95)
2m dx 2
Como estamos procurando estados ligados, as autofunções de energia da partı́cula
para esse problema devem anular-se no infinito

ψ(x) → 0, se|x| → ∞.

Vamos usar como função-tentativa


2
ψ̂(x) = e−αx , (2.96)

onde α > 0 será o parâmetro variacional. Os funcionais (2.80) e (2.81) serão


Z ∞ !
−αx2 ~2 d2 ψ̂ 1 2 2 2
J[ψ̂] = = e − 2
+ mω x e−αx dx =
−∞ 2m dx 2
 2 Z ∞
~ α 1 1 2
= + mω 2 e−2αx , (2.97)
2m 8 α −∞
Z ∞
2
N [ψ̂] = e−2αx , (2.98)
−∞

e o valor esperado do hamiltoniano será

~2 α 1 1
< H > [ψ̂] = + mω 2 (2.99)
2m 8 α
Aplicando a condição variacional (2.85)
 
∂<H> ~2 1 1
= − mω 2 2 = 0, (2.100)
∂α α0 2m 8 α

que fornece o valor do parâmetro que minimiza < H >



α0 = , (2.101)
2~
dando
1
< H > (α0 ) = ~ω, (2.102)
2
que é igual ao valor exato da energia do estado fundamental E0 . Naturalmente
isso ocorreu pois nossa função tentativa é idêntica à autofunção exata.

2.6 Problemas
1. Mostre que o operador de Sturm-Liouville é
(a) linear: L[c1 y1 + c2 y2 ] = c1 L[y1 ] + c2 L[y2 ];
(b) auto-adjunto: < L[y1 ], y2 >=< y1 , L[y2 ] >
60 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS

2. Demonstre que:
(a) os autovalores do operador L são reais;
(b) as autofunções de L correspondentes a autovalores distintos são ortogonais

3. Resolva a equação de Helmholtz unidimensional (2.46) usando o método de


Rayleigh-Ritz como uma combinação linear de duas funções-tentativa:

φ̂1 (x) = 1 − x2 , φ̂2 (x) = x2 (1 − x2 ),

Compare o valor de λ com o resultado exato e calcule o erro relativo percentual.


Interprete seu resultado em termos do caráter das funções tentativa empretadas.

4. Considere a equação de Bessel de ordem m = 0:

1
yxx + yx + λy = 0, (0 ≤ x ≤ 1)
x
com as condições de contorno y(0) < ∞ e y(1) = 0. Use o método de Rayleigh-
Ritz com a função tentativa

φ̂1 (x) = a + bx2 + cx4 ,

e mostre que o autovalor aproximado é uma solução da equação quadrática


3λ̂2 − 128λ̂ + 640 = 0. Estime o erro do autovalor “bom”, e explique o autovalor
“ruim” que também é obtido.

5. A partir da definição (2.22) mostre as propriedades (2.5) e (2.58) do sı́mbolo δ.

6. Considere o problema de uma partı́cula num poço potencial quadrado infinito.


Estime a energia do estado fundamental usando, como função tentativa,

ψ̂(x) = |a|λ − |x|λ

onde λ é um parâmetro variacional. Qual o erro percentual relativo quando se


compara com o resultado exato? [[4], pg. 315]

7. Obtenha a energia do estado fundamental do oscilador harmônico usando uma


função tentativa
1
ψ̂(x) = 2
x +a
onde a > 0 é um parâmetro variacional.

8. Você pode usar o método variacional para obter a energia do primeiro estado
excitado do oscilador harmônico (n = 2). Use a função tentativa
2
ψ̂(x) = xe−βx

9. Considere uma partı́cula sujeita ao potencial V (x) = λx4 . Use o método varia-
cional para estimar a energia do estado fundamental, usando a função tentativa
2
ψ̂(x) = e−αx
2
~
Compare seu resultado com a solução exata desse problema: E0 = 1, 06 2m k1/3 ,
2
onde k = 2mλ/~ .
2.6. PROBLEMAS 61

10. O método variacional na mecânica quântica pode ser generalizado para três
dimensões. Os funcionais (2.80) e (2.81) serão dados por
Z  2  
~
J[ψ] = < ψ(r)|Hψ(r) >= d3 r (∇ψ ∗ · ∇ψ) + V (r)ψ ∗ (r)ψ(r)
2m
Z
3 ∗
N [ψ] = < ψ(r)|ψ(r) >= d rψ (r)ψ(r)

Usando a função tentativa,


(
r

1− α
, se r ≤ α,
ψ̂(r) =
0, se r > α.

com α fazendo o papel de parâmetro variacional, estime a energia do estado


fundamental do átomo de hidrogênio, onde V = ke2 /r, com k = 1/4πǫ0 .

11. Repita o problema anterior com a função tentativa


2
ψ̂(r) = e−αr

Resposta: −11, 5eV (o valor experimental é −13, 6eV ).

12. Use o método variacional para estimar a energia de ligação de um dêuteron


(núcleo de deutério), supondo que o potencial de interação entre o próton e o
nêutron é
V (r) = Ae−r/r0
e use uma função tentativa ψ̂(x) = Ce−βr , onde A e C são constantes de nor-
malização, r0 é um comprimento caracterı́stico do potencial, e β é o parâmetro
variacional. A resposta é −2, 1M eV . O valor experimental é 2, 24M ev.
62 CAPÍTULO 2. MÉTODOS VARIACIONAIS APLICADOS
Referências Bibliográficas

[1] E. Butkov, Fı́sica Matemática (Guanabara Dois, Rio de Janeiro, 1978).

[2] H. Goldstein, C. Poole, e J. Safko, Classical Mechanics, 3rd. Ed. (Addison


Wesley, San Francisco, 2000).
[3] G. B. Arfken e H. J. Weber, Mathematical Methods for Physicists, 5a. Ed.
(Harcourt, San Diego, 2001).

[4] J. J. Sakurai, Modern Quantum Mechanics, Revised Edition, (Addison


Wesley, San Francisco, 1994).

[5] C. Cohen-Tannoudji, B. Diu, e F. Laloë, Quantum Mechanics, 2 volumes,


(Wiley, New York, 1977).

[6] S. Gasiorowicz, Quantum Physics, 3rd. Ed. (Wiley, New York, 2003)

[7] G. Venezian, Am. J. Phys. 34, 701 (1966).

[8] P. W. Cooper, Am. J. Phys. 34, 68 (1966).

63

Vous aimerez peut-être aussi