Vous êtes sur la page 1sur 104

La Teoría de la Relatividad

ESTE ES UN TRABAJO BAJO CONSTRUCCION

m i é r c o l e s , 1 8 d e m a r z o
La ruta geodésica I
“La menor distancia entre dos puntos es la recta que los une” - “Los elementos”, Euclides.
Efectivamente, en un plano de dos dimensiones la menor distancia entre dos puntos P y Q cualesquiera es la recta que une a
dichos puntos. En un espacio tridimensional, también la menor distancia entre dichos puntos P y Q será la recta que los une, y
esa recta podemos imaginarla trazada sobre una superficie plana. Aunque nuestra intuición geométrica humana no nos ayude,
podemos extender esta suposición hacia un espacio de más de tres dimensiones, elevándolo a la categoría de postulado, y de
hecho podemos justificar tal suposición recurriendo a las herramientas del cálculo infinitesimal para encontrar la distancia
mínima entre dos puntos en un espacio n-dimensional.
Pero la vieja afirmación Euclideana se nos viene abajo cuando consideramos una superficie curva, como la superficie de una
pelota o la superficie de un cilindro. Consideremos primero la superficie de un cilindro. Un cilindro es una superficie que al igual
que un rollo de papel puede ser desenrollada y extendida sobre un plano, y sobre la superficie del mismo cilindro cuando ha sido
desenrollado la menor distancia entre dos puntos es la recta que une a dichos puntos:

Sin embargo, cuando volvemos a enrollar la superficie dándole un carácter curvo en un espacio tridimensional, aunque para una
hormiga que esté caminando sobre dicha recta nada parece haber cambiado, para alguien que observa el enrollamiento la ruta
más corta entre dos puntos está dada por la hélice que conecta a dichos puntos:

Y como era de esperarse, la longitud de la línea no ha cambiado nada. La longitud de la línea recta cuando el cilindro está

converted by W eb2PDFConvert.com
desenrollado es exactamente la misma que cuando enrollamos el cilindro, por el hecho de que la longitud es una cantidad
escalar. Sin embargo, la línea trazada sobre la superficie del cilindro tiene una curvatura que antes no existía cuando el cilindro
estaba extendido sobre un plano. Esto es precisamente lo que ocurre cuando la superficie sobre la cual ocurre un movimiento es
transformada de una superficie plana a una superficie curva.
En el caso de la superficie de una pelota esférica de futbol, desde la perspectiva de un observador externo la menor distancia
entre dos puntos P y Q puestos sobre la superficie de la pelota no es la línea recta que une a los puntos puestos en dicha pelota
trazada dicha línea a través de la pelota (lo cual requeriría perforar la pelota con un picahielos) sino el arco de círculo máximo
que pasa por dichos puntos, al cual podemos llamar “la línea más derecha posible de todas” entre dichos puntos. Esta es la
trayectoria que tomaría sobre la superficie de la pelota una cuerda elástica tensa estirada para poner sus extremos en los puntos
P y Q. Para una hormiga que camina sobre la superficie de la pelota, y que por su tamaño no se dá cuenta de que camina sobre
una superficie curva (del mismo modo que nosotros en nuestra experiencia cotidiana no nos damos cuenta de la redondez de la
Tierra, razón por la cual hasta antes del descubrimiento de América muchos creían que la Tierra era plana), la distancia entre
dos puntos P y Q cuando camina de frente y siempre hacia adelante sin desviarse hacia la derecha o hacia la izquierda es una
línea recta; se requiere de un ser “superior” capaz de poder ver desde una perspectiva mucho más amplia esa superficie en la
que habita la hormiga para darse cuenta de que si la hormiga pudiera perforar de alguna manera la superficie de la pelota podría
encontrar una trayectoria más corta aún entre dichos puntos. Pero si no le es dado a la hormiga el poder llevar a cabo esta
“perforación”, si está confinada a vivir y caminar toda su vida sobre la superficie de la pelota, jamás se dará cuenta de ello. De
lo que no nos queda duda alguna es que también en la superficie de la pelota hay una infinitud de rutas posibles para llegar del
punto P al punto Q, y de todas las rutas posibles hay una que le tomará a la hormiga el menor tiempo posible, la cual será la
menor distancia entre los dos puntos de una superficie curva, “la curva más derecha posible” que podamos trazar entre dos
puntos, a la cual designamos como la ruta geodésica o simplemente geodésica.
Expuesto lo anterior, podemos reformular el clásico enunciado de Euclides en una forma moderna más correcta:
“La menor distancia entre dos puntos es la geodésica que los une.”
En el espacio-tiempo plano de la Teoría Especial de la Relatividad, las geodésicas son líneas rectas para cualquier observador.
Pero en el espacio-tiempo curvo de la Teoría General de la Relatividad, las geodésicas dejan de ser líneas rectas. Y nosotros
estamos interesados en estudiar la naturaleza geométrica de esas geodésicas en un espacio-tiempo curvo en cuatro dimensiones
porque en un espacio tal los cuerpos se mueven siguiendo rutas geodésicas. Puesto de otra manera:
Las trayectorias elípticas que siguen los planetas en sus movimientos de traslación alrededor del Sol son las rutas
geodésicas que corresponden a un espacio-tiempo curvo.
Esto que se acaba de enunciar representa una ruptura total con la filosofía detrás del esquema de Newton que proclamaba la
existencia de una fuerza invisible de atracción central F que era la que mantenía a la Luna en órbita alrededor de la Tierra
impidiéndole salir disparada hacia el espacio exterior del mismo modo que se requiere de una fuerza central para mantener a un
objeto girando en torno a nosotros en una trayectoria circular:

Una forma de mantener a un cuerpo en una trayectoria circular es, efectivamente, con la aplicación de una fuerza central que
sea perpendicular a la dirección en la cual se está moviendo el cuerpo como en la ilustración de arriba. Pero otra forma de
mantener a un objeto en una trayectoria circular sin necesidad de que exista una fuerza de atracción entre el objeto y el
punto central en torno al cual está girando el objeto es restringiendo al cuerpo en movimiento a moverse sobre una superficie
que es la que le dicta al objeto la trayectoria que debe seguir, como lo muestra la siguiente figura:

converted by W eb2PDFConvert.com
Estrictamente hablando, la anterior representación no transmite a plenitud la idea relativista detrás de los cuerpos desviándose
de sus trayectorias rectilíneas debido a una curvatura en el espacio-tiempo, porque en el diagrama de arriba si bien se ha
eliminado el concepto de una fuerza de atracción que provoca una desviación de la trayectoria rectilínea, la superficie
hemisférica mostrada altera la trayectoria a través de una fuerza de contacto entre el objeto y la superficie hemisférica,
aplicada por el contorno de la superficie sobre el objeto. En la Teoría de la Relatividad, el concepto de fuerza como causante
de la gravedad ha sido eliminado por completo. La superficie curva existe, pero no es una superficie “sólida”, es una superficie
dictada por la curvatura en el espacio-tiempo causada por la gravedad, es una superficie tan “sólida” (desde el punto de vista
material) como puedan serlo el mismo tiempo y espacio.
Nos preguntamos ahora: si un cuerpo de masa m es libre para moverse inercialmente excepto que su movimiento esté
restringido a llevarse a cabo en una superficie curva, ¿cuál es la curva trazada por el movimiento del cuerpo sobre dicha
superficie? (Podemos imaginar al objeto totalmente cubierto de tinta con la cual va dejando un rastro de su trayectoria al
recorrer la superficie curva.) De la física clásica el resultado viene siendo una geodésica de la superficie, una curva que
representa la menor distancia posible, o bien “la curva más derecha posible”. Esto captura la esencia detrás de la propuesta de
Einstein, la idea de que los cuerpos se mueven sobre una superficie cuatri-dimensional de un espacio-tiempo curvo siguiendo
una ruta geodésica. En la física clásica tal y como fue desarrollada por Newton, un cuerpo se mueve libremente en el espacio en
torno a otro objeto excepto que su movimiento aparenta estar restringido a llevarse a cabo dentro de una superficie bi-
dimensional (el interior de una esfera o una elipse) empotrada en un espacio tri-dimensional tal y como lo tenemos arriba. Sin
embargo, en la Teoría General de la Relatividad una masa se mueve libremente en el espacio-tiempo al estar en caída libre de
modo tal que la gravedad actúa sobre ella a través de la curvatura del espacio-tiempo. En la física clásica, la trayectoria
espacial de un cuerpo es la geodésica de lo que para nosotros parece ser el interior de una superficie bi-dimensional, trazando
la curva de menor longitud posible sobre dicha superficie, mientras que en la Teoría General de la Relatividad la trayectoria es
una trayectoria espacio-tiempo, la cual es una geodésica del espacio-tiempo que va trazando una curva de intervalo espacio-
tiempo extremo en el espacio-tiempo. (Al utilizar la palabra extremo para designar al intervalo, estamos dejando abierta la
posibilidad de que se pueda tratar de un mínimo o de un máximo como se acostumbra tener en los estudios introductorios de
cálculo infinitesimal).
El concepto de los cuerpos moviéndose en el espacio siguiendo rutas geodésicas en el espacio-tiempo sin que exista una fuerza
de atracción entre los mismos como lo suponía Newton parece haber sacado por completo fuera del panorama el papel que
desempeña el cuerpo central como fuente de una fuerza de atracción gravitacional en base a la cantidad de masa M que
contiene. Sin embargo, esto no es así, ya que si bien la fuerza invisible ha dejado de existir la curvatura en el espacio-tiempo
es producida directamente por la masa M del cuerpo en torno al cual está girando su satélite. Entre mayor sea el contenido de
masa M del cuerpo central así como su contenido de energía (esto ya no lo anticipó Newton), tanto mayor será la
curvatura del espacio-tiempo. Si no hay masa en el espacio circundante, entonces un cuerpo cualquiera se mantendrá
moviéndose en línea recta a velocidad constante, inercialmente. De este modo, el contenido total de masa sumado al
contenido energético total de un cuerpo provoca una curvatura en su espacio-tiempo circundante que le dice a los cuerpos que
se le aproximan la trayectoria que deben seguir, la forma en la que deben moverse, siguiendo rutas geodésicas. Esta idea la
expresó Einstein en notación tensorial en octubre de 1915 de la siguiente manera:
R = 8πGT
En notación explícita (empleando índices) la ecuación se escribe como:
Rμν = 8πGTμν
en donde Rμν es el tensor de Ricci con el cual se representa la curvatura del espacio-tiempo, Tμν es el tensor energía-tensión,
y G es la constante de gravitación universal. Sin embargo, no le llevó mucho tiempo a Einstein el darse cuenta de que la
ecuación tensorial anterior, que representa un conjunto de ecuaciones, era incorrecta, ya que las ecuaciones resultaban ser
inconsistentes con la conservación local de la energía-momentum a menos de que la densidad de la masa-energía-momentum del
Universo fuese una cantidad constante. En otras palabras, un ladrillo, el aire e inclusive el vacío tenían que tener la misma
densidad para que lo anterior fuese cierto. Esto requirió revisar el enunciado original, con una solución que resultó ser más que

converted by W eb2PDFConvert.com
obvia, la cual fue publicada al mes siguiente, dándonos la ecuación tensorial fundamental de la Teoría General de la Relatividad:

que nos dice cómo la masa-energía nos provoca una curvatura en el espacio-tiempo cuatri-dimensional, en la cual R es el
escalar de Ricci y gμν es el tensor métrico con el cual ya debemos estar familiarizados. Pero esta ecuación no nos dice cómo
deben moverse los cuerpos en el espacio en proximidad el uno del otro. Para saberlo, Einstein especificó una segunda ecuación
independiente de la primera que nos permite calcular las geodésicas que recorre un cuerpo en movimiento en un espacio-
tiempo cuatri-dimensional curvo. Es la siguiente:

En esta ecuación, la cual también es una ecuación tensorial, tenemos la presencia de los símbolos de Christoffel Γabc.
Para poder llegar a la fórmula anterior, tenemos que hacer primero un repaso de algunos conceptos básicos del cálculo
infinitesimal.
Sabemos del cálculo infinitesimal que en un espacio bi-dimensional Cartesiano (plano xy) la distancia entre dos puntos a(x1,y1)y
b(x2,y2) cualesquiera (no necesariamente la ruta geodésica) está dada por la siguiente relación:

PROBLEMA.- ¿Cuál será la longitud de un arco descrito por la ecuación y = x3/2 desde x1.=.0 hasta x2.=.1?
La derivada de la función proporcionada es:

Aplicando la fórmula obtenemos lo siguiente:

converted by W eb2PDFConvert.com
Esta es la longitud del arco de curva que une los puntos a(x1,y1) = (0,0) y b(x2,y2)=(1,1), pero no es la geodésica entre dichos
puntos. Aquí la geodésica es la línea recta que une a dichos puntos.
Introduciendo la variable tiempo, también podemos especificar la siguiente fórmula general para describir la longitud de una
línea (recta o curva) en un espacio bi-dimensional:

Al introducir el tiempo como una variable independiente en la anterior fórmula para describir una línea (ya sea recta o curva) en
un espacio plano, estamos recurriendo a lo que se conoce en matemáticas como ecuaciones paramétricas.
PROBLEMA.- Encontrar la longitud del arco de una curva descrita por las ecuaciones paramétricas x=t3 y y=t² situado entre
los puntos (x1,y1) = (1,1) y (x2,y2) = (8,4).

converted by W eb2PDFConvert.com
En un espacio tri-dimensional, la descripción de una línea (ya sea recta o curva) por necesidad tiene que llevarse a cabo
empleando ecuaciones paramétricas, y tienen que especificarse tres ecuaciones independientes, una para cada coordenada. A
continuación tenemos un conjunto de ecuaciones que nos especifican la trayectoria de una partícula que viaja a lo largo de una
línea recta conforme avanza el tiempo:
____x = 2 + 6t
____y = t
____z = -2 + 3t
Podemos ver la naturaleza rectilínea de este conjunto de ecuaciones con tres gráficas diferentes, una para la variable
dependiente x en función de la variable independiente t, la otra para la variable y en función de la variable t, y y la otra para la
variable z en función de la variable t.
Podemos extender fácilmente la fórmula usada para calcular la longitud de un arco en un plano bidimensional a una fórmula que
nos permita calcular la longitud de un arco de curva tridimensional. Usando ecuaciones paramétricas, la expresión a ser usada
será:

A modo de ejemplo, supóngase que se tienen las siguientes ecuaciones paramétricas que nos trazan una curva en el espacio
tridimensional:

converted by W eb2PDFConvert.com
siendo a, b y c constantes numéricas. Podemos hacer esto un poco más claro metiéndole números al asunto. Supóngase que
a.=.1, b.=.1 y c.=.2. En tal caso, se tiene el siguiente conjunto de ecuaciones:

Tomando las derivadas para el cálculo de la longitud del arco trazado desde t1.=.0 hasta t2.=.1, se tiene:

Por lo tanto, la longitud del arco de curva trazado desde t1.=.0 hasta t2.=.1 será:

Si hacemos una gráfica de la curva (puesto que la curva es tridimensional, lo mejor que se puede lograr aquí es una proyección
sobre un plano intentando simular los ejes tridimensionales), vemos que las ecuaciones paramétricas describen una curva muy
común, una hélice, como la siguiente:

converted by W eb2PDFConvert.com
El lector astuto se habrá percatado de que esta curva tridimensional es precisamente como la curva que se mostró arriba al
principio de esta entrada conectando dos puntos marcados sobre la superficie de un cilindro.
Cualquiera diría que la línea comprendida entre los puntos t1 y t2 del ejemplo que se acaba de resolver con una longitud
aproximada de 6.59 unidades no es la menor distancia posible entre dichos puntos, y argumentaría que la menor distancia
posible entre tales puntos está dada por la recta que une dichos puntos. Puesto que las coordenadas rectangulares Cartesianas
para cada punto son:
Para t1 = 0: (x1, y1, z1) = (1, 0, 0)
Para t2 = 0: (x2, y2, z2) = (0, 1, 2)
entonces, usando la conocida fórmula Pitagórica, la longitud de la línea recta que une tales puntos debe ser:

y efectivamente, una hormiga caminando sobre esta recta usaría menos de la mitad de su tiempo requerido para llegar de un
punto a otro siguiendo el arco de curva tridimensional. Sin embargo, supóngase que la hélice del ejemplo es la ruta recorrida
sobre un cilindro de acero sólido, impenetrable, no siendo posible “perforar” el cilindro. Entonces no queda más alternativa que
seguir la ruta de la hélice o cualquier otra trayectoria que conecte los puntos t1 y t2. Intuitivamente, la hélice parece ser la ruta
más corta sobre la superficie de un cilindro que conecte dos puntos cualesquiera marcados sobre la superficie del cilindro. En
pocas palabras, la hélice parece ser la geodésica que conecta los puntos t1 y t2. Pero, ¿lo es? ¿Podemos demostrarlo? Veremos
esto en mayor detalle un poco más abajo, pero antes, haremos una reflexión sobre lo que acabamos de ver.

converted by W eb2PDFConvert.com
Hemos tomado la fórmula que nos proporciona la longitud de un arco bidimensional en un plano, y la hemos extendido sin
problema alguno para obtener una fórmula que nos proporciona la longitud de un arco tridimensional. Pero... ¿podemos hacer lo
mismo tratándose de una curva cuatridimensional? De ser tal cosa posible, la definición tentativa para la longitud de un arco de
una 4-curva sería la siguiente:

Obsérvese que estamos metiendo aquí las coordenadas del 4-vector espacio-tiempo de la teoría relativista. En la fórmula, se ha
metido la constante c (la velocidad de la luz) para que la fórmula sea dimensionalmente correcta (todo medido en metros). Y
para poder calcular algún tipo de derivadas, hemos metido un parámetro adicional, simbolizado como τ, a reserva de definir
posteriormente dicho parámetro, aunque nuestra intuición nos sugiere que tal parámetro bien podría ser el tiempo local del
observador viajero, el cual puesto que es medido por el observador que lleva su propio reloj siempre marchará al mismo ritmo.
Y si hablamos de rutas geodésicas en un espacio tridimensional, debe ser posible hablar de lo mismo en un espacio
cuatridimensional. ¿Pero cómo las habremos de determinar? Tómese en cuenta que no hemos demostrado aún ni siquiera que la
hélice sea la geodésica sobre la superficie de un cilindro en el espacio tridimensional. Obviamente, puesto que se trata de un
mínimo (la ruta más corta entre dos puntos), tendremos que echar mano de las herramientas del cálculo infinitesimal,
extendiéndolas hacia un espacio cuatridimensional.
Antes de continuar, repasemos el hecho de que el siguiente conjunto de ecuaciones definitivamente nos describen una línea
curva trazada en un espacio bi-dimensional:
____x = t²
____y = 2t - t² + 5t
mientras que el siguiente conjunto de ecuaciones definitivamente nos describen una línea curva trazada en un espacio tri-
dimensional:
____x = 2t
____y = 1+ t²
____z = 8 - t
Aparentemente, aquí tenemos una perspectiva gráfica sobre el espacio cuatri-dimensional relativista, ya que en el anterior
conjunto de ecuaciones tenemos a las cuatro variables (x,y,z,t). Sin embargo, el problema es que las cuatro variables no son
variables independientes, y una de ellas no está en la misma categoría que las otras tres. Tenemos a tres variables dependientes
y a una variable independiente, siendo que en un espacio cuatri-dimensional puro ninguna de las variables debe estar
privilegiada sobre la otra. Esto es lo que nos obligará a buscar otro tipo de enunciación matemática para poder especificar
formalmente la determinación de la longitud de un arco de curva en el espacio cuatri-dimensional relativista. Y aquí es
precisamente en donde entra el tensor métrico g = (gij) de 16 componentes.
En general, para poder describir el trazo que nos produce una curva en varias dimensiones, digamos cinco, necesitaremos
recurrir forzosamente a ecuaciones paramétricas, con las cuales asociamos una n-pla de valores (posiciones) en las coordenadas
(x0, x1, x2, x3, x4, ..., xn) a cada punto específico de la curva. Así, en el 5-espacio Cartesiano, si las ecuaciones paramétricas
de una curva son:
____x0 = τ² + 1
____x1 = τ - 4
____x2 = 4 sen(τ)
____x3 = τ + 7
____x4 = 4 cos(τ)
entonces el punto de la curva para τ.=.0 estará posicionado en:

converted by W eb2PDFConvert.com
(x0, x1, x2, x3, x4) = (1, -4, 0, 7, 4)
No es necesario recurrir a visiones místicas en planos superiores de consciencia para tratar de imaginar el comportamiento de
esta curva en un 5-espacio Cartesiano. Nos basta con proyectar sobre varios planos bi-dimensionales lo que ocurre para varios
valores de τ para poder “ver” lo que está ocurriendo en las cinco dimensiones. En el plano (x2, x4) la curva estará dando vueltas
interminables alrededor de un círculo de radio 2 con centro en el origen del 5-espacio Cartesiano. Y en el plano (x1, x3) la
proyección de la curva sobre dicho plano nos indica que el móvil avanza allí en línea recta, mientras que en el plano (x0, x1) la
curva sigue la trayectoria de una parábola. Para un 5-espacio Cartesiano hay un total de nueve planos (nueve posibles pares de
combinaciones de las coordenadas), nueve proyecciones que juntas nos dan una idea general sobre la trayectoria y forma de la
curva. Esto es algo así como una “visión de rayos X” con la cual si sacamos la placa del esqueleto de una persona de frente y otra
placa de perfil, con ambas placas podemos hacer una reconstrucción parcial tridimensional del esqueleto. Pero podemos llevar
esta estrategia más lejos aún, utilizando graficados tri-dimensionales. Hay nueve proyecciones estereográficas posibles con las
cuales podemos “ver” mejor aún en cinco dimensiones. Y si recurrimos a una ilustración animada en donde vamos variando una
proyección tridimensional conforme va aumentando o disminuyendo una de las otras dos variables manteniendo la quinta
variable constante (ya hay programas de cómputo que pueden llevar esto a cabo) tenemos entonces cinco proyecciones
estereográficas animadas con las cuales nos es posible “ver” mucho mejor la trayectoria de una curva en cinco dimensiones.
Hemos visto cómo “medir” la distancia entre dos puntos diferentes en un espacio multidimensional no necesariamente plano,
pero hasta ahora no hemos visto cómo obtener la geodésica entre dichos puntos, la ruta más corta de todas las otras rutas
alternas que se puedan trazar de un punto a otro. Para poder encontrar esa ruta óptima, para poder encontrar la geodésica en un
espacio multidimensional, tenemos que recurrir a una rama de las matemáticas conocida como el cálculo de variaciones, en el
cual la cantidad a ser minimizada (o maximizada) aparece como una integral. La determinación de los valores extremos
(máximos o mínimos) de integrales cuyos integrandos contienen funciones desconocidas es precisamente la clase de problemas a
los cuales está dirigido el cálculo de variaciones. El más sencillo de tales problemas consiste en la determinación de una función
y = y(x) para la cual la integral

evaluada entre los puntos x0 = a y x1 = b adquiere su valor mínimo (obsérvese que con fines de simplificación notacional se ha
simbolizado la derivada de y con respecto a x con una comilla, o sea y’). La función integrable F de las variables x, y y y’ se dá
por conocida, por ejemplo:

en donde F = y√1 +(y’)². Al postularse el problema, la dependencia específica de y en x no está prefijada, y(x) es precisamente
la función desconocida que queremos encontrar. Esto es lo que nos lleva a la derivación de la siguiente ecuación obtenida por
primera vez por Euler (esta misma ecuación fue aplicada casi al mismo tiempo por Lagrange a la mecánica para formular sobre
principios variacionales lo que hoy se conoce como dinámica Lagrangiana en la cual la función F es reemplazada por la letra L,
lo que hoy conocemos como el Lagrangiano del sistema):

Pero antes de ver cómo podemos derivar de esta ecuación, consideremos primero un ejemplo de una aplicación de la misma.
PROBLEMA: Hallar la curva y = y(x) con y(0) = 0 y y(a) = b que minimice la longitud del arco que va del punto A(0,0) al punto
B(a,b).
La longitud del arco en el plano Cartesiano x-y está dada por:

Aquí F = √1 +(y’)², y podemos aplicar de inmediato la ecuación de Euler, para lo cual evaluamos primero:

converted by W eb2PDFConvert.com
∂F/∂y = 0
y:
∂F/∂y’ = (½)(1/√1 +(y’)²) 2y’
∂F/∂y’ = y’ / √1 +(y’)²
Usamos ahora directamente la ecuación de Euler:
∂F/∂y - (d/dx)(∂F/∂y’) = 0
0 - (d/dx)(y’ / √1 +(y’)²) = 0
(d/dx)[y’ {1 + (y’)²}-½] = 0
No es necesario tomar aquí la derivada con respecto a x. Para que lo que tenemos sea cierto, se requiere que el término entre
corchetes sea constante, lo cual a su vez requiere que y’ = dy/dx en el denominador de la expresión también sea igual a una
constante C, o sea:

Esto último es, desde luego, la ecuación de una línea recta. La curva extrema es por lo tanto una recta, y se confirma el dicho
de Euclides de que en un plano (Euclideano) la menor distancia entre dos puntos es la recta que los une.
Habiendo visto el anterior ejemplo de la forma en la cual se aplica la ecuación de Euler para poder determinar la naturaleza de
la ruta mínima entre dos puntos cualesquiera, estamos en mejores condiciones para poder entender cómo se lleva a cabo la
derivación de dicha fórmula.
Considérese el siguiente diagrama:

En el diagrama, suponemos que la ruta óptima (la más corta de todas) para minimizar una integral I bajo cierta función y(x) es la
de color rojo. En el mismo diagrama se han trazado dos rutas alternas de color verde que darían a la integral un valor mayor que
el valor que obtendríamos recorriendo la ruta de color rojo. La diferencia entre cualquier otra curva y la ruta óptima es llamada
la variación de y o δy. Sobre el eje horizontal se ha proyectado dicha variación de color ciano. Para la ruta óptima, la
variación δy al recorrer una ruta desde el punto x0 hasta el punto x1 debe ser igual a cero. Cualquier otra ruta podemos
describirla como una función desconocida η(x) así como con un factor de escala variable que llamaremos α y el cual nos dá la
magnitud de la variación. La función η(x) es una función arbitraria excepto por el requerimiento de que todas las rutas alternas
pasen también por los puntos x0.=.a y x1.=.b en donde la variación debe ser cero, o sea:
η(x0) = η(a) = 0
η(x1) = η(b) = 0

converted by W eb2PDFConvert.com
Entonces, si la curva óptima que extremiza (minimiza) a la integral es Y(x), cualquier otra ruta alterna estará dada por:
y(x) = Y(x) + αη(x)
Abreviaremos notacionalmente para simplicidad sin olvidar la dependencia sobre la variable x:
y = Y + αη
Tomando diferenciales con respecto a la variable x:
y’ = Y’ + αη’
La integral I a ser extremizada es la siguiente:

I = ∫F(x, y, y’) dx
o en mayor detalle introduciendo los parámetros de variación:

y la condición para obtener un valor extremo en α = 0, análoga a la derivada dy/dx igualada a cero en el cálculo infinitesimal
ordinario será:
[∂I(α) /∂α]α = 0 = 0
Extremizamos (minimizamos) ahora la integral tomando la derivada de la integral I con respecto al parámetro α manteniendo
todo lo demás constante:
I’(α) = ∂I(α) /∂α

Esto requiere llevar a cabo una diferenciación metiendo al símbolo ∂ dentro del símbolo ∫, o sea efectuando una diferenciación
bajo el símbolo de la integral, lo cual podemos hacer en virtud de que la diferenciación la estamos llevando a cabo con respecto
a la variable α y no la variable dx sobre la cual se efectúa la acción del integrando:

Por la regla de la diferenciación para funciones compuestas, tenemos la siguiente relación:

Usando las expresiones de arriba para ∂Y/∂α = η(x) y ∂Y’/∂α = η’(x), podemos escribir:

De este modo, la integral a ser extremizada es la siguiente:

converted by W eb2PDFConvert.com
Es evidente que en el punto extremo, haciendo α = 0, tendremos:
y = Y + αη = Y
y’ = Y’ + αη’ = Y’
Con esto, podemos expresar de la siguiente manera la integral que será llevada a cabo:

Separaremos temporalmente la integral en la suma de dos integrales para trabajar sobre el segundo término:

Al segundo término en esta integral se le puede aplicar una integración por partes:

Puesto que η(a) = η(b) = 0, la parte integrada es igual a cero, con lo cual:

Juntando esto nuevamente con el primer término de la integral original, tenemos entonces:

Para que esto sea cierto lo que tenemos dentro del paréntesis debe ser cero, ya que siendo η arbitrario si lo escogemos
diferente de cero no hay otra forma de hacer que la expresión de la izquierda sea igual a cero más que igualando todo lo que
hay dentro de los paréntesis a cero. Se concluye de lo anterior que:

Esta es la ecuación de Euler.


PROBLEMA: Demostrar que la geodésica sobre la superficie de un cilindro circular recto es una hélice.
El elemento de distancia en un espacio tri-dimensional está dado por:
ds² = (dx)² + (dy)² + (dz)²
o bien:
ds = √(dx)² + (dy)² + (dz)²

converted by W eb2PDFConvert.com
Para poder expresar el elemento de distancia en coordenadas cilíndricas recurrimos a las relaciones que conectan las
coordenadas rectangulares Cartesianas (x,y,z) con las coordenadas cilíndricas (r,φ,z):
x = r cos φ
y = r sen φ
z =z
Puesto que estamos interesados en obtener la geodésica sobre la superficie de un cilindro, en este problema el radio r se
mantendrá constante en todo momento sin ser objeto de variación alguna. Con esto en mente y tomando diferenciales en cada
una de las tres relaciones anteriores obtenemos lo siguiente:
dx = - r sen φ dφ
dy = r cos φ dφ
dz = dz
Substituyendo estas diferenciales en la relación de la fórmula para el elemento de línea y llevando a cabo la integración sobre la
trayectoria completa, tenemos entonces:

Obsérvese que en este último paso hemos sacado fuera a la diferencial dφ y hemos utilizado la notación de punto poniendo un
punto encima de la variable z para así tener:

Esta variable z con un punto puesto encima debe ser tratada matemáticamente como si fuese una nueva variable.
Podemos identificar de inmediato dentro del integrando a la función F que debemos utilizar para aplicar la ecuación de Euler:

La ecuación de Euler en este caso será:

Puesto que ∂F/∂z = 0, la ecuación de Euler se nos reduce a:

Llevando a cabo la integración, obtenemos lo siguiente:

converted by W eb2PDFConvert.com
Despejando para la variable z con el punto encima:

Puesto que todo lo que está del lado derecho de la ecuación es una constante, esto significa que:

dz/dφ = constante
En pocas palabras, la geodésica entre dos puntos cualesquiera sobre la superficie de un cilindro está dada por la hélice que
conecta dichos puntos. Hemos logrado lo que nos habíamos propuesto desde un principio. Hemos llegado así a la determinación
formal de la geodésica sobre la superficie del cilindro con el cual empezamos esta discusión.
El siguiente paso consistirá en extender el concepto de la geodésica en un espacio tri-dimensional Euclideano hacia la geodésica
en un espacio 4-dimensional propio de la Teoría de la Relatividad, el espacio-tiempo curvo. Para ello, podemos extender sin
dificultad alguna el concepto de la ecuación de Euler usado para encontrar la longitud más corta sobre una superficie en un
espacio de tres dimensiones (como lo es el caso de una esfera) hacia el espacio de cuatro dimensiones, obteniendo así la
ecuación de la geodésica entre dos puntos cualesquiera de dicho espacio 4-dimensional. No hay nuevos principios matemáticos
involucrados ni nuevas ideas, se trata únicamente de extender el concepto de la geodésica hacia un plano multi-dimensional. Es
precisamente así como se obtiene la ecuación general de la geodésica en un espacio-tiempo curvo propio de la Teoría
General de la Relatividad.
No hay que perder de vista el hecho de que la geodésica, por ser a fin de cuentas una distancia, un número medido en metros,
kilómetros o millas, sin dirección y sentido, es algo que esperamos que permanezca invariable bajo cualquier transformación de
coordenadas.

Armando Martínez Téllez a la/s 2:35


Compartir

‹ Página principal ›
Ver versión web
Datos personales
Armando Martínez Téllez
Ver todo mi perfil

Con la tecnología de Blogger.

converted by W eb2PDFConvert.com
La Teoría de la Relatividad
ESTE ES UN TRABAJO BAJO CONSTRUCCION

m i é r c o l e s , 1 8 d e m a r z o
La ruta geodésica II
Lo que hemos visto anteriormente puede ser extendido sin dificultad alguna a otros problemas en los cuales estamos interesados
en encontrar la geodésica que conecta a dos puntos diferentes en un espacio descrito no por dos coordenadas (x1, x2) sino por
tres coordenadas (x1, x2, x3).
PROBLEMA: Demostrar que la menor distancia entre dos puntos en un espacio tri-dimensional Euclideano es una línea recta.
En un espacio tri-dimensional Euclideano, el elemento de la distancia es:
ds² = (dx)² + (dy)² + (dz)²
O bien:
ds = √(dx)² + (dy)² + (dz)²
Para poder describir una una línea cualesquiera en el espacio tri-dimensional Euclideano necesitamos recurrir a ecuaciones
paramétricas en las que en este caso cada una de las variables que representan los tres ejes coordenados dependerá de un
parámetro independiente que llamaremos t, el cual podemos identificar como el tiempo para facilitar nuestra comprensión del
problema. En otras palabras, cada una de las variables x, y y z serán funciones del parámetro t. Siendo así, entonces podemos
llevar a cabo la integración de un punto t1 a otro punto t2:

Para poder utilizar la ecuación de Euler con la finalidad de determinar la ruta extrema entre t1 y t2, identificamos en este caso a
la función F de dicha ecuación como la siguiente:

Obsérvese que estamos llevando a cabo una simplificación representando cada una de las derivadas con respecto a t mediante
un punto colocado encima de cada variable y prescindiendo de la forma explícita de representar dichas derivadas.
En este caso, tendremos tres ecuaciones de Euler, las cuales son:

Obviamente, la función F ya no depende directamente ni de x ni de y ni de z, porque estas variables no aparecen como tales en
la expresión para F (notacionalmente, una variable cualquiera es diferente de la misma variable que tenga un punto colocado
encima, y no deben ser confundidas en el proceso de manipulación matemática). Con esto, tenemos que:

converted by W eb2PDFConvert.com
Entonces las tres ecuaciones de Euler originales se nos reducen a:

Substituyendo la relación para F en estas expresiones y llevando a cabo la integración con respecto al tiempo obtenemos:

Combinando las tres ecuaciones obtenidas, tenemos entonces:

Llevaremos ahora a cabo una integración sobre estas expresiones de un tiempo t1 a un tiempo arbitrario t, obteniendo lo
siguiente:

Ahora repetiremos el procedimiento integrando las mismas expresiones pero de un tiempo t1 a un tiempo t2 obteniendo así:

Esto nos permite hacer las substituciones apropiadas para poder obtener los valores de las constantes de integración C1, C2 y C3
llegando a lo siguiente:

Esta es precisamente la ecuación de una recta en el espacio tri-dimensional Euclideano que pasa por los puntos P(x1, y1, z1) y

converted by W eb2PDFConvert.com
Q(x2, y2, z2).
En algunos problemas es ventajoso recurrir a ciertos “trucos” que a veces se descubren accidentalmente y en otras ocasiones son
el fruto de la experiencia y la madurez del que está trabajando sobre problemas de esta índole. Uno de dichos trucos será
detallado a continuación.
PROBLEMA: Demuéstrese que si la función F en la integral:

es independiente de la variable x, entonces la integral es un extremo si:


Fy - y’Fy’ = constante
o bien, en forma explícita:

El diferencial total de F, cuando es una función de dos variables y y y’ es:

Obsérvese que el término (∂F/∂x) dx no fue incluído en la suma de términos puesto que la función F es independiente de x.
Dividiendo ambos lados entre el diferencial dx y simplificando mediante la toma de las derivadas:

Tomaremos ahora la expresión:


Fy - y’Fy’
y obtendremos la derivada de la misma con respecto a x, que viene siendo:

Tomaremos ahora la derivada con respecto a x del segundo término, y reemplazaremos en el primer término del lado derecho
de esta ecuación la expansión obtenida arriba para dF/dx, cancelando los dos términos comunes que se anulan mutuamente
(puestos en color rojo):

lo cual se nos simplifica a:

converted by W eb2PDFConvert.com
Factorizando y' tenemos que esto es igual a:

Entonces tenemos que:

Por otro lado, si:


Fy - y’Fy’
es igual a una constante, entonces la derivada de esto debe ser igual a cero:

Entonces lo que tenemos se nos reduce a:

Puesto que y’ = dy/dx se asume diferente de cero, esto sólo puede ser cierto si:

que es la ecuación de Euler, la condición esencial para que haya un extremo. Por lo tanto, si:

y si F es independiente de x, entonces la integral:

será un extremo.
PROBLEMA: Encontrar la geodésica que hay entre dos puntos situados sobre la superficie de una esfera.
Como siempre, el elemento de distancia en un espacio tri-dimensional está dado por:

converted by W eb2PDFConvert.com
ds² = (dx)² + (dy)² + (dz)²
o bien:
ds = √(dx)² + (dy)² + (dz)²

Para poder expresar el elemento de distancia en coordenadas esféricas recurrimos a las relaciones que conectan las coordenadas
Cartesianas (x,y,z) con las coordenadas esféricas (r,θ,φ):
x = r sen θ cos φ
y = r sen θ sen φ
z = r cos θ
No es difícil demostrar mediante estas relaciones que el elemento de línea ds² está dado por:
ds² = dr² + r² dθ² + r² sen²θ dφ²
Puesto que estamos interesados en obtener la geodésica sobre la superficie de una esfera, en este problema el radio r se
mantendrá constante en todo momento sin ser objeto de variación alguna. Esto significa que dr = 0. Entonces el elemento de
línea sobre la superficie de la esfera está dado por:
ds² = r² dθ² + r² sen²θ dφ²
ds = r √dθ² + sen²θ dφ²
Entonces, sacando fuera del radical a dφ, la distancia entre dos puntos cualesquiera 1 y 2 sobre la superficie de la esfera será
igual a:

Si lo que estamos buscando es la geodésica, la ruta extrema entre los puntos 1 y 2 (la cual puede ser un mínimo o un máximo)
entonces bajo el criterio de la ecuación de Euler identificamos como F a:

Para poder continuar, utilizaremos la siguiente representación notacional:

con lo cual podemos escribir lo siguiente:

Utilizaremos ahora la “segunda forma” de la ecuación de Euler:

con la cual podemos escribir lo siguiente:

converted by W eb2PDFConvert.com
Diferenciando y multiplicando al través por F, tenemos entonces:

Esto puede ser resuelto para dφ/dθ (obsérvese que no estamos resolviendo para dθ/dφ, en virtud de que este ligero cambio nos
resulta en una simplificación posterior para obtener la respuesta que buscamos), produciéndonos:

Despejando para φ y llevando a cabo la integración obtenemos la siguiente relación:

en donde κ es la constante de integración y α es utilizada para representar:


α² = (1 - C²)/C²
Reescribiendo lo anterior para ponerlo en función de θ, o mejor dicho cot(θ):
cot(θ) = α sen(φ - κ)
Este es un resultado en coordenadas esféricas que no nos ilustra mucho sobre la naturaleza de la geodésica. Para poder obtener
mayor claridad, es necesario revertir a coordenadas rectangulares (Cartesianas) multiplicando ambos miembros por r senθ para
obtener después de haber llevado a cabo la expansión de sen(φ - κ):
(α cos κ) r senθ senφ - (α sen κ) r senθ cosφ = r cosθ
Por razones que serán obvias pronto, no eliminaremos la variable r como podríamos hacerlo al aparecer como factor en ambos
lados de la ecuación.
Siendo κ y α constantes, podemos compactarlas bajo los nombres de otras constantes que las agrupen:
A = α cos κ
B = α sen κ
Esto nos produce:
A (r senθ senφ) - B (r senθ cosφ) = r cosθ
Pero de las transformaciones de coordenadas esféricas a coordenadas Cartesianas se sabe que:
x = r senθ cosφ
y = r senθ senφ
z = r cosθ
Entonces lo que tenemos es esencialmente:
Ay - Bx = z
En el espacio tri-dimensional Euclideano, esta es precisamente la ecuación de un plano que corta a la esfera pasando por el
converted by W eb2PDFConvert.com
centro de la misma. Se concluye que la geodésica es la curva que dicho plano forma con la intersección de la superficie de la
esfera, en pocas palabras, un círculo máximo, definido como aquél que corta a una esfera en dos partes iguales:

Obsérvese que en el caso de la geodésica de la esfera, el círculo máximo incluye tanto la distancia máxima como la distancia
mínima entre dos puntos cualesquiera de la superficie de la esfera, dependiendo del que entre dos puntos cualesquiera sobre la
superficie de la esfera nos movamos siguiendo el camino en el cual recorremos el ángulo esférico más corto que hay entre
dichos puntos (llamémoslo ω), o el ángulo máximo que hay entre dichos puntos (2π - ω), como nos lo muestra la siguiente figura
en la cual tenemos a la izquierda (en color rojo) la ruta más corta posible a lo largo de la geodésica y tenemos a la derecha
(también en color rojo) la ruta más grande posible a lo largo de la geodésica:

La distancia mínima será indudablemente aquella en la cual gastaremos la menor cantidad de gasolina si nos movemos en un
vehículo motorizado para llegar de un punto a otro. ¿Pero y la distancia máxima? Aquí la cosa parecería menos clara, porque
ciertamente hay muchas otras rutas que podemos tomar siguiendo la ruta contraria tomando muchas desviaciones en el camino.
Sin embargo, sólo una de ellas será la ruta “más derecha” posible.
Este problema nos ilustra otra situación en la que los estudiantes expuestos por vez primera a la obtención de máximos y
mínimos mediante las herramientas del cálculo infinitesimal no tienen problema alguno. En el cálculo infinitesimal, si queremos
obtener el máximo o el mínimo de alguna función, tomamos simplemente la derivada de la función e igualamos a cero, y tras
esto tomamos la segunda derivada para determinar mediante el cambio de signo si lo que tenemos es un máximo o un mínimo (o
varios máximos y varios mínimos). En el caso de la ecuación de Euler, no existe un procedimiento general para saber de
antemano si lo que hemos obtenido es un máximo o un mínimo, todo lo que sabemos es que hemos obtenido un extremo.
Afortunadamente, en el caso que nos ocupa, la naturaleza del extremo será obvia por las circunstancias de cada problema que se
vaya considerando.
Habiendo dejado en claro la forma en la cual trabaja la ecuación de Euler para obtener el extremo de una función F que aparece
bajo el signo de una integral, y habiendo dejado en claro también la forma en la cual se obtiene dicha ecuación, estamos
preparados para dar el salto del espacio tri-dimensional Euclideano al espacio 4-dimensional relativista, para lo cual la ecuación
geodésica deberá formularse bajo el esquema más amplio posible, el esquema del cálculo tensorial. Pero antes de ello, haremos
un repaso de la derivación de la ecuación de Euler con la pequeña diferencia de que en esta ocasión meteremos a la variable
tiempo como tal.
PROBLEMA: Demostrar que una condición necesaria para que:

converted by W eb2PDFConvert.com
sea un extremo es que:

Obsérvese que estamos utilizando la notación del punto puesto encima de la variable x, lo cual en este caso indica que se trata
de la derivada de x con respecto al tiempo, dx/dt, considerada en sí como una nueva variable.
Procedemos en esta derivación de la misma forma como lo hicimos para la ecuación de Euler en la que la variable tiempo no
estaba involucrada explícitamente.
Sea x = X(t) la curva que hace a la integral I extrema entre los tiempos t1 y t2. Entonces cualquier otra curva estará dada por:
x = X(t) + αη(t)
en donde α es un factor de escala independiente del tiempo que nos dá la magnitud de la variación y η(t) es una función
desconocida arbitraria excepto por el requerimiento de que todas las rutas alternas pasen también por los puntos t1 y t2 en
donde la variación debe ser cero, o sea:
η(t1) = 0
η(t2) = 0
Entonces, si la curva óptima que extremiza (minimiza) a la integral es x = X(t), cualquier otra ruta alterna estará dada por:
x = X(t) + αη(t)
Abreviaremos notacionalmente para simplicidad sin olvidar la dependencia sobre la variable x:
x = X + αη
Tomando diferenciales con respecto a la variable tiempo:
x’ = dx/dt = X’ + αη’
Al tomar la derivada con respecto al tiempo, en muchos textos y trabajos con la Relatividad General se acostumbra utilizar la
notación de punto poniendo un punto encima de la variable en lugar de la comilla, y tal cosa haremos aquí también:

La integral I a ser extremizada es la siguiente:

y la condición para obtener un valor extremo en α = 0, análoga a la derivada dy/dx igualada a cero en el cálculo infinitesimal
ordinario será:
[∂I(α) /∂α]α = 0 = 0
Extremizamos (minimizamos) ahora la integral tomando la derivada de la integral I con respecto al parámetro α manteniendo
todo lo demás constante:
I'(α) = ∂I(α) /∂α

De nueva cuenta, esto requiere llevar a cabo una diferenciación metiendo al símbolo ∂ dentro del símbolo ∫, o sea efectuando
una diferenciación bajo el símbolo de la integral, lo cual podemos hacer en virtud de que la diferenciación la estamos llevando a
converted by W eb2PDFConvert.com
cabo con respecto a la variable α y no con respecto a la variable dt sobre la cual se efectúa la acción del integrando:

Al segundo término en esta integral se le puede aplicar una integración por partes:

Puesto que η(t1) = η(t2) = 0, la parte integrada es igual a cero, con lo cual:

Juntando esto nuevamente con el primer término de la integral original, tenemos entonces:

Para que esto sea cierto lo que tenemos dentro del paréntesis debe ser cero, ya que siendo η arbitrario si lo escogemos
diferente de cero no hay otra forma de hacer la expresión de la izquierda igual a cero más que igualando todo lo que hay dentro
de los paréntesis a cero. Se concluye de lo anterior que:

Este resultado se puede extender fácilmente a cualquier cantidad n de coordenadas repitiendo mecánicamente los pasos
llevados a cabo arriba para una integral a ser extremizada que tenga la siguiente forma:

obteniendo no una sino varias ecuaciones de Euler, un total de n ecuaciones, una para cada coordenada:

El siguiente paso consistirá en extender el concepto de la geodésica de un espacio tri-dimensional Euclideano hacia la geodésica
en un espacio 4-dimensional propio de la Teoría de la Relatividad, el espacio-tiempo curvo. Para ello, podemos extender sin
dificultad alguna el concepto de la ecuación de Euler usado para encontrar la longitud más corta sobre una superficie en un
espacio de tres dimensiones (como lo es el caso de una esfera) hacia el espacio de cuatro dimensiones, obteniendo así la
ecuación de la geodésica entre dos puntos cualesquiera de dicho espacio 4-dimensional. No hay nuevos principios matemáticos
involucrados ni nuevas ideas, se trata únicamente de extender el concepto de la geodésica hacia un plano multi-dimensional. Es
precisamente así como se obtiene la ecuación general de la geodésica en un espacio-tiempo curvo propio de la Teoría
General de la Relatividad.

converted by W eb2PDFConvert.com
No hay que perder de vista el hecho de que la geodésica, por ser a fin de cuentas una distancia, un número medido en metros,
kilómetros o millas, sin dirección y sentido, es algo que esperamos que permanezca invariable bajo cualquier transformación de
coordenadas.
PROBLEMA: Derivar las ecuaciones geodésicas para un espacio multi-dimensional que pueda ser Euclideano o no-Euclideano.
Empezaremos por la definición más general de todas que se le pueda dar a un elemento infinitesimal de distancia, en la cual
interviene desde luego el tensor métrico g:
ds² = gpq xp xq
Cabe recordar, por la importancia de lo mismo, que aquí está siendo utilizada rígidamente la convención de sumación para
índices repetidos. Esta definición general, dada por Bernhard Riemann, puede ser utilizada para definir una distancia Euclideana
como la siguiente (teorema de Pitágoras extendido a cualquier número de dimensiones):
ds² = (x1)² + (x2)² + (x3)² + (x4) + (x5)²
o para definir un intervalo relativista en un espacio-tiempo plano:
ds² = (x1)² - (x2)² - (x3)² - (x4)
o cualquier otro tipo de distancia que queramos definir. Todo depende de la métrica.
Si en vez de utilizar simplemente ds utilizamos ds/dt, o sea la derivada con respecto al tiempo, entonces tenemos lo siguiente
(la convención de sumación seguirá vigente en todo lo que resta de la solución del problema):

Tensorialmente hablando, lo que queremos encontrar es el extremo de:

Para ello, recurriremos a la ecuación de Euler, al igual que como lo hicimos en todos los problemas anteriores. Pero
obviamente, esto requerirá no una sino varias ecuaciones de Euler para el caso más general que involucra varias variables, como
lo es el caso de la Relatividad General.
Haciendo la identificación:

la especificación de cada una de las ecuaciones de Euler requeridas es inmediata. Cada una de las ecuaciones de Euler para cada
una de las coordenadas xk estará dada por:

En el caso de la Relatividad General, puesto que tenemos un espacio 4-dimensional especificado mediante cuatro coordenadas
generalizadas, tendremos un sistema de cuatro ecuaciones. El procedimiento que llevaremos a cabo será válido para cualquier
espacio n-dimensional.
Obtendremos primero ∂F/∂xk:

converted by W eb2PDFConvert.com
Ahora procedemos a obtener la otra derivada:

Obsérvese que en esto se ha tenido que llevar a cabo un cambio en el sub-índice q de gpq haciéndolo gpk como lo muestra el
siguiente paso intermedio que se empleó arriba:

en virtud de que dentro de la doble sumatoria (implícita en los sub-índices de acuerdo a la convención de sumación):

mientras que:

e igualmente:

viniendo el factor 2 del hecho de que el tensor métrico g es simétrico, o sea gij = gji.
De lo dicho arriba para ds/dt, usando:

tenemos entonces que las ecuaciones de Euler para cada una de las coordenadas xk estarán dadas por:

Tomando la derivada con respecto al tiempo e invirtiendo el orden de los términos (lo cual equivale simplemente a cambiar los
signos):

Obsérvese que hemos utilizado aquí la notación del doble punto o punto repetido puesto encima de la variable para simbolizar
la derivada de segundo orden de la coordenada xk. Aquí podemos introducir los símbolos de Christoffel. Escribiendo:

converted by W eb2PDFConvert.com
tenemos entonces la siguiente conclusión:

Si tomamos a la longitud s del arco como parámetro, de modo tal que:

el resultado obtenido se nos convierte en lo siguiente:

Si multiplicamos ahora todo por grk, en el primer término tendremos primero:

con lo cual el primer término quedará convertido en lo siguiente al llevarse a cabo la contracción sobre los índices repetidos p
como lo marca la convención de sumación sobre la doble sumatoria:

mientras que en el segundo término el efecto de multiplicar grk por el símbolo de Christoffel de primer género será elevar el
índice k de dicho símbolo convirtiéndolo en un símbolo de Christoffel de segundo género:

De este modo, obtenemos finalmente:

Estas son las ecuaciones geodésicas para un espacio multi-dimensional que puede ser Euclideano o no-Euclideano, el cual es
mejor conocido como espacio de Riemann. Es un sistema de ecuaciones diferenciales de segundo orden que tiene que ser
resuelto para poder determinar la trayectoria a lo largo de las geodésicas. Si llevamos a cabo un ligero cambio notacional
haciendo r = β, p = σ y q = α, revirtiendo además hacia la notación de punto, podemos poner esto mismo en una forma que
resultará familiar a quienes ya han hojeado o estudiado textos convencionales de Relatividad General:

Esta ecuación fácilmente memorizable es también conocida como la ecuación geodésica, junto con las ecuaciones de campo
de la Relatividad General, nos dá una especificación matemática completa para el comportamiento de un sistema físico. De este
converted by W eb2PDFConvert.com
modo, cualquier problema propio de la Relatividad General se convierte en un problema de índole meramente matemática.
Pero es importante destacar que la ecuación es completamente general, y se puede utilizar para la búsqueda de geodésicas
tanto dentro de la Relatividad General como en la resolución de problemas clásicos como los que ya hemos visto.
En una geometría Euclideana de cuatro dimensiones, en donde todas las dimensiones son dimensiones espaciales, la geodésica es
“la línea más derecha posible de todas”. Esto es válido para toda geometría Euclideana en donde se cumple el quinto postulado
de Euclides que nos dice: “a través de un punto externo a una recta dada sólo es posible trazar una recta paralela a la recta
dada”. Pero obviamente el quinto postulado no se cumple en una geometría no-Euclideana como la que tiene lugar sobre la
superficie de una esfera. En cualquier parte de la esfera, si trazamos dos rectas perfectamente paralelas (por ejemplo,
formando ambas un ángulo de 90 grados con el Ecuador) y las extendemos indefinidamente sobre la superficie de la esfera, las
rectas eventualmente se encontrarán:

De cualquier manera, aún en una geometría no-Euclideana, la geodésica sigue siendo “la línea más derecha posible de todas”
entre dos puntos, sigue siendo la ruta que representa la menor distancia posible entre dichos puntos, la que nos llevaría el menor
tiempo posible recorrer. En la geometría Euclideana, dos geodésicas inicialmente paralelas permanecen paralelas, nunca se
cruzan ni divergen la una de la otra (como ocurre sobre la superficie de un hiperboloide con forma de silla de montar). Nosotros
describimos esta situación diciendo que este tipo de geometría es una geometría plana. Por otro lado, sobre la superficie de
una esfera dos geodésicas inicialmente paralelas convergen la una hacia la otra y eventualmente se cruzan. Nosotros describimos
esta situación diciendo que este tipo de geometría es una geometría curva.
El lector debe prepararse ahora para una sorpresa.
Si bien en cualquier geometría Euclideana o inclusive en cualquier geometría no-Euclideana bajo cualquier número de
dimensiones espaciales que se nos antoje postular la geodésica es la ruta que representa la menor distancia posible entre dos
puntos cualesquiera, en la geometría no-Euclideana del espacio-tiempo relativista en donde tenemos tres dimensiones espaciales
y una dimensión de tiempo la estructura de la geodésica es tal que aunque sigue siendo “la ruta más derecha posible de todas” la
geodésica no es la trayectoria mínima sino la trayectoria máxima de todas las trayectorias posibles, en pocas palabras no es la
menor distancia posible en el espacio-tiempo sino la mayor distancia posible. Esto tiene una consecuencia muy curiosa con la
que todos estamos familiarizados. Un cuerpo que se mueva bajo la influencia de la gravedad se moverá recorriendo la ruta que
le lleva el mayor tiempo posible recorrer de acuerdo con su reloj propio. En su libro ABC of Relativity: Understanding
Einstein publicado en 1925, Bertrand Russell llama a esto la “ley de la pereza cósmica” - los cuerpos dejados a sí mismos se
toman el mayor tiempo posible para llegar a su destino. Un cuerpo cualquiera, dejado a sí mismo, viaja de modo tal que el
tiempo que le lleva efectuar el recorrido, de acuerdo con su propio reloj, es el mayor tiempo posible. Si hubiera viajado
tomando cualquier otra ruta de un evento a otro, el tiempo sería menor.
¿Pero cómo es esto posible?, se preguntará el lector. En primer lugar, en los problemas matemáticos del cálculo de variaciones,
una de las primeras cosas que confronta el matemático es el hecho de que la solución que obtiene a un problema es una solución
extrema, la cual no necesariamente es un mínimo sino que puede ser también un máximo. La razón por la cual la solución
matemática al problema del recorrido entre dos puntos resulta ser la que toma el mayor tiempo posible es porque el tipo de
intervalo que estamos considerando no es un mero intervalo espacial sino un intervalo relativista que es más análogo a la
dimensión del tiempo que a la dimensión de longitud. De este modo, la Luna en su movimiento de rotación alrededor de la
Tierra escoge su ruta de modo tal que cualquier pedacito de dicha ruta representa una mayor “distancia” que cualquier otra ruta
alterna. Pero esta es una distancia espacio-tiempo. Si nosotros pensamos que la geodésica está dada por la menor distancia
posible entre dos puntos, entonces estamos pensando en una geodésica puramente espacial. Pero si pensamos que la geodésica
está dada por la mayor distancia posible entre dos puntos, entonces estamos pensando en una geodésica espacio-tiempo, una
geodésica relativista. Las trayectorias elípticas de los planetas alrededor del Sol son precisamente geodésicas relativistas. Las
trayectorias parabólicas de los cometas que suelen visitarnos de vez en cuando son también geodésicas relativistas.
Pero si un cuerpo cualquiera dejado a sí mismo viaja de modo tal que el tiempo que le lleva efectuar cualquier recorrido, de
acuerdo con su propio reloj, es el mayor tiempo posible, ¿no podría entonces tomarse un tiempo infinitamente grande para
llegar de un punto a otro? Definitivamente, no, porque el recorrido tiene que hacerlo a lo largo de la geodésica 4-dimensional, o
sea la ruta más corta posible en el espacio-tiempo relativista. Esto es similar a los arcos del circulo máximo que en el espacio
Euclideano tri-dimensional representan la solución a la ecuación de Euler sobre la superficie de una esfera; entre dos puntos
cualesquiera uno de los arcos cuyos extremos están situados en dichos puntos será un arco de menor longitud (mínimo) mientras

converted by W eb2PDFConvert.com
que el otro será el de mayor longitud (máximo), las geodésicas fijan la ruta a seguir, y no hay infinitos involucrados.
Para poder estudiar en mayor detalle la forma en la cual hacemos un recorrido de un punto P a un punto Q en el espacio-tiempo
relativista, debemos considerar cualquier recorrido que llevemos a cabo como un recorrido formado por una cantidad
infinitamente grande de intervalos relativistas infinitamente pequeños:
ds² = (dct)² - (dx)² - (dy)² - (dz)²
Toda geodésica relativista se puede considerar formada por segmentos de intervalos relativistas infinitesimales. Aquí
podemos definir tres tipos de geodésicas en el espacio-tiempo:
1) Geodésicas tipo temporal (timelike).- Aquellas en las que en un intervalo relativístico predomina el componente temporal
sobre el componente espacial,
2) Geodésicas tipo espacial (spacelike).- Aquellas en las que en un intervalo relativístico predomina el componente espacial
sobre el componente temporal
3) Geodésicas tipo luminoso (lightlike).- Aquellas en las que en un intervalo relativístico el componente espacial es igual al
componente temporal.
En la Teoría Especial de la Relatividad, dos observadores inicialmente en reposo el uno frente al otro permanecen en reposo
manteniendo una separación espacial constante, y entonces dos geodésicas tipo temporal inicialmente paralelas se mantendrán
paralelas. El mismo argumento se puede extender hacia las geodésicas tipo espacial y tipo luminoso. Al no cruzarse jamás dichas
geodésicas, se concluye que en la Teoría Especial de la Relatividad, la geometría del espacio-tiempo es Euclideana, es
decir, plana, es una geometría en donde se cumple el quinto postulado de Euclides que nos afirma que dos rectas paralelas se
mantienen paralelas sin cruzarse y sin divergir la una de la otra. Es el tipo de geometría descrita por las transformaciones de
Lorentz. Y en contraste, en la Teoría General de la Relatividad, la geometría del espacio-tiempo es curva, es una geometría en
donde no se cumple el quinto postulado de Euclides porque es una geometría en donde las rectas paralelas no pueden existir.

Armando Martínez Téllez a la/s 2:33


Compartir

‹ Página principal ›
Ver versión web
Datos personales
Armando Martínez Téllez
Ver todo mi perfil

Con la tecnología de Blogger.

converted by W eb2PDFConvert.com
La Teoría de la Relatividad
ESTE ES UN TRABAJO BAJO CONSTRUCCION

m i é r c o l e s , 1 8 d e m a r z o
La ruta geodésica III
Con la ecuación geodésica firmemente en nuestras manos, el siguiente paso consiste en la aplicación de la misma para la
resolución de algunos problemas con el fin de utilizarla eventualmente en la Teoría de la Relatividad. Es importante señalar que
no hay problema relacionado con geodésicas que no podamos resolver recurriendo directamente a la ecuación de Euler. La
ventaja de la ecuación geodésica es que, además de ser fácilmente memorizable, nos produce en esencia lo mismo que nos
brinda la ecuación de Euler.
PROBLEMA: Mediante la ecuación geodésica, encontrar la geodésica entre dos puntos en un plano Cartesiano bi-dimensional.
Para un plano Cartesiano bi-dimensional en el cual tenemos dos coordenadas:
(x1, x2) = (x, y)
habrá dos ecuaciones diferenciales, una para cada coordenada:

Puesto que, tratándose de coordenadas rectangulares Cartesianas, los símbolos de Christoffel (resaltados en color rojo) son todos
iguales a cero, las dos ecuaciones diferenciales anteriores se reducen simplemente a:

Integrando cada una de estas ecuaciones diferenciales una vez:


dx/ds = A____dy/ds = B
en donde A y B son constantes de integración. Combinando ahora ambas ecuaciones de la siguiente manera:

en donde hemos hecho a A/B una nueva constante m. Integrando de nuevo:


y = mx + b
Esta es la ecuación de una recta. Se concluye que en un plano bi-dimensional Cartesiano, la geodésica entre dos puntos es la
recta que los une.
PROBLEMA: Mediante la ecuación geodésica, encontrar la geodésica entre dos puntos en un plano Cartesiano tri-dimensional.
Para un plano Cartesiano bi-dimensional en el cual tenemos dos coordenadas:
(x1, x2, x3) = (x, y, z)

converted by W eb2PDFConvert.com
habrá tres ecuaciones diferenciales, una para cada coordenada:

Nuevamente, puesto que tratándose de coordenadas rectangulares Cartesianas, los símbolos de Christoffel (resaltados en color
rojo) son todos iguales a cero, las tres ecuaciones diferenciales anteriores se reducen simplemente a:

Integrando cada una de estas ecuaciones diferenciales obtenemos lo siguiente:


x = As + x0____y = Bs + y0____z = Cs + z0
en donde A, B, C, x0, y0, y z0 son constantes de integración. Eliminando a la variable s de cada par de ecuaciones que podemos
formar, tenemos lo siguiente:

Esta es la ecuación de una recta dentro de un espacio Cartesiano tri-dimensional. Se concluye que en un plano tri-dimensional
Cartesiano, la geodésica entre dos puntos es la recta que los une.
PROBLEMA: Mediante la ecuación geodésica, escribir las ecuaciones diferenciales para las geodésicas en coordenadas
cilíndricas.
En coordenadas cilíndricas, especificamos un punto mediante las siguientes tres coordenadas:
(x1, x2, x3) = (r, θ, z)
Puesto que tenemos tres coordenadas, habrá tres ecuaciones diferenciales para las geodésicas en coordenadas cilíndricas:

Para las coordenadas cilíndricas, los únicos símbolos de Christoffel diferentes de cero son los siguientes:
Γ221 = Γθ θr = 1/r

Γ212 = Γθ rθ = 1/r

Γ122 = Γr θθ = - r
Llevando a cabo la doble sumatoria requerida en el segundo término de la ecuación geodésica según lo requiere la convención
de sumación, obtenemos para la geodésica de la coordenada radial r la siguiente ecuación diferencial:

converted by W eb2PDFConvert.com
Repitiendo el procedimiento, tenemos la siguiente ecuación diferencial para la geodésica de la coordenada angular θ:

Por último, tenemos la siguiente ecuación diferencial para la geodésica de la coordenada z que en realidad viene siendo trivial:

De esta última ecuación, casi podemos ver de inmediato que para la superficie del cilindro en el cual mantenemos la
coordenada radial r constante todo el tiempo sin cambio alguno, la geodésica vendrá siendo una hélice.
Como puede verse, los símbolos de Christoffel son en realidad todo lo que necesitamos para escribir las ecuaciones geodésicas
que correspondan a cierto sistema de coordenadas.
PROBLEMA: Mediante la ecuación geodésica, escribir las ecuaciones diferenciales para las geodésicas en coordenadas
esféricas.
En coordenadas esféricas, especificamos un punto mediante las siguientes tres coordenadas:
(x1, x2, x3) = (r, θ, φ)
Puesto que tenemos tres coordenadas, habrá tres ecuaciones diferenciales para las geodésicas en coordenadas esféricas:

Para la solución del problema necesitamos los símbolos de Christoffel para las coordenadas esféricas que son los siguientes:
Γ221 = Γθθr = Γ212 = Γθrθ = 1/r

Γ331 = Γφφr = Γ313 = Γφrφ = = 1/r

Γ332 = Γφφθ = Γ323 = Γφθφ = cot θ

Γ122 = Γrθθ = - r

Γ133 = Γrφφ = - r sen² θ

Γ233 = Γθφφ = - sen θ cos θ


Todos los demás símbolos de Christoffel son iguales a cero.
Desarrollaremos primero la ecuación diferencial que corresponde a la geodésica relacionada con la coordenada radial r
expandiendo la doble sumatoria implícita por la convención de sumación en el segundo término de la ecuación geodésica:

converted by W eb2PDFConvert.com
En la expansión mostrada se han destacado de color rojo los símbolos de Christoffel que son iguales a cero y que por lo tanto no
harán contribución alguna a la doble sumatoria.
De este modo, obtenemos nuestra primera ecuación diferencial:

Desarrollaremos ahora la ecuación diferencial que corresponde a la geodésica relacionada con la coordenada angular θ
expandiendo la doble sumatoria implícita por la convención de sumación en el segundo término de la ecuación geodésica:

De este modo, obtenemos nuestra segunda ecuación diferencial:

Por último, desarrollaremos la ecuación diferencial que corresponde a la geodésica relacionada con la coordenada angular φ
expandiendo la doble sumatoria implícita por la convención de sumación en el segundo término de la ecuación geodésica:

De este modo, obtenemos nuestra tercera ecuación diferencial:

PROBLEMA: Mediante la ecuación geodésica, escribir las ecuaciones diferenciales para las geodésicas sobre la superficie de
una esfera.
Este problema es esencialmente similar al problema anterior, excepto que ahora vamos a fijar el radio a un valor inalterable,
manteniéndolo constante. Esto nos deja con tan sólo dos ecuaciones que corresponden a las otras dos coordenadas a las cuales sí
les está permitido variar:

converted by W eb2PDFConvert.com
Desarrollaremos primero la ecuación diferencial que corresponde a la geodésica relacionada con la coordenada angular θ
expandiendo la doble sumatoria implícita por la convención de sumación en el segundo término de la ecuación geodésica:

En la expansión mostrada se han destacado de color rojo los símbolos de Christoffel que son iguales a cero y que por lo tanto no
harán contribución alguna a la doble sumatoria.
Utilizando los valores para los símbolos de Christoffel correspondientes a las coordenadas esféricas dados en la solución del
problema anterior, tenemos entonces la primera ecuación diferencial que corresponde a las geodésicas sobre la superficie de
una esfera:

Desarrollaremos ahora la ecuación diferencial que corresponde a la geodésica relacionada con la coordenada angular φ
expandiendo la doble sumatoria implícita por la convención de sumación en el segundo término de la ecuación geodésica:

Utilizando los valores para los símbolos de Christoffel correspondientes a las coordenadas esféricas dados en la solución del
problema anterior, tenemos entonces la segunda ecuación diferencial que corresponde a las geodésicas sobre la superficie de
una esfera:

Es tiempo de llevar nuestros recién adquiridos conocimientos al campo de la Teoría de la Relatividad.


Puesto que en la Teoría de la Relatividad el espacio es un espacio 4-dimensional:
(x1, x2, x3, x4)
la ecuación geodésica nos producirá un sistema de cuatro ecuaciones diferenciales. Si en vez del parámetro longitud de arco s
introducimos el parámetro tiempo propio τ usando la relación:

s = cτ
entonces tendremos el siguiente sistema de ecuaciones:

converted by W eb2PDFConvert.com
Estas son las cuatro ecuaciones que especifican la ruta geodésica que seguirán los cuerpos en movimiento al estar inmersos los
cuerpos en un espacio-tiempo curvo. Lo único que nos hace falta para resolver el sistema de ecuaciones son los símbolos de
Christoffel, los cuales dependen a su vez directamente del tensor métrico g del cual se obtienen. Es por esto que la métrica
determina todo lo que hay que saber y que se pueda saber de un sistema de cuerpos en movimiento libre.
En virtud del primer término en cada una de las ecuaciones diferenciales para las geodésicas, todas ellas son ecuaciones
diferenciales de segundo orden. El segundo término en cada una de ellas involucra un producto de diferenciales que convierte al
sistema en un sistema de ecuaciones no-lineares, justo uno de los temas más difíciles a tratar, lo cual convierte a la Teoría
General de la Relatividad en una pesadilla para los físicos y en una delicia para los matemáticos. Afortunadamente, en algunos
casos especiales, sobre todo los más importantes, por razones de simetría las ecuaciones se pueden simplificar y se puede
obtener una solución exacta o casi exacta. Pero hablando en términos generales, no existe una solución matemática general para
todos los casos posibles, cada caso tiene que ser analizado y tratado sobre sus propios méritos. Una ayuda en esto es la plena
libertad que tenemos para seleccionar el sistema de coordenadas que más convenga a nuestros propósitos en cierto problema.
Podemos inventar incluso nuestro propio sistema de coordenadas. Sin embargo, lo que describa tal sistema de coordenadas
tendrá que ser algo compatible con las ecuaciones de campo de la Relatividad General.

Armando Martínez Téllez a la/s 2:32


Compartir

‹ Página principal ›
Ver versión web
Datos personales
Armando Martínez Téllez
Ver todo mi perfil

Con la tecnología de Blogger.

converted by W eb2PDFConvert.com
La Teoría de la Relatividad
ESTE ES UN TRABAJO BAJO CONSTRUCCION

m i é r c o l e s , 1 8 d e m a r z o
El transporte paralelo
Intimamente ligado con el concepto de la geodésica dentro de la Relatividad General está el concepto del transporte paralelo.
Haremos primero una distinción entre los dos tipos diferentes posibles de curvatura que puede haber sobre una superficie: la
curvatura intrínseca y la curvatura extrínseca. Consideremos primero la superficie de un cilindro, la cual como vimos
previamente se obtiene enrollando una hoja plana de papel. Uno puede pensar que la superficie de un cilindro es curva puesto
que dicha superficie está “redonda” en cierta dirección en torno al eje de simetría. Esta es una curvatura extrínseca, ya que no
tiene relación alguna con el espacio tri-dimensional plano (en la hoja del cilindro) del cual forma parte. Uno puede formar la
superficie de un cilindro con el simple hecho de enrollar un pedazo plano de papel sin necesidad de tener que cortar o arrugar
el papel en lo más mínimo, de modo tal que la geometría intrínseca es la misma es la misma que la del pedazo de papel original,
es una geometría plana, lo cual significa que la distancia original entre dos puntos cualesquiera sobre la superficie del papel
sigue siendo la misma antes y después del enrollamiento. Las líneas paralelas trazadas sobre la hoja plana de papel original
siguien siendo paralelas después de haber sido enrollado el papel para formar un cilindro, lo cual implica que al permanecer
invariable la validez del quinto postulado de la geometría Euclideana (por un punto exterior a una recta dada sólo es posible
trazar una línea paralela a la recta dada) la superficie del cilindro sigue siendo una geometría Euclideana, todos los resultados y
teoremas clásicos de la geometría Euclideana plana siguen siendo válidos sobre la superficie de un cilindro (la suma de los
ángulos internos de un triángulo cualquiera es igual a 180 grados, el cuadrado de la hipotenusa de un triángulo rectántulo es igual
a la suma de los cuadrados de los catetos, etc.) Para una hormiga confinada a vivir sobre la superficie de un cilindro, la
superficie del cilindro sería una superficie plana en todos sentidos, no tendría forma alguna de detectar la curvatura haciendo
mediciones extremadamente precisas de ángulos sobre dicha superficie. Lo único curioso que encontraría es que viajando hacia
adelante siempre en línea recta, después de una cantidad finita de tiempo descubriría asombrada haber regresado al mismo
punto en el cual empezó su travesía. La geometría intrínseca de una hoja n-dimensional considera únicamente la relación que
pueda haber entre los puntos de las trayectorias confinados a su superficie, mientras que la geometría extrínseca proviene del
considerar a dicha superficie como parte de un espacio formado por un mayor número de dimensiones como lo es el caso de la
superficie del cilindro. De este modo, la geometría extrínseca descansa sobre la suposición de la existencia de espacios
multidimensionales con un mayor número de dimensiones.
En la Relatividad General, cuando hablamos de la curvatura del espacio-tiempo, estamos hablando de una curvatura intrínseca,
puesto que todas las líneas del mundo están confinadas a permanecer en un espacio cuatri-dimensional; en la Relatividad General
en su formulación original no hay espacios de cinco dimensiones o más. Desde la perspectiva de la Relatividad General, si
habitamos en un mundo que forma parte de algo que ocupe más de cuatro dimensiones, ello no es cosa que nos concierna,
puesto que de cualquier manera no podemos salir fuera hacia esa “quinta dimensión”; lo único en lo que estamos interesados es
en la geometría intrínseca del espacio-tiempo.
La superficie del cilindro es intrínsecamente plana. Pero si empezamos a considerar la superficie de una esfera, entonces las
cosas cambian dramáticamente. Para darnos cuenta de ello, considérese la siguiente figura en la cual tenemos un triángulo
esférico formado por el área delimitada por tres círculos máximos (que son las geodésicas o “líneas rectas” sobre la superficie
de una esfera):

converted by W eb2PDFConvert.com
Sobre la superficie de una esfera como ésta, la geometría deja de ser Euclideana. En ella, dos líneas inicialmente paralelas
dejan de ser paralelas desde el momento en que son trazadas. Si trazamos sobre la geodésica AB dos líneas muy cercanas entre
sí que sean perpendiculares a dicha geodésica, eventualmente terminarán cruzándose. Por otro lado, la suma de los ángulos
internos α, β y γ del triángulo ABC ya no es igual a 180 grados, y de hecho siempre será mayor que 180 grados. Podemos trazar
sin dificultad alguna sobre la superficie de una esfera un triángulo cuyos ángulos internos sean todos ángulos rectos, y cuya suma
será igual a 270 grados:

Otra diferencia que podemos encontrar la tenemos si trazamos sobre una hoja plana un “triángulo” hecho con curvas, el cual
podemos tomar como la proyección de un triángulo esférico sobre una imagen tomada por una cámara fotográfica, y empezando
en un punto de dicho triángulo empezamos a trazar líneas horizontales que para nosotros serán líneas perfectamente paralelas:

Si empezamos desde el punto A trazando una línea recta con forma de flecha (de color rojo) representando un vector, y nos
vamos desplazando en sentido contrario a las manecillas del reloj hasta llegar al punto B y después al punto C para finalmente
regresar al punto A, trazando más líneas horizontales al ir haciendo el recorrido, al regresar al punto A el vector final será
paralelo al vector inicial, ambos apuntarán en la misma dirección. Pero si llevamos a cabo un procedimiento similar sobre la
superficie de una esfera, entonces tenemos algo interesante:

En este caso, supóngase que empezamos trazando flechas perfectamente paralelas a lo largo de la geodésica que va desde el
punto A hasta el punto N (el cual podemos tomar como el polo Norte). Estas flechas o vectores serán desde luego las tangentes a

converted by W eb2PDFConvert.com
la geodésica que va desde el punto A hasta el punto N. De la misma manera, una vez que hemos llegado al punto N, trazamos
una paralela a la última tangente que construída al llegar a N pero moviéndonos a lo largo de la geodésica que va desde el punto
N hasta el punto B, lo cual significa que la paralela trazada será una perpendicular al arco NB, y tras esto vamos trazando otras
perpendiculares iguales a lo largo del arco NB, todas las cuales serán paralelas entre sí, hasta llegar al punto B. Hasta aquí, todo
parece en orden.
Ahora supóngase que continuamos el procedimiento después de haber llegado desde el punto N hasta el punto B trazando rectas
paralelas, y empezamos a trazar más paralelas yéndonos del punto B hasta el punto A. Recuérdese que todas estas rectas las
estamos trazando mediante escuadra y compás tan paralelas como no es posible.
Es al completar el circuito llegando al punto A cuando nos topamos con una sorpresa. La línea “paralela” en el punto A al llegar a
dicho punto desde el punto B no apunta en la misma dirección que la de la línea “paralela” inicial. De hecho, el campo vectorial
ha experimentado una rotación de α grados en nuestra construcción sobre la superficie esférica. De este modo, si partimos
desde un punto cualquiera del globo terráqueo siguiendo una ruta geodésica y vamos trazando tangentes sobre dicha ruta, todas
las cuales serán paralelas entre sí al irlas trazando, y continuamos trazando más paralelas conforme hacemos el recorrido que
correspondería a una trayectoria sobre las líneas de un triángulo esférico, entonces al completar un circuito cerrado encontramos
que las líneas han dejado de ser paralelas. Es el circuito cerrado el que ha dado origen a la discrepancia.
La construcción que acabamos de llevar a cabo es conocida como el transporte paralelo, porque vamos “transportando” una
paralela de un punto a otro trazándolas tan paralelas la una a la otra como nos sea posible. Pero por lo que acabamos de ver, no
nos es posible intentar definir -sobre una hoja de trazado curva- campos vectoriales globalmente paralelos. Aún nos es posible
definir un paralelismo local, especificando cómo mover un vector de un punto a otro sobre una hoja de trazado curva de modo
tal que el vector trasladado mantenga la misma dirección y la misma longitud, pero el resultado de tal transporte paralelo
dependerá del tipo de curvatura y sobre todo de la ruta seguida, por lo que no se puede afirmar de modo general que un vector
trazado en un punto A sea paralelo a otro vector B sobre una superficie curva.
En la siguiente figura tenemos un vector V (de color rojo) que ha sido objeto de un transporte paralelo a lo largo de una curva
en la cual una tangente cualquiera de dicha curva es un vector U (de color azul) que viene siendo igual a U = dx/dλ en donde dλ
es un parámetro que puede ser un segmento infinitesimal de arco o un intervalo infinitesimal de tiempo:

Existe un método de aproximación de primer orden con cierta justificación matemática sobre el paralelogramoide de Levi-
Civita para ir construyendo (transportando) un vector V a lo largo de una ruta geodésica, conocido como la escalera de Schild,
ilustrado en el siguiente diagrama:

El método de construcción es el siguiente:


converted by W eb2PDFConvert.com
(1) Empezamos con un segmento de geodésica como el que muestra la figura de arriba, sobre el cual está puesto el vector V =
A0X0 que es el vector que será movido a lo largo de la geodésica mediante el transporte paralelo.
(2) Seleccionamos otro punto A1 sobre la geodésica que esté cercano al punto A0, en la dirección hacia la cual será movido el
vector original.
(3) Trazamos una recta que conecte la punta del vector A0X0 con el punto A1, y hecho esto marcamos el punto medio de dicha
recta, que aquí llamaremos P1.
(4) Constrúyase la geodésica A0P1 y extiéndase la misma hasta el punto X1, de modo tal que la longitud paramétrica de A0X1 sea
el doble de la longitud A0P1.
(5) Finalmente, constrúyase la geodésica A1X1, con lo cual el vector original ha sido desplazado en transporte paralelo hacia una
nueva posición.
La figura muestra dos peldaños de la escalera.
Para poder continuar adelante, daremos ahora un repaso a la estructura matemática que está detrás de los conceptos de la
tangente a una curva espacial en un punto cualquiera de dicha curva.
Intuitivamente, el concepto de la recta tangente a una curva espacial no ofrece mucha dificultad. En la siguiente figura:

en donde sobre la superficie del paraboloide se ha trazado una curva espacial (de color rojo, la cual no necesariamente es la
geodésica sobre dicha superficie) se ha trazado una recta tangente a dicha curva espacial (de color verde). Y en la siguiente
figura, tenemos dos parábolas planas, una de color rojo y la otra de color azul, cada una de las cuales tiene trazada su propia
recta tangente en un punto común a ambas (del mismo color que hace corresponder a la curva espacial con la tangente que le
toca):

Como puede verse en ambas figuras, la tangente puesta en cierto punto P de una curva espacial apunta en la misma dirección

converted by W eb2PDFConvert.com
hacia la cual se está moviendo en el espacio dicho punto. A cada punto de una misma curva espacial corresponderá una tangente
diferente.
Podemos definir formalmente a la tangente de una curva en un punto P de dicha curva como el proceso límite de varias
secantes trazadas a través de dicho punto en donde la distancia h entre los dos puntos P y Q de una secante sobre la curva se va
disminuyendo arbitrariamente hasta que h toma un valor infinitesimalmente pequeño:

En un sistema tri-dimensional de coordenadas Cartesianas, si tenemos una curva espacial cuyas componentes en cada uno de los
tres ejes están especificadas con funciones independientes de un parámetro como t (en función del tiempo) o como s (en
función del arco de longitud de la curva):
x = x(t)___y = y(t)___z = z(t)
entonces si agrupamos estas componentes en un triplete ordenado al cual podemos designar como U:
U = [x(t), y(t), z(t)]
el vector tangente dU/dt (o dU/ds, en su caso) estará dado simplemente por la derivada respectiva de cada componente:

Para simbolizar lo mismo, se acostumbra usar también la notación de los vectores unitarios de base, los cuales son de longitud 1
y que en coordenadas Cartesianas son i, j y k, con lo cual:

Otra notación alterna con vectores unitarios de base utilizada frecuentemente en muchos textos es la siguiente:

Todas estas notaciones sirven para indicar exactamente lo mismo, un triplete ordenado de elementos que deben mantenerse
separados para efectos de cálculo matemático.
Para distinguir a un vector tangente dU/dt de longitud arbitraria obtenido sobre un punto P de una curva espacial de un vector
tangente unitario cuya longitud es siempre igual a la unidad, tenemos que dividirlo entre la expresión que nos dé la magnitud
║dU/dt║ de dicho vector. Podemos denotar a este último como T:

T = (dU/dt) /║dU/dt║
PROBLEMA (5): Suponiendo que una curva C está definida por las ecuaciones paramétricas x = x(s), y = y(s), z = z(s), en donde
s es una longitud de arco de la curva C medida desde un punto fijo en C, demostrar que si r es un vector posición de
cualquier punto en la curva C entonces dr/ds es un vector tangente unitario a la curva C en dicho punto.

converted by W eb2PDFConvert.com
Si r es el vector posición que nos dá las coordenadas de la punta de un vector flecha a partir del origen (0,0,0), entonces:
r = (x, y, z)
Podemos representar el triplete de componentes en vectores unitarios de base i, j y k para simplificar el desarrollo de la
solución:
r=xi +yj +z k
Tomando la derivada con respecto a un elemento infinitesimal de longitud, el vector:

es una tangente a la curva recorrida por la punta del vector posición en base al procedimiento de construcción dado arriba. La
magnitud de este vector está dada por:

Usando la relación Pitagórica para un elemento infinitesimal de longitud:


ds² = dx² + dy² + dz²
Reagrupando y usando la relación tenemos entonces que:
║dr/ds║ = √(dx² + dy² + dz²)/(ds)²

║dr/ds║ = √(dx² + dy² + dz²)/(dx² + dy² + dz²)²

║dr/ds║ = 1

Entonces el vector tangente ║dr/ds║ = 1 es un vector unitario.


PROBLEMA: (1) Encontrar un vector unitario tangente a cualquier punto sobre la curva espacial cuyas ecuaciones
paramétricas son las siguientes:
x = t² + 1
y = 4t - 3
z = 2t² - 6t
y (2) encontrar la tangente unitaria en el punto en donde t = 2.
(1) Para encontrar un vector tangente a cualquier punto sobre la curva, obtenemos primero:
dx/dt = 2t
dy/dt = 4
dz/dt = 4t - 6
En notación de triplete, el vector tangente a cada punto de la curva está dado por:
dr/dt = (2t, 4, 4t - 6)

converted by W eb2PDFConvert.com
Y en notación con vectores unitarios de base, podemos escribir la misma respuesta ya sea como:
dr/dt = (2t) i + 4 j - (4t - 6) k
o como:
dr/dt = (2t) e1 + 4 e2 - (4t - 6) e3
Ambas notaciones sirven para indicar exactamente lo mismo, un triplete ordenado de elementos que deben mantenerse
separados para efectos de cálculo matemático.
La longitud de este vector tangente dr/dt es algo que puede variar de un punto a otro sobre la curva espacial. Para que el
vector tangente sea unitario en cualquier punto de la curva, tenemos que dividirlo entre la magnitud de dicho vector, la cual
es:
║dr/dt║ = √(dx/dt)² + (dy/dt)² + (dz/dt)²

║dr/dt║ = √(2t)² + (4)² + (4t - 6)²

Usando notación de vectores unitarios de base, el vector tangente unitario T sobre cualquier punto de la curva será:
T = (dr/dt) /(║dr/dt║)

(2) En el punto t = 2, el vector tangente unitario será;

Haremos ahora un repaso de otro concepto que utilizaremos en nuestra discusión posterior, el concepto de la derivada
direccional. Para ello, definiremos primero el operador diferencial del o nabla en tres dimensiones en coordenadas
rectangulares (Cartesianas) de la siguiente manera:

Siendo este operador un operador vectorial, aplicarlo sobre una función escalar φ cualesquiera nos producirá un campo
vectorial, el campo vectorial ∇φ, al cual se le dá el nombre de gradiente.
Recurriendo a coordenadas generalizadas xk, podemos extender también la definición del operador vectorial ∇ de tres
dimensiones a un espacio 4-dimensional:

PROBLEMA: Encontrar el gradiente de las siguientes funciones escalares:


(1) φ = x² + y² + z²
(2) φ = 5 + 2x -4xy² + 3z
(3) φ = xyz
(4) φ = x² - y² - z²

converted by W eb2PDFConvert.com
Usando notación de vectores unitarios de base:
(1) ∇φ = 2x i + 2y j + 2z k
(2) ∇φ = (2 - 4y²) i - 8xy j + 3 k
(3) ∇φ = yz i + xz j + yz k
(4) ∇φ = 2x i - 2y j - 2z k
La componente del vector gradiente ∇φ que apunta en la dirección de un vector unitario V se obtiene con el producto escalar
de ambos, o sea ∇φ·V, y se define formalmente como la derivada direccional de la función escalar φ a lo largo de la dirección
del vector V. Geométricamente hablando, en cierta forma es igual a la magnitud de la proyección del vector ∇φ en la
dirección hacia la cual apunta el vector V. Físicamente, esto se interpreta como la razón de cambio de φ en la dirección de V
en cierto punto preseleccionado del espacio a lo largo de una trayectoria.
PROBLEMA: Encontrar la derivada direccional del siguiente campo escalar:
φ = x²yz + 4xz²
en el punto (1, -2, -1) en la dirección del vector:
v = (2, -1, -2)
El primer paso en la solución de este problema consiste en la determinación del campo vectorial ∇φ a partir del campo escalar
φ mediante la aplicación del operador vectorial ∇ a φ. Lo haremos aquí usando notación de vectores unitarios de base en lugar
del triplete ordenado de números con el objeto de simplificar la lectura de los pasos:
∇φ = ∇(x²yz + 4xz²)

∇φ = (2xyz + 4z²) i + x²z j + (x²y + 8xz) k

En el punto (1, -2, -1), el vector que pertenece al campo vectorial ∇φ tiene el siguiente valor:
∇φ = (4 + 4) i + (-1) j + (-2 - 8) k

∇φ = 8i - j - 10k

Antes de encontrar la derivada direccional en el punto (1, -2, -1) en la dirección del vector v = (2, -1, -2), normalizaremos dicho
vector para que tenga una longitud igual a la unidad:
V = v / ║v║
V = (2 i - j - 2k) /√(2)² + (-1)² + (-2)²
V = (2 i - j - 2k) /3
V = (2/3) i - (1/3) j - (2/3) k
La derivada direccional que estamos buscando la obtenemos tomando el producto escalar de los vectores ∇φ y V:
∇φ · V = [8i - j - 10k ] · [(2/3) i - (1/3) j - (2/3)] k

∇φ · V = (8) (2/3) + (-1) (-1/3) + (-10)(-2/3)

∇φ · V = 37/3

En virtud de que la derivada direccional es positiva, esto nos dice que φ está aumentando en esta dirección.
Si hemos de definir lo que hemos visto arriba en términos un poco más elegantes y más formales, usando coordenadas
generalizadas, podemos decir que si tenemos una función escalar φ que dependa de varias coordenadas x1, x2, x3, ..., etc.:

converted by W eb2PDFConvert.com
a lo largo de un vector v (tangente a una curva espacial):

entonces la derivada direccional de esa función escalar φ a lo largo del vector v está definida mediante el límite:

Esta definición intenta resumir todo lo que ya se ha señalado arriba, y en realidad no es más que la representación formal del
producto escalar:
∇φ(x) · v

que frecuentemente se resume simplemente como:

Habiendo visto ya lo que es la derivada direccional, estamos preparados para ver lo que es la derivada absoluta de un tensor, la
cual se representa con la siguiente simbología en el caso de un tensor covariante A:

Esta simbología así como el uso de la palabra “derivada absoluta” son desafortunados porque pudieran dar la falsa impresión de
que la derivada absoluta de un tensor equivale simplemente a la diferenciación de un tensor, lo cual no es así, porque la
derivada absoluta es la extensión al cálculo tensorial del concepto de la derivada direccional, y como lo vimos arriba, la
derivada direccional no es simplemente la diferenciación de un vector, sino que es algo sobre lo cual se aplica posteriormente
un producto vectorial escalar con una tangente para obtener la proyección
Aclarado lo anterior, definimos a la derivada absoluta de un tensor o derivada intrínseca de un tensor de la siguiente manera
en caso de que se trate de un tensor contravariante Tj:

Compárese esta definición con la definición de la derivada direccional. Al igual que en el caso de la derivada direccional en
donde tenemos que obtener primero el vector gradiente ∇φ mediante la aplicación del operador diferencial vectorial ∇,
también para obtener la derivada absoluta tenemos que obtener la derivada covariante del tensor T, lo cual es simbolizado
como Tj,q mediante la notación de la coma puesta en el sub-índice del tensor antes de la letra q que representa a la coordenada
general con respecto a la cual se toma la derivada covariante. Al igual que en el caso de la derivada direccional en donde vamos
a efectuar a cabo el producto escalar del vector gradiente ∇φ con el vector V que es la tangente a la curva espacial sobre la
cual se lleva a cabo la operación, en la derivada absoluta también efectuamos una operación de producto escalar con cada uno
de los componentes dxq/dt que agrupados bajo un vector vienen siendo también una tangente a una curva espacial. Y al igual
que en el caso de la derivada direccional en donde llevamos a cabo un producto escalar entre los vectores ∇φ y V, en el caso
de la derivada absoluta igualmente llevamos a cabo un producto interno entre los tensores Tj,q y dxq/dt mediante una operación
de contracción como lo requiere la convención de sumación para índices repetidos, lo cual a fin de cuentas viene siendo lo
mismo que la toma del producto escalar entre ambos tensores. Obsérvese el uso de la palabra intrínseca en el otro nombre que
se le puede dar a la derivada absoluta de un tensor. Esto tiene una connotación geométrica directa con el concepto de la
curvatura intrínseca dado arriba al inicio de esta entrada. Es precisamente de lo que se trata. Obsérvese también que el
resultado final de las operaciones combinadas en el caso de la derivada absoluta viene siendo un tensor del mismo tipo y del
mismo orden que el tensor original. Esto quiere decir que si obtenemos la derivada absoluta de un tensor contravariante de
orden uno, el resultado será también un tensor contravariante de orden uno.
PROBLEMA: Partiendo del tensor contravariante Ai, y formando el producto interno de la derivada covariante Ai, j con el

converted by W eb2PDFConvert.com
vector tangente dxi/dt a una curva espacial, demostrar la siguiente relación:

Todas las operaciones y demostraciones a ser llevadas a cabo en problemas de este tipo tienen su punto de partida en una
definición tensorial como la siguiente:

El primer paso consiste en tomar la derivada covariante del tensor Ai:

Tomamos ahora el producto interno (contracción) entre este tensor y el tensor dxq/dt:

Multiplicando para remover paréntesis:

Pero por la regla de la cadena, el primer término en el lado derecho de la ecuación es simplemente la derivada ordinaria de
dAi/dt. Simplificando, llegamos a la relación que se quería demostrar desde un principio.
Para un tensor covariante , también podemos definir una derivada absoluta. La definición es casi idéntica a la dada
anteriormente:

PROBLEMA: Partiendo del tensor covariante Ai, y formando el producto interno de la derivada covariante Ai, j con el vector
tangente dxi/dt a una curva espacial, demostrar la siguiente relación:

La resolución de este problema se lleva a cabo en forma casi idéntica al problema anterior, la única diferencia siendo que
utilizamos la derivada covariante para un tensor del tipo covariante en lugar de un tensor del tipo contravariante, lo cual se
refleja en la diferencia de los signos del segundo término de la derivada absoluta de un tensor cuando se trata de un tensor
covariante (-) y de un tensor contravariante (+).
Por una mera ligera conveniencia y sin ninguna otra razón más que esta, trabajaremos sobre la derivada absoluta de un tensor
contravariante.
Si T = (Ti) es un tensor (contravariante), entonces la derivada (Ti, j) de dicho tensor (siguiendo las reglas para la derivada de un
tensor con lo cual entran en el panorama los símbolos de Christoffel) también lo es. Supóngase que vamos a tomar el producto
interno de este tensor T con otro tensor U = (dxi/dt) que viene el vector tangente a una curva espacial C cuyos i componentes

converted by W eb2PDFConvert.com
(tres componentes en caso de un espacio tri-dimensional) son a su vez funciones de un parámetro t ( xi = xi(t) ):

Como ya lo vimos, a este producto se le designa como la derivada absoluta del tensor a lo largo de la curva espacial C siendo sus
componentes:

Una cosa que debemos aquí es que en un sistema de coordenadas en los que los componentes del tensor métrico gij son
constantes numéricas los símbolos de Christoffel se convierten todos en cero, con lo cual la diferenciación absoluta se nos
reduce a lo que ya habíamos visto antes, a la derivada direccional de un vector. Lo que en el Análisis Vectorial llamamos
derivada direccional en el Análisis Tensorial lo llamamos derivada absoluta, estando ambos conceptos siempre definidos a lo
largo de una curva espacial, pero siendo siempre el concepto de la derivada absoluta más general y más extenso que el de la
derivada direccional.
PROBLEMA: Demostrar que la diferenciación absoluta se convierte en diferenciación ordinaria: (1) en el caso del espacio tri-
dimensional Euclideano manejado con coordenadas rectangulares Cartesianas, y (2) en el caso del espacio-tiempo Lorentziano
(Minkoswki) que corresponde a la Teoría Especial de la Relatividad.
(1) En el caso del espacio tri-dimensional Euclideano manejado con coordenadas rectangulares Cartesianas, en donde el
elemento de distancia ds está dado por:
ds² = dx² + dy² + dz²
los componentes del tensor métrico g son:
g11 = g22 = g33 = 1, y gij = 0 para i ≠ j
y por lo tanto todos los símbolos de Christoffel serán iguales a cero. Entonces:

se reduce a:

y la diferenciación absoluta se convierte en diferenciación ordinaria.


(2) En el caso del espacio-tiempo Lorentziano (Minkoswki) que corresponde a la Teoría Especial de la Relatividad, el elemento
de distancia ds lo podemos escribir como:
ds² = c²dt² - dx² - dy² - dz²
con lo cual los componentes del tensor métrico g son:
g11 = 1, g22 = g33 = g44 = -1, y gij = 0 para i ≠ j
y por lo tanto todos los símbolos de Christoffel serán iguales a cero, produciéndonos el mismo resultado que la parte anterior.
Resulta obvio que todo lo que se ha definido arriba para un espacio tri-dimensional se puede extender sin problema alguno hacia
un 4-espacio o inclusive a espacios de dimensiones mayores; y más aún, podemos llevarlo hacia espacios multidimensionales en
donde hay curvatura a causa de un sistema de coordenadas en el que no todos los componentes del tensor métrico gij son
constantes numéricas.

converted by W eb2PDFConvert.com
En un marco de referencia inercial (Lorentziano), toda la geometría Euclideana sigue siendo perfectamente válida. Las líneas
paralelas permanecen paralelas. Del mismo modo, la suma de los ángulos internos de un triángulo cualquiera frente a un
observador en reposo miden 180 grados:

y seguirán midiendo 180 grados cuando el triángulo se pone en movimiento a una velocidad constante frente al observador
después de que todos los efectos relativistas han sido tomados en cuenta (las distancias paralelas a la dirección del movimiento
se contraen mientras que las distancias perpendiculares permanecen iguales):

Sin embargo, si el triángulo es puesto en un marco de referencia acelerado, la suma de los ángulos internos del triángulo ya no
será igual a 180 grados, e inclusive las líneas rectas del triángulo dejarán de ser líneas rectas, se volverán líneas curvas. La
geometría dejará de ser Euclideana para convertirse en una geometría no-Euclideana.
Considérese ahora un plano Euclideano, sin curvatura alguna en la tercera dimensión espacial, en el cual se toma un vector V que
está situado inicialmente en el punto A de un cuadrado y al cual se le arrastra mediante el procedimiento de transporte paralelo
alrededor de los bordes del cuadrado, pasando por los puntos B, C y D hasta regresarlo al punto original de partida:

Después de completar de completar el recorrido completo ABCDA hasta volver al punto de origen, el vector arrastrado
mediante el transporte paralelo continúa apuntando en la misma dirección que aquella a la que apuntaba al empezar el
recorrido. Esto no ocurre en presencia de alguna curvatura, como en el caso en el cual se ha trazado un cuadrado como el de
arriba muy grande sobre la superficie de una esfera. El transporte paralelo proporciona entonces una manera de poder
determinar la curvatura de un espacio tridimensional o de un espacio-tiempo relativista. En un espacio-tiempo plano
(Lorentziano) dV/dλ = 0. Vectorialmente hablando, esto significa que un vector V objeto de transporte paralelo no solo no
cambia de magnitud al ser desplazado, ni siquiera cambia de dirección (sin embargo, en una región suficientemente pequeña, el
espacio curvo se vuelve prácticamente plano. Esta aproximación nos permite considerar a un espacio-tiempo curvo formado por
una cantidad enorme de “mosaicos” espacio-tiempo planos).
converted by W eb2PDFConvert.com
En el caso de un 4-espacio como el que se utiliza en la Teoría de la Relatividad, el vector tangente U se puede definir de la
siguiente manera en función del parámetro τ a partir del vector posición x:

El parámetro es, desde luego, el tiempo propio τ medido por el reloj que viaja con el observador en movimiento.
Considérese ahora la siguiente curva espacial en la cual se han trazado vectores tangentes sobre dicha curva identificados como
U y sobre la cual se ha tomado un vector V al cual se le ha aplicado el procedimiento de transporte paralelo:

Con la ayuda de la regla de la cadena podemos escribir lo siguiente tomándolo como algo matemáticamente válido (utilizamos
derivadas ordinarias para cada dxi/dτ en virtud de que cada componente xi es función de una sola variable que es el parámetro
τ, mientras que usamos derivadas parciales para las componentes ∂Vα/∂xi en virtud de que el vector V es una función no de una
sino de varias variables xi):

Inspeccionando esto que acabamos de escribir, nos percatamos de que podemos representarlo de una manera más compacta
como el producto interno (escalar) de un vector cuyas componentes son dxi/dτ por otro vector cuyas componentes son ∂Vα/∂xi.
Esto lo podemos representar de dos maneras, ya sea en notación matricial (compacta o explícita) o recurriendo a notación de
doble sumatoria usando índices repetidos. Optaremos aquí por esta última porque está más de cerca con el espíritu del
tratamiento tensorial que se le dá a la Teoría de la Relatividad. Si repasamos lo que vimos arriba, no nos debe llevar mucho
tiempo para darnos cuenta de que el vector cuyas componentes son dxi/dτ en realidad es el vector U = (Uβ) que es la tangente a
la curva espacial. Esto significa que la expansión anterior la podemos representar de la manera siguiente:

converted by W eb2PDFConvert.com
Obsérvese que en la segunda línea hemos recurrido a la notación de la coma para representar la derivada parcial de Vα con
respecto a xβ. Pero si repasamos lo que tenemos arriba, no tardamos en caer en la cuenta de que lo que tenemos en UβVα,β es
esencialmente la definición de la derivada absoluta del tensor (vector) V. Pero si como vimos arriba, en un espacio-tiempo
plano (Lorentziano) dV/dλ = 0, entonces el enunciado siguiente:
Uβ Vα , β = 0
es esencialmente la definición del transporte paralelo del vector V a lo largo del vector tangente U trazado sobre la curva
espacial. Pero esta es una expresión tensorial, válida en cualquier marco de referencia. Por lo tanto, aplicando la regla de “la
coma va hacia un semicolon”, reemplazando con ello a la derivada ordinaria con la derivada covariante (la cual involucra ya a
los símbolos de Christoffel), tenemos entonces la siguiente expresión:
Uβ Vα ; β = 0
Esta es la definición invariante (válida para cualquier marco de referencia) del transporte paralelo del vector V a lo largo del
vector tangente U. En otras palabras, si UβVα,β = 0 entonces dV/dλ = 0, y viceversa. La definición invariante del transporte
paralelo es a veces presentada de manera algo críptica aunque compacta de la siguiente manera:

cuyo lado izquierdo se acostumbra leer como “la derivada covariante de V tomada a lo largo del vector tangente U”. Este es
otro caso de una selección desafortunada de simbología, puesto que el operador diferencial vectorial nabla ∇ nunca se aplica
directamente sobre un vector, se aplica sobre un campo escalar transformando a dicho campo escalar en un campo vectorial,
del mismo modo que en manipulaciones matemáticas no se acostumbra anexarle sub-índices a dicho operador, y mucho menos
sub-índices vectoriales.
Regresando al espacio plano, tenemos en él las líneas más importantes que se puedan trazar en dicho espacio, que son las líneas
rectas. Un postulado básico de la geometría Euclideana nos dice que dos rectas paralelas que son inicialmente paralelas
permanecerán paralelas cuando son prolongadas. Esto no significa que podamos utilizar a la distancia que haya entre dos líneas
para determinar si son paralelas cuando son continuadas, porque ambas líneas pueden experimentar una curvatura manteniéndose
la distancia entre ambas constante (como lo que ocurre en las carreteras en donde al tomar una curva la distancia entre ambos
lados de la carretera permanece más o menos constante). Lo que significa el que dos rectas permanezcan paralelas cuando son
continuadas es que ambas permanezcan moviéndose siempre en una misma dirección, de modo tal que la tangente a una línea
sea paralela a la tangente trazada sobre la misma línea en un punto previo o posterior. De hecho, la línea recta es la única curva
en el espacio Euclideano capaz de llevar a cabo un transporte paralelo sobre su propio vector tangente. En un espacio curvo
también podemos trazar líneas “tan derechas como sea posible” demandando el transporte paralelo del mismo vector tangente.
Estas líneas ya las vimos en las entradas previas. Son las geodésicas. Recuérdese cómo habíamos definido a las geodésicas como
“las líneas más derechas posibles entre dos puntos cualesquiera”. Simbólicamente, este requerimiento matemático para tener
“líneas tan derechas como sea posible” se puede representar de la siguiente manera:

Utilizando notación de componentes, lo anterior se puede expresar de la siguiente manera en forma menos críptica y más
susceptible a la manipulación matemática haciendo V = U en la definición invariante del transporte paralelo del vector V a lo
largo del vector tangente U:
Uβ Uα ; β = 0
Aplicando la definición de la derivada covariante como nos lo pide el semicolon (metiendo dentro del panorama a los símbolos
de Christoffel), y manteniéndonos dentro de la notación de componentes, lo anterior se nos convierte en:
UβUα,β + Γαμβ UμUβ = 0
Si identificamos a λ como un parámetro medido a lo largo de la curva (ya sea un elemento de arco o un elemento de tiempo
propio medido por un observador que viaja con su reloj a lo largo de la curva) de modo tal que el vector tangente pueda ser
escrito como Uα = dxα/dλ; esto puede ser simplificado aún más, pero para ello necesitamos probar el siguiente resultado
intermedio:
Uβ · ∂/∂xβ = d/dλ

converted by W eb2PDFConvert.com
Puesto que, de un paso previo:
dVα/dλ = Uβ Vα , β
entonces:

de lo cual se infiere que:

Tenemos además que:

Es así como llegamos al siguiente sistema de ecuaciones:

O bien:

Esto último tiene ya un aspecto que nos debe resultar familiar. Es la ecuación geodésica que ya habíamos obtenido
anteriormente por medio del cálculo de variaciones recurriendo a la ecuación de Euler, y que hemos obtenido ahora aquí
mediante argumentos de índole física. Como podemos constatar, la ruta geodésica, el transporte paralelo y la curvatura del
espacio-tiempo son conceptos que están íntimamente ligados.

Armando Martínez Téllez a la/s 2:30


Compartir

‹ Página principal ›
Ver versión web
Datos personales
Armando Martínez Téllez
Ver todo mi perfil

Con la tecnología de Blogger.

converted by W eb2PDFConvert.com
La Teoría de la Relatividad
ESTE ES UN TRABAJO BAJO CONSTRUCCION

m i é r c o l e s , 1 8 d e m a r z o
La derivada absoluta
En la entrada anterior titulada “El transporte paralelo”, se definió a la derivada absoluta de un tensor T = (Ti) como la
contracción de la derivada covariante de dicho tensor (Ti; q) con otro tensor dxq/dt que sea un vector tangente a una curva
espacial. El resultado de estas operaciones es un tensor del mismo tipo y del mismo orden que el tensor original (contravariante
de orden uno). Dada la importancia del concepto, llevaremos a cabo aquí algunos ejercicios de práctica para familiarizarnos
mejor con las propiedades y las aplicaciones de la derivada absoluta que nos permiten llevar a cabo la tensorialización de la
física clásica, trasladando posteriormente los resultados hacia la física relativista.
La metodología para la obtención de la derivada absoluta es la misma en todos los casos:
a) Se toma la derivada covariante del tensor proporcionado.
b) Se escribe la expresión que denota a las componentes de la tangente con la cual se llevará a cabo la contracción.
c) Se lleva a cabo la contracción de ambas aplicando la convención de sumación para índices repetidos.
PROBLEMA: Obténganse las derivadas absolutas de cada uno de los siguientes tensores, los cuales suponemos que son
funciones diferenciales de la variable t:
1) La invariante Φ
2) Tk

3) Tj
(1) Empezando con Φ, podemos recurrir a la notación del semicolon en el sub-índice para simbolizar a la derivada covariante de
Φ como Φ;q; y designando como dxq/dt a las q componentes de la tangente a la curva espacial sobre la cual queremos llevar a
cabo la derivación absoluta, las operaciones que tenemos que llevar a cabo aparecen en el punto de partida usual para la
obtención de una derivada absoluta:

Si Φ es una invariante, entonces al tomar la derivada covariante del mismo los símbolos de Christoffel son todos iguales a cero,
con lo cual Φ,q se nos convierte simplemente en ∂Φ/∂xq (el semicolon va hacia una coma):

Entonces lo que tenemos para llevar a cabo la operación de contracción, sumando sobre los índices repetidos, es lo siguiente:

Pero por la regla de la cadena, lo que tenemos en el lado derecho es simplemente la derivada ordinaria de Φ con respecto a t,
o sea dΦ/dt. Entonces:

converted by W eb2PDFConvert.com
En este caso, la derivada absoluta viene siendo igual a la derivada ordinaria.
(2) Como en (1), recurrimos a la notación del semicolon en el sub-índice para simbolizar a la derivada covariante del tensor
covariante Tk como Tk;q; y designando como dxq/dt a las q componentes de la tangente a la curva espacial sobre la cual
queremos llevar a cabo la derivación absoluta, las operaciones que tenemos que llevar a cabo aparecen en el punto de partida
usual para la obtención de una derivada absoluta:

El siguiente paso consiste en implementar la derivada covariante del tensor covariante T = (Tk):

Removiendo paréntesis y simplificando:

(3) Como en (1), recurrimos a la notación del semicolon en el sub-índice para simbolizar a la derivada covariante del tensor
contravariante Tj como Tj;q designando como dxq/dt a las q componentes de la tangente a la curva espacial sobre la cual
queremos llevar a cabo la derivación absoluta, con lo cual las operaciones que tenemos que llevar a cabo aparecen en el punto
de inicio usual para la obtención de una derivada absoluta:

Tomamos ahora la derivada covariante del tensor contravariante T = (Tj):

Removiendo paréntesis:

Simplificando:

PROBLEMA: Obténgase la derivada absoluta del tensor contravariante de orden dos U= (Uab).
Simbolizando a la derivada covariante del tensor contravariante de orden dos Uab como Uab;q y designando como dxq/dt a las q
componentes de la tangente a la curva espacial sobre la cual queremos llevar a cabo la derivación absoluta, podemos escribir lo
siguiente:

converted by W eb2PDFConvert.com
Tomando la derivada covariante de U y efectuando la contracción tensorial con dxq/dt obtenemos:

PROBLEMA: Obténgase la siguiente derivada absoluta de un tensor mixto T de orden dos, el cual suponemos que es una
función diferenciable de la variable t:

Simbolizando a la derivada covariante del tensor mixto Tjk como Tjk;q y designando como dxq/dt a las q componentes de la
tangente a la curva espacial sobre la cual queremos llevar a cabo la derivación absoluta, podemos escribir lo siguiente:

El siguiente paso consiste en tomar la derivada covariante del tensor mixto, lo cual nos introduce a los símbolos de Christoffel
dándonos lo siguiente:

Removiendo los paréntesis y simplificando:

PROBLEMA: Obténgase la siguiente derivada absoluta de un tensor mixto T de quinto orden, el cual suponemos que es una
función diferenciable de la variable t:

Simbolizando a la derivada covariante del tensor mixto Tjklmn como Tjklmn;q y designando como dxq/dt a las q componentes de
la tangente a la curva espacial sobre la cual queremos llevar a cabo la derivación absoluta, podemos escribir lo siguiente:

La expansión de la derivada covariante del tensor mixto de quinto orden nos conduce al siguiente paso intermedio:

converted by W eb2PDFConvert.com
Removiendo el paréntesis y simplificando el primer término con la ayuda de la regla de la cadena llegamos a la siguiente
respuesta final:

PROBLEMA: Demostrar que la derivada absoluta de cualquier tensor métrico g = (gjk) es igual a cero.
La derivada absoluta del tensor métrico está dada por la relación:

Pero ya se demostró en una entrada anterior que la derivada covariante del tensor métrico (resaltada de color rojo en esta
expresión) es cero.
Se concluye que, en general, la derivada absoluta del tensor métrico es igual a cero:

PROBLEMA: Demostrar que la derivada absoluta de cualquier tensor métrico conjugado g-1: = (gjk) es igual a cero.
La derivada absoluta del tensor métrico conjugado está dada por la relación:

Pero ya se demostró en una entrada anterior que la derivada covariante del tensor métrico conjugado (resaltada de color rojo
en esta expresión) es cero.
Se concluye que, en general, la derivada absoluta del tensor métrico conjugado es igual a cero:

PROBLEMA: Demostrar que la derivada absoluta del tensor delta Kronecker δ = (δjk) es igual a cero.
La derivada absoluta del tensor delta Kronecker está dada por la relación:

Pero ya se demostró en una entrada anterior que la derivada covariante del tensor delta Kronecker (resaltada de color rojo en
esta expresión) es cero.
Se concluye que, en general, la derivada absoluta del tensor delta Kronecker es igual a cero:

converted by W eb2PDFConvert.com
PROBLEMA: En el cálculo diferencial ordinario, el diferencial del producto de dos funciones u y v es igual al producto de la
primera función u por la diferencial dv de la segunda más la segunda función v por la diferencial du de la primera:
d(uv) = udv + vdu
Esta regla es conocida como la regla de Leibniz. Demostrar que para la derivada absoluta también tenemos una regla similar.
En el cálculo tensorial, las expresiones para las funciones u y v se convierten en tensores T y S. Por definición de la derivada
absoluta, la derivada absoluta del producto de los tensores T y S será:

en donde se ha utilizado la notación del semicolon para indicar la toma de la derivada covariante con respecto a la coordenada
xk.
En una entrada previa ya se demostró la aplicabilidad de la regla de Leibniz al tomar la derivada covariante del producto de dos
tensores. Aplicando dicha regla aquí en el lado derecho de la ecuación, tenemos entonces lo siguiente:

A continuación removemos los paréntesis introduciendo a dxk/dt de una manera que nos servirá para la simplificación posterior:

No cuesta trabajo reconocer lo que tenemos en el lado derecho. En el primer término tenemos a la derivada absoluta del tensor
T multiplicada por el tensor S. Y en el segundo término tenemos al tensor T multiplicado por la derivada absoluta del tensor S:

Esta es precisamente la regla de Leibniz, aplicada en el caso de la derivada absoluta.


PROBLEMA: Demostrar que al tomarse la derivada absoluta de un producto de tensores, tanto el tensor métrico como el
tensor métrico conjugado pueden tratarse como si fuesen constantes.
Si tomamos la derivada absoluta del tensor métrico g estando multiplicado por un tensor contravariante T de primer orden,
podemos ver en el siguiente desarrollo en el cual aplicamos la regla de Leibniz y aplicamos también el hecho de que la derivada
absoluta del tensor métrico es igual a cero:

que el tensor métrico g puede tratarse como si fuese una constante al evaluar la derivada absoluta de un producto de
tensores.
En el caso del tensor métrico conjugado se logra el mismo resultado siguiendo el mismo procedimiento:

converted by W eb2PDFConvert.com
De la misma manera, obtenemos el resultado de que el tensor delta Kronecker puede tratarse como si fuese una constante al
momento de tomar una derivada absoluta.
En la diferenciación absoluta, tanto el tensor métrico como el tensor métrico conjugado como el tensor delta Kronecker
pueden tratarse como si fuesen constantes.
PROBLEMA: Obtener la siguiente derivada absoluta del producto de los tensores U y V:

En este problema podemos utilizar ventajosamente el resultado del problema anterior aplicando la regla de Leibniz:

Aplicamos ahora en cada término la definición de lo que es la derivada absoluta:

La expansión en cada término de la derivada covariante nos conduce al resultado final:

PROBLEMA: Demostrar que la velocidad instantánea de una partícula es un tensor de orden uno.
Definamos un sistema de coordenadas utilizando super-índices, de modo tal que la posición de la partícula en un espacio tri-
dimensional esté especificada por el vector posición x = (xk). Clásicamente, en este sistema de coordenadas, la velocidad
instantánea de la partícula será el vector velocidad v = (vk) dado por:

En otro sistema de coordenadas x = (xp). la velocidad instantánea v = (vp) de la misma partícula estará dada por:

Si teniendo a la mano la velocidad instantánea v = (vk) queremos determinar la velocidad instantánea en otro sistema de

converted by W eb2PDFConvert.com
coordenadas alterno, la relación de transformación para lograrlo es muy sencilla, ya que está dada por la regla de la cadena:

Pero esta es precisamente la definición matemática de un tensor contravariante de orden uno.


Si en vez de un sistema de coordenadas utilizando super-índices hubiéramos usado un sistema de coordenadas con sub-índices,
el resultado habría sido casi el mismo, habríamos obtenido un tensor también de orden uno, pero covariante, sin cambio alguno
en el significado físico.
Se concluye que la velocidad instantánea de una partícula es un tensor de orden uno.
Clásicamente, la definición de la aceleración instantánea está dada por la relación a = dv/dt. El problema con esta definición de
aceleración es que no es invariante bajo una transformación de coordenadas. No hay forma en que la derivada ordinaria de la
velocidad con respecto al tiempo se pueda se pueda hacer invariante bajo una transformación de coordenadas, o lo que es lo
mismo, la definición clásica de aceleración instantánea no es un tensor.
PROBLEMA: Demostrar que la aceleración, definida clásicamente como la derivada de la velocidad instantánea de un objeto
con respecto al tiempo, no es un tensor.
A continuación, tenemos en el lado izquierdo la expresión para la aceleración de un objeto medida en el sistema de
coordenadas x = (xk) = (x1,x2,x3), y tenemos en el lado derecho la expresión para la aceleración del mismo objeto medida en el
sistema de coordenadas x = (xj) = (x1,x2,x3)

No existe forma alguna con la cual podamos “conectar” matemáticamente estas dos expresiones de segundo orden de modo tal
que una se pueda transformar en la otra de acuerdo con la definición del tensor.
Se concluye que la definición clásica de la aceleración instantánea que se enseña en los cursos elementales de física y en los
cursos de Análisis Vectorial no es una invariante bajo un cambio de sistema de coordenadas.
Sin embargo, hay una forma muy fácil de redefinir el concepto de aceleración para que esta pueda ser también invariante bajo
un cambio en un sistema de coordenadas, y esta consiste simplemente en tomar la derivada absoluta de la velocidad:

Esta es precisamente una de las principales motivaciones para el desarrollo del cálculo tensorial o “cálculo diferencial
absoluto”. Aún si la Teoría de la Relatividad nunca hubiese existido por no haber nacido aún Einstein u otro científico que la
descubriera, el interés en poder obtener definiciones físicas válidas dentro de cualquier sistema de coordenadas habría sido
motivación suficiente para desarrollar esta herramienta matemática. La obtención de la derivada absoluta justifica con creces el
tiempo invertido en el desarrollo de los nuevos conceptos que hemos estudiado. Estamos habilitados ya para poder llevar a cabo
toda la tensorialización de la física.
PROBLEMA: Obtener una expresión para la aceleración instantánea de un objeto definida de modo tal que que tenga las
propiedades de un tensor.
Empezaremos con una nueva definición de la aceleración a = (ak) definiéndola como la derivada absoluta de la velocidad con
respecto al tiempo:

Aplicaremos ahora de modo riguroso la definición de la derivada absoluta tal y como se ha especificado arriba, definida como la
derivada covariante (de la velocidad en este caso) a lo largo de la trayectoria sobre la cual se lleva a cabo el movimiento
converted by W eb2PDFConvert.com
mediante una operación de contracción tensorial:

Expandiendo la derivada covariante tenemos entonces:

Como la velocidad instantánea v = (vk) = (dxk/dt) sí es un tensor, podemos reemplazar esta expresión en el primer término
obteniendo así:

En esta última expresión se ha hecho un ligero cambio en el super-índice s de vs renombrándolo como p haciendo lo mismo en
el símbolo de Christoffel para que no se pierda la sumación requerida por la convención de sumación para índices repetidos.
Haciendo un intercambio en los sub-índices del símbolo de Christoffel usando la propiedad de simetría de dicho símbolo, y
escribiendo a vp en su forma explícita como la derivada de la posición con respecto al tiempo, llegamos a nuestra nueva
definición de aceleración, tensorial en el pleno sentido de la palabra:

Escrita de esta manera, la aceleración instantánea nos debe resultar familiar como una ecuación diferencial de la geodésica, lo
cual era de esperarse porque el móvil se está acelerando precisamente a lo largo de la curva geodésica sobre la cual se está
desplazando de un punto a otro.
Una vez definida tensorialmente la aceleración instantánea, podemos revisar una de las leyes más veneradas de la física clásica,
la segunda ley de Newton, que nos dice que “la fuerza es igual al producto de la masa de un cuerpo multiplicada por la
aceleración que dicha fuerza produce en dicho cuerpo”.
PROBLEMA: Expresar la segunda ley de Newton en forma tensorial.
La segunda ley de Newton para una masa M que permanece invariante y es independiente del tiempo, escrita tanto en notación
vectorial compacta como en notación de componentes, es la siguiente:

Obviamente, esto no es algo que pueda permanecer invariante en forma bajo un cambio de coordenadas, porque para que ello
ocurra la derivada ordinaria tienen que ser reemplazadas por la derivada absoluta. Podemos utilizar el resultado del problema
anterior para escribir la ley de Newton en forma tensorial:

converted by W eb2PDFConvert.com
Esta fórmula es válida dentro de la física clásica pre-relativista. Pero si vamos a hacer la transición hacia la física relativista,
tendremos que contender con el hecho de que, para fines teóricos, en una gran mayoría de los casos la definición de fuerza
dinámica ha pasado a ser una pieza de museo, empezando por el hecho de que la masa M de un cuerpo en movimiento deja de
ser invariante, sumado a la eliminación por completo del concepto de la fuerza de atracción gravitacional entre dos cuerpos
como causante del movimiento de dichos cuerpos en el espacio libre. De cualquier manera, seguiremos requiriendo del
concepto de la derivada absoluta, el cual volverá a mostrarnos su cara en cuanto veamos la derivación desde el punto de vista
geométrico del tensor de curvatura de Riemann.
El concepto de la derivada absoluta nos lleva de modo casi natural a otro concepto importante en las matemáticas puras: el
álgebra Lie. Considerando a dxβ/dt como un vector velocidad U = (Uβ) en un espacio N-dimensional, para un tensor V = (Vα)
podemos escribir:

Esta derivada absoluta la podemos interpretar como la componente α de la derivada covariante del vector V a lo largo de la
trayectoria trazada por el vector tangente U, representada en algunos textos como:

PROBLEMA: Si tomamos la definición fundamental de la derivada absoluta de un tensor V a lo largo de una trayectoria curva
cuya tangente es el vector U, escrita en notación de componentes como:
UβVαβ
e invertimos los papeles de U y V definiendo la siguiente derivada absoluta de U:
VβUαβ
y restamos el uno del otro:
UβVαβ - VβUαβ
tenemos entonces la definición de algo nuevo que se simboliza como:

Demostrar que:

La demostración en este caso es trivial. Invirtiendo los papeles de U y V dentro del corchete se tiene para un componente α:

Si esta relación es cierta para todo componente α de los tensores de primer orden U y V, entonces debe ser cierta en lo
general, y podemos escribir:

[U,V] = - [V,U]
Esto que hemos definido sobre un par de campos vectoriales se conoce como el corchete Lie (Lie bracket), en honor al

converted by W eb2PDFConvert.com
matemático Sophus Lie que lo concibió por vez primera, y nos conduce directamente al estudio de un importante campo de las
matemáticas. El corchete Lie toma dos campos tensoriales (vectoriales) U y V, y define a partir de los mismos un nuevo campo
tensorial (vectorial) [U,V] que tiene propiedades interesantes. Más aún, a lo que acabamos de definir se le puede dar una
interpretación como una derivada Lie simbolizada como:

Lo más relevante para nosotros es que a través del álgebra Lie y de la derivada Lie tenemos a la mano la definición de un campo
tensorial en donde no se requieren los símbolos de Christoffel. Es importante entender, físicamente hablando, lo que hemos
llevado a cabo. La ruta o trayectoria a lo largo de la cual se toma la derivada absoluta ha sido reemplazada por una familia
completa (infinita) de trayectorias. Ha sido reemplazada, en efecto, por un campo vectorial. La derivada Lie evalúa
esencialmente el cambio de un campo vectorial a lo largo del flujo de otro campo vectorial.
Si partimos de la definición convencional del gradiente mediante la cual con el operador diferencial nabla (∇) aplicado sobre
un campo escalar f en un espacio N-dimensional:
f = f (x1,x2,x3,...,xα,...,xN)
obtenemos a partir del campo escalar f un campo vectorial :

conocido como el gradiente del campo escalar f, entonces podemos entresacar un componente α entre cualesquiera de sus
demás componentes con la siguiente notación simbólica:

Tomemos ahora el componente α de otro vector U definido sobre el mismo espacio N-dimensional (con una misma cantidad de
componentes o coordenadas) y multipliquémoslo por la igualdad anterior, obteniendo así:

Este componente α lo podemos representar simbólicamente de la siguiente manera en notación vectorial más compacta:

Ahora bien, si tomamos el correspondiente componente α de un tercer campo vectorial V y lo multiplicamos por lo anterior, el
componente producido se puede representar de la manera siguiente:

A continuación tenemos en forma más explícita lo que estamos definiendo con esto último:

Dejemos temporalmente esto a un lado y volvamos a la definición del corchete Lie en notación de componentes:

Si en vez del campo vectorial V metemos en el corchete Lie el producto del campo escalar f por el mismo campo vectorial V,
entonces tendremos lo siguiente en el lado derecho de la igualdad:

converted by W eb2PDFConvert.com
Desarrollando la derivada del primer término de acuerdo con la regla de Leibniz, tenemos:

Reacomodando y reagrupando los términos:

Se han renombrado los índices en el último término teniendo en cuenta que son índices monigote al fin y al cabo. Si observamos
detenidamente, podemos ver que lo que tenemos en el primer término es un corchete Lie, el corchete Lie [U,V], en notación
de componentes. Y el segundo término puede ser substituído por el resultado intermedio que habíamos dejado pendiente
arriba. Esto nos lleva a lo siguiente:

Pero si esto es válido para todos y cada uno de los componentes α desde α = 1 hasta α = N, entonces podemos prescindir de la
notación de componentes para llevar a cabo la representación simbólica de una manera más compacta:

Ahora bien, en el lado izquierdo de esta igualdad tenemos básicamente lo que podemos considerar como la derivada Lie de f V
con respecto a U:

Y en el lado derecho de la igualdad tenemos en el primer término la derivada Lie de V con respecto a U que en notación Lie
podemos representar como:

Por último, en el tercer término del lado derecho de la igualdad, tenemos lo que podemos definir como la derivada Lie del
campo escalar f con respecto al campo vectorial U, representado de la siguiente manera:

Es así como usando notación Lie podemos escribir el resultado obtenido anteriormente de la siguiente manera en la forma de
una regla de Leibniz para el operador derivativo Lie:

Los resultados que hemos obtenido nos muestran que es posible definir para campos tensoriales (vectoriales) en un espacio N-
dimensional un operador derivativo sin necesidad de tener que recurrir a coeficientes de conexión (símbolos de Christoffel) o
inclusive a una métrica, siendo por lo tanto el álgebra Lie y la derivada Lie conceptos de naturaleza muy fundamental.
Varias áreas de la Relatividad General se pueden estudiar y desarrollar con la ayuda de la derivada Lie, para lo cual hay que
pagar el costo ineludible de una mayor sofisticación matemática. Sin embargo, esto no se cubrirá aquí más a fondo por no ser
absolutamente indispensable para nuestros propósitos.

converted by W eb2PDFConvert.com
Armando Martínez Téllez a la/s 2:27
Compartir

‹ Página principal ›
Ver versión web
Datos personales
Armando Martínez Téllez
Ver todo mi perfil

Con la tecnología de Blogger.

converted by W eb2PDFConvert.com
La Teoría de la Relatividad
ESTE ES UN TRABAJO BAJO CONSTRUCCION

m i é r c o l e s , 1 8 d e m a r z o
El tensor de Riemann I
En la Teoría General de la Relatividad, hay tres tensores que nos interesan para estudiar y especificar la curvatura de un
espacio-tiempo curvo: el tensor de Einstein G, el tensor de Ricci y el tensor de Riemann R. El tensor de Einstein es obtenido a
partir del tensor de Ricci, y a su vez el tensor de Ricci es obtenido a partir del tensor de Riemann, de modo tal que queremos
estudiar y tener muy en claro lo que es el tensor de Riemann puesto que todo lo relacionado con la curvatura en un espacio
multi-dimensional deriva de dicho tensor.
El tensor de Riemann surge como consecuencia del análisis involucrado en dar respuesta a lo que parece ser una pregunta
sencilla. Empezando con un tensor covariante V = (Vi) y tomando la derivada covariante del tensor primero con respecto a la
coordenada x j y luego con respecto a la coordenada xk nos produce un tensor de tercer orden:
((Vi); j); k = (Vi); jk = Vi; jk

¿Pero que tal si tomamos primero tomando la derivada covariante del tensor primero con respecto a la coordenada xk y luego
con respecto a la coordenada x j?:
((Vi); k); j = (Vi); kj = Vi; kj
¿Es importante el orden en el cual se lleve a cabo la diferenciación, o se puede decir que en general Vi; jk = Vi; kj?
En la diferenciación parcial ordinaria, no parece haber duda alguna al respecto, ya que las diferenciaciones múltiples se pueden
llevar a cabo en el orden que sea:

Pero al estar trabajando con tensores, ya vimos que la diferenciación se tiene que llevar a cabo con nuevas reglas para que el
objeto diferenciado pueda comportarse también como un tensor, se tiene que llevar a cabo usando la derivada covariante.
La respuesta a nuestra interrogante resulta ser una negativa rotunda, y tratándose de tensores el orden de la diferenciación sí es
importante.
PROBLEMA: Demostrar que
Vp;qr - Vp;rq
no es igual a cero, y que por lo tanto el orden de la diferenciación covariante sí afecta el resultado final.
En el primer paso, evaluaremos primero la derivada covariante múltiple Vp;qr aplicando al pie de la letra la definición de la
derivada covariante para un tensor covariante:

A continuación llevaremos a cabo la diferenciación covariante aplicando de nuevo al pie de la letra la definición de la derivada
covariante para un tensor covariante:

converted by W eb2PDFConvert.com
El siguiente paso consiste en remover los paréntesis para tener lo siguiente:

Hemos obtenido ya Vp;qr. Repitiendo el procedimiento dado arriba, podemos obtener también Vp;rq, pero no es necesario
hacerlo todo de nuevo, ya que basta con intercambiar el orden de los índices para obtener Vp;rq. Hecho esto, si restamos Vp;rq
de Vp;qr obtenemos entonces:

Podemos renombrar los índices para poner en los cuatro términos al tensor Vj como producto:

Esto nos permite llevar a cabo la siguiente factorización:

A menos de que los símbolos de Christoffel sean todos iguales a cero, lo cual no ocurre en un espacio multi-dimensional plano,
Vp;qr y Vp;rq no son iguales, son diferentes, y son diferentes precisamente en una cantidad como la mostrada en color azul entre
los paréntesis. Dicha cantidad:

simbolizada tensorialmente como Rjpqr es precisamente lo que se conoce como el tensor de Riemann. El que Vp;qr ≠ Vp;rq tiene

converted by W eb2PDFConvert.com
consecuencias geométricas profundas que serán analizadas posteriormente.
El tensor de curvatura de Riemann, o simplemente tensor de Riemann, es un tensor de orden cuatro, de modo tal que los
componentes de dicho tensor no pueden ser visualizados con una representación matricial como ocurre con el caso de un tensor
métrico g de orden 2. Estrictamente hablando, podemos definirlo como un tensor covariante de orden cuatro o bien -con la
ayuda del tensor métrico g para subir el primer índice- como un tensor de orden (1,3), o sea un tensor covariante de orden 1 y
contravariante de orden 3. En notación de índices, por lo tanto, es representado ya sea como Rabcd o como Rabcd. En el caso
Rabcd (todos los cuatro índices abajo) llamamos al tensor un tensor de Riemann del primer género ó primera especie (first
kind) mientras que en el caso Ra bcd (el primer índice elevado) llamamos al tensor un tensor de Riemann del segundo género ó
segunda especie (second kind).
PROBLEMA: ¿Qué ventaja puede tener la representación del tensor de Riemann R como un tensor de primer género Rabcd
sobre su representación como un tensor de segundo género Rabcd en notación de componentes?
Por la forma en que ha sido definido arriba el tensor de Riemann de segundo género como el “factor” que nos mide la no-
conmutatividad de las diferenciaciones covariantes de segundo orden, debe resultar obvio que en un espacio 4-dimensional, por
ejemplo, dicho tensor constará de 4x4x4x4 = 256 componentes, y si partimos “a la inversa” de cada una de las componentes
Rabcd del tensor de primer género podemos obtener las 256 componentes que corresponden a la representación Rabcd del
segundo género con la ayuda del tensor métrico conjugado g-1 = (gab) para subir el primer índice. El problema con esto es que al
subir el primer índice inevitablemente habrá muchas componentes en las cuales el segundo, el tercero o el cuarto índice o
varios de ellos puedan ser igual al primero, como la componente Rφtrφ, y esto se puede interpretar erróneamente como algo
que invoca automáticamente la activación de la convención de sumación para índices repetidos. Al tensor de Riemann se le
puede aplicar, desde luego, una operación de contracción tensorial mediante igualación de índices; esto es precisamente lo que
se lleva a cabo con el tensor de Ricci, pero la definición original del tensor de Riemann de segundo género excluye la
aplicación automática de la convención de sumación para índices repetidos. Esta es la razón del por qué varios autores
contemporáneos hacen una mescolanza en la cual después de haber obtenido el tensor de Riemann de segundo género como lo
hemos hecho arriba pasan casi de inmediato al uso del tensor de Riemann de primer género sin explicar claramente la razón que
los orilló a ello (puesto que la operación de contracción tensorial se lleva a cabo entre un índice contravariante y un índice
covariante, al estar todos los índices abajo en el tensor de Riemann de primer género no se aplica de ningún modo la
convención de sumación y entonces no hay confusión alguna). Esta es una de las consecuencias de que el tensor de curvatura de
Riemann o simplemente tensor de curvatura o simplemente tensor de Riemann, el cual es una generalización de la curvatura
de Gauss K a dimensiones más altas, haya sido introducido en 1862 por Riemann y desarrollado en 1869 por Christoffel como una
forma de describir completamente la curvatura en cualquier número de dimensiones mediante un “pequeño monstruo” mucho
antes de que Einstein introdujera su convención de sumación para índices repetidos. Desafortunadamente tenemos una situación
en la que por un lado los componentes del tensor de Riemann de segundo género Rabcd pueden ser obtenidos mediante una
simple fórmula como podemos verlo en la expresión que tenemos arriba aunque bajo el riesgo de que en un momento de
distracción se pueda interpretar accidentalmente la repetición del índice superior y alguno de los índices inferiores como una
invocación automática a la convención de sumación, mientras que por otro lado para obtener los componentes del tensor de
Riemann de primer género Rabcd en el cual no hay confusión se tienen que ir bajando con la ayuda del tensor métrico el índice
en cada uno de ellos, lo cual nos duplica la cantidad de trabajo.
A menos de que se indique lo contrario, y esto tiene que ser estudiado y aclarado para cada caso en particular, en la
evaluación de los componentes del tensor de Riemann de segundo género no se aplica automáticamente la convención de
sumación para índices repetidos.
Formalmente, y en base al resultado obtenido al principio, el tensor de Riemann del segundo género se puede definir a partir de
los símbolos de Christoffel (los cuales no son tensores) de la siguiente manera (¡obsérvese con detenimiento el uso de la
derivada parcial ordinaria, indicado por la coma puesta antes del índice utilizado para la diferenciación!):
Ra bcd = Γabd,c - Γabc,d + Γaμc Γμbd - Γaμd Γμbc
Puesto de manera más explícita:
Ra bcd =__________________________

∂(Γabd)/∂xc - ∂(Γabc)/∂xd + Γabc,d + Γaμc Γμbd - Γaμd Γμbc


Si utilizamos el tensor de Riemann para el estudio de un espacio de cuatro dimensiones como ocurre en el caso del espacio-
tiempo de la Teoría General de la Relatividad, cada uno de los cuatro sub-índices del tensor de Riemann puede representar una
de cuatro variables diferentes, así que un tensor de Riemann está especificado por un total de 4x4x4x4 = 256 componentes, lo
cual nos puede parecer intimidante. Sin embargo, debido a las simetrías que presenta este tensor, no todas las componentes son
independientes, lo cual reduce el número de componentes que tienen que ser calculadas de 256 a 36. Una de tales simetrías en
converted by W eb2PDFConvert.com
el intercambio del tercer y cuarto índice es la siguiente:
Ra bcd = - Ra bdc
Imponiendo además la condición adicional:
Ra bcd + Ra cdb + Ra dbc = 0
el número de componentes independientes puede ser reducido posteriormente a 21, y si se satisface una identidad adicional el
número de componentes puede ser reducido a 20.
Poniendo las componentes del tensor de Riemann R = (Rαβμν) del primer género en función de las componentes de un tensor
métrico g, podemos obtener la siguiente expresión (de nueva cuenta, las comas en los sub-índices indican derivadas parciales
ordinarias):
Rαβμν = (gαν,βμ - gαμ,βν + gβμ,αν - gβν,αμ)/2
Del mismo modo, trabajando sobre esta última relación podemos obtener varias identidades que resultan ser de gran utilidad
para la evaluación de todos los componentes Rαβμν para cierta métrica. La primera identidad nos dice que si intercambiamos los
primeros dos índices (α y β) entonces obtendremos el mismo componente pero con el signo invertido, lo cual equivale a decir
que Rαβμν es antisimétrico en el primer par de índices:
Rαβμν = - Rβαμν
La segunda identidad nos dice que si intercambiamos los últimos dos índices (μ y ν) entonces también obtendremos el mismo
componente pero con el signo invertido, lo cual equivale a decir que Rαβμν es antisimétrico en el segundo par de índices:
Rαβμν = - Rαβνμ
La tercera identidad nos dice que si intercambiamos el primer par de índices (α y β) con el segundo par de índices (μ y ν)
entonces obtendremos el mismo componente, lo cual equivale a decir que Rαβμν es simétrico en el intercambio de los dos pares
de índices:
Rαβμν = Rμναβ
Y por último, la cuarta identidad, nos dice que:
Rαβμν + Rανβμ + +Rαμνβ = 0
Esta última identidad es conocida como la primera identidad de Bianchi.
PROBLEMA: A partir de la definición del tensor de Riemann de primer género, demostrar las identidades:
Rαβμν = - Rβαμν
Rαβμν = - Rαβνμ
Rαβμν = Rμναβ
Rαβμν + Rανβμ + +Rαμνβ = 0
1) A partir de la definición de los componentes Rαβμν en función de los componentes derivados del tensor métrico:
Rαβμν = (gαν,βμ - gαμ,βν + gβμ,αν - gβν,αμ)/2
intercambiamos los índices α y β obteniendo lo siguiente:
Rβαμν = (gβν,αμ - gβμ,αν + gαμ,βν - gαν,βμ)/2
y tras un simple reacomodo:
Rβαμν = (-gαν,βμ + gαμ,βν - gβμ,αν + gβν,αμ)/2

converted by W eb2PDFConvert.com
Rβαμν = - Rαβμν
2) Procediendo como lo hicimos arriba, intercambiando los últimos dos índices μ y ν:
Rαβνμ= (gαμ,βν - gαν,βμ + gβν,αμ - gβμ,αν)/2
y reacomodando:
Rαβνμ = (-gαν,βμ + gαμ,βν - gβμ,αν + gβν,αμ)/2
Rαβνμ = - Rαβμν
3) Intercambiando el primer par de índices con respecto al segundo par de índices (lo cual debe ser interpretado como dos
operaciones, la primera siendo el intercambio de los índices α y μ, y la segunda siendo el intercambio de los índices β y ν):
Rμναβ = (gμβ,να - gμα,νβ + gνα,μβ - gνβ,αμ)/2
Podemos efectuar un ligero reacomodo de índices, haciendo además uso del hecho de que las derivadas parciales ordinarias se
pueden llevar a cabo en cualquier orden, esto es:
gαβ,νμ = gαβ,μν
obteniendo así lo siguiente:
Rμναβ = ( gμβ,αν - gμα,βν + gνα,βμ - gνβ,αμ)/2
Por otro lado, puesto que el tensor métrico es simétrico, tenemos que:
gαβ = gβα
con lo cual lo anterior se nos reduce a:
Rμναβ = (gβμ,αν - gαμ,βν + gαν,βμ - gβν,αμ)/2
y con otro ligero reacomodo:
Rμναβ = ( gαν,βμ - gαμ,βν + gβμ,αν - gβν,αμ)/2
Rαβμν = Rμναβ
4) Finalmente, escribiendo la suma de los tres términos involucrados en la primera identidad de Bianchi tras obtener los otros
dos términos mediante un intercambio de índices, y simplificando con la ayuda de la simetría de los componentes del tensor
métrico:
Rαβμν + Rανβμ + Rαμνβ =
(gαν,βμ - gαμ,βν + gβμ,αν - gβν,αμ)/2
(gαμ,νβ - gαβ,νμ + gνβ,αμ - gνμ,αβ)/2
(gαβ,μν - gαν,μβ + gμν,αβ - gμβ,αν)/2
obtenemos el resultado final deseado, la primera identidad de Bianchi:
Rαβμν + Rανβμ + Rαμνβ = 0
PROBLEMA: Trabajando sobre un espacio de cuatro dimensiones y con la ayuda de las identidades demostradas en el
problema anterior, demuéstrese que estas identidades reducen el número de componentes independientes de Rαβμν de
4x4x4x4 = 256 componentes a 6x7/2 = 21 componentes.
Puesto que Rαβμν = - Rβαμν, si hacemos α = β entonces tenemos Rααμν = - Rααμν, lo cual sólo puede ser cierto si Rααμν es cero. Del
mismo modo, puesto que Rαβμν = - Rαβνμ, si hacemos μ = ν entonces tenemos Rαβμμ = - Rαβμμ, lo cual sólo puede ser cierto si
Rαβμμ es cero. Esto quiere decir que Rαβμν = 0 en todos los casos en los que los primeros dos índices o en los que los últimos dos

converted by W eb2PDFConvert.com
índices sean iguales. Con esto en mente, iremos contando los componentes que pueden ser diferentes de cero de acuerdo a tres
tipos de posibilidades:
Tipo A: Este es el caso en el cual el primer par de índices es igual al segundo par de índices siendo el primer índice en un par
menor que el segundo índice en el mismo par, o sea todas las posibilidades de Rαβαβ siendo α menor que β. Aquí podemos listar
las siguientes posibilidades para un espacio de cuatro dimensiones:
R1212 , R1313 , R1414 , R2323 , R2424 , R3434
Tenemos un total de seis componentes independientes, que de acuerdo a las leyes de la combinatórica es igual a nA = nC2 = n(n-
1)/2 para un espacio de n dimensiones (la cantidad de combinaciones posibles de n objetos tomados dos a la vez), o sea
nA = 4(4-1)/2 = 4·3/2 = 6 componentes
para un espacio de 4 dimensiones.
Tipo B: Este es el caso en el cual el primer índice es igual al tercer índice siendo el segundo índice y el tercer índice diferentes,
o sea todas las posibilidades de Rαβαγ siendo β menor que γ. Aquí podemos listar las siguientes posibilidades para un espacio de
cuatro dimensiones:
R1213 , R1214 , R1314, R2123 , R2124 , R2324
R3132 , R3134 , R3234 , R4142 , R4143 , R4243
Tenemos un total de doce componentes independientes, que de acuerdo a las leyes de la combinatórica es igual a nB = 3·nC3 =
n(n-1)(n-2)/2 para un espacio de n dimensiones, o sea
nB = 4(4-1)(4-2)/2 = 4·3·2/2 = 12 componentes
para un espacio de 4 dimensiones.
Tipo C: Este es el caso en el cual todos los índices son diferentes, teniendo como posibilidades a Rαβγδ ó a Rαγβδ , siendo α
menor que β, siendo β menor que γ, y siendo γ menor que δ. Aquí podemos listar las siguientes posibilidades para un espacio de
cuatro dimensiones:
R1234 , R1324
Tenemos un total de dos componentes independientes, que de acuerdo a las leyes de la combinatórica es igual a
nC = 2·nC4 = n(n-1)(n-2)(n-3)/12
para un espacio de n dimensiones, o sea
nC = 4(4-1)(4-2)(4-3)/12 = 4·3·2·1/12 = 2 componentes
para un espacio de 4 dimensiones.
Sumando las contribuciones individuales de cada uno de los tres tipos de componentes, podemos obtener una fórmula general
que nos dá la cantidad de componentes independientes del tensor de Riemann para un espacio de n dimensiones:
n = nA + nB + nC
n = n(n-1)/2 + n(n-1)(n-2)/2 + n(n-1)(n-2)(n-3)/12
n = 6n(n-1)/12 + 6n(n-1)(n-2)/2 + n(n-1)(n-2)(n-3)/12
n = [6n² - 6n + 6n3 - 18n² + 12n + n4 - 6n3 +11n² - 6n]/12
n = n² (n² - 1) /12
Para un espacio de cuatro dimensiones, la fórmula general que acabamos de obtener nos dá:
n = 4² (4² - 1) /12 = 16 (16 -1) /12 = (16)(15)/12 = 20

converted by W eb2PDFConvert.com
PROBLEMA: Hacer un listado de los componentes independientes de Rαβαγ para un espacio de cinco dimensiones.
Utilizando la clasificación de tres tipos dada en el problema anterior, tenemos los siguientes componentes independientes del
tensor de Riemann para un espacio de cinco dimensiones:
Tipo A: Rαβαβ siendo α menor que β:
R1212 , R1313 , R1414 , R2123 , R1515
R2323 , R2424 , R2525
R3434 , R3535
Tipo B: Rαβαγ siendo β menor que γ:
R1213 , R1214 , R1215 , R1314 , R1315 , R1415
R2123 , R2124 , R2125 , R2324 , R2325 , R2425
R3132 , R3134 , R3135 , R3234 , R3235 , R3435
R4142 , R4143 , R4145 , R4243 , R4245 , R4345
R5152 , R5153 , R5154 , R5253 , R5254 , R5354
Tipo C: Rαβγδ , siendo α menor que β, siendo β menor que γ, y siendo γ menor que δ:
R1234 , R1235 , R1245 , R1345 , R2345
R1324 , R1325 , R1425 , R1435 , R2435
Hay diez componentes del tipo A y diez componentes del tipo C, los cuales sumados a treinta componentes del tipo B nos dá un
total de 50 componentes, lo cual está de acuerdo con la fórmula general:
n² (n² - 1) /12 = 5² (5² -1) /12 = (25)(24)/12 = 50

PROBLEMA: ¿Cuántos componentes independientes de Rαβαγ puede haber para un espacio de tres dimensiones? ¿Cuáles son
estos componentes?
Para un espacio de tres dimensiones, el número de componentes posibles es, de acuerdo a la fórmula general:
n² (n² - 1) /12 = 3² (3² -1) /12 = (9)(8)/12 = 6
Estos componentes son los siguientes:
R1212 , R1313 , R2323 , R1213 , R2123 , R3132

Armando Martínez Téllez a la/s 2:24


Compartir

‹ Página principal ›
Ver versión web
Datos personales

converted by W eb2PDFConvert.com
Armando Martínez Téllez
Ver todo mi perfil

Con la tecnología de Blogger.

converted by W eb2PDFConvert.com
La Teoría de la Relatividad
ESTE ES UN TRABAJO BAJO CONSTRUCCION

m i é r c o l e s , 1 8 d e m a r z o
El tensor de Riemann II
Antes de continuar queremos dejar en claro lo que entendemos por una hoja.
El concepto de hoja (en inglés se le llama manifold), conocida también como carta en muchos textos de geometría diferencial
escritos en castellano (aquí nos limitaremos a llamarle simplemente hoja porque es la palabra que mejor transmite la idea del
concepto del que estamos hablando), es precisamente lo que su nombre indica; se trata de una superficie suave y continua sobre
la cual se pueden aplicar los conceptos del cálculo infinitesimal, se puede obtener una derivada. A continuación tenemos un
ejemplo de una hoja que podríamos llamar silla de montar:

Al empezar a cubrir el tema del tensor de Riemann, lo hicimos formulándonos una simple pregunta, sobre si el orden de la
diferenciación al tomar una derivada covariante tras otra era indiferente respecto al orden en que se tomasen las derivadas, o si
el orden de la diferenciación importaba, encontrándose que el orden de la diferenciación sí es relevante, con la diferencia
entre una expresión y la otra cuantificada por el tensor de Riemann.
Hay otra manera de llegar al tensor de Riemann, y esta es mediante el uso del concepto del transporte paralelo, porque el
tensor de Riemann es de hecho una descripción matemática de la curvatura intrínseca de una hoja. Para ello, recurrimos al
transporte paralelo de un vector V alrededor de una trayectoria cerrada que nos regrese al punto de origen después de darle una
vuelta completa a un pedazo de superficie. Identificaremos a este pedacito de superficie como un “parche de coordenadas”
(coordinate patch) cortado con unas tijeras imaginarias de la hoja (manifold) mostrada en la figura de arriba. De este modo,
imaginemos en nuestra hoja un pedacito muy pequeño de superficie cuyos cuatro lados coinciden con las líneas de coordenadas
x1 = a, x1 = a + δa, x2 = b y x2 = b + δb:

Empezando desde el punto A, llevaremos a cabo el transporte-paralelo de un vector V a lo largo de la coordenada x2 = b =

converted by W eb2PDFConvert.com
constante llevándolo desde la coordenada x1 = a hasta la coordenada x1 = a + δa para situarlo en el punto B. Tras esto, para la
segunda trayectoria, trasladamos mediante transporte paralelo al vector V a lo largo de la coordenada x1 = a + δa = constante
desde el punto B hasta el punto C llevándolo desde la coordenada x2 = b hasta la coordenada x2 = b + δb. Hecho esto, para la
tercera trayectoria trasladamos mediante transporte paralelo al vector V a lo largo de la coordenada x2 = b + δb = constante
desde el punto C hasta el punto D llevándolo desde la coordenada x1 = a + δa hasta la coordenada x1 = a. Y por último, para la
cuarta trayectoria, trasladamos mediante transporte paralelo al vector V a lo largo de la coordenada x1 = a = constante desde el
punto D hasta el punto A llevándolo desde la coordenada x2 = b + δb hasta la coordenada x2 = b, regresándolo al punto de
partida y completando de este modo un circuito cerrado.
La trayectoria completa del vector V a lo largo de la retícula de coordenadas (x1, x2) es:
Ruta 1: A(a, b) → B(a + δa, b)
Ruta 2: B(a + δa, b) → C(a + δa, b + δb)
Ruta 3: C(a + δa, b + δb) → D(a, b + δb)
Ruta 4: D(a, b + δb) → A(a, b)
Tomaremos ahora una enunciación simbólica usual de la operación de transporte paralelo (en la cual el símbolo ∇ no representa
al operador vectorial diferencial usual) que representa al transporte paralelo del vector V a lo largo de la trayectoria U:

y haremos U = e1 simbolizando con esto el transporte paralelo del vector V a lo largo del vector tangente a la coordenada x1:

Para fines de cálculo, tensorialmente hablando, esta simbolización en realidad no es más que la derivada absoluta o derivada
intrínseca que involucra dos operaciones distintas: (1) la obtención de la derivada covariante de V y (2) la contracción tensorial
con el vector U:

Expandiendo la sumatoria múltiple en la operación de transporte paralelo que estamos considerando, llevada a cabo a lo largo de
e1, tenemos entonces:

U1Vα;1 = 0

Aquí podemos aplicar directamente la definición de la derivada covariante a Vα (usaremos la notación de la coma para denotar
la diferenciación parcial con respecto a la coordenada x1:
U1(Vα,1 + Γαμ1Vμ) = 0

Puesto que la trayectoria (y consecuentemente la tangente a la trayectoria) a lo largo de la coordenada x1 no es nula, entonces
el factor entre los paréntesis debe de serlo:
Vα,1 + Γαμ1Vμ = 0

Vα,1 = - Γαμ1Vμ
o bien, explícitamente:

converted by W eb2PDFConvert.com
Con esto, si llevamos a cabo una integración de cada una de las componentes de V = (Vα) desde el punto A hasta el punto B:

tenemos entonces lo siguiente con el resultado que hemos obtenido:

Procediendo del mismo modo, obtenemos lo siguiente para la ruta que lleva mediante transporte paralelo al vector V desde el
punto B hasta el punto C:

Para la ruta que lleva mediante transporte paralelo al vector V desde el punto C hasta el punto D tenemos lo siguiente:

Y por último, la ruta que lleva mediante transporte paralelo al vector V desde el punto D hasta el punto A está dada por la
siguiente relación:

Obsérvese que, intencionalmente, el vector Vα(A) que parte del punto A y el vector Vα(A) que llega al punto A después de un
recorrido completo se han simbolizado de color distinto, uno azul y el otro rojo. Esto se debe a que después de recorrer el
circuito completo el vector V apuntará a una dirección diferente en relación a la dirección a la cual apuntaba al iniciar el
recorrido en virtud de haberse hecho el recorrido sobre una superficie curva (como la superficie de una esfera). La única
forma posible en la cual el vector V puede ser exactamente el mismo después del recorrido A-B-C-D mediante el transporte
paralelo es que el “parche de coordenadas” corresponda a una superficie plana.
Si llamamos al cambio neto en el vector V = (Vα) como δVα, definido de la siguiente manera:
δVα = Vα(A) - Vα(A)
entonces este cambio neto se puede obtener sumando todas las integrales obtenidas arriba:

converted by W eb2PDFConvert.com
Además de haberse sumado los términos, se ha llevado a cabo una inversión en los límites de las integrales de la ruta 3 (de C a
D) y de la ruta 4 (de D a A), lo cual tiene como efecto matemático la inversión de signos, y se han reacomodado las integrales
para que el siguiente paso sea más obvio.
A primera vista, se antoja de inmediato una cancelación de los términos. La integral de la ruta 1 (de A a B) puesta en color azul
y con signo negativo parece que puede ser cancelada por la integral de la ruta 3 (de C a D) puesta en color rojo, de signo
positivo. Lo mismo puede decirse para el otro par de integrales. Sin embargo, para que pueda efectuarse dicha cancelación, se
requiere para el primer par que tanto Γαμ1 como Vμ sean términos constantes, y no lo son. Serían constantes en un espacio-
tiempo plano. Pero ciertamente no son constantes en un espacio-tiempo curvo. Puesto de otra manera:

Y lo mismo puede decirse para el otro par de integrales.


Ante esta situación, podemos recurrir a una aproximación de primer orden mediante una serie de Taylor-McLaurin, la cual para
una función F de dos variables x1 y x2 es la siguiente cuando es desarrollada en torno a un punto P(x1,x2) = P(m,n):

Lo anterior lo podemos escribir de la siguiente manera (se recuerda que los super-índices no son exponentes, son usados para
denotar los componentes contravariantes de un vector):

Descartando los términos de orden superior, de esta expansión en serie de Taylor-MacLaurin obtenemos la siguiente expresión
cuando la coordenada x1 se mantiene constante (esto ocurre al llevar a cabo el transporte paralelo del vector V del punto A al
punto B, y del punto C al punto D):

converted by W eb2PDFConvert.com
Y de la misma manera obtenemos la siguiente expresión cuando la coordenada x2 se mantiene constante (esto ocurre al llevar a
cabo el transporte paralelo del vector V del punto B al punto C, y del punto D al punto A):

De este modo, podemos obtener la siguiente aproximación a un primer orden a la variación neta del vector V al llevarse a cabo
la operación de transporte paralelo :

Podemos sacar fuera de cada una de estas integrales lo que no es afectado por el proceso de integración de acuerdo con la
variable que está siendo integrada:

Las dos integrales son triviales, y llevándolas a cabo tenemos lo siguiente:

Factorizando y reagrupando:

El siguiente paso consiste en tomar las diferenciales aplicando la regla de Leibniz para la diferencial del producto de dos
funciones:

Podemos simplificar esto eliminando las derivadas de Vα utilizando para ello el resultado derivado al principio usando además su
equivalente reemplazando el índice 1 con un índice 2:

De este modo, obtenemos lo siguiente, usando la notación de la coma para indicar diferenciación ordinaria:

converted by W eb2PDFConvert.com
δVα = δa δb [Γαμ1,2 - Γαμ2,1 + Γασ2 Γσμ1 - Γασ1 Γσμ2] Vμ
En el 4-espacio de la Relatividad General, esta expresión representa cuatro ecuaciones en virtud de que el vector V es un 4-
vector. El índice μ que tenemos puesto en el vector V en el lado derecho es un índice libre que nos permite representar
cualquiera de las cuatro componentes del vector trasladado. También en el lado derecho de la ecuación tenemos el producto
δaδb, el cual podemos tomar como el área del “parche de coordenadas”. Ahora bien, los índices 1 y 2 aparecen en esta
expresión porque la ruta de recorrido fue seleccionada para ser llevada a cabo sobre una superficie descrita por las coordenadas
x1 y x2. Pero igual podríamos haber seleccionado otra ruta de recorrido, como aquella en la cual utilizamos las coordenadas x1 y
x3 y consecuentemente aparecerán los índices 1 y 3 en la expresión, o como aquella en la cual utilizamos las coordenadas x3 y x4
y consecuentemente aparecerán los índices 3 y 4. La expresión toda es antisimétrica en los índices 1 y 2 porque el cambio δVα
en el vector V tras efectuarse la operación de transporte paralelo debe tener el signo opuesto si uno lleva a cabo el recorrido en
la dirección contraria (en el lenguaje del Cálculo de las Formas Diferenciales conocido también como el Cálculo Exterior esto
se refleja en la anticonmutatividad de la operación cuña uΛv = - vΛu). Si en lugar de limitarnos al uso de las coordenadas x1 y x2
modificamos ligeramente la expresión obtenida para hacerla válida usando líneas coordenadas generalizadas xp y xq en un
espacio N-dimensional, obtenemos lo siguiente:
δVα = δa δb [Γαμp,q - Γαμq,p + Γασq Γσμp - Γασp Γσμq] Vμ
Si la longitud en el recorrido a lo largo de una de las dos coordenadas utilizadas para el viaje del vector V es aumentado en un
factor de dos, esto también aumenta el área del “parche de coordenadas” δaδb en un factor de dos, doblando el valor de δVα.
Esto significa que δVα depende linealmente de (δa)ep y de (δb)eq (aquí ep y eq son los vectores unitarios de base tangentes a
las líneas de coordenadas seleccionadas para llevar a cabo el viaje), y obviamente también depende del 4-vector Vμ. Si
tomamos el término entre paréntesis y lo definimos como:
Rαβμν = Γαβν,μ - Γαβμ,ν + Γασμ Γσβν - Γασν Γσβμ
entonces tenemos los componentes de un tensor R al cual si se le suministran como argumentos el vector V (o mejor dicho, los
componentes Vμ del vector V a través del índice μ) así como (δa)ep, y de (δb)eq a través de los índices β y ν nos proporcionará
δVα, el cambio en el componente α del vector V cuando se le aplica una operación de transporte paralelo sobre una trayectoria
en una superficie curva. Esto es precisamente lo que nos fija geométricamente el tensor de Riemann.
PROBLEMA: Demostrar la segunda identidad de Bianchi:
Rαβμν;λ + Rαβλμ;ν + Rαβνλ;μ = 0
Podemos intentar llevar a cabo directamente la diferenciación covariante ya sea sobre el tensor de Riemann de primer género o
sobre el tensor de Riemann de segundo género, involucrando con ello a los símbolos de Christoffel que nos resultan como
consecuencia de la diferenciación covariante. Pero tal cosa no es necesaria, porque podemos llevar a cabo una diferenciación
ordinaria si utilizamos primero un marco inercial (Lorentziano) de coordenadas. Tomando la relación correspondiente al tensor
de Riemann de primer género:
Rαβμν = (gαν,βμ - gαμ,βν + gβμ,αν - gβν,αμ)/2
y llevando a cabo la diferenciación ordinaria con respecto al parámetro λ tenemos lo siguiente:
Rαβμν,λ = (gαν,βμλ - gαμ,βνλ + gβμ,ανλ - gβν,αμλ)/2
De esta relación, usando el hecho de que el tensor métrico g es simétrico ( gab = gba) y el hecho de que las derivadas parciales
ordinarias conmutan, obtenemos la segunda identidad de Bianchi.
PROBLEMA: Sabiendo de antemano que en una 2-superficie la curvatura Riemanniana-Gaussiana K está definida de la
siguiente manera:

siendo g el determinante del tensor métrico g, obtener la expresión correspondiente a K para la siguiente métrica:

converted by W eb2PDFConvert.com
Del elemento de línea ds² obtenemos los siguientes componentes que corresponden al tensor métrico g:
g11 = 1/(x1) ²___g22 = 1/(x1) ²
g12 = g21 = 0

así como los siguientes componentes que corresponden al tensor métrico conjugado g-1:
g11 = (x1) ²___g22 = 1/(x1) ²
g12 = g21 = 0
Con esto podemos obtener los símbolos de Christoffel que nos permitirán obtener al componente del tensor de Riemann que
estamos buscando, R1212.

Cuando los tres índices del símbolo de Christoffel son iguales como en el caso de Γ111, tenemos que recurrir a la relación
explícita sin haber atajos posibles:
Γαμν = gαβ (- gμν,β + gνβ,μ + gμβ,ν)/2

Γαμν = gαβ (- ∂gμν/∂xβ + ∂gνβ/∂xμ + ∂gμβ/∂xν)/2


Entonces:
Γ111 = g11 (- ∂g11/∂x1 + ∂g11/∂x1 + ∂g11/∂x1)/2

Γ111 = {(x1) ²} {∂g11/∂x1}/2

Γ111 = {(x1) ²} {- 2 (x1) -3}/2

Siendo la métrica una métrica diagonal, sin componentes “cruzados”, podemos llevar a cabo la evaluación de los otros símbolos
de Christoffel mediante las relaciones simplificadas para métricas diagonales que ya obtuvimos en una entrada previa, las cuales
son:

Empezamos con la evaluación de Γ122:

converted by W eb2PDFConvert.com
A continuación llevamos a cabo la evaluación del símbolo de Christoffel Γ221 que por la propiedad de simetría de los símbolos de
Christoffel de segundo género es igual a Γ212:

Como no requerimos el símbolo de Christoffel Γ222 para la obtención de R1212, no se llevará a cabo aquí la evaluación del
mismo.
Para la obtención de R1212 utilizamos la relación general que nos dá los componentes del tensor de Riemann:

Rαβμν = Γαβν,μ - Γαβμ,ν + Γασμ Γσβν - Γασν Γσβμ


la cual en este caso se nos convierte en:
R1212 = Γ122,1 - Γ121,2 + Γ1σ1 Γσ22 - Γ1σ2 Γσ21

R1212 = ∂Γ122/∂x1 - ∂Γ121/∂x2 + Γ1σ1 Γσ22 - Γ1σ2 Γσ21


La evaluación detallada se muestra a continuación:

En cuanto al determinante del tensor métrico, g, este será:


g = g11 g22 - g12 g21
Siendo g12 = g21 se tiene entonces:
g = g11 g22 - (g12)²
La evaluación de la curvatura K en base a la fórmula dada es la siguiente:

converted by W eb2PDFConvert.com
Finalmente:

Esta curvatura no depende de las coordenadas, y por lo tanto la superficie descrita por esta métrica es una superficie de
curvatura constante. Una curvatura igual a cero corresponde a la curvatura de una superficie plana. Una curvatura positiva
constante corresponde a una superficie como la de la esfera. Y una superficie de curvatura negativa constante corresponde a
algo como un hiperboloide.
En el espacio-tiempo de 4 dimensiones, de las 20 componentes del tensor de Riemann la esencia de diez de ellas es capturada
por el tensor de Ricci obtenido mediante una contracción del tensor de Riemann que será discutida posteriormente, mientras
que la esencia de las diez restantes es capturada por otro tensor conocido como el tensor de Weyl:

En el manejo que se llevará a cabo del tensor de Riemann en otras entradas posteriores, tanto el tensor de Ricci como el escalar
de Ricci que se pueden considerar como trazas del tensor de Riemann (el concepto de traza se toma prestado de la definición
dada a la traza de la diagonal principal de una matriz como la suma de los elementos de la diagonal principal) obtenidas
mediante el proceso de contracción tensorial. En ocasiones es deseable considerar por separado aquellas partes del tensor de
Riemann que son removidas por el tensor de Ricci y el escalar de Ricci. Para ello inventamos el tensor de Weyl que es
básicamente el tensor de Riemann con todas sus contracciones posibles removidas. Usando la notación de paréntesis cuadrados
en los sub-índices que representa simbólicamente una antisimetrización:

el tensor de Weyl queda definido de la siguiente manera (la definición que se dé al tensor de Weyl depende del número de
dimensiones, en este caso suponemos una dimensión de cuatro):

En la práctica, la obtención de los componentes del tensor de Weyl resulta mucho más fácil si simplemente obtenemos primero
todos los componentes del tensor de Ricci, y removemos estos últimos de los componentes del tensor de Riemann, en lugar de
converted by W eb2PDFConvert.com
andar usando fórmulas demasiado elaboradas.

Armando Martínez Téllez a la/s 2:22


Compartir

‹ Página principal ›
Ver versión web
Datos personales
Armando Martínez Téllez
Ver todo mi perfil

Con la tecnología de Blogger.

converted by W eb2PDFConvert.com
La Teoría de la Relatividad
ESTE ES UN TRABAJO BAJO CONSTRUCCION

m i é r c o l e s , 1 8 d e m a r z o
La ecuación de desviación geodésica
El tensor de Riemann tiene una importancia fundamental a la hora de calcular la desviación de dos líneas inicialmente paralelas
cuando se desplazan a través de una superficie curva. Si bien en un espacio dimensional plano las líneas paralelas nunca se
cortan, esta regla no es aplicable en el caso de las superficies curvas de geometría elíptica. Supóngase que dos viajeros salen
del Ecuador en dirección norte. En ambos casos, el ángulo que la trayectoria de su barco forma con el Ecuador es inicialmente
de 90º, por lo que se trata de dos líneas inicialmente paralelas. Sin embargo, conforme los viajeros se van desplazando hacia el
norte, su distancia recíproca se hace cada vez más pequeña hasta que se hace nula en el Polo Norte, que es donde se
encuentran sus trayectorias de viaje. Para calcular la tasa de aproximación entre las dos geodésicas utilizamos la siguiente
ecuación conocida como la ecuación de desviación geodésica:

en donde dξβ y dξν representan el recorrido desde el Ecuador de ambas líneas geodésicas y ξμ la distancia de separación entre
ellas. Al hablar de una desviación geodésica, en ningún momento estamos diciendo que cualquiera de los dos objetos
inicialmente paralelos puestos en movimiento se desviará de su ruta geodésica. La desviación de la que se está hablando es de
la trayectoria que ambos objetos tendrían si continuaran moviéndose siguiendo rutas paralelas al estar en un espacio-tiempo
plano.
En el espacio-tiempo curvo de la Relatividad General, las cosas funcionan de un modo parecido a como funcionan en el espacio
geométrico N-dimensional de Bernhard Riemann: el tensor de Riemann determina la aceleración recíproca entre las líneas del
mundo (o líneas del universo, en el diagrama espacio-tiempo de Minkowski) de dos sistemas inerciales (p.ej. dos asteroides que
se acercan progresivamente como consecuencia de su mutua atracción gravitatoria). Para calcular dicha aceleración, aplicamos
de nuevo la ecuación de desviación geodésica con una ligera modificación introduciendo el tiempo local (o tiempo propio):

en donde dτ es un parámetro afín (en este caso el tiempo local) y uβ y uν son los 4-vectores de la 4-velocidad de cada uno de los
cuerpos que, según el esquema de Minkowski, equivalen geométricamente a campos vectoriales tangentes a ambas líneas de
universo. Esquemáticamente esto representa la aceleración de dos líneas del mundo geodésicas:

Como podemos ver, conforme se avanza en la línea temporal (hacia arriba) el tensor de Riemann curva las geodésicas y provoca
el acercamiento recíproco de las dos partículas. Las geodésicas en un espacio-tiempo plano (Lorentziano) mantienen su

converted by W eb2PDFConvert.com
separación y permanecen paralelas, mientras que las geodésicas en un espacio-tiempo curvo no lo hacen.
Considérense dos geodésicas con vectores tangentes V y V’ que empiezan como paralelas cercanas la una a la otra, una en un
punto A y la otra en un punto A’. Llamemos λ al parámetro afín en las geodésicas (que puede ser un elemento de arco o el
tiempo local τ). Definamos ahora un “vector de conexión” ξ (como en el diagrama de arriba) que llega a una geodésica desde la
otra, conectando puntos de ambas a intervalos iguales (como ξ1 y ξ2 en el diagrama de arriba). Para mayor simplicidad,
adoptaremos un sistema de coordenadas (x0, x1, x2, x3) localmente inercial en el punto A, en el cual la coordenada x0 apunta a
lo largo de la geodésica (la selección del componente-0 que es el componente temporal a lo largo de la geodésica nos ayudará
en relacionar los resultados con el caso en el cual λ es el tiempo local). Entonces en el punto A tenemos que la única componente
del 4-vector velocidad es la componente temporal (trabajaremos con una velocidad de la luz c igual a la unidad para no estar
arrastrando innecesariamente dicha constante a lo largo de la demostración) a la cual le daremos un valor unitario:
V = (Vα) = (1, 0, 0, 0) = (δα0)
Notacionalmente, en conformidad con lo que se ha indicado, las siguientes tres representaciones estarán simbolizando una
misma cosa:

Nuestro punto de partida será la ecuación diferencial para la ruta geodésica (ecuación geodésica):

Puesto que estamos considerando al punto A como parte de un marco de referencia inercial plano (Lorentziano) esto implica que
para el punto A los símbolos de Christoffel en dicho punto deben ser nulos, y en tal caso debe ser cierto lo siguiente para el
punto A:

Pero el punto de la otra geodésica, el punto A’, no está en un marco de referencia plano, por lo cual recurriendo nuevamente a
la ecuación geodésica tenemos que la ecuación de la geodésica V’ en A’ debe ser (puesto que Vα = δα0 entonces en la sumatoria
sobre los símbolos de Christoffel requerida por la convención de sumación -en virtud de los índices repetidos- el único símbolo
de Christoffel que no será cero es Γα00 , todos los demas serán iguales a cero):

Puesto que A y A’ están separados por el vector ξ, los símbolos de Christoffel en el punto A y en el punto A’ están relacionados
de la siguiente manera:

Con la relación previa, esto nos conecta los puntos de partida A y A’ de las geodésicas del siguiente modo:

Ahora bien, la diferencia entre el componente xα que corresponde al punto A’ y el componente xα que corresponde al punto A
debe ser igual al componente ξα del vector de separación ξ entre ambas geodésicas:
xα (A’) - xα (A) = ξα

converted by W eb2PDFConvert.com
Con esto podemos establecer una conexión entre las geodésicas y el vector de separación metiendo las relaciones anteriores en
esto último obteniendo así:

Haremos ahora un pequeño paréntesis. En el lado izquierdo de esta última ecuación tenemos a la segunda derivada ordinaria de
ξ con respecto al parámetro afín, o sea d²ξ/dλ². Esto es perfectamente válido dentro de un espacio-tiempo plano, Lorentziano.
El problema es que no estamos trabajando dentro de un espacio-tiempo plano, estamos trabajando dentro de un espacio-tiempo
curvo. Y al trabajar en un espacio-tiempo curvo, para que los resultados puedan ser válidos en cualquier sistema de coordenadas
tenemos que reemplazar a la derivada ordinaria por la derivada covariante. Y en este caso, no basta con llevar a cabo una sola
diferenciación covariante, tenemos que llevar a cabo dos diferenciaciones covariantes. Para la obtención de la velocidad (de
cambio) de ξ requerimos de la primera derivada covariante de ξ, y para obtener la aceleración de ξ usamos la segunda
derivada covariante de ξ, lo cual será válido (tensorialmente) para cualquier sistema de coordenadas.
Si representamos a la primera derivada covariante del vector ξ = (ξα) con respecto al parámetro λ como (obsérvese el uso del
semicolon con el cual indicamos una diferenciación covariante):
ξα; λ

entonces podemos representar a la segunda derivada covariante del vector ξ = (ξα) con respecto al parámetro λ como
(obsérvese de nueva cuenta el uso del semicolon con el cual indicamos una diferenciación covariante):
(ξα; λ) ; λ
Es importante aclarar aquí que algunos autores de reconocido prestigio representan esta segunda derivada covariante de una
manera como la siguiente:
∇v∇v ξ

Aunque cada autor es libre de inventar la notación que le plazca, esta selección del símbolo nabla (∇) para denotar una
derivada covariante es desafortunada por el hecho de que en una gran cantidad de textos y trabajos científicos el símbolo ∇
está reservado para representar al operador diferencial vectorial ∇ = (∂/∂x, ∂/∂y, ∂/∂z). El operador diferencial vectorial ∇
y la diferenciación covariante representan dos conceptos completamente distintos (el primero ni siquiera involucra símbolos de
Christoffel). Y la colocación de un vector (V) como sub-índice después del símbolo ∇ no ayuda mucho en aclarar la posible
confusión en virtud de que se puede malinterpretar como una derivada absoluta o derivada intrínseca, la cual aunque
ciertamente es una operación matemática que especifica una diferenciación covariante también va aparejada con la
contracción tensorial con el vector en cuestión que viene siendo la tangente de la curva a lo largo de la cual se lleva a cabo la
diferenciación covariante.
Para evitar confusiones, nos mantendremos fieles a la simbología que hemos estado usando en entradas anteriores.
La definición de la derivada covariante nos dá la primera derivada del tensor contravariante (ξα) con respecto a λ (que en este
caso es x0) de la siguiente manera de acuerdo a la definición de derivada covariante:

En virtud del índice repetido β en el segundo término que activa a la convención de sumación, el segundo término se expande a
cuatro términos de Christoffel de segundo género en un 4-espacio correspondiendo a las cuatro componentes de ξβ. Tenemos un
índice libre, q, pero en virtud de que ambas geodésicas son inicialmente paralelas también la geodésica que parte de A se
trasladará a lo largo de la coordenada x0 (la componente temporal), siendo las otras tres componentes iguales a cero para las
otras tres coordenadas (no lo serían si las geodésicas en los puntos A y A’ apuntaran en direcciones diferentes que involucraran a

converted by W eb2PDFConvert.com
las otras tres coordenadas que son las coordenadas espaciales estando lo más anti-paralelas que pudieran estar). Tomando esto
en cuenta e invocando la propiedad de los símbolos de Christoffel de segundo género que nos dice que son simétricos en el
intercambio de los dos índices inferiores, lo anterior lo podemos escribir del siguiente modo:

Llevándose a cabo el cambio de ξα únicamente con respecto a la primera coordenada (la coordenada temporal), podemos
reemplazar a la diferenciación parcial ∂ξα/∂λ por la diferenciación ordinaria dξα/dλ, escribiendo así:

Esta es la primera derivada covariante de ξ = (ξα). Pero estamos interesados en la segunda derivada covariante de ξ. Esto nos
requiere aplicar de nueva cuenta la definición de derivada covariante. Es así como habiendo utilizado el hecho de que los
símbolos de Christoffel son iguales a cero en el punto A llegamos a lo siguiente:

Removiendo el paréntesis tomando la diferenciación indicada con respecto a λ tenemos lo siguiente:

Puesto que el factor dξβ/dx0 es igual a cero, el tercer término se nos hace cero quedándonos únicamente:

Aquí podemos introducir el resultado que habíamos obtenido previamente para d²ξα/dλ² obteniendo de este modo lo siguiente:

En este punto revertiremos a notación simbólica más compacta habiendo quedado claro aquello de lo que estamos hablando,
usando la coma sencilla para indicar las diferenciaciones ordinarias:
(ξα; λ) ; λ = - Γα00,β ξβ + Γαβ0,0 ξβ

Factorizando ξβ:
(ξα; λ) ; λ = (Γαβ0,0 - Γα00,β) ξβ
Esto se puede simplificar aún más si recurrimos a la definición del tensor de Riemann:
Rαβμν = Γαβν,μ - Γαβμ,ν + Γα σμ Γσ βν - Γα σν Γσ βμ
Poniendo ceros en el lugar en donde están los primeros dos sub-índices (β y μ) tenemos entonces:
Rα00ν = Γα0ν,0 - Γα00,ν + Γα σ0 Γσ 0ν - Γα σν Γσ 00
El tercer término y el cuarto término se nos anulan, quedándonos únicamente los dos primeros términos. En el primer término
podemos hacer un reacomodo en los dos primeros sub-índices haciendo uso del hecho de que el símbolo de Christoffel de
segundo género es simétrico en sus índices inferiores y de que esta simetría se mantienen en pie al tomarse la derivada
ordinaria de dicho símbolo de Christoffel:

converted by W eb2PDFConvert.com
Rα00ν = Γαν0,0 - Γα00,ν
Si tomamos el lado derecho de esta ecuación:
Γαν0,0 - Γα00,ν
y hacemos una comparación con lo que habíamos obtenido previamente:
(ξα; λ) ; λ = (Γαβ0,0 - Γα00,β) ξβ
podemos ver que podemos reemplazar en esto último lo que está dentro de los paréntesis por el símbolo del tensor de Riemann
con los dos índices que se han puesto en ceros. Es así como llegamos a lo siguiente:
(ξα; λ) ; λ = Rα00β ξβ

Desde el principio hemos supuesto que (Vα) = (δα0). Entonces V0 = δ00 = 1, lo cual nos permite escribir lo siguiente:

(ξα; λ) ; λ = Rα00β (1)(1) ξβ

(ξα; λ) ; λ = Rα00β (V0)(V0) ξβ


Esto es válido en lo que respecta a una coordenada, la coordenada temporal. Pero todas las cuatro coordenadas están al mismo
nivel (en inglés se acostumbra decir on equal footing), ninguna de ellas está privilegiada sobre la otra. Esto significa que la
generalización del resultado que acabamos de obtener se puede enunciar de modo completamente general de la manera
siguiente:
(ξα; λ) ; λ = Rαμνβ (Vμ)(Vν) ξβ

en donde Vμ es el 4-vector velocidad que corresponde a una de las geodésicas y Vν es la 4-velocidad que corresponde a la otra
geodésica. Esta es esencialmente la ecuación de desviación geodésica.
Si tomamos el parámetro λ como el tiempo local o tiempo propio τ, entonces podemos hacer:
(ξα; λ) ; λ = d²ξ/dτ²
con lo cual:
d²ξ/dτ² = Rαμνβ (Vμ)(Vν) ξβ
Esta es la ecuación de desviación geodésica, desde la perspectiva de la Relatividad General, enunciada al principio de esta
entrada.
La ecuación de desviación geodésica puede ser derivada de modo más riguroso (y más satisfactorio desde el punto de vista
matemático formal) mediante algo que llamamos la segunda variación covariante del Lagrangiano de una partícula puntual, o
bien de la primera variación de un Lagrangiano combinado. El resultado que obtenemos a fin de cuentas es exactamente el
mismo.
PROBLEMA: Dimensionalmente hablando, ¿qué es lo que estamos midiendo con el tensor Rαμνβ a la luz de la ecuación de
desviación geodésica?
ξ es un 4-vector cuyas cuatro componentes son medidas en unidades de longitud (metros). Tomando al parámetro τ como el
tiempo propio (tiempo local), medido en segundos, entonces en el lado derecho de la ecuación de desviación geodésica
d²ξ/dτ² tiene unidades de metros/(segundo)², con lo cual estamos midiendo una aceleración, la aceleración con la cual se está
acortando la longitud del 4-vector ξ. Puesto que cada componente de la 4-velocidad Vμ así como de la 4-velocidad Vν está
medido en metros por segundo, entonces la ecuación de desviación geodésica:
d²ξ/dτ² = Rαμνβ (Vμ)(Vν) ξβ
tiene la siguiente expresión dimensional en unidades del sistema MKS:

converted by W eb2PDFConvert.com
Simplificando:

Para que esta ecuación pueda ser dimensionalmente correcta, se requiere que tenga unidades de metros-2, o sea:

Siendo los metros cuadrados algo que corresponde a una dimensión de superficie, esto nos mide algo por unidad de área.
Recordemos en una de las derivaciones del tensor de Riemann cómo el tensor de curvatura fue obtenido a partir de un “parche
de coordenadas” tomado de la hoja que representa la 2-superficie bajo consideración. Si todos los componentes del tensor de
Riemann son iguales a cero, esto significa que estamos situados en un espacio Euclideano plano. Pero si tan sólo uno de los
componentes del tensor de Riemann es diferente de cero, entonces estamos situados en un espacio curvo (o mejor dicho, en un
espacio-tiempo curvo). Esto significa que podemos equiparar a Rαμνβ como una medida de la curvatura por unidad de área del
espacio dimensional bajo consideración. A mayor magnitud de cualquiera de los componentes del tensor de Riemann Rαμνβ ,
tanto mayor será la curvatura por unidad de área del “parche de coordenadas” sobre el cual se está midiendo dicha curvatura.

Armando Martínez Téllez a la/s 2:12


Compartir

‹ Página principal ›
Ver versión web
Datos personales
Armando Martínez Téllez
Ver todo mi perfil

Con la tecnología de Blogger.

converted by W eb2PDFConvert.com
La Teoría de la Relatividad
ESTE ES UN TRABAJO BAJO CONSTRUCCION

m i é r c o l e s , 1 8 d e m a r z o
6: Los diagramas espacio-tiempo de Minkowski
La Teoría Especial de la Relatividad, tal y como fue enunciada por vez primera por Einstein, era una teoría puramente
algebraica, sin referencia alguna a ningún tipo de geometría. Se debe a Hermann Minkowski la proeza de haberla convertido en
una teoría geométrica llevando a cabo de paso la unificación de dos conceptos que en la mecánica clásica habían sido
considerados completamente independientes y separados el uno del otro: el espacio y el tiempo. Gracias a Minkowski, el
espacio y el tiempo fueron unificados en un solo concepto básico e indivisible bajo una sola palabra, el espaciotiempo (aquí lo
llamaremos espacio-tiempo en el entendido de que ambos conceptos han sido fusionados en uno solo), de modo tal que no era
posible hablar ya del espacio como entidad individual y del tiempo como entidad individual también, separados el uno del otro.
Pero aquí nos estamos adelantando a nuestra historia.
Considerando para fines ilustrativos una velocidad de la luz de c = 1 metro por segundo, el diagrama espacio-tiempo para un
rayo de luz es el siguiente:

Sobre el mismo diagrama, la especificación de la coordenada x de una partícula material que nos indica la posición en la cual se
encuentra la partícula y del tiempo t al que corresponde esta coordenada, se dice que determina un evento o un suceso. Si
representamos la posición x en el eje de las abcisas (eje horizontal) y el tiempo t en las ordenadas (eje vertical), cada punto
del plano x-t corresponde a un posible evento. En un diagrama así podemos representar dos eventos distintos vistos por un
mismo observador, trátese de dos eventos distintos que ocurren en el mismo lugar en tiempos diferentes, dos eventos distintos
que ocurren al mismo tiempo en distintos lugares, o dos eventos distintos que ocurren en tiempos diferentes en lugares
diferentes, como es el siguiente caso:

converted by W eb2PDFConvert.com
El lugar en un plano x-t de los eventos que representan las coordenadas apareadas de una partícula en varios instantes se conoce
en los estudios de la relatividad como línea del mundo (world line) y también como línea del universo. En la Teoría Especial
de la Relatividad, la línea del mundo es siempre una línea recta como la línea azul que tenemos en el diagrama de arriba porque
la partícula material viaja siempre en movimiento rectilíneo en una misma dirección, recorriendo distancias iguales en tiempos
iguales. Si en el instante t1 la coordenada de una partícula móvil es x1, entonces las magnitudes x1 y t1 determinan el evento
E1. Análogamente, x2 y t2 determinan el evento E2. Los eventos para un mismo y único observador están separados en el
espacio por una distancia Δx = x2 - x1 y en el tiempo por una distancia Δt = t2 - t1.
En los estudios sobre la relatividad, no se acostumbra revolver peras con manzanas, no se acostumbra revolver metros con
segundos al medir sobre coordenadas rectangulares. Para que en un diagrama espacio-tiempo tanto el eje horizontal como el eje
vertical usen el mismo tipo de unidades, se acostumbra multiplicar el tiempo en el eje vertical que corresponde al tiempo por la
constante universal absoluta que es la velocidad de la luz c, ya que con ello ct se convierte en una distancia que está medida en
metros, no en segundos. De este modo, no mezclamos peras con manzanas, al medir tanto en el eje vertical como en el eje
horizontal lo estamos haciendo en metros. En todos los diagramas espacio-tiempo que serán utilizados aquí, la ordenada vertical
estará en dimensiones de metros, o sea multiplicada por c, representado en la ordenada vertical como ct. Aunque aparezca t en
lugar de ct, se sobreentenderá que siempre nos estamos refiriendo a ct. Además, para fines de simplificación, le seguiremos
dando a c el valor de 1 metro por segundo. Sin embargo, para fines de cálculo numérico, estamos en libertad de regresar a las
mediciones en segundos sobre el eje vertical.
En la última gráfica de arriba, tenemos representados dos eventos distintos, uno ocurriendo en la posición x1 en un tiempo
representado en la posición ct1, y el otro evento ocurriendo en la posición x2 en un tiempo representado en la posición ct2.
Poniendo números y usando una velocidad de la luz igual a c = 1 metro/segundo, las coordenadas respectivas de cada evento y
la distancia entre ambos eventos es:
x1 = 1 metro
x2 = 2 metros
ct1 = 1 metro
ct2 = 3 metros
Δx = x2 - x1 = 2 metros - 1 metro = 1 metro
cΔt = ct2 - ct1 = 3 metros - 1 metro = 2 metros
PROBLEMA: Una vara de medir de tres metros de largo se encuentra en reposo en el marco de referencia del observador O,
y sus extremos coinciden con las coordenadas x1 = 2 metros y x2 = 5 metros. Trazar las líneas del mundo de los extremos de
la vara de medir en un diagrama espacio-tiempo del observador O.
El diagrama espacio-tiempo pedido es el siguiente:

No es un requisito indispensable que en la construcción de un diagrama del espacio-tiempo se utilicen ejes ortogonales
(perpendiculares, puestos en ángulos rectos el uno con respecto al otro). Es factible e inclusive deseable por razones que pronto
serán obvias construír el diagrama espacio-tiempo utilizando ejes que no son perpendiculares. A continuación tenemos un
diagrama en el cual los ejes principales no son perpendiculares:

converted by W eb2PDFConvert.com
Obsérvese la manera de leer las coordenadas de un punto cualesquiera en este tipo de diagrama, trazando desde el punto líneas
paralelas a uno de los ejes principales hasta topar con el eje principal de la otra coordenada.
Y a continuación tenemos otro diagrama espacio-tiempo en el cual los ejes principales tampoco son perpendiculares:

Para un mismo observador, el anterior diagrama espacio-tiempo nos dá la distancia Δx que separa dos eventos E1 y E2, y nos dá
también la distancia cΔt que separa a dichos eventos. Pero este diagrama espacio-tiempo describe la situación de un solo
observador. El diagrama espacio-tiempo para un observador solitario no nos es de mucha utilidad en la resolución de problemas
propios de la relatividad. Es necesario juntar de alguna manera los diagramas espacio-tiempo de dos observadores que están en
movimiento relativo el uno con respecto al otro en uno solo. Lo que estamos buscando es algo que geométricamente nos
permita visualizar en un mismo diagrama la situación de dos observadores. Esto se logra con un procedimiento que nos fue dado
por el matemático Hermann Minkowski que será dado a continuación.

Procedimiento para construír un diagrama espacio-tiempo

(1) Supondremos que la velocidad de la luz tiene un valor de c = 1 metro/segundo. Empezamos trazando dos coordenadas
perpendiculares que representan el diagrama espacio-tiempo de un observador al cual llamaremos O y que se considera a sí
mismo en estado de reposo en su marco de referencia S, con la coordenada horizontal asignada a la representación de la
posición de un objeto en el eje-x y con la coordenada vertical asignada a la representación del tiempo en el cual el objeto está
en cierta posición:

converted by W eb2PDFConvert.com
(2) El diagrama espacio-tiempo más elemental que combina a dos observadores es el diagrama trivial en el cual ambos
observadores está reposo el uno frente al otro en el mismo lugar (x = x’) y tienen sus relojes sincronizados al mismo tiempo (t =
t’), lo que permite que los orígenes de ambos sistemas de referencia S y S’ coincidan en un mismo punto:

En forma similar a como sucede para el observador O, el eje ct’ es el lugar de los puntos tales que los eventos que ocurren a
lo largo de dicho eje ocurren en el mismo lugar x’ = 0 pero en tiempos distintos para un observador O.
(3) Para trazar un diagrama espacio-tiempo combinado juntando a dos observadores diferentes que están en movimiento
relativo el uno con respecto al otro a una velocidad V, trazamos primero el eje-t’ del marco de referencia S’ sobre el
diagrama espacio-tiempo del observador en reposo usando para ello la velocidad relativa entre ambos observadores. No es
necesario que los orígenes de los diagramas espacio-tiempo del observador O y del observador O’ coincidan, esto es mera
cuestión de conveniencia. Construiremos un diagrama en el que ambos orígenes coinciden.

Suponiendo que la velocidad relativa entre ambos marcos de referencia es de V = 0.4c (o.4 metros/segundo) entonces para
moverse una distancia x = 1 metro el observador O’ debe de haberse movido en un tiempo t = x/V = 2.5 segundos con respecto
al origen, y para moverse una distancia x = 2 metros el observador O’ debe de haberse movido en un tiempo t = x/V = 5
segundos. Todos estos puntos están conectados con una línea recta, la cual trazamos sobre el diagrama como se muestra arriba.
Esta recta corresponde al tiempo t’ del marco de referencia S’. Obsérvese que entre menor sea la velocidad relativa V más y
más cercana estará la línea que hemos trazado a la vertical que corresponde a t, hasta que ambas llegan a coincidir cuando la
velocidad relativa entre los dos observadores es cero. Para mayor simplicidad, prescindiremos de las graduaciones que hemos
puesto en las coordenadas de ambos ejes del observador O:

converted by W eb2PDFConvert.com
(4) A continuación trazamos sobre el diagrama espacio-tiempo la ruta que corresponde a la trayectoria de un rayo de luz con una
velocidad c = 1 metro/segundo:

(5) Ahora vamos a trazar la coordenada de x’ superimponiéndola en el mismo diagrama. Para poder localizarla en dicho
diagrama, considérese primero un rayo de luz lanzado en el marco de referencia del observador O’ en un tiempo (medido en
metros) ct’ = -a desde la coordenada x’ = 0, un evento al que llamaremos E, el cual es reflejado en sentido opuesto en un
tiempo ct = 0 por un espejo en un evento al que llamaremos P, para regresar nuevamente a la coordenada x’ = 0 en un evento al
que llamaremos R ocurriendo en el tiempo ct’ = +a (podemos imaginar lo que ocurre como una descripción geométrica en el
espacio-tiempo del experimento llevado a cabo por el viajero en el ferrocarril al que vimos en la entrada titulada “La física es
parada de cabeza” cuando nos encontramos por vez primera el efecto relativista de la dilatación del tiempo):

Desde la perpectiva del observador estacionario O, la situación del rayo de luz que fue reflejado en el marco de referencia de
O’ es la siguiente:

converted by W eb2PDFConvert.com
Tanto en el marco de referencia del observador O’ como en el marco de referencia del observador O la luz sigue teniendo la
misma velocidad, como lo enuncia el segundo postulado de la Teoría Especial de la Relatividad. Por lo tanto, el rayo de luz que
es lanzado en el marco de referencia de O’ también tendrá la misma pendiente de 45 grados en el marco de referencia de O. En
el diagrama de arriba ubicamos arbitrariamente sobre el eje ct’ el evento E en el punto ct’ = -a, y trazamos desde dicho punto
una trayectoria de 45 grados que corresponde al rayo de luz que es lanzado por el observador O’. Por otro lado, ubicamos sobre
el eje t’ el evento R en el punto ct’ = +a, y trazamos desde allí la trayectoria que representa el rayo de luz reflejado por el
espejo desde el punto que debe representar al evento P, una línea recta también de 45 grados (en concordancia con el segundo
postulado de la Teoría Especial de la Relatividad) pero yendo de derecha a izquierda, extendiendo dicha línea hasta que se
cruce con la otra línea que habíamos trazado. Esto nos dá unívocamente en el diagrama la localización del evento P. Por último,
trazamos una línea punteada que conecta el origen común de ambos observadores hasta el punto que representa al evento P.
Esta es la línea que corresponde a la coordenada de x’. No tardamos en descubrir que el ángulo que forma la coordenada x con
la coordenada x’ es el mismo ángulo que el que forma la coordenada ct con la coordenada ct’. Con esto, hemos terminado
esencialmente con la construcción del diagrama.
Una cosa que resalta del diagrama espacio-tiempo final es el hecho de que los dos eventos identificados con cuadritos rojos y
con los números 1 y 2 que son simultáneos para el observador O’ (ambos ocurren en su tiempo t’ = 0) no ocurren al mismo
tiempo en el marco de referencia del observador O. Esta es nuestra perspectiva geométrica del verdadero origen de los
fenómenos relativistas de dilatación del tiempo y contracción de longitud: la simultaneidad deja de ser absoluta. En el
universo de los absolutos, en la física pre-relativista, si dos eventos ocurrían al mismo tiempo para un observador estacionario,
también ocurrían al mismo tiempo para otro observador en movimiento, lo cual deja de ser válido en la Teoría Especial de la
Relatividad.
Una cosa que no hemos hecho y la cual dejaremos pendiente por el momento es graduar (marcar con divisiones igualmente
espaciadas) las coordenadas (x,t) del observador O y las coordenadas (x’,t’) del observador O’ de modo tal que podamos
resolver gráficamente un problema relativista obteniendo aproximaciones numéricas al igual que como lo hacen los ingenieros
que utilizan papel gráfico para la resolución aproximada de problemas de otra índole (el Smith Chart utilizado para la resolución
de problemas eléctricos de líneas de transmisión, y el diagrama de humedad o carta psicométrica usada para la resolución de
problemas de humedad relativa y punto de rocío). Esta graduación es conocida también como la calibración de los ejes, y se
puede llevar a cabo mediante cálculos numéricos con las ecuaciones de transformación de Lorentz que veremos posteriormente
o con el procedimiento geométrico de la hipérbola invariante.
Así pues, nuestro principal medio de trabajo para el análisis geométrico de los problemas de la Teoría Especial de la Relatividad
es el diagrama espacio-tiempo de Minkowski:

converted by W eb2PDFConvert.com
Este es el diagrama espacio-tiempo desde la perspectiva del observador O en reposo. Si queremos, podemos dibujar también
el diagrama espacio-tiempo desde la perspectiva del observador O’ cuando este se considera en reposo y cuando ve al
observador O en movimiento hacia la izquierda:

En esencia, lo que hemos hecho a sido tomar el diagrama básico para un observador O en reposo en un marco de referencia S,
trazando sobre el mismo la línea que marca la trayectoria de un rayo de luz con una pendiente de 45 grados que corresponde a
una velocidad c de 1 metro por segundo:

y sobre este diagrama, usando como referencia común la bisectriz que ambos diagramas deben tener identificando en el mismo
la línea del mundo de un rayo de luz común a ambos observadores O y O’ en los marcos de referencia S y S’, hemos agregado al
diagrama del observador estacionario O el siguiente diagrama espacio-tiempo de O’ (nos queda pendiente el asunto de cómo se
lleva a cabo la graduación o calibración de los ejes x’-t’):

converted by W eb2PDFConvert.com
para así tener el siguiente diagrama espacio-tiempo combinando a ambos observadores desde la perspectiva del observador
estacionario O:

PROBLEMA: Representar en un diagrama espacio-tiempo cuatro eventos distintos cuyas coordenadas son las siguientes:
E1(x1, c t1) = (1, 2)
E2(x2, c t2) = (2, 5)
E3(x’1, c t’1) = (4, 1)
E4(x’2, c t’2) = (2, 2)
Los eventos E1 y E2 están especificados sobre las coordenadas del observador en reposo O en su marco de referencia S, y en el
diagrama espacio-tiempo combinado estarán ubicados en las siguientes posiciones (se han representado los dos eventos en el
diagrama con unos cuadritos de color púrpura):

Los eventos E3 y E4 están especificados sobre las coordenadas del observador en movimiento O’ en su marco de referencia S’, y
en el diagrama espacio-tiempo combinado estarán ubicados en las siguientes posiciones (se han representado los dos eventos en

converted by W eb2PDFConvert.com
el diagrama con unos cuadritos de color verde):

Cuanto más alta sea la velocidad relativa V entre dos marcos de referencia acercándose o alejándose a una velocidad cada vez
más cercana a la velocidad de la luz, tanto más se irán cerrando los ejes que corresponden al marco de referencia en
movimiento S’ como podemos apreciarlo en el siguiente diagrama espacio-tiempo:

En el diagrama espacio-tiempo de arriba, tenemos sobrepuestos a tres observadores, el observador que consideramos
estacionario, el observador O’ que se está moviendo a una velocidad relativa V con respecto al observador O, y un tercer
observador O’’ que se está moviendo a una velocidad todavía mayor con respecto al observador O. Nótese cómo se van
cerrando cada vez más y más los ejes coordenados x-t de un observador móvil conforme va aumentando su velocidad V con
respecto al observador estacionario.
Cuando se prescinde de un diagrama espacio-tiempo como el caso en el que se vaya a efectuar un cálculo numérico, para la
especificación completa de un mismo evento E cualquiera se deben especificar cuatro coordenadas, las coordenadas (x,t) del
evento en el marco de referencia S, y las coordenadas (x’,t’) del evento en el marco de referencia S’, de modo tal que un
evento quedará registrado como E(x,t,x’,t’) en forma completa. Esto es válido para cualquier evento. El único evento que
tendrá las mismas coordenadas tanto para S como para S será el que ocurra en el punto común de origen, o sea E(x,t,x’,t’) =
(0,0,0,0). En todos los demás casos las coordenadas diferirán. Sin embargo, al hablar de un evento se está hablando de un mismo
y único evento visible para todos los observadores. Cuando un carro choca contra otro, ya sea visto por un observador
estacionario o por un observador móvil, no existen dos marcos de referencia distintos en los cuales uno de los carros choque y el
otro no. Distintos observadores siempre se podrán poner de acuerdo en un evento específico, cada uno asignándole sus propias
coordenadas. En lo que no se podrán poner de acuerdo es en la duración del lapso de tiempo entre dos eventos distintos E1 y E2
y en la distancia espacial que separe a dos eventos distintos. Un observador dirá que el lapso de tiempo entre dos eventos E1 y
E2 fue Δt mientras que el otro dirá que fue Δt’. Un observador dirá que la distancia espacial entre dos eventos fue Δx mientras
que el otro dirá que fue Δx’, y en los diagramas de arriba podemos ver por qué no podrán ponerse de acuerdo jamás, a menos
de que tomen en cuenta las correciones relativistas.
Dado un evento E cualquiera puesto en un diagrama espacio-tiempo que involucre a dos observadores en movimiento relativo el
uno con respecto al otro, las coordenadas del mismo se pueden obtener tanto en un marco de referencia como en el otro
trazando desde el evento líneas paralelas a cada uno de los ejes coordenados respectivos de cada observador, como lo muestra
el siguiente diagrama:

converted by W eb2PDFConvert.com
En el diagrama espacio-tiempo de arriba tenemos un evento A. Trazando una línea horizontal hacia la izquierda hasta llegar al
eje vertical ct podemos obtener el valor de ct con lo cual podemos obtener el tiempo, y trazando una línea vertical hacia abajo
podemos obtener la coordenada de la distancia x. Del mismo evento A podemos hacia la línea ct’ una línea paralela a la
coordenada x’ con lo cual obtenemos el valor de ct’, y podemos trazar hacia abajo otra línea paralela a ct con lo cual
obtenemos el valor de x’.
PROBLEMA: Mediante un diagrama espacio-tiempo, obtener y explicar el efecto relativista de la dilatación del tiempo.
El análisis se llevará a cabo considerando a nuestro proverbial viajero el cual dentro de un vagón de ferrocarril arroja un rayo de
luz hacia arriba desde una linterna, el cual es reflejado por un espejo regresando al punto de partida, mientras que un
observador sentado a un lado de las vías del ferrocarril observa al rayo de luz recorrer una trayectoria mayor. En la construcción
de cualquier diagrama espacio-tiempo se vuelve necesario identificar claramente los eventos que ocurren. En este caso, nos
basta con identificar sobre el diagrama espacio-tiempo dos eventos: el primer evento que llamaremos E1 ocurre cuando el rayo
de luz sale de la linterna, y el segundo evento que llamaremos E2 ocurre cuando el rayo de luz regresa reflejado por el espejo al
punto desde donde fue lanzado. Ambos eventos ocurren en el mismo lugar para el observador viajero O’, al cual le asignaremos
la coordenada x’ = 0, pero en tiempos diferentes t’1 y t’2. Una vez localizados ambos eventos en el sistema de referencia S’ de
O’, nos basta con trazar dos líneas horizontales desde las coordenadas (x’, t’1) y (x’, t’2) hacia el eje de tiempos del
observador O para obtener las coordenadas correspondientes en el marco de referencia de O de los dos eventos:

Darse cuenta de que efectivamente hay una dilatación del tiempo requiere que pongamos sobre los ejes del diagrama espacio-
tiempo divisiones graduadas en los ejes de los tiempos, o sea que llevemos a cabo la calibración de los ejes, lo cual se verá en
una entrada posterior. Obsérvese que a diferencia de como sucede con el observador O’, los eventos E1 y E2 no sólo ocurren en
tiempos diferentes t1 y t2; también ocurren en lugares diferentes x1 y x2.
PROBLEMA: Ilustrar mediante un diagrama espacio-tiempo el fenómeno de la contracción de longitud sobre una vara de
medición, suponiendo que:
a) El observador en reposo O es el que tiene la vara de medir y el observador O’ es el que la ve pasar frente a él.
b) El observador en movimiento O’ es el que lleva consigo la vara de medir y el observador en reposo O es el que la ve pasar
frente a él.
converted by W eb2PDFConvert.com
a) En el primer caso, si el observador en reposo es el que tiene una vara de medir de longitud L0, las líneas del mundo de los
dos extremos de la vara de medir se mantendrán como dos líneas verticales paralelas proyectadas hacia arriba como lo muestra
el siguiente diagrama espacio-tiempo:

En este caso, el observador estacionario O mide para la vara al mismo tiempo t = 0 en su tiempo propio una longitud L0. Pero
el observador móvil O’ mide la coordenada de cada extremo de la vara en tiempos diferentes y concluye que hubo una
contracción en la longitud de la vara.
b) En el segundo caso, si el observador en movimiento O’ es el que lleva consigo la vara de medir de longitud L0, las líneas del
mundo de los dos extremos de su vara de medir se mantendrán como dos líneas paralelas las cuales a su vez serán paralelas a su
eje vertical ct’ como lo muestra el siguiente diagrama espacio-tiempo:

En este caso, el observador O’ mide para su vara al mismo tiempo t’ = 0 en su tiempo propio una longitud L0. Pero el
observador O mide la coordenada de cada extremo de la vara en tiempos diferentes y concluye por su parte que hubo una
contracción en la longitud de la vara.
Hemos visto una forma convencional del diagrama espacio-tiempo de Minkowski, pero no es la única manera de construír un
diagrama espacio-tiempo. Otra forma de lograrlo es recurriendo a un truco. El truco consiste en que sobre un mismo diagrama,
usando el mismo origen para dos observadores distintos que se están moviendo a una velocidad relativa V el uno con respecto al
otro, se tracen dos ejes de espacios correspondiendo a los espacios propios medidos por cada observador, y además se tracen
dos ejes de tiempos correspondiendo a los tiempos propios medidos por cada observador, de modo tal que el eje de tiempos
de un observador sea perpendicular al eje de espacios del otro observador y que el eje de espacios de dicho observador sea
perpendicular al eje de espacios del otro observador. Esto es lo que nos produce esencialmente lo que se llama un diagrama
espacio-tiempo de Loedel, así llamado en referencia a su creador, el físico latinoamericano Enrique Loedel Palumbo:

converted by W eb2PDFConvert.com
El diagrama de Loedel es una modificación con fines didácticos del diagrama espacio-tiempo que fue concebido por Hermann
Minkowski.
Ahora veremos con mayor detalle el asunto de la simultaneidad, visto desde la óptica de la Teoría Especial de la Relatividad.
El primer contacto que tienen muchos estudiantes con la explicación de la pérdida de la simultaneidad absoluta se basa en un
ejemplo como el siguiente en el cual tenemos a nuestro proverbial pasajero de ferrocarril colocado justo a la mitad de los dos
extremos del convoy de vagones. En el marco de referencia S del observador situado a un lado de las vías del ferrocarril justo a
la mitad de dos torres de luz se activan en forma sincronizada (al mismo tiempo) dos pulsos luminosos emanados de las dos
torres de luz usando relojes sincronizados en el marco de referencia de S para lanzar los pulsos luminosos, en forma tal que el
estallido de uno de los pulsos luminosos coincidirá justo con el extremo delantero del ferrocarril y el estallido del otro pulso
luminoso coincidirá justo con el extremo trasero del ferrocarril:

El observador estático situado a un lado de las vías del ferrocarril en el marco de referencia S recibe los dos pulsos luminosos al
mismo tiempo, y por lo tanto concluye que ambos eventos fueron simultáneos dentro de su marco de referencia. Por su parte,
en virtud de que la luz tiene una velocidad finita y en virtud de que el pasajero del ferrocarril está en movimiento rápido, uno
de los pulsos luminosos le llega primero que el otro, y el pasajero concluye que los destellos no ocurrieron al mismo tiempo, que
no fueron simultáneos, dada la diferencia de tiempos en que tardan en llegarle los dos rayos de luz a su plataforma móvil, y por
lo tanto para él los eventos no son simultáneos en su marco de referencia S’.
La anterior es una explicación simplista y en cierta forma errónea porque no toma en cuenta para nada los efectos relativistas de
la dilatación del tiempo y la contracción de longitud. La pérdida en la simultaneidad se debe, según la explicación anterior, a la
velocidad finita de la luz. Si no hubiese dilatación del tiempo ni contracción de longitud, si no hubiese relatividad, si existiesen
el tiempo absoluto y el espacio absoluto, la pérdida en la simultaneidad sería meramente una ilusión, una pérdida de
simultaneidad aparente. La situación actual es más complicada que la descrita en el ejemplo anterior precisamente porque hay
efectos relativistas de dilatación del tiempo y contracción de longitud. Efectivamente, hay una diferencia de tiempos en la
llegada de los dos pulsos luminosos al viajero en el ferrocarril, pero también hay una pérdida de simultaneidad real que no es
ocasionada por la velocidad finita de la luz sino por efectos de índole relativista, y es en este caso en donde los diagramas
espacio-tiempo de Minkowski resultan de una ayuda invaluable para entender lo que está sucediendo, permitiéndonos ir más allá
de la anterior explicación simplista. Para entender lo que está sucediendo, es necesario identificar a los dos eventos que
ocurren simultáneamente en el marco de referencia S como E1 y E2 y ver las coordenadas (x’,t’) de cada uno de dichos eventos
en el marco de referencia S’.
Si dos eventos ocurren al mismo tiempo en el mismo lugar se puede afirmar sin lugar a dudas que ambos eventos son
simultáneos. Cuando dos aviones chocan en el aire, no existe marco de referencia alguno en el cual la colisión de ambos aviones
no sea simultánea. Pero entre mayor sea la distancia entre dos eventos que ocurren en distintos lugares tanto mayor será la

converted by W eb2PDFConvert.com
dificultad para los observadores en decidir por cuenta propia el asunto de la simultaneidad.
Considérese el siguiente diagrama espacio-tiempo de Minkowski que ilustra la situación de eventos que son simultáneos en un
marco de referencia S del observador O y que NO son simultáneos en un marco de referencia S’ del observador O’, así como
eventos que son simultáneos en un marco de referencia S’ pero que NO son simultáneos en el marco de referencia S:

En este diagrama, los eventos A y B ocurren simultáneamente a un mismo tiempo en el marco de referencia S en dos lugares
distintos que podemos identificar como x1 y x2. Pero resulta claro que, relativísticamente hablando, los mismos eventos A y B
ocurren en tiempos diferentes en el marco de referencia de S’, los cuales podemos ubicar en los tiempos t’1 y t’2. Los dos
eventos A y B ocurren en tiempos diferentes en lugares diferentes para un observador situado en S’. Aquí lo que es
simultáneo para S no es simultáneo para S’. Por otro lado, los eventos C y D ocurren simultáneamente a un mismo tiempo en el
marco de referencia S’ en dos lugares distintos que podemos identificar como x’3 y x’4. Pero resulta claro que,
relativísticamente hablando, los mismos eventos C y D ocurren en tiempos diferentes en el marco de referencia de S, los cuales
podemos ubicar en los tiempos t3 y t4. Los dos eventos C y D ocurren en tiempos diferentes en lugares diferentes para un
observador situado en S. Aquí lo que es simultáneo para S’ no es simultáneo para S. Y en cuanto a los eventos E y F, tales
eventos no son simultáneos ni para S ni para S’. Todo esto lo podemos ver claramente tal como es en los diagramas espacio-
tiempo de Minkowski. Desafortunadamente, aunque estos gráficos son de gran ayuda, no se prestan para cálculos numéricos de
precisión, para lo cual tendremos que recurrir a una herramienta algebraica conocida como las ecuaciones de transformación de
Lorentz.
A continuación tenemos otro diagrama espacio-tiempo que nos ilustrara la falla de la simultaneidad dentro de la Teoría Especial
de la Relatividad:

En este diagrama espacio-tiempo, para el observador en el marco de referencia S cuyas coordenadas son (x, ct), dos eventos
son simultáneos cuando de acuerdo con su reloj ocurren al mismo tiempo t = t0 en dos lugares diferentes que podemos
identificar simplemente como x1 y x2, marcados por los puntos obscuros que están puestos sobre la línea horizontal que
corresponde a un tiempo t = t0.
Sin embargo, para el otro observador cuyas coordenadas son (x’, ct’), los dos eventos no ocurren simultáneamente, ocurre
primero uno y después ocurre el otro. En su reloj un evento ocurre primero en el tiempo t’1 y el otro evento ocurre después
en el tiempo t’2. Esta anomalía relativista en la simultaneidad es precisamente la que ocasiona los efectos físicos de la
dilatación del tiempo y la contracción de longitud. Todas las dificultades para comprender las aparentes paradojas que están
detrás de la Teoría Especial de la Relatividad surgen de nuestra renuencia a rechazar de manera definitiva el falso concepto de
la simultaneidad absoluta. Si hubiera simultaneidad absoluta, no habría dilatación relativista del tiempo ni contracción de
longitud, aunque ello requeriría neceariamente la aceptación del movimiento absoluto, lo cual a estas alturas ya hemos

converted by W eb2PDFConvert.com
descartado por completo.
PROBLEMA: Mediante un diagrama espacio-tiempo, obtener y explicar el efecto relativista de la contracción de longitud.
Si en lugar de un diagrama espacio-tiempo trazado sobre una hoja hacemos un esfuerzo extra por representar dos coordenadas
de la posición (x,y) y la coordenada del tiempo (ct) apuntando esta última hacia arriba, podemos dibujar algo que se conoce
como superficies de simultaneidad tanto para el observador O en reposo en el marco de referencia S como el observador en
movimiento O’ en el marco de referencia S’:

En el diagrama de la izquierda, tenemos dos eventos representados con puntitos rojos que ocurren al mismo tiempo,
simultáneamente, en el marco de referencia S del observador O, y tenemos otros dos eventos representados con puntitos
amarillos que ocurren en tiempos diferentes en el marco de referencia S’ del observador O’. Pero en el diagrama de la
izquierda, los dos eventos representados con puntitos amarillos sí ocurren al mismo tiempo, simultáneamente, en el marco de
referencia S’ del observador O’, aunque los eventos representados con puntitos rojos y que eran simultáneos en el marco de
referencia S del observador O han dejado de ser simultáneos para el observador O’.
La limitante de que ningún objeto puede viajar a una velocidad mayor que la velocidad de la luz se refleja no tan sólo en un
cuadrante del diagrama espacio-tiempo, se refleja en los cuatro cuadrantes, y el “origen” del observador puede no
necesariamente coincidir con el origen del diagrama espacio-tiempo que está situado en x = 0 y ct = 0, en virtud de que la
fijación de las coordenadas es una mera cuestión de conveniencia:

En el diagrama de arriba, tenemos a un cuerpo que al moverse del punto A al punto B se ha movido en línea recta de x1 = 0.5
metros y x2 = 0.75 metros a partir de un tiempo t1 = 0.5 segundos a un tiempo t1 = 1.75 segundos, siendo por lo tanto su
velocidad igual a v = 0.2 c. Puesto que el avance natural del tiempo es siempre hacia arriba, el cuerpo sólo puede desplazarse
también junto con el tiempo de abajo hacia arriba, en cualquier trayectoria rectilínea cuya pendiente no exceda la velocidad
de la luz, lo cual está marcado por el área punteada. Del punto B hay un conjunto de puntos que marcan el futuro de la posición
del cuerpo en el diagrama espacio-tiempo, y hay también un conjunto de puntos que marcan el pasado de la posición del cuerpo
en el diagrama espacio-tiempo.
No es necesario limitarnos a un diagrama espacio-tiempo de tan sólo dos dimensiones. Podemos agregar una dimensión
adicional, como correspondería a la coordenada y en un plano Cartesiano x-y, para tener lo que parece ser un cono dentro del
cual están circunscritas las trayectorias posibles de un objeto, llamado cono de luz:

converted by W eb2PDFConvert.com
De este modo, podemos tener las siguientes dos trayectorias rectilíneas posibles en el siguiente diagrama espacio-tiempo
tridimensional:

Antes del advenimiento de la Teoría Especial de la Relatividad, podíamos hablar acerca de un “ahora” universal, podíamos
hablar acerca de un “pasado” común universal y acerca de un “futuro” común universal, comunes a todos los que habitamos en
este Universo, puesto que el tiempo absoluto marchaba al unísono por igual en todo el Universo, sin retrasarse ni adelantarse en
ninguno de sus confines:

Pero a partir del advenimiento de la Teoría Especial de la Relatividad, para cada observador hay un “pasado”, un presente y un
“futuro”, delimitados por el cono de luz:

converted by W eb2PDFConvert.com
En este último diagrama, la línea del mundo (de color verde) corresponde a un observador que está en reposo. El punto en el
que se tocan los dos conos de luz que corresponden al “pasado” y al “futuro” del observador viene siendo el “ahora” del
observador. Puesto que ningún objeto puede moverse a una velocidad mayor que la velocidad de la luz, la única forma de poder
llegar al “ahora” desde el pasado (suponiendo una línea del mundo con un movimiento rectilíneo) es haciéndolo dentro del cono
de luz inferior. Y la única forma de poder llegar a cierto punto del diagrama espacio-tiempo en el “futuro” es estando dentro
del cono de luz superior. Las regiones de espacio-tiempo de color gris en el diagrama de arriba son, por lo tanto, regiones
de espacio-tiempo a las que el observador no tiene acceso. Esto fija de manera unívoca todas las relaciones que pueda haber
de causa-efecto entre dos observadores. Los únicos eventos que pueden cambiar el estado de un observador o de un objeto en
su posición actual en el espacio-tiempo deben estar situados en ó dentro del cono de luz que corresponde a su “pasado”. Y los
únicos eventos que pueden ser influenciados por eventos en los que participe un observador o un objeto deben estar situados en
ó dentro del cono de luz que corresponde a su “futuro”. De este modo, en el siguiente diagrama espacio-tiempo:

el evento que tuvo lugar en el punto C pudo muy bien haber cambiado lo que está sucediendo en el “ahora” del observador que
se encuentra en el punto A, y el observador A puede hacer algo para intervenir sobre lo que sucede en el evento que tiene lugar
en el punto B. Pero no puede hacer nada para modificar lo que ocurra en los eventos E y D porque están fuera de su alcance al
no poder establecer una comunicación con ellos debido a la limitante absoluta de la velodidad de la luz. Los puntos E y D están
en regiones prohibidas. Cabe aclarar que la línea en el diagrama que corresponde a la coordenada X no está inclinada como
parece estarlo; es una línea perfectamente horizontal como puede comprobarlo el lector en el monitor de su computadora con
la ayuda de una hoja de papel. Se trata de una ilusión óptica, como lo es la ilusión del concepto de la simultaneidad absoluta que
tanto trabajo le cuesta a muchos estudiantes sepultar.
¿Entonces ya no podemos hablar de un pasado común y un futuro común a todos los habitantes del Universo como se
acostumbraba hacerlo antes? Sí, pero desde la perspectiva relativista. En el siguiente diagrama espacio-tiempo tenemos los
conos de luz que corresponden no a uno sino a dos eventos A y B:

converted by W eb2PDFConvert.com
En este diagrama, el “ahora” del evento A no puede tener efecto alguno sobre el “ahora” del evento B porque ello requeriría
atravesar la zona gris que le está vedada a ambos eventos. Para poder tener efecto alguno sobre el “ahora” de B, el “ahora” del
evento A debería ser capaz de poder transmitir información al “ahora” del evento B a una velocidad mayor que la velocidad de
la luz, lo cual es imposible. Sin embargo, ambos conos de luz tienen dos zonas en común, las zonas en las cuales se traslapan los
dos conos de luz. La zona común en la cual se traslapan los pasados de ambos, de color rosa, es la zona en la cual ambos eventos
pueden intercambiar información que sea capaz de cambiar el “ahora” de cada uno de ellos, es la zona denominada pasado
común. Y la zona común en la cual se traslapan los futuros de ambos, de color azul cielo, es la zona en la cual ambos eventos
podrán intercambiar información en su futuro (a menos de que ocurra un cambio en la línea del mundo de uno de ellos o de
ambos), es la zona denominada futuro común. De cualquier manera, y hablando del Universo como un todo, sí podemos hablar
de un “ahora” universal que sin embargo no es un “ahora” absoluto, porque en la infinitud de las regiones locales de las que está
hecho el Universo habrá variaciones en la marcha del tiempo como las que predice la Teoría de la Relatividad.
En los diagramas espacio-tiempo que hemos visto, sólo hemos considerado objetos que mantienen una trayectoria rectilínea a
velocidad constante sobre la cual se pueden aplicar los principios propios de la Teoría Especial de la Relatividad. Pero también
podemos trazar en un diagrama espacio-tiempo la trayectoria de un objeto que no mantiene una trayectoria rectilínea, que está
cambiando constantemente de dirección. Un diagrama tal tendría un aspecto como el siguiente:

En esta trayectoria tenemos a un viajero que se ha trasladado del punto P al punto Q en un lapso de tiempo Δτ medido en el
reloj con el que va viajando el viajero. Este es precisamente el tipo de movimientos que deben caer bajo el ámbito de una
teoría expandida para analizar movimientos no-rectilíneos o acelerados, una Teoría General de la Relatividad. La trayectoria
de un cuerpo que no avanza en línea recta dentro del cono de luz debe ser tal que la velocidad de la luz nunca debe ser
excedida, o sea que la tangente de la curva nunca debe apartarse más de 45 grados del eje vertical que representa a la
coordenada del tiempo. A continuación tenemos un ejemplo de un recorrido válido y un recorrido inválido:

converted by W eb2PDFConvert.com
Obsérvese del diagrama anterior izquierdo cómo el cono de luz es algo que viaja junto con el observador móvil, el cual puede
definir en cualquier momento cuál será el instante en que su reloj sea ajustado para marcar el “pasado”, el “futuro” y el
“presente” (el instante a partir del cual se empieza a tomar el tiempo para llevar las cuentas de una sucesión de eventos).
Partiendo de sus dos postulados, Einstein dedujo correctamente las nuevas leyes para las transformaciones llevadas a cabo entre
dos marcos de referencia distintos, formalizadas algebraicamente con las ecuaciones de transformación de Lorentz, pero fue
Hermann Minkowski el que demostró que si dejábamos de ver a las tres dimensiones del espacio y a la dimensión del tiempo
como entidades separadas y las uníamos geométricamente en un espacio-tiempo de cuatro dimensiones, entonces las
transformaciones relativistas podían ser vistas como correspondiendo a rotaciones llevadas a cabo en este espacio-tiempo
cuatri-dimensional, lo cual fue una enorme simplificación creando una nueva perspectiva acerca del espacio y del tiempo. Al
principio Einstein no dió mucha importancia a la interpretación geométrica de Minkowski, tomándola meramente como una
formalidad matemática sin significado físico real, pero eventualmente cambió su actitud adoptando el punto de vista cuatri-
dimensional geométrico que después emplearía para la postulación de la Teoría General de la Relatividad.

Armando Martínez Téllez a la/s 22:00


Compartir

‹ Página principal ›
Ver versión web
Datos personales
Armando Martínez Téllez
Ver todo mi perfil

Con la tecnología de Blogger.

converted by W eb2PDFConvert.com

Vous aimerez peut-être aussi