Académique Documents
Professionnel Documents
Culture Documents
máxima verosimilitud:
modelización de la muestra
En este capı́tulo, tras una breve descripción del método de máxima verosimili-
tud, nos ocuparemos de la modelización de nuestra muestra. Ello supondrá definir el
conjunto de parámetros a ajustar y establecer las dependencias entre estos paráme-
91
92 Implementación del método de máxima verosimilitud
De forma algo más detallada podemos resumir los pasos a seguir en la implemen-
tación del método en los siguientes puntos, cada uno de los cuales será ampliamente
desarrollado a lo largo de este capı́tulo:
Inclusión de los errores observacionales. El modelo debe tener en cuenta que los
valores medidos están afectados de un error observacional y por tanto difieren
de los valores reales.
Describimos en esta sección de forma detallada las hipótesis fı́sicas que hemos
adoptado en la construcción del modelo, ası́ como las funciones que permiten su
representación y sus dependencias con los parámetros libres a ajustar.
Figura 4.1: Distribución de magnitudes absolutas para estrellas del catálogo Hipparcos de
tipos espectrales similares, extraı́da de Houk et al. (1997). La lı́nea discontinua muestra
los histogramas observados y la lı́nea continua los mismos una vez corregidos del sesgo
de Malmquist para una muestra limitada en volumen. Estos últimos han sido ajustados
mediante gaussianas
(4.1)
Esta función de distribución ofrece la ventaja de estar caracterizada por sólo dos
parámetros, valor medio y dispersión (Mv , σMv ), que, como veremos en la sección
96 Implementación del método de máxima verosimilitud
Es bien conocido que la distribución espacial de las estrellas del halo en el entorno
solar no responde a un disco como el descrito, sino que siguen una distribución
4.2. Hipótesis fı́sicas 97
A principios del siglo pasado, Schwartzchild introdujo la idea de que las estrellas
de la Galaxia se movı́an de la misma manera que lo hacen las moléculas de un
gas, con la salvedad, observada empı́ricamente, de que la dispersión de la velocidad
dependı́a de la dirección de ésta. Dicha distribución de velocidades recibe el nombre
de distribución de Schwartzchild y matemáticamente se expresa como:
2 2 2
U −U V −V W −W
− 12 − 12 − 12
fV~ (U, V, W ) = e σU
e σV
e σW
(4.3)
Por otro lado hemos considerado que el elipsoide de velocidades apunta exacta-
mente al centro de la Galaxia. Aunque sabemos que en el entorno solar esto no es ası́,
sino que el elipsoide presenta una desviación conocida como desviación del vértice
(lv ), mayor cuanto menor es la edad del grupo de estrellas. Para los tipos espectra-
les FGK el valor medio de lv es relativamente pequeño, entre 2o y 10o (Dehnen y
Binney 1998), por lo que queda justificada su no inclusión.
98 Implementación del método de máxima verosimilitud
Por efecto de la absorción interestelar las estrellas parecen más débiles de lo que
realmente son, lo que lleva a asignarles una magnitud absoluta también más débil
en caso de no ser considerada. La absorción interestelar depende de la cantidad y
caracterı́sticas de la materia absorbente (básicamente el polvo y el gas presente en
el medio interestelar) que se encuentre entre la estrella y el observador. Al ser la
distribución del medio interestelar inhomogénea, la absorción depende de (r, l, b).
Para una muestra limitada en magnitud aparente como la nuestra, la dependencia
con las coordenadas galácticas introduce a su vez una dependencia entre la posición
y la distancia a la cual podemos ver estrellas: vemos estrellas más lejanas en la
dirección del polo galáctico que en la dirección del plano galáctico, ya que en el
primer caso la absorción es menor. Por último, la absorción interestelar modifica los
ı́ndices de color, de forma que las estrellas parecen más rojas de lo que realmente
son.
2
αi r + βi r
si r ≤ Ri
i
Av (r) = Av (Ri ) + γi (r − Ri ) si Ri < r ≤ Rmax
i
Amax si r > Rmax
i = 1, 199
(4.4)
Figura 4.2: Absorción interestelar Av a 150 pc (en magnitudes) en función de las coor-
denadas galácticas según el modelo de Arenou et al. (1992)
presente, lo cual implica concocer sus edades y el ritmo de formación estelar. Por
otro lado obtener una relación entre la masa y el color (V − K) no es en absoluto
sencillo, debido de nuevo, entre otras causas, a factores evolutivos y a que dicha
relación deberı́a depender de la metalicidad.
Tabla 4.1: Logaritmo del número de estrellas de secuencia principal con una magnitud
más brillante que Mv = 16 en 104 pc3 para el entorno solar (Allen 1973)
+ −
Los valores de A, (V −K)T O , σ(V −K) y σ(V −K) serán parámetros libres de nuestro
modelo. El valor de (V − K)T O estará relacionado con la edad de la población y su
metalicidad. Por su parte, el parámetro A, como veremos en la sección 4.5, puede
depender no sólo de la distribución de colores de la población, sinó también del sesgo
observacional de la muestra.
Una vez más no debemos preocuparnos de que f(V −K) no esté normalizada, ya
que la constante de normalización se evaluará conjuntamente para toda la función
de verosimilitud.
700
600
500
400
f(V−K)
300
200
100
0
−1 0 1 2 3 4 5 6
(V−K)0
Figura 4.3: Representación gráfica de los valores de la tabla 4.1 (puntos) y un ajuste
polinómico de los mismos (lı́nea discontinua). Se representa también la aproximación
adoptada para representar la distribución de (V − K) (lı́nea continua) para un conjunto
arbitrario de parámetros (ver texto)
Es por tanto difı́cil conocer a priori cual deberı́a ser dicha distribución, y de hecho
es uno de los objetivos de este trabajo determinarla.
Queda por estudiar y modelizar una posible correlación entre las distribuciones
de (V − K) y [F e/H]. Es de esperar que dicha correlación exista, puesto que tanto
la distribución de color como la de metalicidad dependen en mayor o menor medida
de la edad. Ası́ por ejemplo, una muestra de estrellas con un origen común (y
por consiguiente con una edad y composición quı́mica similares), presentará una
distribución de color con un valor máximo del mismo correpondiente al turn-off,
y una distribución de metalicidades con un valor promedio caracterı́stico de dicha
edad. A esto hay que añadir la correlación originada por un sesgo en la magnitud
aparente, ya que las estrellas menos metálicas son en promedio menos luminosas, y
por tanto en una muestra limitada en magnitud aparente no estarán incluidas las
estrellas frı́as de baja metalicidad. En nuestro modelo, esta correlación entre (V −K)
y [F e/H] quedará implı́citamente incluida al suponer diferentes distribuciones de
(V − K) para cada una de las n componentes de las que consideramos formada la
muestra, puesto que para cada una de ellas el modelo tiene libertad para ajustar
una distribución de metalicidad distinta.
−2
−1
0
1
2
3
Mv 4
5
6
7
8
9
10
0 0.5 1 1.5 2 2.5 3 3.5 4
(V−K)0
Tanto los modelos de evolución estelar como los diagramas HR del capı́tulo
anterior nos indican que Φ(M v) debe depender de (V − K)0 y de [F e/H]. En el
primer caso hemos adoptado un modelo compuesto por varios segmentos lineales
(figura 4.4), tanto para M v , como para σMv :
A1 (V − K) + B1 si (V − K)01 < (V − K)0 ≤ (V − K)02
M v ((V − K)0 ) = A2 (V − K) + B2 si (V − K)02 < (V − K)0 ≤ (V − K)03
...
(4.7)
C1 (V − K) + D1 si (V − K)01 < (V − K)0 ≤ (V − K)02
σMv (V − K) = C2 (V − K) + D2 si (V − K)02 < (V − K)0 ≤ (V − K)03
...
(4.8)
radial. Existen varios trabajos realizados al respecto (ver por ejemplo Carney et
al. (1996), Flynn y Morell (1997), Fuchs et al. (1999) o Dehnen y Binney (1998),
los tres últimos basados en datos del catálogo Hipparcos) que estudian la relación
de la velocidad espacial y su dispersión con la metalicidad y/o la temperatura.
Sin embargo, como Binney et al. (1997) han demostrado, el conjunto de estrellas
con determinación de la velocidad radial forma una submuestra cinemáticamente
sesgada, debido a que los programas de observación de velocidades radiales tienden
a priorizar estrellas de alto movimiento propio, por lo que debe ponerse una especial
atención al confeccionar la muestra y analizar los datos.
Una rápida inspección de la figura nos muestra que mientras que las velocidades
medias U y W son prácticamente independientes de la metalicidad, V es altamente
dependiente de la misma. Vemos que las estrellas con baja metalicidad tienden a
tener una velocidad de rotación en torno al centro de la Galaxia menor que las
estrellas más metálicas. Este efecto es un reflejo de lo que se conoce como corriente
asimétrica, según el cual la velocidad de rotación promedio de una población en torno
al centro de la Galaxia tiende a disminuir a medida que aumenta la dispersión de
velocidades dentro de la población (ver más abajo la discusión sobre la dependencia
4.3. Dependencias de Φ(Mv ), fe (r, l, b) y fV~ (U, V, W ) 107
300
Numero de estrellas
U
200
100
0
300
Numero de estrellas
V
200
100
0
300
Numero de estrellas
W
200
100
0
−200 −150 −100 −50 0 50 100 150 200
Velocidad (km/s)
Figura 4.5: Histograma de las tres componentes de la velocidad espacial para las estrellas
de la muestra con medidas de la velocidad radial (20 % del total). Obsérvese la forma
gaussiana de las componentes U y W y la extensión hacia velocidades negativas de
la componente V , debido a la corriente asimétrica. Las velocidades estás expresadas
respecto del Local Standard of Rest (LSR)
Si bien no está aún del todo explicado desde un punto de vista teórico, en el caso
del disco delgado el calentamiento puede obedecer a varios mecanismos: interacción
de las estrellas con nubes moleculares y brazos espirales, perturbaciones debidas a
108 Implementación del método de máxima verosimilitud
100
50
U (km/s)
−50
−100
50
−50
−100
V (km/s)
−150
−200
−250
−300
−350
100
50
W (mk/s)
−50
−100
−3 −2.5 −2 −1.5 −1 −0.5 0 0.5 1
[Fe/H]
Figura 4.6: Velocidades medias referidas al LSR en función de [F e/H]. Los intervalos
de metalicidad se han escogido de tal forma que el número de estrellas en cada uno
sea constante. Las barras de error horizontales representan la dispersión [F e/H] dentro
de cada intervalo, mientras que las verticales representan el error observacional en las
componentes de la velocidad promediadas, calculado a partir de los errores individuales
en los movimientos propios, velocidades radiales y distancias
agujeros negros masivos, ... Cada uno de estos encuentros aumenta la dispersión de
velocidades, de manera que las estrellas más viejas, al haber sufrido en promedio
más encuentros que las estrellas jóvenes, tienen dispersiones de la velocidad más
altas.
280
240
200
σU(km/s)
160
120
80
40
0
200
160
σV(km/s)
120
80
40
120
100
σW(km/s)
80
60
40
20
0
−3 −2.5 −2 −1.5 −1 −0.5 0 0.5 1
[Fe/H]
Las figuras 4.8 y 4.9 muestran las componentes de la velocidad y sus dispersiones
en función de (V − K)0 . La primera de las figuras muestra una clara dependencia
de la media de la componente V de la velocidad con (V − K), en especial en el
rango 1.2 < (V − K) < 1.6. Por debajo de este intervalo el valor promedio de V es
cero, mientras que por encima se estabiliza alrededor de un valor de -30 km/s. Este
comportamiento es lo que se conoce como discontinuidad de Parenago (Parenago
1950).
Para entender este comportamiento debemos pensar que a medida que avanza-
mos por la secuencia principal hacia las estrellas más frı́as encontramos progresiva-
mente estrellas formadas en épocas más dispares. En la zona de las estrellas más
calientes sólo las estrellas jóvenes permanecen aún en la secuencia principal, por lo
que la dispersión de edades es pequeña. Al desplazarnos hacia tipos espectrales más
frı́os, el rango de edades va aumentando progresivamente, hasta alcanzar el máxi-
110 Implementación del método de máxima verosimilitud
20
10
U (km/s)
0
−10
−20
20
10
−10
V (km/s)
−20
−30
−40
−50
−60
−70
20
10
W (mk/s)
−10
−20
Figura 4.8: Velocidades medias referidas al LSR en función de (V − K)0 . Los intervalos
y barras de error se han calculado análogamente a la figura 4.6
1
Utilizaremos la notación x0 para asignar los valores observados de las variables.
112 Implementación del método de máxima verosimilitud
60
σU (km/s)
40
20
60
σV (km/s)
40
20
60
σW (mk/s)
40
20
0
0 0.5 1 1.5 2 2.5 3 3.5
(V−K)0
Figura 4.9: Dispersión de las tres componentes de la velocidad referida al LSR en función
de (V − K)0 . Los intervalos y barras de error se han calculado análogamente a la figura
4.6
mencionadas funciones gaussianas. Ası́ pues, en nuestro caso el error total se puede
expresar como:
2 2 2 2
µ0l −µl µ0b −µb
0 −v
2 vr [F e/H]0 −[F e/H]
π 0 −π − 12 − 12 − 12 r
− 12
− 12 µ µ vr [F e/H]
Σ = e π
e l e b e e
0 0 0
δ(m − m)δ(l − l)δ(b − b)δ(C10 − C1 ) (4.9)
20
0
−20
V (km/s)
−40
−60
−80 [Fe/H] < −0.31
−100
20
0
−20
V (km/s)
−40
−60
−80 −0.31 < [Fe/H] < −0.12
−100
20
0
−20
V (km/s)
−40
−60
−80 −0.12 < [Fe/H] < −0.04
−100
20
0
−20
V (km/s)
−40
−60
−80 [Fe/H] > −0.04
−100
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3
(V−K)0
Es evidente que nuestra muestra no está compuesta por todas las estrellas que
forman la población base, siendo posible incluso que no sea representativa de la
misma. Al construir la muestra se han ido seleccionando las estrellas de acuerdo
a diversos criterios, hasta configurar la muestra final. Estos criterios, o efectos de
selección, son extremadamente difı́ciles de modelizar, ya que suelen estar originados
por diversas causas no siempre conocidas (limitaciones observacionales, utilización
de uno u otro catálogo, mezcla de catálogos, etc).
Los sesgos observacionales introducidos en una muestra por los efectos de selec-
ción pueden ser de diferentes tipos:
sesgos cinemáticos: las estrellas con un movimiento propio elevado son inclui-
das con mayor frecuencia en los programas de determinación de velocidades
radiales. Esto provoca que una muestra con velocidades radiales se encuentre
sesgada hacia estos movimientos propios elevados, afectando a la determina-
ción final de la cinemática de la población.
Hay que insistir en que este efecto estará siempre presente, puesto que es
intrı́nseco de la paralaje e independiente de cualquier otro efecto de selección.
otros sesgos, como los provocados por la selección de un determinado tipo es-
pectral, o rango de metalicidades. En general, el efecto de estos sesgos depen-
derá de como se relacionen estos parámetros con las variables que caracterizan
la población.
116 Implementación del método de máxima verosimilitud
En el caso que nos ocupa, hemos considerado que nuestra muestra está libre
de sesgos en posición, ya que en primera aproximación cubre todo el cielo unifor-
memente. Respecto al sesgo cinemático, al no haber exigido medidas de velocidad
radial es de suponer que nuestra muestra no estará excesivamente afectada por el
sesgo cinemático asociado a dichas medidas. Sin embargo sı́ que lo estará por ser
una submuestra del catálogo Hipparcos. El hecho de que la selección de las estrellas
Hipparcos no obedezca exclusivamente a criterios observacionales, sinó que muchas
de estrellas fueron incluidas ad hoc por su interés cientı́fico, hace extremadamente
difı́cil modelar este sesgo. En este sentido se realizaron varias pruebas con funciones
de selección que intentaban favorecer la presencia de estrellas de alto movimiento
propio, pero ninguna de ellas dió resultados satisfactorios. Queda por tanto pen-
diente para trabajos futuros la modelización del sesgo cinemático.
Los otros sesgos son corregidos de forma natural en el ajuste por máxima verosi-
militud, siempre que las funciones de selección y los errores observacionales estén
bien modelizados.
Para tener en cuenta estos sesgos debemos definir una función de selección S(x)
que dé cuenta de la probabilidad de que una estrella con un valor x de una cierta
variable sea incluida en la muestra. En nuestro caso hemos tenido cuenta los efectos
de selección en la magnitud aparente mc y en el color (V − K), de forma que la
función de selección final es el producto de las funciones para cada variable:
S(m0 , (V − K)0 ) = Sm (m0 )S(V −K) ((V − K)0 )
(4.11)
una estrella pertenezca a la muestra disminuya hasta hacerse nula para estrellas con
magnitud aparente superior a una cierta magnitud lı́mite. El caso más sencillo se
da cuando mlim = mc . Es decir, la muestra es completa hasta m0 = mc y no existen
estrellas con magnitudes más débiles.
En el caso más general en que mlim > mc , como es el que nos ocupa, debemos
elegir una función de selección S(m0 ) que permita reproducir la distribución de
magnitudes aparentes. Para ello, observemos la figura 4.11. En lı́nea discontinua se
muestra la distribución F (m0 ) de la magnitud aparente de una muestra simulada
suponiendo que ha sido extraı́da de una única población base con una relación
Mv − (V − K) lineal que ajusta la dada por Schmidt-Kaler (1982), adoptando una
distribución espacial de tipo disco exponencial con Zh = 300 pc y la distribución de
(V − K) de la tabla 4.1. El histograma corresponde a la distribución de magnitud
aparente de las estrellas del catálogo Hipparcos de secuencia principal seleccionadas
según se ha descrito en la sección 2.1.3. De la figura 4.11 deducimos que existe
una magnitud mc hasta la cual la probabilidad de que una estrella pertenezca a
la muestra es independiente de su magnitud. Esta probabilidad será igual a 1 si la
118 Implementación del método de máxima verosimilitud
4000
mc mlim
3000
Numero de estrellas
2000
1000
0
2 4 6 8 10 12 14
m’
Definimos Sm (m0 ) suponiendo que entre mc y mlim una estrella tiene una proba-
bilidad de ser incluida en la muestra dada por una función gaussiana centrada en mc
y con una dispersión σmc tal que para m0 = mlim la probabilidad sea prácticamente
nula:
1 si m0 ≤ mc
2
m0 −mc
Sm (m0 ) = e
− 21 σmc
si mc < m0 < mlim (4.12)
si m0 ≥ mlim
0
en cuenta que se trata únicamente de probar que la función Sm (m0 ) del tipo descrito
en (4.12) es capaz de reproducir el histograma de una muestra sesgada en magnitud
aparente, de forma similar a nuestra muestra.
Por último supondremos que el sesgo en magnitud aparente, y por tanto mc , pue-
de depender de la metalicidad. Con ello se quiere reflejar el hecho de que la muestra
podrı́a tener un cierto sesgo hacia estrellas de una metalicidad dada. Por ejemplo,
en el catálogo Hipparcos se favoreció la presencia de estrellas poco metálicas, de la
misma manera que lo hacen muchas las campañas de fotometrı́a Strömgren o de es-
pectrocopı́a. Si esto no es ası́, el propio ajuste nos dará valores de mc independientes
de la metalicidad.
Ası́ pués, la propia expresión 4.5 contiene suficientes parámetros para modelizar
un posible sesgo observacional en el color (V − K).