4.implementacion Metodo PDF

4 Implementación del método de
máxima verosimilitud:
modelización de la muestra
Gran parte de las investigaciones en el campo de la astrofı́sica se enfrentan al

problema de obtener la mayor información posible de un conjunto de datos, por lo
general incompletos y/o sesgados, referidos únicamente a una muestra extraı́da de
una población base más amplia que es realmente el objeto de estudio. Una manera
de abordar el problema es mediante métodos de análisis estadı́stico, que consideran
el conjunto de datos como una realización de una variable aleatoria. Según el méto-
do de analı́sis empleado necesitaremos introducir más o menos hipótesis sobre la
distribución de dicha variable aleatoria, teniendo en cuenta que, debido a los sesgos,
dicha distribución no suele ser la misma que la distribución de la población base.
Uno de estos métodos es el ajuste por máxima verosimilitud, el cual permite

tener en cuenta simultáneamente toda la información disponible sobre cada estrella
(en nuestro caso paralaje, movimiento propio, velocidad radial, fotometrı́a, ...) y sus
correspondientes errores. Por tratarse de un método paramétrico debemos adoptar
a priori un modelo con una serie de parámetros libres que nos permitirán ajustar
dicho modelo a nuestras observaciones. El primer paso para la aplicación de este
método es pues la modelización de la muestra de trabajo, tanto desde el punto de
vista de los modelos fı́sicos que describen la población base, como de los procesos
de selección llevados a cabo en la elaboración de la muestra.
En este capı́tulo, tras una breve descripción del método de máxima verosimili-
tud, nos ocuparemos de la modelización de nuestra muestra. Ello supondrá definir el
conjunto de parámetros a ajustar y establecer las dependencias entre estos paráme-
91
92 Implementación del método de máxima verosimilitud
tros y las variables consideradas (en nuestro caso temperatura y metalicidad). La

deducción explı́cita de la función de verosimilitud, con el correspondiente desarrollo
matemático asociado, puede encontrarse en el apéndice A.
4.1. Consideraciones generales
La aplicación de métodos de máxima verosimilitud a problemas astronómicos

data de mediados del siglo pasado, cuando Rigal (1958) propuso su utilización en
la obtención de paralajes estadı́sticas. Desde entonces los modelos utilizados han
ido ganando en complejidad a medida que mejoraban los métodos de resolución de
las ecuaciones implicadas y el poder de cálculo de los ordenadores. Ası́, Luri (1995)
propone una implementación que utiliza toda la información astrométrica disponible
(y no sólo la paralaje), para obtener determinaciones de la magnitud absoluta. Esta
implementación introduce además el efecto de los errores observacionales y de los
procesos de selección. En este trabajo hemos partido de la implementación de Luri
(1995), adaptando las funciones de selección y distribución (en especial la del color
(V − K)) al problema particular que nos ocupa.
Como todo método paramétrico, el método de máxima verosimilitud precisa

de un modelo que describa el conjunto de datos de la muestra de trabajo, el cual
debe describir tanto la población base de la que ha sido extraı́da la muestra como
los procesos de selección que han dado lugar a dicha muestra. En el caso de su
implementación para el estudio de la luminosidad y la cinemática de las estrellas F,G
y K de secuencia principal la población base queda caracterizada por su distribución
espacial y las funciones de distribución de magnitud absoluta, velocidad espacial,
color (temperatura) y metalicidad. Además necesitaremos una forma explı́cita para
las funciones de selección, dependientes de variables observadas como la magnitud
aparente o el color. Es posible también establecer relaciones entre las diferentes
variables, las cuales deben ser también modelizadas. Estas relaciones permitirı́an
por ejemplo obtener una calibración de la magnitud absoluta en función de una o
más variables (color, metalicidad, ...).
Los parámetros libres del modelo serán ajustados utilizando el estimador de

máxima verosimilitud, el cual nos dará el conjunto de parámetros que mejor repro-
ducen la muestra. Estos parámetros libres deben de ser escogidos de tal manera que
permitan obtener la máxima información sobre las propiedades astrofı́sicas de la po-
4.1. Consideraciones generales 93
blación, como podrı́an ser el valor de su velocidad espacial, metalicidad promedio,

calibración de la magnitud absoluta en función del color, etc.
De forma algo más detallada podemos resumir los pasos a seguir en la implemen-
tación del método en los siguientes puntos, cada uno de los cuales será ampliamente
desarrollado a lo largo de este capı́tulo:
Adopción y parametrización de modelos que describan la función de distribu-

ción de la magnitud absoluta, distribución espacial y distribución de velocida-
des de la población estelar objeto de estudio. Estas funciones de distribución
dependerán de un indicador de temperatura y/o un indicador de metalicidad,
bien sea de forma explı́cita, bien sea de forma implı́cita al separar nuestra
muestra en grupos con diferente metalicidad promedio (ver capı́tulo 5).
A su vez, el modelo deberá incluir una función de distribución de los paráme-
tros de temperatura y metalicidad. El desarrollo del método y formulación de
las ecuaciones es igualmente válido para cualquier otro par de parámetros C1
y C2 de los cuales quisieramos hacer depender las calibraciones.
La absorción interestelar también debe ser modelizada, puesto que nuestro
observable es la magnitud aparente y no la absoluta. Para ello utilizaremos un
modelo tridimensional de absorción interestelar galáctica.
Análisis de las dependencias de la función de distribución de la magnitud

absoluta, distribución espacial y distribución de velocidades con los parámetros
C1 y C2 . También se deben estudiar, y en su caso modelizar, las posibles
correlaciones entre C1 y C2 .
Inclusión de los errores observacionales. El modelo debe tener en cuenta que los
valores medidos están afectados de un error observacional y por tanto difieren
de los valores reales.
Análisis y modelización de los diferentes sesgos presentes en el proceso de

construcción de la muestra de trabajo. El objetivo de este punto es tener en
cuenta que dicha muestra no está descrita por las mismas distribuciones de
probabilidad que la población base de la cual ha sido extraı́da.
Obtención de la forma explı́cita de la función de verosimilitud, planteamiento

de las ecuaciones a maximizar y estudio de los métodos matemáticos necesarios
para ello (apéndice A).
4.2. Hipótesis fı́sicas
Los parámetros libres del modelo, obtenidos a través de máxima verosimilitud

aplicada a las estrellas de la muestra, permitirán caracterizar la población base que
mejor representa nuestra muestra. Una adecuada elección del modelo a ajustar es
por tanto de suma importancia para la obtención de unos resultados correctos.
Describimos en esta sección de forma detallada las hipótesis fı́sicas que hemos
adoptado en la construcción del modelo, ası́ como las funciones que permiten su
representación y sus dependencias con los parámetros libres a ajustar.
4.2.1. Función de distribución de la magnitud absoluta
La función de distribución de la magnitud absoluta Φ(Mv ) proporciona la fre-

cuencia relativa de estrellas de una determinada magnitud absoluta y puede ser
definida para un grupo cualquiera de estrellas (el entorno solar, un tipo espectral
determinado, la totalidad de estrellas de la Galaxia, etc).
Una manera de determinar esta función de distribución consiste en contar las

estrellas en una determinada área del cielo que poseen una magnitud aparente entre
(m, m + dm). Para poder obtener la función de distribución de Mv a partir de estos
conteos deberemos tener un conocimiento previo de la distribución espacial de esas
estrellas y tener presente que, debido a nuestras limitaciones observacionales, sólo
podemos realizar el contaje hasta una cierta magnitud lı́mite, lo cual introduce un
sesgo conocido como sesgo de Malmquist (ver sección 4.5). Dada la complicación de
este procedimiento, en muchas aplicaciones prácticas se suelen adoptar expresiones
de Φ(Mv ) sencillas, en especial cuando se trata de describir poblaciones formadas
por estrellas de un único tipo espectral y/o clase de luminosidad.
Entre los trabajos más relevantes sobre la distribución de magnitudes absolutas

de un amplio número de estrellas se encuentra el de Houk et al. (1997). Utilizando
una muestra de estrellas de clase V de tipos espectrales entre B y K incluidas en
el catálogo Hipparcos y con distancias inferiores a los 100 pc, Houk et al. cons-
truyen los histogramas de Mv para cada tipo espectral (figura 4.1), corrigiendo el
sesgo de Malmquist. Los valores medios de Mv para cada tipo espectral se pue-
den reproducir ajustando una distribución de magnitudes absolutas gaussiana a los
4.2. Hipótesis fı́sicas 95
Figura 4.1: Distribución de magnitudes absolutas para estrellas del catálogo Hipparcos de
tipos espectrales similares, extraı́da de Houk et al. (1997). La lı́nea discontinua muestra
los histogramas observados y la lı́nea continua los mismos una vez corregidos del sesgo
de Malmquist para una muestra limitada en volumen. Estos últimos han sido ajustados
mediante gaussianas
diferentes histogramas, si bien las dispersiones se desvı́an ligeramente del comporta-

miento gaussiano, mostrando los histogramas una cola más pronunciada hacia altas
luminosidades, principalmente ocasionada por estrellas binarias no resueltas.
La función de distribución de Mv que hemos adoptado para describir nuestra

población base es por consiguiente una gaussiana:
2
Mv −M v
− 12 σM
Φ(Mv ) = e v
(4.1)
Esta función de distribución ofrece la ventaja de estar caracterizada por sólo dos
parámetros, valor medio y dispersión (Mv , σMv ), que, como veremos en la sección
4.3.1, dependerán en nuestro caso de la temperatura y de la metalicidad.
Modelizar Φ(Mv ) de una forma más compleja añadirı́a nuevos parámetros y

posiblemente no mejorarı́a sustancialmente la calibración de la magnitud absoluta.
Hemos de tener presente sin embargo que la σMv resultante podrı́a estar ligeramente
subestimada, debido a la mencionada asimetrı́a del histograma.
En la expresión 4.1 no incluimos el factor de normalización, ya que éste será cal-

culado conjuntamente para la totalidad de la función de verosimilitud.
4.2.2. Distribución espacial
Al igual que Luri (1995), hemos representado la distribución espacial de las

estrellas de nuestra muestra mediante un disco, homogéneo en la dirección (x, y) y
con un decaimiento de la densidad a medida que nos alejamos perpendicularmente
de él (disco exponencial):

|r sin b + Z | 2
fe (r, l, b) = exp r cos b
Zh
(4.2)
El término r2 cos b es el jacobiano de la transformación de coordenadas rectangulares
(X, Y, Z) a galácticas (r, l, b), Z es la altura del Sol sobre el plano galáctico y Zh es
la altura caracterı́stica sobre dicho plano de la población de estrellas considerada.
Evidentemente éste es un perfil de densidad altamente simplificado, que omite

las irregularidades del plano galáctico (estructura espiral, cinturón de Gould, inho-
mogeneidades locales...) y el decaimiento exponencial en función de la distancia al
centro galáctico. La estructura espiral o el cinturón de Gould son extremadamente
difı́ciles de incluir en la función de distribución espacial. Estas irregularidades se
ponen especialmente de manifiesto al estudiar cierto tipo de objetos, en particu-
lar estrellas jóvenes (tipos espectrales OBA), pero puede ser perfectamente obviado
para los tipos espectrales objeto de este trabajo. Por su parte el decaimiento expo-
nencial en el perfil del plano galáctico sólo es importante si consideramos grandes
áreas del disco. Dentro de una esfera de 400 pc alrededor del Sol, como la ocupada
por nuestra muestra, su efecto puede ser excluido del modelo.
Es bien conocido que la distribución espacial de las estrellas del halo en el entorno
solar no responde a un disco como el descrito, sino que siguen una distribución
prácticamente uniforme. Podemos obtener este tipo de distribución a partir de 4.2

asumiendo un valor elevado de Zh , puesto que entonces, para distancias pequeñas,
fe (r, l, b) dependerá poco de la altura sobre el plano galáctico.
Z podrı́a considerarse como un parámetro libre, obteniendo ası́ una determina-

ción de la posición del Sol respecto al plano de la Galaxia. Sin embargo, al ser la
muestra de trabajo tan cercana al Sol, su valor no quedarı́a bien determinado, por
lo cual hemos optado por fijarlo a +16 pc (Binney y Merrifield 1998).
4.2.3. Función de distribución de la velocidad
A principios del siglo pasado, Schwartzchild introdujo la idea de que las estrellas
de la Galaxia se movı́an de la misma manera que lo hacen las moléculas de un
gas, con la salvedad, observada empı́ricamente, de que la dispersión de la velocidad
dependı́a de la dirección de ésta. Dicha distribución de velocidades recibe el nombre
de distribución de Schwartzchild y matemáticamente se expresa como:
2 2 2
U −U V −V W −W
− 12 − 12 − 12
fV~ (U, V, W ) = e σU
e σV
e σW
(4.3)
Análogamente al caso de la magnitud absoluta hemos omitido el factor de nor-

malización.
Como hemos comentado, todas las estrellas de la muestra pertenecen al entorno

solar. Por este motivo no hemos tenido en cuenta el efecto de la rotación diferen-
cial galáctica en la distribución de velocidades, ya que es poco importante en un
volumen tan reducido. Simulaciones hechas por Luri (1995), adoptando el modelo
de rotación de Oort-Lindblad, muestran que la no inclusión de la rotación galáctica
afecta especialmente a la determinación de las dispersiones (σU , σV ) y a la velocidad
V . Este efecto sin embargo sólo es importante para muestras de estrellas que cubran
un gran volumen.
Por otro lado hemos considerado que el elipsoide de velocidades apunta exacta-
mente al centro de la Galaxia. Aunque sabemos que en el entorno solar esto no es ası́,
sino que el elipsoide presenta una desviación conocida como desviación del vértice
(lv ), mayor cuanto menor es la edad del grupo de estrellas. Para los tipos espectra-
les FGK el valor medio de lv es relativamente pequeño, entre 2o y 10o (Dehnen y
Binney 1998), por lo que queda justificada su no inclusión.
4.2.4. Absorción interestelar
Por efecto de la absorción interestelar las estrellas parecen más débiles de lo que
realmente son, lo que lleva a asignarles una magnitud absoluta también más débil
en caso de no ser considerada. La absorción interestelar depende de la cantidad y
caracterı́sticas de la materia absorbente (básicamente el polvo y el gas presente en
el medio interestelar) que se encuentre entre la estrella y el observador. Al ser la
distribución del medio interestelar inhomogénea, la absorción depende de (r, l, b).
Para una muestra limitada en magnitud aparente como la nuestra, la dependencia
con las coordenadas galácticas introduce a su vez una dependencia entre la posición
y la distancia a la cual podemos ver estrellas: vemos estrellas más lejanas en la
dirección del polo galáctico que en la dirección del plano galáctico, ya que en el
primer caso la absorción es menor. Por último, la absorción interestelar modifica los
ı́ndices de color, de forma que las estrellas parecen más rojas de lo que realmente
son.
En este trabajo hemos modelizado la absorción interestelar siguiendo el trabajo

de Arenou et al. (1992). En este modelo el cielo se dividide en 199 regiones, para
cada una de las cuales se da una expresión polinómica de la absorción en el visible
en función de la distancia. Los coeficientes de los polinomios fueron obtenidos a
partir de los colores fotométricos Strömgren de estrellas situadas en cada una de las
199 regiones. Se asume además que a partir de una distancia Rmax no existe más
material absorbente. Ası́:

2
 αi r + βi r
 si r ≤ Ri
i
Av (r) = Av (Ri ) + γi (r − Ri ) si Ri < r ≤ Rmax

 i
Amax si r > Rmax
i = 1, 199
(4.4)
La figura 4.2 muestra la absorción en los diferentes sectores a una distancia de

150 pc.
Figura 4.2: Absorción interestelar Av a 150 pc (en magnitudes) en función de las coor-
denadas galácticas según el modelo de Arenou et al. (1992)
4.2.5. Función de distribución de (V − K)
Dentro de la secuencia principal, la distribución f(V −K) (número de estrellas con

un valor de (V − K) entre (V − K) y (V − K) + d(V − K)) está estrechamente
relacionada con la función de masa, es decir, con el número de estrellas con una
masa entre M y M + dM. Para pasar de una a otra deberı́amos conocer el color
(V − K) para cada una de las masas (y estado evolutivo). Podrı́amos pensar, por
tanto, en derivar f(V −K) de una manera teórica, partiendo de una función de masa
determinada. Sin embargo existen dos complicaciones que hacen este proceso poco
recomendable. En primer lugar, mientras que la función inicial de masa (IM F ),
función de masa en el momento de la formación estelar, está más o menos bien
determinada (ver por ejemplo Scalo 1985), para conocer la función de masa actual
deberı́amos hacer evolucionar el conjunto de estrellas desde su nacimiento hasta el
presente, lo cual implica concocer sus edades y el ritmo de formación estelar. Por
otro lado obtener una relación entre la masa y el color (V − K) no es en absoluto
sencillo, debido de nuevo, entre otras causas, a factores evolutivos y a que dicha
relación deberı́a depender de la metalicidad.
La alternativa es recurrir a determinaciones empı́ricas, basadas en recuentos

estelares en el entorno solar, de la densidad de estrellas en función de la temperatura
o el color. Ası́ por ejemplo, Allen (1973) presenta una tabla que reproducimos en
nuestra tabla 4.1 donde se da la densidad observada de estrellas de la secuencia
principal más brillantes que Mv = 16 en el entorno solar, según el tipo espectral.
Asociando a cada tipo espectral el valor medio de (V − K), según la tabla 2.4 del
capı́tulo 2, hemos obtenido la relación mostrada en la figura 4.3. Está relación se
debe considerar como el resultado de la superposición de las distribuciones de las
diferentes poblaciones estelares en el entorno solar.
Sin embargo, si deseamos representar un grupo de estrellas de una edad o rango

de edades determinado, como es nuestro caso, la relación de la tabla 4.1 debe de
ser modificada. Es de esperar que las estrellas del grupo más frı́as que el valor
correspondiente al turn-off de las estrellas más viejas de la Galaxia no hayan visto
prácticamente modificada su distribución de (V − K) por factores evolutivos. Para
estas estrellas podremos adoptar la relación de la tabla 4.1. No ocurre lo mismo para
las estrellas más masivas, las cuales se habrán separado en mayor o menor medida de
su posición inicial en la secuencia principal. Como consecuencia de la evolución, la
distribución de (V − K) de un grupo de estrellas de una edad determinada presenta
un máximo local alrededor del color del turn-off correspondiente a esta edad. Por
otro lado, existe un (V − K) de corte a partir del cual, y para dicha edad, no
encontraremos estrellas más calientes, puesto que éstas habrán abandonado ya la
secuencia principal.
Una aproximación que tiene en cuenta lo dicho anteriormente consiste en suponer

la distribución de (V − K) formada por dos componentes. La primera de ellas es
un ajuste polinómico de los datos de la tabla 4.1. La segunda componente es una
distribución gaussiana asimétrica centrada en el color correspondiente al turn-off de
la población y superpuesta a la anterior.
Mientras que la primera componente domina la distribución de las estrellas frı́as,

la segunda permite modelizar el máximo de la distribución alrededor del turn-off
debido a efectos evolutivos.
Tabla 4.1: Logaritmo del número de estrellas de secuencia principal con una magnitud
más brillante que Mv = 16 en 104 pc3 para el entorno solar (Allen 1973)
Tipo Espectral log(N )

O -3.6
B 0.0
A 0.7
F 1.4
G 1.8
K 2.0
M 2.8
La forma analı́tica de f(V −K) será por tanto:

 2
(V −K)−(V −K)T O
− 21  +/−

σ
f(V −K) = P(V − K) + Ae (V −K)
(4.5)
con P(V − K) un polinomio de tercer grado. Este polinomio suaviza la distribución

de la tabla 4.1 (figura 4.3), y por tanto disminuye los efectos de la evolución en la
distribución de (V − K) de las estrellas del entorno solar.
+ −
Los valores de A, (V −K)T O , σ(V −K) y σ(V −K) serán parámetros libres de nuestro
modelo. El valor de (V − K)T O estará relacionado con la edad de la población y su
metalicidad. Por su parte, el parámetro A, como veremos en la sección 4.5, puede
depender no sólo de la distribución de colores de la población, sinó también del sesgo
observacional de la muestra.
Una vez más no debemos preocuparnos de que f(V −K) no esté normalizada, ya
que la constante de normalización se evaluará conjuntamente para toda la función
de verosimilitud.
4.2.6. Función de distribución de [F e/H]
La distribución de metalicidad de las estrellas de la Galaxia está ı́ntimamente

relacionada con la evolución quı́mica de la misma, que a su vez depende de los
posibles episodios de formación estelar que han tenido lugar a lo largo de su historia.
700
600
500
400
f(V−K)
300
200
100
0
−1 0 1 2 3 4 5 6
(V−K)0
Figura 4.3: Representación gráfica de los valores de la tabla 4.1 (puntos) y un ajuste
polinómico de los mismos (lı́nea discontinua). Se representa también la aproximación
adoptada para representar la distribución de (V − K) (lı́nea continua) para un conjunto
arbitrario de parámetros (ver texto)
Es por tanto difı́cil conocer a priori cual deberı́a ser dicha distribución, y de hecho
es uno de los objetivos de este trabajo determinarla.
Sin embargo podemos hacer una serie de suposiciones al respecto. Ya hemos

comentado en la introducción que una de las caracterı́sticas que permiten diferenciar
las distintas poblaciones estelares de la Galaxia es precisamente su metalicidad. Es
sabido que la composición de una estrella depende de la composición del medio
interestelar en el cual se formó, el cual se ha ido enriqueciendo paulatinamente en
metales, provinientes de explosiones de supernovas. Ası́ las estrellas de población II,
más viejas, se formaron en un medio pobre en metales, mientras que las de población
I lo hicieron posteriormente en un medio más enriquecido. Se sabe también (ver por
ejemplo Freeman y Bland-Hawthorn 2002) que no todas las estrellas formadas en
una misma época poseen el mismo valor de [F e/H], ya que se pueden haber formado
en regiones de la Galaxia donde el ritmo de enriquecimiento ha sido diferente. Por
último, no todas las poblaciones estelares están presentes en igual número en el
entorno solar.
Es conveniente pues considerar la población base a la que pertenece nuestra

4.3. Dependencias de Φ(Mv ), fe (r, l, b) y fV~ (U, V, W ) 103
muestra como la suma de n componentes estelares. Asumiremos que cada una de

estas componentes tiene una distribución gaussiana de metalicidad, de valor medio
[F e/H] y dispersión σ[F e/H] , diferentes. La distribución final para cada componente
es por tanto:
2
[F e/H]−[F e/H]
− 12 σ[F e/H]
f[F e/H] = e (4.6)
Queda por estudiar y modelizar una posible correlación entre las distribuciones
de (V − K) y [F e/H]. Es de esperar que dicha correlación exista, puesto que tanto
la distribución de color como la de metalicidad dependen en mayor o menor medida
de la edad. Ası́ por ejemplo, una muestra de estrellas con un origen común (y
por consiguiente con una edad y composición quı́mica similares), presentará una
distribución de color con un valor máximo del mismo correpondiente al turn-off,
y una distribución de metalicidades con un valor promedio caracterı́stico de dicha
edad. A esto hay que añadir la correlación originada por un sesgo en la magnitud
aparente, ya que las estrellas menos metálicas son en promedio menos luminosas, y
por tanto en una muestra limitada en magnitud aparente no estarán incluidas las
estrellas frı́as de baja metalicidad. En nuestro modelo, esta correlación entre (V −K)
y [F e/H] quedará implı́citamente incluida al suponer diferentes distribuciones de
(V − K) para cada una de las n componentes de las que consideramos formada la
muestra, puesto que para cada una de ellas el modelo tiene libertad para ajustar
una distribución de metalicidad distinta.
4.3. Dependencias de Φ(Mv ), fe(r, l, b) y fV~ (U, V, W )
Antes de iniciar la discusión sobre cómo dependen las funciones de distribución

Φ(Mv ), fe (r, l, b) y fV~ (U, V, W ) de (V − K) y [F e/H] conviene insistir de nuevo que
se trata de encontrar relaciones válidas para la población base, y no para la muestra
de trabajo. Esto implica que deberemos recurrir a resultados teóricos o a resultados
obtenidos sobre muestras no sesgadas, para plantear un modelo de dependencia
realista para la población. En algunos casos, el análisis de la muestra, aún siendo
sesgada, nos puede dar indicios sobre el tipo de dependencia más adecuado.
−2
−1
0
1
2
3
Mv 4
5
6
7
8
9
10
0 0.5 1 1.5 2 2.5 3 3.5 4
(V−K)0
Figura 4.4: Ejemplo de relación Mv − (V − K)0 siguiendo la expresión 4.7
4.3.1. Dependencia de Φ(Mv )
Tanto los modelos de evolución estelar como los diagramas HR del capı́tulo
anterior nos indican que Φ(M v) debe depender de (V − K)0 y de [F e/H]. En el
primer caso hemos adoptado un modelo compuesto por varios segmentos lineales
(figura 4.4), tanto para M v , como para σMv :

 A1 (V − K) + B1 si (V − K)01 < (V − K)0 ≤ (V − K)02

M v ((V − K)0 ) = A2 (V − K) + B2 si (V − K)02 < (V − K)0 ≤ (V − K)03

...

(4.7)

 C1 (V − K) + D1 si (V − K)01 < (V − K)0 ≤ (V − K)02

σMv (V − K) = C2 (V − K) + D2 si (V − K)02 < (V − K)0 ≤ (V − K)03

...

(4.8)
Como hemos dicho en la sección 4.2, la dependencia de Mv con la metalicidad la

podemos tener en cuenta de forma explı́cita, haciendo depender Ai , Bi , Ci y Di de la
misma, o bien simplemente adoptando unos valores diferentes de estos coeficientes
para cada grupo de metalicidad en que separemos nuestra muestra. Este aspecto,
ası́ como el número de segmentos adoptados serán discutidos en el capı́tulo 5.
4.3.2. Dependencia de fe (r, l, b)
El único parámetro libre de la distribución espacial descrita en la sección 4.2 es

la altura patrón sobre el plano galáctico, Zh . Este parámetro ha de depender obvia-
mente de la metalicidad, puesto que cada población estelar tiene una distribución
espacial diferente.
Uno de los principales argumentos en favor de lo anterior es la existencia del de-

nominado disco grueso. Gilmore y Reid (1983) obtuvieron las magnitudes absolutas
de un gran número de estrellas situadas cerca del polo sur galáctico. Estudiando la
distribución vertical z de estas estrellas para diferentes rangos de magnitud absoluta
descubrieron que las estrellas con Mv < 4 seguı́an un perfil de densidad exponen-
cial con una altura patrón Zh de unos 300 pc, mientras que para las estrellas con
Mv > 4 la altura patrón era de unos 1450 pc. Ası́ pues, las estrellas más brillan-
tes y por lo tanto en promedio más jóvenes se encontraban más próximas al plano
galáctico que las estrellas menos luminosas y por lo tanto más viejas. Gilmore y Reid
(1983) apuntan como explicación más plausible que la muestra esté formada por dos
componentes diferenciadas con una distribución espacial tipo disco exponencial de
diferente Zh cada una. Estas componentes son lo que se conoce como disco delgado
y disco grueso. Posteriores estudios han demostrado que cada componente tiene di-
ferentes valores promedio de [F e/H] (el disco grueso es menos metálico que el disco
delgado) y distintas propiedades cinemáticas.
Por otra parte ya se ha mencionado que la distribución espacial de las estrellas

del halo puede ser localmente representada por un disco exponencial con un elevado
valor de Zh .
Por último, suponemos que, para un grupo de edad determinada, la distribución

espacial es independiente de la temperatura.
4.3.3. Dependencia de fV~ (U, V, W )
El estudio de la cinemática de las diferentes poblaciones estelares que conforman

la Galaxia y su dependencia con la temperatura (reflejo como veremos más adelante
de la relación edad-cinemática) se debe abordar a través del estudio de muestras poco
sesgadas que dispongan de todos los parámetros astrométricos, incluida la velocidad
radial. Existen varios trabajos realizados al respecto (ver por ejemplo Carney et
al. (1996), Flynn y Morell (1997), Fuchs et al. (1999) o Dehnen y Binney (1998),
los tres últimos basados en datos del catálogo Hipparcos) que estudian la relación
de la velocidad espacial y su dispersión con la metalicidad y/o la temperatura.
Sin embargo, como Binney et al. (1997) han demostrado, el conjunto de estrellas
con determinación de la velocidad radial forma una submuestra cinemáticamente
sesgada, debido a que los programas de observación de velocidades radiales tienden
a priorizar estrellas de alto movimiento propio, por lo que debe ponerse una especial
atención al confeccionar la muestra y analizar los datos.
En esta sección vamos a realizar un estudio cualitativo de la cinemática de nuestra

muestra de trabajo, con la única intención de establecer un modelo que nos permita
relacionar dicha cinemática con (V −K) y [F e/H]. Para ello, utilizaremos las estrellas
de la muestra que disponen de velocidad radial, que a pesar de formar una muestra
sesgada, nos permitirán obtener suficiente información para nuestro propósito. Un
análisis más detallado basado en datos Hipparcos para toda la secuencia principal
puede encontrarse en Dehnen y Binney (1998).
Disponer tanto de la velocidad radial como de los movimientos propios y dis-

tancias, permite la determinación de las tres componentes (U, V, W ) de la velocidad
espacial de la estrella (figura 4.5). Más interesante para nuestros propósitos es la fi-
gura 4.6. En ella se han representado los valores de U , V y W en función de [F e/H],
promediados en intervalos con igual número de estrellas. Se eliminaron las estrellas
con velocidades de más de 3σ por encima de la velocidad media del intervalo. Las
barras de error horizontales son la dispersión de [F e/H] dentro del intervalo consi-
derado, mientras que las verticales son los errores en las componentes de la velocidad
promediadas, calculados a partir de los correspondientes errores individuales en la
paralaje, movimientos propios y velocidad radial.
Una rápida inspección de la figura nos muestra que mientras que las velocidades
medias U y W son prácticamente independientes de la metalicidad, V es altamente
dependiente de la misma. Vemos que las estrellas con baja metalicidad tienden a
tener una velocidad de rotación en torno al centro de la Galaxia menor que las
estrellas más metálicas. Este efecto es un reflejo de lo que se conoce como corriente
asimétrica, según el cual la velocidad de rotación promedio de una población en torno
al centro de la Galaxia tiende a disminuir a medida que aumenta la dispersión de
velocidades dentro de la población (ver más abajo la discusión sobre la dependencia
300
Numero de estrellas
U
200
100
0
300
Numero de estrellas
V
200
100
0
300
Numero de estrellas
W
200
100
0
−200 −150 −100 −50 0 50 100 150 200
Velocidad (km/s)
Figura 4.5: Histograma de las tres componentes de la velocidad espacial para las estrellas
de la muestra con medidas de la velocidad radial (20 % del total). Obsérvese la forma
gaussiana de las componentes U y W y la extensión hacia velocidades negativas de
la componente V , debido a la corriente asimétrica. Las velocidades estás expresadas
respecto del Local Standard of Rest (LSR)
entre dispersión de velocidades y metalicidad). La corriente asimétrica puede ser

explicado totalmente a partir de las ecuaciones hidrodinámicas (ver por ejemplo
Binney y Tremaine 1987).
En la figura 4.7 se han representado las dispersiones de las tres componentes

de la velocidad en función de [F e/H]. En este caso es obvia la dependencia de las
tres dispersiones con la metalicidad. En el caso del disco este comportamiento no es
más que el reflejo de lo que se conoce como calentamiento del disco (disk heating en
inglés): la dispersión de la velocidad de un grupo de estrellas aumenta con el paso del
tiempo. La existencia de una relación edad-metalicidad dentro del disco provocarı́a
que este aumento de las dispersiones estuviese relacionado con la metalicidad.
Si bien no está aún del todo explicado desde un punto de vista teórico, en el caso
del disco delgado el calentamiento puede obedecer a varios mecanismos: interacción
de las estrellas con nubes moleculares y brazos espirales, perturbaciones debidas a
100
50
U (km/s)
−50
−100
50
−50
−100
V (km/s)
−150
−200
−250
−300
−350
100
50
W (mk/s)
−50
−100
−3 −2.5 −2 −1.5 −1 −0.5 0 0.5 1
[Fe/H]
Figura 4.6: Velocidades medias referidas al LSR en función de [F e/H]. Los intervalos
de metalicidad se han escogido de tal forma que el número de estrellas en cada uno
sea constante. Las barras de error horizontales representan la dispersión [F e/H] dentro
de cada intervalo, mientras que las verticales representan el error observacional en las
componentes de la velocidad promediadas, calculado a partir de los errores individuales
en los movimientos propios, velocidades radiales y distancias
agujeros negros masivos, ... Cada uno de estos encuentros aumenta la dispersión de
velocidades, de manera que las estrellas más viejas, al haber sufrido en promedio
más encuentros que las estrellas jóvenes, tienen dispersiones de la velocidad más
altas.
En lo referente a las estrellas de baja metalicidad, pertenecientes al halo, la alta

dispersión de la velocidad se podrı́a explicar en base a una formación del halo a
partir de la acreción de subsistemas más pequeños y a la propia evolución dinámica
del sistema.
280
240
200
σU(km/s)
160
120
80
40
0
200
160
σV(km/s)
120
80
40
120
100
σW(km/s)
80
60
40
20
0
−3 −2.5 −2 −1.5 −1 −0.5 0 0.5 1
[Fe/H]
Figura 4.7: Dispersión de las tres componentes de la velocidad espacial en función de

[F e/H]. Los intervalos y barras de error se han calculado análogamente a la figura 4.6
Discutiremos más a fondo éste y otros aspectos de la formación de la Galaxia en

el capı́tulo 6.
Las figuras 4.8 y 4.9 muestran las componentes de la velocidad y sus dispersiones
en función de (V − K)0 . La primera de las figuras muestra una clara dependencia
de la media de la componente V de la velocidad con (V − K), en especial en el
rango 1.2 < (V − K) < 1.6. Por debajo de este intervalo el valor promedio de V es
cero, mientras que por encima se estabiliza alrededor de un valor de -30 km/s. Este
comportamiento es lo que se conoce como discontinuidad de Parenago (Parenago
1950).
Para entender este comportamiento debemos pensar que a medida que avanza-
mos por la secuencia principal hacia las estrellas más frı́as encontramos progresiva-
mente estrellas formadas en épocas más dispares. En la zona de las estrellas más
calientes sólo las estrellas jóvenes permanecen aún en la secuencia principal, por lo
que la dispersión de edades es pequeña. Al desplazarnos hacia tipos espectrales más
frı́os, el rango de edades va aumentando progresivamente, hasta alcanzar el máxi-
mo en el color correspondiente al turn-off de las estrellas más viejas de la Galaxia

((V − K) ≈ 1.6). A partir de aquı́ el rango de edades ya no aumenta, puesto que,
independientemente de cuando se formase, ninguna estrella ha tenido aún tiempo
de evolucionar hacia la fase de gigante abandonando la secuencia principal.
Ası́ pues, al realizar promedios de la dispersión de velocidad en función del color,

encontramos una primera zona de la secuencia principal (la correspondiente a las
estrellas calientes) donde la dispersión es poco dependiente del color, ya que en ella
encontramos tan sólo estrellas del disco con cinemática relativamente parecida. Al
avanzar hacia las estrellas frı́as cada vez encontramos más estrellas viejas y por tanto
con valores más dispares de la velocidad, con lo que la dispersión de la velocidad
aumenta. Como acabamos de decir, a partir de ((V − K) ≈ 1.6) la mezcla de edades
ya no aumenta, por lo que el valor de las dispersiones se estabiliza. Este mismo
razonamiento puede ser aplicado para explicar el comportamiento de V en función
del color (figura 4.8).
Podemos ahora discutir como ha de ser la dependencia de fV~ con (V − K)0 y

[F e/H]. Recordemos que fV~ (U, V, W ) (ecuación 4.3) está parametrizada en función
de las velocidades medias U , V y W y de las respectivas dispersiones σU , σV y σW .
Tanto V como las tres dispersiones, según hemos visto, dependen claramente de la
metalicidad. Por otra parte, tras el análisis anterior, es obvio que si dispusiéramos de
una muestra de estrellas de una misma edad no encontrarı́amos dependencia entre
la cinemática y el color. Como precisamente nuestra intención es separar la muestra
en diferentes poblaciones, cada una de ellas con una cinemática, una metalicidad
y una edad diferenciada, no hará falta suponer una relación entre los parámetros
cinemáticos y el color (V − K).
4.4. Errores observacionales
Al realizar varias observaciones de una misma variable, el conjunto de valores

medidos puede ser representado por una distribución gaussiana alrededor de un
cierto valor medio con una cierta dispersión. Esta dispersión se puede identificar
con el error observacional de la variable. El método de máxima verosimilitud que
queremos implementar debe tener en cuenta estos errores.
En el presente trabajo han sido considerados los errores observacionales en la

4.4. Errores observacionales 111
20
10
U (km/s)
0
−10
−20
20
10
−10
V (km/s)
−20
−30
−40
−50
−60
−70
20
10
W (mk/s)
−10
−20
0 0.5 1 1.5 2 2.5 3 3.5

(V−K)0
Figura 4.8: Velocidades medias referidas al LSR en función de (V − K)0 . Los intervalos
y barras de error se han calculado análogamente a la figura 4.6
paralaje, el movimiento propio, la velocidad radial y la metalicidad. Para ser estrictos

deberı́amos considerar el error observacional de cada una de las variables, pero en
la práctica algunas de estas variables (l, b, magnitudes y colores) son medidas con
suficiente precisión como para poder ignorar su error. Hemos visto que los datos
Hipparcos proporcionan valores de (l, b) con un error medio inferior al milisegundo
de arco, mientras que los errores en las magnitudes y colores fotométricos para
nuestras estrellas suelen ser del orden de la centésima de magnitud, valores que
justifican considerar estas variables libres de error.
Matemáticamente, la distribución de las variables libres de error se puede expre-

sar a través de la función Delta de Dirac δ(x0 − x)1 , mientras que el resto son las
1
Utilizaremos la notación x0 para asignar los valores observados de las variables.
60
σU (km/s)
40
20
60
σV (km/s)
40
20
60
σW (mk/s)
40
20
0
0 0.5 1 1.5 2 2.5 3 3.5
(V−K)0
Figura 4.9: Dispersión de las tres componentes de la velocidad referida al LSR en función
de (V − K)0 . Los intervalos y barras de error se han calculado análogamente a la figura
4.6
mencionadas funciones gaussianas. Ası́ pues, en nuestro caso el error total se puede
expresar como:
2 2 2 2
µ0l −µl µ0b −µb

0 −v
2 vr [F e/H]0 −[F e/H]
π 0 −π − 12 − 12 − 12 r
− 12

− 12 µ µ vr [F e/H]
Σ = e π
e l e b e e
0 0 0
δ(m − m)δ(l − l)δ(b − b)δ(C10 − C1 ) (4.9)
En la expresión anterior estamos suponiendo que los errores correspondientes a

las diferentes variables son independientes entre sı́. Esta hipótesis es cuestionable en
el caso de (µl , µb ), ya que ambas cantidades se miden conjuntamente y sus errores
pueden presentar correlaciones.
En caso de utilizar como variable la distancia en lugar de la paralaje (ver apéndice

A), el error de aquella se puede calcular a partir del correspondiente error en la
paralaje:
π
r = 2 (4.10)
π
4.4. Errores observacionales 113
20
0
−20
V (km/s)
−40
−60
−80 [Fe/H] < −0.31
−100
20
0
−20
V (km/s)
−40
−60
−80 −0.31 < [Fe/H] < −0.12
−100
20
0
−20
V (km/s)
−40
−60
−80 −0.12 < [Fe/H] < −0.04
−100
20
0
−20
V (km/s)
−40
−60
−80 [Fe/H] > −0.04
−100
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3
(V−K)0
Figura 4.10: Relación entre V y (V − K) por grupos de metalicidad. La lı́nea contı́nua

es la relación obtenida para toda la muestra (figura 4.8). La desviación del punto a
(V − K) = 1.5 es debida a la gran presencia en la muestra de estrellas poco metálicas
a esta temperatura
Si usásemos la temperatura en vez del color (V − K)0 se deberı́a considerar su

error, introduciendo en la expresión anterior la correspondiente función gaussiana.
Sin embargo, como se puede ver en el desarrollo de la función de verosimilitud
(apéndice A), la inclusión de este error complica enormente las integrales a resolver,
haciendo necesario el cálculo de una integral numérica doble para cada estrella. Es
por ello que en esta implementación del método hemos optado por utilizar el color
(V − K)0 (el cual puede ser considerado libre de error) en vez de la temperatura
efectiva, dejando la inclusión de ésta última para versiones futuras.
4.5. Efectos de selección y sesgos observacionales
Es evidente que nuestra muestra no está compuesta por todas las estrellas que
forman la población base, siendo posible incluso que no sea representativa de la
misma. Al construir la muestra se han ido seleccionando las estrellas de acuerdo
a diversos criterios, hasta configurar la muestra final. Estos criterios, o efectos de
selección, son extremadamente difı́ciles de modelizar, ya que suelen estar originados
por diversas causas no siempre conocidas (limitaciones observacionales, utilización
de uno u otro catálogo, mezcla de catálogos, etc).
Sin embargo, el estudio de los efectos de selección es de vital importancia si

queremos obtener resultados representativos de la población a partir de estas mues-
tras sesgadas. El ejemplo más evidente es el de la selección por magnitud aparente.
Supongamos que queremos determinar M v , magnitud absoluta promedio de una
muestra, asumiendo una distribución gaussiana de la misma. La manera en que el
ajuste por máxima verosimilitud calcula este valor es comparando el histograma
de magnitudes aparentes obtenido para un valor de M v dado con el de la muestra
real. Ahora bien, sabemos que la muestra es completa hasta una magnitud aparente
mc , de tal manera que el número de estrellas en función de la magnitud aparente
disminuye a partir de mc . Si no tenemos en cuenta la modelización de este sesgo
observacional, el valor de M v que mejor reproducirá el histograma de magnitud apa-
rente observado será más brillante (para compensar la falta de estrellas débiles en
la muestra) del que realmente tiene la población base. Por otro lado, si modeliza-
mos de forma incorrecta la función de selección nos podemos encontrar con que el
histograma de magnitudes aparentes predicho a partir de M v diste mucho de tener
la forma que tiene el histograma de nuestra muestra observada, como explicaremos
con más detalle en la sección 4.5.1. Algo similar ocurre para la distribución de otros
parámetros, como puede ser el color (V − K).
Los sesgos observacionales introducidos en una muestra por los efectos de selec-
ción pueden ser de diferentes tipos:
sesgos en la posición: las limitaciones observacionales (por ejemplo realizar las

medidas desde un mismo observatorio) pueden provocar que nuestra muestra
no cubra toda la bóveda celeste. Esto podrı́a tener efecto en la determinación
de la distribución espacial.
4.5. Efectos de selección y sesgos observacionales 115
sesgos cinemáticos: las estrellas con un movimiento propio elevado son inclui-
das con mayor frecuencia en los programas de determinación de velocidades
radiales. Esto provoca que una muestra con velocidades radiales se encuentre
sesgada hacia estos movimientos propios elevados, afectando a la determina-
ción final de la cinemática de la población.
Por otra parte, es sabido que en la confección del catálogo de entrada de

la misión Hipparcos se favoreció la presencia de estrellas de alto movimiento
propio.
sesgo en la magnitud aparente: también conocido como sesgo de Malmquist.

Este sesgo afecta a la magnitud absoluta promedio de muestras limitadas en
magnitud aparente (ver sección 4.5.1).
sesgo en la estimación de la distancia: la utilización de la paralaje trigono-

métrica para estimar la distancia (r = 1/π) produce resultados sesgados aún
cuando aquella no esté sesgada. Si suponemos que el error de la paralaje sigue
una distribución gaussiana centrada en un valor π0 , se puede demostrar (Luri
y Arenou 1997) que el correspondiente error de r sigue una cierta distribución
con un valor esperado r00 diferente a r0 = 1/π0 . Es decir, el valor más probable
de r, dados π0 y su distribución de error, no es r0 , sino r00 . Lo mismo sucede
para cualquier otra cantidad derivada a partir de la paralaje, como puede ser
la magnitud absoluta de la estrella.
Hay que insistir en que este efecto estará siempre presente, puesto que es
intrı́nseco de la paralaje e independiente de cualquier otro efecto de selección.
No debemos confundir este efecto con el denominado sesgo de Lutz-Kelker

(Lutz y Kelker 1973). Éste último nos dice que dada una muestra de estrellas
seleccionadas de tal forma que el valor de su paralaje, o de su error relativo,
no supere un cierto valor lı́mite, el valor medio observado de la paralaje de la
muestra será mayor que su valor real, como efecto del error gaussiano de la
paralaje y del incremento de volumen de espacio observado en función de la
distancia.
otros sesgos, como los provocados por la selección de un determinado tipo es-
pectral, o rango de metalicidades. En general, el efecto de estos sesgos depen-
derá de como se relacionen estos parámetros con las variables que caracterizan
la población.
En el caso que nos ocupa, hemos considerado que nuestra muestra está libre
de sesgos en posición, ya que en primera aproximación cubre todo el cielo unifor-
memente. Respecto al sesgo cinemático, al no haber exigido medidas de velocidad
radial es de suponer que nuestra muestra no estará excesivamente afectada por el
sesgo cinemático asociado a dichas medidas. Sin embargo sı́ que lo estará por ser
una submuestra del catálogo Hipparcos. El hecho de que la selección de las estrellas
Hipparcos no obedezca exclusivamente a criterios observacionales, sinó que muchas
de estrellas fueron incluidas ad hoc por su interés cientı́fico, hace extremadamente
difı́cil modelar este sesgo. En este sentido se realizaron varias pruebas con funciones
de selección que intentaban favorecer la presencia de estrellas de alto movimiento
propio, pero ninguna de ellas dió resultados satisfactorios. Queda por tanto pen-
diente para trabajos futuros la modelización del sesgo cinemático.
Los otros sesgos son corregidos de forma natural en el ajuste por máxima verosi-
militud, siempre que las funciones de selección y los errores observacionales estén
bien modelizados.
Para tener en cuenta estos sesgos debemos definir una función de selección S(x)
que dé cuenta de la probabilidad de que una estrella con un valor x de una cierta
variable sea incluida en la muestra. En nuestro caso hemos tenido cuenta los efectos
de selección en la magnitud aparente mc y en el color (V − K), de forma que la
función de selección final es el producto de las funciones para cada variable:
S(m0 , (V − K)0 ) = Sm (m0 )S(V −K) ((V − K)0 )
(4.11)
Estamos suponiendo que ambas funciones de selección son independientes. La

forma explı́cita de cada una de estas funciones es discutida en las secciones 4.5.1
y 4.5.2. Es importante notar que la función de selección depende de los valores
observados (indicados con un apóstrofe), afectados de error, y no de los valores
reales.
4.5.1. Selección en la magnitud aparente
Cualquier muestra está en mayor o menor grado limitada en magnitud aparente.

El caso más corriente es que la muestra sea completa hasta una magnitud deno-
minada de completitud y que para magnitudes más debiles la probabilidad de que
una estrella pertenezca a la muestra disminuya hasta hacerse nula para estrellas con
magnitud aparente superior a una cierta magnitud lı́mite. El caso más sencillo se
da cuando mlim = mc . Es decir, la muestra es completa hasta m0 = mc y no existen
estrellas con magnitudes más débiles.
Se puede demostrar que para una muestra limitada en magnitud aparente la

magnitud absoluta media de la muestra es más brillante que la magnitud absoluta
media de la población de la cual ha sido extraı́da, denominándose la diferencia entre
ambas medias sesgo de Malmquist, por el astrónomo sueco K. G. Malmquist que lo
formuló. La explicación es sencilla: el volumen de espacio dentro del cual podemos
ver estrellas brillantes es mucho mayor que el correspondiente a estrellas débiles, con
lo cual las primeras estarán presentes en mayor número dentro de la muestra.
Tradicionalmente el sesgo de Malmquist se corrige después de haber estimado

la magnitud absoluta media de la muestra y su dispersión, obteniendo ası́ una es-
timación de la magnitud absoluta media de la población. Para muestras en que
mlim = mc , el mismo Malmquist (1936) demostró que el valor del sesgo es apro-
2
ximadamente igual a 1.38σM , siendo σM la dispersión de magnitudes absolutas de
la población. La expresión anterior es tan sólo una aproximación de primer orden
y requiere que la población cumpla ciertas condiciones (como estar distribuida ho-
mogéneamente en el espacio) que raramente se cumplirán. El sesgo de Malmquist
puede ser tratado de una forma más rigurosa utilizando un ajuste por máxima vero-
similitud. Luri et al. (1993) utilizan dicho método para obtener una expresión más
precisa del sesgo para el caso mlim = mc .
En el caso más general en que mlim > mc , como es el que nos ocupa, debemos
elegir una función de selección S(m0 ) que permita reproducir la distribución de
magnitudes aparentes. Para ello, observemos la figura 4.11. En lı́nea discontinua se
muestra la distribución F (m0 ) de la magnitud aparente de una muestra simulada
suponiendo que ha sido extraı́da de una única población base con una relación
Mv − (V − K) lineal que ajusta la dada por Schmidt-Kaler (1982), adoptando una
distribución espacial de tipo disco exponencial con Zh = 300 pc y la distribución de
(V − K) de la tabla 4.1. El histograma corresponde a la distribución de magnitud
aparente de las estrellas del catálogo Hipparcos de secuencia principal seleccionadas
según se ha descrito en la sección 2.1.3. De la figura 4.11 deducimos que existe
una magnitud mc hasta la cual la probabilidad de que una estrella pertenezca a
la muestra es independiente de su magnitud. Esta probabilidad será igual a 1 si la
4000
mc mlim
3000
Numero de estrellas
2000
1000
0
2 4 6 8 10 12 14
m’
Figura 4.11: Función de selección Sm (m0 ). El histograma es el correspondiente a las

estrellas del catálogo Hipparcos de secuencia principal. La lı́nea discontinua muestra la
distribución de magnitudes aparentes de la población base (sin ningún sesgo observacio-
nal). La lı́nea continua es el ajuste del histograma suponiendo un sesgo en la magnitud
aparente como el descrito en el texto
muestra es completa hasta dicha magnitud. A partir de mc la probabilidad disminuye

hasta hacerse nula para una magnitud lı́mite mlim .
Definimos Sm (m0 ) suponiendo que entre mc y mlim una estrella tiene una proba-
bilidad de ser incluida en la muestra dada por una función gaussiana centrada en mc
y con una dispersión σmc tal que para m0 = mlim la probabilidad sea prácticamente
nula:


 1 si m0 ≤ mc
 2
m0 −mc

Sm (m0 ) = e
− 21 σmc
si mc < m0 < mlim (4.12)

si m0 ≥ mlim

 0
Un ajuste de Sm (m0 ) al histograma de la secuencia principal Hipparcos de los

tipos FGK utilizando la distribución de magnitud aparente simulada (normalizada
para ajustar la parte brillante del histograma) y adoptando mlim = 12.5 da unos
valores para mc y σmc de 7.6 y 4.6, respectivamente (figura 4.11). Vemos que el
producto F (m0 ) · Sm (m0 ) ajusta razonablemente bien el histograma. Hay que tener
en cuenta que se trata únicamente de probar que la función Sm (m0 ) del tipo descrito
en (4.12) es capaz de reproducir el histograma de una muestra sesgada en magnitud
aparente, de forma similar a nuestra muestra.
mc , σmc y Mv son parámetros altamente correlados, de forma que considerar-

los todos como parámetros libres no garantiza una solución más realista. Ası́, una
determinación errónea de Mv podrı́a ser compensada por una determinación de mc
también errónea para dar un histograma correcto de magnitudes aparentes. Para
evitarlo, hemos considerado mc como parámetro libre y hemos fijado el valor de
σmc , definiéndolo como:
mlim − mc
σmc = (4.13)
nmc
Como veremos en el próximo capı́tulo, nmc será un parámetro que deberemos

fijar antes del ajuste. En el caso del histograma de la figura 4.11, nmc = 5, de forma
que S(mlim ) ' 4 · 10−5 (independientemente del valor de mc ).
Por último supondremos que el sesgo en magnitud aparente, y por tanto mc , pue-
de depender de la metalicidad. Con ello se quiere reflejar el hecho de que la muestra
podrı́a tener un cierto sesgo hacia estrellas de una metalicidad dada. Por ejemplo,
en el catálogo Hipparcos se favoreció la presencia de estrellas poco metálicas, de la
misma manera que lo hacen muchas las campañas de fotometrı́a Strömgren o de es-
pectrocopı́a. Si esto no es ası́, el propio ajuste nos dará valores de mc independientes
de la metalicidad.
4.5.2. Selección en el color (V − K)
La distribución de (V − K)0 de nuestra muestra viene determinada por los si-

guientes puntos:
la distribución de (V − K)0 de la población base (ver sección 4.2.5),
la selección en magnitud aparente descrita en el apartado anterior, a través de

la relación Mv − (V − K)0 , y
la selección en (V − K) propiamente dicha, debido en nuestro caso a que nos

hemos restringido a unos ciertos tipos espectrales y, como veremos, al hecho de
haber exigido medidas de la metalicidad para todas las estrellas de la muestra.
La forma que hemos adoptado para la distribución de (V − K)0 de la población

base (expresión 4.5) permite modelizar que nuestra muestra está compuesta por
estrellas pertenecientes a un rango espectral determinado. Para ello debemos ajustar
−
la dispersión de la gaussiana por su parte izquierda (σ(V −K) ) de tal manera que
reproduzca la distribución espectral de las estrellas más calientes de la muestra.
Debemos además definir los valores extremos (V − K)inf y (V − K)sup . Simi-

larmente al caso de la magnitud aparente, estos valores se definen a partir de los
valores observados de la muestra.
Por último cabrı́a plantearse si existe algún otro sesgo en la distribución de

(V − K), debido por ejemplo al hecho de haber exigido valores de la metalicidad
para todas las estrellas. Es de esperar, sin embargo, que esta exigencia afecte más
a la distribución de magnitud aparente que a la del color (o al tipo espectral). En
cualquier caso, el parámetro A de la expresión (4.5), que representa la abundancia
relativa de estrellas en torno al turn-off respecto de las estrellas más frı́as, puede
también interpretarse como un sesgo observacional.
Ası́ pués, la propia expresión 4.5 contiene suficientes parámetros para modelizar
un posible sesgo observacional en el color (V − K).

4.implementacion Metodo PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

4.implementacion Metodo PDF

Transféré par

Droits d'auteur :

Formats disponibles

4 Implementación del método de

Gran parte de las investigaciones en el campo de la astrofı́sica se enfrentan al

Uno de estos métodos es el ajuste por máxima verosimilitud, el cual permite

tros y las variables consideradas (en nuestro caso temperatura y metalicidad). La

4.1. Consideraciones generales

La aplicación de métodos de máxima verosimilitud a problemas astronómicos

Como todo método paramétrico, el método de máxima verosimilitud precisa

Los parámetros libres del modelo serán ajustados utilizando el estimador de

blación, como podrı́an ser el valor de su velocidad espacial, metalicidad promedio,

Adopción y parametrización de modelos que describan la función de distribu-

Análisis de las dependencias de la función de distribución de la magnitud

Análisis y modelización de los diferentes sesgos presentes en el proceso de

Obtención de la forma explı́cita de la función de verosimilitud, planteamiento

4.2. Hipótesis fı́sicas

Los parámetros libres del modelo, obtenidos a través de máxima verosimilitud

4.2.1. Función de distribución de la magnitud absoluta

La función de distribución de la magnitud absoluta Φ(Mv ) proporciona la fre-

Una manera de determinar esta función de distribución consiste en contar las

Entre los trabajos más relevantes sobre la distribución de magnitudes absolutas

diferentes histogramas, si bien las dispersiones se desvı́an ligeramente del comporta-

La función de distribución de Mv que hemos adoptado para describir nuestra

4.3.1, dependerán en nuestro caso de la temperatura y de la metalicidad.

Modelizar Φ(Mv ) de una forma más compleja añadirı́a nuevos parámetros y

En la expresión 4.1 no incluimos el factor de normalización, ya que éste será cal-

4.2.2. Distribución espacial

Al igual que Luri (1995), hemos representado la distribución espacial de las

Evidentemente éste es un perfil de densidad altamente simplificado, que omite

prácticamente uniforme. Podemos obtener este tipo de distribución a partir de 4.2

Z podrı́a considerarse como un parámetro libre, obteniendo ası́ una determina-

4.2.3. Función de distribución de la velocidad

Análogamente al caso de la magnitud absoluta hemos omitido el factor de nor-

Como hemos comentado, todas las estrellas de la muestra pertenecen al entorno

4.2.4. Absorción interestelar

En este trabajo hemos modelizado la absorción interestelar siguiendo el trabajo

La figura 4.2 muestra la absorción en los diferentes sectores a una distancia de

4.2.5. Función de distribución de (V − K)

Dentro de la secuencia principal, la distribución f(V −K) (número de estrellas con

La alternativa es recurrir a determinaciones empı́ricas, basadas en recuentos

Sin embargo, si deseamos representar un grupo de estrellas de una edad o rango

Una aproximación que tiene en cuenta lo dicho anteriormente consiste en suponer

Mientras que la primera componente domina la distribución de las estrellas frı́as,

Tipo Espectral log(N )

La forma analı́tica de f(V −K) será por tanto:

con P(V − K) un polinomio de tercer grado. Este polinomio suaviza la distribución

4.2.6. Función de distribución de [F e/H]

La distribución de metalicidad de las estrellas de la Galaxia está ı́ntimamente

Sin embargo podemos hacer una serie de suposiciones al respecto. Ya hemos

Es conveniente pues considerar la población base a la que pertenece nuestra

muestra como la suma de n componentes estelares. Asumiremos que cada una de

4.3. Dependencias de Φ(Mv ), fe(r, l, b) y fV~ (U, V, W )

Antes de iniciar la discusión sobre cómo dependen las funciones de distribución

Figura 4.4: Ejemplo de relación Mv − (V − K)0 siguiendo la expresión 4.7

4.3.1. Dependencia de Φ(Mv )

Como hemos dicho en la sección 4.2, la dependencia de Mv con la metalicidad la

4.3.2. Dependencia de fe (r, l, b)

El único parámetro libre de la distribución espacial descrita en la sección 4.2 es

Uno de los principales argumentos en favor de lo anterior es la existencia del de-

Por otra parte ya se ha mencionado que la distribución espacial de las estrellas

Por último, suponemos que, para un grupo de edad determinada, la distribución

4.3.3. Dependencia de fV~ (U, V, W )

El estudio de la cinemática de las diferentes poblaciones estelares que conforman

En esta sección vamos a realizar un estudio cualitativo de la cinemática de nuestra

Disponer tanto de la velocidad radial como de los movimientos propios y dis-