Vous êtes sur la page 1sur 78

1

Universidad Autnoma de Zacatecas


Francisco Garca Salinas
Unidad Acadmica de Matemticas
Tesis en matemticas:

Factores Predictores en la Aparicin del cncer


de Mama
Un Estudio Realizado en el Estado de Zacatecas
Tesis
Para obtener el grado de:
Licenciado en Matemticas
Presenta:

Gerardo Martnez Espino


Asesores de tesis:
Dra. Leticia A. Ramrez Hernndez
Dr. Juan Martnez Ortz

Dedicatoria
El presente trabajo va dedicado a mis padres, pues por ellos estoy aqu y por
ellos sigo a delante ellos que me ensearon a ser la persona que soy a ahora
y que me apoyaron en el transcurso de todos mis logros y fracasos. Ellos que
con la eterna frase no le hace que no saques diez no mas no repruebes
me animaban a no claudicar y a darlo todo sin miramientos.
A mis hermanos Guadalupe y Armando quienes me dieron todas las
herramientas para poder tener una educacin universitaria y que sin ellos
nada de esto pude haber sido posible.
Finalmente para todas aquellas personas que en el transcurso de los aos se
convirtieron en maestros, amigos, alumnos y me ayudaron a tomar siempre
las mejores decisiones.

Agradecimientos
Les doy las gracias a mis asesores la Dra. Leticia A. Ramrez Hernndez y el
Dr. Juan Martnez Ortz que me guiaron a lo largo de toda la investigacin y
siempre me dieron su apoyo incondicional especialmente a la Dra. Leticia
que con paciencia y comprensin me ayud a concluir este proyecto.
Agradezco a todas las personas que me ayudaron con en la recoleccin de
encuestas y al Departamento de Enseanza del Hospital General de
Zacatecas por todas las facilidades brindadas para el desarrollo de esta
investigacin.
Por ltimo y no menos importante, a la Unidad Acadmica de Matemticas
de la UAZ por la oportunidad de ser parte de la misma y ayudar a superarme
como alumno y como persona.

Contenido
INTRODUCCIN.......................................................................................................... 5
Captulo 1: Cncer de mama...................................................................................... 7
1.1 Qu es el Cncer?............................................................................................ 7
1.2 Cncer de Mama............................................................................................... 8
1.3 fisiologa de la Mama......................................................................................... 9
1.4 Mortalidad....................................................................................................... 12
1.5 Polticas de Prevencin para el Cncer de Mama............................................13
Captulo 2: METODOLOGA....................................................................................... 15
2.1 Factores de riesgo........................................................................................... 15
2.2 Recoleccin de Datos...................................................................................... 18
2.2.1 Tamao Muestral....................................................................19
2.3 Regresin Logstica......................................................................................... 20
2.3.1 El modelo de regresin lineal..................................................22
2.4 Mtodo de mnimos cuadrados.......................................................................22
2.5 Estimacin de los coeficientes para el modelo de regresin logstica.............24
2.5.1 Funcin de verosimilitud:........................................................24
2.5.2 Estimador de mxima verosimilitud.........................................25
2.5.3 Test de la razn de verosimilitud.............................................27
2.6 Mtodo de Newton Raphson.........................................................................30
2.7 La prueba de Wald.......................................................................................... 31
2.8 La Curva ROC.................................................................................................. 32
2.9 XLSTAT............................................................................................................. 33
CAPITULO 3 RESULADOS.......................................................................................... 35
CAPITULO 4 CONCLUSIONES..................................................................................... 58
Apndice.................................................................................................................. 60
Bibliografa............................................................................................................... 62

INTRODUCCIN
De acuerdo a datos de la Organizacin Mundial de la Salud (OMS) se estiman
aproximadamente 519 000 muertes a causa del cncer alrededor del mundo,
la enfermedad ocupa el primer lugar de mortalidad. Actualmente el cncer
de mama es el tipo ms frecuente de cncer en la mujer, tanto en los pases
desarrollados como en los llamados en vas de desarrollo, estimando un
promedio de 1.38 millones de casos nuevos que se diagnosticaron en todo el
mundo en 2008

convirtindolo as en un problema de salud pblica

internacional. En Mxico a partir de 2006 el cncer de mama es la primera


causa de mortalidad en el pas en mujeres de 20 aos o ms representando
un 13.8% de muertes por tumores malignos seguido por el cncer
cervicouterino con el 10.4% acorde con el INEGI (Instituto Nacional de
Estadstica y Geografa). (SITIO WEB DE INEGI http://www.inegi.com.mx)
Se han realizado diferentes intentos por entender aspectos epidemiolgicos
de esta enfermedad, desde la misma Medicina, la Biologa, las Matemticas,
etc.
En el Estado de Mxico se realiz un estudio de cncer de mama donde se
encuestaron a 100 mujeres sanas aparejadas con 100 pacientes de cncer
de mama, el objetivo del trabajo era detectar los principales factores que
influyen en el desarrollo de la enfermedad (Ma. J. Aguilar Cordero,
2012;27(5)). Los resultados obtenidos muestran que la edad, el ndice de
masa corporal (IMC) alto, una menarca temprana, la falta de ejercicio y el no
lactar a los hijos, se presentan como factores de riesgo altos. En el presente
estudio se maneja una dinmica similar, se gener un instrumento
estadstico para recopilar informacin (encuesta) y sta se aplic a mujeres
del estado de Zacatecas, en busca de los factores que predominan en el
padecimiento de este cncer tomando una muestra aleatoria de pacientes

con cncer de mama y mujeres sanas. Luego, utilizando el mtodo de


regresin logstica se hizo el anlisis de los datos recopilados.
Los objetivos de esta investigacin son encontrar algunas respuestas al
porque el cncer de mama se ha convertido en una de las primeras causas
de muerte en la repblica mexicana, tomando como punto de partida el
Estado de zacatecas.
Se pretende corroborar los factores de riesgo identificados para esta
enfermedad y de igual manera identificar cules de estos son los que mayor
riesgo representan para las personas.
El estudio de una enfermedad como el cncer es de vital importancia para la
sociedad en estos tiempos modernos ya que es a causa de la desinformacin
que las muertes por dicha enfermedad se hayan incrementado, tanto sector
salud como gobierno del estado pueden lanzar campaas ms eficientes
para combatir la desinformacin y romper tabs entre la comunidad al dar a
conocer los factores de mayor riesgo a los que estn expuestos.
El trabajo se estructura en 4 captulos: en el Captulo 1 se explicara que es el
cncer y como es que afecta el cuerpo centrndonos en el cncer de mama:
la manera en la que se presenta, su desarrollo, los tipos distintos de cncer,
las polticas de prevencin que existen actualmente en nuestro pas. En el
Captulo 2 presentamos la metodologa del estudio, desde la eleccin de los
factores a medir, el diseo de la encuesta, la seleccin de la muestra, y se
describe el mtodo de regresin logstica binaria.
En el Captulo 3 se hace un recuento de los principales resultados de la
investigacin, desde la estadstica simple: porcentajes de prevalencia por
cada factor medido y las observaciones relevantes de los mismos; hasta los
factores determinados por las regresiones y la validacin de nuestro modelo.
Finalmente, el Captulo 4 presenta las conclusiones obtenidas del estudio.

Captulo 1: Cncer de mama.


1.1 Qu es el Cncer?
Cncer es un trmino que se usa para denominar enfermedades en las
cuales las clulas anormales se dividen sin control y que pueden llegar a
invadir otros tejidos ya sea por medio del sistema sanguneo o el sistema
linftico. La mayora de los cnceres reciben sus nombres del rgano en
donde comienzan, por ejemplo el cncer que comienza en la prstata se
llama cncer de prstata. Siendo ms de 100 tipos diferentes de cnceres
podemos clasificarlos en varias categoras, siendo las siguientes las ms
importantes:

Carcinoma: cncer que empieza en la piel o en tejidos que cubren los


rganos internos.

Sarcoma: cncer que empieza en el hueso, cartlago, grasa, msculo,


vasos sanguneos u otro tejido conjuntivo.

Leucemia: cncer que empieza en el tejido en el que se forma la


sangre, como la mdula sea, y causa que se produzcan grandes
cantidades de clulas sanguneas anormales y que entren en la
sangre.

Linfoma y mieloma: cnceres que empiezan en las clulas


del sistema inmunitario.

Cnceres del sistema nervioso central: cnceres que empiezan en


los tejidos del cerebro y de la mdula espinal.

(SITIO WEB National Institute of Cancer http://www.cancer.gov)


Todos los cnceres comienzan en las clulas especficas del tejido u rgano
donde se desarrolla; en un principio las clulas crecen y se dividen en forma
controlada para producir ms clulas acordes para mantener el cuerpo sano,
pero en algn momento el proceso se corrompe y se generan clulas que
tienen deficiencias en el mecanismo de apoptosis (proceso mediante el cual
una clula que envejece o se daa, induce su muerte). Cuando esto pasa,
las clulas no mueren y el cuerpo produce clulas nuevas con esta misma
mutacin, provocando una acumulacin excesiva de las mismas, que genera
una masa de tejido llamada tumor. No todos los tumores son cancerosos, los
podemos clasificar en benignos y malignos.
Un tumor benigno no es canceroso y generalmente se puede extraer y por lo
regular no vuelve a aparecer; mientras que un tumor maligno si es
canceroso

tiene

la

capacidad

de

invadir

tejidos

cercanos,

puede

diseminarse a otras partes del cuerpo (metstasis) y hacer colapsar al


rgano o al sistema donde se origina, en muchos casos con un desenlace
mortal para el paciente que padece la enfermedad.

1.2 Cncer de Mama.


Como su nombre lo indica, este cncer tiene su origen en el tejido mamario,
y es una enfermedad tpicamente femenina, tiene una incidencia de 2
hombres por cada mil mujeres. (SITIO WEB gobierno de la republica
http://www.gob.mx)
Puede afectar los conductos que llevan la leche materna al pezn, o bien
presentarse en el lobulillos que son las glndulas encargadas de la
produccin de la leche, de aqu que haya dos tipos de cncer de mama: el
ductal y el lobular.
Son muchos los factores que se han identificado como riesgosos para el
desarrollo de esta enfermedad:

un IMC alto (ndice de Masa Corporal),


la falta de actividad fsica,
la obesidad,

son presentados como factores fsicos;

la menarca (inicio de la menstruacin) temprana,


la nuliparidad (no tener hijos)

han sido identificados como factores hormonales;

el tener parientes cercanos con este tipo de enfermedad,

se presenta como factor gentico y marca una predisposicin para ciertas


mujeres.
Mientras que, por otro lado,

el haber lactado por periodos prolongados, se presenta como un factor


de proteccin contra esta enfermedad.
(SITIO WEB Cncer.Net http://www.cancer.net)

En el apartado 2.1 veremos la justificacin en la relevancia de estos


factores.

1.3 fisiologa de la Mama.


La informacin para este apartado se consult del sitio web de la
Universidad Peruana Cayetano Hereida al igual que las imgenes se
extrajeron del mismo sitio web (http:// http://www.upch.edu.pe)
La funcin primaria de la glndula mamaria es la de producir la leche que
servir como alimento y que brindara proteccin al nio una vez que haya
nacido. Esta glndula constituye la principal caracterstica entre los
mamferos.
Las mamas se encuentran en la parte interior del trax y

estn

mayormente constituidas por tejido glandular adiposo. La cara superficial de


la mama est cubierta por piel y aproximadamente en el centro se
encuentra el pezn, el cual se encuentra rodeado por una zona de piel

denominada areola. Bajo la areola se ubican las dilataciones de los


conductos galactforos llamadas senos lactferos, que acumulan la leche
que el nio debe exprimir al mamar. La base de la glndula mamaria se
extiende desde la segunda hasta la sexta costilla, desde el borde externo
del esternn hasta la lnea axilar media. El rea sper externa de cada
glndula se extiende hacia la axila y se denomina prolongacin axilar. La
cara superficial de la mama est cubierta por piel y aproximadamente en el
centro se encuentra el pezn. La base del pezn est rodeada por una zona
de piel llamada areola, esta posee numerosas glndulas sebceas, de las
cuales algunas determinan levantamientos de la piel que producen una
secrecin grasa que lubrica el pezn y la areola, denominada glndulas de
Montgomery. Bajo la areola estn ubicadas las dilataciones de los conductos
galactforos llamadas senos lactferos, que es donde se acumula la leche
que el nio deber exprimir para su alimentacin.

Figura 1. Fisiologa de la glndula mamaria.


Esta glndula est formada por tres tipos de tejidos

Glandular de tipo tbulo-alveolar

Conjuntivo que conecta los lbulos

Adiposo (est entre los espacios interlobulares)

Aproximadamente 20 lbulos mamarios conforman la glndula y estn


constituidos por nmeros lobulillos que se encuentran unidos entre s por

tejido conectivo, vasos sanguneos y por su sistema excretor, ubicado en los


conductos lactferos.
Los lobulillos estn formados de 10 a 100 acinos, los cuales estn formados
por un conjunto de clulas secretoras que producen la secrecin lctea y
conforman una cavidad en la cual vierten dicha secrecin. El sistema de
conductos lactferos funciona de la siguiente manera:
El acino se vaca a travs de un conducto terminal, el cual converge con sus
congneres para formar el conducto lobulillar, que recoge la secrecin
lctea de todos los acinos de un lobulillo, estos conductos se renen para
formar un conducto interlobulillar, que al unirse con otros conductos de este
tipo forman el conducto lobular o segmentario, de mayor tamao que los
anteriores, que se dirige al pezn y antes de llegar a l se dilata formando el
seno lactfero, el que se angosta nuevamente para finalmente desembocar
en el pezn.

Figura 2. Anatoma de la glndula mamaria.


Las glndulas mamarias se encuentran en ambos sexos, sin embargo el
hombre nunca llega a desarrollarlas, mantenindolas inertes toda su vida.
En cambio en la mujer sin se encuentran poco desarrolladas en la infancia,
siendo en la pubertad cuando empieza su proceso de maduracin y hasta el
embarazo y el periodo posterior al parto (durante la lactancia) que alcanzan
su mximo desarrollo. Durante el transcurso de la niez las mamas de la

mujer se desarrollan en

forma que el cuerpo crece sin presentar

modificacin alguno, el cambio se sufre dentro de la mama donde se est


dando paso a la construccin de los conductos por crecimiento longitudinal
y ramificacin. Entre los 10 y 12 aos de edad comienzan los cambios
hormonales iniciando as la secrecin de estrgenos que en compaa de los
cambios provocados por la hormona de crecimiento determinan la
maduracin de la glndula mamaria. Una vez se ha iniciado el ciclo
menstrual el estrgeno estimula la proliferacin del tejido que ayuda a la
formacin y ramificacin de los conductos. La progesterona, en la tercera
fase del periodo menstrual, favorece la dilatacin y ramificacin de los
conductos y la diferenciacin de las clulas alveolares, dichos cambios no
regresan con la menstruacin permitiendo a la mama desarrollarse aun en la
etapa adulta. El proceso se repte consecutivamente mientras la mujer
permanece nulpara, incrementando la posibilidad de mutaciones celulares
durante la proliferacin del tejido descrita anteriormente, de ah que sean
factores de riesgo hormonal una menarca temprana y la nuliparidad.
Al llegar el embarazo los niveles de progesterona, prolactina y lactgeno
placentario se elevan ayudando a que lo lobulillos se expandan en forma de
racimos y as la glndula mamaria se prepara para cumplir con su funcin
primordial que es la produccin de leche. Entre la 5 y 8 semana de
gestacin podemos apreciar muchos cambios en las mamas, aumentan
notablemente su tamao, se llegan a sentir ms pesadas, se intensifica la
pigmentacin de la areola y el pezn. El crecimiento de la mama contina
durante toda la gestacin pero a las 20 semanas las clulas comienzan con
la actividad secretora y las clulas mioepiteliales que rodean al alvolo se
alargan y adelgazan.
Algunos das despus del parto aparece la verdadera secrecin lctea y es
sta la que distiende los alveolos que en ese momento estn tapizados por
una sola capa de clulas cilndricas bajas. Despus de la menopausia la

glndula mamaria se atrofia y los elementos celulares de los alveolos y


conductos se degeneran y disminuyen en nmero.

Figura 3.

1.4 Mortalidad.
Las tasas de mortalidad por esta enfermedad en Mxico, ha sufrido cambios
notorios en los ltimos 50 aos. Entre 1955 y 1960 se registraba una tasa de
entre 2 y 4 muertes por cada 100000 mujeres, pero a mediados de la dcada
de los 90se alcanza una cifra de 9 muertes por cada 100000. No obstante
para el 2006 el cncer de mama se haba convertido en la segunda causa de
muerte prematura en mujeres entre 30 y 59 aos de edad.
De los 32 estados de la Repblica mexicana, en 11 esta enfermedad se ha
convertido en la segunda causa de muerte ms comn entre mujeres. Dado
que no se dispone de datos confiables a nivel nacional sobre prevalencia e
incidencia de cncer de fechas anteriores a 1990, las estimaciones publicas
sugieren que en 1990 se presentaron 6000 casos de cncer en el pas y se
esperan 16500 casos nuevos para el ao 2020, a esto se le pueden llegar a
sumar casos no detectados gracias a la falta de acceso a la informacin y la
escasa educacin en cuidado de la salud del mexicano promedio.

Si bien esta enfermedad prolifera en los Estados con mayor ndice de


ingresos (Len, Jalisco, Baja California, la Ciudad de Mxico, por mencionar
algunos) est tomando terreno en los Estados con mayor ndice de pobreza:
Chiapas, Oaxaca, Guerrero; en los cuales en aos recientes se han
presentado cruces entre el cncer crvico y el de mama.
De acuerdo a los datos de los Servicios de Salud de Zacatecas (SSZ), en el
estado de Zacatecas se detectan entre 20 y 40 casos positivos para cncer
de mama al ao, ya sea del tipo lobuliar o el de tipo ductrial infiltrante;
siendo detectado, en la mayora de los casos, por las mismas pacientes
durante la autoexploracin.
Ver (Archivos de Medicina),

1.5 Polticas de Prevencin para el Cncer de


Mama.
La informacin para este apartado es proporcionada por el manual para la
prevencin del cncer del hospital general de Ojocaliente Zac.
El mantener informada a la poblacin en general de los factores de riesgo
que propician el cncer de mama es el trabajo primordial de los centros de
salud a lo largo de toda la Repblica Mexicana. Una primera etapa en la
prevencin de esta enfermedad comienza haciendo un balance en la vida
cotidiana, el ejercicio diario ha demostrado reducir el riesgo de padecer
cncer de mama en la poblacin en general pues, como se dijo
anteriormente, el sobrepeso se ha identificado como un factor de riesgo; el
mantener un IMC alto aumenta el riesgo de llegar a padecer cncer de
mama

postmenopusico

en

la

poblacin.

Es

importante

informar

adecuadamente de los beneficios de una actividad fsica de moderada a


vigorosa y una alimentacin balanceada, especialmente en las mujeres que
han presentado un IMC mayor a 30 que es donde se presenta un grado de
obesidad mrbido y que requiere atencin de un nutrilogo.

La deteccin temprana de este cncer es de vital importancia para dar el


mejor tratamiento, es importante que la comunidad conozca los factores de
riesgo de esta enfermedad comenzando por analizar si hay presencia de
estos factores en el seno familiar, identificando si hay familiares que
padezcan algn cncer y que tan cercano es el parentesco para saber si
representan algn riesgo o no. La elaboracin de un historial clnico tanto
familiar como personal facilita ampliamente la identificacin de muchas
enfermedades, el elaborar un historial enfocado en el cncer de mama
permite a las mujeres mayores a 35 aos que sean candidatas para
tratamientos hormonales y tomar las precauciones correspondientes. Sin
embargo la auto exploracin es un buen indicador de la presencia de alguna
anormalidad en el cuerpo, el sensibilizar a las mujeres para auto explorarse
es romper con tabs impuestos por la sociedad y el dar capacitaciones
favorece en un acertado diagnostico pues la mayora de tumores, tanto
benignos como malignos, son detectados por la autoexploracin, el paso a
seguir seran las pruebas mdicas: mastografa o mamografa (exploracin
de la glndula mamaria mediante rayos X), o la ecografa (exploracin del
tejido mamario utilizando un sistema de ultrasonido).
La primera se puede realizar en todas las mujeres a partir de los 40 aos y
ha demostrado disminuir la mortalidad por cncer de mama, al hacer
diagnsticos de la enfermedad en etapas tempranas. La segunda se
recomienda en mujeres jvenes (menos de 40 aos) que han tenido el
nmero de hijos planeado, o bien, que desean permanecer nulparas; se
sugiere hacer un examen bianual por un experto, una vez cumplidos 6
meses del destete del ltimo hijo y hasta los 40 aos.

Captulo 2: METODOLOGA
2.1 Factores de riesgo.
Se tienen varios antecedentes en la literatura (Cncer de mama: Factores de
riesgo), donde se mencionan los siguientes, como factores como de riesgo:

IMC Alto: El IMC (ndice de masa corporal) es una forma de asociar


el peso y la estatura de una persona mediante la formula
masa
IMC=
2
altura
En donde la masa se mide en kilogramos y la altura en metros, sin
embargo el resultado no es constante y vara de acuerdo a la edad
del individuo y el sexo del mismo. Este ndice es bastante utilizado
para evaluar la nutricin de un sujeto y determinar si este sufre
desnutricin, sobrepeso o algn grado de obesidad. Se establece la
siguiente tabla como una estimacin de los ndices de sobrepesos y
obesidad sujetos al IMC:

Tabla 1. ndice de Masa Corporal


IMC
Menor a
18
18
a
24.9
25
a
26.9

Clasificacin
Peso bajo
Normal
Sobrepeso

Mayor
27
27
29.9
30
39.9
Mayor
40

Obesidad

Obesidad I riesgo de padecer enfermedades cardiovasculares

Obesidad II riesgo muy alto de padecer enfermedades


cardiovasculares
Obesidad III riesgo extremo de padecer enfermedades
cardiovasculares

Se asume como factor de riesgo, pues los niveles de estrgeno son mayores
en las mujeres que presentan algn grado de obesidad, sobre todo en
mujeres postmenopusicas. (SITIO WEB DEL National Cancer Institute
http://www.cancer.gov)

Menarca Temprana: La Menarca es la primera menstruacin de


una mujer y se tiene una media de entre los 13 y 14 aos en Mxico.
Decimos que es temprana cuando aparece antes de esta edad y se
considera de riesgo por la exposicin a cambios hormonales que se
enfrenta la mama durante cada ciclo menstrual.

Lactancia: Tomamos la lactancia como un factor de prevencin


pues la misma produccin de leche limita la capacidad de las clulas
mamarias de actuar anormalmente; adems de que la mayora de
las mujeres tienen menos ciclos menstruales cuando amamantan, lo
cual se traduce en niveles ms bajos de estrgeno. Otra implicacin
que se deriva de la lactancia es que la mayora de las mujeres
tienden a ingerir alimentos ms nutritivos y a adoptar un estilo de
vida ms saludable. (SITIO WEB DE LA Organizacin de Cncer de
mama http://www,breastcancer.org)

Embarazos tardos: La edad ptima fisiolgica para que una


mujer se reproduzca es entre los 21 y 35 aos, pues su cuerpo est
en las mejores condiciones para soportar los diferentes cambios que
se presentan durante la gestacin. Despus de esta edad los
embarazos se tratan como de alto riesgo. El tener al menos un
embarazo se asume factor de proteccin, pues disminuye el nmero
de periodos menstruales en la vida de la mujer.

Exposicin a drogas: El abuso en todo tipo de drogas siempre trae


efectos negativos en el organismo. Se sabe, por ejemplo, que un
cigarrillo contiene cerca de siete mil sustancias activas que ingresan
al cuerpo durante su consumo; de sas al menos 70 son
carcingenos. (SITIO WEB Sociedad americana de Cncer
http://www.cancer.org)
Por otro lado, el Programa Nacional de Toxicologa del Departamento
de Salud y Servicios Humanos de los Estados Unidos, en su Informe
sobre Carcingenos, incluye en la lista el consumo de bebidas
alcohlicas como conocido carcingeno humano. (SITIO WEB DEL
Programa nacional de toxicologa http://ntp.niehs.nih.gov)

Uso de anticonceptivos: La constante exposicin a estrgenos


(componente principal en los anticonceptivos hormonales, se
presenta tambin como factor de riesgo. (BMC Cancer, pag8, 2009)

Menopausia: La llegada tarda de la menopausia, al igual que la


menarca temprana, se presenta como factor de riesgo. Se tiene
como media la aparicin de la menopausia a la edad de 50 aos, en
Mxico.

Antecedentes Familiares de cncer: El tener un pariente cercano


que haya padecido algn tipo de cncer ha sido reportado como
factor de riego. El cncer de mama puede darse en la familia si se ha
diagnosticado cncer de mama o cncer de ovario en parientes de
primer grado, como madres, hermanas, hermanos e hijos, o muchos
parientes cercanos (entre ellos abuelos, tas y tos, sobrinas y
sobrinos, nietos y primos), especialmente antes de los 50 aos.
Tambin es probable que el cncer de mama se d en la familia si el
pariente que desarroll cncer de mama es hombre, ya que esto
puede ser una seal de que los cambios genticos hereditarios
contribuyeron al riesgo de desarrollar cncer. Las mujeres con un
pariente de primer grado que desarroll cncer de mama tienen un
riesgo de aproximadamente el doble del riesgo promedio de una
mujer. Si dos parientes de primer grado desarrollaron cncer de
mama, el riesgo es de cinco veces el riesgo promedio. (SITIO WEB
Cancer.Net http://www.cancer.net)

Ejercicio: El sedentarismo se ha convertido en una actividad muy


comn en los Pases en vas de desarrollo. Smith y sus colegas
(2013) reportaron, en el estudio WISER, cambios en el metabolismo
de estrgenos de aquellas mujeres que se ejercitan 150 minutos
(moderado/ intenso) a la semana. (Norma E., Revista de
Especialidades Mdico-Quirrgica, vol. 19, nm. 2, 2014)

Edad: El riesgo de desarrollar cncer de mama aumenta a medida


que la mujer envejece pues las probabilidades de que se presenten
mutaciones en las clulas, se incrementa con la edad. (SITIO WEB
Cancer.Net http://www.cancer.net)

2.2 Recoleccin de Datos.


Se dise un instrumento estadstico de medicin, una encuesta. sta se
construy a partir de la necesidad de medir los factores descritos en el
apartado anterior: datos generales (domicilio, ocupacin, servicios de salud),
edad, altura y peso (IMC), edad de la menarca, edad de inicio de su vida
sexual, antecedentes de cncer en su familia, nmero de embarazos,
nmero de hijos, edad al primer embarazo, datos de lactancia, hbitos de
consumo de alcohol y tabaco, uso de mtodos anticonceptivos hormonales y
sedentarismo. La encuesta se pens para ser aplicada tanto a mujeres sanas
como a mujeres que haban presentado ya la enfermedad, por lo que se
incorpor un apartado para recolectar datos como: sntomas de la
enfermedad, edad a la que manifest los sntomas, tipo de cncer detectado,

forma de deteccin, tratamiento(s) y status actual de la enfermedad y de la


paciente.
De esta encuesta se generaron 16 variables cualitativas y a partir de ellas 12
variables dicotmicas, a saber:

Municipio
Cdigo Postal
Ocupacin
Servicios de Salud
Situacin Actual (embarazada, sin menopausia, pre-menopasica, en la
menopausia, paso la menopausia)
Edad
Menarca
Periodos menstruales
Mtodo anticonceptivo
Edad de la deteccin del cncer
Estatura
Peso
IMC
Parientes con cncer
Sabe explorarse
Inicio de su Vida Sexual
Numero de periodos

Y para las dicotmicas tenemos

Se ejercita: 1 si se ejercita, 0 si no.


Fuma: 1 si fuma o ha fumado alguna vez, 0 si no.
Bebe: 1 si ha ingerido alguna vez bebidas alcohlicas, 0 de lo
contrario.
Falta de hijos: 1 si es que tiene al menos un hijo 0 si es lo contrario.

En el caso de la variable Periodos menstruales, calculamos cuantos periodos


menstruales tuvieron los sujetos desde su primera menstruacin hasta la
aparicin de la menopausia considerando adems el nmero de embarazos
(en promedio) el resultado es un nmero entre 5 y 10.

La encuesta se aplic durante el periodo comprendido entre Agosto de 2014


y Octubre de 2015. La eleccin de las encuestadas sanas se hizo, primero,
de manera aleatoria. La encuesta se aplic en diferentes puntos de la Ciudad
de Zacatecas: Plaza Bicentenario, Central Camionera y Hospital General. La
situacin se complic cuando se requiri obtener informacin sobre el
paradero de las pacientes que cursaron o cursan el padecimiento de la
enfermedad, para tratar de aplicar la encuesta personalmente. En este caso
se opt por solicitar acceso a la informacin alojada en los sistemas y bases
de datos del Hospital General, lo que permiti la obtencin parcial de datos
para el llenado de las encuestas. De manera paralela se contact a un grupo
de pacientes que estaban en tratamiento en el Instituto de Servicios de
Seguridad Social para Trabajadores del Estado (ISSSTE), en una reunin
mensual que ellas hacen, y ah se encuest a las pacientes que accedieron a
proporcionar voluntariamente su informacin.

2.2.1 Tamao Muestral


La informacin que se tiene de casos reportados positivos para cncer de
mama en el Estado de Zacatecas, es de 350 (de 2001 a 2015), de acuerdo a
lo reportado por Servicios de Salud del Estado de Zacatecas (SSZ).
De la base de datos del Hospital General se lograron llenar datos de 40
encuestas de pacientes de cncer de mama.
De las reuniones del ISSSTE y casos que de coincidencia aparecieron en los
otros lugares donde se realiz la encuesta, se obtuvieron 23.
En cuanto a mujeres sanas, se obtuvieron de inicio 40 encuestas recabadas
de manera aleatoria, y 60 que se hicieron de manera especfica, de acuerdo
a grupos de edad, ocupacin y lugar de residencia; de tal manera que se
tuviera al menos un empate 1-1, en cuanto a caractersticas generales
(edad, peso, ocupacin, domicilio), de una mujer con cncer y una mujer

sana. Quedando la muestra conformada por 163 individuos, 63 que padecen


o padecieron la enfermedad y 100 sanas.
La muestra resulta estadsticamente significativa, pues el nmero de
mujeres enfermas encuestadas corresponde al 70% de las histricamente
reportadas en los ltimos 14 aos. El tener una muestra de 100 sanas, casi
una proporcin 2-1 respecto a las enfermas, asegura la representatividad de
la muestra (buscar referencia que lo justifique)

2.3 Regresin Logstica.


La regresin logstica es una herramienta estadstica que se utiliza en el
anlisis bivariado o multivariado, lo usamos cuando tenemos una variable
dicotmica (0 1) y un conjunto de variables predictoras o independientes,
que pueden ser cuantitativas o categricas. Hacemos este tipo de anlisis
para conocer la probabilidad de que ocurra cierto evento y determinar las
variables que aumentan o disminuyen la probabilidad de que suceda dicho
evento. Esta asignacin se basa en las caractersticas que llegan a presentar
los sujetos a los que se quiere observar, as se generar una variable para
esas probabilidades y se analizar el peso que tiene en el aumento o
disminucin de dicha probabilidad, observando los cambios que se generan a
partir del aumento o disminucin. El modelo estima entonces los coeficientes
de tales cambios y ser bueno si los estados pronosticados coinciden con los
estados reales de cada sujeto.
Los modelos de regresin logstica binaria son los de mayor inters ya que la
mayor parte de las circunstancias analizadas en medicina responden a este
modelo, y la variable dependiente la podemos adaptar a una dicotmica (0 y
1) que nos representar la probabilidad de que se ocurran las cualidades
ptimas para que se d o no cierta enfermedad.
La ecuacin que caracteriza a los modelos de regresin logstica es:

bi x i
n

b0 +
i=1

bi x i
n

b0 +
i=1

1+exp
exp
Pr ( y=1|x ) =
En la cual:
o

Pr ( y=1| X )
variables

es la probabilidad de que y sea 1 a partir del conjunto de


X .

es el conjunto finito

{x 1 , x 2 , , x n }

de covariables que conforman

el modelo.
b0 es la constante o trmino independiente del modelo.
o
o

bi

son los coeficientes de cada covariable.

Por tener la forma de una funcin exponencial, es natural pensar en aplicar


la funcin logaritmo natural para llegar a una forma ms simple y fcil de
manejar, comencemos con dividir la ecuacin por su complemento, que es la
probabilidad de que no se d un suceso y se denota, para esta funcin en
particular, como:
1Pr ( y =1|X )
Teniendo as la probabilidad de que un evento ocurra con respecto a que este
mismo no se llegue a realizar, dando como resultado la siguiente ecuacin:

bi xi
n

b 0+
i=1

Pr ( y =1|X )
=exp
1Pr ( y=1| X )
De esta manera construimos la Odds Ratio o Razn de posibilidades que por
lo regular es denotado como OR. Las OR se definen como la posibilidad de
que una condicin se presente en un grupo de poblacin frente al riesgo de
ocurra en otro grupo de poblacin. A pesar de haber simplificado un poco la
ecuacin, sigue siendo difcil su manejo e interpretacin de forma que
aplicamos el logaritmo natural a la funcin, dando como resultado:
ln

n
Pr ( y=1|x )
=b0 + bi x i
1Pr ( y=1|x )
i=1

Que es ahora una funcin lineal de sencillo manejo. El lado izquierdo de la


igualdad recibe el nombre de logit que no es ms que un logaritmo de las OR
mientras que el lado derecho es una expresin comn del modelo de
regresin lineal.

2.3.1 El modelo de regresin lineal.


La regresin lineal es una tcnica utilizada para analizar la relacin que hay
entre una o ms variables. El modelo nos permite estudiar la relacin entre
una variable dependiente

(Y )

con una o ms variables llamadas

predictoras, dando como resultado la siguiente ecuacin:


n

Y = 0 + i x i +
i=1

Los parmetros

i con i=1, n

son llamados coeficientes de regresin y

representan el cambio con respecto a las variables con cambio unitario


cuando todas las dems variables predictoras
constantes, al parmetro

x i( i j)

xj

se mantienen

se le llama constante del modelo. La variable

es un componente aleatorio de error y se supone que tiene un promedio


0 y una varianza desconocida. La forma de calcular los coeficientes de
regresin es usando el mtodo de mnimos cuadrados.

2.4 Mtodo de mnimos cuadrados.


El mtodo de mnimos cuadrados se puede aplicar para estimar los
coeficientes de regresin de la ecuacin del modelo de regresin lineal. La
funcin de mnimos cuadrados es:
n

S ( 0 , 1 , , k )= y i 0 j xij
i =1

j =1

En donde debemos de minimizar la funcin S con respecto a


cuales a su vez deben de satisfacer:

( 0, ^
1, , ^
k )=2 y i 0 j x ij =0
i=1

S ^

0
Y

j=1

0 , 1 , , k

los

( 0, ^
1, , ^
k )=2 y i 0 j x ij x ij=0 donde j=1,2, , k
i=1

j=1

S ^

j
Que una vez simplificada la ecuacin tenemos las ecuaciones normales de
mnimos cuadrados:
n

i=1

i=1

i=1

i=1

n^
0+ ^
1 x i1 + ^2 xi 2 ++ ^1 xik = y i

i=1
.
.
.

i=1
.
.
.

i=1
.
.
.

i=1
.
.
.

i =1
.
.
.

i=1

i=1

i =1

i =1

i=1

^
0 x i 1+ ^
1 x 2i 1+ ^2 xi 1 xi 2 +, ,+ ^2 xi 1 xi 2= x i 1 y i

2
^
0 x ik + ^
1 x ik x il + ^
2 x ik x i 2 +, ,+ ^
k x ik = x ik y i

Las soluciones para estas ecuaciones sern los estimadores por mnimos
cuadrados

^
0, ^
1 , ,

^
k

El manejo de modelos de regresin mltiple se vuelve ms sencillo cuando


los expresamos en notacin matricial. Representado de la siguiente manera:
y= X +

En donde: y es un vector de nx1 de observaciones,


nxp de variables regresoras,
regresin y

es una matriz de

es un vector de px1 de los coeficientes de

un vector de nx1 de errores aleatorios.

Esta forma de expresar las ecuaciones de mnimos cuadrados cumple todo lo


dicho anteriormente y la ecuacin normal para esta presentacin viene dada
de la siguiente manera:
X X ^=X y
Para resolver las ecuaciones multiplicamos a ambos lados por la matriz
inversa de

X X . As el estimador

por mnimos cuadrados es:

X X X y
^=

solo si la matriz inversa

X X 1

existe, esto siempre y cuando los

regresores sean linealmente independientes.

2.5 Estimacin de los coeficientes para el modelo


de regresin logstica.
La estimacin de los coeficientes del modelo se calcula con el estimador de
mxima verosimilitud, esto es se maximiza la probabilidad de obtener los
valores de la variable dependiente

(Y )

que fueron proporcionados por los

datos obtenidos de nuestra muestra. Para realizar este clculo se recurre a


mtodos iterativos, pues por lo general su clculo es complejo, de modo que
utilizamos paquetes estadsticos que faciliten dicha tarea. Una vez que
encontramos los coeficientes de regresin hay que comprobar que los
resultados no fueron obtenidos meramente por azar si no que hay
evidencias estadsticas que justifican a los coeficientes, a este proceso se le
conoce como significancia estadstica y para ello se pueden emplear tres
mtodos: estadstico de Wald, estadstico G de la razn de verosimilitud y la
prueba de Score.

2.5.1 Funcin de verosimilitud:


x0 , x1 , , xn

La funcin de verosimilitud para n variables aleatorias

se

define como la unin de densidades de las n variables aleatorias digamos,


x
( 1, , x n ; ),
f x , x
1

. Usualmente

la cual es considerada una funcin de

denotamos a esta funcin como

La funcin de verosimilitud

;x
L( 1, , x n ).

; x

L( 1 , , x n )

regresa la verosimilitud que las

variables aleatorias asumen al tomar un valor en particular para cada


x1 , , xn .

La verosimilitud es el valor de una funcin de densidad, as que

para variables aleatorias discretas es una probabilidad, entonces el si


suponemos que conocemos el valor de

digamos

tenemos pues

que el valor particular de las variables aleatorias que es ms probable en

ocurrir es el valor

x 1, , x n

tal que

x
( 1, , x n ; )
es un mximo.
f x , x
1

2.5.2 Estimador de mxima verosimilitud.

Sea

;x
L ( )=L( 1 , , x n )

aleatorias

valor de

x 1, , x n

. Si

la funcin de verosimilitud para las variables

( 1, , x n ) es una funcion de observaciones x1 , , xn


^ ^
donde =
^

que maximiza

de mxima verosimilitud de

L( ),

entonces

1,
( , x n )
^^ ^
=

es el

es el estimador

Los casos ms importantes que debemos de considerar son aquellos donde


x1 , x2, , xn

es una muestra aleatoria de una densidad

f ( X ; )

para la cual

la funcin de verosimilitud es
L ( )=f ( x 1 ; ) f ( x 2 ; ) f ( x n ;)

Y el estimador de mxima verosimilitud cumple con ser la solucin de la


ecuacin:
L ()
=0

Adems,

L( )

y Log L ( )

alcanzan el mismo mximo para el valor de

que en algunos casos es ms sencillo encontrar el mximo del logaritmo de


la funcin de verosimilitud. Si la funcin de mxima verosimilitud tiene k
parmetros, esto es que
n

L ( 1 , 2 , , k )= f ( x i , 1 , 2 , , k )
i=1

entonces los estimadores de mxima verosimilitud para cada parmetro


vienen dados por
L ( 1 , 2 , , k )

^ 1 , ^ 2 , , ^ k ,

que son los valores que maximizan

y para determinarlos debemos de encontrar solucin del

siguiente sistema de ecuaciones:

L ( 1 , 2 , , k )
=0
1

L ( 1 , 2 , , k )
=0
2

L( 1 , 2 , , k )
=0
k

Que al igual que en el caso de un solo parmetro, puede llegar a ser ms til
trabajar con el logaritmo de la funcin de mxima verosimilitud.

El clculo de los parmetros

^
0

^
, 1

,,

^
n

en el modelo de regresin

logstica depende de la funcin verosmil asociada a una muestra de tamao


N, que se denota

L( ( x 1 , y 1 ) , ( x2 , y 2 ) , , ( x n , y n ) , 0 , 1 , , n )

y se asocia a un

modelo de regresin logstica con parmetros


Y

0 , 1 , , n

con una variable

del tipo dicotmico, se tiene entonces que:

( Y =1| x( j) )
1P

y
P ( Y =1|x ( j) )
j

L ( ( x 1 , y 1 ) , ( x 2 , y 2 ) , , ( x n , y n) , 0 , 1 , , n ) =
j=1

Por otra parte tenemos que los valores que maximizan a los parmetros
0 , 1 , , n
con

los

en la funcin
valores

L ( ( x 1 , y 1 ) , ( x 2 , y 2 ) , , ( x n , y n) , 0 , 1 , , n )
que

maximizan

log ( L ( ( x 1 , y1 ) , ( x 2 , y 2 ) , , ( x n , y n ) , 0 , 1 , , n ) )

la

coincide
funcin

tenemos que:
N

j=1

j =1

j
j
j
j
log ( L ( ( x 1 , y1 ) , ( x 2 , y 2 ) , , ( x n , y n ) , 0 , 1 , , n ) )= y LogP ( Y =1|x ) + (1 y ) log ( 1P ( Y =1| x ) )

Y aplicando el procedimiento previamente descrito, los estimadores mximo


verosmiles

^ 0 , ^ 1 , , ^ n

para los parmetros

resolver el siguiente sistema de ecuaciones:

0 , 1 , , n

se obtienen la

i xi j
n

0+
i=1

i xi j
n

0+
i=1

y j
j =1
N

lnL
=
0 j =1

i xi j
n

0+
i=1

i xi j
n

0+
i=1

e
x1j
j

j
1

y x
j=1
N

lnL
=
1 j =1

i xi j
n

0+
i=1

i xi j
n

0+
i=1

e
xnj
j

j
n

y x
j=1
N

lnL
=
n j =1
Para realizar este clculo se recurre a mtodos iterativos, pues por lo general
su clculo es complejo, de modo que utilizamos paquetes estadsticos que
faciliten dicha tarea. Una vez que encontramos los coeficientes de regresin
hay que comprobar que los resultados no fueron obtenidos meramente por
azar sino que hay evidencias estadsticas que justifican a los coeficientes,
a este proceso se le conoce como significancia estadstica y para ello
hacemos uso de las siguientes pruebas.

2.5.3 Test de la razn de verosimilitud.


La prueba consiste en hacer una comparacin de dos verosimilitudes, el
objetivo es comparar el producto entre -2 y el logaritmo natural de dos
modelos de regresin logstica con el percentil correspondiente de una
distribucin

2 , uno es denominado modelo completo (full model) frente al

que se conoce como modelo reducido (reduced model), podemos ver al


segundo modelo como un submodelo del primero ya que solo difieren en la
cantidad de variables ubicadas en cada modelo. Se realizara un juego de
hiptesis para poder aplicar el Test, la hiptesis nula de esta prueba
establece que los parmetros que corresponden a las variables que estn en
el modelo completo pero no en el reducido, sern iguales a cero.

El test funciona de la siguiente forma: considrense tres modelos de


regresin logstica en su forma de logit:
Modelo 1:

logit P1 ( Y =1| X )= + 1 x 1 + 2 x 2

Modelo 2:

logit P2 ( Y =1|X )= + 1 x 1 + 2 x 2 + 3 x 3

Modelo 3:

logit P2 ( Y =1|X )= + 1 x 1 + 2 x 2 + 3 x 3 + 4 x 4

Es claro que el modelo 2 es una extensin del modelo 1 y a su vez el modelo


3 es una extensin del segundo. Para este caso y por mera simplicidad
comparemos el modelo 2 frente al modelo 1.
Denotaremos como

^
L1 , ^
L2 y ^
L3

a los valores de mxima verosimilitud

obtenidos para cada modelo con respecto a una muestra de tamao N, como
ya antes se haba mencionado, mientras ms parmetros tiene un modelo
mejor se ajustar a los datos y por la forma en que se construyeron los
modelos anteriores se tiene lo siguiente:
^
L1 ^
L2 ^
L3
Adems, el logaritmo de una funcin es creciente de modo que:
ln ^
L1 ln ^
L2 ln ^
L3

Y as
2 ln ^
L3 2 ln ^
L2 2 ln ^
L1
Esta es la relacin existente entre las funciones de verosimilitud, tambin
conocida como likelihood statistic. Considerando lo anterior, el test de la
razn de verosimilitud (LR) toma en cuenta la resta de dos log likelihood
statistics.
Empleemos el modelo 2 frente al modelo 1, nuestra hiptesis nula es que
3=0,

pues este parmetro no pertenece al modelo 1, entonces se tiene el

siguiente juego de hiptesis:


H 0 : 3=0
H 1 : 3 0

El test trabaja de la siguiente manera: si la variable

x3

tiene una gran

contribucin en la modelizacin y hace que el Modelo 2 se ajuste mucho


mejor a los datos del modelo 1, se tiene entonces que.
^L2
as
L^ 1
0
L^ 2

y al tomar el

ln

L^ 1

L^ 2

ln

del cociente

>

^L1

de aqu tenemos
2 ln

^L1
+
^L2

^L1
2
ln
Por tanto mientras mayor sea el valor de LR
^L2
estaremos de la hiptesis nula
x3

de

fuera

H 0 : 3=0

ms en contra

. Por otra parte, si la contribucin

mnima

se

tendra

que:

L^ 1
1
L^ 2
y por lo tanto
ln

L^ 1
0
L^ 2

finalmente
2 ln

^L1
0
^L2

Entonces se podra decir que LR


H0 ,

2 ln

una distribucin de probabilidad

^L1
^L2

2r

sigue, bajo la hiptesis nula

con N suficientemente grande,

los grados de libertad en la distribucin sern igual al nmero de parmetros


que se igualaran a cero en el modelo completo frente al modelo reducido.

2.6 Mtodo de Newton Raphson.


El mtodo de Newton-Raphson es un mtodo iterativo que permite aproximar
la solucin de ecuaciones del tipo

f (x)=0

de manera eficiente. Tambin

puede ser usado para encontrar el mximo y el mnimo de una funcin


encontrando la solucin de

f ( x)=0 .

Partimos de una estimacin inicial

x0

y se construye la siguiente sucesin

de aproximaciones
x j+1 =x j

f ( x j)
f ( x j)

Comenzamos identificando la funcin f y llevndola a la forma


calculamos luego

f ( x) ,

f ( x)=0,

teniendo esto pasamos a la construccin de la

formula de recurrencia:
x j+1 =x j

f ( x j)
f ( x j)

Tomamos una estimacin inicial

x0

, por lo general esta estimacin se elige

como la ms cercana a la solucin y se calculan despus las aproximaciones.


El algoritmo se detendr segn el nmero de decimales que se quiera tener
en la solucin, por ejemplo si queremos aproximar una solucin con 6
decimales detendremos el mtodo cuando dos o ms aproximaciones
consecutivas lleguen a coincidir hasta el decimal nmero 8.

El mtodo de Newton Raphson en nuestro caso se aplicara en la funcin de


mxima verosimilitud denotada como:
L ( )=f ( x 1 ; ) f ( x 2 ; ) f ( x n ;)

Que al sustituir en la frmula anterior, la funcin a iterar ser:

j+1= j

Pues

L( j)
L ( j )

es el parmetro a estimar y como se explic anteriormente


L ()=

L ()

2.7 La prueba de Wald.


Esta prueba constituye otra forma de lleva acabo pruebas de hiptesis
acerca de parmetros sin necesidad de usar el test de la razn de
verosimilitud, sin embargo el test de Wald tan solo puede aplicarse para
probar un nico parmetro. Debemos de tener en cuenta el denominado
estadstico de Wald para la variable en cuestin, en este caso denotada por
Xj

donde el estadstico queda definido como:


^
^ j
X j=
^
S^

Siendo

^
j

S^

las estimaciones mximo verosmiles de

y de su

correspondiente desviacin estndar. Se verifica entonces que el cociente:

^
j
N ( 0,1)
^
S
j

Esto es que sigue una distribucin normal de media 0 y con varianza igual a
1 y sirve para rechazar o aceptar la hiptesis nula establecida sobre el
jesimo

parmetro,

H 0 : j=0
H A : j 0
La obtencin de significacin indica que dicho coeficiente es diferente de 0 y
merece ser conservado en el modelo, por eso el uso de la prueba de Wald en
un solo parmetro.

2.8 La Curva ROC


La toma de decisiones es un proceso complejo en el que se deber de
valorar la utilidad de un sujeto de acuerdo a la prueba diagnstica que se
est realizando. Es de vital importancia conocer a detalle que tan exactas
son las diferentes pruebas diagnsticas y su capacidad para clasificar
correctamente a los sujetos en categoras o estados en relacin con la
variable a probar.
Por lo general se expresa la exactitud diagnostica por medio de sensibilidad
y especificidad. Cuando se usa una prueba dicotmica la Sensibilidad es la
probabilidad de clasificar correctamente a un individuo cuyo estado real sea
el definido como positivo respecto a la condicin que se est estudiando. La
Especificidad es la probabilidad de clasificar correctamente a un individuo
cuyo estado real est definido como negativo.

Una

curva

ROC

es

un

grfico

que

muestra

todos

los

pares

sensibilidad/especificidad resultantes de la variacin continua de los puntos


de corte en todo el rango de resultados observados. Mediante la
representacin de pares (especificidad, sensibilidad), la curva ROC nos
proporciona una representacin global de la exactitud diagnostica. Para
reflejar correctamente la relacin entre especificidad y sensibilidad la curva
ROC debe de ser estrictamente creciente, la curva ROC sera la diagonal que
une los vrtices inferior izquierdo y superior derecho. La exactitud de la
prueba aumente a medida que la curva se desplaza desde a diagonal hacia
el vrtice superior izquierdo, para obtener un modelo excelente la curva
debera de reflejar el 100% de sensibilidad y el 100% de especificidad lo que
hara que la curva pasara por el vrtice superior izquierdo.
El rea bajo la curva (AUC) es la probabilidad de clasificar correctamente un
par de individuos uno sano y otro enfermo, seleccionados al azar de la
poblacin, mediante los resultados obtenidos al aplicarles la prueba. Esto
sugiere que el rea bajo la curva ROC se puede emplear como un ndice
conveniente

de

la

exactitud

de

la

prueba;

la

exactitud

mxima

corresponder a un valor de 1 y la mnima de 0.5. (Curvas ROC, 1998, Act


2001)

2.9 XLSTAT.
XLSTAT es un complemento de la paquetera de Microsoft Oficce diseado
para que en conjunto con Excel, facilite el manejo de modelacin de datos.
Empleamos este complemento para realizar todas las modelaciones por
regresin logstica, como se mencion antes los mtodos con los que
estamos trabajando son de naturaleza recursiva y el hacerlas manualmente
nos podra tomar mucho tiempo.
La forma de ingresar los datos es muy similar a cualquier otro programa
estadstico, comenzamos seleccionando nuestra variable de respuesta Y,
despus

seleccionamos

nuestro

conjunto

de

variables

dicotmicas

{x 1 , , x n

} la interfaz del programa nos permite modificar el nmero de

iteraciones que el programa realizar antes de arrojar los datos de la


regresin, adems de permitirnos elegir el tipo de modelo con el cual se
presentar la ecuacin una vez sean encontrados los coeficientes betas que
buscamos adems de poder elegir uno de los mtodos antes mencionados
para los cuales nuestro modelo tiene un mejor se ajuste y de misma manera
el intervalo de confianza que mejor nos parezca.
En esto sentido los objetivos de esta investigacin son encontrar algunas
respuestas al porque el cncer de mama se ha convertido en una de las
primeras causas de muerte en la repblica mexicana, tomando como punto
de partida el Estado de zacatecas.
Se pretende corroborar los factores de riesgo identificados para esta
enfermedad y de igual manera identificar cules de estos son los que mayor
riesgo representan para las personas.
El estudio de una enfermedad como el cncer es de vital importancia para la
sociedad en estos tiempos modernos ya que es a causa de la desinformacin
que las muertes por dicha enfermedad se hayan incrementado, tanto sector
salud como gobierno del estado pueden lanzar campaas ms eficientes
para combatir la desinformacin y romper tabs entre la comunidad al dar a
conocer los factores de mayor riesgo a los que estn expuestos.

CAPITULO 3 RESULADOS
Se analizaron un total de 163 casos, de los cuales se tienen 63 casos
positivos para cncer de mama y 100 negativos para la enfermedad siendo
su porcentaje el de 61% y 39% respectivamente.

si; 39%
no; 61%

Figura 4. Poblacin con Cncer

Una de las formas ms eficientes para detectar esta enfermedad es la auto


exploracin, y para la muestra se tiene que solo el 18% de la poblacin no
sabe cmo explorarse a s misma en comparacin del 82% que si lo sabe.

no; 18%

si; 82%

Figura 5. Auto-exploracin
De los 63 casos positivos para cncer se tiene que al 15.87% de la poblacin
la deteccin de la enfermedad fue antes de cumplir los 40 aos de edad,
mientras que al 58.73% se le detecto entre los 40 y los 60 aos de edad y al
25.4% se le detecto despus de los 60 aos de edad.

menos de 40; 16%


mayor de 60; 25%

menos de 60; 59%

Figura 6. Edad de la Deteccin del Cncer

La edad de la poblacin varia con respecto a la edad de la deteccin del


cncer, se tiene entonces que el 30.06% de toda la poblacin tiene menos
de 40 aos, el 32.52% tiene entre 60 y 40 aos de edad y finalmente el
37.42% tiene ms de 60 aos de edad. Esto con la finalidad de tener una
proporcin de casi 2 mujeres sanas por cada 1 mujer con cncer.

60 y mas; 37%

menos de 40; 30%

menos de 60; 33%

Figura 7. Edad
Dada la diversidad de las edad, se analiz tambin la ocupacin de cada
mujer en lo que se puede apreciar que el 77% de la poblacin se dedica al
hogar, solo el 17% tiene una carrera universitaria y la ejerce y el 6% de toda
la poblacin se dedica a otras actividades como lo son: el servicio a casas, el
comercio, la costura, etc.

Economicamente activo; 23%

hogar; 77%

Figura 8. Ocupacin
Como la encuesta tambin se realiz en diversos centros de salud se detect
que el 67% de la muestra cuenta con el Seguro Popular, el 19% est afiliado
al IMSS, el 12% al ISSSTE y solo un 2% de la poblacin no cuenta con ningn
servicio de salud.

no tiene; 2%

IMSS; 19%
ISSSTE; 12%

Seguro Popular; 67%

Figura 9. Servicios de Salud


Conocer los hbitos de cada mujer de la muestra fue determinante en la
creacin de las variables a analizar con la regresin. Una de las primeras
variables a analizar fue la cantidad de mujeres que realizan ejercicio de lo
que se descubri que el 62% de la poblacin al menos camina dos veces por

semana mientras que el 38% no hace otro ejercicio ms que el que se realiza
en sus labores diarias

no hace; 38%
hace; 62%

Figura 10. Actividad Fsica.


Adems de la falta de ejercicio se busc la ingesta de bebidas alcohlicas y
si se consume el cigarrillo para lo cual se obtuvo que solo el 34% de la
poblacin ha consumida alguna vez en su vida una bebida alcohlica
mientras que el 66% no.

si ; 34%
no; 66%

Figura 11. Ingesta de Bebidas Alcohlicas.

Mientras que para el consumo de tabaco el 77% de la poblacin nunca ha


probado un cigarrillo mientras que el 23% asegura haberlo hecho al menos
una vez.

si; 23%

no; 77%

Figura 12. Tabaquismo


Uno de los factores importantes para esta enfermada ha sido la obesidad y
sobrepeso, para la muestra se tiene que el 25% de las mujeres tienen un
peso dentro de lo normal, el 15% tiene sobrepeso, el 31% tiene de obesidad
del tipo I y el 29% sufre de obesidad tipo II, todo esto de acuerdo a la tabla
descrita en el captulo 2.

obesidad II; 29%

normal ; 25%

sobrepeso; 15%
obesisda I; 31%

Figura 13. ndice de Masa Corporal


A partir de eso se determin el factor obesidad, de lo cual el 61% de la
poblacin tiene obesidad ya sea tipo I o II mientras que el 39% restante
mantiene su peso normal o padece de sobrepeso.

no; 41%
si; 59%

Figura 14. Prevalencia de Obesidad


Dentro de los factores hormonales contamos a la menarca temprana como
uno de los ms importantes pues marca el inicio de los cambios hormonales
de modo que para la muestra el anlisis arrojo que el 55% de toda la
poblacin tuvo su primera menstruacin de trece aos o ms mientras que el
45% entra en el rango de una menarca temprana.

no; 55%

si; 45%

Figura 15. Menarca Temprana (menor a 13a)


El inicio de la vida sexual est considerado dentro de los 18 aos de edad
pero se tiene que solo el 48% de la poblacin comenz su vida sexual mayor
a esta edad mientras que el 52% comenz a edad temprana.

mayor de 18; 48%

menor de 18; 52%

Figura 16. Inicio de la Vida Sexual


Con el inicio de la vida sexual vienen los mtodos de planeacin y el uso de
anticonceptivos, de modo que el 64% de la poblacin asegura usar algn
mtodo anticonceptivo mientras que 36% restante no practica ningn
mtodo.

No; 36%
Si; 64%

Figura 17. Uso de Mtodos Anticonceptivos

Del 64% de las mujeres que afirman usar algn tipo de mtodo
anticonceptivo se tiene que el 84% usa un anticonceptivo del tipo hormonal
y solo el 16% usa los mtodos de barrera.

no; 16%

si; 84%

Figura 18. Mtodo Hormonal


Con respecto a esto se pregunt a las mujeres de la muestra cul era su
situacin actual con respecto a su periodo menstrual, de lo cual se tiene que
solo un 1% de la poblacin estaba embarazada, el 48% aun no llega a la
menopausia, un 1% est en la pre-menopausia, el 16% se encuentra en la
misma y el 34% restante ya paso por este cambio.

paso la menopausia; 34%


sin menopausia; 48%
menopausia; 17%
Pre-menopausia; 1% Embarazada; 1%

Figura 19. Datos Ginecolgicos (menstruacin)


De acuerdo a los cambios hormonales que sufren las mujeres a lo largo de su
vida, se crea la variable Periodos la cual es un promedio entre la edad de la
menarca, el nmero de embarazos y la edad actual de cada sujeto, de modo
que el resultado es un nmero entre 5 y 10. Para esto se tiene que de 5 a 7
la cantidad de periodos es normal mientras que de 8 a 10 se dice que la
cantidad de periodos es mayor a lo normal. As que para el 40% de la
poblacin el nmero de periodos es menor a 8 mientras que el 60% rebasa
esta cantidad.

menor a 8; 40%
mayor a 8; 60%

Figura 20. Periodos

Un factor de prevencin ha sido la presencia de hijos y de la muestra se


tiene que el 40% no tiene hijos y el 60% restante tiene al menos un hijo.

sin hijos; 40%


con hijos; 60%

Figura 21. Datos Ginecolgicos (Hijos)


Como otro factor de prevencin se cuenta la lactancia, y de la muestra se
tiene que el 70% de la poblacin amamanto al menos a un hijo mientras que
el 30% restante por una u otra razn no ha amamantado.

no; 30%

si; 70%

Figura 22. Lactancia

Finalmente se busc si hay parientes directos con algn tipo de cncer y se


encontr que el 40% de la poblacin tiene al menos un pariente cercano con
algn cncer mientras que el 60% contesto que no o, aseguro no saber.

si; 40%
no; 60%

Figura 23. Antecedentes de Cncer en la Familia


Con la finalidad de obtener los mejores resultados se hizo una primera
regresin con todas las variables. La muestra se redujo a 91 casos, 22 con
cncer y 69 sanos pues solo de ellos se pudo recopilar todos los datos
necesarios para esta investigacin lo que nos da una proporcin de 3 a 1.
Tabla 2. Variables con sus respectivos coeficientes para este modelo
Fuente
Var Ind

Valor
-

Menarca
periodos
Hijos
hormonal/T

31.151
1.052
3.567
0.275
-0.328

iempo
detectado
IMC
Alcohol
Fuma

-0.222
0.000
-1.968
1.491

PcC
IVS
Lactancia

0.106
-0.015
0.219

(aos)
ejercicio
Falta de

-1.600
-1.541

hijos
Hijos

0.000

La ecuacin correspondiente a dichos coeficientes es:


Pred (Cancer )=

1/(1+exp ((31.15127+1.052Me+3.567pe +0.274Hi0.327h/T 0.221det+0.000IMC1.967A

Tabla 3. Clasificacin para la muestra de estimacin (Variable Cncer)


de \ a
0
1
Total

0
63
9
72

1
6
13
19

Total
69
22
91

% correcto
91.30%
59.09%
83.52%

De acuerdo a la tabla anterior podemos ver como el modelo tiene una


sensibilidad del 91.3% para la poblacin de mujeres sanas, lo que implica
que el modelo predice correctamente 63 0s de los 69 totales fallando en 6.
Mientras que para la poblacin de cncer se tiene que el modelo falla en 9 1
s de los 22 totales acertando en 22 lo que nos da una Especificidad de
59.09%. En general el modelo promedia un 83.52% lo que nos da un modelo
bueno.
La curva ROC nos da una idea grafica de la eficiencia del modelo.

Curva ROC (AUC=0.866)


1
0.9
0.8
0.7
0.6

Sensibilidad

0.5
0.4
0.3
0.2
0.1
0
0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1 - Especificidad

Figura 24. Curva ROC

Una curva ROC debe de tener un rea bajo la curva de 1 y como se observa
esta tiene 0.866, que nos da un modelo muy bueno con respecto a la
variable cncer.

Tabla 5. Pruebas de Wald, Score y Verosimilitud


Estadstica

-2
Log(Verosimilit
ud)

Chi-

Pr >

cuadrad

Chi

o
32.98751
008

0.002

Score

26.03914

0.017

Wald

277
18.01263

0.157

508

Como se dijo anteriormente las pruebas de Wald, Score y Verosimilitud


ayudan a corroborar que el modelo para la regresin sea bueno, en este caso
se puede observar como las tres pruebas tienes una probabilidad muy
cercana al 0 lo que indica que el modelo es muy bueno. Un modelo excelente
es el que llegue a tener una probabilidad 0.0001 en cada prueba.
A pesar de hacer una regresin con todas las variables se busca la mejor
combinacin de variables que optimice el modelo, pues no todas tienen la
misma significancia para el modelo. Con este razonamiento se obtuvieron las
siguientes regresiones.
Tabla 6. Variables con sus respectivos coeficientes para este modelo:
Fuente
Var Ind
Menarca
periodos
hormonal/Ti
empo
detectado
IMC
Lactancia

Valor
-23.333
0.542
2.543
-0.243
-0.123
0.010
0.284

(aos)

La ecuacin correspondiente a dichos coeficientes es:


Pred (Cancer )=

1
(1+exp((23.332+0.541Me+ 2.543pe0.242h/T 0.123det+0.010IMC +0.283Lac)))

Tabla 7. Tabla de clasificacin para la muestra de estimacin (Variable Cncer)


de \ a
0
1
Total

0
66
16
82

1
3
6
9

Total
69
22
91

% correcto
95.65%
27.27%
79.12%

De acuerdo a la tabla anterior podemos ver como el modelo tiene una


sensibilidad del 95.65% para la poblacin de mujeres sanas, lo que implica
que el modelo predice correctamente 66 0s de los 69 totales fallando en 3.
Mientras que para la poblacin de cncer se tiene que el modelo falla en 16
1s de los 22 totales acertando en 6 lo que nos da una Especificidad de
27.27%. En general el modelo promedia un 79.12% lo que no nos da un
modelo bueno sin embargo tampoco es un modelo malo.
Curva ROC (AUC=0.815)
1
0.9
0.8
0.7
0.6

Sensibilidad

0.5
0.4
0.3
0.2
0.1
0
0

0.1

0.2

0.3

0.4

0.5

0.6

1 - Especificidad

Figura 25. Curva ROC

0.7

0.8

0.9

Una curva ROC debe de tener un rea bajo la curva de 1 y como se observa
esta tiene 0.815, que nos da un modelo bueno con respecto a la variable
cncer.
Tabla 8. Pruebas de Wald, Score y Verosimilitud
Estadstica

Chi-

Pr >

cuadra

Chi

do
19.411

-2
Log(Verosimilit

0.004

9384

ud)
Score

15.877

0.014

Wald

8979
13.204

0.040

1668

Las pruebas de Wald, Score y Verosimilitud ayudan a corroborar que el


modelo para la regresin sea bueno, en este caso se puede observar como
las tres pruebas tienes una probabilidad muy cercana al 0 lo que indica que
el modelo es muy bueno a pesar de que el rea bajo la curva sea de .815.
Tabla 9. Variables con sus respectivos coeficientes para este modelo
Fuente
Var ind
Menarca
detectado
IMC
Lactancia
(aos)
ejercicio
hormonal/Ti
empo
periodos

Valor
-24.215
0.643
-0.148
0.006
0.264
-1.203
-0.262
2.747

La ecuacin correspondiente a dichos coeficientes es:

Pred (Cancer )=

1
(1+exp((24.214 +0.643Me0.148De+ 0.005IMC +0.263L1.203E0.261h /T +2.7

Tabla 10. Tabla de clasificacin para la muestra de estimacin (Variable Cncer)


de \ a
0
1
Total

0
64
10
74

1
5
12
17

Total
69
22
91

% correcto
92.75%
54.55%
83.52%

De acuerdo a la tabla anterior podemos ver como el modelo tiene una


sensibilidad del 92.75% para la poblacin de mujeres sanas, lo que implica
que el modelo predice correctamente 64 0s de los 69 totales fallando en 5.
Mientras que para la poblacin de cncer se tiene que el modelo falla en 10
1s de los 22 totales acertando en 12 lo que nos da una Especificidad de
54.55%. En general el modelo promedia un 83.52% lo que nos da un modelo
bueno.

Curva ROC (AUC=0.828)


1
0.9
0.8
0.7
0.6

Sensibilidad

0.5
0.4
0.3
0.2
0.1
0
0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1 - Especificidad

Figura 26. Curva ROC


Una curva ROC debe de tener un rea bajo la curva de 1 y como se observa
esta tiene 0.828, que nos da un modelo bueno con respecto a la variable
cncer.

Tabla 11. Pruebas de Wald, Score y Verosimilitud


Estadstica
-2

Chicuadrado
23.4368641

Pr >
Chi
0.001

Log(Verosimilit
ud)
Score
Wald

20.0212833
15.5046267

0.006
0.030

Las pruebas de Wald, Score y Verosimilitud ayudan a corroborar que el


modelo para la regresin sea bueno, en este caso se puede observar como
las tres pruebas tienes una probabilidad muy cercana al 0 lo que indica que
el modelo es muy bueno a pesar de que el rea bajo la curva sea de .828.
Tabla 12. Variables con sus respectivos coeficientes para este modelo
Fuente
Var Ind
Menarc

Valor
-21.846
0.640

a
periodo

2.460

s
detecta

-0.135

do
Alcohol
Fuma
ejercici

-1.867
1.341
-1.205

La ecuacin para estas variables es:


Pred (Cancer )=

1
(1+exp((21.845+ 0.640Me+2.460pe0.134de1.866Al+ 1.341F1.205ej)))

Tabla 13. Tabla de clasificacin para la muestra de estimacin (Variable Cncer)


de \ a
0
1
Total

0
64
9
73

1
5
13
18

Total
69
22
91

% correcto
92.75%
59.09%
84.62%

De acuerdo a la tabla anterior podemos ver como el modelo tiene una


sensibilidad del 92.75% para la poblacin de mujeres sanas, lo que implica
que el modelo predice correctamente 64 0s de los 69 totales fallando en 5.
Mientras que para la poblacin de cncer se tiene que el modelo falla en 9 1
s de los 22 totales acertando en 13 lo que nos da una Especificidad de
59.09%. En general el modelo promedia un 84.62% lo que nos da un modelo
muy bueno.

Curva ROC (AUC=0.829)


1

0.9

0.8

0.7

0.6

Sensibilidad

0.5

0.4

0.3

0.2

0.1

0
0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1 - Especificidad

Figura 27. Curva ROC


Una curva ROC debe de tener un rea bajo la curva de 1 y como se observa
esta tiene 0.829, que nos da un modelo bueno con respecto a la variable
cncer.

Tabla 14. Pruebas de Wald, Score y Verosimilitud


Estadstica

-2

Chi-

Pr >

cuadra

Chi

do
27.2871

0.000

Log(Verosimilit

682

ud)
Score

22.2526

0.001

Wald

839
17.2400

0.008

893

Las pruebas de Wald, Score y Verosimilitud ayudan a corroborar que el


modelo para la regresin sea bueno, en este caso se puede observar como
las tres pruebas tienes una probabilidad muy cercana al 0 lo que indica que
el modelo es muy bueno a pesar de que el rea bajo la curva sea de .829.
Tabla 15. Variables con sus respectivos coeficientes para este modelo
Fuente
Var Ind
Menarca
detectado
IMC
Lactancia

Valor
-24.070
0.676
-0.154
-0.014
0.277

(aos)
ejercicio
hormonal/Ti

-1.256
-0.279

empo
periodos
IVS

2.867
-0.034

La ecuacin correspondiente a dichos coeficientes es:

Pred (Cancer )=

1
(1+exp((24.069+ 0.676Me0.154de0.013IMC + 0.276Lac1.255ej0.278h/T +2.8

Tabla 16. Clasificacin para la muestra de estimacin (Variable Cncer)


de \ a
0
1
Total

0
64
11
75

1
5
11
16

Total
69
22
91

% correcto
92.75%
50.00%
82.42%

De acuerdo a la tabla anterior podemos ver como el modelo tiene una


sensibilidad del 92.75% para la poblacin de mujeres sanas, lo que implica
que el modelo predice correctamente 64 0s de los 69 totales fallando en 5.
Mientras que para la poblacin de cncer se tiene que el modelo falla en 11
1s de los 22 totales acertando en 11 lo que nos da una Especificidad de
50.00%. En general el modelo promedia un 82.42% lo que nos da un modelo
bueno.

Curva ROC (AUC=0.837)


1
0.9
0.8
0.7
0.6

Sensibilidad

0.5
0.4
0.3
0.2
0.1
0
0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1 - Especificidad

Figura 28. Curva ROC


Una curva ROC debe de tener un rea bajo la curva de 1 y como se observa
esta tiene 0.837, que nos da un modelo bueno con respecto a la variable
cncer.

Tabla 17. Pruebas de Wald, Score y Verosimilitud


Estadstica

-2

Chi-

Pr >

cuadrad

Chi

o
23.93653

0.002

Log(Verosimi

49

litud)
Score

20.23232

0.009

Wald

51
15.53940

0.049

28

Las pruebas de Wald, Score y Verosimilitud ayudan a corroborar que el


modelo para la regresin sea bueno, en este caso se puede observar como
las tres pruebas tienes una probabilidad muy cercana al 0 lo que indica que
el modelo es muy bueno a pesar de que el rea bajo la curva sea de .837.
Tabla 18. Variables con sus respectivos coeficientes para este modelo
Fuente
Var Ind
Menarc

Valor
-18.032
0.590

a
periodo

2.040

s
detecta

-0.105

do
Alcohol
Fuma
ejercici

-1.912
1.603
-1.585

o
Falta de

-1.256

hijos

La ecuacin correspondiente a dichos coeficientes es:


Pred (Cancer )=

1
(1+exp((18.031+0.590Me+ 2.040pe0.104de1.911Al+1.603Fu1.585ej1.255

Tabla 19. Clasificacin para la muestra de estimacin (Variable Cncer)


de \ a

Total

% correcto

0
1
Total

64
9
73

5
13
18

69
22
91

92.75%
59.09%
84.62%

De acuerdo a la tabla anterior podemos ver como el modelo tiene una


sensibilidad del 92.75% para la poblacin de mujeres sanas, lo que implica
que el modelo predice correctamente 64 0s de los 69 totales fallando en 5.
Mientras que para la poblacin de cncer se tiene que el modelo falla en 9 1
s de los 22 totales acertando en 13 lo que nos da una Especificidad de
59.09%. En general el modelo promedia un 84.62% lo que nos da un modelo
bueno.

Curva ROC (AUC=0.846)


1

0.9

0.8

0.7

0.6

Sensibilidad

0.5

0.4

0.3

0.2

0.1

0
0

0.1

0.2

0.3

0.4

0.5

0.6

1 - Especificidad

Figura 29. Curva ROC

0.7

0.8

0.9

Una curva ROC debe de tener un rea bajo la curva de 1 y como se observa
esta tiene 0.846, que nos da un modelo bueno con respecto a la variable
cncer.

Tabla 20. Pruebas de Wald, Score y Verosimilitud


Estadstica

-2
Log(Verosimi

Chi-

Pr >

cuadrad

Chi

o
28.86200

0.000

65

litud)
Score

24.13037

0.001

Wald

09
17.53252

0.014

89

Las pruebas de Wald, Score y Verosimilitud ayudan a corroborar que el


modelo para la regresin sea bueno, en este caso se puede observar como
las tres pruebas tienes una probabilidad muy cercana al 0 lo que indica que
el modelo es muy bueno a pesar de que el rea bajo la curva sea de .846.

CAPITULO 4 CONCLUSIONES.
En este trabajo se dise un instrumento estadstico de medicin, una
encuesta. sta se construy a partir de la necesidad de medir los factores:
datos generales (domicilio, ocupacin, servicios de salud), edad, altura y
peso

(IMC), edad de la menarca, edad de inicio de su vida sexual,

antecedentes de cncer en su familia, nmero de embarazos, nmero de


hijos, edad al primer embarazo, datos de lactancia, hbitos de consumo de
alcohol

tabaco,

uso

de

mtodos

anticonceptivos

hormonales

sedentarismo. La encuesta se aplic tanto a mujeres sanas como a mujeres


que haban presentado ya la enfermedad, por lo que se incorpor un
apartado para recolectar datos como: sntomas de la enfermedad, edad a la
que manifest los sntomas, tipo de cncer detectado, forma de deteccin,
tratamiento(s) y status actual de la enfermedad y de la paciente. sta se
aplic a mujeres del estado de Zacatecas, en busca de los factores que
predominan en el padecimiento de este cncer tomando una muestra
aleatoria de pacientes con cncer de mama y mujeres sanas.

Los resultados obtenidos en la investigacin nos dicen mucho acerca de los


mtodos que se emplean en la medicin de los factores de riesgo para el
cncer de mama. En lo que corresponde a la estadstica simple, la mayora
de la poblacin prefiere el uso de anticonceptivos del tipo hormonal y ms
del 50% padece de obesidad tipo I o tipo II lo que revela un alto ndice de
masa corporal en la sociedad zacatecana. La variable Periodos resulto tener
una alta presencia en la poblacin lo que demuestra que a pesar de la
presencia de hijos la carga hormonal sigue siendo alta en su cuerpo. El no
fumar o ingerir bebidas alcohlicas tuvo un ndice alto de casos negativos
sin embargo estuvieron presente en la mayora de las regresiones lo que
corrobora que el alejarse de stos los convierte en factores de prevencin, al
igual que la lactancia juega un papel similar dentro de las regresiones.
A pesar de que se comprob que las variables descritas en la literatura
como de ms relevancia (Lactancia, Falta de ejercicio, IMC alto, Menarca
temprana) para la enfermedad estn presentes en la poblacin en general,
no son las de mayor relevancia para este modelo de regresin. Resulta
interesante observar que es que se obtuvieron cinco combinaciones buenas
de factores para el modelo de cncer y en todas, la mayora de las variables
corresponden a factores hormonales. Se comprob adems que el tener
hijos es un factor importante de proteccin pues comparando la segunda
regresin con la quinta, vemos un incremento significante en el rea bajo la
curva tomando en cuenta que se usaron las mismas variables para estas
regresiones.

Lo

correspondiente

los

factores

que

marcan

el

comportamiento de la poblacin la falta de ejercicio est muy presente lo


que clasifica a este factor como de prevencin.
Consecuencia de los resultados obtenidos es la importancia de factores
asociados al comportamiento cotidiano de las mujeres, el cuidado de la
salud en general y el tener hbitos saludables. La falta de ejercicio
contribuye enormemente al incremento del ndice de masa corporal lo que
propicia la Obesidad de cualquier tipo y se ha relacionado a esta con

desordenes hormonal que pueden llegar a perjudicar la salud, adems del


aumento en el uso de los mtodos anticonceptivos del tipo hormonal ya sea
por mayor comodidad o placer es una carga mayor al cuerpo de hormonas
que este no produce en tal cantidad o que suprime la creacin de otras. El
descuidar estos aspectos solo nos demuestra que la mujer mexicana con el
paso del tiempo se est convirtiendo cada vez ms sedentaria.

Apndice.

Bibliografa
Referencias
Abuin, J. R. (2007). Regresin lineal multiple. Madird: Instituto de Econommia
y Geografa.
Al., L. J. (2009). Brast cancer epidemiology according to recognized breast
cancer risk factors in the Prostate, Lung, Colorectal and Oyarian (PLCO)
Cancer Screening Trial Cohort. BMC Cancer 9:84, 8.
Curvas ROC. (1998, Act 2001). Unidad de Epidemiologia Clinica y
Bioestadistica, 229 - 235.
Dennis D Wackerly, W. M. (2010). Estadstica matemtica con aplicaciones
(septima edicin). Cosegraf.
Douglas C. Montgomery, E. a. (2006). introduccin al Anlisis de Regresin
Lineal (Tercera Edicin). Mexico: Continental.
Felicia Marie Knaul, G. N.-O. (2009). Cncer de mama en Mxico: uan
prioridad apremiante. Salud Publica Mex;51, 335-344.
George Casella, R. L. (2002). Statistical Inference Second Edition. DUXBURY,
Thomson Learning.
Instituto Nacional del Cncer. (s.f.). Obtenido de Obesidad y Riesgo de
Cncer: http://www.cancer.gov/espanol/cancer/causasprevencion/riesgo/obesidad/hoja-informativa-obesidad#q4
M, S. A. (Prev 2013). The effects of aerobic exercise on strogen metabolism in
healthy premenopausal women. En S. A. M.

Ma. J. Aguilar Cordero, M. N. (2012;27(5)). Factores de riesgo como


pronstico de padecer cncer de mama en un estado de Mxico.
Nutricin Hospitalaria, 1631-1636.
Mood A.M., G. F. (1974). Introduction to the Throry of Statistics. McGraw-Hill.
Norma Estela Herrera Gonzlez, G. G. (2014). Sedentarismo, obesidad y
cncer de mama: factores de riesgo para una via en comn. Revista de
Especialidades Medico-Quirurgica, vol. 19, num 2 , 251-257.
Palacios, F. (2008). Resolucion aproximada de ecuaciones: Mtodo de
Newton-Raphson. Calalua: Escuela politecnica superior de ingenieria
de manresa .
Pedro Larra, I. I. (2002). Regresin Logistica. Espaa: Departamento de
Ciencias de la Computacion e Inteligencia Artificial.
Smith A, P. W. (Prev 2013;22). The effects of aerobic exercise on estrogen
metabolism in healthy premenopausal women. Cancer Epidemiol
Biomarkers, 756 - 764.
V. Pando Fernndez, R. San Martn Fernndez. (2004). Actas de la Reunion de
la Modelizacion Forestal, 323-327.
V. Valds, A. P. (2010). Fisiologa de la glandula mamaria y lactancia.

Dictopografia
American Cancer Society. (Consultado el 2015) Obtenido de Qu es lo
daino del Tabaco?:
http://www.cancer.org/espanol/cancer/queesloquecausaelcancer/tabac
oycancer/fragmentado/preguntas-acerca-del-habito-de-fumar-eltabaco-y-la-salud-cancer-and-health

Archivos de Medicina. (Consultado el 2015) de


http://www.archivosdemedicina.com/medicina-de-familia/carcinomaductal-infiltrante-el-tipo-de-cncer-de-mama-ms-comn.pdf
Cncer de mama: Factores de riesgo. (Consultado el 2015) Obtenido de
Cancer.Net: http://www.cancer.net/es/tipos-de-c%C3%A1ncer/c
%C3%A1ncer-de-mama/factores-de-riesgo
Epidemiologa del Cncer de Mama. (Consultado el 2015) Obtenido de
gob.mx:
http://www.gob.mx/cms/uploads/attachment/file/11986/epidemdelC.pdf
Instituto Nacional del Cncer. (Consultado el 2015) de Nacional Institute of
Cancer: http://www.cancer.gov/espanol/cancer/que-es
La lactancia durante ms tiempo parece ofrecer proteccin contra el cncer
de mama. (Consultado el 2015) Obtenido de BREASTCANCER.ORG:
http://www.breastcancer.org/es/noticias-investigacion/20130904-4
Nacional Toxicology Program. (Consultado el 2015) Obtenido de U. S.
Departmen of Heal and Human Services:
http://ntp.niehs.nih.gov/pubhealth/roc/roc13/index.html
Regresin Logistica. (Consultado el 2015) de http://www.seqc.es/dl.asp?
175.145.205.255.15.30.27.21.118.133.24.113.255.173.47.5.166.145.6
5.152.249.7.59.180.219.25.233.119.115.80.195.223.111.199.213.21.1
99.153.103.112.234.91.165.216.192.188
Regresin Logstica. (Consultado el 2015) de
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/DM/tema2d
m.pdf
Universidad Peruana Cayetano Hereida. (Consultado el 2015) Obtenido de
Curso de Lactancia Materna:
http://www.upch.edu.pe/ehas/pediatria/lactancia%20materna

Vous aimerez peut-être aussi