Vous êtes sur la page 1sur 28

Análisis Descriptivo Bivariado

Saúl Díaz Navarro


Análisis Descriptivo Bivariado
Permite realizar un verdadero “análisis”
(división), que acompañado de las debidas
comparaciones genera un escudriño
exhaustivo de los datos.

Comparación de Porcentajes y de
promedios para ciertos valores de otra
variable.
Ejemplos
Comparar el promedio de ventas de cada uno
de los asesores comerciales.
Comparar el promedio de calificaciones de los
estudiantes diurnos con el de los estudiantes
nocturnos.
Comparar el porcentaje de enfermos entre los
que tienen un hábito y entre los que no lo
tienen.
Comparar el nivel de calidad de la materia
prima de dos proveedores.
Tablas de Contingencia
También llamadas:
Tablas de Doble Entrada
Cruces de Variables (cross tab)
Tablas de 2*2
Tablas de distribución de frecuencia
bivariadas
Tablas de Contingencia

Muestran la distribución de frecuencias


de una variable, de manera diferenciada,
para cada uno de los valores (o grupo de
valores) de otra variable.
Tabaquismo y Cáncer de Pulmón

Cantidad de Personas Según Tabaquismo y Aparición de Cáncer


Tabaquismo Cáncer No Cáncer Total
No Fuma 4 32 36

Fumador Moderado 21 45 66

Fumador no Moderado 75 22 97

Total 100 99 199

Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280


Porcentaje Columna

Cantidad de Personas Según Tabaquismo y Aparición de Cáncer


Tabaquismo Cáncer No Cáncer Total
No Fuma 4 32 36
4% 32% 18%
Fumador Moderado 21 45 66
21% 45% 33%
Fumador no Moderado 75 22 97
75% 22% 49%
Total 100 99 199
100% 100% 100%
Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280
Porcentaje Fila
Cantidad de Personas Según Tabaquismo y Aparición de Cáncer
Tabaquismo Cáncer No Cáncer Total
No Fuma 4 11% 32 89% 36 100%

Fumador Moderado 21 32% 45 68% 66 100%

Fumador no Moderado 75 77% 22 23% 97 100%

Total 100 50% 99 50% 199 100%

Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280


Porcentaje Total
Cantidad de Personas Según Tabaquismo y Aparición de Cáncer
Tabaquismo Cáncer No Cáncer Total
No Fuma 4 32 36
2% 16% 18%
Fumador Moderado 21 45 66
11% 23% 33%
Fumador no Moderado 75 22 97
38% 11% 49%
Total 100 99 199
50% 50% 100%
Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280
Tabla Completa
Cantidad de Personas Según Tabaquismo y Aparición de Cáncer
Tabaquismo Cáncer No Cáncer Total
No Fuma 4 11% 32 89% 36 100%
4% 2% 32% 16% 18% 18%
Fumador Moderado 21 32% 45 68% 66 100%
21% 11% 45% 23% 33% 33%
Fumador no Moderado 75 77% 22 23% 97 100%
75% 38% 22% 11% 49% 49%
Total 100 50% 99 50% 199 100%
100% 50% 100% 50% 100% 100%
Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280

nij % fila
% Col % Total
Análisis
Cambia la distribución porcentual de la
condición “Cáncer” y “No Cáncer” según
los distintos valores de tabaquismo?
Podemos decir que el Tabaquismo es la
causa del Cáncer?
Podemos decir que el Cáncer es la causa
del Tabaquismo?
Que podemos interpretar?
Análisis
Podemos decir que el tabaquismo, no
afecta la aparición del cáncer?

Aunque no podamos, con un tabla de


contingencia, comprobar una relación
causa efecto, si podemos encontrar
evidencia de asociación o correlación
estadística.
Análisis

Las comparación distribución de la


aparición de cáncer (Variable respuesta)
para entre cada uno de los niveles de
tabaquismo (Factor) permite concluir que
existe una asociación estadística entre el
tabaquismo y la aparición de cáncer.
El tabaquismo es un factor de riesgo
asociado a la aparición de cáncer.
Los Valores de Tabaquismo pueden tomar
los nombre de X1, X2 y X3.

Los valores de Cáncer pueden tomar los


valores Y1 y Y2.
Simbología
Cantidad de Personas Según Tabaquismo y Aparición de Cáncer
Tabaquismo Y1 Y2 Y*
X1 n11 n12 n1*
h11 h12 h1*
X2 n21 n22 n2*
h21 h22 h2*
X3 n31 n32 n3*
h31 h32 h3*
X* n*1 n*2 n**
h*1 h*2 h*3
Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280
Simbologia
Cantidad de Personas Según Tabaquismo y Aparición de Cáncer
Tabaquismo Y1 Y2 Y*
X1 n11 n12 n1*
h11 h12 h1*
X2 n21 n22 n2*
h21 h22 h2*
X3 n31 n32 n3*
h31 h32 h3*
X* n*1 n*2 n**
h*1 h*2 h*3
Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280
Frecuencias Relativas (Total tabla)

𝑛𝑖𝑗
hij =
𝑛
Frecuencia condicional

𝑛𝑖𝑗
ℎሺ𝑋𝑖 ȁ 𝑌𝑗) =
𝑛∗𝑗

Es la proporción equivalente al porcentaje


columna.
Estudiantes según plan de estudios y
Genero Sexual.
GENERO PLAN DE ESTUDIOS
SEXUAL Administració Mercadeo Total
n
Hombre 42 14 56
Mujer 18 6 24
Total 60 20 80
Estudiantes según plan de estudios y
Genero Sexual.

La proporción de género sexual cambia


según el plan de estudios?

La proporción de plan de estudios, cambia


en los distintos géneros sexuales?

Existe alguna asociación estadística entre las


variables plan de estudios y género sexual?
Estudiantes según plan de estudios y
Genero Sexual.
Distribución de Estudiantes Según Género Sexual y Plan de Estudios.
Género Sexual Plan de Estudios
Administración (Y1) Mercadeo (Y2) Total n i*
Masculino 42 70% 18 30% 60 100%
X1 75% 53% 75% 23% 75% 75%
Femenino 14 70% 6 30% 20 100%
X2 25% 18% 25% 8% 25% 25%
Total n*j 56 70% 24 30% 80 100%
100% 70% 100% 30% 100% 100%

nij % fila nij h(Yj|Xi)


% Col % Total h(Xi|Yj) % Total
Estudiantes según plan de estudios y
Genero Sexual.

La proporción de género sexual NO cambia


según el plan de estudios

La proporción de plan de estudios, NO cambia


en los distintos géneros sexuales

NO Existe alguna asociación estadística entre


las variables plan de estudios y género sexual.
Hay Independencia estadística
Independencia Estadística

.h(Xi / Yj) = h(Xi) para todo i, j

.h(Xi ∩ Yj) = h(Xi) * h(Yj)

.h(Xi ∩ Yj) = (hi* ) * (h*j)

Cuando no hay independencia, habrá


dependencia.
Distribución con Independencia
Estadística (Sin dependencia)

Distribución de Estudiantes Según Género Sexual y Plan de Estudios.


Género Sexual Plan de Estudios
Administración (Y1) Mercadeo (Y2) Total n i*
Masculino 60
X1 75%
Femenino 20
X2 25%
Total n*j 56 70% 24 30% 80

nij % fila nij h(Yj|Xi)


% Col % Total h(Xi|Yj) % Total
Distribución con Independencia
Estadística (Sin dependencia)

Distribución de Estudiantes Según Género Sexual y Plan de Estudios.


Género Sexual Plan de Estudios
Administración (Y1) Mercadeo (Y2) Total n i*
Masculino 60
X1 75% 75% 75%
Femenino 20
X2 25% 25% 25%
Total n*j 56 70% 24 30% 80

nij % fila nij h(Yj|Xi)


% Col % Total h(Xi|Yj) % Total
42 (0,7*0,75)= 0,525

Género Sexual Plan de Estudios


Administración (Y1) Mercadeo (Y2) Total n i*
Masculino (0,525*80)
X1 (0,7*0,75) 75%
Femenino
X2 25%
Total n*j 70% 30% 80

nij % fila nij h(Yj|Xi)


% Col % Total h(Xi|Yj) % Total
Coeficiente de Contigencia h2 de cramer.

Compara la distribución bivariada


observada con la distribución bivariado
que resultaría bajo la hipótesis de
independencia estadística.

0 <= h2 <= 1
H2= 0 Total independencia. No hay
dependencia. Caso de Estudiantes por
genero y plan de estudios.

H2=1 Nula Independencia. Máximo


grado de dependencia.

Vous aimerez peut-être aussi