Vous êtes sur la page 1sur 69

ESTADÍSTICA APLICADA A

LA INVESTIGACIÓN

Dr. Harold Guevara


“Me lo contaron y lo olvidé. Lo vi y lo
entendí. Lo hice y lo aprendí”.

Confucio
¿Para qué sirve la estadística?
 La Ciencia se ocupa en general de fenómenos observables

 La Ciencia se desarrolla observando hechos, formulando leyes


que los explican y realizando experimentos para validar o
rechazar dichas leyes

 La Estadística se utiliza como tecnología al servicio de las


ciencias donde la variabilidad y la incertidumbre forman parte
de su naturaleza
Definición
La Estadística es la Ciencia de la

• Sistematización, recogida, ordenación y presentación


(Descriptiva) de los datos referentes a un fenómeno que
presenta variabilidad o incertidumbre para su estudio
metódico, con el objeto de

• deducir las leyes (Probabilidad) que rigen esos fenómenos,

• y poder de esa forma hacer previsiones sobre los mismos, tomar


decisiones u obtener conclusiones (Inferencial)
Otras definiciones
 Rama de la matemática usada para el manejo
de datos numéricos y para estudiar la
variación de diferentes fenómenos
(Puertas y col, 1998)

 Es el arte y la ciencia de manejar los números


cuando expresan los valores cuantitativos de
hechos similares (Ledezma, 1998)
Pasos en un estudio estadístico
 Plantear hipótesis sobre una población
 Los fumadores tienen “más reposos” laborales que los no
fumadores
 ¿En qué sentido? ¿Mayor número? ¿Tiempo medio?

 Decidir qué datos recoger (diseño del estudio)


 Qué individuos pertenecerán al estudio (muestras)
 Fumadores y no fumadores en edad laboral.
 Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen
enfermedades crónicas?
 Qué datos recoger de los mismos (variables)
 Número de reposos
 Tiempo de duración de cada reposo
 ¿Sexo? ¿Sector laboral? ¿Otros factores?

 Recoger los datos (muestreo)


 ¿Estratificado? ¿Sistemáticamente?
Pasos en un estudio estadístico
 Describir (resumir) los datos obtenidos
 tiempo medio de reposo en fumadores y no (estadísticos)
 % de reposos por fumadores y sexo (frecuencias), gráficos,...

 Realizar una inferencia sobre la población


 Los fumadores están de reposo al menos 10 días/año más en
promedio que los no fumadores.

 Cuantificar la confianza en la inferencia


 Nivel de confianza del 95%
 Nivel de significancia: p = 5%
ANALISIS DE DATOS

 ANALISIS UNIVARIADO: se usa al examinar una sola variable


independiente.
 De acuerdo al tipo de información requerida pueden calcularse:
 Medidas de tendencia central(media aritmetica, la mediana, y la
moda), medidas de posicion(los cuartiles Q, los deciles D, y los
percentiles P), y medidas de dispersion o variabilidad(desviacion
media DM, desviacion estandar S, varianza S², coeficiente de
variacion CV).
 Analisis bivariado: se usa para estudiar la relacion de dos
variables simultaneas.
Permite realizar estudio de:
 Dos variables de intervalos :coeficiente de correlacion lineal
pearson, analisis de regresion simple, entre otros.
 Dos variables ordinales: coeficientes de correlacion por rangos
spearman.
 Dos variables nominales: coeficiente de contingencia, pruebas
de ji cuadrado.
 Análisis multivariado: se usa para estudiar las relaciones de mas
de dos variables simultaneas. Analisis de regresion multiple.
 En los problemas de marketing inciden muchas variables que se
requiere analizar, para generar los resultados adecuados a la
investigacion, sin embargo hay que tener cuidado en el manejo
estadistico de las variables para no incurrir en errores propios
de la estadistica.
Método científico y estadística

Plantear Diseñar
hipótesis estudio

Obtener Recoger datos


conclusiones y analizarlos
Población y muestra
 Población (population) es el conjunto sobre el
que estamos interesados en obtener
conclusiones (hacer inferencia).
 Normalmente es demasiado grande para
poder abarcarlo
 Se simboliza como N

 Muestra (sample) es un subconjunto suyo al


que tenemos acceso y sobre el que realmente
hacemos las observaciones (mediciones)
 Debería ser “representativo”
 Esta formado por miembros
“seleccionados” de la población
(individuos, unidades experimentales).
 Se simboliza como n
Población y muestra
 Parámetro: medida de resumen de una
característica en la población. Ejemplo: media
poblacional, error estándar, proporción en la
población

 Estadístico: medida de una característica en la


muestra. Ejemplo: media muestral, desviación
estándar, proporción muestral
Variables
 Una variable es una característica observable
que puede asumir distintos valores entre los
individuos de una población. La información que
disponemos de cada individuo es resumida en
variables.

 En los individuos de la población venezolana, de


uno a otro es variable:

 El grupo sanguíneo
 {A, B, AB, O}  Var. Cualitativa

Nominal
 Su nivel de felicidad “declarado”
 {Deprimido, Intermedio, Muy Feliz} 

Var. Ordinal
 El número de hijos
 {0,1,2,3,...}  Var. Numérica discreta

 La altura
 {1’62 ; 1’74; ...}  Var. Numérica

continua
Tipos de variables
 Cualitativas
Si sus valores no se pueden asociar naturalmente
a un número (no se pueden hacer operaciones
algebraicas con ellos)

 Nominales: Si sus valores no se pueden ordenar


 Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

 Ordinales: Si sus valores se pueden ordenar


 Respuesta a un tratamiento, grado de satisfacción,
intensidad del dolor, tiempo de estancia en el puerto
Tipos de variables
 Cuantitativas
Si sus valores son numéricos (tiene sentido
hacer operaciones algebraicas con ellos)

 Discretas: Si toma valores enteros


 Número de hijos, cigarrillos, abortos,
exámenes realizados, n° productos importados/mes

 Continuas: Si entre dos valores, son posibles


infinitos valores intermedios.
 Altura, Presión intraocular, Dosis de medicamento,
edad, cc de un producto líquido, precio/container
Codificación de variables
 Es buena idea codificar las variables como números para poder
procesarlas con facilidad en un ordenador.

 Es conveniente asignar “etiquetas” a los valores de las variables


para recordar qué significan los códigos numéricos.

 Sexo (Cualit: Códigos arbitrarios)


 0 = Femenino

 1 = Masculino

 Síndrome Metabólico (Cualit: Códigos arbitrarios)


 0 = No

 1 = Sí
Codificación de variables

 Felicidad Ordinal: Respetar un orden al codificar.


 0 = Muy feliz

 1 = Bastante feliz

 2 = Poco feliz

 3 = Infeliz

 Se pueden asignar códigos a respuestas especiales como


 0 = No sabe

 99 = No contesta..

 Se deben tener en cuenta los Datos perdidos (‘missing data’)


Codificación de variables
Recordar siempre el verdadero tipo de variable
EL MÉTODO DEL
MUESTREO
Población y muestra
 Población (population) es el conjunto
sobre el que estamos interesados en obtener
conclusiones (hacer inferencia).
 Normalmente es demasiado grande
para poder abarcarlo
 Se simboliza como N

 Muestra (sample) es un subconjunto suyo


al que tenemos acceso y sobre el que
realmente hacemos las observaciones
(mediciones)
 Debería ser “representativo”
 Se simboliza como n
Universo y muestra
 Parámetro: medida de resumen de una
característica en la población. Ejemplo: media
poblacional, error estándar, proporción en la
población

 Estadístico: medida de una característica en la


muestra. Ejemplo: media muestral, desviación
estándar, proporción muestral
Plan de Muestreo

 Tener en cuenta objetivos del estudio

 Información sobre el universo

 Nivel de confianza adoptado y error de


estimación permitido

 Recursos disponibles
Plan de Muestreo

 Métodos y técnicas a utilizar

 Recopilación y análisis de datos

 Representatividad de la muestra:
 Cantidad: cálculo de n
 Calidad: aleatoria
Tipos de Muestras

 Probabilísticas, aleatorias o al azar:


Todos los integrantes de la población (N)
tienen una probabilidad conocida y
diferente de cero de formar parte
de la muestra (n)

 No probabilísticas o no aleatorias
Muestras Probabilísticas
 Aleatoria simple
 Azar simple
 Azar sistemático: K = N/n

 Aleatoria estratificada
 Aleatoria por conglomerados
 Aleatoria polietápica
 Aleatoria mixta
Muestras No Probabilísticas

 Intencional u Opinática

 Voluntaria

 Errática o Circunstancial
Cálculo del tamaño de la muestra (n)

 Se conoce N: ______N_____
1 + (N x P2)

 Se conoce s: s2 x z2
P2 z = 1,96

 Se conoce la proporción de sujetos con la característica


de interés (p): _p x q x z2
p + q = 100% ó 1 P2
Recolección de la
Información
Actividades de la Recolección de datos

 Elección adecuada de la(s) fuente(s) de


información

 Elaboración o selección del instrumento de


recolección de datos

 Administración del instrumento de


recolección
Tipos de fuentes de información

 Primarias: fuente original de los datos

 Secundarias:

 Registro continuo: historia clínica

 Registro periódico: censos

 Registro ocasional: investigaciones aisladas


Calidad de la Información
 Accesibilidad: ética, legal, administrativa

La información debe ser:

 Fidedigna
 Oportuna
 Pertinente
 Completa
Construcción del instrumento de
recolección de datos
 Preguntas claras, concisas, de fácil comprensión

 Cada pregunta: una idea y un sujeto, relación con el tema

 Nº y orden de las preguntas

 Preguntas cerradas o en abanico

 Evitar temas personales o privados


Presentación del instrumento de
recolección de datos

 Nota de presentación:
 Finalidad de la encuesta, beneficios, usos que se dará a la
información, consentimiento informado
 Solicitud de colaboración y sinceridad a los encuestados
 Nombre de la entidad o institución que respalda

 Instructivo para contestar

 Tamaño y presentación amigables al usuario


Técnicas de Recolección de
Información

Información no registrada
 Interrogatorio: conversación con propósito
(entrevista) o interrogatorio indirecto (cuestionario)
 Observación: obtención de información a través de
los sentidos

Información registrada
 Revisión documental
Instrumentos de Recolección de
Información
 Encuesta

 Cuestionario

 Guía de observación o Lista de cotejo

 Fichas

 Escalas
ELABORACIÓN O
PROCESAMIENTO DE DATOS
Procesamiento de datos
 Revisión de los datos

 Ordenación y clasificación

 Computación

 Presentación de la información: cuadros y


gráficos
Partes de un cuadro estadístico
 Encbezamiento:
 Nº del cuadro

 Título: qué, cómo, dónde y cuándo

 Matriz o molde: primera columna y primera fila

 Cuerpo: cruce de filas con columnas

 Pie: fuente y notas explicativas


Tipos de cuadros estadísticos
 De distribución de frecuencias

 De asociación

 Series cronológicas
Presentación ordenada de datos
7

5
Género Frec.
4
Hombre 4 3

1
Mujer 6
0
Hombre Mujer

 Las tablas de frecuencias y las representaciones gráficas son


dos maneras equivalentes de presentar la información. Las
dos exponen ordenadamente la información recogida en una
muestra.
Tablas de frecuencias
 Exponen la información recogida en la muestra, de forma que
no se pierda nada de información (o poca).

 Frecuencias absolutas: Contabilizan el número de individuos


de cada modalidad

 Frecuencias relativas (porcentajes): Idem, pero dividido por


el total

 Frecuencias acumuladas: Sólo tienen sentido para variables


ordinales y numéricas
 Muy útiles para calcular cuartiles
Tablas de frecuencias
Sexo del encuestado
Número de hijos
Porcentaje
Frecuencia Porcentaje válido Porcentaje Porcentaje
Válidos Hombre 636 41,9 41,9 Frecuencia Porcentaje válido acumulado
Válidos 0 419 27,6 27,8 27,8
Mujer 881 58,1 58,1
1 255 16,8 16,9 44,7
Total 1517 100,0 100,0 2 375 24,7 24,9 69,5
3 215 14,2 14,2 83,8
Nivel de felicidad 4 127 8,4 8,4 92,2
Porcentaje Porcentaje 5 54 3,6 3,6 95,8
Frecuencia Porcentaje válido acumulado 6 24 1,6 1,6 97,3
Válidos Muy feliz 467 30,8 31,1 31,1
7 23 1,5 1,5 98,9
Bastante feliz 872 57,5 58,0 89,0
No demasiado feliz 165 10,9 11,0 100,0 Ocho o más 17 1,1 1,1 100,0
Total 1504 99,1 100,0 Total 1509 99,5 100,0
Perdidos No contesta 13 ,9 Perdidos No contesta 8 ,5
Total 1517 100,0 Total 1517 100,0
Ejemplo
 ¿Cuántos individuos tienen menos Número de hijos
de 2 hijos?
 frec. indiv. sin hijos Porcent. Porcent.
+ Frec. (válido) acum.
frec. indiv. con 1 hijo 0 419 27,8 27,8
= 419 + 255
= 674 individuos 1 255 16,9 44,7
2 375 24,9 69,5
 ¿Qué porcentaje de sujetos 3 215 14,2 83,8
tiene 6 hijos o menos? 4 127 8,4 92,2
 97,3% 5 54 3,6 95,8
6 24 1,6 97,3
 ¿Qué cantidad de hijos es tal 7 23 1,5 98,9
que al menos el 50% de la Ocho+ 17 1,1 100,0
población tiene una
cantidad inferior o igual? Total 1509 100,0
 2 hijos
Gráficos de distribución de
frecuencias

Variable Gráfico

Nominal, ordinal y Barras simples o


numérica discreta diagrama sectorial

Numérica continua Histograma, polígono


de frecuencias o curva
integral
Tipos de gráficos de asociación
Variable Gráfico

Ambas Nominales, ambas Barras múltiples o


ordinales o Barras proporcionadas
Nominal y ordinal

Numérica y Nominal, Polígono


Numérica y Ordinal de frecuencias

Ambas numéricas Diagrama de puntos


Gráficos para
variables cualitativas
Diagramas de barras
 Alturas proporcionales a las frecuencias
(abs. o rel.)
 Se pueden aplicar también a variables numéricas discretas

 Diagramas de sectores (tartas, tortas, pies)


 Evitar usarlo con variables ordinales.
 El área de cada sector es proporcional a su frecuencia (abs. o
rel.)
MANUAL PARA EL MANEJO SEGURO DE DESECHOS
BIOLÓGICOS EN UNA EMPRESA DE SALUD.
VALENCIA, OCTUBRE 2010.
Cuadro Nº 1
DISTRIBUCIÓN DE SUJETOS SEGÚN USO DE EQUIPOS
DE PROTECCIÓN PERSONAL.

Equipos de Protección Personal n %


Guantes 22 69
Mascarilla 4 13
Botas de Seguridad 4 13
Lentes de Seguridad 2 5
Total 32 100

Fuente: Datos de la Investigación


MANUAL PARA EL MANEJO SEGURO DE DESECHOS
BIOLÓGICOS EN UNA EMPRESA DE SALUD.
VALENCIA, OCTUBRE 2010.
Gráfico Nº 1

DISTRIBUCIÓN DE SUJETOS SEGÚN USO DE EQUIPOS


DE PROTECCIÓN PERSONAL.

Fuente: Cuadro N° 1
Cuadro N° 2
Distribución de trabajadores según edad, sexo, estado civil, nivel
de instrucción y condición laboral.
EDAD (años) n %

18-27 5 12,5
28-37 15 37,5
38-47 14 35,0
48-57 4 10,0
58-67 2 5,0
SEXO n %
Masculino 34 85,0
Femenino 6 15,0
ESTADO CIVIL n %
Casado 26 65,0
Soltero 7 17,5
Concubino 5 12,5
Divorciado 2 5,0
NIVEL DE INSTRUCCIÓN n %
Licenciado 8 20,0
Técnico Superior 5 12,5
Bachiller 13 32,5
Bachillerato incompleto 7 17,5
Primaria 7 17,5
CONDICIÓN LABORAL n %
Empleado 20 50,0
Obrero 20 50,0
TOTAL 40 100

Fuente: instrumento de recolección de datos


Gráfico N° 2
Distribución de trabajadores según sexo
15%

Fuente: Instrumento de recolección de datos


Gráfico N° 3
Distribución de trabajadores según nivel de
instrucción.

32,5%

20%

Fuente: Instrumento de recolección de datos


Cuadro Nº 3
Cuadro Nº 3
Distribución de los trabajadores según el
Distribución de los trabajadores según el
conocimiento que tienen sobre la
conocimiento que tienen sobre la
discapacidad laboral y su manejo
discapacidad laboral y su manejo

Conocimiento sobre
n %
discapacidad laboral

Regular (4-6 puntos) 4 16,0

Bueno (7-9 puntos) 14 56,0

Muy Bueno (10-12 puntos) 7 28,0

Total 25 100

Fuente: Instrumento de recolección de datos


Gráfico Nº 4
Distribución de los trabajadores según el conocimiento
que tienen sobre la discapacidad laboral y su manejo

Fuente: Instrumento de recolección de datos


Gráficos para variables numéricas
 Son diferentes en función de
que las variables sean 400
419

discretas o continuas. Valen


375

con frec. absolutas o


relativas. 300

255

Recuento
215

 Diagramas de barras 200

para numéricas 127

discretas 100

 Se deja un espacio
54
24 23 17
entre barras para
indicar los valores 0 1 2 3 4 5 6 7 Ocho o más

Número de hijos
que no son posibles
Construcción de clases en variables
numéricas continuas

• Cálculo del Rango: Lmayor – Lmenor

• Intervalo de clase: ___Rango___


Nº clases

• Centro de clases: __Li+Ls real__


2
Gráficos para variables numéricas
 Histograma 250

 El área que hay bajo el 200

histograma entre dos 150

puntos cualesquiera 100

indica la cantidad 50

(porcentaje o frecuencia)
de individuos en el 20 40 60

Edad del encuestado


80

intervalo.

 Polígono de frecuencias
 Centros de clase
GRÁFICO 5

Distribución de pacientes con hidronefrosis según edad. Policlínico


La Viña y Cruz Roja de Valencia,
periodo 2000-2009.

Porcentaje
30,00% 15
13
25,00%
12
20,00%
10

15,00%

10,00%
3
5,00% 2
0 0 55 Pacientes
0,00%
E 0-9 E 10-19 E 20-29 E 30-39 E 40-49 E 50-59 E 60-69 E 70-79
FRECUENCIA (EDAD)

Fuente: Ficha de recolección de datos.


Gráfico N° 6
Distribución de trabajadores según edad en
años

37,5%
35%

12,5%

10 %
Gráfico N° 7
Distribución de pacientes con LTA según edad en el Caserío
El Pueblito, Municipio Carlos Arvelo, Estado Carabobo,
septiembre 2008-julio 2009.

FUENTE: datos propios de la investigación


Gráfico N° 7.1
Distribución según edad y sexo de los pacientes con
Microalbuminuria y Síndrome Coronario Agudo ingresados
en la Ciudad Hospitalaria “Dr. Enrique Tejera” en el período
Febrero 2013 – Abril 2013.

Fuente: Datos de la investigación


GRÁFICO Nº 8
Distribución de los pacientes con y sin diagnóstico de Baja Masa
Ósea según prevalencia de Ingesta Alcohólica. Consulta de
Medicina Interna del Hospital Universitario Dr. Ángel Larralde,
período Enero 2004-Julio 2009.

Ingesta
Alcohólica
%

Fuente: Datos de la investigación


%

Fuente: Datos de la investigación


Gráfico Nº 10
Estratificación Socio-económica de los
Estudiantes de la Universidad de Carabobo y
Universidad Autónoma de Madrid. 2009-2010

Fuente: Datos del estudio


Gráfico N° 11:
Distribución de pacientes con Enfermedad de Hansen según
ocurrencia de Casos Nuevos/Año, atendidos en el Servicio de
Dermatología Sanitaria del Hospital Dr. Rafael González Plaza,
Estado Carabobo, en el periodo 2005–2009

Fuente: Datos del estudio

Vous aimerez peut-être aussi