Académique Documents
Professionnel Documents
Culture Documents
DE DATOS CATEGÓRICOS
Solange Lugo
Ingeniera de Sistemas, Especialista en Estadística
T.P. 68255125305 ST
PRIMER CAPÍTULO
CONCEPTUALIZACIÓN
ESCALA DE MEDIDA
razón
Los datos históricos se refieren a estudios en los cuales los datos tienen una definición geográfica o
circunstancial. Por ejemplo, la ocurrencia de una enfermedad infecciosa en una área determinada,
los niños atendidos en un centro de salud, o el número de accidentes durante un periodo específico.
Los datos experimentales son extraídos de estudios que involucran la asignación aleatoria de
tratamientos a un grupo de sujetos. Por ejemplo, el caso en el que a los sujetos se les administra
una dosis entre varias dosis de un medicamento.
En estudios por encuestas, los individuos son seleccionados aleatoriamente desde una población objetivo.
Por ejemplo, se selecciona una muestra de los usuarios de determinado medicamento para investigar
algunos rasgos físicos de estos. El investigador puede seleccionar aleatoriamente una población de estudio
y luego asignar aleatoriamente tratamientos a los individuos que resulten para el estudio.
Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST
DISTRIBUCIONES DE
PROBABILIDAD MÁS
USADAS EN EL
ANÁLISIS DE DATOS
CATEGÓRICOS
Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST
Una distribución de probabilidad muestra los posibles resultados de un experimento y la probabilidad de
que cada uno se presente.
𝜇 = 𝑥 ∗ 𝑃(𝑥)
𝜎 2 = 𝑥 − 𝜇 2 𝑃(𝑥 ൯
𝒏 𝒙 𝒏−𝒙
𝑷 𝒙 = 𝒑 1−𝒑
𝒙
𝜇 𝑥 𝑒 −𝜇
𝑃 𝑥 =
𝑥!
𝑛!
𝑷 𝒙 =
𝑥1 ! 𝑥2 ! … 𝑥𝑘 !
En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor
aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra.
𝑝(1−𝑝)
Intervalo de confianza para la proporción = 𝑝 ± 𝑧
𝑛
En las pruebas de hipótesis estadísticas, primero se definen las hipótesis y luego se aplican las
pruebas para verificar su validez.
Ho : P ≤ Po
Ho : P ≥ Po
H1 : P > Po
H1 : P < Po
Se acostumbra elegir
el nivel de 0.05 para los proyectos de investigación relacionados con los consumidores;
el nivel de 0.01 en relación con el control de calidad,
y el de 0.10 para las encuestas políticas.
Usted, como investigador, debe elegir el nivel de significancia
antes de formular una regla de decisión y recopilar los datos de la muestra.
Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST
Paso 3: Se selecciona el estadístico de
prueba
Valor, determinado a partir de la información de la muestra,
para determinar si se rechaza la hipótesis nula.
Verdadera Falsa
Ho es verdadera Ho es falsa
Acepto Ho Acepto Ho
Rechazo Ho Rechazo Ho Rechazo Ho Rechazo Ho
α/2 L.I. 1-α L.S. α/2 L.I. L.S.
Los cálculos de potencia generalmente se hacen antes de recopilar los datos. El propósito de un cálculo
de potencia es determinar, cuándo se realiza una prueba de hipótesis, si posiblemente rechaza o no H0
en el evento en que H0 es falsa
Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST
Ejemplo
Suponga que se ha desarrollado un proceso químico que puede aumentar la producción del
proceso actual. Se sabe que éste tiene una media de producción de 80 y desviación estándar de 5.
Si la media de la producción del nuevo proceso se muestra mayor a 80, el nuevo proceso será
realizado. Se propone operar el nuevo proceso 50 veces y después probar la hipótesis,
obteniéndose una media muestral de 81,16. Se supone que si el nuevo proceso tuviera una media
de la producción de 81, entonces sería muy benéfico instaurarlo en la producción. Si es el caso
que μ = 81, que es la potencia de la prueba, ¿cuál es la probabilidad de que H0 se rechace?
Una potencia de 0.4090 es muy baja, significando que si la media de la producción del nuevo proceso
es, en realidad 81, hay solamente 41% de probabilidad que el experimento propuesto detecte la
mejoría sobre el proceso antiguo y permita que el nuevo proceso se realice.
Sería poco sabio invertir tiempo y dinero en aplicar este experimento,
ya que tiene gran un riesgo de fallar.
Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST
Como con los P-valores, no hay una línea divisoria científicamente válida entre
potencia suficiente e insuficiente.
En general, las pruebas con potencias mayores a 0.80 o quizás 0.90 se consideran
aceptables, pero no hay reglas prácticas bien establecidas.