Primera Clase de Tópicos en Estadística

ANÁLISIS ESTADÍSTICO
DE DATOS CATEGÓRICOS
Solange Lugo
Ingeniera de Sistemas, Especialista en Estadística
T.P. 68255125305 ST
PRIMER CAPÍTULO
CONCEPTUALIZACIÓN
ESCALA DE MEDIDA
Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

La escala de medida de una variable categórica es un elemento
importante para la selección del análisis estadístico apropiado. Una
selección inadecuada de la escala de medida puede conducir a una
estrategia estadística inapropiada que arrojaría conclusiones erróneas
acerca de la realidad contenida en los datos

Variables dicotómicas
Tienen dos posibles respuestas:
Presencia – ausencia
Si – No
O -1
ONN - OFF
Tratamiento Favorable Desfavorable Total

Placebo 16 48 64
Prueba 40 20 60
Total 56 68 124

Variables ordinales
Más de dos posibles resultados y estos tienen un orden propio, por tanto tienen
una escala de medida ordinal
Estado de mejoría de un paciente, entre Bueno(3), Regular(2), Malo (1)
Género Tratamiento Bueno Regular Malo Total

Femenino Actividad 16 5 6 27
Femenino Placebo 6 7 19 32
Masculino Actividad 5 2 7 14
Masculino Placebo 1 0 10 11
Total 28 14 42 84
¿Puedo fusionar estas variables y producir una variable dicotómica?

Variables de conteos discretos
No se registran categorías sino se cuentas, por tanto tenemos resultados enteros
Niños visitados en un hospital de los cuales algunos mostraron presencia de enfermedad
Número de portátiles infectados con algún virus en un laboratorio de informática
Género Tratamiento Períodos Total

0 1 2
Femenino Rural 45 64 71 180
Femenino Urbana 80 104 116 300
Masculino Rural 84 124 82 290
Masculino Urbana 106 117 87 310
Total 315 409 356 1080

Variables nominales
Variables con más de dos categorías, a las cuales no se les atribuye un orden, se dice que la variable es
de tipo nominal
Región Tipo de sangre Total

0 A B AB
Norte 40 160 150 50 400
Centro 50 130 100 40 320
Sur 70 180 90 60 400
Total 160 470 340 150 1120

 Variables cualitativas: De
naturaleza no numérica.
 Por lo común lo que interesa
es el número o porcentaje de
observaciones en cada
categoría.
 Los datos cualitativos se
reúnen en gráficas y
diagramas de barras.
 Variables cuantitativas: Se
presentan de forma numérica.
 Las variables discretas toman
ciertos valores, y existen
vacíos entre éstos.
 Una variable continua adopta
cualquier valor dentro de un
intervalo específico.
Representan Representan Representan Igual que las variables
una categoría que una categoría que magnitudes y la de intervalo, solo que
identifica un grupo de identifican un grupo de distancia entre los cuentan con un cero
pertenencia pertenencia con un números de su escala es que representa la
orden lógico. igual. El cero es un ausencia total de
valor a tener en cuenta medida
y se pueden usar
valores negativos
Niveles de medición
 Nominal: Los datos se distribuyen en categorías sin un orden particular.
 Ejemplos: Estado civil, género, raza, credo religioso, afiliación política, lugar de nacimiento, el número de
seguro social, los números de teléfono, entre otros
 Ordinal: El nivel ordinal describe las variables a lo largo de un continuo sobre el que se pueden ordenar los valores. En
este caso las variables no sólo se asignan a grupos sino que además pueden establecerse relaciones de mayor que,
menor que o igual que, entre los elementos.
 Ejemplo, se puede ordenar al conjunto de alumnos en función de la calificación obtenida en el último examen.
 De intervalo: El punto cero de la escala es arbitrario y no significa ausencia de valor. Se pueden usar valores
negativos. Las razones entre valores no tienen sentido pues dependen de la posición del cero, no puede decirse que una
temperatura es el doble que la otra, pues usando grados centígrados dará un resultado y usando grados Fahrenheit dará
otro. Las variables medidas al nivel de intervalo se llaman variables de intervalo o variables de escala.
 Ejemplos: La fecha, la temperatura, las puntuaciones de una prueba, la escala de actitudes, conjuntos de
años, entre otros.
 De razón: Cuenta con todas las características del nivel de intervalo, y la razón entre dos valores resulta significativa. El
cero significa ausencia de la característica, la escala de razón comienza desde el cero y aumenta en números
sucesivos iguales a cantidades del atributo que está siendo medido.
 Ejemplo; el ingreso; el cero representaría que no recibe ingreso en virtud de un trabajo, la velocidad; el cero
significa ausencia de movimiento.
Ejemplo
Cuál es el nivel de medición que reflejan los siguientes datos?

a) La edad de cada persona en una muestra de 50 adultos que escuchan una de las
1.230 estaciones de radio que transmiten entrevistas en Estados Unidos es:
razón
b) En una encuesta de 200 propietarios de automóviles de lujo, 100 eran de California,

50 de Nueva York, 30 de Illinois y 20 de Ohio nominal

Ejercicios en clase
 1. ¿Cuál es el nivel de medición de cada una de las siguientes variables?

a) Coeficientes intelectuales de los estudiantes. De intervalo
b) La distancia que viajan los estudiantes para llegar a clases. De razón
c) Las calificaciones de los estudiantes en el primer examen de estadística. De intervalo
d) Una clasificación de estudiantes por fecha de nacimiento. Nominal
e) Una clasificación de estudiantes que cursan primero, segundo, tercero o Ordinal
último grado.
f ) Número de horas que los alumnos estudian a la semana. De razón

ESQUEMA DE
MUESTREO
Cuando se quiere hacer un estudio inferencial, los datos categóricos pueden proceder de diferentes
esquemas de muestreo, sea probabilístico o no. Los datos se ubican en tres esquemas muestrales:
datos históricos, datos experimentales y datos de encuestas.
Los datos históricos se refieren a estudios en los cuales los datos tienen una definición geográfica o
circunstancial. Por ejemplo, la ocurrencia de una enfermedad infecciosa en una área determinada,
los niños atendidos en un centro de salud, o el número de accidentes durante un periodo específico.
Los datos experimentales son extraídos de estudios que involucran la asignación aleatoria de
tratamientos a un grupo de sujetos. Por ejemplo, el caso en el que a los sujetos se les administra
una dosis entre varias dosis de un medicamento.
En estudios por encuestas, los individuos son seleccionados aleatoriamente desde una población objetivo.
Por ejemplo, se selecciona una muestra de los usuarios de determinado medicamento para investigar
algunos rasgos físicos de estos. El investigador puede seleccionar aleatoriamente una población de estudio
y luego asignar aleatoriamente tratamientos a los individuos que resulten para el estudio.
DISTRIBUCIONES DE
PROBABILIDAD MÁS
USADAS EN EL
ANÁLISIS DE DATOS
CATEGÓRICOS
Una distribución de probabilidad muestra los posibles resultados de un experimento y la probabilidad de
que cada uno se presente.
Las características fundamentales de una distribución de probabilidad son:
1. La probabilidad de un resultado en particular se encuentra entre 0 y 1, inclusive.

2. Los resultados son eventos mutuamente excluyentes.
3. La lista es exhaustiva. Así, la suma de las probabilidades de los diversos eventos es igual a 1

Variable aleatoria: Cantidad que resulta de un experimento que, por azar, puede
adoptar diferentes valores.
Variable aleatoria Discreta: Variable aleatoria que adopta sólo valores

claramente separados.
Variable aleatoria Continua: Si la variable aleatoria es continua, es una

distribución de probabilidad continua y esta se da cuando es el resultado de
algún tipo de medición.

Por lo general una distribución discreta es el
resultado de contar algo como:
 El número de caras que se presentan en tres lanzamientos de una moneda

 El número de estudiantes que obtienen “A” en clase
 El número de empleados de producción que se ausentaron hoy en el segundo
turno

Las distribuciones continuas son el resultado
de algún tipo de medición como:
 La duración de cada canción en el último álbum de Sándalo

 El peso de cada estudiante de esta clase
 La temperatura ambiente en el momento en que se leen estos apuntes

Media, varianza y desviación estándar de
una distribución de probabilidad
𝜇 = ෍ 𝑥 ∗ 𝑃(𝑥)
𝜎 2 = ෍ 𝑥 − 𝜇 2 𝑃(𝑥 ൯

Distribución Binomial
Distribución de Poisson
Distribución Multinomial
Distribución Hipergeométrica

Distribución Binomial
Principales características para definir una distribución de probabilidad binomial
 El resultado de cada prueba de un experimento se clasifica en una de dos categorías
mutuamente excluyentes: éxito o fracaso
 La variable aleatoria de interés permite contar el número de éxitos en una cantidad fija
de pruebas
 La probabilidad de éxito y fracaso es la misma para cada prueba
 Las pruebas son independientes, lo cual significa que el resultado de una prueba no influye
en el resultado de otra prueba.
𝒏 𝒙 𝒏−𝒙
𝑷 𝒙 = 𝒑 1−𝒑
𝒙

Distribución de Poisson
Principales características para definir una distribución de probabilidad Poisson
 La variable aleatoria es el número de veces que ocurre un evento durante un intervalo definido.
 La probabilidad de que ocurra el evento es proporcional al tamaño del intervalo
 Los intervalos no se superponen y son independientes
𝜇 𝑥 𝑒 −𝜇
𝑃 𝑥 =
𝑥!

Distribución Multinomial
Un ensayo de Bernoulli representa un proceso que tiene dos posibles resultados,

una generalización del ensayo de Bernoulli constituye el experimento
multinomial, que es un proceso con k resultados, donde k≥2.
𝑛!
𝑷 𝒙 =
𝑥1 ! 𝑥2 ! … 𝑥𝑘 !

Distribución Hipergeométrica
Cuando una población finita contiene dos tipos de unidades, que pueden ser denominados como
éxitos y fracasos, y se extrae una muestra aleatoria simple de la población, cada unidad representa
un ensayo de Bernoulli. A medida que se selecciona cada unidad, la proporción de éxitos en la
población restante disminuye o aumenta, dependiendo si la unidad extraída es un éxito o fracaso.
Por esta razón, los ensayos no son independientes, de ahí que el número de éxitos en la muestra no
siga una distribución binomial. En su lugar, la distribución que describe adecuadamente el número
de éxitos en esta situación se llama distribución hipergeométrica.

INFERENCIA SOBRE
UNA PROPORSIÓN
Estimación
Una pregunta fundamental respecto a ciertas especies, es el tamaño de población. Se puede tomar el
caso de las ballenas. Estos mamíferos gigantescos no se quedan quietos para contarlos. Viajan por
grandes extensiones y pasan la mayor parte del tiempo bajo el agua aunque suben a la superficie a
respirar en intervalos regulares. El método más sencillo para estimar la población consiste en marcar
un cierto número de ballenas; se les dispara un cilindro metálico de un pie de longitud, de modo que
queda colocado en la grasa bajo la piel. En la época de caza, las ballenas marcadas dan información
sobre su movimiento y la proporción de ballenas marcadas. La utilidad de la información anterior
puede verse más fácilmente simulando el experimento con una bolsa de canicas. Como en el caso de
las ballenas, el número de canicas en la bolsa es desconocido. Se seleccionan aleatoriamente unas
cuantas canicas de la bolsa, por ejemplo 10, se marcan y se regresan a la bolsa. Después se agita la
bolsa y se extraen nuevamente, en forma aleatoria, cierto número de canicas. Se cuenta el número
de canicas marcadas y las no marcadas, obteniéndose la proporción muestral.
En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor
aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra.

Estimadores
Estimador de intervalo: Intervalo donde probablemente se localiza un

parámetro de población, basado en información de la muestra.
Estimador puntual: Valor único calculado a partir de una muestra para

calcular un parámetro poblacional.

Intervalos de confianza para la proporción
El desarrollo de un estimador puntual para la proporción de la población y un intervalo de confianza para

una proporción de población es similar a hacerlo para una media.
La interpretación de un intervalo de confianza resulta de mucha utilidad en la toma de decisiones y
desempeña un papel importante en eventos como las elecciones.
𝑝(1−𝑝)
Intervalo de confianza para la proporción = 𝑝 ± 𝑧
𝑛

Pruebas de hipótesis para la proporción
Ahora en lugar de crear un conjunto de valores en el que se espera que se

presente el parámetro poblacional (intervalos de confianza), se expone un
procedimiento para probar la validez de un enunciado relativo a un
parámetro poblacional.
En las pruebas de hipótesis estadísticas, primero se definen las hipótesis y luego se aplican las
pruebas para verificar su validez.

Procedimiento de cinco pasos para
probar una hipótesis

Paso 1: Definición de las hipótesis
La hipótesis nula, hace referencia al valor de un parámetro poblacional

formulado con el fin de probar evidencia numérica, representada por Ho, es
la afirmación sobre una o más características de poblaciones que al inicio se
supone cierta (es decir, la "creencia a priori").
La hipótesis alternativa, es la afirmación que se acepta si los datos de la

muestra ofrecen suficiente evidencia para rechazar la hipótesis nula,
representada por Ha, es la afirmación contradictoria a Ho, y ésta es la
hipótesis del investigador.

Prueba de hipótesis de una sola cola (derecha) Prueba de hipótesis de una sola cola (izquierda)
Ho : P ≤ Po
Ho : P ≥ Po
H1 : P > Po
H1 : P < Po
Prueba de hipótesis de dos colas

Ho : P = Po
H1 : P ≠ Po

Paso 2: Se selecciona un nivel de
significancia
No existe ningún nivel de significancia que se aplique a todas las pruebas.

Se toma la decisión de utilizar el nivel de 0.05
(expresado con frecuencia como nivel de 5%),
nivel de 0.01, nivel de 0.10 o cualquier otro nivel entre 0 y 1.
Se acostumbra elegir
el nivel de 0.05 para los proyectos de investigación relacionados con los consumidores;
el nivel de 0.01 en relación con el control de calidad,
y el de 0.10 para las encuestas políticas.
Usted, como investigador, debe elegir el nivel de significancia
antes de formular una regla de decisión y recopilar los datos de la muestra.
Paso 3: Se selecciona el estadístico de
prueba
Valor, determinado a partir de la información de la muestra,
para determinar si se rechaza la hipótesis nula.
π: corresponde a la Proporción de la población, también se puede denotar como P

Paso 4: Se formula la regla de decisión
Es una afirmación sobre las condiciones específicas en que se rechaza la hipótesis
nula y aquellas en las que no se rechaza. La región o área de rechazo define la
ubicación de todos esos valores que son tan grandes o tan pequeños que la
probabilidad de que ocurran en una hipótesis nula verdadera es muy remo
Los aspectos que deben mencionarse en esta formulación son:
1. El área en que se acepta la hipótesis nula y el área en que se rechaza la hipótesis
nula (valor crítico)
2. El nivel de significancia utilizado
3. El valor calculado en el estadístico de prueba (sea z o t)
4. El área en que se acepta la hipótesis alternativa y el área en que se rechaza la
hipótesis alternativa (valor crítico)

Paso 5: Se toma una decisión
Consiste en calcular el estadístico de la prueba, compararlo con el valor crítico, y tomar la
decisión de rechazar o no la hipótesis nula. Si, a partir de la información de la muestra, se
calcula el valor del estadístico de prueba se acepta o rechaza la hipótesis nula con un nivel de
significancia definido.
La decisión de rechazar H0 se toma porque el estadístico de prueba se localiza en la región de
rechazo.
Es necesario subrayar de nuevo que siempre existe la posibilidad de que la hipótesis nula se
rechace cuando en realidad no se debe rechazar (error tipo I). Asimismo, existe una posibilidad
definible de que la hipótesis nula se acepte cuando debiera rechazarse (error tipo II).
Se acepta la hipótesis nula si el estadístico de prueba es un valor (mayor o igual a…, menor
o igual a… o mayor o igual a… y menor o igual a…) y se acepta la hipótesis alternativa.
Se acepta la hipótesis alternativa si el estadístico de prueba es un valor (menor a…, mayor
a… o menor a… y mayor a…) y se acepta la hipótesis nula.

Ejemplo
Como director de operaciones de bombas electro sumergibles de diferentes pozos

en el centro de Barrancabermeja, usted considera que el 60% de las bombas
presentan un desgaste considerable y necesitan un rápido mantenimiento. Usted
intenta establecer una importante política respecto a la estructura de precios
sobre esta proporción. Una muestra de 800 bombas instaladas revela que 492
bombas necesitan un mantenimiento. A un nivel de significancia del 5%. Qué
puede concluir sobre la proporción de todas las bombas que requieren
mantenimiento?

Tipos de error al prueba una hipótesis
Tipo I. Rechazar la hipótesis nula Ho cuando es verdadera, la probabilidad de cometer este tipo de error es α.
α = P(Rechazar Ho | Ho es verdadera)
Tipo II. Aceptar la hipótesis nula cuando es falsa, la probabilidad de cometer este tipo de error es β.
β = P(No Rechazar Ho | Ho es falsa)
Luego, 1- β, la probabilidad de que la prueba detecte diferencias cuando realmente existan, Potencia de la prueba

Hipótesis nula: Ho
Verdadera Falsa
Ho es verdadera Ho es falsa
Acepto Ho Acepto Ho
Rechazo Ho Rechazo Ho Rechazo Ho Rechazo Ho
α/2 L.I. 1-α L.S. α/2 L.I. L.S.
Nivel de Nivel de confianza Nivel de Potencia de la Potencia de la

significancia significancia prueba prueba
Error Tipo I Error Tipo I Error Tipo II

Valor p
La Probabilidad de observar un valor muestral tan extremo o más que el

valor observado, si la hipótesis nula es verdadera.
Entonces, el valor p es una manera de expresare la probabilidad
de que H0 sea falsa.
Si el valor p < nivel de significancia, Rechazo H0
Si valor p > nivel de significancia, Acepto H0
Si el valor p es muy grande, es probable que H0 sea VERDADERA
Si el valor p es pequeño, es probable que H0 sea FALSA
El P-valor también se llama nivel de significancia observado.

Ejercicio en clase
Un artículo de ingeniería, analiza algunos experimentos que implican diferentes lubricantes.

En un experimento, 45 bolas de acero, lubricadas con parafina purificada, estaban sujetas a
una carga de 40 kg a 600 rpm durante 60 minutos. El promedio de desgaste, medido por la
reducción en el diámetro, era de 673.2 μm, y la desviación estándar era de 14.9 μm.
Suponga que la especificación para un lubricante es que la media del desgaste sea menor de
675 μm.
Determine un P-valor para probar Ho: μ = 675 contra Ha: μ < 675. contando el nivel de
significancia de 0,05

Significancia estadística
Cada vez que el P-valor o valor p, es menor que un umbral específico, el

resultado indica que es “significativo estadísticamente” a ese nivel.
Por lo que, por ejemplo,
si P ≤ 0.05 el resultado es estadísticamente significativo a un nivel de 5%,
si P ≤ 0.01, el resultado es estadísticamente significativo a un nivel de 1%,
y así sucesivamente.

Potencia de la Prueba de hipótesis
Una prueba de hipótesis da como resultado un error de tipo II

si H0 es aceptada cuando es falsa.
La potencia de una prueba es la probabilidad de rechazar H0 cuando ésta es falsa.
Potencia = 1 – P(error tipo II)
Para ser útil una prueba debe tener probabilidades pequeñas tanto como errores de tipos I y II.
El error de tipo I se conserva pequeño al elegir un valor pequeño de α.
Entonces se calcula la potencia de la prueba,
Si la potencia de la prueba es grande,
entonces la probabilidad de un error de tipo II es pequeña, y la prueba es útil.
Los cálculos de potencia generalmente se hacen antes de recopilar los datos. El propósito de un cálculo
de potencia es determinar, cuándo se realiza una prueba de hipótesis, si posiblemente rechaza o no H0
en el evento en que H0 es falsa
Ejemplo
Suponga que se ha desarrollado un proceso químico que puede aumentar la producción del
proceso actual. Se sabe que éste tiene una media de producción de 80 y desviación estándar de 5.
Si la media de la producción del nuevo proceso se muestra mayor a 80, el nuevo proceso será
realizado. Se propone operar el nuevo proceso 50 veces y después probar la hipótesis,
obteniéndose una media muestral de 81,16. Se supone que si el nuevo proceso tuviera una media
de la producción de 81, entonces sería muy benéfico instaurarlo en la producción. Si es el caso
que μ = 81, que es la potencia de la prueba, ¿cuál es la probabilidad de que H0 se rechace?
Una potencia de 0.4090 es muy baja, significando que si la media de la producción del nuevo proceso
es, en realidad 81, hay solamente 41% de probabilidad que el experimento propuesto detecte la
mejoría sobre el proceso antiguo y permita que el nuevo proceso se realice.
Sería poco sabio invertir tiempo y dinero en aplicar este experimento,
ya que tiene gran un riesgo de fallar.
Como con los P-valores, no hay una línea divisoria científicamente válida entre
potencia suficiente e insuficiente.
En general, las pruebas con potencias mayores a 0.80 o quizás 0.90 se consideran
aceptables, pero no hay reglas prácticas bien establecidas.

Primera Clase de Tópicos en Estadística

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Primera Clase de Tópicos en Estadística

Transféré par

Droits d'auteur :

Formats disponibles

ANÁLISIS ESTADÍSTICO

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Tratamiento Favorable Desfavorable Total

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Género Tratamiento Bueno Regular Malo Total

¿Puedo fusionar estas variables y producir una variable dicotómica?

Género Tratamiento Períodos Total

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Región Tipo de sangre Total

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Cuál es el nivel de medición que reflejan los siguientes datos?

b) En una encuesta de 200 propietarios de automóviles de lujo, 100 eran de California,

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

 1. ¿Cuál es el nivel de medición de cada una de las siguientes variables?

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Las características fundamentales de una distribución de probabilidad son:

1. La probabilidad de un resultado en particular se encuentra entre 0 y 1, inclusive.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Variable aleatoria Discreta: Variable aleatoria que adopta sólo valores

Variable aleatoria Continua: Si la variable aleatoria es continua, es una

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

 El número de caras que se presentan en tres lanzamientos de una moneda

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

 La duración de cada canción en el último álbum de Sándalo

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Un ensayo de Bernoulli representa un proceso que tiene dos posibles resultados,

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Estimador de intervalo: Intervalo donde probablemente se localiza un

Estimador puntual: Valor único calculado a partir de una muestra para

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

El desarrollo de un estimador puntual para la proporción de la población y un intervalo de confianza para

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Ahora en lugar de crear un conjunto de valores en el que se espera que se

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

La hipótesis nula, hace referencia al valor de un parámetro poblacional

La hipótesis alternativa, es la afirmación que se acepta si los datos de la

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Prueba de hipótesis de dos colas

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

No existe ningún nivel de significancia que se aplique a todas las pruebas.

π: corresponde a la Proporción de la población, también se puede denotar como P

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Como director de operaciones de bombas electro sumergibles de diferentes pozos

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Nivel de Nivel de confianza Nivel de Potencia de la Potencia de la

Error Tipo I Error Tipo I Error Tipo II

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

La Probabilidad de observar un valor muestral tan extremo o más que el

El P-valor también se llama nivel de significancia observado.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Un artículo de ingeniería, analiza algunos experimentos que implican diferentes lubricantes.

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST

Cada vez que el P-valor o valor p, es menor que un umbral específico, el

Solange Lugo Ingeniera de Sistemas, Especialista en Estadística T.P. 68255125305 ST