Académique Documents
Professionnel Documents
Culture Documents
La siguiente definición se refiere a uno de los usos incorrectos de la estadística más comunes y
graves: • Muestra de respuesta voluntaria (o muestra autoseleccionada) es aquella donde los
sujetos deciden ser incluidos por sí mismos.
Correlación y causalidad: Cuando nosotros encontramos una asociación estadística entre dos
variables, no podemos concluir que una de las variables es la causa de la otra (o que la afecta
directamente), una correlación no implica causalidad.
Resultados reportados: Cuando se recaban datos de personas, es mejor tomar las medidas que
pedir a los sujetos que reporten resultados.
Gráficas y Pictogramas: Las gráficas —como las de barras y las circulares— en ocasiones sirven
para exagerar o disfrazar la verdadera naturaleza de los datos.
Orden de las preguntas: En ocasiones las preguntas de una encuesta se sesgan de manera no
intencional debido a factores como el orden de los reactivos que se someten a consideración.
Datos faltantes: En ocasiones los resultados se ven muy afectados por datos faltantes. A veces
faltan datos muestrales por el azar, otras veces, por factores especiales.
Estudios para el propio beneficio: En ocasiones los estudios reciben el patrocinio de grupos con
intereses específicos que buscan promover.
Números precisos: Puesto que esta cantidad es muy precisa, mucha gente considera
erróneamente que también es exacta.
Parámetro es una medición numérica que describe algunas características de una población.
Estadístico es una medición numérica que describe algunas características de una muestra
Los datos discretos resultan cuando el número de valores posibles es un número finito o un
número que “puede contarse” (es decir, el número de valores posibles es 0, 1, 2, etcétera).
Los datos continuos (numéricos) resultan de un número infinito de posibles valores que, que
corresponden a alguna escala continua que cubre un rango de valores sin huecos,
interrupciones o saltos.
Los datos están en el nivel de medición ordinal cuando pueden acomodarse en algún orden,
aunque las diferencias entre los valores de los datos (obtenidas por medio de una resta) no
pueden calcularse o carecen de significado.
El nivel de medición de intervalo se parece al nivel ordinal, pero con la propiedad adicional de
que la diferencia entre dos valores de datos cualesquiera tiene un significado. Sin embargo, los
datos en este nivel no tienen un punto de partida cero naturales inherentes (donde la cantidad
que está presente corresponde a nada).
El nivel de medición de razón es similar al nivel de intervalo, pero con la propiedad adicional de
que sí tiene un punto de partida cero naturales (donde el cero indica que nada de la cantidad
está presente). Para valores en este nivel, tanto las diferencias como las razones tienen
significado.
De razón Hay un punto de partida cero Ejemplo: distancias
natural y las razones tienen
significado
De intervalo Las diferencias tienen Ejemplo: temperaturas
significado, pero no hay un corporales en grados
punto de partida cero Fahrenheit o Celsius
natural, las razones no
tienen significado
Ordinal Las categorías están Ejemplo: Las calificaciones
ordenadas, pero no hay de las universidades en el
diferencias o estas carecen Ranking Web
de significado
Nominal Sólo categorías. Los datos no Ejemplo: el color de los ojos
pueden acomodarse en un
esquema de orden
En un estudio retrospectivo (o de control de caso), los datos se toman del pasado (a través del
examen de registros, entrevistas y otros medios).
En los estudios prospectivos vamos adelante en el tiempo siguiendo grupos con un factor
causal potencial y grupos que no lo tienen, como un grupo de conductores que utilizan
teléfonos celulares y un grupo de conductores que no usan teléfonos celulares.
Diseño rigurosamente controlado Otra opción para asignar sujetos a los bloques es el uso del
diseño rigurosamente controlado, donde los sujetos son cuidadosamente elegidos para que
quienes formen cada bloque sean similares en las características que sean importantes para el
experimento. En un experimento para probar la efectividad de un fármaco para disminuir la
presión sanguínea, si el grupo placebo incluye a una persona del sexo masculino de 30 años de
edad, con sobrepeso, fumador, con alto consumo de bebidas alcohólicas y con una dieta alta
en sal y grasas, el grupo de tratamiento también debe incluir a una persona con características
similares.
Diseño experimental completamente aleatorizado Cuando se decide cómo asignar a los sujetos
a los diferentes bloques, se puede utilizar una selección aleatoria o intentar controlar
cuidadosamente la asignación, para que los sujetos de cada bloque resulten similares. Una
opción consiste en usar un diseño experimental completamente aleatorizado, mediante el cual
los sujetos se asignan a los diferentes bloques a través de un proceso de selección aleatoria. Un
ejemplo de un diseño experimental completamente aleatorizado es el experimento de la
poliomielitis: los niños fueron asignados al grupo de tratamiento o al grupo placebo a través de
un proceso de selección aleatoria (equivalente a lanzar una moneda al aire).
Tamaño de muestra Además de controlar los efectos de las variables, otro elemento clave del
diseño experimental es el tamaño de las muestras. Éstas deben ser suficientemente grandes
para que el comportamiento errático, que es característico de muestras muy pequeñas, no
disfrace los efectos verdaderos de los diferentes tratamientos.
En una muestra aleatoria los miembros de una población se seleccionan de manera que cada
miembro individual tiene la misma posibilidad de ser elegido.
Una muestra aleatoria simple del tamaño de n sujetos, se selecciona de manera que cada
posible muestra del mismo tamaño n tenga la misma posibilidad de ser elegida.
Un error de muestreo es la diferencia entre el resultado de una muestra y el verdadero
resultado de la población; tal error es consecuencia de las posibles fluctuaciones de las
muestras.
Un error no de muestreo ocurre cuando los datos de una muestra se obtienen, registran o
analizan de forma incorrecta
1. Centro: valor promedio o representativo que indica la localización de la mitad del conjunto
de los datos.
2. Variación: Medida de la cantidad en que los valores de los datos varían entre sí.
3. Distribución: La naturaleza o forma de la distribución de los datos sobre el rango de valores
(como en forma de campana, distribución uniforme o sesgada).
4. Valores atípicos: Valores muestrales que están muy alejados de la vasta mayoría de los
demás valores de la muestra.
5. Tiempo: Características cambiantes de los datos a través del tiempo.
Los límites de clase inferiores son las cifras más pequeñas que pueden pertenecer a las
diferentes clases. (Los límites de clase inferiores de la tabla son 60, 70, 80, 90, 100, 110 y 120).