Vous êtes sur la page 1sur 5

1-2 Tipos de datos 5

Ante todo, le pedimos que inicie su estudio de la estadística con una mente
abierta. No dé por hecho que el estudio de la estadística es comparable con un pro-
cedimiento inflexible. Según la experiencia del autor, a menudo los estudiantes se
sorprenden por la interesante naturaleza de la estadística, y también por el hecho
de que en realidad pueden dominar los principios básicos sin gran dificultad, in-
cluso si no sobresalen en otros cursos de matemáticas. Estamos convencidos de
que cuando termine este curso introductorio, tendrá la firme creencia de que la
estadística es una materia rica e interesante, con aplicaciones extensas, reales y
significativas. También estamos convencidos de que con la asistencia a clases y
la dedicación constantes, usted tendrá éxito al dominar los conceptos básicos de la
estadística presentados en este curso.

El estado de la
1-2 Tipos de datos estadística
Concepto clave En la materia de estadística se trata principalmente de utilizar El término estadística se deriva
datos muestrales para hacer inferencias (o generalizaciones) sobre una población de la palabra latina status (que
completa. Debemos saber y entender las definiciones de población, muestra, pa- significa “estado”). Los prime-
rámetro y estadístico, ya que son básicas y fundamentales. También necesitamos ros usos de la estadística impli-
reconocer la diferencia entre datos cuantitativos y datos cualitativos. Tenemos que caron la recopilación de datos y
entender que algunos números, como los códigos postales, no son cantidades en el la elaboración de gráficas, para
sentido de que realmente midan o cuenten algo. Los códigos postales son, en rea- describir diversos aspectos de
lidad, ubicaciones geográficas, por lo que no tiene sentido hacer cálculos con el- un estado o de un país. En 1662
los, como calcular su promedio. En esta sección se describen distintos aspectos de John Graunt publicó informa-
la naturaleza de los datos muestrales, los cuales pueden afectar de manera impor-
ción estadística acerca de los
tante los métodos estadísticos que se utilicen con ellos.
nacimientos y los decesos. Al
En la sección 1-1 definimos los términos población y muestra. Los siguientes
dos términos se utilizan para distinguir entre los casos en que tenemos datos de trabajo de Graunt siguieron es-
una población completa y los casos donde sólo tenemos datos de una muestra. tudios de tasas de mortalidad y
de enfermedad, tamaño de po-
blaciones, ingresos y tasas de
Definiciones desempleo. Los hogares, go-
Parámetro es una medición numérica que describe algunas características de biernos y empresas se apoyan
una población. mucho en datos estadísticos
Estadístico es una medición numérica que describe algunas características para dirigir sus acciones. Por
de una muestra. ejemplo, se reúnen datos de
manera cuidadosa y con regula-
ridad para establecer las tasas
EJEMPLOS de desempleo, las tasas de infla-
1. Parámetro: En la ciudad de Nueva York hay 3250 botones para caminar, ción, los índices del consumidor
que los peatones emplean en las intersecciones de tránsito. Se descubrió y las tasas de nacimientos y
que el 77% de dichos botones no funciona (según datos del artículo “For muertes; en tanto que los líderes
Exercise in New York Futility, Push Button”, de Michael Luo, New York Ti- empresariales utilizan los datos
mes). La cifra del 77% es un parámetro porque está basada en la población resultantes para tomar decisio-
de todos los 3250 botones para peatones. nes que afectan futuras contra-
2. Estadístico: Con base en una muestra de 877 ejecutivos encuestados, se en- taciones, los niveles de produc-
contró que el 45% de ellos no contrataría a alguien con un error ortográfico en ción y la expansión hacia nuevos
su solicitud de empleo. Esta cifra del 45% es un estadístico, ya que está basa- mercados.
da en una muestra y no en la población completa de todos los ejecutivos.
6 Capítulo 1 Introducción a la estadística

Algunos conjuntos de datos consisten en números (como alturas de 66 y 72


pulgadas); mientras que otros son no numéricos (como los colores de ojos verde y
café). Los términos datos cuantitativos y datos cualitativos suelen utilizarse para
distinguir entre ambos tipos.

Definiciones
Los datos cuantitativos consisten en números que representan conteos o
mediciones.
Los datos cualitativos (o categóricos o de atributo) se dividen en diferentes
categorías que se distinguen por algunas características no numéricas.

EJEMPLOS
1. Datos cuantitativos: Los pesos de las supermodelos.
2. Datos cualitativos: El género (hombre/mujer) de atletas profesionales.

Cuando se trabaja con datos cuantitativos, es importante utilizar las unidades


de medida apropiadas, como dólares, horas, pies, metros, etcétera. Debemos ser
especialmente cuidadosos para observar aquellas referencias como “todas las
cantidades están en miles de dólares” o “todos los tiempos están en centésimas de
segundo” o “las unidades están expresadas en kilogramos”. Ignorar unidades
de medida como éstas nos llevaría a conclusiones incorrectas. La NASA perdió su
Mars Climate Orbiter de $125 millones* cuando la sonda se estrelló debido a que
el programa de control tenía los datos de aceleración en unidades inglesas, pero
ellos incorrectamente consideraron que estaban en unidades métricas.
Los datos cuantitativos se describen con mayor detalle distinguiendo entre los
tipos discreto y continuo.

Definiciones
Los datos discretos resultan cuando el número de valores posibles es un nú-
mero finito o un número que “puede contarse” (es decir, el número de valores
posibles es 0, 1, 2, etcétera).
Los datos continuos (numéricos) resultan de un infinito de posibles valores
que corresponden a alguna escala continua que cubre un rango de valores sin
huecos, interrupciones o saltos.

EJEMPLOS
1. Datos discretos: El número de huevos que ponen las gallinas son datos
discretos porque representan conteos.
2. Datos continuos: Las cantidades de leche que producen las vacas son datos
continuos porque son mediciones que pueden tomar cualquier valor dentro
de un continuo. Durante un intervalo de tiempo dado, una vaca produce una
cantidad de leche que puede ser cualquier valor entre 0 y 5 galones. Es posi-
ble obtener 2.343115 galones, porque la vaca no está restringida a cantida-
des discretas de 0, 1, 2, 3, 4 o 5 galones.

*En esta obra, el signo $ hará referencia a dólares estadounidenses, a menos que se especifique otra
unidad monetaria.
1-2 Tipos de datos 7

Un ejemplo más: el número de latas de bebidas de cola son datos discretos; en


tanto que el volumen real de la bebida de cola es un dato continuo.
Otra forma común de clasificar los datos consiste en usar cuatro niveles de
medición: nominal, ordinal, de intervalo y de razón. Cuando se aplica la estadís-
tica a problemas reales, el nivel de medición de los datos es un factor importante
para determinar el procedimiento a utilizar. (Véase la figura 15-1 en la página
764). En este libro encontraremos algunas referencias a estos niveles de medición;
sin embargo, lo importante aquí se basa en el sentido común: no hay que hacer
cálculos ni utilizar métodos estadísticos que no sean apropiados para los datos.
Por ejemplo, no tendría sentido calcular el promedio de los números del seguro
social, ya que estos números son datos que se utilizan como identificación, y no
representan mediciones o conteos de algo. Por la misma razón, no tendría sentido
calcular un promedio de los números que aparecen en las camisetas de los jugado- Medición de la
res de básquetbol. desobediencia
¿De qué manera se recolectan
Definición datos sobre algo que parece que
El nivel de medición nominal se caracteriza por datos que consisten exclusi- no es medible, como el nivel de
vamente en nombres, etiquetas o categorías. Los datos no se pueden acomo- desobediencia de la gente? El
dar en un esquema de orden (como del más bajo al más alto). psicólogo Stanley Milgram di-
señó el siguiente experimento:
Un investigador enseñó a un
sujeto voluntario a operar un
EJEMPLOS Veamos algunos ejemplos de datos muestrales a nivel de me- tablero de control que adminis-
dición nominal.
traba “choques eléctricos” cada
1. Sí/no/indeciso: Respuestas de sí, no e indeciso en una encuesta vez más dolorosos a una tercera
2. Colores: Los colores de los automóviles conducidos por estudiantes univer- persona. En realidad no se da-
sitarios (rojo, negro, azul, blanco, magenta, púrpura, etcétera) ban tales choques, y la tercera
persona era un actor. El volun-
tario iniciaba con 15 volts y fue
Puesto que los datos nominales carecen de orden y no tienen un significado instruido para incrementar los
numérico, no se deben utilizar para hacer cálculos. En ocasiones se asignan números choques en aumentos de 15
a las distintas categorías (especialmente cuando los datos se codifican para utili- volts. El nivel de desobediencia
zarse en computadoras), pero estos números no tienen un significado computacio-
era el punto donde el sujeto se
nal real y cualquier promedio que se calcule carece de sentido.
negaba a incrementar el voltaje.
Fue sorprendente que dos ter-
ceras partes de los sujetos obe-
Definición decieron las órdenes, aun cuan-
Los datos están en el nivel de medición ordinal cuando pueden acomodarse do el actor gritaba y fingía sufrir
en algún orden, aunque no es posible determinar diferencias entre los valores un ataque cardiaco.
de los datos o tales diferencias carecen de significado.

EJEMPLOS Veamos algunos ejemplos de datos muestrales a nivel de me-


dición ordinal.
1. Las calificaciones de un curso: Un profesor universitario asigna califica-
ciones de A, B, C, D, E o F. Tales calificaciones se pueden ordenar, aunque
continúa
8 Capítulo 1 Introducción a la estadística

no es posible determinar diferencias entre tales calificaciones. Por ejemplo,


sabemos que A es mayor que B (por lo que hay un orden); pero no podemos
restar B de A (por lo que no se puede calcular la diferencia)
2. Rangos: Con base en varios criterios, una revista ordena las ciudades de
acuerdo con su “habitabilidad”. Dichos rangos (primero, segundo, tercero,
etcétera) determinan un orden. Sin embargo, las diferencias entre los rangos
no tienen ningún significado. Por ejemplo, una diferencia “del segundo menos
el primero” sugeriría 2 - 1 = 1, pero esta diferencia de 1 no tiene significado
porque no es una cantidad exacta que sea comparable con otras diferencias
de este tipo. La diferencia entre la primera y la segunda ciudades no es la
misma que la diferencia entre la segunda y la tercera ciudades. Utilizando
los rangos de la revista, la diferencia entre la ciudad de Nueva York y Boston
no se puede comparar de forma cuantitativa con la diferencia entre San Luis
y Filadelfia.

Los datos ordinales proporcionan información sobre comparaciones relativas,


pero no las magnitudes de las diferencias. Por lo general, los datos ordinales no
deben utilizarse para hacer cálculos como promedios, aunque en ocasiones esta
norma se infringe (como sucede cuando utilizamos calificaciones con letras para
calcular una calificación promedio).

Definición
El nivel de medición de intervalo se parece al nivel ordinal, pero con la
propiedad adicional de que la diferencia entre dos valores de datos cuales-
quiera tiene un significado. Sin embargo, los datos en este nivel no tienen
punto de partida cero natural inherente (donde nada de la cantidad está
presente).

EJEMPLOS Los siguientes ejemplos ilustran el nivel de medición de in-


tervalo.
1. Temperaturas: Las temperaturas corporales de 98.2°F y 98.6°F son ejem-
plos de datos a nivel de medición de intervalo. Dichos valores están orde-
nados, y podemos determinar su diferencia de 0.4°F. Sin embargo, no existe
un punto de inicio natural. Pareciera que el valor de 0°F es un punto de inicio;
son embargo, éste es arbitrario y no representa la ausencia total de calor.
Puesto que 0°F no es un punto de partida cero natural, sería incorrecto decir
que 50°F es dos veces más caliente que 25°F.
2. Años: Los años 1000, 2008, 1776 y 1492. (El tiempo no inició en el año 0,
por lo que el año 0 es arbitrario y no constituye un punto de partida cero na-
tural que represente “la ausencia de tiempo”).

Definición
El nivel de medición de razón es similar a nivel de intervalo, pero con la
propiedad adicional de que sí tiene un punto de partida cero natural (donde el
cero indica que nada de la cantidad está presente). Para valores a este nivel,
tanto las diferencias como las proporciones tienen significado.
1-2 Tipos de datos 9

EJEMPLOS Los siguientes son ejemplos de datos al nivel de medición de


razón. Observe la presencia de un valor cero natural, así como el uso de propor-
ciones que significan “dos veces” y “tres veces”.
1. Pesos: Los pesos (en quilates) de anillos de compromiso de diamante (el 0
realmente representa la ausencia de peso y 4 quilates es dos veces el peso de
2 quilates).
2. Precios: Los precios de libros de texto universitarios ($0 realmente repre-
senta ningún costo y un libro de $90 es tres veces más caro que un libro
de $30).

Este nivel de medición se denomina de razón porque el punto de partida cero


hace que las razones o cocientes tengan significado. Entre los cuatros niveles de
medición, la principal dificultad surge al distinguir entre los niveles de intervalo y
de razón. Sugerencia: Para simplificar esta diferencia, utilice una sencilla “prueba de
razón”: Considere dos cantidades en las cuales un número es dos veces el otro y
pregúntese si “dos veces” sirve para describir correctamente las cantidades. Puesto
que un peso de 200 libras es dos veces más pesado que un peso de 100 libras,
pero 50°F no es dos veces más caliente que 25°F, los pesos están en el nivel de
razón, mientras que las temperaturas Fahrenheit están en el nivel de intervalo. Para
una comparación y un repaso concisos, estudie la tabla 1-1 que señala las diferen-
cias entre los cuatro niveles de medición.

Tabla 1-1 Niveles de medición de datos

Nivel Resumen Ejemplo

Nominal Sólo categorías Origen de estudiantes:

r nombres.
Los datos no pueden 5 californianos Sólo categorías o
acomodarse en un 20 tejanos
esquema de orden. 40 neoyorquinos
Ordinal Las categorías están Automóviles de estudiantes: Orden
ordenadas, determinado por
pero no hay 5 compactos “compacto,
diferencias o carecen 20 medianos r mediano,
de significado. 40 grandes grande”.
De intervalo Las diferencias Temperaturas
tienen un significado, del campus: 0°F no significa
pero no hay punto 5°F “sin calor”.
de partida cero natural, 20°F r 40°F no es dos
veces más
y los cocientes no 40°F
caliente que 20°F.
tienen significado.
De razón Hay un punto de partida Distancias de traslado
cero natural y de los estudiantes:
r veces más lejos
40 km es dos
los cocientes 5 km
tienen significado. 20 km que 20 km.
40 km

Vous aimerez peut-être aussi