ESTADISTICA

Estadística descriptiva
ESTADÍSTICA DESCRIPTIVA
1.1 INTRODUCCIÓN
La estadística está relacionada con recolección, procesamiento, análisis e

interpretación de datos numéricos, de ahí la importancia de su estudio en todos los
campos de la ciencia y la ingeniería.
Estadística Descriptiva
Recolecta, presenta y caracteriza un conjunto de datos (por ejemplo, edad de una
población, altura de los estudiantes de una escuela, temperatura de los días de un
determinado mes del año, etc.) con el fin de describir apropiadamente las diversas
características de ese conjunto; consiste sobre todo en la presentación de datos en
forma de tablas y gráficas; esto es, sin intentar inferir nada que vaya más allá de los
datos como tales.
Estadística Inferencial
Se deriva de muestras, de observaciones hechas sólo acerca de una parte de un
conjunto numeroso de elementos y esto implica que su análisis requiere de
generalizaciones que van más allá de los datos. Como consecuencia, la
característica más importante del reciente crecimiento de la estadística ha sido un
cambio en el énfasis de los métodos, los cuales son utilizados para hacer
generalizaciones. La Estadística Inferencial investiga o analiza una población
partiendo de una muestra tomada.
1.2 Tipos de variables

Las variables pueden ser de dos tipos:
Variables cualitativas: No se pueden medir numéricamente. Por ejemplo,
nacionalidad, color de piel, sexo, color favorito, etc.
Variables cuantitativas: Tienen valor numérico. Por ejemplo, edad, precio de un
producto, ingresos anuales, notas, etc
Jorge Tuapanta
1
Las variables cuantitativas se clasificar en discretas y continuas:

Discretas: Sólo pueden tomar valores enteros. Por ejemplo: número de hermanos,
número de estudiantes, número de computadores etc.
Continuas: Pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la
velocidad de un vehículo, gastos por semana, promedio de notas, etc.
1.3 Niveles de medición
La medición de las variables puede realizarse por medio de cuatro escalas de

medición: la nominal, ordinal, de intervalo y de razón. Se utilizan para ayudar en la
clasificación de las variables, el diseño de las preguntas para medir variables, e
incluso indican el tipo de análisis estadístico apropiado para el tratamiento de los
datos.
Una característica esencial de la medición es la dependencia que tiene de la
posibilidad de variación. La validez y la confiabilidad de la medición de una variable
depende de las decisiones que se tomen para operarla y lograr una adecuada
comprensión del concepto evitando imprecisiones y ambigüedades, en caso
contrario, la variable corre el riesgo inherente de ser invalidada debido a que no
produce información confiable.
a) Medición Nominal
En este nivel de medición se establecen categorías distintivas que no implican un
orden específico. Por ejemplo, si la unidad de análisis es un grupo de personas, para
clasificarlas se puede establecer la categoría sexo con dos niveles, masculino (M) y
femenino (F), los encuestados sólo tienen que señalar su género, no se requiere de
un orden real. Para su identificación y posterior análisis de datos se puede asignar
números: 1= M, 2=F.
b) Medición Ordinal
Se establecen categorías con dos o más niveles que implican un orden inherente
entre si. La escala de medición ordinal es cuantitativa porque permite ordenar a los
Jorge Tuapanta
2
eventos en función de la mayor o menor posesión de un atributo o característica. Por

ejemplo, en el nivel educativo: Primaria, secundaria y superior; en notas cualitativas
A, B, C y D, etc.
Las anteriores alternativas de respuesta pueden codificarse con números, 1, 2, 3,
etc. que sugieren un orden preestablecido pero no implican una distancia entre un
número y otro.
c) Medición de Intervalo
La medición de intervalo posee las características de la medición nominal y ordinal.
Establece la distancia entre una medida y otra. La escala de intervalo se aplica a
variables continuas pero carece de un punto cero absoluto. El ejemplo más
representativo de este tipo de medición es un termómetro, cuando registra cero
grados centígrados de temperatura indica el nivel de congelación del agua y cuando
registra 100 grados centígrados indica el nivel de ebullición, el punto cero es
arbitrario no real, lo que significa que en este punto no hay ausencia de temperatura.
d) Medición de Razón
Una escala de medición de razón incluye las características de los tres anteriores
niveles de medición (nominal, ordinal e intervalo). Determina la distancia exacta entre
los intervalos de una categoría. Adicionalmente tiene un punto cero absoluto, es
decir, en el punto cero no existe la característica o atributo que se mide. Las
variables de ingreso, edad, número de hijos, etc. son ejemplos de este tipo de
escala. El nivel de medición de razón se aplica tanto a variables continuas como
discretas.
1.4 Distribuciones de frecuencias

Muchas veces uno se pregunta, ¿para qué sirven las encuestas que a veces se
hacen en la calle?, ¿Cómo saber si una estación de radio se escucha más que otra?
La respuesta se comienza con la recaudación de datos.
Jorge Tuapanta
3
Los datos son información que se recoge, esto puede ser opinión de las personas
sobre un tema, edad o sexo de encuestados, dónde viven, cuántas personas viven
en una casa, qué tipo de sangre tiene un grupo de personas, etc.
Hay datos que pueden ser de mucha utilidad a diferentes profesionales en la toma de
decisiones, para resolver problemas o para mostrar resultados de investigaciones.
Una vez que se haya recogido toda la información, se procede a crear una base de
datos, donde se registran todos los datos obtenidos.
Algunas veces, si los datos son muy complicados, se codifican, esto quiere decir que
se le coloca una palabra clave que identifica un título muy largo. Cuando ya está
elaborada la base de datos se parece a una tabla.
Para disponer la información de manera óptima, se genera una tabla en la que, la
primera columna presenta los valores, que se representa con la letra x, en la
segunda columna se dispondrán las frecuencias, que se representa con la letra f , en
la tercera columna la frecuencia relativa, que se denota por fr y está definida como
f
fr  , donde n es el tamaño de la muestra; en la cuarta columna aparece la
n
frecuencia relativa porcentual y en la última la frecuencia acumulada, ver tabla 1.1.
Tabla 1. 1. Tabla de frecuencias
x f fr fr % F.A
1 6 0,0400 4 6
2 11 0,0733 7,333 17
3 12 0,0800 8,000 29
4 30 0,2000 20,000 59
5 40 0,2667 26,667 99
6 25 0,1667 16,667 124
7 14 0,0933 9,333 138
8 9 0,0600 6,000 147
9 3 0,0200 2,000 150
Total 150 1,0000 100,0
Jorge Tuapanta
4
Elaboración de una distribución de frecuencias

La Distribución de frecuencias es un agrupamiento de datos en categorías
mutuamente excluyentes, que indican el número de observaciones en cada
categoría. Utilizaremos la distribución de frecuencias para organizar los datos de
varias maneras e indicar los sitios donde los valores de datos tienden acumularse, y
ayuda a distinguir los valores mayores y menores.
Los pasos para elaborar una distribución de frecuencias lo explicaremos con un
ejemplo.
Si dispone de los datos de los gastos semanales (en dólares) de comestibles de una
muestra de 45 hogares, ver tabla 1.2.
Tabla 1. 2. Gastos semanales en dólares de una muestra de 45 hogares
271 363 159 176 227 337 295 319 250

279 205 279 266 199 177 162 232 303
192 181 321 309 246 278 150 141 335
116 100 151 240 474 297 170 188 320
429 294 570 324 276 235 435 123 325
PASO 1: Determinar el número de clases

Se sugiere utilizar como número de clases el menor número (k) tal que 2K > n, n es
el número de datos.
Para nuestro ejemplo n=45, y K=6 porque 26 > 45. Entonces el número de clases
que se recomienda considerar son 6.
PASO 2: Determinar el intervalo o amplitud
El intervalo o amplitud de las clases debe ser igual para todas ellas. Todas las clases
juntas deben cubrir por lo menos la distancia que hay desde el menor hasta el mayor
valor que se tiene en los datos sin procesar, es decir:
donde i es el intervalo de clase, H el mayor valor, L el menor valor observado y K el

número de clases. Para nuestro ejemplo H=570, L=100 y K=6, entonces
Jorge Tuapanta
5
En la práctica éste valor se redondea hacia arriba a algún múltiplo de 10 o de 100.

En nuestro caso se puede tomar $ 80 como extensión del intervalo.
PASO 3: Establecer los límites de cada clase
Es recomendable que se establezca límites de clase claros de manera que cada dato
pertenezca sólo a una clase. Para nuestro ejemplo las clases quedarían así, ver tabla
1.3
Tabla 1. 3. Clases
Clases
[100,180[
[180,260[
[260,340[
[340,420 [
[420,500[
[500,580[
PASO 4: Distribuir los datos en las diferentes clases

De la tabla de datos que tenemos sin procesar, distribuimos los datos en cada clase.
Para nuestro ejemplo quedaría así, ver tabla 1.4.
Tabla 1. 4. Distribución de los datos de gastos en las diversas clases
Clases Distribución
[100,180[ 100 116 123 141 150 151 159 162 170 176 177
[180,260[ 181 188 192 199 205 227 232 235 240 246 250
[260,340[ 266 271 276 278 279 279 294 295 297 303 309 319 320
321 324 325 335 337
[340,420 [ 363
[420,500[ 429 435 474
[500,580[ 570
Al organizar los datos en una distribución de frecuencias podemos resumir la

configuración de los gastos semanales de las familias. Observe lo siguiente:
1. Los gastos semanales van desde $100 hasta aproximadamente $580.
Jorge Tuapanta
6
2. Los gastos semanales se concentran entre 100 y 340 dólares. En total 40, o
88.89 % de los gastos semanales se concentran en éste intervalo.
3. La mayor concentración está en la clase de 260 a 340 dólares. El valor central de
la clase es 300 dólares ((260+340)/2 = 300), por tanto se puede decir que el gasto
semanal típico es 300 dólares.
4. La menor concentración está entre 340 y 580 dólares. En total 5 que es el
11.11 %
PASO 5: Contar el número de elementos en cada clase
Al número de elementos de cada clase se le llama frecuencia de clase ( f ). Por
consiguiente, la tabla de frecuencias de gastos semanales en dólares, quedaría de la
siguiente forma, ver tabla 1.5.
Tabla 1. 5. Tabla de distribución de frecuencias
Clases f
[100,180[ 11
[180,260[ 11
[260,340[ 18
[340,420 [ 1
[420,500[ 3
[500,580[ 1
TOTAL 45
La organización de los datos en una distribución de frecuencias, ha hecho que se

pierda los gastos semanales exactos. Sin embargo, el límite inferior de la primera
clase y el límite superior de la última tienen esencialmente el mismo significado. Se
llegaría a la misma conclusión si se sabe que el gasto semanal más alto es
aproximadamente 580, que si se sabe el gasto semanal exacto fue 570. Las ventajas
de condensar los datos en una forma más comprensible, compensan en mucho tal
desventaja.
La tabla 1.5, puede completarse con la frecuencia relativa, la frecuencia relativa
porcentual y la acumulada; para terminar con su análisis.
Jorge Tuapanta
7
1.5 Gráficas de Distribuciones de frecuencias

Los gerentes de ventas, analistas de valores, administradores de hospitales y otros
ejecutivos, con frecuencia necesitan tener una percepción rápida de la tendencia en
ventas, precios de acciones o costos de administración. Estas tendencias pueden
mostrarse utilizando gráficas.
HISTOGRAMA
Es un resumen gráfico de los valores producidos por las variaciones de una
determinada característica, representando la frecuencia con que se presentan
distintas categorías dentro de dicho conjunto.
Los histogramas nos permiten resumir grandes cantidades de datos; además
podemos hacer un análisis de los datos evidenciando esquemas de comportamiento
y pautas de variación que son difíciles de captar en una tabla numérica.
La figura 1, muestra un histograma de los gastos semanales de las 45 familias.
FRECUENCIAS DE GASTOS SEMANALES

20 18
18
16
14
FRECUENCIAS
12 11 11
10
8
6
4 3
2 1 1
0
140 220 300 380 460 540
GASTOS SEMANALES POR CLASES
Figura 1. Frecuencias de gastos semanales en dólares de las 45 familias
En base a la figura 1, 11 familias tienen un gasto promedio de $ 300, y una familia

un gasto promedio de $ 380 y otra de $ 540.
Jorge Tuapanta
8
Para elaborar el histograma también se pudo haber cogido los intervalos de clase(
100 a 180; 180 a 260,..etc), y no los puntos medios de cada clase. Hágalo y
compare.
POLIGONO DE FRECUENCIAS
Un polígono de frecuencias es similar al histograma. Está formado por segmentos
de rectas que unen a los puntos medios de las clases y la frecuencia de clase. El
polígono de frecuencias añade dos clases con frecuencias cero: una antes de la
primera clase y otra después de la última. El resultado es que se "sujeta" la línea por
ambos extremos al eje horizontal y lo que podría ser una línea separada del eje se
convierte, junto con éste, en un polígono, ver figura 2.
POLÍGONO DE FRECUENCIAS DE LOS GASTOS

SEMANALES
20
15
FRECUENCIAS
10
0
60 140 220 300 380 460 540 620
GASTOS SEMANALES POR CLASES
Figura 2. Polígono de frecuencias de los gastos semanales en dólares de 45 familias
1.6 Medidas descriptivas

Cuando se tiene un grupo de observaciones, se desea describirlo a través de un sólo
número. Para tal fin, no se usa el valor más elevado ni el valor más pequeño como
único representante, ya que sólo representan los extremos. Una de las propiedades
más sobresalientes de la distribución de datos es su tendencia a acumularse hacia el
centro de la misma. Esta característica se denomina tendencia central.
Jorge Tuapanta
9
Las medidas de tendencia central más usuales son: la media aritmética, la mediana y
la moda.
MEDIA ARITMÉTICA
La media aritmética de n valores, es igual a la suma de todos ellos dividida entre n .
Se denota por ̅ . Esto es:
n
x i
X  i 1
n
Cuando los datos tienen más de una frecuencia, para obtener la media aritmética se
agrega otra columna a la tabla estadística con el producto de las observaciones y sus
frecuencias. Es decir, si se cuenta con una distribución de datos entonces se aplica
la fórmula:
n
f i xi
X  i 1
n
Las características de la media aritmética son:
1. La media aritmética es la única medida de tendencia central donde la suma de las
desviaciones de cada valor, respecto de la media, siempre es igual a cero. Es decir:
n
 (x
i 1
i X )0
2. En su cálculo se toman en cuenta todos los valores de la variable.

3. La media es una medida muy útil para comparar dos o más poblaciones.
4. La media aritmética es altamente afectada por valores extremos.
5. No puede ser calculada en distribuciones de frecuencia que tengan clases
abiertas.
6. La media aritmética es única, o sea, un conjunto de datos numéricos tiene una y
sólo una media aritmética.
MEDIANA
La mediana es el punto central de una serie de datos ordenados de forma
ascendente o descendente. De acuerdo al número de casos o datos, hay dos formas
para calcular la mediana: para número impar y para número par.
Jorge Tuapanta
10
1. Número impar de datos ordenados de menor a mayor o de mayor a menor: la

mediana es el valor que queda justo al centro.
Ejemplo.
Obtener la mediana de los siguientes datos: 4, 7, 1, 9, 2, 5, 6.
Solución.
Ordenando de forma ascendente: 1, 2, 4, 5, 6, 7, 9.
El valor que queda al centro es el 5, porque hay tres datos antes y tres datos
después de él, entonces la mediana es 5.
2. Número de datos par, en este caso se busca la media aritmética entre los dos
valores centrales.
Ejemplo.
Obtener la mediana de los siguientes datos: -3, 5, 18, 4, 11, -6, 9, 10, -1, 2.
Solución.
Ordenando de forma ascendente: -6, -3, -1, 2, 4, 5, 9, 10, 11, 18.
Los valores centrales son 4 y 5. Su media aritmética es: 4.5
En este caso, la mediana de este conjunto no pertenece al conjunto de datos.
Las características de la mediana son:
1. En su cálculo no se incluyen todos los valores de la variable.
2. La Mediana no es afectada por valores extremos.
3. Puede ser calculada en distribuciones de frecuencia con clases abiertas.
4. No es lógica desde el punto de vista algebraico.
MODA
La moda de un conjunto de datos numéricos es el valor que más se repite, es decir,
el que tiene el mayor número de frecuencias absolutas. La moda puede ser no única
e inclusive no existir.
La moda es una medida de tendencia central muy importante, porque permite
planificar, organizar y producir para satisfacer las necesidades de la mayoría.
EJEMPLO
Obtener la moda de los siguientes datos: -3, 3, -2, 0, 3, -1, -2, 4, 5, -2, 0, 1.
Jorge Tuapanta
11
Solución.
Ordenando de forma ascendente: -3, -2, -2, -2, -1, 0, 0, 1, 3, 3, 4, 5.
El valor que más se repite es el -2, por lo tanto ese valor es su moda.
EJEMPLO
Obtener la moda de los siguientes datos: 6, 2, -1, -5, 3, -3, -2, 5, 0, -4, 4, 1.
Solución.
Ordenando de forma ascendente: -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, 6.
Ningún valor se repite es, decir su moda no existe.
Las características de la moda son:
1. En su cálculo no se incluyen todos los valores de la variable.
2. El valor de la moda puede ser afectado grandemente por el método de
designación de los intervalos de clases.
3. No está definida algebraicamente.
4. Puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.
5. No es afectada por valores extremos.
TAREA DE INVESTIGACION: La media, mediana y moda de datos agrupados
MEDIDAS DE DISPERSIÓN
La dispersión mide que tan alejados están un conjunto de valores respecto a su

media aritmética. Así, cuanto menos disperso sea el conjunto, más cerca del valor
medio se encontrarán sus valores. Este aspecto es de vital importancia para el
estudio de investigaciones.
Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los

valores de la variable a un cierto valor central, o que permiten identificar la
concentración de los datos en un cierto sector del recorrido de la variable. Se trata de
coeficientes para variables cuantitativas.
Jorge Tuapanta
12
Una medida de dispersión se puede utilizar para evaluar la confiabilidad de dos o

más promedios.
AMPLITUD DE VARIACIÓN (RANGO)
Esta es la medida más sencilla de calcular y comprender. Se concentra en el valor

máximo y mínimo de la colección de datos y viene dada por:
R = Valor máximo - Valor mínimo
En el caso de distribuciones de frecuencias, el rango se obtiene restándole al límite

superior de la última clase (LSUC) el límite inferior de la primera clase (LIPC):
R  LSU C  LIPC
La ventaja de utilizar el rango como medida de dispersión, es la sencillez de su

cálculo, aun cuando se trate de un conjunto bastante grande de datos. Además, el
significado de esta medida es fácil de comprender.
La principal limitación del rango es que considera solamente los valores extremos de
los datos, y no proporciona información respecto a los demás valores.
DESVIACIÓN MEDIA
La desviación media mide el monto medio en que varían los valores de una
población o muestra, con respecto a su media. La desviación media para una
n
x i x
muestra está dada por: DM  i 1
La desviación media tiene dos ventajas.
Primero, utiliza en cálculo todos los valores de la muestra.
Segundo, es fácil de comprender, pues representa el promedio en que los valores se

desvían con respecto a la media.
Jorge Tuapanta
13
VARIANZA Y DESVIACIÓN ESTÁNDAR
Dada una colección de datos x1 , x 2 , x 3 ,...xn , cuya media aritmética es x , se define la
varianza, como el promedio de las diferencias elevadas al cuadrado de cada uno de

esos valores con respecto a su media, y lo denotaremos por S 2 , es decir:
 x 
n
2
i x
S2  i 1
n 1
De la fórmula anterior se deduce que:
1. Mientras más alejados estén los valores de su media mayor será el valor de la
varianza y mientras más concentrados se encuentren alrededor de su media,
menor será el valor de la varianza.
2. La varianza nunca es negativa, ya que se está sumando cantidades elevadas al
cuadrado.
3. El valor mínimo que puede tomar es cero, el cual se logra cuando todos los
valores son iguales entre sí, es decir, que no existe variabilidad entre ellos.
La desviación estándar de x1 , x 2 , x 3 ,...xn observaciones se define como la raíz

cuadrada de la varianza, es decir:
 x 
n
2
i x
S i 1
n 1
2
 n 
  xi 
 x    x i   i 1 
n n
2
x
2
Se demuestra que i
i 1 i 1 n
Por lo tanto la varianza y la desviación de una muestra se lo pueden definir como:
Jorge Tuapanta
14
2
 n 
  xi 
x i   i 1 
n

2
n
S 2  i 1 → VARIANZA
n 1
2
 n 
  xi 
x i   i 1 
n

2
n
S i 1
→ DESVIACIÓN ESTÁNDAR
n 1
Para el caso de datos agrupados en distribuciones de frecuencias, las

expresiones para la varianza y la desviación estándar son:
 f X  2
f X 2

n
S 
2
→ VARIANZA
n 1
 f X  2
f X 2

n
S → DESVIACIÓN ESTÁNDAR
n 1
Donde:
X es el punto medio de una clase
f es la frecuencia de clase
n es el número total de observaciones en la muestra
EJEMPLO 1
De la producción por hora de un grupo de empleados que ensamblan unidades

modulares, se seleccionan valores al azar. Las salidas de la muestra fueron: 8, 9, 8,
11, 10, 7, 9 y 12. Calcular, rango, desviación media, varianza y desviación estándar.
R = Valor máximo - Valor mínimo = 12-7 = 5
Jorge Tuapanta
15
Para el cálculo de la desviación media, varianza y desviación estándar nos

ayudamos de la siguiente tabla:
xi xi  x | xi  x | x i x 
2
8 -1,25 1,25 1,56

9 -0,25 0,25 0,06
8 -1,25 1,25 1,56
11 1,75 1,75 3,06
10 0,75 0,75 0,56
7 -2,25 2,25 5,06
9 -0,25 0,25 0,06
12 2,75 2,75 7,56
 74 0 10,5 19,5
x 74
x i x
10,5
x   9,25 , DM  i 1
  1,31
i
n 8 n 8
 x   x 
n n
2 2
i x i x
19,5
S2  i 1
  2,79 , S i 1
 2,79  1,67
n 1 7 n 1
EJEMPLO 2
La tabla de distribución de frecuencias, muestran los gastos semanales en dólares,

de 45 familias. Halle el rango, varianza y desviación estándar.
Clases f
[100,180[ 11
[180,260[ 11
[260,340[ 18
[340,420 [ 1
[420,500[ 3
[500,580[ 1
Jorge Tuapanta
16
Hallemos el rango utilizando: R  LSU C  LIPC = 580 – 100 = 480
Para el cálculo de la varianza y desviación estándar nos ayudamos de la siguiente

tabla:
Frecuencia Punto medio de clase

Clases
f X fX f X2
[100,180[ 11 140 1540 215600
[180,260[ 11 220 2420 532400
[260,340[ 18 300 5400 1620000
[340,420 [ 1 380 380 144400
[420,500[ 3 460 1380 634800
[500,580[ 1 540 540 291600
TOTAL 45 11660 3438800
 f X 2
(11660) 2
f X 2

n
3438800 
45
S2    9490.10
n 1 44
 f X  2
f X 2

n
S  9490.10  97.42
n 1
COEFICIENTE DE VARIACIÓN
La medida de dispersión relativa más conocida es el coeficiente de variación. En

algunas ocasiones es de interés comparar la dispersión de dos colecciones de datos.
Si los datos están medidos en las mismas unidades y las respectivas medias
aritméticas son iguales o muy parecidas es posible utilizar la desviación estándar. Si
esto no se cumple, no se puede utilizar la desviación estándar para comparar las
dispersiones de los dos grupos de datos.
Una medida de dispersión que permite la comparación de la dispersión en cualquier

situación, que no viene expresada en ninguna unidad es el coeficiente de variación.
Jorge Tuapanta
17
S
El coeficiente de variación se define como: CV   100
x
El coeficiente de variación es la proporción o porcentaje de la media que representa

la desviación estándar.
Si por ejemplo el CV=20%, significa que la desviación estándar representa el 20%

del valor de la media aritmética.
EJEMPLO
Las mediciones realizadas con un micrómetro 1 tienen una media de 3.92 mm y una
desviación estándar de 0.0152 mm, y las realizadas con el micrómetro 2 tienen una
media de 1.54 pulgadas y una desviación estándar de 0.0086 pulgadas. ¿Cuál de
estos dos instrumentos es relativamente más preciso?
Solución
0.0152
Para el micrómetro 1, el coeficiente de variación es: CV   100  0.39%
3.92
0.0086
Para el micrómetro 2, el coeficiente de variación es: CV   100  0.56%
1.54
Por lo tanto, las mediciones hechas con el micrómetro 1 son relativamente más
precisas.
Jorge Tuapanta
18

ESTADISTICA

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

ESTADISTICA

Transféré par

Droits d'auteur :

Formats disponibles

Estadística descriptiva

La estadística está relacionada con recolección, procesamiento, análisis e

1.2 Tipos de variables

Las variables cuantitativas se clasificar en discretas y continuas:

1.3 Niveles de medición

La medición de las variables puede realizarse por medio de cuatro escalas de

eventos en función de la mayor o menor posesión de un atributo o característica. Por

1.4 Distribuciones de frecuencias

Tabla 1. 1. Tabla de frecuencias

Elaboración de una distribución de frecuencias

Tabla 1. 2. Gastos semanales en dólares de una muestra de 45 hogares

271 363 159 176 227 337 295 319 250

PASO 1: Determinar el número de clases

donde i es el intervalo de clase, H el mayor valor, L el menor valor observado y K el

En la práctica éste valor se redondea hacia arriba a algún múltiplo de 10 o de 100.

PASO 4: Distribuir los datos en las diferentes clases

Tabla 1. 4. Distribución de los datos de gastos en las diversas clases

Al organizar los datos en una distribución de frecuencias podemos resumir la

Tabla 1. 5. Tabla de distribución de frecuencias

La organización de los datos en una distribución de frecuencias, ha hecho que se

1.5 Gráficas de Distribuciones de frecuencias

FRECUENCIAS DE GASTOS SEMANALES

Figura 1. Frecuencias de gastos semanales en dólares de las 45 familias

En base a la figura 1, 11 familias tienen un gasto promedio de $ 300, y una familia

POLÍGONO DE FRECUENCIAS DE LOS GASTOS

Figura 2. Polígono de frecuencias de los gastos semanales en dólares de 45 familias

1.6 Medidas descriptivas

2. En su cálculo se toman en cuenta todos los valores de la variable.

1. Número impar de datos ordenados de menor a mayor o de mayor a menor: la

TAREA DE INVESTIGACION: La media, mediana y moda de datos agrupados

La dispersión mide que tan alejados están un conjunto de valores respecto a su

Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los

Una medida de dispersión se puede utilizar para evaluar la confiabilidad de dos o

AMPLITUD DE VARIACIÓN (RANGO)

Esta es la medida más sencilla de calcular y comprender. Se concentra en el valor

R = Valor máximo - Valor mínimo

En el caso de distribuciones de frecuencias, el rango se obtiene restándole al límite

La ventaja de utilizar el rango como medida de dispersión, es la sencillez de su

La desviación media tiene dos ventajas.

Primero, utiliza en cálculo todos los valores de la muestra.

Segundo, es fácil de comprender, pues representa el promedio en que los valores se

VARIANZA Y DESVIACIÓN ESTÁNDAR

Dada una colección de datos x1 , x 2 , x 3 ,...xn , cuya media aritmética es x , se define la

varianza, como el promedio de las diferencias elevadas al cuadrado de cada uno de

De la fórmula anterior se deduce que:

La desviación estándar de x1 , x 2 , x 3 ,...xn observaciones se define como la raíz

Por lo tanto la varianza y la desviación de una muestra se lo pueden definir como:

Para el caso de datos agrupados en distribuciones de frecuencias, las

X es el punto medio de una clase

n es el número total de observaciones en la muestra

De la producción por hora de un grupo de empleados que ensamblan unidades

R = Valor máximo - Valor mínimo = 12-7 = 5

Para el cálculo de la desviación media, varianza y desviación estándar nos

8 -1,25 1,25 1,56

La tabla de distribución de frecuencias, muestran los gastos semanales en dólares,

Hallemos el rango utilizando: R  LSU C  LIPC = 580 – 100 = 480

Para el cálculo de la varianza y desviación estándar nos ayudamos de la siguiente

Frecuencia Punto medio de clase

La medida de dispersión relativa más conocida es el coeficiente de variación. En

Una medida de dispersión que permite la comparación de la dispersión en cualquier

El coeficiente de variación es la proporción o porcentaje de la media que representa

Si por ejemplo el CV=20%, significa que la desviación estándar representa el 20%

Vous aimerez peut-être aussi